本記事は arXiv:2503.23278 Model Context Protocol (MCP): Landscape, Security Threats, and Future Research Directions の解説記事です。 論文概要(Abstract) 本論文は、Anthropicが2024年11月に発表したModel Context Protocol(MCP)に対する...
論文概要 本記事は Advanced ingestion process powered by LLM parsing for RAG system (arXiv:2412.15262) の解説記事です。Retrieval Augmented Generation(RAG)システムにおいて、多様な構造を持つマルチモーダル文書の処理は依然として大きな課題である。本論文では、LLMパワードOC...
本記事は arXiv:2409.00920 ToolACE: Winning the Points of LLM Function Calling の解説記事です。 論文概要(Abstract) ToolACEは、LLMのFunction Calling能力を向上させるための高品質な訓練データを自動生成するパイプラインである。著者らは自己進化的合成プロセスにより26,507個の多様なAP...
論文概要 本記事は Jina-ColBERT-v2 (arXiv:2408.16672) の解説記事です。Jina-ColBERT-v2は、ColBERTアーキテクチャに基づく多言語対応のLate Interactionリトリーバーである。XLM-RoBERTaをバックボーンに採用し、Matryoshka Representation Learning(MRL)による柔軟な次元選択、Rot...
本記事は arXiv:2408.02442 Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large Language Models の解説記事です。 論文概要(Abstract) 本論文は、JSON、XML、YAML等の構造化出力フォーマットがLLMの推論能力および...
論文概要 本記事は ARAGOG (arXiv:2404.01037) の解説記事です。ARAGOG(Advanced RAG Output Grading)は、Retrieval-Augmented Generation(RAG)パイプラインにおける検索段階と生成段階を分離して評価する診断フレームワークである。著者らは、既存のRAG評価が end-to-end の出力品質のみに着目してお...
論文概要 本記事は Reconstructing Context: Evaluating Advanced Chunking Strategies for Retrieval-Augmented Generation (arXiv:2504.19754) の解説記事です。RAG(Retrieval-Augmented Generation)システムにおいて、文書をどのようにチャンクに分割す...
本記事は arXiv:2410.03439 ToolGen: Unified Tool Retrieval and Calling via Generation の解説記事です。 論文概要(Abstract) ToolGenは、従来のツール検索(どのツールを使うか)とツール呼び出し(どう使うか)を分離していたパイプラインを、LLMの単一生成パスに統一するフレームワークである。各ツールに仮...
本記事は Anthropicエンジニアリングブログ「Writing effective tools for AI agents」 の解説記事です。 ブログ概要(Summary) Anthropicは自社のエンジニアリングブログにおいて、AIエージェント向けツール設計の体系的なアプローチを公開した。このブログでは、ツールを「決定論的システムと非決定論的エージェントの間の新しいソフトウェア契...
論文概要 本記事は Late Chunking (arXiv:2409.04701) の解説記事です。Jina AIのMichael Güntherらが2024年9月に発表した本論文は、密ベクトル検索における従来のチャンキング手法が抱える文脈情報喪失の問題に対し、Transformerによるエンコード後にチャンキングを行う「Late Chunking」を提案しています。追加学習なしで既存の...