📄 論文解説: ARAGOG — RAGパイプラインの検索・生成分離評価フレームワーク

論文概要本記事は ARAGOG (arXiv:2404.01037) の解説記事です。ARAGOG（Advanced RAG Output Grading）は、Retrieval-Augmented Generation（RAG）パイプラインにおける検索段階と生成段階を分離して評価する診断フレームワークである。著者らは、既存のRAG評価が end-to-end の出力品質のみに着目してお...

27/05/2026 blog paper

RAG evaluation RAGAS +2

📄 論文解説: Reconstructing Context — RAG向け高度チャンキング戦略の体系的評価

論文概要本記事は Reconstructing Context: Evaluating Advanced Chunking Strategies for Retrieval-Augmented Generation (arXiv:2504.19754) の解説記事です。RAG（Retrieval-Augmented Generation）システムにおいて、文書をどのようにチャンクに分割す...

27/05/2026 blog paper

RAG chunking evaluation +2

📄 ICLR 2025論文解説: ToolGen ― ツール検索と呼び出しを生成で統一するフレームワーク

本記事は arXiv:2410.03439 ToolGen: Unified Tool Retrieval and Calling via Generation の解説記事です。論文概要（Abstract） ToolGenは、従来のツール検索（どのツールを使うか）とツール呼び出し（どう使うか）を分離していたパイプラインを、LLMの単一生成パスに統一するフレームワークである。各ツールに仮...

27/05/2026 blog paper

AI agent tool-use +3

✍️ Anthropic解説: AIエージェントのための効果的なツール設計 ― 5原則と評価駆動アプローチ

本記事は Anthropicエンジニアリングブログ「Writing effective tools for AI agents」の解説記事です。ブログ概要（Summary） Anthropicは自社のエンジニアリングブログにおいて、AIエージェント向けツール設計の体系的なアプローチを公開した。このブログでは、ツールを「決定論的システムと非決定論的エージェントの間の新しいソフトウェア契...

27/05/2026 blog tech_blog

AI agent tool-use +3

📄 論文解説: Late Chunking — 長文コンテキスト埋め込みモデルによる文脈保持型チャンキング

論文概要本記事は Late Chunking (arXiv:2409.04701) の解説記事です。Jina AIのMichael Güntherらが2024年9月に発表した本論文は、密ベクトル検索における従来のチャンキング手法が抱える文脈情報喪失の問題に対し、Transformerによるエンコード後にチャンキングを行う「Late Chunking」を提案しています。追加学習なしで既存の...

27/05/2026 blog paper

RAG chunking embedding +2

📄 論文解説: DRAGIN — 情報ニーズベースの動的検索拡張生成

論文概要（Abstract）本記事は DRAGIN: Dynamic Retrieval Augmented Generation based on the Information Needs of Large Language Models の解説記事です。DRAGINは、生成過程でLLMが「いつ」「何を」検索すべきかを、モデル内部の情報ニーズに基づいて動的に判断するActive Re...

26/05/2026 blog paper

DRAGIN RAG active-retrieval +3

📄 論文解説: ToolLLM — 16000以上の実世界APIをLLMに習得させるフレームワーク

本記事は https://arxiv.org/abs/2304.08354 の解説記事です。論文概要（Abstract） Qin, Liang, Ye et al. (2023) は、オープンソースLLMのツール使用能力を飛躍的に向上させるフレームワーク ToolLLM を提案した。著者らは RapidAPI Hub から 16,464 個の実世界 API（49カテゴリ）を収集し、自動...

26/05/2026 blog paper

ToolLLM DFSDT tool-use +3

✍️ AWS公式ブログ解説: Amazon Q BusinessのAgentic RAG機能

ブログ概要（Summary）本記事は AWSブログ: Bringing Agentic RAG to Amazon Q Business の解説記事です。AWSは、Amazon Q Businessに「Agentic RAG」機能を導入し、従来の単発検索型RAGでは困難であった複雑なエンタープライズクエリへの対応を実現した。AIエージェントがクエリ分解、ツールベース検索、マルチターン会話...

26/05/2026 blog tech_blog

AWS Amazon-Q AgenticRAG +2

📄 論文解説: MCPエージェントエコシステムのセキュリティ — 4つの攻撃ベクタと6つの対策

本記事は https://arxiv.org/abs/2505.14032 の解説記事です。論文概要（Abstract） Liu, Song, Xing, Zhang (2025) は、Model Context Protocol（MCP）ベースのエージェントシステムにおけるセキュリティ脆弱性を体系的に分析した論文を発表した。著者らは3つのデプロイメントシナリオ（Single Agen...

26/05/2026 blog paper

MCP security prompt-injection +2

📄 論文解説: MCPBench — MCPサーバーの実用性を体系的に評価するベンチマーク

論文概要（Abstract）本記事は https://arxiv.org/abs/2504.11094 の解説記事です。 MCPBenchは、2024年後半に登場したModel Context Protocol（MCP）サーバーの実用性を体系的に評価するベンチマークフレームワークである。著者らは、Web検索系7サーバーとデータベース検索系3サーバーの合計10種のMCPサーバーを対象に、...

26/05/2026 blog paper

MCP benchmark evaluation +2

1
...
25
26
27
...
147
26 / 147