本記事は、Gim et al. (2024) による論文「Prompt Cache: Modular Attention Reuse for Low-Latency Inference」の解説記事です。LLM推論において、プロンプト間で共通するテキストセグメントのKVキャッシュを事前計算・再利用し、Time To First Token (TTFT) を削減する手法を、数式・実装・実験結果を...
ブログ概要(Summary) 本記事は LangChain公式ブログ「Agent Protocol: Interoperability for LLM agents」(2024年11月19日公開、著者: Ankush Gola)の解説記事です。 LLMエージェントのフレームワークが乱立する中、異なるフレームワーク間でエージェントを連携させる標準的な方法が求められています。このブログでは、...
本記事は DPBench の解説記事です。 論文概要(Abstract) DPBenchは、LLMベースのマルチエージェントシステムが同時的な資源競合の下でどのように協調するかを評価するためのベンチマークである。著者らは古典的な食事する哲学者問題(Dining Philosophers Problem)をフレームワークとして採用し、行動プロトコル、通信構造、グループサイズを独立して変化さ...
本記事は Introducing LangSmith Engine の解説記事です。 ブログ概要(Summary) LangSmith Engineは、LangChainが2026年5月のInterrupt 2026カンファレンスでパブリックベータとして発表した機能である。本番環境のトレースデータを継続的に監視し、障害検出、パターンクラスタリング、根本原因診断、修正Pull Reques...
論文概要 本記事は https://arxiv.org/abs/2411.18241 の解説記事です。 本論文「Exploration of LLM Multi-Agent Application Implementation Based on LangGraph+CrewAI」は、Zhihua Duan、Jialin Wang(2024年11月27日公開、arXiv:2411.1824...
本記事は How we built our multi-agent research system の解説記事です。 ブログ概要(Summary) Anthropicは、自社のResearch機能をorchestrator-workerパターンで構築したマルチエージェントシステムとして公開している。リードエージェント(Claude Opus 4)がクエリを分析して戦略を策定し、複数の特殊...
論文概要 本記事は https://arxiv.org/abs/2512.16959 の解説記事です。 Mohammad(2025)は、マイクロサービスにおける回復パターン・戦略・評価フレームワークに関するPRISMA準拠の系統的文献レビューを実施した。2014年から2025年にかけてIEEE Xplore、ACM Digital Library、Scopusから収集された412件の文献...
本記事は arXiv:2503.11951 の解説記事です。 論文概要(Abstract) Chang and Geng(2025)は、LLMベースのマルチエージェント計画システムが抱える4つの根本的限界 – 信頼性の低い自己検証、コンテキスト喪失、トランザクション保証の欠如、エージェント間協調不足 – に対処する構造化マルチエージェントアーキテクチャ「SagaLLM」を提案している。S...
論文概要 Xie et al. (2026) による本論文は、LLMベースのマルチエージェントシステム(LLM-MAS)において、単一の小さな誤りがメッセージ伝播を通じてシステム全体の偽合意(false consensus)に発展するメカニズムを数理的にモデル化し、その防御手法を提案した研究である。著者らは協調構造を有向依存グラフとして抽象化し、3種類の脆弱性クラス(カスケード増幅・トポロ...
AI生成記事: 本記事はClaude Opus 4.6によって生成されました。内容の正確性は論文原文に基づいていますが、解釈の誤りがある可能性があります。 本記事は Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems の解説記事で...