Home
0h-n0 TechBLog
キャンセル

📄 論文解説: From Spark to Fire — Error Cascades and Failure Attribution in Multi-Agent Systems

論文概要 Xie et al. (2026) による本論文は、LLMベースのマルチエージェントシステム(LLM-MAS)において、単一の小さな誤りがメッセージ伝播を通じてシステム全体の偽合意(false consensus)に発展するメカニズムを数理的にモデル化し、その防御手法を提案した研究である。著者らは協調構造を有向依存グラフとして抽象化し、3種類の脆弱性クラス(カスケード増幅・トポロ...

📄 論文解説: Which Agent Causes Task Failures and When? — マルチエージェントLLMの自動障害帰属

AI生成記事: 本記事はClaude Opus 4.6によって生成されました。内容の正確性は論文原文に基づいていますが、解釈の誤りがある可能性があります。 本記事は Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems の解説記事で...

📄 論文解説: A Survey of AI Agent Protocols

本記事は arXiv論文 “A Survey of AI Agent Protocols”(Yang et al., 2025)の解説記事です。LLMエージェント間の通信プロトコルを体系的に分類・評価した初のサーベイ論文について、分類法の構造、主要プロトコルの設計、評価指標フレームワークを中心に解説します。 論文概要(Abstract) LLMベースのAIエージェントが産業界に広く展開さ...

📄 論文解説: Beyond Task Completion — エージェントAI評価の4柱フレームワーク

論文概要 本記事は https://arxiv.org/abs/2512.12791 の解説記事です。 Akshathala ら(2025)は、エージェント型AIシステムの評価においてタスク完了率(Task Completion Rate)のみに依存することの限界を指摘し、4つの評価柱(LLM・メモリ・ツール・環境)と3つの解析レイヤー(静的解析・動的実行・判定ベース)から構成される包括...

📄 論文解説: AI Observability for Large Language Model Systems

論文概要 本記事は https://arxiv.org/abs/2604.26152 の解説記事です。 本論文「AI Observability for Large Language Model Systems: A Multi-Layer Analysis of Monitoring Approaches from Confidence Calibration to Infrastru...

📄 論文解説: Towards a Science of AI Agent Reliability

論文概要 本記事は https://arxiv.org/abs/2602.16666 の解説記事です。 Stephan Rabanser、Sayash Kapoor ら Princeton University の研究グループは、AIエージェントの信頼性を科学的に定量化するための体系的フレームワークを提案した。著者らは、ベンチマーク精度スコアの改善が実際の運用信頼性の向上を意味しないとい...

📄 論文解説: Don't Break the Cache - プロンプトキャッシュの実践的評価

論文概要 本記事は Don’t Break the Cache: An Evaluation of Prompt Caching for Long-Horizon Agentic Tasks の解説記事です。 Lumer ら(2026)は、OpenAI・Anthropic・Google の 3 プロバイダが提供するプロンプトキャッシュ機構を、マルチターンのエージェントタスクで体系的に評価...

📄 EMNLP 2023論文解説: LLMLingua - プロンプト圧縮で最大20倍のトークン削減

論文概要 本記事は LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models の解説記事です。 LLMLinguaは、小型言語モデル(LLaMA-7B / Alpaca-7B等)を圧縮器として活用し、大規模言語モデル(GPT-3.5/GPT-4等)への入力プロンプトを最大20倍に圧縮...