本記事は MCP-Zero: Proactive Tool Discovery for Autonomous LLM Agents の解説記事です。 論文概要(Abstract) MCP-Zeroは、大規模なMCPサーバー環境においてLLMエージェントが必要なツールを動的に発見・接続するフレームワークである。従来の静的MCPツール読み込みでは、サーバー数が増加するとコンテキスト汚染・ツー...
本記事は Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory の解説記事です。 論文概要(Abstract) LLMの急速な発展により、マルチターン対話やエージェントの実用化が進む一方で、セッションをまたぐ長期記憶の欠如が実運用における重大な課題となっている。著者らはMem0を提案し、LLMエー...
本記事は Build durable AI agents with LangGraph and Amazon DynamoDB の解説記事です。 ブログ概要 AWS Database Blogで公開されたこの記事は、LangGraphで構築したAIエージェントのチェックポイント(状態スナップショット)をAmazon DynamoDBに永続化する手法を解説している。LangGraphのグラ...
ブログ概要 本記事はAnthropic Engineering Blog: Code execution with MCPの解説記事です。 Anthropicのエンジニアリングチームは、MCP(Model Context Protocol)を利用したAIエージェント構築において、従来のツール直接呼び出しパターンからコード実行パターンへ移行することで、トークン使用量を150,000トークン...
本記事は Beyond Single Turns: Understanding Longitudinal Agent Interaction and Session Continuation の解説記事です。 論文概要(Abstract) LLMエージェントが実世界のタスクを遂行する際、ネットワーク障害やタイムアウト、ユーザーの離席などによりセッションが中断されるケースは避けられない。従...
本記事は MALBO: Optimizing LLM-Based Multi-Agent Teams via Multi-Objective Bayesian Optimization の解説記事です。 論文概要(Abstract) MALBOは、LLMベースのマルチエージェントシステムにおけるモデル割当を多目的最適化問題として定式化するフレームワークである。$M$個のLLMと$N$個の...
本記事は RouteLLM: Learning to Route LLMs with Preference Data の解説記事です。 論文概要(Abstract) RouteLLMは、クエリの複雑さに応じて高性能(高コスト)なLLMと軽量(低コスト)なLLMを動的に切り替えるルーターモデルのフレームワークである。著者らは、Chatbot Arenaの人間選好データを活用して4種のルータ...
本記事は GuardAgent: Safeguard LLM Agents by a Guard Agent via Knowledge-Enabled Reasoning の解説記事です。 論文概要(Abstract) LLMエージェントの急速な発展に伴い、エージェントが実行するアクションの安全性を保証する課題が浮上している。著者らはGuardAgentを提案し、ターゲットエージェント...
本記事は AIOS: LLM Agent Operating System の解説記事です。 論文概要(Abstract) AIOSは、LLMベースのエージェントをOSのプロセスに見立て、スケジューリング・コンテキスト管理・メモリ管理・ストレージ管理・アクセス制御といったカーネルレベルの機能を提供するアーキテクチャである。著者らは、従来のエージェントフレームワークではLLMリソースの独占...
論文概要(Abstract) LLMで複雑なタスクを処理する際、長大なプロンプトがメモリ使用量・推論コスト・レイテンシの増大を引き起こす。本サーベイ論文は、プロンプト圧縮手法をHard Prompt Methods(自然言語テキストの直接操作)とSoft Prompt Methods(学習された連続ベクトル表現への変換)に体系化し、Attention最適化・PEFT・マルチモーダル統合・合...