本記事は Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence (arXiv:2407.07061) の解説記事です。 論文概要(Abstract) 本論文は、異なるフレームワーク(AutoGen、LangChain、独自実装)や異なるLLMバックエンド(GPT-4...
本記事は An open-source protocol for AI agents to interact (IBM Research Blog) の解説記事です。 ブログ概要(Summary) IBM Researchが2025年3月に公開したAgent Communication Protocol (ACP) の設計思想と実装を解説するブログ記事である。ACPは「エージェント通信の...
本記事は AG2 OpenTelemetry Tracing: Full Observability for Multi-Agent Systems (AG2 Blog, 2026-02-08) の解説記事です。 ブログ概要(Summary) AG2(AutoGen v0.4+)の公式ブログ記事で、フレームワークに組み込まれたOpenTelemetryトレーシング機能の設計と使用法を解説...
本記事は Distributed tracing for agentic workflows with OpenTelemetry (Red Hat Developer, 2026-04-06) の解説記事です。 ブログ概要(Summary) Red Hat AIチームのFabio Massimo Ercoli氏が、マルチエージェントITセルフサービスシステム(it-self-servi...
本記事は A Survey on Agent Communication Protocols (arXiv:2505.02279) の解説記事です。 論文概要(Abstract) 本論文は、LLMエージェント間通信のための4大プロトコル — Google A2A(Agent-to-Agent)、Anthropic MCP(Model Context Protocol)、IBM ACP(A...
本記事は arXiv:2506.06579 の解説記事です。 論文概要(Abstract) 本論文は、LLM推論における計算コスト・エネルギー消費・レイテンシの課題に対し、マルチLLMインテリジェントモデル選択の2大アプローチ――ルーティングと階層的推論(Hierarchical Inference / カスケーディング)――を体系的に特徴化・比較する。ルーティングはクエリ特性に基づいて...
本記事は arXiv:2508.07675 の解説記事です。 論文概要(Abstract) LLM推論コストの削減手段としてセマンティックキャッシュが注目されている。本論文は、意味的に類似したクエリに対してキャッシュ済み応答を再利用する際の「ミスマッチコスト」を考慮したキャッシュ退避問題を、原理的な最適化問題として定式化した。著者らは、クエリ到着確率やサービングコストが既知のOracle...
本記事は TensorOpera Router: A Multi-Model Router for Efficient LLM Inference (arXiv:2408.12320) の解説記事です。 論文概要(Abstract) TensorOpera Router(PolyRouter)は、複数の特化型LLM(エキスパートモデル)を統合管理し、受信クエリごとに最適なモデルへ動的にル...
本記事は The Gateway Grew Up — Portkey Blog の解説記事です。 ブログ概要(Summary) Portkey AIが2026年3月に公開した「The Gateway Grew Up」は、同社のAIゲートウェイ製品であるPortkey Gatewayのメジャーアップデート(Gateway 2.0)を発表するブログ記事である。Portkeyの公式ブログによる...
本記事は arXiv:2603.04445 の解説記事です。 論文概要(Abstract) LLMの急速な発展に伴い、性能・コスト・得意分野が異なる多数のモデルが利用可能になっている。静的なモデルデプロイメントではクエリの複雑さに応じた柔軟な対応ができないため、推論時にクエリ特性に基づいてモデルを動的に選択するルーティングシステムへの需要が高まっている。本サーベイは、独立に訓練された複数...