Home
0h-n0 TechBLog
キャンセル

✍️ AG2解説: OpenTelemetryによるマルチエージェントシステムの完全可観測性

本記事は AG2 OpenTelemetry Tracing: Full Observability for Multi-Agent Systems (AG2 Blog, 2026-02-08) の解説記事です。 ブログ概要(Summary) AG2(AutoGen v0.4+)の公式ブログ記事で、フレームワークに組み込まれたOpenTelemetryトレーシング機能の設計と使用法を解説...

📄 論文解説: A Survey on Agent Communication Protocols

本記事は A Survey on Agent Communication Protocols (arXiv:2505.02279) の解説記事です。 論文概要(Abstract) 本論文は、LLMエージェント間通信のための4大プロトコル — Google A2A(Agent-to-Agent)、Anthropic MCP(Model Context Protocol)、IBM ACP(A...

📄 論文解説: Towards Efficient Multi-LLM Inference — ルーティング vs 階層的推論の体系的比較

本記事は arXiv:2506.06579 の解説記事です。 論文概要(Abstract) 本論文は、LLM推論における計算コスト・エネルギー消費・レイテンシの課題に対し、マルチLLMインテリジェントモデル選択の2大アプローチ――ルーティングと階層的推論(Hierarchical Inference / カスケーディング)――を体系的に特徴化・比較する。ルーティングはクエリ特性に基づいて...

📄 INFOCOM 2026論文解説: セマンティックキャッシュによる低コストLLMサービング — オフライン学習からオンライン適応へ

本記事は arXiv:2508.07675 の解説記事です。 論文概要(Abstract) LLM推論コストの削減手段としてセマンティックキャッシュが注目されている。本論文は、意味的に類似したクエリに対してキャッシュ済み応答を再利用する際の「ミスマッチコスト」を考慮したキャッシュ退避問題を、原理的な最適化問題として定式化した。著者らは、クエリ到着確率やサービングコストが既知のOracle...

✍️ Portkeyテックブログ解説: Gateway 2.0 — 1日1兆トークンを処理するAIゲートウェイのフルOSS化

本記事は The Gateway Grew Up — Portkey Blog の解説記事です。 ブログ概要(Summary) Portkey AIが2026年3月に公開した「The Gateway Grew Up」は、同社のAIゲートウェイ製品であるPortkey Gatewayのメジャーアップデート(Gateway 2.0)を発表するブログ記事である。Portkeyの公式ブログによる...

📄 論文解説: Dynamic Model Routing and Cascading for Efficient LLM Inference — LLMルーティング手法の体系的サーベイ

本記事は arXiv:2603.04445 の解説記事です。 論文概要(Abstract) LLMの急速な発展に伴い、性能・コスト・得意分野が異なる多数のモデルが利用可能になっている。静的なモデルデプロイメントではクエリの複雑さに応じた柔軟な対応ができないため、推論時にクエリ特性に基づいてモデルを動的に選択するルーティングシステムへの需要が高まっている。本サーベイは、独立に訓練された複数...