Home
0h-n0 TechBLog
キャンセル

📄 論文解説: Dynamic Model Routing and Cascading for Efficient LLM Inference

論文概要(Abstract) 本記事は Dynamic Model Routing and Cascading for Efficient LLM Inference: A Survey の解説記事です。 本サーベイ論文は、LLM推論時に複数モデルから動的にモデルを選択する「ルーティング」と「カスケード」のアプローチを体系的に整理したものです。著者らは、クエリ難易度推定、人間の嗜好データ...

📄 論文解説: ToolPRM — Function Callingのためのプロセス報酬モデルによる推論時スケーリング

本記事は ToolPRM: Fine-Grained Inference Scaling of Structured Outputs for Function Calling(Lin et al., 2025年10月、ACL 2026 採択)の解説記事です。 論文概要(Abstract) 推論時スケーリング(test-time compute scaling)は数学的推論タスクで成功を収...

📄 論文解説: VIGIL — ツールストリームインジェクションからLLMエージェントを防御するVerify-Before-Commitプロトコル

本記事は VIGIL: Defending LLM Agents Against Tool Stream Injection via Verify-Before-Commit(Lin et al., 2026年1月)の解説記事です。 論文概要(Abstract) LLMエージェントのツール呼び出しにおいて、ツール定義(docstring)やランタイムフィードバック(tool_result...

📄 論文解説: XGrammar-2 — エージェントLLMのための動的構造化生成エンジン

本記事は XGrammar-2: Efficient Dynamic Structured Generation Engine for Agentic LLMs(Li et al., 2026年1月、ACM CAIS 26)の解説記事です。 論文概要(Abstract) 現代のLLMエージェントはツール呼び出し(Function Calling)において動的な構造化生成を必要とする。出力...

📄 論文解説: To Call or Not to Call — LLMツール呼び出しの必要性・有用性・コスト効率を評価するフレームワーク

本記事は To Call or Not to Call: A Framework to Assess and Optimize LLM Tool Calling(Wu et al., 2026年5月)の解説記事です。 論文概要(Abstract) LLMエージェントにおけるツール呼び出し(Function Calling)は常に有益とは限らない。冗長な呼び出しや性能を低下させる呼び出しが...

📄 NeurIPS 2025論文解説: Multi-Agent Collaboration via Evolving Orchestration — 強化学習で進化するマルチエージェント協調オーケストレーション

論文概要(Abstract) 本記事は arXiv:2505.19591「Multi-Agent Collaboration via Evolving Orchestration」(NeurIPS 2025採択)の解説記事です。 著者らは、マルチエージェントLLMシステムにおけるエージェント間の協調を中央集権型オーケストレーター(「Puppeteer」)が動的に制御する新たなパラダイムを...

✍️ AWS公式解説: LangGraphとAmazon DynamoDBで構築する耐久性のあるAIエージェント

ブログ概要(Summary) 本記事は AWS Database Blog「Build durable AI agents with LangGraph and Amazon DynamoDB」(2026年1月13日公開、著者: Lee Hannigan)の解説記事です。 LangGraphのステートマシンモデルでは、チェックポインターがグラフの各ステップでState(状態)をスナップシ...