Home
0h-n0 TechBLog
キャンセル

📄 論文解説: DAAO — 難易度適応型エージェントオーケストレーションによるクエリ特化マルチエージェントワークフロー

本記事は Difficulty-Aware Agent Orchestration in LLM-Powered Workflows(arXiv:2509.11079、WWW2026採択) の解説記事です。 論文概要(Abstract) 本論文は、既存のマルチエージェントLLMシステムが静的ワークフローに依存しているため、単純なクエリを過剰に処理するか複雑なクエリで性能が不足する問題に対...

✍️ Braintrust解説: プロンプトバージョニングのベストプラクティス — 本番運用を壊さないイテレーション手法

Braintrust解説: プロンプトバージョニングのベストプラクティス ブログ概要(Summary) 本記事は https://www.braintrust.dev/articles/what-is-prompt-versioning の解説記事です。 Braintrustが公開したこの記事では、LLMアプリケーションにおけるプロンプトバージョニングの定義、設計原則、デプロイ戦略、テ...

✍️ Anthropicのマルチエージェントリサーチシステム: オーケストレータ・ワーカーパターンの設計と運用

本記事は How we built our multi-agent research system(Anthropic Engineering Blog) の解説記事です。 ブログ概要(Summary) Anthropicは、自社のResearch機能においてマルチエージェントシステムを構築した経験について詳細なエンジニアリングブログを公開している。このシステムはオーケストレータ・ワーカ...

📄 論文解説: A Taxonomy of AgentOps for Language Model Agents

本記事は arXiv:2406.09760 “A Taxonomy of AgentOps for Language Model Agents” の解説記事です。 論文概要(Abstract) 著者ら(Wayadande, Pisal, Patil)は、LLMベースのAIエージェントを体系的に構築・評価・テスト・デプロイするためのツール群と運用プラクティスを「AgentOps」として定義...

📄 論文解説: From Agent Loops to Structured Graphs — LLMエージェント実行のスケジューラ理論的フレームワーク

本記事は From Agent Loops to Structured Graphs: A Scheduler-Theoretic Framework for LLM Agent Execution の解説記事です。 論文概要(Abstract) 本論文は、LLMエージェントシステムで広く採用されている「エージェントループ」パラダイムの構造的弱点を特定し、古典的なスケジューリング理論を適...

📄 論文解説: Llumnix - LLMサービングのための動的スケジューリングとライブマイグレーション

本記事は Llumnix: Dynamic Scheduling for Large Language Model Serving の解説記事です。 この記事は Zenn記事: Ollama v0.23×Docker Composeで構築するマルチGPU分散推論クラスタ実践ガイド の深掘りです。 論文概要(Abstract) 著者ら(Alibaba Cloud)は、既存のLLMサービン...

📄 論文解説: PowerInfer - コンシューマGPUでの高速LLM推論エンジン

本記事は PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU の解説記事です。 この記事は Zenn記事: Ollama v0.23×Docker Composeで構築するマルチGPU分散推論クラスタ実践ガイド の深掘りです。 論文概要(Abstract) 著者ら(上海交通大学 IPADS研究室...