本記事は Effective harnesses for long-running agents(Anthropic Engineering Blog) の解説記事です。 ブログ概要(Summary) Anthropicは、長時間実行されるLLMエージェントの制御基盤(ハーネス)の設計パターンについて、実践的なエンジニアリングブログを公開している。このブログでは、Initializerエ...
本記事は arXiv:2601.01954 の解説記事です。 論文概要(Abstract) 本論文は、ソフトウェアエンジニアリング(SE)研究においてLLMプロンプティングがどのように報告されているかを実証的に調査した研究である。著者らはICSE、FSE、ASEの3大SE会議から2022年以降に発表された1,731本の論文を収集し、そこから286本のLLM関連論文を抽出・分析した。さらに...
本記事は https://www.anthropic.com/research/bloom の解説記事です。記事中の実験結果・数値はすべてAnthropicチームによる報告に基づいており、筆者自身が実験を行ったものではありません。 ブログ概要(Summary) Bloomは、LLMの行動特性(sycophancy、self-preservation、sabotageなど)を定量評価するた...
本記事は The Orchestration of Multi-Agent Systems: Architectures, Protocols, and Enterprise Adoption(arXiv:2601.13671) の解説記事です。 論文概要(Abstract) 本論文は、自律エージェントが構造化された協調とコミュニケーションを通じて共有目標を達成する「オーケストレーテッド...
本記事は Prompt, agent, and model lifecycle management(AWS Prescriptive Guidance, 2026年公開)の解説記事です。 この記事は Zenn記事: Gitによるプロンプト変更管理:LLMアプリの品質を守るバージョニング実践 の深掘りです。 ブログ概要(Summary) AWS Prescriptive Guidanc...
本記事は Difficulty-Aware Agent Orchestration in LLM-Powered Workflows(arXiv:2509.11079、WWW2026採択) の解説記事です。 論文概要(Abstract) 本論文は、既存のマルチエージェントLLMシステムが静的ワークフローに依存しているため、単純なクエリを過剰に処理するか複雑なクエリで性能が不足する問題に対...
Braintrust解説: プロンプトバージョニングのベストプラクティス ブログ概要(Summary) 本記事は https://www.braintrust.dev/articles/what-is-prompt-versioning の解説記事です。 Braintrustが公開したこの記事では、LLMアプリケーションにおけるプロンプトバージョニングの定義、設計原則、デプロイ戦略、テ...
本記事は How we built our multi-agent research system(Anthropic Engineering Blog) の解説記事です。 ブログ概要(Summary) Anthropicは、自社のResearch機能においてマルチエージェントシステムを構築した経験について詳細なエンジニアリングブログを公開している。このシステムはオーケストレータ・ワーカ...
本記事は arXiv:2406.09760 “A Taxonomy of AgentOps for Language Model Agents” の解説記事です。 論文概要(Abstract) 著者ら(Wayadande, Pisal, Patil)は、LLMベースのAIエージェントを体系的に構築・評価・テスト・デプロイするためのツール群と運用プラクティスを「AgentOps」として定義...
本記事は From Agent Loops to Structured Graphs: A Scheduler-Theoretic Framework for LLM Agent Execution の解説記事です。 論文概要(Abstract) 本論文は、LLMエージェントシステムで広く採用されている「エージェントループ」パラダイムの構造的弱点を特定し、古典的なスケジューリング理論を適...