Home
0h-n0 TechBLog
キャンセル

📄 論文解説: AgentSquare - モジュール設計空間でのLLMエージェント自動探索

本記事は arXiv:2501.12599 の解説記事です。 論文概要(Abstract) Chen, Yuan, Song ら(2025)は、LLMエージェントの設計をモジュール化し、最適な構成を自動探索するフレームワーク AgentSquare を提案した。エージェントシステムをPlanning、Reasoning、Tool Use、Memoryの4モジュールに分解し、(1) mod...

📄 論文解説: τ-bench - Tool-Agent-User Interaction Benchmark

本記事は arXiv:2406.12045 の解説記事です。 論文概要(Abstract) Yao, Shinn, Razavi, Narasimhan(2024)は、LLMエージェントのツール使用能力・ポリシー準拠・ユーザインタラクション能力を包括的に評価するベンチマークτ-bench(Tool-Agent-User Interaction Benchmark)を提案した。従来のベンチ...

✍️ Anthropicブログ解説: Effective Harnesses for Long-Running Agents

Anthropicブログ解説: Effective Harnesses for Long-Running Agents ブログ概要 本記事は Anthropic Engineering Blog: Effective harnesses for long-running agents の解説記事です。 Anthropicのエンジニアリングチームは、長時間動作するAIエージェントが大規模...

✍️ LangChainブログ解説: Tuning Deep Agents to Work Well with Different Models

ブログ概要 本記事は Tuning Deep Agents to Work Well with Different Models(LangChain公式ブログ、2026年4月29日、Vivek Trivedy・Mason Daugherty著)の解説記事です。 LLMベースのエージェントフレームワークにおいて、モデルごとに異なるプロンプト戦略やツール構成が必要になる問題は広く認識されてい...

📄 論文解説: BioEmu — 拡散モデルによるタンパク質平衡アンサンブルのスケーラブルなエミュレーション

論文概要(Abstract) BioEmuは、Microsoft Researchが開発した拡散ベースの生成モデルであり、タンパク質のアミノ酸配列のみを入力として、ボルツマン分布に従う平衡構造アンサンブルを高速に生成する。従来の分子動力学(MD)シミュレーションではスーパーコンピュータで数ヶ月を要する計算を、単一GPUで1時間あたり数千構造の生成へと加速した。AlphaFold2のEvof...

📄 論文解説: Inference Scaling for Long-Context RAG

論文概要(Abstract) 本記事は Inference Scaling for Long-Context RAG論文 (arXiv:2410.04343) の解説記事です。 Retrieval-Augmented Generation(RAG)において、推論時のスケーリング戦略を体系的に分析した研究である。著者らは、取得するコンテキストの長さ(context length scali...

📄 論文解説: Sleeping Competing Bandits — Dueling Banditのsleeping拡張とregret解析

本記事は arXiv:2603.19700 の解説記事です。 論文概要(Abstract) Saha & Shekhar(2026)は、competing bandits(dueling bandits)モデルをsleeping設定に拡張した「Sleeping Competing Bandits」を提案した。標準のcompeting banditsでは学習者がペアのアームを選択し...