Home
0h-n0 TechBLog
キャンセル

📄 論文解説: Skills for Scalable AI Agents — スキルのライフサイクルと相転移現象

本記事は Skills for Scalable AI Agents (arXiv:2602.12430) の解説記事です。 論文概要(Abstract) Li et al.(2026)は、LLMエージェントにおける「スキル(Skill)」を統一的に整理した論文を発表した。著者らはスキルを取得方法(Acquisition)・表現形式(Representation)・呼び出し方法(Invo...

📄 論文解説: SafeThink — 推論チェーン初期の数ステップ介入で安全性を回復するinference-time防御

論文概要(Abstract) 本記事は Safety Recovery in Reasoning Models Is Only a Few Early Steering Steps Away (arXiv:2602.11096) の解説記事です。 SafeThinkは、マルチモーダル大規模推論モデル(MLRM)に対するinference-time防御手法である。安全報酬モデルで推論トレー...

📄 論文解説: Enhancing Multi-Server MCP Interactions Through Context-Aware Server Collaboration

論文概要(Abstract) MCP(Model Context Protocol)のマルチサーバー環境において、サーバー間の文脈共有不足や冗長な処理が課題となっている。本論文では、Context Propagation(文脈伝播)、Capability Negotiation(能力交渉)、Collaborative Task Decomposition(協調タスク分解)の3つのメカニズム...

📄 論文解説: Large Language Model based Multi-Agents — A Survey of Progress and Challenges

本記事は arXiv:2402.01680 の解説記事です。 論文概要(Abstract) Guo et al.(2024)は、LLMベースのマルチエージェントシステムを「環境(Environment)」「プロファイル(Profile)」「コミュニケーション(Communication)」「能力(Capability)」の4軸で体系的に分類したサーベイ論文である。IJCAI 2024に採...

✍️ Anthropic Engineering解説: 長時間実行エージェントの効果的なハーネス設計パターン

本記事は Effective harnesses for long-running agents(Anthropic Engineering Blog、2025年11月26日公開) の解説記事です。 ブログ概要(Summary) Anthropic Engineeringブログで公開されたこの記事は、コンテキストウィンドウを超える長時間実行エージェントを安定して運用するためのハーネス(制...

📄 ICLR 2025論文解説: Relaxed Recursive Transformers — レイヤー共有とLoRAによるモデル圧縮

論文概要(Abstract) 本記事は Relaxed Recursive Transformers (ICLR 2025) の解説記事です。 Google DeepMindの研究チームは、既存の事前学習済みTransformerを「Recursive Transformer」に変換する手法を提案している。Recursive Transformerは単一のレイヤーブロックを複数回繰り返し...

📄 論文解説: Think, But Don't Overthink — LLM推論における過剰思考の抑制と動的トークン予算制御

論文概要(Abstract) 本記事は Think, But Don’t Overthink (arXiv:2603.02615) の解説記事です。 DeepSeek-R1やQwQ-32Bなどの大規模推論モデル(LRM)は、回答前に拡張的な思考チェーン(thinking tokens)を生成する。この拡張推論は困難な問題で性能を向上させるが、しばしば「過剰思考(overthinking)...

📄 論文解説: MemGPT — 仮想メモリ管理に着想を得たLLMエージェントの無制限セッション維持

論文概要(Abstract) 本記事は MemGPT: Towards LLMs as Operating Systems(Packer et al., 2023) の解説記事です。MemGPTは、オペレーティングシステムの仮想メモリ管理から着想を得て、LLMの固定長コンテキストウィンドウを超える長期ステートフルセッションを実現するシステムである。著者らは、LLMエージェントが自身のコンテ...