本記事は MemoryOS: LLM Agent Memory Management Operating System Inspired by OS (Ji et al., 2025) の解説記事です。 論文概要(Abstract) MemoryOSは、オペレーティングシステム(OS)のストレージ階層設計をLLMエージェントのメモリ管理に適用した包括的フレームワークである。インコンテキス...
本記事は Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models (2023) の解説記事です。 論文概要(Abstract) 本論文は、LLMの固定長コンテキストウィンドウの制約を超えて長期対話メモリを実現する「再帰的要約チェーン」を提案している。会話を固定ウィンドウで処理し、...
本記事は Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory (Chhikara et al., 2025) の解説記事です。 論文概要(Abstract) Mem0は、AIエージェント・アシスタント向けのスケーラブルなメモリ層である。純粋なベクトル類似度検索やフルコンテキスト方式とは異なり、意...
本記事は Effective context engineering for AI agents(Anthropic Applied AI team, 2025年9月)の解説記事です。 ブログ概要(Summary) Anthropicの応用AIチームが発表した本ブログポストは、「コンテキストエンジニアリング」という概念を体系化した実践ガイドである。プロンプトエンジニアリング(初期プロンプ...
本記事は MemGPT: Towards LLMs as Operating Systems (Packer et al., 2023) の解説記事です。 論文概要(Abstract) MemGPTは、オペレーティングシステム(OS)のメモリ階層の概念をLLMのコンテキスト管理に適用した研究である。固定長のコンテキストウィンドウを「主記憶(RAM)」、外部ストレージ(ベクターDB・ファイ...
論文概要(Abstract) 本記事は Towards Tool Use Alignment of Large Language Models(EMNLP 2024)の解説記事です。 LLMが外部ツールを呼び出す際、正しくツールを選択・実行するだけでなく、有害な指示や不正なツール応答を拒否し、不要なツール呼び出しを避けて自律的に応答する能力が求められる。本論文は、ツール利用シナリオにおけ...
Anthropicエンジニアリングブログ解説: AIエージェントのための効果的なツール設計 ブログ概要 本記事は https://www.anthropic.com/engineering/writing-tools-for-agents の解説記事です。 Anthropicのエンジニアリングチーム(Ken Aizawa他、Barry Zhang, Zachary Witten, Da...
論文概要(Abstract) 本記事は Gorilla: Large Language Model Connected with Massive APIs の解説記事です。 Gorillaは、UC Berkeleyの研究チームが提案した、LLMに大規模APIの正確な呼び出し能力を付与するためのシステムである。著者らは、APIドキュメントを検索して取得した情報をプロンプトに含めた状態でファ...
本記事は ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs (arXiv:2307.16789) の解説記事です。 論文概要(Abstract) ToolLLMは、Tsinghua大学・Yale大学・RapidAPIの共同研究チームが2023年に発表した、LLMに大規模な実世界APIの...
本記事は SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering (arXiv:2405.15017) の解説記事です。 論文概要(Abstract) SWE-agentは、LLMエージェントがソフトウェアエンジニアリングタスクを遂行する際のAgent-Computer Interfac...