Home
0h-n0 TechBLog
キャンセル

📄 NeurIPS 2025論文解説: A-Mem — Zettelkasten方式によるLLMエージェントの自律型メモリ管理

本記事は https://arxiv.org/abs/2502.12110 の解説記事です。 論文概要(Abstract) A-Memは、LLMエージェントのメモリを「エージェント自身が自律的に組織化する」という新しいパラダイムを提案するシステムである。社会学者Niklas Luhmannが考案したZettelkasten(ツェッテルカステン)方式の原理を応用し、個々のメモリをアトミック...

📄 論文解説: MemGPT — LLMをOSとして捉える階層型メモリアーキテクチャ

本記事は https://arxiv.org/abs/2310.08560 の解説記事です。 論文概要(Abstract) MemGPTは、LLMの固定長コンテキストウィンドウをOSにおける物理メモリ(RAM)に見立て、外部ストレージとの間で情報をページングする階層型メモリ管理システムである。著者らは、Main Context(高速・限定容量)、Recall Storage(会話履歴のベ...

✍️ Google Research公式ブログ解説: Towards a Science of Scaling Agent Systems

本記事は Google Research Blog: Towards a Science of Scaling Agent Systems: When and Why Agent Systems Work(2026年1月28日公開)の解説記事です。 ブログ概要(Summary) Google ResearchのKim & Liu(2026)は、「エージェントを増やせば性能が上がる...

✍️ Google DeepMind公式解説: Gemini 3.1 Pro — 3段階推論と16ベンチマーク分析

ブログ概要 本記事は Google DeepMind公式: Gemini 3.1 Pro の解説記事である。Google DeepMindは2026年2月19日にGemini 3.1 Proを公開した。Gemini 3.1 Proは、Transformer系Mixture-of-Experts(MoE)アーキテクチャに基づく推論特化型モデルであり、従来の2段階(low/high)に加えて中...

✍️ Anthropic Research解説: 推論モデルのChain-of-Thoughtは思考過程を忠実に反映していない

ブログ概要 本記事は、Anthropic Alignment Scienceチームが2025年4月3日に公開した研究ブログ記事 Reasoning models don’t always say what they think の解説記事である。この研究では、推論モデル(Claude 3.7 SonnetおよびDeepSeek R1)のChain-of-Thought(CoT)が、モデルの...

📄 論文解説: RouterBench — LLMルーティング戦略のベンチマーク評価

本記事は arXiv:2503.06806 の解説記事です。 論文概要(Abstract) RouterBenchは、LLMルーティング戦略を公平に比較評価するためのベンチマークフレームワークである。LLMルーティングとは、入力クエリに応じて複数の候補モデル(高性能・高コストの大型モデルと低コストの小型モデル)から最適なモデルを選択するタスクを指す。著者らは、ルールベース・学習ベース分類...