📄 論文解説: Mem-α — 3階層メモリとインテリジェントルーティングでマルチエージェントLLMを強化

論文概要（Abstract）本記事は Mem-α (arXiv:2509.25911) の解説記事です。 Mem-αは、LLMエージェントの外部メモリ構築方針を強化学習（RL）で最適化するフレームワークである。従来手法は事前定義ルールでメモリ更新を行っていたが、「何を保存するか」「どう構造化するか」の判断がタスクに適応できない問題があった。Mem-αは下流QA精度を報酬としてGRPO（...

09/06/2026 blog paper

LLM multi-agent memory +2

📄 論文解説: AgentDiet — 推論時トラジェクトリ圧縮でLLMエージェントのトークンコストを最大60%削減

論文概要（Abstract）本記事は AgentDiet (arXiv:2509.23586) の解説記事です。 AgentDietは、LLMベースのマルチターンエージェントシステムにおいて、実行時のトラジェクトリ（軌跡）に蓄積する無駄な情報を自動的に除去する手法である。著者らは、エージェントの軌跡には「不要情報（useless）」「冗長情報（redundant）」「期限切れ情報（ex...

09/06/2026 blog paper

LLM agent token-efficiency +2

📄 論文解説: MemAgent — daGRPOで7Bモデルを3000Kトークン対応の長文処理エージェントに

論文概要本記事は MemAgent (arXiv:2507.02259) の解説記事です。 MemAgentは、LLMの固定コンテキストウィンドウの制約を超えて超長文ドキュメントを処理するためのエージェントフレームワークである。ドキュメントを固定長チャンクに分割し、各チャンクを逐次読み込みながら固定長の補助メモリパネルを上書き更新していく。訓練にはDAPO（Decoupled Adva...

09/06/2026 blog paper

LLM agent long-context +3

📄 論文解説: Memory-R1 — LLMエージェントにメモリ操作をRLでエンドツーエンド学習させる

本記事はAIによって生成されました。内容の正確性には配慮していますが、最新情報は原論文をご確認ください。論文概要本記事は Memory-R1 (arXiv:2508.19828) の解説記事です。 Memory-R1は、LLMエージェントが外部メモリを能動的に管理・活用する能力を強化学習（RL）によって獲得するためのフレームワークである。LLMは本質的にステートレスであり、コンテキ...

09/06/2026 blog paper

LLM agent reinforcement-learning +2

📄 論文解説: MemCtrl — RL訓練メモリコントローラでLLMエージェントの精度向上とトークン削減を両立

論文概要（Abstract）本記事は MemCtrl (arXiv:2601.20831) の解説記事です。 MemCtrlは、マルチモーダル大規模言語モデル（MLLM）にメモリ管理機能を付加するフレームワークである。基盤モデルのコンテキストウィンドウが有限であるという制約に対し、訓練可能なメモリヘッド $\mu$ をゲート機構として導入し、エージェントの探索中にどの観測・リフレクショ...

09/06/2026 blog paper

LLM agent reinforcement-learning +2

📄 論文解説: Lost in the Middle at Birth — Transformer位置バイアスの厳密理論

本記事は https://arxiv.org/abs/2603.10123 の解説記事です。論文概要 “Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias” (Borun D Chowdhury, 2026年3月) は、大規模言語モデル (LLM) で広く観測されてきた「中間部分の情報が失わ...

08/06/2026 blog paper

LLM transformer position-bias +3

✍️ AWS解説: LLM応答コスト90%削減を実現するキャッシュ戦略の実践ガイド

本記事は Optimize LLM response costs and latency with effective caching の解説記事です。ブログ概要 AWSデータベースブログで公開された本記事は、LLMアプリケーションにおけるキャッシュ戦略の包括的ガイドである。著者らは、プロンプトキャッシュとリクエスト-レスポンスキャッシュの2つの主要アプローチを提示し、Amazon M...

08/06/2026 blog tech_blog

AWS LLM caching +4

📄 論文解説: Inference Scaling for Long-Context RAG — 推論計算量スケーリングによるRAG性能の線形改善

本記事は https://arxiv.org/abs/2410.04343 の解説記事です。論文概要 Zhenrui Yue, Honglei Zhuang, Aijun Bai らによる本論文は、知識集約型タスクにおいてテスト時計算量（inference compute）を拡大する際、単にコンテキストに投入する外部知識量を増やすだけでは性能が頭打ちになるという問題に取り組んでいる。著...

08/06/2026 blog paper

LLM RAG inference-scaling +3

📄 ICML 2025論文解説: NoLiMa — リテラルマッチを超えるロングコンテキスト評価ベンチマーク

本記事は https://proceedings.mlr.press/v267/modarressi25a.html の解説記事です。論文概要 NoLiMa（No Literal Matching）は、LLMのロングコンテキスト処理能力をリテラルマッチングに頼らず評価するベンチマークである。著者らは、既存のNIAHテストが質問文とneedleの間に高い語彙的重複を持ち、モデルが表層的パ...

08/06/2026 blog paper

LLM long-context benchmark +3

📄 論文解説: Found in the Middle — 位置注意バイアスの較正によるロングコンテキスト活用の改善

本記事は https://arxiv.org/abs/2406.16008 の解説記事です。論文概要（Abstract）大規模言語モデル（LLM）は、長い入力コンテキストを処理するよう訓練されていても、入力の中間に位置する関連情報を適切に捉えることが困難である。本論文では、この「Lost in the Middle」問題がLLMの固有のU字型位置注意バイアスに起因することを明らかにし...

08/06/2026 blog paper

LLM long-context attention +3

1
...
13
14
15
...
144
14 / 144