Home
0h-n0 TechBLog
キャンセル

📄 論文解説: Multi-Modal Vision vs. Text-Based Parsing — LLMによる請求書処理戦略のベンチマーク

本記事は https://arxiv.org/abs/2509.04469 の解説記事です。 論文概要(Abstract) 本論文は、請求書からの情報抽出タスクにおいて、マルチモーダルLLMの2つの処理戦略――画像を直接入力する「Native Vision」と、Doclingでドキュメントを事前にMarkdownへ変換してからテキストとして入力する「Docling変換」――をゼロショット...

📄 EMNLP 2025論文解説: Memory OS of AI Agent — LLMエージェントのためのOS型メモリ管理

本記事は Memory OS of AI Agent(Kang et al., 2025)の解説記事です。 この記事は Zenn記事: Bedrock AgentCoreで社内問い合わせエージェントを構築しメモリ永続化で精度向上 の深掘りです。Bedrock AgentCoreではエージェントにメモリを持たせて対話品質を向上させますが、MemoryOSはそのメモリ管理を「OSのメモリ管理」...

📄 論文解説: AgenTracer — LLMエージェントシステムの障害トレーシングと根本原因分析

本記事は AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems?(Zhang et al., 2025)の解説記事です。 論文概要(Abstract) LLMベースのマルチエージェントシステムは単体エージェントを上回る性能を示す一方、システムの脆弱性も増大しています。障害が発生した際に「どのエージェントが」「いつ」障...

📄 論文解説: TRAIL — エージェントトレースの推論と障害特定ベンチマーク

本記事は TRAIL: Trace Reasoning and Agentic Issue Localization(Deshpande et al., 2025)の解説記事です。 論文概要(Abstract) LLMエージェントが複雑なタスクを実行する際、障害の特定と分類は依然として人手に依存しています。TRAILは、エージェントの実行トレースを体系的に分析するための障害分類体系(タク...

✍️ サーベイ解説: LLMエージェントの自律メモリ — 機構・評価・フロンティア

本記事は https://arxiv.org/abs/2603.07670 の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)が自律エージェントとして複雑な長期タスクを遂行する場面が増えている。こうしたエージェントにとって、過去の経験を蓄積・保持・活用するメモリ機構は不可欠な認知能力である。本サーベイは、LLMエージェントのメモリシステムを4層タクソノミー(ストレ...

📄 論文解説: Memoria — 人間の記憶モデルに着想を得たスケーラブルなエージェントメモリフレームワーク

本記事は https://arxiv.org/abs/2512.12686 の解説記事です。 論文概要(Abstract) Memoriaは、会話型AIシステムにおける長期メモリ能力を強化するために設計されたエージェントメモリフレームワークである。認知心理学のAtkinson-Shiffrinモデルに着想を得て、Sensory Memory、Short-Term Memory(STM)、...

📄 論文解説: MemMachine — Factual Ground Truthを保護するパーソナライズドAIエージェントメモリ

本記事は MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents(Al-Omari et al., 2025)の解説記事です。 論文概要(Abstract) AIモデルがstatelessなエンジンからstatefulなエージェントへと進化する中で、対話履歴を跨いでユーザーの情報を保持・...