✍️ AWS公式ブログ解説: Amazon Bedrock AgentCore Evaluationsで信頼性の高いAIエージェントを構築する

本記事は Build reliable AI agents with Amazon Bedrock AgentCore Evaluations（AWS Machine Learning Blog, 2026年3月31日）の解説記事です。ブログ概要（Summary） Amazon Bedrock AgentCore Evaluationsは、AIエージェントのパフォーマンスを開発から本番...

29/05/2026 blog tech_blog

AWS Bedrock agent +4

📄 ICSE 2026論文解説: TraceCoder — トレース駆動型マルチエージェントによるLLM生成コードの自動デバッグ

本記事は TraceCoder: A Trace-Driven Multi-Agent Framework for Automated Debugging of LLM-Generated Code（Huang et al., 2026）の解説記事です。ICSE 2026（2026年4月、リオデジャネイロ）で発表されました。論文概要（Abstract） LLMが生成するコードには、構文...

29/05/2026 blog paper

LLM agent debugging +4

📄 論文解説: AgenTracer — LLMエージェントシステムの障害トレーシングと根本原因分析

本記事は AgenTracer: Who Is Inducing Failure in the LLM Agentic Systems?（Zhang et al., 2025）の解説記事です。論文概要（Abstract） LLMベースのマルチエージェントシステムは単体エージェントを上回る性能を示す一方、システムの脆弱性も増大しています。障害が発生した際に「どのエージェントが」「いつ」障...

29/05/2026 blog paper

LLM agent debugging +4

📄 論文解説: TRAIL — エージェントトレースの推論と障害特定ベンチマーク

本記事は TRAIL: Trace Reasoning and Agentic Issue Localization（Deshpande et al., 2025）の解説記事です。論文概要（Abstract） LLMエージェントが複雑なタスクを実行する際、障害の特定と分類は依然として人手に依存しています。TRAILは、エージェントの実行トレースを体系的に分析するための障害分類体系（タク...

29/05/2026 blog paper

LLM agent debugging +4

✍️ サーベイ解説: LLMエージェントの自律メモリ — 機構・評価・フロンティア

本記事は https://arxiv.org/abs/2603.07670 の解説記事です。論文概要（Abstract）大規模言語モデル（LLM）が自律エージェントとして複雑な長期タスクを遂行する場面が増えている。こうしたエージェントにとって、過去の経験を蓄積・保持・活用するメモリ機構は不可欠な認知能力である。本サーベイは、LLMエージェントのメモリシステムを4層タクソノミー（ストレ...

29/05/2026 blog paper

survey memory LLM +2

📄 論文解説: Memoria — 人間の記憶モデルに着想を得たスケーラブルなエージェントメモリフレームワーク

本記事は https://arxiv.org/abs/2512.12686 の解説記事です。論文概要（Abstract） Memoriaは、会話型AIシステムにおける長期メモリ能力を強化するために設計されたエージェントメモリフレームワークである。認知心理学のAtkinson-Shiffrinモデルに着想を得て、Sensory Memory、Short-Term Memory（STM）、...

29/05/2026 blog paper

memory conversational-AI RAG +2

✍️ Strands Agents SDK技術解説: エージェントアーキテクチャとObservabilityの深掘り

本記事は https://aws.amazon.com/blogs/machine-learning/strands-agents-sdk-a-technical-deep-dive-into-agent-architectures-and-observability/ の解説記事です。ブログ概要（Summary） AWSが公開したStrands Agents SDKは、LLMエージェ...

29/05/2026 blog tech_blog

aws strands-agents agent-architecture +2

📄 論文解説: MemMachine — Factual Ground Truthを保護するパーソナライズドAIエージェントメモリ

本記事は MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents（Al-Omari et al., 2025）の解説記事です。論文概要（Abstract） AIモデルがstatelessなエンジンからstatefulなエージェントへと進化する中で、対話履歴を跨いでユーザーの情報を保持・...

29/05/2026 blog paper

memory personalization knowledge-graph +2

📄 論文解説: DoVer — LLMマルチエージェントシステムの介入駆動型自動デバッグ

本記事は DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems（Ma et al., 2025）の解説記事です。論文概要（Abstract） LLMベースのマルチエージェントシステムは複雑なタスクを解決できる一方、障害発生時のデバッグが困難です。従来のログ分析では、長く分岐する実行トレースの中から障害...

29/05/2026 blog paper

LLM multi-agent debugging +4

📄 論文解説: MemoRAG — メモリ駆動型次世代RAGアーキテクチャ

本記事は MemoRAG: Moving Towards Next-Gen RAG via Memory-Inspired Knowledge Discovery（Qian et al., 2024）の解説記事です。論文概要（Abstract）長大なコンテキストの処理はLLMにとって依然として大きな課題です。近年のLLMは32Kや128Kトークンのコンテキストウィンドウを扱えるように...

29/05/2026 blog paper

RAG memory LLM +2

1
...
23
24
25
...
147
24 / 147