- ✍️ Mem0公式ブログ解説: State of AI Agent Memory 2026 — メモリアーキテクチャの本番運用比較
- 📄 論文解説: Memory in the Age of AI Agents — エージェントメモリの3次元分類法
- 📄 論文解説: Survey on Evaluation of LLM-based Agents — エージェント評価手法の体系的分類
- 📄 論文解説: Memory for Autonomous LLM Agents — エージェントメモリの機構・評価・フロンティア
- ✍️ AWS公式ブログ解説: Amazon Bedrock AgentCore Evaluationsによるエージェント品質の自動評価
本記事は VBench-2.0: Advancing Video Generation Benchmark Suite for Thinking (arXiv:2503.21755) の解説記事です。 論文概要(Abstract) VBench-2.0は、動画生成モデルの評価を従来の画質・モーション品質から、高次の認知能力・推論能力へと拡張した次世代ベンチマークである。5大カテゴリ(Hu...