Home
0h-n0 TechBLog
キャンセル

📄 論文解説: LlamaFirewall — Metaが提案するLLMエージェント向けオープンソースガードレールシステム

本記事は arXiv:2505.03574 “LlamaFirewall: An open source guardrail system for building secure AI agents” の解説記事です。 論文概要(Abstract) LlamaFirewallは、Metaが開発したLLMエージェント向けのオープンソースガードレールフレームワークである。自律的にコード編集や...

📄 論文解説: 人間フィードバックによる動画生成の改善 - Flow-DPO/Flow-NRGの統合フレームワーク

本記事は Improving Video Generation with Human Feedback (arXiv:2501.13918) の解説記事です。 論文概要(Abstract) 本論文は、人間の嗜好フィードバックを活用して動画生成モデルの品質を改善する統合フレームワークを提案する。16,000プロンプトを12のT2Vモデルで生成し、182,000件のアノテーション付き嗜好デー...

✍️ AWS解説: AgentCore長期記憶の設計原則 — セマンティック・エピソード・サマリー記憶戦略の使い分け

本記事は AWS Machine Learning Blog: “Building smarter AI agents: AgentCore long-term memory deep dive” の解説記事です。 ブログ概要(Summary) Amazon Bedrock AgentCore Memoryは、LLMエージェントに長期記憶を提供するマネージドサービスである。本ブログ記事で...

📄 論文解説: VBench-2.0 - 動画生成モデルの認知・推論能力を評価する次世代ベンチマーク

本記事は VBench-2.0: Advancing Video Generation Benchmark Suite for Thinking (arXiv:2503.21755) の解説記事です。 論文概要(Abstract) VBench-2.0は、動画生成モデルの評価を従来の画質・モーション品質から、高次の認知能力・推論能力へと拡張した次世代ベンチマークである。5大カテゴリ(Hu...

📄 論文解説: GEPA — 反省的プロンプト進化が強化学習を超える(ICLR 2026 Oral)

本記事は GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning (arXiv:2507.19457) の解説記事です。 論文概要(Abstract) GEPAは、LLMに実行トレース(推論過程、ツール呼び出し、出力)を分析させ、自然言語で「反省(reflection)」を行うことでプロンプトを進化的...