本記事は PromptWizard: The future of prompt optimization through feedback-driven self-evolving prompts (Microsoft Research Blog) の解説記事です。 ブログ概要(Summary) PromptWizardは、Microsoft Researchが開発したフィードバック駆動...
本記事は arXiv:2505.03574 “LlamaFirewall: An open source guardrail system for building secure AI agents” の解説記事です。 論文概要(Abstract) LlamaFirewallは、Metaが開発したLLMエージェント向けのオープンソースガードレールフレームワークである。自律的にコード編集や...
本記事は Improving Video Generation with Human Feedback (arXiv:2501.13918) の解説記事です。 論文概要(Abstract) 本論文は、人間の嗜好フィードバックを活用して動画生成モデルの品質を改善する統合フレームワークを提案する。16,000プロンプトを12のT2Vモデルで生成し、182,000件のアノテーション付き嗜好デー...
本記事は AWS Machine Learning Blog: “Building smarter AI agents: AgentCore long-term memory deep dive” の解説記事です。 ブログ概要(Summary) Amazon Bedrock AgentCore Memoryは、LLMエージェントに長期記憶を提供するマネージドサービスである。本ブログ記事で...
本記事は VBench-2.0: Advancing Video Generation Benchmark Suite for Thinking (arXiv:2503.21755) の解説記事です。 論文概要(Abstract) VBench-2.0は、動画生成モデルの評価を従来の画質・モーション品質から、高次の認知能力・推論能力へと拡張した次世代ベンチマークである。5大カテゴリ(Hu...
本記事は Teach Better or Show Smarter? On Instructions and Exemplars in Automatic Prompt Optimization (NeurIPS 2024) の解説記事です。 論文概要(Abstract) 本論文は、自動プロンプト最適化(APO: Automatic Prompt Optimization)において、命令...
本記事は AWS Machine Learning Blog: “Apply fine-grained access control with Bedrock AgentCore Gateway interceptors” の解説記事です。 ブログ概要(Summary) Amazon Bedrock AgentCore Gatewayは、LLMエージェントのツール呼び出しをインターセプト...
本記事は GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning (arXiv:2507.19457) の解説記事です。 論文概要(Abstract) GEPAは、LLMに実行トレース(推論過程、ツール呼び出し、出力)を分析させ、自然言語で「反省(reflection)」を行うことでプロンプトを進化的...
本記事は Wan: Open and Advanced Large-Scale Video Generative Models (arXiv:2503.20314) の解説記事です。 論文概要(Abstract) Wanは、Alibaba Wan-AIグループが開発した大規模動画生成モデルファミリーの技術論文である。Text-to-Video(T2V)、Image-to-Video(I2...
本記事は Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM (arXiv:2412.15156) の解説記事です。 論文概要(Abstract) Prompt-A-Videoは、T2V(Text-to-Video)拡散モデル向けのプロンプト最適化を、選好整合LLMで自動化するフレームワ...