📄 論文解説: VBench-2.0 - 動画生成モデルの認知・推論能力を評価する次世代ベンチマーク

本記事は VBench-2.0: Advancing Video Generation Benchmark Suite for Thinking (arXiv:2503.21755) の解説記事です。論文概要（Abstract） VBench-2.0は、動画生成モデルの評価を従来の画質・モーション品質から、高次の認知能力・推論能力へと拡張した次世代ベンチマークである。5大カテゴリ（Hu...

11/03/2026 blog paper

video-generation benchmark evaluation +3

📄 NeurIPS 2024論文解説: Teach Better or Show Smarter? — 命令最適化 vs 例示最適化の体系的比較

本記事は Teach Better or Show Smarter? On Instructions and Exemplars in Automatic Prompt Optimization (NeurIPS 2024) の解説記事です。論文概要（Abstract）本論文は、自動プロンプト最適化（APO: Automatic Prompt Optimization）において、命令...

11/03/2026 blog paper

prompt-optimization instruction-optimization exemplar-optimization +2

✍️ AWS解説: Bedrock AgentCore Gateway interceptorsによるエージェントツール呼び出しの細粒度アクセス制御

本記事は AWS Machine Learning Blog: “Apply fine-grained access control with Bedrock AgentCore Gateway interceptors” の解説記事です。ブログ概要（Summary） Amazon Bedrock AgentCore Gatewayは、LLMエージェントのツール呼び出しをインターセプト...

11/03/2026 blog tech_blog

AWS bedrock AgentCore +3

📄 論文解説: GEPA — 反省的プロンプト進化が強化学習を超える（ICLR 2026 Oral）

本記事は GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning (arXiv:2507.19457) の解説記事です。論文概要（Abstract） GEPAは、LLMに実行トレース（推論過程、ツール呼び出し、出力）を分析させ、自然言語で「反省（reflection）」を行うことでプロンプトを進化的...

11/03/2026 blog paper

GEPA prompt-optimization DSPy +3

📄 論文解説: Wan - 大規模オープンソース動画生成モデルのアーキテクチャと訓練

本記事は Wan: Open and Advanced Large-Scale Video Generative Models (arXiv:2503.20314) の解説記事です。論文概要（Abstract） Wanは、Alibaba Wan-AIグループが開発した大規模動画生成モデルファミリーの技術論文である。Text-to-Video（T2V）、Image-to-Video（I2...

11/03/2026 blog paper

video-generation diffusion-model wan22 +3

📄 論文解説: Prompt-A-Video - 選好整合LLMによる動画拡散モデルのプロンプト最適化

本記事は Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM (arXiv:2412.15156) の解説記事です。論文概要（Abstract） Prompt-A-Videoは、T2V（Text-to-Video）拡散モデル向けのプロンプト最適化を、選好整合LLMで自動化するフレームワ...

11/03/2026 blog paper

video-generation prompt-optimization DPO +3

📄 論文解説: TextGrad — テキストによる自動微分でLLMパイプラインを最適化する

本記事は TextGrad: Automatic “Differentiation” via Text (arXiv:2406.07496) の解説記事です。論文概要（Abstract） TextGradは、LLMを用いた「テキスト空間での自動微分」を実現するフレームワークである。著者らは、複合AIシステム内の各コンポーネントに対し、LLMが自然言語でフィードバック（テキスト勾配）を生...

11/03/2026 blog paper

TextGrad prompt-optimization LLM +2

📄 PLDI 2024論文解説: Cedar — 表現力・高速・安全・解析可能を両立した認可言語の設計と実装

本記事は arXiv:2403.04651 “Cedar: A New Language for Expressive, Fast, Safe, and Analyzable Authorization”（PLDI 2024採択）の解説記事です。論文概要（Abstract） Cedarは、認可ポリシーを記述するためのオープンソースプログラミング言語である。principal（主体）がr...

11/03/2026 blog paper

cedar authorization policy +2

📄 論文解説: VPO - プロンプト最適化によるText-to-Videoモデルのアラインメント

本記事は VPO: Aligning Text-to-Video Generation Models with Prompt Optimization (arXiv:2503.20491) の解説記事です。論文概要（Abstract） Text-to-Video（T2V）モデルは訓練時に詳細なキャプションで学習されるが、ユーザーが入力するプロンプトは短く曖昧であることが多い。このギャッ...

11/03/2026 blog paper

video-generation prompt-optimization DPO +3

📄 論文解説: Agent-R — エピソード記憶を用いたリアルタイムリフレクションでLLMエージェントの誤り訂正を効率化する

本記事は arXiv:2501.04682 “Agent-R: Training Language Model Agents to Reflect via In-Context Episodic Memory” の解説記事です。論文概要（Abstract） Agent-Rは、LLMベースのエージェントがタスク実行中にリアルタイムで誤りを検出し、エピソード記憶を用いてバックトラックする反...

11/03/2026 blog paper

episodic-memory LLM-agent reflection +2

1
...
30
31
32
...
86
31 / 86