📄 論文解説: TextGrad — テキストによる自動微分でLLMパイプラインを最適化する

本記事は TextGrad: Automatic “Differentiation” via Text (arXiv:2406.07496) の解説記事です。論文概要（Abstract） TextGradは、LLMを用いた「テキスト空間での自動微分」を実現するフレームワークである。著者らは、複合AIシステム内の各コンポーネントに対し、LLMが自然言語でフィードバック（テキスト勾配）を生...

11/03/2026 blog paper

TextGrad prompt-optimization LLM +2

📄 PLDI 2024論文解説: Cedar — 表現力・高速・安全・解析可能を両立した認可言語の設計と実装

本記事は arXiv:2403.04651 “Cedar: A New Language for Expressive, Fast, Safe, and Analyzable Authorization”（PLDI 2024採択）の解説記事です。論文概要（Abstract） Cedarは、認可ポリシーを記述するためのオープンソースプログラミング言語である。principal（主体）がr...

11/03/2026 blog paper

cedar authorization policy +2

📄 論文解説: VPO - プロンプト最適化によるText-to-Videoモデルのアラインメント

本記事は VPO: Aligning Text-to-Video Generation Models with Prompt Optimization (arXiv:2503.20491) の解説記事です。論文概要（Abstract） Text-to-Video（T2V）モデルは訓練時に詳細なキャプションで学習されるが、ユーザーが入力するプロンプトは短く曖昧であることが多い。このギャッ...

11/03/2026 blog paper

video-generation prompt-optimization DPO +3

📄 論文解説: Agent-R — エピソード記憶を用いたリアルタイムリフレクションでLLMエージェントの誤り訂正を効率化する

本記事は arXiv:2501.04682 “Agent-R: Training Language Model Agents to Reflect via In-Context Episodic Memory” の解説記事です。論文概要（Abstract） Agent-Rは、LLMベースのエージェントがタスク実行中にリアルタイムで誤りを検出し、エピソード記憶を用いてバックトラックする反...

11/03/2026 blog paper

episodic-memory LLM-agent reflection +2

📄 論文解説: DSPy — 宣言的LMパイプラインを自己改善コンパイラで最適化するフレームワーク

本記事は DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines (arXiv:2310.03714) の解説記事です。論文概要（Abstract） DSPyは、言語モデル（LM）パイプラインを「テキスト変換グラフ」として抽象化し、宣言的なプログラミングモデルとエンドツーエンドのコンパ...

11/03/2026 blog paper

DSPy prompt-optimization LLM +3

📄 ICLR 2025論文解説: CogVideoX - Expert Transformerによるテキスト-動画拡散モデル

本記事は arXiv:2408.06072 “CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer” の解説記事です。この論文はICLR 2025に採択されています。論文概要（Abstract） CogVideoXは、Zhipu AI（清華大学系）が開発した大規模テキスト-動画拡散モデルである。著者らは...

10/03/2026 blog paper

video-generation diffusion-transformer expert-transformer +6

📄 EMNLP 2025論文解説: GRPO-LEAD - 難易度考慮型GRPOによる簡潔な数学推論

本記事は GRPO-LEAD: A Difficulty-Aware Reinforcement Learning Approach for Concise Mathematical Reasoning in Language Models の解説記事です。論文概要（Abstract） GRPO-LEADは、GRPOの3つの実践的課題（報酬スパース性、出力の冗長性、問題難易度の無視）を...

10/03/2026 blog paper

GRPO reinforcement-learning LLM +3

✍️ NVIDIA NeMo-RL: GRPOによるDeepScaleRレシピの再現と大規模RL学習基盤

本記事は Reinforcement Learning with NVIDIA NeMo-RL: Reproducing a DeepScaleR Recipe Using GRPO の解説記事です。ブログ概要（Summary） NVIDIAは2025年7月にオープンソースのRL学習ライブラリNeMo-RLを公開した。このブログ記事では、NeMo-RLを用いてDeepScaleRのGR...

10/03/2026 blog tech_blog

GRPO reinforcement-learning NVIDIA +4

📄 論文解説: HunyuanVideo - 13Bパラメータのオープンソース動画生成フレームワーク

本記事は arXiv:2412.03603 “HunyuanVideo: A Systematic Framework for Large Video Generation Model” の解説記事です。論文概要（Abstract） HunyuanVideoは、Tencentが開発した13Bパラメータのオープンソース動画生成モデルである。著者らは、データキュレーション、アーキテクチャ設...

10/03/2026 blog paper

video-generation diffusion-transformer VAE +6

📄 論文解説: LTX-2 - 音声と動画を同時生成する非対称デュアルストリームDiffusion Transformer

本記事は arXiv:2601.03233 “LTX-2: Efficient Joint Audio-Visual Foundation Model” の解説記事です。論文概要（Abstract） LTX-2は、Lightricksが2026年1月に公開した、動画と音声を単一のフォワードパスで同時生成するオープンソースの拡散モデルである。著者らは、14Bパラメータの動画ストリームと5...

10/03/2026 blog paper

video-generation audio-visual diffusion-transformer +6

1
...
99
100
101
...
154
100 / 154