Home
0h-n0 TechBLog
キャンセル

📄 ICLR 2025論文解説: CogVideoX - Expert Transformerによるテキスト-動画拡散モデル

本記事は arXiv:2408.06072 “CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer” の解説記事です。この論文はICLR 2025に採択されています。 論文概要(Abstract) CogVideoXは、Zhipu AI(清華大学系)が開発した大規模テキスト-動画拡散モデルである。著者らは...

📄 EMNLP 2025論文解説: GRPO-LEAD - 難易度考慮型GRPOによる簡潔な数学推論

本記事は GRPO-LEAD: A Difficulty-Aware Reinforcement Learning Approach for Concise Mathematical Reasoning in Language Models の解説記事です。 論文概要(Abstract) GRPO-LEADは、GRPOの3つの実践的課題(報酬スパース性、出力の冗長性、問題難易度の無視)を...

✍️ NVIDIA NeMo-RL: GRPOによるDeepScaleRレシピの再現と大規模RL学習基盤

本記事は Reinforcement Learning with NVIDIA NeMo-RL: Reproducing a DeepScaleR Recipe Using GRPO の解説記事です。 ブログ概要(Summary) NVIDIAは2025年7月にオープンソースのRL学習ライブラリNeMo-RLを公開した。このブログ記事では、NeMo-RLを用いてDeepScaleRのGR...

📄 論文解説: HunyuanVideo - 13Bパラメータのオープンソース動画生成フレームワーク

本記事は arXiv:2412.03603 “HunyuanVideo: A Systematic Framework for Large Video Generation Model” の解説記事です。 論文概要(Abstract) HunyuanVideoは、Tencentが開発した13Bパラメータのオープンソース動画生成モデルである。著者らは、データキュレーション、アーキテクチャ設...

📄 論文解説: LTX-2 - 音声と動画を同時生成する非対称デュアルストリームDiffusion Transformer

本記事は arXiv:2601.03233 “LTX-2: Efficient Joint Audio-Visual Foundation Model” の解説記事です。 論文概要(Abstract) LTX-2は、Lightricksが2026年1月に公開した、動画と音声を単一のフォワードパスで同時生成するオープンソースの拡散モデルである。著者らは、14Bパラメータの動画ストリームと5...

📄 論文解説: DAPO - 大規模GRPO学習の4つの失敗パターンとその解決策

本記事は DAPO: An Open-Source LLM Reinforcement Learning System at Scale の解説記事です。 論文概要(Abstract) DAPOは、GRPOベースの大規模LLM強化学習における4つの実践的欠陥を特定し、それぞれに対する修正手法を提案した研究である。著者ら(ByteDance Seed)は、Clip-Higher(非対称クリ...

📄 論文解説: Wan - オープンな大規模動画生成モデル群

本記事は arXiv:2503.03049 “Wan: Open and Advanced Large-Scale Video Generative Models” の解説記事です。 論文概要(Abstract) Wanは、Alibaba(Wan-Video)が開発したオープンソースの大規模動画生成モデル群である。テキストから動画(T2V)および画像から動画(I2V)の両方をサポートし、...

📄 論文解説: DeepSeekMath - Group Relative Policy Optimization(GRPO)による数学推論の限界突破

本記事は DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models の解説記事です。 論文概要(Abstract) DeepSeekMathは、7Bパラメータのオープン言語モデルで数学推論の限界を押し広げた研究である。著者らはCommon Crawlから120Bトークンの数学関連デ...