Home
0h-n0 TechBLog
キャンセル

✍️ NVIDIA公式ブログ解説: NeMo Curatorによるデータキュレーションで埋め込みモデル精度を12%改善

本記事は NVIDIA Technical Blog: Boost Embedding Model Accuracy for Custom Information Retrieval(2025年6月25日公開)の解説記事です。 ブログ概要(Summary) NVIDIAのTechnical Blogで公開された本記事は、会話型AIアナリティクスプラットフォーム「Coxwave Align...

📄 論文解説: 拡散言語モデルのサーベイ — 手法分類・課題・今後の研究方向

本記事は arXiv:2508.10875 “A Survey on Diffusion Language Models” の解説記事です。 論文概要(Abstract) 本サーベイ論文は、VILA Lab(Georgia Tech)のチームが2025年8月に発表した拡散言語モデル(Diffusion Language Model, DLM)の包括的な調査である。著者らは、テキスト生成に...

📄 論文解説: Diffusion Models in De Novo Drug Design — 創薬における拡散モデルの体系的レビュー

本記事は Diffusion Models in De Novo Drug Design(Alakhdar, Poczos & Washburn, Journal of Chemical Information and Modeling, 2024)の解説記事です。 論文概要(Abstract) 本論文は、de novo創薬における拡散モデルの適用を体系的にレビューしたサーベイ論...

📄 論文解説: LLaDA-MoE — Sparse MoEと拡散言語モデルの初統合

本記事は arXiv:2509.24389 “LLaDA-MoE” の解説記事です。 論文概要(Abstract) LLaDA-MoE は、マスク拡散言語モデル LLaDA に Sparse Mixture-of-Experts(MoE)アーキテクチャを統合した研究である。著者らは、Transformer の FFN 層を Sparse MoE 層に置換し、7B の総パラメータ中わずか ...

📄 論文解説: Mercury — 拡散ベースの超高速言語モデルの推論技術

本記事は arXiv:2506.17298 “Mercury: Ultra-Fast Language Models Based on Diffusion” の解説記事です。 論文概要(Abstract) Mercury は、Inception Labs が開発した商用拡散言語モデルであり、自己回帰(AR)モデルと比較して推論速度を大幅に高速化することを目的としている。著者らは、マスク拡...