最近の更新
speculative-decoding 8
- 論文解説: EAGLE-2 - 動的ドラフトツリーによるLLM推論高速化 16/03/2026
- 論文解説: Fast Inference from Transformers via Speculative Decoding 16/03/2026
- vLLM公式ブログ解説: How Speculative Decoding Boosts vLLM Performance — 実装と性能評価 13/03/2026
- 論文解説: Fast Inference from Transformers via Speculative Decoding — 投機的デコーディングの原論文 13/03/2026
- 論文解説: EAGLE-3 — 学習時テストスケーリングによるLLM投機的デコーディングの進化 13/03/2026
- 論文解説: Medusa — 複数デコーディングヘッドによるLLM推論高速化フレームワーク 13/03/2026
- 論文解説: EAGLE — Feature Uncertaintyの再考によるLLM投機的デコーディングの高速化 13/03/2026
- 論文解説: Speculative RAG — 並列ドラフト生成によるRAG高速化と精度向上の同時達成 22/02/2026