最近の更新
machinelearning 5
- Kokoro-82M オンデバイスTTS実装解説: モバイル・エッジで動く高品質音声合成の実践 19/02/2026
- 論文解説: Distil-Whisper — 大規模擬似ラベリングによるWhisperの知識蒸留 19/02/2026
- NVIDIA Speech AIモデル解説: Parakeet・NeMoが実現する業界最高精度の音声認識 19/02/2026
- ICASSP 2024論文解説: Matcha-TTS — Conditional Flow Matchingによる高速音声合成 19/02/2026
- 論文解説: Moonshine — エッジデバイス向けリアルタイム音声認識モデル 19/02/2026