- 📄 論文解説: Llumnix - LLMサービングのための動的スケジューリングとライブマイグレーション
- ✍️ Meta Engineering解説: LLM推論スケーリングにおけるテンソル・コンテキスト・エキスパート並列化
- 📄 論文解説: PowerInfer - コンシューマGPUでの高速LLM推論エンジン
- 📄 論文解説: DistServe - Prefill/Decode分離によるLLMサービングのGoodput最適化
- 📄 論文解説: Efficient Memory Management for Large Language Model Serving with PagedAttention
本記事は MMTEB: Massive Multilingual Text Embedding Benchmark (arXiv:2502.13595) の解説記事です。 論文概要(Abstract) テキスト埋め込みモデルの評価は、従来のMTEB(Muennighoff et al., 2022)が英語中心であったため、多言語モデルの公平な比較が困難であった。Enevoldsen, C...