Home
0h-n0 TechBLog
キャンセル

📄 論文解説: MMTEB — 250言語×500データセットに拡張された多言語テキスト埋め込みベンチマーク

本記事は MMTEB: Massive Multilingual Text Embedding Benchmark (arXiv:2502.13595) の解説記事です。 論文概要(Abstract) テキスト埋め込みモデルの評価は、従来のMTEB(Muennighoff et al., 2022)が英語中心であったため、多言語モデルの公平な比較が困難であった。Enevoldsen, C...

📄 論文解説: JSONSchemaBench — 10K実世界スキーマによるLLM構造化出力ベンチマーク

本記事は arXiv:2501.10868 の解説記事です。 論文概要(Abstract) Geng, Cooper, Moskal ら (2025) は、LLMの構造化出力生成を体系的に評価するベンチマーク JSONSchemaBench を提案している。GitHub、Kubernetes設定ファイル、API仕様書などから収集した約10,000件の実世界JSON Schemaを用い、6...

📄 論文解説: Llumnix — ライブマイグレーションによるLLM推論の動的スケジューリング

本記事は Llumnix: Dynamic Scheduling for Large Language Model Serving(arXiv:2401.12843、2024年1月公開)の解説記事です。 論文概要(Abstract) Llumnixは、LLM推論サービングにおける動的スケジューリングシステムである。著者らは、既存のLLMサービング基盤(vLLM等)が採用する静的なロードバ...

📄 論文解説: RAGCache — 知識ツリー構造によるRAG推論のKVキャッシュ最適化

本記事は RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation の解説記事です。 論文概要(Abstract) 著者らは、RAG(Retrieval-Augmented Generation)システムにおいて、検索されたドキュメントのKVキャッシュを「知識ツリー(Knowledge Tree)」構...

📄 論文解説: FrugalGPT — カスケード型LLMルーティングでコスト最大98%削減

本記事は FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance (arXiv:2305.05176) の解説記事です。 論文概要(Abstract) 著者らは、大規模言語モデル(LLM)のAPI利用コストを削減するための3つの戦略(プロンプト適応、LLMカスケード...