Home
0h-n0 TechBLog
キャンセル

📄 ICLR 2025論文解説: NV-Embed — Latent Attentionと2段階訓練によるLLMベース汎用埋め込みモデル

論文概要(Abstract) 本記事はNV-Embed論文の解説記事です。 NV-Embedは、NVIDIAが提案したdecoder-only LLMをベースとした汎用埋め込みモデルである。著者らは、decoder最終層の隠れ状態から高品質なシーケンス表現を抽出するLatent Attention Layerと、検索タスクと非検索タスクを段階的に学習する2段階contrastive in...

📄 論文解説: Ruri — LLM合成データと知識蒸留による日本語汎用テキスト埋め込みモデル

論文概要(Abstract) 本記事は Ruri: Japanese General Text Embeddings(arXiv:2409.07737) の解説記事です。 Ruriは、名古屋大学の塚越・笹野らが開発した日本語汎用テキスト埋め込みモデル群である。英語・多言語でのembeddingモデル開発が活発に進む中、日本語では訓練データの不足と専門知識の欠如が課題となっていた。著者らは...

📄 論文解説: Qwen3 Embedding — マルチステージ訓練とモデルマージによるオープンソースSOTA埋め込みモデル

論文概要(Abstract) 本記事は Qwen3 Embedding論文 の解説記事です。 Qwen3 Embeddingは、Alibabaが開発した0.6B/4B/8Bの3サイズで展開されるテキスト埋め込み・リランキングモデルシリーズである。著者らは、約150Mペアの弱教師あり事前学習と約19Mペアの教師ありファインチューニングを組み合わせたマルチステージ訓練パイプラインを採用し、さ...

📄 論文解説: Gemini Embedding — LLMの多言語理解力を活用した汎用テキスト埋め込みモデル

論文概要(Abstract) 本記事はGemini Embedding論文の解説記事です。 Gemini Embeddingは、GoogleのGemini LLMが持つ多言語・コード理解能力を埋め込み(embedding)モデルへ転用した手法である。著者らは、classification、similarity、clustering、ranking、retrievalといった多様な下流タス...

✍️ Zilliz解説: セマンティックハイライティングモデルでRAGトークンコストを70-80%削減

ブログ概要(Summary) 本記事はMilvus公式ブログ「Semantic Highlighting for RAG Context Pruning and Token Saving」(Zilliz、2026年1月公開)の解説記事です。RAG(Retrieval-Augmented Generation)パイプラインにおいて、検索済みドキュメントからクエリに意味的に関連する文のみを抽出...

📄 論文解説: M-RAG — チャンクフリー検索戦略でRAGの情報断片化を解消

論文概要 本記事は arXiv 2603.26667 “M-RAG: Making RAG Faster, Stronger, and More Efficient” の解説記事です。M-RAGは従来のRAG(Retrieval-Augmented Generation)パイプラインにおけるテキストチャンキングを排除し、ドキュメントから「メタマーカー」と呼ばれる構造化されたKey-Valu...

📄 ICLR 2025論文解説: MMTEB — 500+タスク・250+言語の多言語テキスト埋め込みベンチマーク

論文概要(Abstract) 本記事は MMTEB: Massive Multilingual Text Embedding Benchmark の解説記事です。 MMTEBは、テキスト埋め込みモデルの評価基盤を大幅に拡張する大規模多言語ベンチマークである。従来のMTEB(Massive Text Embedding Benchmark)が58タスク・112言語をカバーしていたのに対し、...

📄 ICLR 2025論文解説: Provence — ゼロコスト文脈枝刈りでRAGを効率化

本記事は arXiv 2501.16214(ICLR 2025採択)の解説記事です。Navier Labs Europeの Chirkova らが提案した Provence (Pruning and Reranking Of retrieVEd relevaNt ContExts) は、RAG パイプラインにおける文脈枝刈り(context pruning)をバイナリ系列ラベリングとして定式...