論文概要(Abstract) 本記事はNV-Embed論文の解説記事です。 NV-Embedは、NVIDIAが提案したdecoder-only LLMをベースとした汎用埋め込みモデルである。著者らは、decoder最終層の隠れ状態から高品質なシーケンス表現を抽出するLatent Attention Layerと、検索タスクと非検索タスクを段階的に学習する2段階contrastive in...
論文概要(Abstract) 本記事は Ruri: Japanese General Text Embeddings(arXiv:2409.07737) の解説記事です。 Ruriは、名古屋大学の塚越・笹野らが開発した日本語汎用テキスト埋め込みモデル群である。英語・多言語でのembeddingモデル開発が活発に進む中、日本語では訓練データの不足と専門知識の欠如が課題となっていた。著者らは...
論文概要(Abstract) 本記事は Qwen3 Embedding論文 の解説記事です。 Qwen3 Embeddingは、Alibabaが開発した0.6B/4B/8Bの3サイズで展開されるテキスト埋め込み・リランキングモデルシリーズである。著者らは、約150Mペアの弱教師あり事前学習と約19Mペアの教師ありファインチューニングを組み合わせたマルチステージ訓練パイプラインを採用し、さ...
論文概要(Abstract) 本記事はGemini Embedding論文の解説記事です。 Gemini Embeddingは、GoogleのGemini LLMが持つ多言語・コード理解能力を埋め込み(embedding)モデルへ転用した手法である。著者らは、classification、similarity、clustering、ranking、retrievalといった多様な下流タス...
ブログ概要(Summary) 本記事はMilvus公式ブログ「Semantic Highlighting for RAG Context Pruning and Token Saving」(Zilliz、2026年1月公開)の解説記事です。RAG(Retrieval-Augmented Generation)パイプラインにおいて、検索済みドキュメントからクエリに意味的に関連する文のみを抽出...
論文概要 本記事は arXiv 2603.26667 “M-RAG: Making RAG Faster, Stronger, and More Efficient” の解説記事です。M-RAGは従来のRAG(Retrieval-Augmented Generation)パイプラインにおけるテキストチャンキングを排除し、ドキュメントから「メタマーカー」と呼ばれる構造化されたKey-Valu...
論文概要 本記事は、arXiv 2601.11024 として公開された論文 “PruneRAG: Confidence-Guided Query Decomposition Trees for Efficient Retrieval-Augmented Generation” の解説記事です。PruneRAGは、Retrieval-Augmented Generation(RAG)における...
論文概要(Abstract) 本記事は arXiv 2503.10720「AttentionRAG: Attention-Guided Context Pruning in Retrieval-Augmented Generation」の解説記事である。AttentionRAGは、Retrieval-Augmented Generation(RAG)において検索されたコンテキストをLLM内...
論文概要(Abstract) 本記事は MMTEB: Massive Multilingual Text Embedding Benchmark の解説記事です。 MMTEBは、テキスト埋め込みモデルの評価基盤を大幅に拡張する大規模多言語ベンチマークである。従来のMTEB(Massive Text Embedding Benchmark)が58タスク・112言語をカバーしていたのに対し、...
本記事は arXiv 2501.16214(ICLR 2025採択)の解説記事です。Navier Labs Europeの Chirkova らが提案した Provence (Pruning and Reranking Of retrieVEd relevaNt ContExts) は、RAG パイプラインにおける文脈枝刈り(context pruning)をバイナリ系列ラベリングとして定式...