論文概要 本記事は arXiv:2602.16299 の解説記事です。 MICE(Minimal Interaction Cross-Encoders)は、標準的なCross-Encoderから「有害または不要なインタラクション」を段階的に除去することで、Late Interactionに近いアーキテクチャを導出する手法である。著者らは、Cross-Encoderの内部Attention...
論文概要 本記事は arXiv:2603.02153 の解説記事です。 Medrano, Verma, Chhabra (2026) は、エンタープライズ知識ベース上の本番RAGシステムにおいて、Reciprocal Rank Fusion(RRF)を用いたクエリ融合手法を評価した。著者らの報告によれば、融合手法はベンチマーク上の生のrecallを向上させるものの、「これらの向上はリラン...
論文概要(Abstract) 本記事は arXiv:2508.01405 の解説記事です。 ハイブリッド検索(lexical検索とsemantic検索の統合)は、Retrieval-Augmented Generation(RAG)をはじめとする現代の情報検索システムにおける基盤技術となっている。しかし、その設計空間は広大かつ複雑であり、検索パラダイム・融合手法・リランキング手法の間のト...
論文概要 本記事は arXiv:2604.01733 の解説記事です。 Retrieval-Augmented Generation(RAG)システムにおいて、テキストと表データが混在する文書に対する検索手法の体系的な比較はこれまで存在しなかった。本論文は、スパース検索・密ベクトル検索・ハイブリッド融合・リランキング・クエリ拡張・インデックス拡張・適応的検索の7カテゴリに属する10種の検...
ブログ概要 本記事は ParadeDB公式ブログ「Hybrid Search in PostgreSQL: The Missing Manual」 の解説記事です。 著者 James Blackwood-Sewell は、PostgreSQL の拡張機能である pg_search(BM25 全文検索)と pgvector(ベクトル類似度検索)を組み合わせ、外部の検索エンジンを一切使わずに...
ブログ概要 本記事はQwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Modelsの解説記事です。 Alibaba Qwen Teamは2025年6月5日、Qwen3シリーズの基盤モデルをベースとしたテキストEmbeddingモデル群「Qwen3-Embedding」とリランキングモデル群...
本記事は Fine-Tuning Embedding Models for Enterprise Retrieval: A Practical Guide with NVIDIA Nemotron Recipe の解説記事です。 ブログ概要(Summary) Ciscoのエンジニアリングチーム(Md Rahman, Arkaprabho Ghosh, Navin Bilwar, Desh...
論文概要(Abstract) 本記事はTurboQuant: Online Vector Quantization with Near-optimal Distortion Rateの解説記事です。 TurboQuantは、Google Researchが提案したデータ非依存(data-oblivious)なベクトル量子化手法である。著者らは、ランダム直交回転によるデータ幾何の単純化(P...
論文概要(Abstract) 本記事はNV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Modelsの解説記事です。 NV-Embedは、NVIDIAが提案したdecoder-only LLM(Mistral-7B)をベースとした汎用テキスト埋め込みモデルである。著者らは、(1) シーケンス表現...
本記事は Build a Domain-Specific Embedding Model in Under a Day (NVIDIA、HuggingFace Blog掲載)の解説記事です。 ブログ概要(Summary) NVIDIAが公開したNemotron Embedding Fine-tuningレシピは、ドメイン固有のドキュメントコーパスからEmbeddingモデルを1日以内にF...