Home
0h-n0 TechBLog
キャンセル

📄 論文解説: MICE — Cross-Encoderの推論コストを4分の1に削減する効率的リランキング手法

論文概要 本記事は arXiv:2602.16299 の解説記事です。 MICE(Minimal Interaction Cross-Encoders)は、標準的なCross-Encoderから「有害または不要なインタラクション」を段階的に除去することで、Late Interactionに近いアーキテクチャを導出する手法である。著者らは、Cross-Encoderの内部Attention...

📄 論文解説: RAG Fusionの本番環境での限界 — 検索精度向上がエンドツーエンド性能に直結しない理由

論文概要 本記事は arXiv:2603.02153 の解説記事です。 Medrano, Verma, Chhabra (2026) は、エンタープライズ知識ベース上の本番RAGシステムにおいて、Reciprocal Rank Fusion(RRF)を用いたクエリ融合手法を評価した。著者らの報告によれば、融合手法はベンチマーク上の生のrecallを向上させるものの、「これらの向上はリラン...

📄 論文解説: Balancing the Blend — ハイブリッド検索のトレードオフを11データセットで実証分析

論文概要(Abstract) 本記事は arXiv:2508.01405 の解説記事です。 ハイブリッド検索(lexical検索とsemantic検索の統合)は、Retrieval-Augmented Generation(RAG)をはじめとする現代の情報検索システムにおける基盤技術となっている。しかし、その設計空間は広大かつ複雑であり、検索パラダイム・融合手法・リランキング手法の間のト...

📄 論文解説: From BM25 to Corrective RAG — 10種の検索戦略を23,000クエリでベンチマーク

論文概要 本記事は arXiv:2604.01733 の解説記事です。 Retrieval-Augmented Generation(RAG)システムにおいて、テキストと表データが混在する文書に対する検索手法の体系的な比較はこれまで存在しなかった。本論文は、スパース検索・密ベクトル検索・ハイブリッド融合・リランキング・クエリ拡張・インデックス拡張・適応的検索の7カテゴリに属する10種の検...

✍️ ParadeDB解説: PostgreSQLだけでBM25×ベクトルのハイブリッド検索を実現する完全ガイド

ブログ概要 本記事は ParadeDB公式ブログ「Hybrid Search in PostgreSQL: The Missing Manual」 の解説記事です。 著者 James Blackwood-Sewell は、PostgreSQL の拡張機能である pg_search(BM25 全文検索)と pgvector(ベクトル類似度検索)を組み合わせ、外部の検索エンジンを一切使わずに...

✍️ Qwen3-Embedding解説: 命令対応型多言語Embeddingモデルの技術詳細

ブログ概要 本記事はQwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Modelsの解説記事です。 Alibaba Qwen Teamは2025年6月5日、Qwen3シリーズの基盤モデルをベースとしたテキストEmbeddingモデル群「Qwen3-Embedding」とリランキングモデル群...

📄 ICLR 2026論文解説: TurboQuant — Shannon限界に迫るデータ非依存ベクトル量子化

論文概要(Abstract) 本記事はTurboQuant: Online Vector Quantization with Near-optimal Distortion Rateの解説記事です。 TurboQuantは、Google Researchが提案したデータ非依存(data-oblivious)なベクトル量子化手法である。著者らは、ランダム直交回転によるデータ幾何の単純化(P...

📄 論文解説: NV-Embed — LLMをGeneralist Embeddingモデルとして訓練する改良手法

論文概要(Abstract) 本記事はNV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Modelsの解説記事です。 NV-Embedは、NVIDIAが提案したdecoder-only LLM(Mistral-7B)をベースとした汎用テキスト埋め込みモデルである。著者らは、(1) シーケンス表現...