Home
0h-n0 TechBLog
キャンセル

✍️ NVIDIA cuVS解説: GPU加速ベクトル検索がRAG・推薦のインデックス構築を最大40倍高速化

本記事は Optimizing Vector Search for Indexing and Real-Time Retrieval with NVIDIA cuVS の解説記事です。 ブログ概要(Summary) NVIDIA cuVSは、GPU加速によるベクトル検索・クラスタリングライブラリである。CAGRA(GPU最適化グラフ索引)、DiskANN、HNSW、IVF-PQ等の主要ア...

📄 論文解説: TextGrad — テキストによる自動微分フレームワーク

論文概要(Abstract) TextGradは、ニューラルネットワークにおける自動微分(Automatic Differentiation)の概念をテキスト空間に拡張したフレームワークである。LLMが生成する自然言語フィードバックを「テキスト勾配(textual gradient)」として扱い、計算グラフ上を逆伝播させることで、プロンプト・コード・分子構造など多様な非微分可能変数を最適化...

📄 論文解説: LSM-VEC — LSMツリー型動的ベクトルインデックスでFreshDiskANN比5倍の書き込みスループット

本記事は LSM-VEC: An LSM-Tree Based Dynamic Vector Index の解説記事です。 論文概要(Abstract) 推薦システムやリアルタイム検索では、ベクトルデータベースに対する高スループットの書き込み(新規ベクトルの継続的挿入)と効率的な類似度検索の両立が求められる。しかし静的ベクトルインデックス(HNSW、IVF等)は読み取り最適化されており、...

📄 論文解説: DSPy — 宣言的LM呼び出しを自己改善パイプラインにコンパイル

論文概要(Abstract) DSPy(Declarative Self-improving Python)は、Stanford NLPグループが提案した、言語モデル(LM)パイプラインをテキスト変換グラフとして抽象化するプログラミングフレームワークである。従来のプロンプトエンジニアリングでは、パイプラインの各ステージごとに手作業でプロンプト文字列を調整する必要があったが、DSPyではシグ...

📄 論文解説: WAS — RRFを超えるハイブリッド検索スコアリング手法とインデックス最適化

本記事は Enhancing Vector Search with Weighted Aggregate Scores and Inverted Indexing の解説記事です。 論文概要(Abstract) RAGパイプラインにおけるハイブリッド検索(BM25キーワード検索 + Dense ベクトル検索)は、単一手法より検索精度が高いことが知られている。その融合手法として広く使われる...

📄 論文解説: SIMBA — バッチレベルビームサーチによるDSPyプログラムの推論時スケーリング

論文概要(Abstract) SIMBA(Stochastic Introspective Mini-Batch Ascent)は、DSPyプログラムの最適化においてバッチレベルビームサーチの発想を取り入れた推論時スケーリングフレームワークである。複数ステージから構成されるLMプログラムに対し、ミニバッチ単位で候補プログラムを生成・スコアリング・剪定(プルーニング)するサイクルを繰り返すこ...

📄 論文解説: グラフ型ベクトル検索の包括的実験評価 — HNSW・DiskANN・RoarGraph・ACORNを同一条件で比較

本記事は Graph-based Vector Search: An Experimental Evaluation of the State of the Art の解説記事です。 論文概要(Abstract) ベクトル検索(ANN: Approximate Nearest Neighbor)アルゴリズムは多数提案されているが、公平な比較評価が不足していた。本論文は、グラフ型ANN索引...

📄 論文解説: MIPROv2 — ベイズ最適化による多段LLMプログラムの命令・デモ最適化

論文概要(Abstract) MIPROv2(Multi-prompt Instruction PRoposal Optimizer Version 2)は、複数のLM呼び出しモジュールで構成されるDSPyプログラムに対して、各モジュールの命令文(instruction)とfew-shotデモンストレーションを同時にベイズ最適化するアルゴリズムである。著者らは、プログラム構造やデータを考慮...

📄 論文解説: GEPA — リフレクティブなプロンプト進化で強化学習を超える

本記事は GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning(Peng et al., 2025)の解説記事です。 この記事は Zenn記事: DSPy v3.1 GEPA×Evaluateで構築するプロンプト最適化自動化パイプライン の深掘りです。 論文概要(Abstract) GEPAはLL...

📄 論文解説: ACORN — フィルタ付きベクトル検索の精度を劇的に改善するグラフ探索アルゴリズム

本記事は ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data の解説記事です。 論文概要(Abstract) ベクトルデータベースにおけるフィルタ付き近似最近傍探索(Filtered ANN)は、RAGやECサイトの検索で不可欠な機能である。しかし従来のHNS...