📄 論文解説: Prompt Cache — モジュラーAttention再利用による低レイテンシLLM推論

本記事は Prompt Cache: Modular Attention Reuse for Low-Latency Inference の解説記事です。論文概要（Abstract） Prompt Cacheは、LLM推論におけるTime-To-First-Token（TTFT）を削減するための手法である。プロンプト内に繰り返し現れる共通セグメント（システム指示、Few-shot例、ド...

01/04/2026 blog paper

LLM KV-cache prompt-caching +3

✍️ NVIDIA cuVS解説: GPU加速ベクトル検索がRAG・推薦のインデックス構築を最大40倍高速化

本記事は Optimizing Vector Search for Indexing and Real-Time Retrieval with NVIDIA cuVS の解説記事です。ブログ概要（Summary） NVIDIA cuVSは、GPU加速によるベクトル検索・クラスタリングライブラリである。CAGRA（GPU最適化グラフ索引）、DiskANN、HNSW、IVF-PQ等の主要ア...

31/03/2026 blog tech_blog

NVIDIA GPU vector-database +6

📄 論文解説: TextGrad — テキストによる自動微分フレームワーク

論文概要（Abstract） TextGradは、ニューラルネットワークにおける自動微分（Automatic Differentiation）の概念をテキスト空間に拡張したフレームワークである。LLMが生成する自然言語フィードバックを「テキスト勾配（textual gradient）」として扱い、計算グラフ上を逆伝播させることで、プロンプト・コード・分子構造など多様な非微分可能変数を最適化...

31/03/2026 blog paper

automatic-differentiation text-optimization llm +2

📄 論文解説: LSM-VEC — LSMツリー型動的ベクトルインデックスでFreshDiskANN比5倍の書き込みスループット

本記事は LSM-VEC: An LSM-Tree Based Dynamic Vector Index の解説記事です。論文概要（Abstract）推薦システムやリアルタイム検索では、ベクトルデータベースに対する高スループットの書き込み（新規ベクトルの継続的挿入）と効率的な類似度検索の両立が求められる。しかし静的ベクトルインデックス（HNSW、IVF等）は読み取り最適化されており、...

31/03/2026 blog paper

vector-database LSM-tree dynamic-index +5

📄 論文解説: DSPy — 宣言的LM呼び出しを自己改善パイプラインにコンパイル

論文概要（Abstract） DSPy（Declarative Self-improving Python）は、Stanford NLPグループが提案した、言語モデル（LM）パイプラインをテキスト変換グラフとして抽象化するプログラミングフレームワークである。従来のプロンプトエンジニアリングでは、パイプラインの各ステージごとに手作業でプロンプト文字列を調整する必要があったが、DSPyではシグ...

31/03/2026 blog paper

dspy llm-framework prompt-optimization +2

📄 論文解説: WAS — RRFを超えるハイブリッド検索スコアリング手法とインデックス最適化

本記事は Enhancing Vector Search with Weighted Aggregate Scores and Inverted Indexing の解説記事です。論文概要（Abstract） RAGパイプラインにおけるハイブリッド検索（BM25キーワード検索 + Dense ベクトル検索）は、単一手法より検索精度が高いことが知られている。その融合手法として広く使われる...

31/03/2026 blog paper

hybrid-search BM25 dense-retrieval +5

📄 論文解説: SIMBA — バッチレベルビームサーチによるDSPyプログラムの推論時スケーリング

論文概要（Abstract） SIMBA（Stochastic Introspective Mini-Batch Ascent）は、DSPyプログラムの最適化においてバッチレベルビームサーチの発想を取り入れた推論時スケーリングフレームワークである。複数ステージから構成されるLMプログラムに対し、ミニバッチ単位で候補プログラムを生成・スコアリング・剪定（プルーニング）するサイクルを繰り返すこ...

31/03/2026 blog paper

inference-time-compute beam-search dspy +2

📄 論文解説: グラフ型ベクトル検索の包括的実験評価 — HNSW・DiskANN・RoarGraph・ACORNを同一条件で比較

本記事は Graph-based Vector Search: An Experimental Evaluation of the State of the Art の解説記事です。論文概要（Abstract）ベクトル検索（ANN: Approximate Nearest Neighbor）アルゴリズムは多数提案されているが、公平な比較評価が不足していた。本論文は、グラフ型ANN索引...

31/03/2026 blog paper

vector-database HNSW DiskANN +5

📄 論文解説: MIPROv2 — ベイズ最適化による多段LLMプログラムの命令・デモ最適化

論文概要（Abstract） MIPROv2（Multi-prompt Instruction PRoposal Optimizer Version 2）は、複数のLM呼び出しモジュールで構成されるDSPyプログラムに対して、各モジュールの命令文（instruction）とfew-shotデモンストレーションを同時にベイズ最適化するアルゴリズムである。著者らは、プログラム構造やデータを考慮...

31/03/2026 blog paper

prompt-optimization bayesian-optimization dspy +2

📄 論文解説: GEPA — リフレクティブなプロンプト進化で強化学習を超える

本記事は GEPA: Reflective Prompt Evolution Can Outperform Reinforcement Learning（Peng et al., 2025）の解説記事です。この記事は Zenn記事: DSPy v3.1 GEPA×Evaluateで構築するプロンプト最適化自動化パイプラインの深掘りです。論文概要（Abstract） GEPAはLL...

31/03/2026 blog paper

prompt-optimization evolutionary-algorithm dspy +2

1
...
44
45
46
...
126
45 / 126