論文概要 本記事は SparseServe (arXiv 2509.24626) の解説記事です。SparseServeは、長文脈LLM推論における動的疎アテンション(Dynamic Sparse Attention, DSA)のシステムレベルの課題を解決するサービングフレームワークである。DSAはアテンション計算量を削減するが、未使用のKVキャッシュがGPU HBM上に残留し並列処理を制...
ブログ概要(Summary) 本記事は Qdrant公式ブログ「Hybrid Search Revamped — Building with Qdrant’s Query API」 の解説記事です。 Qdrant社のKacper Łukawski氏が2024年7月に公開した本ブログ記事では、Qdrant 1.10で導入されたQuery APIを中心に、ハイブリッド検索をサーバーサイドで完...
論文概要(Abstract) 本記事は BEIR: A Heterogeneous Benchmark for Zero-shot Evaluation of Information Retrieval Models(NeurIPS 2021 Dataset and Benchmark Track)の解説記事です。 著者らは、既存のニューラル情報検索(IR)モデルが均質で限定的な実験設定...
本記事は From BM25 to Corrective RAG: Benchmarking Retrieval Strategies for Text-and-Table Documents の解説記事です。 論文概要(Abstract) Retrieval-Augmented Generation(RAG)システムにおける検索品質の重要性にもかかわらず、テキストとテーブルが混在する異...
本記事は Balancing the Blend: An Experimental Analysis of Trade-offs in Hybrid Search の解説記事です。 論文概要(Abstract) ハイブリッド検索は、RAGパイプラインや情報検索システムにおいて検索精度を向上させる手法として広く採用されている。しかし、複数の検索パスを組み合わせることで生じる効果とコストのト...
本記事は M3-Embedding: Multi-Linguality, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation の解説記事です。 論文概要(Abstract) M3-Embedding(BGE-M3)は、1つのモデルからdense retriev...
論文概要(Abstract) 本記事は Enhancing Model Context Protocol (MCP) with Context-Aware Server Collaboration の解説記事です。 著者らは、Model Context Protocol(MCP)の拡張として Context-Aware MCP(CA-MCP)を提案している。従来のMCPでは中央のLLMが...
本記事は SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering の解説記事です。 論文概要(Abstract) 言語モデル(LM)エージェントによるソフトウェアエンジニアリングタスクの自動化において、エージェントがコンピュータ環境と対話するインタフェースの設計が性能に大きな影響を与えることを示...
論文概要(Abstract) 本記事は LLM-based Agents for Automated Bug Fixing: How Far Are We? の解説記事です。 この論文は、LLMベースの6種のバグ修正エージェントをSWE-bench Lite(300件のGitHub Issue)上で体系的に評価した実証研究です。著者らは、解決率(Resolved Rate)、コスト効率、...
本記事は Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? の解説記事です。 論文概要(Abstract) AGENTS.mdやCLAUDE.mdといったリポジトリレベルのコンテキストファイルは、コーディングエージェントをリポジトリに適応させる手段として広く普及している。...