本記事は MMTEB: Massive Multilingual Text Embedding Benchmark (arXiv:2502.13595) の解説記事です。 論文概要(Abstract) テキスト埋め込みモデルの評価は、従来のMTEB(Muennighoff et al., 2022)が英語中心であったため、多言語モデルの公平な比較が困難であった。Enevoldsen, C...
本記事は arXiv:2501.11555 HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction の解説記事です。 論文概要(Abstract) HybridRAGは、Knowledge Graphベースの...
本記事は arXiv:2501.10868 の解説記事です。 論文概要(Abstract) Geng, Cooper, Moskal ら (2025) は、LLMの構造化出力生成を体系的に評価するベンチマーク JSONSchemaBench を提案している。GitHub、Kubernetes設定ファイル、API仕様書などから収集した約10,000件の実世界JSON Schemaを用い、6...
本記事は arXiv:2501.09516 “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG” の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6でSQL統合Agentic RAGを実装する の深掘りです。 論文概要(Abstract) LLMの静的知識・コ...
本記事は Llumnix: Dynamic Scheduling for Large Language Model Serving(arXiv:2401.12843、2024年1月公開)の解説記事です。 論文概要(Abstract) Llumnixは、LLM推論サービングにおける動的スケジューリングシステムである。著者らは、既存のLLMサービング基盤(vLLM等)が採用する静的なロードバ...
本記事は RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation の解説記事です。 論文概要(Abstract) 著者らは、RAG(Retrieval-Augmented Generation)システムにおいて、検索されたドキュメントのKVキャッシュを「知識ツリー(Knowledge Tree)」構...
本記事は FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance (arXiv:2305.05176) の解説記事です。 論文概要(Abstract) 著者らは、大規模言語モデル(LLM)のAPI利用コストを削減するための3つの戦略(プロンプト適応、LLMカスケード...
本記事は NeurIPS 2024で採択された HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models の解説記事です。 論文概要(Abstract) 著者ら(Bernal Jiménez Gutiérrez, Yiheng Shu, Yu Gu, Michihiro Yasunaga...
本記事は AOP: Automated and Interactive LLM Pipeline Orchestration for Answering Complex Queries (CIDR 2025) の解説記事です。 論文概要(Abstract) AOP(Automated and Interactive LLM Pipeline Orchestration)は、複雑なクエリに...
✍️ Microsoft FastTrack解説: Azure API Management Circuit BreakerとLoad BalancingによるAzure OpenAIレジリエンス設計
本記事は Using Azure API Management Circuit Breaker and Load balancing with Azure OpenAI Service(Microsoft FastTrack for Azure Blog)の解説記事です。 ブログ概要(Summary) Microsoft FastTrack for Azureチームが公開したこのブログ記...