本記事は AWS Machine Learning Blog の解説記事です。 ブログ概要(Summary) AWSは、RAGベースのドキュメントアシスタントにおいて、ベクトル検索だけでは構造化データの正確な問合せが困難であるという課題に対し、エンティティ抽出+SQLクエリ+エージェントを統合したアーキテクチャを提案している。Amazon Bedrock上のClaude 3.5 Sonn...
本記事は AWS Machine Learning Blog: “Build a robust text-to-SQL solution generating complex queries, self-correcting, and querying diverse data sources” の解説記事です。 ブログ概要(Summary) AWSは、Amazon Bedrockを活用...
ブログ概要(Summary) 本記事は https://aws.amazon.com/blogs/machine-learning/effective-cost-optimization-strategies-for-amazon-bedrock/ の解説記事です。 この記事は Zenn記事: Bedrock Intelligent Prompt Routingで社内RAGコスト最大60...
論文概要(Abstract) 本論文は、LLMが生成したコードをFunction-as-a-Service(FaaS)プラットフォーム上で自動的にデプロイ・実行するフレームワーク「LLM4FaaS」を提案している。著者らによると、LLMは自然言語からのコード生成能力に優れるものの、生成コードの実行環境の構築・デプロイは依然として技術的障壁が高い。FaaSの高い抽象度を活用することで、この障...
本記事は MMTEB: Massive Multilingual Text Embedding Benchmark (arXiv:2502.13595) の解説記事です。 論文概要(Abstract) テキスト埋め込みモデルの評価は、従来のMTEB(Muennighoff et al., 2022)が英語中心であったため、多言語モデルの公平な比較が困難であった。Enevoldsen, C...
本記事は arXiv:2501.11555 HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction の解説記事です。 論文概要(Abstract) HybridRAGは、Knowledge Graphベースの...
本記事は arXiv:2501.10868 の解説記事です。 論文概要(Abstract) Geng, Cooper, Moskal ら (2025) は、LLMの構造化出力生成を体系的に評価するベンチマーク JSONSchemaBench を提案している。GitHub、Kubernetes設定ファイル、API仕様書などから収集した約10,000件の実世界JSON Schemaを用い、6...
本記事は arXiv:2501.09516 “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG” の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6でSQL統合Agentic RAGを実装する の深掘りです。 論文概要(Abstract) LLMの静的知識・コ...
本記事は Llumnix: Dynamic Scheduling for Large Language Model Serving(arXiv:2401.12843、2024年1月公開)の解説記事です。 論文概要(Abstract) Llumnixは、LLM推論サービングにおける動的スケジューリングシステムである。著者らは、既存のLLMサービング基盤(vLLM等)が採用する静的なロードバ...
本記事は RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation の解説記事です。 論文概要(Abstract) 著者らは、RAG(Retrieval-Augmented Generation)システムにおいて、検索されたドキュメントのKVキャッシュを「知識ツリー(Knowledge Tree)」構...