Home
0h-n0 TechBLog
キャンセル

✍️ AWS解説: Amazon Bedrock×RAGによるエンタープライズText-to-SQLの構築パターン

本記事は AWS Machine Learning Blog の解説記事です。 ブログ概要(Summary) AWSは、RAGベースのドキュメントアシスタントにおいて、ベクトル検索だけでは構造化データの正確な問合せが困難であるという課題に対し、エンティティ抽出+SQLクエリ+エージェントを統合したアーキテクチャを提案している。Amazon Bedrock上のClaude 3.5 Sonn...

📄 論文解説: LLM4FaaS — LLMとFunction-as-a-Serviceで実現するノーコードアプリケーション開発

論文概要(Abstract) 本論文は、LLMが生成したコードをFunction-as-a-Service(FaaS)プラットフォーム上で自動的にデプロイ・実行するフレームワーク「LLM4FaaS」を提案している。著者らによると、LLMは自然言語からのコード生成能力に優れるものの、生成コードの実行環境の構築・デプロイは依然として技術的障壁が高い。FaaSの高い抽象度を活用することで、この障...

📄 論文解説: MMTEB — 250言語×500データセットに拡張された多言語テキスト埋め込みベンチマーク

本記事は MMTEB: Massive Multilingual Text Embedding Benchmark (arXiv:2502.13595) の解説記事です。 論文概要(Abstract) テキスト埋め込みモデルの評価は、従来のMTEB(Muennighoff et al., 2022)が英語中心であったため、多言語モデルの公平な比較が困難であった。Enevoldsen, C...

📄 論文解説: JSONSchemaBench — 10K実世界スキーマによるLLM構造化出力ベンチマーク

本記事は arXiv:2501.10868 の解説記事です。 論文概要(Abstract) Geng, Cooper, Moskal ら (2025) は、LLMの構造化出力生成を体系的に評価するベンチマーク JSONSchemaBench を提案している。GitHub、Kubernetes設定ファイル、API仕様書などから収集した約10,000件の実世界JSON Schemaを用い、6...

📄 論文解説: Llumnix — ライブマイグレーションによるLLM推論の動的スケジューリング

本記事は Llumnix: Dynamic Scheduling for Large Language Model Serving(arXiv:2401.12843、2024年1月公開)の解説記事です。 論文概要(Abstract) Llumnixは、LLM推論サービングにおける動的スケジューリングシステムである。著者らは、既存のLLMサービング基盤(vLLM等)が採用する静的なロードバ...

📄 論文解説: RAGCache — 知識ツリー構造によるRAG推論のKVキャッシュ最適化

本記事は RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation の解説記事です。 論文概要(Abstract) 著者らは、RAG(Retrieval-Augmented Generation)システムにおいて、検索されたドキュメントのKVキャッシュを「知識ツリー(Knowledge Tree)」構...