本記事は RAGO: Systematic Performance Optimization for Retrieval-Augmented Generation Serving (arXiv:2503.14649, ISCA 2025) の解説記事です。 論文概要(Abstract) RAGO(Retrieval-Augmented Generation Optimizer)は、RAG...
本記事は Compact Language Models via Pruning and Knowledge Distillation (arXiv:2407.14679)(NeurIPS 2024採択)の解説記事です。 論文概要(Abstract) 著者らは、大規模LLMをプルーニング(枝刈り)した後に知識蒸留で再学習することで、スクラッチ学習の3%未満のデータ量で同等性能のコンパクト...
本記事は MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL(COLING 2025採択)の解説記事です。 論文概要(Abstract) MAC-SQLは、大規模データベースと複雑なクエリに対応するため、3つの専門エージェント(Selector、Decomposer、Refiner)が協調してText-to-SQL...
本記事は arXiv: 2510.05691 — DecEx-RAG: Boosting Agentic Retrieval-Augmented Generation with Decision and Execution Optimization via Process Supervision の解説記事です。EMNLP 2025 Industry Trackで採択されています。 この記...
本記事は LangChain Blog: Self-Reflective RAG with LangGraph の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6のtool_useで出典付きAgentic RAGを構築する の深掘りです。 ブログ概要(Summary) LangChainの公式ブログでは、LangGraphのStateG...
本記事は Advancing the frontier of video understanding with Gemini 2.5(Google Developers Blog、2025年5月9日) の解説記事です。 ブログ概要(Summary) Google Developers Blog が2025年5月に公開した本記事は、Gemini 2.5 の動画理解能力に焦点を当てた技術解説...
本記事は AWS Machine Learning Blog の解説記事です。 ブログ概要(Summary) AWSは、RAGベースのドキュメントアシスタントにおいて、ベクトル検索だけでは構造化データの正確な問合せが困難であるという課題に対し、エンティティ抽出+SQLクエリ+エージェントを統合したアーキテクチャを提案している。Amazon Bedrock上のClaude 3.5 Sonn...
本記事は AWS Machine Learning Blog: “Build a robust text-to-SQL solution generating complex queries, self-correcting, and querying diverse data sources” の解説記事です。 ブログ概要(Summary) AWSは、Amazon Bedrockを活用...
ブログ概要(Summary) 本記事は https://aws.amazon.com/blogs/machine-learning/effective-cost-optimization-strategies-for-amazon-bedrock/ の解説記事です。 この記事は Zenn記事: Bedrock Intelligent Prompt Routingで社内RAGコスト最大60...
論文概要(Abstract) 本論文は、LLMが生成したコードをFunction-as-a-Service(FaaS)プラットフォーム上で自動的にデプロイ・実行するフレームワーク「LLM4FaaS」を提案している。著者らによると、LLMは自然言語からのコード生成能力に優れるものの、生成コードの実行環境の構築・デプロイは依然として技術的障壁が高い。FaaSの高い抽象度を活用することで、この障...