本記事は FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance (arXiv:2305.05176) の解説記事です。 論文概要(Abstract) 著者らは、大規模言語モデル(LLM)のAPI利用コストを削減するための3つの戦略(プロンプト適応、LLMカスケード...
本記事は NeurIPS 2024で採択された HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models の解説記事です。 論文概要(Abstract) 著者ら(Bernal Jiménez Gutiérrez, Yiheng Shu, Yu Gu, Michihiro Yasunaga...
本記事は AOP: Automated and Interactive LLM Pipeline Orchestration for Answering Complex Queries (CIDR 2025) の解説記事です。 論文概要(Abstract) AOP(Automated and Interactive LLM Pipeline Orchestration)は、複雑なクエリに...
✍️ Microsoft FastTrack解説: Azure API Management Circuit BreakerとLoad BalancingによるAzure OpenAIレジリエンス設計
本記事は Using Azure API Management Circuit Breaker and Load balancing with Azure OpenAI Service(Microsoft FastTrack for Azure Blog)の解説記事です。 ブログ概要(Summary) Microsoft FastTrack for Azureチームが公開したこのブログ記...
本記事は LangChain Expression Language - LangChain Blog の解説記事です。 ブログ概要(Summary) 2023年8月にLangChain公式ブログで発表されたLCEL(LangChain Expression Language)は、LLMアプリケーションのパイプラインを宣言的に構築するための表現言語である。SQLAlchemy Expre...
本記事は Use Amazon Bedrock Intelligent Prompt Routing for cost and latency benefits(AWS Machine Learning Blog)の解説記事です。 ブログ概要(Summary) AWS Machine Learning Blogは、Amazon Bedrock Intelligent Prompt Rou...
ブログ概要(Summary) 2024年11月25日、AnthropicはModel Context Protocol(MCP)を発表した。MCPは、AIアシスタントと外部データソース・ツールを接続するためのオープンスタンダードであり、コンテンツリポジトリ、ビジネスツール、開発環境など、データが存在するシステムとAIを統合するための標準的な方法を提供する。従来の断片的なインテグレーションを...
本記事は arXiv:2501.17893 の解説記事です。 論文概要(Abstract) MemEngineは、LLMエージェントのメモリシステムを統一的かつモジュラーに構築するためのライブラリである。著者らは、既存のLLMエージェントがメモリを断片的かつアドホックに実装している問題を指摘し、Memory Operations(21種のアトミックプリミティブ)→ Memory Func...
本記事は arXiv:2501.13956 Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory の解説記事です。 論文概要(Abstract) 著者ら(Deshraj Yadav, Taranjeet Singh, Dev Khant, 2025年1月)は、LLMエージェントにスケーラブルな長期...
本記事は arXiv:2412.04687 の解説記事です。 論文概要(Abstract) Cuiらは、LLMを用いたNL2SQL(自然言語→SQL変換)の研究を「訓練軸」と「推論軸」の2次元で体系的に分類したサーベイを発表した。訓練軸ではPre-training、Supervised Fine-Tuning(SFT)、RLHF(人間フィードバックからの強化学習)の3段階を、推論軸ではP...