本記事は Visual Language Intelligence and Edge AI 2.0 with NVIDIA Cosmos Nemotron(NVIDIA Technical Blog) の解説記事です。 ブログ概要(Summary) NVIDIA が2025年1月に公開した本ブログは、同社の Vision-Language Model(VLM)ファミリーである VILA/...
本記事は NVIDIA Developer Blog: Traditional RAG vs. Agentic RAG—Why AI Agents Need Dynamic Knowledge to Get Smarter の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6のtool_useで出典付きAgentic RAGを構築する の深掘...
本記事は Deploying the NVIDIA AI Blueprint for Cost-Efficient LLM Routing(NVIDIA Developer Blog)の解説記事です。 ブログ概要(Summary) NVIDIAは、LLMルーティングの本番環境向けリファレンス実装として「AI Blueprint for Cost-Efficient LLM Routing...
本記事は AWS Machine Learning Blog: Build conversational interfaces for structured data using Amazon Bedrock Knowledge Bases の解説記事です。 ブログ概要(Summary) AWSは2025年にAmazon Bedrock Knowledge Basesに構造化データ対応機...
論文概要(Abstract) 本論文は、ノーコード開発プラットフォーム(NCDP: No-Code Development Platform)にLLMを統合する際の適性要因を実証的に分析した研究である。著者ら(Minghe Wang et al.)は、4つの要因——モデル選択、プロンプト言語、学習データの背景知識、エラー情報を活用したFew-shot設計——がノーコード開発の成功率に与える...
本記事は arXiv:2412.19512 の解説記事です。 論文概要(Abstract) Laveeらは、大規模商品カタログに対する質問応答において、ルールベース、RAGベース、SQLベースの3手法を比較し、SQLベースのアプローチがルールベースを53.8%、RAGベースを25.4%上回ることを実証した。著者らは商品カタログ固有のベンチマークを構築し、特に複雑なフィルタリングやソートを...
本記事は CHASE-SQL: Multi-Path Reasoning and Preference Optimized Candidate Selection in Text-to-SQL の解説記事です。 論文概要(Abstract) CHASE-SQLは、3つの独立したSQL生成パス(Chain-of-Thought、Divide-and-Conquer、Query Plan B...
本記事は RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generation の解説記事です。 論文概要(Abstract) RAGCache は、RAG(Retrieval-Augmented Generation)システムにおける検索結果(知識チャンク)のKVキャッシュを事前計算・階層的に管理するフレームワ...
本記事は DistServe: Disaggregating Prefill and Decoding for Goodput-optimized Large Language Model Serving(arXiv:2403.02310、2024年3月公開)の解説記事です。 論文概要(Abstract) DistServeは、LLM推論のPrefillフェーズ(プロンプト処理)とDec...
本記事は arXiv:2309.02427 Cognitive Architectures for Language Agents の解説記事です。 論文概要(Abstract) 著者ら(Theodore Sumers, Shunyu Yao, Karthik Narasimhan, Thomas L. Griffiths, Princeton University, 2023年9月)は...