Home
0h-n0 TechBLog
キャンセル

✍️ LangChain公式解説: LangGraph Adaptive RAG — エージェント型検索ルーティングの実装パターン

ブログ概要(Summary) LangChain公式のLangGraph Adaptive RAGチュートリアルは、LLMが検索の要否を自律的に判断し、検索結果の品質を評価し、必要に応じてクエリを書き換えるエージェント型RAGシステムの構築方法を解説しています。文書の前処理、セマンティック検索インデックスの構築、エージェント的な意思決定の3つの能力を統合したシステムで、条件分岐とフィードバ...

📄 論文解説: Multi-Document RAGにおけるBM25・Dense・Hybrid検索戦略の体系的比較

論文概要(Abstract) 本論文は、金融ドメインにおけるマルチドキュメントRAGの検索戦略を体系的に評価した研究です。Dense Retrieval(LLM Embeddings)、Sparse Retrieval(BM25)、Hybrid Retrieval(DenseとSparseの統合)、Parent-Child Retrievalの4つの検索手法と、LLMベースRerankin...

📄 論文解説: Chain-of-Retrieval Augmented Generation — 反復的クエリ再構成でマルチホップQAの精度を向上

論文概要(Abstract) Chain-of-Retrieval Augmented Generation(CoRAG)は、言語モデルが最終回答を生成する前に段階的に情報を検索・推論する手法です。従来のRAGが初期クエリで1回だけ検索を行うのに対し、CoRAGは検索結果と中間推論に基づいてクエリを反復的に再構成し、マルチホップ質問に対してより正確で包括的な回答を可能にします。Reject...

📄 論文解説: Query Routing for Homogeneous Tools — 同種ツール間の軽量クエリルーティング手法

論文概要(Abstract) 本論文は、同一機能を持つ複数の同種ツール(Homogeneous Tools)間でクエリを最適なツールにルーティングする手法を体系的に調査した初の実証研究です。従来の研究は異種ツール(検索、計算、翻訳など機能が異なるツール)のルーティングに集中していましたが、同種ツール — 同じタスクを解くが性能プロファイルが異なるツール群 — のルーティングは未探索でした。...

📄 論文解説: AdaptiveRAG — クエリ分類×適応的検索戦略でRAGの精度とコストを両立する

論文概要(Abstract) AdaptiveRAGは、RAGシステムにおけるクエリルーティングの課題に取り組んだ研究です。従来のRAGは全クエリに対して一律の検索パイプラインを適用するため、単純なクエリでは不必要な検索コストが発生し、複雑なクエリでは検索が不十分になるという問題がありました。本論文では、クエリを3タイプ(Simple / Conversational / Complex)...

✍️ AWS公式解説: Amazon Bedrock Intelligent Prompt Routing — マネージドLLMルーティングの実装と活用

ブログ概要(Summary) Amazon Bedrock Intelligent Prompt Routingは、2025年4月にGA(一般提供)となったAWSマネージドのLLMルーティングサービスです。単一のサーバーレスエンドポイントを通じて、同一モデルファミリー内の複数LLM間でリクエストを動的にルーティングし、コスト最大30%削減を品質維持のまま実現します。メタモデル(ルーティング...

📄 論文解説: SRAG — マルチホップ質問応答のための構造化RAG

論文概要(Abstract) SRAG(Structured Retrieval-Augmented Generation)は、マルチホップ質問応答(複数の文書から情報を統合して回答する必要がある質問)に特化したRAGフレームワークである。従来のRAGは単一文書からの情報抽出に強いが、「Pythonの作者の母親はいつ生まれた?」のような2段階以上の推論が必要な質問には弱い。SRAGは複雑な...

📄 論文解説: MASAI — モジュラーアーキテクチャによるソフトウェアエンジニアリングAIエージェント

論文概要(Abstract) MASAI(Modular Architecture for Software-engineering AI agents)は、GitHub Issueの自動解決タスクを5つの専門サブエージェントに分解することで、SWE-bench Liteで28.33%(85/300件解決)を達成したシステムである。2024年6月時点でSWE-benchリーダーボードの最高...

📄 論文解説: RouteLLM — 人間選好データによるLLMコスト最適化ルーティング

論文概要(Abstract) LLMは異なるコスト-品質トレードオフを示し、それらの間でルーティングすることでコストを維持しつつ品質を保てる。本論文はLLMルーティングの問題を提起し、因果推論としての定式化により厳密な分析を可能にする。人間選好データを用いたLLMルーター訓練フレームワークを開発し、複数のルーター設計で実装・評価した。最良のルーターはMT-BenchでGPT-4コストを40...

📄 論文解説: RULER — Needle-in-a-Haystackの先にあるロングコンテキストLLM評価の決定版

論文概要(Abstract) 「Needle-in-a-Haystack(NIAH)」テストはロングコンテキストLLMの評価として広く使われているが、単一の隠し情報の検索に限定されるため、LLMの真の長文脈能力を測れていない。本論文ではRULER(Retrieval, Understanding, and Long-context Evaluation Revisited)を提案する。RU...