論文概要(Abstract) 本記事は A-RAG論文 (arXiv:2602.03442) の解説記事です。 A-RAGは、従来のpassive RAG(単発検索+生成)の限界を超え、LLMエージェントが検索戦略を動的に計画・実行・評価するフレームワークである。クエリ分解、マルチラウンド検索、自己評価ループを統合し、階層的検索インターフェース(keyword_search / sema...
論文概要(Abstract) 本記事は Improved Regret Bounds for Bayesian Optimization with Transfer Learning (arXiv:2506.01393) の解説記事です。 この論文は、転移学習を用いたベイズ最適化(BO)アルゴリズムに対して、情報理論的な道具立てを活用した新たな累積リグレットバウンドを導出しています。著者...
本記事は Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models の解説記事です。 論文概要(Abstract) Nemotron-Hは、NVIDIAが2025年4月に発表したMamba-2 SSMとTransformer Attentionを組み合わせたハイブリッドアーキテクチャのモデ...
論文概要(Abstract) 本記事は arXiv:2410.24164 π₀: A Vision-Language-Action Flow Model for General Robot Control の解説記事です。 π0はPhysical Intelligence社が2024年10月に発表した汎用ロボット制御のための基盤モデルである。事前学習済みのVision-Language ...
論文概要(Abstract) 本記事は https://arxiv.org/abs/2402.10085 の解説記事です。 AlphaFold-NMR(AISAR: AI SAmpling with NMR Recall selection)は、AlphaFold2のニューラルネットワークドロップアウトを利用した構造サンプリングと、NMR実験データに基づくベイズスコアリングを統合し、タン...
ブログ概要(Summary) 本記事は ProjectDiscovery Blog: How We Cut LLM Costs by 59% With Prompt Caching の解説記事です。 ProjectDiscoveryはセキュリティ自動化プラットフォームを提供する企業であり、AIエージェント基盤「Neo」においてClaude Opus 4.5を用いた大規模なマルチステップエ...
本記事は NVIDIA Technical Blog: 5x Faster Time to First Token with NVIDIA TensorRT-LLM KV Cache Early Reuse の解説記事です。 ブログ概要(Summary) NVIDIAは TensorRT-LLM における KV Cache の再利用効率を大幅に向上させる3つの最適化技術を発表した。第一に...
ブログ概要(Summary) 本記事は https://research.google/pubs/or-tools-vehicle-routing-solver-a-generic-constraint-programming-solver-with-heuristic-search-for-routing-problems/ の解説記事です。 Google OR-ToolsのVehic...
ブログ概要(Summary) 本記事は Getting started with Amazon Bedrock Agents custom orchestrator の解説記事です。Amazon Bedrock Agentsのカスタムオーケストレーション機能は、デフォルトのReAct(Reason and Action)戦略に代えて、Lambda関数によるユーザー定義のオーケストレーション...
本記事は Anthropic: Building Effective AI Agents の解説記事です。 ブログ概要(Summary) Anthropicが2024年12月に公開した「Building Effective AI Agents」は、LLMを活用したエージェントシステムの設計パターンを体系的に整理したガイドラインである。ブログでは「ワークフロー」と「エージェント」を明確に区...