論文解説: LLMベースのコード生成エージェント完全サーベイ 論文概要 本サーベイ論文は、LLM(大規模言語モデル)を活用したコード生成エージェントの包括的な分析を提供します。従来のコード生成手法との3つの重要な違い(自律性、適用範囲、エンジニアリング重視)を明確にし、2022年から2025年6月までの100本の高品質論文を体系的にレビューしています。 論文情報: arXiv I...
NVIDIA研究解説: エージェントAIシステムのコード実行セキュリティ ブログ概要 NVIDIA AI Red Teamによる公式テックブログ “How Code Execution Drives Key Risks in Agentic AI Systems” (2025年) は、AIエージェントが動的に生成したコードを実行する際の 根本的なセキュリティリスク を詳述しています。本記...
概要 HyPA-RAG(Hybrid Parameter-Adaptive RAG)は、AI法律・政策ドメインに特化したRAGシステムです。arXiv論文2409.09046およびNAACL 2025 Industry Trackで発表され、ハイブリッド検索(BM25 + Dense + Knowledge Graph)とクエリ複雑度に応じたパラメータ適応により、法律文書検索の精度と文脈適...
カンファレンス論文解説: AvaTaR - LLMエージェントのツール使用最適化 論文概要 AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning (NeurIPS 2024) は、Stanford University と Amazon によるLLMエージェントのツール使用能力を 対比推論 で最適化す...
論文解説: Infini-attention - 無限長コンテキストを実現する圧縮メモリ機構 論文概要 Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention (arXiv:2404.07143, 2024年4月) は、Google DeepMindによる 無限長コンテキ...
概要 FAISS(Facebook AI Similarity Search)は、Meta AI FAIR(Facebook AI Research)が開発した高効率ベクトル類似検索ライブラリです。arXiv論文2401.08281で詳細が公開され、1.5兆ベクトル(144次元)のインデックス作成や10億規模のGPU高速検索を実現しています。 本記事では、FAISSの中核技術であるHNS...
Anthropic研究解説: プロンプトインジェクション防御の最前線 ブログ概要 Anthropicの公式研究ブログ “Mitigating the risk of prompt injections in browser use” (2025年) は、ブラウザ操作エージェントに対する プロンプトインジェクション攻撃 の防御手法を詳述しています。本記事は、Claude Opus 4.5で...
概要 Google Researchが提案するSpeculative RAGは、従来のRAG(Retrieval-Augmented Generation)システムの推論遅延と精度の両方を大幅に改善する新しいアーキテクチャです。本手法は、小規模な専門特化モデル(Specialist Drafter)と大規模な汎用モデル(Generalist Verifier)を組み合わせたドラフト・検証パ...
1. 論文概要 Ahmed E. Hassan(Queen’s University)、Gustavo A. Oliva(Amazon)らによる本論文(arXiv:2410.06107, 2024年10月公開)は、大規模言語モデル(LLM)時代の新しいソフトウェア工学パラダイム「SE 3.0」を提唱しています。 SE 3.0の定義: Intent-centric(意図中心)、conver...
論文概要 タイトル: Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers 公開日: 2025年6月(arXiv:2506.00054) 本論文は、RAGシステムの設計空間を体系的に分類し、アーキテクチャパターン、強化...