概要 FAISS(Facebook AI Similarity Search)は、Meta AI FAIR(Facebook AI Research)が開発した高効率ベクトル類似検索ライブラリです。arXiv論文2401.08281で詳細が公開され、1.5兆ベクトル(144次元)のインデックス作成や10億規模のGPU高速検索を実現しています。 本記事では、FAISSの中核技術であるHNS...
Anthropic研究解説: プロンプトインジェクション防御の最前線 ブログ概要 Anthropicの公式研究ブログ “Mitigating the risk of prompt injections in browser use” (2025年) は、ブラウザ操作エージェントに対する プロンプトインジェクション攻撃 の防御手法を詳述しています。本記事は、Claude Opus 4.5で...
概要 Google Researchが提案するSpeculative RAGは、従来のRAG(Retrieval-Augmented Generation)システムの推論遅延と精度の両方を大幅に改善する新しいアーキテクチャです。本手法は、小規模な専門特化モデル(Specialist Drafter)と大規模な汎用モデル(Generalist Verifier)を組み合わせたドラフト・検証パ...
1. 論文概要 Ahmed E. Hassan(Queen’s University)、Gustavo A. Oliva(Amazon)らによる本論文(arXiv:2410.06107, 2024年10月公開)は、大規模言語モデル(LLM)時代の新しいソフトウェア工学パラダイム「SE 3.0」を提唱しています。 SE 3.0の定義: Intent-centric(意図中心)、conver...
論文概要 タイトル: Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers 公開日: 2025年6月(arXiv:2506.00054) 本論文は、RAGシステムの設計空間を体系的に分類し、アーキテクチャパターン、強化...
論文概要 タイトル: A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions 著者: Shailja Gupta, Rajesh Ranjan, Surya Narayan Singh 公開日: 2024年10月3...
論文概要 タイトル: Large Language Models as Optimizers 著者: Chengrun Yang, Xuezhi Wang, Yifeng Lu, Hanxiao Liu, Quoc V. Le, Denny Zhou, Xinyun Chen (Google DeepMind) 発表: ICLR 2024 arXiv ID: 2309.03409 提出日:...
論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク 論文概要 AgentBench: Evaluating LLMs as Agents (arXiv:2308.10848, 2023年8月) は、Large Language Model (LLM) をエージェントとして評価するための包括的なベンチマークフレームワークです。従来のLLM評価が自然言語処理タス...
1. ブログ概要 DeepMindが2025年に発表したCodeMenderは、コードセキュリティの脆弱性を自動的に検出・修正するAIエージェントシステムです。従来の静的解析ツールやLintが「脆弱性の指摘」に留まるのに対し、CodeMenderは修正パッチの自動生成から検証、アップストリームへの貢献までを実現しています。 主要な特徴: Gemini Deep Thinkモデル: ...
ブログ概要 Amazon BedrockにStructured Outputs機能が追加され、Foundation ModelsがJSON Schemaに確実に準拠した応答を生成できるようになりました。本機能はConstrained Decodingを使用し、モデルがスキーマ違反を生成することを防ぎます。 Zenn記事ではPydanticによる事後検証を紹介しましたが、Amazon Be...