Home
0h-n0 TechBLog
キャンセル

✍️ FAISS完全ガイド: 大規模ベクトル検索の実装と最適化

概要 FAISS(Facebook AI Similarity Search)は、Meta AI FAIR(Facebook AI Research)が開発した高効率ベクトル類似検索ライブラリです。arXiv論文2401.08281で詳細が公開され、1.5兆ベクトル(144次元)のインデックス作成や10億規模のGPU高速検索を実現しています。 本記事では、FAISSの中核技術であるHNS...

✍️ Anthropic研究解説: プロンプトインジェクション防御の最前線

Anthropic研究解説: プロンプトインジェクション防御の最前線 ブログ概要 Anthropicの公式研究ブログ “Mitigating the risk of prompt injections in browser use” (2025年) は、ブラウザ操作エージェントに対する プロンプトインジェクション攻撃 の防御手法を詳述しています。本記事は、Claude Opus 4.5で...

✍️ Speculative RAG: Draftingで推論を高速化する最新手法

概要 Google Researchが提案するSpeculative RAGは、従来のRAG(Retrieval-Augmented Generation)システムの推論遅延と精度の両方を大幅に改善する新しいアーキテクチャです。本手法は、小規模な専門特化モデル(Specialist Drafter)と大規模な汎用モデル(Generalist Verifier)を組み合わせたドラフト・検証パ...

📄 論文解説: SE 3.0 - AI-Nativeソフトウェア工学の新パラダイム

1. 論文概要 Ahmed E. Hassan(Queen’s University)、Gustavo A. Oliva(Amazon)らによる本論文(arXiv:2410.06107, 2024年10月公開)は、大規模言語モデル(LLM)時代の新しいソフトウェア工学パラダイム「SE 3.0」を提唱しています。 SE 3.0の定義: Intent-centric(意図中心)、conver...

✍️ RAGアーキテクチャと堅牢性: 設計空間の全体像

論文概要 タイトル: Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers 公開日: 2025年6月(arXiv:2506.00054) 本論文は、RAGシステムの設計空間を体系的に分類し、アーキテクチャパターン、強化...

✍️ RAG完全サーベイ: 基礎から最先端まで進化の全体像

論文概要 タイトル: A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions 著者: Shailja Gupta, Rajesh Ranjan, Surya Narayan Singh 公開日: 2024年10月3...

📄 論文解説: Large Language Models as Optimizers(OPRO)

論文概要 タイトル: Large Language Models as Optimizers 著者: Chengrun Yang, Xuezhi Wang, Yifeng Lu, Hanxiao Liu, Quoc V. Le, Denny Zhou, Xinyun Chen (Google DeepMind) 発表: ICLR 2024 arXiv ID: 2309.03409 提出日:...

📄 論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク

論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク 論文概要 AgentBench: Evaluating LLMs as Agents (arXiv:2308.10848, 2023年8月) は、Large Language Model (LLM) をエージェントとして評価するための包括的なベンチマークフレームワークです。従来のLLM評価が自然言語処理タス...

✍️ DeepMind CodeMender解説: AI駆動型コードセキュリティ改善エージェント

1. ブログ概要 DeepMindが2025年に発表したCodeMenderは、コードセキュリティの脆弱性を自動的に検出・修正するAIエージェントシステムです。従来の静的解析ツールやLintが「脆弱性の指摘」に留まるのに対し、CodeMenderは修正パッチの自動生成から検証、アップストリームへの貢献までを実現しています。 主要な特徴: Gemini Deep Thinkモデル: ...

✍️ AWS ML Blog解説: Amazon Bedrockの構造化出力 - スキーマ準拠AI応答の実現

ブログ概要 Amazon BedrockにStructured Outputs機能が追加され、Foundation ModelsがJSON Schemaに確実に準拠した応答を生成できるようになりました。本機能はConstrained Decodingを使用し、モデルがスキーマ違反を生成することを防ぎます。 Zenn記事ではPydanticによる事後検証を紹介しましたが、Amazon Be...