✍️ FAISS完全ガイド: 大規模ベクトル検索の実装と最適化

概要 FAISS（Facebook AI Similarity Search）は、Meta AI FAIR（Facebook AI Research）が開発した高効率ベクトル類似検索ライブラリです。arXiv論文2401.08281で詳細が公開され、1.5兆ベクトル（144次元）のインデックス作成や10億規模のGPU高速検索を実現しています。本記事では、FAISSの中核技術であるHNS...

15/02/2026 blog paper

FAISS Vector-Search HNSW +3

✍️ Anthropic研究解説: プロンプトインジェクション防御の最前線

Anthropic研究解説: プロンプトインジェクション防御の最前線ブログ概要 Anthropicの公式研究ブログ “Mitigating the risk of prompt injections in browser use” (2025年) は、ブラウザ操作エージェントに対するプロンプトインジェクション攻撃の防御手法を詳述しています。本記事は、Claude Opus 4.5で...

15/02/2026 blog tech_blog

security prompt-injection claude +2

✍️ Speculative RAG: Draftingで推論を高速化する最新手法

概要 Google Researchが提案するSpeculative RAGは、従来のRAG（Retrieval-Augmented Generation）システムの推論遅延と精度の両方を大幅に改善する新しいアーキテクチャです。本手法は、小規模な専門特化モデル（Specialist Drafter）と大規模な汎用モデル（Generalist Verifier）を組み合わせたドラフト・検証パ...

15/02/2026 blog tech_blog

RAG LLM Speculative-Decoding +2

📄 論文解説: SE 3.0 - AI-Nativeソフトウェア工学の新パラダイム

1. 論文概要 Ahmed E. Hassan（Queen’s University）、Gustavo A. Oliva（Amazon）らによる本論文（arXiv:2410.06107, 2024年10月公開）は、大規模言語モデル（LLM）時代の新しいソフトウェア工学パラダイム「SE 3.0」を提唱しています。 SE 3.0の定義: Intent-centric（意図中心）、conver...

15/02/2026 blog paper

software-engineering AI LLM +1

✍️ RAGアーキテクチャと堅牢性: 設計空間の全体像

論文概要タイトル: Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers 公開日: 2025年6月（arXiv:2506.00054）本論文は、RAGシステムの設計空間を体系的に分類し、アーキテクチャパターン、強化...

15/02/2026 blog paper

RAG architecture robustness +2

✍️ RAG完全サーベイ: 基礎から最先端まで進化の全体像

論文概要タイトル: A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions 著者: Shailja Gupta, Rajesh Ranjan, Surya Narayan Singh 公開日: 2024年10月3...

15/02/2026 blog paper

RAG LLM retrieval +2

📄 論文解説: Large Language Models as Optimizers（OPRO）

論文概要タイトル: Large Language Models as Optimizers 著者: Chengrun Yang, Xuezhi Wang, Yifeng Lu, Hanxiao Liu, Quoc V. Le, Denny Zhou, Xinyun Chen (Google DeepMind) 発表: ICLR 2024 arXiv ID: 2309.03409 提出日:...

15/02/2026 blog paper

prompt-engineering llm optimization +2

📄 論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク

論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク論文概要 AgentBench: Evaluating LLMs as Agents (arXiv:2308.10848, 2023年8月) は、Large Language Model (LLM) をエージェントとして評価するための包括的なベンチマークフレームワークです。従来のLLM評価が自然言語処理タス...

15/02/2026 blog paper

LLM agent benchmark +2

✍️ DeepMind CodeMender解説: AI駆動型コードセキュリティ改善エージェント

1. ブログ概要 DeepMindが2025年に発表したCodeMenderは、コードセキュリティの脆弱性を自動的に検出・修正するAIエージェントシステムです。従来の静的解析ツールやLintが「脆弱性の指摘」に留まるのに対し、CodeMenderは修正パッチの自動生成から検証、アップストリームへの貢献までを実現しています。主要な特徴: Gemini Deep Thinkモデル: ...

15/02/2026 blog tech_blog

AI security code-analysis +2

✍️ AWS ML Blog解説: Amazon Bedrockの構造化出力 - スキーマ準拠AI応答の実現

ブログ概要 Amazon BedrockにStructured Outputs機能が追加され、Foundation ModelsがJSON Schemaに確実に準拠した応答を生成できるようになりました。本機能はConstrained Decodingを使用し、モデルがスキーマ違反を生成することを防ぎます。 Zenn記事ではPydanticによる事後検証を紹介しましたが、Amazon Be...

14/02/2026 blog tech_blog

aws bedrock structured-output +1

1
...
8
9
10
11
9 / 11