本記事は arXiv:2503.00455 “SRE-Agent: A Multi-Agent Framework for Automating Site Reliability Engineering Tasks” の解説記事です。 論文概要(Abstract) SRE-Agentは、大規模言語モデル(LLM)を活用してSite Reliability Engineering(SRE)...
本記事は Google Research Blog “SOAR: New algorithms for even faster vector search with ScaNN”(2024年4月10日公開)の解説記事です。対応する論文は arXiv:2404.00774 “SOAR: Improved Indexing for Approximate Nearest Neighbor Sea...
本記事は NVIDIA Technical Blog “Accelerating Vector Search: NVIDIA cuVS IVF-PQ Part 1, Deep Dive” の解説記事です。 ブログ概要(Summary) NVIDIAのcuVS(CUDA Vector Search)ライブラリにおけるIVF-PQ(Inverted File Index with Produ...
本記事は Meta Engineering Blog “Accelerating GPU indexes in Faiss with NVIDIA cuVS”(2025年5月8日公開)の解説記事です。 ブログ概要(Summary) MetaとNVIDIAの共同プロジェクトにより、Faiss v1.10.0にNVIDIA cuVS(CUDA Vector Search)ライブラリが統合され...
本記事は NeurIPS 2019 “DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node” の解説記事です。 論文概要(Abstract) DiskANNは、Microsoft Researchが開発したSSD最適化型の近似最近傍探索(ANN)システムである。著者ら(Subramany...
本記事は arXiv:2502.11593 “Rethinking HNSW: How Much Does It Actually Need?” の解説記事です。 論文概要(Abstract) HNSW(Hierarchical Navigable Small World)グラフは近似最近傍探索(ANN)の事実上の標準アルゴリズムとして広く利用されている。その効率性は階層構造とスモールワ...
本記事は NVIDIA Technical Blog: Securing LLM Systems Against Prompt Injection の解説記事です。 ブログ概要(Summary) NVIDIA AI Red TeamのRich Harang氏が執筆した本ブログでは、LLMフレームワークLangChainに存在した3件の重大な脆弱性(CVE-2023-29374、CVE-2...
本記事は NAACL 2025 Findings: Attention Tracker: Detecting Prompt Injection Attacks in LLMs の解説記事です。 論文概要(Abstract) 本論文は、LLMのアテンション機構を分析することでプロンプトインジェクション攻撃を検出するゼロショット手法「Attention Tracker」を提案している。著者ら...
本記事は NAACL 2025 Findings: Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents の解説記事です。 論文概要(Abstract) LLMエージェントが外部ツール・データを統合する際に生じる間接プロンプトインジェクション(IPI: Indirec...
本記事は NVIDIA Technical Blog: Mitigating Stored Prompt Injection Attacks Against LLM Applications の解説記事です。 ブログ概要(Summary) NVIDIA AI Red TeamのJoseph Lucas氏が執筆したこの技術ブログでは、LLMアプリケーションにおける「Stored Promp...