- 📄 論文解説: Benchmarking Large Language Models for Vulnerability Detection — LLM脆弱性検出の定量評価
- ✍️ Anthropic解説: Mitigating Prompt Injections in Browser Use — 強化学習による防御の最前線
- 📄 論文解説: Not What You've Signed Up For — 間接プロンプトインジェクションの体系的脅威分析
- 📄 論文解説: Prompt Injection Attacks on Agentic Coding Assistants — 5製品の実証評価
- ✍️ NVIDIA解説: リランキングマイクロサービスによるRAG精度向上とコスト削減の両立
論文概要(Abstract) LLMを用いたコード脆弱性検出は、従来のSAST(静的アプリケーションセキュリティテスト)ツールを補完する有望なアプローチとして注目されている。本論文は、CVEデータベースの実脆弱性コードを用いてGPT-4、Claude-3-Opus、Gemini等の主要LLMの脆弱性検出能力を体系的にベンチマーク評価した研究である。Zero-shot、Few-shot、Co...