最近の更新
LLM-security 15
- 論文解説: Quantifying PII Leakage in LLMs — 三層PII分類とSILSメトリクスによるLLMプライバシーリスクの定量化 30/03/2026
- 論文解説: Defeating Prompt Injections by Design — CaMeLアーキテクチャによる設計レベルのプロンプトインジェクション防御 30/03/2026
- Microsoft MSRCの間接プロンプトインジェクション防御戦略:Spotlighting・Prompt Shields・決定論的緩和の多層防御 17/03/2026
- 論文解説: ToolHijacker — LLMエージェントのツール選択に対するプロンプトインジェクション攻撃 17/03/2026
- NVIDIA AI Red Team解説: セマンティックプロンプトインジェクション — 視覚的記号でAIガードレールを突破する新手法 12/03/2026
- Meta AI解説: LlamaFirewall — AIエージェント向けオープンソースガードレールシステム 12/03/2026
- NAACL 2025論文解説: Attention Tracker — 訓練不要のプロンプトインジェクション検出 12/03/2026
- 論文解説: Prompt Injection Attacks and Defenses in LLM-Integrated Applications 12/03/2026
- ACL 2025論文解説: PIGuard — 過剰防御を抑制するプロンプトインジェクション検出 12/03/2026
- NVIDIA技術ブログ解説: LangChainのプロンプトインジェクション脆弱性3件とLLMセキュリティの教訓 01/03/2026
- NAACL 2025論文解説: Attention Tracker — アテンション解析によるプロンプトインジェクション検出 01/03/2026
- NAACL 2025論文解説: Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents 01/03/2026
- NVIDIA技術ブログ解説: Stored Prompt Injectionの脅威とLLMアプリケーション防御戦略 01/03/2026
- 論文解説: Prompt Injection Attacks and Defenses in LLM-Integrated Applications 01/03/2026
- 論文解説: The Instruction Hierarchy — LLMに命令の優先順位を学習させる 24/02/2026