最近の更新
prompt-injection 25
- 論文解説: Defeating Prompt Injections by Design — CaMeLアーキテクチャによる設計レベルのプロンプトインジェクション防御 30/03/2026
- Unit 42セキュリティレポート解説: MCPサンプリング経由の新しいプロンプトインジェクション攻撃ベクトル 17/03/2026
- 論文解説: AgentDojo — LLMエージェントのプロンプトインジェクション攻防を動的に評価するフレームワーク 17/03/2026
- 論文解説: InjecAgent — ツール統合LLMエージェントに対する間接プロンプトインジェクションのベンチマーク 17/03/2026
- Microsoft MSRCの間接プロンプトインジェクション防御戦略:Spotlighting・Prompt Shields・決定論的緩和の多層防御 17/03/2026
- 論文解説: ToolHijacker — LLMエージェントのツール選択に対するプロンプトインジェクション攻撃 17/03/2026
- 論文解説: AgentDojo — LLMエージェントのプロンプトインジェクション攻撃・防御を動的に評価するフレームワーク 13/03/2026
- MCP セキュリティリスク解説: Plug, Play, and Prey — Microsoft Defender チームの分析 13/03/2026
- NVIDIA AI Red Team解説: セマンティックプロンプトインジェクション — 視覚的記号でAIガードレールを突破する新手法 12/03/2026
- Meta AI解説: LlamaFirewall — AIエージェント向けオープンソースガードレールシステム 12/03/2026
- NAACL 2025論文解説: Attention Tracker — 訓練不要のプロンプトインジェクション検出 12/03/2026
- 論文解説: Prompt Injection Attacks and Defenses in LLM-Integrated Applications 12/03/2026
- ACL 2025論文解説: PIGuard — 過剰防御を抑制するプロンプトインジェクション検出 12/03/2026
- 論文解説: LlamaFirewall — Metaが提案するLLMエージェント向けオープンソースガードレールシステム 11/03/2026
- 論文解説: MCP Safety Audit — MCPエコシステムのセキュリティ脅威分類とLLM脆弱性評価 08/03/2026
- NVIDIA技術ブログ解説: LangChainのプロンプトインジェクション脆弱性3件とLLMセキュリティの教訓 01/03/2026
- NAACL 2025論文解説: Attention Tracker — アテンション解析によるプロンプトインジェクション検出 01/03/2026
- NAACL 2025論文解説: Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents 01/03/2026
- NVIDIA技術ブログ解説: Stored Prompt Injectionの脅威とLLMアプリケーション防御戦略 01/03/2026
- 論文解説: Prompt Injection Attacks and Defenses in LLM-Integrated Applications 01/03/2026
- 論文解説: The Instruction Hierarchy — LLMに命令の優先順位を学習させる 24/02/2026
- Anthropic解説: Mitigating Prompt Injections in Browser Use — 強化学習による防御の最前線 21/02/2026
- 論文解説: Not What You've Signed Up For — 間接プロンプトインジェクションの体系的脅威分析 21/02/2026
- 論文解説: Prompt Injection Attacks on Agentic Coding Assistants — 5製品の実証評価 21/02/2026
- Anthropic研究解説: プロンプトインジェクション防御の最前線 15/02/2026