本記事は PromptArmor: Simple yet Effective Prompt Injection Defenses (arXiv:2507.15219) の解説記事です。 論文概要(Abstract) 本論文は、LLMエージェントに対するプロンプトインジェクション攻撃を防御するための3段階フレームワーク「PromptArmor」を提案している。著者らは、専用モデルの訓練を必...
本記事は MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents (arXiv:2502.05174) の解説記事です。 論文概要 MELONは、LLMエージェントに対する間接プロンプトインジェクション(IPI)攻撃を検出するための防御フレームワークである。著者らは「攻撃が成功するとエー...
本記事は Securing AI Agents with Information-Flow Control (arXiv:2505.23643) の解説記事です。 論文概要(Abstract) Manuel Costa, Boris Kopf, Aashish Kolluri, Andrew Paverd, Mark Russinovich, Ahmed Salem, Shruti To...
論文概要 本記事は LlamaFirewall: An open source guardrail system for building secure AI agents (arXiv:2505.03574) の解説記事です。 Chennabasappa et al. (2025) は、LLMエージェントに対するプロンプトインジェクション・間接的なプロンプトインジェクション・安全でない...
論文概要 本記事は Defeating Prompt Injections by Design (arXiv:2503.18813) の解説記事です。 著者らは、LLMエージェントに対するプロンプトインジェクション攻撃をアーキテクチャレベルで防御するフレームワーク「CaMeL(CApabilities for MachinE Learning)」を提案している。CaMeLは、LLM自体の...
ブログ概要(Summary) 本記事は Effective cost optimization strategies for Amazon Bedrock の解説記事です。 AWSの公式ブログは、Amazon Bedrockを活用する際の包括的なコスト最適化戦略を体系的に解説している。料金モデルの選択(On-Demand / Batch / Provisioned Throughput)...
論文概要 本記事は https://arxiv.org/abs/2505.16078 の解説記事です。 Li et al. (2025) は、産業用テキスト分類タスクにおける小規模言語モデル(Small Language Models, SLM)の有効性を体系的に調査した論文である。ChatGPTやLlama-3.3-70Bのような大規模デコーダモデルが支配的な現在、実務では「どのモデル...
論文概要(Abstract) 本記事は https://arxiv.org/abs/2602.06370 の解説記事です。 テキスト分類タスクにおいて、ファインチューニングされたBERT系エンコーダモデルとLLMプロンプティング(GPT-4o、Claude Sonnet 4.5)を、予測品質(Macro F1)・推論コスト(USD)・レイテンシ(ms)の3軸で多目的比較した研究である。4...
ブログ概要(Summary) 本記事は https://aws.amazon.com/blogs/machine-learning/customize-amazon-nova-models-with-amazon-bedrock-fine-tuning/ の解説記事です。 AWSの公式ブログでは、Amazon Bedrock上でNovaモデルファミリーをファインチューニングする手法が解説...
本記事は arXiv:2510.18633 の解説記事です。 論文概要(Abstract) Roxana Petcu, Kenton Murray, Daniel Khashabiらによる本論文は、RAG(Retrieval-Augmented Generation)における複合クエリの分解を多腕バンディット(Multi-Armed Bandit, MAB)問題として定式化する。従来のク...