論文概要(Abstract) 本記事は arXiv:2403.02817 の解説記事です。 InjecAgentは、ツール統合LLMエージェントに対する間接プロンプトインジェクション(Indirect Prompt Injection, IPI) を体系的に評価する初の専用ベンチマークである。著者らは攻撃を「ユーザー目的妨害」と「悪意あるツール実行」の2つのカテゴリに分類し、17種のツー...
論文概要(Abstract) 言語モデル(LM)はゼロショット設定で高い能力を示すが、算術計算や事実検索、時間的推論といった基本タスクでは依然として課題がある。Toolformerは、LMがAPI呼び出しを自律的に学習する手法であり、自己教師あり方式でいつ・どのツールを・どの引数で呼び出すかを判断できるモデルを構築する。著者らの報告によると、6.7BパラメータのToolformerがGPT...
ブログ概要(Summary) 本記事は Microsoft MSRC Blog: How Microsoft Defends Against Indirect Prompt Injection Attacks(2025年7月29日公開、著者: Andrew Paverd)の解説記事です。 Microsoftは間接プロンプトインジェクション(Indirect PI)に対する多層防御戦略を公...
本記事は Anthropic Blog: Prompt caching with Claude(2024年8月14日公開、2024年12月17日GA)の解説記事です。 ブログ概要(Summary) AnthropicはClaude APIにPrompt Caching機能を導入し、APIリクエスト間で共通するプロンプト部分をサーバー側でキャッシュして再利用する仕組みを提供している。公式ブ...
本記事は Anthropic Engineering Blog: Introducing advanced tool use on the Claude Developer Platform(2025年11月24日公開)の解説記事です。 ブログ概要(Summary) Anthropicは2025年11月にClaude Developer Platformへ3つのAdvanced Tool...
論文概要(Abstract) 本記事は arXiv:2504.19793 の解説記事です。 ToolHijackerは、LLMエージェントのツール選択パイプラインに対する新たなプロンプトインジェクション攻撃手法である。著者らは、攻撃者がツールライブラリに悪意あるツールドキュメントを注入し、LLMエージェントに正規ツールの代わりに悪意あるツールを選択させる手法を提案している。攻撃をドキュメ...
本記事は EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees (arXiv:2406.14066) の解説記事です。 論文概要(Abstract) 本論文は、Speculative Decodingの改良手法EAGLE-2を提案している。先行手法EAGLE-1(1層のAutoregressive He...
本記事は Fast Inference from Transformers via Speculative Decoding (arXiv:2211.17192) の解説記事です。 論文概要(Abstract) 本論文は、LLMの自己回帰推論を高速化するSpeculative Decoding(投機的デコーディング)を提案している。小さなドラフトモデル(draft model)でK個のト...
本記事は Orca: A Distributed Serving System for Transformer-Based Generative Models の解説記事です。 論文概要(Abstract) 本論文は、Transformerベースの生成モデルのサービングにおけるスケジューリング問題に対し、Continuous Batching(別名: iteration-level sc...
本記事は Efficiently Programming Large Language Models using SGLang (arXiv:2312.07910) の解説記事です。 論文概要(Abstract) 本論文は、LLMの呼び出しを効率的にプログラミングするためのフロントエンドDSL(SGLang言語)と、バックエンドのKVキャッシュ再利用最適化(RadixAttention)...