Home
0h-n0 TechBLog
キャンセル

📄 論文解説: マルチエージェント認可の形式モデルMACとベンチマークMAS-AuthBench

本記事は https://arxiv.org/abs/2503.10918 の解説記事です。 論文概要 LLMベースのマルチエージェントシステム(MAS)が実世界のタスク自動化に広く活用される一方で、エージェント間の認可(authorization)制御は依然として体系化されていない。著者らは、マルチエージェントシステムにおける認可を形式的に定義するMulti-Agent Capabil...

📄 論文解説: Prompt Injection Attacks in LLMs — 30攻撃×10防御の統一ベンチマーク評価

本記事は https://arxiv.org/abs/2412.16822 の解説記事です。 Guangyu Shen ら(Purdue University, UMass Amherst)による本論文は、LLM に対するプロンプトインジェクション攻撃 30 種と防御手法 10 種を統一的なベンチマーク環境で体系的に評価した研究である。著者らは「単一の防御手法では全攻撃カテゴリをカバーでき...

✍️ サーベイ解説: Towards Agentic AI Security — エージェントAIセキュリティの脅威タクソノミーと防御戦略

本記事は https://arxiv.org/abs/2506.00130 の解説記事です。 論文概要 エージェントAI(Agentic AI)は、LLMに計画・ツール利用・記憶・長期的インタラクション機能を統合したシステムとして急速に普及している。しかし、その自律性の高さゆえにセキュリティリスクも従来のAIシステムとは質的に異なるものとなっている。本サーベイ論文「Towards Age...

📄 論文解説: OAuth for LLMs — マルチエージェント向け委任認可フレームワーク

本記事は https://arxiv.org/abs/2504.05765 の解説記事です。 論文概要 本論文は、Rany Hany、Vijayanand Banahatti、Sachin Lodha(TCS Research)による研究であり、OAuth 2.0およびRFC 8693 Token Exchangeをエージェント委任認可に拡張するフレームワークを提案している。著者らは、既...

📄 論文解説: More Agents Is All You Need — 並列エージェントスケーリングの実証とLangGraph Send APIへの示唆

論文概要(Abstract) 本記事は More Agents Is All You Need(Li et al., 2024)の解説記事です。 この論文は、LLMエージェントを複数インスタンス並列に実行し、多数決(majority voting)で最終出力を選択するだけで、複雑なワークフロー設計なしに性能が大幅に向上することを実証している。著者らはHumanEval、MBPP(コード生...

📄 論文解説: Agent Workflow Memory — ワークフロー記憶の有向グラフ表現とLangGraph Checkpointerへの示唆

論文概要(Abstract) 本記事は Agent Workflow Memory(Zhu et al., 2024)の解説記事です。 Agent Workflow Memory(AWM)は、LLMエージェントが過去に成功したタスク実行から「再利用可能なワークフロースニペット」を抽出・記憶し、新しいタスクに適用するフレームワークである。ワークフローは有向グラフ構造(ノード=アクション、エ...

✍️ LangChain公式ブログ解説: LangGraph Multi-Agent Workflows — 3パターンのマルチエージェント設計

本記事は LangChain公式ブログ: LangGraph Multi-Agent Workflows(2024年1月23日公開)の解説記事です。 ブログ概要(Summary) LangChainチームは2024年1月、LangGraphを用いたマルチエージェントシステムの設計パターンを3種類に分類したブログ記事を公開した。著者らはマルチエージェントシステムを「言語モデルで駆動される複...

📄 論文解説: ReAct — LLMにおける推論と行動の統合がLangGraphの設計基盤になるまで

論文概要(Abstract) 本記事は ReAct: Synergizing Reasoning and Acting in Language Models(Yao et al., 2022)の解説記事です。 ReActは、大規模言語モデル(LLM)に推論トレース(Thought)とタスク固有の行動(Action)を交互に生成させるプロンプトフレームワークである。従来のChain-of-...

✍️ Anthropic公式ブログ解説: Building Effective Agents — 5つのワークフローパターンとLangGraph 1.2への対応

本記事は Anthropic公式ブログ: Building Effective AI Agents(2024年12月19日公開)の解説記事です。 ブログ概要(Summary) Anthropicは2024年12月、AIエージェント構築に関する包括的なガイド「Building Effective Agents」を公開した。このブログ記事では、LLMを用いたシステムを「ワークフロー」と「エー...