📄 WWW 2026論文解説: GraphRAG-R1 — プロセス制約付き強化学習によるグラフRAGの検索・生成結合最適化

本記事は arXiv:2507.23581 (GraphRAG-R1) の解説記事です。論文概要（Abstract） GraphRAG-R1は、知識グラフ（KG）上での検索と推論を強化学習（RL）で結合最適化するフレームワークである。著者らは既存GraphRAGの3つの限界 — 固定検索パイプライン、結果のみに基づく報酬、密部分グラフによるノイズ — に対し、プロセス制約付きRLを提案...

03/06/2026 blog paper

rag graphrag reinforcementlearning +3

📄 論文解説: vLLM — PagedAttentionによるLLMサービングのメモリ効率革新

本記事は arXiv:2309.06180 の解説記事です。論文概要（Abstract） LLMの高スループットサービングには、多数のリクエストを同時にバッチ処理する必要がある。しかし、リクエストごとに必要なKVキャッシュのメモリは巨大かつ動的に増減するため、従来のシステムではメモリの断片化や重複確保によりバッチサイズが制限されていた。著者らはOSの仮想メモリとページング機構に着想を得...

03/06/2026 blog paper

LLM vllm inference +4

📄 論文解説: A2RAG — バイオメディカルQAのための適応的エージェント型グラフRAG

本記事は arXiv:2601.21162 (A2RAG) の解説記事です。論文概要（Abstract） A2RAG (Adaptive Agentic Graph Retrieval Augmented Generation) は、バイオメディカル質問応答（QA）における検索精度向上を目的としたフレームワークである。構造化知識グラフ（KG）と非構造化テキストという異種情報ソースに対し...

03/06/2026 blog paper

rag graphrag reinforcementlearning +3

📄 ASPLOS 2024論文解説: SpotServe — プリエンプティブルインスタンス上のLLMサービングシステム

本記事は arXiv:2311.15566 (SpotServe) の解説記事です。論文概要（Abstract） SpotServeは、プリエンプティブル（Spot）GPUインスタンス上で大規模言語モデル（LLM）の推論サービスを提供する分散システムである。著者らは、Spotインスタンスの突然のプリエンプション（強制終了）に対処するため、動的並列化構成の再調整、Kuhn-Munkres...

03/06/2026 blog paper

LLM spot-instances inference +4

✍️ AWS解説: Amazon Bedrock AgentCoreがCedarを選んだ理由 — エージェントワークフローのポリシー制御

本記事は https://aws.amazon.com/blogs/security/why-policy-in-amazon-bedrock-agentcore-chose-cedar-for-securing-agentic-workflows/ の解説記事です。 2026年5月20日にAWS Security Blogで公開された本記事は、Liana Hadarean氏とJean-B...

02/06/2026 blog tech_blog

AWS Cedar authorization +2

📄 論文解説: マルチエージェント認可の形式モデルMACとベンチマークMAS-AuthBench

本記事は https://arxiv.org/abs/2503.10918 の解説記事です。論文概要 LLMベースのマルチエージェントシステム（MAS）が実世界のタスク自動化に広く活用される一方で、エージェント間の認可（authorization）制御は依然として体系化されていない。著者らは、マルチエージェントシステムにおける認可を形式的に定義するMulti-Agent Capabil...

02/06/2026 blog paper

authorization multi-agent formal-model +2

📄 論文解説: Prompt Injection Attacks in LLMs — 30攻撃×10防御の統一ベンチマーク評価

本記事は https://arxiv.org/abs/2412.16822 の解説記事です。 Guangyu Shen ら（Purdue University, UMass Amherst）による本論文は、LLM に対するプロンプトインジェクション攻撃 30 種と防御手法 10 種を統一的なベンチマーク環境で体系的に評価した研究である。著者らは「単一の防御手法では全攻撃カテゴリをカバーでき...

02/06/2026 blog paper

prompt-injection security LLM +2

✍️ サーベイ解説: Towards Agentic AI Security — エージェントAIセキュリティの脅威タクソノミーと防御戦略

本記事は https://arxiv.org/abs/2506.00130 の解説記事です。論文概要エージェントAI（Agentic AI）は、LLMに計画・ツール利用・記憶・長期的インタラクション機能を統合したシステムとして急速に普及している。しかし、その自律性の高さゆえにセキュリティリスクも従来のAIシステムとは質的に異なるものとなっている。本サーベイ論文「Towards Age...

02/06/2026 blog paper

security multi-agent LLM +2

📄 論文解説: OAuth for LLMs — マルチエージェント向け委任認可フレームワーク

本記事は https://arxiv.org/abs/2504.05765 の解説記事です。論文概要本論文は、Rany Hany、Vijayanand Banahatti、Sachin Lodha（TCS Research）による研究であり、OAuth 2.0およびRFC 8693 Token Exchangeをエージェント委任認可に拡張するフレームワークを提案している。著者らは、既...

02/06/2026 blog paper

OAuth authorization multi-agent +2

📄 論文解説: More Agents Is All You Need — 並列エージェントスケーリングの実証とLangGraph Send APIへの示唆

論文概要（Abstract）本記事は More Agents Is All You Need（Li et al., 2024）の解説記事です。この論文は、LLMエージェントを複数インスタンス並列に実行し、多数決（majority voting）で最終出力を選択するだけで、複雑なワークフロー設計なしに性能が大幅に向上することを実証している。著者らはHumanEval、MBPP（コード生...

01/06/2026 blog paper

agent scaling parallel +5

1
...
19
20
21
...
146
20 / 146