本記事は How Good are LLM-based Rerankers? An Empirical Analysis of State-of-the-Art Reranking Models(Abdallah et al., EMNLP 2025 Findings)の解説記事です。 論文概要(Abstract) 本論文は、LLMベース・軽量コンテキスト型・ゼロショット型を含む最先端の...
本記事は Reflexion: Language Agents with Verbal Reinforcement Learning(Shinn et al., NeurIPS 2023)の解説記事です。 論文概要(Abstract) Reflexionは、大規模言語モデル(LLM)エージェントが勾配更新なしに過去の経験から学習するためのフレームワークである。従来の強化学習がスカラー報酬...
本記事は RouteLLM: Learning to Route LLMs with Preference Data(ICLR 2025採択)の解説記事です。 論文概要(Abstract) RouteLLMは、推論時にクエリの複雑度に応じて強いLLM(GPT-4等)と弱いLLM(Mixtral-8x7B等)を動的に振り分けるルーターモデルの学習フレームワークである。Chatbot Are...
本記事は https://arxiv.org/abs/2312.10997 の解説記事です。本記事は論文の引用・解説であり、筆者自身が実験を行ったものではありません。 論文概要(Abstract) Gao et al. (2023) は、Retrieval-Augmented Generation(RAG)に関する包括的サーベイを提示している。LLMが抱えるハルシネーション、知識の陳腐化...
本記事は Precise Zero-Shot Dense Retrieval without Relevance Labels(Gao et al., 2022)の解説記事です。 論文概要(Abstract) 密検索(Dense Retrieval)はさまざまなタスクで有効性が示されているが、関連度ラベルが利用できないゼロショット環境での構築は依然として困難である。著者らは、クエリから直...
本記事は How Speculative Decoding Boosts vLLM Performance の解説記事です。 ブログ概要(Summary) vLLMプロジェクトが2024年10月に公開した公式ブログでは、vLLMにおける投機的デコーディングの実装アーキテクチャ、サポートする3つの手法(ドラフトモデル方式、Prompt Lookup Decoding、Medusa/EAGL...
論文概要(Abstract) 本記事は arXiv:2406.13352 “AgentDojo: A Dynamic Environment to Evaluate Prompt Injection Attacks and Defenses for LLM Agents” の解説記事です。 AgentDojoは、ツールを利用するLLMエージェントに対するプロンプトインジェクション攻撃と防...
論文概要(Abstract) 本記事は arXiv:2502.11157 “ToolNet: Connecting Large Language Models with Massive Tools via Tool Graph” の解説記事です。 ToolNetは、数百〜数千規模の外部ツールをグラフ構造でモデル化し、LLMエージェントが効率的にツールを選択・連鎖実行できるようにする手法で...
本記事は Fast Inference from Transformers via Speculative Decoding の解説記事です。 論文概要(Abstract) 本論文は、投機的デコーディング(Speculative Decoding)の理論的基盤を確立した原論文の一つである。著者らは、CPUの投機的実行(speculative execution)の概念をLLMの自己回帰生...
ブログ概要(Summary) 本記事は AWS Machine Learning Blog: “Introducing Amazon Bedrock AgentCore Gateway: Transforming enterprise AI agent tool development” および関連記事 Streamline AI agent tool interactions: Conn...