📄 EMNLP 2025論文解説: How Good are LLM-based Rerankers? — リランキングモデルの実証分析

本記事は How Good are LLM-based Rerankers? An Empirical Analysis of State-of-the-Art Reranking Models（Abdallah et al., EMNLP 2025 Findings）の解説記事です。論文概要（Abstract）本論文は、LLMベース・軽量コンテキスト型・ゼロショット型を含む最先端の...

14/03/2026 blog paper

reranking LLM cross-encoder +5

📄 論文解説: Reflexion — 言語エージェントのための言語的強化学習

本記事は Reflexion: Language Agents with Verbal Reinforcement Learning（Shinn et al., NeurIPS 2023）の解説記事です。論文概要（Abstract） Reflexionは、大規模言語モデル（LLM）エージェントが勾配更新なしに過去の経験から学習するためのフレームワークである。従来の強化学習がスカラー報酬...

14/03/2026 blog paper

agent llm reinforcement-learning +2

📄 ICLR 2025論文解説: RouteLLM — 人間の嗜好データからLLMルーティングを学習する

本記事は RouteLLM: Learning to Route LLMs with Preference Data（ICLR 2025採択）の解説記事です。論文概要（Abstract） RouteLLMは、推論時にクエリの複雑度に応じて強いLLM（GPT-4等）と弱いLLM（Mixtral-8x7B等）を動的に振り分けるルーターモデルの学習フレームワークである。Chatbot Are...

14/03/2026 blog paper

LLM model-routing cost-optimization +4

📄 論文解説: Retrieval-Augmented Generation for Large Language Models — RAGパイプライン設計の体系的整理

本記事は https://arxiv.org/abs/2312.10997 の解説記事です。本記事は論文の引用・解説であり、筆者自身が実験を行ったものではありません。論文概要（Abstract） Gao et al. (2023) は、Retrieval-Augmented Generation（RAG）に関する包括的サーベイを提示している。LLMが抱えるハルシネーション、知識の陳腐化...

14/03/2026 blog paper

RAG retrieval LLM +2

📄 論文解説: Precise Zero-Shot Dense Retrieval without Relevance Labels (HyDE)

本記事は Precise Zero-Shot Dense Retrieval without Relevance Labels（Gao et al., 2022）の解説記事です。論文概要（Abstract）密検索（Dense Retrieval）はさまざまなタスクで有効性が示されているが、関連度ラベルが利用できないゼロショット環境での構築は依然として困難である。著者らは、クエリから直...

14/03/2026 blog paper

HyDE dense-retrieval zero-shot +5

✍️ vLLM公式ブログ解説: How Speculative Decoding Boosts vLLM Performance — 実装と性能評価

本記事は How Speculative Decoding Boosts vLLM Performance の解説記事です。ブログ概要（Summary） vLLMプロジェクトが2024年10月に公開した公式ブログでは、vLLMにおける投機的デコーディングの実装アーキテクチャ、サポートする3つの手法（ドラフトモデル方式、Prompt Lookup Decoding、Medusa/EAGL...

13/03/2026 blog tech_blog

vllm speculative-decoding LLM +4

📄 論文解説: AgentDojo — LLMエージェントのプロンプトインジェクション攻撃・防御を動的に評価するフレームワーク

論文概要（Abstract）本記事は arXiv:2406.13352 “AgentDojo: A Dynamic Environment to Evaluate Prompt Injection Attacks and Defenses for LLM Agents” の解説記事です。 AgentDojoは、ツールを利用するLLMエージェントに対するプロンプトインジェクション攻撃と防...

13/03/2026 blog paper

mcp security prompt-injection +3

📄 論文解説: ToolNet — グラフ構造による大規模ツール管理でLLMエージェントのツール選択を効率化

論文概要（Abstract）本記事は arXiv:2502.11157 “ToolNet: Connecting Large Language Models with Massive Tools via Tool Graph” の解説記事です。 ToolNetは、数百〜数千規模の外部ツールをグラフ構造でモデル化し、LLMエージェントが効率的にツールを選択・連鎖実行できるようにする手法で...

13/03/2026 blog paper

mcp tool-use graph +3

📄 論文解説: Fast Inference from Transformers via Speculative Decoding — 投機的デコーディングの原論文

本記事は Fast Inference from Transformers via Speculative Decoding の解説記事です。論文概要（Abstract）本論文は、投機的デコーディング（Speculative Decoding）の理論的基盤を確立した原論文の一つである。著者らは、CPUの投機的実行（speculative execution）の概念をLLMの自己回帰生...

13/03/2026 blog paper

speculative-decoding LLM inference +3

✍️ Amazon Bedrock AgentCore Gateway 解説: AWS によるマネージド MCP Gateway の設計と機能

ブログ概要（Summary）本記事は AWS Machine Learning Blog: “Introducing Amazon Bedrock AgentCore Gateway: Transforming enterprise AI agent tool development” および関連記事 Streamline AI agent tool interactions: Conn...

13/03/2026 blog tech_blog

mcp aws bedrock +4

1
...
89
90
91
...
151
90 / 151