- 📄 論文解説: Reflexion — 言語エージェントのための言語的強化学習
- 📄 ICLR 2025論文解説: RouteLLM — 人間の嗜好データからLLMルーティングを学習する
- 📄 論文解説: Retrieval-Augmented Generation for Large Language Models — RAGパイプライン設計の体系的整理
- 📄 論文解説: Precise Zero-Shot Dense Retrieval without Relevance Labels (HyDE)
- ✍️ vLLM公式ブログ解説: How Speculative Decoding Boosts vLLM Performance — 実装と性能評価
本記事は Reflexion: Language Agents with Verbal Reinforcement Learning(Shinn et al., NeurIPS 2023)の解説記事です。 論文概要(Abstract) Reflexionは、大規模言語モデル(LLM)エージェントが勾配更新なしに過去の経験から学習するためのフレームワークである。従来の強化学習がスカラー報酬...