Home
0h-n0 TechBLog
キャンセル

✍️ Anthropic Research解説: Building Effective AI Agents — エージェント設計パターンの実践ガイド

本記事は Building Effective AI Agents(Anthropic Research、2024年12月19日公開)の解説記事です。 ブログ概要(Summary) Anthropicが2024年12月に公開したAIエージェント設計の公式ガイドである。著者のErik SchluntzとBarry Zhangは、数十チームのエージェント構築を支援した経験から、ワークフロー(...

📄 論文解説: Empowering Working Memory for LLM Agents — 作業記憶の動的管理

本記事は Empowering Working Memory for Large Language Model Agents(2024)の解説記事です。 論文概要(Abstract) LLMエージェントにおける作業記憶(Working Memory)は、現在のタスク実行に必要な情報を一時的に保持・操作する認知機能に対応する。本論文は、LLMのコンテキストウィンドウを作業記憶として捉え、そ...

📄 ICDE 2025論文解説: Compound AIシステムのBlueprint Architecture — エージェントとデータのオーケストレーション設計

本記事は Compound AI Systems Blueprint Architecture(ICDE 2025 DAISワークショップ)の解説記事です。 論文概要(Abstract) LLMの産業利用が進む中、単一モデルからCompound AIシステム(複数AIコンポーネントの協調システム)への移行が加速している。著者らは、エンタープライズ環境でエージェントとデータをオーケストレー...

📄 論文解説: RAGBench — 説明可能な4次元メトリクスによるRAGパイプライン評価ベンチマーク

この記事はAIによって生成されたものであり、内容の正確性については読者自身でご確認ください。 論文概要 RAGBench(Friel, Belyi, Sanyal, 2024)は、Retrieval-Augmented Generation(RAG)システムの包括的評価を目的とした大規模ベンチマークデータセットである。著者らは約10万件のラベル付き事例を12のソースデータセットか...

📄 論文解説: Reflexion — 言語エージェントのための言語的強化学習

本記事は Reflexion: Language Agents with Verbal Reinforcement Learning(Shinn et al., NeurIPS 2023)の解説記事です。 論文概要(Abstract) Reflexionは、大規模言語モデル(LLM)エージェントが勾配更新なしに過去の経験から学習するためのフレームワークである。従来の強化学習がスカラー報酬...

📄 ICLR 2025論文解説: RouteLLM — 人間の嗜好データからLLMルーティングを学習する

本記事は RouteLLM: Learning to Route LLMs with Preference Data(ICLR 2025採択)の解説記事です。 論文概要(Abstract) RouteLLMは、推論時にクエリの複雑度に応じて強いLLM(GPT-4等)と弱いLLM(Mixtral-8x7B等)を動的に振り分けるルーターモデルの学習フレームワークである。Chatbot Are...

📄 論文解説: Retrieval-Augmented Generation for Large Language Models — RAGパイプライン設計の体系的整理

本記事は https://arxiv.org/abs/2312.10997 の解説記事です。本記事は論文の引用・解説であり、筆者自身が実験を行ったものではありません。 論文概要(Abstract) Gao et al. (2023) は、Retrieval-Augmented Generation(RAG)に関する包括的サーベイを提示している。LLMが抱えるハルシネーション、知識の陳腐化...

📄 論文解説: Precise Zero-Shot Dense Retrieval without Relevance Labels (HyDE)

本記事は Precise Zero-Shot Dense Retrieval without Relevance Labels(Gao et al., 2022)の解説記事です。 論文概要(Abstract) 密検索(Dense Retrieval)はさまざまなタスクで有効性が示されているが、関連度ラベルが利用できないゼロショット環境での構築は依然として困難である。著者らは、クエリから直...