Home
0h-n0 TechBLog
キャンセル

✍️ LangChainブログ解説: Memory for Agents — エージェントメモリの設計パターン

ブログ概要(Summary) LangChain共同創業者のHarrison Chase氏が2024年10月に公開したブログ記事「Memory for Agents」は、エージェントにおけるメモリの役割をProcedural Memory(手続き記憶)、Semantic Memory(意味記憶)、Episodic Memory(エピソード記憶)の3類型に整理し、それぞれの実装戦略を解説した...

✍️ AWSブログ解説: Build Durable AI Agents with LangGraph and Amazon DynamoDB

ブログ概要(Summary) AWS Database Blogが2026年1月に公開した「Build Durable AI Agents with LangGraph and Amazon DynamoDB」は、LangGraphのチェックポイント機構をAmazon DynamoDBで永続化するDynamoDBSaverライブラリの設計と実装を解説したものである。小さなチェックポイント(...

✍️ Anthropicブログ解説: Effective Harnesses for Long-Running Agents — 長時間稼働エージェントの状態管理

ブログ概要(Summary) Anthropicのエンジニア Justin Young氏が2025年11月に公開したブログ記事「Effective Harnesses for Long-Running Agents」は、AIエージェントが複数のコンテキストウィンドウにまたがって長時間動作する際の状態管理・永続化パターンを解説したものである。Initializer Agent(初期セットアッ...

📄 論文解説: Don't Break the Cache — LLMエージェントフレームワークのプロンプトキャッシュ効率を体系評価

本記事は Don’t Break the Cache: An Evaluation of Prompt Caching for Long-Horizon Agentic Tasks の解説記事です。 論文概要(Abstract) LLMのエージェント応用が拡大するなか、マルチターン推論で発生する高コスト・高レイテンシの課題に対し、プロンプトキャッシュ(KVキャッシュの再利用)が有効な最適...

📄 論文解説: Vibe Coding — AIとの対話によるプログラミングの実証分析

論文概要(Abstract) 本論文は、AIとの対話を通じてコードを生成する新しいプログラミング実践「Vibe coding」を、8時間以上の動画データの質的分析によって実証的に明らかにした研究である。著者らは、Vibe codingが「AIプロンプト → コード評価 → 手動編集」の反復サイクルに従うことを発見し、この実践がプログラミング専門知識を不要にするのではなく、コンテキスト管理・...

📄 論文解説: Agentic Retrieval-Augmented Generation — エージェント型RAGアーキテクチャの体系的分類

本記事は arXiv:2501.09136 “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG” の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)は静的な訓練データに依存するため、動的なリアルタイムクエリへの対応に限界がある。従来のRetrieval-Augmented Generat...

📄 論文解説: Ruri — 日本語汎用テキスト埋め込みモデル

論文概要(Abstract) Ruriは、国立情報学研究所(NII)のTsukagoshiらによって提案された日本語汎用テキスト埋め込みモデルである。英語圏で発展した大規模埋め込みモデルの手法を日本語に適用し、弱教師あり事前学習・LLM合成データによる中間学習・教師あり微調整の3段階パイプラインで学習する。著者らは同時に日本語埋め込み評価基盤JMTEB(Japanese Massive T...

📄 論文解説: RouteLLM — 選好データに基づくLLMルーティングでコスト85%削減

本記事は RouteLLM: Learning to Route LLMs with Preference Data (arXiv:2406.18665) の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)は多様なタスクで高い性能を示すが、高性能モデルほど推論コストが高く、すべてのリクエストに高性能モデルを使うのは非効率である。著者らは、人間の選好データを活用して...