📄 論文解説: Agent Workflow Memory — ワークフロー記憶の有向グラフ表現とLangGraph Checkpointerへの示唆

論文概要（Abstract）本記事は Agent Workflow Memory（Zhu et al., 2024）の解説記事です。 Agent Workflow Memory（AWM）は、LLMエージェントが過去に成功したタスク実行から「再利用可能なワークフロースニペット」を抽出・記憶し、新しいタスクに適用するフレームワークである。ワークフローは有向グラフ構造（ノード=アクション、エ...

01/06/2026 blog paper

agent workflow memory +4

✍️ LangChain公式ブログ解説: LangGraph Multi-Agent Workflows — 3パターンのマルチエージェント設計

本記事は LangChain公式ブログ: LangGraph Multi-Agent Workflows（2024年1月23日公開）の解説記事です。ブログ概要（Summary） LangChainチームは2024年1月、LangGraphを用いたマルチエージェントシステムの設計パターンを3種類に分類したブログ記事を公開した。著者らはマルチエージェントシステムを「言語モデルで駆動される複...

01/06/2026 blog tech_blog

LangGraph LangChain multi-agent +4

📄 論文解説: ReAct — LLMにおける推論と行動の統合がLangGraphの設計基盤になるまで

論文概要（Abstract）本記事は ReAct: Synergizing Reasoning and Acting in Language Models（Yao et al., 2022）の解説記事です。 ReActは、大規模言語モデル（LLM）に推論トレース（Thought）とタスク固有の行動（Action）を交互に生成させるプロンプトフレームワークである。従来のChain-of-...

01/06/2026 blog paper

ReAct LLM agent +5

✍️ Anthropic公式ブログ解説: Building Effective Agents — 5つのワークフローパターンとLangGraph 1.2への対応

本記事は Anthropic公式ブログ: Building Effective AI Agents（2024年12月19日公開）の解説記事です。ブログ概要（Summary） Anthropicは2024年12月、AIエージェント構築に関する包括的なガイド「Building Effective Agents」を公開した。このブログ記事では、LLMを用いたシステムを「ワークフロー」と「エー...

01/06/2026 blog tech_blog

agent LLM architecture +5

✍️ Vespa公式解説: Matryoshka × Binary Quantization — ベクトル検索コストを64倍削減する実装手法

本記事は Vespa公式ブログ: Matryoshka + Binary vectors: Slash vector search costs with Vespa の解説記事です。ブログ概要（Summary） Vespa社のChief ScientistであるJo Kristian Bergum氏による本ブログ記事は、Matryoshka Representation Learnin...

31/05/2026 blog tech_blog

vespa vectordb matryoshka +3

📄 ICML 2025論文解説: EPD Disaggregation — マルチモーダルモデルの推論を3ステージに分離して効率化

論文概要本記事は、ICML 2025に採択された論文「Efficiently Serving Large Multimodal Models Using EPD Disaggregation」（Singh et al.）の解説記事です。著者自身が実験を行ったわけではなく、論文の内容を引用・解説しています。 Large Multimodal Model（LMM）はテキストに加えて画像・動...

31/05/2026 blog paper

multimodal llm-serving inference-optimization +2

✍️ Qdrant公式解説: Binary Quantization — ベクトル検索を40倍高速化する量子化手法

本記事は Qdrant公式ブログ: Binary Quantization — Vector Search, 40x Faster の解説記事です。ブログ概要（Summary） Qdrant社のNirant Kasliwal氏による本ブログ記事は、Binary Quantization（BQ）をQdrantベクトルDBに実装した際の技術的詳細とベンチマーク結果を報告している。BQはfl...

31/05/2026 blog tech_blog

qdrant vectordb binary-quantization +3

✍️ Google Cloud公式ブログ解説: Cloud Runのstartup CPU boostでコールドスタートを最大50%削減

本記事について本記事は、Google Cloudの公式ブログ記事 New startup CPU boost improves cold starts in Cloud Run, Cloud Functions（著者: Steren Giannini氏、Google Cloud Director of Product Management、2022年9月27日公開）の技術解説記事です。本...

31/05/2026 blog tech_blog

cloud-run cold-start gcp +2

📄 論文解説: RAGシステムのEmbeddingストレージ最適化 — 量子化×次元削減の体系的評価

本記事は Optimization of embeddings storage for RAG systems using quantization and dimensionality reduction techniques (arXiv:2505.00105) の解説記事です。論文概要（Abstract）本論文は、RAG（Retrieval-Augmented Generati...

31/05/2026 blog paper

embedding quantization rag +3

📄 ICDCS 2025論文解説: SlimStart — プロファイルガイド最適化によるサーバーレスコールドスタート削減

論文概要本記事は、ICDCS 2025（45th IEEE International Conference on Distributed Computing Systems）に採択された論文 “Efficient Serverless Cold Start: Reducing Library Loading Overhead by Profile-guided Optimization...

31/05/2026 blog paper

serverless cold-start profile-guided-optimization +2

1
...
20
21
22
...
146
21 / 146