Home
0h-n0 TechBLog
キャンセル

📄 MLSys 2024論文解説: Prompt Cache — モジュール式Attentionステート再利用による低レイテンシLLM推論

論文概要 本記事は Prompt Cache: Modular Attention Reuse for Low-Latency Inference(MLSys 2024)の解説記事です。 著者らは、LLMの推論においてプロンプト間で共通するテキストセグメント(システムメッセージ、プロンプトテンプレート、コンテキスト文書など)のAttentionステート(KVキャッシュ)を事前計算・保存し...

✍️ Inside the LLM Call: OpenTelemetry GenAI Semantic Conventionsによるエージェントオブザーバビリティの実践

本記事は Inside the LLM Call: GenAI Observability with OpenTelemetry の解説記事です。 この記事は Zenn記事: マルチエージェント通信のオブザーバビリティ設計:分散トレーシングと障害復旧の実装 の深掘りです。 ブログ概要(Summary) OpenTelemetry公式ブログのこの記事は、GenAI Semantic Co...

✍️ Checkpoints Are Not Durable Execution: LangGraph・CrewAI・Google ADKが本番エージェントワークフローで不足する理由

本記事は Checkpoints Are Not Durable Execution: Why LangGraph, CrewAI, Google ADK, and Others Fall Short for Production Agent Workflows の解説記事です。 この記事は Zenn記事: マルチエージェント通信のオブザーバビリティ設計:分散トレーシングと障害復旧の実装 ...

📄 論文解説: トレースベース品質保証フレームワーク — エージェントAIオーケストレーションの契約・テスト・ガバナンス

本記事は A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance の解説記事です。 この記事は Zenn記事: マルチエージェント通信のオブザーバビリティ設計:分散トレーシングと障害復旧の実装 の深掘りです。 論文概要(Abstract) マルチ...

✍️ AG2 OpenTelemetry Tracing: マルチエージェントシステムの完全なオブザーバビリティを実現する

本記事は AG2 OpenTelemetry Tracing: Full Observability for Multi-Agent Systems の解説記事です。 この記事は Zenn記事: マルチエージェント通信のオブザーバビリティ設計:分散トレーシングと障害復旧の実装 の深掘りです。 ブログ概要(Summary) AG2(AutoGenの後継フレームワーク)は、2026年2月に...

📄 論文解説: AgentTrace — デプロイ済みマルチエージェントシステムの因果グラフトレーシングによる根本原因分析

本記事は AgentTrace: Causal Graph Tracing for Root Cause Analysis in Deployed Multi-Agent Systems の解説記事です。 この記事は Zenn記事: マルチエージェント通信のオブザーバビリティ設計:分散トレーシングと障害復旧の実装 の深掘りです。 論文概要(Abstract) マルチエージェントシステム...

📄 論文解説: Agent Workflow Memory — ワークフロー記憶の蒸留によるエージェント自己改善

本記事は Agent Workflow Memory (arXiv: 2409.02077) の解説記事です。 論文概要(Abstract) Agent Workflow Memory(AWM)は、エージェントの過去のタスク実行から再利用可能な「ワークフロー」を自動的にマイニング・格納・検索するシステムである。ワークフローとは、特定のタスクタイプを解決するための行動シーケンスを構造化・抽...

📄 論文解説: MemoryOS — AIエージェント用メモリオペレーティングシステムの3層階層設計

本記事は MemoryOS: A Memory Operating System for AI Agent (arXiv: 2504.01990) の解説記事です。 論文概要(Abstract) MemoryOSは、AIエージェントのメモリを短期(Short-term)・中期(Mid-term)・長期(Long-term)の3層で階層的に管理するメモリオペレーティングシステムである。各層...

✍️ AWS Blog解説: LangGraphとDynamoDBで構築するDurable AIエージェント — チェックポイントによる耐障害性設計

本記事は Build durable AI agents with LangGraph and Amazon DynamoDB (AWS Database Blog) の解説記事です。 ブログ概要(Summary) AWS Database Blogが2026年1月に公開したこの記事は、LangGraphエージェントの状態永続化にDynamoDBを使用するDynamoDBSaverチェッ...