Home
0h-n0 TechBLog
キャンセル

✍️ OpenTelemetry公式ブログ解説: AIエージェント可観測性の標準化と2つの計装アプローチ

ブログ概要 AIエージェントが本番環境で増加するなか、可観測性(Observability)の標準化が急務となっている。OpenTelemetry公式ブログに掲載された本記事では、Guangya Liu(IBM)とSujay Solomon(Google)が、AIエージェントの可観測性を確保するための2つの計装アプローチ(Baked-InとExternal)を比較し、フレームワーク開発者・...

📄 論文解説: Towards Model-Native Agentic AI — パイプライン型からモデルネイティブ型へのパラダイムシフト

本記事は Towards Model-Native Agentic AI(2025)の解説記事です。 論文概要(Abstract) 本論文は、AIエージェントアーキテクチャが「Pipeline-based(パイプライン型)」から「Model-Native(モデルネイティブ型)」へ移行しつつあるパラダイムシフトを体系的に分析している。Pipeline-based型では計画・ツール使用・メモ...

📄 論文解説: Navigating MLOps — 統一ライフサイクルフレームワークとLLMOps統合

本記事は Navigating MLOps: Insights into Maturity, Lifecycle, Tools, and Careers(2025年3月公開)の解説記事です。 論文概要(Abstract) MLOps(Machine Learning Operations)の採用は産業界で急速に拡大しているが、業界・学術界・各組織が提案するライフサイクルフレームワークや成...

✍️ OpenTelemetry公式ブログ解説: LLMアプリケーションの可観測性設計パターン

ブログ概要 Ishan Jain(Grafana)は、OpenTelemetry公式ブログにおいて、LLMベースアプリケーションに対する可観測性の設計パターンを解説している。従来のWebアプリケーション監視とは異なり、LLMアプリケーションではトークン消費量・コスト追跡・可変レイテンシ・外部APIレートリミットといった固有の監視課題がある。本ブログでは、OpenTelemetry Coll...

✍️ BAIR Blog解説: The Shift from Models to Compound AI Systems — モノリシックモデルから複合AIへの転換

本記事は The Shift from Models to Compound AI Systems(BAIR Blog、2024年2月18日公開)の解説記事です。 ブログ概要(Summary) UC Berkeley AIリサーチ(BAIR)グループが2024年2月に公開した、Compound AI Systemsの概念を提唱するブログ記事である。著者のMatei Zaharia(Dat...

📄 ACL 2025論文解説: SetR — ランキングから集合選択へ、RAG検索のパラダイムシフト

本記事は Shifting from Ranking to Set Selection for Retrieval Augmented Generation(Lee et al., ACL 2025)の解説記事です。 論文概要(Abstract) 従来のRAGパイプラインでは、検索結果の順位付け(ランキング)に基づいてLLMに渡すパッセージを選択する。著者らはこのアプローチの限界を指摘し...

📄 ACL 2024論文解説: When is Tree Search Useful for LLM Planning? — 木探索の有効性条件

本記事は When is Tree Search Useful for LLM Planning? It Depends on the Discriminator(Chen et al., ACL 2024)の解説記事です。 論文概要(Abstract) LLMが多段階の問題を解く際に、木探索(Tree Search)がどのような条件下で有効かを分析した論文である。著者らは、LLMベース...

✍️ Anthropic Contextual Retrieval解説: チャンクへのコンテキスト付与でRAG検索精度を67%改善

本記事は Introducing Contextual Retrieval(Anthropic, 2024年9月)の解説記事です。 ブログ概要(Summary) Anthropicは、RAG(Retrieval-Augmented Generation)パイプラインにおける検索精度の課題を解決するためにContextual Retrievalを提案している。従来のチャンク分割では文書全体...