ブログ概要 AIエージェントが本番環境で増加するなか、可観測性(Observability)の標準化が急務となっている。OpenTelemetry公式ブログに掲載された本記事では、Guangya Liu(IBM)とSujay Solomon(Google)が、AIエージェントの可観測性を確保するための2つの計装アプローチ(Baked-InとExternal)を比較し、フレームワーク開発者・...
本記事は Towards Model-Native Agentic AI(2025)の解説記事です。 論文概要(Abstract) 本論文は、AIエージェントアーキテクチャが「Pipeline-based(パイプライン型)」から「Model-Native(モデルネイティブ型)」へ移行しつつあるパラダイムシフトを体系的に分析している。Pipeline-based型では計画・ツール使用・メモ...
本記事は Navigating MLOps: Insights into Maturity, Lifecycle, Tools, and Careers(2025年3月公開)の解説記事です。 論文概要(Abstract) MLOps(Machine Learning Operations)の採用は産業界で急速に拡大しているが、業界・学術界・各組織が提案するライフサイクルフレームワークや成...
本記事は Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever(Jha et al., MRL 2024)の解説記事です。 論文概要(Abstract) 著者らは、ColBERTのLate Interaction機構を多言語・汎用のリトリーバーとして改良したJina-ColBERT-v2を提案...
ブログ概要 Ishan Jain(Grafana)は、OpenTelemetry公式ブログにおいて、LLMベースアプリケーションに対する可観測性の設計パターンを解説している。従来のWebアプリケーション監視とは異なり、LLMアプリケーションではトークン消費量・コスト追跡・可変レイテンシ・外部APIレートリミットといった固有の監視課題がある。本ブログでは、OpenTelemetry Coll...
本記事は The Shift from Models to Compound AI Systems(BAIR Blog、2024年2月18日公開)の解説記事です。 ブログ概要(Summary) UC Berkeley AIリサーチ(BAIR)グループが2024年2月に公開した、Compound AI Systemsの概念を提唱するブログ記事である。著者のMatei Zaharia(Dat...
本記事は Shifting from Ranking to Set Selection for Retrieval Augmented Generation(Lee et al., ACL 2025)の解説記事です。 論文概要(Abstract) 従来のRAGパイプラインでは、検索結果の順位付け(ランキング)に基づいてLLMに渡すパッセージを選択する。著者らはこのアプローチの限界を指摘し...
本記事は When is Tree Search Useful for LLM Planning? It Depends on the Discriminator(Chen et al., ACL 2024)の解説記事です。 論文概要(Abstract) LLMが多段階の問題を解く際に、木探索(Tree Search)がどのような条件下で有効かを分析した論文である。著者らは、LLMベース...
本記事は Benchmarking Haystack Pipelines for Optimal Performance(deepset公式ブログ、2024年6月24日公開)の解説記事です。 ブログ概要(Summary) deepset社のSenior NLP EngineerであるDavid Batistaは、Haystack 2.xのRAGパイプラインを系統的にベンチマークする手法と...
本記事は Introducing Contextual Retrieval(Anthropic, 2024年9月)の解説記事です。 ブログ概要(Summary) Anthropicは、RAG(Retrieval-Augmented Generation)パイプラインにおける検索精度の課題を解決するためにContextual Retrievalを提案している。従来のチャンク分割では文書全体...