- 📄 論文解説: From Spark to Fire — Error Cascades and Failure Attribution in Multi-Agent Systems
- 📄 論文解説: Which Agent Causes Task Failures and When? — マルチエージェントLLMの自動障害帰属
- 📄 論文解説: A Survey of AI Agent Protocols
- 📄 論文解説: Beyond Task Completion — エージェントAI評価の4柱フレームワーク
- ✍️ OpenTelemetry公式ブログ解説: Inside the LLM Call — GenAI Observability with OpenTelemetry
本記事は RAGAS: Automated Evaluation of Retrieval Augmented Generation (Es et al., 2023) の解説記事です。 論文概要(Abstract) Retrieval Augmented Generation(RAG)システムの品質評価は、検索コンポーネントと生成コンポーネントの両方を考慮する必要があり、従来の手法では...