- 📄 論文解説: ToolBeHonest — ツール使用LLMの幻覚を多層的に診断するベンチマーク
- 📄 論文解説: Learning to Rewrite Tool Descriptions for Reliable LLM-Agent Tool Use
- 📄 論文解説: LLM Agents Making Agent Tools — 研究論文からツールを自動構築するToolMaker
- 📄 論文解説: ToolACE — LLM Function Calling訓練データの自動生成パイプライン
- 📄 論文解説: Efficient Tool Use with Chain-of-Abstraction Reasoning
本記事は ToolBeHonest: A Multi-level Hallucination Diagnostic Benchmark for Tool-Augmented Large Language Models の解説記事です。 論文概要(Abstract) ToolBeHonestは、ツール拡張LLMにおける幻覚(Hallucination)問題を多層的に診断するベンチマークであ...