最近の更新
hallucination 15
- 論文解説: SelfCheckGPT — 外部知識不要のLLM幻覚検出手法 24/03/2026
- 論文解説: RGB Benchmark — RAGに必要な4能力の体系的評価 24/03/2026
- ACL 2024論文解説: RAGTruth — RAGシステムの幻覚検出コーパスと評価手法 24/03/2026
- 論文解説: RAGAS — RAGパイプラインの自動評価フレームワーク 24/03/2026
- 論文解説: ToolBeHonest — ツール使用LLMの幻覚を多層的に診断するベンチマーク 18/03/2026
- テックブログ解説: Sufficient Context — RAGにおけるコンテキスト十分性の新しいレンズ(Google Research / ICLR 2025) 09/03/2026
- EMNLP 2025論文解説: FaithJudge — 人間アノテーション活用のRAG忠実度ベンチマーク 23/02/2026
- 論文解説: Self-RAG — 自己反省トークンによる適応的検索・生成・批評の統合フレームワーク 21/02/2026
- 論文解説: Corrective Retrieval Augmented Generation (CRAG) 20/02/2026
- NeurIPS 2024論文解説: LLM-Check — LLMのHallucination検出手法の体系的評価 17/02/2026
- Amazon Bedrock Automated Reasoningによる数学的LLM出力検証 17/02/2026
- 論文解説: NeMo Guardrails - プログラマブルなLLM安全性制御フレームワーク 17/02/2026
- 論文解説: HaloScope — ラベルなしLLM生成文からのHallucination検出 17/02/2026
- 論文解説: Hallucination Detection and Mitigation - LLMハルシネーションの多面的検出と緩和戦略 14/02/2026
- NeurIPS 2024論文解説: HaloScope - 未ラベルLLM生成データを活用したハルシネーション検出 14/02/2026