最近の更新
efficiency 7
- 論文解説: M-RAG — チャンクフリー検索戦略でRAGの情報断片化を解消 02/07/2026
- 論文解説: Reasoning Under Adaptive Budgets — LLMの推論効率化サーベイ 09/05/2026
- 論文解説: Think, But Don't Overthink — LLM推論における過剰思考の抑制と動的トークン予算制御 26/04/2026
- 論文解説: Matryoshka Representation Learning — 可変次元埋め込みで検索コストを1/14に削減する 04/03/2026
- 論文解説: ReWOO — 観察を分離した効率的エージェント推論でトークン消費を大幅削減 24/02/2026
- 論文解説: Optima — LLMベースマルチエージェントシステムの効果と効率を同時最適化するフレームワーク 22/02/2026
- 論文解説: Continual Quantization-Aware Pre-Training — 16-bitから1.58-bitへの最適移行戦略 17/02/2026