最近の更新
cost optimization 8
- LLMトークン最適化: セマンティックキャッシュとプロンプト圧縮によるコスト・レイテンシ削減 05/03/2026
- EMNLP 2025論文解説: RouterEval — LLMルーティング戦略の包括的ベンチマーク 05/03/2026
- 論文解説: AdaptiveRAG — クエリ複雑度分類器でRAG構成を動的適応し35%コスト削減 24/02/2026
- 論文解説: プロンプトキャッシュ戦略の体系的分析 — Claude/GPT-4/GeminiのAPIコスト60-80%削減 24/02/2026
- 論文解説: FrugalGPT — LLMカスケード・プロンプト適応・近似の3戦略で最大98%コスト削減 24/02/2026
- 論文解説: RouteLLM — 選好データから学習するLLMルーターで推論コストを2倍以上削減 24/02/2026
- 論文解説: syftr — Bayesian最適化によるRAGパイプラインのPareto最適構成探索 24/02/2026
- Microsoft解説: Azure OpenAI PTU(Provisioned Throughput Units)ベストプラクティス — 容量計画からスピルオーバーまで 23/02/2026