最近の更新
aigateway 9
- NVIDIA技術ブログ解説: LLM推論最適化の全体像 — KVキャッシュからSpeculative Decodingまで 03/05/2026
- 論文解説: Mixture-of-Agents — 複数LLM協調による品質向上フレームワーク 03/05/2026
- ICML 2025論文解説: A Unified Approach to Routing and Cascading for LLMs 03/05/2026
- 論文解説: FrugalGPT — LLMカスケードによるコスト98%削減フレームワーク 03/05/2026
- 論文解説: RouteLLM — 選好データに基づくLLMルーティングフレームワーク 03/05/2026
- 論文解説: Hybrid LLM — Conformal Predictionによる品質保証付きLLMルーティング 12/03/2026
- 論文解説: FrugalGPT — LLM APIコストを最大98%削減するカスケード戦略 12/03/2026
- 論文解説: MeanCache — ユーザー中心セマンティックキャッシュによるLLMサービスコスト削減 12/03/2026
- ICLR 2025論文解説: RouteLLM — 嗜好データを用いたLLMルーティングによるコスト効率的推論 12/03/2026