- 📄 論文解説: ENOVA — 半教師ありVAEによるサーバーレスLLMサービングの自動構成とオートスケーリング
- 📄 論文解説: Teaching Large Language Models to Self-Debug — LLMの自己デバッグ手法
- ✍️ AWS公式ブログ解説: Amazon Bedrock AgentCore — 7つのマネージドサービスでAIエージェントを本番運用する
- 📄 論文解説: SWE-Search — MCTSで実世界ソフトウェアエンジニアリングタスクを解く
- 📄 論文解説: Helium — データベースクエリ最適化でLLMエージェントワークフローを最大39倍高速化
本記事は https://arxiv.org/abs/2407.09486 の解説記事です。 論文概要(Abstract) ENOVAは、マルチGPUクラスタ上でのサーバーレスLLMサービングにおいて、デプロイ構成の自動推定とオートスケーリングを統合的に解決するシステムである。著者らは、構成推薦モジュール(Configuration Recommendation)、性能検知モジュール(P...