Home
0h-n0 TechBLog
キャンセル

📄 論文解説: ENOVA — 半教師ありVAEによるサーバーレスLLMサービングの自動構成とオートスケーリング

本記事は https://arxiv.org/abs/2407.09486 の解説記事です。 論文概要(Abstract) ENOVAは、マルチGPUクラスタ上でのサーバーレスLLMサービングにおいて、デプロイ構成の自動推定とオートスケーリングを統合的に解決するシステムである。著者らは、構成推薦モジュール(Configuration Recommendation)、性能検知モジュール(P...

📄 論文解説: Teaching Large Language Models to Self-Debug — LLMの自己デバッグ手法

本記事は Teaching Large Language Models to Self-Debug の解説記事です。 論文概要(Abstract) Self-Debuggingは、LLMが自身の生成したコードをデバッグする手法である。著者らは、外部のオラクルフィードバック(正解テスト等)なしでも、コードの実行結果の検査やコードの自然言語による説明(ラバーダックデバッグ)によってLLMが自...

✍️ AWS公式ブログ解説: Amazon Bedrock AgentCore — 7つのマネージドサービスでAIエージェントを本番運用する

本記事は AWS公式ブログ「Introducing Amazon Bedrock AgentCore: Securely deploy and operate AI agents at any scale」(著者: Danilo Poccia、2025年7月16日公開、2025年10月13日 GA更新) の解説記事です。公式ブログおよび AWS ドキュメントの内容を整理・補足しています...

📄 論文解説: Helium — データベースクエリ最適化でLLMエージェントワークフローを最大39倍高速化

本記事は https://arxiv.org/abs/2603.16104 の解説記事です。 本記事はAIによって生成されました。 論文概要(Abstract) Heliumは、エージェントワークフローにおけるLLM呼び出しの冗長性をデータベースクエリ最適化の手法で排除するフレームワークである。著者らは、相互依存するLLM呼び出しの連鎖をクエリ実行プランとしてモデル化し、Templat...

📄 OSDI 2024論文解説: ServerlessLLM — マルチティアチェックポイントで実現する低レイテンシサーバーレスLLM推論

本記事は https://arxiv.org/abs/2401.14351 の解説記事です。 論文概要(Abstract) ServerlessLLMは、大規模言語モデル(LLM)のサーバーレス推論において低レイテンシを実現する分散システムである。GPUサーバーに搭載された大容量ストレージ(DRAM、NVMe SSD、SATA SSD)を活用してチェックポイントをローカルに保持し、リモー...

📄 論文解説: Tree of Thoughts — LLM推論を木探索で強化する意思決定フレームワーク

本記事は Tree of Thoughts: Deliberate Problem Solving with Large Language Models の解説記事です。 論文概要(Abstract) Tree of Thoughts(ToT)は、LLMの推論を「思考の木探索」として定式化するフレームワークである。Chain-of-Thought(CoT)の線形的な推論を一般化し、複数の...

📄 論文解説: Agentic Plan Caching — テスト時プラン再利用でLLMエージェントコストを50%削減

論文概要(Abstract) 本記事は https://arxiv.org/abs/2506.14852 の解説記事です。 Agentic Plan Caching(APC)は、LLMエージェントの計画フェーズで生成された構造化プランテンプレートを抽出・保存・適応・再利用するテスト時メモリシステムである。著者らは、既存のLLMキャッシュ技術(コンテキストキャッシュ、セマンティックキャッシ...

📄 論文解説: CodeTree — エージェント誘導型木探索によるLLMコード生成

本記事は CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models の解説記事です。 論文概要(Abstract) CodeTreeは、LLMベースのエージェントが木構造を用いてコード生成の解空間を効率的に探索するフレームワークである。Thinker・Solver・Debugger・...