📄 論文解説: LLM生成パラメータのコスト最適化: ベイズ最適化で20-40%削減

論文概要タイトル: LLM生成パラメータのコスト最適化: ベイズ最適化で20-40%削減 arXiv ID: 2311.09668 対象読者: 修士学生レベル（機械学習・LLMの基礎知識を持つエンジニア・研究者） temperature、top_p、max_tokensなどの生成ハイパーパラメータをベイズ最適化で調整し、品質制約を満たしつつコストを20-40%削減。要約タスクでは「te...

15/02/2026 blog paper

LLM cost-optimization observability +2

📄 論文解説: Beyond ChatGPT: 50社以上の本番LLMデプロイ実態調査とコスト構造分析

論文概要タイトル: Beyond ChatGPT: 50社以上の本番LLMデプロイ実態調査とコスト構造分析 arXiv ID: 2310.05869 対象読者: 修士学生レベル（機械学習・LLMの基礎知識を持つエンジニア・研究者）医療・金融・EC等の53社を対象に、本番環境でのLLMデプロイパターンとコスト構造を分析。推論コストが全体の60-75%を占め、主な障害はコンテキスト長超過...

15/02/2026 blog paper

LLM cost-optimization observability +2

📄 論文解説: Infinite-LLM: 分散KVキャッシュで100万トークンのコンテキストを低コストで処理

論文概要タイトル: Infinite-LLM: 分散KVキャッシュで100万トークンのコンテキストを低コストで処理 arXiv ID: 2401.14489 対象読者: 修士学生レベル（機械学習・LLMの基礎知識を持つエンジニア・研究者） KVキャッシュをGPU間で分散し、単一GPUでOOMが発生する長コンテキスト(128K-1Mトークン)を処理可能にする手法。レイテンシは15-25%...

15/02/2026 blog paper

LLM cost-optimization observability +2

✍️ Meta Code Llama解説: オープンソースで実現する最先端コード生成

Meta Code Llama解説: オープンソースで実現する最先端コード生成ブログ概要 MetaのCode Llamaは、Llama 2をベースにコード特化型のファインチューニングを施した大規模言語モデルです。商用利用可能なオープンソースとして公開され、HumanEvalで53.7%、MBPPで56.2%という当時最高水準の性能を達成しました。ブログ情報: 公開元: Met...

15/02/2026 blog tech_blog

LLM code-generation open-source +2

📄 論文解説: AI-Nativeソフトウェア開発ライフサイクルとV-Bounceモデル

論文解説: AI-Nativeソフトウェア開発ライフサイクルとV-Bounceモデル論文概要本論文は、AI時代に適応した新しいソフトウェア開発ライフサイクル（SDLC）を提案します。従来のV-モデルを再設計した「V-Bounceモデル」により、AIが実装を担当し、人間は検証・確認者としての役割にシフトする paradigm shift を実現します。論文情報: arXiv ...

15/02/2026 blog paper

SDLC V-model AI-native +2

📄 論文解説: LLMベースのコード生成エージェント完全サーベイ

論文解説: LLMベースのコード生成エージェント完全サーベイ論文概要本サーベイ論文は、LLM（大規模言語モデル）を活用したコード生成エージェントの包括的な分析を提供します。従来のコード生成手法との3つの重要な違い（自律性、適用範囲、エンジニアリング重視）を明確にし、2022年から2025年6月までの100本の高品質論文を体系的にレビューしています。論文情報: arXiv I...

15/02/2026 blog paper

LLM code-generation AI-agent +2

✍️ NVIDIA研究解説: エージェントAIシステムのコード実行セキュリティ

NVIDIA研究解説: エージェントAIシステムのコード実行セキュリティブログ概要 NVIDIA AI Red Teamによる公式テックブログ “How Code Execution Drives Key Risks in Agentic AI Systems” (2025年) は、AIエージェントが動的に生成したコードを実行する際の根本的なセキュリティリスクを詳述しています。本記...

15/02/2026 blog tech_blog

security code-execution AI-agent +2

✍️ HyPA-RAG: ハイブリッド検索のパラメータ適応最適化

概要 HyPA-RAG（Hybrid Parameter-Adaptive RAG）は、AI法律・政策ドメインに特化したRAGシステムです。arXiv論文2409.09046およびNAACL 2025 Industry Trackで発表され、ハイブリッド検索（BM25 + Dense + Knowledge Graph）とクエリ複雑度に応じたパラメータ適応により、法律文書検索の精度と文脈適...

15/02/2026 blog paper

RAG Hybrid-Search BM25 +3

📄 カンファレンス論文解説: AvaTaR - LLMエージェントのツール使用最適化

カンファレンス論文解説: AvaTaR - LLMエージェントのツール使用最適化論文概要 AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning (NeurIPS 2024) は、Stanford University と Amazon によるLLMエージェントのツール使用能力を対比推論で最適化す...

15/02/2026 blog paper

LLM agent tool-use +2

📄 論文解説: Infini-attention - 無限長コンテキストを実現する圧縮メモリ機構

論文解説: Infini-attention - 無限長コンテキストを実現する圧縮メモリ機構論文概要 Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention (arXiv:2404.07143, 2024年4月) は、Google DeepMindによる無限長コンテキ...

15/02/2026 blog paper

transformer attention context-window +2

1
...
14
15
16
...
18
15 / 18