論文概要(Abstract) 本記事は https://arxiv.org/abs/2402.10085 の解説記事です。 AlphaFold-NMR(AISAR: AI SAmpling with NMR Recall selection)は、AlphaFold2のニューラルネットワークドロップアウトを利用した構造サンプリングと、NMR実験データに基づくベイズスコアリングを統合し、タン...
30/04/2026 blog paper
AISAR AlphaFold2 NMR +4
ブログ概要(Summary) 本記事は ProjectDiscovery Blog: How We Cut LLM Costs by 59% With Prompt Caching の解説記事です。 ProjectDiscoveryはセキュリティ自動化プラットフォームを提供する企業であり、AIエージェント基盤「Neo」においてClaude Opus 4.5を用いた大規模なマルチステップエ...
29/04/2026 blog tech_blog
prompt-caching llm anthropic +3
本記事は NVIDIA Technical Blog: 5x Faster Time to First Token with NVIDIA TensorRT-LLM KV Cache Early Reuse の解説記事です。 ブログ概要(Summary) NVIDIAは TensorRT-LLM における KV Cache の再利用効率を大幅に向上させる3つの最適化技術を発表した。第一に...
29/04/2026 blog tech_blog
kv-cache tensorrt-llm nvidia +3
ブログ概要(Summary) 本記事は https://research.google/pubs/or-tools-vehicle-routing-solver-a-generic-constraint-programming-solver-with-heuristic-search-for-routing-problems/ の解説記事です。 Google OR-ToolsのVehic...
29/04/2026 blog tech_blog
Google OR-Tools VRP +4
ブログ概要(Summary) 本記事は Getting started with Amazon Bedrock Agents custom orchestrator の解説記事です。Amazon Bedrock Agentsのカスタムオーケストレーション機能は、デフォルトのReAct(Reason and Action)戦略に代えて、Lambda関数によるユーザー定義のオーケストレーション...
29/04/2026 blog tech_blog
AWS Bedrock agent +4
本記事は Anthropic: Building Effective AI Agents の解説記事です。 ブログ概要(Summary) Anthropicが2024年12月に公開した「Building Effective AI Agents」は、LLMを活用したエージェントシステムの設計パターンを体系的に整理したガイドラインである。ブログでは「ワークフロー」と「エージェント」を明確に区...
29/04/2026 blog tech_blog
Anthropic agent design-pattern +3
本記事は arXiv:2404.14294 Prompt Cache: Modular Attention Reuse for Low-Latency Inference の解説記事です。 論文概要(Abstract) LLM推論において、多くの入力プロンプトはシステムメッセージやプロンプトテンプレート、コンテキスト文書など重複するテキストセグメントを含んでいる。Prompt Cache...
29/04/2026 blog paper
kv-cache prompt-caching llm +3
本記事は arXiv:2312.07104 Efficiently Programming Large Language Models using SGLang の解説記事です。 論文概要(Abstract) SGLangは、大規模言語モデル(LLM)アプリケーションを効率的に実行するためのシステムである。フロントエンド言語とランタイムの2層で構成され、ランタイム側の中核技術として Ra...
29/04/2026 blog paper
kv-cache radix-tree llm-serving +3
本記事は arXiv:2312.03052 CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion の解説記事です。 なお、本論文の正式なarXiv IDは 2405.16444 に更新されており、ACM EuroSys 2025にてBest Paperを受賞した。以下の解説はEu...
29/04/2026 blog paper
kv-cache rag llm-serving +3
本記事は arXiv:2308.08155 AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation の解説記事です。 論文概要(Abstract) AutoGenは、複数のエージェントが相互に会話することでタスクを遂行するLLMアプリケーションを構築するためのオープンソースフレームワークである。各エ...
29/04/2026 blog paper
LLM multi-agent AutoGen +4