Home
0h-n0 TechBLog
キャンセル

📄 論文解説: AISAR — AlphaFold2とNMRの統合による隠れたタンパク質構造状態の解明

論文概要(Abstract) 本記事は https://arxiv.org/abs/2402.10085 の解説記事です。 AlphaFold-NMR(AISAR: AI SAmpling with NMR Recall selection)は、AlphaFold2のニューラルネットワークドロップアウトを利用した構造サンプリングと、NMR実験データに基づくベイズスコアリングを統合し、タン...

✍️ ProjectDiscovery事例解説: プロンプトキャッシュ最適化でLLMコスト59%削減を達成した実装戦略

ブログ概要(Summary) 本記事は ProjectDiscovery Blog: How We Cut LLM Costs by 59% With Prompt Caching の解説記事です。 ProjectDiscoveryはセキュリティ自動化プラットフォームを提供する企業であり、AIエージェント基盤「Neo」においてClaude Opus 4.5を用いた大規模なマルチステップエ...

✍️ AWS公式ブログ解説: Amazon Bedrock Agentsカスタムオーケストレーターの設計と実装

ブログ概要(Summary) 本記事は Getting started with Amazon Bedrock Agents custom orchestrator の解説記事です。Amazon Bedrock Agentsのカスタムオーケストレーション機能は、デフォルトのReAct(Reason and Action)戦略に代えて、Lambda関数によるユーザー定義のオーケストレーション...

✍️ Anthropic公式ガイド解説: 効果的なAIエージェント設計の7パターン

本記事は Anthropic: Building Effective AI Agents の解説記事です。 ブログ概要(Summary) Anthropicが2024年12月に公開した「Building Effective AI Agents」は、LLMを活用したエージェントシステムの設計パターンを体系的に整理したガイドラインである。ブログでは「ワークフロー」と「エージェント」を明確に区...

📄 論文解説: Prompt Cache — モジュラーアテンション再利用による低レイテンシ推論

本記事は arXiv:2404.14294 Prompt Cache: Modular Attention Reuse for Low-Latency Inference の解説記事です。 論文概要(Abstract) LLM推論において、多くの入力プロンプトはシステムメッセージやプロンプトテンプレート、コンテキスト文書など重複するテキストセグメントを含んでいる。Prompt Cache...

📄 論文解説: SGLang RadixAttention — Radix Treeによる自動KV Cache共有でLLMサービングを高速化

本記事は arXiv:2312.07104 Efficiently Programming Large Language Models using SGLang の解説記事です。 論文概要(Abstract) SGLangは、大規模言語モデル(LLM)アプリケーションを効率的に実行するためのシステムである。フロントエンド言語とランタイムの2層で構成され、ランタイム側の中核技術として Ra...

📄 論文解説: AutoGen — マルチエージェント会話によるLLMアプリケーション基盤

本記事は arXiv:2308.08155 AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation の解説記事です。 論文概要(Abstract) AutoGenは、複数のエージェントが相互に会話することでタスクを遂行するLLMアプリケーションを構築するためのオープンソースフレームワークである。各エ...