最近の更新
anthropic 27
- Claude Code設計思想解説: Prompt Caching Is Everything — キャッシュファーストなエージェント設計 18/05/2026
- 長時間実行エージェントのための効果的なハーネス設計 — Anthropicの実践知見 12/05/2026
- Anthropicのマルチエージェントリサーチシステム: オーケストレータ・ワーカーパターンの設計と運用 12/05/2026
- 論文解説: CacheGen — KVキャッシュ圧縮とストリーミングで長文コンテキストのLLM推論を高速化 03/05/2026
- 論文解説: CachedAttention — マルチターン会話のKVキャッシュ階層管理でLLM推論コストを最大69%削減 03/05/2026
- 論文解説: PagedAttention — LLM推論のKVキャッシュメモリ管理を変革した仮想メモリ方式 03/05/2026
- 論文解説: SGLang — RadixAttentionによるLLMプレフィックスキャッシュの自動最適化 03/05/2026
- 論文解説: Prompt Cache — Modular Attention Reuse for Low-Latency Inference 03/05/2026
- Anthropicブログ解説: Scaling Managed Agents - Brain/Hands/Session分離アーキテクチャ 01/05/2026
- Anthropicブログ解説: Effective Harnesses for Long-Running Agents 01/05/2026
- ProjectDiscovery事例解説: プロンプトキャッシュ最適化でLLMコスト59%削減を達成した実装戦略 29/04/2026
- Anthropic Research解説: Building Effective Agents — LLMエージェントのツール活用設計パターン 12/04/2026
- 論文解説: Marconi — Hybrid LLM時代のPrefix Caching システム 07/04/2026
- Anthropic Engineering解説: マルチエージェント研究システムの設計と実装 — 単一エージェント比90.2%の性能向上を実現したアーキテクチャ 28/03/2026
- Anthropic Prompt Caching解説: Claude APIのキャッシュアーキテクチャとコスト最適化の技術詳細 17/03/2026
- Anthropic Advanced Tool Use解説: Tool Search・Programmatic Tool Calling・Tool Use Examplesの技術詳細 17/03/2026
- 論文解説: Don't Break the Cache — プロンプトキャッシュの3社比較評価 24/02/2026
- 論文解説: Don't Do RAG — Cache-Augmented Generation(CAG)がRAGを置き換える条件 24/02/2026
- Anthropic公式解説: Claude Prompt Cachingの技術仕様と最適化戦略 23/02/2026
- Anthropic解説: Building Effective Agents — 5つの構成パターンとエージェント設計の実践原則 22/02/2026
- Anthropic解説: Claude APIプロンプトキャッシュ — コスト90%削減・レイテンシ85%短縮の実装と料金設計 22/02/2026
- Care Accessが Amazon Bedrock プロンプトキャッシュで86%コスト削減を達成した事例解説 22/02/2026
- Anthropic: AIエージェント評価の実践ガイド — Demystifying Evals 22/02/2026
- 論文解説: FrugalGPT — 複数LLMカスケードによるコスト最大98%削減 22/02/2026
- Anthropic解説: Effective Context Engineering for AI Agents 21/02/2026
- Anthropic解説: マルチエージェントリサーチシステムの設計と実装 20/02/2026
- Anthropic公式ガイド解説: AIエージェントのためのContext Engineering — 4戦略と実装パターン 18/02/2026