- ✍️ NVIDIA解説: ログ解析マルチエージェント自己修正型RAGシステム — Nemotronとハイブリッド検索の実装
- ✍️ Anthropic解説: Claude APIプロンプトキャッシュ — コスト90%削減・レイテンシ85%短縮の実装と料金設計
- 📄 論文解説: Agentic RAG with Knowledge Graphs for Clinical Practice Guideline Retrieval
- 📄 論文解説: Prompt Cache — モジュラーAttention再利用による低レイテンシLLM推論
- 📄 論文解説: CacheBlend — 選択的KV再計算によるRAGサービングの高速化
お世話になっております。おばんどす。現在、youtubeの教育コンテンツの成長がすさまじく、機械学習全般のコンテンツも豊富にあります。ここでは、私が登録している機械学習系のYoutube channelを紹介していきます。非常にボリューミーなので、すべてを確認するというスタンスではなく、興味がある動画をピックアップして、さらっと確認した方が良いです。(1.5倍速推奨)別の記事で、おすすめサ...