Home
0h-n0 TechBLog
キャンセル

📄 ICML 2025論文解説: EPD Disaggregation — マルチモーダルモデルの推論を3ステージに分離して効率化

論文概要 本記事は、ICML 2025に採択された論文「Efficiently Serving Large Multimodal Models Using EPD Disaggregation」(Singh et al.)の解説記事です。著者自身が実験を行ったわけではなく、論文の内容を引用・解説しています。 Large Multimodal Model(LMM)はテキストに加えて画像・動...

✍️ Qdrant公式解説: Binary Quantization — ベクトル検索を40倍高速化する量子化手法

本記事は Qdrant公式ブログ: Binary Quantization — Vector Search, 40x Faster の解説記事です。 ブログ概要(Summary) Qdrant社のNirant Kasliwal氏による本ブログ記事は、Binary Quantization(BQ)をQdrantベクトルDBに実装した際の技術的詳細とベンチマーク結果を報告している。BQはfl...

📄 論文解説: ModServe — マルチモーダルモデルサービングのためのモダリティ対応リソース分離

論文概要 本記事は ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving (Qiu et al., ACM SoCC 2025) の解説記事です。本記事は引用・解説であり、筆者が独自に実験を行ったものではありません。 ModServeは、大規模マル...

📄 論文解説: Serverless Cold Starts and Where to Find Them

論文概要 本記事は Serverless Cold Starts and Where to Find Them (arXiv:2410.06145) の解説記事です。本記事は引用・解説であり、筆者自身による実験は行っていません。 Joosen らは、Huawei の本番サーバーレスプラットフォーム(YuanRong)から収集した31日間・5データセンターリージョンにわたる85億リクエスト...

📄 NeurIPS 2022論文解説: Matryoshka Representation Learning

本記事は Matryoshka Representation Learning (arXiv:2205.13147) の解説記事です。 論文概要(Abstract) Matryoshka Representation Learning(MRL)は、単一のEmbeddingモデルから複数粒度の次元ベクトルを同時に学習する手法である。著者らは、通常の学習パイプラインに最小限の変更を加えるだけ...