ブログ概要(Summary) 本記事は Effective cost optimization strategies for Amazon Bedrock の解説記事です。 AWSの公式ブログは、Amazon Bedrockを活用する際の包括的なコスト最適化戦略を体系的に解説している。料金モデルの選択(On-Demand / Batch / Provisioned Throughput)...
論文概要 本記事は https://arxiv.org/abs/2505.16078 の解説記事です。 Li et al. (2025) は、産業用テキスト分類タスクにおける小規模言語モデル(Small Language Models, SLM)の有効性を体系的に調査した論文である。ChatGPTやLlama-3.3-70Bのような大規模デコーダモデルが支配的な現在、実務では「どのモデル...
論文概要(Abstract) 本記事は https://arxiv.org/abs/2602.06370 の解説記事です。 テキスト分類タスクにおいて、ファインチューニングされたBERT系エンコーダモデルとLLMプロンプティング(GPT-4o、Claude Sonnet 4.5)を、予測品質(Macro F1)・推論コスト(USD)・レイテンシ(ms)の3軸で多目的比較した研究である。4...
ブログ概要(Summary) 本記事は https://aws.amazon.com/blogs/machine-learning/customize-amazon-nova-models-with-amazon-bedrock-fine-tuning/ の解説記事です。 AWSの公式ブログでは、Amazon Bedrock上でNovaモデルファミリーをファインチューニングする手法が解説...
本記事は arXiv:2510.18633 の解説記事です。 論文概要(Abstract) Roxana Petcu, Kenton Murray, Daniel Khashabiらによる本論文は、RAG(Retrieval-Augmented Generation)における複合クエリの分解を多腕バンディット(Multi-Armed Bandit, MAB)問題として定式化する。従来のク...
本記事は https://arxiv.org/abs/2403.10407 の解説記事です。 論文概要(Abstract) SPLADE検索結果に対するリランキング手法の包括的比較研究である。著者らは、Cross-Encoder(DeBERTa-v3、ELECTRA等)とLLMベースのリランカー(GPT-4、GPT-3.5 Turbo等)を、TREC Deep Learning 2019...
本記事は arXiv:2212.10496 の解説記事です。 論文概要(Abstract) Luyu Gao, Xueguang Ma, Jimmy Lin, Jamie Callanらによる本論文は、関連性ラベルなしでゼロショットの高精度密検索(dense retrieval)を実現する手法「HyDE(Hypothetical Document Embeddings)」を提案している。...
本記事は arXiv:2409.18511 の解説記事です。 論文概要(Abstract) Yixuan Tang, Yi Yangらによる本論文は、汎用Embeddingモデルがドメイン固有テキスト(金融分野)において性能低下する現象を体系的に実証した研究である。著者らは金融テキストに特化したベンチマーク「FinMTEB」(64データセット、7タスク)を構築し、MTEB(Massive...
ブログ概要(Summary) 本記事は Automate Amazon Bedrock batch inference: Building a scalable and efficient pipeline の解説記事です。 AWSはAmazon Bedrockのバッチ推論において、1モデル・1リージョンあたり同時実行10ジョブという上限が存在する。この制約のもとで大量のバッチジョブを効...
論文概要(Abstract) 本記事は https://arxiv.org/abs/2407.15831 の解説記事です。 NV-Retrieverは、テキスト埋め込みモデルのfine-tuningにおけるhard negative mining手法を改善する研究である。著者らは、正例(positive)の関連度スコアを活用してfalse negativeを除去するPositive-aw...