Home
0h-n0 TechBLog
キャンセル

✍️ AWS公式ブログ解説: Amazon Bedrockのコスト最適化戦略

ブログ概要(Summary) 本記事は Effective cost optimization strategies for Amazon Bedrock の解説記事です。 AWSの公式ブログは、Amazon Bedrockを活用する際の包括的なコスト最適化戦略を体系的に解説している。料金モデルの選択(On-Demand / Batch / Provisioned Throughput)...

📄 ACL 2025論文解説: 産業テキスト分類における小規模言語モデルの実践的知見

論文概要 本記事は https://arxiv.org/abs/2505.16078 の解説記事です。 Li et al. (2025) は、産業用テキスト分類タスクにおける小規模言語モデル(Small Language Models, SLM)の有効性を体系的に調査した論文である。ChatGPTやLlama-3.3-70Bのような大規模デコーダモデルが支配的な現在、実務では「どのモデル...

📄 論文解説: Cost-Aware Model Selection for Text Classification

論文概要(Abstract) 本記事は https://arxiv.org/abs/2602.06370 の解説記事です。 テキスト分類タスクにおいて、ファインチューニングされたBERT系エンコーダモデルとLLMプロンプティング(GPT-4o、Claude Sonnet 4.5)を、予測品質(Macro F1)・推論コスト(USD)・レイテンシ(ms)の3軸で多目的比較した研究である。4...

📄 論文解説: Query Decomposition for RAG — 探索-活用バランスによるクエリ分解最適化

本記事は arXiv:2510.18633 の解説記事です。 論文概要(Abstract) Roxana Petcu, Kenton Murray, Daniel Khashabiらによる本論文は、RAG(Retrieval-Augmented Generation)における複合クエリの分解を多腕バンディット(Multi-Armed Bandit, MAB)問題として定式化する。従来のク...

📄 論文解説: Cross-Encoder vs LLM Reranker — SPLADE検索結果のリランキング手法比較

本記事は https://arxiv.org/abs/2403.10407 の解説記事です。 論文概要(Abstract) SPLADE検索結果に対するリランキング手法の包括的比較研究である。著者らは、Cross-Encoder(DeBERTa-v3、ELECTRA等)とLLMベースのリランカー(GPT-4、GPT-3.5 Turbo等)を、TREC Deep Learning 2019...

📄 論文解説: HyDE — 仮想文書Embeddingによるゼロショット高精度検索

本記事は arXiv:2212.10496 の解説記事です。 論文概要(Abstract) Luyu Gao, Xueguang Ma, Jimmy Lin, Jamie Callanらによる本論文は、関連性ラベルなしでゼロショットの高精度密検索(dense retrieval)を実現する手法「HyDE(Hypothetical Document Embeddings)」を提案している。...

📄 論文解説: Do We Need Domain-Specific Embedding Models? — FinMTEBベンチマークによる実証分析

本記事は arXiv:2409.18511 の解説記事です。 論文概要(Abstract) Yixuan Tang, Yi Yangらによる本論文は、汎用Embeddingモデルがドメイン固有テキスト(金融分野)において性能低下する現象を体系的に実証した研究である。著者らは金融テキストに特化したベンチマーク「FinMTEB」(64データセット、7タスク)を構築し、MTEB(Massive...

✍️ AWS公式ブログ解説: Amazon Bedrockバッチ推論の自動化パイプライン構築

ブログ概要(Summary) 本記事は Automate Amazon Bedrock batch inference: Building a scalable and efficient pipeline の解説記事です。 AWSはAmazon Bedrockのバッチ推論において、1モデル・1リージョンあたり同時実行10ジョブという上限が存在する。この制約のもとで大量のバッチジョブを効...

📄 論文解説: NV-Retriever — Positive-Aware Hard Negative Miningによるテキスト埋め込みモデルの改善

論文概要(Abstract) 本記事は https://arxiv.org/abs/2407.15831 の解説記事です。 NV-Retrieverは、テキスト埋め込みモデルのfine-tuningにおけるhard negative mining手法を改善する研究である。著者らは、正例(positive)の関連度スコアを活用してfalse negativeを除去するPositive-aw...