Home
0h-n0 TechBLog
キャンセル

✍️ GPT-5.5のreasoning.effortとツール呼び出し最適化の技術解説

本記事は Introducing GPT-5.5 (OpenAI) および Using GPT-5.5 (API Docs) の解説記事です。 ブログ概要(Summary) OpenAIは2026年4月23日にGPT-5.5をリリースした。GPT-5.5はreasoning.effortパラメータ(none/low/medium/high/xhigh)で推論深度とレイテンシのトレードオフ...

✍️ AgentCore Optimization解説: エージェント品質の自動改善ループ

本記事は Introducing the agent performance loop: AgentCore Optimization now in preview の解説記事です。 ブログ概要(Summary) AWSは2026年4月30日、Amazon Bedrock AgentCore Optimizationのプレビュー提供を発表した。この機能は、プロダクション環境で収集されたエ...

📄 論文解説: Reasoning Under Adaptive Budgets — LLMの推論効率化サーベイ

本記事は arXiv:2503.10461 Reasoning Under Adaptive Budgets の解説記事です。 論文概要(Abstract) 本論文は、LLMが複雑な推論タスクに取り組む際の計算予算(推論トークン数・ステップ数)を動的に制御する手法群を体系的にサーベイしている。著者らは、Chain-of-Thought(CoT)推論の計算コストが実用上の課題となっている現...

✍️ Amazon Bedrock レイテンシ最適化推論の実践ガイド解説

本記事は Optimizing AI responsiveness: A practical guide to Amazon Bedrock latency-optimized inference の解説記事です。 ブログ概要(Summary) AWSが公式ブログで公開した「Amazon Bedrock latency-optimized inference」の実践ガイドでは、perfo...

✍️ AlloyDB ScaNNインデックスの内部構造と性能分析

ブログ概要(Summary) 本記事は https://cloud.google.com/blog/products/databases/understanding-the-scann-index-in-alloydb の解説記事です。 Google Cloudが公式ブログで解説しているAlloyDB ScaNNインデックスは、Google Researchが開発したScaNN(Scal...

📄 論文解説: Cost-Effective, Low Latency Vector Search with Azure Cosmos DB

本記事は https://arxiv.org/abs/2505.05885 の解説記事です。 論文概要(Abstract) 本論文は、Azure Cosmos DBにDiskANNベースのベクトル検索を統合した設計と実装を述べている。著者らは、DRAM上のPQコードとNVMe SSD上のフルベクトル・グラフエッジという階層型ストレージにより、専用ベクトルDB比で最大4倍のコスト効率を達成...

📄 論文解説: RaBitQ — 理論保証付き1ビット量子化によるベクトル検索高速化

本記事は https://arxiv.org/abs/2405.12497 の解説記事です。関連するZenn記事「クラウドDB内蔵ベクトル検索 vs 専用DB 2026:AlloyDB・Aurora・Cosmos DBの実力比較」もあわせてご参照ください。 論文概要 RaBitQ(Randomized Binary Quantization)は、高次元ベクトルの近似最近傍探索(ANN)に...

📄 論文解説: Not All Indexes Are Equal — 10億スケールベクトル検索インデックスの実測評価

論文概要(Abstract) 本記事は https://arxiv.org/abs/2401.09350 の解説記事です。 本論文は、10億(Billion)スケールの近似最近傍探索(ANN)において、7種のインデックス手法(HNSW、DiskANN、ScaNN、IVF-PQ、IVF-HNSW、NSG、SPANN)を3つのデータセットで実測評価したベンチマーク研究である。著者らは、リコー...

📄 論文解説: Filtered-DiskANN — フィルタ付きベクトル検索のためのグラフアルゴリズム

論文概要(Abstract) 本記事は https://arxiv.org/abs/2211.12850 の解説記事です。 Filtered-DiskANNは、属性フィルタ付き近似最近傍探索(Filtered ANN Search)を高精度に実現するグラフベースアルゴリズムである。著者らは、従来のpost-filtering方式がselectivityの低い条件下でrecallが著しく低...