Home
0h-n0 TechBLog
キャンセル

✍️ OpenAI公式解説: Structured Outputs in the API — strict modeによる100%スキーマ準拠の実現

本記事は OpenAI: Introducing Structured Outputs in the API の解説記事です。 ブログ概要(Summary) OpenAIは2024年8月6日、APIにStructured Outputs機能を導入した。strict: true を設定することで、モデルの出力が開発者指定のJSON Schemaに100%準拠することが保証される。この機能は...

✍️ NVIDIA解説: TensorRT-LLMのKVキャッシュ再利用最適化 — 優先度ベースEvictionとイベントAPI

本記事は Introducing New KV Cache Reuse Optimizations in NVIDIA TensorRT-LLM の解説記事です。 ブログ概要(Summary) NVIDIAは2025年1月、TensorRT-LLMに2つの新機能を導入した。優先度ベースKVキャッシュEvictionは、トークン範囲ごとに優先度と保持期間を設定し、システムプロンプトなどの頻...

✍️ AWS公式解説: Amazon Bedrockプロンプトキャッシュの技術仕様とConverse API実装

本記事は AWS公式ドキュメント: Prompt caching for faster model inference および AWS What’s New: Amazon Bedrock 1-hour prompt caching の解説記事です。 ブログ概要(Summary) Amazon Bedrockのプロンプトキャッシュは、リクエスト間で共通するプロンプトプレフィックスのKV計...

✍️ サーベイ解説: A Survey of Vibe Coding with Large Language Models — 制約付きMDPによる形式化と5つの開発モデル

論文概要(Abstract) 本論文は、LLMの進化がコード生成支援から自律的コーディングエージェントへのパラダイムシフトを促し、「Vibe Coding」と呼ばれる新しい開発手法を生み出したことを体系的にサーベイしたものである。著者ら(Yuyao Ge et al., 15名)は、Vibe codingを制約付きマルコフ決定過程(Constrained Markov Decision P...