- 📄 論文解説: Dynamic Model Routing and Cascading for Efficient LLM Inference
- 📄 論文解説: ToolPRM — Function Callingのためのプロセス報酬モデルによる推論時スケーリング
- 📄 論文解説: VIGIL — ツールストリームインジェクションからLLMエージェントを防御するVerify-Before-Commitプロトコル
- 📄 論文解説: XGrammar-2 — エージェントLLMのための動的構造化生成エンジン
- 📄 論文解説: JSONSchemaBench — 構造化出力のための制約付きデコーディングベンチマーク
論文概要(Abstract) Matryoshka Representation Learning(MRL)は、University of Washingtonの Kusupatiらが2022年に提案した表現学習手法である。通常の埋め込みモデルは固定次元のベクトルを出力するが、MRLでは単一のモデルで複数の粒度(8, 16, 32, …, 2048次元)の埋め込みを同時に学習する。学習済み...