最近の更新
constrained-decoding 8
- NeurIPS 2024論文解説: SGLang — RadixAttentionとCompressed FSMによるLLM推論高速化 24/02/2026
- ICML 2025論文解説: Flexible and Efficient Grammar-Constrained Decoding 24/02/2026
- SqueezeBits解説: llguidance vs XGrammar — vLLM/SGLangでの構造化出力ベンチマーク 24/02/2026
- 論文解説: XGrammar — 語彙分割とキャッシュによる高速構造化出力エンジン 24/02/2026
- 論文解説: JSONSchemaBench — 構造化出力フレームワークの体系的ベンチマーク 24/02/2026
- OpenAI公式解説: Structured Outputs in the API — strict modeによる100%スキーマ準拠の実現 23/02/2026
- 論文解説: JSONSchemaBench — 10K実世界スキーマによるLLM構造化出力ベンチマーク 23/02/2026
- 論文解説: Efficient Guided Generation for Large Language Models — 有限状態機械による構造化出力の理論基盤 23/02/2026