最近の更新
online-learning 5
- 論文解説: Sleeping Competing Bandits — Dueling Banditのsleeping拡張とregret解析 30/04/2026
- 論文解説: Near-optimal Per-Action Regret Bounds for Sleeping Bandits — 行動ごとの最適regret保証 30/04/2026
- 論文解説: Online Combinatorial Optimization with Stochastic Decision Sets and Adversarial Losses — Sleeping組合せ最適化の原点 30/04/2026
- 論文解説: Follow-the-Perturbed-LeaderによるBest-of-Both-Worlds保証 — Tsallis摂動の理論と組合せバンディットへの応用 30/04/2026
- 論文解説: Online Combinatorial Optimization with Sleeping Arms — CATアルゴリズムによるregret改善 30/04/2026