Ładuje się......

On Gap-Based Lower Bounding Techniques for Best-Arm Identification

In this paper, we consider techniques for establishing lower bounds on the number of arm pulls for best-arm identification in the multi-armed bandit problem. While a recent divergence-based approach was shown to provide improvements over an older gap-based approach, we show that the latter can be re...

Szczegółowa specyfikacja

Zapisane w:
Opis bibliograficzny
Główni autorzy: Lan V. Truong, Jonathan Scarlett
Format: Artigo
Język:Inglês
Wydane: MDPI AG 2020-07-01
Seria:Entropy
Hasła przedmiotowe:
Dostęp online:https://www.mdpi.com/1099-4300/22/7/788
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!