Ładuje się......
On Gap-Based Lower Bounding Techniques for Best-Arm Identification
In this paper, we consider techniques for establishing lower bounds on the number of arm pulls for best-arm identification in the multi-armed bandit problem. While a recent divergence-based approach was shown to provide improvements over an older gap-based approach, we show that the latter can be re...
Zapisane w:
Główni autorzy: | , |
---|---|
Format: | Artigo |
Język: | Inglês |
Wydane: |
MDPI AG
2020-07-01
|
Seria: | Entropy |
Hasła przedmiotowe: | |
Dostęp online: | https://www.mdpi.com/1099-4300/22/7/788 |
Etykiety: |
Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
|