Načítá se...

Robust and Efficient Transfer Learning with Hidden Parameter Markov Decision Processes

We introduce a new formulation of the Hidden Parameter Markov Decision Process (HiP-MDP), a framework for modeling families of related tasks using low-dimensional latent embeddings. Our new framework correctly models the joint uncertainty in the latent parameters and the state space. We also replace...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Adv Neural Inf Process Syst
Hlavní autoři: Killian, Taylor, Daulton, Samuel, Konidaris, George, Doshi-Velez, Finale
Médium: Artigo
Jazyk:Inglês
Vydáno: 2017
Témata:
On-line přístup:https://ncbi.nlm.nih.gov/pmc/articles/PMC6814194/
https://ncbi.nlm.nih.gov/pubmed/31656388
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo otaguje tento záznam!