Lanean...

Hidden Parameter Markov Decision Processes: A Semiparametric Regression Approach for Discovering Latent Task Parametrizations

Control applications often feature tasks with similar, but not identical, dynamics. We introduce the Hidden Parameter Markov Decision Process (HiP-MDP), a framework that parametrizes a family of related dynamical systems with a low-dimensional set of latent factors, and introduce a semiparametric re...

Deskribapen osoa

Gorde:
Xehetasun bibliografikoak
Argitaratua izan da:IJCAI (U S)
Egile Nagusiak: Doshi-Velez, Finale, Konidaris, George
Formatua: Artigo
Hizkuntza:Inglês
Argitaratua: 2016
Gaiak:
Sarrera elektronikoa:https://ncbi.nlm.nih.gov/pmc/articles/PMC5466173/
https://ncbi.nlm.nih.gov/pubmed/28603402
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!