A carregar...

Linear Fitted-Q Iteration with Multiple Reward Functions

We present a general and detailed development of an algorithm for finite-horizon fitted-Q iteration with an arbitrary number of reward signals and linear value function approximation using an arbitrary number of state features. This includes a detailed treatment of the 3-reward function case using t...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Main Authors: Lizotte, Daniel J., Bowling, Michael, Murphy, Susan A.
Formato: Artigo
Idioma:Inglês
Publicado em: 2012
Assuntos:
Acesso em linha:https://ncbi.nlm.nih.gov/pmc/articles/PMC3670261/
https://ncbi.nlm.nih.gov/pubmed/23741197
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!