Mostrar el registro sencillo del ítem
Aprendizaje por refuerzo en espacios de estados continuos
dc.contributor.advisor | Borrajo Millán, Daniel | spa |
dc.contributor.author | Fernández Rebollo, Fernando | spa |
dc.contributor.other | Universidad Carlos III de Madrid. Departamento de Informática; | spa |
dc.date.issued | 2002 | spa |
dc.identifier.citation | p. 181-189 | spa |
dc.identifier.uri | http://hdl.handle.net/10016/569 | spa |
dc.identifier.uri | http://hdl.handle.net/11162/42490 | |
dc.description.abstract | El aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes de forma automática. La mayor parte de la teoría del aprendizaje por refuerzo se fundamenta en la programación dinámica. La implementación tradicional de estas funciones en forma tabular no es práctica cuando el espacio de estados es muy grande, o infinito. En este caso es necesario aplicar métodos de generalización que permitan extrapolar la experiencia adquirida para un conjunto limitado de estados, a la totalidad del espacio.. Para resolver el problema mencionado se puede recurrir a dos aproximaciones. Por un lado, existen técnicas basadas en una selección adecuada de puntos significativos y, por otro, se pueden emplear los métodos basados en el desarrollo de funciones de valor con algún método supervisado de aproximación de funciones. El trabajo trata de desarrollar métodos de aprendizaje por refuerzo aplicables en dominios con espacios de estados continuos, partiendo de las dos aproximaciones mencionadas, para fundirlas en un método eficaz que permita que el aprendizaje totalmente automático.. Esta investigación facilita un nuevo método de aprendizaje por refuerzo para dominios con espacios de estados continuos (ENNC-QL). Este método permite aprender tareas en entornos de varias dimensiones con mayor eficacia y el número de parámetros que debe suministrársele es mínimo. | spa |
dc.format.extent | 189 p. | spa |
dc.format.medium | Multimedia | spa |
dc.format.medium | Digital | spa |
dc.language.iso | spa | spa |
dc.rights | Creative Commons Atribución-NoComercial-SinDerivadas 3.0 España | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | |
dc.subject | enseñanza a distancia | spa |
dc.subject | inteligencia artificial | spa |
dc.subject | uso didáctico del ordenador | spa |
dc.subject | método de enseñanza | spa |
dc.subject | enseñanza automatizada | spa |
dc.title | Aprendizaje por refuerzo en espacios de estados continuos | spa |
dc.type | Tesis doctoral | spa |
dc.audience | Profesorado | spa |
dc.bbdd | Investigaciones | spa |
dc.date.provenance | 20090122 | spa |
dc.description.location | Biblioteca de la Escuela Politécnica. Universidad Carlos III; Avda. Universidad 30; 28911 Leganés; Tel. +34916249438; Fax +34916249066; piepolitec@listserv.uc3m.es | spa |
dc.description.pais | ESP | spa |
dc.educationLevel | Ámbito general | spa |
dc.identifier.signatura | MD L/TU 00157 | spa |