Mostrar el registro sencillo del ítem

dc.contributor.advisorBorrajo Millán, Danielspa
dc.contributor.authorFernández Rebollo, Fernandospa
dc.contributor.otherUniversidad Carlos III de Madrid. Departamento de Informática;spa
dc.date.issued2002spa
dc.identifier.citationp. 181-189spa
dc.identifier.urihttp://hdl.handle.net/10016/569spa
dc.identifier.urihttp://hdl.handle.net/11162/42490
dc.description.abstractEl aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes de forma automática. La mayor parte de la teoría del aprendizaje por refuerzo se fundamenta en la programación dinámica. La implementación tradicional de estas funciones en forma tabular no es práctica cuando el espacio de estados es muy grande, o infinito. En este caso es necesario aplicar métodos de generalización que permitan extrapolar la experiencia adquirida para un conjunto limitado de estados, a la totalidad del espacio.. Para resolver el problema mencionado se puede recurrir a dos aproximaciones. Por un lado, existen técnicas basadas en una selección adecuada de puntos significativos y, por otro, se pueden emplear los métodos basados en el desarrollo de funciones de valor con algún método supervisado de aproximación de funciones. El trabajo trata de desarrollar métodos de aprendizaje por refuerzo aplicables en dominios con espacios de estados continuos, partiendo de las dos aproximaciones mencionadas, para fundirlas en un método eficaz que permita que el aprendizaje totalmente automático.. Esta investigación facilita un nuevo método de aprendizaje por refuerzo para dominios con espacios de estados continuos (ENNC-QL). Este método permite aprender tareas en entornos de varias dimensiones con mayor eficacia y el número de parámetros que debe suministrársele es mínimo.spa
dc.format.extent189 p.spa
dc.format.mediumMultimediaspa
dc.format.mediumDigitalspa
dc.language.isospaspa
dc.rightsCreative Commons Atribución-NoComercial-SinDerivadas 3.0 Españaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectenseñanza a distanciaspa
dc.subjectinteligencia artificialspa
dc.subjectuso didáctico del ordenadorspa
dc.subjectmétodo de enseñanzaspa
dc.subjectenseñanza automatizadaspa
dc.titleAprendizaje por refuerzo en espacios de estados continuosspa
dc.typeTesis doctoralspa
dc.audienceProfesoradospa
dc.bbddInvestigacionesspa
dc.date.provenance20090122spa
dc.description.locationBiblioteca de la Escuela Politécnica. Universidad Carlos III; Avda. Universidad 30; 28911 Leganés; Tel. +34916249438; Fax +34916249066; piepolitec@listserv.uc3m.esspa
dc.description.paisESPspa
dc.educationLevelÁmbito generalspa
dc.identifier.signaturaMD L/TU 00157spa


Ficheros en el ítem

    Mostrar el registro sencillo del ítem

    Creative Commons Atribución-NoComercial-SinDerivadas 3.0 España
    Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commons Atribución-NoComercial-SinDerivadas 3.0 España