Research on reinforcement learning methods : a practical study

Pinilla Martínez, Fernando Javier

doi:oai:oa.upm.es:47887

dc.contributor.advisor	Bajo Pérez, Javier
dc.contributor.author	Pinilla Martínez, Fernando Javier
dc.contributor.other	Universidad Politécnica de Madrid. Facultad de Informática, Departamento de Inteligencia Artificial, Calle del Prof. José García Santesmases, 9, 28040 Madrid; Tel. +34913947501; secretaria@fi.upm.es	spa
dc.date.issued	2017
dc.identifier.citation	p. 45-46	spa
dc.identifier.uri	http://oa.upm.es/47887/1/TFM_FERNANDO_PINILLA_MARTINEZ.pdf	spa
dc.identifier.uri	http://hdl.handle.net/11162/190007
dc.description.abstract	El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente.	spa
dc.format.extent	56 p.	spa
dc.format.medium	Digital	spa
dc.language.iso	eng	spa
dc.rights	Cuando no se especifique otra condición, los documentos incorporados a Redined a texto completo, se hallan bajo las condiciones de uso de sólo lectura y únicamente podrán ser citados con reconocimiento del autor(es). Para cualquier otro uso, deberá solicitarse el permiso del autor (es)	spa
dc.subject	inteligencia artificial	spa
dc.subject	enseñanza automatizada	spa
dc.subject	juego educativo	spa
dc.subject	estrategia de aprendizaje	spa
dc.title	Research on reinforcement learning methods : a practical study	eng
dc.type	Trabajo fin de máster	spa
dc.audience	Profesorado	spa
dc.bbdd	Investigaciones	spa
dc.description.pais	ESP	spa
dc.educationLevel	Ámbito general	spa
dc.identifier.doi	oai:oa.upm.es:47887	spa

Ficheros en el ítem

Ficheros	Tamaño	Formato	Ver
No hay ficheros asociados a este ítem.

Mostrar el registro sencillo del ítem