Mostrar el registro sencillo del ítem
Research on reinforcement learning methods : a practical study
dc.contributor.advisor | Bajo Pérez, Javier | |
dc.contributor.author | Pinilla Martínez, Fernando Javier | |
dc.contributor.other | Universidad Politécnica de Madrid. Facultad de Informática, Departamento de Inteligencia Artificial, Calle del Prof. José García Santesmases, 9, 28040 Madrid; Tel. +34913947501; secretaria@fi.upm.es | spa |
dc.date.issued | 2017 | |
dc.identifier.citation | p. 45-46 | spa |
dc.identifier.uri | http://oa.upm.es/47887/1/TFM_FERNANDO_PINILLA_MARTINEZ.pdf | spa |
dc.identifier.uri | http://hdl.handle.net/11162/190007 | |
dc.description.abstract | El aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente. | spa |
dc.format.extent | 56 p. | spa |
dc.format.medium | Digital | spa |
dc.language.iso | eng | spa |
dc.rights | Cuando no se especifique otra condición, los documentos incorporados a Redined a texto completo, se hallan bajo las condiciones de uso de sólo lectura y únicamente podrán ser citados con reconocimiento del autor(es). Para cualquier otro uso, deberá solicitarse el permiso del autor (es) | spa |
dc.subject | inteligencia artificial | spa |
dc.subject | enseñanza automatizada | spa |
dc.subject | juego educativo | spa |
dc.subject | estrategia de aprendizaje | spa |
dc.title | Research on reinforcement learning methods : a practical study | eng |
dc.type | Trabajo fin de máster | spa |
dc.audience | Profesorado | spa |
dc.bbdd | Investigaciones | spa |
dc.description.pais | ESP | spa |
dc.educationLevel | Ámbito general | spa |
dc.identifier.doi | oai:oa.upm.es:47887 | spa |
Ficheros en el ítem
Ficheros | Tamaño | Formato | Ver |
---|---|---|---|
No hay ficheros asociados a este ítem. |