Show simple item record

dc.contributor.advisorBajo Pérez, Javier
dc.contributor.authorPinilla Martínez, Fernando Javier
dc.contributor.otherUniversidad Politécnica de Madrid. Facultad de Informática, Departamento de Inteligencia Artificial, Calle del Prof. José García Santesmases, 9, 28040 Madrid; Tel. +34913947501; secretaria@fi.upm.esspa
dc.date.issued2017
dc.identifier.citationp. 45-46spa
dc.identifier.urihttp://oa.upm.es/47887/1/TFM_FERNANDO_PINILLA_MARTINEZ.pdfspa
dc.identifier.urihttp://hdl.handle.net/11162/190007
dc.description.abstractEl aprendizaje por refuerzo ha mejorado significativamente en las últimas décadas, haciendo importantes contribuciones a una amplia gama de campos en Inteligencia Artificial. Mientras que la investigación en este campo ha crecido considerablemente, algunos de los proyectos más impactantes han demostrado la eficacia de las metodologías y los principios del aprendizaje por refuerzo cuando se combinan con otros métodos como las cada vez más importantes redes neuronales artificiales. Un ejemplo de esto es la codificación de un agente de inteligencia artificial que logra resultados sobrehumanos en diferentes tareas como juego de mesa o visión por computador. El objetivo principal de este proyecto es adquirir un conocimiento y comprensión profundos acerca de las ventajas y desventajas del aprendizaje por refuerzo en contraste con otros campos comunes en aprendizaje automático como el aprendizaje supervisado y el aprendizaje no supervisado. El presente proyecto estudia el aprendizaje por refuerzo a partir de sus principios básicos y presenta algunos de los métodos y algoritmos más avanzados. Una implementación de un algoritmo de aprendizaje de refuerzo es llevada a cabo para resolver un simple problema de encontrar las mejores acciones en el juego de mesa Tic-Tac-Toe, utilizando uno de los algoritmos más relevantes en la materia llamado Q-Learning. Se presentan otras características interesantes sobre el aprendizaje por refuerzo junto con las principales líneas abiertas de investigación que se están estudiando actualmente.spa
dc.format.extent56 p.spa
dc.format.mediumDigitalspa
dc.language.isoengspa
dc.rightsCuando no se especifique otra condición, los documentos incorporados a Redined a texto completo, se hallan bajo las condiciones de uso de sólo lectura y únicamente podrán ser citados con reconocimiento del autor(es). Para cualquier otro uso, deberá solicitarse el permiso del autor (es)spa
dc.subjectinteligencia artificialspa
dc.subjectenseñanza automatizadaspa
dc.subjectjuego educativospa
dc.subjectestrategia de aprendizajespa
dc.titleResearch on reinforcement learning methods : a practical studyeng
dc.typeTrabajo fin de másterspa
dc.audienceProfesoradospa
dc.bbddInvestigacionesspa
dc.description.paisESPspa
dc.educationLevelÁmbito generalspa
dc.identifier.doioai:oa.upm.es:47887spa


Files in this item

FilesSizeFormatView

There are no files associated with this item.

    Show simple item record