Agente Sonic. Deep reinforcement learning

Alemán de León, Cristóbal Daniel

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/119886

Título :	Agente Sonic. Deep reinforcement learning
Autoría:	Alemán de León, Cristóbal Daniel
Tutor:	Nuñez Do Rio, Joan Manuel
Otros:	Ventura, Carles
Resumen :	El aprendizaje por refuerzo es una rama de la inteligencia artificial la cual estudia algoritmos capaces de hacer que los sistemas aprendan a realizar tareas automáticamente sin utilizar algoritmos tradicionales. Se basan en un sistema de recompensas donde las acciones correctas reciben una recompensa positiva. Dentro de estos algoritmos encontramos el Deep Q-Network que utiliza redes neuronales profundas para entornos complejos como son los videojuegos. La finalidad de este proyecto es la creación de un agente DQN que aprenda a superar diferentes niveles de un videojuego apoyándose en el reto propuesto por el equipo de OpenIA en 2018. En este reto se propone la creación de agentes capaces de superar niveles diferentes de los usados para entrenarlos. OpenIA nos proporciona, a partir de la librería Gym Retro, las herramientas necesarias para llevar a cabo dicho reto. Estas consisten entornos que disponen de observaciones, acciones y recompensas para superar diferentes niveles del juego Sonic the Hedgehog ¿. El agente desarrollado será finalmente capaz de tomar acciones que le permitan obtener un mayor avance horizontal dentro de cada nivel. Los entornos donde se evalúa al agente son diferentes de los entornos de entrenamiento con lo que de esta forma se comprueba en los resultados de la generalización realizada por el algoritmo de Deep Learning en un entorno desconocido.
Palabras clave :	aprendizaje automático red neuronal artificial aprendizaje profundo
Tipo de documento:	info:eu-repo/semantics/bachelorThesis
Fecha de publicación :	jun-2020
Licencia de publicación:	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Aparece en las colecciones:	Bachelor thesis, research projects, etc.