Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/119886
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Alemán de León, Cristóbal Daniel | - |
dc.contributor.other | Ventura, Carles | - |
dc.date.accessioned | 2020-07-07T09:22:49Z | - |
dc.date.available | 2020-07-07T09:22:49Z | - |
dc.date.issued | 2020-06 | - |
dc.identifier.uri | http://hdl.handle.net/10609/119886 | - |
dc.description.abstract | El aprendizaje por refuerzo es una rama de la inteligencia artificial la cual estudia algoritmos capaces de hacer que los sistemas aprendan a realizar tareas automáticamente sin utilizar algoritmos tradicionales. Se basan en un sistema de recompensas donde las acciones correctas reciben una recompensa positiva. Dentro de estos algoritmos encontramos el Deep Q-Network que utiliza redes neuronales profundas para entornos complejos como son los videojuegos. La finalidad de este proyecto es la creación de un agente DQN que aprenda a superar diferentes niveles de un videojuego apoyándose en el reto propuesto por el equipo de OpenIA en 2018. En este reto se propone la creación de agentes capaces de superar niveles diferentes de los usados para entrenarlos. OpenIA nos proporciona, a partir de la librería Gym Retro, las herramientas necesarias para llevar a cabo dicho reto. Estas consisten entornos que disponen de observaciones, acciones y recompensas para superar diferentes niveles del juego Sonic the Hedgehog ¿. El agente desarrollado será finalmente capaz de tomar acciones que le permitan obtener un mayor avance horizontal dentro de cada nivel. Los entornos donde se evalúa al agente son diferentes de los entornos de entrenamiento con lo que de esta forma se comprueba en los resultados de la generalización realizada por el algoritmo de Deep Learning en un entorno desconocido. | es |
dc.description.abstract | Reinforcement learning is a branch of artificial intelligence that studies algorithms capable of making the systems learn to do tasks automatically without using traditional algorithms. They are based on an achievement system in which the right actions are positively rewarded. Within these algorithms, we can find Deep Q-Network, which uses profound neural networks for complex environments such as video games.The purpose of this project is the creation of a DQN agent that learns to overcome different levels of a video game based on the challenge proposed by the team OpenIA in 2018. In this challenge, the creation of agents able to overcome different levels than the ones used for training them is suggested. Using the Gym Retro library, OpenIA provides us with the tools needed to carry this challenge out. These tools consist of observations, actions, and rewards for completing levels of the game Sonic the Hedgehog¿. In the end, the agent developed will be able to take actions that allow it to obtain a larger horizontal movement within each level. The environments where we evaluate the agent are different from the training environment. This way, we check the results of the generalization made by the algorithm of Deep Learning in an unknown environment. | en |
dc.description.abstract | L'aprenentatge per reforç és una branca de la intel·ligència artificial la qual estudia algorismes capaços de fer que els sistemes aprenguin a fer tasques automàticament sense utilitzar algorismes tradicionals. Es basen en un sistema de recompenses on les accions correctes reben una recompensa positiva. Dins d'aquests algorismes trobem el Deep Q-Network que utilitza xarxes neuronals profundes per a entorns complexos com són els videojocs. La finalitat d'aquest projecte és la creació d'un agent DQN que aprengui a superar diferents nivells d'un videojoc secundant-se en el repte proposat per l'equip de OpenIA en 2018. En aquest repte es proposa la creació d'agents capaços de superar nivells diferents dels usats per a entrenar-los. OpenIA ens proporciona, a partir de la llibreria Gym Retro, les eines necessàries per a dur a terme aquest repte. Aquestes consisteixen entorns que disposen d'observacions, accions i recompenses per a superar diferents nivells del joc Sonic the Hedgehog ¿. L'agent desenvolupat serà finalment capaç de prendre accions que li permetin obtenir un major avanç horitzontal dins de cada nivell. Els entorns on s'avalua a l'agent són diferents dels entorns d'entrenament amb el que d'aquesta manera es comprova en els resultats de la generalització realitzada per l'algorisme de Deep Learning en un entorn desconegut. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | spa | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | aprenentatge profund | ca |
dc.subject | aprenentatge automàtic | ca |
dc.subject | aprendizaje automático | es |
dc.subject | machine learning | en |
dc.subject | artificial neural network | en |
dc.subject | red neuronal artificial | es |
dc.subject | xarxa neuronal artificial | ca |
dc.subject | aprendizaje profundo | es |
dc.subject | deep learning | en |
dc.subject.lcsh | Deep learning -- TFG | en |
dc.title | Agente Sonic. Deep reinforcement learning | - |
dc.type | info:eu-repo/semantics/bachelorThesis | - |
dc.audience.educationlevel | Estudis de Grau | ca |
dc.audience.educationlevel | Estudios de Grado | es |
dc.audience.educationlevel | University degrees | en |
dc.subject.lemac | Aprenentatge profund -- TFG | ca |
dc.subject.lcshes | Aprendizaje profundo -- TFG | es |
dc.contributor.tutor | Nuñez Do Rio, Joan Manuel | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
calemandTFG0620memoria.pdf | Memoria del TFG | 450,39 kB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons