Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/119886
Títol: Agente Sonic. Deep reinforcement learning
Autoria: Alemán de León, Cristóbal Daniel
Tutor: Nuñez Do Rio, Joan Manuel
Altres: Ventura, Carles  
Resum: L'aprenentatge per reforç és una branca de la intel·ligència artificial la qual estudia algorismes capaços de fer que els sistemes aprenguin a fer tasques automàticament sense utilitzar algorismes tradicionals. Es basen en un sistema de recompenses on les accions correctes reben una recompensa positiva. Dins d'aquests algorismes trobem el Deep Q-Network que utilitza xarxes neuronals profundes per a entorns complexos com són els videojocs. La finalitat d'aquest projecte és la creació d'un agent DQN que aprengui a superar diferents nivells d'un videojoc secundant-se en el repte proposat per l'equip de OpenIA en 2018. En aquest repte es proposa la creació d'agents capaços de superar nivells diferents dels usats per a entrenar-los. OpenIA ens proporciona, a partir de la llibreria Gym Retro, les eines necessàries per a dur a terme aquest repte. Aquestes consisteixen entorns que disposen d'observacions, accions i recompenses per a superar diferents nivells del joc Sonic the Hedgehog ¿. L'agent desenvolupat serà finalment capaç de prendre accions que li permetin obtenir un major avanç horitzontal dins de cada nivell. Els entorns on s'avalua a l'agent són diferents dels entorns d'entrenament amb el que d'aquesta manera es comprova en els resultats de la generalització realitzada per l'algorisme de Deep Learning en un entorn desconegut.
Paraules clau: aprenentatge profund
aprenentatge automàtic
xarxa neuronal artificial
Tipus de document: info:eu-repo/semantics/bachelorThesis
Data de publicació: jun-2020
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Bachelor thesis, research projects, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
calemandTFG0620memoria.pdfMemoria del TFG450,39 kBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons