Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/119086
Títol: Desarrollo de un agente mediante Deep Q-Learning en un entorno de juegos de plataformas
Autoria: Buedo Risueño, Álvaro
Director: Ventura, Carles  
Tutor: Kanaan-Izquierdo, Samir  
Resum: Avui dia cada vegada és més freqüent la interacció entre les persones i els sistemes informàtics, per la qual cosa les tècniques d'aprenentatge màquina cada vegada són més rellevants i necessàries en les nostres vides ja que poden tenir aplicació en gairebé qualsevol àmbit. Aquest projecte de recerca consisteix en l'aplicació de la tècnica d'aprenentatge per reforç profund al joc de plataformes "Super Mario Bros". Concretament, en el projecte es desenvolupa la implementació de l'algorisme Q-Learning, un dels algorismes més famosos dins de la tècnica de l'aprenentatge per reforç. A més de l'aprenentatge per reforç, a causa de la complexitat del problema, s'han introduït xarxes neuronals convolucionals, desenvolupant així el que es coneix com a aprenentatge per reforç profund (DQN) Amb l'ús d'aquest algorisme es pretén aconseguir que el personatge del videojoc sigui capaç de superar els nivells que se li plantegin sobre la base de l'experiència obtinguda al llarg de la seva exploració d'aquests nivells. Per a implementar aquest algorisme s'ha utilitzat el llenguatge de programació Python, que és el més potent per al desenvolupament de sistemes de intel·ligència artificial, amb les seves llibreries TensorFlow i Keras per a la implementació de les xarxes neuronals Al llarg de la memòria s'exposa tant l'anàlisi, disseny i implementació del sistema, com la presentació dels resultats obtinguts i la seva interpretació. Per a finalitzar el treball es descriu la sèrie de conclusions obtingudes juntament amb el plantejament del possible treball futur a manera d'ampliació i millora d'aquest.
Paraules clau: xarxes neuronals
aprenentatge per reforç
aprenentatge profund
Tipus de document: info:eu-repo/semantics/masterThesis
Data de publicació: jun-2020
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Bachelor thesis, research projects, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
abuedorTFM0620memoria.pdfMemoria del TFM1,56 MBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons