Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/119086
Títol: | Desarrollo de un agente mediante Deep Q-Learning en un entorno de juegos de plataformas |
Autoria: | Buedo Risueño, Álvaro |
Director: | Ventura, Carles ![]() |
Tutor: | Kanaan-Izquierdo, Samir ![]() |
Resum: | Avui dia cada vegada és més freqüent la interacció entre les persones i els sistemes informàtics, per la qual cosa les tècniques d'aprenentatge màquina cada vegada són més rellevants i necessàries en les nostres vides ja que poden tenir aplicació en gairebé qualsevol àmbit. Aquest projecte de recerca consisteix en l'aplicació de la tècnica d'aprenentatge per reforç profund al joc de plataformes "Super Mario Bros". Concretament, en el projecte es desenvolupa la implementació de l'algorisme Q-Learning, un dels algorismes més famosos dins de la tècnica de l'aprenentatge per reforç. A més de l'aprenentatge per reforç, a causa de la complexitat del problema, s'han introduït xarxes neuronals convolucionals, desenvolupant així el que es coneix com a aprenentatge per reforç profund (DQN) Amb l'ús d'aquest algorisme es pretén aconseguir que el personatge del videojoc sigui capaç de superar els nivells que se li plantegin sobre la base de l'experiència obtinguda al llarg de la seva exploració d'aquests nivells. Per a implementar aquest algorisme s'ha utilitzat el llenguatge de programació Python, que és el més potent per al desenvolupament de sistemes de intel·ligència artificial, amb les seves llibreries TensorFlow i Keras per a la implementació de les xarxes neuronals Al llarg de la memòria s'exposa tant l'anàlisi, disseny i implementació del sistema, com la presentació dels resultats obtinguts i la seva interpretació. Per a finalitzar el treball es descriu la sèrie de conclusions obtingudes juntament amb el plantejament del possible treball futur a manera d'ampliació i millora d'aquest. |
Paraules clau: | xarxes neuronals aprenentatge per reforç aprenentatge profund |
Tipus de document: | info:eu-repo/semantics/masterThesis |
Data de publicació: | jun-2020 |
Llicència de publicació: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ ![]() |
Apareix a les col·leccions: | Bachelor thesis, research projects, etc. |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
abuedorTFM0620memoria.pdf | Memoria del TFM | 1,56 MB | Adobe PDF | ![]() Veure/Obrir |
Comparteix:


Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons