Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/122766
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Barajas Higuera, Daniel | - |
dc.date.accessioned | 2020-09-23T19:16:09Z | - |
dc.date.available | 2020-09-23T19:16:09Z | - |
dc.date.issued | 2020-09-15 | - |
dc.identifier.uri | http://hdl.handle.net/10609/122766 | - |
dc.description.abstract | En este proyecto se experimentó con algoritmos de aprendizaje por refuerzo jugando Donkey Kong, Ice Climber, Kung Fu, Super Mario Bros y Metroid de la consola NES. El algoritmo DQN y sus variantes como Doble DQN y Dueling DQN fueron usados para experimentar con la representación de estados mediante la RAM. Se proponen algunas estrategias para reducir la dimensionalidad de los estados y las acciones. También se proponen funciones de recompensa para crear un agente fácil de entrenar con pocos recursos computacionales. Se probaron dos maneras de reducir la dimensión de la RAM, el mapa de la RAM funcionó bien sólo en fase de entrenamiento mientras que el método de los bytes activados consiguió mejores resultados. | es |
dc.description.abstract | In this project, reinforcement learning algorithms are explored to play the games Donkey Kong, Ice Climber, Kung Fu, Super Mario Bros, and Metroid from the NES console. The Deep-Q learning algorithm is used to experiment with the RAM representation of the state. DQN algorithm extensions as Double DQN and Dueling Network Architectures are explored too. Some simple strategies to reduce the state-space and action-space are proposed in addition to reward functions to create an easy to train agent with low computational resources. Two ways to reduce the RAM representation of the state were tested, RAM map method worked well just in the training phase meanwhile the activated bytes method get better results also in gameplay. | en |
dc.description.abstract | En aquest projecte es va experimentar amb algorismes d'aprenentatge per reforç jugant Donkey Kong, Hissi Climber, Kung Fu, Super Mario Bros i Metroid de la consola NES. L'algorisme DQN i les seves variants com a Doble DQN i Dueling DQN van ser usats per a experimentar amb la representació d'estats mitjançant la RAM. Es proposen algunes estratègies per a reduir la dimensionalitat dels estats i les accions. També es proposen funcions de recompensa per a crear un agent fàcil d'entrenar amb pocs recursos computacionals. Es van provar dues maneres de reduir la dimensió de la RAM, el mapa de la RAM va funcionar bé només en fase d'entrenament mentre que el mètode dels bytes activats va aconseguir millors resultats. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | spa | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | RAM | es |
dc.subject | RAM | en |
dc.subject | Q-learning profund | ca |
dc.subject | Q-learning profundo | es |
dc.subject | deep Q-learning | en |
dc.subject | RAM | ca |
dc.subject | NES | ca |
dc.subject | NES | es |
dc.subject | NES | en |
dc.subject.lcsh | Machine learning -- TFM | en |
dc.title | Aprendiendo de la memoria RAM de la NES | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | - |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Aprenentatge automàtic -- TFM | ca |
dc.subject.lcshes | Aprendizaje automático -- TFM | es |
dc.contributor.director | Ventura, Carles | - |
dc.contributor.tutor | Kanaan-Izquierdo, Samir | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
dbarajasTFM0920memoria.pdf | Memoria del TFM | 12,3 MB | Adobe PDF | ![]() Visualizar/Abrir |
Comparte:


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons