Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/63605
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Bermejo Fernández, Eduard | - |
dc.contributor.other | Universitat Oberta de Catalunya | - |
dc.date.accessioned | 2017-06-16T11:01:10Z | - |
dc.date.available | 2017-06-16T11:01:10Z | - |
dc.date.issued | 2017-05-31 | - |
dc.identifier.uri | http://hdl.handle.net/10609/63605 | - |
dc.description.abstract | Este proyecto centra sus esfuerzos en hacer un repaso de la literatura existente sobre Reinforcement Learning así como aplicar los algoritmos de este campo a juegos sencillos. Se ha utilizado el toolkit OpenAI Gym que contiene el emulador de ATARI para realizar los experimentos. Los juegos utilizados son BlackJack, FrozenLake, MountainCar, Breakout y Pong. Desde los algoritmos más sencillos a los más complejos, se observa que cada uno de ellos puede aplicarse sobre diferentes problemas y que dependiendo de la naturaleza y complejidad del problema unos funcionan mejor que otros. | es |
dc.description.abstract | Aquest projecte centra els seus esforços a fer un repàs de la literatura existent sobre Reinforcement Learning així com aplicar els algorismes d'aquest camp a jocs senzills. S'ha utilitzat el toolkit OpenAI Gym que conté l'emulador de ATARI per a realitzar els experiments. Els jocs utilitzats són BlackJack, FrozenLake, MountainCar, Breakout i Pong. Des dels algorismes més senzills als més complexos, s'observa que cadascun d'ells pot aplicar-se sobre diferents problemes i que depenent de la naturalesa i complexitat del problema uns funcionen millor que uns altres. | ca |
dc.description.abstract | This project focuses its efforts on reviewing the existing literature on Reinforcement Learning as well as applying the algorithms of this field to simple games. The OpenAI Gym toolkit containing the ATARI emulator has been used to perform the experiments. The games used are BlackJack, FrozenLake, MountainCar, Breakout and Pong. From the simplest algorithms to the most complex ones, it¿s been observed that each of them can be applied on different problems and depending on the nature and complexity of the problem some might work better than others. | en |
dc.language.iso | spa | - |
dc.publisher | Universitat Oberta de Catalunya | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | machine learning | en |
dc.subject | reinforcement learning | en |
dc.subject | aprendizaje automático | es |
dc.subject | aprenentatge automàtic | ca |
dc.subject | aprendizaje por refuerzo autónomo | es |
dc.subject | aprenentatge per reforç autònom | ca |
dc.subject | algorismes | ca |
dc.subject | algorithms | en |
dc.subject | algoritmos | es |
dc.subject.lcsh | Computer algorithms -- TFM | en |
dc.title | Aplicación de algoritmos de reinforcement learning a juegos | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.subject.lemac | Algorismes computacionals -- TFM | ca |
dc.subject.lcshes | Algoritmos computacionales -- TFM | es |
dc.contributor.tutor | Kanaan-Izquierdo, Samir | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
ebermejofTFM0617memòria.pdf | Memoria del trabajo fin de máster | 1,98 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons