Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/119226
Título : Aplicació de tècniques d'aprenentatge computacional per la creació d'agents jugadors de Sushi Go
Autoría: Montufo Rosal, Jose
Tutor: Nuñez Do Rio, Joan Manuel
Otros: Ventura, Carles  
Resumen : La aplicación de técnicas de aprendizaje por refuerzo a los juegos de mesa ha sido objeto en los últimos años de multitud de proyectos entre la comunidad científica especializada. Las mecánicas y las reglas de los juegos de mesa suelen formar un entorno idóneo para ser utilizados como banco de pruebas de las herramientas que proporciona el área del aprendizaje por refuerzo. Este proyecto nació con el fin de utilizar el juego de cartas Sushi Go como base para la creación de diversos agentes inteligentes capaces de aprender una estrategia que les permita resultar competitivos contra un humano. Los objetivos del proyecto son la comparación del rendimiento que proporcionan las diversas técnicas del aprendizaje por refuerzo, estudiar la estrategia óptima que utilizan, y crear una UI que permita a los usuarios enfrentarse a los agentes. Para conseguir este fin, se ha modificado una implementación preexistente para construir un entorno estándar de OpenAI Gym para Sushi Go. Posteriormente, se ha utilizado el entorno para aplicar los diferentes algoritmos de aprendizaje en la creación de los agentes. Finalmente, se ha realizado la comparación entre los agentes para determinar los algoritmos más óptimos, y se ha descrito la estrategia que siguen los agentes con mejor rendimiento. Al final del proyecto, el autor se ha enfrentado en una serie de partidas con el mejor agente, siendo capaz de ganar casi la totalidad. Este hecho no hace más que indicar que los agentes todavía tienen mucho margen de mejora, sea aplicando nuevos algoritmos, o ampliando el espacio de estados que utilizan para obtener información del entorno.
Palabras clave : aprendizaje por refuerzo
OpenAI
juegos de mesa
Tipo de documento: info:eu-repo/semantics/bachelorThesis
Fecha de publicación : jun-2020
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jmontufoTFG0620memòria.pdfMemòria del TFG2,22 MBAdobe PDFVista previa
Visualizar/Abrir
jmontufoTFG0620presentació.pdfPresentació del TFG537,51 kBAdobe PDFVista previa
Visualizar/Abrir