Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/119226
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorMontufo Rosal, Jose-
dc.contributor.otherVentura, Carles-
dc.date.accessioned2020-07-02T18:58:48Z-
dc.date.available2020-07-02T18:58:48Z-
dc.date.issued2020-06-
dc.identifier.urihttp://hdl.handle.net/10609/119226-
dc.description.abstractL'aplicació de tècniques d'aprenentatge per reforç als jocs de taula ha estat l'objecte en els darrers anys de multitud de projectes entre la comunitat científica especialitzada. Les mecàniques i les regles dels jocs de taula acostumen a formar un entorn idoni per ser utilitzats com a banc de proves de les eines que proporciona l'àrea de l'aprenentatge per reforç. Aquest projecte va néixer amb la finalitat d'utilitzar el joc de cartes Sushi Go com a base per a la creació de diversos agents intel·ligents capaços d'aprendre una estratègia que els hi permeti resultar competitius a un humà. Els objectius del projecte són la comparació del rendiment que proporcionen diverses tècniques d'aprenentatge per reforç, estudiar l'estratègia òptima que utilitzen, i crear una UI que permeti els usuaris enfrontar-se als agents. Per aconseguir aquesta finalitat, s'ha modificat una implementació preexistent per construir un entorn estàndard d'OpenAI Gym per a Sushi Go. Posteriorment, s'ha utilitzat l'entorn per aplicar els diferents algoritmes d'aprenentatge en la creació dels agents. Finalment, s'ha realitzat la comparació entre els agents per determinar els algoritmes més òptims, i s'ha descrit l'estratègia que segueixen els agents amb millor rendiment. Al final del projecte, l'autor s'ha enfrontat en una sèrie de partides amb el millor agent, sent capaç de guanyar gairebé la totalitat. Aquest fet no fa més que indicar que els agents encara tenen molt marge de millora, sigui aplicant nous algoritmes, o ampliant l'espai d'estats que utilitzen per obtenir informació de l'entorn.ca
dc.description.abstractThe application of reinforcement learning techniques to board games has been the subject in recent years of many projects among the specialized scientific community. The mechanics and rules of board games tend to form an ideal environment to be used as a test bed for the tools provided by the area of reinforcement learning. This project was born in order to use the Sushi Go card game as a basis for creating various intelligent agents capable of learning a strategy that would allow them to be competitive against a human. The goals of the project are to compare performance provided by various reinforcement learning techniques, study the optimal strategy they use, and create a UI that allows users to confront agents. To achieve this goal, a pre-existing implementation has been modified to build a standard OpenAI Gym environment for Sushi Go. Subsequently, the environment has been used to apply the different learning algorithms in the creation of the agents. Finally, the comparison between the agents to determine the most optimal algorithms was performed, and the strategy followed by the best performing agents was described. At the end of the project, the author has challenged in a series of games to the best agent, being able to win almost all. This fact only indicates that agents still have much room for improvement, either by applying new algorithms, or by expanding the state space they use to obtain information from the environment.en
dc.description.abstractLa aplicación de técnicas de aprendizaje por refuerzo a los juegos de mesa ha sido objeto en los últimos años de multitud de proyectos entre la comunidad científica especializada. Las mecánicas y las reglas de los juegos de mesa suelen formar un entorno idóneo para ser utilizados como banco de pruebas de las herramientas que proporciona el área del aprendizaje por refuerzo. Este proyecto nació con el fin de utilizar el juego de cartas Sushi Go como base para la creación de diversos agentes inteligentes capaces de aprender una estrategia que les permita resultar competitivos contra un humano. Los objetivos del proyecto son la comparación del rendimiento que proporcionan las diversas técnicas del aprendizaje por refuerzo, estudiar la estrategia óptima que utilizan, y crear una UI que permita a los usuarios enfrentarse a los agentes. Para conseguir este fin, se ha modificado una implementación preexistente para construir un entorno estándar de OpenAI Gym para Sushi Go. Posteriormente, se ha utilizado el entorno para aplicar los diferentes algoritmos de aprendizaje en la creación de los agentes. Finalmente, se ha realizado la comparación entre los agentes para determinar los algoritmos más óptimos, y se ha descrito la estrategia que siguen los agentes con mejor rendimiento. Al final del proyecto, el autor se ha enfrentado en una serie de partidas con el mejor agente, siendo capaz de ganar casi la totalidad. Este hecho no hace más que indicar que los agentes todavía tienen mucho margen de mejora, sea aplicando nuevos algoritmos, o ampliando el espacio de estados que utilizan para obtener información del entorno.es
dc.format.mimetypeapplication/pdf-
dc.language.isocat-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectreinforcement learningen
dc.subjectaprenentatge per reforçca
dc.subjectaprendizaje por refuerzoes
dc.subjectOpenAIes
dc.subjectOpenAIca
dc.subjectjuegos de mesaes
dc.subjectjocs de taulaca
dc.subjectboard gamesen
dc.subjectOpenAIen
dc.subjectaprenentatge per reforçca
dc.subject.lcshArtificial intelligence -- TFGen
dc.titleAplicació de tècniques d'aprenentatge computacional per la creació d'agents jugadors de Sushi Go-
dc.typeinfo:eu-repo/semantics/bachelorThesis-
dc.audience.educationlevelEstudis de Grauca
dc.audience.educationlevelEstudios de Gradoes
dc.audience.educationlevelUniversity degreesen
dc.subject.lemacIntel·ligència artificial -- TFGca
dc.subject.lcshesInteligencia artificial -- TFGes
dc.contributor.tutorNuñez Do Rio, Joan Manuel-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jmontufoTFG0620memòria.pdfMemòria del TFG2,22 MBAdobe PDFVista previa
Visualizar/Abrir
jmontufoTFG0620presentació.pdfPresentació del TFG537,51 kBAdobe PDFVista previa
Visualizar/Abrir