Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/148726
Títol: Entrenament mitjançant aprenentatge per reforç d’un model de llenguatge per a la generació automatitzada d’aplicacions
Altres títols: Entrenament d’un gran model de llenguatge per a la generació automatitzada d’aplicacions
Autoria: Masagué Deu, Quer
Tutor: Ferrer-Mestres, Jonathan  
Altres: Baró, Xavier  
Resum: Es vol definir una estratègia que aprofiti la potència dels grans models de llenguatge per a la generació automatitzada d’aplicacions. Amb aquesta finalitat es dissenya i entrena un model de llenguatge generatiu a partir de fonts pròpies. La utilització d’aquests models en el camp del desenvolupament d’aplicacions es troba limitat al context de l'assistència, tot i que l’evolució de la seva qualitat comença a fer-los adients per automatitzar tasques d’aquest tipus. Malgrat que l’accés als grans models preentrenats s’ha privatitzat existeix una gran comunitat que treballa en versions obertes. Es proposa fer servir una d’aquestes arquitectures obertes, la nanoGPT, per entrenar un model amb aquesta finalitat. Degut a l’elevat cost de computació i els grans volums de dades requerits, s’ha hagut de multiplicar els datasets originals mitjançant plantilles. En un procés iteratiu s'han entrenat i comparat diferents configuracions dels models cercant la millora de la qualitat dels seus resultats. Gràcies a això i a l’aplicació de tècniques d’enginyeria d’indicacions s’ha arribat a assolir l’objectiu de generar petites aplicacions de forma automatitzada amb les funcionalitats i paràmetres requerits. Aplicant aquestes resultats es podria entrenar un model a partir de codi productiu per a oferir suport a una aplicació que faciliti la creació automatitzada d’aplicacions. El cost de la infraestructura necessària porta a valorar la utilització d’un model preentrenat refinat amb el codi propi resultant a més una eina que pot ser consultada directament amb llenguatge natural per a l’obtenció del programa necessari sense necessitat d’aplicació mitjancera.
Paraules clau: machine learning
natural language processing
large language model
Tipus de document: info:eu-repo/semantics/bachelorThesis
Data de publicació: jun-2023
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Bachelor thesis, research projects, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
quermdTFG0623memoria.pdfMermòria del TFG3,12 MBAdobe PDFThumbnail
Veure/Obrir
quermdTFG0623videopresentacio.mkvVídeo de la presentació90,47 MBMKVVeure/Obrir
quermdTFG0623presentacio.odpPresentació16,53 MBOpenDocument PresentationVeure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative CommonsLlicència Creative Commons Creative Commons