Entrenament mitjançant aprenentatge per reforç d’un model de llenguatge per a la generació automatitzada d’aplicacions

Masagué Deu, Quer

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/148726

Títol:	Entrenament mitjançant aprenentatge per reforç d’un model de llenguatge per a la generació automatitzada d’aplicacions
Altres títols:	Entrenament d’un gran model de llenguatge per a la generació automatitzada d’aplicacions
Autoria:	Masagué Deu, Quer
Tutor:	Ferrer-Mestres, Jonathan
Altres:	Baró, Xavier
Resum:	Es vol definir una estratègia que aprofiti la potència dels grans models de llenguatge per a la generació automatitzada d’aplicacions. Amb aquesta finalitat es dissenya i entrena un model de llenguatge generatiu a partir de fonts pròpies. La utilització d’aquests models en el camp del desenvolupament d’aplicacions es troba limitat al context de l'assistència, tot i que l’evolució de la seva qualitat comença a fer-los adients per automatitzar tasques d’aquest tipus. Malgrat que l’accés als grans models preentrenats s’ha privatitzat existeix una gran comunitat que treballa en versions obertes. Es proposa fer servir una d’aquestes arquitectures obertes, la nanoGPT, per entrenar un model amb aquesta finalitat. Degut a l’elevat cost de computació i els grans volums de dades requerits, s’ha hagut de multiplicar els datasets originals mitjançant plantilles. En un procés iteratiu s'han entrenat i comparat diferents configuracions dels models cercant la millora de la qualitat dels seus resultats. Gràcies a això i a l’aplicació de tècniques d’enginyeria d’indicacions s’ha arribat a assolir l’objectiu de generar petites aplicacions de forma automatitzada amb les funcionalitats i paràmetres requerits. Aplicant aquestes resultats es podria entrenar un model a partir de codi productiu per a oferir suport a una aplicació que faciliti la creació automatitzada d’aplicacions. El cost de la infraestructura necessària porta a valorar la utilització d’un model preentrenat refinat amb el codi propi resultant a més una eina que pot ser consultada directament amb llenguatge natural per a l’obtenció del programa necessari sense necessitat d’aplicació mitjancera.
Paraules clau:	machine learning natural language processing large language model
Tipus de document:	info:eu-repo/semantics/bachelorThesis
Data de publicació:	jun-2023
Llicència de publicació:	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Apareix a les col·leccions:	Bachelor thesis, research projects, etc.

Arxius per aquest ítem:

Arxiu	Descripció	Mida	Format
quermdTFG0623memoria.pdf	Mermòria del TFG	3,12 MB	Adobe PDF	Veure/Obrir
quermdTFG0623videopresentacio.mkv	Vídeo de la presentació	90,47 MB	MKV	Veure/Obrir
quermdTFG0623presentacio.odp	Presentació	16,53 MB	OpenDocument Presentation	Veure/Obrir

Mostrar el registre complet de l'ítem

Comparteix:

Impacte:

Google Scholar

Microsoft Academic

Exporta:

Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative CommonsLlicència Creative Commons