Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/148329
Títol: Entrenamiento y evaluación automática y humana de un motor de traducción automática neuronal para la traducción de textos literarios del francés al español en el marco del proyecto MTUOC
Autoria: Peñagarikano Calvo, Jon Mikel
Tutor: Rodríguez Vázquez, Silvia  
Resum: El uso de sistemas de traducción automática para traducir textos literarios ha suscitado recientemente un gran interés dados, por una parte, el potencial cada vez mayor de estos sistemas y, por otra parte, las características propias de los textos literarios, que a priori no parecen aptos para la traducción automática. En este trabajo, se crea un corpus paralelo alineado mediante el algoritmo SBERT para entrenar un motor de traducción automática neuronal especializado en la traducción de textos literarios del francés al español. El entrenamiento se lleva cabo empleando herramientas propias del proyecto MTUOC de la Universitat Oberta de Catalunya y una técnica de ponderación de oraciones para dar prioridad a los segmentos que provienen del corpus especializado, lo que supone una de las principales novedades de la investigación frente a trabajos pasados. Después, se realiza una evaluación tanto automática como humana del motor y se comparan los resultados con los de un motor entrenado previamente con un corpus especializado de menor tamaño. Pese a que las traducciones ofrecidas por el motor entrenado están lejos de alcanzar la calidad de una traducción humana, los resultados obtenidos en este estudio parecen indicar que el empleo de un corpus especializado de mayor tamaño y de una técnica de ponderación de oraciones en el proceso de entrenamiento influye de manera positiva en la calidad de las traducciones del motor.
The use of machine translation systems to translate literary texts has recently aroused great interest. This has been motivated by the increasing potential of these systems and because, theoretically, literary texts do not seem suitable for machine translation. In this paper, a parallel corpus aligned by means of the SBERT algorithm is created to train a neural machine translation engine specialized in the translation of literary texts from French into Spanish. This training is performed using tools from the MTUOC project of the Universitat Oberta de Catalunya and a sentence-weighting technique so that segments from the specialized corpus are prioritized. This represents one of the main changes when compared to previous research. Afterwards, both automatic and human evaluation of the engine are carried out and the results are compared with those of a previously trained engine with a smaller specialized corpus. Although the translations provided by the trained engine are far from reaching the quality of a human translation, the results obtained in this study seem to indicate that the use of a larger specialized corpus and a sentence-weighting technique in the training process enhances the quality of the engine's output.
Paraules clau: traducción automática neuronal
traducción literaria
corpus paralelo
entrenamiento de sistemas de traducción automática neuronal
ponderación de oraciones
evaluación automática
evaluación humana
neural machine translation
literary translation
parallel corpus
neural machine translation system training
sentence-weighting
automatic evaluation
human evaluation
Tipus de document: info:eu-repo/semantics/masterThesis
Data de publicació: jun-2023
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Trabajos finales de carrera, trabajos de investigación, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
jpenagarikanoTFM0623.pdfMemoria del TFM1,32 MBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative CommonsLlicència Creative Commons Creative Commons