Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/149208
Título : El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya
Otros títulos : The parallel corpus of the Official Journal of the Catalan Government
Autoría: Oliver, Antoni  
Citación : Oliver González, A. [Antoni]. (2023). El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya. Linguamática, 14(2), 75-81. doi: 10.21814/lm.14.2.380
Resumen : En aquest article presentem el procés de compilació de la nova versió del corpus paral·lel català-castellà creat a partir dels textos del Diari Oficial de la Generalitat de Catalunya (DOGC). Es descriuen els processos de descàrrega, conversió a text, segmentació i alineació automàtica. Tots els programes que s'han desenvolupat per dur a terme aquests processos es distribueixen amb una llicència lliure i el corpus compilat es pot descarregar lliurement. A més, es descriu el procés d'entrenament i avaluació de dos motors de traducció automàtica neuronal català-castellà i castellà-català que s'ha dut a terme fent servir aquest corpus paral·el.
In this paper, the process of compilation of thenew version of the Catalan–Spanish parallel corpusof the Official Journal of the Catalan Government (DOGC) is presented. The processes of downloading,conversion to text, segmentation and automatic align-ment are described. All the programs that have beendeveloped to perform these processes are distributedunder a free license and the compiled corpus can befreely downloaded. Furthermore, the process of trai-ning and evaluation of two neural machine transla-tion systems, Catalan–Spanish and Spanish–Catalan,using this corpus is presented.
Palabras clave : corpus paral.lel
traducció automàtica neuronal
parallel corpus
neural machine translation
DOI: https://doi.org/10.21814/lm.14.2.380
Tipo de documento: info:eu-repo/semantics/article
Versión del documento: info:eu-repo/semantics/publishedVersion
Fecha de publicación : 31-dic-2022
Licencia de publicación: https://creativecommons.org/licenses/by/4.0/  
Aparece en las colecciones: Articles
Articles cientÍfics

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Oliver_l_corpus.pdf388,64 kBAdobe PDFVista previa
Visualizar/Abrir
Comparte:
Exporta:
Consulta las estadísticas

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons