Please use this identifier to cite or link to this item: http://hdl.handle.net/10609/149208
Full metadata record
DC FieldValueLanguage
dc.contributor.authorOliver, Antoni-
dc.date.accessioned2023-11-16T12:18:45Z-
dc.date.available2023-11-16T12:18:45Z-
dc.date.issued2022-12-31-
dc.identifier.citationOliver González, A. [Antoni]. (2023). El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya. Linguamática, 14(2), 75-81. doi: 10.21814/lm.14.2.380-
dc.identifier.issn1647-0818MIAR
-
dc.identifier.urihttp://hdl.handle.net/10609/149208-
dc.description.abstractEn aquest article presentem el procés de compilació de la nova versió del corpus paral·lel català-castellà creat a partir dels textos del Diari Oficial de la Generalitat de Catalunya (DOGC). Es descriuen els processos de descàrrega, conversió a text, segmentació i alineació automàtica. Tots els programes que s'han desenvolupat per dur a terme aquests processos es distribueixen amb una llicència lliure i el corpus compilat es pot descarregar lliurement. A més, es descriu el procés d'entrenament i avaluació de dos motors de traducció automàtica neuronal català-castellà i castellà-català que s'ha dut a terme fent servir aquest corpus paral·el.ca
dc.description.abstractIn this paper, the process of compilation of thenew version of the Catalan–Spanish parallel corpusof the Official Journal of the Catalan Government (DOGC) is presented. The processes of downloading,conversion to text, segmentation and automatic align-ment are described. All the programs that have beendeveloped to perform these processes are distributedunder a free license and the compiled corpus can befreely downloaded. Furthermore, the process of trai-ning and evaluation of two neural machine transla-tion systems, Catalan–Spanish and Spanish–Catalan,using this corpus is presented.en
dc.format.mimetypeapplication/pdfca
dc.language.isocatca
dc.publisherUniversidade do Minhoca
dc.relation.ispartofLinguamática, 2023, 14(2)ca
dc.relation.urihttps://www.linguamatica.com/index.php/linguamatica/article/view/380-
dc.rightsCC BY-
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/-
dc.subjectcorpus paral.lelca
dc.subjecttraducció automàtica neuronalca
dc.subjectparallel corpusen
dc.subjectneural machine translationen
dc.titleEl corpus paral·lel del Diari Oficial de la Generalitat de Catalunyaca
dc.title.alternativeThe parallel corpus of the Official Journal of the Catalan Governmenten
dc.typeinfo:eu-repo/semantics/articleca
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
dc.identifier.doihttps://doi.org/10.21814/lm.14.2.380-
dc.gir.idAR/0000010314-
dc.type.versioninfo:eu-repo/semantics/publishedVersion-
Appears in Collections:Articles
Articles cientÍfics

Files in This Item:
File Description SizeFormat 
Oliver_l_corpus.pdf388,64 kBAdobe PDFThumbnail
View/Open
Share:
Export:
View statistics

This item is licensed under aCreative Commons License Creative Commons