Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/75868
Títol: El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya
Autoria: Oliver González, Antoni
Citació: Oliver González, A.(2017)"El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya", Zeitschrift für Katalanistik/Revista d'Estudis Catalans, 30, p.269-291.I SSN 0932-2221
Resum: En aquest treball es presenta el procés de compilació del corpus paral·lel del Diari Oficial de la Generalitat de Catalunya (DOGC). Descriu el procés de descàrrega, les eines i els processos per al tractament i l'anàlisi lingüística. El resultat final és un gran corpus paral·lel que està disponible gratuïtament en diversos formats i amb diversos nivells d'anotació. Aquest corpus és un recurs molt valuós per a diferents aplicacions. Com a exemple, es descriuen tres possibles camps d'aplicació: com una memòria de traducció per ser utilitzada en una eina de traducció assistida per computadora; per a l'extracció i consulta de terminologia i per a la formació de sistemes estadístics de traducció automàtica.
Paraules clau: corpus paral·lel
memòria de traducció
extractors de terminologia
traducció automàtica estadística
processament de llenguatges naturals
Tipus de document: info:eu-repo/semantics/article
Data de publicació: 2017
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Articles
Articles cientÍfics

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
16_Oliver.pdfArticle Zeitschrift für Katalanistik546,07 kBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons