Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/109799
Títol: Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan-Spanish language pair
Autoria: Farrús, Mireia  
Costa Jussà, Marta R.
Mariño, José B.
Poch Riera, Marc
Hernández Huerta, Adolfo
Henríquez, Carlos
Rodríguez Fonollosa, José A.
Altres: Universitat Oberta de Catalunya. Internet Interdisciplinary Institute (IN3)
Universitat Politècnica de Catalunya (UPC)
Citació: Farrús Cabeceran, M., Costa-Jussà, M.R., Marino, J.B., Poch, M., Hernandez, A., Henriquez, C. & Rodriguez Fonollosa, J.A. (2011). Overcoming statistical machine translation limitations: error analysis and proposed solutions for the Catalan-Spanish language pair. Language Resources and Evaluation, 45(2), 181-208. doi: 10.1007/s10579-011-9137-0
Resum: This work aims to improve an N-gram-based statistical machine translation system between the Catalan and Spanish languages, trained with an aligned Spanish-Catalan parallel corpus consisting of 1.7 million sentences taken from El Periódico newspaper. Starting from a linguistic error analysis above this baseline system, orthographic, morphological, lexical, semantic and syntactic problems are approached using a set of techniques. The proposed solutions include the development and application of additional statistical techniques, text pre- and post-processing tasks, and rules based on the use of grammatical categories, as well as lexical categorization. The performance of the improved system is clearly increased, as is shown in both human and automatic evaluations of the system, with a gain of about 1.1 points BLEU observed in the Spanish-to-Catalan direction of translation, and a gain of about 0.5 points in the reverse direction. The final system is freely available online as a linguistic resource.
Paraules clau: traducció automàtica estadística
traducció basada en n-grames
coneixements lingüístics
categories gramaticals
DOI: 10.1007/s10579-011-9137-0
Tipus de document: info:eu-repo/semantics/article
Versió del document: info:eu-repo/semantics/acceptedVersion
Data de publicació: 20-feb-2011
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Articles
Articles cientÍfics

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
Farrus_LRE_Overcoming.pdf367,31 kBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons