Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/75868
Registre complet de metadades
Camp DC | Valor | Llengua/Idioma |
---|---|---|
dc.contributor.author | Oliver, Antoni | - |
dc.date.accessioned | 2018-04-05T16:51:17Z | - |
dc.date.available | 2018-04-05T16:51:17Z | - |
dc.date.issued | 2017 | - |
dc.identifier.citation | Oliver González, A.(2017)"El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya", Zeitschrift für Katalanistik/Revista d'Estudis Catalans, 30, p.269-291.I SSN 0932-2221 | - |
dc.identifier.issn | 0932-2221MIAR | - |
dc.identifier.uri | http://hdl.handle.net/10609/75868 | - |
dc.description.abstract | In this paper the process of compilation of the parallel corpus from the Official Diary of the Catalan Government (DOGC) is presented. It describes the downloading process, the tools and processes for the treatment and linguistic analysis. The final result is a big parallel corpus that is freely available in several formats and with several annotation levels. This corpus is a very valuable resource for different applications. As example, three possible fields of application are described: as a translation memory to be used in a Computer-Assisted Translation tool; for terminology extraction and query and for training statistical machine translation systems. | en |
dc.description.abstract | En este trabajo se presenta el proceso de compilación del corpus paralelo del Diario Oficial de la Generalitat de Catalunya (DOGC). Describe el proceso de descarga, las herramientas y los procesos para el tratamiento y el análisis lingüístico. El resultado final es un gran corpus paralelo que está disponible gratuitamente en varios formatos y con varios niveles de anotación. Este corpus es un recurso muy valioso para diferentes aplicaciones. Como ejemplo, se describen tres posibles campos de aplicación: como una memoria de traducción para ser utilizada en una herramienta de traducción asistida por computadora; para la extracción y consulta de terminología y para la formación de sistemas estadísticos de traducción automática. | es |
dc.description.abstract | En aquest treball es presenta el procés de compilació del corpus paral·lel del Diari Oficial de la Generalitat de Catalunya (DOGC). Descriu el procés de descàrrega, les eines i els processos per al tractament i l'anàlisi lingüística. El resultat final és un gran corpus paral·lel que està disponible gratuïtament en diversos formats i amb diversos nivells d'anotació. Aquest corpus és un recurs molt valuós per a diferents aplicacions. Com a exemple, es descriuen tres possibles camps d'aplicació: com una memòria de traducció per ser utilitzada en una eina de traducció assistida per computadora; per a l'extracció i consulta de terminologia i per a la formació de sistemes estadístics de traducció automàtica. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | cat | - |
dc.publisher | Zeitschrift für Katalanistik/Revista d'Estudis Catalans | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | parallel corpus | en |
dc.subject | translation memory | en |
dc.subject | terminology extraction | en |
dc.subject | statistical machine translation | en |
dc.subject | natural language processing | en |
dc.subject | corpus paralelo | es |
dc.subject | corpus paral·lel | ca |
dc.subject | memoria de traducción | es |
dc.subject | memòria de traducció | ca |
dc.subject | extractores de terminología | es |
dc.subject | extractors de terminologia | ca |
dc.subject | traducción automática estadística | es |
dc.subject | traducció automàtica estadística | ca |
dc.subject | procesamiento de lenguajes naturales | es |
dc.subject | processament de llenguatges naturals | ca |
dc.subject.lcsh | Terms and phrases | en |
dc.title | El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya | - |
dc.type | info:eu-repo/semantics/article | - |
dc.audience.mediator | Theme areas::Arts and Humanities | - |
dc.subject.lemac | Terminologia | ca |
dc.subject.lcshes | Terminología | es |
dc.gir.id | AR/0000004954 | - |
Apareix a les col·leccions: | Articles Articles cientÍfics |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
16_Oliver.pdf | Article Zeitschrift für Katalanistik | 546,07 kB | Adobe PDF | Veure/Obrir |
Comparteix:
Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons