Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/80325
Título : | Improving term candidates selection using terminological tokens |
Autoría: | Vàzquez, Mercè Oliver, Antoni |
Citación : | Vàzquez, M.; Oliver, A. (2018). "Improving term candidates selection using terminological tokens". Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, p. 122-147. ISSN 0929-9971. DOI: 10.1075/term.00016.vaz |
Resumen : | La identificación de términos apropiados de corpus específicos de dominio utilizando métodos computacionales es una tarea que debe ser validada manualmente por especialistas, lo cual es una actividad que consume mucho tiempo. Para reducir este esfuerzo y mejorar la selección de los términos candidatos, implementamos el método Token Slot Recognition, un método de filtrado basado en tokens terminológicos que se utiliza para clasificar candidatos de términos extraídos de corpus específicos de dominio. Este artículo presenta la implementación del término con un método de filtrado de candidatos que desarrollamos en los enfoques lingüísticos y estadísticos aplicados para la extracción automática de términos utilizando varios corpus específicos de dominio en diferentes idiomas. Observamos que el método de filtrado supera la selección de candidatos a término al clasificar un mayor número de términos en la lista de candidatos a término que la frecuencia sin procesar, y para la extracción de términos estadísticos la mejora es entre 15% y 25% tanto en precisión como en recuperación. Nuestros análisis revelaron además una reducción en el número de candidatos a término para ser validados manualmente por especialistas. En conclusión, el número de candidatos a término extraídos automáticamente de corpus específicos del dominio se ha reducido significativamente utilizando el método de filtrado Token Slot Recognition, por lo que los candidatos a término pueden ser validados fácil y rápidamente por especialistas. |
Palabras clave : | extracción automática de términos tokens terminológicos método de filtrado TSR extractores de terminología corpus específicos de dominio unidades terminológicas TBXTools términos candidatos |
DOI: | 10.1075/term.00016.vaz |
Tipo de documento: | info:eu-repo/semantics/article |
Fecha de publicación : | 11-jun-2018 |
Licencia de publicación: | https://creativecommons.org/licenses/by-nc/4.0/ |
Aparece en las colecciones: | Articles Articles cientÍfics |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Vàzquez-Oliver_Improving term candidates selection using-terminological-tokens.pdf | 520,38 kB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons