Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/80325
Título : Improving term candidates selection using terminological tokens
Autoría: Vàzquez Garcia, Mercè
Oliver González, Antoni
Citación : Vàzquez, M.; Oliver, A. (2018). "Improving term candidates selection using terminological tokens". Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, p. 122-147. ISSN 0929-9971. DOI: 10.1075/term.00016.vaz
Resumen : La identificación de términos apropiados de corpus específicos de dominio utilizando métodos computacionales es una tarea que debe ser validada manualmente por especialistas, lo cual es una actividad que consume mucho tiempo. Para reducir este esfuerzo y mejorar la selección de los términos candidatos, implementamos el método Token Slot Recognition, un método de filtrado basado en tokens terminológicos que se utiliza para clasificar candidatos de términos extraídos de corpus específicos de dominio. Este artículo presenta la implementación del término con un método de filtrado de candidatos que desarrollamos en los enfoques lingüísticos y estadísticos aplicados para la extracción automática de términos utilizando varios corpus específicos de dominio en diferentes idiomas. Observamos que el método de filtrado supera la selección de candidatos a término al clasificar un mayor número de términos en la lista de candidatos a término que la frecuencia sin procesar, y para la extracción de términos estadísticos la mejora es entre 15% y 25% tanto en precisión como en recuperación. Nuestros análisis revelaron además una reducción en el número de candidatos a término para ser validados manualmente por especialistas. En conclusión, el número de candidatos a término extraídos automáticamente de corpus específicos del dominio se ha reducido significativamente utilizando el método de filtrado Token Slot Recognition, por lo que los candidatos a término pueden ser validados fácil y rápidamente por especialistas.
Palabras clave : extracción automática de términos
tokens terminológicos
método de filtrado TSR
extractores de terminología
corpus específicos de dominio
unidades terminológicas
TBXTools
términos candidatos
DOI: 10.1075/term.00016.vaz
Tipo de documento: info:eu-repo/semantics/article
Fecha de publicación : 11-jun-2018
Licencia de publicación: https://creativecommons.org/licenses/by-nc/4.0/  
Aparece en las colecciones: Articles
Articles cientÍfics

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Vàzquez-Oliver_Improving term candidates selection using-terminological-tokens.pdf520,38 kBAdobe PDFVista previa
Visualizar/Abrir