Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/80325
Títol: Improving term candidates selection using terminological tokens
Autoria: Vàzquez Garcia, Mercè
Oliver González, Antoni
Citació: Vàzquez, M.; Oliver, A. (2018). "Improving term candidates selection using terminological tokens". Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, p. 122-147. ISSN 0929-9971. DOI: 10.1075/term.00016.vaz
Resum: La identificació de termes apropiats de corpus específics de domini utilitzant mètodes computacionals és una tasca que ha de ser validada manualment per especialistes, la qual cosa és una activitat que consumeix molt temps. Per reduir aquest esforç i millorar la selecció dels termes candidats, implementem el mètode Token Slot Recognition, un mètode de filtrat basat en tokens terminològics que s'utilitza per classificar candidats de termes extrets de corpus específics de domini. Aquest article presenta la implementació del terme amb un mètode de filtrat de candidats que desenvolupem en els enfocaments lingüístics i estadístics aplicats per a l'extracció automàtica de termes utilitzant diversos corpus específics de domini en diferents idiomes. Observem que el mètode de filtrat supera la selecció de candidats a terme en classificar un major nombre de termes en la llista de candidats a terme que la freqüència sense processar, i per a l'extracció de termes estadístics la millora és entre 15% i 25% tant en precisió com en recuperació. Les nostres anàlisis van revelar a més una reducció en el nombre de candidats a terme per ser validats manualment per especialistes. En conclusió, el nombre de candidats a terme extrets automàticament de corpus específics del domini s'ha reduït significativament utilitzant el mètode de filtrat Token Slot Recognition, per la qual cosa els candidats a terme poden ser validats fàcil i ràpidament per especialistes.
Paraules clau: extracció automàtica de termes
tokens terminològics
mètode de filtrat TSR
extractors de terminologia
corpus específics de domini
unitats terminològiques
TBXTools
termes candidats
DOI: 10.1075/term.00016.vaz
Tipus de document: info:eu-repo/semantics/article
Data de publicació: 11-jun-2018
Llicència de publicació: https://creativecommons.org/licenses/by-nc/4.0/  
Apareix a les col·leccions:Articles
Articles cientÍfics

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
Vàzquez-Oliver_Improving term candidates selection using-terminological-tokens.pdf520,38 kBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons