Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/80325
Títol: | Improving term candidates selection using terminological tokens |
Autoria: | Vàzquez Garcia, Mercè Oliver González, Antoni |
Citació: | Vàzquez, M.; Oliver, A. (2018). "Improving term candidates selection using terminological tokens". Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication, p. 122-147. ISSN 0929-9971. DOI: 10.1075/term.00016.vaz |
Resum: | La identificació de termes apropiats de corpus específics de domini utilitzant mètodes computacionals és una tasca que ha de ser validada manualment per especialistes, la qual cosa és una activitat que consumeix molt temps. Per reduir aquest esforç i millorar la selecció dels termes candidats, implementem el mètode Token Slot Recognition, un mètode de filtrat basat en tokens terminològics que s'utilitza per classificar candidats de termes extrets de corpus específics de domini. Aquest article presenta la implementació del terme amb un mètode de filtrat de candidats que desenvolupem en els enfocaments lingüístics i estadístics aplicats per a l'extracció automàtica de termes utilitzant diversos corpus específics de domini en diferents idiomes. Observem que el mètode de filtrat supera la selecció de candidats a terme en classificar un major nombre de termes en la llista de candidats a terme que la freqüència sense processar, i per a l'extracció de termes estadístics la millora és entre 15% i 25% tant en precisió com en recuperació. Les nostres anàlisis van revelar a més una reducció en el nombre de candidats a terme per ser validats manualment per especialistes. En conclusió, el nombre de candidats a terme extrets automàticament de corpus específics del domini s'ha reduït significativament utilitzant el mètode de filtrat Token Slot Recognition, per la qual cosa els candidats a terme poden ser validats fàcil i ràpidament per especialistes. |
Paraules clau: | extracció automàtica de termes tokens terminològics mètode de filtrat TSR extractors de terminologia corpus específics de domini unitats terminològiques TBXTools termes candidats |
DOI: | 10.1075/term.00016.vaz |
Tipus de document: | info:eu-repo/semantics/article |
Data de publicació: | 11-jun-2018 |
Llicència de publicació: | https://creativecommons.org/licenses/by-nc/4.0/ |
Apareix a les col·leccions: | Articles Articles cientÍfics |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
Vàzquez-Oliver_Improving term candidates selection using-terminological-tokens.pdf | 520,38 kB | Adobe PDF | Veure/Obrir |
Comparteix:
Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons