Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/70667
Título : Predicció de l'ús del català mitjançant la classificació supervisada
Autoría: Grimaldo Moreno, Francisco
López Iñesta, Emilia
Perucho Pla, Manel
Querol Puig, Ernest
Citación : Grimaldo, F., López-Iñesta, E., Perucho, M. & Querol Puig, E. (2016). "Predicció de l'ús del català mitjançant la classificació supervisada". Treballs de Sociolingüística Catalana, (26), pp. 181-197. ISSN 0211-0784. doi: 10.2436/20.2504.01.115
Resumen : Uno de los principales retos que ha tenido y tiene la sociología del lenguaje es averiguar cuáles son las variables que influyen en los usos lingüísticos. En la investigación que presentamos nos valemos de los métodos de un área de la inteligencia artificial, el aprendizaje automático (machine learning), que estudia la implementación de métodos computacionales que permiten inducir modelos de conocimiento a partir de información que proviene de datos de ejemplo disponibles, para averiguar si alguno de estos mejora la predicción del grado de utilización de la lengua catalana conseguida hasta ahora. Hemos utilizado tres métodos de clasificación supervisada: Naive Bayes, árboles de decisión y máquinas de vectores de soporte. Para cumplir este cometido era necesario un corpus empírico que nos permitiera tanto la comprobación del nivel de predicción de un modelo teórico como su validez en diferentes contextos sociolingüísticos. Las investigaciones que conocemos que tienen unos porcentajes más altos de predicción son las llevadas a cabo por Querol, que han sido evaluadas en todos los territorios donde se habla catalán. La investigación que hemos hecho con estos datos permite concluir que la clasificación supervisada puede servir para construir modelos de predicción del grado de uso del catalán con un porcentaje de acierto que supera los conseguidos en las investigaciones precedentes. Con lo cual podemos establecer cuáles son las variables más informativas. Además, también nos ayuda a resolver el problema metodológico de la división en grupos lingüísticos y demuestra que el uso es un sistema continuo.
Palabras clave : uso lingüístico
predicción
inteligencia artificial
aprendizaje automático
clasificación supervisada
DOI: 10.2436/20.2504.01.115
Tipo de documento: info:eu-repo/semantics/article
Fecha de publicación : ene-2016
Licencia de publicación: https://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Articles
Articles cientÍfics

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Grimaldo_TSC16_Predicció.pdf951,23 kBAdobe PDFVista previa
Visualizar/Abrir
Comparte:
Exporta:
Consulta las estadísticas

Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.