Análisis de sentimientos aplicado a la opinión política en Twitter: un sistema de clasificación en tiempo real

Llorente Ayuso, Pablo

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/96770

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Llorente Ayuso, Pablo	-
dc.contributor.other	Ventura, Carles	-
dc.date.accessioned	2019-06-29T17:09:20Z	-
dc.date.available	2019-06-29T17:09:20Z	-
dc.date.issued	2019-06-04	-
dc.identifier.uri	http://hdl.handle.net/10609/96770	-
dc.description.abstract	En este trabajo se ha desarrollado una aplicación web que muestra, en tiempo real, la opinión polarizada de los usuarios en español de Twitter sobre cuatro temas políticos: feminismo, derechos LGTB, migraciones y servicios públicos. La aplicación se inscribe dentro de la disciplina del análisis de sentimientos, obteniendo las opiniones por medio de la clasificación del texto de los tweets utilizando un conjunto de algoritmos de aprendizaje supervisado. La preparación de los datos de entrenamiento se ha llevado a cabo implementando técnicas simbólicas de procesamiento del lenguaje natural mediante el uso de funciones con cadenas y expresiones regulares sobre el texto de los tweets. Para la selección de atributos se ha escogido la frecuencia inversa de documento sobre las palabras del texto. La clasificación final de una opinión resulta en la selección de la clase mayoritaria del conjunto de clasificadores. Los resultados de la evaluación muestran una eficacia de entre el 77% y el 94% en función de la métrica seleccionada y del tema político estudiado. El algoritmo con mejores resultados es el clasificador bayesiano, si bien su eficacia converge con el clasificador por mayoría a medida que la distribución de las clases del conjunto de entrenamiento se hace más uniforme. La arquitectura de la aplicación web tiene tres niveles (presentación, lógica de negocio e integración) siguiendo un patrón modelo-vista-controlador en un entorno WAMP (Windows, Apache, MariaDB y PHP) en el que los resultados de la clasificación se ofrecen en formato JSON mediante una API.	es
dc.description.abstract	En aquest treball s'ha desenvolupat una aplicació web que mostra, en temps real, l'opinió polaritzada dels usuaris en espanyol de Twitter sobre quatre temes polítics: feminisme, drets LGTB, migracions i serveis públics. L'aplicació s'inscriu dins de la disciplina de l'anàlisi de sentiments, obtenint les opinions per mitjà de la classificació del text dels tweets utilitzant un conjunt d'algoritmes d'aprenentatge supervisat. La preparació de les dades d'entrenament s'ha dut a terme implementant tècniques simbòliques de processament del llenguatge natural mitjançant l'ús de funcions amb cadenes i expressions regulars sobre el text dels tweets. Per a la selecció d'atributs s'ha escollit la freqüència inversa de document sobre les paraules del text. La classificació final d'una opinió resulta en la selecció de la classe majoritària del conjunt de classificadors. Els resultats de l'avaluació mostren una eficàcia d'entre el 77% i el 94% en funció de la mètrica seleccionada i del tema polític estudiat. L'algoritme amb millors resultats és el classificador bayesià, si bé la seva eficàcia convergeix amb el classificador per majoria a mesura que la distribució de les classes del conjunt d'entrenament es fa més uniforme. L'arquitectura de l'aplicació web té tres nivells (presentació, lògica de negoci i integració) seguint un patró model-vista-controlador en un entorn WAMP (Windows, Apache, MariaDB i PHP) en què els resultats de la classificació s'ofereixen en format JSON mitjançant una API.	ca
dc.description.abstract	In this work we have developed a web application that shows, in real time, the polarized opinion of users on Twitter in Spanish about four political issues: feminism, LGBT rights, migrations and public services. The application is part of Sentiment Analysis discipline and opinions are obtained using a set of supervised machine learning algorithms. The preparation of the training data has been carried out by implementing symbolic natural language processing techniques through the use of functions with strings and regular expressions on the text of the tweets. For the selection of attributes, the inverse document frequency has been chosen over the words in the text. The final classification of an opinion results in the selection of the majority class of the set of classifiers. The results of the evaluation show an effectiveness between 77% and 94% depending on the selected metric and the political issue studied. The algorithm with the best results is the Bayesian classifier, although its efficiency converges with the classifier by majority as the distribution of the classes of the training set becomes more uniform. The architecture of the web application has three levels: presentation, business logic and integration, and it follows a model-view-controller pattern in a WAMP environment (Windows, Apache, MariaDB and PHP) in which the results of the classification are offered in JSON format using an API.	en
dc.format.mimetype	application/pdf	-
dc.language.iso	spa	-
dc.publisher	Universitat Oberta de Catalunya (UOC)	-
dc.rights	CC BY-NC-ND	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	-
dc.subject	opinión política	es
dc.subject	Twitter	es
dc.subject	sentiment analysis	en
dc.subject	análisis de sentimientos	es
dc.subject	anàlisi de sentiments	ca
dc.subject	Twitter	ca
dc.subject	Twitter	en
dc.subject	political opinion	en
dc.subject	opinió política	ca
dc.subject.lcsh	Artificial intelligence -- TFG	en
dc.title	Análisis de sentimientos aplicado a la opinión política en Twitter: un sistema de clasificación en tiempo real	-
dc.type	info:eu-repo/semantics/bachelorThesis	-
dc.audience.educationlevel	Estudis de Grau	ca
dc.audience.educationlevel	Estudios de Grado	es
dc.audience.educationlevel	University degrees	en
dc.subject.lemac	Intel·ligència artificial -- TFG	ca
dc.subject.lcshes	Inteligencia artificial -- TFG	es
dc.contributor.tutor	Isern, David	-
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Bachelor thesis, research projects, etc.