Please use this identifier to cite or link to this item:

http://hdl.handle.net/10609/96770
Full metadata record
DC FieldValueLanguage
dc.contributor.authorLlorente Ayuso, Pablo-
dc.date.accessioned2019-06-29T17:09:20Z-
dc.date.available2019-06-29T17:09:20Z-
dc.date.issued2019-06-04-
dc.identifier.urihttp://hdl.handle.net/10609/96770-
dc.description.abstractEn este trabajo se ha desarrollado una aplicación web que muestra, en tiempo real, la opinión polarizada de los usuarios en español de Twitter sobre cuatro temas políticos: feminismo, derechos LGTB, migraciones y servicios públicos. La aplicación se inscribe dentro de la disciplina del análisis de sentimientos, obteniendo las opiniones por medio de la clasificación del texto de los tweets utilizando un conjunto de algoritmos de aprendizaje supervisado. La preparación de los datos de entrenamiento se ha llevado a cabo implementando técnicas simbólicas de procesamiento del lenguaje natural mediante el uso de funciones con cadenas y expresiones regulares sobre el texto de los tweets. Para la selección de atributos se ha escogido la frecuencia inversa de documento sobre las palabras del texto. La clasificación final de una opinión resulta en la selección de la clase mayoritaria del conjunto de clasificadores. Los resultados de la evaluación muestran una eficacia de entre el 77% y el 94% en función de la métrica seleccionada y del tema político estudiado. El algoritmo con mejores resultados es el clasificador bayesiano, si bien su eficacia converge con el clasificador por mayoría a medida que la distribución de las clases del conjunto de entrenamiento se hace más uniforme. La arquitectura de la aplicación web tiene tres niveles (presentación, lógica de negocio e integración) siguiendo un patrón modelo-vista-controlador en un entorno WAMP (Windows, Apache, MariaDB y PHP) en el que los resultados de la clasificación se ofrecen en formato JSON mediante una API.es
dc.description.abstractEn aquest treball s'ha desenvolupat una aplicació web que mostra, en temps real, l'opinió polaritzada dels usuaris en espanyol de Twitter sobre quatre temes polítics: feminisme, drets LGTB, migracions i serveis públics. L'aplicació s'inscriu dins de la disciplina de l'anàlisi de sentiments, obtenint les opinions per mitjà de la classificació del text dels tweets utilitzant un conjunt d'algoritmes d'aprenentatge supervisat. La preparació de les dades d'entrenament s'ha dut a terme implementant tècniques simbòliques de processament del llenguatge natural mitjançant l'ús de funcions amb cadenes i expressions regulars sobre el text dels tweets. Per a la selecció d'atributs s'ha escollit la freqüència inversa de document sobre les paraules del text. La classificació final d'una opinió resulta en la selecció de la classe majoritària del conjunt de classificadors. Els resultats de l'avaluació mostren una eficàcia d'entre el 77% i el 94% en funció de la mètrica seleccionada i del tema polític estudiat. L'algoritme amb millors resultats és el classificador bayesià, si bé la seva eficàcia convergeix amb el classificador per majoria a mesura que la distribució de les classes del conjunt d'entrenament es fa més uniforme. L'arquitectura de l'aplicació web té tres nivells (presentació, lògica de negoci i integració) seguint un patró model-vista-controlador en un entorn WAMP (Windows, Apache, MariaDB i PHP) en què els resultats de la classificació s'ofereixen en format JSON mitjançant una API.ca
dc.description.abstractIn this work we have developed a web application that shows, in real time, the polarized opinion of users on Twitter in Spanish about four political issues: feminism, LGBT rights, migrations and public services. The application is part of Sentiment Analysis discipline and opinions are obtained using a set of supervised machine learning algorithms. The preparation of the training data has been carried out by implementing symbolic natural language processing techniques through the use of functions with strings and regular expressions on the text of the tweets. For the selection of attributes, the inverse document frequency has been chosen over the words in the text. The final classification of an opinion results in the selection of the majority class of the set of classifiers. The results of the evaluation show an effectiveness between 77% and 94% depending on the selected metric and the political issue studied. The algorithm with the best results is the Bayesian classifier, although its efficiency converges with the classifier by majority as the distribution of the classes of the training set becomes more uniform. The architecture of the web application has three levels: presentation, business logic and integration, and it follows a model-view-controller pattern in a WAMP environment (Windows, Apache, MariaDB and PHP) in which the results of the classification are offered in JSON format using an API.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectopinión políticaes
dc.subjectTwitteres
dc.subjectsentiment analysisen
dc.subjectanálisis de sentimientoses
dc.subjectanàlisi de sentimentsca
dc.subjectTwitterca
dc.subjectTwitteren
dc.subjectpolitical opinionen
dc.subjectopinió políticaca
dc.subject.lcshArtificial intelligence -- TFGen
dc.titleAnálisis de sentimientos aplicado a la opinión política en Twitter: un sistema de clasificación en tiempo real-
dc.typeinfo:eu-repo/semantics/bachelorThesis-
dc.audience.educationlevelEstudis de Grauca
dc.audience.educationlevelEstudios de Gradoes
dc.audience.educationlevelUniversity degreesen
dc.subject.lemacIntel·ligència artificial -- TFGca
dc.subject.lcshesInteligencia artificial -- TFGes
dc.contributor.directorVentura Royo, Carles-
dc.contributor.tutorIsern Alarcón, David-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Appears in Collections:Bachelor thesis, research projects, etc.

Files in This Item:
File Description SizeFormat 
pllorenteayusoTFG0619memoria.pdfMemoria del TFG1 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License Creative Commons