Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/132207
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorFraire Ferrer, Miquel Àngel-
dc.contributor.otherVentura, Carles-
dc.coverage.spatialVilanova i la Geltrú, ESP-
dc.date.accessioned2021-06-25T19:11:02Z-
dc.date.available2021-06-25T19:11:02Z-
dc.date.issued2021-06-08-
dc.identifier.urihttp://hdl.handle.net/10609/132207-
dc.description.abstractEn l'anàlisi del sentiment hi conflueixen tant models d'aprenentatge automàtic com tècniques bàsiques de processament del llenguatge natural. Aquestes darreres solen aplicar-se fonamentalment a adaptar el corpus textual d'entrada al tipus de dades que exigeix el model, així com per reduir-ne la dimensionalitat sense perdre informació rellevant, fet que permet a l'algorisme classificador guanyar eficiència. Amb tot, un coneixement més profund de les particularitats lingüístiques del corpus permetria d'emprendre accions que fessin incrementar també el grau de precisió en els resultats de l'anàlisi del sentiment. Particularment, l'etiquetatge morfosintàctic per tal d'assignar més pes a aquells mots amb més càrrega semàntica durant l'entrenament de l'algorisme hauria de traduir-se en una millora dels resultats de classificació. Amb aquesta finalitat s'han seleccionat tres corpus textuals diferents, se'ls ha sotmès a les operacions habituals en un exercici d'anàlisi del sentiment i se n'han mesurat els resultats. Tot seguit i després d'haver aplicat als corpus originals la tècnica abans esmentada, s'ha tornat a entrenar el model. Posteriorment s'ha procedit a incrementar la precisió en l'etiquetatge morfosintàctic mitjançant tècniques de reconeixement i correcció del llenguatge informal. Finalment s'ha fet el càlcul de distribució de freqüències per tal de conèixer les diferències de pes semàntic entre corpus, les quals poden explicar resultats incomprensiblement divergents o allunyats, i eventualment corregir aquestes desviacions. La conclusió és que el mètode d'assignació de més pes a mots semànticament rellevants mitjançat l'etiquetatge morfosintàctic és especialment eficaç en corpus tematitzats sense paraules de freqüència totalment esbiaixada cap a una categoria en particular.ca
dc.description.abstractBoth machine learning and basic natural language processing techniques come together in the sentiment analysis. The latter are usually applied mostly to adapt the input text corpus to the data types the model requires, as well as to reduce its dimensionality without losing relevant information, which allows the classifying algorithm to gain efficiency. However, a deeper knowledge of the linguistic particularities of the corpus would allow to carry out some actions in order to increase the degree of accuracy in the sentiment analysis results. Particularly, using the technique of Part-of-Speech tagging to assign more weight to those words with more semantic load during the algorithm training, should turn into improved ranking results. To that end, three different textual corpora have been selected and subjected to the usual operations in a sentiment analysis exercise, and then the results have been measured. Then, after applying the aforementioned technique to the original corpora, the model has been trained again. Subsequently, the accuracy of Part-of-Speech tagging has also been increased through techniques for recognizing and correcting informal language. Finally, the word frequency distribution has been calculated in order to know the differences in semantic weight amongst corpora, which can explain an incomprehensibly divergent or distant outcome, and occasionally correct these deviations. The conclusion is that the method of assigning more weight to semantically relevant words by means of Part-of-Speech tagging is especially effective in themed corpora not containing words of totally biased frequency towards a certain category.en
dc.description.abstractEn el análisis del sentimiento confluyen tanto modelos de aprendizaje automático como técnicas básicas de procesamiento del lenguaje natural. Estas últimas suelen aplicarse fundamentalmente a adaptar el corpus textual de entrada al tipo de datos que exige el modelo, así como para reducir la dimensionalidad sin perder información relevante, lo que permite al algoritmo clasificador ganar eficiencia. Con todo, un conocimiento más profundo de las particularidades lingüísticas del corpus permitiría emprender acciones que hicieran incrementar también el grado de precisión en los resultados del análisis del sentimiento. Particularmente, el etiquetado morfosintáctico para asignar más peso a aquellas palabras con más carga semántica durante el entrenamiento del algoritmo debería traducirse en una mejora de los resultados de clasificación. Con este fin se han seleccionado tres corpus textuales diferentes, se les ha sometido a las operaciones habituales en un ejercicio de análisis del sentimiento y se han medido los resultados. A continuación y después de haber aplicado a los corpus originales la técnica antes mencionada, se ha vuelto a entrenar el modelo. Posteriormente se ha procedido a incrementar la precisión en el etiquetado morfosintáctico mediante técnicas de reconocimiento y corrección del lenguaje informal. Finalmente se ha hecho el cálculo de distribución de frecuencias para conocer las diferencias de peso semántico entre corpus, las cuales pueden explicar resultados incomprensiblemente divergentes o alejados, y eventualmente corregir estas desviaciones. La conclusión es que el método de asignación de más peso a palabras semánticamente relevantes mediante el etiquetado morfosintáctico es especialmente eficaz en corpus tematizados sin palabras de frecuencia totalmente sesgada hacia una categoría en particular.es
dc.format.mimetypeapplication/pdf-
dc.language.isocat-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectanàlisi del sentimentca
dc.subjectsentiment analysisen
dc.subjectxarxes neuronalsca
dc.subjectneural networksen
dc.subjectprocessament del llenguatge naturalca
dc.subjectnatural language processingen
dc.subjectanálisis del sentimientoes
dc.subjectredes neuronaleses
dc.subjectprocesamiento del lenguaje naturales
dc.subject.lcshArtificial intelligence -- TFGen
dc.titleRefinament de l'anàlisi del sentiment per xarxes neuronals mitjançant tècniques de PLN-
dc.typeinfo:eu-repo/semantics/bachelorThesis-
dc.audience.educationlevelEstudios de Gradoes
dc.audience.educationlevelUniversity degreesen
dc.subject.lemacIntel·ligència artificial -- TFGca
dc.subject.lcshesInteligencia artificial -- TFGes
dc.contributor.tutorIsern, David-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  

frairefmVideo2021.mp4

167,91 MBMP4Visualizar/Abrir
frairefmTFG0621memòria.pdfMemòria del TFG2,18 MBAdobe PDFVista previa
Visualizar/Abrir
frairefmTFG0621presentació.pdfPresentació del TFG1,77 MBAdobe PDFVista previa
Visualizar/Abrir