Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/133708
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorChan, Jin Lung-
dc.coverage.spatialBarcelona, ESP-
dc.date.accessioned2021-07-18T22:52:47Z-
dc.date.available2021-07-18T22:52:47Z-
dc.date.issued2021-06-06-
dc.identifier.urihttp://hdl.handle.net/10609/133708-
dc.description.abstractThe project explores the current State-of-the-Art of NLP, researches different biomedical datasets, and applies the SciSpacy library to extract and recognize entities from the CORD-19 dataset, a growing data collection with over 500.000 scientific papers linked to COVID-19. The data extraction code is written in Python and deployed in the Kaggle platform. Different visualization software such as Tableau and Gephi has been used to represent the extracted entities in the post-processing analysis.en
dc.description.abstractEl proyecto explora el estado actual de la PNL, investiga diferentes conjuntos de datos biomédicos y aplica la biblioteca SciSpacy para extraer y reconocer entidades del conjunto de datos CORD-19, una creciente recopilación de datos con más de 500.000 documentos relacionados con COVID-19. El código de extracción de datos está escrito en Python y se implementa en la plataforma Kaggle. Se han utilizado diferentes software de visualización como Tableau y Gephi para representar las entidades extraídas en el análisis de posprocesamiento.es
dc.description.abstractEl projecte explora l'estat actual de l'art de la PNL, investiga diferents conjunts de dades biomèdics i aplica la biblioteca SciSpacy per extreure i reconèixer entitats del conjunt de dades CORD-19, una recopilació de dades creixent amb més de 500.000 científics papers vinculats a COVID-19. El codi d'extracció de dades s'escriu a Python i es desplega a la plataforma Kaggle. S'han utilitzat diferents programes de visualització com Tableau i Gephi les entitats extretes a l'anàlisi de post-processament.ca
dc.format.mimetypeapplication/pdf-
dc.language.isoeng-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectnamed entity recognitionen
dc.subjectCOVID-19en
dc.subjectnatural processing languageen
dc.subjectreconeixement d'entitats anomenatca
dc.subjectllenguatge de processament naturalca
dc.subjectCOVID-19ca
dc.subjectreconocimiento de entidad con nombrees
dc.subjectlenguaje de procesamiento naturales
dc.subjectCOVID-19es
dc.subject.lcshBig Data -- TFMen
dc.titleApplication of NLP to extract biomedical entities from COVID-19 papers-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacDades massives -- TFMca
dc.subject.lcshesDatos masivos -- TFMes
dc.contributor.directorPairo Castiñeira, Erola-
dc.contributor.tutorPrados Carrasco, Ferran-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jlchanTFM0621memory.pdfMemory of TFM3,38 MBAdobe PDFVista previa
Visualizar/Abrir