Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/133708
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Chan, Jin Lung | - |
dc.coverage.spatial | Barcelona, ESP | - |
dc.date.accessioned | 2021-07-18T22:52:47Z | - |
dc.date.available | 2021-07-18T22:52:47Z | - |
dc.date.issued | 2021-06-06 | - |
dc.identifier.uri | http://hdl.handle.net/10609/133708 | - |
dc.description.abstract | The project explores the current State-of-the-Art of NLP, researches different biomedical datasets, and applies the SciSpacy library to extract and recognize entities from the CORD-19 dataset, a growing data collection with over 500.000 scientific papers linked to COVID-19. The data extraction code is written in Python and deployed in the Kaggle platform. Different visualization software such as Tableau and Gephi has been used to represent the extracted entities in the post-processing analysis. | en |
dc.description.abstract | El proyecto explora el estado actual de la PNL, investiga diferentes conjuntos de datos biomédicos y aplica la biblioteca SciSpacy para extraer y reconocer entidades del conjunto de datos CORD-19, una creciente recopilación de datos con más de 500.000 documentos relacionados con COVID-19. El código de extracción de datos está escrito en Python y se implementa en la plataforma Kaggle. Se han utilizado diferentes software de visualización como Tableau y Gephi para representar las entidades extraídas en el análisis de posprocesamiento. | es |
dc.description.abstract | El projecte explora l'estat actual de l'art de la PNL, investiga diferents conjunts de dades biomèdics i aplica la biblioteca SciSpacy per extreure i reconèixer entitats del conjunt de dades CORD-19, una recopilació de dades creixent amb més de 500.000 científics papers vinculats a COVID-19. El codi d'extracció de dades s'escriu a Python i es desplega a la plataforma Kaggle. S'han utilitzat diferents programes de visualització com Tableau i Gephi les entitats extretes a l'anàlisi de post-processament. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | named entity recognition | en |
dc.subject | COVID-19 | en |
dc.subject | natural processing language | en |
dc.subject | reconeixement d'entitats anomenat | ca |
dc.subject | llenguatge de processament natural | ca |
dc.subject | COVID-19 | ca |
dc.subject | reconocimiento de entidad con nombre | es |
dc.subject | lenguaje de procesamiento natural | es |
dc.subject | COVID-19 | es |
dc.subject.lcsh | Big Data -- TFM | en |
dc.title | Application of NLP to extract biomedical entities from COVID-19 papers | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Dades massives -- TFM | ca |
dc.subject.lcshes | Datos masivos -- TFM | es |
dc.contributor.director | Pairo Castiñeira, Erola | - |
dc.contributor.tutor | Prados Carrasco, Ferran | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
jlchanTFM0621memory.pdf | Memory of TFM | 3,38 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons