Application of NLP to extract biomedical entities from COVID-19 papers

Chan, Jin Lung

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/133708

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Chan, Jin Lung	-
dc.coverage.spatial	Barcelona, ESP	-
dc.date.accessioned	2021-07-18T22:52:47Z	-
dc.date.available	2021-07-18T22:52:47Z	-
dc.date.issued	2021-06-06	-
dc.identifier.uri	http://hdl.handle.net/10609/133708	-
dc.description.abstract	The project explores the current State-of-the-Art of NLP, researches different biomedical datasets, and applies the SciSpacy library to extract and recognize entities from the CORD-19 dataset, a growing data collection with over 500.000 scientific papers linked to COVID-19. The data extraction code is written in Python and deployed in the Kaggle platform. Different visualization software such as Tableau and Gephi has been used to represent the extracted entities in the post-processing analysis.	en
dc.description.abstract	El proyecto explora el estado actual de la PNL, investiga diferentes conjuntos de datos biomédicos y aplica la biblioteca SciSpacy para extraer y reconocer entidades del conjunto de datos CORD-19, una creciente recopilación de datos con más de 500.000 documentos relacionados con COVID-19. El código de extracción de datos está escrito en Python y se implementa en la plataforma Kaggle. Se han utilizado diferentes software de visualización como Tableau y Gephi para representar las entidades extraídas en el análisis de posprocesamiento.	es
dc.description.abstract	El projecte explora l'estat actual de l'art de la PNL, investiga diferents conjunts de dades biomèdics i aplica la biblioteca SciSpacy per extreure i reconèixer entitats del conjunt de dades CORD-19, una recopilació de dades creixent amb més de 500.000 científics papers vinculats a COVID-19. El codi d'extracció de dades s'escriu a Python i es desplega a la plataforma Kaggle. S'han utilitzat diferents programes de visualització com Tableau i Gephi les entitats extretes a l'anàlisi de post-processament.	ca
dc.format.mimetype	application/pdf	-
dc.language.iso	eng	-
dc.publisher	Universitat Oberta de Catalunya (UOC)	-
dc.rights	CC BY-NC-ND	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	-
dc.subject	named entity recognition	en
dc.subject	COVID-19	en
dc.subject	natural processing language	en
dc.subject	reconeixement d'entitats anomenat	ca
dc.subject	llenguatge de processament natural	ca
dc.subject	COVID-19	ca
dc.subject	reconocimiento de entidad con nombre	es
dc.subject	lenguaje de procesamiento natural	es
dc.subject	COVID-19	es
dc.subject.lcsh	Big Data -- TFM	en
dc.title	Application of NLP to extract biomedical entities from COVID-19 papers	-
dc.type	info:eu-repo/semantics/masterThesis	-
dc.audience.educationlevel	Estudis de Màster	ca
dc.audience.educationlevel	Estudios de Máster	es
dc.audience.educationlevel	Master's degrees	en
dc.subject.lemac	Dades massives -- TFM	ca
dc.subject.lcshes	Datos masivos -- TFM	es
dc.contributor.director	Pairo Castiñeira, Erola	-
dc.contributor.tutor	Prados Carrasco, Ferran	-
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Bachelor thesis, research projects, etc.