Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/133006
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorVallejo Ortega, Jorge-
dc.contributor.otherPerez-Navarro, Antoni-
dc.coverage.spatialManises, ESP-
dc.date.accessioned2021-07-02T21:59:14Z-
dc.date.available2021-07-02T21:59:14Z-
dc.date.issued2021-06-08-
dc.identifier.urihttp://hdl.handle.net/10609/133006-
dc.description.abstractLa finalidad de este trabajo es probar que se puede crear una herramienta automatizada de minería de textos biomédicos de la base de datos PubMed y de análisis de los resultados usando el lenguaje R, utilizándola para recuperar un listado de genes posiblemente relacionados con la endometriosis. La herramienta creada resultante del trabajo es un prototipo para un uso casual y exploratorio por parte de investigadores, sin necesidad de que tengan conocimientos de programación ni de otras herramientas bioinformáticas. En este trabajo se ha usado la API base de datos PubMed para la recopilación de datos (sumarios de publicaciones biomédicas) a través de easyPubMed, el reconocimiento de entidades nombradas (un método de minería de textos) a través de pubmed.mineR para obtener una lista de genes a partir de los datos recopilados, la API de la herramienta web Enrichr (a través de enrichR) para ejecutar el test estadístico de enriquecimiento de términos sobre el listado de genes y, finalmente el paquete shiny para programar una aplicación web en lenguaje R de programación. Como resultados se han obtenido un script en lenguaje R y una aplicación web capaces de realizar tareas de minería y análisis de datos de forma programática, un listado de genes potencialmente relacionados con la endometriosis significativamente enriquecidos en términos de ontología génica compatibles con la endometriosis. Llegamos a la conclusión de que es posible implementar diferentes tareas de minería de textos y análisis de datos en un programa escrito en lenguaje R, y obtener resultados de análisis coherentes.es
dc.description.abstractLa finalitat d'aquest treball és probar que es pugui crear una eina automatitzada de mineria de textos biomèdics de la base de dades PubMed i d'anàlisi dels resultats utilitzant el llenguatge R, utilitzant per recuperar un llistat de gens possiblement relacionats amb l'endometriosi. La eina creada resultant del treball és un prototip per a un ús casual i exploratori per part d'investigadors, sense necessitat de que tinguin coneixements de programació ni d'altres eines bioinformàtiques. En aquest treball s'ha utilitzat l'API base de dades PubMed per a la recopilació de dades (sumaris de publicacions biomèdiques) a través de easyPubMed, el reconeixement d'entitats nombrades (un mètode de mineria de textos) a través de pubmed.mineR per obtenir una lista de genes a partir de los datos recopilados, la API de la herramienta web Enrichr (a través de enrichR) per executar el test estadístic d'enriquiment de termes sobre el llistat de gens i, finalment, el paquet shiny per programar una aplicació web en llenguatge R de programació. Com resultats s'han obtingut un script en llenguatge R i una aplicació web capaces de realitzar tareas de mineria i anàlisi de dades de forma programàtica, un llistat de gens potencialment relacionats amb l'endometriosi significativament enriquecidos en términos de ontología génica compatibles con la endometriosis. Llegim a la conclusió de que és possible implementar diferents tareas de mineria de textos i anàlisi de dades en un programa escrit en llenguatge R, i obtenir resultats d'anàlisi coherents.ca
dc.description.abstractThe purpose of this work is to test that an automated biomedical text mining tool can be created from the PubMed database and results analysis using the R language, using it to retrieve a list of genes possibly related to endometriosis. The tool created as a result of the work is a prototype for casual and exploratory use by researchers, without the need for programming knowledge or other bioinformatics tools. In this work the PubMed database API has been used for data collection (biomedical publication summaries) through easyPubMed, the recognition of named entities (a text mining method) through pubmed.mineR to obtain a list of genes from the collected data, the API of the web tool Enrichr (via enrichR) to run the statistical test of enrichment of terms on the list of genes and finally the shiny package to program a web application in language R programming. As a result, an R-language script and a web application capable of programmatically performing mining and data analysis, a list of potentially endometriosis-related genes significantly enriched in terms of gene ontology compatible with endometriosis, have been obtained. We conclude that it is possible to implement different text mining and data analysis tasks in a program written in the R language, and to obtain consistent analysis results.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectendometriosises
dc.subjectminería de datoses
dc.subjectshinyes
dc.subjectendometriosica
dc.subjectmineria de datosca
dc.subjectshinyca
dc.subjectendometriosisen
dc.subjecttext miningen
dc.subjectshinyen
dc.subject.lcshBioinformatics -- TFMen
dc.titleEndo-Mining: herramienta web para la búsqueda automatizada de genes potencialmente relacionados con la endometriosis a través de minería de textos-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorRebrij, Romina-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jvallejoortTFM0621memoria.pdfMemoria del TFM831,96 kBAdobe PDFVista previa
Visualizar/Abrir