Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/106366
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorCanet Carbó, Joan-
dc.contributor.otherPrados Carrasco, Ferran-
dc.date.accessioned2020-01-22T21:01:16Z-
dc.date.available2020-01-22T21:01:16Z-
dc.date.issued2020-01-03-
dc.identifier.urihttp://hdl.handle.net/10609/106366-
dc.description.abstractDiferents composicions taxonòmiques al microbioma intestinal han estat relacionades a algunes malalties com la diabetis o la malaltia de Crohn. En aquest projecte s'han descrit la composició microbiològica de mostres fecals i variables clíniques -com l'edat o l'índex de massa corporal- associades a un gran nombre d'individus. S'han generat diferents models amb algoritmes de Machine Learning, com Random Forest, Support Vector Machine i XGBoost, per predir si un subjecte ha desenvolupat, o no, alguna malaltia autoimmunitària, a partir de la seua composició taxonòmica intestinal i unes variables clíniques. Els resultats obtinguts a la descripció taxonòmica no mostren uns enterotips clarament diferenciats entre les mostres. La majoria de les variables clíniques categòriques no estan segueixen una distribució equilibrada de les classes. Les distribució de les variables clíniques numèriques analitzades sí que s'aproximen a una distribució normal. El millor model de classificació s'ha obtingut utilitzant un mètode de mostratge anomenat SMOTE per a generar les dades d'entrenament i emprant l'algoritme XGBoost, obtenint un valor de l'estadístic Kappa de 0.6612. Aquest valor es considera que té una adequació substancial a les dades reals. El gènere Bifidobacterium ha sigut el que més ha contribuït en el rendiment del model. A tall de cloenda, no s'han pogut classificar les mostres en enterotips clarament diferenciats; no obstant això, s'ha pogut generar un model per predir si una persona ha desenvolupat, o no, una malaltia autoimmunitària, utilitzant dades del microbioma intestinal i variables clíniques amb una adequació substancial a les dades reals.ca
dc.description.abstractDifferent taxonomic compositions of the gut microbiome have been related to some diseases, such as diabetes or Crohn's disease. In this project, the microbiological composition of fecal samples and clinical variables -such as age or body mass index- associated to a big number of subjects have been described. Different models have been generated using Machine Learning algorithms, such as Random Forest, Support Vector Machine and XGBoost, to predict whether a subject has developed, or not, any autoimmune disease, using its gut taxonomic composition and some clinical variables. The obtained results in the taxonomic description do not show very differentiated enterotypes between the samples. Most of the categorical clinical variables do not follow a balanced distribution of their levels. The analyzed numerical clinical variables¿ distribution does follow approximately a normal distribution. The best classifier model has been obtained using a sampling method called SMOTE to generate the training set and using the XGBoost algorithm, obtaining a Kappa statistic value of 0.6612. This value is considered to have a substantial adequacy to the real data. The Bifidobacterium genus has been the one that has contributed the most to the model performance. In conclusion, the samples could not be classified into very differentiated enterotypes; however, a model to predict whether a subject has developed, or not, an autoimmune disease has been generated, using gut microbiome data and clinical variables, giving a substantial adequacy to the real data.en
dc.description.abstractDiferentes composiciones taxonómicas al microbioma intestinal han sido relacionadas a algunas dolencias como la diabetes o la dolencia de Crohn. En este proyecto se han descrito la composición microbiológica de muestras fecales y variables clínicas -como la edad o el índice de masa corporal- asociadas a un gran número de individuos. Se han generado diferentes modelos con algoritmos de Machine Learning, como Random Monte, Support Vector Machine y XGBoost, para predecir si un sujeto ha desarrollado, o no, alguna dolencia autoimmunitària, a partir de su composición taxonómica intestinal y unas variables clínicas. Los resultados obtenidos a la descripción taxonómica no muestran unos enterotips claramente diferenciados entre las muestras. La mayoría de las variables clínicas categóricas no están siguen una distribución equilibrada de las clases. Las distribución de las variables clínicas numéricas analizadas sí que se aproximan a una distribución normal. El mejor modelo de clasificación se ha obtenido utilizando un método de muestreo llamado SMOTE para generar los datos de entrenamiento y empleando el algoritmo XGBoost, obteniendo un valor del estadístico Kappa de 0.6612. Este valor se considera que tiene una adecuación sustancial a los datos reales. El género Bifidobacterium ha sido el que más ha contribuido en el rendimiento del modelo. A guisa de conclusión, no se han podido clasificar las muestras en enterotipos claramente diferenciados; sin embargo, se ha podido generar un modelo para predecir si una persona ha desarrollado, o no, una dolencia autoinmunitária, utilizando datos del microbioma intestinal y variables clínicas con una adecuación sustancial a los datos reales.es
dc.format.mimetypeapplication/pdf-
dc.language.isocat-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectmicrobioma humàca
dc.subjectmachine learningen
dc.subjectmalalties autoimmunitàriesca
dc.subjectaprenentatge automàticca
dc.subjectaprendizaje automáticoes
dc.subjectenfermedades autoinmuneses
dc.subjectautoimmune diseasesen
dc.subjectmicrobioma humanoes
dc.subjecthuman microbiomeen
dc.subject.lcshBioinformatics -- TFMen
dc.titleGeneració i anàlisi d'un model per relacionar el microbioma humà i dades clíniques amb malalties autoimmunitàries-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorPaytuví Gallart, Andreu-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jcanetcarboTFM0120memòria.pdfMemòria del TFM2,19 MBAdobe PDFVista previa
Visualizar/Abrir