Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/133757
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorTomás Gascó, Anna-
dc.coverage.spatialBarcelona, ESP-
dc.date.accessioned2021-07-20T09:42:24Z-
dc.date.available2021-07-20T09:42:24Z-
dc.date.issued2021-06-16-
dc.identifier.urihttp://hdl.handle.net/10609/133757-
dc.description.abstractLas enfermedades cardiovasculares son la primera causa de muerte en el mundo. Entre ellas, la insuficiencia cardíaca es una patología crónica muy común que se define como la incapacidad del corazón para funcionar de manera óptima. Con el fin de aportar nuevo conocimiento en la materia se ha propuesto realizar un estudio de clustering utilizando una base de datos pública que recoge variables clínicas de 299 pacientes paquistaníes mayores de 40 años con insuficiencia cardíaca. Se han aplicado 5 métodos diferentes de análisis de clustering: k-means, clustering jerárquico aglomerativo, hk-means, Gaussian mixture modelos y PAM con distancia de Gower. Los 4 primeros se han aplicado utilizando sólo las variables numéricas escaladas, pero el último nos ha permitido utilizar la matriz al completo. Además, se ha incluido un estudio de hk-means estratificado con las variables sexo, supervivencia y fracción de eyección. Los cálculos se han hecho utilizando un valor de k = 2, el número de clúster óptimo y lo que daba un resultado más coherente. Con las tablas de características para cada clúster generado y los gráficos de dispersión se ha podido encontrar un patrón consistente en el que los clúster con prevalencia de pacientes fallecidos durante el estudio, se caracterizan por tener una media de edad y un valor de creatinina en sangre superior que el clúster con pacientes que han sobrevivido. En definitiva, este estudio permite aportar un nuevo punto de vista a unos datos que nunca se habían estudiado de esta manera. Además, se han reafirmado las conclusiones que se habían obtenido con los métodos clásicos de regresión y supervivencia.es
dc.description.abstractCardiovascular disease is the leading cause of death worldwide. Among them, heart failure is a very common chronic pathology that is defined as the inability of the heart to function appropriately. In order to provide new knowledge in the field, it has been proposed to conduct a clustering study using a public database that collects clinical variables from 299 Pakistani patients over 40 years of age with heart failure. Five different methods of clustering analysis have been applied: k-means, agglomerative hierarchical clustering, hk-means, Gaussian mixture models and PAM with Gower distance. The first 4 have been applied using only the scaled numeric variables, but the last one has allowed us to use the whole dataset. In addition, a stratified hk-means study with the variables sex, survival, and ejection fraction has been included. The calculations were made using a value of k = 2, the most optimal number of clusters and the one that gave a more consistent result. With the baseline characteristics table for each cluster generated and the scatter plots, a consistent pattern could be found in which the clusters with a prevalence of patients who died during the study are characterized by having an average age and serum creatinine value higher than the cluster with patients who have survived. In short, this study provides a new perspective on data that has never been studied in this way. In addition, the conclusions reached with the classical methods of regression and survival have been reaffirmed.en
dc.description.abstractLes malalties cardiovasculars són la primera causa de mort al món. Entre elles, la insuficiència cardíaca és una patologia crònica molt comú que es defineix com la incapacitat de cor per funcionar de manera òptima. Per tal d'aportar nou coneixement en la matèria s'ha proposat realitzar un estudi de clustering utilitzant una base de dades pública que recull variables clíniques de 299 pacients pakistanesos majors de 40 anys amb insuficiència cardíaca. S'han aplicat 5 mètodes diferents d'anàlisi de clustering: k-means, clustering jeràrquic aglomeratiu, hk-means, Gaussian mixture models i PAM amb distància de Gower. Els 4 primers s'han aplicat utilitzant només les variables numèriques escalades, però l'últim ens ha permès utilitzar la matriu a l'complet. A més, s'ha inclòs un estudi de hk-means estratificat amb les variables sexe, supervivència i fracció d'ejecció. Els càlculs s'han fet utilitzant un valor de k = 2, el nombre de clúster òptim i el que donava un resultat més coherent. Amb les taules de característiques per a cada clúster generat i els gràfics de dispersió s'ha pogut trobar un patró consistent en què els clúster amb prevalença de pacients morts durant l'estudi, es caracteritzen per tenir una mitjana d'edat i un valor de creatinina en sang superior que el clúster amb pacients que han sobreviscut. En definitiva, aquest estudi permet aportar un nou punt de vista a unes dades que mai s'havien estudiat d'aquesta manera. A més, s'han reafirmat les conclusions que s'havien obtingut amb els mètodes clàssics de regressió i supervivència.ca
dc.format.mimetypeapplication/pdf-
dc.language.isocat-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectclusteringen
dc.subjectheart failureen
dc.subjectmultivariant dataen
dc.subjectagrupacióca
dc.subjectinsuficiència cardíacaca
dc.subjectdades multivariantsca
dc.subjectagrupamientoes
dc.subjectinsuficiencia cardíacaes
dc.subjectdatos multivarianteses
dc.subject.lcshBioinformatics -- TFMen
dc.titleAnàlisi de clustering per a l'exploració de dades biològiques multivariants-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.directorMaceira, Marc-
dc.contributor.tutorFernández Martínez, Daniel-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
atomasgaTFM0621memòria.pdfMemòria del TFM1,66 MBAdobe PDFVisualizar/Abrir