Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/139067
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorPardo Montenegro, Beatriz-
dc.contributor.otherVentura, Carles-
dc.coverage.spatialVigo, ESP-
dc.date.accessioned2022-02-07T15:06:59Z-
dc.date.available2022-02-07T15:06:59Z-
dc.date.issued2021-12-
dc.identifier.urihttp://hdl.handle.net/10609/139067-
dc.description.abstractLos ensayos clínicos longitudinales se hacen con medidas repetidas de algunas variables a lo largo de un tiempo. Es un problema frecuente encontrarnos con que alguna de estas medidas falta. Desarrollar estrategias adecuadas en el tratamiento de datos faltantes supone un gran reto. Una de las alternativas recomendadas es la imputación múltiple. Los análisis de supervivencia analizan el tiempo que tarda en ocurrir un evento de interés, si éste no ocurre en el tiempo de seguimiento del ensayo, se denomina censura. Existen numerosas alternativas para la realización de análisis de supervivencia con datos censurados, el método convencional más utilizado es Kaplan Meier. En los últimos años se han desarrollado algoritmos de machine learning, uno de ellos es random survival forest. En este TFM, tras realizar labores de data management, se realiza imputación de datos faltantes de la base de datos del ensayo Lake con 2 opciones de imputación disponibles en R, en las librerías mice y randomForestSRC. Se comparan los resultados de la función de supervivencia de Kaplan Meier y del algoritmo random survival forest aplicados al resultado de ambas imputaciones. El evento estudiado es fracaso virológico en pacientes diagnosticados de VIH tratados con tratamiento experimental vs control. Los resultados del índice C son muy similares. Por Kaplan Meier, se concluye que el tratamiento experimental tiene menos fracasos virológicos que el tratamiento estándar, pero las diferencias son significativas sólo en la base de datos imputada con la librería randomForestSRC.es
dc.description.abstractEls assajos clínics longitudinals es fan amb mesures repetides d'algunes variables al llarg d'un temps. És un problema freqüent trobar-nos que alguna d'aquestes mesures falta. Desenvolupar estratègies adequades en el tractament de dades que manca suposa un gran repte. Una de les alternatives recomanades és la imputació múltiple. Les anàlisis de supervivència analitzen el temps que triga a ocórrer un esdeveniment d'interès, si aquest no ocorre en el temps de seguiment de l'assaig, es denomina censura. Existeixen nombroses alternatives per a la realització d'anàlisi de supervivència amb dades censurades, el mètode convencional més utilitzat és Kaplan Meier. En els últims anys s'han desplegat algorismes de machine learning, un d'ells és random survival forest. En aquest TFM, després de realitzar labors de data management, es realitza imputació de dades que manca de la base de dades de l'assaig Lake amb 2 opcions d'imputació disponibles en R, en les llibreries mice i randomForestSRC. Es comparen els resultats de la funció de supervivència de Kaplan Meier i de l'algorisme random survival forest aplicats al resultat de totes dues imputacions. L'esdeveniment estudiat és fracàs virológico en pacients diagnosticats de VIH tractats amb tractament experimental vs. control. Els resultats de l'índex C són molt similars. Per Kaplan Meier, es conclou que el tractament experimental té menys fracassos virològics que el tractament estàndard, però les diferències són significatives només en la base de dades imputada amb la llibreria randomForestSRC.ca
dc.description.abstractLongitudinal clinical trials are done with repeated measures of some variables over a period of time. It is a common problem to find that some of these measures are missing. Developing appropriate strategies for dealing with missing data is a major challenge. One of the recommended alternatives is multiple imputation. Survival analyses look at the time it takes for an event of interest to occur, if it does not occur within the follow-up time of the trial, it is called censoring. There are numerous alternatives for performing survival analysis with censored data, the most commonly used conventional method is Kaplan Meier. In recent years, machine learning algorithms have been developed, one of which is the random survival forest. In this TFM, after performing data management tasks, imputation of missing data from the Lake trial database is performed with 2 imputation options available in R, in the mice and randomForestSRC libraries. The results of the Kaplan Meier survival function and the random survival forest algorithm applied to the result of both imputations are compared. The event studied is virologic failure in HIV-diagnosed patients treated with experimental treatment vs. control. The results of the C-index are very similar. By Kaplan Meier, it is concluded that experimental treatment has fewer virological failures than standard treatment, but the differences are significant only in the database imputed with the randomForestSRC library.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-SA-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/es-
dc.subjectdatos faltanteses
dc.subjectimputaciónes
dc.subjectanálisis supervivenciaes
dc.subjectdades que mancaca
dc.subjectmissing dataen
dc.subjectimputacióca
dc.subjectimputationen
dc.subjectsurvival analysisen
dc.subjectanàlisi supervivènciaca
dc.subjectensayos longitudinaleses
dc.subjectlongitudinal trialsen
dc.subjectassajos longitudinalsca
dc.subject.lcshBioinformatics -- TFMen
dc.titleEstrategias para el abordaje de la problemática de los datos faltantes en ensayos clínicos longitudinales-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorPerez-Alvarez, Nuria-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
bpardomTFM1221memoria.pdfMemoria del TFM1,63 MBAdobe PDFVista previa
Visualizar/Abrir