Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/146106
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorHernández Villena, Juan Vicente-
dc.contributor.otherVentura, Carles-
dc.coverage.spatialBarcelona, ESP-
dc.date.accessioned2022-07-01T14:41:34Z-
dc.date.available2022-07-01T14:41:34Z-
dc.date.issued2022-06-
dc.identifier.urihttp://hdl.handle.net/10609/146106-
dc.description.abstractUn dato faltante o missing es información relevante para el análisis pero que, por diversos factores, no pudo ser registrado y como consecuencia, está ausente en las bases de datos de cualquier tipo, incluyendo los registros longitudinales. Los mismos, si no son tomados en cuenta, pueden influir significativamente en el poder estadístico, la integridad del análisis, en estimaciones sesgadas y en la calidad de los resultados, por lo que es necesario un tratamiento correcto sobre los mismos, basado en las características que presenten. Este trabajo buscó poner a prueba diversas alternativas de imputación múltiple mediante la estrategia PMM, tratamiento moderno que ha generado buenos resultados, sobre los datos faltantes de una base de datos de pacientes con VIH, en tres escenarios de acuerdo al tamaño muestral. Una vez realizada las imputaciones, los resultados se pusieron a prueba, reproduciendo el análisis realizado en la publicación original de donde provienen los datos (comparación entre tratamientos), obteniendo resultados similares a los descritos. Se describió un flujo de trabajo recomendado para el análisis previo y tratamiento de missings, cuando la base de datos es longitudinal, con un tamaño muestral peque¿no, sin distribución normal y con altos porcentajes de datos faltantes, características que no suelen ponerse a prueba cuando se evalúan este tipo de métodos, pero que son frecuentes en diversos campos de investigación como la biología y la salud.es
dc.description.abstractA missing data is relevant information to the analysis, but due to different factors could not be recorded, and as consequence, is absent in any kind of dataset, including longitudinal records. If they are not taken into account, they will influence significantly the statistical power, the analysis integrity, the bias, and the quality of the results. So, it is necessary to use the correct treatment on them, based on their characteristics. This study carried out several multiple imputation alternatives by the PMM strategy, a modern treatment that has generated good results, on an HIV dataset missing data, in three scenarios according to the sample size. Once the imputations were done, the results were put to test, reproducing the analysis carried out in the original paper where the data comes from (comparison between treatments), obtaining similar results to those described. An improved workflow was described for the missings¿ previous analysis and treatment, with a longitudinal dataset, with small sample size, non-normal distribution, and with high percentages of missing data, characteristics that are not common when these methods are evaluated, but which are common in the most research fields such as biology and healthcare.en
dc.description.abstractUna dada faltant o missing és informació rellevant per a l'anàlisi però que, per diversos factors, no va poder ser registrat i com a conseqüència, està absent a les bases de dades de qualsevol tipus, incloent els registres longitudinals. Aquests, si no són presos en compte, poden influir significativament en el poder estadístic, la integritat de l'anàlisi, en estimacions esbiaixades i en la qualitat dels resultats, per la qual cosa cal un tractament correcte sobre aquests, basat en les característiques que presentin. Aquest treball va buscar posar a prova diverses alternatives d'imputació múltiple mitjançant l'estratègia PMM, tractament modern que ha generat bons resultats, sobre les dades que falten d'una base de dades de pacients amb VIH, en tres escenaris d'acord amb la mida mostral. Un cop realitzades les imputacions, els resultats es van posar a prova, reproduint l'anàlisi realitzada a la publicació original d'on provenen les dades (comparació entre tractaments), obtenint resultats similars als descrits. Es va descriure un flux de treball recomanat per a l'anàlisi prèvia i tractament de missings, quan la base de dades és longitudinal, amb una mida mostral petita, sense distribució normal i amb alts percentatges de dades mancants, característiques que no solen posar-se a prova quan s'avaluen aquest tipus de mètodes, però que són freqüents en diversos camps de recerca com ara la biologia i la salut.ca
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-SA-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/es/-
dc.subjectdatos faltanteses
dc.subjectmissing dataen
dc.subjectdades faltantsca
dc.subjectbioinformáticaes
dc.subjectbioinformàticaca
dc.subjectbioinformaticsen
dc.subjectVIHes
dc.subjectVIHca
dc.subjectHIVen
dc.subjectimputación múltiplees
dc.subjectimputació múltipleca
dc.subjectmultiple imputationen
dc.subject.lcshBioinformatics -- TFMen
dc.titleMissing data: Imputación múltiple en bases de datos pequeñas-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorPerez-Alvarez, Nuria-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
juanvhernandezvTFM0622memoria.pdfMemoria del TFM1,24 MBAdobe PDFVista previa
Visualizar/Abrir
juanvhernandezvTFM0622presentación.pdfPresentación del TFM827,77 kBAdobe PDFVista previa
Visualizar/Abrir