Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/145466
Título : Integrative learning for heterogeneous blockwise missing omics data
Autoría: Baena Miret, Sergi
Tutor: Reverter, Ferran  
Vegas Lozano, Esteban
Resumen : En muchas ocasiones la información que se puede recopilar no es completa, ya que para algunas observaciones no se dispone de todas las fuentes de datos (lo que se conoce como datos perdidos por bloques) por ello, la cuestión que se plantea es cómo se podría implementar un proceso integrador con datos perdidos por bloques basado en una aproximación tipo Lasso que luego podría aplicarse a datos ómicos reales. De hecho, en este trabajo se resolverá un problema de regresión de optimización que consiste en un modelo de aprendizaje de características unificado para datos heterogéneos faltantes en bloque (o incluso completos) que realiza el análisis a nivel de característica y a nivel de fuente simultáneamente. La novedad de esto, radica en que aunque se puede encontrar la formulación y la optimización teórica del problema, no se ha podido encontrar su implementación en código en ningún sitio, por lo que ha sido imposible (hasta que no se ha conseguido implementarlos) dar una evaluación razonable del modelo. De hecho, para la evaluación del modelo (el estudio de su eficacia y rendimiento) se utilizaron datos sintéticos generados por un modelo de regresión lineal y datos reales extraídos de un nuevo proyecto de investigación en colaboración llamado Human Early-Life Exposome (HELIX). En definitiva, en este trabajo se ha estudiado un modelo de aprendizaje de características de dos niveles motivado por los datos del exposoma y se ha implementado un código que se aproxima tanto a los datos completos como a los que faltan en bloque. Específicamente, introduciendo un modelo de aprendizaje de características unificado para datos completos, que contiene varios modelos convexos clásicos que han sido fácilmente extendidos para manejar el caso más desafiante: los datos perdidos por bloques. Al final, se ha conseguido presentar un modelo de regresión de optimización que, dados los datos completos o los que faltan en bloque, nos permite obtener información de ellos para hacer predicciones para datos estructurados similares. En particular, se ha observado grandes resultados para los datos simulados y resultados bastante buenos para estos datos del exposoma.
Palabras clave : modelo de regresión de optimización
aprendizaje automático
datos óhmicos
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : 2-jun-2022
Licencia de publicación: http://creativecommons.org/licenses/by/3.0/es/  
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
sbaenamFMDP0622report.pdfReport of TFM4,14 MBAdobe PDFVista previa
Visualizar/Abrir