Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/91506
Título : Análisis y optimización de un autoencoder variacional semisupervisado para diseño molecular condicionado
Autoría: Colmenarejo Sánchez, Gonzalo
Tutor: Vegas Lozano, Esteban
Otros: Sánchez-Pla, Alex  
Resumen : Se ha analizado y optimizado el reciente autoencoder variacional semisupervisado (SSVAE) de Kang y Chao (2018, J. Chem. Inf. Model., Article ASAP DOI: 10.1021/acs.jcim.8b00263) como modelo de Deep Learning de QSAR inverso para diseño molecular condicionado. El objetivo es caracterizar el output del modelo (corrección, diversidad y novedad, distribución de propiedades) en función de distintos factores: tamaño y diversidad del conjunto de entrenamiento, tamaño del output, tipo de conjunto de moléculas (drug-like vs productos naturales), y propiedades de condicionamiento (MWt, logP y QED vs TPSA, MR y LASA). Se ha utilizado TensorFlow en las simulaciones y RDKit y chemfp como librerías quimioinformáticas. El modelo, en su modo incondicionado, genera colecciones de moléculas con alta diversidad (medida como moléculas únicas, número de clusters y número de frameworks) y relativamente baja novedad (medida como porcentaje de moléculas sin análogos y porcentaje de frameworks nuevos), disminuyendo la diversidad y aumentando la novedad en el condicionado. La corrección aumenta en el modo condicionado, siendo siempre muy alta (> 90%). La diversidad aumenta con el tamaño del conjunto de output, más lentamente en las moléculas condicionadas, y no depende del tamaño del conjunto de entrenamiento. La novedad disminuye significativamente con el tamaño del conjunto de entrenamiento, y aumenta con el del conjunto de output. La diversidad y novedad aumentan con la diversidad intensiva del conjunto de entrenamiento. Además, se ha modificado el SSVAE para generar con éxito tanto productos naturales como análogos condicionados, vía condicionamiento multiobjetivo, extendiendo las capacidades originales del SSVAE para diseño molecular.
Palabras clave : aprendizaje profundo
diseño molecular
autoencoder variacional
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : 31-dic-2018
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  

PresentaTFMGonzaloColmenarejoUOC.mp4

Presentación del TFM216,65 MBMP4Visualizar/Abrir
gcolmenarejoTFM1218memoria.pdfMemoria del TFM2,23 MBAdobe PDFVista previa
Visualizar/Abrir