Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/127826
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorMonserrat Gómez, Mariano-
dc.contributor.otherMaceira, Marc-
dc.contributor.otherSanchez-Martinez, Melchor-
dc.coverage.spatialSevilla, ESP-
dc.date.accessioned2021-02-03T17:15:40Z-
dc.date.available2021-02-03T17:15:40Z-
dc.date.issued2021-01-05-
dc.identifier.urihttp://hdl.handle.net/10609/127826-
dc.description.abstractDurante el desarrollo de nuevos fármacos, se ha visto que la mayoría de las moléculas estudiadas son descartadas en los ensayos clínicos por presencia de toxicidad. A consecuencia, se han desarrollado métodos computacionales para predecir la actividad de las moléculas candidatas. En los últimos años, los péptidos se han propuesto como posibles candidatos a fármacos por su alta actividad biológica, especificidad, bajo coste de producción y alta penetración. En este trabajo se pretende desarrollar un modelo Machine Learning (ML) para predecir la toxicidad peptídica para el posible desarrollo de nuevos fármacos. Se recopilarán péptidos tóxicos y no tóxicos de distintas bases de datos y se agruparán en un dataset. Con las secuencias peptídicas, se generarán los descriptores pseudo-aminoácidos para la creación de modelos de predicción de toxicidad peptídica. Con métodos de clustering y balanceo se crearán nuevos datasets que serán usados para generar modelos predictivos con los algoritmos de ML utilizados: SVM, RF y GBRT. Se seleccionarán los mejores modelos y serán evaluados con un dataset externo. Los modelos generados por clustering y balanceo eran de mayor calidad (exactitud, precisión, sensibilidad, especificidad, F1 y AUC de curva ROC) que los obtenidos con el dataset inicial. De los cinco mejores modelos evaluados con el dataset externo (Modelo Subsampling SVM, Modelo Subsampling RF, Modelo DBSCAN+Subsampling SVM, Modelo DBSCAN+Subsampling GBRT y Modelo Linclust RF), tres presentaban mejores indicadores de calidad. Se concluye que los mejores modelos para predecir la toxicidad de péptidos son Modelo Subsampling SVM, Modelo Subsampling RF y Modelo DBSCAN+Subsampling GBRT.es
dc.description.abstractDurant el desenvolupament de nous fàrmacs, s'ha vist que la majoria de les molècules estudiades són descartades en els assajos clínics per presència de toxicitat. A conseqüència, s'han desenvolupat mètodes computacionals per predir l'activitat de les molècules candidates. En els últims anys, els pèptids s'han proposat com a possibles candidats a fàrmacs per la seva alta activitat biològica, especificitat, baix cost de producció i alta penetració. En aquest treball es pretén desenvolupar un model Machine Learning (ML) per predir la toxicitat peptídica per al possible desenvolupament de nous fàrmacs. Es recopilaran pèptids tòxics i no tòxics de diferents bases de dades i s'agruparan en un dataset. Amb les seqüències peptídiques, es generaran els descriptors pseudo-aminoàcids per a la creació de models de predicció de toxicitat peptídica. Amb mètodes de clustering i balanceig es crearan nous datasets que seran usats per a generar models predictius amb els algoritmes de ML utilitzats: SVM, RF i GBRT. Es seleccionaran els millors models i seran avaluats amb un dataset extern. Els models generats per clustering i balanceig eren de major qualitat (exactitud, precisió, sensibilitat, especificitat, F1 i AUC de corba ROC) que els obtinguts amb el dataset inicial. Dels cinc millors models avaluats amb el dataset extern (Model Subsampling SVM, Model Subsampling RF, Model DBSCAN + Subsampling SVM, Model DBSCAN + Subsampling GBRT i Model Linclust RF), tres presentaven millors indicadors de qualitat. Es conclou que els millors models per predir la toxicitat de pèptids són Model Subsampling SVM, Model Subsampling RF i Model DBSCAN + Subsampling GBRT.ca
dc.description.abstractIn the development of new drugs, it has been seen that the majority of the studied molecules are discarded during clinical trials due to toxicity. As a consequence, computational methods have been developed to predict the activity of candidate molecules. In the last years, peptides have been proposed as possible drug candidates due to their high biological activity, specificity, low production cost and high penetration. This project aims to develop a Machine Learning (ML) model to predict peptide toxicity for the possible development of new drugs. Toxic and non-toxic peptides will be collected from different databases and gathered in a new dataset. With the peptide sequences, the pseudo-amino acids descriptors will be generated for the creation of predictive models of peptide toxicity. New datasets will be created with clustering and balancing techniques that will be used to generate predictive models with the used ML algorithms: SVM, RF and GBRT. The best models will be selected and evaluated with an external dataset. The models generated by clustering and subsampling had higher quality (accuracy, precision, sensitivity, specificity, F1-scrore and AUC of the ROC curve) than those obtained with the initial dataset. Three of the five best models evaluated with an external dataset (Modelo Subsampling SVM, Modelo Subsampling RF, Modelo DBSCAN+Subsampling SVM, Modelo DBSCAN+Subsampling GBRT y Modelo Linclust RF) presented better quality indicators. We conclude that the best models to predict peptides toxicity are Modelo Subsampling SVM, Modelo Subsampling RF and Modelo DBSCAN+Subsampling GBRT.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectpéptidoes
dc.subjecttoxicidades
dc.subjectmachine learninges
dc.subjectpèptidca
dc.subjecttoxicitatca
dc.subjectmachine learningca
dc.subjectpeptideen
dc.subjecttoxicityen
dc.subjectmachine learningen
dc.subject.lcshBioinformatics -- TFMen
dc.titlePredicción de la toxicidad en péptidos mediante técnicas Machine Learning-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
mmonserratgTFM0121memoria.pdfMemoria del TFM3,47 MBAdobe PDFVista previa
Visualizar/Abrir