Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/98986
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorVela Castro, Alberto-
dc.date.accessioned2019-07-11T15:20:19Z-
dc.date.available2019-07-11T15:20:19Z-
dc.date.issued2019-06-04-
dc.identifier.urihttp://hdl.handle.net/10609/98986-
dc.description.abstractExiste una creciente predilección por la aplicación de técnicas in silico en el desarrollo y descubrimiento de nuevos fármacos frente a las costosas y laboriosas técnicas de laboratorio. Estas son técnicas de machine learning. El Trabajo de Final de Máster (TFM) consistirá en analizar cuáles son las mejores técnicas actuales de machine learning para la predicción de la propiedad ADME-Tox, toxicidad. Una vez seleccionadas se realizará una comparativa práctica, además de una teórica con una base de datos real donde se podrán observar las distintas eficacias en la predicción de los distintos modelos propuestos. La metodología se llevó a cabo con el software libre de R y el paquete "rcdk" para la generación de los descriptores, le siguió un pre-procesamiento de los datos y una posterior generación de los algoritmos con su debida comparación. El algoritmo que se diferenció del resto por sus características fue el Árbol de decisión con una precisión del 0.88 y un índice kappa de 0.72 para este tipo de datos. Gracias a que es capaz de operar con bajos volúmenes de datos, pocos niveles y sobre todo por su capacidad de excluir características sin importancia. Se podría concluir que para bases de datos con un gran número de descriptores numéricos y pocos valores el algoritmo idóneo sería el Árbol de decisión.es
dc.description.abstractThere is a growing predilection for the application of in silico techniques in the development and discovery of new drugs opposite of costly and laborious laboratory techniques. These are machine learning techniques. The Master Final Project (TFM) consisted in the analysis of the best current techniques of machine learning for the prediction of ADME-Tox property, toxicity. Once a theoretical comparison has been made, a practice will be carried out with a real database where it will be possible to observe the different efficiencies in the prediction of the different proposed models. The methodology was carried out with the free software of R and the "rcdk" package for the generation of the descriptors, followed by a pre-processing of the data and a subsequent generation of the algorithms with their proper comparison. The algorithm that was differentiated from the rest by its characteristics was the Decision Tree with an accuracy of 0.88 and a kappa index of 0.72 for this type of data. Thanks to the fact that it is capable of operating with low data volumes, few levels and above all because of its ability to exclude unimportant features. It could be concluded that for databases with a large number of numerical descriptors and few values, the ideal algorithm would be the Decision Tree.en
dc.description.abstractExisteix una creixent predilecció per l'aplicació de tècniques in silico en el desenvolupament i descobriment de nous fàrmacs enfront de les costoses i laborioses tècniques de laboratori. Aquestes són tècniques de machine learning. El Treball de Final de Màster (TFM) consistirà a analitzar quines són les millors tècniques actuals de machine learning per a la predicció de la propietat ADME-Tox, toxicitat. Una vegada seleccionades es realitzarà una comparativa pràctica, a més d'una teòrica amb una base de dades real on es podran observar les diferents eficàcies en la predicció dels diferents models proposats. La metodologia es va dur a terme amb el programari lliure de R i el paquet "rcdk" per a la generació dels descriptors, li va seguir un pre-processament de les dades i una posterior generació dels algorismes amb la seva deguda comparació. L'algorisme que es va diferenciar de la resta per les seves característiques va ser l'Arbre de decisió amb una precisió del 0.88 i un índex kappa de 0.72 per a aquesta mena de dades. Gràcies a que és capaç d'operar amb baixos volums de dades, pocs nivells i sobretot per la seva capacitat d'excloure característiques sense importància. Es podria concloure que per a bases de dades amb un gran nombre de descriptors numèrics i pocs valors l'algorisme idoni seria l'Arbre de decisió.ca
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-SA-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/es/-
dc.subjectmachine learningen
dc.subjectmáquina de vectores de soportees
dc.subjectsupport vector machineen
dc.subjectmàquina de vectors de suportca
dc.subjectredes neuronales artificialeses
dc.subjectxarxes neuronals artificialsca
dc.subjectartificial neural networksen
dc.subjecttoxicidades
dc.subjecttoxicitatca
dc.subjecttoxicityen
dc.subjectaprenentatge automàticca
dc.subjectaprendizaje automáticoes
dc.subjectbases de dadesca
dc.subjectdatabaseen
dc.subjectbases de datoses
dc.subjectanálisis estadísticoes
dc.subjectanàlisi estadísticaca
dc.subjectstatistical analysisen
dc.subject.lcshBioinformatics -- TFMen
dc.titleEmpleo de técnicas de Machine Learning para la predicción de propiedades ADME-Tox: Toxicidad-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.directorEnciso, Marta-
dc.contributor.tutorCanovas Izquierdo, Javier Luis-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
velacastroaTFM0619memoria.pdfMemoria del TFM925,65 kBAdobe PDFVista previa
Visualizar/Abrir