Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/133102
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorÁlvarez González, Sara-
dc.contributor.otherMaceira, Marc-
dc.coverage.spatialFigueiroá, ESP-
dc.date.accessioned2021-07-05T09:35:00Z-
dc.date.available2021-07-05T09:35:00Z-
dc.date.issued2021-06-
dc.identifier.urihttp://hdl.handle.net/10609/133102-
dc.description.abstractEste trabajo tiene como objetivo obtener un modelo predictivo capaz de identificar las regiones en las que un Factor de Transcripción (FT) se acoplará al ADN. Los datos empleados son extraídos a partir de los resultados de la técnica de ChIP-seq. Dicha técnica es capaz de reconocer las secuencias en las que estos FTs se han acoplado. Identificar la secuencia exacta a la que los FTs se han unido es una tarea difícil en ciertas condiciones moleculares. Técnicas computacionales basadas en Machine Learning (ML), una rama dentro de la Inteligencia Artificial que centra sus esfuerzos en el desarrollo de modelos predictivos es considerada una herramienta analítica útil para este tipo de problemas. Estas técnicas son capaces de extraer los patrones no lineales de los datos a partir de un gran conjunto de ejemplos. Además, trabajos previos han desarrollado descriptores matemáticos capaces de convertir la secuencia primaria de ADN en matrices de datos numéricos, facilitando en gran medida el uso de algoritmos de ML. En este proyecto se presenta un conjunto de modelos que han sido entrenados para la predicción de las regiones de unión del FT Gcra en la especie bacteriana Brevundimonas subvibrioides. Los resultados aquí presentados muestran un alto rendimiento en la predicción de estas regiones gracias al uso de descriptores tanto estructurales como de composición del ADN.es
dc.description.abstractAquest treball té com a objectiu obtenir un model predictiu capaç d'identificar les regions en què un Factor de Transcripció (FT) s'acoblarà a l'ADN. Les dades emprats són extretes a partir dels resultats de la tècnica de ChIP-seq. Aquesta tècnica és capaç de reconèixer les seqüències en què aquests FTS s'han acoblat. Identificar la seqüència exacta a la qual els FTS s'han unit és una tasca difícil en certes condicions moleculars. Tècniques computacionals basades en Machine Learning (ML), una branca dins de la Intel·ligència Artificial que centra els seus esforços en el desenvolupament de models predictius és considerada una eina analítica útil per a aquest tipus de problemes. Aquestes tècniques són capaços d'extreure els patrons no lineals de les dades a partir d'un gran conjunt d'exemples. A més, treballs previs han desenvolupat descriptors matemàtics capaços de convertir la seqüència primària d'ADN en matrius de dades numèriques, facilitant en gran mesura l'ús d'algoritmes de ML. En aquest projecte es presenta un conjunt de models que han estat entrenats per a la predicció de les regions d'unió de l'FT Gcra en l'espècie bacteriana Brevundimonas subvibrioides. Els resultats aquí presentats mostren un alt rendiment en la predicció d'aquestes regions gràcies a l'ús de descriptors tant estructurals com de composició de l'ADN.ca
dc.description.abstractThe aim of this work is to obtain a predictive model capable of identifying the regions where a Transcription Factor (TF) will bind to DNA. The data used are extracted from the results of the ChIP-seq technique. This technique is able to recognize the sequences in which these TFs have been coupled. Identifying the precise sequence to which the TFs are attached is a difficult task under certain molecular conditions. Computational techniques based on Machine Learning (ML), a branch within Artificial Intelligence that focuses its efforts on the development of predictive models is considered a useful analytical tool for this type of problems. These techniques are capable of extracting nonlinear patterns from data from a large set of examples. In addition, previous work has developed mathematical descriptors capable of converting the primary DNA sequence into numerical data matrices, greatly facilitating the use of ML algorithms. In this project we present a set of models that have been trained for the prediction of TF Gcra binding regions in the bacterial species Brevundimonas subvibrioides. The results presented here show a high performance in the prediction of these regions thanks to the use of both structural and DNA composition descriptors.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectprotein bindingen
dc.subjectmachine learningen
dc.subjecttranscription factoren
dc.subjectunió a proteïnesca
dc.subjectaprenentatge automàticca
dc.subjectfactor de transcripcióca
dc.subjectunión a proteínases
dc.subjectaprendizaje automáticoes
dc.subjectfactor de transcripciónes
dc.subject.lcshBioinformatics -- TFMen
dc.titleDesarrollo de un sistema de Machine Learning para obtener modelos de unión a factores de transcripción en datos ChIP-seq-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorErill, Ivan-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
salvarezgonzTFM0621memoria.pdfMemoria del TFM1,8 MBAdobe PDFVista previa
Visualizar/Abrir