Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/121606
Título : eQTL Detector; an automated pipeline for eQTL mapping and downstream analysis
Autoría: Martínez Rosales, Diego Maximiliano
Tutor: Garrido Martín, Diego
Resumen : Access to both DNA and RNA genotyping technologies have opened a new paradigm in the mapping of complex characters, these are based on the evaluation of the interaction of the genotype and other variables such as methylations, proteins or levels of gene expression, in relation to this last variable, expression QTLs (eQTL) try to determine the level of expression of each gene based on each of the variants of the organisms in whole genome basis, the variants can be close to the gene of interest, in a range of 1Mb, _cis_-eQTL, or distant in a range greater than 1 Mb, called _trans_-eQTL. The amount of data necessary to perform this type of studies requires the use of tools that are easy to implement and that guarantee reproducible results. The use of containers in bioinformatics has been one of the solutions to this problem, then Docker is one of the most widely used. On the other hand, different tools that can map eQTL have existed for more than a decade, but there is one that stands out above the others, QTLtools, an application easy to implement, efficient in the use of hardware and also contains different modules that goes from quality control of samples to the co-localization of eQTL with GWAS hits. In this work we present eQTL_Detector, an automated pipeline that uses the QTLtools modules as a base and integrates them into a container that generates a report using the statistical software R and R Markdown functionalities for the creation of the report. In addition, in this work we describes each of the steps of this pipeline describing the inputs and outputs for each step together with their statistical foundations.
El acceso a tecnologías de genotipado tanto de ADN como ARN han abierto una nuevo paradigma en el mapeo de caracteres complejos, estas están basadas en la evaluación de la interacción del genotipo y otras variables como metilaciones, proteínas o niveles de expresión genética, en relación a esta última variable, los denominados QTL de expresión (eQTL) tratan de determinar el nivel de expresión de cada gen en función de cada una de las variantes del genoma del organismo, las variantes pueden ser cercanas al gen de interés, en un rango de 1Mb cis-eQTL, o distantes en un rango mayor a 1 Mb , denominados trans-eQTL. La cantidad de datos necesarios para realizar este tipo de estudios requiere del uso de herramientas que sean fáciles de implementar y que garanticen resultados reproducibles, el uso de contenedores en bioinformática ha sido una de las soluciones a este problema, siendo Docker uno de los más utilizados. Por otra parte, diferentes herramientas que tienen la capacidad de realizar mapeo de eQTL existen desde hace más de una década, pero existe una que sobresale sobre sobre las otras, QTLtools, una aplicación fácil de implementar, eficiente en el uso del hardware y además contiene diferentes módulos que van desde el control de calidad de las muestras hasta la colocalización de eQTL con hits de GWAS. En este trabajo presentamos eQTL_Detector un pipeline automatizado que utiliza como base los módulos de QTLtools y los integra en un contenedor que genera un reporte utilizando el software estadístico R y funcionalidades de R Markdown para la creación del reporte, además en el presente trabajo se describen cada uno de los pasos de este pipeline describiendo las entradas y salidas de cada paso junto con los fundamentos estadísticos de estos.
L'accés a tecnologies de genotipat tant d'ADN com ARN han obert una nou paradigma en el mapatge de caràcters complexos, aquestes estan basades en l'avaluació de la interacció del genotip i altres variables com a metilacions, proteïnes o nivells d'expressió genètica, en relació a aquesta última variable, els denominats QTL d'expressió (eQTL) tracten de determinar el nivell d'expressió de cada gen en funció de cadascuna de les variants del genoma de l'organisme, les variants poden ser pròximes al gen d'interès, en un rang de 1Mb cis-eQTL, o distants en un rang major a 1 Mb , denominats trans-eQTL. La quantitat de dades necessàries per a realitzar aquest tipus d'estudis requereix de l'ús d'eines que siguin fàcils d'implementar i que garanteixin resultats reproduïbles, l'ús de contenidors en bioinformàtica ha estat una de les solucions a aquest problema, sent Docker un dels més utilitzats. D'altra banda, diferents eines que tenen la capacitat de realitzar mapatge de eQTL existeixen des de fa més d'una dècada, però existeix una que sobresurt sobre sobre les altres, QTLtools, una aplicació fàcil d'implementar, eficient en l'ús del maquinari i a més conté diferents mòduls que van des del control de qualitat de les mostres fins a la colocalización de eQTL amb hits de GWAS. En aquest treball presentem eQTL_Detector un pipeline automatitzat que utilitza com a base els mòduls de QTLtools i els integra en un contenidor que genera un reporti utilitzant el programari estadístic R i funcionalitats de R Markdown per a la creació del reporti, a més en el present treball es descriuen cadascun dels passos d'aquest pipeline descrivint les entrades i sortides de cada pas juntament amb els fonaments estadístics d'aquests.
Palabras clave : eQTL
pipeline
Docker
GWAS
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : 6-jun-2020
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
martindiTFM0620memoria.pdfMemoria del TFM1,19 MBAdobe PDFVista previa
Visualizar/Abrir