Please use this identifier to cite or link to this item: http://hdl.handle.net/10609/121606
Title: eQTL Detector; an automated pipeline for eQTL mapping and downstream analysis
Author: Martínez Rosales, Diego Maximiliano
Tutor: Garrido Martín, Diego
Abstract: Access to both DNA and RNA genotyping technologies have opened a new paradigm in the mapping of complex characters, these are based on the evaluation of the interaction of the genotype and other variables such as methylations, proteins or levels of gene expression, in relation to this last variable, expression QTLs (eQTL) try to determine the level of expression of each gene based on each of the variants of the organisms in whole genome basis, the variants can be close to the gene of interest, in a range of 1Mb, _cis_-eQTL, or distant in a range greater than 1 Mb, called _trans_-eQTL. The amount of data necessary to perform this type of studies requires the use of tools that are easy to implement and that guarantee reproducible results. The use of containers in bioinformatics has been one of the solutions to this problem, then Docker is one of the most widely used. On the other hand, different tools that can map eQTL have existed for more than a decade, but there is one that stands out above the others, QTLtools, an application easy to implement, efficient in the use of hardware and also contains different modules that goes from quality control of samples to the co-localization of eQTL with GWAS hits. In this work we present eQTL_Detector, an automated pipeline that uses the QTLtools modules as a base and integrates them into a container that generates a report using the statistical software R and R Markdown functionalities for the creation of the report. In addition, in this work we describes each of the steps of this pipeline describing the inputs and outputs for each step together with their statistical foundations.
El acceso a tecnologías de genotipado tanto de ADN como ARN han abierto una nuevo paradigma en el mapeo de caracteres complejos, estas están basadas en la evaluación de la interacción del genotipo y otras variables como metilaciones, proteínas o niveles de expresión genética, en relación a esta última variable, los denominados QTL de expresión (eQTL) tratan de determinar el nivel de expresión de cada gen en función de cada una de las variantes del genoma del organismo, las variantes pueden ser cercanas al gen de interés, en un rango de 1Mb cis-eQTL, o distantes en un rango mayor a 1 Mb , denominados trans-eQTL. La cantidad de datos necesarios para realizar este tipo de estudios requiere del uso de herramientas que sean fáciles de implementar y que garanticen resultados reproducibles, el uso de contenedores en bioinformática ha sido una de las soluciones a este problema, siendo Docker uno de los más utilizados. Por otra parte, diferentes herramientas que tienen la capacidad de realizar mapeo de eQTL existen desde hace más de una década, pero existe una que sobresale sobre sobre las otras, QTLtools, una aplicación fácil de implementar, eficiente en el uso del hardware y además contiene diferentes módulos que van desde el control de calidad de las muestras hasta la colocalización de eQTL con hits de GWAS. En este trabajo presentamos eQTL_Detector un pipeline automatizado que utiliza como base los módulos de QTLtools y los integra en un contenedor que genera un reporte utilizando el software estadístico R y funcionalidades de R Markdown para la creación del reporte, además en el presente trabajo se describen cada uno de los pasos de este pipeline describiendo las entradas y salidas de cada paso junto con los fundamentos estadísticos de estos.
Keywords: eQTL
Docker
pipeline
Document type: info:eu-repo/semantics/masterThesis
Issue Date: 6-Jun-2020
Publication license: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Appears in Collections:Trabajos finales de carrera, trabajos de investigación, etc.

Files in This Item:
File Description SizeFormat 
martindiTFM0620memoria.pdfMemoria del TFM1,19 MBAdobe PDFThumbnail
View/Open