Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/148591
Título : Benchmark of pre-processing pipelines of single cell RNA sequencing data
Autoría: Jiménez Sánchez, Dídac
Tutor: Saera-Vila, Alfonso  
Resumen : Single cell RNA sequencing (scRNA-Seq) is a very powerful tool to study the transcriptome. Several tools are available to pre-process the data it produces. However, no standard exists. The objective of this work is to compare four scRNA-Seq pre-processing tools and extract conclusions regarding the advancements over recent years, and to determine the superior tool. The tools compared were (i) UMI Tools, one of the first published tools, which served as reference point, (ii) Salmon Alevin, a tool with many interesting features, (iii) Kallisto Bustools, a tool focused on computational efficiency and (iv) STARSolo, a recent implementation to a popular aligner. I designed 4 pipelines in bash to implement each tool, and I implemented a downstream analysis to evaluate the biological significance of the results. I compared the computational speed and efficiency, the count matrices produced and the biological results. For the comparisons, I used the datasets provided by Tabula Muris as ground truth. I found that Kallisto Bustools was significantly more efficient and faster, while UMI Tools was the slowest tool. The count matrices produced were consistent with the ground truth for UMI Tools and Kallisto Bustools while Salmon Alevin and STARSolo presented inconsistencies. The biological results were coherent, although Salmon Alevin showed problematics. I concluded that scRNA-Seq has progressed in recent years but more so in computational efficiency. Kallisto Bustools was the fastest and most consistent tool among those evaluated.
El single-cell RNA sequencing (scRNA-Seq) és una eina molt potent per estudiar el transcriptoma. Hi ha diverses eines disponibles per preprocessar les dades que se n'obtenen. Tanmateix, no existeix cap estàndard. L'objectiu d'aquest treball és comparar quatre eines de preprocessament de scRNA-Seq, extreure conclusions sobre els avenços dels darrers anys, i determinar si hi ha una eina superior. Les eines comparades han sigut (i) UMI Tools, una de les primeres eines publicades, que serveix de punt de referència, (ii) Salmon Alevin, una eina amb moltes característiques interessants, (iii) Kallisto Bustools, una eina centrada en l'eficiència computacional i (iv) STARSolo, una implementació recent sobre un aligner popular. He dissenyat 4 pipelines en bash per implementar cada eina i he implementat un anàlisi downstream per a avaluar la significació biològica dels resultats. He comparat la velocitat i l'eficiència computacional, les count matrix produïdes i els resultats biològics. Per a les comparacions, he utilitzat els conjunts de dades proporcionats per Tabula Muris com a ground truth. He trobat que Kallisto Bustools és significativament més ràpid i eficient, mentre que UMI Tools és l'eina més lenta. Les count matrix produïdes per UMI Tools i Kallisto Bustools han estat coherents amb la ground truth, mentre que les produïdes per Salmon Alevin i STARSolo presentaven inconsistències. Els resultats biològics han sigut coherents, tot i que Salmon Alevin ha presentat problemes. Concloc que el preprocessat de dades de scRNA-Seq ha progressat en els darrers anys, però més en eficiència computacional. Kallisto Bustools es l'eina més ràpida i consistent entre les avaluades.
Palabras clave : scRNA-seq
bioinformatics
preprocessing
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : jun-2023
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
djimenezsancheFMDP0623report.pdfReport of TFM1,54 MBAdobe PDFVista previa
Visualizar/Abrir
Comparte:
Exporta:
Consulta las estadísticas

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons