Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/97527
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorGuadall Roldán, Anna-
dc.contributor.otherCanovas Izquierdo, Javier Luis-
dc.date.accessioned2019-07-02T15:24:06Z-
dc.date.available2019-07-02T15:24:06Z-
dc.date.issued2019-06-04-
dc.identifier.urihttp://hdl.handle.net/10609/97527-
dc.description.abstractConventional flow cytometry is an experimental technique enabling to measure up to 30 fluorescence parameters per cell. Recently, flow cytometry has been fused to mass spectrometry giving rise to a new methodology named mass cytometry that can potentially detect up to 100 parameters per cell. Cell populations are mainly characterized by a procedure known as gating, consisting in manually delimitating cell subsets using histograms or two-dimensional dot plots in a sequential manner. This procedure is time-consuming, imprecise and particularly inadequate to be used with a high number of parameters. In the past few years new computational techniques have been developed in order to efficiently handle high-dimensional cytometry data. However, such developments are still under evaluation. Furthermore, dealing with these techniques requires proficiency in using R packages and script writing. The main objective of this project is to provide cytometrists with efficient and easy-to-use unsupervised learning algorithms and visualization tools to explore high-dimensional cytometry data in a reproducible way. To that end, an extensive bibliographic research on unsupervised clustering algorithms applied to cytometry data has been performed and a methodology for performance evaluation has been developed. A selection of algorithms has been benchmarked using this methodology and both real cytometry and synthetic data, the latter being specially generated to that end. This comparative study has allowed the selection of a clustering algorithm, RPhenograph, to implement a Shiny application. The developed methodology is now ready to be applied to benchmark further algorithms and compare performances on other experimental designs.en
dc.description.abstractLa citometría de flujo convencional es una tecnología que permite detectar hasta 30 parámetros por célula. Recientemente, la citometría de flujo y la espectrometría de masas se han fusionado dando lugar a la denominada citometría de masas, que potencialmente permite la detección de hasta 100 parámetros por célula. Las poblaciones celulares se caracterizan principalmente mediante el procedimiento de gating, consistente en delimitar manualmente las poblaciones usando histogramas o gráficos de puntos de manera secuencial. Este procedimiento es lento, impreciso y particularmente inadecuado para un elevado número de parámetros. En los últimos años se han estado desarrollando nuevas técnicas computacionales con la finalidad de manejar datos de citometría multidimensional de modo eficiente. Sin embargo, la eficacia de tales desarrollos todavía se está evaluando. Además, el manejo de estas técnicas requiere habilidad en el uso de paquetes R y programación. El objetivo principal de este proyecto es proporcionar a los citometristas algoritmos de aprendizaje no supervisado y técnicas de visualización para explorar datos de citometría multiparamétrica de modo reproducible. Con esta finalidad, se ha realizado una extensa búsqueda bibliográfica sobre algoritmos de agrupamiento aplicados a la citometría y se ha desarrollado una metodología para la evaluación del rendimiento. Una selección de algoritmos ha sido contrastada aplicando esta metodología a datos de citometría reales y datos ficticios generados expresamente con este fin. Este estudio comparativo ha permitido seleccionar un algoritmo de agrupamiento, RPhenograph, para ser implementado mediante una aplicación Shiny. La metodología desarrollada es aplicable para la evaluación de nuevos algoritmos y nuevos diseños experimentales.es
dc.description.abstractLa citometria de flux convencional és una tecnologia que permet detectar fins a 30 paràmetres per cèl·lula. Recentment, la citometria de flux i l'espectrometria de masses s'han fusionat donant lloc a l'anomenada citometria de masses, que potencialment permet la detecció de fins a 100 paràmetres per cèl·lula. Les poblacions cel·lulars es caracteritzen principalment mitjançant el procediment de gating, consistent en delimitar manualment les poblacions usant histogrames o gràfics de punts de manera seqüencial. Aquest procediment és lent, imprecís i particularment inadequat per a un elevat nombre de paràmetres. En els últims anys s'han estat desenvolupant noves tècniques computacionals amb la finalitat de gestionar dades de citometria multidimensional de manera eficient. No obstant això, l'eficàcia d'aquests desenvolupaments encara s'està avaluant. A més, el maneig d'aquestes tècniques requereix habilitat en l'ús de paquets R i programació. L'objectiu principal d'aquest projecte és proporcionar als citometristas algoritmes d'aprenentatge no supervisat i tècniques de visualització per explorar dades de citometria multiparamètrica de manera reproduïble. Amb aquesta finalitat, s'ha realitzat una extensa recerca bibliogràfica sobre algoritmes d'agrupament aplicats a la citometria i s'ha desenvolupat una metodologia per a l'avaluació del rendiment. Una selecció d'algorismes ha estat contrastada aplicant aquesta metodologia a dades de citometria reals i dades fictícies generats expressament amb aquesta finalitat. Aquest estudi comparatiu ha permès seleccionar un algoritme d'agrupament, RPhenograph, per a ser implementat mitjançant una aplicació Shiny. La metodologia desenvolupada és aplicable per a l'avaluació de nous algoritmes i nous dissenys experimentals.ca
dc.format.mimetypeapplication/pdf-
dc.language.isoeng-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectmultiparametric cytometryen
dc.subjectclusteringen
dc.subjectalgorithm performanceen
dc.subjectcitometría multiparamétricaes
dc.subjectrendimiento del algoritmoes
dc.subjectclusteringes
dc.subjectcitometria multiparamètricaca
dc.subjectrendiment del algorismeca
dc.subjectclusteringca
dc.subject.lcshBioinformatics -- TFMen
dc.titleComparison of clustering methods for multiparametric cytometry data analysis in order to implement an R/Shiny application-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelMaster's degreesen
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorAdsuar Gómez, Antonio Jesús-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
aguadallTFM0619memory.pdfMemory of TFM3,29 MBAdobe PDFVista previa
Visualizar/Abrir