Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/82228
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorMiro Cau, Berta-
dc.date.accessioned2018-07-03T00:58:10Z-
dc.date.available2018-07-03T00:58:10Z-
dc.date.issued2018-06-05-
dc.identifier.urihttp://hdl.handle.net/10609/82228-
dc.description.abstractGene expression regulated by DNA methylation patterns has been long studied in relation to cancer. There exists a negative correlation between the expression of a gene and its methylation level. An integrative analysis of expression and methylation arrays was performed using three datasets for colorectal cancer: TCGA, GEO and own data. The datasets had over 11000 genes, 9000 of which were common. Based on the preconception that methylation represses expression, we selected genes that showed an L-shaped expression and methylation scatterplot with 4 different methods. The first method used, naive, was based on a signifi cant negative correlation. Another method was based on Conditional Mutual Information (CMI). A heuristic method was carried out by superimposing a grid on each scatterplot and weighing the cells according to an L-shape. Finally, a scagnostics selection analysis was based on 9 parameters de ning the shape of scatterplots. The scagnostics needed to be used in conjunction with other methods for optimal results. The accuracy, sensitivity and speci city were measured for the various methods and the one with the best diagnostic measures was the Heuristic, followed by the CMI and the naive. The one that fared lowest was the scagnostics. The final gene list was obtained from a pool of all methodologies.It resulted in 179 target genes, mostly coding for ATP-binding, transcription and zinc finger proteins.en
dc.description.abstractLa expresión génica regulada por patrones de metilación del ADN ha sido estudiada durante mucho tiempo en relación con el cáncer. Existe una correlación negativa entre la expresión. de un gen y su nivel de metilación. El análisis integrador de la expresión y los arreglos de metilación se han realizado utilizando tres conjuntos de datos para el cáncer colorrectal: TCGA, GEO y datos propios. Los conjuntos de datos tienen más de 11000 genes, 9000 de los cuales son comunes. Sobre la base de la idea preconcebida de que la metilación reprime la expresión, seleccionamos genes que mostraron una expresión en forma de L y un gráfico de dispersión de metilación con 4 diferentes metodos. El primer método utilizado, se basó en una significativa correlación negativa. Otro método fue basado en información mutua condicional(CMI). Se realizó un método heurístico mediante la superposición de una cuadrícula en cada dispersión y pesaje de las celdas según una forma de L. Finalmente, el análisis de la selección de los datos estadísticos se basó en 9 parámetros que definen la forma de gráficos de dispersión. Los escagnósticos debían usarse junto con otros métodos para obtener resultados óptimos. La precisión, sensibilidad y especificidad fueron medidas para los diferentes métodos y la que tenía las mejores medidas diagnósticas fue la heurística, seguida de la CMI.es
dc.description.abstractL'expressió gènica regulada per patrons de metilació de l'ADN ha estat estudiada durant molt temps en relació amb el càncer. Existeix una correlació negativa entre l'expressiód'un gen i el seu nivell de metilación. L'anàlisi integrador de l'expressió i els arranjaments de metilació s'han realitzat utilitzant tres conjunts de dades per al càncer colorrectal: TCGA, GEO i dades pròpies. Els conjunts de dades tenen més de 11000 gens, 9000 dels quals són comuns. Sobre la base de la idea preconcebuda que la metilació reprimeix l'expressió, seleccionem gens que van mostrar una expressió en forma de L i un gràfic de dispersió de metilación amb 4 diferents métodes. El primer mètode utilitzat, es va basar en una significativa correlació negativa. Un altre mètode va ser basat en informació mútua condicional(CMI). Es va realitzar un mètode heurístic mitjançant la superposició d'una quadrícula en cada dispersió i pesaje de les cel·les segons una forma de L. Finalment, l'anàlisi de la selecció de les dades estadístiques es va basar en 9 paràmetres que defineixen la forma de gràfics de dispersió. Els escagnóstics havien d'usar-se juntament amb altres mètodes per obtenir resultats òptims. La precisió, sensibilitat i especificitat van ser mesurades per als diferents mètodes i la que tenia les millors mesures diagnòstiques va ser l'heurística, seguida de la CMI.ca
dc.format.mimetypeapplication/pdf-
dc.language.isoeng-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectgene expressionen
dc.subjectexpresión génicaes
dc.subjectexpressió gènicaca
dc.subjectmetilacióca
dc.subjectmetilaciónes
dc.subjectmethylationen
dc.subjectintegracióca
dc.subjectintegraciónes
dc.subjectintegrationen
dc.subject.lcshBioinformatics -- TFMen
dc.titleScatterplot analysis of expression and DNA methylation integration data-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorSánchez-Pla, Alex-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
bmirocTFM0618memory.pdfMemoria del TFM4,19 MBAdobe PDFVista previa
Visualizar/Abrir