Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/82006
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorGómez Sánchez, Juan Alberto-
dc.contributor.otherUniversitat Oberta de Catalunya-
dc.contributor.otherMerino, David-
dc.date.accessioned2018-07-02T08:25:41Z-
dc.date.available2018-07-02T08:25:41Z-
dc.date.issued2018-06-
dc.identifier.urihttp://hdl.handle.net/10609/82006-
dc.description.abstractEn el presente proyecto se ha buscado obtener un método que permita comparar el funcionamiento de varios de los algoritmos de agrupamiento más comúnmente utilizados al ser aplicados sobre una matriz de datos de expresión génica. La necesidad de poder seleccionar los algoritmos más eficientes surge del aumento progresivo en el volumen de este tipo de datos y los grandes requerimientos de análisis necesarios. Para conseguir los objetivos se han desarrollado los diferentes algoritmos elegidos utilizando un set de datos común con datos de muestras de tejido mamario, las cuales se dividían en clases según su tipo celular (lobular y ductal) y según su estado (normal o tumoral), y se han comparado sus resultados en función de diversos criterios como la internalidad, la estabilidad o la variación biológica. Se han obtenido resultados tanto de cómo agrupan los datos cada uno de los algoritmos, como de comparación entre todos ellos. Estos resultados apuntan a un mejor manejo de estos datos por parte de los algoritmos de tipo jerárquico, en especial el algoritmo DIANA. Finalmente se concluye que los algoritmos de agrupamiento no trabajan especialmente bien con este tipo de datos, ya que a la hora de dividir los datos en grupos no se ha obtenido un buen reparto de forma general, siendo la división entre células tumorales y normales la única agrupación que se puede valorar como positiva.es
dc.description.abstractThe aim of this project is to obtain a method that allow us to compare how some of the most common clustering algoritms works when they are applied over a genetic expression matrix. The desire to select the most efficient algorithms arises from the progressive increase of this data type volume and the huge requirements that it needs. To achieve the objetives it has been developed all the diferents chosen algoritms using it over a common data set which consist in samples of mammary tissue that are divided by his celular type (lobular and ductal) and by his state (normal and tumoral), and its results has been compared in function of diverse criteria like internality, stability and biological variation. Results of how this algorithms group the data has been obtained along with a comparative about the process. The results point to a better control of this data by the hierarchical algorithms, especially the DIANA algorithm. Finally, it is concluded that this type of algorithms doesn't works well with this type of data, because it didn´t get a good divide on the data set generally, being the division between tumoral and normal cells the only what can be rating as positive.en
dc.description.abstractEn el present projecte s'ha buscat obtenir un mètode que permeti comparar el funcionament de varis dels algorismes d'agrupament més comunament utilitzats en ser aplicats sobre una matriu de dades d'expressió gènica. La necessitat de poder seleccionar els algorismes més eficients sorgeix de l'augment progressiu en el volum d'aquest tipus de dades i els grans requeriments d'anàlisis necessàries. Per aconseguir els objectius s'han desenvolupat els diferents algorismes triats utilitzant un set de dades comuna amb dades de mostres de teixit mamari, les quals es dividien en classes segons el seu tipus cel·lular (lobular i ductal) i segons el seu estat (normal o tumoral), i s'han comparat els seus resultats en funció de diversos criteris com la internalidad, l'estabilitat o la variació biològica. S'han obtingut resultats tant de com agrupen les dades cadascun dels algorismes, com de comparació entre tots ells. Aquests resultats apunten a un millor maneig d'aquestes dades per part dels algorismes de tipus jeràrquic, especialment l'algorisme DIANA. Finalment es conclou que els algorismes d'agrupament no treballen especialment bé amb aquest tipus de dades, ja que a l'hora de dividir les dades en grups no s'ha obtingut un bon repartiment de forma general, sent la divisió entre cèl·lules tumorals i normals l'única agrupació que es pot valorar com a positiva.ca
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectexpresión génicaes
dc.subjectgene expressionen
dc.subjectmachine learningen
dc.subjectaprenentatge automàticca
dc.subjectaprendizaje automáticoes
dc.subjectclusteringes
dc.subjectclusteringca
dc.subjectclusteringen
dc.subjectexpressió gènicaca
dc.subject.lcshBioinformatics -- TFMen
dc.titleAnálisis comparativo de diferentes métodos de agrupación para el tratamiento de datos de expresión genética-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelPostgraduate degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorRebrij, Romina-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jgomezsanchezTFM0618memoria.pdfMemoria del TFM879,47 kBAdobe PDFVista previa
Visualizar/Abrir
jgomezsanchezTFM0618código.pdfCódigo en formato Markdown357,26 kBAdobe PDFVista previa
Visualizar/Abrir