Please use this identifier to cite or link to this item:

http://hdl.handle.net/10609/91266
Full metadata record
DC FieldValueLanguage
dc.contributor.authorSaura Sánchez, Maria Teresa-
dc.date.accessioned2019-02-03T23:59:22Z-
dc.date.available2019-02-03T23:59:22Z-
dc.date.issued2019-01-
dc.identifier.urihttp://hdl.handle.net/10609/91266-
dc.description.abstractLas plantas desarrollan nuevos órganos y tejidos a lo largo de su ciclo de vida. Gracias a la tecnología de microarrays de ADN se ha podido indagar en los mecanismos transcripcionales asociados al desarrollo de estas estructuras en la especie modelo Arabidopsis thaliana. Sin embargo, los estudios publicados analizan un reducido número de muestras para la selección de genes de desarrollo según la expresión específica de éstos en los distintos tejidos de la planta, sin tener en cuenta relaciones más complejas entre los genes. En este trabajo se propone el uso de técnicas de machine learning para la selección de genes relevantes en el desarrollo de las estructuras de la planta A. thaliana. Para ello, se generó una base de datos con más de 500 perfiles de expresión correspondientes a semillas, plántulas, raíces, hojas y flores. Sobre estos datos se utilizaron tres métodos de machine learning para la selección de genes según su importancia en modelos de clasificación: FP-RF, RF-RFE SVM-RFE. Además, se evaluó la capacidad del método autoencoder para la representación de estos datos en una dimensión reducida. Los grupos de genes seleccionados por ML mostraron un alto rendimiento en la clasificación de las muestras por RF, SVM y ANN. Asimismo, el análisis funcional in silico de estos genes reveló su implicancia en los procesos de desarrollo de la planta. Estos resultados ponen de manifiesto la potencia de los algoritmos de ML para el estudio del desarrollo de las plantas a partir de datos de expresión génica.es
dc.description.abstractTranscriptional programs are important in the development of the structures throughout the life cycle of plants. DNA microarray technology has provided a useful tool to discover relevant genes in the development of the reference plant Arabidopsis thaliana. However, previous studies use a reduced number samples to discover marker genes based on its specific expression along the tissues. In this work, a machine learning approach is presented to select relevant genes in the development of A. Thaliana. A database was built with more than 500 expression profiles corresponding to seeds, seedlings, roots, leaves and flowers. Gene selection was carried out with three different ML methods: FP-RF, RF-RFE, SVM-RFE. Furthermore, an autoencoder architecture was evaluated for dimensionality reduction of the data. The genes selected by ML techniques yield high classification performance in SVM, RF and ANN algorithms. Moreover, these genes are biologically relevant to plant development process. This work provides a new approach to study plant development from gene expression data.en
dc.description.abstractLes plantes desenvolupen nous òrgans i teixits al llarg del seu cicle de vida. Gràcies a la tecnologia de microarrays d'ADN s'ha pogut indagar en els mecanismes transcripcionals associats al desenvolupament d'aquestes estructures en l'espècie model Arabidopsis thaliana. No obstant això, els estudis publicats analitzen un reduït nombre de mostres per a la selecció de gens de desenvolupament segons l'expressió específica d'aquests en els diferents teixits de la planta, sense tenir en compte relacions més complexes entre els gens. En aquest treball es proposa l'ús de tècniques de machine learning per a la selecció de gens rellevants en el desenvolupament de les estructures de la planta A. thaliana. Per a això, es va generar una base de dades amb més de 500 perfils d'expressió corresponents a llavors, plàntules, arrels, fulles i flors. Sobre aquestes dades es van utilitzar tres mètodes d'machine learning per a la selecció de gens segons la seva importància en models de classificació: FP-RF, RF-RFE SVM-RFE. A més, es va avaluar la capacitat del mètode autoencoder per a la representació d'aquestes dades en una dimensió reduïda. Els grups de gens seleccionats per ML van mostrar un alt rendiment en la classificació de les mostres per RF, SVM i ANN. Així mateix, l'anàlisi funcional in silico d'aquests gens va revelar la seva implicancia en els processos de desenvolupament de la planta. Aquests resultats posen de manifest la potència dels algoritmes de ML per a l'estudi del desenvolupament de les plantes a partir de dades d'expressió gènica.ca
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectmachine learningen
dc.subjectArabidopsis thalianaca
dc.subjectaprendizaje automáticoes
dc.subjectaprenentatge automàticca
dc.subjectArabidopsis thalianaes
dc.subjectArabidopsis thalianaen
dc.subjectmicroarrayses
dc.subjectmicroarraysca
dc.subjectmicroarraysen
dc.subject.lcshBioinformatics -- TFMen
dc.titleMachine learning para la selección de genes implicados en el desarrollo de Arabidopsis thaliana utilizando datos de expresión génica-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.directorSánchez Pla, Alexandre-
dc.contributor.tutorVegas Lozano, Esteban-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Appears in Collections:Bachelor thesis, research projects, etc.

Files in This Item:
File Description SizeFormat 
saurasanchezTFM0119memoria.pdfMemoria del TFM5.7 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License Creative Commons