Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/91266
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Saura Sánchez, Maria Teresa | - |
dc.contributor.other | Sánchez-Pla, Alex | - |
dc.date.accessioned | 2019-02-03T23:59:22Z | - |
dc.date.available | 2019-02-03T23:59:22Z | - |
dc.date.issued | 2019-01 | - |
dc.identifier.uri | http://hdl.handle.net/10609/91266 | - |
dc.description.abstract | Las plantas desarrollan nuevos órganos y tejidos a lo largo de su ciclo de vida. Gracias a la tecnología de microarrays de ADN se ha podido indagar en los mecanismos transcripcionales asociados al desarrollo de estas estructuras en la especie modelo Arabidopsis thaliana. Sin embargo, los estudios publicados analizan un reducido número de muestras para la selección de genes de desarrollo según la expresión específica de éstos en los distintos tejidos de la planta, sin tener en cuenta relaciones más complejas entre los genes. En este trabajo se propone el uso de técnicas de machine learning para la selección de genes relevantes en el desarrollo de las estructuras de la planta A. thaliana. Para ello, se generó una base de datos con más de 500 perfiles de expresión correspondientes a semillas, plántulas, raíces, hojas y flores. Sobre estos datos se utilizaron tres métodos de machine learning para la selección de genes según su importancia en modelos de clasificación: FP-RF, RF-RFE SVM-RFE. Además, se evaluó la capacidad del método autoencoder para la representación de estos datos en una dimensión reducida. Los grupos de genes seleccionados por ML mostraron un alto rendimiento en la clasificación de las muestras por RF, SVM y ANN. Asimismo, el análisis funcional in silico de estos genes reveló su implicancia en los procesos de desarrollo de la planta. Estos resultados ponen de manifiesto la potencia de los algoritmos de ML para el estudio del desarrollo de las plantas a partir de datos de expresión génica. | es |
dc.description.abstract | Transcriptional programs are important in the development of the structures throughout the life cycle of plants. DNA microarray technology has provided a useful tool to discover relevant genes in the development of the reference plant Arabidopsis thaliana. However, previous studies use a reduced number samples to discover marker genes based on its specific expression along the tissues. In this work, a machine learning approach is presented to select relevant genes in the development of A. Thaliana. A database was built with more than 500 expression profiles corresponding to seeds, seedlings, roots, leaves and flowers. Gene selection was carried out with three different ML methods: FP-RF, RF-RFE, SVM-RFE. Furthermore, an autoencoder architecture was evaluated for dimensionality reduction of the data. The genes selected by ML techniques yield high classification performance in SVM, RF and ANN algorithms. Moreover, these genes are biologically relevant to plant development process. This work provides a new approach to study plant development from gene expression data. | en |
dc.description.abstract | Les plantes desenvolupen nous òrgans i teixits al llarg del seu cicle de vida. Gràcies a la tecnologia de microarrays d'ADN s'ha pogut indagar en els mecanismes transcripcionals associats al desenvolupament d'aquestes estructures en l'espècie model Arabidopsis thaliana. No obstant això, els estudis publicats analitzen un reduït nombre de mostres per a la selecció de gens de desenvolupament segons l'expressió específica d'aquests en els diferents teixits de la planta, sense tenir en compte relacions més complexes entre els gens. En aquest treball es proposa l'ús de tècniques de machine learning per a la selecció de gens rellevants en el desenvolupament de les estructures de la planta A. thaliana. Per a això, es va generar una base de dades amb més de 500 perfils d'expressió corresponents a llavors, plàntules, arrels, fulles i flors. Sobre aquestes dades es van utilitzar tres mètodes d'machine learning per a la selecció de gens segons la seva importància en models de classificació: FP-RF, RF-RFE SVM-RFE. A més, es va avaluar la capacitat del mètode autoencoder per a la representació d'aquestes dades en una dimensió reduïda. Els grups de gens seleccionats per ML van mostrar un alt rendiment en la classificació de les mostres per RF, SVM i ANN. Així mateix, l'anàlisi funcional in silico d'aquests gens va revelar la seva implicancia en els processos de desenvolupament de la planta. Aquests resultats posen de manifest la potència dels algoritmes de ML per a l'estudi del desenvolupament de les plantes a partir de dades d'expressió gènica. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | spa | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | machine learning | en |
dc.subject | Arabidopsis thaliana | ca |
dc.subject | aprendizaje automático | es |
dc.subject | aprenentatge automàtic | ca |
dc.subject | Arabidopsis thaliana | es |
dc.subject | Arabidopsis thaliana | en |
dc.subject | microarrays | es |
dc.subject | microarrays | ca |
dc.subject | microarrays | en |
dc.subject.lcsh | Bioinformatics -- TFM | en |
dc.title | Machine learning para la selección de genes implicados en el desarrollo de Arabidopsis thaliana utilizando datos de expresión génica | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Bioinformàtica -- TFM | ca |
dc.subject.lcshes | Bioinformática -- TFM | es |
dc.contributor.tutor | Vegas Lozano, Esteban | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Trabajos finales de carrera, trabajos de investigación, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
saurasanchezTFM0119memoria.pdf | Memoria del TFM | 5,7 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons