Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/137426
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorFernández Morán, Borja-
dc.contributor.otherJorba, Josep-
dc.coverage.spatialLeón, ESP-
dc.date.accessioned2022-01-17T16:37:51Z-
dc.date.available2022-01-17T16:37:51Z-
dc.date.issued2022-01-17-
dc.identifier.urihttp://hdl.handle.net/10609/137426-
dc.description.abstractLas redes neuronales para clasificación de secuencias de virus pueden ser útiles para las autoridades sanitarias a la hora de actuar a la mayor brevedad ante brotes de virus o nuevas variantes de los mismos. Sin embargo, la gran cantidad de datos de entrada necesarios, así como la complejidad de las propias secuencias genéticas (pueden estar formadas por decenas de miles de aminoácidos cada una), hacen que entrenar una red neuronal de este tipo sea un problema computacionalmente costoso. En este contexto, el objetivo del presente trabajo consiste en analizar la viabilidad de una red neuronal convolucional para clasificación de secuencias de ADN cuyo entrenamiento se divide en varios nodos computacionales. Para realizar este análisis se ha construido una red neuronal convolucional que clasifica secuencias genéticas de varios virus diferentes. Sobre esta base, se pretende comparar una versión cuyo entrenamiento se divide en varios nodos de computación respecto a la versión tradicional entrenada en un único nodo, con el objetivo de comprobar si se produce una mejora en el tiempo total de entrenamiento sin perjuicio en el resto de métricas de rendimiento de la red.es
dc.description.abstractLes xarxes neuronals per a classificació de seqüències de virus poden ser útils per a les autoritats sanitàries a l'hora d'actuar al més aviat possible davant brots de virus o noves variants d'aquests. No obstant això, la gran quantitat de dades d'entrada necessaris, així com la complexitat de les pròpies seqüències genètiques (poden estar formades per desenes de milers d'aminoàcids cadascuna), fan que entrenar una xarxa neuronal d'aquest tipus sigui un problema computacionalment costós. En aquest context, l'objectiu del present treball consisteix a analitzar la viabilitat d'una xarxa neuronal convolucional per a classificació de seqüències d'ADN l'entrenament del qual es divideix en diversos nodes computacionals. Per a realitzar aquesta anàlisi s'ha construït una xarxa neuronal convolucional que classifica seqüències genètiques de diversos virus diferents. Sobre aquesta base, es pretén comparar una versió l'entrenament de la qual es divideix en diversos nodes de computació respecte a la versió tradicional entrenada en un únic node, amb l'objectiu de comprovar si es produeix una millora en el temps total d'entrenament sense perjudici en la resta de mètriques de rendiment de la xarxa.ca
dc.description.abstractNeural networks for virus sequence classification can be useful for health authorities to act as quickly as possible in response to virus outbreaks or new variants of viruses. However, the large amount of input data required, as well as the complexity of the genetic sequences themselves (they may consist of tens of thousands of amino acids each), make training such a neural network a computationally expensive problem. In this context, the aim of the present work is to analyze the feasibility of a convolutional neural network for DNA sequence classification whose training is divided into several computational nodes. To perform this analysis, a convolutional neural network has been constructed that classifies genetic sequences of several different viruses. On this basis, we intend to compare a version whose training is divided into several computational nodes with respect to the traditional version trained in a single node, in order to check if there is an improvement in the total training time without affecting the rest of the network performance metrics.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rights.uriCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectdistributed computingen
dc.subjectcomputació distribuïdaca
dc.subjectaprenentatge profundca
dc.subjectclassificació de l'ADNca
dc.subjectdeep learningen
dc.subjectDNA classificationen
dc.subjectcomputación distribuidaes
dc.subjectaprendizaje profundoes
dc.subjectclasificación del ADNes
dc.subject.lcshSoft computing -- TFMen
dc.titleAnálisis de rendimiento del entrenamiento de una red neuronal distribuida para la clasificación de secuencias de ADN-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacInformàtica tova -- TFMca
dc.subject.lcshesInformática blanda -- TFMes
dc.contributor.tutorIserte, Sergio-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
bfernm04TFM0122memoria.pdfMemoria del TFM735,59 kBAdobe PDFVista previa
Visualizar/Abrir