Please use this identifier to cite or link to this item:

http://hdl.handle.net/10609/98706
Full metadata record
DC FieldValueLanguage
dc.contributor.authorHernández Ballesteros, Susana-
dc.date.accessioned2019-07-09T10:03:39Z-
dc.date.available2019-07-09T10:03:39Z-
dc.date.issued2019-06-04-
dc.identifier.urihttp://hdl.handle.net/10609/98706-
dc.description.abstractEl problema de clasificación de machine learning en general es uno de los problemas mas comunes del mundo de la investigación y en concreto en el ámbito de la bioinformática. Ser capaces de determinar la clase de un conjunto de inputs biológicos dentro de un grupo de opciones desempeña un importante papel. Sin embargo, para realizar estos análisis se requiere que el usuario posea un cierto conocimiento de programación y conocimientos sobre los distintos modelos disponibles. Este trabajo pretende crear una aplicación web que permita a usuarios que no dispongan de los conocimientos suficientes de programación, realizar un pipeline completo de análisis de datos con modelos de machine learning con objetivo de clasificación. Para ello, se desarrolla un pipeline en el lenguaje de programación R que marcara¿ la ruta a seguir para el análisis y, posteriormente, se implementara¿ este pipeline en una herramienta web creada mediante la herramienta Shiny. Para comprobar la correcta funcionalidad tanto del pipeline como de la aplicación web, se descargan han utilizado dataset con target binario y multiclase que contengan los datos en uno o dos ficheros, en formato CSV con distintos separadores con variables tanto categóricas como numéricas que permitan realizar el análisis utilizando para ello distintos parámetros. La herramienta permite cargar los datos, describirlos, separarlos y modelizarlos para determinar que modelo de clasificación es el más adecuado para aplicar a cada conjunto de datos.es
dc.description.abstractEl problema de classificació de machine learning en general és un dels problemes mes comuns del món de la recerca i en concret en l'àmbit de la bioinformática. Ser capaços de determinar la classe d'un conjunt d'inputs biològics dins d'un grup d'opcions exerceix un important paper. No obstant això, per a realitzar aquestes anàlisis es requereix que l'usuari posseeixi un cert coneixement de programació i coneixements sobre els diferents models disponibles. Aquest treball pretén crear una aplicació web que permeti a usuaris que no disposin dels coneixements suficients de programació, realitzar un pipeline complet d'anàlisi de dades amb models de machine learning amb objectiu de classificació. Per a això, es desenvolupa un pipeline en el llenguatge de programació R que marcarà la ruta a seguir per a l'anàlisi i, posteriorment, s'implementarà aquest pipeline en una eina web creada mitjançant l'eina Shiny. Per a comprovar la correcta funcionalitat tant del pipeline com de l'aplicació web, es descarreguen han utilitzat dataset amb target binari i multiclase que continguin les dades en un o dos fitxers, en format CSV amb diferents separadors amb variables tant categòriques com numèriques que permetin realitzar l'anàlisi utilitzant per a això diferents paràmetres. L'eina permet carregar les dades, descriure'ls, separar-los i modelizarlos per a determinar que model de classificació és el més adequat per a aplicar a cada conjunt de dades.ca
dc.description.abstractThe problem of classification of machine learning in general is one of the most common problems in the world of research and specifically in the field of bioinformatics. Being able to determine the class of a set of biological inputs within a group of options plays an important role. However, in order to carry out these analyzes, the user must have some knowledge of programming and knowledge about the different models available. This work aims to create a web application that allows users who do not have sufficient knowledge of programming, to perform a complete pipeline of data analysis with machine learning models for classification purposes. For this, a pipeline is developed in the R programming language that will mark the path to follow for the analysis and, later, this pipeline will be implemented in a web tool created by the Shiny tool. To check the correct functionality of both the pipeline and the web application, datasets with binary and multiclass target containing the data in one or two files have been used, in CSV format with different separators with both categorical and numeric variables that allow performing the analysis using different parameters. The tool allows to load the data, describe it, separate them and model them to determine which classification model is the most appropriate to apply to each data set.en
dc.format.mimetypeapplication/pdf-
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectmachine learninges
dc.subjectclasificaciones
dc.subjectclassificacióca
dc.subjectclassificationen
dc.subjectShinyca
dc.subjectShinyes
dc.subjectShinyen
dc.subjectmachine learningen
dc.subjectaprendizaje automáticoes
dc.subjectaprenentatge automàticca
dc.subject.lcshBioinformatics -- TFMen
dc.titleDesarrollo de una GUI para el analisis y modelizacion de problemas de clasificacion-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorAdsuar Gómez, Antonio Jesús-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Appears in Collections:Bachelor thesis, research projects, etc.

Files in This Item:
File Description SizeFormat 
sherbalTFM0619memoria.pdf3.75 MBAdobe PDFView/Open

This item is licensed under a Creative Commons License Creative Commons