Desarrollo de una GUI para el analisis y modelizacion de problemas de clasificacion

Hernández Ballesteros, Susana

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/98706

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Hernández Ballesteros, Susana	-
dc.date.accessioned	2019-07-09T10:03:39Z	-
dc.date.available	2019-07-09T10:03:39Z	-
dc.date.issued	2019-06-04	-
dc.identifier.uri	http://hdl.handle.net/10609/98706	-
dc.description.abstract	El problema de clasificación de machine learning en general es uno de los problemas mas comunes del mundo de la investigación y en concreto en el ámbito de la bioinformática. Ser capaces de determinar la clase de un conjunto de inputs biológicos dentro de un grupo de opciones desempeña un importante papel. Sin embargo, para realizar estos análisis se requiere que el usuario posea un cierto conocimiento de programación y conocimientos sobre los distintos modelos disponibles. Este trabajo pretende crear una aplicación web que permita a usuarios que no dispongan de los conocimientos suficientes de programación, realizar un pipeline completo de análisis de datos con modelos de machine learning con objetivo de clasificación. Para ello, se desarrolla un pipeline en el lenguaje de programación R que marcara¿ la ruta a seguir para el análisis y, posteriormente, se implementara¿ este pipeline en una herramienta web creada mediante la herramienta Shiny. Para comprobar la correcta funcionalidad tanto del pipeline como de la aplicación web, se descargan han utilizado dataset con target binario y multiclase que contengan los datos en uno o dos ficheros, en formato CSV con distintos separadores con variables tanto categóricas como numéricas que permitan realizar el análisis utilizando para ello distintos parámetros. La herramienta permite cargar los datos, describirlos, separarlos y modelizarlos para determinar que modelo de clasificación es el más adecuado para aplicar a cada conjunto de datos.	es
dc.description.abstract	El problema de classificació de machine learning en general és un dels problemes mes comuns del món de la recerca i en concret en l'àmbit de la bioinformática. Ser capaços de determinar la classe d'un conjunt d'inputs biològics dins d'un grup d'opcions exerceix un important paper. No obstant això, per a realitzar aquestes anàlisis es requereix que l'usuari posseeixi un cert coneixement de programació i coneixements sobre els diferents models disponibles. Aquest treball pretén crear una aplicació web que permeti a usuaris que no disposin dels coneixements suficients de programació, realitzar un pipeline complet d'anàlisi de dades amb models de machine learning amb objectiu de classificació. Per a això, es desenvolupa un pipeline en el llenguatge de programació R que marcarà la ruta a seguir per a l'anàlisi i, posteriorment, s'implementarà aquest pipeline en una eina web creada mitjançant l'eina Shiny. Per a comprovar la correcta funcionalitat tant del pipeline com de l'aplicació web, es descarreguen han utilitzat dataset amb target binari i multiclase que continguin les dades en un o dos fitxers, en format CSV amb diferents separadors amb variables tant categòriques com numèriques que permetin realitzar l'anàlisi utilitzant per a això diferents paràmetres. L'eina permet carregar les dades, descriure'ls, separar-los i modelizarlos per a determinar que model de classificació és el més adequat per a aplicar a cada conjunt de dades.	ca
dc.description.abstract	The problem of classification of machine learning in general is one of the most common problems in the world of research and specifically in the field of bioinformatics. Being able to determine the class of a set of biological inputs within a group of options plays an important role. However, in order to carry out these analyzes, the user must have some knowledge of programming and knowledge about the different models available. This work aims to create a web application that allows users who do not have sufficient knowledge of programming, to perform a complete pipeline of data analysis with machine learning models for classification purposes. For this, a pipeline is developed in the R programming language that will mark the path to follow for the analysis and, later, this pipeline will be implemented in a web tool created by the Shiny tool. To check the correct functionality of both the pipeline and the web application, datasets with binary and multiclass target containing the data in one or two files have been used, in CSV format with different separators with both categorical and numeric variables that allow performing the analysis using different parameters. The tool allows to load the data, describe it, separate them and model them to determine which classification model is the most appropriate to apply to each data set.	en
dc.format.mimetype	application/pdf	-
dc.language.iso	spa	-
dc.publisher	Universitat Oberta de Catalunya (UOC)	-
dc.rights	CC BY-NC-ND	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	-
dc.subject	machine learning	es
dc.subject	clasificacion	es
dc.subject	classificació	ca
dc.subject	classification	en
dc.subject	Shiny	ca
dc.subject	Shiny	es
dc.subject	Shiny	en
dc.subject	machine learning	en
dc.subject	aprendizaje automático	es
dc.subject	aprenentatge automàtic	ca
dc.subject.lcsh	Bioinformatics -- TFM	en
dc.title	Desarrollo de una GUI para el analisis y modelizacion de problemas de clasificacion	-
dc.type	info:eu-repo/semantics/masterThesis	-
dc.audience.educationlevel	Estudis de Màster	ca
dc.audience.educationlevel	Estudios de Máster	es
dc.audience.educationlevel	Master's degrees	en
dc.subject.lemac	Bioinformàtica -- TFM	ca
dc.subject.lcshes	Bioinformática -- TFM	es
dc.contributor.tutor	Adsuar Gómez, Antonio Jesús	-
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Bachelor thesis, research projects, etc.