Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/109506
Título : Herramienta para analizar matrices de expresión génicas con machine learning
Autoría: Rodríguez Pérez, Domingo Javier
Tutor: Fernandez Hilario, Alberto  
Otros: Adsuar Gómez, Antonio Jesús
Resumen : En el campo de las aplicaciones biomédicas, es tan importante obtener una alta precisión como hacer que los modelos generados sean explicables para el personal clínico. Por esta razón, es esencial aplicar técnicas inteligentes que sean capaces de aprender de manera efectiva en estos escenarios. En esta ocasión se trata de crear un software en R para proporcionar una manera sencilla de construir un análisis explicativo de la causalidad entre la expresión génica y las condiciones del paciente. El software creado está muy automatizado facilitando las entradas de datos para estudiar diferentes matrices de expresión, con un flujo lineal, con una lectura de datos a través del código GEO, un preprocesamiento en el que se facilita un contraste de hipótesis,una normalización para hacer los datos comparables entre ellos y un filtrado de genes que reduce el cálculo computacional del posterior entrenamiento de los modelos machine learning el cual conlleva diferentes técnicas de selección de genes para, a través de la validación del modelo, detectar la relación entre la expresión génica y la condición del paciente y compartir los resultados de los genes realmente implicados en la respuesta Pongo a prueba esta herramienta con uno de los temas mas actuales en cuanto a diagnostico clínico, la detección del cáncer a través de la expresión génica de las plaquetas. Los datos se han obtenido del experimento con código GSE89843. Se obtienen AUC por encima del 90% con tan solo 10 genes, lo que supone un gran avance en este campo. El AUC se puede interpretar como la probabilidad de clasificarlos correctamente. Debido a su bajo coste por el número reducido de genes y su poca invasividad puede realizarse a modo de test preventivo y reducir su tasa de mortalidad.
Palabras clave : RNA-seq
selección de atributos
biopsia líquida
random forest
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : ene-2020
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
jrodriguezperez012TFM0120memoria.pdfMemoria del TFM644,26 kBAdobe PDFVista previa
Visualizar/Abrir