Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/149868
Título : Application of Machine Learning Methods to Predict Phytoplankton Blooms and Determine Microbial Biomarkers using Marine Microbiomes
Autoría: Fernández González, Nuria
Director: Astrid Rebrij, Romina
Tutor: Ventura Royo, Carles
Resumen : El conocimiento de las relaciones entre el bacterioplancton y las proliferaciones de fitoplancton es clave para entender el funcionamiento de los ecosistemas, como también predecir y mitigar los efectos del cambio global sobre estos ecosistemas. Estas comunidades microbianas son gobernadas por relaciones complejas. Además, los datos para estudiar la diversidad del bacterioplancton (Variantes de secuencias de amplicones del gen del ARNr 16S) son altamente dimensionales, dispersos y ruidosos. En este proyecto, los clasificadores Random Forest basados en datos de diversidad se utilizaron para predecir proliferaciones costeras de fitoplancton y buscar biomarcadores de estos. Tras unir los datos de dos campañas oceanográficas, las muestras se clasificaron entre las categorías Bloom y normal según la concentración de clorofila. Los datos resultantes eran altamente dimensionales (166 muestras, 7593 variables) y desbalanceados (31 muestras bloom, 135 normales). Para reducir la dimensionalidad, las variables biológicas con abundancias relativas menores al 0,01% se eliminaron. Alternativamente, se agruparon a nivel de género. Los modelos Random Forest se entrenaron valorando diferente número de variables en los árboles individuales. El proceso se repitió con cien divisiones diferentes de los datos en los grupos de entrenamiento y test para asegurar la representatividad de los resultados. Los modelos sólo alcanzaron buenos niveles de desempeño (kappa, sensibilidad y especificidad medias > 0.8) tras utilizar la técnica de sobre muestreo sintético de la clase minoritaria, bloom, para balancear los datos. Finalmente, se determinaron los biomarcadores como las variables más importantes según su error predictivo.
Palabras clave : biomarcadores
proliferación de algas costeras
random forest
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : 2023
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
nuriafergonzalezTFM2023.pdfMemoria TFM3,04 MBAdobe PDFVista previa
Visualizar/Abrir
Comparte:
Exporta:
Consulta las estadísticas

Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.