Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/149868
Título : | Application of Machine Learning Methods to Predict Phytoplankton Blooms and Determine Microbial Biomarkers using Marine Microbiomes |
Autoría: | Fernández González, Nuria |
Director: | Astrid Rebrij, Romina |
Tutor: | Ventura Royo, Carles |
Resumen : | El conocimiento de las relaciones entre el bacterioplancton y las proliferaciones de fitoplancton es clave para entender el funcionamiento de los ecosistemas, como también predecir y mitigar los efectos del cambio global sobre estos ecosistemas. Estas comunidades microbianas son gobernadas por relaciones complejas. Además, los datos para estudiar la diversidad del bacterioplancton (Variantes de secuencias de amplicones del gen del ARNr 16S) son altamente dimensionales, dispersos y ruidosos. En este proyecto, los clasificadores Random Forest basados en datos de diversidad se utilizaron para predecir proliferaciones costeras de fitoplancton y buscar biomarcadores de estos. Tras unir los datos de dos campañas oceanográficas, las muestras se clasificaron entre las categorías Bloom y normal según la concentración de clorofila. Los datos resultantes eran altamente dimensionales (166 muestras, 7593 variables) y desbalanceados (31 muestras bloom, 135 normales). Para reducir la dimensionalidad, las variables biológicas con abundancias relativas menores al 0,01% se eliminaron. Alternativamente, se agruparon a nivel de género. Los modelos Random Forest se entrenaron valorando diferente número de variables en los árboles individuales. El proceso se repitió con cien divisiones diferentes de los datos en los grupos de entrenamiento y test para asegurar la representatividad de los resultados. Los modelos sólo alcanzaron buenos niveles de desempeño (kappa, sensibilidad y especificidad medias > 0.8) tras utilizar la técnica de sobre muestreo sintético de la clase minoritaria, bloom, para balancear los datos. Finalmente, se determinaron los biomarcadores como las variables más importantes según su error predictivo. |
Palabras clave : | biomarcadores proliferación de algas costeras random forest |
Tipo de documento: | info:eu-repo/semantics/masterThesis |
Fecha de publicación : | 2023 |
Licencia de publicación: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
nuriafergonzalezTFM2023.pdf | Memoria TFM | 3,04 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.