Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/148790
Título : Extracció atmosfèrica dels exoplanetes de la missió Ariel utilitzant mètodes de conjunt basats en arbres de decisió
Autoría: Ejarque Gonzalez, Elisabet  
Tutor: Ruiz Dern, Laura  
Fors Aldrich, Octavi  
Butturini, Andrea  
Otros: Casas-Roma, Jordi  
Resumen : En les darreres dues dècades s'ha descobert la presència de fins a 5272 exoplanetes, els quals ja han començat a redefinir la nostra comprensió sobre la formació i evolució dels sistemes planetaris. Actualment, s'estan centrant esforços en passar de la detecció a la caracterització d'aquests exoplanetes, és a dir, entendre de què estan fets. Gràcies a properes missions com el recent James Webb Space Telescope, i la missió Ariel de l'Agència Espacial Europea (prevista per llançament el 2029), s'espera obtenir una quantitat de dades espectrals sense precedents, les quals permetran caracteritzar la composició i propietats físiques de les atmosferes d'aquest mons llunyans. Malgrat tot, els mètodes actuals per interpretar els espectres atmosfèrics són computacionalment molt costosos i poden representar un coll d'ampolla a l'hora de processar tot el volum de dades que es preveuen generar en els propers anys. Davant d'aquest escenari, l'àmbit de l'aprenentatge automàtic s'està plantejant com una alternativa potencialment més flexible i amb menys requeriments computacionals. Recentment s'ha posat a disposició de la comunitat científica l'Atmospheric Big Challenge Database (ABC Database), un conjunt de dades que simulen el volum i complexitat de dades que es mesuraran en la missió Ariel. Aprofitant l'oportunitat que representa aquest conjunt de dades, en aquest treball s'ha explorat l'ús de models de conjunt (Random Forest, Gradient Boosting) per tal d'extreure informació de temperatura i composició atmosfèrica a partir de dades espectrals. Els resultats obtinguts han demostrat que aquesta família de tècniques, aplicades a l'ABC Database, tenen una capacitat de predicció més elevada que el mètodes tradicionals d'inferència Bayesiana Nested Sampling. A més, tots els models desenvolupats han presentat uns temps d'entrenament de màxim 1.5 minuts, posant de relleu la seva eficiència computacional. En conseqüència, els mètodes de conjunt basats en arbres de decisió es posicionen com una alternativa prometedora als mètodes actuals per fer front al gran volum de dades que s'adquirirà en les properes missions dedicades a la caracterització atmosfèrica d'exoplanetes.
In the last two decades up to 5272 exoplanets have been discovered, which have already begun to redefine our understanding of the formation and evolution of planetary systems. Recently, scientists have turned their attention from detection to the characterization of exoplanet atmospheres. Thanks to upcoming missions such as the recently launched James Webb Space Telescope, and the European Space Agency's Ariel Mission (due for launch in 2029), an unprecedented amount of atmospheric transmission spectra is to be obtained. These data will enable the characterization of the chemical composition and physical properties of these distant worlds. However, current state-of-the-art methods for interpreting atmospheric spectral data are computationally expensive and may pose a bottleneck when processing the expected volume of data to be generated in the coming years. In this context, the field of machine learning is emerging as a promising alternative due to its high flexibility and rapid inference time. Recently, the Atmospheric Big Challenge Database (ABC Database) has been released to the community. This data set simulates the quantity and quality of data that will be measured in the Ariel mission. Seizing the opportunity presented by this dataset, this study explores the use of ensemble models (Random Forest, Gradient Boosting) to retrieve temperature and chemical composition information from spectral data. The obtained results have demonstrated that this family of techniques, applied to the ABC Database, exhibit higher predictive capabilities compared to traditional Bayesian method Nested Sampling. Furthermore, all developed models have shown training times of up to 1.5 minutes, highlighting their computational eficiency. Consequently, ensemble methods based on decision trees emerge as a promising alternative to current methods in handling the large volume of data expected to be acquired in future missions dedicated to the atmospheric characterization of exoplanets.
Palabras clave : random forest
gradient boosting
extracció atmosfèrica
missió Ariel
aprenentatge en conjunts
ensemble models
random forest
gradient boosting
atmospheric retrieval
Ariel mission
Tipo de documento: info:eu-repo/semantics/masterThesis
Fecha de publicación : 24-jun-2023
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM_EEjarque_2023.pdfMemòria del TFM2,96 MBAdobe PDFVista previa
Visualizar/Abrir
Comparte:
Exporta:
Consulta las estadísticas

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons