Extensão do método geoestatístico de interpolação por aprendizado de máquina para incorporação de anisotropia, superfícies de tendência e análise espaço-temporal em 3 e 4 dimensões
Este documento apresenta a qualificação para a transição do programa de Mestrado para o Doutorado em Ciência e Tecnologia Ambiental na Universidade Federal do ABC (UFABC). O trabalho desenvolvido concentra-se na interpolação espacial de variáveis ambientais utilizando algoritmos de aprendizado de máquina, com ênfase significativa na incorporação da anisotropia espacial através da classificação de azimutes.
Utilizando o conjunto de dados Meuse, foram comparados os desempenhos de diversos modelos de aprendizado de máquina baseados em árvores de decisão, incluindo Random Forest, ExtraTrees Regressor e XGBoost Regressor. O estudo testou a hipótese de que esses algoritmos são eficientes na previsão de variáveis regionalizadas e que a incorporação da anisotropia melhora os resultados preditivos quando um componente anisotrópico está presente nos dados.
Nossos resultados demonstram que a inclusão do azimute classificado como preditor aprimora significativamente a capacidade preditiva dos modelos, como evidenciado por mapas interpolados que capturam eficazmente a orientação de padrões espaciais. Notavelmente, a combinação de azimutes classificados e distâncias classificados resultou nas melhores métricas de desempenho, frequentemente superando métodos geoestatísticos tradicionais como a Krigagem Ordinária. A análise visual, fundamental para a interpolação espacial, revelou que, embora os azimutes introduzam artefatos em bloco, sua combinação com distâncias resultou em previsões mais precisas e espacialmente consistentes em comparação com o uso isolado de qualquer um dos atributos. Além disso, o modelo XGBoost de melhor desempenho com distâncias e azimutes classificados não apresentou autocorrelação espacial significativa em seus resíduos.
Esta pesquisa destaca a robustez e o potencial das abordagens de aprendizado de máquina como alternativas eficazes aos métodos geoestatísticos tradicionais para a interpolação de dados ambientais. O trabalho também serve de base para a pesquisa de doutorado proposta, que pretende expandir a abordagem atual para interpolações em três e quatro dimensões (3D espacial e espaço-temporal), incorporando a dimensão vertical e a componente temporal na modelagem, de modo a representar com maior realismo a dinâmica de plumas contaminantes e outros fenômenos ambientais complexos. Como desdobramentos secundários, o doutorado também buscará abordar desafios identificados, como o refinamento da modelagem da anisotropia, a melhoria da suavidade cartográfica, o aprimoramento da quantificação da incerteza e a exploração de modelos híbridos de ML-geoestatística para uma aplicabilidade mais ampla.