La investigación en modelado geoespacial identifica áreas clave para la mejora


Los métodos de modelado geoespacial se han convertido en una herramienta importante para el monitoreo ambiental, que se utiliza para gestionar los riesgos ambientales y monitorear las amenazas de desastres naturales. Los resultados del modelado son una fuente importante de información para pronosticar y comprender las consecuencias de diversos escenarios de desarrollo socioeconómico y cambio climático.


Por Oleg Sherbakov, Instituto de Ciencia y Tecnología de Skolkovo


Una nueva investigación identificó áreas para mejorar el modelado geoespacial
Ejemplo de cuantificación de incertidumbre para mapeo espacial proporcionado en el marco del proyecto SoilGrids. Crédito: Nature Communications (2024). DOI: 10.1038/s41467-024-55240-8

La investigación geoespacial aprovecha cada vez más los métodos de aprendizaje automático para monitorear la cobertura vegetal, evaluar el funcionamiento de los ecosistemas y la biodiversidad, así como para combatir incendios, inundaciones y sequías.

Los investigadores publican numerosos artículos en los que informan sobre la mejora de modelos, la solución de problemas fundamentales y nuevos enfoques, incluso en las ciencias naturales. Sin embargo, estas publicaciones suelen adolecer de errores metodológicos, principalmente debido a las limitaciones inherentes al aprendizaje automático.

Un grupo de científicos de Skoltech y del Instituto AIRI analizó la literatura académica, identificó problemas típicos y propuso soluciones. Los resultados se presentan en un artículo de revisión publicado en la revista Nature Communications .

«Encontramos que entre las principales dificultades se encuentran el desequilibrio de los datos, la autocorrelación espacial, los sesgos en los datos, los errores de pronóstico y las dificultades para estimar la incertidumbre del modelo. Aunque estos problemas son bien conocidos, los enfoques existentes a menudo los ignoran, limitándose a los procedimientos estándar de entrenamiento y validación de modelos de aprendizaje automático», dijo una de las autoras principales, Diana Koldasbayeva, estudiante de doctorado en Skoltech del programa de Ciencias e Ingeniería Computacionales y de Datos.

«Para eliminar estas limitaciones, es necesario desarrollar métodos que consideren las características únicas de los datos ambientales y los procesos espaciotemporales», dijo Alexey Zaitsev, coautor del estudio, profesor asistente del Centro de IA Skoltech y jefe del Laboratorio de Investigación Aplicada Skoltech-Sberbank.

«El artículo presenta un enfoque unificado para resolver estos problemas, que incluye herramientas y técnicas para mejorar la precisión de los modelos, así como recomendaciones para mejorar la evaluación de su calidad. Esperamos que nuestros resultados ayuden a los científicos de diferentes países a elegir sus direcciones de investigación».

Los autores también identificaron áreas clave para el desarrollo de la investigación geoespacial teniendo en cuenta los detalles de los datos ambientales y presentaron su propia colección de herramientas, recursos y proyectos avanzados que utilizan tecnologías geoespaciales para resolver problemas ambientales.

La colección está disponible públicamente en GitHub e invita a los colegas a usarla y complementarla.

«En el estudio, introdujimos nuevos conjuntos de datos, modelos y enfoques para garantizar la calidad del trabajo necesario para implementar desarrollos científicos aplicados en la industria y resolver el problema de la interpretabilidad de los pronósticos basados ​​en datos», comentó el profesor Evgeny Burnaev, director del Centro de IA Skoltech y jefe del grupo de investigación Learnable Intelligence en AIRI.

«Por ejemplo, es sumamente importante crear bases de datos bien organizadas. La mejora de los datos conduce naturalmente a una reducción de las distorsiones asociadas con el desequilibrio y la autocorrelación.

«Anticipamos el surgimiento de modelos autosupervisados ​​entrenados en grandes conjuntos de datos semicurados para el mapeo geoespacial en la investigación ambiental , similar a lo que hemos visto en el modelado del lenguaje y la visión por computadora».

Más información: Diana Koldasbayeva et al., Desafíos en el modelado geoespacial basado en datos para la investigación y la práctica ambiental, Nature Communications (2024). DOI: 10.1038/s41467-024-55240-8