Mejorar las predicciones de la gravedad, el lugar y el momento de las inundaciones con IA


Las inundaciones son uno de los desastres naturales más devastadores que enfrentan las comunidades de Estados Unidos, causando miles de millones de dólares en daños anualmente, según el Servicio Meteorológico Nacional. Un grupo, que incluye a varios investigadores de Penn State, desarrolló recientemente un modelo computacional para optimizar la predicción de inundaciones en el territorio continental de Estados Unidos.


Los investigadores dijeron que su modelo ofrece predicciones con niveles de eficiencia y precisión sin precedentes en comparación con los modelos tradicionales, creando simulaciones con un sistema altamente optimizado de procesamiento y simulación de datos.

Su modelo, al que denominan modelo hidrológico y de enrutamiento diferenciable de alta resolución, incorpora macrodatos y lecturas físicas —como datos extraídos de redes fluviales y teorías de generación de caudal— en un sistema impulsado por inteligencia artificial (IA) para simular y predecir el movimiento del agua . El equipo publicó su enfoque en Water Resources Research .

Un modelo hídrico común utilizado actualmente por hidrólogos, o investigadores que estudian el ciclo del agua, es el Modelo Hídrico Nacional (NWM) de la Administración Nacional Oceánica y Atmosférica (NOAA), según Chaopeng Shen, profesor de ingeniería civil y ambiental en la Universidad Estatal de Pensilvania y coautor del artículo. El modelo utiliza datos meteorológicos para simular el caudal (la velocidad a la que fluye el agua en un río) en el territorio continental de Estados Unidos.

Los modelos tradicionales, como el NWM, deben someterse a una calibración de parámetros, donde se procesan grandes conjuntos de datos que contienen décadas de datos históricos de caudales fluviales de todo Estados Unidos para establecer parámetros y generar simulaciones útiles. Si bien este modelo es ampliamente utilizado por organizaciones como el Servicio Meteorológico Nacional para la predicción de inundaciones, según Shen, la calibración de parámetros hace que el proceso sea muy ineficiente.

«Para que este modelo sea preciso, tradicionalmente los datos deben calibrarse individualmente en cada sitio», explicó Shen. «Este proceso es lento, costoso y tedioso. Nuestro equipo determinó que incorporar el aprendizaje automático al proceso de calibración en todos los sitios podría mejorar enormemente la eficiencia y la rentabilidad».

El modelo del equipo implementa un subconjunto de técnicas de IA conocidas como redes neuronales, que reconocen eficientemente patrones complejos en grandes conjuntos de datos dinámicos. Las redes neuronales funcionan como un cerebro humano, creando conexiones lógicas entre sus unidades, y pueden operar de forma autónoma y mejorar con el tiempo a medida que analizan más datos.

Según Yalan Song, profesor asistente de investigación de ingeniería civil y ambiental y coautor correspondiente del artículo, el modelo del equipo implementa varios tipos de redes neuronales para reconocer los patrones de parámetros clave y aprender cómo cambian en el tiempo y el espacio.

«Al incorporar redes neuronales, evitamos el problema de la calibración específica del sitio y mejoramos sustancialmente la eficiencia del modelo», afirmó Song. «En lugar de abordar cada sitio individualmente, la red neuronal aplica principios generales que interpreta a partir de datos históricos para realizar predicciones. Esto aumenta considerablemente la eficiencia, a la vez que predice con precisión el caudal en zonas del país con las que podría no estar familiarizado».

Según Shen, existen modelos de agua que hacen predicciones enteramente a través del aprendizaje automático entrenado con datos de observación sobre cómo debería comportarse el agua dentro del rango de datos de entrenamiento, pero la falta de un conocimiento físico amplio que respalde estas predicciones puede hacer que estos modelos minimicen la intensidad de valores atípicos previamente no vistos en las simulaciones.

El modelo puede usar datos existentes para inferir cómo una determinada cantidad de lluvia durante un tiempo determinado aumentará el nivel de un río en particular, pero no sabría cómo hacer una predicción correcta cuando se encuentre con eventos de lluvia extrema que no se hayan registrado en la región en el pasado.

Shen afirmó que esto puede ser peligroso en el contexto de la predicción de inundaciones y el aumento de fenómenos meteorológicos extremos, ya que minimizaría el riesgo real. Según Song, el diseño de su modelo ofrece simultáneamente las ventajas de los modelos basados ​​en la física y los modelos de aprendizaje automático, a la vez que mejora la precisión de las predicciones de eventos extremos.

El equipo entrenó su nuevo modelo con un gran conjunto de datos sobre caudal registrados en un total de 2.800 estaciones de medición (sitios que miden el caudal de los ríos) proporcionadas por el Servicio Geológico de Estados Unidos, junto con datos meteorológicos e información detallada de la cuenca.

Utilizando 15 años de datos de caudal, encargaron a su modelo la predicción y creación de una simulación de caudal de alta resolución de 40 años para sistemas fluviales en todo el territorio continental de Estados Unidos. Compararon la simulación con los datos observados, midiendo la varianza entre las observaciones y las simulaciones.

Los investigadores observaron mejoras sustanciales (en general del 30%) en la precisión de la predicción del caudal en aproximadamente 4.000 estaciones de medición, que incluían las 2.800 originales y estaciones de medición adicionales no incluidas en los datos de entrenamiento, en comparación con la versión actual del NWM, especialmente en áreas geológicas específicas con estructuras únicas.

«Nuestra red neuronal aborda la calibración aprendiendo de los grandes conjuntos de datos que tenemos de lecturas anteriores, a la vez que considera la información basada en la física del NWM», afirmó Song. «Esto nos permite procesar grandes conjuntos de datos de forma muy eficiente, sin perder el nivel de detalle que proporciona un modelo basado en la física, y con un mayor nivel de consistencia y fiabilidad».

Shen dijo que este enfoque de calibración no sólo es eficiente, sino también altamente consistente, independientemente de la región que se simule.

«El enfoque anterior no solo es muy ineficiente, sino también bastante inconsistente», afirmó Shen. «Con nuestro nuevo enfoque, podemos crear simulaciones utilizando el mismo proceso, independientemente de la región que intentemos simular. A medida que procesemos más datos y generemos más predicciones, nuestra red neuronal seguirá mejorando. Con una red neuronal entrenada, podemos generar parámetros para todo Estados Unidos en cuestión de minutos».

Según Shen, su modelo es candidato para su uso en el marco de próxima generación del NWM que la NOAA está desarrollando para mejorar los estándares de predicción de inundaciones en todo el país. Si bien aún no ha sido seleccionado, Shen afirmó que su modelo es «altamente competitivo», pues ya está acoplado a este marco operativo. Sin embargo, podría llevar tiempo que los usuarios del modelo se familiaricen con el componente de IA, según Shen, quien explicó que se requieren evaluaciones independientes minuciosas para demostrar que la precisión del modelo es confiable incluso en escenarios sin entrenamiento.

El equipo está trabajando para cerrar la brecha final —mejorando la capacidad de predicción del modelo de diaria a horaria— para que sea más útil para aplicaciones operativas, como la vigilancia y alerta de inundaciones horarias. Shen atribuyó el trabajo de investigación a la operación al estudiante de doctorado en ingeniería civil Leo Lonzarich, señalando que desarrollar un marco que otros investigadores puedan ampliar será clave para resolver problemas y desarrollar el modelo como comunidad.

«Una vez entrenado el modelo, podemos generar predicciones a una velocidad sin precedentes», explicó Shen. «Antes, generar 40 años de datos de alta resolución a través del NWM podía llevar semanas y requería la colaboración de muchas supercomputadoras. Ahora, podemos hacerlo en un solo sistema, en cuestión de horas, lo que permite que esta investigación se desarrolle con gran rapidez y genere un ahorro considerable de costos».

Aunque estos modelos se utilizan principalmente para la predicción de inundaciones, las simulaciones proporcionan a los hidrólogos información que puede utilizarse para predecir otros eventos importantes, como las sequías. Dichas predicciones podrían utilizarse para fundamentar la gestión de los recursos hídricos, lo que, según Shen, podría tener implicaciones para la investigación en agricultura y sostenibilidad.

«Gracias a la interpretación física de nuestro modelo, puede describir características de las cuencas hidrográficas, como la humedad del suelo, el caudal base de los ríos y la recarga de aguas subterráneas, lo cual resulta muy útil para la agricultura y mucho más difícil de generar mediante aprendizaje automático basado exclusivamente en datos», explicó Shen. «Podemos comprender mejor los sistemas naturales que desempeñan un papel fundamental en el mantenimiento de los ecosistemas y los organismos que los habitan en todo el país».

Más información: Yalan Song et al., El modelado hídrico de alta resolución a escala nacional se ve mejorado mediante el aprendizaje automático multiescala diferenciable basado en la física, Water Resources Research (2025). DOI: 10.1029/2024WR038928