Un nuevo conjunto de datos de teledetección mejora el seguimiento de los cambios globales en la tierra


Al rastrear cambios sin precedentes en el uso de la tierra durante el último siglo, los mapas globales de cobertura terrestre brindan información clave sobre el impacto de los asentamientos humanos en el medio ambiente. 


por Revista de teledetección


Un nuevo conjunto de datos de teledetección mejora el seguimiento de los cambios globales en la tierra
Científicos de la Universidad Sun Yat-Sen desarrollaron un conjunto de datos anotados a gran escala (Globe230k) para mapear la cobertura terrestre global de manera altamente generalizada. Los parches anotados proporcionan pistas para ayudar a las herramientas de clasificación a distinguir tierras de cultivo, bosques, humedales, pastizales y más. Crédito: [Qian Shi, Universidad Sun Yat-Sen]; [Da He, Universidad Sun Yat-Sen]; [Zhengyu Liu, Universidad Sun Yat-Sen]; [Xiaoping Liu, Universidad Sun Yat-Sen]; [Jingqian Xue, Universidad Sun Yat-Sen]

Investigadores de la Universidad Sun Yat-sen crearon un conjunto de datos de anotaciones de teledetección a gran escala para respaldar la investigación de observación de la Tierra y proporcionar nuevos conocimientos sobre el monitoreo dinámico de la cobertura terrestre global.

En su estudio, publicado en el Journal of Remote Sensing , el equipo examinó cómo el uso/cobertura del suelo global (LULC) ha experimentado cambios dramáticos con el avance de la industrialización y la urbanización, incluidas la deforestación y las inundaciones.

“Necesitamos urgentemente un seguimiento de LULC de alta frecuencia y alta resolución para mitigar el impacto de las actividades humanas en el clima y el medio ambiente”, afirmó Qian Shi, profesor de la Universidad Sun Yat-sen.

El monitoreo global de LULC se basa en algoritmos de clasificación automática que clasifican imágenes de sensores remotos satelitales píxel por píxel. Los métodos de aprendizaje profundo basados ​​en datos extraen características intrínsecas de las imágenes de detección remota y estiman la etiqueta LULC de cada píxel.

En los últimos años, los investigadores han empleado cada vez más un método llamado segmentación semántica para tareas de clasificación de imágenes de teledetección en el aprendizaje profundo para el mapeo global de la cobertura terrestre. En lugar de clasificar las imágenes como un todo, la segmentación semántica clasifica cada píxel o elemento con determinadas etiquetas.

“A diferencia de reconocer la escena comercial o residencial en una imagen, la red de segmentación semántica puede delinear los límites de cada objeto terrestre en la escena y ayudarnos a comprender cómo se utiliza el suelo”, dijo Shi.

Este tipo de comprensión semántica de alto nivel no se puede lograr sin la información de contexto de cada píxel; Los objetos geográficos están estrechamente conectados con las escenas circundantes, lo que puede proporcionar pistas para la predicción de cada píxel. Por ejemplo, los aviones atracan en aeropuertos, los barcos atracan en puertos y los manglares generalmente crecen en las costas.

Sin embargo, el rendimiento de la segmentación semántica está limitado por la cantidad y la calidad de los datos de entrenamiento, y los datos de anotación existentes suelen ser insuficientes en cantidad, calidad y resolución espacial, según Shi.

Para colmo, los conjuntos de datos generalmente se muestrean a nivel regional y carecen de diversidad y variabilidad, lo que dificulta la escala global de los modelos basados ​​en datos.

Para abordar estos inconvenientes, el equipo de investigación propuso un conjunto de datos de anotaciones a gran escala, Globe230k, para la segmentación semántica de imágenes de teledetección. El conjunto de datos tiene tres ventajas:

  • Escala: el conjunto de datos Globe230k incluye 232.819 imágenes anotadas con tamaño adecuado y resolución espacial;
  • Diversidad: las imágenes anotadas provienen de regiones de todo el mundo con un área de cobertura de más de 60.000 kilómetros cuadrados, lo que indica una alta variabilidad y diversidad;
  • Funciones multimodales: el conjunto de datos Globe230k no solo contiene bandas RGB sino también otras características importantes para la investigación del sistema terrestre, como índices de vegetación, elevación y polarización.

El equipo probó el conjunto de datos Globe230k en varios algoritmos de segmentación semántica de última generación y descubrió que podía evaluar algoritmos cruciales para caracterizar la cobertura del suelo, incluido el modelado multiescala, la reconstrucción de detalles y la capacidad de generalización.

“Creemos que el conjunto de datos Globe230k podría respaldar más investigaciones de observación de la Tierra y proporcionar nuevos conocimientos sobre el monitoreo dinámico de la cobertura terrestre global”, dijo Shi.

El conjunto de datos se ha hecho público y puede utilizarse como punto de referencia para promover un mayor desarrollo del mapeo global de la cobertura terrestre y el desarrollo de algoritmos de segmentación semántica.

Otros contribuyentes incluyen a Da He, Zhengyu, Liu, Xiaoping Liu y Jingqian Xue, todos de la Universidad Sun Yat-sen y del Laboratorio Clave Provincial de Urbanización y Geosimulación de Guangdong.

Más información: Qian Shi et al, Globe230k: Un conjunto de datos de anotación de píxeles densos de referencia para el mapeo global de la cobertura terrestre, Journal of Remote Sensing (2023). DOI: 10.34133/detección remota.0078