Investigadores desarrollan un nuevo sistema de control de calidad de datos oceánicos


Durante el siglo pasado, varios instrumentos recopilaron más de 16 millones de perfiles de temperatura del océano. Sin embargo, cada instrumentación proporciona datos de diferente precisión, diferente calidad y diferente finalización de los metadatos.


por Li Yuan, Academia China de Ciencias


Antes de utilizar estos datos sin procesar para realizar la investigación científica , el proceso de control de calidad (QC) es obligatorio para garantizar la precisión y disponibilidad de los datos. En los primeros años, los expertos solían realizar manualmente el control de calidad. Sin embargo, el control de calidad manual de grandes conjuntos de datos no es factible debido al costo de mano de obra y tiempo.

Investigadores del Instituto de Física Atmosférica (IAP) de la Academia de Ciencias de China (CAS) y sus colaboradores proporcionan un nuevo sistema de control de calidad automático basado en el rango climatológico para perfiles in situ de la temperatura del océano. El sistema se llama CAS Ocean Data Center—Quality Control system, o CODC-QC para abreviar, e incluye 14 controles de calidad distintos para identificar valores atípicos.

El estudio fue publicado en Deep Sea Research Part I: Oceanographic Research Papers .

“Desarrollamos este nuevo sistema de control de calidad para proporcionar una base de datos de calidad homogénea, con una carga de trabajo humana y un costo de tiempo reducidos en el control de calidad manual”, dijo Tan Zhetao de IAP, primer autor del estudio.

En CODC-QC, los cuantiles 0,5% y 99,5% se utilizan como umbrales para definir rangos climatológicos locales. Estos umbrales varían en el tiempo, lo que tiene como objetivo excluir erróneamente datos reales durante “eventos extremos”. Las estrategias anteriores se utilizan en la verificación del rango climatológico local tanto para la temperatura como para el gradiente de temperatura vertical, en el que se tiene en cuenta la característica anisotrópica de las propiedades del agua y se realizan los ajustes de las barreras topográficas de la masa de agua.

Además, el rendimiento del sistema CODC-QC se evaluó utilizando dos conjuntos de datos de referencia expertos/manuales QC-ed. Esta evaluación demostró la efectividad del esquema propuesto para eliminar datos falsos y minimizar el porcentaje de buenos datos marcados por error.

El CODC-QC también se aplicó a la base de datos mundial de los océanos (WOD18) que incluye 16 804 361 perfiles de temperatura de 1940 a 2021. Según las estadísticas de valores atípicos de temperatura, se rechazó el 7,97 % de las mediciones, en las que los datos XBT obtuvieron los valores más altos. índice de rechazo (15,44 %), mientras que el flotador de perfilado Argo obtuvo el índice de rechazo más bajo (2,39 %). “Sugerimos que la calidad de las observaciones de temperatura depende del tipo de instrumentación”, dijo Viktor Gouretski, investigador del IAP y coautor del estudio.

Los investigadores también aplicaron el sistema CODC-QC al estudio de seguimiento del calentamiento global de los océanos. “Descubrimos que la aplicación del sistema CODC-QC conduce a una diferencia del 15 % para la tendencia lineal de los cambios en el contenido de calor del océano global de 0 a 2000 m entre 1991 y 2021, en comparación con la aplicación de WOD-QC (NOAA/NCEI), lo que implica una fuente de error no despreciable en la estimación del contenido de calor del océano”, dijo el profesor Cheng Lijing de IAP, autor correspondiente del estudio.

Los datos de perfil oceánico in situ controlados por calidad (por CODC-QC) y corregidos por sesgo de CAS-Ocean Data Center, Global Ocean Science Database (CODC-GOSD) ahora son de libre acceso en http://www.ocean.iap .ac.cn/ y http://english.casodc.com/ .

Más información: Zhetao Tan et al, Un nuevo sistema automático de control de calidad para las observaciones del perfil del océano y el impacto en la estimación del calentamiento del océano, Deep Sea Research Part I: Oceanographic Research Papers (2022). DOI: 10.1016/j.dsr.2022.103961