IA y cambio climático: Cómo registrar de forma fiable las emisiones de gases de efecto invernadero


Las grandes empresas de la UE están obligadas por ley a informar sobre sus emisiones de gases de efecto invernadero (GEI).


por la Universidad Ludwig Maximilian de Múnich


Ilustración visual de la guía del GHGP. Crédito: Scientific Data (2025). DOI: 10.1038/s41597-025-05664-8

Sin embargo, extraer manualmente esta información de extensos informes de sostenibilidad en formato PDF es lento y propenso a errores. Muchos equipos intentan agilizar el proceso mediante la automatización, por ejemplo, mediante el uso de modelos de lenguaje extenso (LLM), sistemas de IA que leen texto y generan respuestas.

El Dr. Malte Schierholz, coordinador del proyecto e investigador postdoctoral del Laboratorio de Ciencias de Datos Sociales e IA (SODA Lab), insta, sin embargo, a la cautela. «Con los métodos de extracción automática, es fácil confiar plenamente en los resultados del LLM y pasar por alto errores de medición frecuentes».

Dado que la tendencia hacia una mayor automatización es prometedora pero riesgosa al mismo tiempo, el grupo de investigación Greenhouse Gas Insights and Sustainability Tracking (GIST) se propuso construir un punto de referencia confiable para recopilar datos de emisiones.

Un estándar de oro para registrar datos de emisiones

En un artículo publicado en Scientific Data , el grupo presenta un conjunto de datos de referencia de referencia para la extracción de emisiones de GEI. Este conjunto de datos se basa en informes de sostenibilidad de empresas del índice MSCI World Small Cap y del DAX alemán.

«La tarea básica consistía en extraer los valores de emisiones de GEI de archivos PDF y convertirlos en una tabla», explica Schierholz. «Lo que al principio parecía sencillo resultó ser sorprendentemente complejo».

En un proceso de varias etapas, expertos en finanzas sostenibles de LMU y Deutsche Bundesbank trabajaron con metodólogos para definir reglas de anotación estrictas, realizaron múltiples rondas de extracción y verificación y convocaron grupos de discusión de expertos.

«Si se busca un conjunto de datos preciso que permita comparaciones entre empresas, se necesitan reglas claras y una amplia retroalimentación durante todo el proceso de anotación de datos», afirma Jacob Beck, quien dirigió el proyecto. «Al final, algunos casos ambiguos requirieron la discusión de un grupo de expertos».

Muchas empresas no proporcionan suficiente documentación

El Dr. Andreas Dimmelmeier, investigador en finanzas sostenibles (consorcio GreenDIA), no se mostró sorprendido. «Los casos difíciles de resolver se deben no solo a protocolos de presentación de informes complejos y en parte inconsistentes, sino también a la falta de contexto y a la información incompleta en los informes de las empresas. Muchas empresas de nuestra muestra no divulgaron sus emisiones según los marcos de información y cálculo establecidos».

El equipo también observó que aproximadamente la mitad de los informes no contenían datos utilizables sobre gases de efecto invernadero . Cuando se reportaban emisiones, la mayoría de las veces se referían a emisiones directas e indirectas derivadas del consumo de energía. Los datos sobre otras emisiones indirectas, como las derivadas de la cadena de suministro o de los viajes y el transporte, rara vez estaban completos.

El conjunto de datos, junto con scripts y materiales complementarios, ofrece una base transparente y rigurosamente seleccionada para evaluar enfoques automatizados de informes de sostenibilidad. Al explicitar los supuestos y las decisiones, permite comparaciones justas de métodos y una comunicación más clara de la incertidumbre de las anotaciones. El grupo GIST espera que este recurso ayude a investigadores y profesionales a medir el progreso con mayor honestidad y a subsanar las deficiencias críticas de datos en el camino hacia las cero emisiones netas.

Más información: Jacob Beck et al., Abordando las lagunas de datos en los informes de sostenibilidad: Un conjunto de datos de referencia para la extracción de emisiones de gases de efecto invernadero, Scientific Data (2025). DOI: 10.1038/s41597-025-05664-8