El aprendizaje automático impulsa un nuevo enfoque para detectar contaminantes del suelo


Un equipo de investigadores de la Universidad Rice y el Baylor College of Medicine ha desarrollado una nueva estrategia para identificar contaminantes peligrosos en el suelo, incluso aquellos que nunca han sido aislados o estudiados en un laboratorio.


por Silvia Cernea Clark, Universidad Rice


El nuevo enfoque, descrito en un estudio publicado en Proceedings of the National Academy of Sciences , utiliza imágenes basadas en luz, predicciones teóricas de las firmas luminosas de los compuestos y algoritmos de aprendizaje automático (ML) para detectar compuestos tóxicos como los hidrocarburos aromáticos policíclicos (HAP) y sus compuestos derivados (PAC) en el suelo.

Los HAP y los PAC, un subproducto común de la combustión, se han vinculado con el cáncer, problemas de desarrollo y otros problemas de salud graves.

La identificación de contaminantes en el suelo suele requerir laboratorios avanzados y muestras físicas de referencia estándar de los contaminantes sospechosos. Sin embargo, para muchos contaminantes ambientales que representan un riesgo para la salud pública, no existen datos experimentales disponibles que permitan detectarlos.

«Este método permite identificar sustancias químicas que aún no han sido aisladas experimentalmente», dijo Naomi Halas, profesora universitaria y profesora Stanley C. Moore de Ingeniería Eléctrica e Informática en Rice.

El nuevo método utiliza una técnica de imagen basada en la luz, conocida como espectroscopia Raman de superficie mejorada, que analiza cómo la luz interactúa con las moléculas, rastreando los patrones únicos, o espectros , que emiten. Los espectros sirven como «huellas químicas» de cada compuesto. La técnica se perfecciona mediante el uso de nanocapas distintivas diseñadas para realzar las características relevantes de los espectros.

Utilizando la teoría del funcional de la densidad —una técnica de modelado computacional que permite predecir el comportamiento de átomos y electrones en una molécula—, los investigadores calcularon el aspecto de los espectros de una amplia gama de HAP y PAC basándose en la estructura molecular de los compuestos. Esto les permitió generar una biblioteca virtual de huellas dactilares para HAP y PAC.

Se utilizaron dos algoritmos ML complementarios (extracción de picos característicos y similitud de picos característicos) para analizar rasgos espectrales relevantes en muestras de suelo del mundo real y asociarlos con compuestos mapeados en la biblioteca virtual de espectros.

«Estamos utilizando HAP en el suelo para ilustrar esta nueva y crucial estrategia», afirmó Halas. «Existen decenas de miles de sustancias químicas derivadas de HAP, y este enfoque —calcular sus espectros y usar aprendizaje automático para conectar los espectros calculados teóricamente con los observados en una muestra— nos permite identificar sustancias químicas para las que quizás no dispongamos de datos experimentales».

El método aborda una deficiencia crítica en el monitoreo ambiental , abriendo la puerta a la identificación de una gama mucho más amplia de compuestos peligrosos, incluyendo aquellos que han cambiado con el tiempo. Esto es especialmente importante dado que el suelo es un entorno dinámico donde las sustancias químicas están sujetas a transformaciones que pueden dificultar su detección.

Thomas Senftle, ​​profesor asociado de Ingeniería Química y Biomolecular del fideicomiso William Marsh Rice de Rice, comparó el proceso con el uso del reconocimiento facial para encontrar a un individuo en una multitud.

«Imagínense que tenemos la foto de una persona cuando era adolescente, pero ahora tiene treinta y tantos», dijo Senftle. «En mi grupo, teóricamente, podemos predecir cómo se verá la foto».

Los investigadores probaron el método en suelo de una cuenca hidrográfica restaurada y un área natural, utilizando muestras contaminadas artificialmente y una muestra de control. Los resultados demostraron que el nuevo enfoque detectó con fiabilidad incluso trazas diminutas de HAP mediante un proceso más sencillo y rápido que las técnicas convencionales.

«Este método puede identificar moléculas contaminantes de HAP y PAC menos conocidas y en gran medida no estudiadas», dijo Oara Neumann, científica investigadora de Rice y coautora del estudio.

En el futuro, el método podría permitir pruebas de campo en el sitio mediante la integración de los algoritmos ML y la biblioteca espectral teórica con dispositivos Raman portátiles en un sistema móvil, lo que facilitaría a los agricultores, las comunidades y las agencias ambientales analizar el suelo en busca de compuestos peligrosos sin necesidad de enviar muestras a laboratorios especializados y esperar días para obtener los resultados.

Más información: Yilong Ju et al., Detección in silico de hidrocarburos aromáticos policíclicos en suelos contaminados mediante aprendizaje automático, Actas de la Academia Nacional de Ciencias (2025). DOI: 10.1073/pnas.2427069122