Codea Blog  

Blog Details

Modelado de la Dispersión de Contaminantes en la Minería Mediante Geoestadística y Machine Learning

IMPACTO AMBIENTAL DE LA MINERÍA

 La industria, la minería y el tráfico han dejado una huella antropogénica notable, que se refleja en todos los compartimentos ambientales (Wang et al., 2016, citado por Boente et al., 2018). Esta influencia humana se manifiesta de manera significativa en la geografía, biología y el ecosistema local, especialmente cuando se inician actividades mineras.

 

La minería, en particular, es una fuente frecuente de elementos potencialmente tóxicos (PTE), que incluyen metales pesados y arsénico, los cuales pueden tener un impacto perjudicial en el medio ambiente y suponer una amenaza para la salud humana cuando se encuentran en concentraciones elevadas.

 

Esta huella antropogénica también provoca un serio deterioro de los compartimentos medioambientales, especialmente en lo que respecta al suelo (Wang et al., 2016, citado por Boente et al., 2018). Esto se convierte en un problema crítico cuando se considera el uso de suelos potencialmente contaminados en la agricultura y otras actividades agrícolas.

 

Es de vital importancia evaluar las concentraciones de PTE en suelos utilizados para la agricultura y actividades agrícolas, con el fin de determinar los riesgos para la salud (Ballabio et al., 2021; Gil-Diaz et al., 2019, citados por Salgado et al., 2023). La presencia de estos elementos tóxicos en el entorno tiene un impacto significativo en la calidad de la tierra y en la seguridad alimentaria, lo que hace que la monitorización y la gestión adecuada sean esenciales para mitigar los efectos negativos de la actividad humana en el medio ambiente.

 

CONTAMINANTES PRODUCIDOS POR MINERÍA: RIESGOS PARA LA SALUD Y LA CADENA ALIMENTARIA

La distribución de elementos en el entorno suele ser un factor determinante en el inicio de actividades mineras, las cuales conllevan una perturbación significativa de la geografía, biología y el ecosistema local. Esto ha dado lugar a una huella antropogénica notable en todos los compartimentos ambientales (Wang et al., 2016, citado por Boente et al., 2018).

 

La minería es una fuente común de elementos potencialmente tóxicos (PTE), como metales pesados y arsénico, que pueden causar daños ambientales y representar una amenaza para la salud humana cuando están presentes en altas concentraciones. Estos contaminantes ingresan a la cadena alimentaria a través de los cultivos, pastos y praderas utilizadas para criar ganado (Ballabio et al., 2021; Gil-Diaz et al., 2019, citados por Salgado et al., 2023).

 

Por lo tanto, es esencial determinar las concentraciones de PTE en suelos potencialmente contaminados utilizados en la agricultura y actividades agrícolas. Esto se debe a que estos contaminantes pueden ingresar a la cadena alimentaria a través de los cultivos y forrajes, lo que plantea preocupaciones significativas para la salud pública y la seguridad alimentaria (Ballabio et al., 2021; Gil-Diaz et al., 2019, citados por Salgado et al., 2023).

 

CONTAMINACION EN ZONAS INDUSTRIALES Y MINERAS

Las zonas industriales y mineras a menudo actúan como fuentes de contaminantes que causan un deterioro grave en los compartimentos medioambientales, especialmente en el suelo. Entre los contaminantes más comunes en el suelo se encuentran los elementos potencialmente tóxicos (PTE), como los metales pesados y el arsénico (Boente et al., 2022; Forján et al., 2018, citados por Salgado et al., 2023).

 

La evaluación de la abundancia, distribución y movilidad de estos PTE en el suelo es una tarea compleja, pero fundamental, ya que puede influir en la evaluación de riesgos y en la elección de las tecnologías de remediación más apropiadas (Boente et al., 2022; Forján et al., 2018, citados por Salgado et al., 2023).

 

La contaminación del suelo puede ocurrir debido a la dispersión mecánica causada por varios agentes de meteorización, como la escorrentía superficial, los vientos y las pendientes (Boente et al., 2018). Boente et al. (2018) enfatiza la importancia de analizar cada etapa de un proceso de caracterización en este contexto.

 

El crecimiento continuo de la industria minera ha resultado en la generación de grandes cantidades de residuos sólidos, y en estos residuos se han identificado elementos tóxicos (ET) cuya capacidad de lixiviación plantea un riesgo ambiental significativo (Qi et al., 2023).

 

GEOESTADÍSTICA PARA LA ESTIMACIÓN ESPACIAL

Retamal (2020) sugiere que, según la situación particular a resolver, existen diversas técnicas que se pueden aplicar.

En ocasiones, cuando se utiliza el kriging ordinario para estimar variables continuas, el modelo geoestadístico no arroja resultados adecuados debido a la alta variabilidad presente en los datos. Esto suele suavizar las concentraciones, eliminando los valores extremos y ajustándolos hacia la media de la distribución. Una alternativa eficaz es emplear bloques pequeños como unidades de estimación, lo que proporciona una mejor comprensión de la variabilidad de la contaminación.

 

Es factible llevar a cabo la predicción espacial y la distribución de metales traza e índices de contaminación en sedimentos utilizando modelos geoestadísticos basados en el kriging, que se considera el método de interpolación espacial más preciso (Bende et al., 2023; Boentea et al., 2019).

 

Para analizar la distribución espacial de los metales traza e índices de contaminación, se pueden calcular semivariogramas simples y cruzados, los cuales proporcionan una medida promedio de la variabilidad entre las observaciones separadas por una cierta distancia. Estos semivariogramas describen la estructura de la variabilidad espacial de la variable en estudio (Abende et al., 2023).

 

Una vez que se ha desarrollado el variograma experimental, este se ajusta a un variograma teórico, y luego se procede a generar mapas de los elementos traza estudiados y los índices de contaminación mediante el uso del kriging y el co-kriging ordinario (Abende et al., 2023).

 

 

Figura 01. Análisis geoestadístico de Hg. a) (Izquierda) Variograma del indicador experimental para I1 y mapa de probabilidad para un contenido de Hg superior a 2,5 ppm (SSL local); (Derecha) Variograma del indicador experimental para I2 y mapa de probabilidad para un contenido de Hg superior a 1 ppm (RBSSL regional). b) (Izquierda) Variograma omnidireccional y modelos esféricos ajustados; (Derecha) Imagen promedio (IA) e incertidumbre espacial (desviación estándar). (Fuente: Boentea, et al. 2018).

 

APLICACIÓN DE MACHINE LEARNING EN  ANÁLISIS DE DISPERSIÓN DE CONTAMINANTES

Boente et al. (2019) llevaron a cabo un análisis detallado de las muestras de suelo, calculando estadísticas como la media, mediana, desviación estándar (SD) y desviación estándar relativa (RSD) para todos los elementos analizados. Además, realizaron un análisis factorial mediante el Análisis de Componentes Principales para reducir la dimensionalidad de las variables, manteniendo aquellas con cargas altas.

 

El éxito del aprendizaje automático (ML) depende en gran medida de la reducción adecuada de la dimensionalidad de las variables independientes en el conjunto de datos original (Salgado et al., 2023)

 

En este contexto, existen dos enfoques principales en el análisis de regresión:

1. Análisis de Regresión Lineal (LR): Este enfoque incluye técnicas paramétricas, como la Regresión Lineal Múltiple (MLR), que se basan en el supuesto fundamental de mínimos cuadrados, que asume independencia y distribución igual de errores con media cero y varianza constante. Sin embargo, estos supuestos pueden verse afectados por la no normalidad, la multicolinealidad de las variables y la heterocedasticidad de la varianza del error (Salgado et al., 2023).

 

2. Análisis de Regresión No Lineal: Este enfoque engloba técnicas como las Redes Neuronales Artificiales (ANN), la Regresión de Vectores de Soporte (SVR), los Árboles de Clasificación y Regresión, y los Bosques Aleatorios (RF).

 

En la actualidad, los algoritmos computacionales que imitan la inteligencia humana y se basan en el aprendizaje automático (ML) son ampliamente empleados, especialmente en el análisis de grandes conjuntos de datos. Estas técnicas tienen la capacidad de generar mapas continuos que son fundamentales para calcular diversas variables, como, por ejemplo, la materia orgánica del suelo en el condado de Zhongning (Carrillo, 2022).

 

El aprendizaje automático (ML) es un enfoque de programación informática basado en datos que permite a las computadoras "aprender" y "reconocer" patrones de manera autónoma a partir de datos empíricos. Este enfoque ha demostrado ser altamente eficiente para realizar predicciones precisas sin requerir una inversión significativa de tiempo y recursos (Carrillo, 2022).

 

Figura 2. Ejemplo de Diagrama de Flujo de Trabajo empleando Maachine Learning. (Qi et al., 2023)

 

En los últimos años, el ML ha encontrado una amplia aplicación en el ámbito de los residuos sólidos y campos relacionados, abarcando desde la identificación del origen de los residuos sólidos hasta la mejora de procesos de reciclaje, así como en la gestión y evaluación ambiental (Qi et al., 2023). Las avanzadas capacidades de estas técnicas de ML han demostrado ser extremadamente útiles para abordar problemas complejos en estos campos.

 

Predicción Mediante Redes Neuronales Artificiales (ANN)

La predicción mediante Redes Neuronales Artificiales (ANN) es un enfoque que se utiliza para modelar sistemas complejos, especialmente aquellos que son difíciles de abordar mediante métodos estadísticos tradicionales. En un estudio realizado por Abende et al. (2023), se emplearon ANN para evaluar la variabilidad espacial de las concentraciones de elementos traza e índices de contaminación en los sedimentos del Río Lom en Bekao. Este análisis se llevó a cabo utilizando el software Matlab 2019.

 

De acuerdo con Abdallah et al. (2020), citado por Qi et al. (2023), el uso de ANN es especialmente común en el campo de los residuos sólidos. Las redes neuronales artificiales constan de tres tipos de capas: la capa de entrada, la capa oculta y la capa de salida. Estas capas trabajan de manera conjunta para procesar datos y proporcionar resultados basados en decisiones.

 

Por otro lado, el método de Bosques Aleatorios (RF) es un enfoque de clasificación y regresión no paramétrico que se basa en la construcción de un gran número de árboles de decisión. Cada uno de estos árboles se desarrolla utilizando diferentes variables independientes seleccionadas aleatoriamente del conjunto de datos original. La fortaleza y precisión de los algoritmos de RF se deben a su uso de muestreo aleatorio y a la generación de una gran cantidad de árboles, lo que les permite superar a los modelos basados en árboles individuales. Estas técnicas de RF han encontrado una creciente aplicación en la teledetección para aplicaciones medioambientales. Han demostrado un mejor rendimiento y una mayor velocidad de procesamiento en comparación con otras técnicas predictivas (Salgado et al., 2023).

 

Modelos Potenciados Generalizados (GBM)

Son una combinación de dos técnicas, algoritmos de árboles de decisión, con la creación de sucesivos conjuntos de árboles débiles, y métodos de impulso, donde cada árbol aprende de los anteriores. Los GBM se ajustan repetidamente a múltiples árboles de decisión para mejorar la precisión. Estos modelos muestran el efecto de cada predictor después de evaluar la influencia de otros, se caracterizan por su robustez cuando faltan valores y valores atípicos. (Salgado et al. 2023)

 

Regresión adaptativa multivariada (MARS)

Es un método para el modelado de regresión flexible de datos de alta dimensión. Es una regresión o clasificación no paramétrica, basada en el ajuste de modelos de regresión lineal en diferentes intervalos espaciales de variables independientes. El proceso también se ejecuta entre variables dependientes y el modelo puede reducir los efectos aditivos y la interacción entre variables dependientes. Uno de los puntos fuertes de este método es el procesamiento de valores faltantes y la prevención de sobrepasos mediante una autocomprobación. (Salgado et al. 2023)

 

Retamal (2020), señala que utiliza dos tipos de técnicas:

• Aprendizaje Supervisado: Existe una variable a predecir, el algoritmo aprende de un conjunto de datos, donde el algoritmo puede aprender de los ejemplos proporcionados, los condicionantes que permitan predecir que categoría le corresponde a una instancia dentro de una enumeración de posibles categorías. Este tipo de aprendizaje comprende redes neuronales artificiales.

 

• Simulación Bayesiana: Se refiere a un enfoque de aprendizaje automatizado basado en una red bayesiana supervisada para obtener información sobre el elemento contaminante y el entorno en donde se encuentra; se puede aprender automáticamente a través de datos de un gráfico acícliclo directo (DAG) donde las relaciones probabilísticas basadas en las distribuciones de probabilidad de las concentraciones de los elementos maximizaron la predicción de la variable de interés. (Boentea, et al. 2018)

 

 

Figura 4. Análisis de aprendizaje automático. a) Red Bayesiana supervisada construida con un algoritmo Naive Bayes Aumentado para la caracterización de Hg. La estructura simple está representada por flechas grises, mientras que la estructura secundaria (aumentada) se muestra con flechas negras. b) Mapeo de cuadrantes que representa la información mutua suministrada por cada elemento relacionado con el Hg. (Boentea, et al. 2018)

 

Aprendizaje no Supervisado: Formado por entradas y no se conoce las clases a las que pertenecen los datos, su objetivo es agrupar los datos por características similares en un número definido de clases. Comprende los siguientes modelos: Segmentación (clusters), detección de anomalías, reglas de asociación.

 

CONCLUSIONES

• La minería y la industria dejan una huella ambiental significativa, perturbando la geografía y el ecosistema local.

• Elementos potencialmente tóxicos (PTE), como metales pesados y arsénico, afectan el medio ambiente y la salud.

• Los PTE en suelos contaminados ingresan a la cadena alimentaria, amenazando la salud a través de cultivos y pastos.

• Zonas industriales y mineras son fuentes comunes de contaminación, particularmente de metales pesados y arsénico.

• La dispersión de contaminantes ocurre por diversos medios, como escorrentía y vientos. Se requiere un análisis detallado en cada paso del proceso de caracterización.

• La geoestadística, como el kriging, se usa para estimar y analizar la variabilidad espacial de la contaminación.

• El análisis de datos y la reducción dimensional son esenciales para identificar patrones en datos ambientales, El aprendizaje automático, como las redes neuronales, mejora la precisión en la predicción.

• El aprendizaje automático se aplica en áreas como el reciclaje y la gestión de residuos sólidos. Algoritmos como Bosques Aleatorios y Modelos Potenciados Generalizados mejoran la precisión ambiental.

 

REFERENCIAS BIBLIOGRÁFICAS

1. Abende, R., Luther, M., Ayiwouo, M., Cathya, M., Boroh, W., Mambou, L., Meying, A. (2023). A coupled geostatistical and machine learning approach to address spatial prediction of trace metals and pollution indices in sediments of the abandoned gold mining site of Bekao, Adamawa, Cameroon.

2. Boentea, C., Albuquerque, M., Gerassis, S., Rodriguez, E., & Gallego, J. (2018). A coupled multivariate statistics, geostatistical and machine-learning approach to address soil pollution in a prototypical Hg-mining site in a natural reserve.

3. Carrillo, E. (2022). Mapeo de Suelos Contaminados con Arsénico y Mercurio a Partir de Datos Proporcionados por Vehículos Aéreos no Tripulados.

4. Retamal, J. (2020). Predicción y Diagnóstico en Suelos Contaminados por DAM usando Machine Learning.

5. Qi, C., Wu, M., Liu, H., Liang, Y., Liu, X., & Lin, Z. (2023). Machine learning exploration of the mobility and environmental assessment of toxic elements in mining-associated solid wastes.

6. Salgado, L., Lopez, C., Colina, A., Baragaño, D., Forján, R., & Gallego, J. (2023). Hg and As pollution in the soil-plant system evaluated by combining multispectral UAV-RS, geochemical survey and machine learning.

 

Comentarios

Registrate o Inicia Sesión para comentar y obtener Cursos de pago gratis

function loadurl(){ var val1 = document.getElementById("valor3").value; console.log(val1); if(val1){ window.location = "/comunidad/blog/filtrar/"+val1+"/"} }