Recibido: 29 de Junio de 2020
Aceptado: 16 de Septiembre de 2020
Publicado: 10 de Noviembre de 2020
En los últimos años, uno de los principales problemas en Colombia es la contaminación ambiental debido al crecimiento de la población y la industrialización. La contaminación afecta a las grandes ciudades, perjudicando el medio ambiente y la salud humana. Es por ello que se presenta una metodología para el análisis de la contaminación ambiental en Medellín, usando técnicas de percepción remota, imágenes Landsat 7 y 8 y variables de calidad del aire. La metodología está compuesta por cuatro etapas: i. Preprocesamiento de imágenes, ii. Procesamiento de imágenes, cálculo de los índices de temperatura de la superficie (TS ), índice de vegetación normalizado (NDVI ), índice de vegetación ajustado al suelo transformado (TSAVI ), índice de diferencia normalizada del agua (NDWI ) y el índice normalizado del suelo (NSI ), iii. Interpolación de variables de calidad del aire, Material Particulado (PM10 ), Material Particulado (PM2.5 ), Dióxido de Nitrógeno (NO2 ) y Ozono (O3 ); y, iv. Análisis de componentes principales. A partir de las técnicas aplicadas combinadas con la estimación del primer componente principal, el cual contenía el 90 % de variación de la información, se obtuvo un mapa de calidad ambiental que permitió identificar que los focos de contaminación se presentan en sectores con poca cobertura de vegetación, gran cantidad de construcciones y gran flujo vehicular. Por otro lado, las zonas con calidad de aire bueno son sectores que presentan una mayor cobertura de vegetación, por lo general ubicados en los extremos de la ciudad y de estrato socioeconómico 4, 5 y 6. Este mapa puede ser insumo en la oportuna toma de decisiones en cuanto a la planificación urbana, ya que permite la pronta intervención en las zonas donde la calidad ambiental es deficiente.
Palabras clave: percepción remota, contaminación atmosférica, calidad del aire, procesamiento de imágenes, análisis de componentes principales.
Due to population growth and industrialization, air pollution has become one of Colombia’s major issues in recent years. It affects large cities, harming the environment and human health. Therefore, in this paper, we propose a methodology to analyze air pollution in Medellín, Colombia using remote sensing techniques, Landsat-7 and Landsat-8 images, and air quality variables. The proposed methodology consists of four stages: (i) image preprocessing; (ii) image processing and calculation of the Surface Temperature (TS ), Normalized Difference Vegetation Index (NDVI ), Transformed Soil Adjusted Vegetation Index (TSAVI ), Normalized Difference Water Index (NDWI ), and Normalized Difference Soil Index (NSI ); (iii) interpolation of air quality variables, Particulate Matter (PM10 and PM2.5 ), Nitrogen Dioxide (NO2 ), and Ozone (O3 ) ; and (iv) principal component analysis. Based on the applied techniques, together with the estimation of the first major component (which contains 90% of information variation), an air quality map is obtained. According to this map, the sources of pollution are found in sectors with little vegetation cover, a great number of buildings, and high traffic flow. Conversely, areas with good air quality include sectors with greater vegetation cover, which are usually found in the limits of the city and in socioeconomic strata 4, 5, and 6. This map could be used as input for timely decision-making regarding urban planning because it allows for an early intervention in areas with poor air quality.
Keywords: Remote sensing, air pollution, air quality, image processing, principal component analysis.
La contaminación atmosférica se ha convertido en uno de los principales problemas en Colombia debido al deterioro continuo en la calidad del aire y el impacto sobre la salud humana y el medio ambiente [
El análisis de la distribución espacial de la contaminación atmosférica se ha abordado mediante redes de vigilancia [
Entre los métodos más usados para el análisis de la calidad ambiental se encuentra el Análisis por Componentes Principales PCA. Esta técnica estudia la relación entre variables correlacionadas permitiendo reducir su número a un conjunto de variable sin correlacionar [
Este documento presenta una metodología para el análisis de la contaminación ambiental en Medellín a partir de datos de estaciones meteorológicas e imágenes de los satélites Landsat 7 y Landsat 8. El artículo se ordena de la siguiente manera: la sección 2, muestra los materiales y métodos; sección 3, los resultados obtenidos; y, la sección 4, las conclusiones.
La metodología propuesta para el análisis de la calidad ambiental aplicando técnicas de teledetección y análisis de componentes principales se desarrolla en el Software ENVI 5.0 y permite el cálculo de los índices TS, NDVI, TSAVI, NDWI y NSI ; la interpolación de variables de calidad del aire PM10 , PM2.5 , NO2 y O3 ; y el Análisis de Componentes Principales, (ver Figura 1). Se utilizan imágenes entre el año 2016 al 2019 obtenidas de la USGS (United States Geological Survey) de los satélites Landsat 7, que contiene 3 bandas del visible (B1 azul, B2 verde y B3 rojo), 2 bandas del infrarrojo cercano (B4 y B5), 1 banda térmica (B6), 1 banda infrarrojo medio (B7) y 1 banda pancromática (B8); Landsat 8, contiene 3 bandas del visible (B2 azul, B3 verde y B4 rojo), 1 banda de aerosol (B1), 1 banda de infrarrojo cercano (B5), 2 bandas SWIR (B6 y B7), 1 banda pancromática (B8), 1 banda cirrus (B9) y 2 bandas TIRS (B10 y B11) y mediciones meteorológicas de las variables de calidad del aire NO2 , O3 , PM2.5 , y PM10 de las mismas fechas. La información relacionada con estas variables es obtenida del SIATA (Sistema de Alerta Temprana de Medellín y el Valle de Aburrá) (ver Tabla 1).
Fecha | Hora de captura imagen | Imagen | Hora de captura variable ambiental |
18/12/2017 | 15:18 | Landsat 8 | 15:00 |
09/04/2018 | 15:17 | Landsat 8 | 15:00 |
21/11/2016 | 15:21 | Landsat 7 | 15:00 |
15/02/2019 | 15:12 | Landsat 7 | 15:00 |
2.1 Preprocesamiento de las imágenes
Las imágenes requieren de un preprocesamiento para disminuir los efectos del ruido geométrico y radiométrico presente, y ser el insumo en las etapas de análisis visual o digital.
La corrección atmosférica disminuye las distorsiones producidas por la atmosfera que se introducen en los valores de radiancia en las bandas de las imágenes, esta se calcula por medio de (1) [
Donde ρ es la reflectividad, E0 es la irradiancia exoatmosférica, τ1 es el coeficiente de transmisión atmosférica sol-tierra para cada una de las bandas B1τ1 = 0.70, B2τ1 = 0.78, B3τ1 = 0.85, B4τ1 = 0.91, B5τ1 = 0.95 y B7τ1 = 0.97, τ2 es el coeficiente de transmisión atmosférica tierra-sensor, L es la radiancia del pixel a corregir, La es el valor mínimo de niveles digitales por cada banda, θ es el ángulo cenital solar y d = 1.49598 * 108 Km es la distancia tierra-sol [
El preprocesamiento se realiza en el Software ENVI. Por medio del toolbox Radiometric Calibration se convierten los niveles digitales a valores de radiancia. Por otra parte, se realiza la corrección radiométrica del bandeado que corrige el efecto de desplazamiento del histograma de la imagen con el fin de obtener el mismo valor promedio y una misma desviación típica para todas las bandas [
2.2 Procesamiento de las imágenes
En esta etapa se usan las imágenes corregidas radiométrica y geométricamente como insumos para estimar distintas variables que son indicadores de calidad del aire.
A continuación, se describe cómo estimar cada una de estas variables.
2.2.1 Temperatura de la superficie TS
La temperatura de la superficie se calcula por medio de (2) [6].
Donde TI es la temperatura de brillo superficial obtenida en función de las constantes de calibración del sensor, λ = 0.00115 μm es la longitud de onda media de la banda térmica,
ρ = 1.438*10-2 mK y ε es la emisividad de la superficie, la cual se calcula teniendo en cuenta la proporción de vegetación [
2.2.2 Índice de vegetación normalizado NDVI
Los índices de vegetación son transformaciones matemáticas entre distintas bandas espectrales de la misma escena. Estos permiten evaluar la proporción de reflectancia en la vegetación verde para las longitudes de onda asociadas a la luz roja e infrarroja, pues la clorofila absorbe la luz roja en el proceso de fotosíntesis. El índice de vegetación normalizado NDVI, es uno de los índices más usados en la literatura científica, ya que facilita la interpretación de los parámetros biofísicos de la vegetación fotosintéticamente activa [
Donde BIRC es la banda del infrarrojo cercano y BR la banda rojo del visible [
2.2.3 Índice de vegetación ajustado al suelo transformado TSAVI
El índice TSAVI es un ajuste al NDVI en el que se busca corregir el efecto del brillo del suelo en zonas con escasa cobertura vegetal [
En (4) el numerador aparece con la diferencia entre el valor de la banda BIRC y el valor que tendría esta banda si toda la luz en el rojo procediese del suelo, y el denominador se define de tal forma que se corrija los efectos debido a la visión del suelo entre la vegetación, s y a son la pendiente y el intercepto con el suelo [
2.2.4 Índice de diferencia normalizada del agua NDWI
El índice de diferencia normalizada del agua permite medir los cambios en el contenido de agua de la vegetación, permitiendo identificar el nivel de saturación de humedad de la vegetación [
Donde BG es la banda verde [
2.2.5 Índice normalizado del suelo NSI
El índice normalizado del suelo NSI analiza la cantidad de suelo edificado que abarca la superficie urbana, indicando que a mayor área construida los valores son más altos [
Donde BIRS es la banda correspondiente al infrarrojo de onda corta.
2.3 Métodos de interpolación
La interpolación es usada para predecir valores en una superficie en lugares que no tienen información [
El kriging simple es usado si los fenómenos son estacionarios, con varianza y esperanzas conocidas y constantes [
Donde z ( x0 ) es el valor estimado de la variable en la posición x0, λi son los pesos calculados por medio de la matriz de covarianza, m es la media del valor de la variable, Z ( xi ) son las mediciones de las variables de interés en los puntos i =1 , 2,…, n [
El IDW asigna los pesos a los datos muestreados entorno a una función inversa de la distancia que los separa, por lo cual los puntos más cercanos tienen un peso mayor en el cálculo [
Donde Z ˆ j es el valor estimado para el punto, j.n es el número de puntos utilizados para la interpolación, zj es el valor en el punto i - ésimo, kij es el peso asociado al dato i en el cálculo del nodo j. Los pesos k varían entre 0 y 1 según el dato y la suma total de los pesos es la unidad [
2.4 Análisis de componentes principales
El análisis de componentes principales es una técnica multivariante que estudia la relación que se presenta entre variables correlacionadas y reduce el número de dimensiones mediante la creación de un conjunto de variables sin correlación. Las componentes principales son combinaciones lineales de las variables correlacionadas y se construyen en orden de importancia en cuanto a la variabilidad total de la muestra [
El análisis de componentes principales permite el paso de un espacio vectorial Rn a un subespacio Rm ( n > m ) sin pérdida de información relevante, maximizando su varianza. El PCA calcula una matriz de autocorrelación de los datos con sus vectores propios y los ordena de acuerdo con su valor propio para posteriormente normalizarlos [
Donde ∝' x es la funciona lineal de los elementos de x de máxima varianza, y ∝1 es un vector de p constantes y denota la transpuesta ∝11 , ∝12 ,…, x1p . El segundo componente se calcula con ∝'2 incorrelacionada con ∝'1x . Así se eligen los componentes no correlacionados entre sí, de modo que las variables aleatorias tengan cada vez menor varianza [
Con las imágenes Landsat 7 y 8 se realizó un preprocesamiento que consistió en la corrección de bandeado para el caso del Landsat 7, la corrección atmosférica para todas las imágenes y el recorte para ajustar a la zona de estudio la ciudad de Medellín. Seguidamente, se calculó cada uno de los índices (TS, NDVI, TSAVI, NDWI y NSI) para cada una de las fechas. También, con las mediciones meteorológicas se estimaron las superficies de las variables NO2 , O3 , PM2.5 , y PM10 usando los métodos de interpolación kriging simple e IDW.
Las superficies asociadas a todas las variables se obtienen con un tamaño de píxel de 30 metros. Después, mediante el análisis de componentes principales se generó un mapa de calidad ambiental asociado a cada fecha estudiada y se identificaron las áreas con calidad de aire más deficiente. Esta información fue cruzada con información socioeconómica descargada del Portal Geográfico del Municipio de Medellín, la cual contenía la localización de los barrios y el estrato socioeconómico.
A continuación, se describe cada superficie encontrada con el fin de identificar los sectores con la temperatura más alta, las zonas con mayor cobertura de vegetación, las áreas con mayor contenido de agua y las zonas con mayor suelo construido.
3.1 Temperatura de la Superficie TS
Se calculó la temperatura de la superficie para las imágenes entre 2016 y 2019. Al igual que en el estudio de [
En estos sectores se presentan temperaturas por encima de los 30°C y son sectores con construcciones grandes y de baja altura.
3.2 Índice de vegetación NDVI
El índice de vegetación NDVI permitió identificar las zonas con cobertura de vegetación. Se evidenció que en los extremos del casco urbano se presenta una vegetación dispersa. El sector de la ciudad con mayor vegetación dispersa se encuentra en el sureste, siendo un sector residencial de estrato socioeconómico 5 y 6, con una gran cobertura de árboles. Por otro lado, el centro de Medellín es la zona donde se presenta menos cobertura de vegetación al igual que en los barrios aledaños al corredor vial del río Medellín. La Figura 3 muestra el índice NDVI obtenido en las fechas estudiadas.
3.3 Índice de vegetación TSAVI
El índice de vegetación TSAVI puede verse afectado por las variaciones en el brillo del suelo, por lo cual los valores de la cubierta vegetal son más independientes al reflejo del suelo [
3.4 Índice de vegetación NDWI
Este índice determinó las zonas con mayor concentración de humedad, donde al igual que el NDVI y el TSAVI en la zona suroriental y noroccidental, es donde se presenta mayor vegetación y por ende mayor contenido de humedad. En la Figura 5 se presenta el índice obtenido para cada una de las fechas.
3.5 Índice de vegetación NSI
Este índice determinó las áreas construidas con el fin de conocer cómo ha cambiado el uso del suelo y su expansión a lo largo del tiempo y el espacio. Para el año 2019 se presentaron cambios en el uso del suelo (ver Tabla 2), siendo ese año el que mostró la mayor variación. Por otro lado, entre los años 2017 y 2018 no se presentó variación en cuanto al área construida y por lo general las fechas de estudio no presentaron una variación significativa. La Figura 6 ilustra el índice de vegetación obtenido.
NSI | 2016 | 2017 | 2018 | 2019 |
2016 | 1.000 | 0.919 | 0.919 | 0.890 |
2017 | 0.919 | 1.000 | 1.000 | 0.876 |
2018 | 0.919 | 1.000 | 1.000 | 0.876 |
2019 | 0.890 | 0.876 | 0.876 | 1.000 |
3.6 Análisis de relaciones entre los índices
Por medio de matrices de correlación se analizaron las relaciones entre los diferentes índices (NDVI, TSAVI, NDWI, NSI y TS ) para cada una de las fechas estudiadas (ver Tabla 3). Se observó que se presenta una correlación alta entre el NDWI, TSAVI y NDVI, debido a que el primero analiza la cantidad de humedad en el suelo mientras el TSAVI y NDVI identifican las zonas con cobertura de vegetación.
Año 2016 | |||||
Variables | TS | NDVI | TSAVI | NDWI | NSI |
TS | 1.000 | -0.697 | -0.680 | -0.695 | 0.695 |
NDVI | -0.697 | 1.000 | 0.993 | 0.905 | -0.905 |
TSAVI | -0.680 | 0.993 | 1.000 | 0.901 | -0.901 |
NDWI | -0.695 | 0.905 | 0.901 | 1.000 | -1.000 |
NSI | 0.695 | -0.905 | -0.901 | -1.000 | 1.000 |
Año 2017 | |||||
Variables | TS | NDVI | TSAVI | NDWI | NSI |
TS | 1.000 | -0.583 | -0.526 | -0.590 | 0.590 |
NDVI | -0.583 | 1.000 | 0.976 | 0.913 | -0.913 |
TSAVI | -0.526 | 0.976 | 1.000 | 0.892 | -0.892 |
NDWI | -0.590 | 0.913 | 0.892 | 1.000 | -1.000 |
NSI | 0.590 | -0.913 | -0.892 | -1.000 | 1.000 |
Año 2018 | |||||
Variables | TS | NDVI | TSAVI | NDWI | NSI |
TS | 1.000 | -0.641 | -0.612 | -0.640 | 0.640 |
NDVI | -0.641 | 1.000 | 0.987 | 0.891 | -0.891 |
TSAVI | -0.612 | 0.987 | 1.000 | 0.876 | -0.876 |
NDWI | -0.640 | 0.891 | 0.876 | 1.000 | -1.000 |
NSI | 0.640 | -0.891 | -0.876 | -1.000 | 1.000 |
Año 2019 | |||||
Variables | TS | NDVI | TSAVI | NDWI | NSI |
TS | 1.000 | -0.582 | -0.528 | -0.639 | 0.639 |
NDVI | -0.582 | 1.000 | 0.984 | 0.870 | -0.870 |
TSAVI | -0.528 | 0.984 | 1.000 | 0.831 | -0.831 |
NDWI | -0.639 | 0.870 | 0.831 | 1.000 | -1.000 |
NSI | 0.639 | -0.870 | -0.831 | -1.000 | 1.000 |
Por otro lado, se presentó una correlación negativa o inversa entre el NDVI y el NSI, dado que el NSI busca identificar las zonas con mayores construcciones y el NDVI las coberturas de vegetación.
La temperatura TS presentó una correlación positiva con el NSI, dado que a mayor área construida mayor aumento de temperatura, es por ello por lo que en la zona centro de la ciudad donde se presenta una alta densidad de construcciones, la temperatura es mayor.
Lo contrario ocurre con los índices NDVI, TSAVI y NDWI, ya que la correlación es negativa debido que a mayor temperatura, menor cobertura de vegetación y menor humedad del suelo lo cual concuerda con el estudio de [
El TSAVI y el NDVI presentaron una alta correlación debido a que ambos índices identifican cobertura de vegetación.
3.7 Interpolación de variables de calidad del aire
Las variables de calidad del aire descargadas del SIATA fueron adquiridas de la misma fecha de la toma de las imágenes. La red de monitoreo del SIATA cuenta con 43 estaciones a lo largo del Valle de Aburrá, de las que se tomó la información de 30 (ver Figura 7).
Las variables PM10 , PM2.5 , NO2 y O3 fueron interpoladas por el método kriging simple para cada una de las fechas de estudio. Este método generó una superficie homogénea que representaba la tendencia de los datos y la distribución de los mismos.
Para las variables PM2.5 y PM10 del año 2016, se utilizó el método de interpolación IDW debido a que los datos poseían un distanciamiento grande y el Kriging muestra problemas en la generación de los variogramas, ocasionando que los datos no interpolen o no representen la realidad, por lo cual el IDW se perfiló mejor, para este tipo de distribución de datos.
3.8 Mapa de calidad ambiental
Al igual que en [
En el año 2016, 16.47 hectáreas presentaban calidad ambiental muy deficiente y para el año 2017 ese valor aumentó a 40.32 hectáreas, ya que zonas con calidad ambiental deficiente pasaron a la categoría muy deficiente. En el año 2018 el área disminuyó a 36.36 Ha y esta tendencia se mantuvo hasta el año 2019 con 31.32 Ha.
La calidad ambiental buena tendió a aumentar, ya que para el año 2016 era de 1884.24 Ha y para el año 2019 paso a ser 1984.05 Ha, debido a que zonas que presentaban una calidad ambiental moderada pasaron a tener una buena calidad ambiental. Por el contrario, zonas categorizadas con muy buena calidad pasaron a tener calidad buena, como en la zona sureste de la ciudad.
Se evidenció que las zonas con calidad muy deficiente son sectores con una gran cantidad de construcciones y poca cobertura de vegetación, como la zona centro de la ciudad, donde se integran rutas de buses, el metro y se presenta una gran concurrencia de personas.
Las zonas con una calidad del aire muy buena y buena presentan una mayor cobertura de vegetación. Por lo general están ubicadas en los extremos de la ciudad, zonas de estrato socioeconómico 4, 5, y 6, lo cual evidencia que la calidad ambiental está muy asociada a la cobertura de vegetación que es un factor clave de balance y al estrato socioeconómico, debido al área construida y el diseño urbanístico. Los focos de contaminación se ubican en el centro de la ciudad y en algunos sectores aledaños al Aeropuerto Olaya Herrera, debido a su diseño urbanístico con poca cobertura de vegetación, una gran cantidad de construcciones y un gran flujo vehicular.
En este estudio se analizó la calidad ambiental por medio de PCA usando variables ambientales y variables de calidad de aire, a diferencia [
La metodología propuesta para el análisis de la contaminación ambiental se usó para analizar un periodo de 4 años con datos anuales, pero puede adaptarse para utilizar datos con periodicidad trimestral para analizar efectos estacionales. Asimismo, incluyendo variables de calidad del agua, socioeconómicas y sociodemográficas que permitan la creación de índice de calidad ambiental que analice la contaminación ambiental desde varios componentes.
Se propuso una metodología para analizar la distribución espacial de la contaminación ambiental en el casco urbano de Medellín utilizando técnicas de percepción remota y análisis estadísticos. Con la metodología propuesta se obtiene un mapa de calidad ambiental que se enfoca en la contaminación atmosférica dado el uso de variables de calidad del aire como PM10 , PM2,5 , NO2 y O3 . Este mapa se obtuvo a partir del primer componente, el cual contenía el 90 % de variación de la información y permitió ubicar los sectores con la calidad ambiental más deficiente, siendo insumo para la planificación urbana y para dar atención prioritaria a las áreas más críticas.
De acuerdo con la metodología propuesta, los principales focos de contaminación del casco urbano de Medellín se presentaron en la zona centro de la ciudad y en sectores aledaños al Aeropuerto Olaya Herrera. Estos focos corresponden a zonas con poca cobertura de vegetación, un área construida extensa y elevado flujo vehicular.
El mapa de calidad ambiental puede ser usado como insumo en la oportuna toma de decisiones en cuanto a la planificación urbana por parte de entidades como la Alcaldía y las secretarías de Medio Ambiente y de Planeación, ya que posibilita la pronta intervención en las zonas donde la calidad ambiental es muy deficiente. Proporciona también que las entidades de salud puedan identificar los sectores más vulnerables por la Muy Deficiente calidad ambiental y hacer seguimiento a los residentes de estos sectores, dado los problemas de salud que esto conlleva.
La metodología propuesta puede ser aplicada en diferentes zonas y se recomienda incluir variables socioeconómicas como uso del suelo urbano, densidad de población y variables de calidad de agua, entre otras, debido a que la incorporación de otros indicadores robustece el análisis y permite una mejor comprensión de los factores que influyen en la contaminación ambiental.
Los autores agradecen al SIATA por suministrar la información de las variables de calidad del aire Material Particulado (PM10y PM2.5 ) , Dióxido de Nitrógeno (NO2 ) y Ozono (O3 ) y a la Universidad de Manizales por el apoyo para el desarrollo de la investigación. El artículo no es financiado por ninguna entidad.
Los autores declaran que no se presentan conflictos de interés.
Lizette Tello-Cifuentes: conceptualización, diseño, desarrollo y análisis de la investigación para tesis de maestría y escritora del artículo.
Jean P. Díaz Paz: contribuyó como director de tesis, supervisó y revisó durante el planteamiento, desarrollo y análisis de la investigación y apoyó en la escritura del artículo.