Perceptions of Quality of Reproductive Care Services in Bolivia: Use of Photo Prompts and Surveys as...

8
Aplicación de modelos de redes neuronales artificiales en la predicción de índices de calidad de agua en el Río Tunjuelito Bogotá D.C. John Chavarro 1 , Wilson Patiño 1 1. Clase de Seminario II, Maestría en Hidrosistemas, Facultad de Ingeniería Pontificia Universidad Javeriana, Bogotá B.C. [email protected] [email protected] Resumen: En la búsqueda de la gestión óptima del abastecimiento de agua y la recuperación ambiental de cuerpos de agua superficiales han aumentado la necesidad de nuevas técnicas de modelación que puedan proporcionar una representación confiable, eficiente y precisa de la dinámica no lineal de la calidad del agua en los sistemas de distribución de agua. Dado que las redes neuronales artificiales (RNA) han sido ampliamente aplicadas a la aproximación de funciones de transferencia no lineal, en este trabajo se presenta un desarrollo de redes de perceptrón multicapa para estimar los índices de calidad del agua (DBO, OD) en el Río Tunjuelito localizado al costado suroccidental de la Ciudad de Bogotá. En este articulo, se utilizo la información y datos de la calidad del agua en el Río Tunjuelito que incluye cinco parámetros quincenales registrados en un periodo de dos años en cada una de las diez estaciones de monitoreo, para el cálculo de la demanda biológica de oxígeno (DBO) y de oxígeno disuelto (OD) como índices que afectan a la calidad del agua. Para la etapa de entrenamiento de las RNA se tomaron un conjunto de datos seleccionados aleatoriamente, los cuales representan el 80% de la base de datos original, para las etapas de validación y comprobación se utilizaron de la misma manera el 10% para cada etapa. El desempeño del modelo fue evaluado por criterios estadísticos que incluyen el coeficiente de correlación (r), raíz del error cuadrático medio (RMSE) y el error medio absoluto (MAE). En la estructura óptima del coeficiente de correlación para la etapa de entrenamiento de la red neural para la DBO y OD son 0.964 y 0.933 respectivamente, también la raíz del error cuadrado medio son 30.94 y 1.43, respectivamente. Los resultados muestran un gran potencial de la RNA para simular las variables de calidad del agua. Palabras clave: Redes Neuronales Artificiales; Predicción; Índice de Calidad del Agua, DBO. 1. Introducción El crecimiento de la población y el desarrollo industrial de la Ciudad de Bogotá han generado focos de contaminación en la mayor parte de los cuerpos de agua superficial durante la última década debido al incremento en la demanda del recurso hídrico y vertimientos de aguas residuales. Solo en las cabeceras de los ríos escapan de esta grave situación. Este modelo general de contaminación puede ejemplificarse tomando el eje del rio Tunjuelito, donde la DBO 5 alcanza valores medios cercanos a 68 (mg O2/L), DQO total de 207 (mg O2/L), Oxígeno Disuelto de 2.01 (mg O2/L), concentraciones de Nitrógeno Total de 20.84 (mg N/L), y conductividades del orden de 402 μS/cm, con sólidos suspendidos totales de 294 (mg SST.L- 1), los coliformes totales suben a 468 millones en promedio, con picos de hasta 24000 millones (NMP.100 m/L) en la desembocadura al Río Bogotá, donde hay una importante industria de curtimbres, los caudales oscilan de 2.80 a 6.80 en promedio. Para prevenir esta tendencia no deseada, el control de la contaminación del agua se ha convertido en una herramienta muy importante para mantener la sostenibilidad del recurso hídrico. Los parámetros de contaminación de los ríos exhiben diferentes propiedades (Wu et al, 2009;.. Sahoo et al, 2006). En general, la contaminación orgánica en un sistema acuático se mide y se expresa en términos de la demanda bioquímica de oxígeno (DBO) y reducción del nivel de oxígeno disuelto (OD). La DBO mide una cantidad aproximada de bio-degradables de materia orgánica presente en el agua y es un parámetro muy importante para el desarrollo de estrategias de manejo para la protección de los recursos hídricos; Los altos valores de DBO causan una concentración baja de OD (oxígeno disuelto) y condiciones inadecuadas de vida para la flora y la fauna en el río (Dogan y col., 2009). Al mismo tiempo, DBO-DO son las relaciones de intercambio con el lecho del río y la

Transcript of Perceptions of Quality of Reproductive Care Services in Bolivia: Use of Photo Prompts and Surveys as...

Aplicación de modelos de redes neuronales

artificiales en la predicción de índices de calidad de

agua en el Río Tunjuelito – Bogotá D.C.

John Chavarro1, Wilson Patiño

1

1. Clase de Seminario II, Maestría en Hidrosistemas, Facultad de Ingeniería Pontificia Universidad Javeriana, Bogotá

B.C.

[email protected] [email protected]

Resumen: En la búsqueda de la gestión óptima del abastecimiento de agua y la recuperación ambiental de

cuerpos de agua superficiales han aumentado la necesidad de nuevas técnicas de modelación que puedan

proporcionar una representación confiable, eficiente y precisa de la dinámica no lineal de la calidad del agua

en los sistemas de distribución de agua. Dado que las redes neuronales artificiales (RNA) han sido

ampliamente aplicadas a la aproximación de funciones de transferencia no lineal, en este trabajo se presenta

un desarrollo de redes de perceptrón multicapa para estimar los índices de calidad del agua (DBO, OD) en el

Río Tunjuelito localizado al costado suroccidental de la Ciudad de Bogotá. En este articulo, se utilizo la

información y datos de la calidad del agua en el Río Tunjuelito que incluye cinco parámetros quincenales

registrados en un periodo de dos años en cada una de las diez estaciones de monitoreo, para el cálculo de la

demanda biológica de oxígeno (DBO) y de oxígeno disuelto (OD) como índices que afectan a la calidad del

agua. Para la etapa de entrenamiento de las RNA se tomaron un conjunto de datos seleccionados

aleatoriamente, los cuales representan el 80% de la base de datos original, para las etapas de validación y

comprobación se utilizaron de la misma manera el 10% para cada etapa. El desempeño del modelo fue

evaluado por criterios estadísticos que incluyen el coeficiente de correlación (r), raíz del error cuadrático

medio (RMSE) y el error medio absoluto (MAE). En la estructura óptima del coeficiente de correlación para

la etapa de entrenamiento de la red neural para la DBO y OD son 0.964 y 0.933 respectivamente, también la

raíz del error cuadrado medio son 30.94 y 1.43, respectivamente. Los resultados muestran un gran potencial

de la RNA para simular las variables de calidad del agua.

Palabras clave: Redes Neuronales Artificiales; Predicción; Índice de Calidad del Agua, DBO.

1. Introducción

El crecimiento de la población y el desarrollo

industrial de la Ciudad de Bogotá han generado

focos de contaminación en la mayor parte de los

cuerpos de agua superficial durante la última

década debido al incremento en la demanda del

recurso hídrico y vertimientos de aguas residuales.

Solo en las cabeceras de los ríos escapan de esta

grave situación. Este modelo general de

contaminación puede ejemplificarse tomando el eje

del rio Tunjuelito, donde la DBO5 alcanza valores

medios cercanos a 68 (mg O2/L), DQO total de 207

(mg O2/L), Oxígeno Disuelto de 2.01 (mg O2/L),

concentraciones de Nitrógeno Total de 20.84 (mg

N/L), y conductividades del orden de 402 µS/cm,

con sólidos suspendidos totales de 294 (mg SST.L-

1), los coliformes totales suben a 468 millones en

promedio, con picos de hasta 24000 millones

(NMP.100 m/L) en la desembocadura al Río

Bogotá, donde hay una importante industria de

curtimbres, los caudales oscilan de 2.80 a 6.80 en

promedio. Para prevenir esta tendencia no deseada,

el control de la contaminación del agua se ha

convertido en una herramienta muy importante para

mantener la sostenibilidad del recurso hídrico. Los

parámetros de contaminación de los ríos exhiben

diferentes propiedades (Wu et al, 2009;.. Sahoo et

al, 2006). En general, la contaminación orgánica en

un sistema acuático se mide y se expresa en

términos de la demanda bioquímica de oxígeno

(DBO) y reducción del nivel de oxígeno disuelto

(OD). La DBO mide una cantidad aproximada de

bio-degradables de materia orgánica presente en el

agua y es un parámetro muy importante para el

desarrollo de estrategias de manejo para la

protección de los recursos hídricos; Los altos

valores de DBO causan una concentración baja de

OD (oxígeno disuelto) y condiciones inadecuadas

de vida para la flora y la fauna en el río (Dogan y

col., 2009). Al mismo tiempo, DBO-DO son las

relaciones de intercambio con el lecho del río y la

nitrificación y desnitrificación (Sengorur et al,

2006. Singh et al, 2009.). Sin embrago, los métodos

actualmente disponibles para la determinación

simultanea de la DBO-DO son muy tediosos y

propensos a errores de medición, además de

costosos y demandan mucho tiempo de cálculo. Por

lo tanto surge un método que permite su

establecimiento teniendo en cuenta algunos

geoindicadores medidos directamente en campo,

utilizando las ANN como un enfoque adecuado

para la modelización de la calidad del agua (Chen

et al, 2003;. Jan-Tai et al, 2006).

El objetivo principal del presente trabajo es

construir una red neuronal artificial (ANN) a partir

de los índices de calidad del agua del río Tunjuelito

caracterizado en un periodo de 2 años, (OD, DBO)

y demostrar su aplicación a la predicción de datos

complejos de calidad del agua como en la mejora

continua de interpretación y generación de

resultados en el menor tiempo posible.

2. Materiales y Métodos

2.1. Área de estudio y datos de calidad del agua

El Río Tunjuelito se encuentra localizado al

costado suroccidental de la Ciudad de Bogotá, está

afectado por la minería exhaustiva de su lecho

fluvial y vertimientos de aguas residuales en zonas

residenciales e industrias de curtiembres

principalmente. Se utilizaron los datos de calidad

del agua de 10 estaciones situadas desde el Embalse

la Regadera hasta la desembocadura al rio Bogotá

(Estación Isla Pontón) en una longitud de

aproximadamente 5.0 Km. De acuerdo con la

Figura 1, promedios de los datos de calidad de

aguas superficiales en el Río Tunjuelito, registrados

en el periodo comprendido entre el 02 de diciembre

de 2009 hasta el 09 de diciembre de 2011, se

observan incrementos en las concentraciones de

todos los parámetros en las estaciones Doña Juana,

San Benito y Transversal 86, los cuales pueden ser

originados por la quebrada Yomasa y por el

vertimiento del aliviadero de la planta de

tratamiento de lixiviados del relleno sanitario; por

la actividad extractiva e industrial de la zona, así

como por el reciclaje de escombros; y por la

descarga sobre el río Tunjuelo en inmediaciones del

Cementerio del Apogeo, respectivamente. Las

ubicaciones de estas estaciones se ilustran en la

Figura 2.

Figura 1. Localización de las estaciones de monitoreo en el río Tunjuelito.

2.2. Modelo de redes neuronales artificiales

RNA

En este trabajo, se aplicó un algoritmo de redes

neuronales artificiales para estimar los índices de

calidad de agua de Demanda Bioquímica de

Oxígeno (DBO) y Oxigeno Disuelto (OD) en

corrientes superficiales. Los modelos de RNA son

funciones-aproximadoras altamente flexibles que

han demostrado su utilidad en una amplia gama de

aplicaciones del recurso hídrico. Muchos estudios

han demostrado que las redes neuronales se

desempeñan mejor que muchos de los métodos de

modelación clásicos (Zhang et al, 2002). Las RNA

representan una tecnología inteligente muy

importante que utiliza el conocimiento

experimental para razonar y resolver problemas

específicos de manera análoga al funcionamiento

del cerebro humano, el conocimiento es obtenido

por la RNA a través de un proceso de aprendizaje y

las conexiones interneuronales conocidas como

pesos sinápticos son utilizadas para almacenar

dicho conocimiento.

Figura 2. Concentraciones de DQO, DBO5, Nitrógeno Total, Conductividad y Oxigeno Disuelto en el río

Tunjuelo.

Un algoritmo de RNA puede llegar al resultado en

condición de escasez de datos con la ayuda de la

información actual, aceptar la entrada continua de

datos, entrenarse y recordar. La mayor ventaja de

una red neuronal es su habilidad para relacionar

modelos complejos no-lineales sin suposiciones a

priori de la naturaleza de la relación. El modelo

RNA realiza un mapeo funcional no-lineal a partir

de las observaciones pasadas (Xt-1, Xt-2... Xt-p) para

encontrar un valor futuro Xt, i.e (Durdu, 2009).

Una RNA se compone de tres capas: la de entrada,

la oculta y la de salida. Entre las capas se

encuentran las ligas de conexión con los pesos

respectivos (Figura 3).

Figura 3. Ejemplo de la topología de una RNA.

Las RNAs operan sobre la base de reconocimiento

de patrones que pueden adquirir, almacenar y

utilizar a partir de ejemplos. Esto hace que no se

programe directamente sino a partir del ajuste de

parámetros por medio de un algoritmo de

aprendizaje. Los algoritmos en aprendizaje

automático pueden ser clasificados en dos

categorías: supervisados y no supervisados. Si la

red utiliza un tipo de aprendizaje supervisado se

deben proporcionar parejas de patrones entrada-

salida y la RNA aprende a asociarlos. Esto

equivale a modelos estadísticos como: técnicas de

regresión, análisis discriminante, modelos de

series temporales, etc. Si el entrenamiento no es

supervisado, se le suministran a la red datos de

entrada para que extraiga los rasgos característicos

esenciales. (Obregón, 2006).

Si en una RNA se tienen n neuronas, ordenadas

arbitrariamente y se puede designar la j-ésima

neurona como Nj. Su trabajo es simple y único,

consiste en recibir las entradas de las células

vecinas y calcular un valor de salida, el cual es

enviado a todas las células restantes (Figura 4).

Las conexiones que unen a las neuronas de una

RNA tienen asociado un peso, que es el que hace

que la red adquiera un conocimiento.

Considerando i y como el valor de salida de la

neurona i en un instante dado, dicha señal es

transmitida desde la neurona i a la j pero dicha

señal es modificada por el valor del peso de la

conexión entre las neuronas en cuestión. La

nomenclatura para el peso sináptico entre la

neurona j y la neurona i es Wji. El primer subíndice j indica la neurona o unidad hacia dónde

va la conexión. El segundo subíndice i indica la

neurona o unidad desde donde proviene la

conexión.

0

1

2

3

4

5

6

0

100

200

300

400

500

600

700

800

900

1 2 3 4 5 6 7 8 9 10

Co

nce

ntr

acio

n O

D (

mgO

2/l

)

Co

nce

ntr

ació

n D

BO

5, D

QO

, NTK

, (m

g/l)

C

on

du

ctiv

idad

S.cm

-1]

DBO5 Total[mg O2/L]

DQO Total[mg O2/L]

Nitrógeno Total Kjeldahl [NTK][mg N/L]

Conductividad[µS/cm]

Oxígeno Disuelto [OD Winkler][mg O2/L]

Figura 4. Esquema de una Neurona Artificial con

sus principales elementos.

Una neurona o unidad de procesamiento se ve

afectada por las salidas de las neuronas con las

cuales ella está conectada. El efecto total de las

salidas de estas neuronas reflejado en la unidad de

procesamiento que se esté analizando se conoce

como S, que se puede ver como suma de los

efectos de las salidas a las cuales ella está

conectada.

𝑆𝑗 = 𝑊𝑗𝑖𝑌𝑖𝑛𝑖=1 (1)

Entre las unidades o neuronas que forman una red

neuronal artificial existe un conjunto de

conexiones que las unen. Cada unidad transmite

señales a aquellas que están conectadas a su

salida. Asociada con cada j Neurona hay una

función de activación que transforma la entrada

neta que la unidad presenta como resultado de

estar conectada con otras unidades que le

suministran información, en el valor de salida yi.

Para este trabajo se utilizo una función de

activación Sigmoidal.

𝜎 𝑆 = 1

1+𝑒−𝑠 (2)

2.2.1. Retro-propagación de Redes Neuronales,

algoritmo de aprendizaje

La propagación hacia atrás (BP) es un algoritmo

de uso común de aprendizaje en la aplicación de

RNA (Ying et al, 2007). El algoritmo consiste en

minimizar un error (comúnmente cuadrático) por

medio de descenso de gradiente, por lo que la

parte esencial del algoritmo es cálculo de las

derivadas parciales de dicho error con respecto a

los parámetros de la red neuronal (Rumelhart et al.

1986), este se usó para entrenar la red neuronal en

este trabajo. El error medio cuadrático en las

muestras de entrenamiento es una función

objetivo típico que se reduce el error al mínimo.

Este algoritmo de entrenamiento es una técnica

que ayuda a distribuir el error con el fin de llegar a

un mejor ajuste o un error mínimo. Después de

que la información ha pasado a través de la red en

una dirección hacia adelante y la red ha predicho

una salida, el algoritmo de retropropagación

redistribuye los errores asociados con esta nueva

salida a través del modelo, y en consecuencia los

pesos se ajustan. La minimización del error se

logra a través de varias iteraciones. Después de

completar el entrenamiento, el desempeño de la

RNA se valida. Dependiendo del resultado la

RNA puede ser implementada para su uso

previsto.

2.2.2. Variables de entrada y procesamiento de

los datos

En cada estación de muestreo del río Tunjuelito, se

han medido 34 diferentes parámetros de calidad de

agua llevados a cabo en periodos de horas, días y

semanas, sin embargo, para este trabajo se

utilizaron los parámetros que tienen mayor índice

de correlación respecto a los valores de DBO5 y

OD, los cuales son importantes en la evaluación

de la calidad del agua; los parámetros

seleccionados cuentan con registros completos en

el periodo analizado. Después del análisis

correlativo, se seleccionaron en total 5 variables,

incluyendo el pH, conductividad eléctrica,

temperatura, nitrógenos totales y caudal medio,

que influyen en la afectación de la calidad del

agua (OD y DBO ) a cierto grado (Tabla 1).

En este trabajo, antes de la conformación de la

red, se normalizaron las variables de entrada en el

rango [-3,-3] y las variables de salida en el rango

[0.05, 0.95] de la siguiente manera:

𝑋∗ = 6 𝑥−𝑥𝑚𝑖𝑛

𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 − 3 (3)

𝐷∗ = 0.9 𝑑−𝑑𝑚𝑖𝑛

𝑑𝑚𝑎𝑥 −𝑑𝑚𝑖𝑛 + 0.05 (4)

X* y D* son los valores normalizados de un

determinado parámetro de entrada y salida

respectivamente, x y d son los valores medidos

para estos parámetros, xmin, xmax, dmin y dmax son

los valores mínimo y máximo en la base de datos

para estos parámetros de entrada y salida

respectivamente (Dogan et al, 2009).

Tabla 1. Parámetros medidos en campo y su

relación con los índices de calidad DBO5 y OD.

Parámetro Unidad

Índice de

correlación

con DBO5

Índice de

correlación

con OD

Nitrógeno Total

Kjeldahl [NTK]

[mg

N/L] 0.893 -0.517

Conductividad

[µS/cm] 0.867 -0.563

Temp. [°C] 0.515 -0.471

pH [Unid] 0.367 -0.275

Caudal [L/s] -0.001 -0.162

Posteriormente, se construyeron dos diferentes

modelos de RNA para el cálculo de la OD y DBO

por separado y un tercer modelo de RNA para

calcular OD y DBO en conjunto. Las redes se

formaron con conjuntos de entrenamiento

aleatorios en un 80%, luego se validó con

conjuntos de datos aleatorios en un 10% y se

comprobó con conjuntos de datos aleatorios en un

10%. Para la conformación de las RNAs se

construyeron perceptrónes multicapa formados

por tres capas, una de entrada, una oculta y la de

salida, esto permite resolver problemas que no son

linealmente separables.

2.3. Criterios de Desempeño

Un modelo entrenado en el conjunto datos de

entrenamiento se puede evaluar mediante la

comparación de sus predicciones y los valores

medidos en el conjunto de datos de prueba de

mayor ajuste. Estos valores se calibran de forma

sistemática ajustando varios parámetros del

modelo. Para la evaluación de los modelos de

RNAs desarrollados se adoptó una propuesta

multi-criterio, en que se evaluó el rendimiento de

los modelos usando varios errores estadísticos y

medidas de bondad del ajuste, incluyendo la raíz

del error cuadrado medio (RMSE), el error medio

absoluto (MAE), el coeficiente de correlación (r).

Para la comparación visual de los valores

observados y simulados se usaron diagramas de

dispersión.

𝑅𝑀𝑆𝐸 = 1

𝑛 𝑃𝑖 − 𝑂𝑖

2𝑛𝑖=1 (5)

𝑀𝐴𝐸 = 1

𝑛 𝑃𝑖 −𝑂𝑖

2𝑛𝑖=1 (6)

𝑟 = 1 − 𝑃𝑖−𝑂𝑖

2𝑛𝑖=1

𝑂𝑖2𝑛

𝑖=1 − 𝑃𝑖

2𝑛𝑖=1

𝑛

(7)

Donde Pi y Oi son los valores pronosticados y

observados, respectivamente. Y n es el número

total de observaciones.

3. Resultados

Diferentes modelos de redes fueron construidos y

probados a fin de determinar el número óptimo de

neuronas en la capa oculta bajo la misma función

de transferencia (logística). La selección del

número adecuado de neuronas en la capa oculta es

un tema de gran relevancia en la construcción de la

RNA, ya que un número mayor de neuronas puede

resultar en un sobreentrenamiento, mientras que un

número menor puede o no capturar la esencia del

proceso. Luego, se construyeron 3 modelos para el

cálculo de la OD y DBO5, un modelo para cada

parámetro de calidad, y otro modelo para el cálculo

de los dos indicadores en simultánea. La red se

construyó con el conjunto de datos generales

(patrones) con la caja de herramientas de Matlab

para RNA. Dicho conjunto de datos fue

fraccionado para formar el conjunto de datos de

entrenamiento (80%), validación (10%) y prueba

(10%), los cuales son seleccionados por el software

de manera aleatoria. El tamaño óptimo de la red fue

seleccionado en función del mínimo error medio

absoluto (MAE), mayor coeficiente de correlación

(r) y factor de compresión (Fc) entre 3 y 16 en

magnitud (Figura 5). Las características de los

modelos seleccionados se presentan en la Tabla 2.

La RNA seleccionada para el modelo de DBO5 se

compone de una capa de entrada con 5 variables,

una capa oculta con 12 neuronas y una capa de

salida con la variable objetivo, mientras que, para el

modelo de RNA de OD la diferencia radica en el

número de neuronas en la capa oculta, ya que el

número óptimo se encontró en 8 neuronas. Para el

modelo combinado DBO5-OD, la estructura la

componen 5 variables de entrada, 11 neuronas en la

capa oculta y una capa de salida con las dos

variables objetivo. Los modelos construidos

(DBO5, OD y DBO5-OD) fueron entrenados

utilizando el algoritmo de propagación hacia atrás

(Levenberg-Marquardtbackpropagation).

Los valores del coeficiente de correlacion (r),

RMSE y MAE calculados el conjunto de datos de

entrenamiento, validación y prueba en todos los

modelos se presentan en la Tabla 2. La Figura 6

muestra los valores observados y calculados por el

modelo de OD para el conjunto de datos general

(entrenamiento, validación y prueba). La estructura

de modelo seleccionada (5 variables de entrada –

12 neuronas en la capa oculta -1 neurona en la capa

de salida) proporcionó el mejor ajuste para los 3

conjuntos de datos. El coeficiente de correlación (r)

para los datos de entrenamiento, validación y

prueba fueron 0.933, 0.921, 0.772 respectivamente.

Igualmente, RMSE y MAE, para los 3 conjuntos de

datos, son 1.43, 1.42, 1.22, 1.15, 1.20 y 1.05

respectivamente (Tabla 2). En la figura xxxx, se

puede apreciar el cerrado seguimiento de los

valores calculados de las concentraciones de OD en

el rio Tunjuelo contra los observados. Las métricas

de desempeño del modelo de OD sugieren un buen

ajuste del modelo para el conjunto de datos

utilizado.

Figura 5. Selección delnúmeroóptimo de neuronas en la capa

oculta para el modelo de RNA para DBO5, OD y ambos en función de las métricas de desempeño y el factor de compresión.

4. Conclusiones

En el caso de la DBO5, la RNA seleccionada (5 – 8

-1) proporcionó el mejor ajuste para el conjunto de

datos de entrenamiento, validación y prueba. La

Figura 7 muestra el ajuste del modelo entre el

conjunto de datos de los valores medidos y el

conjunto de datos calculados (entrenamiento,

validación y prueba). Los valores del coeficiente de

correlación (r), para el conjunto de datos de

entrenamiento, validación y prueba son 0.964,

0.965 y 0.929 respectivamente. De la misma

manera, RMSE y MAE para los conjunto de datos

son 30.94, 29.44, 30.39, 21.71, 21.82 y 24.12

respectivamente para el conjunto de datos de

entrenamiento, validación y prueba (Tabla 2). Los

valores de r, RMSE y MAE sugieren un buen ajuste

del modelo seleccionado de DBO5 para el conjunto

de datos analizados.

Para el modelo de RNA con salidas OD y DBO5, si

bien los valores de r, RMSE y MAE (Tabla 2)

indican un buen ajuste del modelo, los mismos

valores para los modelos independientes OD y

DBO5 sugieren un mejor desempeño que el modelo

combinado.

En la Figura 8, las predicciones de OD, DBO5 y

OD-DBO5 de las redes neuronales entrenadas con

propagación hacia aras con arquitecturas 5-8-1, 5–

12-1 y 5–11-1 (neuronas capa de entrada, capa

oculta y capa de salida) son comparadas con los

valores medidos de OD y DBO5. Las figuras

revelan que existe una gran correlación entre

valores simulados y los observados. Los valores de

los coeficientes de correlación para los modelos de

RNA para OD, DBO5 y OD - DBO5 son 0.915,

0.96 y 0.942 respectivamente, los cuales son

considerados satisfactorios en modelos similares.

Estos resultados indican que el modelo de red

neuronal es capaz de reconocer el patrón de los

parámetros de calidad del agua para proporcionar

buenas predicciones de las variaciones diarias de

los datos de calidad del agua (DBO5 y OD) del río

Tunjuelo.

Los resultados indican claramente el buen

desempeño de la red neuronal. Esto es de esperarse

debido a la naturaleza no lineal de las funciones de

transferencia entre las características de calidad de

agua tales como DBO5 y OD, y otros parámetros

de calidad (Banejad et al., 2011).

El presente estudio muestra que redes óptimas son

capaces de captar tendencias a largo plazo

observados en las variables de calidad de aguas

0.86

0.88

0.90

0.92

0.94

0.96

0.98

0.000

0.002

0.004

0.006

0.008

0.010

3 4 5 6 7 8 9 10 11 12 13 14 15

r

[mg

O2

.L-1

]

DBO5

0.83

0.84

0.85

0.86

0.87

0.88

0.89

0.90

0.91

0.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

2 3 4 5 6 7 8 9 10 11 12 13 14 15

r

[mg

O2

.L-1

]

Oxigeno Disuelto

0.82

0.84

0.86

0.88

0.90

0.92

0.94

0.96

0.000

0.005

0.010

0.015

0.020

0.025

3 4 5 6 7 8 9 10 11

r

[mg

O2

.L-1

]

Número de Neuronas Capa Oculta

OD - DBO5

MSE r

(OD y DBO5), tanto en el tiempo como en el

espacio. Los resultados indican que las redes

neuronales son una herramienta eficaz para el

cálculo de los índices de calidad del agua (OD y

DBO5) que también se podrían utilizar para mejorar

la comprensión de los comportamientos de

contaminación en los ríos. Así, las RNA pueden ser

vistas como una valiosa alternativa a las técnicas de

modelación tradicionales.

Figura 6. Comparación del modelo y los niveles de DBO5 en el

rio Tunjuelo (a) entrenamiento, (b) validación y (c) prueba

usando el modelo DBO5-RNA.

Figura 7. Comparación del modelo y los niveles de OD en el rio

Tunjuelo (a) entrenamiento, (b) validación y (c) prueba usando el

modelo OD-RNA.

Tabla 2. Métricas de desempeño para los modelos de red neuronal artificial para el cálculo de OD y DBO5 en las aguas del rio Tunjuelo (Bogotá, Colombia).

Modelo Estructura RNA Conjunto de datos RMSE (mg/l)

MAE (mg/l)

r

DBO5 5 - 8 - 1

Entrenamiento 30.94 21.71 0.964

Validación 29.44 21.82 0.965

Prueba 30.39 24.12 0.929

OD 5 - 12 - 1

Entrenamiento 1.43 1.15 0.933

Validación 1.47 1.20 0.921

Prueba 1.22 1.05 0.772

BBO5 - OD 5 - 11 - 2

DBO5

Entrenamiento 41.94 33.28 0.930

Validación 37.14 32.84 0.950

Prueba 40.53 31.24 0.981

OD

Entrenamiento 1.63 1.32 0.848

Validación 1.18 1.04 0.929

Prueba 1.48 1.16 0.871

Figura 8.. Correlación de los datos observados versus las

predicciones de DBO5 para losconjuntos de datos de entrenamiento (azul), validación (verde), prueba (rojo) y general

(negro) obtenidos usando DBO5-RNA.

Figura 9. Correlación de los datos observados versus las predicciones de OD para losconjuntos de datos de entrenamiento

(azul), validación (verde), prueba (rojo) y general (negro)

obtenidos usando OD-RNA.

Figura 10. Correlación de los datos observados versus las

predicciones de OD - DBO5 para losconjuntos de datos de

entrenamiento (azul), validación (verde), prueba (rojo) y general (negro) obtenidos usando OD - DBO5-RNA.

Convenio ALCALDÍA MAYOR DE BOGOTÁ

D.C. Departamento Técnico Administrativo

MEDIO AMBIENTE e INSTITUTO DE

HIDROLOGÍA, METEOROLOGÍA Y

ESTUDIOS AMBIENTALES, Calidad del

Recurso Hídrico de Bogotá D.C., 2004.

Convenio ALCALDÍA MAYOR DE BOGOTÁ

D.C. y Universidad de Los Andes, Calidad del

Recurso Hídrico de Bogotá D.C., 2009-2010.

Pérez Hernández Edmundo, La crisis del Agua en

Bogotá, 2007.

Pérez Preciado Alfonso, El problema del rio

Bogotá, 2009.