Calibraci´ on on de los par´ ametros ametros del modelo model o lluvi lluvia-e a-esco scorre rrent nt´ ´ıa GR4J GR4 J usando usa ndo algori alg oritmo tmoss gen´ gen´ etico eticoss Luis Luis A. Alfar Alfaro o Casas Casas Jos´ Jos´ e Herre Herrera ra Quis Quispe pe Juan Juan Carlos Carlos Guti Guti´ ´ errez e rrez Jorge L. Sua˜ na n a Cham Chamb bi Henr Henry y Gall Galleg egos os Velga elgara ra Universidad Nacional de San Agust´ Agust´ın - C´ atedra CONCYTEC, Arequipa - Per´ atedra u @gmail.com Resumen
El desarrollo desarr ollo de un u n m´etodo etodo eficiente y robusto rob usto para la estimaci´ estima ci´ on on de par´ ametros de modelos hidrol´ ametros ogicos ogicos es un tema cr´ cr´ıtico en una un a cuenca. cuen ca. Los Lo s algoritmos al goritmos gen´eticos, eticos, han demostrado d emostrado ser m´etodos etodos de optimizaci´ op timizaci´ on on muy eficaces. En consecuencia, consec uencia, en el presente estudio estu dio se utiliza un u n Algoritmo Gen´etico (GA) para optimizar opt imizar los valores de los par´ ametros ametros de calibraci´ on on del modelo m odelo lluvia-escorrent´ lluvia- escorrent´ıa ıa GR4J (Genie ( Genie Rural a 4 parametres par ametres Journalier) en dos sub-cuencas de la cuenca del r´ıo ıo Chili. Los datos de entrada utilizados fueron registros diarios de precipitaci´ on on y evapotranspiraci´ evapotranspiraci´ on, y el resultado es calibrado con los diarios de caudal observado. on, La funci´ on on objetivo utilizada, reduce al m´ınimo la desviaci´ on de error entre los resultados generados y los datos observados. Este modelamiento consta de dos etapas, en primer lugar la calibraci´ on on del modelo y en segundo lugar la validaci´ on on del modelo. modelo. Para Para la calibraci´ calibraci´ on del modelo, se utilizan datos de los on cinco primeros a˜ nos nos y la validaci´ on con datos del sexto a˜ on no. no. Los m´ etodos etodos para obtener el error fueron el coeficiente Nash-Sucliffe (NS) y Relative Volume Error (RVE). Los resultados de este estudio, muestran que los par´ ametros de los cinco primeros a˜ ametros nos, son muy similares a los par´ nos, ametros con los datos del sexto ametros a˜ no. En consecuencia, se puede concluir que el modelo GA tiene la capacidad para desempe˜ no. narse narse con eficiencia, si se aplica a la calibraci´on on de un modelo lluvia-escorrent´ lluvia- escorrent´ıa. ıa.
Lluvia-esc orrent´´ıa, Palabras clave: Lluvia-escorrent
1.
modelo m odelo GR4J, estudio de caudales, caud ales, algoritmo algori tmo gen´etico, etico, optimizaci´ optimiz aci´on on
Intr Introdu oducc cci´ i´ on on
El modelado de lluvia-escorrent´ lluvia-escorrent´ıa, por lo general, implica un an´ alisis alisi s estad esta d´ıstico, ıstico , para extender y predecir pred ecir datos futuros. Hay problemas para construir y calibrar un modelo de lluvia-escorrent´ lluvia-escorrent´ıa, ya que depende de las caracter´ısticas ıstica s f´ısicas ısicas de la cuenca de un r´ıo. Un modelo diario de lluvia-escorre lluvi a-escorrent nt´´ıa (usado en este estudio) estudio ) es el GR4J (Genie Rural a 4 parametres Journalier) que fue desarrollado por Perrin et al.[2] y ha demostrado ser un modelo robusto y eficiente. GR4J, se desarroll´o a partir de modelos anteriores como GR3J, propuesto originalmente por Edijatno [7] y luego mejorado con ´exito exito por p or Nascimento [11] y Edijatno [8]. La necesidad de un m´ etodo etodo de optimizaci´on on eficiente para encontrar los mejores valores de los par´ametametros del modelo es muy necesaria. necesaria. Muchos Muchos m´ etodos etodos tradiciona tradicionales, les, tales como la programaci programaci´´on on lineal (LP) y programaci´ on on din´amica amica (DP), se han utilizado para resolver estos problemas. Los GAs, est´an basados en la selecci´ on natural darwiniana, que combina el concepto de la supervivencia de los m´as on as fuertes y operadores gen´ gen´eticos eticos naturales naturales [5]. La forma forma de trabajar y su aplicaci´ aplicaci´on on est´an an bien documentadas por Goldberg [9] y Michaelwiez [10]. Una de las ventajas de los GAs es la identificaci´on on de alterativas casi optimas. En el campo de la hidrolog´ hidrolog´ıa, los GAs, son m´ etodos etodos de optimizaci´ on que se muestran potentes. Franchini y Galeati [3], on hacen un estudio comparativo de diversos esquemas de algoritmos gen´eticos eticos para la calibraci´on de modelos conceptuales de lluvia-escorrent´ lluvia-escorrent´ıa y concluyeron que los GAs son un m´ etodo etodo robusto, demostrando ser un instrumento v´alido alido para la optimizaci´on on de funciones objetivo complejas. Sharif et al. [4], utilizan GA en el desarrollo de los recursos h´ıdricos ıdricos y la compar´ o con la programaci´on on din´ amica, amica, que lleg´o a la conclusi´on on de que ambos resultados eran comparables. Los GAs, pueden ser configurados de muchas maneras, pero hasta ahora existe poca literatura sobre el tipo m´ as adecuado para la calibraci´on as on de un modelo lluvia-escorrent´ lluvia-escorrent´ıa. Este trabajo, pretende llenar este vac´ vac´ıo,
´ Figura 1: Ambito de la Cuenca del r´ıo Chili. mediante la aplicaci´on de un GA para calibrar el modelo lluvia-escorrent´ıa GR4J. El prop´osito de este trabajo ha sido presentar que los GAs pueden f´acilmente hacer frente a este tipo de problemas y presentarse como una herramienta robusta de optimizaci´on. Varios experimentos han sido dise˜nados para elegir los componentes adecuados del GA, incluyendo los m´ etodos de selecci´on como ruleta, torneo, estoc´astico y m´etodos de cruce como: Scattered, punto simple, punto doble. El ciclo de evoluci´on se repite hasta un criterio de finalizaci´on (ejecuciones computacionales), la variaci´on de individuos entre las diferentes generaciones o un valor de aptitud predefinido.
2.
´ Area de estudio
La cuenca del r´ıo Chili se encuentra ubicada al Sur del Per´u, b´ asicamente est´a ubicado en el departamento de Arequipa, con peque˜nos sectores de los departamentos de Cusco, Puno y Moquegua, como se muestra en la Figura 1.
2.1.
Subcuenca El Pa˜ ne
Ubicada al extremo norte del ´area en estudio, est´a sobre los 4 585 m.s.n.m. caracterizado por tener un clima h´ umedo (tropical). Tiene una extensi´on de 198 K m2 , una precipitaci´ on media diaria de 2.21 mm/d, la evapotranspiraci´ on promedio es de 4 mm/d y el caudal medio diario es de 2.66 m 3 /s [5]. Cuenta con una Estaci´on Climatol´ ogica y una Estaci´on Limnim´etrica, ambas denominadas El Pa˜ ne (ubicadas en el mismo reservorio).
2.2.
Subcuenca El Frayle
La Subcuenca del Fraile abarca desde el nacimiento de los r´ıos Yamanayo, Collpamayo, Paltimayo, Cancusane, Pasto Grande (entre otros r´ıos menores); hasta el r´ıo Blanco (que nace de la confluencia de los r´ıos ya mencionados) presentando un ´area de drenaje de 1041 Km 2 y finaliza en el embalse El Fraile ubicado sobre el r´ıo Blanco a una altitud media de 4000 m.s.n.m., regulando los recursos h´ıdricos. Cuenta con una Estaci´on Climatol´ ogica y una Estaci´on Limnim´ etrica, ambas denominadas El Frayle (ubicadas en el mismo reservorio). Teniendo una precipitaci´on media anual de 386 mm, un caudal medio anual de 3.32 m 3 /s [5].
3.
Descripci´ o n del modelo GR4J
GR4J es un modelo lluvia-escorrent´ıa que se basa en cuatro par´ametros libres de datos de precipitaci´on diaria. El modelo GR4J es la ultimaversi´on modificada del modelo GR3J, propuesto originalmente por Edijatno [7] y luego sucesivamente mejorado por Nascimento [11] y Edijatno [8].
Figura 2: Descripci´ on del modelo lluvia-escorrent´ıa GR4J. x1 : Capacidad m´axima de tanque de producci´on (mm). x2 : Coeficiente de intercambio de aguas subterr´aneas (mm). x3 : Capacidad m´axima de tanque de enrutamiento (mm). x4 : Odenada de la hora pico del hidrograma unitario UH1 ( dia). En el estudio desarrollado por Perrin et al. [2], el modelo GR4J ofrece mejores resultados que otros modelos lluvia-escorrent´ıa. En este estudio, Perrin et al. [2] uso 429 cuencas hidrograficas con diferentes climas. La descripci´on de los procesos f´ısicos de lluvia a escurrimiento del modelo GR4J,se da de la siguiente manera. El tanque de producci´on (x1 ), es el almacenamiento superficial del suelo, que puede almacenar las lluvias. En este tamque, se producen evapotranspiraci´on y percolaci´on. la capacidad de este tanque, depende del tipo de suelo de la cuenca hidrogr´afica. Poca porosidad del suelo puede permitir mayor almacenamiento en el tanque de producci´on. Coeficiente de intercambio de aguas subterr´aneas (x2 ), es una funci´on de interccambio de aguas subterraneas que influyen en el tanque de enrutamiento. Cuando tiene un valor negativo, el agua ingresa a un acu´ıfero profundo; cuando elvalor es positivo, entonces el agua sale del acu´ıfero al exterior(tanque de enrutamiento). Tanque de enrutamiento (x3 ),es el aumento de agua que puede ser almacenado en el suelo poroso. El valor del tamque de enrutamiento depende del tipo y humedad del suelo. Tiempo pico ( x4 ), es el tiempo donde se forma el pico en la ordenada del hidrograma unitario del modelo GR4J. La ordenadade este hidrograma escreado a partir de la escorrent´ıa, donde el 90 % del caudal, es un flujo lento que se infiltra en el suelo y el 10 % del caudal, es un flujo r´apido que fluye sobre la superficie del suelo (ver Figura 2).
4. 4.1.
Modelo de desarrollo Datos de entrada
Para calibrar el modelo, se utiliz´o registros hist´oricos pertenecientes a: precipitaci´on, evaporaci´on y caudal observado de 5 a˜nos. En la Figura 3, se muestra la precipitaci´on utilizada en el estudio.
4.2.
Algoritmo Gen´ etico
Para el proceso de optimizaci´on se realiz´o la construcci´on un algoritmo gen´etico combinado con el m´etodo de Gauss-Newton, el esquema se puede ver en la Figura 4, con un cromosona de seis elementos, referidos a los par´ ametros de calibraci´on.
Figura 3: Datos de precipitasi´ on. a) Datos de precipitasi´on, subcuenca Pa˜ ne b) Datos de precipitasi´on, subcuenca Frayle
Figura 4: Estructura del algoritmo gen´etico empleado para la optimizaci´on
4.3.
Funci´ on objetivo
La principal consideraci´ on para la optimizaci´on de la funci´on objetivo, es maximizar el coeficiente NashSutcliffe (NS), que se utiliza para calcular el cambio entre la sumatoria de los cuadrados de los datos observados menos los generados por el modelo. La ecuaci´on general del coeficiente Nash-Sutcliffe se expresa como:
E (Q) = 100 ∗
Q ¯ Q
2
i
−
i
−
ˆ Q Q i
2
(1)
i
Donde: Qi : es el caudal observado en el d´ıa i. ˆ i : es el caudal generado en el d´ıa i. Q ¯ i : es el promedio del caudal observado en el d´ıa i. Q La funci´on de aptitud del GA, esta sujeta a los siguientes l´ımites y restricciones: 1 < x1 < 2000, −50 < x2 < 50, 1 < x3 < 400, 0 < x4 < 99,
x1 x2 x3 x4
R ∈ R ∈ R ∈ R ∈
(2) (3) (4) (5)
Adicionalmente,se utiliz´ o el metodo Relative Volume Error (RVE), que se utiliza para calcular el volumen de los datos observados con los datos resultantes del modelo [6]. La ecuaci´on general del error de volumen
Figura 5: Valores de aptitud para diferentes tama˜ nos de poblaci´on. a)Sub-cuenca Pa˜ne b)Sub-cuenca Frayle relativo esta dada como:
Q Qˆ (Q ) RV E = i
−
i
(6)
i
5.
Modelo de aplicaci´ on y discuci´ on
Para aplicar el modelo de GA desarrollado, se ha utilizado registros diarios de : precipitaci´ on, evaporaci´on y caudales observados de 5 a˜nos, del 2003 al 2007. Luego de obtener los valores de los par´ametros, el modelo ha sido validado con registros del a˜no 2008. En este modelo, el valor de calibraci´on para el coeficiente NashSutcliffe (NS) debe ser cien y el valor del metodo Relative Volume Error (RVE) debe ser cero. En un GA, uno de los par´ametros m´as importantes es el tama˜no de la poblaci´on. En aplicaciones de recursos h´ıdricos este valor esta entre 64 y 300 y hasta 1000 individuos [1]. Una gran poblaci´on ayuda a tener una mayor diversidad, pero involucra un considedarble costo computacional. A fin de encotrar un tama˜no optimo de poblaci´on, en este estudio, se consideraron diferentes tama˜nos de poblaci´ on. La busqueda inicial se realiz´ o con una probabilidad de cruce de 0.8 y un tama˜nos de poblaci´on de 50 individuos, incrementando la poblaci´on en 15 individuos en cada caso, alcanzando una poblaci´on de 305. El resultado del sistema para la sub-cuenca Pa˜ ne inicialmente fue 79.269 %, siendo incrementado hasta 83.436% y para la sub-cuenca Frayle 42.436 % a 55.9 %. La Figura 5, muestra como la funci´ on objetivo se reduce resultando un rendimiento mejorado del sistema. El rendimiento del sistema mejora significativamente cuando el tama˜no de la poblaci´on aumenta hasta un numero determinado. Luego, con el aumento de la poblaci´on, el sistema produce mejores resultados, no hay una mejora significativa. Ese punto importante en este trabajo se produce con 200 individuos, luego el rendimiento no mejora significativamente. El segundo par´ametro importante que influye en el rendimiento del GA, es la probabilidad de cruce, el m´etodo de cruce y el m´etodo de selecci´on. Su efecto sobre el rendimiento del sistema es estudiado mediante la variaci´ on de la probabilidad de cruce desde 0.6 a 0.9, con un incremento de 0.02 con m´ etodos de selecci´on como: ruleta, torneo, estoc´astico uniforme y m´etodos de cruce como: Punto simple, punto doble, dispersos; con una poblaci´on optima de 200 individuos. Los resultados, se muestran en la Figura 6, comparando la probabilidad de cruce con el rendimiento del sistema, se puede ver que el rendimiento del sistema mejora con el aumento de la probabilidad de cruce hasta 0.75. Despu´ es de este valor, el rendimiento del sistema no tiene mejoras significativas y hasta disminuye al aumentar la probabilidad de cruce. En la Figura 7, se muestra los resultados obtenidos por diferentes metodos de cruce. En las Figuras 8 y 9, se muestra la comparaci´on de los datos observados de caudales con los caudales generados por el modelo, usando los par´ametros que ofrecen el menor error. La Tabla 1, muestra la eficiencia del modelo mediante el coeficiente Nash-Sutcliffe, para la sub-cuenca Pa˜ne da un valor de 83.43%. Esto demuestra que los datos de calibraci´on y la validaci´on tienen patrones similares. El coeficiente Nash-Sutcliffe describe que los son los datos generados por el modelo en comparaci´on con los datos observados, son similares. Si el valor es cercano a 1 (100 %), los datos generados tienen un patr´on similar al desempe˜ no observado del sistema. Para la sub-cuenca el Frayle, el coeficiente de Nash-Sutcliffe da un valor
Figura 6: Valores de aptitud para diferentes probabilidades de cruce. a)Sub-cuenca Pa˜ ne b)Sub-cuenca Frayle
Figura 7: Valores de aptitud para diferentes probabilidades de cruce. a)Sub-cuenca Pa˜ ne b)Sub-cuenca Frayle
Figura 8: Series de caudales simulados y observados para la sub-cuenca Pa˜ne.
Figura 9: Series de caudales simulados y observados para la sub-cuenca Frayle
Error Nash (NS) RVE(Q)
Sub-cuenca Pa˜ ne 83,436 0.6760
Sub-cuenca Frayle 55.900 10.20
Tabla 1: Funciones de aptitud obtenidos por el GA. Par´ametros x1 x2 x3 x4
Sub-cuenca Pa˜ ne 2.77 0.00 4.67 0.00
Sub-cuenca Frayle 40.27 0.00 5.15 0.00
Tabla 2: Par´ ametros ´optimos obtenidos por el GA. de 55.90 % , que decribe que los datos generados por el modelo en comparaci´on con los datos observados, no son similares. Si el valor supera 0.5 (50%), el modelo tienen un desempe˜no superior a la media del caudal observado. El error obtenido en la sub-cuenca del Frayle, se puede atribuir a la poca representatividad de los registros usados para la calibraci´on del modelo, puesto que solo se cuenta con una estaci´on de medici´on para una cuenca con una ´area de 1041 km2 , motivo por el cual como trabajo futuro se plantea la utilizaci´on de algunos m´etodos como por ejemplo pol´ıgomos de Thiessen, que nos permita obtener series mas representativas para la calibraci´ on. En la Tabla 2, se pueden ver los valores ´optimos de los par´ametros para ambas sub-cuencas.
6.
Conclusiones
La aplicaci´ on de algoritmos gen´eticos es satisfactorio para el ajuste de par´ametros del modelo GR4J, generando una representaci´on significativa de las series diarias de caudales, especialmente la tendencia de ´estos y los caudales m´ınimos. Los criterios de eficiencia, est´an entre 50 y 100 % , esto demuestra el potencial del modelo para la calibraci´on de modelos hidrol´ogicos. En este estudio, se han encontrado valores cercanos a la soluci´ on ´optima en 100 generaciones, con una poblaci´on de 200 individuos. Una representaci´on de cadena real, la incorporaci´on del metodo de selecci´on uniforme estoc´astica y la forma de cruce dispersa, junto con una probabilidad de cruce de 0.75, dan los mejores resultados. El modelo GR4J, es facil de implementar, en comparaci´ on con otros modelos robustos, ya que es dificil tener el control total sobre todos los par´ametros y las variables. El uso de 4 par´ametros facilita su optimizaci´on mediante el uso de algoritmos gen´eticos. Se espera que una combinaci´on h´ıbrida con diferentes m´etodos de calibraci´on y optimizaci´on basados en metaheur´ısticas y m´etodos num´ericos puedan dar mejores resultados.
Referencias [1] R. S. Govindaraju A.R. Rao. Artificial Neural Networks in Hydrology (Water Science and Technology Library). Springer, 2000. [2] Charles Perrin Claude Michel Vazken Andreassian. Improvement of a parsimonious model for streamflow simulation. Journal of Hydrology , 279:275–289, 2003. [3] Marco Franchini Giorgio Galeati. Comparing several genetic algorithm schemes for the calibration of conceptual rainfall-runoff models. Hydrological Sciences Journal , 42:3:357–379, 1997. [4] Waleed ARM MSM Amin G Abdul Halim ARM Shariff W Aimrun. Calibrated radar-derived rainfall data for rainfallrunoff modeling. European Journal of Scientific Research , 30 (4):608–619, 2009.
[5] Autodema. Diagnostico de gestion de la oferta de agua de la cuenca quilca-chili. Technical report, Autodema, 2002. [6] M.J. Booij. Impact of climate change on river flooding assessed with different spatial model resolutions. Journal of Hydrology , 303(1-4):176–198, 2005. [7] C. Michel Edijatno. Un modele pluie-debit journalier a trois parameters. La Houille Blanche , pages 113–121, 1989. [8] C. Michel Edijatno. Gr3j: a daily watershed model with three free parameters. Journal of Hydrology , 44 (2):263 – 277, 1999. [9] David E. Goldberg. Genetic Algorithms in Search, Optimization, and Machine Learning . Addison-Wesley Professional, 1989. [10] Zbigniew Michalewicz. Genetic Algorithms + Data Structures = Evolution Program . Springer, 1996. [11] N. O. Nascimento. Appreciation a Laide Dun Modele Emirique Des Effets Daction Anthropiques Sur La Relation Pluie-Debit a Lechelle Du Bassin Versant . PhD thesis, CERGRENE/ENPC, Paris, France, 1995.