Métodos Estadísticos en Hidrología Facultad de Ingeniería – Escuela de Ingeniería Civil
Rio Burate en Tostos, julio 2008
mayo, 2013
Métodos Estadísticos en Hidrología
Los métodos estadísticos están basados en principios matemáticos que describen la variación aleatoria de un conjunto de observaciones de un proceso, y estos centran su atención en las observaciones mismas en lugar de los procesos físicos que la producen.
Los procesos hidrológicos evolucionan en espacio y tiempo de una forma que es parcialmente predecible, ó determinística, y parcialmente aleatoria. Un proceso de este tipo se conoce como Estocástico ó Aleatorio.
Métodos Estadísticos en Hidrología
Los métodos estadísticos están basados en principios matemáticos que describen la variación aleatoria de un conjunto de observaciones de un proceso, y estos centran su atención en las observaciones mismas en lugar de los procesos físicos que la producen.
Los procesos hidrológicos evolucionan en espacio y tiempo de una forma que es parcialmente predecible, ó determinística, y parcialmente aleatoria. Un proceso de este tipo se conoce como Estocástico ó Aleatorio.
Estadística Hidrológica Existen dos tipos de procesos estocásticos:
• No correlacionados en tiempo. Ejemplo: Serie de caudales promedios diarios, máximos anuales, del Río Caroní en Arekuna. El caudal máximo ocur oc urri rido do du dura rant nte e el añ año o 19 1993 93 es in inde depe pend ndie ient nte e de dell ca caud udal al má máxi ximo mo ocurrido durante el año anterior.
• Correlacionados en el tiempo. Ejemplo: El caudal del Río Orinoco en Ciudad Bolívar ocurrido durante el día de hoy tiene una alta dependencia con el caudal ocurrido durante el día de ayer. Este ti Este tipo po de de depe pend nden enci cia a ta tamb mbié ién n se pr produ oduce ce a niv nivel el es espa paci cial al,, po por r ejem ej empl plo, o, la las s to torm rmen enta tas s pr pres esen enta tan n un una a es estr truc uctu tura ra de co corr rrel elac ació ión n espacial que puede ser muy importante.
ANÁLISIS DE LAS SERIES HISTÓRICAS DE CAUDALES El caudal es un valor referido a un instante (m3 /s). En las series históricas de caudales se expresa como un valor medio, relativo a un determinado tiempo (día, mes, año, periodo de años):
•
•
•
•
•
Caudal medio diario: Valor promedio de los caudales instantáneos de cada día (para cada día). Caudal medio mensual: Valor promedio de los 30/31 caudales medios diarios (para cada mes). Caudal medio anual: Valores promedio de los 12 caudales medios mensuales (para cada año). Caudal mensual medio: Valor promedio de los caudales medios mensuales, para un periodo consecutivo de años. Caudal anual medio: Valor promedio de los caudales medios anuales, para un periodo consecutivo de años.
ANÁLISIS DE LAS SERIES HISTÓRICAS DE CAUDALES -
Caudal máximo instantáneo: Es el valor máximo de caudal registrado, que puede referirse a cada mes, o al año correspondiente. (Para su registro se necesitan mediciones continuas (limnígrafos))
-
Caudal máximo diario: Es el valor máximo de los caudales medios diarios, que puede referirse a cada mes, o al año correspondiente. (Se puede registrar con mediciones una por día (limnímetros)).
-
Caudales mínimos: Se refieren a los valores mínimos de caudales, instantáneo o diario, pudiendo referirse a valores mensuales o del año. ( A menudo estos caudales mínimos se refieren al valor medio de un número consecutivo de días)
Organización de los datos - Distribución de Frecuencias Es necesario hacer un ordenamiento de los datos hidrológicos recolectados para así obtener una mejor visualización de los mismos. Cuando se efectúa este sumario, los datos se distribuyen en clases, las cuales están definidas por un limite superior y uno inferior. Para formar una distribución de frecuencias se procede de la siguiente manera: 1.- Se determina el valor máximo y el mínimo, por lo tanto el rango de los datos 2.- Se divide el rango en un numero conveniente de intervalos de clase 3.- Se determina el numero de observaciones que ocurre dentro de cada intervalo, lo que constituye la frecuencia 4.- Para obtener la distribución relativa de frecuencias, la frecuencia de cada clase se divide por la frecuencia de todas las clases y se expresa como un porcentaje.
Funciones de Frecuencia Si las observaciones de una muestra están idénticamente distribuidas, estas se pueden ordenar en histogramas de frecuencias. Para su construcción se divide el rango de valores en intervalos ( x), seleccionando un delta pequeño, pero de forma tal, que cada intervalo contenga información.
Histogramas de Frecuencia Polígonos de frecuencia: Se obtiene uniendo los puntos medios de los topes de los rectángulos del histograma de frecuencias, resultando así un grafico de los puntos intermedios de las clases contra su frecuencia
Medidas de la tendencia central La medida de la tendencia central es un valor que trata de situarse en el punto medio de un conjunto ordenado de datos. Las principales medidas de la tendencia central son: 1.- La media aritmética
x
1 n
n
x
i
i 1
2.- La mediana de un conjunto de números ordenados según su magnitud, es el valor central, o la media aritmética de los dos valores centrales. Geométricamente, es el valor de la abscisa que corresponde a la vertical que divide al histograma en dos áreas iguales. 3.- El modo de un conjunto de valores es aquel que ocurre con mas frecuencia
Correlación y regresión con aplicaciones en Hidrologìa La correlacion y la regresión tienen diversas aplicaciones en hidrología, entre otras, la extensión de registros cortos, la estimación de datos faltantes, la regionalización de la información hidrológica y el diseño de redes hidrometeorologicas.
Correlacion La correlación se define como la asociación entre dos o más variables aleatorias, que explica solo parcialmente la variación total de una variable por la variación de otras variables aleatorias involucradas en la ecuación de asociación. La parte de la variación total que queda sin explicar, o sea, la variación no explicada, se debe a errores o a otras variables aleatorias que no han sido tomadas en cuenta en la correlación.
Interpretación El valor del índice de correlación varía en el intervalo [-1,1]: •
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa : cuando una de ellas aumenta, la otra también lo hace en proporción constante.
•
Si 0 < r < 1, existe una correlación positiva.
•
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
•
Si -1 < r < 0, existe una correlación negativa.
•
Si r = -1, existe una correlación negativa perfecta.
El índice indica una dependencia total entre las dos variables llamada relación inversa : cuando una de ellas aumenta, la otra disminuye en proporción constante.
Tratamiento probabilístico de los datos hidrológicos El comportamiento de una variable aleatoria X sólo se puede describir a través de una distribución de probabilidades. De esta manera se puede estimar la posibilidad que un valor de la variable se encuentre en un determinado rango. Notación: X mayúscula: variable aleatoria x minúscula: un determinado valor de la variable. P(X x) : Probabilidad que el valor de la variable X sea menor o igual a x. Ejemplo, X: Lluvia en Macagua durante el mes de mayo. x = 100 mm. P(X x) : Probabilidad que la precipitación mensual durante el mes de mayo, en Macagua, sea igual o menor a 100 mm. P(50 X 100): Probabilidad que la precipitación en el mes de mayo, en Macagua, se ubique entre 50 y 100 mm.
Tratamiento probabilístico de los datos hidrológicos P(t)
Muestra
t Pasado sin datos (?)
Pasado con datos
Hoy
Futuro (?)
Población El conjunto de observaciones x1, x2,….. xn; de una variable aleatoria X, se denomina muestra. Se supone que las muestras se toman de una población infinita, en el caso de variables hidroclimáticas, con propiedades ó parámetros invariables en el tiempo.
Tratamiento probabilístico de los datos hidrológicos El conjunto de todas las muestras posibles que pueden extraerse de una población se conoce como el espacio muestral. Un evento es un subconjunto del espacio muestral
Espacio Muestral Espacio Muestral del proceso de precipitación : [0, ) Espacio Muestral del lanzamiento de una moneda : Cara y Sello. Espacio Muestral del lanzamiento de un dado : 1, 2, 3, 4, 5 y 6. Evento: Es un subconjunto del espacio muestral. Ejemplos: • Que ocurra una lluvia < 30 mm • Que salga cara
• Que sea un número impar
Diagramas de VENN
∩ Intersección U Union
Definición de probabilidad de un evento La probabilidad de un evento A, P(A), es la posibilidad que este ocurra cuando se efectúa una observación de la variable aleatoria. Si se dispone de “n” observaciones ó datos de lluvias diarias en la estación Arekuna, cuenca del río Caroní, durante el mes de Mayo, de los cuales n A tienen valores iguales o menores a 40 mm (Evento A); entonces la P(A), se puede estimar utilizando la frecuencia relativa:
F r
nA n
Cuando n → , se tiene la estimación de P(A)
P ( A) lim
n
nA n
Principios de probabilidades de eventos
i) Probabilidad Total P ( A1 ) P ( A2 ) P ( Am ) P () 1
A1 A2
ii) Complementaridad
Am
P ( A ) 1 P ( A) iii) Probabilidad Condicional: Supongamos que tenemos dos eventos A y B. A∩B significa que A y B ocurran simultáneamente. Se define P(B/A): La probabilidad que ocurra B dado que A ya ocurrió. Independencia :
Ā
A
P ( B | A)
P ( A B) P ( A)
P ( A B) P ( A) P ( B)
Principios de probabilidades de eventos iii) Probabilidad Condicional: Supongamos que tenemos dos eventos A y B. A∩B significa que A y B ocurran simultáneamente. Se define P(B/A): La probabilidad que ocurra B dado que A ya ocurrió. Independencia :
P ( A B) P ( B | A) P ( A)
P ( A B) P ( A) P ( B)
Si la ocurrencia de B no depende de la ocurrencia de A se dice que los eventos son independientes El evento A podría ser que la precipitación de este año sea menor que 2500 mm y el evento B que la precipitación del próximo año sea menor que 2500 mm
Ejemplo 11.1.1 Utilizando la información descrita en la Tabla 11.1.1, estime •
P(X 35”) = Probabilidad que la precipitación sea menor que 35”
•
P(X>45”) = Probabilidad que la precipitación sea mayor que 45”
•
P(35” X 45”).
Ejemplo 11.1.1
n= 1979-1911+1= 69 •
P (35.0 R 45.0in) 1 P ( R 35.0) P ( R 45.0) P(X 35”) = 23/69 = 0.333
•
P(X>45”) = 19/69 = 0.275
•
P(35” X 45”).
1 0.333 0.275
P (35.0 R 45.0in) 1 P ( R 35.0) P ( R 45.0) (0.333) 2
1 0.333 0.275 0.392
Ejemplo 11.1.2 Suponiendo que el proceso de la Tabla 11.1.1, es independiente, estime la probabilidad que en 2 dos años sucesivos C 35 ” P R 35C). P de .0in ocurran menos (Evento
P (35.0 R 45.0in) 1 P ( R 35.0) P ( R 45.0)
1 0.333 0.275
P C P R 35.0in
2
2 ( 0 . 333 ) =
0.111
Observando la Tabla 11.1.1, se tiene que existen nueve pares de valores que corresponden al evento C, n c=9. P (C )
nC n
9 68
0.132 0.111
Funciones de Frecuencia y de Probabilidad Si las funciones de una muestra están idénticamente distribuidas (cada valor de la muestra extraído de la misma distribución de probabilidad) estas pueden ordenarse para formar un histograma de frecuencia. Si el numero de observaciones ni en el intervalo i, se divide por el numero total de observaciones n, el resultado se conoce como la función de frecuencia relativa
La suma de los valores de las frecuencias relativas hasta un punto dado es la función de frecuencia acumulada
Funciones de Frecuencia La función de Frecuencia Relativa, f s(xi) se obtiene dividiendo el número de observaciones, ni, que contiene el intervalo [xi- x, x i], entre el número total de observaciones, n.
ni
f s ( xi )
n
La cual representa P[xi- x X xi]. La suma de los valores de las frecuencias relativas hasta un intervalo (clase) dado, representa la Función de Frecuencia Acumulada, Fs(x).
F s ( xi )
i
f ( x ) s
j
j 1
Esta función representa P[X xi]. Las funciones de frecuencia relativa y acumulada, están definidas para una muestra, las funciones correspondientes a la población se obtienen a través de los límites, cuando n → y x → 0.
Distribuciones de Frecuencia y de Probabilidad
La función de frecuencia acumulada se convierte en la función de distribución de probabilidad F(X) cuya derivada es la función de densidad de probabilidad
Las funciones de frecuencia relativa, frecuencia acumulada y distribución de probabilidad son todas adimensionales y varían en el rango (0,1). Sin embargo, como dF(X) es adimensional y dX tiene dimensiones de X, la función de densidad de probabilidad f(x) = dF(x)/dx tiene dimensiones de (X) 1
-
y varía en el rango (0, )
La función de densidad de probabilidad, de una variable aleatoria continua es una función, usualmente denominada f(x) que describe la densidad de la probabilidad en cada punto del espacio de tal manera que la probabilidad de que la variable aleatoria tome un valor dentro de un determinado conjunto sea la integral de la función de densidad sobre dicho conjunto.
Una de las funciones de densidad de probabilidad mas conocidas es la curva en forma de campana de la distribución normal
Medidas de la dispersión Se denomina dispersión el grado con que los valores de las muestras tratan de dispersarse alrededor del valor medio. Existen varias formas de expresar el grado de dispersión, entre ellas las mas usadas son: 1.- Rango: es la diferencia entre el valor máximo y el mínimo
2.- La desviación típica
s
3.- El coeficiente de variación
1
n
n 1 i 1
CV
( xi x ) 2
S X
( S2 = Varianza )
Parámetros y Estadísticos
El objetivo de la estadística es extraer la información esencial de un conjunto de datos, reduciendo un conjunto grande de números a un conjunto pequeño de números. Los estadísticos son números calculados de una muestra los cuales resumen sus características mas importantes . Los parámetros estadísticos son características de una población.
Distribución Normal La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar. Con esta notación, la densidad de la normal viene dada por la ecuación:
Distribución Normal Una de las funciones de densidad de probabilidades más conocidas es la Distribución Normal:
f ( x)
1 2
( x ) 2 exp 2 2
Donde, μ y σ, son los parámetros de la distribución. Esta distribución se puede simplificar definiendo la variable normal estándar, z, obteniéndose la Distr ibución Normal Estándar , la cual se caracteriza por tener media igual cero y desviación estándar unitaria:
z
x
f ( z )
1 2
e
z 2 / 2
Propiedades de la distribución normal 1.- Tiene una única moda, que coincide con su media y su mediana. La curva normal es asintótica al eje de abscisas. El área total bajo la curva es, por tanto, igual a 1. 2.- Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. 3.- La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica (). Cuanto mayor sea , más aplanada será la curva de la densidad. 4.- El área bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo .
Distribución Normal Estándar
Distribución Normal Estándar La Función de Distribución Normal Estándar, se obtiene según la ecuación:
F ( z )
z
1
2
e
u 2 / 2
du
Esta ecuación no tiene solución analítica. Sus valores se tabulan en la Tabla 11.2.1, y pueden aproximarse mediante el siguiente polinomio: B
1 1 0.196854 | z | 0.115194 | z |2 0.000344 | z |3 0.019527 | z |4 4 2
Donde, |z| representa el valor absoluto de z, y el valor de la distribución normal estándar se obtiene de la siguiente forma:
F ( z ) B
1 B
Para
z 0
Para
z 0
El error de estimación de F(z), utilizando el polinomio, es < 0.00025
Distribución Normal Estándar Ejemplo 11.2.1 •
P(Z-2) = F(-2), |z| = |-2| = 2 1 1 0.196854 2 0.115194 (2) 2 0.000344 (2)3 0.019527 (2)4 4 2 F (-2) = B = 0.023
B
•
P(Z1) = F(1), |z| = |1| = 1, B = 0.159 F(1) = 1 – B = 0.841
•
P(-2 Z1) = F(1) – F(-2) = 0.841 – 0.023 = 0.818
Río Paraguay en Asunción Histograma de Frecuencias Absolutas y Relativas. Función de Frecuencia Acumulada 20
100.00%
18
90.00%
16
80.00%
14
70.00%
a i c 12 n e u 10 c e 8 r F
60.00% 50.00% 40.00%
6
30.00%
4
20.00%
2
10.00%
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 5 0 5 0 5 0 5 0 5 0 5 0 5 1 1 2 2 3 3 4 4 5 5 6 6 7 7
Clase Frecuencia
% acumulado
. . . r o y a m y
0.00%
Río Paraguay en Asunción Ajuste de la Función de Distribución Normal 1.00 0.90 0.80 0.70 ] x < X [ P
0.60 0.50 0.40 0.30 0.20 0.10 0.00 0
1000
2000
3000
4000
5000
6000
7000
Caudal (m3/s) Función de Distribución Normal
Datos Históricos
8000
Ajuste de la Distribución Normal a los totales anuales de precipitación, registrados en la Estación Caserío Morita, Estado Barinas
z
x
f ( z )
1 2
e
z / 2 2
Año
Precipitación
Orden
X
F(x)
Fs(X)
1957
1303.0
1
912.9
0.03829
0.022727
1958
1412.0
2
1033.1
0.10071
0.045455
1959
1579.0
3
1033.8
0.10122
0.068182
1960
1307.0
4
1047.2
0.11130
0.090909
1961
1339.0
5
1047.3
0.11138
0.113636
1962
1301.0
6
1076.2
0.13554
0.136364
1963
1592.1
7
1083.1
0.14180
0.159091
1964
1083.1
8
1090.8
0.14902
0.181818
1965
1405.8
9
1092.1
0.15026
0.204545
1966
1331.8
10
1093.7
0.15180
0.227273
1967
1090.8
11
1104.3
0.16226
0.250000
1968
1033.8
12
1168.0
0.23462
0.272727
1969
1733.6
13
1191.8
0.26565
0.295455
1970
1620.9
14
1192.4
0.26646
0.318182
1971
1047.3
15
1215.1
0.29793
0.340909
1972
1168.0
16
1249.7
0.34888
0.363636
1973
1249.7
17
1256.6
0.35942
0.386364
1974
1047.2
18
1260.3
0.36511
0.409091
1975
1445.8
19
1294.5
0.41901
0.431818
1976
1338.1
20
1301.0
0.42946
0.454545
1977
1192.4
21
1303.0
0.43269
0.477273
1978
1658.0
22
1307.0
0.43915
0.500000
1979
1705.0
23
1322.4
0.46418
0.522727
1980
1294.5
24
1331.8
0.47954
0.545455
1981
1611.8
25
1338.1
0.48985
0.568182
1982
1322.4
26
1339.0
0.49132
0.590909
1983
1508.1
27
1341.3
0.49509
0.613636
1984
1341.3
28
1405.8
0.59966
0.636364
1985
1076.2
29
1412.0
0.60946
0.659091
1986
1093.7
30
1445.8
0.66154
0.681818
1987
1466.8
31
1466.8
0.69247
0.704545
1988
1664.3
32
1508.1
0.74934
0.727273
1989
912.9
33
1579.0
0.83234
0.750000
1990
1215.1
34
1592.1
0.84548
0.772727
1991
1867.8
35
1611.8
0.86392
0.795455
1992
1260.3
36
1620.9
0.87191
0.818182
1993
1104.3
37
1658.0
0.90109
0.840909
1994
1033.1
38
1664.3
0.90551
0.863636
1995
1092.1
39
1702.0
0.92900
0.886364
1996
1191.8
40
1705.0
0.93066
0.909091
1997
1702.0
41
1733.6
0.94499
0.931818
1998
1806.2
42
1806.2
0.97103
0.954545
1999
1256.6
43
1867.8
0.98418
0.977273
MEDIA
1344.3
D ES V. E ST AN D.
2 43 .6
Totales anuales de precipitación Estación Caserío Morita, Edo. Barinas 1.0 a d i l i b a b o r p e d n ó i c u b i r t s i d e d n ó i c n u F
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 800
1000
1200
1400
1600
Precipitación total anual en mm Dis t. Norm al
Datos his tóricos
1800
2000
Varianza y Asimetría
Ejemplo 11.3.1 Usando los datos de la Tabla 11.3.2, estime la media, la desviación estándar y el coeficiente de asimetría 1 x n
n
x
i
i 1
401.7 10
s 2
40.17in n
1
( x x ) n 1
2
i
i 1
1016.9 113.0in 2 9
s (113.0)1/ 2 10.63in n
n C s
( x x )
3
i
i 1
(n 1)(n 2) s 3
10 6480.3 0.749 3 9 8 (10.63)
Distribuciones de Probabilidades utilizadas en hidrología
Distribuciones de Probabilidades utilizadas en hidrología
Periodo de Retorno En los cálculos hidrológicos en muchas ocasiones no interesa conocer la distribución de los valores, sino mas bien el período de tiempo que debe transcurrir para que un evento iguale o exceda una magnitud dada o para que sea menor al de esa magnitud.
Rio Burate en las Mesitas, Trujillo, julio 2008
Periodo de Retorno Frecuencia Es el numero de veces que un evento (precipitación, creciente, etc) de una magnitud especificada es igualado o superado en un periodo determinado.
Periodo de retorno Tr Periodo de retorno o intervalo de ocurrencia, es el intervalo promedio, en años, entre acontecimientos, que igualan o exceden una magnitud dada.
Una P = 60 mm/h y una frecuencia de una vez con un periodo de retorno de 15 años , significa que una precipitación de 60 mm/h será igualada o excedida, una vez, en promedio, cada 15 años; que es de esperar que sea igualada o excedida 2 veces en 30 años; 3 veces en 45 años, etc.
Período de Retorno Un evento extremo ocurre cuando la variable aleatoria Q m supera un determinado umbral QTr. Definiendo la variable , como el intervalo de recurrencia entre eventos donde QmQTr , el Período de Retorno de este tipo de eventos será el valor esperado de , E().
La figura 12.1.1, muestra las descargas máximas del río Guadalupe en Texas, USA, para el período 1935-1978. Si se define el umbral Q T= 50000 cfs, se observa que durante este período dicho umbral ha sido superado nueve (9) veces; con intervalos de recurrencia que varían entre 1 y 16 años.
Período de Retorno El Período de Retorno, T, de este evento [ Q≥ 50000 cfs], representa el valor esperado (promedio) de la variable , tomado sobre un gran número de ocurrencias. En el caso del río Guadalupe, existen ocho intervalos de recurrencia durante un período de 41 años, entre la primera y última ocurrencia. Por lo tanto, el período de retorno de dicho evento será: T = 41 años / 8 ocurrencias = 5.1 años De esta forma el período de retorno representa el período de recurrencia promedio entre eventos que igualan o exceden la magnitud del umbral considerado.
Serie de caudales máximos anuales del río Guadalupe
Es decir, dos caudales máximos por encima del nivel de inundación representan crecidas independientes sólo si entre los dos eventos el caudal había regresado completamente al nivel de flujo base.
Por otra parte, si no se vuelve al nivel de flujo base entre las dos máximas, las crecidas no son eventos independientes, porque la primera afectó a la segunda.
El análisis de frecuencia de crecidas exige que los datos sean independientes y homogéneos. El requisito de independencia implica que las crecidas deben ocurrir de forma individual, sin afectarse mutuamente.
Serie de caudales máximos anuales del río Guadalupe
Serie de caudales máximos anuales del río Guadalupe
Período de Retorno
p P ( X xT )
La probabilidad de ocurrencia del evento
X xT
En cualquier observación puede relacionarse con el Periodo de Retorno en la siguiente forma: Para cada observación existen dos resultados posibles ya sea éxito o falla. Si la probabilidad de ocurrencia de este evento se denota como p,
p=P[Qm QTr ] y sabiendo, que la distribución de probabilidades de un intervalo de recurrencia de duración es Binomial, ya que cada año se tienen dos posibles resultados, que son éxito Q m QTr o falla Qm
Debido a que las observaciones son independientes, la probabilidad de un intervalo de recurrencia de duración es el producto de las probabilidades de -1 fallas seguidas por un éxito, es decir :
(1 p) 1 p
E ( )
1
(1 p )
Y el valor esperado esta dado por:
2 3 p p 2(1 p) p 3(1 p) p 4(1 p) p
1
p 1 21 p 31 p 2 41 p 3 E ( )
p P ( X xT )
p
1
1 1 p
2
p
T
P ( X xT )
1 T
Período de Retorno En el caso del ejemplo del río Guadalupe,
P ( X xT )
1 T
p = P[Q≥50000 cfs] = 1 / 5.1 años = 0.195
Periodo de retorno Tr Periodo de retorno o intervalo de ocurrencia, es el intervalo promedio, en años, entre acontecimientos, que igualan o exceden una magnitud dada.
¿Cuál es la probabilidad que un evento de T años de período de retorno ocurra por lo menos una vez los próximos N años? P[X < xT cada año durante N años] = (1-p) N Usando el principio de la complementariedad,
P[X ≥ xT por lo menos una vez en N años] = 1 - (1-p)N Dado que p = 1 / T
P[X ≥ xT por lo menos una vez en N años] = 1 - ( 1- ( 1 / T)) N
Ejemplo 12.1.1.- Estime la probabilidad que el río Guadalupe tenga un caudal máximo anual que exceda los 50000 cfs, por lo menos una vez los próximos tres (3) años.
Sabemos que P[Q ≥ 50000 cfs] = 0.195, por lo tanto,
P[X ≥ xT por lo menos una vez en N años] = 1 - (1-p)N
P[Q ≥ 50000 cfs, por lo menos una vez los próximos 3 años ] = (1-(1-0.195)3 = 0.48
P[X ≥ xT por lo menos una vez en N años] = 1 - ( 1- ( 1 / T)) N
Período de Retorno
Un concepto equivocado común es que una tormenta de 25 años siempre produce una creciente de 25 años.
Período de Retorno
Graficas de Probabilidad - Ajuste de Distribuciones Como una verificación de que la distribución de probabilidad se ajusta a un conjunto de datos hidrológicos, estos pueden graficarse en un papel de probabilidad diseñado especialmente o utilizando una escala de graficación que linealice la función de distribución. Luego los datos graficados se ajustan por medio de una línea recta con propósitos de interpolación y extrapolación.
Papel de probabilidad La probabilidad acumulada de una distribución teórica puede representarse gráficamente en un papel de probabilidad diseñado para la distribución. En uno de estos papeles las ordenadas representan el valor de x en una cierta escala y las accisas representan la probabilidad, el periodo de retorno T o la variable reducida “ y”.
Las escalas para las ordenadas y las abcisas estan diseñadas de tal manera que se espera que los datos que van a ser ajustados aparezcan cercanos a una línea recta
Posición de graficación Una posición de graficacion se refiere al valor de la probabilidad asignada a cada uno de los datos que van a graficarse. Se han propuesto numerosos métodos para la determinación de las posiciones de graficacion, la mayoría de los cuales son empiricos. Si “n” es el numero total de los valores que van a ser graficados y m es la posicion de un valor en una lista ordenada por magnitud descendente, la probabilidad de excedencia del e-mesimo valor mayor Xm es para un “m” grande: P[X ≥ xT ] = m/n
Estimación de la frecuencia de la lluvia a partir de una serie de datos medidos – Método Grafico 1.-
Se seleccionan las precipitaciones máximas para diferentes duraciones de una estación de lluvia. Tabla V-5
2.-
Los datos así obtenidos se ordenan de mayor a menor. Se le asigna el no de orden 1 al valor mayor, 2 al que le sigue, etc. Tabla V-6
3.- Se calcula el periodo de retorno Tr a cada uno de los valores ordenados mediante la formula siguiente:
Tr
n 1 m
Formula de W. Weibull n = No de años de observación m = No de orden del termino de serie
4.- Se plotea en papel de probabilidades extremas de Gumbel, cada una de las precipitaciones contra su periodo de retorno Tr calculado 5.- Se traza una línea recta de ajuste a través de los puntos ploteados
En ocasiones en el grafico de probabilidades extremas es preferible utilizar la escala de las probabilidades de no ocurrencia y se hace una conversión de los Tr mediante la expresión:
q (1
1
) x100 Tr
6.-- Con la curva de 6. de frecuencia de precipitaciones precipitaciones obtenida, se puede determinar la precipitación máxima, de la duración que se requiera, para un periodo de retorno Tr Tr que se desee al extrapolar la recta:
Análisis de intensidad – duración – periodo de retorno Con este método se obtiene en una estación la intensidad de precipitación correspondiente a una duración y periodo de retorno dado. Del análisis de los pluviogramas se construyen curvas llamadas de intensidad-duración-periodo intensidad-duración-p eriodo de retorno. 1.-1.
Se anal analiz izan an las las llu lluvi vias as de de mayo mayorr inte intens nsid idad ad de de todo todo el el periodo de registro y se seleccionan las laminas maximas precipitadas para diferentes duraciones. Tabla V-5
2.-2.
Este Est e anál anális isis is se se hace hace ley leyen endo do los los tot total ales es de de lluv lluvia ia registrada en el pluviograma para 5, 10, 15 min, etc. Tambien se hacen lecturas para las duraciones 1, 3, 6, 9, 12 y 24 horas
3.-- Los datos obtenidos en la tabla V-5 3. V-5 se reagrupan en orden orden decreciente según su magnitud y se les asigna un número de orden para calcular el correspondiente Tr Tr y la probabilidad de no ocurrencia
Formula de W. Weibull
Tr
n 1 m
q (1
1
) x100 Tr
4.- De acuerdo a las duraciones seleccionadas se pasan los datos de precipitaciones de la tabla V-6 a intensidades máximas de precipitaciones (mm/h) como se indica en la siguiente tabla (Tabla V-7)
Ejem.
17.0
102 6
5.-- Se traslada la información de la tabla anterior (Tabla 5. (Tabla V-7) al papel de probabilidades extremas de Gumbel y se obtiene la siguiente curva
Las curvas que relacionan precipitaciones, intensidad –duración –periodo de retorno se pueden construir en distintos tipos de papel como los indicados. También pueden trazarse en papel semilogaritmico y doble logaritmico log log
Se ti tien ene e un fá fábr bric ica a ub ubic icad ada a en la ma marg rge en de un rí río. o. El ed edif ific icio io es esttá protegido para la eventualidad de un caudal máximo de 900 unidades de flujo. Exceder el nivel de 900 unidades de flujo provocaría graves daños a la mercancía, con repercusiones muy graves para su negocio. Dado un historial de 30 años, el trazado de serie anual muestra que el período de retorno de 900 unidades de flujo es de _____. 50 años
Descripción general del análisis de frecuencia de crecidas
• El análisis de frecuencia de crecidas brinda información sobre el
potencial estadístico de que se produzca una crecida. • El período de retorno expresa un período (por ejemplo, la avenida de
100 años) que es la duración estadística media entre crecidas de cierta magnitud. Cuanto mayor el período de retorno, tanto mayor la crecida. • La probabilidad de excedencia o de ocurrencia para un año en
particular es el inverso del período de retorno. Por lo tanto, la probabilidad de excedencia de una avenida de 100 años sería de 1/100, o del 1 %.
• La avenidas, sin embargo, no ocurren a intervalos uniformes. Por tanto,
una avenida de 100 años no ocurre necesariamente una sola vez en un período de 100 años. • Una crecida de determinado período de retorno no es necesariamente el
producto de un aguacero que tiene el mismo período de retorno. Es decir, un aguacero de 25 años no produce necesariamente una avenida de 25 años.
Existen dos aplicaciones del análisis de frecuencia de crecidas: 1. Estimar la magnitud potencial de la crecida que puede ocurrir en un intervalo de tiempo dado. 2. Estimar el período de retorno de una crecida de cierta magnitud.
Método para estimar la frecuencia de valores extremos Para ciertos sucesos extremos como picos de crecientes y precipitaciones no hay un limite físico, siempre habrá la posibilidad de esperar un suceso mayor.
El estudio de eventos hidrológicos extremos incluye la selección de una secuencia de observaciones máximas o mínimas de conjunto de datos. Por ejemplo, el estudio de los caudales picos en una estación hidrométrica utiliza solamente el máximo caudal registrado cada año, entre los muchos miles de valores registrados.
Método para estimar la frecuencia de valores extremos E.J. Gumbel propuso que la probabilidad P de la ocurrencia de un valor igual o mayor que cualquier valor X se expresa como:
p 1 e
e y
e = base de los logaritmos neperianos y = Variable reducida la cual para una muestra grande es igual a
y
1 0.7797 x
( x x 0.4505 x)
Método para estimar la frecuencia de valores extremos (cont.-/1)
p 1 e qe y
e y
e y
1 0.7797 x
p = probabilidad de ocurrencia de un valor igual o mayor q = probabilidad de no ocurrencia
( x x 0.4505 x)
p q 1 q 1 p
X = es la magnitud del suceso con la probabilidad p X = es el promedio aritmético de la serie de los sucesos observados y = variable reducida
x
= desviación estandar de los datos observados
Método para estimar la frecuencia de valores extremos (cont.-/2) La ecuación anterior se deduce de una muestra infinitamente grande y no es aplicable cuando interese buscar periodos de retorno a partir de muestras limitadas. En tales casos se recomienda utilizar la ecuación siguiente la cual da resultados muy similares a medida que crece la serie
x x (
siendo
Y
y yn n
k
) x
y yn n
O también:
x x k x
X indica el valor del suceso extremo (precipitacion, creciente, etc.) alcanzado o excedido, en promedio, una vez para un Tr
= variable reducida en función de Tr (Tabla V-1)
Yn = la media de la variable reducida (Tabla V-2)
n = desviación típica de la variable reducida (Tabla V-3)
Método para estimar la frecuencia de valores extremos (cont.-/3)
k
y yn
x x (
n
y yn n
) x
X indica el valor del suceso extremo (precipitacion, creciente, etc.) alcanzado o excedido, en promedio, una vez para un Tr
n = numero de años de observación
Ejem. Dadas las precipitaciones máximas anuales de 15 minutos de duración que se muestran en la siguiente tabla, determinar:
a.- La precipitación máxima para la misma duración correspondiente a un periodo de retorno de 20 a ños. b.- La probabilidad de no ocurrencia de una intensidad de lluvia de 100 mm/h para la misma duración.
Año
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
P (mm)
17.1
14.0
x x (
19.5
y yn n
24.0
) x
16.1
12.7
18.3
k
21.4
15.2
y yn n
19.5
21.2
14.2
n = 12 años de observación
k
k
x
y yn n
2,970 0,5035 0,9833 1 n
n
X
xi
i 1
x
n
Tr = 20 años
Y = 2,970
2,5033 213,2 12 1
x x (
y yn
17,67
n
( x x ) n 1 i
i 1
0,9833
Yn = 0.5035
2
132,53 12 1
3,4710
x 17,67 (2,5083)3,4710 26,47mm
n
) x
p 1 e qe
e y
e y
I= 100 mm/h
k
p = probabilidad de ocurrencia de un valor igual o mayor q = probabilidad de no ocurrencia
D = 15 min = 0.25 h
y yn
x x (
n
y yn n
X = 25 mm
) x X 17,67
k
25 17.67 3.47
y yn k n 0.5035 2.1117 x0.9833 2.5799
qe
e y
e
e 2.5799
0.93
x
3,4710
2,1117
Estimación de Gastos Pico - Método Racional Asume que la máxima tasa de escurrimiento en una cuenca pequeña ocurre
cuando toda la cuenca está contribuyendo, y que esta tasa de escurrimiento es igual a un porcentaje C de la tasa promedio de lluvia.
Q C x I x A
Q = caudal C = Coeficiente de escorrentía I = Intensidad de precipitación correspondiente al tiempo de concentración A = área de la cuenca
A 500ha
La formula racional esta basada en ciertas hipótesis: 1.- El escurrimiento resultante de cualquier intensidad de lluvia I es un máximo cuando esa intensidad de lluvia dura, al menos, tanto como el tiempo de concentración Tc. 2.- El escurrimiento resultante de una intensidad de lluvia, con duración igual o mayor que el Tc, es una fracción de la precipitación. 3.- La frecuencia de la máxima descarga Q es la misma que la de la intensidad de lluvia I para el Tc dado. 4.- El coeficiente de escorrentia C es el mismo para lluvias de diferentes frecuencias. 5.- El coeficiente de escorrentía es el mismo para todas las lluvias en una cuenca dada.
Q C x I x A
“No considera variaciones de la intensidad de la lluvia en el área durante todo el tiempo de concentración” La aplicación de la formula racional requiere del conocimiento de un coeficiente de escorrentía C, del tiempo de concentración Tc, de la intensidad de la lluvia correspondiente I y del área de la cuenca a drenar En áreas urbanas, el área de drenaje usualmente esta compuesta de subareas o subcuencas de diferentes características superficiales, como resultado se requiere un análisis compuesto que tenga en cuenta las diferentes características superficiales
n
C A
Q I
i
i 1
i
Unidades de medida
Q
Q = m3 /s
C x I x A
I = mm/h
360
A = ha
Q = l/s
Q C x I x A
I = l/s/ha
mm/h x 2.78 = l/s/ha
A = ha I se calcula mediante la curva de intensidad-duracion-periodo de retorno, preferiblemente o mediante la siguiente formula:
I 9.25 xixTc
0.55
i=
Intensidad maxima horaria para un Tr considerado en mm/h
Tc= Tiempo de concentración en minutos
Ejemplo Determinar el caudal máximo para Tr= 50 años de una cuenca que se muestra, sabiendo que longitud del cauce 1.15 km, área de la cuenca 70 ha y coeficiente de escurrimiento 0,40. Para la estimación de la intensidad utilizar la curva Intensidad-duracion-frecuencia anexa.
Cota 637 m
Cota 525 m
Q C x I x A
Q = l/s I = l/s/ha A = ha
mm/h x 2.78 = l/s/ha
Tc
0.0195(
3 L H
)
0.385
Formula del Bureau of Reclamation (USA)
Tc = tiempo de concentración en minutos L = Longitud del cauce principal en metros H = Diferencia de elevación entre el punto mas elevado y el que se considera 3
Tc
0.385
150 0.0195( ) 637 525
10.8 min
I
(
580 2.78
Q
)
C x I x A 360
208.6mm / h
16.22m3 / s
Escala del Diseño Hidrológico - Control del agua
Valor Límite Estimado (ELV): Corresponde a la máxima magnitud posible que puede tener un evento hidrológico, en un lugar dado (definido geográficamente).
Escala del Diseño Hidrológico - Control del agua
Este concepto de Valor Límite Estimado (ELV), está implícito en las conocidas Precipitación Máxima Probable (PMP) y Crecida Máxima Probable (CMP), (PMF).
El grado de incertidumbre asociada a estas estimaciones depende de la confiabilidad de la información histórica disponible (datos de lluvias extremas, caudales extremos, curvas de gastos, densidad de la red pluviométrica, etc.), del conocimiento técnico y de la exactitud del análisis.
Según la OMM (Organización Meteorológica Mundial), la PMP se define como : La cantidad de precipitación, cercana al límite físico superior, definida para una duración dada y una localización geográfica determinada. Con base a registros históricos mundiales, la PMP puede tener
períodos de retorno tan grandes como 500 millones de años, que generalmente, corresponde a un factor de frecuencia, KT = 15. Algunos hidrólogos le asignan períodos de retorno arbitrarios a la PMP y CMP,
del orden de 10000 años. Existen métodos estadísticos y físicos para estimar la PMP, y luego utilizando modelos como los basados en hidrogramas unitarios sintéticos ó en la Onda
Cinemática, permiten la estimación de la CMP.
Escala del Diseño Hidrológico - Control del agua
Límites basados en probabilidades : Las probabilidades de ocurrencia pueden ser estimadas, adecuadamente, cuando están disponibles registros hidrológicos, lo suficientemente largos, que permitan la realización de análisis de frecuencia confiables.
Los métodos probabilísticos son menos subjetivos y más manejables, y conducen a formas lógicas para determinar niveles óptimos de diseño mediante el uso de Análisis Hidroeconómico y Análisis de Riesgo.
En la tabla que se incluye a continuación, se dan algunos criterios generales, basados en experiencias pasadas, para la selección del período de retorno de diseño de obras de control.
Adicionalmente, para un área densamente poblada, donde la falla de la estructura causaría pérdidas de vidas humanas y extensos daños a propiedades, se justifica el uso del ELV, en el diseño.
Sin embargo, en áreas menos pobladas y donde las fallas causan menores daños, sin pérdidas de vidas humanas, se puede disminuir el grado de protección, por ejemplo, se diseña para la crecida milenaria.
Según la Academia Nacional de Ciencias de USA: Presa pequeña: H < 12 m Presa mediana: 12 m 30 m Donde H es la altura de la presa.
Escala del Diseño Hidrológico – Uso del agua
La diferencia entre los criterios aplicados en este caso, con respecto a la discusión anterior, radica en que el problema es de falta de agua y no exceso de la misma.
En este caso el valor de las variables de diseño se selecciona de forma tal que el sistema tenga una probabilidad de falla aceptable para el propósito considerado. Para llevar acabo este análisis existen
dos metodologías:
El Enfoque Tradicional: Cuyo análisis se lleva a cabo utilizando los registros históricos
disponibles. La limitación de esta metodología es que la estimación de la falla se basa en un período único (el histórico), suponiendo que el mismo va a ocurrir en forma similar en el futuro.
Hidrología Operacional: En este caso el análisis es similar al anterior, pero realizándolo sobre un gran número de escenarios futuros de ocurrencia de las variables estocásticas. Es decir, se obtienen respuestas para cada escenario, pudiéndosele ajustar distribuciones de probabilidades a las mismas, lo cual permite una evaluación más precisa de las fallas del sistema.
Diseño Hidrológico El Diseño Hidrológico representa la evaluación del impacto de eventos hidrológicos en sistemas de recursos hidráulicos a los fines de establecer los criterios de selección de las variables más importantes que definen los componentes del sistema para que este se comporte adecuadamente. A través de este tipo de diseño se pueden establecer medidas que pueden ser:
– Estructurales: como la construcción de un embalse regulador o diques marginales, a los fines de controlar inundaciones;
– No estructurales: como el ordenamiento de la planicie de inundación, utilizando la información de manchas de inundación resultantes de la aplicación de modelos hidrológicos e hidráulicos. Es importante destacar que además de los criterios establecidos a través del análisis hidrológico – hidráulico, existen otros aspectos que se deben tomar en cuenta en el diseño de recursos hidráulico como son: económicos-financieros, salud pública, geotécnicos, estructurales, legales, estéticos, seguridad, ambientales,… etc.
Escala del Diseño Hidrológico Los fines de la planeación y manejo de los Recursos Hidráulicos se puede clasificar en dos categorías:
– Control del agua: • Máximos:
Crecidas extremas, manchas de inundación, drenajes, canalizaciones, obras de desvío en la construcción de presas, obras de alivio, arrastre de sedimentos,.. etc. • Mínimos: Sequías, contaminación de cuerpos de agua, salinidad (cuña salina), derivación y trasvases (caudales garantizados), caudales ecológicos.. etc. – Uso del agua: Abastecimiento urbano e industrial, riego agrícola, hidroelectricidad, recreación, etc. En ambos casos la tarea del diseño hidrológico, es la misma, la cual corresponde a la determinación del Caudal de Diseño. Sin embargo, la diferencia entre ambas categorías corresponde a la escala, ya que en el primer caso el interés está en los caudales extremos (eventos), mientras que en el segundo el interés es sobre todo el hidrograma de caudales por un largo período de años.