Distribuciones de Probabilidad en Hidrología 1

INTRODUCCION La aplicación de la estadística en Hidrología es el análisis de la información hidrológica en forma de probabilidades, a fin de inferir las características con que debe ser esperado en el futuro el fenómeno que se estudia. El avance en el campo de las computadoras y el desarrollo creciente de métodos numéricos han dado una importancia particular al uso de la estadística especialmente en Hidrología. En forma general, la mayoría de los problemas hidrológicos se pueden agrupar en tres categorías principales de acuerdo al objetivo objeti vo principal del proyecto: I.

Diseño de estructuras hidráulicas, siendo necesaria la evaluación y cuantificación de los valores extremos (máximos y mínimos) del escurrimiento superficial.

II.

Satisfacción de demandas, siendo necesario evaluar y cuantificar las descargas disponibles en el punto de interés.

III.

Diseño y operación de embalses, siendo necesario evaluar y cuantificar la variación del escurrimiento superficial en todas sus características estadísticas, como valores medios, máximos y mínimos.

En el presente trabajo nos concentraremos en los métodos de distribución de probabilidades para el cálculo de máximas avenidas utilizando los métodos de Distribución LOG NORMAL y Distribución LOG PEARSON TIPO III. Esperamos que el presente trabajo sea de gran utilidad para nuestro futuro que nos estamos formando como Ing. Agrícolas.

Objetivo General: 

Aprender a calcular calcular los caudales máximos instantáneos para un periodo periodo determinado.

Objetivos Específicos: 

Realizar el cálculo de las máximas avenidas por los métodos de distribución de LOG NORMAL y LOG PEARSON TIPO III.



Comparación de dichos dichos métodos con con el fin de tomar tomar un criterio con que método realizar los cálculos.

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGÍA El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de Distribuciones de Probabilidad. La variable se designa por mayúscula y un valor específico de ella por minúscula. Por P (x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P (a ≤ x ≤ b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si conocemos la probabilidad P (a ≤ x ≤ b) para todos los valores de a y b, se dice que conocemos la Distribución de Probabilidades de la variable x. Si x es un número dado y consideramos la probabilidad P (X ≤ x): F(x)= P (X ≤ x): y llamamos F(x) la función de distribución acumulada. Ejemplo Se tienen las probabilidades de que haya 1, 2, 3, ... etc., días nublados por semana en un determinado lugar, con ellos calcule la distribución de probabilidades x 0 1 2 3 4 5 6 7 Total

P(x) 0.05 0.15 0.25 0.20 0.15 0.10 0.08 0.02 1.0

F(x) 0.05 0.20 0.45 0.65 0.80 0.90 0.98 1.00

Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 años de registro de caudales de crecientes (máximos instantáneos) en el río Magdalena, agrupados en 9 intervalos de clase. x 1 2 3 4 5 6 7 8 9 Total

P(x) 0.05 0.10 0.15 0.20 0.10 0.10 0.15 0.10 0.05 1.00

F(x) 0.05 0.15 0.30 0.50 0.60 0.70 0.85 0.95 1.00

Cuando el número de observaciones se incrementa, el tamaño de los intervalos decrece y se puede tener algo sí

donde f (x) es la llamada función de densidad de probabilidades y tiene las siguientes características i ) ii ) iii )

Lo que implica que las probabilidades se definen sólo como ÁREAS bajo la función de densidad de probabilidad (FDP) entre límites finitos.

1.1

MOMENTOS DE LAS DISTRIBUCIONES

Las propiedades de las distribuciones pueden ser definidas completamente en términos de los momentos. Los momentos en estadística son similares a los momentos en física (rotación respecto al origen) para la variable continua

para la variable discreta o respecto a la media (eje de rotación diferente al origen) para la variable continua

para la variable discreta

1.2

PARÁMETROS ESTADÍSTICOS

Los estadísticos extraen información de una muestra, indicando las características de la población. Los principales estadísticos son los momentos de primer, segundo y tercer orden correspondiente a la media, varianza, y asimetría respectivamente.

1.2.1 Media m: es el valor esperado de la variable misma. Primer momento respecto al origen. Muestra la tendencia central de la distribución

el valor estimado de la media a partir de la muestra es

1.2.2 Varianza s²: mide la variabilidad de los datos. Es el segundo momento respecto a la media.

el valor estimado de la varianza a partir de la muestra es

en el cual el divisor es n-1 en lugar de n para asegurar que la estadística de la muestra no sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que el valor verdadero. Las unidades de la varianza son la media al cuadrado, la desviación estándar s es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raíz cuadrada de la varianza, se estima por s. El significado de la desviación estándar se ilustra en la siguiente figura

Efectos de la función de densidad de probabilidad causados por cambios en la desviación estándar.

Coeficiente de variación su estimado es

es una medida adimensional de la variabilidad

1.2.3 Coeficiente de asimetría g la distribución de los valores de una distribución alrededor de la media se mide por la asimetría. Se obtiene a partir del tercer momento alrededor de la media, dividiéndolo por el cubo de la desviación estándar para que sea adimensional. tercer momento respecto a la media

Un estimativo del coeficiente de asimetría está dado por Ejemplo Encontrar el valor medio de la precipitación si se tiene

2 .-

Intervalo (mm)

Xi medio

100 110 120 130 140 150 160

105 115 125 135 145 155 165

110 120 130 140 150 160 170

FrecuenciaFrecuencia x f(x) absoluta relativa 10 0.1 10.5 16 0.16 18.4 9 0.09 11.25 10 0.1 13.5 20 0.2 29 15 0.15 23.25 20 0.2 33 Total=100 = S138.9

ANALISIS DE FRECUENCIA

El análisis de frecuencia es una herramienta utilizada para, predecir el comportamiento futuro de los caudales en un sitio de interés, a partir de la información histórica de caudales. Es un método basado en procedimientos estadísticos que permite calcular la magnitud del caudal asociado a un período de retorno. Su confiabilidad depende de la longitud y calidad de la serie histórica, además de la incertidumbre propia de la distribución de probabilidades seleccionada. Cuando se pretende realizar extrapolaciones, período de retorno mayor que la longitud de la serie disponible, el error relativo asociado a la distribución de probabilidades utilizada es más importante, mientras que en interpolaciones la incertidumbre está asociada principalmente a la calidad de los datos a modelar; en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar, et al. 1994). La

extrapolación de frecuencias extremas en una distribución empírica de crecientes es extremadamente riesgosa (Garcon, 1994). Para determinar la magnitud de eventos extremos cuando la distribución de probabilidades no es una función fácilmente invertible se requiere conocer la variación de la variable respecto a la media. Chow en 1951 propusó determinar esta variación a partir de un factor de frecuencia K T que puede ser expresado:

y se puede estimar a partir de los datos

Para una distribución dada, puede determinarse una relación entre K y el período de retorno Tr. Esta relación puede expresarse en términos matemáticos o por medio del uso de una tabla. El análisis de frecuencia consiste en determinar los parámetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un período de retorno dado. A continuación, se describen las principales distribuciones de probabilidad utilizadas en hidrología, la forma de estimar sus parámetros, el factor de frecuencia y los límites de confianza. Estos últimos son indicadores de que tanta incertidumbre se tiene con las extrapolaciones, puesto que determinar el rango de valores donde realmente estaría la variable, si el rango es muy grande la incertidumbre es muy alta y si es pequeño, por el contrario, habrá mucha confianza en el valor estimado.

3.- DISTRIBUCIONES CONTINUAS 3.1

DE

PROBABILIDAD

PARA

VARIABLES

DISTRIBUCION NORMAL

La distribución normal es una distribución simétrica en forma de campana, también conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrológicos tiene amplia aplicación por ejemplo a los datos transformados que siguen la distribución normal.

3.1.1 .-

Función de densidad:

La función de densidad está dada por

Los dos parámetros de la distribución son la media m y desviación estándar s para los cuales (media) y s (desviación estándar) son derivados de los datos.

3.1.2

Estimación de parámetros:

3.1.3

Factor de frecuencia:

1.

Si se trabaja con los X sin transformar el K se calcula como

este factor es el mismo de la variable normal estándar

3.1.4

Limites de confianza:

donde a es el nivel de probabilidad es el cuantil de la distribución normal estandarizada para una probabilidad acumulada de 1-a y S e es el error estándar

3.2

DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye normalmente. Esta distribución es muy usada para el cálculo de valores extremos por ejemplo Qmax, Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos se reducen en mayor proporción los datos mayores que los menores. Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de las variables estén centrados en la media

3.2.1


y = ln x donde, my : media de los logaritmos de la población (parámetro escalar), estimado estimado sy .

sy : Desviación estándar de los logaritmos de la población,

3.2.2


3.2.3


Puede trabajarse en el campo original y en el campo transformado. 2.

Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviación estándar de los logaritmos, así:

Ln(XTr ) = xTr +KSy de donde, XTr = eln (xTr ) con K con variable normal estandarizada para el Tr dado, x y media de los logaritmos y Sy es la desviación estándar de los logaritmos. 3.

Campo original: Si se trabaja con los X sin transformar el K se calcula como

K es la variable normal estandarizada para el Tr dado, es el coeficiente de variación, x media de los datos originales y s desviación estándar de los datos originales.

3.2.4

Limites de confianza:

En el campo transformado.

en donde, n número de datos, Se error estándar, K T variable normal estandarizada.

EJEMPLO: En un río se tienen 30 años de registros de Q máximos instantáneos anuales con x= 15 m 3/s, S = 5 m 3/s (media y desviación estándar para los datos originales). xy=2.655, sy = 0.324 (media y desviación estándar de los datos transformados). Encontrar el caudal para un periodo de retorno de 100 años y los límites de confianza para un a = 5%. Calcular la probabilidad de que un caudal de 42.5 m 3/s no sea igualado o excedido P(Q ≤ 4.25). Solución: n=30 x= 15 m3/s s = 5 m3/s

xy=2.655 sy = 0.324

En el campo original

= 5/15 = 0.33 K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0.99)

de la tabla de la normal se obtiene KT=2.33

KT = 3.06 QTr = 15 + 5 * 3.028 QTr = 30.14 m 3/s En el campo transformado se tiene que: LnQTr100 = 2.655 + 2.33*0.324 LnQTr100 = 3.40992 QTr100 = Exp (3.40992) Q Tr100 = 30.26 m3/s Límites de confianza Ln (QTr ) ± t(1-a) Se

d = 1.93

t(1-a) = t(0.95) = 1.645 (Leído de la tabla de la normal) Ln (30.28) ± (1.645) (0.11) 3.41 ± 0.18095 [3.22905 [e3.22905 [25.26

3.59095] e3.59095] 36.29]

Intervalos de confianza para Q Tr100 b) Calcular la probabilidad de que un caudal de 45 m 3/s no se igualado o excedido P (Q≤ 4.25). Ln (42.5) = 3.75 t = (3.75 - 2.655) /0.324 F (3.38) = 0.9996 Leído de la tabla de la normal P (Q≤ 4.25) = 99.9%

3.3

DISTRIBUCION GUMBEL O EXTREMA TIPO I

Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es la distribución general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequías (máximos y mínimos).

3.3.1


En donde a y b son los parámetros de la distribución.

3.3.2

donde muestra.

3.3.3

Estimación de parámetros

son la media y la desviación estándar estimadas con la


Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para un período de retorno de 2.33 años es igual a la media de los caudales máximos.

3.3.4

Limites de confianza

Xt ± t(1-a) Se

KT es el factor de frecuencia y t (1-a) es la variable normal estandarizada para una probabilidad de no excedencia de 1-a.

EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 años de periodo de retorno y los intervalos de confianza. x= 15 m 3/s, s = 5 m3/s QTr100 = x + KT s

KT = 3.14 QTr100 = 15 + 3.14*5 QTr100 = 30.7 m3/s Intervalos de confianza t(1-a) = t(0.95) = 1.645 (Leído de la tabla de la normal)

d = 3.93

Xt ± t(1-a) Se

30.7 m3/s ± (1.64) (3.58) [24.83 m3/s QTr100

3.4

36.58 m3/s]

Intervalo de confianza para

DISTRIBUCION GAMMA DE TRES PARÁMETROS O PEARSON TIPO 3

Esta distribución ha sido una de las más utilizadas en hidrología. Como la mayoría de las variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la distribución de frecuencia de variables tales como crecientes máximos anuales, Caudales mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres parámetros.

3.4.1


donde, x0 £ x < a para a > 0 a < x £ x0 para a < 0 a y b son los parámetros de escala y forma, respectivamente, y x0 es el parámetro de localización.

3.4.2


Cs es el coeficiente de asimetría, estándar de la muestra respectivamente.

3.4.3


son la media y la desviación

donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.

3.4.4

Intervalos de confianza:

Xt ± t(1-a) Se

Donde S es la desviación estándar de la muestra, n es el número de datos y d se encuentra tabulado en función de Cs y Tr.

EJEMPLO: Se tiene una estación con 30 años de registros de caudales máximos instantáneos con Media de 4144 pie 3/s y desviación estándar de 3311 pie3/s. Si el coeficiente de asimetría de los caudales es de 1.981 pie 3/s cual es caudal para un periodo de retorno de 100 años y su intervalo de confianza. QTr100 = X+ SK K es F(1.981, 100)

,

de tablas se obtiene K=3.595

(1.9,100) = 3.553 (2.0,100) = 3.605 QTr100 = 4144+ (3.595) (3311) QTr100 = 16050 pie3/s Intervalos de confianza Xt ± t(1-a) Se

d = F (1.981,100)

,

(1.9,100) = 8.2196 (2.0,100) = 8.5562

de tablas se obtiene d =8.4922

Se = 5133.56 pie 3/s t(1-a) = t (0.95) = 1.645 (Leído de la tabla de la normal) 16050 ± (5133.56) (1.645) [7605.29 pie3/s

24494.71pie3/s]

Intervalos de confianza para QTr100

3.5

DISTRIBUCIÓN PARÁMETROS

LOG

GAMMA

O

LOGPEARSON

DE

3

Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con X y y S y como la media y desviación estándar de los logaritmos de la variable original X.

3.5.1


donde, y0 ≤ y < a para a > 0 a ≤ y ≤ y0 para a < 0 a y b son los parámetros de escala y forma, respectivamente, y y0 es el parámetro de localización.

3.5.2


Cs es el coeficiente de asimetría, son la media y la desviación estándar de los logaritmos de la muestra respectivamente.

3.5.3


donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.

3.5.4

Intervalos de confianza:

Xt ± t(1-a) Se

Donde Sy es la desviación estándar de los logaritmos de la muestra, n es el número de datos y d se encuentra tabulado en función de Cs y Tr.

METODO DE LOG. PEARSON III

Determinar el caudal máximo instantáneo para 50 años de periodo de retorno con los datos del ejemplo anterior utilizando la distribución LOG Pearson tipo III

AÑO

(m3 /s)

1965

67.6

1966

81.1

1967

110.5

1968

83

1969

80.6

1970

183.1

1971

86.8

1972

99.6

1973

75

1974

72.6

1975

106.4

1976

90.2

1977

110.1

1978

64.3

1979

77.8

1980

88.5

1981

100.6

1982

79.5

1983

68.4

1984

70.1

1985

92.7

Determinamos el coeficiente modular :

K = Qi/Qm Determinamos el valor ( k- 1 ) Paso tres ( k – 1 ) 2 Paso cuatro ( k – 1 ) 3

Se desarrolla en tabla :

Paso 5 : determinamos la desviación estándar :

√ .  

= 607.01

Paso 6 : determinación del coeficiente de variabilidad :

Cv = 607.01 / 708.99 = 0.856

Paso 7 : determinación del coeficiente de asimetría :

Basándonos en la tabla de Foster – Rybikin se calculan los caudales :

Interpolamos para verificar los valores en 50 años de periodo de retorno:

% PROB.

Desv. Norm

Q ( m3 / s )

2

2.185

536.18

DONDE : Qmax = Qm ( 1 + Desv.Norm*cof de variación ) Qmax = 536.18 ( 1 + ( 2.185* 0.856) ) = 1539.0296

Periodo de retorno 50 años

Ln 67.6 81.6 110.5 83.0 80.6 183.1 86.8 99.6 75 72.6 106.4 90.2 110.1 64.3 77.0 89.5 100.6 79.5 68.4 70.1 92.7

4.21 4.40 4.71 4.42 4.39 5.21 4.46 4.60 4.32 4.28 4.67 4.50 4.70 4.16 4.35 4.49 4.61 4.38 4.23 4.25 4.53 93.87



17.72 19.36 22.18 19.54 19.27 27.14 19.89 21.16 18.60 18.32 21.81 20.25 22.09 17.31 18.92 20.16 21.25 19.18 17.89 18.06 20.52 420.68

   ∑ ∑   =  −  (9.  7) 4 . 6 8−  =     = 0.2325 150 = 0.02 1-0.02=0.98/2=0.49 Z=2.33

Lnx= 4.47+(2.33)(0.2325) Lnx=5.011725 X = 150.1635

CONCLUSIONES: 

Aprendimos cuenca.

a calcular los caudales máximos instantáneos de una



Aprendimos a realizar los cálculos de las máximas avenidas con los métodos de distribución de LOG NORMAL y LOG PEARSON TIPO III.



Concluimos que el método LOG PEARSON TIPO III no se utiliza en Latinoamérica pero que si es de gran utilidad.

Distribuciones de Probabilidad en Hidrología 1

Recommend Documents