............... 15 .......... 15 .......... 16 l.3Definiciónclásicadeprobabilidad......... .............17 1.4 Definición axiomática de probabilidad......... ....... 18 1.5 Período de retorno ...........21 1.6 Concepto de riesgo:.................. ..........22 1.7 Cálculo de la probabilidad empírica o experimental.............26 1.8 Variables a1eatorias................ -...........28 Variable aleatoria discreta ...................30 ...............30 Variable aleatoria continua... 1.9 Distribuciones....... ...........31 Función de de densidad de probabilidad de una variable ...........32 aleatoria discreta..... Función de densidad de probabilidad de una variable aleatoria ...........33 continua
1. Conceptos
1.1 Espacio 1.2
Contenido
-
Hidrologfa Estadística
Página (6)
a una Función de distribución acumulada, correspondiente """"' 36 distribución discreta" una a Función de distribución acumulada, correspondiente """"'37 distribución continua """""""'44 1.10 Valor esPerado """" 40 1.11 Momentos de una distribución """"""""46 Momento respecto al origen media la """"""'46 a resiecto Momento ."rrruiton """""""""'41 Media de una distribución
La media geométrica .........97 La mediana............... .........98 La moda ......... 100 Comparación entre la media, la mediana y la moda.............. 101 3.3 Medidas de dispersión .......... ...........102 Rango....... ......L02 Yariatza... ......102 Desviación estándar.... ..... 105 Coeficientes de variación............ ....... 107 3.4 Medida de simetría y asimetría ........107 Sesgo........ ...... L07 3.5 Medida de achatamiento.......... ........ 110 Curtosis.... ...... I 10 3.6 Momentos lineales (L-moments).............:................. .......... t 17 3.7 Problemas propuestos............ .......... 133
parámetros ....137 4.1 Definición de parámetros ................. 137 4.2Definición de estimadores............... .................. 138 4.3 Métodos de estimación de parámetros ............... 140 Método gráfrco ............,... 140 Método de mínimos cuadrados................ ............145 Método de momentos ............................... ........... 148 Método de máxima verosimilitud............. ........... 161 4.4 Problemas propuestos............ ..........L67
4. Estimación de
de bondad y ajuste..... Definición............ .5.2 Ajuste gráfico .5.3 Prueba de Chi-cuadrado........
..............359 puntual y por estimación intervalos................ 359 11.1 Estimación ll.2lntervalo de confiatzapata la media de una distribución normal, cuya varianza es ..............361 I1.3 Intervalo de confialzapara la media de una distribución normal, con varianza desconocida............. .............365 11.4 Intervalo de confianzaparalavaianza de la distribución ..........368 I L5 Problemas .........377 de
conocida............
consistencia.--........ Introducción......-..
8. Análisis de 8.1
"""'"""' """""
307 307
normal...... propuestos........... Bibliografía
á.¡ ¡ráriris doble
masa.............".".'....... """"""""312
consu1tada................
..............373
Fconr.,iiao - página (10)
Anexo A. Transformada de Laplace y función gamma.......,.'.......377 ...,.,........,.,.379 A.1 A.2Latransformada de Laplace.............. .............'..380 A. 3 Ejercicios propuestos transformada de LapaIce ................. 396 .....'......398 A.4 Función ....,.........407 A.5 Ejercicios propuestos funcidn
Justificación
gamma
Anexo B: Funciones
trigonométricas
........409
Apéndice: Tablas estadísticas y papeles probabilísticos .....'.........413 Otras
publicaciones...,
Prólogo
gamma
..............435
Los estudios hidrológicos requieren del análisis de
cuantiosa información hidrometeológica; esta información puede consistir de datos de precipitación, caudales, temperatura, evaporación, etc.
Los datos recopilados, solo representan una información en bruto, si éstos se organizan y analizan en forma adecuada, proporcionan al hidrólogo una herramienta de gran utilidad, que le
pero
permite tomar decisiones en el diseño de estructuras hidráulicas.
úiliza los conceptos de probabilidades y estadística, siendo este campo, una de las primeras áreas de la ciencia e ingeniería, en usar los conceptos Para el análisis de la información, la hidrología
I
l
cstadísticos, en un esfuerzo para analtzar los fenómenos naturales.
I
I
La presente publicación bajo el nombre de Hidrología Estadística, 3¡tá orientada a ayudar a comprender los principios fundamentales dc la probabilidad y la estadística, aplicada ala hidrología, así como, mosffar algunas herramientas estadísticas, que han sido aplicadas gon éxito, en la solución de problemas hidrológicos. Prra la simplificación del análisis de la abundante información, se Fquiere del uso de la computadora digital, es por eso, que el autor hl desarollando la aplicación HidroEsta, que tiene la finalidad de Prccesar fácilmente esta información. Ella se utiliza en la solución d¡ los ejemplos resueltos.
F Prólogo
-
Hidrología Estadística
página (12)
La publicación cubre los siguientes temas:
! capitulo I,
conceptos básicos, incluyendo los eventos, probabilidades, variables aleatorias, distribuciones, función densidad, función acumulada, valor esperado, momentos y
.
.
capítulo
II,
capítulo
III,
distribuciones de frecuencia de una muestra, su representación tabular y gráfica, y su procedimiento de cálculo.
de las
distribuciones, como media, mediana, moda, medidas de dispersión, medidas de simetría y asimetría, y medidas de achatamiento, también se incluye el cálculo de los parámetros estadísticos utilizando la técnica de los
medidas
momentos lineales.
. .
capítulo IV, estimación de parámetros, mediante método gráfico, mínimos cuadrados, momentos y máxima verosimilitud.
capítulo V, pruebas de bondad de ajuste, dentro de las cuales se contemplan el ajuste gráfico, Chi-cuadrado y SmirnovKolmogorov.
. .
capítulo IX, completación y extensión de series hidrológicas, utilizando la correlación lineal, para llenar registros con valores incompletos, o para extender registros cortos, con base en otros
. .
X, técnicas de generación de números aleatorios uniformes, normales y log-normales, y de series sintéticas. capítulo
capítulo XI, la estimación de los intervalos de confianza, parala media y varianza de la población, a partir de datos muestrales.
Como anexo se incluye la transformada de Laplace y la función gamma completa, conceptos matemáticos de gran importancia, que ayudan a simplificar los cálculos que se realizan en la estimación de parámetros y distribuciones teóricas. También, se incluye un listados de funciones trigonométricas, que ayudan al lector, en los ejercicios de transformada de Laplace. Por otro lado, se incluye un apéndice con las tablas estadísticas más usuales, las cuales ayudan en los cálculos a realizar, así como los papeles probabilísticos normal, log-normal, Gumbel y log-Gumbel.
capítulo VI, distribuciones teóricas más utilizadas en hidrología, como la normal, log-normal, gamma, log-Pearson tipo III, Gumbel y log-Gumbel.
capítulo
VII,
conceptos
de
correlación
y
regresión, los
y
coeficientes de correlación determinación, las ecuaciones de regresión lineal y no lineal simple, las ecuaciones de regresión lineal y no lineal múltiple, y la ecuación de regresión polinomial.
.
página (13)
registros mas largos.
transformación lineal de variables aleatorias.
.
-
capítulo VIII, análisis de consistencia, como el análisis visual, doble masa, estadístico con los análisis de saltos y tendencias.
El autor desea expresar su agradecimiento, a aquellas personas que de una u otra manera, han estado involucradas con la elaboración de enta publicación, como por ejemplo: los estudiantes de la Escuela de ,lngeniería Agrícola, quienes utilizaron, como texto la versión proliminar de esta publicación, en el curso Estadística Aplicada, el dlscñador gráfrco, Rafael Murillo que trabajó con las ilustraciones, cl estudiante Gerardo Espinoza, por la dígitalización de parte del toxto y Alexis Rodríguez del Instituto Costarricense de Electricidad (lCE), por sus acertadas sugerencias.
,7 Prólogo
-
página(l4)
Un agradecimiento muy especial, al Comité Regional de Recursos Hidráulicos (CRRH), por el apoyo económico, pors financiar la primera edición, y por hacer llegar el libro a todos los países de Centroamérica.
Máximo Villón Béjar
Conceptos básicos 1.1 Espacio muestral Es el conjunto de todos los posibles resultados de un experimento.
un
experimento, no es posible determinar con seguridad su resultado, si se puede, definir con precisión un listado de los resultados posibles de ocurrir. Esta lista constituye el espacio muestral, y se designa como §.
Aún cuando en
ffjemplos
l,
I:1
.
Si el experimento consiste en lanzar una moneda, los resultados posibles son escudo o corona, luego el espacio muestral se representa como:
S = { escudo, corona } tlonde: NS = 2 llcndo, Ng : número posible de resultados del espacio muestral
7,
Si el experimento consiste enlanzar un dado, el espacio muestral será:
t7 Conceptos básicos
S=
-
página (16)
Hidrologfa Estadística
-
página (lZ
)
Nc=6
t 1,2,3,4,5,61
N^s=6
3. Si el
experimento consiste en lanzar
2
dados,
el
espacio
muestral, de la suma de los resultados de los dos dados, será:
S= {2,3,4,5,6,7,8,9, 10, ll,L2l = l1
L.3 Definición clásica de probabilidad La probabilidad P(AL de un evento A, en un experimento aleatorio y de los cuales N¿, son
que tiene N5 resultados igualmente posibles, resultados favorables, esta dada por:
N.s
pre)=+ ...(t.t) Ns
1.2 Eventos Son los resultados posibles que se pueden presentar enlarealización de un experimento. Es un subconjunto del espacio muesffal.
Ejemplos
1.
\iemplos 1.3
l,
i.2
Al anojar
una moneda, la probabilidad de que salga escudo, es:
P=!
En el experimento de lanzar una moneda el evento A, que salga escudo es:
4=
{ escudo } donde: NA= | siendo, N¿ : número posible de resultados del experimento
2
Al anojar un dado, hay seis casos igualmente posibles, la probabilidad de que salga un número igual o mayor que 3 es:
P=!-z' 63
lanzar un dado, el evento B que salga número mayor o igual que 3, es:
Al anojar dos dados, hay 36 casos igualmente posibles, la probabilidad de que la suma de los resultados sea 7, es:
B = {3,4,5,6} NB=4
P=9=r 366
2. En el experimento
3. En el experimento
lanzar dos dados, el evento C, que salga un
es:
C
= { (1,6), (6,1), (2,5), (5,2), (4,3), (3,4) I
En una urna se tienen dos bolas rojas y ocho bolas negras, hallar la probabilidad que al extraer una bola, esta sea de colór rojo.
Conceptos básicos
-
página (18)
Hidrología Estadfstica
2. P(IC'¡
o-2 -l ----
105
página (19)
l. P(a)=g
De los 10 casos igualmente probables, en 2 casos sucederá el evento que se considera, por lo que se tendrá:
I
-
= 1 - P(A), dohdeACes el complemento deA
Los axiomas anteriores, permiten la definición de los siguientes conceptos importantes
:
El
concepto clásico de probabilidad sólo se puede aplicar en experimentos en los que hay un número finito de casos igualmente posibles. Pero en la naturaleza, los principales problemas prácticos no son de este tipo.
Probabilidad de Ia unión de sucesos Si A
yB
son eventos cualesquiera en un espacio muestral §,
entonces:
1.4 Definición axiomática de probabilidad
.
P(A U B) = P(A) + P(B) - P(A
n
B)
...(r.2)
Sea S un espacio muestral asociado a un experimento, y
A cualquier suceso de S (A subconjunto de S). Se dice que P es una función de probabilidad en el espacio muestral S, si se satisfacen los siguientes
La P(A U B), es llamada unión de probabilidades y se lee la probabilidad deAoB.
tres axiomas:
Probabilidad de eventos independientes
1.
0 < P(A) SI,paru
todoA e
Si
,S
A y B son eventos independientes de un espacio muestral
§,
cntonces: 2. P(S) 3
=I
P(A
Si 47, A2,..., A¡¿ es una serie de sucesos, independientes mutuamente excluyentes, entonces:
a
B) = P(A) x
P(B)
.. . (1.3)
La P(A n B), es llamada Ia probabilidad de intersección probabilidadde Ay B.
probabilidad ocurrencia de uno, no se ve afectada por la ocurrencia del otro, son matuamente exéluyentes, cuando la ocurrencia de imposibilita la ocurrencia del otro. De estos axiomas, se deducen los siguientes teoremas:
Probabilidad condicional §l e y B son dos eventos en los cuales P(A) + 0, entonces, la probabilidad condicional de que ocrrra el suceso B, dado que tucedió A, se define por:
7 Conceptos básicos
-
página (20)
P(BtA\-P(A.B) P(A)
Ejemplo 1.4 Supóngase que el río Turrialba alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.2. En el río Turrialba, cuando atraviesa la ciudad del mismo nombre, hay un puente cuya probabilidad de falla en los estribos es 0.3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0.5. Con estos datos se desea conocer la probabilidad de falla en eI puente.
Solución: De acuerdo a los datos del problema, se tiene: Probabilidad ocurrencia de la creciente: P(C) = 0.2 Probabilidad no ocurrencia de la creciente: p(C) = 1-0.2 = 0.8 Probabilidad falla: P(O = 0.3 Probabilidad no falla: P(F1= I - 0.3 = 0.7 Probabilidad falla dada la creciente: P(Flq =O.5
El puente falla (queda inutilizado), cuando falla en los estribos cuando hay creciente; esto se representa de acuerdo a Ia (L.2), de la siguiente forma: P(CU F)= P(A+ P(D - P(C nfl ... (1.5)
De otro lado, de la ecuación (1.4) de la probabilidad condicional, tiene:
P(F'tC)='(?.2,') = p(CnF) = p(c)xp(F tC) P(C) Luego: P(C o F) =O.2 x 0.5 = 0.1
Hidrología Estadística
-
página (21)
Sustituyendo valores en la ecuación (1.5), resulta: P(CU F)=0.2+0.3 -0.1
P(CU F)=0.4 .'. La probabilidad de falla en el puente es del 40 7o.
1.5 Período de retorno (T) Se define el pertodo de retorno T, como el intervalo promedio de tiempo en años, dentro del cual un evento de magnitud x puede ser igualado o excedido, por lo menos una vez en promedio. Así, si un evento igual o mayor a -r, ocurre una vez en I años, su probabilidad de ocurrencia P, es igual a I en Tcasos, es decir:
p(x > *> =
l;
I
... (1.6)
ó
fdonde
-I P(X > x)
...fi.7\
:
P(X>x ) = probabilidad
de ocurrencia de un evento
f = período de retorno
>.r
L¡ definición anterior, permite indicar que la probabilidad de que x ll0 ocuna en cualquier año; es decir, la probabilidad de ocurrencia ,Ét un evento <.r, se expresa como:
P(X-x) le:
Pk ,T
...(1.8)
,'-lr(x
...(1.e)
1
F Conceptos básicos
-
págirc(22)
Hidrología Estadística
donde:
período de retorno P(X>x) = probabilidad de excedencia P(X
P
Tabla 1.1 Período de retorno de diseño recomendado, para
corta duración Drena¡e de aeropuertos Drenaie urbano Drenaie Aqrícola Muros de encauzamiento Alcantarillas para carreteras
Periodo de Retorno laños)
50-100 25
P=L-P 1
=l-1T
P
Si se supone que la no ocurrencia de un evento en un año cualquiera, es independiente de la no ocurencia del mismo, en los años anteriores y posteriores, entonces la probabilidad de que el evento no ocurra en n años sucesivos ó confiabilidad, es:
5-10
1-2
P.P....P n factores
5
2-10
5-10 2-50* 1.1
-5
-/-
1.6 Concepto de Riesgo (R) Si un evento de diseño, por ejemplo un caudal de diseño Q, tiene un período de retorno de T años, y una probabilidad de excedencia P, de acuerdo al apartado anterior, se cumple:
T
- Pn =1,(.- 1)' r)
La probabilidad de que el evento, oculTa al menos una vez en r¿ años sucesivos, es conocida como riesgo o falla R, y se representa por: R = 1- (P)'
* Puede aumentar si estas obras protegen poblados de importancia.
p=!
probabilidad de ocurrencia de un caudal > Q período de retorno
La probabilidad de que Q no ocuna en cualquier año; es decir, la probabilidad de ocurrencia de un caudal < Q, es:
estructuras menores
Puente sobre carretera menos importante o alcantarillas sobre carretera imoortante Alcantarillas sobre camino secundario Drenaje lateralde los pavimentos, donde puede tolerarse encharcamiento con lluvia de
-
I-
En la tabla 1.1, se muestran los períodos de retorno recomendados, para el cálculo de caudales de diseño de estructuras menores.
Puente sobre carretera importante
págha (231
donde:
I-
Tipo de estructura
-
n=
r-[r-+)'
(1 ro)
donde:
R=riesgoofalla
I-
período de retorno n = vida útil del proyecto
Conceptor básicos
-
Hidrología Estadfstica
p&gina (24l-
Con el prrámetro riesgo, ee posiHe determinar cuáles son las implicaciones, de seleccionar un período de retorno dado de una obra, que tiene una vida útil de n años.
l,-1)'=r-R r]
I
1-:=1r-n)i T\
Para diferentes valores de períodos de retorno (7) y diferentes valores de vida útil (n) de las obras.
La probabilidad de que se presente al menos un evento de probabilidad llT en I años es: 1- (l - lfi)r, que para un peíodo
largo tiende a ser 0.6321. En consecuencia, si la vida útil de una estructura y el período de retorno de diseño son iguales, la probabilidad de que la capacidad de la estructura sea excedida durante la vida útil es muy alta. Por lo tanto, el período de retorno debe rer mucho mayor que la vida útil de la estructura para estar razonablemente seguros de que ningún valor exceda su capacidad. Sin embargo, para cualquier período de retorno de diseño que se seleccione, siempre hay una probabilidad de que el valor sea excedido; por supuesto, si se selecciona un período de retorno de diseño muy alto en comparaeión con la vida útil de la estructura, la probabilidad de que su eapacidad sea excedida podrá ser muy b{a, pero siempre existe.
página (25]l
Despejando T de la ecuación (1.10), se tiene:
En la tabla 1.2, se muestran algtmos valores de riesgo.
T
-
1
T
--J , r-(r-n);
(l.ll)
...
En la tabla 1.3, se presentan valores de T, para diferentes valores de riesgo (R) y diferentes valores de vida úül (n) de las obras. Tabla 1.3 Valores de T, en función de R y n Vida
R
299
5 498
995
25 2488
149
248
495
1238
59 29
98 48
195
488
18
95 35
238
11
3
0.01
100
2 199
o.o2 0.05 0.10 0.25 0.50
50 20
99 39
10
19
4 2 1.3 1.0
7 3 2
5
I
2.7
4.1
111
1.27
1.66
0.75
0.99
10
15
7.7 2.7
87 37
50
100
2lJlJ
4975
99s0
2475 975 475 174
4950 1 950 950 348 145 73 22
1990 0 9900 3900 1899 695
18
73 37
5.9
11
289 144 44
Ejemplo 1.5: Determinar el riesgo o falla de una obra que tiene una vida útil de 15 años, si se diseña para un período de retorno de 10 años.
F Conceptos básicos
- página (26)
Hidrología Estadística
Solución:
página (27
Z=10y n=15 Sustituyendo valores en la ecuación (1.10), se tiene:
Tabla 1.4 Fórmulas para determinar la probabilidad experimental
R=1-1,-l)"
Fórmula empírica
10J
R =0.7941=79.417o
Probabilidad experimental acumulada P
California
Si el riesgo es de 79.41Vo, se tiene una probabilidad del79.4lVo de que la obra falle durante su vida útil.
m n
Hazen
m-1
2
Ejemplo 1.6: Para el diseño de una estructura hidráulica, con vida
Blom
Tukey
.'.f=238años
experimental Dado un conjunto de datos ordenados:
m-0.3 n+0.4
Chegadayev
=237'78
1.7 Cálculo de la probabilidad empírica o
nll
'i
Solución: De los datos del ejemplo, se tiene: T=l0Vo=0.Ly n= 25 años Sustituyendo valores en la ecuación (1.1 1), se tiene:
11 ' =1-grno* l-(l-o.l),5
n m
Weibull
útil de 25 años,
se acepta sólo el IO %o'de riesgo. ¿Qué período de retorno se debe escoger para el diseño de la estructura?
T=
I
XlrX2, I3r...,fN Existen varias fórmulas para calcular la probabilidad de ocurrencia los datos ordenados, los cuales se muestran en la tabla 1.4. "de-
De los datos del ejemplo, se tiene:
[
-
m-a
Gringorten
n
donde
*7- 2a
:
-
probabilidad experimental acumulada o frecuencia relativa empírica m= nimeto de orden n = número de datos P
Conceptos básicos
-
págna (2Bl
a = yalor comprendido en el intervalo
O
de n, de acuerdo amst a la siguiente tabla: n 10 20 30 40 a o.448 o.443 0.442 0.441 n 60 70 80 90 a 0.440 o.440 o.440 0.439