46
2.6 DISTRIBUCIÓN EXTREMA TIPO I (GUMBEL) Si se toma los valores extremos (máximos o mínimos) de N muestras con con n elem elemen ento toss cada cada una, una, se encu encuen enttra qu quee su dist distri ribu buci ción ón de probabilidades se aproxima a una forma asintótica, a medida que n se incrementa. El tipo de la forma depende del tipo de distribución inicial de los n valores. La distribución de los máximos o mínimos se da por la siguiente expresión: p n ( x) = P ( a n x + bn )
(2-161)
an y bn vienen a ser funciones de n. FISCHER y TIPPET han mostrado que existen tres posibles soluciones para la ecuación general 2-161 (Verma y Advani, 1973), y se denominan tipos I,II,III. El tipo I es una función ilimitada, el tipo II tiene un límite inferior y el tipo III, un límite superior. La distribución tipo I o de Gumbel (Gumbel,1958) se usa frecuentemente para eventos extremos máximos y resulta de una distribución inicial ilim ilimit itad adaa del del tipo tipo exp expon onenc encia ial, l, la cual cual conv converg ergee haci haciaa un unaa funci función ón exponencial. Ejemplos de este tipo incluyen a las funciones normal y lognormal. La función tipo I para una función exponencial simple se deriva como sigue: a) Asumiendo las serie E1,E2,En de variables aleatorias independientes con distribución de probabilidades acumulativas dada por : (2-162)
P(x)=P(Ev≤y)
b) Definiendo a Xn como el valor máximo de E en una muestra de longitud n, es decir max Ev, tal que: P ( X n
≤ y ) = P ( E 1 ≤ y, E 2 ≤ y,..., E n ≤ y ) P ( X n ≤ y ) = [ P ( y )]
n
(2-163) (2-164)
47
c) Ahora, asumiendo que la cola de la distribución P(y) es exponencial, tal que: − y (2-165) P ( y ) =1 − α e d) De la ecuación 2-164, si ln( n) es una constante normalizada.
P [ X n
≤ y + ln(α n)] = [ P ( y + ln(α n))] n
Y la ecuación 2-165 P ( y + ln(α n)) =1 − α e
(2-166)
(2-167)
−( y +ln(α n ))
En tal forma que: P ( X n ≤ y + ln(α n))) = [1 − α e
Ó P ( X n
]
(2-168)
−( y + ln(α n )) n
[
≤ y + ln(α n))) = 1 − e
− y
/ n]
(2-169)
n
(e) si n tiende al infinito, entonces: − [ ≤ + = − ( ln( α )) 1 / n] p X y n e n lim lim y
n→ ∞
n
(2-170)
n→ ∞
Ó lim p( X n
≤ y +
ln(α n)) = e
−e
− y
(2-171)
n→ ∞
Está última expresión es la forma reducida de la distribución de (2-172) probabilidades acumulativa haciendo Y= (x-B)
Se obtiene: P ( x )
= e −e
(2-173)
−α ( x − B )
Donde es el parámetro de concentración, B es una medida de la tendencia central. La densidad de probabilidades es:
p ( x ) = α e {−α ( x − B ) −e
−α ( x − B )
}
2.6.1 ESTIMACIÓN DE LOS PARÁMETROS
(2-174)
48
2.6.1.1 MÉTODO DE LOS MOMENTOS. Aplicando la ecuación estándar para la generación de momentos con respecto al origen a la “pdf” de la función reducida extrema tipo I: ∞ ´
µ y , r
= ∫ y r * e − y
−e − y
(2-175)
dy
−∞
Haciendo Z= e-y resulta: ∞
µ y´ , r
= ∫ ( −ln Z ) r * Z * e −z * (−1 / z )dz
(2-176)
0
Luego, el primer momento con respecto al origen es: ∞
´ y , r
µ
= ∫ ln Z * Z * e −z * dz / z
(2-177)
0
∞
Pero, como ∫ Z * e −z * dz = Γ (1) de KENDALL y STUART (1963) se 0
tiene:
(2-178)
= −ψ (1) = γ E
µ y´ ,1
γ E =0 .5772157
Constante de Euler
Considerando la variable original x=y/ +B se tiene:
(2-179)
µ = β + γ E / δ ´ 1
En forma similar, GUMBEL (1958) ha mostrado que el segundo momento (2-180) con respecto al promedio, μ2, está dado como: 2 2 2 2 µ 2 = π /(α * 6) = π / 6(1 / α ) De las dos últimas expresiones se pueden despejar
y B:
α = 1.2825 / σ β = µ − 0.4500σ
(2-181) (2-182)
Donde μ y σ son los parámetros estadísticos de la muestra. Los coeficientes de asimetría y curtosis son constantes para la distribución extrema tipo I e iguales a 1.14 y 5.4 respectivamente.
2.6.1.2 MÁXIMA VEROSIMILITUD
49
El método postula la tesis de que y B deben ser tal que la probabilidad de n eventos máximos individuales X1,…Xn, observados como dos(2-183) n picos anuales, debe ser un máximo. La probabilidad que X1 ocurra como un evento pico anual es: p ( x1 ) = α exp{ − α ( x1 − β ) − exp[ − α ( x1 − β )]}
Para X2: p( x 2 ) = α exp{ − α ( x 2
−
β ) − exp[ − α ( x 2
−
β )]}
(2-184)
Por lo tanto: p( X 1 ,......., X n ) = p( X 1), p( X 2),..., p( Xn) = n n α exp−α ∑( X i − β ) − ∑ e−α ( xi − B ) i =1 i =1
(2-185)
n
Luego, de acuerdo al método, se toma el logaritmo de la ecuación 2-185 y se deriva parcialmente con respecto a y B. y se iguala a cero. n n −α ( xi − B ) (2-186) ln L = n ln α − α ( xi − B) − e
∑
∑
i =1
i =1
∂ ln L n = − ∑ ( xi − B) + ∑ ( xi − B)e −α ( xi −B ) ∂α α i =1 i =1 n ∂ ln L = nα − α ∑ e −α ( xi− B) ∂α i =1 n
n
(2-187) (2-188)
Igualando 2-189 a cero se tiene: n
∑
(2-189)
e −α ( xi − B )
i =1
Luego, e
αβ
n
= n / ∑ e −α xi
(2-190), ó
i =1
n −α ( xi ) B = 1 / α * ln n / ∑ e i =1
(2-191)
Reemplazando en 2-188 el promedio aritmético por su símbolo μ, se tiene: n ∂ ln L n (2-192) = − − + α B − −α ( xi)
∂α
α
n( µ B)
e
∑ ( xi i =1
B)e
50
Sustituyendo la ecuación 2-190 en 2-192 se tiene: n
∂ ln L ∂α
=
n α
n ∑ ( xi − B )e −α ( xi )
(2-193)
i =1
− n ( µ − B ) +
n
∑
e −α ( xi )
i =1
Igualando está última expresión a cero y simplificando se obtiene: F (α ) =
n
∑ ( xi)e
n
− ( µ − 1 / α )∑
−α ( xi )
i =1
e
−α ( xi )
(2-194)
=0
i =1
Está última expresión no puede resolverse analíticamente para PANCHANG (1967) usa la expresión de Taylor en la siguiente forma: F( F( F´(
)=F(
j+1
)=F(
j+1
j
j
(2-195)
+ h j)
) + h j F´(
j
(2-196)
)
) es la derivada de primer orden de F( ) con respecto a
j
n
F ´(α ) = −∑ Xi e 2
−α ( xi )
n
+ ( µ − 1/ α )∑ X i e
i =1
−α ( xi )
i =1
n
2
− 1/ α
∑
e−α ( xi )
(2-197)
i =1
son aproximaciones sucesivas de . El procedimiento adoptado por PUNCHANG consiste en estimar j por el método de los momentos. Luego, evaluando F( j) y F´( j) de las ecuaciones 2-194 y 2-197 se tiene:
j y
j+1
h1= - F( (
)
(2-198)
)+h1
(2-199)
) / F´(
1
)=(
2
1
1
El procedimiento se repite hasta obtener valores de F( 1) suficientemente pequeños, cuando B se obtiene de 2-191 normalmente sólo se requiere 3 ó 4 pasos.
2.6.2 OTROS MÉTODOS VRMA Y ADVANIL (1973). Usan una aproximación simple para estimar y β.
51
Suponiendo que Xmax y Xmin son los valores extremos máximos y mínimos de una serie de n eventos máximos, los eventos transformados Ymax y Ymin. Son: (2-200) Ymax= (Xmax –β) (2-201) Ymin= (Xmin –β)
Tomando como 1/n a la probabilidad de excelencia de Xmax y 1/1,01 a la probabilidad de excelencia de Xmin, son válidas las siguientes expresiones: Ymax = -Ln(-Ln(1-1/n)) Ymin = -Ln (-ln(1-1/1,01))
(2-202) (2-203)
Reemplazando estas dos últimas expresiones en las dos anteriores, y resolviendo simultáneamente ambas ecuaciones, se obtienen los estimados por y β (usando la expansión log y despreciando Ten 2º orden)
YEVJEVICH (1972) describe en procedimiento gráfico para estimar β. Si se hace en (2-173) X=β, P(B)= e-1=0.368
y
(2-204)
Graficando los eventos X contra T =(n+1)/m en un papel doble exponencial y ajustando una línea recta a los puntos, se determine B entrando en el gráfico con T=1/p(B) = 2.717. La pendiente de la recta es 1/ . Como se puede observar el método es muy sencillo, pero su precisión no es comparable con el de máxima verosimilitud.
2.6.3 FACTOR DE FRECUENCIA De la función de distribución de probabilidades dada en 2-171 se deduce la expresión que relaciona la variable reducida, y, con el período de retorno, T. YT=-Ln(-Ln((T-1)/T))
(2-205)
52
En la Tabla 2.11 se presentan algunos valores de YT para diferentes T
Tabla 2.11 Valores de Yt en función de t para la Distribución Extrema Tipo 2 T 2 5 10 20 50
YT 0.3665 1.4999 2.2506 2.9702 3.9019
T 10 500 1000
YT 4.6001 6.2136 6.9073
Fuente: Guevara (1998)
Ordenando los n eventos de acuerdo a su magnitud (m=1 para el mayor, m=n para el menor), T=(n+1)/m, la ecuación 2-205 es: Ym = -Ln (-Ln((n+1-m)/(n+1)))
(2-206)
Calculando los parámetros estadísticos (μy, σy) de la serie Ym (m=1, 2.n) n (2-207) µ = Ym / n
∑
y
m =1
n
σ y = ∑ (Ym − µ y ) 2 / n
(2-208)
m =1
Los parámetros y β pueden definirse en función de μy, σy y los parámetros μ y σ de los datos observados: (2-209) α = σ y / σ
β = µ − µ y / α
Ahora bien, introduciendo estas expresiones en la expresión ym = α ( x − B )
Y reordenando para x se obtiene: X = µ + (Ym − µ y )σ / σ y
(2-210) (2-211) (2-212)
Comparando esta última expresión con la ecuación general de frecuencia se obtiene para la distribución extrema tipo I: K= (Ym-μy)/σy
(2-213)
Debido a que µ y , σ y Sólo son una función de n (tamaño de muestra), sus valores pueden ser tabulados. En la Tabla 2.12 se dan algunos valores
53
típicos. Alternativamente, se pueden tabular los valores de K para diferentes valores de T y n. En la Tabla 2.13 se presentan algunos valores típicos. WEISS (1955) presenta una solución gráfica para la Ecuación 2-212, en términos del promedio y desviación estándar de la muestra. CHOW (1954) considera a la distribución extrema tipo I como un caso especial de la distribución log-normal, con un coeficiente de asimetría, γ 1 , constante de 1.1396. De la Ecuación 2-173, el evento XT se puede relacionar con T como sigue: 1 (2-214) X T = B − ln[ − ln (1 − 1 / T ) ] α
Donde T=1/(1-P(x)). La sustitución para por el método de los momentos arroja: X T
y β de las soluciones obtenidas
= µ − { 0.45 + 0.7797 ln(− ln[1 − 1 / T ]}σ
(2-215)
Comparando esta ecuación con la ecuación estándar de frecuencia, se obtiene como factor de frecuencia para la distribución extrema tipo I. K = −{ 0.45 + 0.7797 ln(− ln(1 −1 / T ))}
(2-216)
En la última columna de la Tabla 2-12 se dan los valores de K calculados por la Ecuación 2-217. Estos valores corresponden a las condiciones límites de la Ecuación 2-214, es decir, n→∞
Tabla 2.12 Desviación Estándar y Promedio de Orden Estadístico, m/n+1, para diversos tamaños de muestras, n
54
Fuente: Guevara (1998)
Tabla 2.13 Factor de Frecuencia para Distribución Extrema Tipo I
55
Fuente: Guevara (1998)
2.6.4 CÁLCULO DEL ERROR Figura 2.3 Nomograma para elESTÁNDAR uso con la distribución Extrema Tipo I 2.6.4.1 MÉTODO DE LOS MOMENTOS. Anteriormente se dio la ecuación general para calcular el error estándar de la distribución de dos parámetros, como: 2 µ K 2 (2-217) [γ 2 − 1] S T = 2 1 + K γ 1 + n 4 Del método de los momentos se tiene: (2-218) γ 1 = 1.1396 (2-219)
γ 2 = µ 4 / µ 22 = 5.4002
Luego: S T 2 =
σ 2 n
[1 + 1.1396 K + 1.10 K ] 2
(2-220)
Tomando la raíz cuadrada y simplificando se tiene: S T = δ σ 2 / n = δσ / n
(2-221)
Los valores de δ dependen solo de K y por lo tanto pueden tabularse en función , n y T. en la Tabla 2.14 se presenta dicho cálculo.
Tabla 2.14 Parámetro δ para el uso en el Error Estándar de la Distribución Extrema Tipo I
56
Fuente: Guevara (1998)
2.6.4.2 MÉTODO DE MÁXIMA VEROSIMILITUD. Debido que el coeficiente de asimetría es constante para la distribución extrema tipo I, el estimado de máxima verosimilitud para St es: 2 T
S
∂ X 2 = ∂α
2
∂ X var α + ∂β
var B
+ 2 ∂ X ∂X cov(α , β ) ∂α ∂β
De 2-211 se tiene: XT=B+YT/ Luego:
Y
2 T
S =
(2-223)
∂ X = −Y T / α 2 ∂α
Y T 2
α
4
(2-222)
(2-224)
∂ X =1 ∂β
(2-225)
Y T
(2-226)
var α + var β − 2
α
2
cov(α , β )
De la ecuación de máxima verosimilitud 2-186, las derivadas parciales son: 2
∂ ln L 2
∂α
∂
2
=−
n
α
ln L
∂ B
2
2
n
− ∑( Xi − B ) e 2
−α ( xi − B )
(2-227)
i =1
= −α
2
n
*
∑e
−α ( xi − B )
(2-228)
i =1
n ∂2 ln L = n + α ∑( Xi − B)2 e−α ( xi − B ) ∂α ∂β i =1
(2-229)
57
Sustituyendo la ecuación 2-189 se tiene: 2
∂ ln L 2
∂β
(2-230)
2
= −nα
De KIMBALL (1946) se tiene: 2
∂ ln L 2
∂α
(2-231)
2
= −1.8237n / α
∂2 ln L = −0.4228n ∂β ∂α
(2-232)
La matriz de información arroja: Var = 0.6079 2/n Var B = 0.2570/n
(2-233) (2-234)
Cov( ,B) = 1.1086/
(2-235)
2
n
Sustituyendo estas últimas expresiones en la ecuación 2-226 se obtiene: 1 (2-236) [1.1086 + 0.5140Yt + 0.6079Yt 2 ] S T 2 = nα 2
Está última es equivalente a la expresión dada por KIMBALL: S T 2 =
1 nα
2
[1 + (1 − γ
e
(2-237)
+ Y T ) 2 /(π 2 / 6)]
Las ecuaciones 2-236 y 2-237 se pueden simplificar a la siguiente expresión: (2-238) S T = δ l / α n En la tabla 2.15 se dan los valores de δ l Para algunos valores de T. Para establecer una comparación con los estimados por momento, se usa la relación entre y σ dada en 2-181, lo cual resulta:
(2-239)
S T = δ m σ 2 / n
La última línea de la tabla 2.15 muestra los resultados de uso de la ecuación 2-239
TABLA 2.15 Probabilidad
δ m
mediante el
58
Probabilidad acumulativa, P en porcentaje 80 90 95 98 Período de retorno, T correspondiente 5 10 20 50 Valor de δl en ecuación 2-238 1.8020 2.3118 2.8282 3.5171 Valores de δm en ecuación 2-239 1.0956 1.4055 107195 2.1383
50 2 1.1742 0.7139
99 100 4.0420 2.4574
Fuente: Guevara (1998)
Comparando los valores de δl de la tabla 2.14 con los de δm de la tabla 2.13 se encuentra que los resultados de los momentos son mayores que los de máxima verosimilitud.
2.7 DISTRIBUCIÓN PEARSON TIPO III La densidad de probabilidades de la función Pearson tipo III tiene la siguiente expresión: X − γ p( x) = J ( β ) α α 1
β −1
x −γ
−
e
son parámetros por definir de la función y GAMMA. α , β , γ
(2-240)
α
J ( β )
Es la función
La ecuación 2-240 se puede simplificar introduciendo la sustitución y=(xγ )/ β −1 − y y e (2-241) p ( y ) =
J ( β )
Está última expresión viene a ser la distribución Gamma de un parámetro descrito en muchos textos de estadística.
2.7.1 ESTIMACIÓN DE PARÁMETROS
59
2.7.1.1 MÉTODO DE LOS MOMENTOS. Sustituyendo la ecuación 2-240 en la ecuación general para los momentos con respecto al origen se tiene: ∞
´ 1
µ
= ∫ X
r
0
β −1
x − γ α Γ ( β ) α 1
x −γ
− e
α
dx
(2-242)
Reemplazando t por (x- γ )/ , la última expresión se simplifica en:
∞
µ r ´
= 1 Γ ( β ) ∫ (α y + γ ) r y B −1 e −y dy 0
(2-243)
La expresión 2-244 se puede evaluar, sabiendo que la función GAMMA está dada por: ∞
∫ y
β −1
e −y dy = Γ ( β )
(2-244)
0
Por lo tanto, para r=1, el primer momento con respecto al origen, µ 1´ , se tiene: ´ µ 1 =
1
∞
(α y Γ ( B ) ∫
B
e − y +γ y B −1e − y )dy
(2-245)
0
µ 1´
=
α Γ ( β + 1)
Γ ( B)
Γ ( β ) + γ = αβ + γ Γ ( β )
(2-246)
Para r=2 µ 2´ = α 2 β ( β + 1) + 2αβ γ + γ 2
(2-247)
Debido a que: µ 2 = µ 2´ − ( µ 1´ ) 2
(2-248)
El segundo momento central será: µ 2 = σ 2 = α 2 β
(2-249)
En forma similar, los momentos centrales de orden superior son: µ 3 = 2α 3 β µ 4 = 3α 4 β ( β + 2 ) µ 5 = 4α 5 β ( β + 2 ) µ 6 = 5α 6 β ( 3β 2 + 26 β + 24 )
Definiendo las siguientes relaciones entre los momentos: γ 1 = µ 3 / µ 23 / 2 (Asimetría) γ 2 = µ 4 / µ 22 (Curtosis)
(2-250) (2-251) (2-252) (2-253)
(2-254) (2-255) (2-256)
60
γ 3 = µ 5 / µ 25 / 2 γ 4 = µ 6 / µ 23
(2-257)
Se pueden definir los parámetros γ 2 − γ 4 En términos γ 1 de Para la distribución Pearson III como sigue: γ 2 = 3(1 + γ 12 / 2
(2-258)