i. Dist Distri ribu buci ción ón Gumb Gumbel el.. La distrib distribuci ución ón de valore valoress Tipo Tipo I conoci conocida da como como distrib distribuci ución ón Gumbel Gumbel o Doble Exponencial, Exponencial, tiene como función función de distribución distribución de probabilidades la siguiente expresión: − e− α ( x − β
F ( x ) =e
Utiliza Utilizando ndo el mtodo mtodo de moment momentos, os, se obtien obtienen en las siguie siguiente ntess relaciones: β μ =
α =
−
0.45 σ
1.2825 σ
Donde:
α : !ar"metro de concentración# β
: !ar"metro de localización#
$Es tambin conocida con el nombre de distribución de valores extremos Tipo Tipo I# Este modelo representa la distribución l%mite del ma&or valor de n valores independientes e idnticamente distribuidos con una distribución tipo exponencial a medida 'ue n crece indefinidamente(
a. Pruebas de bondad bondad de ajuste. Las pruebas de bondad de a)uste son pruebas de *ipótesis 'ue se usan usan para ara eval evalua uarr si un con con)un )unto de datos atos es una muest uestra ra independiente de la distribución elegida# En la teor%a elegida estad%stica, las pruebas de bondad de a)uste m"s conocida es la +olmogorov -mirnov#
- Prueba Prueba Kolmo Kolmogor gorov ov-- Smirnov Smirnov.. La prueba de bondad de a)uste estad%stico +olmogorov. -mirnov con consid sidera era la desv desvia iaci ció ón de la func funció ión n de distr istrib ibu ució ción de probabilidades de la muestra !/x0 de la función de probabilidades teórica, escogida !o/x0 tal 'ue:
( ) − P ( x ) ]
D n=max [ P x
0
La prueba re'uiere 'ue el valor D calculado con la expresión anterior sea menor 'ue el valor tabulado
d crit .
para un nivel de
probabilidad /significancia0 re'uerido# Esta prueba es f"cil de realizar & comprende las siguientes etapas:
El valor estad%stico D es la m"xima diferencia entre la función de distribución acumulada de la muestra & la función de distribución acumulada teórica escogida# -e fi)a el nivel de probabilidad /nivel de significancia0 a, valores de 1#12 & 1#13 son los m"s usuales# El valor critico
d crit .
de la prueba debe ser obtenido de la Tabla
453, el cual est" en función de
∝
y n
, pues depende del nivel de
significancia & del n6mero de datos# -i el valor calculado D es menor 'ue el
d crit .
, la distribución
escogida se debe aceptar# !or el contrario, si el valor calculado D es ma&or 'ue el
d crit .
, la distribución escogida se debe rec*azar#
Tabla N° 1. Valores crticos d crit . !ara la !rueba Smirnov " Kolmogorov de #ondad de ajuste. Tama7o de la
8 9 1#31
8 9 1#12
8 9 1#13
muestra 2 31 32 1 2 ;1 <1
1#23 1#;= 1#; 1#> 1#< 1# 1#3?
1#2> 1#<3 1#;< 1#? 1#> 1#< 1#3
1#>= 1# 1#<1 1#;2 1#; 1#? 1#2
n grande
3#@/n0A3@
3#;>@/n0A3@
$uente% &!aricio' ())1
I.
REVICION BIBLIOGRAFICA. I.1. POBLACIÓN: Es el con)unto de ma&or de datos individuales, personas o cosas cu&o estudio nos interesa obtener información# Los datos individuales de una población se llama unidades elementales u observaciones#
Una población estadística es un conjunto de observaciones medibles o descritas para cada uno de sus unidades elementales.
I.2. MUESTRA. Es una información proporcionada por una parte nita de la población. También es considerado como un sub-conjunto propio – nito de la población.
I.3. HISTOGRAMA Y POLÍGONOS DE FRECUENCIA Son dos representaciones grcas de las distribuciones de frecuencia. !. Un "istograma o "istograma de frecuencias# consiste en una serie de rectngulos $ue tienen% -& Sus bases sobre un eje "ori'ontal (el eje )& con centros en las marcas de clase * longitud igual al tama+o de los intervalos de clase. -& Supercies proporcionales a las frecuencias de clase. B#
C.
Un pol%gono de frecuencias, es un gr"fico de l%nea trazado sobre las marcas de clase# !uede obtenerse uniendo los puntos medios de los tec*os de los rect"ngulos en el *istograma 3#
MEDIA ,a media de un conjunto de datos numéricos ) # )/# ...# ) est representada por * denida por%
#
Ing. MAXIMO VILLON BEJAR Pág. 73
3#>;@/n0A3@
0ue es el momento de orden . ,a mediana de un conjunto de n1meros ordenados en orden de grande'a# corresponde al valor del punto central ( es un n1mero impar& o la media aritmética de los dos valores centrales (en el caso $ue sea par& /. n
X
=
∑ i
Xini
=3
n
I.4. MEDIANA Es el valor de la serie de datos $ue se sit1a justamente en el centro de la muestra (un 234 de valores son inferiores * otro 234 son superiores&. o presentan el problema de estar in5uido por los valores e6tremos# pero en cambio no utili'a en su clculo toda la información de la serie de datos (no pondera cada valor por el n1mero de veces $ue se "a repetido&.
n − N −3 : = Y −3 + C ni i
M e
i
i
I.1. MODA ,ocali'a el dato de ma*or frecuencia. Es el valor del dato cu*a frecuencia es m6ima. 7Si la distribución de frecuencias tienen un solo m6imo (m6imo absoluto la moda es el valor del dato de ma*or frecuencia# * se dice $ue la distribución de frecuencias es uni- modal. 7
Si la distribución de frecuencias tiene mas de un m6imo (m6imo relativos se dice $ue la distribución de frecuencia es multimodal% 8imodal# Trimodal# etc.
7
Si todas las frecuencias son iguales se dice $ue la distribución no tiene moda * se trata de una distribución uniforme.
7 9ara :atos ;lasicados ,a moda es la marca de la clase modal. 9ara una mejor /
Ing. MAXIMO VILLON BEJAR Pág. 48.
apro6imación se puede usar la siguiente formula
Mom!"o# m$#"%&'#( m)*) ) *m"%+& , -$%"o#*#: E6isten varias clases de descriptores aritméticos# siendo los momentos el método adecuado para calcular los estadígrafos# es decir con el clculo de momentos se determina los estadígrafos o estadísticos ;omo en los cursos de esttica# resistencia de materiales# física# matemticas# etc. se calculan los momentos de órdenes primero# segundo# etc. generali'ando se tiene% momento con respecto al origen de coordenadas * momentos con respecto a la media
I.1. DESVIACIÓN MEDIA Es la media aritmética de los valores absolutos de las desviaciones de los datos con respecto a una medida de tendencia central. N
DM =
∑ Xi − estadi gra fo ⋅ de ⋅ posicion I =3
n
Si el estadígrafo es la media# se tiene% N
DM =
∑ Xi − x I =3
n
<
9ara datos no clasicados
N
DM =
∑ Xi − x ni
I =3
n
<
9ara datos clasicados
I.. D#/*&-*0! E#"!)&% , V&%*&!-*& =iden el grado de dispersión de los datos numéricos en torno de un valor medio.
,a :esviación Estndar de un conjunto de datos )# ...# )n est denida por%
,a >ariancia es el cuadrado de la desviación estndar%
,a fórmula de la varian'a ser% n
∑ ( X i − X ) V / x 0 =
ni
i =3
n
I.. COVARIANA El valor de covarian'a entre dos conjuntos de datos numéricos a * b# con puntos es denido por%
Este valor indica el grado de similitud entre los conjuntos a * b# o sea# como los datos estn correlacionados entre sí. ;uanto ma*or es la covarian'a# ma*or es el grado de correlación entre los datos.
I.. COEFICIENTE DE CORRELACIÓN El coeciente de correlación mide la similitud entre dos conjuntos de datos numéricos sobre una escala absoluta de ?-# @. Este coeciente es
;alculado a través de la división del valor de covariancia entre la raí' cuadrada del producto de las desviaciones estndar de los conjuntos de datos a * b%
I.5.
COEFICIENTE DE VARIACIÓN
El efecto de la variación o dispersión con relación a la media puede ser medido por la dispersión relativa# denida por% Dispersión Relativa = Dispersión Absoluta/Media Si la dispersión absoluta corresponde a la desviación estndar# la dispersión relativa es denominada coeciente de variación v %A El coeciente de variación deja de ser 1til cuando la media es pró6ima de cero. Su formula esta representada por C #V #/ x 0 =
S x
D311C
X
I.6. COEFICIENTE DE MOMENTO DE ASIMETRÍA ,a asimetría de una muestra se mide mediante el coeciente de asimetría# para el clculo del coeciente de asimetría se emplea el tercer momento con respecto a la media * para $ue este coeciente no tenga dimensiones el tercer momento se divide entre la desviación estndar elevado a la potencia A. Es el grado de desvío o alejamiento del eje de simetría de una distribución. 9ara distribuciones asimétricas# la media tiende a situarse del lado de la cola ms larga de la distribución. Este coeciente puede ser denido usando el A momento centrado en la media * la desviación estndar% B m;
=
3 n
n
E( x
i
i
=3
- x
;
) g = C s =
n : m;
( n − 3)( n − :) S ;
Sí gC3 es una distribución simétrica Sí gD3 es una distribución sesgada a la derec"a (polígono de frecuencias con cola ms larga a la derec"a&
Sí g3 es una distribución sesgada a la i'$uierda (polígono de frecuencias con cola ms larga "acia la i'$uierda&. –
El sesgo del polígono de frecuencias se aprecia tra'ando una vertical por la moda donde se diferencia la cola del polígono de frecuencias.
A
Ing. MAXIMO VILLON BEJAR Pág. 107.
B
Ing. MAXIMO VILLON BEJAR Pág. 105
–
Es importante indicar $ue los tres n1meros son sucientes para tener una idea de la forma del "istograma.
I.17.
COEFICIENTE DE 8URTOSIS
El grado apuntamiento del polígono de frecuencias (forma puntiaguda del polígono de frecuencias& se mide mediante el coeciente de curtosis. 9ara el clculo del coeciente de curtosis se emplea el cuarto momento con respecto a la media * para $ue este coeciente no tenga dimensiones el cuarto momento se divide entre la desviación estndar elevado a la potencia B n
∑ ( xi − x ) M < =
i =3
n
<
C K =
n ; M <
( n − 3)( n − :)( n − ;) S <
=ide el grado de ac"atamiento de una distribución de datos * puede ser denido por la división del momento de grado B centrado en la media entre la variancia elevada al cuadrado. F sea%
Es una medida estadística $ue describe el apuntamiento o ac"atamiento de una cierta distribución con respecto a una distribución normal. ,a Gurtosis positiva indica una distribución relativamente apuntada# * la negativa indica una distribución relativamente ac"atada. En una distribución normal la Gurtosis es igual a A# a los valores ma*ores a A se los llama Gurtosis e6cesiva. El caso de Gurtosis e6cesiva indica $ue "a* una ma*or probabilidad de $ue los retornos observados estén ms alejados de la media $ue en una distribución normal. ,eptoGurtosis se denomina al atributo de una distribución con mu* altos índices de Gurtosis. El valor del coeciente de curtosis es costumbre comparar con ;GCA $ue es coeciente de apuntamiento de una curva continua de forma de una campana (curva normal&.
Sí ;GDA es una distribución leptoc1rtica# picuda o puntiaguda. Sí ;GCA es una distribución mesoc1rtica o moderada (curva normal&
Sí ;GA es una distribución platic1rtica# ac"atada o plana.
1.2.o.9 DESVIACIÓN ESTNDAR MUESTRAL. La varianza muestral est" medida en el cuadrado de las unidades observadas al *acer las mediciones contenidas en la muestra# !ara
devolverse a una estad%stica 'ue use las mismas unidades 'ue las observaciones, es necesario calcular su ra%z cuadrada#
,o anterior conduce a la denición de la estadística denominada Hdesviación estndar muestralH# $ue no es otra cosa $ue la raí' cuadrada de la varian'a
9ara una muestra de tama+o n, 6# ...# 6 n# se tiene $ue%
El uso de esta estad%stica es recomendado en a'uellos con)untos de datos 'ue ofrecen cierto grado de simetr%a respecto de su centro# En estos casos, *abitualmente tiene sentido medir discrepancias de un valor con el centro de los datos usando m6ltiplos de la desviación est"ndar#
! modo de ejemplo# se puede decir $ue un valor est bastante alejado del centro de los datos si su distancia de él supera dos desviaciones estndar. !po*ndose en la idea anterior# la desviación estndar puede ser usada para determinar valores $ue se encuentran HcercaH del centro. Este uso va ms all de la simple descripción# en otros mbitos de Estadística es usada para tomar decisiones respecto de la población de la $ue fue e6traída la muestra .
I.11. SESGO -eg6n el diccionario un sesgo es Funa inclinación parcial de la menteF# En nuestro "mbito, la palabra sesgo sirve para definir la tendencia sistem"tica de ciertos dise7os de ensa&os cl%nicos para producir de forma consistente resultados me)ores o peores 'ue otros dise7os#
SGeIness o sesgo% =edida estadística $ue describe la simetría de la distribución alrededor de un promedio. Si el sesgo es igual a cero# la distribución es simétrica< si el sesgo es positivo la distribución una tendr una cola asimétrica e6tendida "acia los valores positivos. Un sesgo negativo indica una distribución con una cola asimétrica e6tendida "acia los valores negativos J. 2
Ing. MAXIMO VILLON BEJAR Pág. 93
J
Ing. MAXIMO VILLON BEJAR Pág. 94
&*+ST, D, +N& DST#+/0N D, P0#D&D,S ,a distribución de 9robabilidades es una función $ue representa la probabilidad de ocurrencia de una variable aleatoria. !justando una distribución a un conjunto de datos "idrológicos# una gran cantidad de información de la muestra se resume en la distribución * sus parmetros.
DST#+/0N,S D, P0#D&D ,N 2D00G3& El comportamiento de las variables aleatorias discretas o continuas se describe con la a*uda de :istribuciones de 9robabilidad. ,a variable se designa por ma*1scula * un valor especíco de ella por min1scula. 9or 9(6 C a& se denota la probabilidad de $ue un evento asuma el valor a< similarmente 9(a ≤ 6 ≤ b& denota la probabilidad de $ue un evento se encuentre en el intervalo (a#b&. Si conocemos la probabilidad 9(a ≤ 6 ≤ b& para todos los valores de a * b# se dice $ue conocemos la :istribución de 9robabilidades de la variable 6. Si 6 es un n1mero dado * consideramos la probabilidad 9() ≤ 6&% K(6&C 9() ≤ 6&% ,lamamos K(6& la función de distribución acumulada.
3.9
DISTRIBUCIONES CONTINUAS 3.1
DE
PROBABILIDAD
PARA
VARIABLES
DISTRIBUCION NORMAL ,a distribución normal es una distribución simétrica en forma de campana# también conocida como ;ampana de Lauss. !un$ue muc"as veces no se ajusta a los datos "idrológicos tiene amplia aplicación por ejemplo a los datos transformados $ue siguen la distribución normalM.
3.1.1
FUNCIÓN DE DENSIDAD:
,a función de densidad est dada por
,os dos parmetros de la distribución son la media µ * desviación estndar σ para los cuales derivados de los datos. M
Ing. MAXIMO VILLON BEJAR Pág. 169.
(media& * s (desviación estndar& son
3.1.2
ESTIMACIÓN DE PARMETROS:
3.1.3
FACTOR DE FRECUENCIA:
.
Si se trabaja con los ) sin transformar el N se calcula como
Este factor es el mismo de la variable normal estndar
3.1.4
LIMITES DE CONFIANA:
:onde α es el nivel de probabilidad es el cuartil de la distribución normal estandari'ada para una probabilidad acumulada de - α * Se es el error estndar O
3.2
DISTRIBUCIÓN LOGNORMAL DE DOS PARMETROS Si los logaritmos P de una variable aleatoria ) se distribu*en normalmente se dice $ue ) se distribu*e normalmente. Esta distribución es mu* usada para el clculo de valores e6tremos por ejemplo 0ma6# 0mínimos# 9ma6# 9mínima (e6celentes resultados en !ntio$uia&. Tiene la ventaja $ue )D3 * $ue la transformación ,og tiende a reducir la asimetría positiva *a $ue al sacar logaritmos se reducen en ma*or proporción los datos ma*ores $ue los menores. ,imitaciones% tiene solamente dos parmetros# * re$uiere $ue los logaritmos de las variables estén centrados en la media Q
Ing. MAXIMO VILLON BEJAR Pág. 170.
4.(.1
$+N/5N D, D,NSD&D%
* C ln 6 :onde# µ*% media de los logaritmos
de la población (parmetro escalar
estimado σ*% :esviación estndar de los logaritmos de la población# estimado
s y .3 4.(.(
,ST6&/5N D, P&76,T0S%
3.2.3
FACTOR DE FRECUENCIA % 9uede trabajarse en el campo original * en el campo transformado.
/ /. ;ampo transformado% Si se trabaja en el campo transformado se trabaja con la media * la desviación estndar de los logaritmos# así% ,n() Tr& C 6 TrRNS* de donde# )Tr C
e
ln (6 Tr
&
;on N con variable normal estandari'ada para el Tr dado# 6 * media de los logaritmos * S* es la desviación estndar de los logaritmos. /.-A. ;ampo original% Si se trabaja con los ) sin transformar el N se calcula como Q
Ing. MAXIMO VILLON BEJAR Pág. 179
3
Ing. MAXIMO VILLON BEJAR Pág. 181
N es la variable normal estandari'ada para el Tr dado# es el coeciente de variación# 6 media de los datos originales * s desviación estndar de los datos originales. A./.B
,=TES :E ;FK!!%
En el campo transformado.
en donde# n numero de datos# Se error estndar# N T variable normal estandari'ada.
3.3
DISTRIBUCION GUMBEL Una familia importante de distribuciones usadas en el anlisis de frecuencia "idrológico es la distribución general de valores e6tremos# la cual "a sido ampliamente utili'ada para representar el comportamiento de crecientes * se$uías (m6imos * mínimos& .
3.3.1
FUNCIÓN DE DENSIDAD:
En donde α * β son los parmetros de la distribución.
3.3.2
ESTIMACIÓN DE PARMETROS
Ing. MAXIMO VILLON BEJAR Pág. 210.
:onde muestra.
3.3.3
son la media * la desviación estndar estimadas con la
FACTOR DE FRECUENCIA %
:onde Tr es el periodo de retorno. 9ara la distribución Lumbel se tiene $ue el caudal para un período de retorno de /.AA a+os es igual a la media de los caudales m6imos.
3.3.4
LIMITES DE CONFIANA
)t ± t(-α& Se
N T es el factor de frecuencia * t (-α& es la variable normal estandari'ada para una probabilidad de no e6cedencia de - α.
E;m<'o ) A<'*-&-*0!.9 C&'-$'&% ' %&!=o o '& &m<'*"$) ) '& m$#"%&