HIDROLOGIA GENERAL HH – 113 J Profesora:
Mirtha Patricia Calderón Hijuma MSc. Hidrologia y Recursos Hidricos
SEMANA 5
Universidad Nacional de Ingeniería Facultad de Ingeniería Civil
Setiembre 2010
SEMANA 4: Palabras Clave: • Probabilidad en hidrología • Funciones de distribución de probabilidades • Distribución Normal • Parámetros estadísticos
SEMANA 5 Palabras Clave: • Calidad de la información • Consistencia de datos hidrometeorológicos • Corrección de datos • Completación y extensión de registros
ANALISIS DE CONSISTENCIA DE DATOS Se muestra el registro de precipitaciones mensuales para los años 1963 al 2000 de la estación Picoy en la cuenca del Rio Huaura. Se observa un registro completo, sin ausencia de datos, sin embargo surgen las siguientes cuestiones:
ESTA CODIG AÑO 1968 1969
ANALISIS DE CONSISTENCIA DE DATOS Es esta información CONFIABLE? Los datos registrados son representativos del lugar? Cómo evalúo la CALIDAD de la información? Cómo evalúo que los errores en la toma de la información son mínimos y que no afectarán significativamente los resultados al usarla?
Para responder estas interrogantes recurrimos a las técnicas de ANALISIS DE CONSISTENCIA DE DATOS
ANALISIS DE CONSISTENCIA DE DATOS Los datos hidrológicos constituyen una secuencia de observaciones de algunas de las fases del ciclo hidrológico, efectuada en un lugar determinado. Los datos pueden ser; un registro de las descargas de una corriente en un lugar particular o puede ser un registro de la cantidad de precipitación captada en un cierto pluviómetro. Aunque para la mayoría de los propósitos hidrológicos se prefiere un largo registro en lugar de una corta duración, quien los use debe conocer que cuanto más largo sea el registro, hay más probabilidad de que haya habido cambios en las condiciones físicas de la cuenca o en los métodos de recolectar los datos. Si los cambios son apreciables, el registro así compuesto no representaría una condición real, representaría una condición no existente y no una que no existió o bien antes o bien después del cambio. Tal registro es inconsistente.
ANALISIS DE CONSISTENCIA DE DATOS Entonces, se deben hacer investigaciones para encontrar la razón de la inconsistencia y evaluar su probable efecto en los datos. Puesto que la inconsistencia puede ser debida a otras causas, tales como errores de parte del operador o caprichos de la naturaleza, ningún ajuste deberá ser aplicado al registro sin antes constatar cambios en el método de recolectar los datos, cambios en la ubicación de la estación, ocurrencia de eventos climatológicos extremos, entre otros.
ANALISIS DE CONSISTENCIA DE DATOS Para el análisis de la calidad de la información se cuentan con los siguientes procedimientos: 1.Inspección Visual 2.Análisis de Doble Masa 3.Análisis de Inferencia Estadística Los dos primeros procedimientos son del tipo gráfico mientras que el último es de tipo estadístico.
ANALISIS DE CONSISTENCIA DE DATOS Inspección Visual La inspección visual ayudará a observar gráficamente la homogeneidad o no de los datos del registro. Se pueden obtener gráficos de la variable hidrológica versus tiempo que indiquen que los datos son homogéneos y consistentes o que evidencien la presencia de cambios bruscos o cambios continuos. SALTOS: Identificados con cambios bruscos en los datos por lo que éstos no son considerados homogéneos ni consistentes. a) Salto en la media:
X 1 ≠ X 2 ; S1 = S 2
b) Salto en la desviación estándar:
X 1 = X 2 ; S1 ≠ S 2
ANALISIS DE CONSISTENCIA DE DATOS Inspección Visual TENDENCIAS: Identificados con cambios continuos en los datos por lo que éstos no son considerados homogéneos ni consistentes. a) Tendencia en la media; a incrementarse con el X (t ), ésta S = tiende cte tiempo
a) Tendencia en la desviación X = cteestándar; ., S (t ) ésta tiende a incrementarse con el tiempo
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa El análisis de Doble masa permite verificar gráficamente la calidad de la información en comparación con estaciones vecinas. Una curva de doble masa es una gráfica en papel aritmético que se consigue acumulando los valores de la estación de interés así como los valores de la estación índice para el mismo periodo. Procedimiento: En la siguiente tabla se tienen los datos de precipitación total anual de los años 1948 a 1959 de la estación índice cuyos valores acumulados se muestran en la columna 5 y los datos acumulados de la estación de interés en la columna 3. La curva doble masa se grafica ploteando los valores mostrados en dichas columnas.
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa Años 1
1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958
Estación Interés P (mm) 2
P (mm) Acum. 3
1168 755 760 1088 1272 651 359 1151 715 509 603
1168 1923 2683 3771 5043 5694 6053 7204 7919 8428 9031
Est. Índice o Patrón P (mm) P (mm) Acum. 4 5
1066 720 935 1010 978 792 1181 1062 901 692 1053
1066 1786 2721 3731 4709 5501 6682 7744 8645 9337 10390
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa Condición Antigua
Condición Reciente
X 1 , S1
Curva Doble Masa
X 2 , S2
α2 1953
α1
Valor acumulado
Estación Índice
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa Al observarse quiebres en la gráfica se entiende que los datos de la estación de interés contienen inconsistencias que deben ser investigadas y/o corregidas. Selección de la Estación Índice o Patrón: Para seleccionar la estación índice o patrón se debe contar con toda la información disponible y existente en la cuenca, así como en sus alrededores. Se procede luego a realizar las gráficas de doble masa teniendo en cuenta lo siguiente: 1. Estaciones involucradas: P1 , P2 , P3 ,............Pn 2. Obtener los acumulados de cada estación:
∑ P , ∑ P ,∑ P ,..........∑ P 1
2
3
n
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa 1. Estaciones involucradas:
P1 , P2 , P3 ,............Pn
2. Obtener los acumulados de cada estación:
∑ P , ∑ P ,∑ P ,..........∑ P 1
2
3
3. Obtener los acumulados de los promedios del resto de estaciones para cada uno de los casos de las estaciones bajo análisis, así: Para P1 obtener: Para P2 obtener: Para P3 obtener:
( P2 + P3 + P4 + .........Pn ) ∑ n ( P1 + P3 + P4 + .........Pn ) ∑ n ( P1 + P2 + P4 + .........Pn ) ∑ n
n
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa
∑P ∑P ∑P
1 2
3
Estación 1 Cambios
Estación 2
“
Estación 3 Buena calidad de la información
“
( P2 + P3 + P4 + .........Pn ) n
∑
( P1 + P3 + P4 + .........Pn ) n
∑
( P1 + P2 + P4 + .........Pn ) n
∑
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa La teoría de la curva de doble masa se basa en el hecho de que el resultado de graficar los valores acumulados de una cantidad contra los valores acumulados de otra cantidad durante el mismo periodo, debe ser una línea recta, dependiendo su continuidad de la constancia de la proporcionalidad entre ambas variables; la pendiente de la recta representará la constante de proporcionalidad entre dichas cantidades.
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Doble Masa Al usar la curva de doble masa para el análisis de consistencia de datos de lluvia, asumimos que la relación entre las cantidades x e y, puede ser expresada por una recta, teniendo una ecuación de la forma y = bx, en donde b es la pendiente de la curva de doble masa. Una ruptura en la pendiente de la curva de doble masa, significa que ha ocurrido un cambio en la constante de proporcionalidad entre las dos variables, o quizás que la proporcionalidad no es una constante en todos los puntos de la recta. De la gráfica anterior se identifica que la estación 3 presenta un comportamiento homogéneo, por lo que se elige como estación patrón y en caso necesario las demás estaciones serán corregidas tomando la estación 3 como base.
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística Se denomina así al análisis estadístico realizado sobre los estadísticos de media y desviación estándar para determinar la consistencia y homogeneidad de los datos. Consistencia en la Media: Tamaño de la muestra: n Periodos en la muestra: n1 y n2 Media del periodo 1:
1 n1 X 1 = ∑ xi n1 i =1
Desviación estándar del periodo 1: Desviación estándar del periodo 2:
donde
n=n1+n2
Media del periodo 2: 1 2
1 n1 2 ( xi − x1 ) S1 = ∑ n1 − 1 i =1 1 2 1 n2 2 ( xi − x2 ) S2 = ∑ n2 − 1 i =1
1 X2 = n2
n2
∑x i =1
i
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística Hipótesis planteada: H.P.: µ1 Hipótesis alternativa:
H.A.:
= µ2 µ1 ≠ µ 2
Se establece el rango de confianza (nivel de significancia) de que las hipótesis planteadas se cumplan en un 95%. La prueba se realiza con el estadístico t-student para el cual se tiene que el valor calculado (tc) debe caer en la región de X 1 muestrales X2 aceptación y así aceptar que las medias y son estadísticamente iguales. X 1 ≅ X 2 Se debe cumplir que:
t c ≤ tT
donde tT es el t-student de tabla según α y los grados de libertad (G.L.). Mostrar tabla t-student y grafica de región de
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística α = 2.5% (0.025) G.L. = n1 + n2 – 2
0
( X 1 − X 2 ) − ( µ1 − µ 2 ) tc = 1 y Sd 1 1 2 Sd = S p + Desviación típica de los promedios Sd : n1 n2 (n1 −1) S12 + ( n2 −1) S 22 Desviación típica ponderada Sp : S p = n + n − 2 1 2
tc ≤ tT se cumple, entonces la información es homogénea Si respecto a la media y se acepta que las medias muestrales son estadísticamente iguales.
1 2
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística Consistencia en la Desviación Estándar: Se cuenta con las siguientes hipótesis estadísticas: Hipótesis planteada:
H.P.:
σ1 = σ 2
Hipótesis alternativa:
H.A.:
σ1 ≠ σ 2
La prueba se realiza con el estadístico F (Fisher) para el cual se tiene que el valor calculado (Fc) debe caer en la región de aceptación y así aceptar que las desviaciones muestrales y S1 S2 son estadísticamente iguales. Se debe cumplir que:
S1 ≅ S 2 Fc ≤ FT
Mostrar tabla F y grafica de región de aceptación
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística donde FT es el F de tabla según α y los grados de libertad del numerador (G.L.N) y del denominador (G.L.D.). Se establece el rango de confianza (nivel de significancia) de que las hipótesis planteadas se cumplan en un 95%, es decir 1-α=95% permitiendo establecer que α=5%. Donde: G.L.N. = grados de libertad del tamaño de la muestra del numerados menos 1 (nN – 1). G.L.D. = grados de libertad del tamaño de la muestra del denominador menos 1 (nD – 1).
ANALISIS DE CONSISTENCIA DE DATOS Análisis de Inferencia Estadística F calculado Fc se obtiene según:
S12 Fc = 2 S2
si S > S
S 22 Fc = 2 S1
si S 22 > S12
2 1
2 2
De tal manera que Fc > 1 Si Fc ≤ FT se cumple, entonces la información es homogénea respecto a la desviación estándar y se acepta que las desviaciones muestrales son estadísticamente iguales.
CORRECCIÓN DE DATOS En los casos en que la media y la desviación estándar son estadísticamente iguales no se corrige la información original por ser consistente con 95% de probabilidades de que así sea, aún cuando en el gráfico de doble masa se observen quiebres. Al cumplirse ambas condiciones, la información es totalmente homegénea. En caso de no presentarse lo anterior se puede recurrir a la corrección de datos, previa verificación de l
COMPLETACIÓN Y EXTENSIÓN DE REGISTROS Completación: cuando se disponen de datos en un registro, pero por alguna razón alguno de ellos no está consignado, entones es necesario completar los datos para tener un registro completo que se pueda utilizar. Extensión: Cuando se dispone de un registro de datos de determinada longitud, pero por alguna razón se desea extenderlo de tal manera de contar con un registro de datos de mayor longitud que se pueda utilizar.
COMPLETACIÓN Y EXTENSIÓN DE REGISTROS Métodos y aplicaciones para la completación de registros: Método Aplicación Promedio Aritmético
Datos puntuales faltantes en la misma estación La precipitación normal de las estaciones no diferirá más de un 10% de la precipitación normal de la estación
Proporción Normal
Requiere precipitación en las estaciones en el mismo período de tiempo del dato faltante
Análisis de Correlación Existencia de pares de registros
TAREA 5 1. Evaluar por inspección visual los siguientes gráficos.