ANÁLISIS DE HOMOGENEIDAD Y CONSISTENCIA Consiste en realizar un análisis de la información i nformación disponible, mediante criterios físicos y métodos estadísticos que permitan identificar, evaluar y eliminar los posibles errores sistemáticos que ha podido ocurrir, sea por causas naturales naturales u ocasionadas por por la intervención de la mano mano del hombre.
Inconsistencia, son los errores sistemáticos que se presentan como saltos y tendencias en las series maestrales. (Cahuana Andia & Yugar Morales, 2009)
No homogeneidad, cambios de los datos originales con el tiempo. La No Homogeneidad en los datos de Precipitación, se produce por movimiento de la Estación, cambios en el medio ambiente que rodea la Estación. Las causas principales de serie de precipitaciones no homogéneas se debe a:
Cambio en la localización del pluviómetro.
Cambio en la forma de exposición o reposición del aparato.
Cambio en el procedimiento de observación o reemplazo del operador.
Construcción de embalses en las cercanías.
Deforestación y reforestación en la zona.
Apertura de nuevas áreas de cultivo en los alrededores.
Desecación de pantanos
Industrialización en áreas circundantes.
En los análisis climatológicos se utiliza el término homogeneidad aplicándose para ello las pruebas estadísticas y en los análisis hidrológicos se utiliza el término
consiste consi stenci ncia a de
la serie,
por lo general se detecta con la técnica de la curva doble masa.
PRUEBAS ESTADÍSTICAS DE HOMOGENEIDAD El test o prueba estadística de homogeneidad presenta una hipótesis nula y una regla para aceptarla o rechazarla en base a su probabilidad de ocurrencia. Si dicha probabilidad es pequeña, se concluye que la serie es no homogénea, si es grande, se dice que la serie es homogénea. (Cahuana Andia & Yugar Morales, 2009)
TEST DE MANN-KENDALL La prueba de Homogeneidad de Mann-Kendall es un test t est no paramétrico, tiene una hipótesis nula sencilla y fácil de satisfacer. Este test detecta cualquier forma de tendencia, ya sean lineales o en forma de saltos, siempre que den una tendencia global, este test no es adecuado para series que presentan un componente estacional. La prueba de Homogeneidad de Mann-Kendall es en realidad un test estadístico que conduce a elegir alguna de las l as siguientes respuestas: (Cahuana Andia & Yugar Morales, 2009)
Hipótesis nula: Todos los valores de la serie son datos aleatorios de una sola población (Es una serie Homogénea).
Hipótesis alternativa: Es una serie no homogénea con tendencia monótona.
La prueba consiste en calcular un índice de desviación de la serie, y a partir de este valor calcular
el valor de mediante la relación:
1 = (1)(2+5) √ 18 = − = ∑ −
= ∑
Donde:
= Número de registros = Índice de desviación calculado = Número de valores de > para i < j < n = Número de valores de < para i < j < n Luego se elige un nivel de significancia α o valor de confiabilidad en función al cual se definirá
la condición de homogeneidad de la serie. Este índice se relaciona con un valor de Vcrit a través de la función de distribución normal, que se muestra en la Tabla. Se compara V y Vcrit Si V es menor que Vcrit se acepta la hipótesis nula, es decir que la serie es homogénea con un nivel de significancia de α %, de lo contrario se asume la hipótesis alternativa.
∝
Tabla. 0.005
0.010
0.025
0.050
0.100
2.58
2.33
1.96
1.64
1.28
LAS PRUEBAS DE CONSISTENCIA Y HOMOGENEIDAD RELATIVA_ Una serie de tiempo de datos hidrológicos es relati vamente constante si los datos son periódicamente proporcionales a una serie de tiempo apropiado simultáneamente (Chang y Lee 1974). La consistencia relativa significativa que los datos hidrológicos en una observación cierta estación son generados por el mismo mecanismo que genera similares datos de otras estaciones. Es una práctica común para verificar la coherencia en relación con el doble de la masa de análisis. Para determinar la consistencia relativa, se comparan las observaciones a partir de una cierta estación con la media de las observaciones de varias estaciones cercanas. Este medio se llama la base o patrón es difícil decir cuantas estaciones el modelo debe e incluir. Las estaciones cuanto menor los datos determinados influirá en la consistencia y la valides de la media patrón. Doble masa de análisis, es comprobación requiere eliminar del patrón los datos de una determinada estación y comparándolos con los datos restantes. Si estos datos son consistentes con los totales generales de la zona, que se vuelven a incorporar en el patrón no se puede hacer un análisis de doble masa, sin embargo se pueden detectar cambios similares que ocurrieron en las estaciones de forma simultánea. Por ejemplo si al mismo tiempo todas las estaciones en la región comenzaron a registrar los datos que fueron del 50% que es demasiado grande, la doble curva de la masa no muestra un cambio significativo. Análisis de doble masa
Doble la masa de análisis supone una relación lineal entre la serie de tiempo de los procesos de datos hidrológicos. Como este supuesto no puede ser valida en todas las tasas de acumulación, que debe ser verificada. Los datos pluviométricos son por lo general proporcionales a los totales en las estaciones cercanas en la misma zona hidrológica. Una relación lineal entre dos variables que incluye el par x=O y y=S se puede expresar como:
Y=b*x Donde B= factor de proporcionalidad Y=serie de tiempo para ser probada X=serie de tiempo del modelo La definición la pendiente media como la pendiente de la recta que pasa por los puntos O,S y Y,X, dará una estimación bastante buena de la media real de los factores de proporcionalidad. Los puntos trazados nunca caen exactamente en la línea media. Si hay una tendencia lejos de la línea durante un periodo determinado. El análisis de las tendencias persistentes de distancia de la pendiente media, se ve que los puntos de quiebre entre dos periodos con pendientes aparentemente diferentes indicar el momento en que los cambios de relación lineal entre el medio de dos partes de la serie de tiempo. Doble masa análisis no solo se usa para verificar la consistencia relativa de una serie de un tiempo de serie, si no también para encontrar los factores de corrección de errores y llenar los vacios. Esta aplicación se limita a los totales mensuales y anuales ya que normalmente no trabaja con los diarios. Además en el mejor de los casas, de doble masa análisis preserva la media y no el estándar.
Ejemplo sencillo de doble masa análisis
Utilizándolos datos de la tabla 6.1 del libro de Dalmen y Hall (1999), Pg. 32. Tabla 6.1 datos de ejemplo para el análisis de doble masa.
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Año 0 1 2 3 4 5 6 7 8 9 10 11 12 13
xi 0 1362 1111 1337 1392 1914 1252 1309 1283 1260 1643 1415 1450 1141
yi 0 1243 990 1310 1255 1784 1232 1189 1102 979 1421 1240 1236 1115
∑(xi)=xi 0 1362 2473 3810 5202 7116 8368 9677 10960 12220 13863 15278 16728 17869
∑(yi)=yi 0 1243 2233 3543 4798 6582 7814 9003 10105 11084 12505 13745 14981 16096
yi+(-bav*xi) 0 16,1 5,4 111,0 112,2 172,1 276,3 286,2 232,5 76,5 17,5 -17,1 -87,2 0
ai=yi/xi 0 0,9126 0,8911 0,9798 0,9016 0,9321 0,9840 0,9083 0,8589 0,7770 0,8649 0,8763 0,8524 0,9772
bav
0,90078
En este terreno de las diferencias acumuladas también llamado una parcela residual de la masa, los valores máximos y mínimos corresponden a puntos de quiebre en el original de doble masa de la línea, haciendo mas fácil la interpreta ción en nuestro ejemplo el punto de ruptura se encuentra en el año 7. Hay otros métodos de identificación los posibles puntos de quiebre en las líneas de doble masa por ejemplo Singh 1968, Chang y Lee 1974, pero el que se describe es simple y eficiente. La relación media o pendiente de los datos de la tabla 6.1. Desde el año 1 a7 año, es las siguientes: Bi= (9003-0)/(9677-0)=09304 Y desde el año de 8 a 13 años es: Bz= (16096-9003)/(17869-9677)=0.8658 Figura 1, dos formas de representar los datos en la tabla 1, simplificado de doble masa de parcela. Análisis de factores de proporcionalidad
Es un análisis de prueba para la consistencia relativa. La prueba de los factores de proporcionalidad de dos periodos par la estabilidad de la media es equivalente a probar la importancia de los cambios en las laderas de los periodos antes y después de un punto de quiebre evidente en una linera de d oble masa. La ventaja de la base de datos de detección procedimiento es que la estabilidad varianza de la prueba es demasiado. Lo que indica las correcciones de datos que podrían haber influido en la varianza. Una desventaja es la omisión de los datos si se adhiere a la exigencia de que el numero de datos de los sub-conjuntos deben ser iguales, si los datos se distribuyen normalmente entonces se puede utilizar subconjuntos con un numero desigual de datos.
Ejemplo sencillo de análisis de proporcionalidad La grafica muestra un tendencia que revela una tendencia negativa, los cálculos anteriores y las pendientes de la simplificación doble masa, el grafico 6.1 indican que la segunda mitad de la serie de tiempo tiene un medio mas pequeño que el primero. El cuadro anterior muestra que la varianza y la media de los sub-conjuntos son estadísticamente similares. Esto significa que el valor máximo de salidas
acumulativas de la media en el año 7 no corresponde con una verdadera ruptura en la línea y que la proporcionalidad entre los datos de la estación de prueba y los del patrón no cambia después. Figura 2, serie temporal de los factores de proporcionalidad
Tabla 2, calculo de la prueba de F y T para dos sub-conjuntos de factores de proporcionalidad. Años de agua 1-17 (1)
Años de agua 8-13 (7)
xi
(1) x i2
(7) xi
x i2
1
0,9126
0,8329
8
0,8589
0,7378
2
0,8911
0,7940
9
0,7770
0,6037
3
0,9798
0,9600
10
0,8649
0,7480
4
0,9016
0,8128
11
0,8763
0,7679
5
0,9321
0,8688
12
0,8524
0,7266
6
0,9840
0,9683
13
0,9772
0,9549
7
0,9083
0,8251
6,5095
6,0619
5,2067
4,5390
suma
numero de observaciones
7
6
x¯
0,9299336
0,8677903
s
0,0376317
0,0642113
s2
0,0014161
0,0041231
F
0,3435
t
2,1712
V1
6
V2
5
V
11
Tabla 3, resultados del calculo de F y T para dos sub-conjuntos de factores de proporcionalidad.
F 2,5% Años de agua 1
1-7
Años de agua 2
8 - 13
v1,v2
6,5
Ft F 97,5% 0,169 0,343 6,98
t 2,5% v
tt t 97,5%
11
-2,2 2,17 2,2
Si se hace caso omiso de la observación de agua para el año 13 (o no la tiene todavía) y pruebas de detección de cambios en la pendiente de 1 as6 años de agua y de 7 a 12 uno se encuentra una significati vo cambio en los factores de proporcionalidad: F=0.838 con VI=5 y V”=5 es aceptable en el nivel al 5% de significancia, t=3.204 con V=10, lo que indica que los factores cambia después del año 6 de agua, el análisis de tendencia también indica que hay un cambio (t=-2.81, con V=10). Conclusiones
Las pruebas de consistencia y homogeneidad, nos muestra las desviaciones acumuladas de la pendiente media y los factores de proporcionalidad, además de mostrarnos el comportamiento de la varianza, para ello nos recomienda los autores para realizar el análisis análisis de doble masa y análisis de factores de proporcionalidad.
Bibliografía
E.R. Dahmen. M.J. Hall. 1990. Screening of Hydrological Data: Tests for Stationarity and Relative Consistency International Institute for Land Reclamation and Improvement/ILRI P.O.BOX 45,6700 AA WageningeqThe Netherlands,
Pruebas de homogeneidad El objetivo es comprobar si en k poblaciones ( A1, ..., Ak ), es idéntica la distribución de probabilidad de una variable cualitativa con m posibles resultados ( B1, ..., Bm). Es decir, si se verifica que P ( B j/ A1) = P ( B j/ A2) = ... = P ( B j/ Ak ) = P ( B j)
per a tot j = 1, ..., m
La diferencia respecto del caso de independencia es que los totales de las filas ni· son valores fijos y no aleatorios y corresponden al número de individuos seleccionados en la muestra que pertenencen a la población i. La estimación de los valores P ( B j) bajo la hipótesis de homogeneidad se obtiene a partir de la tabla de contingencia a través de n· j/ N.
Hipótesis nula de homogeneidad: dadas dos poblaciones cualesquiera i y i’ se verifica que H0: pij = pi’j
para todo j = 1, ..., m
donde pij es la probabilidad del resultado j en la población i. La hipótesis alternativa (alguna igualdad no es cierta) implica la nohomogeneidad de las poblaciones. Los valores observados son nij. Los valores esperados bajo la hipótesis nula de homogeneidad se calculan de la manera siguiente: eij = ni· P ( B j) = ni· (n· j/ N ) = (ni· · n· j)/ N
Este resultado es idéntico al obtenido en el caso del contraste de independencia. El estadístico de contraste se calcula de manera análoga:
La distribución asintótica bajo la hipótesis nula es una χ 2 con (k − 1) · (m − 1) grados de libertad. Los grados de libertad pueden entenderse de
manera intuitiva entendiendo que el número de parámetros que se estiman son (m − 1), ya que queda fijada la probabilidad de la última clase B j una vez
estimadas las restantes y al considerar que existen k restricciones de los valores esperados debido a que tenemos fijados los totales de cada población. Por tanto, aplicando la fórmula para los grados de libertad, se obtiene: grados de libertad = número de clases − número de parámetros estimados − número de restricciones grados de libertad = ( k · m) − (m − 1) − k = (k − 1) · (m − 1) El criterio de decisión es el mismo que en el contraste de independencia. La condición de validez es que las frecuencias esperadas eij sean mayores que 5.