Top. Meteor. Oceanogr., 7(1):1-20,2000
Aplicación de algunos métodos de relleno a series anuales de lluvia de diferentes regiones de Costa Rica 1 R OSARIO OSARIO ALFARO , R AFAEL AFAEL PACHECO
Instituto Meteorológico Meteorológico Nacional,Ministerio Nacional,Ministerio del Ambiente y Energía, San José, Costa Costa Rica (Recibido el 3 de mayo de 2000, aceptado el 28 de junio, de 2000) ABSTRACT This paper shows the results obtained when different methods for filling gaps in annual precipitation series were applied to records of meteorological meteorological stations, located in different regions of Costa Rica. Simple and multiple regression were used. The ratio, the normal-ratio and the adjusted ratio methods methods were also utilized. The first, third and fifth methods required just an additional station to fill the gaps, the others required two. The methods were applied to 12 stations, from which 5 are located in the Caribbean Caribbean Coast and 7 in the Pacific’s. In total, the information of 36 stations was used in this study. The Wilcoxon Sum Rank Test showed showed that all estimated series have identical probability distributions to the observed observed series. The lower differences between observed observed and estimated data are obtained when multiple regression is used. This is showed in the values obtained for for MAE (mean absolute error) and RMSE (root mean square error). Despite the former results, the maximum differences between the observed and estimated values were very high in some cases (95%). A recent study, which uses an autoregressive model of order 45 to estimate annual precipitation values shows that the highest differences with this method are around 35%, which suggest the use of more complex methods if more accurate estimations are required.
1. Introducción
Algunos estudios que requieren la utilización de series cronológicas de datos, presentan el problema de series con datos faltantes que limitan el uso de las mismas, aún cuando algunas tienen registros registros suficientemente suficientemente largos. Cada vez que se inicia un trabajo con series de precipitación en el Instituto Meteorológico Nacional (IMN), se recurre a algún método de relleno para estimar datos faltantes; sin embargo, no existe ninguna sugerencia formal a este respecto por parte del Instituto, la cual esté basada en algún estudio serio que le de sustento. La finalidad de este trabajo consiste en determinar la confiabilidad de algunos métodos simples de relleno para datos anuales de precipitación, los cuales se sugieren en la Guía de Prácticas Climatológicas de la Organización Meteorológica Mundial (WMO 1983). Estos métodos corresponden a la regresión simple, múltiple y de la
razón q. También se usó el método método de la razón-normal razón-normal (Paulhus and Kohler. 1952) con una pequeña variación, ya que toma en consideración promedios de precipitación en períodos iguales, en vez de promedios normales de precipitación y se utilizan dos estaciones cercanas en vez de tres. La diferencia obedece al hecho de que muchas estaciones con las que cuenta el IMN no poseen registro de lluvia desde 1960. Además, en algunas regiones del país, escasamente se encuentran dos estaciones cercanas a otra, entendiéndose por cercana aquella estación ubicada al menos dentro de la misma cuenca y a una altura semejante, si es posible. También se utilizó el método de la razón q, tomando en consideración una clasificación de las estaciones que depende de su cantidad de precipitación anual (método de la razón ajustada).
CUADRO 1. Estaciones estudiadas, períodos considerados y número de años de los registros. 1
Dirección para correspondencia: Rosario. Alfaro, Instituto Meteorologico Nacional, Apartado 7-3350-1000 7-3350-1000 San Jose, Costa Rica. Rica. E-mail:
[email protected] [email protected]
42
ALFARO&PACHECO: Aplicación de algunos métodos de relleno se series anuales de lluvia de diferentes regiones de Costa Rica
Estación
Latitud (°)
Longitud (°)
Elev. (m)
Período
Puntarenas San Miguel de Barranca Nagatac Coto 47 Km 18 Coto 44 CATIE Humo La Suiza San José Villa Colón Desamparados Limón La Lola Finca El Carmen Fabio Baudrit A. J. Santamaría La Garita Nicoya Morote Paquera Damas Fca Cerritos Finca Pocares Linda Vista, El Guarco Comandancia de Cartago La Cangreja Pindeco Volcán P. Zeledón Ciudad Quesada I. Quebrada Azul San Vicente Upala Los Chiles
9 59 10 00 10 04 8 36 8 36 8 35 9 53 9 48 9 51 9 56 9 54 9 54 10 00 10 06 10 12 10 01 10 00 9 57 10 09 10 04 9 49 9 29 9 30 9 31 9 50 9 53 9 48 9 08 9 13 9 20 10 20 10 24 10 17 10 54 11 02
84 46 84 42 84 43 82 59 83 04 82 59 83 38 83 43 83 37 84 05 84 14 84 04 83 03 83 23 83 29 84 16 84 12 84 21 85 27 85 16 84 56 84 12 84 09 84 15 83 58 83 55 83 58 83 20 83 27 83 42 84 26 84 28 84 24 85 01 84 43
3 140 450 8 6 7 602 680 620 1172 700 1162 5 40 15 840 932 460 120 20 15 6 5 6 1400 1440 1830 397 418 700 650 83 1450 50 40
1963-1984 1963-1984 1963-1984 1951-1978 1951-1978 1951-1978 1963-1982 1963-1982 1963-1982 1970-1985 1970-1985 1970-1985 1972-1996 1972-1996 1972-1996 1971-1996 1971-1996 1971-1996 1975-1993 1975-1993 1975-1993 1976-1993 1976-1993 1976-1993 1963-1985 1963-1985 1963-1985 1985-1993 1985-1993 1985-1993 1973-1992 1973-1992 1973-1992 1986-1994 1986-1994
22 22 22 27 27 27 20 20 20 16 16 16 25 25 25 26 26 26 18 18 18 18 18 18 23 23 23 9 9 9 19 19 19 9 9
San Jorge Los Chiles
10 42
84 40
55
1986-1994
9
Con el fin de comparar los resultados obtenidos, se calcularon los errores MAE y RMSE, según lo sugiere Willmott (1982), ya que estos errores básicamente miden el error promedio entre los valores estimados y los observados mediante el cálculo de las diferencias existentes entre dichos valores. También se usó el test de Wilcoxon (McClave and Dietrich. 1991) para determinar si las poblaciones de las dos muestras (la de valores observados y la de estimados) tenían distribuciones de probabilidad idénticas.
Años
Se determinaron las diferencias máximas observadas entre los valores reales y los estimados. Además, se compararon los resultados con aquellos obtenidos en un estudio reciente (Leite and Peixoto. 1996) que utiliza un método más complejo para reproducir series de datos de precipitación anual.
CUADRO 2. Distancias y diferencias en altura existentes entre cada una de las estaciones analizadas y sus estaciones vecinas.
TOPICOS METEOROLOGICOS
Estación en estudio Puntarenas Coto 47 CATIE San José Limón Fabio Nicoya Damas L. Vista C.Quesada Pindeco Upala Promedios
D1 (km) 8 5 4 13 33 8 22 10 27 8 40 36 17.8
D2 (km) 7 3 5 22 52 10 63 4 28 24 48 44 25.8
2. Metodología
Varias consideraciones debieron hacerse a la hora de hacer la escogencia de la información para verificar los métodos de relleno de datos faltantes, ya que no sólo se requiere que las estaciones estén cerca de la estación en estudio, sino que también cuenten con series completas de datos con períodos de registro similares. En este estudio, 8 estaciones analizadas cuentan con estaciones cercanas ubicadas a menos de 30 kms de distancia. Sin embargo, la mayor distancia de una estación cercana corresponde a 63 kms. Los valores estimados con los diferentes métodos se compararon con los valores observados mediante el uso de los errores MAE, RMSE y el test de Wilcoxon antes citados. El cálculo de totales anuales de precipitación se hizo utilizando cinco métodos de estimación. Estos comprenden la regresión lineal y múltiple, el método de la razón, de la razón-normal y de la razón ajustada. Este último método se obtuvo con base en una clasificación de las estaciones con respecto a la cantidad de lluvia anual, utilizada por Villalobos y Retana (1998), para caracterizar períodos lluviosos. Este procedimiento no es en sí un método de relleno, sino que se usó para ajustar el método de la razón. De los cinco métodos, la regresión múltiple y la razón normal se utilizaron haciendo uso de los datos de dos estaciones cercanas. Con el fin de acatar las recomendaciones sugeridas en WMO. (1986), con los métodos de la razón utilizados sólo se estimaba un dato faltante en las series en cada ocasión, lo que significa que no se estimó más de un 10% de un registro y en la mayoría de los casos, un dato faltante representaba menos de un 5% del registro. Con los métodos de regresión, simplemente se calculó la ecuación y se compararon los valores observados con los estimados.
Dif. alt. 1 (m) 137 -2 78 -472 35 92 -100 -1 40 -567 21 -10 129.6
43
Dif. alt. 2 (m) 447 -1 18 -10 10 -380 -105 0 430 800 303 5 209.1
Para hacer los cálculos se usaron series con el mismo período de registro. Con los métodos de la razón, cada uno de los datos de la serie en estudio fue eliminado para simular la ausencia de dato y se rellenó usando los diferentes métodos. Así se reprodujeron las series completas de datos estimados a partir de los datos reales. Luego, se obtuvo la diferencia en porcentaje entre los valores correspondientes de las dos series y se estimó el valor medio de las diferencias con cada uno de los métodos utilizados. También se calcularon los errores MAE y RMSE antes citados para cada método. Las series de datos estimados se compararon estadísticamente con sus correspondientes de valores observados usando el test de Wilcoxon de suma de rangos. Esta prueba permitió determinar la identidad entre las series de datos observados y estimados, al nivel de significancia del 5%. 2.1. Métodos de regresión
Como primer método de relleno de datos anuales se utilizó la regresión lineal, sugerida en WMO. (1983), aunque se sabe que raras veces se observa una relación lineal perfecta debido a que los fenómenos que se estudian en climatología son usualmente multivariables. Sin embargo, se utilizó este método por ser el más simple y porque en algunas regiones de Costa Rica difícilmente se puede contar con una estación pluviométrica “cercana” a la estación de interés. Por otro lado, los períodos de algunas de las series son muy cortos, lo cual limita su uso. Luego se utilizó el modelo de regresión múltiple, también sugerido en la misma guía, usando los datos de dos estaciones cercanas. Esto en la práctica se puede realizar solo en aquellas regiones en las cuales la densidad de la red de estaciones es buena, como en el Valle Central de Costa
CUADRO 3. Resultados de la aplicación de los diferentes métodos de relleno a la estación de Puntarenas. Se muestran las diferencias máximas obtenidas entre los valores estimados y los reales. El promedio de las diferencias de la serie obtenido con cada método de relleno se muestra en la última columna.
44
ALFARO&PACHECO: Aplicación de algunos métodos de relleno se series anuales de lluvia de diferentes regiones de Costa Rica
Método Razón Razón Razón ajustada Regresión simple Regresión simple Regresión múltiple Razón normal
Estación vecina Nagatac S. M. Barranca Nagatac Nagatac S. M. Barranca Nagatac y Barranca Nagatac y Barranca
Rica, ya que existen regiones del país que no cuentan con dos series de datos de estaciones vecinas cuyo período de registro sea igual al de la estación en estudio. En las regiones con una densidad alta de estaciones, el método de regresión múltiple podría utilizarse en un futuro con más estaciones, con el fin de determinar si los valores estimados mejoran significativamente con respecto a aquéllos calculados con base en la información de dos estaciones vecinas.
Dif. máx en mm. 886 1090 1006.5 743.7 572.5 634.7 743.2
Prom. dif. en mm. 120.3 148.3 200.6 219.6 209.1 190.6 203.1
tomó en cuenta el hecho de que las estaciones fueran cercanas a la estación en estudio y se consideraron valores promedios de lluvia en diferentes períodos en vez de precipitaciones normales. Para obtener la precipitación anual de una estación X ( P X ) para un año determinado, utilizando los datos de dos estaciones A y B, se utilizó la siguiente ecuación: P X =
1 ( N X P A + N X P B ) 2 N A N B
(3)
2.2. Método de la razón
El método de la razón q (Barger, 1960, WMO 1966 y WMO 1983) se basa en el hecho de que para pares de estaciones, la razón entre sus valores mensuales, anuales o medios, tiende a ser constante. Según este método, si se tienen dos estaciones ( A y B), se requiere determinar q de la siguiente manera: q = Σ b / (1) i Σ ai desde i = 1 hasta N donde N= número total de datos de la serie bi = dato i de la estación B ai = dato i de la estación A Seguidamente, si el valor b j falta en la estación B, éste se obtiene de la siguiente manera: b j = q x a j (2) Este método es utilizado en la bibliografía consultada para rellenar medias de diferentes períodos, pero se menciona que puede ser utilizado para valores mensuales y anuales. En este estudio se utilizó particularmente para obtener datos anuales, pero su aplicabilidad a datos mensuales será investigada posteriormente. 2.3. Método de la razón-normal
Este procedimiento estima cantidades de lluvia con base en tres estaciones cercanas y uniformemente espaciadas con respecto a la estación en estudio (Paulhus and Kkohler, 1952). Estos requerimientos son difíciles de cumplir en algunas regiones de nuestro país, por lo que se utilizó el método con dos estaciones cercanas únicamente. Este método se sugiere para cuando las diferencias en las precipitaciones anuales normales de las estaciones consideradas son mayores que un 10%. En el caso de las estaciones del I. M. N, son pocas las estaciones que cuentan con períodos de registro largos, por lo tanto, únicamente se
donde N X es la lluvia promedio de la estación X para el mismo período que se obtiene la lluvia promedio de la estación A ( N A) y B ( N B). P A y P B son los valores correspondientes a P X (precipitación anual) de las estaciones A y B. 2.4. Método de la razón ajustada
Este método es básicamente el método de la razón (sección 2.2), únicamente que utiliza los promedios de lluvia de años lluviosos, secos y normales en vez del promedio anual normal. Este método, utilizado en forma más meticulosa por Villalobos y Retana (1998) en otro estudio, para otros fines, consiste en obtener una clasificación de la precipitación anual de la estación en estudio ( B) y una estación cercana (A), con base en el valor medio de sus series (X p ) y sus desviaciones estándar (S ), clasificando los totales anuales de dichas estaciones según se indica a continuación: Lluvioso si bi ( o ai ) > X p +S, Normal si X p-S ≤ bi ( o ai ) ≤ X p+S Seco si bi ( o ai ) < X p-S Una vez que se clasifican los totales anuales de precipitación de cada una de las estaciones, para calcular un dato faltante bi de la estación en estudio, se utiliza la información obtenida anteriormente de la estación cercana para determinar a qué categoría corresponde el año que se desea estimar y de acuerdo a su clasificación, se obtiene el valor de q (q = Σ b / la sumatoria de los años i Σ a ) haciendo i correspondientes a esa categoría. Posteriormente, si el total anual faltante es b j , éste se calcula con base en la ecuación (2), en donde a j representa el total anual correspondiente de la estación cercana. 3. Datos utilizados
TOPICOS METEOROLOGICOS
Este estudio se realizó con datos anuales de precipitación. En el cuadro 1 se muestran las estaciones utilizadas con su ubicación, los períodos considerados y el número total de años de las series. El cuadro 2 muestra la distancia existente en kilómetros (D1 y D2) y las diferencias en altitud en metros (dif. alt. 1 y dif. alt. 2) entre cada de una de las estaciones en estudio y las dos estaciones más cercanas. Los valores en altitud negativos y positivos corresponden a estaciones con una altura menor y mayor respectivamente, con relación a la estación analizada.
45
haya sido lluvioso en una estación, lo haya sido también en la otra, por ejemplo, lo cual sucede únicamente en el 64 % de los casos en esta estación. Por otro lado, los métodos que utilizan la información de dos estaciones vecinas no disminuyen la diferencia máxima ni el promedio de las diferencias entre los valores reales y los observados, de acuerdo a los resultados anteriores. Los métodos de relleno que se denotan según la nomenclatura que se muestra en el cuadro 4, se aplicaron a todas las estaciones consideradas en este estudio. Para comparar las muestras (observada y estimada) se calcularon los errores MAE y RMSE, los cuales se muestran en el cuadro 5.
4. Resultados y Discusión
A continuación se muestran algunos ejemplos de las diferencias existentes entre las series de datos de la estación en estudio y sus estaciones cercanas. Vale la pena destacar, que en el caso más extremo, la estación cercana se encuentra a 63 kms de distancia y que la mayor diferencia de altura entre ellas corresponde a 800 metros. En la figura 1 se muestra un caso en el cual, la serie de datos de la estación en estudio y las series de las estaciones cercanas son bastante semejantes, no solo en su distribución sino también en su magnitud. En este caso las diferencias en distancia corresponden a 33 y 52 kms y las diferencias en altitud no sobrepasan los 35 metros. En la Figura 2 se muestra un caso en el cual se encuentran grandes diferencias en magnitud en las series de datos anuales de la estación en estudio y sus vecinas. Las diferencias máximas en distancia y altura entre las estaciones es de 8 km y 447 m respectivamente. A continuación se presentan en detalle algunas de las comparaciones realizadas entre los valores estimados y los observados para el caso particular de la estación Puntarenas (Figuras 3, 4 y 5). En el cuadro 3 se muestran las diferencias máximas obtenidas entre los valores reales y los estimados con cada uno de los métodos de relleno para el caso de la estación Puntarenas. Además se obtiene el promedio de las diferencias para cada método de cálculo utilizado. Obsérvese como el método de la razón ajustada no mejora las estimaciones, por el contrario, en este caso en particular, la diferencia máxima observada aumenta en 120.5 mm. Posiblemente, esto sería cierto únicamente cuando el comportamiento de la estación en estudio y su estación vecina sean muy semejantes, es decir, que cuando el año
CUADRO 4. Métodos de relleno utilizados para reproducir una serie de datos estimados utilizando al menos una estación cercana a la estación en estudio.
Método de relleno
Siglas
Regresión simple
RG
De la razón
Q
De la razón ajustada
QA
Regresión múltiple
RM
De la razón normal
QN
Para determinar si las distribuciones de probabilidad asociadas con las dos poblaciones eran equivalentes, se utilizó el test Wilcoxon de suma de rangos (McClave & Dietrich. 1991). Este test es muy útil para estos casos, ya que no hace suposiciones en cuanto a la forma de las distribuciones de probabilidad de las muestras de datos. Un resumen de la aplicación de los diferentes métodos se observa en el cuadro 6. Las columnas en su orden corresponden a las estaciones estudiadas, los períodos considerados, el número de años de los registros, y el estadístico Z o TA utilizado en la evaluación del test de Wilcoxon con cada uno de los métodos indicados en la primer fila del cuadro.
46
ALFARO&PACHECO: Aplicación de algunos métodos de relleno se series anuales de lluvia de diferentes regiones de Costa Rica
Estación Limón y vecinas 5000 m m n e 4000 l a u n a a 3000 i v u l L
2000
2 7 9 1
4 7 9 1
6 7 9 1
8 7 9 1
0 8 9 1
2 8 9 1
4 8 9 1
6 8 9 1
8 8 9 1
0 9 9 1
2 9 9 1
4 9 9 1
Años Limón
La Lola
Fca el Carmen
Fig. 1. Series de datos anuales de la estación Limón y estaciones cercanas (La Lola y Finca El Carmen).
.
Estación Puntarenas y vecinas 4500 m m n 3500 e l a u 2500 n a a i v 1500 u l L
500
3 6 9 1
5 6 9 1
7 6 9 1
9 6 9 1
1 7 9 1
3 7 9 1
5 7 9 1
7 7 9 1
9 7 9 1
1 8 9 1
3 8 9 1
Años Puntarenas
Nagatac
San M.Barranca
Fig. 2. Series de datos anuales de la estación Puntarenas y estaciones cercanas (Nagatac y San Miguel de Barranca).
6 9 9 1
TOPICOS METEOROLOGICOS
47
Datos reales y estimados de Puntarenas
m m n e l a u n a a i v u l L
3500 2500 1500 500
3 6 9 1
5 6 9 1
7 6 9 1
9 6 9 1
1 7 9 1
3 7 9 1
5 7 9 1
7 7 9 1
9 7 9 1
1 8 9 1
3 8 9 1
Años Puntarenas
Q con Nag.
Q con Barr.
Fig. 3. Datos reales de la estación Puntarenas y valores estimados con el método de la razón (Q) utilizando la información de las estaciones vecinas de Nagatac (Nag) y San Miguel de Barranca (Barr).
Datos reales y estimados de Puntarenas 2500
m m n e l a u 1500 n a a i v u l L
500
3 6 9 1
5 6 9 1
7 6 9 1
9 6 9 1
1 7 9 1
3 7 9 1
5 7 9 1
7 7 9 1
9 7 9 1
1 8 9 1
3 8 9 1
Años Puntarenas
Q con Nag.
QA con Nag.
Fig. 4. Serie de datos observados de la estación Puntarenas y valores estimados según el método de la razón (Q) y el de la razón ajustada (QA), usando la información de la estación vecina de Nagatac.
48
ALFARO&PACHECO: Aplicación de algunos métodos de relleno se series anuales de lluvia de diferentes regiones de Costa Rica
Datos reales y estimados de Puntarenas 2500
m m n 2000 e l a u 1500 n a a i v 1000 u l L
500
3 6 9 1
5 6 9 1
7 6 9 1
9 6 9 1
1 7 9 1
3 7 9 1
5 7 9 1
7 7 9 1
9 7 9 1
1 8 9 1
3 8 9 1
Años Puntarenas
RG Nagatac
RG Barranca
Fig. 5. Valores reales de la estación de Puntarenas y datos estimados utilizando regresión simple (RG) con las estaci ones de Nagatac y San Miguel de Barranca.
Datos reales y estimados de Puntarenas 3000
m m 2500 n e l a 2000 u n a 1500 a i v 1000 u l L
500
3 6 9 1
5 6 9 1
7 6 9 1
9 6 9 1
1 7 9 1
3 7 9 1
5 7 9 1
7 7 9 1
9 7 9 1
1 8 9 1
3 8 9 1
Años Puntarenas
RM
QN
Fig. 6. Aplicación del método de regresión múltiple (RM) y de la razón normal (QN) para obtener datos estimados de lluvia anual para la estación de Puntarenas. Las estaciones cercanas utilizadas son Nagatac y San Miguel de Barranca.
TOPICOS METEOROLOGICOS
El estadístico TA se obtiene sacando el rango de las observaciones de la muestra de valores observados y la muestra de valores estimados, como si las observaciones pertenecieran a la misma población. El número de datos de la primera muestra se denota como n1 y los de la segunda como n2 y corresponden a valores menores o iguales a 10. El test estadístico TA es la suma de rangos de la muestra más pequeña o en el caso en que n1=n2, se puede usar cualquier suma de rangos. Cuando el tamaño de las dos muestras es igual a 10 o más grande, se usa el test estadístico Z , el cual está dado por la siguiente ecuación: TA – n1(n1+ n2 + 1) Z = ________2_____ √ n1n2(n1+ n2+1) 12
(4)
La hipótesis nula utilizada en este test (Ho) establece que la población de las 2 muestras tienen distribuciones de probabilidad idénticas. La hipótesis alternativa (Ha) afirma que la distribución de probabilidad para la muestra A está desplazada hacia la izquierda o la derecha de la distribución de probabilidad de la muestra B. Para un nivel de significancia del 5%, la región de rechazo de Z corresponde a Z < -1.96 o Z > 1.96. La región
49
de aceptación de TA para muestras con n=9 tiene como límite inferior y superior 63 y 108, respectivamente (McClave & Dietrich. 1991). Según los resultados anteriores, en todos los casos, se debe aceptar la hipótesis nula de que las poblaciones de las muestras tienen distribuciones de probabilidad idénticas. Sin embargo, vale la pena destacar las diferencias máximas en % obtenidas entre los valores estimados y los observados según cada método, las cuales se muestran a continuación en los cuadro 7 y 8. Obsérvese que de las 12 estaciones analizadas, 9 de ellas tienen las diferencias máximas más pequeñas cuando se utiliza el método de la regresión múltiple para obtener los valores estimados. El método de la razón ajustada muestra las diferencias más grandes en la mitad de las estaciones; sin embargo, un detalle muy importante que vale la pena destacar es el hecho de que la estación de Limón, presenta la mayor coincidencia de clasificación de sus totales anuales de lluvia (84%) con respecto a los de la estación vecina utilizada en este método (La Lola), la cual se encuentra a 33 kms de distancia y a 35 metros más de altura. En este caso en especial, la diferencia máxima más pequeña se obtiene utilizando este método.
CUADRO 5. Valores máximos y mínimos correspondientes a los errores MAE y RMSE obtenidos, según cada método de relleno.
Método
Mín. MAE
Máx. MAE
Mín RMSE
Máx RMSE
RG
110
408
143
527
Q
131
604
161
723
QA
116
570
146
731
RM
97
401
131
527
QN
101
401
139
527
CUADRO 6. Resultados (estadístico Z o TA) de la aplicación de los métodos de relleno para estimar totales anuales de precipitación. Los valores de
50
ALFARO&PACHECO: Aplicación de algunos métodos de relle no se series anuales de lluvia de diferentes regiones de Costa Rica
Pindeco y Upala corresponden a valores
TA.
Estación
Período
Años
RG
Q
QA
RM
QN
Puntarenas
1963-84
22
0.258
-0.023
-0.657
0.046
0
Coto 47
1951-78
28
0.043
0.874
-0.890
-0.112
-0.026
CATIE
1963-82
20
0.108
0.135
0.487
-0.027
0.162
San José
1970-85
16
-0.188
-0.603
0.075
-0.113
-0.414
Limón
1972-96
25
0.262
0.766
-0.456
0.146
0.223
Fabio
1971-96
26
-0.146
0
-0.146
-0.018
-0.110
Nicoya
1975-93
19
0.253
0.190
0.506
0.285
0.316
Damas
1976-93
18
0.063
0
-0.506
0.032
-0.095
L. Vista
1963-85
23
0.033
-0.626
-0.209
0.055
-0.209
C.Quesada
1973-92
20
-0.073
0.014
-0.014
-0.131
0.073
Pindeco
1985-93
9
86
85
73
85
81
Upala
1986-94
9
84
90
81
84
88
CUADRO 7. Valores de las diferencias máximas en % obtenidas con cada uno de los métodos, para cada una de las estaciones analizadas.
Estación analizada
Puntarenas Coto 47 CATIE San José Limón Fabio Nicoya Damas L. Vista C.Quesada Pindeco Upala
RG 71 23 30 23 21 22 53 23 50 38 15 18
Dif. máx. en % observadas según cada método Q QA RM 85 95 52 31 26 17 30 57 15 53 31 23 41 20 28 23 22 21 56 79 52 26 20 15 51 53 51 33 46 65 16 27 13 48 28 18
CUADRO 8. Diferencias máximas absolutas en % encontradas entre l os valores reales de las series y los valores estimados con cada uno de los
métodos de relleno utilizados.
QN 57 17 20 46 24 22 52 28 50 34 27 27
TOPICOS METEOROLOGICOS
Método RG Q QA RM QN
Dif en % 71 85 95 65 57
5. Conclusiones
En este trabajo se utilizaron cinco métodos simples para calcular datos faltantes en las series anuales de lluvia de 12 estaciones meteorológicas ubicadas en diferentes regiones de Costa Rica. Se utilizó el test Wilcoxon de suma de rangos para determinar si las series de datos estimados tenían distribuciones de probabilidad idénticas a las de las series de datos observados. Los resultados mostraron que todas las series de datos estimados tienen distribuciones de probabilidad idénticas a las de sus correspondientes series de datos observados. Sin embargo, las diferencias máximas observadas alcanzan valores hasta de un 95% del valor real en el caso más extremo (método de la razón ajustada usando la estación de Puntarenas). Las diferencias máximas más pequeñas se obtienen utilizando el método de la regresión múltiple. Esto se refleja en los valores de los errores MAE y RMSE (Willmott. 1982) calculados y tabulados en el cuadro 5. Las diferencias máximas más grandes se dan con el método de la razón ajustada. Sin embargo, los resultados obtenidos parecen indicar que este método es bueno cuando las clasificación por cantidad de lluvia anual de una estación en comparación con su estación vecina es bastante coincidente. Sería bueno corroborar estos resultados haciendo una análisis más profundo de este método. Estudios recientes utilizan métodos más complejos para reproducir series de precipitación anual, tales como el modelo autoregresivo de orden 45 (Leite and Peixoto. 1996). Los resultados del trabajo mencionado anteriormente muestran diferencias máximas absolutas entre los valores reales y estimados de alrededor de un 30%, lo cual sugiere la utilización de métodos más complejos de los presentados en este estudio, si se desean hacer estimaciones más precisas de datos anuales de precipitación
51
Agradecimientos
A José Retana y Manuel Solera, un agradecimiento muy especial por sus sugerencias y comentarios. RESUMEN
En este estudio se muestran los resultados obtenidos al aplicar diferentes métodos de relleno para datos faltantes en las series anuales de lluvia de algunas estaciones meteorológicas ubicadas en diferentes zonas de Costa Rica. Los procedimientos utilizados comprenden regresión simple y múltiple, y los métodos de la razón, de la razón normal y la razón ajustada. El primero, tercero y quinto requieren el uso de la información de una estación adicional para calcular los datos faltantes. Los otros métodos requieren dos. Se analizaron 12 estaciones, de la cuales 5 están en la Vertiente del Caribe y 7 en la del Pacífico. En total, se utilizaron los totales anuales de precipitación de 36 estaciones. Se usó el test Wilcoxon de suma de rangos para determinar si las distribuciones de probabilidad de los datos observados y estimados eran idénticas. Los resultados mostraron que todas las series estimadas de datos tienen distribuciones de probabilidad idénticas a las de los datos reales. Las diferencias más pequeñas entre los datos observados y los estimados se obtienen al utilizar el método de regresión múltiple, lo cual se refleja en los valores de los errores MAE y RMSE. Sin embargo, a pesar de los resultados anteriores, en algunos casos se observan diferencias muy grandes entre los valores observados y los estimados (95%). Un estudio reciente que usa un modelo autoregresivo de orden 45 para estimar valores anuales de precipitación, muestra que las diferencias más grandes obtenidas con este modelo giran alrededor del 30%, lo cual sugiere la utilización de métodos más complejos si se desean hacer estimaciones más precisas de los datos.
Referencias WMO, 1966. Some Methods of Climatological Analysis. WMO - No. 199.TP. 103. WMO, 1983. Guide to Climatological Practices. WMO - No. 100 Barger, L. and J. C. Nyhan, 1960. Climatology at work. Washington D.C. Paulhus, J. L. H., and M.A. Kohler, 1952. Interpolation of Missing Precipitation Records. Mon. Wea. Rev., 80, No.8, 129-133. Leite, S. M., and J. P. Peixoto, 1996. The Autoregressive Model of Climatological Time Series: An Application to the Longest Time Series in Portugal. Int. J. Clim ., 16, 1165-1173. McClave, J. and F.H. Dietrich, II, 1991. Statistics. Macmillan Publishing Company, 928 pp. Villalobos, R., and J. Retana, 1998. The ENSO phenomenon and the interannual climate variation: its relationship with dry land rice yields in the Northern Pacific of Costa Rica and decision making, en revisión. Willmott, C.J., 1982. Some Comments on the Evaluation of Model Performance. Bull. Amer. Met. Soc., 63, 1309-1313. WMO, 1986. Guía de Prácticas Hidrológicas. WMO - No. 168