3 Análisis de serie de tiempo.
3.1 Componentes de una serie de tiempo. Tendencia, es la componente de largo plazo que constituye la base del crecimiento o declinación de una serie histórica, como se presenta en la figura 1.1. Los fuerzas básicas que producen o afectan la tendencia de una serie son: cambios en la población, inflación, cambio tecnológico e incremento en la productividad. Figura 1.1 Gráfica de una serie de datos con tendencia
Ciclicidad, es un conjunto de fluctuaciones en forma de onda o ciclos, de más de un año de duración, producidos por cambios en las condiciones económicas, como se presenta en la figura 1.2. Representan la diferencia entre los valores esperados de una variable (tendencia) y los valores reales (la variación residual que fluctúa alrededor de la tendencia). Figura 1.2 Gráfica de una serie de datos con ciclicidad
Estacionalidad, las fluctuaciones estacionales se encuentran típicamente en los datos clasificados por trimestres, mes o semana. La variación estacional se refiere a un patrón de cambio, regularmente recurrente a través del tiempo. El movimiento se completa dentro de la duración de un año y se repite a sí mismo año tras año, como se presenta en la figura 1.3. Figura 1.3 Gráfica de una serie de datos con estacionalidad.
Aleatoriedad, este comportamiento irregular está compuesto por fluctuaciones causadas por sucesos impredecibles o no periódicos, como el clima poco usual, huelgas, guerras, rumores, elecciones y cambio de leyes, como se presenta en la figura 1.4. Figura 1. 4 Gráfica de una serie de datos con aleatoriedad
Estacionaria, es aquella serie de datos cuyas propiedades estadísticas básica, como media y la varianza, permanecen constantes en el tiempo, se dice que una serie que no presenta crecimiento o declinación es estacionaria, como se presenta en la figura 1.5. Figura 1. 5 Gráfica de una serie de datos estacionaria
3.2 Método de mínimos cuadrados. Mínimos cuadrados es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración). Pero requiere un gran número de iteraciones para converger. Un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria. El teorema de Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución normal. También es importante que los datos recogidos estén bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar más peso a un dato en particular, véase mínimos cuadrados ponderados). La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas. Muchos otros problemas de optimización pueden expresarse también en forma de mínimos cuadrados, minimizando la energía o maximizando la entropía Dada una serie de datos la recta de mejor ajuste a esos datos está dada por y = mx =b, donde la pendiente es
y la ordenada en el origen es
En el caso frecuente en el que la recta deba pasar por el origen, su ecuación será y la pendiente es
La bondad del ajuste por mínimos cuadrados se puede estimar calculando el coeficiente de correlación
Un coeficiente de correlación próximo a la unidad indica un buen ajuste. Debe tenerse en cuenta que los datos experimentales estarán afectados por sus incertidumbres y por tanto los valores de m y b tendrán también incertidumbre. Para determinarla de forma sencilla, se supone que los datos en x no tienen incertidumbre y que los datos en y tienen todos la misma uy. Entonces la incertidumbre en la pendiente está dada por
donde U es el valor mayor entre uy y oe.
La incertidumbre en la ordenada en el origen es:
donde U es el valor mayor entre uy y oe. En el caso de una recta que pasa por el origen, la incertidumbre en la pendiente es
donde U es el valor mayor entre uy y oe.
3.3 Métodos de promedios móviles. La utilización de esta técnica supone que la serie de tiempo es estable, esto es, que los datos que la componen se generan sin variaciones importantes entre un dato y otro (error aleatorio=0)2, esto es, que el comportamiento de los datos aunque muestren un crecimiento o un decrecimiento lo hagan con una tendencia constante. Cuando se usa el método de promedios móviles se está suponiendo que todas las observaciones de la serie de tiempo son igualmente importantes para la estimación del parámetro a pronosticar (en este caso los ingresos). De esta manera, se utiliza como pronóstico para el siguiente periodo el promedio de los n valores de los datos más recientes de la serie de tiempo. Utilizando una expresión matemática, tenemos: El término móvil indica que conforme se tienen una nueva observación de la serie de tiempo, se reemplaza la observación más antigua de la ecuación y se calcula un nuevo promedio.
El resultado es que el promedio se moverá, esto es, conforme se tengan nuevos datos y se vayan sustituyendo en la fórmula, el valor del promedio irá modificándose. No existe una regla específica que nos indique cómo seleccionar la base del promedio móvil n. Si la variable que se va a pronosticar no presenta variaciones considerables, esto es, si su comportamiento es relativamente estable en el tiempo, se recomienda que el valor de n sea grande. Por el contrario, es aconsejable un valor de n pequeño si la variable muestra patrones cambiantes. En la práctica, los valores de n oscilan entre 2 y 10. El método de promedios móviles es muy útil cuando se tiene información no desagregada y cuando no se conoce otro método más sofisticado y que permita predecir con mayor confianza.
3.4 Métodos de suavización exponencial. Otro método para realizar un pronóstcico es el método de suavización exponencial. A diferencia de los promedios móviles, este método pronostica otorgando una ponderación a los datos dependiendo del peso que tengan dentro del cálculo del pronóstico. Esta ponderación se lleva a cabo a través de otorgarle un valor a la constante de suavización, α, que puede ser mayor que cero y menor que uno. Para nuestro ejemplo, utilizamos un valor de α = 0.8, por ser éste el que mejor ajusta al pronóstico a los datos reales. El método de suavización exponencial supone que el proceso es constante, al igual que el método de promedios móviles. Esta técnica está diseñada para atenuar una desventaja del método de promedios móviles, en donde los datos para calcular el promedio tienen la misma ponderación. De manera particular, esta técnica considera que las observaciones recientes tienen más valor, por lo que le otorga mayor peso dentro del promedio. La suavización exponencial utiliza un promedio móvil ponderado de los datos históricos de la serie de tiempo como pronóstico; es un caso especial de promedio móvil en donde se selecciona un solo valor de ponderación 3. El modelo básico de suavización exponencial se presenta a continuación: Ft+1 = αYt + (1 - α)Ft (2) Donde: Ft+1 = Pronóstico de la serie de tiempo para el periodo de t + 1. Yt = Valor real del periodo anterior al año a pronosticar. Ft = Valor real del periodo anteanterior al año a pronosticar. α = Constante de suavización (0 ≤ α ≤ 1). La utilización de esta ecuación implica algunas especificaciones. El cálculo de Ft+1 está ligado con los 2 periodos anteriores. En otras palabras, el pronóstico de suavización exponencial en determinado periodo es (Ft+1) = al valor real de la serie de tiempo en el periodo anterior (Yt) X la constante de suavización (α), + 1 la constante de suavización (α) X el periodo anteanterior (Ft). Ft+1 = αααYt + (1 - ααα)Ft
(2)
A pesar de que la suavización exponencial nos da un pronóstico que es un promedio ponderado de todas las operaciones pasadas, no es necesario guardar todos los datos del pasado a fin de calcular el pronóstico para el periodo siguiente. De hecho, una vez seleccionada la constante de suavización α, sólo se requiere de dos elementos de información para calcular el pronóstico. La ecuación (2) muestra que con un α dado, podemos calcular el pronóstico para el periodo t + 1 simplemente conociendo los valores reales y pronosticados de la serie de tiempo el periodo t, es decir, Yt y Ft. La elección de la constante de suavización α es crucial en la estimación de pronósticos futuros. Si la serie de tiempo contiene una variabilidad aleatoria sustancial, se preferirá un valor pequeño como constante de suavización. La razón
de esta aseveración es que gran parte del error del pronóstico es provocado por la variabilidad aleatoria, por lo que un valor pequeño de α permite un pronóstico mejor. Por el contrario, para una serie de tiempo con una variabilidad aleatoria relativamente pequeña, valores más elevados de la constante de suavización tienen la ventaja de ajustar con rapidez los pronósticos cuando ocurren errores de pronóstico y permitiendo, por lo tanto, que el pronóstico reaccione con mayor rapidez a las condiciones cambiantes. En la práctica, el valor de α está entre .01 y .90.
Utilizando la ecuación 2, sustituimos los valores correpondientes para hacer el pronóstico para el año 1992. Sutituyendo valores nos quedaría:
Fingresos 1992 = 0.8 (201986) + (1 – 0.8)(163305) Fegresos 1992 = 0.8 (189498) + (1 – 0.8)(162370) El mismo procedimiento se realiza para el resto de los años y obtenemos los resultados que aparecen en el cuadro 2. Una vez que se calculan los Diplomado en Gestión Estratégica de las Finanzas Públicas D.R. Instituto Tecnológico y de Estudios Superiores de Monterrey, México, 2006 pronósticos de ingresos y egresos, la diferencia entre éstos nos da el ahorro, que aparece en la última columna del mismo cuadro. Podemos observar que el pronóstico se ajusta más a los datos reales que en el caso de los promedios móviles. Este método nos permite realizar un pronóstico más confiable que el caso anterior. Claramente se observa que el pronóstico tiene mejor ajuste y la diferencia entre los valores reales y los pronosticados es mínima.
3.5 Tendencias no lineales. En el caso de tendencias no lineales, los dos tipos de curvas de tendencia de uso mas frecuente son la curva de tendencia exponencial y la curva de tendencia parabólica. Una curva de tendencia exponencial común refleja una tasa constante de crecimiento durante un periodo de años. La curva exponencial debe su nombre al hecho de que la variable independiente X es el exponente de b1 en la ecuación general: Formula nº3 b = valor de Y en el año 0 b1= tasa de crecimiento. De la obtención del logaritmo de ambos lados resulta la ecuación de tendencia lineal logarítmica: Formula nº4La ventaja de la transformación a logaritmos es que la ecuación lineal para el análisis de tendencias puede aplicarse a los logaritmos de los valores cuando la serie de tiempo sigue una curva exponencial. Los valores logarítmicos pronosticados de Y pueden reconvertirse después a las unidades de medida originales mediante la obtención del antilogaritmo de los valores. Una línea de tendencia logarítmica es una línea curva que se ajusta perfectamente y que es muy útil cuando el índice de cambios de los datos aumenta o disminuye rápidamente y después se estabiliza. Esta línea de tendencia logarítmica puede utilizar valores positivos o negativos. En el siguiente ejemplo se utiliza una línea de tendencia logarítmica para mostrar el crecimiento previsto de la población animal en un área determinada, donde la población se estabilizó al reducirse el espacio para los animales. Observe que el valor R cuadrado es 0,9407, que es un ajuste relativamente bueno de la línea respecto a los datos.
3.6 Variación estacional. El análisis de las variaciones estacionales tiene por objeto determinar oscilaciones de período corto, inferior o igual al año por lo general, que son de máximo interés para el economista o empresario, para la mejor organización de sus actividades operativas. En una segunda fase se trata de eliminar tales variaciones de los datos observados que permitan apreciar de cierto modo la influencia de causas importantes de variación en las series cronológicas. La dificultad principal del análisis de la componente estacional radica en el hecho de que en la práctica tal variación no es idéntica en el transcurso de los años, bien sea porque se desplaza de un mes a otro, o porque varía de intensidad. Muchos y variados son los métodos preconizados por la estadística para determinar la variación estacional, basados unos en la hipótesis aditiva y otros en la multiplicativa. Todos ellos tratan de aislar la variación estacional eliminando las otros componentes, por resta algebraica o por cociente, según sea la hipótesis inicial de combinación. Deben, pues, ser eliminada la tendencia secular y las variaciones accidentales. Cuando el período de estudio es corto, la variación cíclica puede suponerse incluida en la tendencia, por lo cual, al eliminarse ésta, queda también eliminada aquella. De todos los métodos usuales se expondrá sólo uno, basado en la hipótesis aditiva, denominado "Método de las medias mensuales". El problema que nos proponemos resolver, es el de encontrar una curva tal que en el eje de las abcisas, estén representados los meses del año, por ejemplo ( t= 1, 2, 3, ....12) y en las ordenadas, la variación promedio correspondiente a cada uno de los meses del año, prescindiendo por cierto de otro tipo de variaciones, ya sean tendenciales, cíclicas (no anuales) o accidentales (aleatorias). Determinada la tendencia, bien sea mediante un ajuste analítico, bien mediante el método de promedios móviles, la variación estacional puede determinarse a través de los siguientes pasos: 1) Se determinan las desviaciones de los datos de la serie respecto a la tendencia o sea, la diferencia entre los datos y el valor correspondiente a la tendencia. De esta manera se elimina la tendencia. yi Ti E C I 2) Se calculan las medias aritméticas de las desviaciones correspondientes a todos los eneros, todos los febreros, etc. Este paso tiende a eliminar la componente cíclica e irregular quedando únicamente la componente estacional. 3) Se redondean estas medias y los resultados son la estimación de la variación estacional para cada mes. El método de cálculo se desarrolla mediante el proceso que se expone a continuación reflejados en la tabla 4, en la que se ha prescindido del año inicial 1977, por no disponer de datos para la tendencia de sus primeros - seis meses y
del último año 1982 por ocurrir lo mismo para el último semestre de dicho año. Se puede usar suma cuando los eneros tienen valores muy grandes. Tabla 4 - Cálculo de las variaciones estacionales.
Mes
1978
1979
Enero
1980
1981
Totales
E Yi Ti Medias
Variación
mensuales
Estacional
2.52
3.42
4.27
4.46
14.67
3.668
3.615
Febrero
1
0.77
-2.64
0.36
-0.51
-0.128
-0.180
Marzo
1.52
-1.81
2.47
-0.79
1.39
0.348
0.295
Abril
3
1.11
0.56
2.04
6.71
1.678
1.625
Mayo
-0.12
-1.02
-1.1
-1.71
-3.95
-0.988
-1.040
Junio
-2.17
-4.21
-2.77
-3.02
-12.17
-3.043
-3.095
Julio
-2.81
-1.92
-2.62
-2.79
-10.14
-2.535
-2.588
Agosto
-5.31
-3.89
-3.67
-3.39
-16.26
-4.065
-4.118
Septiembre
-4.14
-4
-4.08
-3.42
-15.64
-3.910
-3.963
Octubre
-0.92
-0.21
-1.46
-0.94
-3.53
-0.883
-0.935
Noviembre
5.21
5.79
1.52
4.13
16.65
4.163
4.110
Diciembre
4.33
7.25
5.52
8.21
25.31
6.328
6.275
0.632
0.000
Las cuatro primeras columnas han sido obtenidas restando de los datos iniciales (Tabla 1) los valores de la tendencia (tabla 3) diferencias que resultan positivas y negativas. Así para Enero de 1977 tenemos 17 - 14,48 = 2,52 Febrero de 1977 tenemos 15,5 - 14,5 = 1,00 La columna de totales es la suma algebraica de todos los eneros de todos los febreros, etc. La columna de medias mensuales se obtiene dividiendo los valores de los totales por 4, que es el número de años utilizado. Por último, la columna " variación estacional" es la misma que la de medias después de someter los valores de ésta a un redondeo que hace que las sumas de las variaciones estacionales sea cero, que se efectúa de la forma siguiente: Se suma la columna de medias y se divide esta suma por 12. Si el resultado es positivo se resta de cada una de las medias mensuales y si es negativo se suma. En nuestro caso el total de medias vale 0,1150 y por lo tanto 0,1150/12 = 0,0095. Este valor se resta algebraicamente a la columna de medias y el resultado se redondea a dos cifras decimales, que es la aproximación con que venían dados los datos iniciales, conservando la segunda cifra decimal o forzándola en una unidad, según que las dos últimas formen un número menor o mayor que 50 respectivamente.
Así pues:
3,6675 - 0,0095 = 3,6580 = 3,66 - 0,1275 - 0,0095 = 0,1370 = -0,14 6,7025 - 0,0095 = 6,6930 = 6,69
Se puede representar ahora la variación estacional en un gráfico, en el que como abscisa se toman los distintos meses y en ordenadas los valores obtenidos. Resulta así la figura 4. Componente Estacional
E
F M
A
M
J
J
A
S O
N
D