SERIES DE TIEMPO RESUMEN En este trabajo se ha realizado el análisis de datos por series de tiempo, para un conjunto de datos de la temperatura del medio ambiente, los datos corresponde específicamente al aeropuerto Internacional Jorge Chávez, en la provincia constitucional del Callao, de la ciudad de Lima, en Perú. Los datos fueron recolectados durante los años 1999, 2000, 2001, 2002, 2003, 2004. Para el análisis solo se han considerado las temperaturas de los cuatro primeros meses de cada año, además debo indicar que se ha tomado valores promedios mensuales. 1.
INTRODUCCION
Una serie de tiempo esta dado por un conjunto de observaciones que están ordenadas en el tiempo, y que estas pueden representar el cambio de una variable ya sea de tipo económica, física, química, biológica, etc., a lo largo esa historia. El objetivo del análisis de una serie de tiempo es el conocimiento de su patrón de comportamiento, para así poder prever su evolución en el futuro cercano, suponiendo por supuesto que las condiciones no variarán significativamente. Los pronósticos que se puedan realizar en base al análisis de este tipo de datos servirán para el desarrollo de nuevos planes para inversiones en agricultura por ejemplo, elaboración de nuevos productos por parte de las empresas, prevención de desastres por cambios en el clima, o captar turistas para la ciudad, etc.
2. TEORIA 2.1 Series de Tiempo Una serie temporal o cronológica es un conjunto e observaciones de una variable, ordenadas según transcurre el tiempo. En una serie de tiempo las observaciones no se deben ordenar de mayor a menor debido a que se perdería el grueso de la información debido a que nos interesa detectar como se mueve la variable en el tiempo es muy importante respetar la secuencia temporal de las observaciones.
2.2 Representación de una Serie Temporal Par realizar la representación de una serie y temporal se debe realizar mediante una gráfica de dispersión x-y como se muestra en la fig.1
Fig.1. Representación de una serie temporal
2.3 Componentes de una serie temporal 2.3.1 Tendencia La tendencia es un movimiento de larga duración que muestra la evolución general de la serie en el tiempo. La tendencia es un movimiento que puede ser estacionario o ascendente, y su recorrido, una línea recta o una curva. Algunas de las posibles formas son las que se muestran en la fig.2
Fig.2. Representación de la tendencia La tendencia es un movimiento que puede ser estacionario o ascendente o descendente como se indica en la fig.3
Fig. 3 Tendencias ascendente, estacionaria y descendente También son posibles algunas formas para la tendencia, que no necesariamente tiene una distribución de puntos en forma aproximadamente lineal sino como las que se muestran en la fig. 4
Fig.4 Líneas de tendencia de otras posibles formas.
2.3.2 Variacione s estacionales. Se habla de este tipo de variaciones usualmente cuando el comportamiento de la variable en el tiempo en un periodo esta relacionado con la época o un periodo particular, por lo general en el espacio cronológico presente.
Fig. 5 Variaciones estacionales
2.3.3 Variaciones cíclicas Se llama así a las o cíclicas a lo largo de una tendencia con un periodo superior al año. El ciclo sugiere la idea de que este tipo de movimiento se repite cada cierto periodo con características parecidas. Los ejemplos mas frecuentes se encuentran en le campo de las variables económicas, en esto casos se deben principalmente a la alternancia de las etapas de prosperidad y depresión en la actividad económica.
2.3.4 Variaciones residuales Cuando a parecen hechos imprevistos, repentinos que afecten las variables en estudio acatando que no podemos proveer nos hallamos frente a variaciones residuales provocadas por r factores externos a aleatorios. Por ejemplo un día lluvioso y frio durante el verano es difícil de predecir y aunque perturbaría ciertas actividades diarias como la venta de helados no afectaría en este caso significativamente la serie. 3.
ANALISIS DE LA TENDENCIA
En la práctica es difícil distinguir la tendencia del comportamiento cíclico. Por ejemplo la gráfica puede conducirnos a concluir que existe una tendencia ascendente en la parte de 1980 a 1982, pero esto es una parte de la serie de tiempo más grande.
Fig, 6 Tendencias crecientes, crecientes entre periodos de tiempo 3.1
Método Gráfico
Mediante este método muy elemental se determina la tendencia a partir de una representación grafica de la serie.la aplicación de este método es como sigue y y y y
Se representa gráficamente la serie cronológica Se unen los extremos superiores de la serie, se hace los mismo con los inferiores Se obtiene dos líneas que encierran ala serie srcinal Uniendo los puntos medios de las distancias entre las dos líneas o curvas se obtiene la tendencia. La línea o curva de tendencia obtenida tendrá un trazado mucho mas suave que la serie srcinal.
Fig. 7 Representación tendencia estacionaria 3.2
Método de las medias móviles
Para este método se deben de considerar los siguientes pasos que se detallan y
y
y
y
4.
O bservar
con detenimiento la serie para determinar aproximadamente la fluctuación con periodo mas largo y llamamos q al número de observaciones que forman una oscilación compleja. Se procede a calcular una serie de medias. La primera de ellas se calcula a partir de las que las primeras observaciones de la serie pero eliminado la primera observación y añadiendo al inmediata posterior. Se prosigue así hasta calcular la media de las últimas observaciones. Cada una de las medias obtenidas en el paso anterior se asigna al instante o momento dentro del periodo temporal que promedian. Uniendo las medias se obtiene la tendencia.
APLICACIÓN
Caso
1:
Producción de Motocicletas en una empresa japonesa, periodo
1974
-
1990
En la siguiente tabla se tiene la producción de motocicletas de una empresa (en millones de motos) en un periodo de 17 años que se muestra en la tabla Nº 1 Tabla Nº1 Venta de Motocicletas en un periodo de 17 años (Producción en millones de motocicletas) Años Producción
Años
Producción
Años
Producción
1974
2.1
1980
2.2
1986
2.1
1975
1.9
1981
2.0
1987
1.9
1976
1.7
1982
1.8
1988
1.5
1977
1.5
1983
1.7
1989
1.4
1978
1.6
1984
1.9
1990
2.5
1979
2.0
1985
2.4
----
-----
Se traslada los datos a Microsoft Excel, ordenados en dos columnas, luego se realiza la gráfica de los datos. Se obtiene la gráfica mostrada en la fig.8
Fig. 8 Representación de la serie de tiempo para las motocicletas por año En la grafica se observa que los años donde se registra mayor producción son 1974, 1980, 1985,1990 Entonces podemos tomar cada cinco años como la cantidad de años para la cual la empresa realiza su mayor producción. Sin embargo es conveniente encontrar una línea de tendencia tal que se pueda hallar una ecuación ajustada para los pronósticos de la producción en el tiempo.
Utilizando el método de la media móvil
Se construye una nueva tabla con las medias móviles Esto es para suavizar la distribución de puntos
Fig. 9 Serie srcinal y serie suavizada por los promedios móviles
Hallando la línea de tendencia En Microsoft Excel, la línea de tendencia para la curva suavizada se obtiene fácilmente y se nuestra en la fig 10
Fig. 10. Línea de tendencia con R2 = 0.4169 El coeficiente de determinación es muy pequeño por lo que no se puede asegurar categóricamente que la ecuación lineal hallada es la que pronostica la producción en los años posteriores.
Será necesario realizar un segundo arreglo con medias móviles El problema ahora es que el periodo donde alcanza la mayor producción es un numero par de años, por lo que se hace difícil en la tabla hallar el año central, realizando el promedio de
Fig.11 Suavizando la línea de tendencia por segunda vez La fig. 11 muestra la segunda suavizada de la línea de tendencia, no ha variado mucho con respecto a la primera,.
Caso 2: Temperatura en Lima ± Aeropuerto Internacional Jorge Chávez, periodo 2000- 2004 En la ciudad de Lima (Perú) el Aeropuerto Internacional Jorge Chávez, las temperaturas registradas durante los años 2000, 2001, 2002, 2003, 2004 consideramos en este caso solo los primeros cuatro meses de cada año, las temperaturas registradas por cada mes promediados son las que se muestran en la tabla Nº1 Tabla Nº 2 Temperaturas de Lima ± Aeropuerto Internacional Jorge Chávez (Lima ±Perú) 2000 ± 2004 2000
2001
2002
2003
2004
T ( º C ) T ( º C )T ( º C )T ( º C )T ( º C )
Enero
21.835
21.694
Febrero
21.835
23.070
22.654
Marzo
21.113
22.181
22.654
22.053
21.887
21.113
20.440
21.270
19.340
20.443
Abril
21.132
22.257
23.286
20.443
22.959
Representación gráfica Primero se organizan los datos de manera conveniente en la hoja de cálculo Excel, Se obtiene la siguiente representación de los datos
Fig. 12 Representación gráfica de los fatos de temperatura por cuatrimestre
CONCLUSIONES y
y
Las series temporales pueden servir para predecir acontecimientos futuros en base a ciertos comportamientos de determinadas variables Si tenemos mas observaciones que se puedan promediar, que es el orden de la media móvil, se obtienen tendencias mas suaves. Este hecho no debe hacernos olvidar que aunque hemos mejorado la tendencia con el suavizado, por el contrario perdemos información sobre los valores iniciales y finales de la tendencia estimada. Con el procedimiento de medias móviles siempre es posible elegir el número de observaciones que se deben tomar para el promedio, esto no siempre es fácil, esto da el periodo de oscilación Si se determina la función matemática de la tendencia lineal, esta no permitirá conocer los valores perdidos tanto al inicio como al final del proceso de búsqueda de la línea de tendencia,
1. Requisitos de Estadística Descriptiva: a. Media, Mediana b. Desviación estándar c. Regresión lineal 2. Qué es una serie de tiempo a. Componentes de la Serie de Tiempo (tipos de variación): i. Tendencia secular ii. Variación estacional iii. Variación cíclica iv. Variación irregular b. Tendencia de una serie i. Lineal ii. No lineal c. Métodos de Suaviza miento de la Serie i. Promedios móviles ii. Promedios móviles ponderados iii. Suaviza miento exponencial d. Pronósticos y su precisión i. Promedios móviles ii. Promedios móviles ponderados iii. Suaviza miento exponencial
Series de Tiempo Por serie de tiempo nos referimos a datos estadísticos que se recopilan, observan o registran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros). El término serie de tiempo se aplica por ejemplo a datos registrados en forma periódica que muestran, por ejemplo, las ventas anuales totales de almacenes, el valor trimestral total de contratos de construcción otorgados, el valor trimestral del PIB. a. Componentes de la serie de tiempo b. Supondremos que en una serie existen cuatro tipos básicos de variación, los cuales sobrepuestos o actuando en concierto, contribuyen a los cambios observados en un período de tiempo y dan a la serie su aspecto errático. Estas cuatro componentes son: Tendencia secular, variación estacional, variación cíclica y variación irregular. Supondremos, además, que existe una relación multiplicativa entre estas cuatro componentes; es decir, cualquier valor de una serie es el producto de factores que se pueden atribuir a las cuatro componentes.
1. Tendencia secular: La
tendencia secular o tendencia a largo plazo de una serie es por lo común el resultado de factores a largo plazo. En términos intuitivos, la tendencia de una serie de tiempo caracteriza el patrón gradual y consistente de las variaciones de la propia serie, que se consideran consecuencias de fuerzas persistentes que afectan el crecimiento o la reducción de la misma, tales como: cambios en la población, en las características demográficas de la misma, cambios en los ingresos, en la salud, en el nivel de educación y tecnología. Las tendencias a largo plazo se ajustan a diversos esquemas. Algunas se mueven continuamente hacía arriba, otras declinan, y otras más permanecen igual en un cierto período o intervalo de tiempo.
2. Variación estacional: El componente de la serie de tiempo que representa la variabilidad en los datos debida a influencias de las estaciones, se llama componente estacional. Esta variación corresponde a los movimientos de la serie que recurren año tras año en los mismos meses (o en los mismos trimestres) del año poco más o menos con la misma intensidad. Por ejemplo: Un fabricante de albercas inflables espera poca actividad de ventas durante los meses de otoño e invierno y tiene ventas máximas en los de primavera y verano, mientras que los fabricantes de equipo para la nieve y ropa de abrigo esperan un comportamiento anual opuesto al del fabricante de albercas.
Variación cíclica: Con frecuencia las series de tiempo presentan secuencias alternas de puntos abajo y arriba de la línea de tendencia que duran más de un año, esta Variación se mantiene después de que se han eliminado las variaciones o tendencias estacional e irregular. Un ejemplo de este tipo de variación son los ciclos comerciales cuyos períodos recurrentes dependen de la prosperidad, recesión, depresión y recuperación, las cuales no dependen de factores como el clima o las costumbres sociales. 3.
4.
Variación Irregular:
Esta se debe a factores a corto plazo, imprevisibles y
no recurrentes que afectan a la serie de tiempo. Como este componente explica la
variabilidad aleatoria de la serie, es impredecible, es decir, no se puede esperar predecir su impacto sobre la serie de tiempo. Existen dos tipos de variación irregular: a) Las variaciones que son provocadas por acontecimientos especiales, fácilmente identificables, como las elecciones, inundaciones, huelgas, terremotos. b) Variaciones aleatorias o por casualidad, cuyas causas no se pueden señalar en forma exacta, pero que tienden a equilibrarse a la larga. b. Tendencia de una serie 1.
Tendencia lineal
Como se dijo antes, la tendencia de una serie viene dada por el movimiento general a largo plazo de la serie. La tendencia a largo plazo de muchas series de negocios (industriales y comerciales), como ventas, exportaciones y producción, con frecuencia se aproxima a una línea recta. Esta línea de tendencia muestra que algo aumenta o disminuye a un ritmo constante. El método que se utiliza para obtener la línea recta de mejor ajuste es el Método de Mínimos Cuadrados.
2. Tendencia no lineal Cuando la serie de tiempo presenta un comportamiento curvilíneo se dice que este comportamiento es no lineal. Dentro de las tendencias no lineales que pueden presentarse en una serie se encuentran, los polinomios, logarítmica, exponencial y potencial, entre otras. c. Métodos de Suaviza miento de la Serie 1.
Promedio móvil
Un promedio móvil se construye sustituyendo cada valor de una serie por la media obtenida con esa observación y algunos de los valores inmediatamente anteriores y posteriores. Se mostrará este método con los siguientes ejemplos: Ejemplo 1. Aplicar el método de promedios móviles para el pronóstico de ventas de gasolina a partir de la siguiente información: Se considerará el promedio móvil a partir de las tres observaciones más recientes. En este caso se utilizará la siguiente ecuación: datos de recientes más valores promedio móvil Resumen de cálculos para promedios móviles de tres semanas Valor de la serie de tiempo (miles de galones) Pronóstico de la i-estima semana con Promedios móviles 1 17 2 21
3 19 4 23 (17+21+19)/3 = 19 5 18 (21+19+23)/3 = 21 6 16 ((19+23+18)/3 = 20 7 20 19 8 18 18 9 22 18 10 20 20 11 15 20 12 22 19
Los promedios móviles también se pueden construir tomando en cuenta valores adyacentes De las observaciones, por ejemplo: En el caso de determinar el promedio móvil para tres observaciones adyacentes de la tabla anterior, se tiene: Semana Valor de la serie de tiempo (miles de galones) Pronóstico de la estimación semana con Promedios móviles para 3 años 1 17 2 21 (17+21+19)/3 = 19 3 19 (21+19+23)/3 = 21 4 23 (19+23+18)/3 = 20 5 18 (23+18+16)/3 = 19 6 16 18 7 20 18 8 18 20 9 22 20 10 20 19 11 15 19
12 22
2. Promedios móviles ponderados Para mostrar el uso de éste método, se utilizará la primera parte del ejemplo anterior de la venta de gasolina. El método consiste en asignar un factor de ponderación distinto para cada dato. Generalmente, a la observación o dato más reciente a partir del que se quiere hacer el pronóstico, se le asigna el mayor peso, y este peso disminuye en los valores de datos más antiguos. En este caso, para pronosticar las ventas de la cuarta semana, el cálculo se realizaría de la siguiente manera: Galones semana cuarta la para pronóstico 33. 19) 19 (63) 21 (62) 17 (61 Puede observarse que el dato más alejado (correspondiente a la primera semana) tiene el factor de ponderación más pequeño, el siguiente tiene un factor de ponderación del doble que el primero y el dato más reciente (que corresponde a la tercera semana) tiene un factor de ponderación del triple del primero. Los pronósticos para las diversas semanas se presentan en la siguiente tabla. En todos los casos, la suma de los factores de ponderación debe ser igual a uno. Semana Valor de la serie de tiempo (miles de galones) Pronóstico de la i-ésima semana con Promedios móviles para 3 años 1 17 2 21 3 19 4 23 19.33 5 18 21.33 6 16 19.83 7 20 17.83 8 18 18.33 9 22 18.33 10 20 20.33 11 15 20.33 12 22
3.
Suavizamiento exponencial
El suavizamiento exponencial emplea un promedio ponderado de la serie de tiempo pasada como pronóstico; es un caso especial del método de promedios móviles ponderados en el cual sólo se selecciona un peso o factor de ponderación: el de la observación más reciente. En la práctica comenzamos haciendo que F1, el primer valor de la serie de valores uniformados, sea igual a Y1, que es el primer valor real de la serie. ttt FYF)1(1 Donde: Ft+1 = pronóstico de la serie de tiempo para el período t+1 Yt = valor real de la serie de tie mpo en el período t Ft = pronóstico de la serie de tiempo para el período t = constante de suavizamiento, 0 1 En base a lo anterior, el pronóstico para el período dos se calcula de la siguiente manera: 112 )1(FYF 112)1(YYF 12YF Como se observa, el pronóstico para el período 2 con suavizamiento exponencial es igual al valor real de la serie de tiempo en el período uno. Para el período 3, se tiene que: 223)1(FYF 123)1(YYF Para el período 4 se tiene: 123334)1()1()1(YYYFYF 1 2 234)1()1(YYYF
Para mostrar el método de suavizamiento exponencial, retomamos el ejemplo de la gasolina, utilizando como constante de suavizamiento = 0.2: valores/semana Pronóstico Semana ( t ) Valor (Yi) Ft 1 17 F1 = Y1 = 17.00 2 21 F2 = F1 =17.00 3 19 F3 = Y2+(1-)F2 = 17.80 4 23 F4 = Y3 + (1-)F3 = 18.04 5 18 F5 = Y4 + (1 -)F4 = 19.03 6 16 F6 = Y5 + (1-)F5 = 18.83 7 20 F7 = Y6 + (1 -)F6 = 18.26 8 18 F8 = Y7 + (1 -)F7 = 18.61 9 22 F9 = Y8 + (1-)F8 = 18.49 10 20 F10 = Y9 + (1 -)F9 = 19.19 11 15 F11 = Y10 + (1 -)F10 = 19.35 12 22 F12 = Y11 + (1-)F11 = 18.48