Análisis de Series de tiempo Modelo clásico de series de tiempo.
CONCEPTOS Una serie de tiempo es un conjunto de observaciones hechas en distintos momentos, normalmente a intervalos iguales de tiempo. Las series de tiempo pueden incluir cantidad de turistas que visitan México en distintos meses, valor del tipo de cambio del peso – dólar dólar en distintos días, entre otros aspectos. Matemáticamente una serie de tiempo puede definirse como los valores de una variable de interés como Y1, Y2, Y3 …. Yn en los tiempos t1, t2, t3…. tn. Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversas diversas instituciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prever o prevenir. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión, a su vez, se suele basar en lo que ha ocurrido en el pasado. Se tiene pues un nuevo tipo de inferencia estadística que se hace acerca del futuro de alguna variable o compuesto de variables basándose en sucesos pasados. La técnica más importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es el análisis de series de tiempo. Son innumerables las aplicaciones que se pueden citar, en distintas áreas del conocimiento, tales como, en economía, física, geofísica, química, electricidad, en demografía, en marketing, en telecomunicaciones, en transporte, etc.
Ser Ser ies De Ti empo
1. Series económicas:
2. Series Físicas:
3. Geofísica:
4. Series demográficas: 5. Series de marketing:
Ej emplos
- Precios de un artículo - Tasas de desempleo - Tasa de inflación - Índice de precios, etc. - Meteorología - Cantidad de agua caída - Temperatura máxima diaria - Velocidad del viento (energía eólica) - Energía solar, etc. - Series sismologías - Tasas de crecimiento de la población - Tasa de natalidad, mortalidad - Resultados de censos poblacionales - Series de demanda, gastos, ofertas
6. Series de telecomunicación: - Análisis de señales 7. Series de transporte:
- Series de tráfico
Uno de los problemas que intenta resolver las series de tiempo es el de predicción. Esto es dado una serie {x(t1),...,x(tn)} nuestros objetivos de interés son describir el comportamiento de la serie, investigar el mecanismo generador de la serie temporal, buscar posibles patrones temporales que permitan sobrepasar sobrep asar la incertidumbre del futuro. En adelante se estudiará como construir un modelo para explicar la estructura y prever la evolución de una variable que observamos a lo largo del tiempo. La variables de interés puede ser macroeconómica (índice de precios al consumo, demanda de electricidad, series de exportaciones o importaciones, etc.), microeconómica (ventas de una empresa, existencias en un almacén, gastos en publicidad de un sector), física (velocidad del viento en una central eólica, temperatura en un proceso, caudal de un río, concentración en la atmósfera de un agente contaminante), o social (número de nacimientos, matrimonios, defunciones, o votos a un partido político).
DEFINICIÓN DE SERIE DE TIEMPO En muchas áreas del conocimiento las observaciones de interés son obtenidas en instantes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales, trimestrales, semestrales o bien registradas por algún equipo en forma continua. Llamamos Serie de Tiempo a un conjunto de mediciones de cierto fenómeno o experimento registradas secuencialmente en el tiempo. Estas observaciones serán denotadas por {x(t1), x(t2), ..., x(tn)} = {x(t) : t Î T Í R} con x(ti) el valor de la variable x en el instante ti. Si T = Z se dice que la serie de tiempo es discreta y si T = R se dice que la serie de tiempo es continua. Cuando ti+1 - ti = k para todo i = 1,...,n-1, se dice que la serie es equiespaciada, en caso contrario será no equiespaciada. En adelante se trabajará con series de tiempo discreta, equiespaciadas en cuyo caso asumiremos y sin perdida de generalidad que: {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}. PRIMER PASO AL ANALIZAR CUALQUIER SERIE DE TIEMPO El primer paso en el análisis de series de tiempo, consiste en graficar la serie. Esto nos permite detectar las componentes esenciales de la serie. El gráfico de la serie permitirá: a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal. Un outliers es una observación de la serie que corresponde a un comportamiento anormal del fenómeno (sin incidencias futuras) o a un error de medición. Se debe determinar desde fuera si un punto dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie. Por ejemplo, en un estudio de la producción diaria en una fabrica se presentó la siguiente situación ver figura 1.1:
Los dos puntos enmarcados en un círculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondían a dos días de paro, lo que qu e naturalmente n aturalmente afectó la producción en esos días. El problema fue solucionado eliminando las observaciones e interpolando.
b) Permite detectar tendencia: la tendencia representa el comportamiento predominante de la serie. Esta puede ser definida vagamente como el cambio de la media a lo largo largo de un periodo (ver figura 1.2).
c) Variación estacional: la variación estacional representa un movimiento periódico de la serie de tiempo. La duración de la unidad del periodo es generalmente menor que un año. Puede ser un trimestre, un mes o un día, etc (ver figura 1.3). Matemáticamente, podemos decir que la serie representa variación estacional si existe un número s tal que x(t) = x(t + k×s). Las principales fuerzas que causan una variación estacional son las condiciones del tiempo, como por ejemplo: 1) en invierno las ventas de helado 2) en verano la venta de lana 3) exportación de fruta en marzo. Todos estos fenómenos presentan un comportamiento estacional (anual, semanal, etc.)
d) Variaciones irregulares (componente aleatoria): los movimientos irregulares (al azar) representan todos los tipos de movimientos de una serie de tiempo que no sea tendencia, variaciones estacionales y fluctuaciones cíclicas. MODELOS DE DESCOMPOSICIÓN Un modelo clásico para una serie de tiempo, supone que una serie x(1), ..., x(n) puede ser expresada como suma o producto de tres componentes: tendencia, estacionalidad y un término de error aleatorio.
Existen tres modelos de series de tiempos, que generalmente se aceptan como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos observados. Estos son: 1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: Multiplicativo: X(t) = T(t) • E(t) • A(t) 3. Mixto: X(t) = T(t) • E(t) + A(t)
Donde: X(t) serie observada en instante t T(t) componente de tendencia E(t) componente estacional A(t) componente aleatoria (accidental) Una suposición usual es que A(t) sea una componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo (1), es adecuado, por ejemplo, cuando E(t) no depende de otras componentes, como T(t), sí por el contrario la estacionalidad varía con la tendencia, el modelo más adecuado es un modelo multiplicativo (2). Es claro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos. El problema que se presenta, es modelar adecuadamente las componentes de la serie. La figura 2.1 ilustra posibles patrones que podrían seguir series representadas por los modelos (1), (2) y (3).
Análisis de fluctuaciones. Técnicas De Pronóstico Para Series Cíclicas Es la fluctuación en forma de onda alrededor de la tendencia. Los patrones cíclicos tienden a repetirse en los datos cada dos, tres o más años. Las fluctuaciones en forma de onda hacia arriba y hacia abajo alrededor de la tendencia rara vez se repiten en intervalos fijos de tiempo y también varía la magnitud de las fluctuaciones. Las técnicas de pronóstico para datos cíclicos se utilizan siempre que:
El ciclo del negocio influye sobre la variable de interés. Como ejemplos están los factores económicos de mercado y de la competencia. • Se presentan cambios en el gusto popular. Ejemplos de ello son la moda, la música y la alimentación. • Se presenta cambios en la población. Podemos citar como ejemplos las guerras, escasez, epidemias y desastres naturales. Se presentan cambios en el ciclo de vida del producto. Ejemplo de ello son la • introducción, crecimiento, maduración, saturación y declinación del mercado. Análisis de tendencia. •
Análisis de Tendencia Al observar la figura sobre la cantidad de ganado en Estados Unidos, así como cualquier otro valor que cambia en el tiempo, podemos notar dependiendo de cada caso como pueden existir fuerzas económicas, políticas, psicológicas y sociales en el cambio de una variable. Precisamente la interpretación de ese cambio es un análisis de tendencia. Existe una clasificación de los movimientos de las series de tiempo, los cuales son:
Clasificación en los análisis de tendencia: 1) Movimientos de larga duración. Dirección general a la cual tienden a ir los valores de la serie de tiempo en un intervalo largo de duración. 2) Movimientos cíclicos. Se refieren a las oscilaciones de larga duración alrededor de la línea de tendencia. Estos ciclos como se denominan pueden ser o no periódicos, es decir, pueden tener intervalos de d e tiempo similares o iguales. En diversas actividades económicas, se considera que un valor es cíclico si tiene una duración igual o mayor a un año. 3) Movimientos estacionales. Se refieren a las normas de tendencia que siempre o casi siempre se siguen en el transcurso de los meses del año. 4) Movimientos irregulares o al azar. Movimientos esporádicos de las series de tiempo, por sucesos ocasionales (inundaciones, (inunda ciones, terremotos, huelgas, elecciones, etcétera). etcétera) .
ESTIMACIÓN DE LA TENDENCIA Supondremos aquí que la componente estacional E(t) no está presente y que el modelo aditivo es adecuado, esto es: X(t) = T(t) + A(t), donde A(t) es ruido blanco. Hay varios métodos para estimar T(t). Los más utilizados consisten en: 1) Ajustar una función del tiempo, como un polinomio, una exponencial u otra función suave de t. 2) Suavizar (o filtrar) los valores de la serie. 3) Utilizar diferencias. AJUSTE DE UNA FUNCIÓN Los siguientes gráficos ilustran algunas de las formas de estas curvas. 3. T(t) = a + b e t 1.T(t) = a + bt (Lineal) 2.T(t) = a e bt (Exponencial) (Exponencial modificada)
) ) 4.T(t) = 0 + 1t ,...,+ mt m 5.T(t) = exp(a + b(r t t)) (Gompertz 0 < r < 1) (Polinomial)
1 t
a b( r
)
, 0 r 1
6. T(t) = (Logística)
Nota: i. la curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representación de la tendencia a largo plazo. plaz o. ii. La tendencia rectilínea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un período restringido de tiempo (por ejemplo).
En la figura 1 ambas curvas (recta y Gompertz) ajustan bien pero las proyecciones divergen enormemente a largo plazo. Ejemplo 1: En la tabla 1 se presentan los datos trimestrales de unidades habitacionales iniciadas en los Estados Unidos desde el tercer trimestre de 1964 hasta el segundo trimestre de 1972 [1]. (Es necesario advertir que para el análisis de tendencia tendencia el periodo que se considera debería ser más largo. Sin embargo, ya que el propósito principal es el de ilustrar el método de descomposición y las técnicas para inferir partiendo de los elementos así descompuestos, la insuficiencia de los datos no tiene por qué interesar.) Tabla 1: Nuevas unidades habitacionales comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972 (en miles de unidades). Añ o
I
II
1964 1965 1966 1967 1968 1969 1970 1971 1972
283 274 218 298 336 264 389 510
454 392 382 452 468 399 604 661
III
IV
Total Total Anual
398 392 290 382 423 387 408 579
352 345 210 340 372 309 396 513
1,474 1,166 1,322 1,545 1,500 1,467 2,085
Sea t cada uno de los 32 trimestres que van de 1964 a 1972, o sea que t = 1 para el tercer trimestre de 1964, t = 2 para el cuarto trimestre, y así sucesivamente. Así que el dominio de definición de t es el conjunto de los enteros de 1 a 32 inclusive. inclusive. Sea T(t) las iniciaciones de viviendas trimestralmente. trimestralmente. Los valores de t y T(t) se dan en la tabla 2.2. Para calcular los valores de a y de b en la recta de tendencia T(t) = a + bt Se obtienen las siguientes cifras a partir de los datos de la tabla 1. Tabla 2: Cálculo de la tendencia de las viviendas comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972
Añ o tr i mestr mestr e t
T(t) T( t)
Tendencia Tenden cia
1964: 3 4 1965: 1 2 3 4 1966: 1 2 3 4 1967: 1 2 3 4 1968: 1 2 3 4 1969: 1 2 3 4 1970: 1 2 3 4 1971: 1 2 3 4 1972: 1 2
398 352 283 454 392 345 274 392 290 210 218 382 382 340 298 452 423 372 336 468 387 309 264 399 408 396 389 604 579 513 510 661
291,73 291,7 3 298,07 304,41 304,4 1 310,75 317,09 323,43 329,77 329,7 7 336,11 342,45 348,79 355,13 361,47 367,81 374,15 380,49 386,83 393,17 399,51 405,85 412,19 418,53 424,87 431,21 437,55 443,89 450,23 456,57 462,91 469,25 475,59 481,93 488,27
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Entonces, la recta de tendencia es T(t) = 285,39 + 6,34× t La figura 2 muestra gráficamente gráficamente la recta de tendencia ajustada a los datos trimestrales de la tabla 2. La recta de trazos después de 1972 representa proyecciones (ver sección 3 Predicciones). Figura 2
Medición de variaciones estacionales e Irregulares. Estacionalidad: Fluctuaciones periódicas bastante regulares que se presenta dentro de cada período de 12 meses, año tras año. Se presenta por po r condiciones climatológicas, costumbres sociales y religiosas entre otras razones. Para identificar la existencia o no de estacionalidad en una serie, se puede realizar la prueba de Anova con respecto a los meses, para determinar si los promedios de consultas externas por mes presentan o no diferencias; o probar los índices estaciónales para observar si existen valores que se encuentren por fuera del rango de 90 – 110. 110. Índices estaciónales: Seasonal index Period (* 100) 1 108.434 2 109.102 3 101.940 4 102.519 5 107.203 6 109.353 7 105.347 8 100.074 9 74.481 10 80.496 11 98.024 12 103.028
De acuerdo con los índices estaciónales se determina que la serie si presenta estacionalidad, pues existen índices que se encuentran por fuera del rango 90 y 110, el cual es un criterio empírico, pero reconocido en la literatura de series de tiempo para determinar la estacionalidad de una serie. Así, por ejemplo, en los meses de septiembre se presenta una marcada disminución de 25.519% con respecto al promedio de consultas mensuales, mientras que en los meses de febrero y junio se incrementa el número de consultas externas. Aplicación de ajustes estacionales. Pasos Necesarios para Realizar el Ajuste Estacional. El proceso de ajuste estacional se puede describir de manera general en seis pasos10, los cuales son comúnes a ambas amba s aplicaciones: 1. Antes de comenzar cualquier tipo de ajuste, el usuario debe familiarizarse con las series de tiempo que se pretenden ajustar. El objetivo es contar con los elementos necesarios para seleccionar los parámetros de ajuste más adecuados para que la serie ajustada refleje las características pertinentes de la serie original. 2. Antes de descomponer la serie de tiempo, es necesario realizar un ajuste previo que tiene dos objetivos: El primero es evitar que el proceso de descomposición se vea afectado por la presencia de no-linearidades en la serie. El segundo objetivo, es mejorar la estabilidad de los componentes estimados ante la incorporación de nuevas observaciones de la serie de tiempo. 3. Antes de utilizar la serie pre-ajustada, es necesario determinar si tanto los ajustes previos como el modelo utilizado son los apropiados. Para lo cual es necesario realizar una serie de diagnosticos para evaluar la bondad del ajuste. Cuando los diagnosticos indican algún problema es necesario ne cesario volver a la etapa de pre-ajuste pre- ajuste y realizar los cambios necesarios para asegurar que los diagnósticos sean satisfactorios.
Pronósticos basados en factores de tendencia. Una consideración particularmente importante en los pronósticos a largo plazo, es el componente cíclico de las series de tiempo. METODOS PARA PRONOSTICOS A CORTO PLAZO: