TEMA TEMA 5. Descripci Descripci´ o on ´n de series temporales
1
Int Introdu oducci´ cci´ on on
Una serie serie temporal temporal es una serie serie estad´ estad´ıstica ıstica cuyos cuyos valores alores se observ observan a lo largo del tiempo, por ejemplo a lo largo la rgo de d´ıas, semanas, meses, estaciones, a˜ a nos, n ˜ os, etc. Los valores se denotar´an an por Y 1 , Y 2 , Y 3 , etc. Por ejemplo, si se observa una cantidad a lo largo de los meses, y se empieza en Enero de 2001, Y 1 ser´ ser´ıa el valor observado para Enero de 2001, Y 2 para Febrero de 2001,..., Y 15 ıa ıa el valor para Marzo de 2002, y as´ as´ı sucesivamente. 15 ser´ Ejemplo 1.1 La tienda tienda online de una pap papeler´ eler´ıa, abierta abierta el 1 de Abril Abril de 2002 ha registr egistrado ado las
siguientes ventas por trimestre (miles de EUROS), 2002
2003
2004
2005
-----------------------------------------------Trimestre 1
--
18.7
22.9
30.4
Trimestre 2
15.1
22.6
26.3
32.1
Trimestre 3
8.3
14.0
18.5
24.2
Trimestre 4
20.3
24.8
28.7
--
------------------------------------------------
2
Compo Compone nen ntes tes de de una una seri serie e tem tempor poral al
Usualmente, una serie temporal es la resultante de la interacci´on de varios factores, (a) Tendencia secular. Es el comportamiento b´asico asico de la serie, a largo plazo. Se denotar´a por T s . Variaciones estacionales. Son alteraciones que se repiten de forma peri´odica y que est´ (b) Variaciones an an relacionadas con el problema considerado. Se denotar´a por V e .
on de la producci´ on de un producto agrario, habr´ a una in• En la observaci´ fluencia decisiva decisiva de la estaci´ on (Primavera, Verano, Oto˜ no, Invierno). Aqu´ Aqu´ı la l a palabra estacional estar´ estar´ıa pre precisamente cisamente referida a la estaci´ on astron´ omica.
Ejemplo 2.1
on de los precios a lo largo de los a˜ nos, cada mes tiene unas particularidades • En la observaci´ estacional se referir´ıa que los lo s hacen variar va riar de forma distinta. d istinta. Aqu´ Aqu´ı la palabra estacional ıa a los meses. mese s. all n´ umero umero de estaci estacione oness, en senti Denotaremos por r a sentido do amplio amplio.. Si son esta estaci cion ones es astron´omicas omicas o trimestres del a˜no, no, ser´a r = 4, si son meses, r = 12, si son d´ıas de la semana, semana, r = 7, etc.
1
Varia ciones es c´ıclicas ıcli cas.. Es una componente de la serie que recoge oscilaciones peri´odicas de (c) Variacion mayor mayor amplitud amplitud que las anterior anteriores. es. Por ejemplo, ejemplo, ciclos ciclos burs´ atiles, atiles, ciclos econ´omicos omicos en los que se dan de forma alternada etapas de prosperidad y de depresi´on, on, cambio cambioss en la moda,.. moda,.... .. Su estudio escapa al objetivo de este curso. Variaciones ariaciones accidentales. Son cambio (d) V cambioss impre imprevis vistos tos en la serie de datos. datos. Po Porr ejempl ejemplo, o, un pedido inesperado a una empresa es una variaci´on on accidental en las ventas de esa empresa, una huelga es una variaci´on on accidental en la serie de transportes de pasajeros de un aeropuerto, una ola de calor en una serie de temperaturas, etc.
En el siguiente gr´afico afico se ha represen representado tado la serie del Ejemplo 1.1. Recordemo Recordemoss que los datos son trimestrales, es decir tenemos 4 observaciones por a˜no, no, r = 4. En est este gr´ gr´afico afico se puede apreciar la componente estacional (hay un patr´on on similar en las ventas que se repite de a˜no n o a a˜ no). n o). En el el gr´afico afico se ha esbozado tambi´ en en lo que ser´ıa ıa la tendencia de la serie, justificaremos en los siguientes apartados apartados c´ omo obtener aproximaciones a esta componente. omo
2.1
Mode odelos
Podemos considerar principalmente dos modelos o formas de mezclarse las componentes anteriores,
• Modelo Aditivo. Y = T s + V e + V c + V a
• Modelo Multiplicativo. Y = T s × V e × V c × V a Observaci´ on on. En la pr´ actica para proponer un modelo para una serie de datos, es ´util actica util el gr´afico afico
de la serie.
2
afico observamos que la amplitud de la oscilaci´on on • Un modelo multiplicativo es adecuado si en ese gr´afico de la componente estacional aumenta con la tendencia. En el Ejemplo 2.2 se puede observar de forma clara este hecho. cambio,, un modelo modelo aditiv aditivoo ser´ sera´ adecuado si en el gr´afico afico de la serie observamos que la • En cambio amplitud de la oscilaci´on on de la componente estacional se mantiene aproximadamente constante con la tendencia. Ejemplo 2.2 En la siguiente tabla se ha recogido la entrada de turistas en millones en una determi-
nada regi´ on durante 7 a˜ nos. Los datos son trimestrales: Primavera, Verano, Oto˜ no, Invierno (r=4). En el gr´ afico de la serie se aprecia claramente la componente estacional y c´ omo la amplitud de la oscilaci´ on de esta componente componente aumenta con la tendencia. Por tanto, un modelo multiplicativo multiplicativo ser´ıa ıa adecuado.
En nuestro desarrollo supondremos que el modelo es multiplicativo , es decir, que el resultado final procede de mezclar las componentes mediante multiplicaci´on o producto. Nos proponemos proponemos los siguiente siguientess OBJETIVOS: Estudia Estudiarr una serie serie tempora temporall de forma forma descri descripti ptiv va, hacien haciendo do aflorar aflorar la tenden tendencia cia
secular, es decir, el comportamiento b´asico asico de la serie, y las variaciones estacionales, que son las que m´as as influencia pueden tener a corto y medio plazo.
3
3
Metodolog Meto dolog´ ´ıa
La metodolog´ıa ıa que seguiremos se divide en varias fases, en cada una de las cuales se van separando o aislando las distintas componentes. Finalmente, se pueden realizar predicciones del valor que tendr´a la serie en estaciones futuras.
3.1 3.1
Inv Investig estigac aci´ i´ on de la Tendencia Secular on
Promediaremos, con la media aritm´etica, etica, las observaciones observaciones agrup´andolas andolas en grupos de r valores medias m´ oviles oviles. Estos consecutiv consecutivos. os. Las cantidades cantidades obtenidas se denominan medias Estos valor valores es se pueden pueden considerar como una primera aproximaci´on o n de la tend tenden enci cia. a. Seg´ Seg´ un r sea par o impar, el m´etodo un etodo var´ var´ıa un poco. po co.
• Si r es impar: Se hace el promedio directamente y se asigna al instante o estaci´on intermedio. promedio, pero los resultados resultados no corresponde corresponden n exactamen exactamente te a las estaciones, estaciones, • Si r es par: Se hace el promedio, es decir, no est´an an centrados, centrados, por p or lo que a contin continuaci´ uaci´ on se promedian otra vez de dos en dos. Veamos on estas dos situaciones en el siguiente ejemplo. Ejemplo 3.1 C´ alculo de las medias m´ oviles par paraa el caso de d´ıas de la semana, es decir, decir, r = 7, o sea, impar; y para estaciones astron´ omicas, o sea, r = 4, esto es, par. Y
Medias Moviles Centradas
Y
M.M.No Cent.
M.M. Centradas
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Lunes
1
Martes
2
P
5
Miercoles
2
V
3
Jueves
3
(1+2+2+3+5+2+2)/7 = 2.43
O
1
11/4=2.75
(2.75+3.00)/2=2.875
Viernes
5
(2+2+3+5+2+2+2)/7 = 2.57
I
2
12/4=3.00
(3.00+3.00)/2=3.000
Sabado
2
(2+3+5+2+2+2+2)/7 = 2.57
P
6
12/4=3.00
(3.00+3.25)/2=3.125
Domingo
2
(3+5+2+2+2+2+3)/7 = 2.71
V
3
13/4=3.25
(3.25+3.25)/2=3.250
Lunes
2
(5+2+2+2+2+3+3)/7 = 2.71
O
2
13/4=3.25
(3.25+3.25)/2=3.250
Martes
2
(2+2+2+2+3+3+6)/7 = 2.86
I
2
13/4=3.25
(3.25+3.50)/2=3.375
Miercoles
3
(2+2+2+3+3+6+3)/7 = 3.00
P
6
14/4=3.50
Jueves
3
(2+2+3+3+6+3+1)/7 = 2.86
V
4
Viernes
6
Sabado
3
Domingo
1
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
N´ otese que para los d´ıas, ıas, como r = 7 que es impar, impar, se han prome promediad diado o de 7 en 7 asignando asignando directame directamente nte al d´ıa ıa correspondi correspondiente. ente. Por ejemplo, al primer Jueves se le asigna la media de Lunes, Martes, Mi´ ercoles, ercoles, Jueves, Viernes, S´ abado y Domingo. Por el contrario, para las estaciones, tenemos r = 4 que es par. Entonces Entonces las primera primerass medias medias m´ oviles corresponder´ der´ıan ıan a instantes instantes intermed intermedios ios y por por ello se dice dice que no est´ an centr centradas adas.. Por ejemplo al prome promediar diar Primavera Primavera (P), Verano (V), Oto˜ no (O) e Invierno In vierno (I), el resultado corresponder corresponder´ ´ıa ıa a un punto intermedio entre Verano Verano y Oto˜ no. Por ello hay que volver a promediar, ahora de dos en dos, para centrar.
4
3.2 3.2
Inv Investig estigac aci´ i´ on de las Variaciones Estacionales on
Dividiremos los datos originales por sus correspondientes medias m´oviles oviles (donde sea posible). Seguidamente promediaremos los valores obtenidos para cada una de las estaciones, empleando la media aritm ar itm´´etica. eti ca. Obten Ob tendr dremo emoss as a s´ı r valores que denotaremos s1 , s2,..., sr . Llamem Llamemos os S a su suma total. Finalmente calculamos las cantidades, ei =
r si × si = S s
que representan la variaci´on on estacional aportada por cada estaci´on. on. Estas cantidades se denominan ´ındices ınd ices de variaci´ variac i´ on on estacional. Multiplica Multiplicando ndo por cien se obtienen obtienen estas cantidade cantidadess como porce p orcentajes, ntajes, quiz´as as m´as as f´aciles aciles de interpretar en algunas ocasiones.
3.3
C´ alculo alculo de la Tendenci Tendencia a Secular
Ya hemos visto que la tendencia secular est´a impl´ impl´ıcita en las medias medias m´ ovil o viles es.. Para ara su c´alculo alculo concreto eliminamos la estacionalidad de la serie original, divididiendo los datos originales por las variaciones ariaciones estacionales estacionales,, ei , (suponiendo (suponiendo que el modelo es multipli multiplicativ cativo) o) . Obtenemos Obtenemos as´ as´ı una serie de valores que se denomina serie desestacionalizada y que supondr´a una aproximaci´on on de la tendencia, mejor que la dada por las medias m´oviles. oviles. Mediante un ajuste de regresi´on on de la serie desestacionalizada, ser´a posible plasmar la tendencia en una recta del tipo tendencia = b × t + a, donde tendencia representa la tendencia secular y t el tiempo, y donde a y b se calculan como se ha visto en el tema anterior de regresi´on y correlaci´on on (tema 4).
3.4 3.4
Pred Predic icci cion ones es
Es posible predecir el valor de la serie para una estaci´on on futura. Para Para ello se siguen siguen los siguiente siguientess pasos, (a) Se predice predice la tendencia tendencia en dicha estaci´ estaci´on, on, a partir de la recta de regresi´on on que representa dicha tenden tendencia cia.. Pa Para ra ello ello se sustituy sustituyee la t en tendencia = b × t + a, por el instante del tiempo correspondiente a la estaci´on on donde se quiera realizar la predicci´on. on. (b) El valor obtenido se multiplica por la variaci´on on estacional, ei , correspondiente a la estaci´on on donde se quiera la predicci´on, on, es decir se estacionaliza la predicci´on. on. El resultado es la predicci´on on buscada. buscada. Esta predic predicci´ ci´ on on ser´a m´as as o menos fiable dependiendo del ajuste de la recta y del per´ per´ıodo de tiempo transcurrido. Obviamente Obviamente ser´a m´as as fiable una predicci´on o n a dos a˜ nos nos vista que a 15 a˜ nos nos vista. NOTA: En el documento denominado Ejemplo completo de series temporales , se desarrolla
lo anterior con todo detalle. Se recomienda estudiar el tema y dicho documento de forma paralela. 5
4
Problemas
Estudie la evoluci´ on de los datos proporcionados, apoy´andose on andose en la representaci´on on gr´afica afica de los mismos, y calcule las medias m´oviles. oviles.
1.
Cuatrimestres\A˜ nos
1890
1891
1892
1893
1o
20 10 10
30 20 10
10 30 20
30 20 30
2o 3o
Las ventas ventas trimestrales online trimestrales online de de una f´abrica abrica de calzado expresadas en miles de euros, para los a˜nos nos 2012, 2013 y 2014 fueron las siguientes: 2.
Trimestres \ A˜ nos 1o 2o 3o 4o
2012
2013
2014
150 165 125 170
155 170 135 165
160 180 140 180
Suponiendo un modelo multiplicativo: (a) Obtenga la serie de tendencia por el m´etodo etodo de las medias m´oviles. oviles. (b) Obtenga los ´ındices ındices de variaci´on on estacional por el m´etodo etodo de la raz´on on a la media m´ovil. ovil. (c) Desestacionalice con dichos ´ındices la serie observada. (d) Obtenga la l a tendencia tendenci a lineal a justando justand o mediante una un a recta por p or el m´etodo etodo de m´ m´ınimos cuadrado cu adrados. s. Repres Rep res´´entela ent ela gr´ gr ´aficamente. aficamente. (e) Estime las ventas que se realizar´an an en cada cada trimestr trimestree de 2016. 2016. Estudi Estudiee la fiab fiabili ilidad dad de las predicciones. Suponiendo un modelo mo delo multiplicativo y que los ´ındices de variaci´ variaci´on on estacional son respectivamente 1.02, 1.20, 1.10, 0.68 para las distintas estaciones del a˜no, no, desestacionalice la siguiente serie temporal relativa al n´umero umero de incidencias registradas en un servicio t´ecnico ecnico inform´atico atico entre 2005 y 2008: 3.
6
Estaciones\A˜ nos
2005
2006
2007
2008
Primavera
8 10 9 5
7 11 8 4
9 12 9 6
10 13 10 5
Verano Oto˜ no no Invierno
El n´ umero umero de p´aginas aginas web cerradas por no cumplir la legislaci´on on vigente, a lo largo de los tres cuatrimestres de los a˜nos nos 2009, 2010 y 2011, fueron: 4.
Cuatrimestres\A˜ nos
2009
2010
2011
1o
6 12 4
10 15 7
14 25 12
2o 3o
Suponiendo un modelo multiplicativo: (a) Obtenga los ´ındices ındices de variaci´on on estacional. (b) Desestacionalice la serie observada observada yt . (c) Calcule la tendencia ten dencia general gen eral aplicando apli cando el m´etodo etodo de d e m´ m´ınimos cuadrado cu adrados. s. Estudie la adecuaci´ a decuaci´on on del ajuste. (d) Prediga el n´umero umero de p´aginas aginas web que se cerraron en cada cuatrimestre de 2013.
7
5
Utilizaci´ on o n en R
5.1 5.1
Entr Entrad ada a de dato datoss
Introducimos los datos del Ejemplo 1.1 datos1 = c(15.10 15.10, ,8.30 8.30, ,20.30 20.30, ,18.70 18.70, ,22.60 22.60, ,14.00 14.00, ,24.80 24.80, ,22.90 22.90, , 26.30, 26.30 ,18.50 18.50, ,28.70 28.70, ,30.40 30.40, ,32.10 32.10, ,24.20 24.20) ) datos1 ##
[1] [1 ] 15 15.1 .1
8.3 8. 3 20 20.3 .3 18.7 18.7 22.6 22.6 14.0 14.0 24.8 24.8 22.9 22.9 26.3 26.3 18.5 18.5 28.7 28.7 30.4 30.4 32.1 32.1 24.2 24.2
Creamos la serie temporal con el comando ts(data,frequency,start) donde: data es data es la serie de datos, frequency es el n´umero umero de estaciones, y start es un vector cuyas componentes indican el a˜no n o y la estaci´on on de inicio, respectivamente. serie1= serie1 =ts ts( (data data=datos1, =datos1,frequency frequency= =4,start start= =c(2002 2002, ,2)) serie1 ##
Qtr1 Qtr2 Qtr3 Qtr4
## 2002
15.1
8.3 20.3
## 20 2003 03 18 18.7 .7 22 22.6 .6 14 14.0 .0 24 24.8 .8 ## 20 2004 04 22 22.9 .9 26 26.3 .3 18 18.5 .5 28 28.7 .7 ## 20 2005 05 30 30.4 .4 32 32.1 .1 24 24.2 .2
5.2 5.2
Desc Descom ompos posic ici´ i´ on de la serie en componentes on
El comando decompose comando decompose almacena en una lista informaci´on on relacionada con las componentes de una serie temporal que siga un modelo determinado (en nuestro caso multiplicativo) componentes= componentes =decompose decompose(serie1, (serie1,type type= =c("multiplicative" "multiplicative")) ))
La serie de medias m´oviles oviles centradas ha quedado almacenada en el valor trend. trend. mmcent= mmcent =componentes componentes$ $trend mmcent ##
Qtr1
## 2002
Qtr2 NA
Qtr3
Qtr4
NA 16.5375
## 200 2003 3 18 18.18 .1875 75 19. 19.462 4625 5 20. 20.550 5500 0 21 21.53 .5375 75 ## 200 2004 4 22 22.56 .5625 25 23. 23.612 6125 5 25. 25.037 0375 5 26 26.70 .7000 00 ## 2005 28.1375
NA
NA
8
Los ´ındices de variaci´on on estacional han quedado almacenados en el valor figure. figure. ´ dice # In Indic e par para a ca cada da es estac taci´ i´ on
varest1= varest1 =componentes componentes$ $figure varest1
## [1] 1.12 1.126229 62295 5 0.70 0.703035 30354 4 1.13 1.139880 98804 4 1.03 1.030854 08547 7
Los ´ındices de variaci´on on estacional repetidos para cada a˜no no han quedado almacenados en el valor seasonal. seasonal. varest2= varest2 =componentes componentes$ $seasonal
´ dice # In Indic e par para a ca cada da es estac taci´ i´ on rep repet etido idos s pa para ra ca cada da a~ no
varest2 ##
Qtr1
## 2002
Qtr2
Qtr3
Qtr4
1.1262295 0.7030354 1.1398804
## 2003 1.03 1.030854 08547 7 1.12 1.126229 62295 5 0.70 0.703035 30354 4 1.13 1.139880 98804 4 ## 2004 1.03 1.030854 08547 7 1.12 1.126229 62295 5 0.70 0.703035 30354 4 1.13 1.139880 98804 4 ## 2005 1.03 1.030854 08547 7 1.12 1.126229 62295 5 0.70 0.703035 30354 4
5.3
C´ alculo alculo de la tendenci tendencia a secular
Serie desestacionalizada serie_des= serie_des =serie1 serie1/ /varest2 #serie desestac desestacionaliza ionalizada da serie_des ##
Qtr1
## 2002
Qtr2
Qtr3
Qtr4
13.40757 11.80595 17.80889
## 2003 18.1 18.14029 4029 20.0 20.06696 6696 19.9 19.91365 1365 21.7 21.75667 5667 ## 2004 22.2 22.21457 1457 23.3 23.35226 5226 26.3 26.31447 1447 25.1 25.17808 7808 ## 2005 29.4 29.49009 9009 28.5 28.50218 0218 34.4 34.42217 2217
Para calcular la recta de tendencia tendremos en cuenta que la serie de instantes de tiempo no viene ..., 14} sino como T = { 2002.25, 2002.50, 2002.75, 2003.00, ..., ..., 2005.50} dada en R como T = { 1, 2, 3, 4, ...,
Time= Time =time time(serie_des) (serie_des)#M #Me e da lo los s ti tiem empo pos s en lo los s qu que e ha si sido do me medi dida da la se seri rie e Time ##
Qtr1
Qtr2
Qtr3
Qtr4
9
## 2002
2002.25 2002.50 2002.75
## 200 2003 3 20 2003. 03.00 00 200 2003.2 3.25 5 200 2003.5 3.50 0 20 2003. 03.75 75 ## 200 2004 4 20 2004. 04.00 00 200 2004.2 4.25 5 200 2004.5 4.50 0 20 2004. 04.75 75 ## 200 2005 5 20 2005. 05.00 00 200 2005.2 5.25 5 200 2005.5 5.50 0
La tendencia secular es la recta tendencia = a + b ∗ t donde a y b son los coeficientes de la recta de regresi´on on de la serie desestacionalizada: rYT= rYT =lm lm(serie_des (serie_des~ ~Time) #recta #recta de regr regresi´ esi´ on rYT ## ## Cal Call: l: ## lm( lm(for formul mula a = ser serie_ ie_des des ~ Tim Time) e) ## ## Coefficie Coefficients: nts: ## (Intercept) ##
-11485.744
Time 5.743
coef= coef =as.vector as.vector(rYT (rYT$ $coefficients) #extraigo #extraigo los coe coefici ficiente entes s coef ## [1] -11485.743626
5.742901
a=coef[ coef[1 1] b=coef[ coef[2 2] a ## [1] -11 -11485 485.74 .74 b ## [1] 5.7 5.7429 42901 01
5.4 5.4
Repre Represe sen ntaci taci´ on o ´n gr´ afica afica de la serie
Pintamos Pintamos la serie y su tendencia. tendencia. Para Para configurar el gr´afico afico tendremos en cuenta que lty es lty es el tipo de l´ınea ın ea,, col el color de la l´ınea e ylim el ylim el rango.
10
plot(serie1, plot (serie1,type type= ="l" "l", ,ylim ylim= =c( min min(serie1), (serie1), max max(serie1))) (serie1))) par( par (new new= =TRUE TRUE) ) #coma #comand ndo o pa para ra hac hacer er un plo plot t en encim cima a de otr otro o plot(a plot (a+ +b*Time, Time,type type= ="l" "l", ,lty lty= =2,col col= =2,ylab ylab= ="" "", ,ylim ylim= =c( min min(serie1), (serie1), max max(serie1))) (serie1)))
0 3
5 2
1 e i r e s
0 2
5 1
0 1
2002.5
2003.0
2003.5
2004.0
2004.5
2005.0
2005.5
Time
5.5 5.5
Pred Predic icci cion ones es
Seleccionamos un instante t donde queremos realizar la predicci´on. on. Por ejemplo, el trimestre siguiente al ultimo u ´ ltimo de nuestra nuestra serie.
11
t=length length(serie1) (serie1)+ +1
serie1 termina en el tercer trimestre. El trimestre siguiente a predecir ser´ ser´ıa el cuarto, por lo que la estaci´on on y el instante de tiempo a utilizar en la predicci´on ser´ se r´ıan ıa n frec = 4 y t = 2005.75. frec= frec =4 t=2005.75 tsecular= tsecular =a+b*t
#c´ alculo alcu lo la tend tendenci encia a secu secular lar
prediccion= prediccion =tsecular tsecular* *varest1[frec] #predigo
12