UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA PROFESIONAL DE ECONOMÍA
ESCUELA DE ECONOMÍA
MODELO ARIMA - PBI TRIMESTRAL PERÚ 1990 – 2010 2010 CURSO
ECONOMETRÍA II
DOCENTE
JORGE ZEGARRA PINTO
INTEGRANTES
CICLO
NORIEGA BARRERA SISSY RAVELO PRIETO SERGIO RODRIGUEZ SALINAS ROXANA
VI – “A”
TRUJILLO - 2011
PRESENTACIÓN
A partir de la teoría econométrica de los procesos ARMA, es decir, de los aspectos teóricos que deben satisfacer dichos procesos, el analista debe encontrar aquel modelo que más se ajuste al comportamiento de sus datos. Aunque en la práctica, la mayoría de las veces, no resulta sencillo determinar, de manera inequívoca, cual es el modelo más adecuado para una serie económica. Lo cual conlleva la necesidad de analizar el alcance de la metodología, cuando se está trabajando con el modelo correcto y cuando no.
Dos son los objetivos principales de esta práctica. En primer lugar, aprender a simular o generar procesos ARMA a partir de la programación directa que permite Eviews y observar que características tienen dichos procesos.
En segundo lugar, mostrar cómo aplicar la metodología Box-Jenkins a los procesos generados, y así poder analizar cuáles son las potencialidades y las limitaciones de dicha metodología.
En concreto, se especificar un modelo ARMA(1,1), y utilizando la posibilidad que ofrece Eviews de programar, simularemos dicho proceso generador de datos (PGD) que hayamos especificado. Una vez, la serie ha sido generada es posible analizar cómo funciona la metodología de Box-Jenkins, del tratamiento empírico de series temporales. Dicha metodología consta de cuatro fases: identificación, estimación, validación y predicción. En la primera de las fases, el analista debe identificar qué proceso ARMA resulta más adecuado a sus datos, determinando los órdenes p y q del proceso ARMA, a partir de un análisis grafio de la serie y de sus correlaciones.
1
En la segunda fase, una vez seleccionado el modelo, se procede a la estimación de los parámetros de este. Esto permite pasar a la tercera fase de validación, en la cual se realizan los habituales test de significación individual y conjunta de los parámetros, se estudia si el modelo satisface las condiciones de estacionalidad e invertibilidad, se analiza la matriz de correlaciones entre los parámetros, se realizan contrastes de la media de la serie, y se analizan las funciones de autocorrelación simple (FAS) y parcial (FAP).de los residuos estimados. Si un modelo satisface los criterios de validación, pasa a la última fase, en la cual se utiliza el modelo estimado para predecir el comportamiento de la serie en el futuro.
Si por el contrario, un modelo no pasa la etapa de validación, el analista debe volver a especificar el modelo, es decir, volver a la etapa 1. Aplicando dichas fases al modelo correcto y a un modelo incorrecto pretendemos analizar la habilidad de la metodología de seleccionar e mejor modelo.
2
INTRODUCCIÓN
En 1970, Box y Jenkins desarrollaron un cuerpo metodológico destinado a identificar, estimar y diagnosticar modelos dinámicos de series temporales en los que la variable tiempo juega un papel fundamental. Una parte importante de esta metodología está pensada para liberar al investigador económetra de la tarea de especificación de los modelos dejando que los propios datos temporales de la variable a estudiar nos indiquen las características de la estructura probabilística subyacente. En parte, los procedimientos que vamos a analizar se contraponen a la "forma tradicional" de identificar y especificar un modelo apoyándonos en las teorías subyacentes al fenómeno analizado aunque, convenientemente utilizados, los conceptos y procedimientos que examinaremos constituyen una herramienta útil para ampliar y complementar los conocimientos econométricos básicos. Se comenzará analizando los modelos en los que una variable es explicada utilizando exclusivamente una "exógena": su propio pasado. Podemos decir que la consideración exclusiva de los valores pasados de una determinada variable para explicar su evolución presente y futura supone, al mismo tiempo, una ventaja y un inconveniente La ventaja radica en el hecho de no necesitar distintas series de datos (distintas variables) referidas al mismo período de tiempo (característica común a todos los modelos univariantes) y, al mismo tiempo, ahorrarnos la identificación y especificación del modelo en el sentido de la econometría tradicional. El inconveniente es que, al renunciar a la inclusión de un conjunto más amplio de variables explicativas, no atendemos a las relaciones que sin duda existen entre casi todas las variables económicas perdiendo capacidad de análisis al tiempo que renunciamos, implícitamente, al estudio teórico previo del fenómeno y a su indudable utilidad.
3
SERIES DE TIEMPO – MODELO ARIMA Los Modelos de Series Temporales pueden ser: Univariantes y Multivariantes.
UNIVARIANTES Sólo se analiza una serie temporal en función de su propio pasado. Un modelo univariante para un proceso estocástico univariante o escalar (Yt) es cualquier conjunto de hipótesis bien definidas sobre ciertas propiedades teóricas de las distribuciones de probabilidad (conjuntas, marginales o condicionales) de los componentes del proceso (Yt) del que se supone procede una serie temporal observada:
Procesos Autorregresivos AR(q) Los procesos o filtros autorregresivos están diseñados de modo que el comportamiento de una variable en un instante de tiempo depende de valores pasados de la propia variable. Así, si el valor de la variable u en el momento t depende de su valor en el periodo anterior más un término aleatorio se dice que el proceso es autorregresivo de primer orden AR(1). Si la relación de dependencia se establece con los p valores anteriores el proceso será autorregresivo de orden p. Matemáticamente estos procesos se expresan del siguiente modo:
Donde εt es un proceso de ruido blanco y por tanto con esperanza nula, varianza constante
y covarianza nula.
4
Procesos de Medias Móviles MA(q) Los procesos de medias móviles, por su parte, se estructuran estableciendo una relación de dependencia entre la variable que se modela y un conjunto de retardos de la variable de ruido blanco et. Si sólo existe un retardo de la variable de ruido blanco el proceso será de orden 1, mientras que si existe una combinación lineal de q términos de error de ruido blanco el proceso se denomina MA(q).
Procesos Mixtos ARIMA(p,I,q) Si el comportamiento de una variable se modela combinando procesos autorregresivos y de medias móviles se denomina ARMA. Así un modelo ARMA(p,q) se caracteriza por una sucesión de p términos autorregresivos y q términos de medias móviles; esto es:
El objetivo que se plantea será entonces conocer qué esquema sigue la perturbación y cuál es la mejor estructura para su modelización
5
DESARROLLO DEL MODELO USANDO LA METODOLOGIA BOX-JENKINS Para hacer el siguiente modelo de series de tiempo metodología datos trimestrales de la variable
medida PBI real
A R I M A,
contamos con
en millones de soles, trimestres
comprendidos entre los años 1990-2010. Los pasos para ir construyendo un proceso ARIMA que sea estable y valido son: La metodología de Box-Jenkins Especificación inicial. Contrastes de raíces unitarias. Análisis de correlogramas simples y correlogramas parciales Estimación. Valoración de modelos Contrastes de hipótesis sobre los coeficientes Análisis de residuos
La metodología Box-Jenkins La metodología propuesta por Box y Jenkins para el análisis de series temporales consiste en los siguientes pasos: 1. Determinar la transformación estacionaria de la serie. 2. Analizar el correlograma simple y el correlograma parcial para determinar cuál es el modelo apropiado para la transformación estacionaria 3. Estimar los parámetros del modelo 4. Diagnóstico para comprobar que el modelo satisface los supuestos iníciales, fundamentalmente que las innovaciones no están relacionadas con el pasado. 5. En el caso de que las innovaciones no sean ruido blanco, proponer un modelo alternativo en función de la información contenida en el correlograma de los residuos.
6
7
Puede notarse como tiene una tendencia creciente a través del tiempo, de esta grafica a simple vista se comprueba que la serie PBI real no es estacionaria en la media ya que esta crece a través del tiempo. Por tal motivo se podría decir que para que la serie sea estacionaria deberá diferenciarse al menos una vez, lo que nos daría una serie estacion aria . de or den 1
CONTRASTES DE RAÍZ UNITARIA El contraste Dickey-Fuller Aumentada y la de Phillips-Perron están diseñados para contrastar la siguiente hipótesis:
Bajo la nula, estamos interesados en la raíz positiva: Estamos contrastando si tenemos un paseo aleatorio. Siempre tenemos que incluir una constante en el modelo porque estamos contrastando frente a la alternativa de estacionalidad (no de media cero). Es un contraste unilateral.
Por razones numéricas, el contraste se basa en la estimación por MCO de la siguiente ecuación:
El estadístico t se calcula de la forma habitual. Sin embargo, su distribución asintótica debe ser obtenida numéricamente porque, bajo la hipótesis nula, la serie no es estacionaria y la teoría asintótica habitual no se puede utilizar.
PRUEBA DE RAIZ UNITARTIA
VARIABLE
PBI REAL
AUGMENTED DICKEY- FULLER
PHILLIPS-PERRON
ESTACIONARIEDAD
INTERCEPT
INTERCEPT Y TREND
NONE
INTERCEPT
INTERCEPT Y TREND
NONE
NIVELES
1.173114
-0.400577
2.331243
1.272594
-4.542781
4.529763
( 0.9978)
( 0.9859)
( 0.9950)
( 0.9984)
( 0.0024)
( 0.9996)
-4.251303
-5.260788
-3.619846
-21.42557
-57.51839
-21.32474
( 0.0009)
( 0.0002)
( 0.0004)
( 0.0001)
( 0.0001)
( 0.0000)
TRIMESTRAL
1°DIFERENCIA
Como se ve la serie es estacionaria en 1º diferencia es decir es integrada de orden 1, ya que al hacer ambos test estos coinciden que es estacionaria en 1º diferencia.
8
FUNCIONES DE AUTOCORELACCIÓN
9
Para tener una noción del tipo de modelo que se puede poner en práctica se hace uso de los correlogramas, para ver si se trata de un AR(p) y de un MA(q) en su componente regular, así como también podría se el caso de observarse una
o SAR(s)
un
en SM A(s)
su
componente estacional, con lo que el proceso integraría la parte regular y la parte estacional en un mismo modelo, con lo que se generaría un modelo SARIMA .
Se puede ver que es un AR(1) en la función de autocorrelación parcial FACP y además en la función de autocorrelación simple
FAS
se puede ver claramente que no decae
rápidamente sino que lo hace de forma muy lenta, lo que además nos dice que no es una serie estacionaria en niveles sino que al menos debe diferenciarse una vez para volverse estacionaria.
ESPECIFICACIÓN INICIAL
Dada una serie temporal concreta, la primera etapa para su análisis es la especificación de un modelo inicial para ajustar a dicha variable. La propuesta de dicho modelo inicial se basará en:
1. Primero determinar cuál es la transformación estacionaria 2. Analizar los correlogramas de la transformación estacionaria para determinar los órdenes del modelo ARMA estacional multiplicativo adecuado. Existen una serie de transformaciones que son muy habituales en un contexto de series temporales y son útiles en el momento de especificar una ecuación. Tenemos las siguientes transformaciones de la variable PBI que usaremos en nuestro modelo:
dPBI : Crea la variable dPBI como la primera diferencia de la serie PBI. lpbi : Crea la variable lPBI como el logaritmo de la serie PBI. dsPBI: Crea la variable dsPBI como la diferencia estacional de la serie PBI. Si la serie es trimestral, s será igual a 4, si es mensual será 12, etc.
dlPBI: Crea la variable lPBI como la primera diferencia del logaritmo de la serie PBI. dslPBI: Se obtiene la misma transformación que antes, pero sobre la frecuencia estacional respectiva.
10
MODELOS SARIMA dlPBI(p,I,q)x(p,I,q)S
11
Dependent Variable: DLPBI Method: Least Squares Date: 12/17/11 Time: 22:29 Sample (adjusted): 1991Q3 2010Q4 Included observations: 78 after adjustments Convergence achieved after 15 iterations Backcast: 1990Q2 1991Q2 Variable
Coefficient
Std. Error
t-Statistic
Prob.
AR(1) SAR(4) MA(1) SMA(4)
0.659513 1.025686 -0.705345 -0.954761
0.046886 0.007092 0.059472 0.015924
14.06623 144.6207 -11.86014 -59.95752
0.0000 0.0000 0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots
Inverted MA Roots
0.883509 0.878786 0.023772 0.041818 183.0370
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat
0.011954 0.068279 -4.590693 -4.469836 1.958599
1.01 .66 .00+1.01i -.00-1.01i -1.01 Estimated AR process is nonstationary .99 .71 -.00+.99i -.00-.99i -.99
CORRELOGRAMA DE LOS RESIDUOS Se lleva a cabo para ver si siguen un proceso de
,y ru ido blanco
12
si estos están
dentro de los márgenes están normalmente distribuidos.
dlPBI (1,1,1)x(1,1,1)4
Como se aprecia el correlograma muestra que los residuos están dentro de los parámetros. Por tanto siguen un proceso de ruido blanco
13
HISTOGRAMA DE NORMALIDAD DE LOS RESIDUOS
CONCLUSIONES
14
En cuanto a los coeficientes del modelo son individualmente significativos, según el contraste de la t de student.
o
El modelo cumplen las condiciones de estacionalidad y de invertibilidad puesto que tanto las raíces de los polinomios autorregresivos como los de media móvil caen fuera del círculo de radio unidad.
o
Desde el punto de vista del correlograma de los residuos estos están dentro de los márgenes lo que nos dice que sigue un
proceso de rui do blanco
y por lo tanto
también podemos decir que los residuos están normalmente distribuidos.
o
A su vez, las matrices de correlaciones de los coeficientes de estos modelos no muestran signos de multicolinealidad.
o
El modelo es válido por el lado de que la suma de los residuos al cuadrado también arroja una cifra pequeña 0.041818, mientras que el coeficiente de correlación nos da arroja un 88,35%.
ANEXO TRIMESTRES
PBI REAL (Millones S/.)
15
TRIMESTRES
PBI REAL (Millones S/.)
1º Trimestre 1990
21.898,399785
3º Trimestre 2000
29.373,685000
2º Trimestre 1990
21.831,485636
4º Trimestre 2000
29.490,728000
3º Trimestre 1990
18.375,423867
1º Trimestre 2001
28.463,417000
4º Trimestre 1990
19.927,101338
2º Trimestre 2001
32.086,553000
1º Trimestre 1991
19.628,879000
3º Trimestre 2001
29.914,732000
2º Trimestre 1991
21.740,915000
4º Trimestre 2001
30.852,385000
3º Trimestre 1991
21.335,224000
1º Trimestre 2002
29.400,211116
4º Trimestre 1991
21.054,673000
2º Trimestre 2002
34.169,754000
1º Trimestre 1992
20.877,017000
3º Trimestre 2002
31.506,047000
2º Trimestre 1992
21.346,073000
4º Trimestre 2002
32.326,001000
3º Trimestre 1992
19.945,192000
1º Trimestre 2003
31.370,869283
4º Trimestre 1992
21.232,275000
2º Trimestre 2003
35.723,629998
1º Trimestre 1993
20.730,811000
3º Trimestre 2003
32.342,838493
2º Trimestre 1993
22.449,160000
4º Trimestre 2003
33.107,503296
3º Trimestre 1993
21.930,118000
1º Trimestre 2004
32.675,552282
4º Trimestre 1993
22.264,500000
2º Trimestre 2004
36.855,407650
1º Trimestre 1994
23.126,908000
3º Trimestre 2004
33.927,633671
2º Trimestre 1994
25.427,870000
4º Trimestre 2004
35.682,651859
3º Trimestre 1994
24.481,670000
1º Trimestre 2005
34.648,838149
4º Trimestre 1994
25.540,996000
2º Trimestre 2005
39.372,569135
1º Trimestre 1995
25.846,606286
3º Trimestre 2005
36.217,481441
2º Trimestre 1995
28.241,906728
4º Trimestre 2005
38.401,089592
3º Trimestre 1995
26.593,904000
1º Trimestre 2006
37.304,988733
4º Trimestre 1995
26.381,472000
2º Trimestre 2006
41.667,286780
1º Trimestre 1996
25.912,633983
3º Trimestre 2006
39.372,865509
2º Trimestre 1996
28.962,807218
4º Trimestre 2006
41.800,295526
3º Trimestre 1996
27.016,216000
1º Trimestre 2007
40.506,604402
4º Trimestre 1996
27.868,337000
2º Trimestre 2007
45.074,175438
1º Trimestre 1997
27.430,945505
3º Trimestre 2007
42.912,619508
2º Trimestre 1997
31.133,131000
4º Trimestre 2007
45.913,467121
3º Trimestre 1997
28.898,202860
1º Trimestre 2008
44.675,585861
4º Trimestre 1997
29.831,708000
2º Trimestre 2008
50.347,093413
1º Trimestre 1998
28.100,675000
3º Trimestre 2008
47.584,770631
2º Trimestre 1998
30.298,589000
4º Trimestre 2008
48.897,760423
3º Trimestre 1998
28.813,898000
1º Trimestre 2009
45.524,811919
4º Trimestre 1998
29.309,088000
2º Trimestre 2009
49.743,660432
1º Trimestre 1999
27.724,269000
3º Trimestre 2009
47.305,162226
2º Trimestre 1999
30.683,672000
4º Trimestre 2009
50.581,766633
3º Trimestre 1999
28.856,015000
1º Trimestre 2010
48.330,171815
4º Trimestre 1999
30.323,460000
2º Trimestre 2010
54.729,044306
1º Trimestre 2000
29.721,821000
3º Trimestre 2010
51.846,886624
2º Trimestre 2000
32.470,708000
4º Trimestre 2010
55.236,832677
FUENTE: ESTADÍSTICAS PBI PERÚ - BCRP
BIBLIOGRAFIA
EN LIBROS:
BOX, G. E. P., y JENKINS, G. M. (1976): Time Series Anlysis. Forecas¬ting and Control. Holden-Day.
BOX, G. E. P.; PIERCE, D., y NEWBOLD, P. (1987): «Estimating Trend and Growth Rates in Seasonal Time Series", Journal of American Statistical Asociation, 82, 397, 276-282.
CHATFIELD, C, y PROTHERO, D. L. (1973): «Box-Jenkins seasonal forecasting: problems in a case study". Journal of Royal Statistical Society A.. 134, 295-336.
ECONOMETRÍA DAMODAR N. Gujarati 4º Edición
ESTADÍSTICAS ECONÓMICAS - series trimestrales del Banco Central de Reserva del Perú: http.www.bcrp.gob.pe
EN INTERNET:
http://es.wikipedia.org/wiki/Modelo_autorregresivo_integrado_de_media_m%C3%B3v il
http://www.dnp.gov.co/Portals/0/archivos/documentos/DEE/Archivos_Economia/181.p df
http://www.uam.es/personal_pdi/economicas/anadelsur//pdf/Box-Jenkins.PDF
http://www2.uah.es/esd/ST/sesion1.pdf
16