Ejercicios Resueltos (de examen) Rom´ an Salmer´ an o n G´ on omez omez
1.
Modelo Mode lo li line neal al uni uniec ecua uaci ciona onall m´ ultiple ultiple
1. Usando los siguientes datos, consumo nacional (C (C t ) y renta nacional (R (Rt ) en Espa˜ na pana ra el period periodo o 1995 1995-200 -2005 5 a pre precio cioss cor corrie rient ntes es (109 eur euros), os), obt obteng enga a las est estima imacion ciones es por MCO,, as MCO as´ ´ı com como o las suma sumass de cua cuadra drados dos tot total, al, exp explic licada ada y res residua idual, l, y el coefi coeficie cient nte e de determinaci´ on, para el modelo de regresi´ on, on C t = β 1 + β 2 Rt + ut . on C t 34 9 36 8 38 8 41 4 44 4 48 4 51 8 55 0 58 6 63 5 68 6
A˜ no no 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05
Rt 38 8 40 8 43 3 46 5 49 8 53 8 57 4 61 4 65 6 69 9 74 8
A partir de la informaci´on on muestral se tiene que: t
X X = =
11 6 021 6021 60 21 3443 3443083 083
t
,
X C = =
por lo que la estimaci´on del modelo por MCO se obtiene a partir de:
t
β = β = X X
−1
t
X C = =
2′ 1234 0′ 00371 0′ 00 003371 0′ 00000678
−
−
Por tanto, el modelo estimado queda: C C t =
·
−
5422 3104015
5422 3104015
=
,
12′8761 0′924
−12′8761 + 0′924 924R Rt .
La suma de cuadrados explicada se obtiene a partir de la expresi´on:
· t
t
SC E = = β β X C
2
n C = 2798415′824
− ·
− 11
· 5422 11
mientras que la de los residuos: SC R =
et e 182′1756 = = 20 ′ 2417 2417,, n k 11 2
−
−
1
2
= 125862′7334 7334,,
.
donde se ha usado que:
e = = C C
− C = C =
349 368 388 414 444 484 518 550 586 635 686
y por tanto, e tanto, e t e = 182 ′1756.
−
345′ 6509 364′ 1317 387′ 2327 416′ 8019 447′ 2952 484′ 2567 517′ 5221 554′ 4837 593′ 2933 633′ 0270 678′ 3049
=
− −− − −
3′3491 3′8683 0′7673 2′ 8019 3′ 2952 0′ 2567 0′4779 4′ 4837 7′ 2933 1′9730 7′6951
,
Por otro lado, la suma de cuadrados totales ser´a SC T = SC E + S + SCR CR = 125862′7334 + 182 ′1756 = 126044′909. Finalmente, el coeficiente de determinaci´on es: R2 =
SC E 125862′7334 = = 0 ′ 998554 998554.. SC T 126044′909
2. Para el modelo Y t = = β β 1 + β 2 vt + β 3 wt + ut se tienen los siguientes datos: S C T = 104′ 9167 9167,,
n = 12 12,,
− − X t X
Se pide:
−1
0′ 6477 0 ′ 0 41 0′ 0639
=
−′0′041 −0′′0639 0 0071 −0 0011 −0′0011 0′0152
X t Y =
,
91 699 448
.
a) Ajust Ajustar ar el modelo por el m´ etodo de MCO y calcu etodo calcular lar el coeficien coeficiente te de deter determinac minaci´ i´ on. on. b) Contraste de significaci´ on para β 2 + β 3 = 1. on c) Int Interv ervalo alo de predicci´ on para E [Y on Y ]] sabiendo que v0 = 2′ 5 y w0 =
−0′3.
La estimaci´on on del modelo por MCO se obtiene a partir de:
β = β = X t X
−1
− −
0′ 6477 0 ′ 041 0′ 0639
X t Y =
−′0′ 041 −0′′0639 0 0071 −0 0011 · ′ ′ −0 0011 0 0152
91 699 448
=
Por tanto, el modelo estimado queda: Y Y t = 1′ 6545 + 0 ′ 7391 7391vvt + 0 ′2258 2258w wt . Para calcular el coeficiente de determinaci´on tend tendremos remos en cuen cuenta ta que:
·
SC E = = β β t X t Y donde se ha usado que:
− n · Y −
2
= 768′3488
·
β t X tY = (1 ′ 6545 0′ 7391 0′ 2258) β
y
Y t = 91
− 690′083 = 78′2654 2654,,
· 91 699 448
→ Y = 91 = 7 ′ 583 → Y 12 2
2
= 768′3488 3488,,
= 57 ′5069 5069..
1′ 6545 0′ 7391 0′ 2258
.
Adem´ as, como S as, como S CT CT = = 104 ′9167, el coeficiente de determinaci´on ser´a: a: R2 =
SC E 78′ 26547 = = 0 ′ 7459 7459.. ′ SC T 104 9167
Es deci decir, r, el ajuste realizado realizado explica aproximadame aproximadamente nte un 74’59 % de la variabilid variabilidad ad de Y Y .. Para el contraste de significaci´on on de la restricci´on H on H 0 : : β β 2 + β 3 = 1, tendremos en cuenta que se rechaza la hip´otesis otesis nula si:
− · Rβ β
F exp exp =
t
r
R (X t X )
−1
Rt
q σ2
·
· − −1
Rβ β
r
> F q,n q,n−k (1
− α).
De la restricci´on β on β 2 + β 3 = 1 se obtiene que R R = = (0 1 1), r = 1 y q q = = 1, por lo que:
−
Rβ β
R
· t
X X
−1
·R
t
r = (0 1 1)
= (0 1 1)
−
1′ 6545 0′ 7391 0′ 2258
·
· − −
0′ 6477 0 ′ 041 0′0639
−
σ2 =
se tiene que:
−0′0351 0351,,
−′0′041 −0′′0639 0 0071 −0 0011 · −0′0011 0′ 0152
= ( 0′1049 0′ 006 0′ 0141)
Y como:
1=
· 0 1 1
0 1 1
= 0 ′ 0201 0201..
SC R SC T = n k n
−− SC E = 104′9167 − 78′ 2654 = 26′6512 = 2 ′ 962 962,, −k 12 − 3 9
−
0′ 03512 F exp = exp = ′ 2 962 0′ 0201 por lo que no se rechaza la hip´otesis otesis nula.
·
0′ 0012 = 0 ′ 0207 > 5 ′ 117 = F = F 1,9 (0′ 95) 95),, ′ 0 0595
Finalmente, el intervalo de predicci´on para E para E [[Y Y ]] es:
± − · · · t
x0 β β Como:
α 2
tn−k 1
xt0 (X tX )−1 x0 .
σ
·
xt0 β β = = 1′ 6445 + 0 ′ 7391 2′ 5 + 0 ′ 2258 ( 0′ 3) = 3 ′ 43451 43451,,
xt0
· X t X
−1
·x
0
·
= (1 2′ 5
− 0′3)
= (0′ 56437
−
·−
· − −
0′ 6477 0 ′ 0 41 0′ 0639
0′02292
el interva intervalo lo de confianza al 95 % es: 3′ 43451
−
−′0′041 −0′′0639 1 · 2′5′ 0 0071 −0 0011 ′ ′ −0 0011 0 0152 −0 3
0′ 07121)
· − 1 2′ 5 0′ 3
= 0 ′ 528433 528433,,
± 2′2622 · 1′ 721 · 0′ 727 = (0′60451 60451,, 6′26451) 26451).. 3
3. En un estudio de los determinantes de la inversi´ on se usaron 20 datos anuales, correspondientes a las siguientes variables: inversi´ on anual en billones de pesetas (Y ), tipo de inter´ es en porcentaje (X 1 ) y variaci´ on anual de PIB en billones de pesetas (X 2 ). Se dispone de la siguiente informaci´ on:
Se pide:
X 1t = 100 X 1t Y t = 255 X 12t = 680
−
−
X 2t = 24 X 2t Y t = 146 X 22t = 48′8
Y t = 5 X 1t X 2t = 100 2 Y t Y = 1200
a) Obtenga las estimaciones por MCO del modelo Y t = α + βX 1t + δX 2t + u2 . b) Contraste la significaci´ on global del modelo a partir del porcentaje de evoluci´ on temporal de la inversi´ on que puede explicarse por la influencia lineal del tipo de inter´ es y la variaci´ on anual del PIB. c) Contraste la hip´ otesis nula: β 1 = 1 β 2 = 2
.
A partir de la informaci´on proporcionada en el enunciado se tiene que:
20 100 24 100 680 100 24 100 48′ 8
X t X =
−
5 255 146
X t Y =
,
Luego las estimaciones por MCO de los coeficientes del modelo ser´an:
t
β = X X
−1
t
X Y =
0′ 3623 0′ 0388 0′ 0988
−0′ ′0388 −0′ ′0988 0 0063 0′ 0063
− −
Por tanto, el modelo estimado queda: Y t =
0 0063 0′0562
5 255 146
· −
− − .
=
2′ 725 0′ 875 6′ 125
.
−2′ 725 − 0′875X t + 6′125X t. 1
2
Para el modelo sea significativo a partir del coeficiente de determinaci´on se ha de verificar que: 2
R >
k−1 n−k F k−1,n−k (1 1 1 + nk− −k F k−1,n−k (1
·
− α) = R . − α) sig
·
Puesto que:
· t
t
β X Y = ( 2′ 725
y
−
−
0′ 875 6′ 125)
2
· − 5 255 146
= 1103′7,
→ Y = 205 = 0 ′25 → n · Y = 1 ′25, es claro que S CE = β t · X tY − n · Y = 1103 ′7 − 1′ 25 = 1102′45. Y como el enunciado nos proporciona que S CT = Y t − Y = 1200, se obtiene que:
Y t = 5
2
1102′45 R = = 0 ′ 9187. 1200 2
Por otro lado: 2 Rsig =
2 17
· 3′ 59 = 0′4224 = 0 ′2969. 1′ 4224 1 + · 3′ 59 2
17
4
2 Por tanto, como R 2 > R sig , podemos afirmar que el modelo es significativo.
Finalmente, para contrastar la hip´otesis
β 1 = 1 , β 2 = 2
H 0 : se tiene que R =
0 1 0 0 0 1
,
1 2
r =
,
q = 2.
En tal caso:
− ·
Rβ
r =
R
t
X X
0 1 0 0 0 1
−1
·R
t
· −− − − − − · − − − · − − 2′725 0′875 6′ 125
1 2
0′ 3623 0′0388 0′0988
0 1 0 0 0 1
=
0′ 0063 0′0063 0′0063 0′0562
=
0′ 875 6′125
=
1 2
0′0388 0′ 0063 0′ 0063
=
0′ 0988 0′ 0063 0′ 0562
1′ 875 4′125
,
0 0 1 0 0 1
.
Por otro lado:
− SC E = 1200 − 1102′45 = 97′55 → σ
SC R = SCT y entonces:
( 1′ 875 4′ 125) F exp =
−
·
178′7702 20′0401 20′ 0401 20′ 0401 2 5′7382
−
−
·
2
=
97′ 55 = 5 ′ 7382, 17
· − 1′875 4′ 125
=
1279′5 = 111′4897. 11′ 4764
Como F exp > 3 ′ 59 = F 2,17 (0′ 95), se rechaza la hip´otesis nula. 4. Se desea estudiar la influencia que sobre la demanda de carne de vacuno ha tenido el precio de la carne de cerdo (X 1 ) y de la ternera (X 2 ). Para ello se han tomado datos anuales desde 1979 a 2001 (ambos inclusive), obteni´ endose los siguientes resultados:
Y t = 2′ 1 + 0 ′ 7X 1t
− 1′ 5X t, 2
R2 = 0 ′ 9,
SCE = 126.
¿Se po dr´ıa afirmar, para un nivel de confianza del 95 %, que los precios no influyen sobre la demanda de ternera? Para saber si los precios de la carne de cerdo y de ternera influyen en la demanda de la carne estudiaremos la significaci´on conjunta del modelo. Puesto que: F exp =
R2 k −1 1−R2 n−k
0′ 9/2 0′ 45 = ′ = ′ = 90 > 3 ′ 49 = F 2,20 (0′ 95) = F k−1,n−k (1 0 1/20 0 005
− α),
concluimos que se rechaza la hip´otesis nula de que todos los coeficientes de las variables explicativas son nulos de forma simult´anea, por lo que los precios de la carne influyen sobre la demanda.
5
5. Para estimar el modelo Y t = β 1 + β 2 X 2t + β 3 X 3t + ut se ha obtenido una muestra de la cual ha resultado: t
X X = Se pide:
14 7 14 7 4′ 5 7 14 7 15
t
,
X Y =
10 6 12
Y t Y = 14.
,
a) Estimar los coeficientes del modelo por MCO. b) Estudiar la significaci´ on del modelo. c) Contrastar la hip´ otesis β 2 + 1 = β 3 . d) Calcular el intervalo de predicci´ o n al 95 % para Y sabiendo que X 2 = 5 y X 3 = 7. Las estimaciones por MCO de los coeficientes del modelo ser´an:
β = X t X
−1
− − − − 1′ 3214 0′ 5 1
X t Y =
Por tanto, el modelo estimado queda: Y t =
0′ 5 1 0
−1 0 1
− · 10 6 12
=
1′7857 1 2
.
1′ 7857 + X 2t + 2X 3t .
Para estudiar la significaci´on global del modelo recurriremos al contraste ANOVA, de manera que el modelo ser´a significativo si F exp =
SCE/k SCR/n
− 1 > F k− ,n−k (1 − α). −k 1
Teniendo en cuenta que:
· t
t
β X Y = ( 1′ 7857 1 2)
y1
−
· 10 6 12
= 12 ′ 1429,
→ Y = 10 = 0 ′ 7143, 14 se tiene que SCE = β t · X t Y − n · Y = 12 ′ 1429 − 14 · 0′7143 = 4 ′9998. Adem´as, SCT = Y t Y − n · Y 14 − 14 · 0′ 7143 = 6 ′ 8569. Por tanto, S CR = SCT − SC E = 1′8571. 2
Con todo ello:
Y t = 10
2
2
2
=
4′ 9998/2 F exp = ′ = 14 ′ 8074 > 3 ′ 98 = F 2,1 (0′ 95). 1 8571/11
Esto es, el modelo es significativo. Para contrastar la hip´otesis H 0 : β 2 + 1 = β 3 , tendremos que tener en cuenta que R = (0 1 y q = 1. En tal caso: 1′ 7857 1 Rβ r = (0 1 1) + 1 = 0, 2
−
− ·
−
lo cual conduce a que F exp = 0 > 4′ 84 = F 1,11 (0′ 95) = F q,n−k (1 hip´ otesis nula.
1
El primer elemento de la matriz
X t X indica
que
n =
14.
6
− 1), r = −1
− α). Por tanto, no se rechaza la
Finalmente, el intervalo de predicci´on para Y es:
± − · · · · − · → − − − · · · − · − − · xt0 β
Como:
α 2
tn−k 1
σ
1′7857 1 2
xt0 β = (1 5 7)
σ2 =
t
x0
t
X X
−1
1 + xt0 (X t X )−1 x0 .
= 17 ′ 2143,
SC R 1′8571 = = 0 ′ 1688 n k 11
x0
= (1 5 7)
σ = 0′ 4109,
1′ 3214 0′ 5 1
= ( 8′ 1786 4′ 5 6)
0′ 5 1 0
1 5 7
1 0 1
1 5 7
= 56 ′ 3214,
el intervalo de confianza al 95 % es: 17′2143
± 2′ 201 · 0′ 4109 · 7′5711 = (10′3671, 24′0615).
6. Al ob jeto de determinar si existen o no diferencias en las calificaciones obtenidas por hombres y mujeres en una determinada asignatura, a partir de 20 observaciones se estim´ o el modelo: notat = β 0 + β 1 notamediaBUP t + β 2 generot + ut , donde la variable genero toma el valor 1 si se trata de una mujer y 0 para un var´on. Los resultados de la estimaci´ on fueron los siguientes:
notat
=
25 (4’5)
+
0’75 notamediaBUP t + (7’1)
20’5 generot (2’3)
R2 = 0’72
¿Puede decirse que los resultados de unos y otros son distintos? Teniendo en cuenta que la nota esperada para un var´on y una mujer son, respectivamente: E [notat /generot = 0] = β 0 + β 1 notamediaBUP t , E [notat /generot = 1] = β 0 + β 1 notamediaBUP t + β 2 , se tiene que, para una misma nota media en BUP, la diferencia esperada entre la nota de una mujer y un hombre viene determinada por E [notat /generot = 1]
− E [notat/generot = 0] = β . 2
Como el contraste de significaci´on individual para dicho par´ametro es significativo:
20′ 5 texp = = 8 ′ 913 > 2 ′ 0003 = t 60 (0′ 975), 2′ 3 se tiene que dicho par´ametro es distinto de cero. Por tanto, puede afirmarse que los resultados de unos y otros son distintos. Adem´ as, como la estimaci´on de dicho par´ametro es positiva, la nota esperada para una mujer es mayor que la de un hombre (siempre y cuando tengan la misma nota media en BUP). 7
7. Con informaci´ on muestral relativa a 14 observaciones, se pretende estimar el modelo de regresi´ on: Y t = β 0 + β 1 X 1t + β 2 X 2t + β 3 X 3t + ut , a partir de:
X tX =
Se pide:
14 85 631 532 3126 20666 2094 13132 78683 317950
X t Y =
,
248 1622 9202 37592
.
a) Calcular las estimaciones de los par´ ametros del modelo por MCO.
b) Estimar V ar β . c) ¿Influyen las variaciones de X 2t en la variable dependiente? d) Calcular el coeficiente de determinaci´ on corregido. e) Calcular un intervalo de confianza del 95 % para la varianza del t´ ermino de perturbaci´ on. f) Contrastar la significaci´ on global del modelo al 95 %. Las estimaciones de los par´ametros del modelo son:
− − −− β =
X t X
−1
X t Y
20′ 164 0′ 015065 0′23145 0′ 7617
=
0′ 015065 0′ 013204 0′ 001194 0′ 00094
=
0′ 000575
−
32′ 891 0′ 80371 0′ 3982 0′03713
−′0′23145 −0′′7617 0 001194 −0 00094 · 0′ 003635 0′ 000575 0′ 000401
248 1622 9202 37592
.
Por otro lado, teniendo en cuenta (por construcci´on del vector X t Y ) que: Y t = 248
y que:
→ Y = 248 = 17 ′ 714, 14
·
β t X t Y = 4552′552,
·
se tiene que S CE = β t X t Y
− n · Y = 4552′552 − 14 · 17′714
2
= 159′ 551.
Entonces, puesto que en el enunciado se nos indica que SC T = 226 ′ 86, es inmediato que SC R = SC T SC E = 67′ 308 y, por tanto:
−
σ2 =
·
SC R 67′308 = = 6 ′7308. n k 14 4
−
−
Luego, la estimaci´on de V ar β corresponde a:
V ar β = σ2
X tX
−1
=
−−
1′ 3575 0′ 00101 0′ 0155 0′ 00512 8
0′ 00101 0′0155 0′000888 0′00008 0′ 00008 0′00024 ′ 0 000063 0′ 000038
−
−
−0′′ 00512 −0′ 000063 0 000038 0′ 000027
.
A partir de ambas estimaciones podremos determinar si las variaciones de X 2t influyen en Y t : texp =
√ −
0′ 3982 = 25 ′ 704 > 2 ′ 228 = t 10 (0′ 975). 0′ 00024
Evidentemente se rechaza que β 2 = 0, por lo que X 2t influye en la variable dependiente. Para calcular el coeficiente de determinaci´on corregido tendremos en cuenta la siguiente expresi´on: 2
R =1 Puesto que R 2 =
′
159 551 226′ 86
− 1 − R · nn −− k1 . 2
= 0 ′7033 es claro que: 2
R =1
− (1 − 0′7033) · 13 = 0 ′ 6143. 10
Podemos observar que al eliminar la influencia de las variables explicativas el coeficiente de determinaci´ on ha disminuido alrededor del 9 %. El intervalo de confianza para σ 2 es:
− ·
(n k) σ2 (n k) σ2 , χ2n−k,1− α χ2n−k, α
− ·
2
=
2
10 6′ 7308 10 6′ 7308 , 20′483 3′ 247
·
·
= (3 ′ 286, 20′73).
Finalmente, para contrastar la significaci´on conjunta del modelo construiremos la tabla ANOVA: Fuente Variaci´o n Explicada Residual Total
Suma de Cuadrados 159’551 67’308 226’86
Grados de Libertad 3 10
Medias 53’1836 6’7308 7’9015
Como F exp = 7′ 9015 > 3 ′ 71 = F 3,10 (0′ 95), se rechaza la hip´otesis nula de que todos los coeficientes son nulos de forma simult´anea, por tanto, el modelo es significativo en su conjunto.
2.
Multicolinealidad
1. Dadas las siguientes matrices: X =
1 4 13 1 1 4 1 5 16
,
X =
1 1 1
−5 3 0
3 44 6
,
X =
analice en cada caso la posible existencia de multicolinealidad.
1 1 1
−2 −3 5
3′ 0001 4 3′ 9999
−
,
En el caso de la primera matriz, puesto que la tercera columna se obtiene sumando a la primera el triple de la segunda, estamos ante un claro ejemplo de multicolinealidad perfecta (su determinante es cero), mientras que las columnas de la segunda matriz son linealmente independientes (determinante igual a -181), por lo que no hay multicolinealidad en este caso. Finalmente, en la tercera matriz se muestra un caso de multicolinealidad aproximada, ya que la primera fila menos la tercera es aproximadamente igual a la segunda (determinante igual a 0’0007). 2. Si en el modelo Y t = α + βX t + δZ t + ut se cumple que se pueden estimar? 9
X t = λ constante. ¿Qu´ e par´ ametros Z t
X t = λ se tiene que X t = λZ t , de forma que sin m´as que sustituir dicha expresi´on en la Z t ecuaci´ on del modelo: Y t = α + βλZ t + δZ t + ut = α + (βλ + δ ) Z t + ut , A partir de
se pueden estimar α y βλ + δ . Luego, a no ser que se tenga informaci´on a priori, no se podr´ıan estimar los par´ametros originales. X t Si se opta por la opci´on Z t = , se podr´a estimar α y λδ . λ 3. Dado el modelo Y t = β 1 + β 2 X 2t + β 3 X 3t + β 4 X 4t + ut , utilizando una muestra de 20 datos, se procedi´ o a su estimaci´ on, obteni´endose:
Y t =
Se pide:
8’34
+
0’7 X 2t (0’56)
0’4 X 3t + (0’7)
0’1 X 4t (0’5)
R2 = 0’96
a) Analice el posible problema de multicolinealidad. b) Si hay alg´ un problema, indique la forma m´as adecuada de solucionarlo. Atendiendo a los contrastes de significaci´on individual, ning´un coeficiente es significativo, ya que:
−
0′ 7 texp = ′ = 1 ′25 > 2 ′ 12 = t 16 (0′ 975), 0 56
0′ 4 = 0 ′ 5714 > 2 ′ 12 = t 16 (0′ 975), 0′ 7 0′ 1 texp = ′ = 0 ′2 > 2 ′12 = t 16 (0′ 975). 05
texp =
Adem´ as, el coeficiente de determinaci´on es bastante alto y el modelo es conjuntamente significativo: F exp =
R2 k −1 1−R2 n−k
0′ 93/3 0′ 32 = ′ = ′ = 128 > 3 ′ 24 = F 3,16 (0′ 95) = F k−1,n−k (1 0 04/16 0 0025
− α).
Todo esto nos hace pensar en la posible existencia de multicolinealidad en el modelo. La principal soluci´on para eliminar la relaci´on lineal entre las variables independientes consiste en eliminar del modelo la variable que causa la multicolinealidad. on lineal m´ ultiple Y t = β 1 + β 2 X 2t + β 3 X 3t + β 4 X 4t + ut se verifica que 4. En el modelo de regresi´ X 2t = 3X 4t . Indique qu´ e par´ ametros son estimables: a) cuando no se dispone de informaci´ on a priori sobre los coeficientes, y b) cuando se sabe que β 4 = 2. Sustituyendo X 2t = 3X 4t en la ecuaci´on del modelo se obtiene que: Y t
= β 1 + β 2 X 2t + β 3 X 3t + β 4 X 4t + ut = β 1 + 3β 2 X 4t + β 3 X 3t + β 4 X 4t + ut = β 1 + β 3 X 3t + (3β 2 + β 4 ) X 4t + ut .
Por tanto, son estimables los par´ametros β 1 , β 3 y la combinaci´on lineal 3β 2 + β 4 . Por tanto, a no ser que haya informaci´on a priori no ser´a posible obtener las estimaciones de β 2 y β 4 . Si se sabe que β 4 = 2, entonces la ecuaci´on del modelo quedar´ıa: Y t = β 1 + β 3 X 3t + (3β 2 + 2) X 4t + ut , por lo que se podr´ıan estimar los par´ametros β 1 , β 2 y β 3 . 10
3.
Heteroscedasticidad
1. Dado un modelo Y t = β 0 + β 1 X t + ut , t = 1, . . . , n, donde V ar(ut ) = σ 2 X t2 , obtener las expresiones de las variables transformadas de tal forma que las estimaciones por MCG de β puedan calcularse estimando por MCO. Puesto que V ar(ut ) = σ 2 X t2 es claro que la matriz de transformaci´on en este caso es:
P =
1
0
X1
1
0 .. . 0
0 0 .. .
·· · ·· ·
X2
.. . 0
..
.
·· ·
1
Xn
,
por lo que el nuevo modelo transformado, Y t∗ = β 0 X 1∗t + β 1 X 2∗t + u∗t , vendr´a determinado por Y t∗ =
Y t , X t
1 , X t
X 1∗t =
X 2∗t =
X t = 1, X t
ut , X t
u∗t =
∀t.
Adem´ as, como la perturbaci´on aleatoria de este modelo transformado verifica, para cualquier valor de t, que:
· · ·
ut E [u∗t ] = E
1 E [ut ] = 0, X t X t ut 1 σ2 X t2 V ar (u∗t ) = V ar = 2 V ar (ut ) = = σ 2 , X t X t X t2 ut ut−k E [ut ut−k ] Cov u∗t , u∗t−k = E u∗t u∗t−k = E = = 0, X t X t−k X t X t−k
=
·
·
·
·
al estimarlo por MCO se obtendr´an las estimaciones por MCG, que son lineales, insesgadas y ´optimas. Advi´ertase que se supone que u verifica que tiene media cero y est´a incorrelada. 2. En el modelo Y t = β 0 + β 1 X t + ut , t = 1,...,n, cuyas perturbaciones no est´ an autocorrela2 σ cionadas, pero son tales que V ar(ut ) = E (u2t ) = 2 , ¿c´ omo obtendr´ıa el estimador m´ as X t adecuado de β ?. σ2 2 Puesto que se verifica que V ar(ut ) = E (ut ) = 2 , para obtener un estimador lineal, insesgado y X t ´optimo de β transformar´ıa el modelo original mediante la siguiente matriz
P =
X 1 0 .. .
0 X 2 .. .
·· · ·· ·
0
0
·· ·
..
0 0 .. .
.
X n
,
de manera que el nuevo modelo transformado, Y t∗ = β 0 X 1∗t + β 1 X 2∗t + u∗t , determinado por Y t∗ = Y t X t ,
·
X 2∗t = X t X t = X t2 ,
X 1∗t = 1 X t = X t ,
·
u∗t = u t X t ,
·
·
∀t,
es un modelo con perturbaciones esf´ericas, ya que, para cualquier valor de t, verifica: E [u∗t ] = E [ut X t ] = X t E [ut ] = 0,
·
·
σ2 ∗ 2 2 V ar (ut ) = V ar (ut X t ) = X t V ar (ut ) = X t = σ 2 , 2
·
·
Cov u∗t , u∗t−k
·
· X
t
= E u∗t u∗t−k = E [ut X t ut−k X t−k ] = X t X t−k E [ut ut−k ] = 0.
·
·
·
·
En tal caso, al estimarlo por MCO obtendremos estimaciones lineales, insesgadas y ´optimas para β . 11
3. Dado el modelo: Y t = β 0 + β 1 X t con los siguientes datos: Y X e
2 -3 1’37
3 -2 -0’42
7 -1 0’79
6 0 -3
15 1 3’21
8 2 -6’58
22 3 4’63
Utilizar el contraste de Goldfeld-Quandt y el contraste de Glesjer para la detecci´on de heteroscedasticidad. Para detectar la heteroscedasticidad a partir del test de Goldfeld-Quant hay que ordenar las observaciones de menor a mayor respecto de la variable que se considera provoca la heteroscedasticidad. En este caso, puesto que s´olo hay una variable independiente, X t , hay que ordenar en funci´on de sus valores. Como se puede observar, los datos ya est´an ordenados de forma adecuada. A continuaci´on hay que eliminar m observaciones centrales (normalmente un tercio de la muestra). Como m = 37 = 2′ 3333, en este caso deber´ıamos eliminar 2 observaciones centrales. Pero esta elecci´on supondr´ıa que uno de los dos subgrupos estuviese formado por dos puntos, lo que conduce a un ajuste perfecto y, entonces, su suma de cuadrados de los residuos ser´ıa cero. Para evitar este hecho vamos a eliminar una ´unica observaci´on central, por lo que nos quedar´ıan los subgrupos: y1 =
2 3 7
,
X 1 =
1 1 1
−3 −2 −1
e
y2 =
15 8 22
,
X 2 =
1 1 1 2 1 3
.
De estos dos subgrupos lo ´unico que nos interesa es su suma de cuadrados de los residuos. As´ı, para el primer subgrupo se tiene que: SC R1 = y 1t y1 β1 t X 1t y1 = 1′ 5,
− − · − − · − −
donde se ha usado que: t
β 1 = X 1 X 1
−1
t
X 1 y1 =
Mientras que para el segundo:
3 6
6 14
−1
12 19
SC R2 = y2t y2
=
2′3334 1 1 0′ 5
· 12 19
9 2′ 5
=
−
.
β 2t X 2t y2 = 73′ 5,
donde se ha usado que: t
β2 = X 2 X 2
−1
t
X 2 y2 =
3 6 6 14
−1
45 97
=
·
2′ 3334 1 ′ 1 05
45 97
−
=
8 3′ 5
.
En tal caso, puesto que
F exp =
SC R2 73′5 = ′ = 49 > 9 ′ 28 = F 3,3 (0′ 95) = F n SC R1 15
m n−m
−
2
,
2
(0′ 95),
se rechaza la hip´otesis nula de homocedasticidad. Es decir, la perturbaci´on aleatoria del modelo considerado es heteroced´ astica. Para aplicar el test de Glesjer, hay que plantear la regresi´on auxiliar
|et| = α + βX th + vt, donde los valores m´as comunes para h son ±2, ±1, ±1/2. En este caso, debido a la naturaleza de las observaciones, s´olo es posible estudiar los casos en los que h = 1, 2.
12
Cuadro 1: Datos regresi´ on auxiliar et X t2 X t 1’37 9 -3 0’42 4 -2 0’79 1 -1 3 0 0 3’21 1 1 6’58 4 2 4’63 9 3
| |
Atendiendo a la informaci´on de la tabla 1 se tiene que para h = 1:
− − − · − −− X t X
β =
σ2
V ar β donde
=
= σ2
X =
En tal caso, puesto que texp =
yty
−1
2′ 8571 0′ 8757
X t y =
,
β t X t y 9′ 0994 = = 1 ′ 6199, n k 7 2 −1 0′ 2314 0 X t X = ′ 0 0 0579
1 1 1 1 1 1 1
3 2 1 0 1 2 3
,
y =
1′ 37 0′ 42 0′ 79 3 ′ 3 21 6′ 58 4′ 63
,
.
′ ′ ′ ′ √ 008757 ′0579 = 3 6393 > 2 571 = t (0 975) = t n−k (0 975), ′
5
se tiene que se rechaza la hip´otesis nula de que la pendiente sea cero. Para h = 2:
− − · − − β =
σ2
V ar β donde
=
X tX
yty
= σ2
X =
−1
X t y =
2′ 5714 0′ 0714
,
β t X t y 29′ 1434 = = 5 ′ 8287, n k 5 −1 1′ 9429 0′ 2776 X t X = 0′2776 0′0694
1 1 1 1 1 1 1
9 4 1 0 1 4 9
,
13
y =
1′ 37 0′ 42 0′ 79 3 ′ 3 21 6′ 58 4′ 63
.
,
En tal caso, puesto que
√ 0 0714 ′ ′
texp =
0 0694
= 0 ′ 271 > 2 ′ 571 = t 5 (0′ 975) = t n−k (0′ 975),
se tiene que no se rechaza la hip´otesis nula de que la pendiente sea cero. Por tanto, atendiendo a los resultados obtenidos, podemos decir que hay heteroscedasticidad en la perturbaci´on aleatoria del modelo. Adem´as, podemos suponer 2 que E u2t = σ 2 X t . Luego, para eliminar la heteroscedasticidad habr´ıa que transformar el modelo mediante la matriz:
P =
√ 1
0
X1
√ 1
0 .. . 0
X2
.. . 0
.
0 0 .. .
· ··
√ 1
· ·· · ·· ..
X7
.
etrico se ha relacionado linealmente el desempleo con las demandas 4. En un estudio econom´ de trabajo y el IPC en 50 provincias espa˜ nolas. Para analizar la posible presencia de heteroscedasticidad provocada por el IPC, se ha procedido a ordenar las observaciones de menor a mayor respecto de dicha variable, se han eliminado 14 datos centrales y a partir de los dos subgrupos restantes se han obtenido los siguientes resultados: SC R1 = 65432 y SC R2 = 97548 a) Detectar la posible presencia de heteroscedasticidad. b) Indique cuales ser´ıan los efectos que tendr´ıa la presencia de heteroscedasticidad sobre los estimadores por MCO y c´ omo resolver´ıa dichos efectos suponiendo que en este caso la varianza de las perturbaciones depende proporcionalmente del IPC. Para detectar la posible presencia de heteroscedasticidad en el modelo usaremos el test de GoldfeldQuant, de tal manera que puesto que F exp =
SC R2 97548 = = 1 ′ 4908 > 2 ′ 2172 = F 18,18 (0′ 95) = F n 65432 SC R1
m n−m
−
2
,
2
(0′ 95),
no se rechaza la hip´otesis nula de homocedasticidad. En el caso de que hubiese existido heteroscedasticidad en el modelo, los estimadores por MCO no ser´ıan ´optimos. Para resolver esta situaci´on habr´ıa que transformar el modelo en uno con perturbaciones esf´ericas, de tal forma que al aplicarle MCO se obtuvieran estimadores lineales, insesgados y ´optimos.
As´ı por ejemplo, si se verifica que V ar(ut ) = E u2t = σ 2 IP C t , la matriz para transformar el modelo ser´ıa: √ 1 0 0 IP C √ 1 0 0 IP C P = , .. .. .. .. . . . . √ 1 0 0 IP C
1
2
··· ··· ···
50
obteni´endose el nuevo modelo transformado, Y t∗ = β 0 X 1∗t + β 1 X 2∗t + u∗t , determinado por Y t∗ =
Dt √ IP , C t
X 1∗t =
√ IP1 C ,
2 Se tiene que para h = 1 la SC R = 9′ 0994 y para coeficiente de determinaci´ on ser´ a mayor para h = 1.
X 2∗t =
t
h =
2 la
SC R =
14
t √ DT , IP C t
u∗t =
√ IPut C , ∀t, t
29′ 1434. Como en ambos casos la
SC T es
la misma, el
donde D denota al desempleo y DT a la demanda de trabajo. Adem´as, como la perturbaci´ on aleatoria de este modelo transformado verifica, para cualquier valor de t, que:
√ √ · · · · √ ·
ut 1 = E [ut ] = 0, IP C t IP C t u2t 1 σ2 IP C t = E = = σ 2 , E u2t = IP C t IP C t IP C t
E [u∗t ] = E
E u∗t 2
Cov u∗t , u∗t−k
= E u∗t u∗t−k = E
ut IP C t
ut−k IP C t−k
=
t · ut−k ] √ IPE [u C · IP C t
= 0,
t−k
estamos ante un modelo con perturbaciones esf´ericas, por lo que al estimarlo por MCO se obtendr´an las estimaciones por MCG, que son lineales, insesgadas y ´optimas. 5. Dada la siguiente muestra de gastos en viajes ( GV i ) y renta (Ri ) correspondiente a diez familias: Obs 1 2 3 4 5 6 7 8 9 10
GV 12 20 10 20 15 8 10 15 25 10
R 325 600 410 550 370 250 580 650 630 420
Estime un modelo lineal para explicar los gastos en viajes y detecte la posible existencia de heteroscedasticidad mediante los siguientes m´ etodos: a) b) c) d) e)
M´ etodo gr´ afico Test de Glesjer Test de Goldfeld y Quandt Test de White Test de Breusch-Pagan
La estimaci´on del modelo lineal que explica los gastos en viajes mediante la renta a partir de las observaciones consideradas es:
GV t = 1′ 96707 + 0 ′ 0261921 Rt , (5′ 234) (0′ 0105)
·
R2 = 0 ′ 4358.
Puesto que este tipo de regresiones de secci´on cruzada suelen presentar heteroscedasticidad en la perturbaci´ on aleatoria vamos a estudiar a continuaci´on esta posibilidad. En primer lugar consideraremos los m´etodos gr´aficos. As´ı, en la figura (1) se tiene el gr´afico de dispersi´on de los residuos frente a cada observaci´on, donde se puede observar que los grupos de observaciones 1-6 y 7-10 tienen distinta varianza. Adem´as, en la figura (2), gr´afico de dispersi´on de los residuos frente a la variable que se sospecha provoca la heteroscedasticidad en el modelo (que en este caso no puede ser otra sino la renta), se observa que la variabilidad de los residuos aumenta conforme lo hace la renta. Todo esto nos hace sospechar que hay heteroscedasticidad en la perturbaci´on aleatoria del modelo y que ´esta viene determinada por la variable renta. Para confirmar esta sospecha recurriremos a los distintos m´etodos anal´ıticos estudiados. 15
Figura 1: Gr´afico de los residuos Residuos de la regresión (= GV observada − estimada) 8
6
4
2 o u d i s e r
0
−2
−4
−6
−8
1
2
3
4
5
6
7
8
9
10
600
650
Figura 2: Gr´afico de dispersi´ on Residuos de la regresión (= GV observada − estimada) 8
6
4
2 o u d i s e r
0
−2
−4
−6
−8 250
300
350
400
450 R
16
500
550
Para h = 1/2:
−
α =
σ
4′ 7712 0′2158
=
2
158′ 2483
=
−1
140′ 2934
8
−
34′ 6783 795′ 4088
0′2158 0′ 01
10′7084 0′4844
V ar (α) = Esto es:
· · − − − −
10 216′4 ′ 216 4 4785
34′ 6783 795′4088
et =
,
= 2 ′ 2444,
0′4844 0′ 0224
| |
6′ 2063 0′ 447
=
.
−6′′2063 + 0′′447 · Rt / . 1 2
(3 273) (0 149)
De manera que en el contraste de significaci´on individual de la pendiente se rechaza la hip´otesis nula ya que: 0′ 447 texp = ′ = 2 ′ 986 > 2 ′ 31 = t 8 (0′ 975). 0 149 Para h =
−1/2:
−
10 0′ 4729 0′ 4729 0′ 0229
α =
σ2
4 83′ 3 83′3 1762′2
=
158′ 2483
=
V ar (α) = Esto es:
−
· · − −1
34′ 6783 1′ 5324
34′6783 1′ 5324
=
12′ 4377 189′6627
− 140′6711 = 2 ′ 1971, 8
8′ 9
−183′1
−183′′1 3871 9
,
.
−1/2 .
et = 12 ′4377 189′ 6627 Rt (2′ 983) (62′ 2245)
| |
−
·
De manera que en el contraste de significaci´on individual de la pendiente se rechaza la hip´otesis nula ya que: 189′6627 texp = = 3 ′ 048 > 2 ′ 31 = t 8 (0′ 975). ′ 62 2245
| |
Para h =
−1:
α =
σ2
= =
V ar (α) = Esto es:
−
· − · − − −
10 0′ 0229 0′ 0229 0′ 0001
−1
34′ 6783 0′ 0687
1′ 0173 400 34′ 6783 400 17440 0′ 0687 158′2483 140′5488 = 2 ′ 2124, 8 2′ 2507 884′9156 . 884′9156 385850
−
18
=
7′ 8 1881′1
,
Cuadro 3: Reordenaci´on de las observaciones en funci´on de la renta GV t 8 12 15 10 10 20 10 20 25 15 Rt 250 325 370 410 420 550 580 600 630 650
et = 7 ′ 8 1881′1 Rt−1 . (1′ 501) (621′ 166)
| |
−
·
De manera que en el contraste de significaci´on individual de la pendiente se rechaza la hip´otesis nula ya que: 1881′1 texp = = 3 ′ 0283 > 2 ′ 31 = t 8 (0′ 975). 621′166
| |
Como en todos los casos se rechaza la hip´otesis de que la pendiente sea nula, habr´a heteroscedasticidad en el modelo. b)
Para aplicar el test de Goldfeld-Quant reordenamos las observaciones de menor a mayor de acuerdo a la variable renta (obteniendo la tabla 3) y obtenemos las sumas de cuadrados de los residuos de las regresiones de los subgrupos que surgen al eliminar las 4 observaciones centrales. As´ı, para el primer subgrupo se tiene y1 = obteni´endose
− β 1 =
6′ 5476 0′ 0578
,
8 12 15
,
X 1 =
SCR1 = y1t y1
Mientras que para el segundo
y2 = obteni´endose
− β 2 =
Entonces:
69′4737 0′ 0789
,
20 25 15
,
1 250 1 325 1 370
,
− β t X ty = 433 − 432′9082 = 0′ 0918. 1
X 2 =
SCR2 = y2t y2
1
1
1 600 1 630 1 650
,
− β t X ty = 1250 − 1207′9 = 42′1053. 2
2
2
42′ 1053 = 458 ′6634 > 9 ′ 27663 = F 3,3 (0′ 95), 0′ 0918 y en tal caso, se rechaza la hip´otesis nula de homocedasticidad. Es decir, la perturbaci´on aleatoria del modelo es heteroced´astica. F exp =
c )
En el caso del test de White habr´a que calcular el coeficiente de determinaci´on de la regresi´on auxiliar e2t = α 0 + α1 Rt + α2 Rt2 + vt .
·
·
Atendiendo a la informaci´on proporcionada por la tabla 4 se tiene que
− − α =
21′ 3268 0′ 0811 0′0000067
,
19
SCR = 5163′5
− 3504′1 = 1659′3,
Cuadro 4: Informaci´on regresiones auxiliares e2t Rt Rt2 2’3119 325 105625 5’3715 600 360000 7’3216 410 168100 13’1570 550 302500 11’1679 370 136900 0’2653 250 62500 51’2441 580 336400 15’9356 650 422500 42’6657 630 396900 8’8076 420 176400
e2 = 15 ′ 8248,
SCT = 5163 ′5
Y en tal caso: R2 = 1
− 10 · 15′8248 = 2659′3.
3 − 1659 = 0 ′ 376. ′ 2659 3
′
Por tanto, como χ2exp = 10 0′ 376 = 3 ′ 76 > 5 ′991 = χ 22 (0′ 95),
·
no se rechaza la hip´otesis nula de homocedasticidad. d )
Para el test de Breusch-Pagan la regresi´on auxiliar es e2t = α0 + α1 Rt + vt .
·
Atendiendo a la informaci´on proporcionada por la tabla 4 se tiene que
− α =
20′ 0151 0′ 0749
e2 = 15 ′ 8248,
SCR = 5163′5
,
SCT = 5163 ′5
Y en tal caso: R2 = 1
− 3504 = 1659′6,
− 10 · 15′8248 = 2659′3.
6 − 1659 = 0 ′ 3759. ′ 2659 3
′
Por tanto, como χ2exp = 10 0′ 3759 = 3 ′ 759 > 3 ′ 8414 = χ 21 (0′ 95),
·
no se rechaza la hip´otesis nula de homocedasticidad.
Podemos observar que a partir de los dos primeros test concluir´ıamos que hay heteroscedasticidad en el modelo mientras que a partir de los dos ´ultimos no rechazar´ıamos la hip´otesis nula de homocedasticidad. Esta contradicci´on se puede deber a que los dos ´ultimos test se deben usar cuando la muestra es grande y no tan peque˜ na como en este caso. Por tanto, como los dos primeros test son id´oneos para situaciones donde la muestra es peque˜na y una variable es la causante de la heteroscedasticidad (situaci´on de este modelo), consideraremos que la perturbaci´on aleatoria del modelo que estudia los gastos en viajes a partir de la renta es heteroced´astica. En tal caso, a partir de las sumas de cuadrados de los residuos 3 de las regresiones auxiliares (ver tabla 5) calculadas al aplicar el test de Glesjer (en la estimaci´on de σ 2 ), podemos concluir que la perturbaci´on σ aleatoria es proporcional a la inversa de la ra´ız cuadrada de la renta, esto es, V ar (ut ) = √ = σ/ . R 2
2
t
3
1
Rt
2
Puesto que la suma de cuadrados totales es la misma en todas las regresiones, el mayor coeficiente de determinaci´on corresponder´ a a la menor suma de cuadrados de los residuos.
20
Cuadro 5: Suma de cuadrados de los residuos de las regresiones auxiliares del test de Glesjer h 1 1/2 -1/2 -1 SCR 18’3959 17’9549 17’5772 17’6995
Cuadro 6: Observaciones del modelo transformado Y t∗ X 1∗t X 2∗t 50’9509 4’245911 1379’921 98’9846 4’949232 2969’539 44’9983 4’499829 1844’930 96’8547 4’842735 2663’504 65’7872 4’385816 1622’752 31’8108 3’976354 994’088 49’0746 4’907463 2846’328 75’7390 5’049267 3282’024 125’2493 5’009970 3156’281 45’2702 4’527019 1901’348
Entonces, la matriz para transformar el modelo ser´ıa:
P =
1/4
R1 0 .. .
0 1/4 R2 .. .
·· · ·· ·
0
·· ·
0
..
0 0 .. .
.
1/4
R10
,
obteni´endose el nuevo modelo transformado, Y t∗ = β 0 X 1∗t + β 1 X 2∗t + u∗t , determinado por 1/4
Y t∗ = GV t Rt ,
·
1/4
X 1∗t = 1 Rt
·
1/4
1/4
X 2∗t = Rt Rt
= Rt ,
·
5/4
1/4
u∗t = u t Rt ,
= Rt ,
·
∀t.
En la tabla 6 se tienen las observaciones del modelo transformado. Adem´ as, se comprueba f´acilmente que el nuevo modelo es un modelo con perturbaciones esf´ericas. En efecto, para cualquier valor de t, se verifica que:
· · · · · · · 1/4
E [u∗t ] = E ut Rt
E u∗t 2
Cov u∗t , u∗t−k
1/2
= E u2t Rt
1/4
= Rt
1/2
= Rt
E [ut] = 0, 1/2
E u2t = Rt 1/4
= E u∗t u∗t−k = E ut Rt
·
σ2 1/2
Rt
1/4
= σ 2 , 1/4
ut−k Rt−k = Rt
·
· Rt−/ k · E [ut · ut−k ] = 0. 1 4
Por tanto, al estimarlo por MCO se obtendr´an las estimaciones por MCG, que son lineales, insesgadas y ´optimas:
GV t = 1′ 84598 + 0′ 0264311 Rt , (5′ 85113) (0′ 0113727)
·
R2 = 0 ′ 932014.
6. Dado el siguiente modelo estimado por MCO:
P IB t =
−187′7′ + 3′76′ · OCU t , (182 9)
(0 19)
21
t = 1, . . . , 18
Se han realizado contrastes para analizar la existencia de homocedasticidad, rechaz´ andose en todo caso esta hip´ otesis. A la vista de las siguientes regresiones, ¿c´ omo eliminar´ıa la heteroscedasticidad?
| | − | | et =
68600′1 + 419′7 OCU t , (123′4)
·
et = 77998′8 + 0 ′ 16 OCU t2 , (0′ 06)
·
R2 = 0 ′ 38
R2 = 0 ′ 3
¿Qu´ e consecuencias conlleva la no existencia de homocedasticidad en el modelo? Teniendo en cuenta que: 419′ 7 = 3 ′ 4011 > 2 ′ 12 = t16 (0′ 975), 123′ 4 0′ 16 texp = ′ = 2 ′ 6667 > 2 ′ 12 = t 16 (0′ 975), 0 06 en ambos casos se rechaza la hip´otesis nula de que la pendiente sea cero, por lo que aplicando el test de Glesjer concluimos que efectivamente hay heteroscedasticidad en el modelo. texp =
Por otro lado, puesto que la primera regresi´on auxiliar tiene un mayor coeficiente de determinaci´on consideraremos que la varianza de la perturbaci´on aleatoria es proporcional a la variable OCU , es decir, V ar(ut ) = σ 2 OCU t . Por tanto, para eliminar la heteroscedasticidad del modelo lo transformar´ıa mediante la matriz √ 1 0 0 OCU 1 √ 0 0 OCU P = . .. .. .. .. . . . . √ 1 0 0 OCU
·
··· ···
1
2
···
18
Finalmente, la no existencia de homocedasticidad en el modelo hace que los estimadores obtenidos por MCO no sean ´optimos. 7. Utilizando una muestra de 25 observaciones anuales se ha estimado el siguiente modelo: Y t = β 1 + β 2 X 2t + β 3 X 3t + ut . Utilizando s´ olo las primeras 10 observaciones se obtiene la siguiente ecuaci´ on estimada:
Y t = 80′5 + 0 ′ 93X 2t
− 0′87X t,
SCR = 125 ′7,
3
mientras que para las ´ ultimas 10 observaciones se obtiene la siguiente estimaci´ on: Yt = 20′ 61 + 0′ 53X 2t
− 0′105X t,
SCR = 498 ′ 94.
3
Adem´ as, se dispone de la siguiente informaci´ on:
|et| = 6 ′ 81 − 625′17 · X 1 t ,
R2 = 0 ′ 43,
2
1 |et| = 10 ′23 − 89′54 · √ X
,
R2 = 0 ′ 33.
2t
Se pide: a) Detectar si hay presencia de heteroscedasticidad en el modelo y, en tal caso, indicar qu´ e variable la induce. 22
b) Especificar cu´ al ser´ıa la matriz de transformaci´ on m´ as adecuada para solucionar la heteroscedasticidad, en caso de que la hubiera. Para detectar si hay presencia de heteroscedasticidad en el modelo usaremos el test de Goldfeld-Quant. Puesto que: SC R2 498′ 94 F exp = = = 3 ′ 97 > 2 ′ 98 = F 10,10 (0′ 95) = F n ′ SC R1 125 7
m n−m
−
,
2
2
(0′ 95),
se rechaza la hip´otesis nula de homocedasticidad (advi´ertase que hemos tenido en cuenta que se disponen de 25 observaciones, n = 25, de las cuales se eliminan 5 centrales, m = 5). Esto es, hay heteroscedasticidad en el modelo. Por otro lado, atendiendo a las regresiones en las que la variable dependiente es el valor absoluto de los residuos, et , la heteroscedasticidad la induce la variable X 2t y consideraremos que V ar(ut ) = σ 2 X1 t . Esta elecci´on se debe a que de los dos modelos proporcionados es el primero el que ofrece un mejor ajuste (mayor coeficiente de determinaci´on). En tal caso, la matriz de transformaci´on del modelo ser´a:
| |
·
P =
√
X 21 0 .. .
0 X 22 .. .
√
0
0
0 0 .. .
·· · ·· · ..
.
·· · √ X
2 25
2
.
8. Suponiendo que existe heteroscedasticidad en un modelo lineal, V t = β 0 + β 1 P t + u t , que estudia las ventas en funci´ on del precio y que la relaci´ on entre la varianza de las perturbaciones aleatorias y el precio es cuadr´ atica, indique como transformar´ıa el modelo para que sea homoced´ astico. Puesto que la relaci´on entre la varianza de las perturbaciones aleatorias y el precio es cuadr´atica entonces se verifica que V ar(ut ) = E (u2t ) = σ 2 P t2 . En tal caso, para que el modelo sea homoced´astico lo transformar´ıa mediante la siguiente matriz:
·
P =
1
0
P 1
1
0 .. . 0
P 2
.. . 0
··· ··· ..
.
···
0 0 .. . 1
P n
.
De esta forma, el nuevo modelo transformado es un modelo con perturbaciones esf´ericas (por tanto, homoced´astico) y al estimarlo por MCO obtendremos estimaciones lineales, insesgadas y ´optimas. 9. En un modelo lineal para estimar el consumo (C) en funci´ o n de la renta (R) se han ordenado los datos de menor a mayor y se han obtenido las siguientes regresiones: 10
Ct = 1′ 1 + 1 ′ 5 Rt ,
·
e2t = 230,
t=1 30
Ct = 20′ 1 + 0 ′ 5 Rt ,
·
e2t = 43230.
t=21
Analice la presencia de heteroscedasticidad en el modelo. Para detectar si hay presencia de heteroscedasticidad en el modelo usaremos el test de Goldfeld-Quant. Puesto que: F exp =
SC R2 43230 = = 187′956 > 2 ′ 98 = F 10,10 (0′ 95) = F n SC R1 230 23
m n−m
−
2
,
2
(0′ 95),
se rechaza la hip´otesis nula de homocedasticidad (advi´ertase que hemos tenido en cuenta que se disponen de 30 observaciones, n = 30, de las cuales se eliminan 10 centrales, m = 10). Luego, hay heteroscedasticidad en el modelo. 10. Haciendo uso de los datos per c´ apita sobre el gasto p´ ublico en servicios sociales (GPSS) y el PIB de 34 pa´ıses en 2009, se ha obtenido p or MCO la siguiente estimaci´ on:
GPSS i =
−0′1245 + 0′ 0731 · P IB i.
a) Conociendo la siguiente regresi´ on auxiliar e2i = 0 ′ 0176
2
− 0′0052 · P IB i + 0 ′0004 · P IB i ,
con R2 = 0 ′ 9582, contraste si hay heteroscedasticidad en el modelo. b) Suponiendo que existe heteroscedasticidad y bajo el supuesto E [u2i ] = la matriz de transformaci´ on que corrija dicho problema.
σ2 , especifique P IB i2
Aplicando el test de White hay heteroscedasticidad en el modelo ya que: 2 n Raux = 34 0′ 9582 = 32′ 5788 > 5 ′ 991 = χ22 (0′ 95).
·
Adem´ as, como E [u2i ] = es:
σ2 , P IB i2
·
es claro que la matriz de transformaci´on que corrije la heteroscedasticidad
P =
P IB 1 0 .. .
0 P IB 2 .. .
··· ···
0
0
···
..
0 0 .. .
.
P IB 34
.
11. Supongamos que tras estimar el modelo original, Y t = β 1 + β 2 X t + u t , por MCO se ha realizado la siguiente regresi´ on auxiliar: et = α 0 +
| |
α1 + vt , X t
rechaz´ andose la hip´ otesis H 0 : α 1 = 0. ¿Qu´ e conclusiones se pueden obtener? ¿Existe alg´ un problema en el modelo? En caso afirmativo, describa detalladamente como resolverlo comprobando que se ha solucionado. Teniendo en cuenta el test de Glesjer se puede concluir que existe heteroscedasticidad en el modelo original (y que V ar(ut ) = σ2 X1t ), el cual habr´ıa que transformar multiplicando por la siguiente matriz: X 1 0 0 0 X 2 0 P = , .. .. .. . . .
·
√ √ ·· · ·· · ·· · √ · · · 0
0
X n
para obtener el modelo transformado: Y t∗ =
·
X t Y t ,
X t∗ =
el cual ya es homoced´astico: V ar(u∗t ) = V ar
X t X t ,
cte∗ =
X t ,
u∗t =
X t ut = X t V ar(ut ) = X t
24
·
X t ut ,
2
σ · X = σ . t 2
∀t,
12. Supongamos que para ilustrar la detecci´ on de la heteroscedasticidad el profesor de Econometr´ıa considera un modelo que trata de explicar el n´ umero de accidentes de tr´ afico, Y , en funci´ on de los a˜ nos de conducci´ on, X 1 , y de la edad, X 2 , a partir de 90 observaciones. Tras realizar el an´ alisis de los procedimientos gr´ aficos, dicho profesor sospecha que la variable edad puede ser causa de heteroscedasticidad en el modelo, por lo que procede a ordenar la muestra de forma creciente en funci´on de dicha variable. De las 90 observaciones omite 30 centrales y ajusta por MCO los dos grupos de observaciones restantes obteni´ endose
90
que σ12 = 30 ′ 7 para el primero y que
e2t = 1428 ′32 para el segundo. ¿Existe heteroscedas-
t=61
ticidad en el modelo? Un grupo de alumnos descontentos con la explicaci´ on del profesor consideran que la heteroscedasticidad la provoca m´ as de una variable, por lo que estiman la siguiente regresi´ on auxiliar: e2t = α 0 + α1 X 1 + α2 X 2 + α3 X 12 + α4 X 22 + α5 X 1 X 2 + vt ,
obtenidendo un coeficiente de determinaci´on R2 = 0′ 63. ¿Existe heteroscedasticidad en el modelo? ¿Hay alg´ un tipo de contradicci´ on entre las conclusiones obtenidas por el profesor y los alumnos? ¿C´ omo resolverla? A partir del test de Goldfeldt-Quant no se rechaza la hip´otesis nula de homocedasticidad ya que 1428′32 F exp = = 1 ′ 723151 > 1 ′ 84087 = F 30,30 (0′ 95), ′ 828 9
donde se ha usado que S CR 1 = (n1
2 1
−k )·σ 1
= 27 30′ 7 = 828′ 9.
·
Por otro lado, teniendo en cuenta el test de White si se rechaza la hip´otesis nula de homocedasticidad ya que χ2exp = 90 0′ 63 = 56′7 > 11 ′ 07 = χ 25 (0′ 95).
·
El conflicto radica en que el primer test se debe aplicar cuando la muestra es peque˜na, cosa que no ocurre en este caso. 13. Supongamos que se disponen de las siguientes observaciones para el modelo Y t = α+βX t +ut : Y t 20 30 32
X t 11 16 18
Si se verifica que V ar (ut ) = σ 2 X t , ¿aplicar MCG al modelo anterior es equivalente a aplicar MCO al siguiente conjunto de datos? Razone su respuesta.
·
Y t∗ 6’0302 7’5 7’5424
X t∗ 3’3166 4 4’2426
√
Para corregir la heteroscedasticidad hay que transformar los datos dividiendo entre X t obteni´endose los datos que se indican. Luego es equivalente aplicar MCG al modelo original y aplicar MCO al modelo transformado.
25
4.
Autocorrelaci´ on
1. Para la estimaci´ on de la producci´ on de gases contaminantes por una f´ abrica de papel se ha utilizado el siguiente modelo: C t ǫt
= β 0 + β 1 V t + ǫt , = ρǫt−1 + ν t ,
para t = 1, , T , y donde C denota la producci´ on de gases contaminantes y V al volumen de papel fabricado. Comente qu´ e supuesto del modelo lineal general se incumple en este caso si se intenta estimar la primera ecuaci´ on por m´ınimos cuadrados ordinarios.
·· ·
En este caso, puesto que la perturbaci´on aleatoria del modelo de regresi´on tiene una estructura autorregresiva de orden 1, la misma no ser´a incorrelada. En efecto: Cov (ǫt , ǫt−1 ) = E [ǫt ǫt−1 ] = E [(ρǫt−1 + ν t ) ǫt−1 ] = E ρǫ2t−1 + ν t ǫt−1 = ρE ǫ2t−1 + E [ν t ǫt−1 ] = ρ σ2 = 0,
·
·
·
donde se ha supuesto que V ar (ǫt ) = σ 2 , t, y que los procesos ǫ y ν est´an incorrelados.
∀
2. A partir del modelo: Y t = β 0 + β 1 X t + ut y suponiendo que las perturbaciones tienen varianza constante y siguen el siguiente proceso u t = 0′ 5ut−1 +ν t . Se pide obtener el estimador MCG del modelo sabiendo que disponemos de los siguientes datos: Y X
4 2
6 3
10 6
Evidentemente habr´a autocorrelaci´on en la perturbaci´on aleatoria (ejercicio 1), de forma que, tal y como indica el enunciado, habr´a que estimar el modelo por m´ınimos cuadrados generalizados. Sin embargo, para poder aplicar dicho m´ etodo es necesario conocer la matriz Ω. Por tanto, el primer paso que hay que realizar es obtener dicha matriz. En efecto, puesto que: E [ut ut−1 ] = = E [ut ut−2 ] = =
· ·
E [(0′ 5ut−1 + ν t ) ut−1 ] 0′ 5 E u2t−1 + E [ν t ut−1 ] = 0′ 5 σ2 , E [(0′ 5ut−1 + ν t ) ut−2 ] 0′ 5 E [ut−1 ut−2 ] + E [ν t ut−2 ] = 0′ 5 0′ 5 σ2 = 0 ′ 25 σ2 ,
·
·
·
· ·
·
·
·
·
·
·
donde sa ha usado que ν t y u t est´an incorrelados, se tiene que: Σ= esto es:
σ2 0′5σ2 0′ 25σ2
0′ 5σ2 σ2 ′ 0 5σ2
Ω= En tal caso:
· − β =
=
· · · 0′ 25σ2 0′ 5σ2 σ2
1 0′ 5 0′ 25 ′ 05 1 0′ 5 0′25 0′ 5 1
−1 X Ω−1 X X t Ω−1 y = t
1′ 7772 0′ 3098
−
= σ 2
1 0′ 5 0′25 0′ 5 1 0′ 5 ′ ′ 0 25 0 5 1
0′3098 0′ 0815
26
.
1′ 6667 6′ 3334 6′ 3334 36′ 3334
11′ 3334 60′ 6667
,
=
−1
1′ 3478 1′ 4348
11′3334 60′6667
,
donde se ha usado que X =
1 2 1 3 1 6
,
4 6 10
y =
Ω−1 =
,
−
1′ 3334 0′ 6667 0
−0′ 6667 0 1′ 6667 −0′6667 −0′ 6667 1′ 3334
.
Luego, la estimaci´on por MCG ser´a Y t = 1′ 3478 + 1 ′ 4348 X t .
·
3. Se dispone de una serie de 25 datos que relacionan el salario nominal, X t , y el empleo, Y t . Una vez hecha la estimaci´ on los residuos obtenidos son: t 1 2 3 4 5 6 7 8 9 et 2’6 2’8 -2’3 0’6 -0’75 0’12 1’2 2’5 -3 t 13 14 15 16 17 18 19 20 21 22 et 0’8 -6 -1 -2 2’3 2’4 4 3’43 2’3 -1’1
10 -2’4 23 -2’2
11 12 0’5 0’7 24 25 -2’55 ?
Adem´ as, se han realizado las regresiones sobre los 10 primeros datos y sobre los diez u ´lti′ ′ mos obteni´endose S CR 1 = 75 43 y S CR 2 = 91 4. Contrastar la existencia de autocorrelaci´ on y heteroscedasticidad. Para contrastar la presencia de heteroscedasticidad en el modelo usaremos el contraste de GodlfeldQuant: 91′4 F exp = ′ = 1 ′ 21172 > 2 ′ 98 = F 10,10 (0′ 95). 75 43 Por tanto, no se rechaza la hip´otesis nula de que la perturbaci´on aleatoria sea homoced´astica.
Por otro lado, para contrastar la presencia de autocorrelaci´on calcularemos el estad´ıstico de DurbinWatson a partir de la informaci´on de la tabla 7: d =
186′ 9201 = 1 ′ 2377. 151′ 0168
Como dL = 1′ 2879 y dU = 1′ 4537, entonces hay autocorrelaci´on positiva en la perturbaci´on aleatoria del modelo ya que d < d L . on de primer orden en el modelo: 4. Contrastar la existencia de autocorrelaci´
Pt =
−2′884 + 0′462S t + 0′184P t−
1
sabiendo que tenemos una muestra de quince observaciones y que:
−1
V ar β = σ2 (X ′ X )
=
− −
19′39 0′ 384 0′ 175
−′0′384 −0′ ′175 0 0153 −0 01258 −0′ 0125 0′ 03577
d = 1′ 75021
Puesto que como regresora aparece la variable dependiente retardada para estudiar la autocorrelaci´on en este modelo hay que utilizar la h de Durbin. En tal caso, se rechaza la hip´otesis nula de incorrelaci´on si n h = ρ > Z 1− α , 1 n var
||
· − ·
2
donde var es la varianza estimada del coeficiente correspondiente a la variable retardada y Z 1− α es el punto de una distribuci´on N(0,1) que deja a su izquierda una probabilidad 1 α2 . 27
2
−
Es evidente que n = 15 y var = 0′ 03577. Por otro lado, como d = 1′ 75021 se tiene que ρ 0′ 1249.
≃ 1−
′
1 75021 2
=
Luego, sin m´as que sustituir:
|h| =
· − 0′ 1249
1
15 = 0 ′ 71057 > 1 ′ 96 = Z 0 975 . 15 0′ 03577
·
′
Por tanto, no rechazo la hip´otesis nula de incorrelaci´on. 5. Se ha recogido informaci´ on de la econom´ıa espa˜ nola para el p eriodo 1985-1990 del consumo p´ u blico y el PIB con objeto de estimar un modelo de regresi´ on lineal que explique el consumo p´ ublico. Se ha llegado al siguiente modelo estimado por MCO: ˆt = 2′ 1864 + 0′ 0796P IB t C con:
6
(et
t=2
2
− et− ) 1
= 0 ′ 049327
6
e2t = 0 ′ 0161
t=1
Se pide contrastar la existencia de autocorrelaci´ on. En este caso
0′ 049327 = 3 ′ 0638, dL = 0′ 6101, dU = 1 ′ 4002. ′ 0 0161 dU < d < 4 dL = 3′ 3898, el contraste de Durbin-Watson no es concluyente. d =
Como 2′ 5998 = 4
−
−
6. El n´ umero de peque˜ nos accidentes ocurridos en las calles de una ciudad (Y ) y el n´ umero de coches matriculados en la misma (X ) durante 10 a˜ nos han sido los siguientes: Y 25 27 28 32 33 36 38 40 41 45
X 510 520 528 540 590 650 700 760 800 870
Dado el modelo Y t = β 0 + β 1 X t + ut , se pide: a) Estimar la recta que exprese el n´ umero de accidentes ocurridos en funci´ on del n´ umero de coches matriculados. b) Calcular el estad´ıstico Durbin-Watson y detectar la posible existencia de autocorrelaci´ on. c) Aplicar m´ınimos cuadrados generalizados para solucionar el posible problema de autocorrelaci´ on comprobando que realmente ha sido resuelto.
29
Para estimar la recta que exprese el n´umero de accidentes ocurridos en funci´on del n´umero de coches matriculados tendremos encuenta que
· · − y =
de forma que
t
β =
X X
−1
25 27 28 32 33 36 38 40 41 45
X =
X y =
−
510 520 528 540 590 650 700 760 800 870
0′0042 0′ 00001
,
−1
10 6468 6468 4335984
t
2′ 8436 0′ 0042
=
,
1 1 1 1 1 1 1 1 1 1
345 230674
=
345 230674
2′ 5676 0′ 0494
.
Por tanto, la estimaci´on buscada es
Y t = 2′ 5676 + 0′ 0494 X t .
·
Adem´ as, a partir de dicha estimaci´on se calculan los residuos como:
e = y
− y = y − X
· β =
25 27 28 32 33 36 38 40 41 45
−
27′7462 28′2399 28′6349 29′2273 31′6958 34′ 658 37′1265 40′0887 42′0635 45′5194
=
− −− − −−
2′ 7462 1′ 2399 0′ 6349 2′ 7727 1′ 3042 1′ 342 0′ 8735 0′ 0887 1′ 0635 0′ 5194
.
En las representaciones gr´aficas de las figuras 3 y 4 sobre los residuos anteriores podemos observar en la primera rachas de valores por encima y por debajo del cero y en la segunda una tendencia creciente. Ambas situaciones nos hace pensar en la presencia de autocorrelaci´on positiva en la perturbaci´on aleatoria del modelo. En efecto, teniendo en cuenta los residuos se obtiene la informaci´on de la tabla 8 y a partir de ´estos se tiene que: 18′ 796 d = ′ = 0 ′ 8228. 22 8435 En tal caso, como d L = 0′ 8791 y d U = 1 ′ 3197, entonces hay autocorrelaci´on positiva ya que d < d L . Para resolver este problema de autocorrelaci´on utilizaremos el m´etodo de Prais-Winsten para transformar los datos ya que se disponen de pocas observaciones. Entonces: Y t∗ =
− 1
Y t
ρ2 Y 1 , ρ Y t−1 , t > 1
− ·
·
X ∗ = it
30
− 1 X it
ρ2 X i1 , i = 1, 2 , ρ X i t−1 , t > 1, i = 1, 2
− ·
·
Residuos de la regresión (= Y observada − estimada) 3
2
1
o u d i s e r
0
−1
−2
−3
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
Figura 3: Gr´afico temporal de los residuos 3
2.5
2
1.5
1 t _ e
0.5
0
-0.5
-1
-1.5 -2
-1
0
1
2
e_t_1
Figura 4: Gr´afico de dispersi´ on
Cuadro 8: C´alculo et e2t -2’7462 7’5416 -1’2399 1’5373 -0’6349 0’403 2’7727 7’6879 1’3042 1’701 1’342 1’801 0’8735 0’763 -0’0887 0’0079 -1’0635 1’131 -0’5194 0’2697 22’8435
del estad´ıstico de Durbin-Watson et−1 et et−1 (et et−1 )2
−
-2’7462 -1’2399 -0’6349 2’7727 1’3042 1’342 0’8735 -0’0887 -1’0635
31
1’5063 0’605 3’4076 -1’4685 0’0378 -0’4685 -0’9622 -0’9748 0’5441
−
2’2689 0’3661 11’6115 2’1565 0’0014 0’2195 0’9258 0’9502 0’2961 18’796
el consumo p´ ublico. A trav´ es de la estimaci´ on de MCO se han obtenido los siguientes resultados: 9
2
R = 0 ′85,
SCT = 5 ′ 08,
t=2
et et−1 = 0′ 22.
·
Detectar la posible presencia de autocorrelaci´ on a trav´ es del contraste de Durbin-Watson. Teniendo en cuenta que R2 = 1
− SSCCRT =⇒ SC R = 1 − R · SC T = (1 − 0′85) · 5′ 08 = 0′762, 2
es claro que
9
ρ =
et et−1
·
t=2
9
t=1
y entonces d
0′ 22 = ′ = 0 ′ 28872, 0 762
e2t
≃ 2 · (1 − 0′28872) = 1′42257218.
Como dL = 0′ 8243 y dU = 1′ 31, se verifica que 1 ′ 31 = dU < d = 1′ 42 < 2′ 69 = 4 modelo es incorrelado.
− dU . Esto es, el
8. Al estimar por MCO un modelo lineal, a partir de 21 observaciones, se obtuvo:
Yt = 1′ 3 + 0 ′ 97 Y t−1 + 2 ′ 31 X t , (0′ 3) (0′ 18) (0′ 41)
·
d = 1′ 21,
·
donde las cifras entre par´ entesis son las desviaciones t´ıpicas. Contrastar la presencia de autocorrelaci´ on en la perturbaci´ on aleatoria. Puesto que como regresora aparece la variable dependiente retardada para estudiar la autocorrelaci´on en este modelo hay que utilizar la h de Durbin. En tal caso, se rechaza la hip´otesis nula de incorrelaci´on si n h = ρ > Z 1− α , 1 n var
· − ·
||
2
donde var es la varianza estimada del coeficiente correspondiente a la variable retardada y Z 1− α es el punto de una distribuci´on N(0,1) que deja a su izquierda una probabilidad 1 α2 . 2
−
Es evidente que n = 21 y var = 0′ 182 = 0 ′0324. Por otro lado, como d = 1′ 21 se tiene que ρ 0′ 395.
≃ 1−
′
1 21 2
=
Luego, sin m´as que sustituir:
|h| =
· − 0′395
1
21 = 3 ′ 201 > 1 ′ 96 = Z 0 975 . 21 0′ 0324
·
′
Por tanto, rechazo la hip´otesis nula de incorrelaci´on, es decir, hay autocorrelaci´on en la perturbaci´on aleatoria. 9. Dado un modelo lineal de consumo en funci´on del PIB con los siguientes datos: Y t 22 X t 3
15 1
8 2
6 0
3 -2
2 -3
7 -1
Contraste la existencia de autocorrelaci´ on sabiendo que la regresi´ on del modelo original por MCO produce los siguientes residuos: 33
Cuadro 11: C´alculo et e2t 4’63 21’4369 3’21 10’3041 -6’58 43’2964 -3 9 -0’42 0’1764 1’37 1’8769 0’79 0’6241 87’2148
et 4 ’63
del estad´ıstico de Durbin-Watson 2 et−1 et et−1 (et et−1 )
−
4’63 3 ’21 -6’58 -3 -0’42 1’37
3’21
−
-1’42 9’79 3’58 2’58 1’79 -0’58
-6’58
-3
2’0164 95’8441 12’8164 6’6564 3’2041 0’3364 120’8738
-0’42
1’37
0’79
Teniendo en cuenta la informaci´on de la tabla 11 se tiene que 120′ 8738 d = = 1 ′ 3859. ′ 87 2148 Como dL = 0′ 6996 y dU = 1′3564, se tiene que dU < d < 4 aleatoria del modelo considerado est´a incorrelada.
− dU = 2′6436. Luego, la perturbaci´on
10. A partir de una muestra de 20 datos se ha estimado por MCO el siguiente modelo:
Y t = 4′ 9 + 2 ′ 2X 2t + 3 ′ 5X 3t ,
mientras que con los residuos del modelo anterior se ha realizado la siguiente regresi´ on: et = 0′ 75 et−1 .
Se pide:
·
a) Analizar la presencia de autocorrelaci´ on de primer orden utilizando el contraste de Durbin-Watson. b) Suponiendo que las perturbaciones siguen un proceso autorregresivo de primer orden y que ha obtenido una estimaci´ on adecuada del coeficiente de dicho proceso, especifique la ecuaci´ on que usar´ıa para obtener estimaciones eficientes de los par´ ametros del modelo. Puesto que ρ = 0′ 75, entonces d 2 (1 ρ) = 0 ′ 5. Y como dL = 1′ 1004 y dU = 1′ 5367 hay autocorrelaci´on positiva en la perturbaci´on aleatoria del modelo ya que d < d L .
≃ · −
Por otro lado, puesto que se disponen de pocas observaciones, se deber´ıa usar el procedimiento iterativo de Prais-Winsten con ρ = 0′ 75 para la obtenci´on de estimaciones ´optimas. 11. Utilizando una muestra de 25 observaciones anuales se estima mediante MCO el siguiente modelo que estudia la demanda (D) en funci´ on del precio (P) y la renta (R):
Dt = 521′ 2 + 0 ′ 532 Rt (322′08) (0′ 036)
· − 23′25 ′· P t + 0 ′415′ · Dt− , 1
(18 75)
d = 2′ 088.
(0 05)
¿Se puede decir que los estimadores por MCO son ´optimos? Puesto que como regresora aparece la variable dependiente retardada para estudiar la autocorrelaci´on en este modelo hay que utilizar la h de Durbin. En tal caso, se rechaza la hip´otesis nula de incorrelaci´on si n h = ρ > Z 1− α , 1 n var
||
· − · 34
2