CAPITULO 11 11.1 11.1.. Esta Establ bléz ézca case se si las las sigu siguie ient ntes es afir afirma maci cion ones es son son cier cierta tas, s, fals falsas as o inci incier erta tass y brevemente de sus razones: a) En presenci presenciaa de heterosced heteroscedastic asticidad idad los estimado estimadores res MCO son sesgado sesgadoss al igual que ineficientes. Falso que sean sesgadas, los estimadores siguen siendo insesgados ya que para establecer el insesgamiento de los estimadores no es necesario que mi sean homoscedasticos ya que son consistentes bajo las suposiciones del modelo de regresión lineal clásico; pero es verdad que ya no sean eficientes ya que b1 estimado estimado ya no tendrá varianza mínima en la clase de los estimadores lineales b) Si hay heteroscedasticidad, heteroscedasticidad, las pruebas convencionales convencionales t y F son inválidas. Cierto, porque las conclusiones a las cuales se llegue o las inferencias que se hagan pueden ser erróneas, ya que si ignoramos la heteroscedasticidad se utilizaría la formula usual de la
varianza y en promedio var B estaría sobreestimada o subestimada. ^
1
c) En presenci presenciaa de heterosceda heteroscedastici sticidad, dad, el método método MCO usual usual sobrestima sobrestima siempre siempre los errores estándar de los estimadores.
Falso, no siempre sobreestima porque var B depende de la naturaleza de la relación entre ^
1
2
si
y
los valores tomados por la variable explicativa, por lo tanto puede estar sobreestimada o subestimada d) Si los residuo residuoss estimado estimadoss a través través a travé travéss de una regresi regresión ón MCO exhiben exhiben un patrón sistemático, significa que hay presencia de heteroscedasticidad en los datos. Cierto, ya que según este modelo informal (gráfico) si nos muestra un gráfico de
2 i
frente a
^
los y con relación sistemática entonces hay indicios de heteroscedasticidad i
e) No hay una prueba prueba genera generall de heteros heterosce cedas dastic ticida idad d que esté esté libre libre de supue supuesto sto alguno sobre cuál de las variables está correlacionada con el término error Cierto, ya que todas la pruebas se basan en como estan relacionadas las regresoras con el término error. f) Si una regreso regresora ra que tiene varian varianza za no consta constante nte se omite (incorr (incorrect ectame amente nte)) de un modelo, los residuos (MCO) serán heteroscedasticos. Cierto, porque para corregir la heteroscedasticidad no consiste en eliminar la variable sino darle forma, es decir, hay que transformarla de manera que la varianza del residual se haga
constante; y de nada me serviria eliminar la variable incorrectamente, es decir, sin saber porque la estoy eliminando. 11.2. En una regresión de salarios promedio (W, $) sobre el número de empleados (N) para una muestra aleatoria de 30 empresas, se obtuvieron los siguientes resultados: = 7.5 + 0.009N t=n.a. (16.10)
(1)
2
R =0.90
/N= 0.008 + 7.8(1/N) t=(14.43) (76.58)
2
(2)
R =0.99
a) ¿Qué está suponiendo el autor al pasar de la ecuación (1) a ola (2)?, ¿Estaba preocupado por la heteroscedasticidad? ¿cómo se sabe? El autor talvez haya hecho el test de Goldfeld y Quandt rechazando la hipótesis de heteroscedasticidad y está suponiendo que la varianza de las perturbaciones es proporcional al cuadrado de la variable explicativa numero de empleados (N), y por lo tanto si estaba preocupado por la heteroscedasticidad ya que se tiene que hacer ese cambio para que al aplicar MCO sean los estimadores MELI. b) ¿Se pueden relacionar las pendientes y las intersecciones de los dos modelos? Se puede decir que en la regresión transformada, el término de la intersección b1es el coeficiente de pendiente en la ecuación original y el coeficiente de la pendiente b0 es el término de la intersección en el modelo original c) ¿se pueden comparar R 2 de los modelos? ¿Porqué si o porqué no? No se pueden, ya que la segunda ecuación está transformada y para poder comparar los R 2 se tendría que llevar la segunda ecuación al modelo original 11.3. a) ¿Se pueden estimar los parámetros de los modelos | i| = B + B X + v | i| = B1 + B2 X i2 + vi 1
2
i
i
Mediante el método de mínimos cuadrados ordinarios? ¿Porqué si o porqué no?. No, porque no son lineales en los parámetros desconocidos b) Si la respuesta es negativa, ¿se puede sugerir un método informal o formal de estimación de los parámetros de tales modelos? (véase el capitulo 14). El método de ensayo y error, que consiste en ver la forma en que el modelo de regresion dado se ajusta a los datos dados, y para eso se supone un valor para cada parámetro , y luego puesto que se conocen los valores de Y, X, b1, b2, se determina con facilidad la suma error de cuadrados, luego se sigue repitiendo el procedimiento hasta obtener la menor suma de error al cuadrado.
11.4. Aunque los modelos logarítmicos tales como el modelo de la ecuación (11.6.12) frecuentemente reducen la heteroscedasticidad, se debe prestar cuidadosa atención a las propiedades del término de perturbación de tales modelos. Por ejemplo, el modelo Yi=b1
B2
X i
ui
Puede escribirse como lnYi=lnb1+b2lnXi+ln ui a) Si ln ui tiene valor esperado cero, ¿Cuál debe ser la distribución de u i? Su distribución debe ser uniforme igual a 1 b) Si E(ui)=1, ¿Será E(ln u i)=0? ¿Por qué si o por qué no? Si, porque para que sea E(u i)=1, la suma de los u i debe ser igual al tamaño de muestra lo cual quiere decir que cada ui debe ser igual a uno, ytransformando la variable a ln u i siempre me va a dar cero c) Si E(ln ui) es diferente de cero, ¿qué puede hacerse para volverlo cero? Lo que puede hacerse es que hacer que cada uno de los residuales sea igual a la unidad o también hacer que la mitad de residuales sean recíprocos a la otra mitad 11.5. Muéstrese que
*
B2
* 2
de 11.3.8 también puede expresarse como B
∑ w y x = 2* ∑ w x
* * i i
i
i
var ( B2* )
* dada en (11.3.9) también puede expresarse como var ( B 2 ) =
1 2* ∑ wi xi
y
i
donde
− −* ( y ) =Yi- Y y ( x ) =Xi- X * representan las desviaciones en relacion con las medias * i
* i
ponderadas
−
Y
*
−
y X * definidas como
−
Y
*
= ∑wi Y i / ∑wi
− *
w X / w X = ∑ i i ∑ i
SOLUCIÓN: a) B
* 2
_ *
_
w y x [ w (Y − Y )( X − X )] =∑ =∑ ∑ w x ∑ w ( X − X ) * i
i
i
* i
i
i
2* i
_
* 2
i
_ *
B 2* =
*
i
i
_ *
∑ [wiY i − wi Y )( X i − X _
_
)]
∑ wi ( X i − X )
∑ B 2*
=
−∑
wi X i
∑ wi X i
∑
wi
∑
−∑
wi Y i
i
i
2
_ *
wi X i
wi
i
i
i
2
_ *
Y
_ 2*
w X w Y + ∑ i i ∑ i i ∑ wi ∑ wi ∑ wi
2
i
*
− 2∑ wi X i X + ∑ wi X
∑ ∑ ∑ w ∑ w X − ( ∑ w X ) ∑w wi Y i
_
∑ wi X i Y i − ∑ wiY i X − ∑ wi X i Y + ∑ wi X
=
* 2
wi X i Y i
_ *
*
B 2*
=
∑
wi X i Y i
−2∑
∑ w Y + ∑ w X ∑ w Y ∑w ∑w ∑ w ∑ w X − (∑ w X ) ∑w wi X i
i
i
i
i
i
i
i
2
2
i
i
i
i
i
i
∑ wi ∑ wi X i Y i − ∑ wi X i ∑ wi Y i wi ∑ = 2 ∑ wi ∑ wi X i 2 − ( ∑ wi X i )
∑w
i
*
B2
=∑
i
∑ w X Y − ∑ w X ∑ w Y ∑ w ∑ w X − ( ∑ w X ) wi
i
i
i
i
i
i
2
i
i
i
2
i
i
i
b)
var
( )= * B2
1
∑
1
=
2*
wi xi
∑
_ * 2
wi ( X i − X
)
1
=
∑
wi X i
2
_ *
− 2∑
wi X i X
_ 2* wi X 2
+∑
1
var ( B2* ) =
∑w X i
2
i
− 2∑( wi X i
∑wi X i 2 ∑wi X i + ∑ wi ) wi wi 1
( )= *
var B2
∑ w X i
i
2
2 ∑ wi X i ( wi X i ) ∑ ( ∑ wi X i ) + − 2 ∑ wi wi
var ( B
* 2
)=
=
∑w − 2( ∑ w X ) + ( ∑ w X ) i
∑ w ∑ w X i
i
i
2
2
i
i
∑w
i
∑ w ∑ w X − ( ∑ w X ) 2
i
i
i
i
2
i
11.6. Con propósitos pedagógicos Hanushek y Jackson estiman el siguiente modelo: Ct= b1+ b2 PNBt + b3 Dt + ui (1) Donde Ct= gasto agregado de consumo privado en el año t, PNB t =producto nacional bruto en el año t y D t =gastos de defensa nacional en el año t, siendo el objetivo del análisis estudiar el efecto de los gastos de defensa sobre otros gastos en la economía. Postulan que s = s (PNBt)2, luego transforman (1) y estiman Ct/ PNBt = b1(1/ PNBt)+ b2 + b3 (Dt /PNBt) + ui / PNBt (2) 2
t
2
Los resultados empíricos basados en la información para 1964-1975 fueron los siguientes (errores estándar entre paréntesis): ^
C t
26.19 +0.6248 PNB t - 0.4398 Dt (2.73) (0.0060) (0.0736) =
R 2 =0.999
i
i
2
^
C t / PNBt = 25.92(1/ PNBt)+ 0.6246 -
(2.22)
(0.0068)
0.4315 (Dt /PNBt) (0.0597)
R 2 =0.875
a) ¿Qué supuesto hacen los autores sobre la naturaleza de la heteroscedasticidad? ¿Pueden justificarse? Los autores hacen el supuesto de que la varianza del error es proporcional a (PNB t)2, si pueden justificarse si previamente se ha utilizado un método grafico y se ha observado y verificado lo anteriormente dicho. b) Compárense los resultados de las dos regresiones. ¿La transformación del modelo original ha mejorado los resultados, es decir, ha reducido los errores estándar estimados? ¿Por qué si o por qué no? Si ha reducido los errores estándar, porque ahora la regresión es homoscedastica c) ¿Se pueden comparar los valores de R 2? ¿ Por qué si o por qué no? (Pista: Examínese las variables dependientes) No se pueden ya que el objetivo de la regresión es estudiar el efecto de los gastos de defensa sobre otros gastos de la economía, entonces al ser transformada la ecuación se distorsiona la variable en estudio y no me daría la información que necesito.
11.7. Téngase en cuenta las regresiones estimadas (11.6.2) y (11.6.3). Los resultados de la regresión son muy similares. ¿A q puede deberse este resultado? En la ecuación 11.6.2podemos observar la corrección de la heterocedasticidad mediante el método de mínimos cuadrados ponderados que es un caso especial de la técnica de estimación
de mínimos cuadrados generalizados en el cual nos indica que de para hacer la corrección del supuesto de heterocedasticidad debemos dividir a todo el modelo original entre la varianza 2 σ i que suponemos como conocida , los resultados obtenidos de la ecuación luego de transfórmala resulta ser parecida a los valores obtenidos en la ecuación 11.6.3, esto pudo darse por que en el método de MCP da mayor peso a las observación que se encuentran agrupados cerca a su media, que aquellas que están ampliamente dispersas a su alrededor, de esta manera es mas confiable estimar la función de regresión poblacional. 2 Por otra parte el MCO (sin ponderar) cada µ ˆ i recibirá el mismo peso al minimizar la suma de cuadrados de regresión. 11.8. Pruébese que si wi=w una constante, para cada i, β 2 y β3 son idénticos al igual q sus varianzas. a)
wi = w =1/ σ2 β*2=[( ∑wi )( ∑wi xi yi )- ( ∑wi xi ) ( ∑wi yi )]/[ ( ∑wi ) ( ∑wi x2i) - ( ∑wi xi)2] β*2 = [(n/ σ2 )(n/ σ2 ) ∑ xi yi - (n/ σ2 ) ∑ xi *(n/ σ2 ) ∑ yi ]/[ (n/ σ2 )2∑ x2i - (n/ σ2 )2(∑ xi)2] β*2 =[n w2(∑ xi yi - ∑ xi ∑ yi )]/[ n w2(∑x2i – (∑ xi )2] ^
β*2 = B2
………comprobado.
b) Var(β*2 )=[ ∑wi ] / [( ∑wi )( ∑wi x2i ) – (∑wi xi )2] Var(β*2 )=[nw] / [(nw)(w∑x2i ) - w2(∑ xi )2 ] Var(β*2 )=[nw] / [w2 (n∑x2i - (∑ xi )2 )] Var(β*2 )=[n σ2 ] / [n∑x2i - (∑ xi )2 ] Var(β*2 )=[σ2 ] / [∑x2i - n x 2] −
^
Var(β*2 ) = σ2 / ∑x2i = B2 11.9. Refiéranse las formulas (11.2.2) y (11.2.3). Supóngase que: σ2i = σ2 K i donde σ2 es una constante, y donde K i son ponderaciones conocidas, no necesariamente todas iguales. Utilizando este supuesto, muéstrese que la varianza dada en (11.2.2) puede expresarse como:
Var(β1)=( σ2*∑x2i k i ) / ( ∑x2i *∑x2i ) El primer termino del miembro derecho es la formula de la varianza dada en (11.2.3), es decir, var(β2 ) bajo heteroscedasticidad y bajo homoscedasticidad derecho.) ¿Puede derivarse alguna conclusión general sobre las relaciones entre (11.2.2) y (11.2.3)? σ2i = σ2k i (σ2i)/( σ2) = k i
Var B Var B ^
2
= (σ2 (∑ X2i k i ))/ (∑ X2i*∑ X2i)
^
2
=(∑ X2i σ2i)/( ∑ X2i)2 ………… Comprobado.
Lo que se puede decir es q la varianza bajo heterosedasticida es igual a la varianza bajo homocedasicidad pero afectado por ponderaciones conocidas que nos proporcionan las variables regresoras. 11.10. En el modelo: Yi = β2Xi + ui ( nota: no hay intersección) Se dice que var(u i ) = σ2 X2i . Demuéstrese que:
Var B Var B ^
2
= (σ2 ∑ X4i ) / ( ∑ X2i)2
^
2
= (∑ X2i σ2i)/( ∑ X2i)2
Var B Var B ^
= [(∑ X2i (σ2i X2i)] / ( ∑ X2i)2
2
^
2
= (∑ X4i σ2i) / ( ∑ X2i)2 = (σ2 ∑ X4i ) / ( ∑ X2i)2
11.12 La tabla 11.6 presenta información sobre la razón ventas/efectivo en las industrias manufactureras de estados unidos, clasificadas por tamaño de activos del establecimiento para el periodo 1971-I a 1973-IV. (Información trimestral.) La razon ventas/efectivo puede considerarse como una medida de velocidad del ingreso en el sector empresarial, es decir, el numero de veces q un dólar circula.
Tabla 11.6 Año y Trimestre 1–10
10–25
25–50
50–100
100–250
250–1000
1000 +
1971– I –II –III –IV
6.696 6.826 6.338 6.272
6.929 7.311 7.035 6.265
6.858 7.299 7.082 6.874
6.966 7.081 7.145 6.485
7.819 7.907 7.691 6.778
7.557 7.685 7.309 7.12
7.86 7.351 7.088 6.765
1972– I –II –III
6.692 6.818 6.783
6.236 7.01 6.934
7.101 7.719 7.182
7.06 7.009 6.923
7.104 8.064 7.784
7.584 7.457 7.142
6.717 7.28 6.619
–IV
6.779
6.988
6.531
7.146
7.279
6.928
6.919
1973– I –II –III
7.291 7.766 7.733
7.428 9.071 8.357
7.272 7.818 8.09
7.571 8.692 8.357
7.583 8.608 7.68
7.053 7.571 7.654
6.63 6.805 6.772
–IV
8.316
7.621
7.766
7.867
7.666
7.38
7.072
a) Para cada tamaño de activos, calcúlese la media y a desviación estándar de la razon ventas/efectivo. prom Des.Estan
7.025833333 7.265417 7.299333 7.3585 7.66358 7.37 6.9898333 0.621392254 0.802579 0.462716 0.644182 0.46739 0.2563332 0.3651692
b)Grafiquese el valor de la media frente a la desviación estándar obtenida en utilizando el tamaño de activos como unidad de observación. x
y
0.621392254 0.802579416 0.462716354 0.644181581 0.467389162
7.025833 7.265417 7.299333 7.3585 7.663583
(a),
0.256333235 7.37 0.36516916 6.989833
7.7 7.6 7.5
o i 7.4 d e 7.3 m o r 7.2 P 7.1 7 6.9 0
0.2
0.4
0.6
0.8
1
Desv.estand.
c) Utilizando un modelo de regresión apropiado, decídase si la desviación estándar de la razón se incrementa con el valor de la media. De no ser así, ¿Cómo se interpreta el resultado? Estaditica de la Regresion Coef.Correl.Mult. 0.080018567 0.006402971 Coef.Deter R 2 2 -0.192316435 R ajustado 0.248503584 Error tipico 7 observaciones Coeficientes Intercepción Variable X1
7.33272701 -0.09851176
y=7.332-0.00985X ……….. * El valor de la media disminuye cuando la desviación aumenta en una unidad.
11.13. Prueba de Homogeneidad de Varianza de Bartlett: Suponga que hay K varianzas muestrales independientes S 12, S22,……Sk 2 cada una conf 1, f 2,…………….f k g de l , provenientes de la poblaciones normalmente distribuidas con media µ y varianza .Supóngase además que se desea probar la hipótesis nula Ho = ∂ 12=∂22 .….. =∂k 2, es decir ∂i2, cada varianza muestral es una estimación de la misma varianza poblacional ∂ 2. Si la hipótesis nula es verdadera, entonces. S
2
∑ f S = i
2 i
f
Constituye una estimación de la estimación común (agrupada) de la varianza poblacional ∂ 2, donde fi= (ni-1), siendo n i el número de observaciones en el grupo i-ésimo y donde f=Σfi. Barlett a demostrado de que la hipótesis nula puede probarse por la razón A/B, que esta distribuida aproximada con la distribución X 2 con k-1g de1, donde A = f ln S
2
− ∑( f i ln S i2 ) y
B = 1 +
1 1 ∑ − 3( k −1) f i f 1
Aplíquese la prueba de Barlett sobre los datos de la tabla 11.1 verifíquese que no se puede rechazar la hipótesis de la que las varianzas poblacionales de la compensación salarial son las mismas para cada tamaño de empleo del establecimiento, al nivel de la significancia del 5%. NOTA: f1, los g de l para cada varianza muestral, es 9, puesto que n i para cada muestra (es decir, clase de empleo) es 10.
Pregunta 11.13
Tamaño de empleo (número promedio de empleados )
1-4 2994 1721 3600 3494 3498 3611 3875 4616 3538 3016
A. productos similares P. del tabaco P. textiles. R. P. relacionados Papel y P. similares I. y publicación Químicos Similares P. P. y carboníferos P. de caucho y plástico P. productos de piel. Compensación promedio 3396 Desviación estándar 742.2 Productividad promedio 9355 fi 9 Si^2= 550831 fi*Si^2 4957482 ln(Si^2)= 13.2192 fi*ln(Si^2)= 118.973 Σfi*ln(Si^2)= Σfi*Si^2= S^2
5-9 3295 2057 3657 3787 3847 4206 4660 5181 3984 3196
10-19 3565 3336 3674 3533 3913 4695 4930 5317 4014 3149
20-49 3907 3320 3437 3215 4135 5083 5005 5337 4287 3317
50-99 4189 2980 3340 3030 4445 5301 5114 5421 4221 3414
3787 851.4
4013 727.8
4104 805.06
4146 929.9
8584 7962 9 9 724942.2 529697.6 6524480 4767278 13.49385 13.18006 121.4446 118.6206 1111.87 A= 8.1E+07 B= 996808 A/B=
8275 8389 9 9 648114 864890.9 5833024 7784019 13.3818 13.67036 120.436 123.0332 6.92345 3.96296 1.74704 0.98780920 4
100-249 250-499 500-999 1000-2499 4486 4676 4968 5342 2848 3072 2969 3822 3334 3225 3163 3168 2834 2750 2967 3453 4885 5132 5342 5326 5269 5182 5395 5552 5248 5630 5870 5876 5710 6316 6455 6347 4539 4721 4905 5481 3254 3177 3346 4067 4241 1080.6
4388 1241.2
4538 1307.7
4843 1110.5
9418 9795 10281 9 9 9 1167697.1 1541283 1710095 10509274 1.4E+07 1.5E+07 13.970544 14.2481 14.3521 125.7349 128.233 129.169
11750 9 1233718 11103460 14.02554 126.2299
ln(S^2)= 13.8123 X2 f*ln(S^2) 1118.8 Se verifica que no se puede rechazar la hipótesis Ho entonces nos indica que no existe heteroscedastisidad con nivel de significancia del 5%.
11.16. Gasto alimentario en India. En la tabla 2.8 se proporcionaron datos sobre el gasto en alimentos y el gasto total de 55 familias de Indias. A.-Haga la regresión del gasto alimentario sobre el gasto total y examine los residuos obtenidos en dichas regresión. Residuos
-138.0920413 -160.0506179 -53.5299062 -90.36421257 -41.91448597 -107.553537 -69.47069022 -45.42926681 -36.98547106 -31.50025191 -52.9381168 -20.571237 -70.92625508 -31.56530614 -62.52388274 -17.6836455 1.677303435 28.80157365 18.48204812 -9.476528472 -77.796054 -126.5948678 25.76608111 -94.71320719
33.62985657 29.4286704 100.8488353 -23.50627537 159.6654417 69.76005764 -46.19268069 -8.382005149 126.0559523 84.04409063 54.63578743 159.6654417 8.422739537 84.04409063 37.83104274 67.23934594 -15.10390302 -60.48848279 80.68314169 109.2512077 1.700841663 50.43460125 25.22748422 218.4820481 151.2630694
14.48797898 8.422739537 -176.3108348 -37.79030835 5.411063027 -47.9084625 Resultados de la regresión de MCO. Ŷ=294.0626648 + 0.23299933X i e.e = 53.37118857 0.107620702 t = 5.509764213 1.484498448
R^2= 0.039920046
Con una significancia al 5% no sigue un patrón sistemático por eso presenta heteroscedastisidad. B.-Grafíquese los residuos obtenidos en el inicio a.-En comparación con el gasto total y verifíquese si existe algún patrón sistemático. Varia ble X 1 Gráfi co de los residua les
250 200 150
s 100 o u 50 d i 0 s e R -50 0
100
200
300
400
500
600
700
-100 -150 -200 Vari able X 1
C.- Si la gráfica del inicio b.-sugiere que existe heteroscedasticidad, aplíquese las pruebas Park, Glejser y White a fin de averiguar si la sensación respecto a la heteroscedasticidad observada en b.-Se justifica con estas pruebas. La grafica indica que en este caso existe heteroscedasticidad. Prueba de Park . Ŷ= -0.124788408+ 1.234059717lnx i e.e = 8.126031722 t = -0.015356623
1.318323492 0.936082627
R^2= 0.016264136
La prueba de Park sugiere que existe una relación positiva estadísticamente significativa entre los residuos al cuadrado y el gasto total Prueba de Glejser Ŷ= 21.53138352 -0.020349671x i e.e = 32.6820581 t = 0.658813574
0.065901962 1.323774692
R^2= 0.032005539
La prueba de Glejser sugiere que existe una relación sistemática entre los valores absolutos de los residuos al cuadrado y el gasto total, con la que surge la posibilidad que la regresión presente heteroscedasticidad.
Prueba de White û= -35311.52981+ 158.9744757X 1 - 0.142801612X12 e.e = 31684.75592 134.5201531
0.137685315
t = -1.114464315
-1.037159353
1.181789286
R^2= 0.066688662
Ho = No hay heteroscedasticidad. H1= Si hay heteroscedasticidad. n *R 2 = 3.667876411 X22 = 0.159783069 Bajo la hipótesis nula la existencia de heteroscedasticidad, tiene una distribución jicuadrado con 2 g de l, al obtener se juzga que lo suficiente bajo entonces se concluye que existe heteroscedasticidad.
D.-Obténgase los errores estándar de White consistentes en heteroscedasticidad y compárense con los errores estándar MCO. Decídase si vale la pena corregir este ejemplo a causa de la heteroscedasticidad. e.e = 31684.75592 134.5201531
0.137685315 Errores estándar de White.
e.e = 53.37118857 0.107620702
Errores estándar de MCO.
Si vale la pena corregir este ejemplo a causa de la heteroscedasticidad.
11.17. Repítase el ejercicio 11.16, pero en esta ocasión efectúese la regresión del logaritmo del gasto alimentario sobre el logaritmo del gasto total. Si se observa heteroscedasticidad en el modelo lineal del ejercicio 11.16, pero no en el modelo Loglineal, ¿qué conclusión se puede deducir? Muestre todos los cálculos necesarios. Resultados de la regresión de MCO. Ŷ=294.0626648 + 0.23299933X i e.e = 53.37118857 0.107620702 t = 5.509764213 1.484498448
R^2= 0.039920046
logŶ= 1.977499824+ 0.217354397log x i e.e = 0.36949803 t = 5.35185491
0.1380293 1.57469751
R^2= 0.04469515
Al comparar el modelo lineal de MCO con el modelo Log lineal el modelo Log lineal sigue un patrón sistemático eso quiere decir que no presenta heteroscedasticida.
11.18. Un atajo de la prueba White. Como se dijo en el texto, la prueba White puede consumir grados de libertad si existe varias regresoras y si se introducen todas las regresoras, sus términos cuadrados de sus productos cruzados. Por consiguiente, en vez de estimar las regresiones como la (11.5.22), ¿por qué no simplemente se efectúa la siguiente regresión?
∧2
∧
µ 12 = α 1 +α 2 Y i + α 2 Y i +ν i
Donde Y i son valores estimados Y (es decir, la regresada) de cualquier modelo que se esté calculando. Después de todo Y i es simplemente el promedio ponderado de las regresoras, donde los coeficientes estimados de la regresión sirven como ponderaciones. Obténgase el valor R 2 de la regresión anterior y utilicé (11.5.22) para privar la hipótesis de que no existe heteroscedasticidad. Aplíquese la prueba anterior al ejemplo de gasto alimentario del ejercicio 11.6. ∧
∧
Resultados de la regresión de MCO.
Ŷ=294.0626648 + 0.23299933X i e.e = 53.37118857 0.107620702 t = 5.509764213 1.484498448
R^2= 0.039920046
Ŷ= -811718.6673+ 4285.489808 Y i -5.594766574 Y i ∧
e.e = 744661.676 t = -1.090050278
∧
2
4011.729165 5.394317233 1.068240061 -1.037159353
R^2= 0.066688662
11.19 Reconsidérese el ejemplo sobre I y D analizado en la sección 11.7. Repítase ese ejemplo utilizando las ganancias como la regresara A priori, ¿se esperaría que lo resultados fuesen? ¿Por que si porque no? VENTAS
ID
UTILIDADES
1. Containers and packaging 2. Nonbank financial
6,375.30
62.5
185.1
11,626.40
92.9
1,569.50
3. Service industries
14,655.10
178.3
276.8
4. Metals and mining
21,869.20
258.4
2,828.10
26,408.30
494.7
225.9
32,405.60
1,083.00
3,751.90
35,107.70
1,620.60
2,884.10
40,295.40
421.7
4,645.70
70,761.60
509.2
5,036.40
5. Housing and construction 6. General manufacturing 7. Leisure time industries 8. Paper and forest products 9. Food 10. Health care
80,552.80
6,620.10
13,869.90
11. Aerospace
95,294.00
3,918.60
4,487.80
101,314.10
1,595.30
10,278.90
116,141.30
6,107.50
8,787.30
122,315.70
4,454.10
16,438.80
141,649.90
3,163.80
9,761.40
12. Consumer products 13. Electrical and electronics 14. Chemicals 15. Conglomerates
16. Office equipment and computers 17. Fuel 18. Automotive
175,025.80
13,210.70
19,774.50
230,614.50
1,703.80
22,626.60
293,543.00
9,528.20
18,415.40
11.20 la tabla 11.8 proporciona datos sobre la mediana de los salarios de profesores de estadística de tiempo completo, que laboraron en centros universitarios de investigación de estados unidos, durante el periodo 2000-2001 a) Grafíquense la mediana de los salarios respecto a los años de rangos (medidos como años de experiencia). Para propósitos de la grafica, supóngase que la mediana de los salarios se refiere al punto medio de los años de rango. 140000 120000 100000 80000 Serie1 60000 40000 20000 0 0.00
10.00
20.00
30.00
40.00
b) Considérense los siguientes modelos de regresión Y i = α + α 1 X i + µ Y i
= β + β 1 X i + β 2 X i2 + υ
Donde Y= mediana del salario, X= año en el rango (medido en el punto medio del rango), y u y v son los términos de error. ¿Se puede argumentar a raspón por la que el modelo (2) seria preferible al modelo (1)? A partir de los datos dados, estímese los modelos c) Si se observa que hay heteroscedasticidad en el modelo (1), pero no en el modelo (2) ¿Qué conclusiones se pueden deducir? Muestre los cálculos necesarios Modelo (1) ANOVA Model Regressio n Residual Total
Sum of Squares 12920304 21.428 88481006 4.972 21768404 86.400
df
Mean Square 1 12920304 21.428 13 68062312. 690 14
F
Sig.
18.983
.001
Coefficients Unstandardize Coefficients
Standardized Coefficients
t
Sig.
Model B Std. Error 1 (Constant) 73586.804 3944.584 AÑOS 949.562 217.942
Beta 18.655 4.357
.770
.000 .001
Modelo (2) ANOVA Mode Regressio n Residual Total
Sum of Squares 15101771 34.369 66666335 2.031 21768404 86.400
df
Mean Square 2 75508856 7.184 12 55555279. 336 14
F
Sig.
13.592
.001
Coefficients Unstandar Standardiz dized ed Coefficient Coefficient s s Model B Std. Error Beta 1 (Constant) 66356.180 5100.501 AÑOS 2285.920 702.547 1.855 XCUA -40.071 20.222 -1.130
t
Sig.
13.010 3.254 -1.982
.000 .007 .071
d) Si se observa la presencia de heteroscedasticidad en el modelo (2) ¿Cómo se podrían transformar los datos, de manera que en el modelo transformado no existiera heteroscedasticidad? 11.21 Si se tiene la siguiente información: SRC1 basado en la primeras 30 observaciones =55 g de l =25 SRC2 basado en las ultimas 30 observaciones =140, g de l = 25 Realízece la prueba sobre heteroscedasticidad Goldfeld- Quandt al nivel de significancia del 5% λ =
( SCE 2 / gl 2) ( SCE 1 / gl 1)
= 2.545454545
F ( 0.05, 25, 25) =1.95544720 7
Por lo tanto existe heteroscedasticidad 11.22 la tabla 11.9 presenta información acerca de los precios de acciones (Y) y los precios al consumidor (X) expresados en cambios porcentuales anuales para un corte transversal de 20 países a) Grafíquense los datos en un diagrama de dispersión
100 90 80 70 60 50
Serie1
40 30 20 10 0 0
5
10
15
20
25
b) Efectúese la regresión de Y sobre X y examínense los residuos de esta regresión ¿Que se observa? ANOVA Model Regression Residual Total
Sum of Squares 255.145 300.137 555.282
df
Mean Square 1 255.145 18 16.674 19
F
Sig.
15.302
.001
Coefficients Unstandar Standardiz dized ed Coefficient Coefficient s s Model B Std. Error Beta 1 (Constant) 4.508 1.300 PCONSU .705 .180 .678 MI
t
Sig.
3.466 3.912
.003 .001
Los posibles datos atipicos pueden ser los que los siguientes países: Chile, Francia, India, Israel y Japon c) Puesto que los datos en el caso de chile parecen ser atípicos repítase la regresión en b) eliminando la información sobre chile, ahora examínense los residuos de esta regresión ¿Qué se observa? ANOVA Model Regressio n Residual Total
Sum of Squares 18.775
df
218.910 237.685
17 18
1
Mean Square 18.775
F
Sig.
1.458
.244
12.877
Coefficients
Model 1 (Constant)
Unstandardiz ed Coefficients B 10.045
Standardized Coefficients Std. Error 2.483
t
Sig.
Beta 4.045
.001
PCONSU MI
-.704
.583
-.281 -1.207
.244
observamos en el modelo en b) de ser significante, en c) ya no lo es pues pasa de 0.01 a 0.244
d) Si, con base en los resultados obtenidos en b, se concluye que hubo heteroscedasticidad en la varianza del error pero con base en los resultados en c) se modifica esta conclusión, ¿Qué conclusiones generales se obtienen?