Introdu cción cción a la Econometría
X. EFECTO SOBRE LOS ESTIMADORES DE LA VIOLACIÓN DE LAS HIPÓTESIS O SUPUESTOS DEL MODELO DE REGRESIÓN LINEAL: MINIMOS CUADRADOS ORDINARIOS. Como se recordará, este modelo se usa para obtener estimadores contenidos en la ecuación de regresión, considerando que se cumplen ciertos supuestos que sustentan sus propiedades de ser: s er: a).insesgados; b).- eficientes, c).- suficientes y d).- consistentes. Dicho modelo modelo se apoy a, entre otros, en las las siguientes siguientes hip hip ótesis o supuest sup uestos: os: 1.- la varianza de las Ui es constante y por ello se dice que hay homocedasticidad, que viene del griego: homos ( igual ) y cedastitis ( dispersión ) entre los miembros de la serie estadística, razón por la cual tiene t ienenn la varianza mínima mínima,, que a su vez corresponde corresp onde a los los estima est imadores dores que hemos hemos dado en llamar eficientes. 2.- No existe existe autocorrelación entre las perturbaciones, µ i , y 3.- No existe multicolinial idad exp licat licat ivas de la la ecuación de regresión. regresión. idad entre las variables exp 4.- El modelo modelo de regresión regresión esta est a perfec p erfectamente tamente especificad e specificadoo, de manera que no existe ningún Sesgo de especificación (Gujarati,1991:210). Cuando se cumplen estos y otros supuestos ( en mi opinión menos importantes ) se tiene una buena inferencia inferencia estadística est adística y se está est á en condiciones condiciones de hacer hacer una adecuada est estima imación ción y mejores mejores p ruebas de hipótesis. ¿ Pero qué sucede cuando se violan estos supuestos ? definitivamente definitivament e se p ierde calidad calidad en los estimadores y disminuy e el el rigor rigor técnico con que se maneja maneja la información ya que dejan de ser insesgados, eficientes, consistentes y suficientes, afectando la estimación que se hace con la ecuación de regresión y orillando al investigador a la toma equivocada de decisiones decisiones porque las t`s y las F´s cambian cambian de valor, en la forma que se indica indica a continuación: continuación:
X.1 HETEROCEDAS HETEROCEDASTICIDAD TICIDAD Uno de los principales análisis que se realizan sobre la violación de los supuestos en que se basa el método de M CO p ara determinar determinar el valor valor y p or consiguiente consiguiente la cali calidad dad de los estima est imadores, dores, se s e refiere refiere a la verificación, Ho, de si las perturbaciones µ i de la función de regresión poblacional, son o no homocedásticas, ergo, que todas tienen la misma varianza; en otras palabras, es conveniente señalar que hasta el momento hemos establecido el supuesto de homocedasticidad, es decir, que las distorsiones o errores µ i de la ecuación de regresión tienen la misma varianza. Ahora bien, cuando dichos errores no observan una misma varianza se acepta la Ha y se dice que hay heterocedasticidad Pro fes fesor or Genaro Gen aro Sá nch nchez ez Bara Barajas jas
129
Introdu cción cción a la Econometría
o que las µ i son heterocedásticas. En otras palabras los µ i no tiene t ienenn una varianza varianza const ante, que es lo mismo que decir que la varianza del error no es constante para todas las observaciones de la serie histórica a partir de la que se determinó la ecuación de regresión. ¿Qué efecto o consecuencia trae la heterocedasticidad?
• Las estimaciones a y b de mínimos cuadrados son insesgados pero no consistentes ni eficientes, es decir, no p oseen os een varianza mínima, alg algunos datos dat os tienen una varianza varianz a más grande; además el valor del estimador no tiende al del parámetro a medida que crece el tamaño de la muestra, se dice que es inconsistente. $
$
• Las varianz varianzas as estim est imadas adas var ( a ), var ( b ) no son s on insesgadas. insesgadas. Al ser sesg s esgados ados los est imadores imadores de las varianz varianzas, as, invalidan invalidan las pruebas p ruebas de significa significación ción sobre las hipótes hip ótesis is que se establezcan. es tablezcan. $
$
¿Cómo se detecta? Señala Gujarati (1991:275) que no es fácil detectarla, que “ no existen exi sten reglas fijas y seguras s eguras par paraa p or ello ello se han creado creado algunos algunos métodos detectarlo, sino sólo unas cuantas reglas generales”. por informales y de aproximación para detectar la presencia de heterocedásticidad, reglas a las que llama algunos remedios ( o sea que ni siquiera califica o eleva al rango de métodos o técnicas) , , los cuales generalmente examinan los residuos obtenidos de la aplicación de MCO para identificar en ellos patrones sistemáticos. Lo anterior en palabras de Carrascal ( 2001:227): “ no existen reglas fijas para p ara saber si en un modelo modelo existe existe heterocedasticidad; heterocedasticidad; p ues en t odos los contrastes contrast es estadísticos estadíst icos se se plantea p lantea la hipót esis nula de homocedasticidad. homocedasticidad. Ademá Ad emás, s, dado que las p erturbaciones erturbaciones aleatorias aleatorias no son observables, las formas de detección se basan en los errores de la estimación por mínimos cuadrados ordinarios. En concreto, la mayor parte de los contrastes van a utilizar el cuadrado de dichos errores como indicativo de la varianza de cada perturbación o el valor absoluto de dicho error para p ara ap ap roxima roximarr la desviaci desviación ón típ ica.” ica.” Derivado de lo anterior podemos decir que en general se pueden realizar cualesquiera de las siguientes pruebas: p ruebas: 1. Método gráfico 2. Ramsey 3. Glejser 4. Breusch y Pagan Pagan 5. White 6. Goldfeld Goldfeld y Quant 7. Razón de verosimilitades verosimilitades
130
Pro fes fesor or Genaro Gen aro Sá nch nchez ez Baraja Barajas s
Introdu cción cción a la Econometría
o que las µ i son heterocedásticas. En otras palabras los µ i no tiene t ienenn una varianza varianza const ante, que es lo mismo que decir que la varianza del error no es constante para todas las observaciones de la serie histórica a partir de la que se determinó la ecuación de regresión. ¿Qué efecto o consecuencia trae la heterocedasticidad?
• Las estimaciones a y b de mínimos cuadrados son insesgados pero no consistentes ni eficientes, es decir, no p oseen os een varianza mínima, alg algunos datos dat os tienen una varianza varianz a más grande; además el valor del estimador no tiende al del parámetro a medida que crece el tamaño de la muestra, se dice que es inconsistente. $
$
• Las varianz varianzas as estim est imadas adas var ( a ), var ( b ) no son s on insesgadas. insesgadas. Al ser sesg s esgados ados los est imadores imadores de las varianz varianzas, as, invalidan invalidan las pruebas p ruebas de significa significación ción sobre las hipótes hip ótesis is que se establezcan. es tablezcan. $
$
¿Cómo se detecta? Señala Gujarati (1991:275) que no es fácil detectarla, que “ no existen exi sten reglas fijas y seguras s eguras par paraa p or ello ello se han creado creado algunos algunos métodos detectarlo, sino sólo unas cuantas reglas generales”. por informales y de aproximación para detectar la presencia de heterocedásticidad, reglas a las que llama algunos remedios ( o sea que ni siquiera califica o eleva al rango de métodos o técnicas) , , los cuales generalmente examinan los residuos obtenidos de la aplicación de MCO para identificar en ellos patrones sistemáticos. Lo anterior en palabras de Carrascal ( 2001:227): “ no existen reglas fijas para p ara saber si en un modelo modelo existe existe heterocedasticidad; heterocedasticidad; p ues en t odos los contrastes contrast es estadísticos estadíst icos se se plantea p lantea la hipót esis nula de homocedasticidad. homocedasticidad. Ademá Ad emás, s, dado que las p erturbaciones erturbaciones aleatorias aleatorias no son observables, las formas de detección se basan en los errores de la estimación por mínimos cuadrados ordinarios. En concreto, la mayor parte de los contrastes van a utilizar el cuadrado de dichos errores como indicativo de la varianza de cada perturbación o el valor absoluto de dicho error para p ara ap ap roxima roximarr la desviaci desviación ón típ ica.” ica.” Derivado de lo anterior podemos decir que en general se pueden realizar cualesquiera de las siguientes pruebas: p ruebas: 1. Método gráfico 2. Ramsey 3. Glejser 4. Breusch y Pagan Pagan 5. White 6. Goldfeld Goldfeld y Quant 7. Razón de verosimilitades verosimilitades
130
Pro fes fesor or Genaro Gen aro Sá nch nchez ez Baraja Barajas s
Introdu cción cción a la Econometría
Al resp resp ecto sobre el el método gráfic gráfico, o, G.S M addala addala en su obra “Introdu “I ntroducci cción ón a la Econometría; Econometría; Segunda Edición de la Editorial Prentice Hall, capítulo 5, hoja 229, pone un ejemplo sencillo pero ilustrativo a través del cual se identifica la heterocedastidad con el método gráfico. El autor hace función el consumo (y) del ingreso (x). Para ello presenta la información de 20 familias, misma que aparece en la siguiente tabla, cuyo ingreso y consumo se expresa en miles de dólares.
FAMILIA
Y
Yc
X
Y-Yc=Ui RESIDUO
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
19.9 31.2 31.8 12.1 40.7 6.1 38.6 25.5 10.3 38.8 8.0 33.1 33.5 13.1 14.8 21.6 29.3 25.0 17.9 19.8
20.9019921708 29.8952390494 33.7623352071 11.7288803547 38.8884859279 6.42286469639 41.0468651788 24.3194259847 10.1100959166 36.9999040834 8.13158160331 31.8737533626 35.0213897701 13.5275297304 15.5959765125 22.520776609 27.9167247361 26.297940298 17.2147609506 18.9234778576
22.3 32.3 36.6 12.1 42.3 6.2 44.7 26.1 10.3 40.2 8.1 34.5 38.0 14.1 16.4 24.1 30.1 28.3 18.2 20.1
-1.00 1.30 -1.96 0.37 1.81 -0.32 -2.45 1.18 0.19 1.80 -0.13 1.23 -1.52 -0.43 -0.80 -0.92 1.38 -1.30 0.69 0.88
Con estos est os datos d atos y trabajando con el Programa Programa Eviews, Eviews, se s e procede p rocede a crear crear la la base de datos: datos : vamos a “ File File”, luego a New Workfile Wor kfile periodicidad: ponemos de inicio ( start: start: 1 ) y de final (end:12) ok abre abre nuevamente el workfile, hacemos doble clic y se abre el archivo en el que registramos los datos de Y e X, en name le ponemos el nombre del grupo01. También podemos ir a Quick Empty Group (edit series) y registramos los datos de Y e X, luego guardamos con Save. Ahora ya estamos listos para
Pro fes fesor or Genaro Gen aro Sá nch nchez ez Bara Barajas jas
131
Introdu cción cción a la Econometría
hacer análisis economét econométrico. rico. Fijámos Fijámos el cursor curso r en Quick, aparece un cuadro o caja de diálogo, ahí se pulsa p ulsa Estimate equation, se especifica: y_c_x, oprimimos la palabra ok y se obtiene la siguiente ecuación de regresión: Y = 0.847 + 0.899X R 2 = 0.986 (0.703) (0.0253) RSS = 31.074 Para calcular Ui: en el cuadro de la ecuación, está la palabra view, ahí pulsamos el cursor y aparece, entre otros, actual fitted residuals, pedimos actual fitted table, oprimi op rimimos mos el lado lado izquierdo del ratón y parecen los valores originales de Y, los de cada una de las Y´s calculadas con la ecuación de regresión regresión anterior y Ui= Yi-Yc Yi-Yc donde i=1,2,3,…….18,19,20
Con esos datos p rocedemos rocedemos a identificar identificar la heterocedasticidad: heterocedasticidad:
Dependent Variable: Y Method: Least Squares Date: 11/22/04 Tim e: 19:46 Sample: 1901 1920 Included observ observation ation s: 2 0 Varia bl e C X R-s R-squared Adj usted R-squ R-squared ared S.E. of regres regress sion Sum squared resid resid Log li keli hood Durbin-Wats Durbin-Watson on stat
Coeffici ent
Std. Error Error
t-Statistic
Prob.
0.847052 0.899325
0.703355 0.025309
1.204302 35.53360
0.2441 0.0000
0.98594 4 0.9 8516 85 164 4 1.31389 5 31.0737 7 -32.78509 2.58 268 6
Mean depen dent var S.D. de pe nden nd en t var Akaike Akaike info criterion criterion Schwarz Schwarz criterion criterion F-s F-statistic tatistic Prob(F-s Prob(F-stati tati stic)
23.555 00 10 .78 69 1 3.4785 09 3.5780 82 1262.6 37 0.00 000 0
a). Método Gráfico Estando en la pantalla de este archivo, vamos a view, ahí pedimos actual fitted residuals, luego , actual fitted graph, decimos ok, y aparece la gráfica de residuos siguiente
132
Pro fes fesor or Genaro Gen aro Sá nch nchez ez Baraja Barajas s
Introdu cción cción a la Econometría
50 40 30 20 10
2
0
1 0 -1 -2 -3 02
04
06
08
Residual
10
12 Actual
14
16
18
20
Fitted
Ahora vam os a Quick Estimate Estimate Equation; Equation; U- C X, ok y sale la ecuación. ecuación. Ahora vam os a View View Actual, Actual, Fitt Fitted, ed, Residual, Residual, Actual Actual Fitted Fitted Table y sale:
obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Actual 19.9 31.2 31.8 12.1 40.7 6.1 38.6 25.5 10.3 38.8 8 33.1 33.5 13.1 14.8 21.6 29.3
Fi tted 20.9019921708 29.8952390494 33.7623352071 11.7288803547 38.8884859279 6.42286469639 41.0468651788 24.3194259847 10.1100959166 36.9999040834 8.13158160331 31.8737533626 35.0213897701 13.5275297304 15.5959765125 22.520776609 27.9167247361
Resid Residual ual -1.00199217083 -1.00199217083 1.30476095063 -1.96233520714 -1.96233520714 0.371119645276 1.8115140721 -0.322864696388 -0.322864696388 -2.44686517875 -2.44686517875 1.18057401532 0.189904083412 1.80009591659 -0.13158160331 -0.13158160331 1.22624663735 -1.52138977013 -1.52138977013 -0.427529730432 -0.427529730432 -0.795976512495 -0.795976512495 -0.920776608968 -0.920776608968 1.38327526391
Pro fes fesor or Genaro Gen aro Sá nch nchez ez Bara Barajas jas
Resid Residual ual | .* | | . | | * . | | . |* | . | | . *| |* . | | . | | . |* | . | | . *| | . | | *. | | . *| | .* | | .* | | . |
Plot Plo t . * . . . * . . * . . * . * . . . . .*
| | | | | | | | | | | | | | | | |
133
Introducción a la Econometría 18 19 20
25 17.9 19.8
26.297940298 17.2147609506 18.9234778576
-1.29794029795 0.685239049368 0.876522142446
| | |
* . .
| . | * . | *.
| | |
Lo anterior ahora visto en términos de disp ersión de las Ui con respecto a X’s: Continuando con el análisis gráfico ahora sí representamos la relación Xi con Ui vamos a Quick ahí pedimos Graph, aparece la pantalla Series List con Group01, lo borramos y en su lugar ponemos X U, damos ok y aparece Line Graph: seleccionamos Scatter Diagram, ok aparece la siguiente gráfica. 2
1
0 U
-1
-2
-3 0
10
20
30
40
50
X
que es la figura típica que resulta al graficar los valores de los residuos versus los valores de X, ingreso, obteniéndose el diagrama que indica o permite identificar que hay un problema de heterocedastidad, puesto que hay una alta dispersión de Ui a medida que aumenta el valor de X, mismo que debe resolverse para recuperar la bondad estadística de los est imadores. Conviene reiterar, como se estableció antes, que los datos entre paréntesis que acompañan la ecuación de regresión, corresponden a los errores estándar de los coeficientes. Así, a partir de la ecuación de regresión se calcularon los residuos en la forma ya familiar en esta etapa del conocimiento econométrico. Su análisis reveló que dichos residuos ( en valores absolutos ) eran más grandes a medida que crecía el valor de X, ingreso, y pequeños a medida que X tomaba valores pequeños. Esta evidencia le permitió señalar a Maddala que las varianzas de los errores no son las mismas, constantes, y por consiguiente hay heterocedasticidad, de tal manera que los estimadores â y bˆ ya no son eficientes (pero si insesgados) y cuestionan seriamente los resultados a que se llega cuando se hacen p ruebas de significación sobre las hipótesis en materia de regresión y correlación.
134
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
b).- Con la prueba F , estableciendo la Ho: E(Ui2)= σ2 constante, que significa que hay homocedasticidad, misma que contrasta con Ha: E(Ui2) ≠ de σ2 constante, que indica que hay heterocedasticidad y donde i= 1,2,……19,20. ¿Cómo se corrige o resuelve la heterocedastidad? Con:
• La aplicación de la técnica de mínimos cuadrados ponderados; • La deflactación de los datos mediante alguna medida de “tamaño”; • La transformación de los datos en la forma funcional denominada logarítmica. X.1.1 Identificación numérica de la hete rocedasticidad Tomando como referencia los datos anteriores, se corren las regresiones y se establece la hipótesis nula de homocedasticidad y se p rueba que los coeficientes son o no significativos.
X.1.1.1 La prueba de Ramsey Se hace la regresión de uˆt sobre y t 2 , y t 3 ... y la prueba de significación de los coeficientes. Así, dado que existe una sola variable explicativa x, se puede utilizar en lugar de y para identificar la heterocedasticidad. Se hace la regresión de uˆi sobre x i2 , x i3 ... x in . Los resultados fueron: $
$
$
u = − 0.379 + 0.236(10 −2 x 2 $
− 0549 . )(10−4 x 3 )
R 2
= 0034 .
Como ninguno de los coeficientes tuvo una relación t>1, se toma la decisión de aceptar la hipótesis nula, es decir, que no hay heterocedasticidad, además que al ser R2 pequeña indica que no es fuerte la relación entre X, µi, i.e,, no hay heteroscedasticidad..
X.1.1.2 La prueba de White Se hace la regresión de ut sobre todas las variables explicativas, sus cuadrados y sus productos cruzados. Así cuando 2 variables explicativas 1 , 2 , White establece la regresión ut 2 sobre x 1 , x 2 , x12 , x 22 , x1 x 2 . Los valores que se obtuvieron considerando una sola variable explicativa, fueron: $
$
= −1.370 + 0116 . (0.390) (0.0014) u = 0.493 - 0.071x + 0.0037x2 u2 $
$
R 2
= 07911 .
R 2
= 0878 .
Pro fesor Genaro Sá nchez Barajas
135
Introducción a la Econometría
(0.620) (0.055) (0.0011) En los dos casos R 2 es grande y por consiguiente se rechaza la hipótesis nula y se concluye diciendo que hay heterocedasticidad.
X.1.1.3. La prueba de Goldfeld y Quandt Cuando las muestras no son grandes, se recomienda utilizar esta prueba. En este caso los errores obtenidos en el primer ejercicio, se clasifican en dos grupos; el primero comprende los 10 valores pequeños de Ui obtenidos con respecto a x; el segundo, los valores más grandes de Ui. Enseguida se corre la regresión para cada uno de los dos grupos y, con estos datos, se hace la prueba F, mediante la cual se contrasta la hipótesis nula de la igualdad de las varianzas del error. Para hacer más firme la toma de decisiones para aceptar o rechazar la hipótesis de homocedasticidad, Salvatore ( 1993:152) y Gujarati ( 1991:266) recomiendan sacar o quitar algunos datos centrales de la distribución con objeto de “acentuar la diferencia entre el grupo de varianza pequeña y el grupo de varianza grande”. Sin embargo, en este caso no omitiremos ningún dato porque como dice Gujarati mismo: “ la habilidad de la prueba de Goldfeld-Quant para llevar a cabo lo anterior en forma exitosa depende de la manera como se escoja c”, que es el número de datos a omitir. Así, tenemos tenemos que obtener dos grupos de datos: el primero, con los residuos p equeños , el segundo, con los residuos grandes; debemos clasificar esos residuos, para ello usando Eviews: Process Sort Series para Y e X y sus valores aparecen en orden ascendente, ahí luego , sample, doble clic, 1 10 Estimate Equation name: Group01; igual hacemos para Group02, donde sample: 11 20,
Primer Grupo Número de Y1 Valor de Residuo ui observación X1 6 6.1 6.2 -0.32 11 8.0 8.1 -0.13 9 10.3 10.3 0.19 4 12.1 12.1 0.37 14 13.1 14.1 -0.43 15 14.8 16.4 -0.80 19 17.9 18.2 0.69 20 19.8 20.1 0.88 1 19.9 22.3 -1.00 16 21.6 24.1 -0.92 ˆ1 y Y ˆ2 Se estiman estas dos regresiones Y
136
SegundoGrupo Número de Y2 Valor de observación X2 8 25.5 26.1 18 25.0 28.3 17 29.3 30.1 2 31.2 32.3 12 33.1 34.5 3 31.8 36.6 13 33.5 38.0 10 38.8 40.2 5 40.7 42.3 7 38.6 44.7
Pro fesor Genaro Sá nchez Barajas
Residuo ui
1.18 -1.30 1.38 1.30 1.23 -1.96 -1.52 1.80 1.81 -2.45
Introducción a la Econometría
ˆ1 = 1.0533 + 0.876x R 2 = 0.985 Y
;
ˆ2 = 3.279 + 0.835x R 2 = 0.904 Y
(0.616) (0.038) σ=0.689519 σ ˆ 2 = 0.475
(3.443) (0.096) σ=1.775825 σ 2 = 3154 . $
El desglose estadístico de estas dos regresiones es, empezando con Y1 , X1 : Dependent Variabl e: Y1 Method: Least Squares Date: 11/19/04 Ti me: 13:37 Sample(adjusted): 1 10 Included observations: 10 after adjusting endpoints Variabl e C X1 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log li kelihood Durbin-Watson stat
Coeffici ent
Std. Error
t-Statistic
Prob.
1.053316 0.876016
0.616164 0.037939
1.709474 23.09013
0.1257 0.0000
0.985217 0.983369 0.689519 3.803487 -9.356051 1.745354
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-stati stic)
14.36000 5.346692 2.271210 2.331727 533.1539 0.000000
Significado S.E. of Regressión= σ YX que antes usamos; es distinto de Std. Error que suele ser menor porque corresponde a cada parámetro muestral. De igual manera para Y2, X2 Dependent Variabl e: Y2 Method: Least Squares Date: 11/19/04 Ti me: 21:27 Sample(adjusted): 1 10 Included observations: 10 after adjusting endpoints Variabl e C X2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log li kelihood Durbin-Watson stat
Coeffici ent
Std. Error
t-Statistic
Prob.
3.278963 0.834637
3.443383 0.096213
0.952250 8.674885
0.3689 0.0000
0.903908 0.891897 1.775825 25.22845 -18.81632 2.051248
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-stati stic)
32.75000 5.401080 4.163264 4.223781 75.25363 0.000024
Con los dos S.E. of regresión calculamos las dos varianzas y F:
Pro fesor Genaro Sá nchez Barajas
137
Introducción a la Econometría
Se calcula F =
3154 . = 6.64 Varianza de residuos pequeñ os 0475 . Varianza de residuos randes
=
Para calcular los grados de libertad, gl, de la F téorica Salvatore( 1993:152) y Gujarati (1991:266) señalan que los grados de libertad tanto para el numerador como para el denominador se calculan con la fórmula: n-d- 2k/2, donde n= número de observaciones= 20, d= número de observaciones omitidas, en este caso ninguna, luego d=0, k= número de p arámetros= 2 en cada grupo, luego tanto p ara el numerador como para el denominador gl= 20-0 -2(2)/2= 20-4/2= 8 gl Así, la F teórica se obtiene en tablas para α = 1% con 8 y 8 grados de libertad, y es Fα = 6.03 < F = 6.64, por lo que se rechaza la hipótesis de homocedasticidad y se acepta que hay un problema de heterocedasticidad. Gráficamente
Zona de rechazo de Ho:
Zona de aceptación de H o:
F α=6.03
X.1.2
S olución al problema de hete rocedasticidad
X.1.2.1 Transformación de los datos en logaritmos, usando una forma funcional doble logarítmica. En ocasiones se resuelve haciendo la regresión en forma doble logarítmica lineal. Así usando los 20 datos originales y convirtiéndolos en logaritmos: usando Eviews vamos a Quick Generate Series enter equation, ponemos lx=log(x); también ly=log(Y) y aparece la siguiente tabla:
obs
138
LX
LY
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
3.10458667847 3.47506723023 3.60004824041 2.4932054526 3.74478708605 1.82454929205 3.79997350162 3.26193531433 2.33214389524 3.69386699562 2.09186406168 3.54095932404 3.63758615973 2.64617479738 2.79728133483 3.1822118405 3.40452517175 3.34286180465 2.90142159408 3.00071981507
2.99071973173 3.44041809482 3.45946628979 2.4932054526 3.70622809245 1.80828877118 3.65325227647 3.23867845216 2.33214389524 3.65842024663 2.07944154168 3.49953328238 3.51154543883 2.57261223021 2.69462718077 3.07269331469 3.37758751602 3.21887582487 2.88480071285 2.9856819377
Vamos a Quick: Estímate Equation: LY C LX, ok Se corre la regresión y se obtiene: Log y = 0.0757 + 0.9562 log x R 2 =0.9935 (0.0574) (0.0183) RSS = 0.03757 Dependent Variabl e: LY Method: Least Squares Date: 11/19/04 Ti me: 22:01 Sample: 1 20 Included observations: 20 Variabl e
Coeffici ent
Std. Error
t-Statistic
Prob.
0.075672 0.956186
0.057393 0.018255
1.318496 52.38022
0.2039 0.0000
R-squared Adjusted R-squared S.E. of regression
0.993482 0.993120 0.045689
Sum squared resid
0.037575
Log li keli hood Durbin-Watson stat
34.39278 2.166013
Mean dependent var 3.033911 S.D. dependent var 0.550836 Akaike info criterion 3.239278 Schwarz criterion 3.139705 F-statistic 2743.688 Prob(F-stati stic) 0.000000
C LX
Pro fesor Genaro Sá nchez Barajas
139
Introducción a la Econometría
Para calcular los residuos con Eviews se estima la regresión, en el menú de View, seleccionar Actual, Fitted, Residual, después nos vamos a Actual Fitted, Table:
Observación: en la gráfica de la tabla, última columna, no aparecen unidos los puntos, pero si en la pantalla del monitor. Enseguida clasificamos las Ui en función de X, en los dos siguientes grupos:
Número de observación 6 140
Log Y1 calculada 1.8
Log de x1 1.82
Residuo Número de Log Y2 ui observación calculada -0.12 8 3.24
Pro fesor Genaro Sá nchez Barajas
Log de x2 Residuo ui
3.26
0.44
Introducción a la Econometría
11 9 4 14 15 19 20 1 16
2.08 2.33 2.49 2.57 2.69 2.88 2.99 2.99 3.07
2.09 2.33 2.49 2.65 2.80 2.90 3.00 3.20 3.18
0.04 0.27 0.34 -0.33 -0.56 0.35 0.41 -0.54 -0.46
18 17 2 12 3 13 10 5 7
3.22 3.38 3.44 3.5 3.46 3.51 3.66 3.7 3.65
3.34 3.40 3.48 3.54 3.60 3.64 3.69 3.74 3.80
-0.53 0.47 0.42 0.38 -0.59 -0.42 0.51 0.50 -0.56
Una vez calculados los residuos de los dos grupos se corren sus dos regresiones y se obtiene, para el primero: Quick, Estimate Equation: LY- C- LX1, ok Dependent Variabl e: LY1 Method: Least Squares Date: 11/22/04 Ti me: 20:33 Sample(adjusted): 1 10 Included observations: 10 after adjusting endpoints Variabl e
Coeffici ent
Std. Error
t-Statistic
Prob.
0.122770 0.935596
0.083001 0.031083
1.479135 30.09966
0.1774 0.0000
R-squared Adjusted R-squared S.E. of regression
0.991247 0.990153 0.041927
Sum squared resid
0.014063
Log li keli hood Durbin-Watson stat
18.64455 1.786700
Mean dependent var 2.589000 S.D. dependent var 0.422518 Akaike info criterion 3.328910 Schwarz criterion 3.268393 F-statistic 905.9898 Prob(F-stati stic) 0.000000
C LX1
Y para el segundo grupo: Quick Estimate Equation: LY2 –C- LX2, , ok Dependent Variabl e: LY2 Method: Least Squares Date: 11/22/04 Ti me: 20:58 Sample(adjusted): 1 10 Included observations: 10 after adjusting endpoints Variabl e C LX2 R-squared Adjusted R-squared S.E. of regression
Coeffici ent
Std. Error
t-Statistic
Prob.
0.320335 0.889170
0.358071 0.100780
0.894614 8.822901
0.3971 0.0000
0.906807 0.895158 0.053754
Mean dependent var 3.476000 S.D. dependent var 0.166012 Akaike info criterion 2.831958
Pro fesor Genaro Sá nchez Barajas
141
Introducción a la Econometría Sum squared resid
0.023116
Schwarz criterion
Log li keli hood Durbin-Watson stat
16.15979 2.189455
F-statistic Prob(F-stati stic)
2.771441 77.84358 0.000021
Se dice que hay una solución porque se observa que no hay un aumento significativo en el valor de los residuos ( ui ) a medida que crecen los valores de x, es decir, se reduce la heterocedasticidad en las varianzas del error.
X.1.2.2 Aplicación de F De las dos regresiones anteriores t enemos: con los cálculos de M addala: Grupo 1 log y = 0.122 + 0.936x R 2 = 0.991; (0.083) (0.031) σ=0.041927 2 σ = 0.001596 $
Grupo 2 log y = 0.320 + 0.889x R 2 = 0.907 (0.358) (0.100) σ=0.053754 σ 2 = 0.002789 $
0002789 . = 175 . ; Como F α = 344 . para α = 5% y con α= 1% tenemos F téorica= 6.03 0001596 . con 8 y 8 grados de libertad. En los dos casos vemos que no se rechaza la hipótesis de homocedasticidad; se dice que desapareció la heterocedasticidad, que los estimadores ahora son insesgados y eficientes y ratifican los motivos por los cuales en el capítulo IX se prefirió esta forma funcional. Así, F =
En resumen, se debe señalar que es conveniente detectar si existe o no heterocedasticidad, ya que de identificarse este problema, ello ocasiona que: a) Los estimadores de mínimos cuadrados sean ineficientes, aun cuando siguen siendo insesgados; es decir, cuando son ineficientes tienen una varianza más grande. b) Los estimadores de las varianzas son sesgados. Ello nulifica (mejor dicho, altera los resultados de) las pruebas de significación que se realizan p ara probar la bondad de los estimadores. c) Se relaja el supuesto de que la varianza del término de error ( ui ) es constante.
X.2
AUTOCORRELACION
Si hablamos en términos de la hipótesis nula, ésta se establece diciendo que los términos de error (ui ) en el modelo de regresión son independientes, es decir: Ho: r=0, no hay correlación.
142
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Lo contrario, es decir la hipótesis alternativa es el relajamiento de este supuesto (hipótesis nula), es decir Ha: r distinto de cero, donde r es el coeficiente de correlación entre las µi, lo cual indica que dichos términos de error, son dependientes unos de otros. Lo anterior significa que hay relación entre ellos, que están correlacionadas, mismas que vistos en función de las SERIES DE TIEMPO, revelan que hay AUTOCORRELACION entre ellas. Ejemplo, si analizamos el ingreso de las personas en varios años, el ingreso del año uno influye en el ingreso del año dos, este en el del año tres, y así sucesivamente, esto origina una autocorrelación en el tiempo.
X.2.1 Identificación de autocorrelación se hace con la r y la estadística de Durbin-Watson. a). Aquí como en la heterocedasticidad se usa r, cuando su valor es alto: cercano a más uno o a menos uno, se dice que hay autocorrelación. b). Prueba de Durbin y Watson Como el término de error ( ut ) de un año está autocorrelacionado con el del año inmediato anterior ( ut −1 ), Durbin y Watson elaboraron la estadística “d”, que sirve para detectar la autocorrelación y se determina con la fórmula: n
∑(u − u − ) $
d =
2
t
n
$
t
∑u
2
1
2 t
$
1
en la que ut se define como el residuo estimado para el período o año t. $
Si desarrollamos el cuadrado de la fórmula de d, obtenemos 2 2 ∑ + Σ u u t t −1− 2Σ u ˆ ˆt uˆt −1 d = ∑uˆ 2
t
Tomando en cuanta que cuando la muestra es grande se observa que ∑ ut y 2
$
∑u
2 t −1
$
son casi iguales
ya que difieren en una observación, tal que podemos decir 1+1= 2; en otras p alabras ambas sumatorias son iguales, y si factorizamos tenemos que d= 2( 1- la segunda parte del desarrollo), dividida entre el denominador que ahí aparece; luego, si decimos que r representa la autocorrelación entre ellos, es decir que r representa la segunda y última parte de la ecuación, entonces podemos establecer que la fórmula se puede expresar como: d ≅ 2( 1 - r )
Pro fesor Genaro Sá nchez Barajas
143
Introducción a la Econometría
Ahora bien, puesto que sabemos que r oscila entre –1 y +1, con desigualdades podemos decir lo siguiente: -1 ≤ r ≤ + 1 Derivado de lo anterior, podemos establecer las siguientes igualdades: cuando r = + 1, se dice que d = 0; hay autocorrelación positiva; cuando r = -1, se dice que d = 4; hay autocorrelación negativa; y cuando r = 0, se dice que d = 2; no hay autocorrelación. Por consiguiente cuando d tenga valores cercanos a 0 o 4, diremos que los residuos están altamente correlacionados. Es importante decir que la distribución muestral de d depende del valor de las variables explicativas. Durbin y Watson calcularon los valores de los limites superior ( u ) e inferior ( L ) para diferentes niveles de significación de d. Estos valores están en tablas mediante las cuales se prueban hipótesis nulas: autocorrelación cero versus las hipótesis alternativas: autocorrelación positiva de primer orden ( entre ut y ut −1 ); cuando la autocorrelación es negativa se intercambian u y L . Luego si:
d < d L , se rechaza la hipótesis nula de no autocorrelación, hay autocorrelación, debe corregirse. d > d u , no se rechaza la hipótesis nula de independencia, no se hace nada. d L < d < d u , la prueba no es concluyente, es decir no sabemos si los términos de error u i están autocorrelacionados o son independientes. Lo anterior dicho en palabras de Dominick Salvatore(9) : (“Econometría” Editorial Mc Graw Hill, página 153). S i d < d L , se acepta la hipótesis de autocorrelación, Ha: r ≠ 0 y se rechaza Ho: r=0 d > d u , se rechaza la hipótesis de autocorrelación, Ha: r ≠ 0 y se acepta Ho: r=0 Para probar la Ho se compara la d calculada con la d en tablas partiendo de que está demostrado que la esperanza matemática de d, cuando r = 0, está dada por la fórmula: E(d) = 2 +
2(k − 1) n − k
K es igual al número de parámetros de regresión estimados (se incluye el término constante). Dominick Salvatore(9) dice que k = número de variables explicativas + 1 ( término constante ), ver Anexo.5 en el anexo de todas las tablas estadísticas, y si n es el tamaño de la muestra, vamos a A.5 y ´1 encontramos k , que necesitamos para obtener diferentes valores de d. Con estos datos se buscan
144
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
en la tabla de Durbin Watson los valores d L y d u y se comparan con la d calculada para identificar si hay o no autocorrelación entre los residuos.
Ejemplo del uso de la prueba de Durbin, Watson: G. S. Maddala corre la ecuación logarítmica lineal para explicar la p roducción (x) en función de los insumos de capital K y trabajo (L) en Estados Unidos. (p ágina 114 de obra citada) y halla: Log X = -3.938 – 1.451 log L1 + 0.384 log K 1 (0.237) (0.083) (0.048) R 2 = 0.9946 ; DW = 0.88 r=0.559= coeficiente de autocorelación, que enseguida usamos para eliminar la autocorrelación. Con K 1 = k-1 = 3 – 1= 2 y n = 39 con α = 5% se halla en tablas d L = 1.38. Puesto que la d = 0.88 < d L = 1.38, se rechaza la hipótesis nula de no autocorrelación, en otras palabras se rechaza la hipótesis nula de r = 0 con α = 5%. Ello significa que hay autocorrelación positiva de primer orden entre los residuos de mínimos cuadrados, ergo no son independientes u t y u t −1 entre si. La existencia de autocorrelación también se ratifica con el alto valor que toma R 2 = 0.9946
X.2.2 Consecuencia de la autocorrelación Como indica Dominick Salvatore(9) , la presencia de autocorrelación es común en “Series de Tiempo y lleva a errores estándar sesgados hacia abajo (y así a pruebas estadísticas e intervalos de confianza incorrectos)”. Gujarati (1991: 298) por su parte dice que “ aun cuando los estimadores MCO continuan siendo lineales, insesgados y consistentes, pero dejan de ser eficientes”, situación que provoca las mismas consecuencias que Salvatore señaló.
X.2.3 Corrección de autocorrelación a) Dominick Salvatore (*) dice que para corregir la autocorrelación se debe estimar r, por ser el indicador de la autocorrelación serial. Así se determina a partir de d= 2(1-r); despejando obtenemos r=2-d/2, de manera que cuando d=0.88,vemos que r= 20.88/2=1.12/2=0.56, valor a utilizar para reducir o eliminar la autocorelación. Así, según el valor que tome r será la reducción o eliminación de la autocorrelación (Gujarati,1991:323). b) El mismo autor Gujarati ( 1991: 330) comenta que Theil y Nagar sugieren que en muestras pequeñas r se debe estimar con la fórmula: Pro fesor Genaro Sá nchez Barajas
145
Introducción a la Econometría
r =
N 2 (1 − d / 2) + k 2 2
− k 2
En que: N: Número total de observaciones d=d de Durbin Watson K= Número de coeficientes a estimar Luego, en el ejemplo anterior calculamos r con las dos fórmulas y obtenemos el mismo resultado: r = 0.56,
•
•
r = 1 −
d
2 Maddala. r =
= 1−
0.88 = 1 − 0.44 = 0.56 , valor igual al mostrado inicialmente por 2
N 2 (1 − d / 2) + k 2
= − k 2 (39)2 (0.56) + (3)2 1521(0.56) + 9 851 + 9 860 = = = = = 0.5665 (39) 2 − 32 1521 − 9 1512 1512 2
Una vez conocido r se p uede corregir la autocorrelación partiendo del siguiente razonamiento: De acuerdo con Gujarati ( 1991:317) si, denominamos como ecuación #1, Y t = β 1 + β 2 X t + µ t Si #1 se cumple en el periodo t, se cumple también en el período t-1, p or tanto La ecuación #2: Y t −1 = β 1 + β 2 X t −1 + µ t −1 ahora multiplicando la ecuación #2 por (nuestra r) en ambos lados de la ecuación, obtenemos la ecuación #3: ρ Y t −1 = ρβ 1 + ρβ 2 X t −1 + ρµ t −1 .
Ahora restando la ecuación #3 de la #1 obtenemos: la ecuación #4: (Y t − ρ Y t −1 ) = β 1 (1 − ρ ) + β 2 X t − ρβ 2 X t −1 + ( µ t − ρµ t −1 ) = β 1(1 − ρ ) + β 2 ( X t − ρ X t −1) + ε t donde se usó un esquema autorregresivo de primer orden µ i = ρµ t −1 + ε t Y t * = β 1* + β 2* X t * + ε t , de manera que ahora podemos expresar la ecuación anterior como la siguiente ecuación #5 Y 1* = β 1* + β 2* X t * + ε t donde β 1* = β 1 (1 − ρ ),Y t * = (Y t − ρ Y t −1 ) y X t * = ( X t − ρ X t −1 ) , que nos da la pauta para los cálculos que se muestran a continuación. Señala Gujarati que para no perder la primera observación en el proceso de diferenciación, se 2 ˆ para la primera observación transformada de Y y X, x1 1 r respectivamente. Así, en el caso de que r ˆ ≈ 1, la autocorrelación puede corregirse volviendo a
utilizan
2 y1 1 r ˆ
y
calcular la regresión en forma de diferencia y omitiendo el término de la ordenada en el origen. LogX *
= log X − 0.5665 log X t −1
146
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
= log L − 0.5665 log Lt −1 logY (con asterisco)=logY-0.5665logY del año anterior logB del presente año(con asterisco)=logB del presente año-logB del año anterior
LogL*
Así, también: LogK *
= log K − 0.5665 log K t −1
En seguida se estimará la nueva ecuación de regresión y es seguro que se obtendrá una d con valor distinto a 0.88, que al compararse con du y dL (valores teóricos) se aceptará Ho: es decir que ya no hay autocorrelación. X.2.3.1 Ejemplo numé rico para corregir la autocorrelación a) D. Salvatore.
D. Salvatore presenta el nivel de inventarios, Y, y ventas X, los dos en miles de millones de dólares para la industria de manufacturas de los E.E. U.U., del año 1959 al de 1978. Hace la regresión de Y con X con los siguientes datos: Año
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
Y
52.9
53.8
54.9
58.2
60.0
63.4
68.2
78.0
84.7
90.6
98.2
101.7
102.7
108.3
124.7
157.9
158.2
170.2
180.0
198.0
X
30.3
30.9
30.9
33.4
35.1
37.3
41.0
44.9
46.5
50.3
53.5
52.8
55.9
63.0
73.0
84.8
86.6
98.8
110.8
124.7
R 2 = 0.98
Obtiene yt = 6.61 + 1.63 x t
(1.98) (32.0) d = 0.69 (3.33) (0.05) hecho con Eviews Que en detalle es : Dependent Variabl e: Y Method: Least Squares Date: 11/22/04 Ti me: 21:13 Sample(adjusted): 1959 1978 Included observations: 20 after adjusting endpoints Variabl e C X R-squared Adjusted R-squared S.E. of regression Sum squared resid Log li kelihood Durbin-Watson stat
Coeffici ent
Std. Error
t-Statistic
Prob.
6.608085 1.631438
3.329150 0.050975
1.984917 32.00487
0.0626 0.0000
0.982731 0.981771 6.275390 708.8494 -64.05788 0.696772
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
Pro fesor Genaro Sá nchez Barajas
103.2300 46.47964 6.605788 6.705361 1024.312 0.000000
147
Introducción a la Econometría
Dado que con n = 20 y K 1 =2-1= 1 y α = 5%
L
= 1.20 tenemos que d = 0.70 <
L
= 1. 20 se
acepta la hipótesis de autocorrelación. Así, para corregir la autocorrelación, se dice que una estimación de r esta dada por r= 2-d/2 = 2-0.70/2= 1.30/2=0.65 Con la otra fórmula se obtiene r= 0.67 Si usamos r=0.67 para transformar las variables originales y utilizando el dato del año de 1959 : 52.9
1 − ( 0 . 67 )
2
=
39.27
y
del
mismo
año
el
valor
de
las
ventas,
2
30.3 1 − (0.67) = 22.49 para la primera observación transformado de Y y X, respectivamente. Para el resto de los valores transformados de Y e X se calcula de la siguiente manera: Puesto que con r= 0.67 obtenemos r cuadrada= 0.4489, entonces usamos y1 1
2
ˆ r
para el primer dato de Y, que corresponde a 1959, y p ara no desecharlo
= Y 1 1 − r 2 = 52.9 .5511 = 52.9(74) = 39.27 p ara el primer término de Y Y 2* = Y 2 − rY 1 = 53.8 − 0.67(52.9) = 53.8 − 35.44 = 18.36 para el segundo y subsecuentes Y´s, ver ecuaciones Y 3* = Y 3 − rY 2 = 54.9 − 0.67(53.8) = 18.85 Y 4* = Y 4 − rY 3 = 58.2 − 0.67(54.9) = 21.41 Y 5* = Y 5 − rY 4 = 60.0 − 0.67 (58.2) = 21.01 Y 6* = Y 6 − rY 5 = 63.4 − 0.67( 60.0) = 23.20 Y 7* = Y 7 − rY 6 = 68.2 − 0.67(63.4) = 25.72 Y 8* = Y 8 − rY 7 = 78.0 − 0.67( 68.2) = 32.31 Y 9* = Y 9 − rY 8 = 84.7 − 0.67(78.0) = 32.44 Y 10* = Y 10 − rY 9 = 90.6 − 0.67(84.7) = 33.85 Y 11* = Y 11 − rY 10 = 98.2 − 0.67(90.6) = 37.50 Y 12* = Y 12 − rY 11 = 101.7 − 0.67(98.2) = 35.91 Y 13* = Y 13 − rY 12 = 102.7 − 0.67(101.7) = 34.56 Y 14* = Y 14 − rY 13 = 108.3 − 0.67 (102.7) = 39.49 Y 15* = Y 15 − rY 14 = 124.7 − 0.67(108.3) = 52.14 Y 16* = Y 16 − rY 15 = 157.9 − 0.67(124.7) = 74.35 Y 17* = Y 17 − rY 16 = 158.2 − 0.67(157.9) = 52.41 Y 18* = Y 18 − rY 17 = 170.2 − 0.67(158.2) = 64.21 Y 19* = Y 19 − rY 18 = 180.0 − 0.67(170.2) = 65.97 Y 20* = Y 20 − rY 19 = 198.0 − 0.67(180.0) = 77.40 Y 1*
148
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Hacemos lo mismo para la transformación de las X´s con r=0.67 y r cuadrada=0.4489 usamos x1 1
2
ˆ para el primer dato de X, que corresponde a 1959, y para no desecharlo r
= X 1 1 − r 2 = 30.3 1 − 0.4489 = 30.3 0.5511 = 30.3(0.74) = 22.49 para el primer término de X X 2* = X 2 − rX 1 = 30.9 − 0.67(30.3) = 10.60 ;para el segundo y subsecuentes X´s, seguir ecuaciones X 3* = X 3 − rX 2 = 30.9 − 0.67(30.9) = 10.20 X 4* = X 4 − rX 3 = 33.4 − 0.67(30.9) = 12.70 X 5* = X 5 − rX 4 = 35.1 − 0.67(33.4) = 12.72 X 6* = X 6 − rX 5 = 37.3 − 0.67 (35.1) = 13.78 X 7* = X 7 − rX 6 = 41.0 − 0.67(37.3) = 16.00 X 8* = X 8 − rX 7 = 44.9 − 0.67( 41.0) = 17.43 X 9* = X 9 − rX 8 = 46.5 − 0.67(44.9) = 16.42 * X 10 = X 10 − rX 9 = 50.3 − 0.67(46.5) = 19.15 * X 11 = X 11 − rX 10 = 53.5 − 0.67(50.3) = 19.80 * X 12 = X 12 − rX 11 = 52.8 − 0.67 (53.5) = 16.96 * = X 13 − rX 12 = 55.9 − 0.67(52.8) = 20.52 X 13 * = X 14 − rX 13 = 63.0 − 0.67(55.9) = 25.55 X 14 * = X 15 − rX 14 = 73.0 − 0.67(63.0) = 30.79 X 15 * = X 16 − rX 15 = 84.0 − 0.67(73.0) = 35.89 X 16 * = X 17 − rX 16 = 86.6 − 0.67(84.8) = 29.78 X 17 * = X 18 − rX 17 = 98.8 − 0.67(86.6) = 40.78 X 18 * = X 19 − rX 18 = 110.8 − 0.67(98.8) = 44.60 X 19 * = X 20 − rX 19 = 124.7 − 0.67(110.8) = 50.46 X 20 X 1*
Con los datos nuevos, transformados de Y e X, a partir de r, ahora corremos nuevamente la regresión sobre las variables transformadas (que identificaremos con *), sin omitir los datos de 1959, y se obtienen: *
* y = 4.65 +1.52 x
R 2 = 0.94
t
t
(2.42) (0.08)
d = 1.32
De manera detallada: Dependent Variable: YCALC Method: Least Squares Date: 11/20/04 Ti me: 14:32 Sample: 1959 1978 Included observations: 20 Variabl e
Coefficient
Std. Error
t-Statistic
Pro fesor Genaro Sá nchez Barajas
Prob.
149
Introducción a la Econometría C XCALC R-squared Adjusted R-squared S.E. of regression Sum squared resid Log li kelihood Durbin-Watson stat
4.656444 1.526495
2.423902 0.089229
1.921053 17.10764
0.942061 0.938842 4.746834 405.5838 -58.47472 1.327927
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-stati stic)
0.0707 0.0000 41.93650 19.19455 6.047472 6.147046 292.6714 0.000000
Vemos en la tabla de Durbin y Watson que con α = 5%, n = 20 y K 1 = 1 se obtiene dU = 1.41 y dL=1.20. Por consiguiente decimos que d = 1.32, esta entre estos dos valores anteriores, lo cual significa que la autocorrelación esta indefinida. Por otra parte, es interesante señalar que cuando omitimos los datos de Y e X del primer año, 1959, al correr la ecuación de regresión se obtiene el siguiente valor de d cuyas “estadísticas” no difieren sustancialmente de la anterior.
Dependent Variable: YTRNSF Method: Least Squares Date: 11/21/04 Ti me: 09:21 Sample(adjusted): 1960 1978 Included observations: 19 after adjusting endpoints Variabl e
Coefficient
Std. Error
t-Statistic
Prob.
C XTRNSF
4.526473 1.519796
2.479092 0.094774
1.825859 16.03594
0.0855 0.0000
0.937990 0.934343 4.849969 399.8774 -55.90366 1.335496
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-stati stic)
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log li kelihood Durbin-Watson stat
40.05211 18.92771 6.095122 6.194537 257.1515 0.000000
b) Ejemplo de Gujarati . A manera de comparación y de ilustración de los diversos métodos recién analizados, adicionalmente considérese el ejemplo siguiente elaborado p or Gujarati ( 1990:323). (Véase la siguiente tabla ) Tabla con los datos originales Relación entre el índice de vacantes (IV) y la tasa de desempleo (U)
150
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría Año y trimestre IV 1957-1959=100 1962 1 104.66 1962 2 103.53 1962 3 97.30 1962 4 95.96 1963 1 98.83 1963 2 97.23 1963 3 99.06 1963 4 113.66 1964 1 117.00 1964 2 119.66 1964 3 124.33 1964 4 133.00 1965 1 143.33 2 144.66 1965 1965 3 152.33 178.33 1965 4 1966 1 192.00 186.00 1966 2 1966 3 188.00 4 193.33 1966 1967 1 187.66 175.33 1967 2 1967 3 178.00 187.66 1967 4 Fuente: Dam odar Guja rati, « fhe Relation between He lp-Wanted Index Quarterly Review of Economics and Business, vol. 8,1968, pp. 67-73.
U% 5.63 5.46 5.63 .5.60 5.83 5.76 5.56 5.63 5.46 5.26 5.06 5.06 4.83 4.73 4.46 4.20 3.83 3.90 3.86 3.70 3.66 3.83 3.93 3.96
and the Unem ploym ent Rate: A Statistical Analy sis, 1962-1967» , The
El modelo de regresión seleccionado para la investigación empírica fue ln IV t = β 1 + β 2ln Ut + υt donde IV es el índice de vacantes y U la tasa de desempleo1. A priori, se espera que β 2 sea negativo. (¿Por qué?) Suponiendo que se cumplen todos los supuestos MCO, se puede escribir la regresión estimada como: lnVI =
7.3084 - 1.537510 lnUt (0.1110) (0.0711) N = 24 t = (65.825) (-21.612) r 2 = 0.9550 d = 0.9021 De la regresión estimada, se observa que el d de Durbin-Watson indica la presencia de correlación serial positiva, Para 24 observaciones y 1 variable explicativa, la tabla Durbin-Watson al 5% muestra que d L = 1.27 Y d u = 1.45 Y el d estimado es de 0.9021 y está p or debajo del límite crítico.' Puesto que la regresión arriba citada está contaminada de correlación serial, no se puede confiar en los errores estándar estimados y en las razones t por los argumentos ya anotados. Por consiguiente, es necesario aplicar medidas remediales. El remedio, por supuesto, depende de que p (coeficiente de 1
Por el momento, no debe preocupar el problema de simultaneidad, es decir si U ocasiona el IV o viceversa. Pro fesor Genaro Sá nchez Barajas
151
Introducción a la Econometría correlación) pueda ser estimado mediante uno o más de los métodos ya analizados. Para nuestro ejemplo ilustrativo el p estimado a partir de los diversos métodos es el siguiente:
Método utilizado d de Durban-Watson d de Theil-Nagar Cochrane-Orcutt
Iteración I Iteración II Iteración III Iteración IV Iteración V Dos etapas, de Durban
P 0.5490 0.5598 0.54571 0.57223 0.57836 0.57999 0.58040 0.7952
Comentario Véase (12.6.12) Véase ejercicio 12.6
Como puede ver el lector, el d de Durbin-Watson, el d modificado de Theil-Nagar, el paso l del procedimiento de dos etapas de Cochrane-Orcutt y el p rocedimiento iterativo de Cochrane-Orcutt todos producen estimaciones de p que son bastante similares; pero la obtenida de Durbin, dos etapas, es bastante diferente2. La p regunta práctica es entonces: ¿Cuál método de estimación de p se debe seleccionar en la práctica? Se dará respuesta a esta pregunta en breve. Por el momento, se continuará con nuestro ejemplo y se ilustrará la forma de estimar la ecuación en diferencia generalizada (o estimación MCG factible) utilizando uno de estos P. Se utiliza la aproximación de d en muestras pequeñas de Theil-Nagar. Utilizando la fórmula dada en el ejercicio dos hojas atrás, se obtiene ρ ˆ = 0.5598. Con esta estimación, se transforma la información de la siguiente manera:
= ln IV t − 0.5554 ln IV t −1 InU t * = InU t − 0.5554inU t −1 InIV t *
Es decir, se resta 0.5554 veces el valor anterior de la variable de su valor actual. Puesto que la primera observación no tiene un valor precedente, se tienen dos opciones: (1) eliminarla del análisis, o (2) incluirla mediante la transformación de Prais-Winsten, la cual, en el presente caso, se convierte en 2
Puede haber una razón técnica para esta diferencia. Si se examina (12.6.19) cuidadosamente, se verá que hay dos estimaciones de p, una obtenida directamente del valor rezagado de Y y otra obtenida al dividir el coeficiente del valor rezagado de X por el coeficiente de X. No hay garantía de que las dos estimaciones sean idénticas. El problema real aquí es que (12.6.19) es intrínsecamente un modelo de regresión no lIneal (en parámetros) y debe ser estimado mediante procedimientos de estimación de regresión no lIneal, que están por fuera del alcance de este lIbro.
152
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
1 − (0.5554 )2 • InIV 1 y
1 − (0.5554 )2 • InU 1 . Se presentan los resultados en las dos formas.
Omitiendo la primera observación ln IV t * = 3.1284- 1.4672 In U *t ee = (0.0886) (0.1328) t = (35.326) (-11.045)
N = 23 r 2 = 0.9685 d=1.77
donde las variables con asterisco son las t ransformadas. como se indicó anteriormente. Obsérvese que 3.1284 = β ˆ1 (1 − ρ ˆ ) = β ˆ1 (1 − 0.5554) de donde se obtiene β ˆ1 = 7.3084. que es comparable con el β ˆ1 de la regresión original (12.7.1).
Incluyendo la primera observación (transformación Prais- Winsten)339 ln IV t * = 3.1361 - 1.4800 In U *t ee = (0.0813) (0.1198) t = (38.583) (-12.351)
N = 24 r 2 = 0.9684 d = 1.83
(12.7.3)
Comparando la regresión original (contaminada de autocorrelación) con la regresión transformada y la regresión Prais-Winsten se observa que los resultados son generalmente comparables4. La pregunta práctica es: ¿se ha resuelto el p roblema de autocorrelación? Si se t oman los valores Durbin-Watson estimados report ados por sus valores observados, parecería que ya no hay autocorrelación de (primer orden) (¿Por qué?) Sin embargo, como lo anota Kenneth White en su SHAZAM (p.86).las tablas de Durbin-Watson pueden no ser apropiadas para probar la presencia de correlación serial en la información, que y a ha sido ajustada por autocorrelación. Por consiguiente, se p uede utilizar una de las pruebas no paramétricas analizada anteriormente. Para la regresión original puede demostrarse que con base en la prueba de rachas, no se p uede rechazar la hipótesis de que no hay correlación serial en los residuales de esa regresión. (Véase ejercicio 12.20). Para la regresión Prais-Winsten (12.7.3) puede también demostrarse que los residuales estimados de esa regresión están libres del problema de correlación serial. (Verífiquese esto explícitamente. Como información. hay 11 residuales p ositivos. 13 residuales negativos y el número de rachas es 12. Si se desea probar hipótesis sobre los parámetros. se puede proceder en la forma usual. Pero 3
Un punto técnico: El término de intercepto en la regresi ón Prais-Winsten es alg o complicado. Como resultado, se debe efectuar esta regr esión a través del origen. El término de intercepto reportado en (12.7.3) no ha sido mezclado. Para mayores detalles, véase Kenneth J. White y Linda T.M. Bui, Computer Handhook Using SHAZAM, McGraw-Hill, New York, 1985, p. 86. Para detalles teóricos, véase Jan Kmenta. Elements o/ Econometrics, 2a. ed., Macmillan, New York, 1986. pp. 303-305. 4 Pero recuérdese que en muestras pequeñas. los resultados podrían ser sensibles a la inclusión o exclusión de la primera observación.
Pro fesor Genaro Sá nchez Barajas
153
Introducción a la Econometría
obsérvese que como se está estimando p. las pruebas usuales de significancia serán estrictamente válidas solamente en muestras grandes. En muestras pequeñas, los resultados de las pruebas serán solo aproximados. Por ejemplo, de (12.7.2) se puede concluir que el verdadero coeficiente de pendiente es estadísticamente diferente de cero. Pero se debe tener cautela aquí puesto que nuestra muestra de 23 observaciones no es demasiado grande.
Comparación de los métodos. Retornando a la pregunta planteada anteriormente: ¿Cuál método de estimación de p se debe utilizar en la práctica para efectuar la regresión en diferencia generalizada o MCG factible? Si se está tratando con muestras grandes (digamos, por encima de 60-70 observaciones). no hay gran diferencia en cuál método sea seleccionado. y a que todos producen más o menos resultados similares. Pero generalmente este no es el caso en muestras finitas o pequeñas ya que los resultados pueden depender de cuál método se seleccione. En muestras pequeñas, entonces, ¿cuál método es preferible? Desafortunadamente, no hay una respuesta definitiva a esta pregunta porque los estudios de muestras pequeñas realizados mediante los diversos métodos, a través de las simulaciones de M onte Carlo, no favorecen consistentemente ninguno de los métodos. En la práctica, sin embargo, el método frecuentemente utilizado es el método iterativo de CochraneOrcutt, que ya ha sido incorporado a diversos programas de computado tales como ET; SHAZAM, TSP Y SAS. A medida que el software de computador se hace más sofisticado, se pueden utilizar métodos de estimación de p orientados específicamente para tratar con tales muestras pequeñas. De hecho, en la actualidad, paquetes como SAS contienen MV y algunos procedimientos no lineales de estimación de p (Véase el procedimiento AUTOREG de SAS).
Por otra parte es conveniente señalar que para llegar a estos resultados transformando las variables originales, al igual que en el ejemplo anterior, se utilizó el algoritmo que se expresa en la siguiente tabulación. IVt
Ut
104.66 103.53 .. .. 187.66
5.63 5.46 . . 3.96
LnIVt
LnUt
InIV t *
.. ..
.. ..
.. ..
= ln IV t − 0.5598 ln IV t −1 InU *t = InU t − 0.5598 ln U t −1
.. ..
Mediante estas transformaciones se obtuvieron las ecuaciones de regresión que permitieron, primero, identificar la autocorrelación y segundo, eliminarla. Así, para verificar la eliminación de autocorrelación, hacemos lo siguiente: a)Con N=23 y k-1=1 α =5% tenemos que d L=1.257 y d u=1.437, comparamos y vemos que: d=1.77 154
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
>d u=1.437, luego como d>d u no hay correlación y aceptamos H o: r=0. b)Con N=24, y k-1=1 α =5% obtenemos en tablas d L=1.273 y d u=1.446, comparamos d=1.8342 >d u=1.446, como d>d u , decimos que no hay correlación y aceptamos H o: r=0.
X.3 MULTICOLINEALIDAD Se dice que existe multicolinealidad cuando dos o más variables explicativas están altamente correlacionadas en el modelo de regresión; esta alta correlación impide conocer el efecto individual de cada una de estas variables explicativas sobre la variable dependiente.
X.3.1 Consecuencias de la correlación entre variables explicativas. Los coeficientes estimados con el método de mínimos cuadrados ordinarios, en opinión de D. Salvatore (misma obra citada anteriormente, página 151), “pueden ser estadísticamente insignificantes”, aun cuando se vea que R 2 tenga valores muy altos y, lo que es más importante, los coeficientes estimados aun siguen siendo INSESGADOS. Es más, Salvatore menciona que si el propósito principal de la regresión es el PRONOSTICO “la multicolinealidad no es un problema si el mismo patrón de multicolinealidad persiste durante el período pronosticado”.
X.3.2 ¿Cómo se identifica la multicoline alidad? 1. Cuando se observa que alguno o ninguno de los coeficientes de las variables explicativas es estadísticamente significativo, además de que R 2 resulta alto y F muestra que en conjunto si son significativos estadísticamente. Carrascal (2001:162). 2. También se detecta la multicolinealidad cuando se obtienen elevados coeficientes de correlación simple o parciales, entre las variables explicatorias; sin embargo, esto no es muy seguro porque puede presentarse multicolinealidad “suficiente aun si los coeficientes de correlación simple o parciales son relativamente bajos (menores que 0.5)”. Derivado de lo anterior es que Carrascal (2001:174) propone calcular la matriz de correlaciones entre cada par de regresores, es decir hacer análisis de correlación simple; si la correlación es elevada (próxima a ± 1) es indicativo de que hay multicolinealidad.
X.3.3 Métodos para reducir o eliminar la multicolinealidad a) Se amplia el tamaño de los datos muestrales; b) Utilizar información a priori; c) Se transforma la relación funcional: incrementando o deflactando las variables del modelo.
Pro fesor Genaro Sá nchez Barajas
155
Introducción a la Econometría
d) Se omite una de las variables altamente colineales. En este caso puede surgir un problema de especificación o error si la teoría señala que dicha variable omitida se debe incluir en el modelo, por ello no es recomendable. NOT A: La transformación de variables incluidas en el modelo para que la nuevas variables transformadas presenten correlaciones lineales más bajas se hace incrementando las variables, como ya se indicó y, en el caso de la deflactación de las mismas, se hace con INPC u otro apropiado, de modo que el modelo ahora se expresa a precios constantes y con ello se elimina la multicolinealidad.
X.3.4 Ejemplos numéricos para identificar y resolver la mul ticolinealidad. D. Salvatore en la página 155 de la obra citada plantea el siguiente caso: La producción en toneladas, Q, los insumos de trabajo en horas-hombre, L, así como los insumos de capital en horas-máquina, K, así como sus logaritmos naturales, lnQ, InL. lnK, respectivamente, de 15 empresas norteamericanas.
Empresa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Q 2,350 2,470 2,110 2,560 2,650 2,240 2,430 2,530 2,550 2,450 2,290 2,160 2,400 2,490 2,590
L 2,334 2,425 2,230 2,463 2,565 2,278 2,380 2,437 2,446 2,403 2,301 2,253 2,367 2,430 2,470
K 1,570 1,850 1,150 1,940 2,450 1,340 1,700 1,860 1,880 1,790 1,480 1,240 1,660 1,850 2,000
LnQ 7.76217 7.81197 7.65444 7.84776 7.88231 7.71423 7.79565 7.83597 7.84385 7.80384 7.73631 7.67786 7.78322 7.72004 7.85941
Lnl 7.75534 7.79359 7.70976 7.80914 7.84971 7.73105 7.77486 7.79852 7.80221 7.78447 7.74110 7.72002 7.76938 7.79565 7.81197
LnK 7.35883 7.52294 7.04752 7.57044 7.80384 7.20042 7.43838 7.52833 7.53903 7.48997 7.29980 7.12287 7.41457 7.52294 7.60090
a) Con esos datos ajustó una función de producción Cobb – Douglas de la forma Q = b0 2
b1
b2
e
u
y encontró así como el coeficiente de correlación simple entre lnL y lnK; para ello transformó los datos en forma de logaritmo natural y obtuvo: lnQ = 0.50 + 0.76 lnL + 0.19 lnK (1.07) ( 1.36)
156
R 2 = 0.969 2
= 0. 964
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
r ln
L
ln K
= 0.992
Detalladamente: Dependent Variable: LQ Method: Least Squares Date: 11/22/04 Tim e: 21:29 Sample: 1 15 Included observation s: 15 Variab le
Coeffi cien t
Std. Error
t-Statistic
Prob.
0.500430 0.757561 0.188009
4.480020 0.707327 0.138676
0.111703 1.071019 1.355744
0.9129 0.3052 0.2001
R-squared Adj usted R-squared S.E. of regressio n
0.96888 2 0.9 63 696 0.01 284 9
Sum squa red resid
0.00 198 1
Log li keli hood Durbin-Watson stat
45.7071 0 2.08 714 2
Mean depen dent var 7.78860 4 S.D. depen dent va r 0.0 67 435 Akai ke in fo criterion 5.694280 Schwarz criterion 5.552670 F-statistic 186.814 7 Prob(F-stati stic) 0.00 000 0
C LL LK
b) Relacionó lnQ con lnL solamente y halló: LnQ = -5.50 + 1.71 lnL (0.71) (0.09)
R 2 =0.964
Dependent Variable: LQ Method: Least Squares Date: 11/21/04 Tim e: 18:48 Sample: 1 15 Included observation s: 15 Variab le
Coeffi cien t
Std. Error
t-Statistic
Prob.
C LL
-5.501022 1.708958
0.71110 5 0.091442
-7.735877 18.68891
0.0000 0.0000
R-squared Adj usted R-squared S.E. of regressio n
0.96411 6 0.9 61 355 0.01 325 6
Sum squa red resid
0.00 228 5
Log li keli hood Durbin-Watson stat
44.6382 4 2.07 294 3
Mean depen dent var 7.78860 4 S.D. depen dent va r 0.0 67 435 Akai ke in fo criterion 5.685099 Schwarz criterion 5.590692 F-statistic 349.275 3 Prob(F-stati stic) 0.00 000 0
Pro fesor Genaro Sá nchez Barajas
157
Introducción a la Econometría
c) Relaciono lnQ con lnK solamente lnQ = 5.33 + 0.33 lnK (0.13) (0.01)
R 2 = 0.966
Dependent Variable: LQ Method: Least Squares Date: 11/21/04 Tim e: 18:49 Sampl e(adjusted): 1 15 Included observation s: 15 after adju sting endpo ints Varia bl e
Coeffici ent
Std. Error
t-Statistic
Prob.
5.331671 0.330505
0.131934 0.017778
40.41163 18.59031
0.0000 0.0000
R-squared Adj usted R-squared S.E. of regressio n
0.96644 3 0.9 63646 0.01 276 7
Sum squa red resid
0.00 195 6
Log li keli hood Durbin-Watson stat
42.2658 7 2.06 741 2
Mean depen dent var 7.7835 46 S.D. de pe nden t var 0.0 6696 3 Akai ke in fo criterion 5.752267 Schwarz criterion 5.660973 F-statistic 345.59 95 Prob(F-stati stic) 0.00 000 0
C LK
d) Analizó los resultados anteriores en relación con la multicolinealidad y señaló: Que en a) ni
2 bˆ1 ni bˆ 2 eran estadísticamente significativas con α = 5 % y como R = 0.97, concluyó
que había multicolinealidad, es decir, las empresas más grandes eran propensas a usar más trabajo y más capital que las empresas pequeñas. Esta situación se confirmó por el valor muy alto de 0.992 para el coeficiente de correlación simple entre lnL y lnK. En b) y c) al reestimarse la regresiones simples con lnL ó lnK como la única variable explicatoria, se vio que tanto los coeficientes de lnL como lnK ahora eran estadísticamente significativas con α = 1% y con R 2 superior a 0.96. Estos mejores resultados usando una sola variable explicativa podrían inducir a usar una sola de ellas en la regresión. Ello no es aconsejable, ya que omitirla en la regresión múltiple genera una estimación de pendiente con mínimos cuadrados ordinarios sesgada para la variable explicativa utilizada, debido a que la teoría de la empresa establece que el trabajo como el capital deben incluirse en la función de p roducción. e) ¿Cómo superar lo anterior, cómo eliminar la multicolinialidad trabajando con las dos variables independientes ?, para ello supone que en esta industria no existen economías de escala (es decir, b1 + b2=1); ahora bien en palabras de Gujaratí (1991:234): “si se espera obtener retornos a escala constante, entonces b1+b2=1”. 158
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Se recurre a la transformación de las variables sabiendo que sin economías de escala, la función de producción Cobb – Douglas se puede plantear como Q = b0 L
b1
1 −b1
u
K e , ecuación en la que se
observa al compararla con la ecuación inicial, que b2 ahora se obtiene a partir de b1. Al expresar la
nueva ecuación en forma doble – Log y reordenándola, se tiene: ln Q = ln b0 + b1 ln L + (1 − b1) ln K + u ln Q − ln K = ln b0 + b1 (ln L − ln K ) + u Enseguida se establece lnQ* = lnQ – lnK y lnL* = lnL – lnK y luego relacionando y corriendo en la computadora lnQ* con lnL*, para calcular b1, se obtiene la siguiente ecuación de regresión: LnQ* = 0.07 + 0.83 lnL* (0.008)
R 2 0.990
(0.022)
Dependent Variable: Q1 Method: Least Squares Date: 11/21/04 Tim e: 20:13 Sample: 1 15 Included observation s: 15 Variab le
Coeffi cien t
Std. Error
t-Statistic
Prob.
0.071856 0.830859
0.008354 0.022073
8.601163 37.64117
0.0000 0.0000
R-squared Adj usted R-squared S.E. of regressio n
0.99090 8 0.9 90 209 0.01 311 4
Sum squa red resid
0.00 223 6
Log li keli hood Durbin-Watson stat
44.8005 8 1.96 001 6
Mean depen dent var 0.35933 3 S.D. depen dent va r 0.1 32 529 Akai ke in fo criterion 5.706745 Schwarz criterion 5.612338 F-statistic 1416.85 7 Prob(F-stati stic) 0.00 000 0
C L1
luego
bˆ 2 = 1 − bˆ1 = 1 − 0.83 = 0.17 , de manera que b1+b2=1 es decir 0.83 +
0.17=1 Por consiguiente al hacer la prueba de significación, se recurre a la columna de probabilidad que indica un valor de cero, indicativo de que son estadísticamente significativas ambas variables, esto es debido a la probabilidad de α =0.05 que maneja el programa, y por ello ya no existe multicolinealidad.
Pro fesor Genaro Sá nchez Barajas
159
Introducción a la Econometría
La solución al problema de la multicolinealidad que se presenta podemos decir que es de manera parcial, y a que es necesario contar con más información (datos) p ara estimar nuevamente y llegar a la solución del problema, en donde se puedan usar las dos variables explicativas, ya que como se recordará el problema de la multicolnealidad “es una cuestión de grado y no de clase. La distinción significativa no es entre la p resencia o ausencia de este fenómeno en un modelo, sino entre sus varios grados. Como la multicolinealidad se refiere a una condición sobre las variables explicativas o independientes que se supone no estocásticas, entonces es una característica de la muestra y no de la población bajo estudio”.[Luis O, 1992] Cabe señalar que la detección de multicolinealidad es la mitad de la batalla (Gujarati, 1991:241). La otra mitad esta relacionada con hallar como deshacerse del problema. Nuevamente, no existen método seguro, solamente unas pocas reglas generales. Algunas de estas son las ya mencionadas en el punto XI.3.3. Naturalmente, para saber cual de estar regla utilizar en la practica tenemos que conocer la naturaleza de los datos y la severidad del problema de multicolinealidad. El archivo maestro o nuestra base de datos p ara llegar a estos resultados es. obs 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915
Q 2350 2470 2110 2560 2650 2240 2430 2530 2550 2450 2290 2160 2400 2490 2590
L 2334 2425 2230 2463 2565 2278 2380 2437 2446 2403 2301 2253 2367 2430 2470
K 1570 1850 1150 1940 2450 1340 1700 1860 1880 1790 1480 1240 1660 1850 2000
LQ 7.76217060714 7.81197342962 7.65444322647 7.84776253747 7.88231491898 7.71423114485 7.79564653633 7.83597458172 7.84384863815 7.80384330354 7.73630709655 7.67786350068 7.78322401634 7.82003798946 7.85941315469
LL 7.75533881285 7.79358680337 7.70975686445 7.80913539812 7.8497137576 7.73105314401 7.77485576667 7.79852305363 7.80220931625 7.78447323574 7.74109909004 7.72001794043 7.76937860951 7.79564653633 7.81197342962
LK 7.35883089834 7.52294091807 7.04751722136 7.57044325206 7.80384330354 7.20042489294 7.43838353004 7.52833176671 7.53902705582 7.48997089883 7.29979736676 7.1228666586 7.41457288135 7.52294091807 7.6009
LQ*1 0.41 0.29 0.61 0.28 0.08 0.51 0.36 0.31 0.3 0.31 0.44 0.56 0.37 0.3 0.26
L*1 0.4 0.27 0.66 0.24 0.05 0.53 0.33 0.27 0.26 0.29 0.44 0.6 0.36 0.28 0.21
XI. MO D ELO D E ECU ACION ES S IMU LT AN EAS : APL ICACIO NES ECON Ó MICAS A ECU ACIO N ES DE EQ U ILI BRIO 2 . Con los uniecuacionales se establece una relación unidireccional, de causa a efecto; donde X es la causa y Y el efecto: No obstante hay situaciones en que Y influye también X, en este caso es preciso considerar dos ecuaciones : a un modelo de ecuaciones simultaneas, en el que hay más de dos ecuaciones , una para cada variable dependiente se le llama modelo de ecuaciones simultaneas.
160
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
En este caso el método M CO, es generalmente inaplicable para estimar los parámetros de cada una de las ecuaciones en el modelo. Por otra parte si en este modelo existen dos o más ecuaciones no es posible obtener valores numéricos de cada parámetro en cada ecuación porque las ecuaciones no son observacionalmente distinguibles, es decir se p arecen mucho entre si , entonces se tiene el problema de IDENTIFICACIÓN; p or ejemplo en la regresión de la cantidad Q sobre el precio P ¿es la ecuación resultante una función de oferta o de demanda¿ ya que Q y P son parte de las dos funciones. Luego es import ante resolver el problema de identificación antes de p roceder ala estimación . p ara ello hay diversos métodos, como también los hay para estimar los modelos de ecuaciones simultaneas. El metodo de MCO no es aplicale porque uno de sus supuestos es que X no es estocàstica, y si lo es, esta distribuida independientemente del termino de perturbación (Ui) estocàstico . si no se cumple lo anterior, entonces los estimadores de MCO son sesgados e inconsistentes: cuando n tiende a N, el valor del estimador no converge con el valor del parámetro poblacional, dado que hay correlación entre X y U i. Métodos para la Estimación
Para estimar los p arámetros de los modelos existen diversos métodos, destacan: a) Uniecuacionales o de información limitada; b) M étodos de sistemas conocidos como M étodos de información completa.ç En los uniecuacionales cada ecuación ( en el sistema de ecuaciones simultáneas) se estima individualmente considerando las restricciones impuestas sobre ella ( tales como la exclusión de algunas variables ) sin preocuparse de las restricciones sobre las otras ecuaciones en el modelo, de ahí el nombre de métodos de información limitada . En el segundo grupo de métodos , se estiman todas las ecuaciones en el modelo de manera simultanea, teniendo en cuenta ,las restricciones ocasionadas por la omisión o ausencia de algunas variables sobre dichas ecuaciones, por eso se llaman métodos de información completa. Idealmente se deberían usar los métodos de sistemas, dentro de los que destaca el método de máxima verosimilitud con información completa, pero en la pràctica no se usan p or: a) El gran numero o volumen de datos, b) Conducen a soluciones que son altamente no lineales en los p arámetros y por ende, difíciles de determinar y c) Si hay un héroe de especificación, este se trasmite al resto del sistema. En consecuencia estos métodos se vuelven muy sensibles a los errores de especificación. Por consiguiente, en la practica, se usan los métodos uniecuacionales con mucha frecuencia, los cuales son: 1. Mínimos cuadrados ordinarios, MCO; 2. Mínimos cuadrados indirectos, MCI; y 3. Mínimos cuadrados de dos etapas . Sobre uno, antes se hablò de sus limitaciones, sin embargo hay una situación en que puede aplicarse apropiadamente: En los modelos recursivos, t riangulares o causales, donde las p erturbaciones de
Pro fesor Genaro Sá nchez Barajas
161
Introducción a la Econometría
diferentes ecuaciones no están correlacionadas, es decir existe cero correlación contemporánea ( el mismo periodo. Con el dos, se usa cuando la ecuación estructural esta exactamente identificada; donde las estimaciones de los parámetros se conocen como estimaciones de mínimos cuadrados indirectos, cuyos parámetros son consistentes y , bajo los supuestos apropiados, eficientes. El método numero tres se usa cuando una variable”representante” de la variable explicativa estocàstica Y t, tal que aunque se parece a ella ( ambas están altamente correlacionadas), no esta correlacionada con U-i. Tal variable también se le conoce como estructural, ¿Còmo se obtiene esta variable? Con el método de mínimos cuadrados en dos etapas, M C2E. ROSARIO AQUÍ VAN LAS 3 HOJAS DE SALVATORE
162
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Pro fesor Genaro Sá nchez Barajas
163
Introducción a la Econometría
164
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Pro fesor Genaro Sá nchez Barajas
165
Introducción a la Econometría
A manera de reiteración, como se indicó, el sistema de ecuaciones simultáneas es el fundamento de los modelos multiecuacionales , que a diferencia de los modelos uniecuacionales vist os has ta el moment o, se caracterizan p or lo siguiente: a) Exist e más de una v ariable dep endiente; b) Exi s t e má s de una ecu ac ió n; c) Una variable dependiente de una ecuación puede aparecer como variable explicativa en otra ecuación del sistema de ecuaciones simultáneas. Por ello, en opinión de Gujarati (1990,275), dicha variable dependiente explicativa se convierte en es to cástica, es tando p or lo general correlacionada con el término de pert urbación de la ecuación en la que ap arece como exp licativa. En est a situación el método M CO no debe aplicarse porque los estimadores obtenidos no son consistentes, lo que implica que no tienden a su valor cerdadero, cualquiera que sea el tamaño de la muestra. A continuación se expone la construcción de un modelo multiecuacional con aplicaciones a la economía.
XI.1 Te oría de l os Prec i os XI.1.1 In trodu cc i ón : Fu n ci on es y Model os La mayoría de las proposiciones básicas de la teoría económica tienen que ver con relaciones funcionales y se pueden representar o formular matemáticamente. En la teoría de los p recios p odemos empezar con dos sup uestos s imp les:
i ) La cantidad (Q o ) de un bien ofrecido para venderse en un momento dado depende del p recio (p ). En lenguaje matemático, la cantidad ofrecida es fu nción del p recio. Q 0 =f 1 ( p ) Además, se supone que la cantidad ofrecida aumentará si el precio aumenta y disminuirá si éste des ciende.
i i ) La cantidad Q d de un bien que los consumidores demandarán depende del precio (p), luego Q d =f 2 (p). Se supone que la cantidad demandada aumentará si el precio disminuye y disminuye si el precio aumenta. El problema es encontrar funciones matemáticas que representen la funciones de oferta (Q 0 ) y de demanda (Q d ). Si el precio se mide en el eje vertical y la cantidad demandada en el eje horizontal; sabemos que la curva normal de la oferta tendrá p endient e p os it iv a y la cu rva de dem an da s er á nega t iv a.
166
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
d
70
q
60 50 40 30 20
d
q
10 0 0
20
40
60
Las funciones serán : Q0= 3 p Q d =40-2p Estas dos ecuaciones producen líneas rectas de la oferta y la demanda. Dos ecuaciones de segundo grado serán, para la misma relación económica: Q 0 =p 2 +2 Qd =
12 p
La p rimera es una p arábola y la s egunda es un a hipérbo la rectangular. En ambas, p arte de la curva es irrelevante. Precios y cantidades negativos no s on de interés para el economista, por ello los gráficos y diagramas en econom ía generalmente muestra las secciones positivas de las funciones ilustradas, el resto es simplemente ignorado en las funciones anteriores P y Q. Las constantes que determinan la relación exacta de P y Q se conocen como p ar ám et ros de la s funciones . En la función lineal de demanda anterior 40 y -2 son los dos parámetros.
XI.1.2 El abora ci ón de u n Model o. Una vez que escogimos las dos funciones adecuadas para representar las relaciones de la oferta y demanda, enseguida procedemos a elaborar un modelo. Un modelo es simp lemente un sist ema de ecuaciones simultáneas describiendo algunos as p ectos de la vida económica. Para encontrar los valores de las diferentes variables contenidas
Pro fesor Genaro Sá nchez Barajas
167
Introducción a la Econometría
en el modelo es necesario que el número de incógnitas en el modelo sea exactamente igual al número de ecuaciones. T omemos el segundo p ar de ecuaciones de demanda y oferta Q 0 =p 2 +2
Qd =
12 p
El modelo no está completo ya que tenemos dos ecuaciones pero tres incógnitas: Q 0 , Q d , y p. Como nosotros buscamos una situación de equilibrio, es decir, los valores de P y Q p ara los cuales la cantidad ofrecida en venta es exactamente igual a la cantidad que los consumidores compraran. Lo anterior nos da la tercera ecuación, la de equilibrio. Q 0 =Q d Ahora el modelo está completo y graficando las funciones podemos encontrar los valores de P y Q, y hallar que el precio y la cantidad son 2 y 6 resp ectivamente. Este enfoque que requiere establecer un sistema de ecuaciones simultáneas cuya solución es para encontrar los valores de equilibrio de las variables es una de las herramientas básicas de los economistas. Naturalmente los modelos serán más comp lejos que el utilizado, p ero los p rincipios s on los mismos. 1. Ejercicio: D e las siguientes ecuaciones indique cuales repres entan adecuadamente a las ecuaciones de demanda y oferta. Q =155-25p Q= 50p P=0.10Q 2 PQ=20 5Q-50-200P=0 Q=1200-p 2
¿Que supuestos hizo sobre las características de la forma de las funciones de oferta y demanda? 2.- Comp lete los 2 modelos y encuentre el p recio y cantidad de equilibrio, dadas las siguientes ecuaciones.
168
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
a) Q d =100-20p Q 0 =-5+15p
b) Q d =1000-p 2 Q0= 3 0 p
SOLUCIÓN: Q=15 5-25p Q= 50p P=0.10Q 2 PQ =20
es es es es
ecuación ecuación ecuación ecuación
de de de de
demanda ofert a oferta demanda
es ecuación de oferta 5Q-50- 200P= 0 es ecuación de demanda Q = 1200-p 2 Supues tos p ara la demanda: A medida que el p recio aumenta, la cantidad demandada baja. Supuestos para la oferta: A medida que el precio aumenta, la cantidad ofrecida aumenta. Función de Oferta P Q 2 Función de demanda P Q Si P=0. 10Q 1 .31 2 Si Q=155-25p 1 130 Q =P/0.10 2 .44 Q-155+25p =0
2 105
Q=
P
10
3
.54
25p=-Q+155 P =
− Q + 155 25
Función de demanda P PQ=20 1 Q=20/P 2 3
Q 20 10 6
Cuando Q=1200-P 2 Función de D emanda P Q 1 1999
Pro fesor Genaro Sá nchez Barajas
169
Introducción a la Econometría
2 3
1996 1961
a)
Q d =100-20P Q 0 =-5+15P Q 0 =Q d P=3; Q=40
Q d =1000-P 2 Q 0 =30P Q 0 =Q d P=20; Q=600
XI.1.3 Con stru cc i ón de u n Model o de Equ i l i bri o Prec i o-D em an da-O ferta 2 Suponga que sabíamos que a un precio de 10 pesos la cantidad demandada de un bie n det er minad o es de 250 unid ad es , y que la ca nt id ad dem an dad a aume nt ar á en 50 unidades por la reducción de cada peso por abajo de 10 pesos, y disminuirá en 50 unidades la cantidad por el aumento de cada peso por arriba de 10 pesos. La demanda es una línea recta como se muestra en el siguiente diagrama, donde la relación este la cantidad demandada (Q d ) y el precio (p) puede describirse así: Q d =a-bP p 25 20 15
D
10 5 0 -5
Q 0
200
400
600
800
Si la demanda se extiende al eje de las equis (línea punteada), ello implicaría que una cantidad finita hipotética sería demandada si se tratara de un bien libremente comerciable en el mercado. No nos interesa dicha situación sino la porción representada por la línea continua. La extensión al punto en que P=0 nos p rop orci ona el valor de la co ns t an t e “ a” en la ec uac ió n an t er io r; s i P =0; Qd =a. Además sabemos que (-b)es la pendiente dela recta. Empezando en el punto P=0, sabemos que por cada aumento de un peso en el precio, la cantidad demandada disminuirá en 50 u nidades, es decir, b=50, luego p odemos escribir Qd =a-50p
170
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Y como sabemos por la información que recibimos que cuando P=10, Q d =250, p odem os hal lar el valo r de “ a” s us t it uy en do es t os val ores . 250 = a-50(10) a = 750 luego la ecuación de demanda es: Qd =750-50p. Ahora analicemos el lado de la oferta en el mercado. Supo nga que sabemos que s i el p rec io fuer a t an baj o co mo ci nco p es os nad ie ofrec er ía nad a de la me rca ncía p ar a la venta, y que por cada peso de aumento arriba de ese nivel ($5.00), se ofrecerán 20 unidades del bien para vent a en el mercado. La ecuación de la oferta p uede escribirse así: Q0 =c+dp
p 12
O
10 8 6 4 2
Q
0 0
50
100
150
luego d=20. Como sabemos que Q 0 =0 cuando P=5, determinamos el valor de “C” haciendo: 0=C+(20)(5) C=-100 As í la ecuación de ofert a es: Q 0 =-100+20p Ahora determinemos los valores de equilibrio de P, Q d , Q o , es decir encontrar el p rec io al cual la ca nt id ad dem an dada es igu al a la ca nt id ad ofrec id a en el me rcad o. Para ello se debe encontrar el punto de intersección de las dos rectas, con Qd =Q 0
Así 750-50p
=-100+20p =70P=850 P =12.14
Pro fesor Genaro Sá nchez Barajas
171
Introducción a la Econometría
Interpretación: El precio de equilibrio en este mercado es de 12.14. La cantidad comprada y vendida a ese precio se determina sustituyendo el valor de P=12.14 en cualquiera de las ecuaciones d e ofert a y demanda. Q 0 =-100+(20)(12.14) Q 0 =-100+242.80 Q 0 =Q d =142.80
XI.1.4 Vari abl es En dógen as y Exógen as2 Tomemos como referencia el modelo lineal anterior trabajando con las literales de las ecuaciones: Q d =a-bP Q 0 =c+dP Q d =Q 0 Las variables en el modelo P y Q están interrelacionadas y el valor de una depende del valor de la otra, ya que cuando resolvimos el sistema de ecuaciones simultáneas p udimos en co nt rar el val or de P y lu ego el de Q p or s us t it uci ón. Ahora supóngase que se trata de un producto agrícola y deseamos aumentar el realismo del modelo incluyendo la precipitación pluvial mensual (R) en la ecuación de la oferta, la cual se convierte en: Q 0 =c+dP+eR Est a nueva variable es de diferente nat uraleza de las variables P y Q. Los valores de P y Q se determinan dentro del modelo y por ello se denominan como VARIABLES ENDO GENAS . La lluvia mensual sin embargo, no se determina p or nin guna varia ble den t ro del s is t em a, lo s cam bio s en P o Q no af ec t ar on el valor de R. Puesto que el valor de R se determina por fuerzas extrañas al modelo, se conoce como VARIABLE EXOGENA.
172
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Es interesante la interpretación gráfica de un cambio en el valor de las variables exógenas. Para ello suponga que la ecuación de oferta Q 0 =C+dP+eR tiene los siguientes parámetros: Q 0 =4+3p+2R En cierto mes la p recipitación p luvial fue de 2 pulgadas, tal que la función de oferta fue: Q 0 =4+3p+2(2) =8+3p Q1 En el mismo mes del siguiente año la precipitación fue 3.5 pulgadas, la función de oferta fue: Q 0 =4+3p+2(3.5) Q 0 =11+3p Q2 graficando las dos ecuaciones t enemos:
120
p
O2
100 80
O1
60 40 20
Q
0 0
20
40
60
El cambio en el valor de la variable exógena produjo un cambio en la función de oferta. Si, sin embargo le damos diferentes valores a las variables endógenas P y Q, entonces suponiendo que no cambie los valores de los parámetros, la recta de la oferta no cambia. Diferentes valores de P y Q simplemente representan diferentes puntos en la ecuación de oferta actual. Para Q 1, tenemos Q 0 =8+3p cuando p=2, Q=14; cuando p aumenta a 3, Q aumenta a 17, otro punto en la recta. Similarmente para cualquier recta de demanda de la forma Q d =f(p), los cambios en cualquier variable exógena: ingreso, gasto, etc., cambiarán la recta de la demanda; los cambios en los p recios no la modificarán.
Pro fesor Genaro Sá nchez Barajas
173
Introducción a la Econometría
XI.2 Te oría del In greso 2 XI.2.1 El M odel o S i mp l e Key n esi an o. La teoría de ingreso nacional puede diseñarse pensando en dos identidades. La p rimera es t ab le ce que p ar a una ec onomía ce rrad a (s in co me rci o ext er io r) el gas t o total (E) es la suma de los gastos de consumo, (C), gasto de inversión (I) y el gasto del gobierno (G ). E=C+1+G La segunda identidad describe el desglose del ingreso nacional en la forma en que se recibe en la economía; el ingreso (Y) se usa para comprar bienes de consumo (C), p ara el ahorro (A ), y p ar a p aga r imp ues t os al gobierno (T ):Y=C+A +T Para un determinado periodo de tiempo, el gasto total debe ser exactamente igual al ingreso nacional recibido.E=Y y por consiguiente : C+I+G=C+A+T Si suponemos que el gobierno gasta exactamente lo que recibe como ingreso por los impuestos que cobra, tenemos que (G=T), luego como (C) aparece en los dos lados de la economía, tenemos las identidades: I=A y C=C. Estas identidades muestran que para cualquier periodo pasado de tiempo el total de gasto debió ser igual al ingreso recibido, y por consiguiente que la inversión fue igual al ahorro. Sin embargo no hay razón alguna para suponer que al principio del p erio do, la ca nt id ad de din er o que lo s homb res de nego ci os des ea n in ver t ir s ea igu al a la cantidad que desean ahorrar las personas. Estas últimas pueden desear ahorrar más de lo que piensan invertir los hombres de negocios, estos pueden planear invertir más de que las personas piensan ahorrar. En el primer caso la presión deflacionaria disminuirá el ingreso nacional hasta que alcance el p unt o de equilibrio; en el segundo caso, la p resión inflacionaria aumentará el ingreso nacional hasta un nivel de equilibrio en que el ahorro sea igual a la inversión. La economía sólo estará en equilibrio cuando, a cierto nivel de ingreso, cuando la inversión planeada sea igual al ahorro planeado; en este caso, el gasto to tal p laneado será igual al ingreso t ot al esp erado. El profesor Keynes ilustra su teoría con el siguiente modelo matemático. Ejemp lo: Si la p rop ensión p romedio a ahorrar en un p aís está dada po r la exp resión: A=.2Y-50 y el nivel de inversión está dado por I=.1Y, encuentre el nivel de equilibrio del ingreso. 174
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Hasta el momento el modelo está incompleto, tenemos tres incógnitas (A, I, Y) y solo dos ecuaciones. La t ercera ecuación es la de equilibrio: A=I, resolviendo p ara Y 0.2Y-50=.1Y 0.1Y=50 Y=500 Suponga que la propensión promedio a ahorrar aumenta y que la función de ahorro cambia a: A=.2y-35. Si la función de inversión permanece constante, debemos esperar presiones deflacionarias para reducir el nivel de ingresos. Digamos que A′ =I 0.2Y-35=.1Y 0.1Y=35 Y=350. Estas dos situaciones diferentes se pueden mostrar gráficamente: A, I 400
A' A
350 300 250 200 150
I
100 50 0 -50
0
500
1000
1500
2000
y
-100
Si A=.2y-50 Y A o -50 500 50
Si A’=.2y-35 Si I=.1y Y A’ y I 0 -35 0 0 350 35 350 35 500 50
A=I Otro diagrama usado frecuentemente en la teoría del ingreso mide el gasto nacional (E) en el eje vertical y el ingreso (Y) en el eje horizontal. Hemos visto que en equilibrio E=Y
Pro fesor Genaro Sá nchez Barajas
175
Introducción a la Econometría
Los puntos de equilibrio se encuentran a lo largo de la línea con ángulo de 45 0 que es equidistante de los dos ejes. A medida que el gasto nacional aumenta por un aumento en el gasto de cons umo, en la inversión o en el gast o del gobierno, el punt o de equilibrio se moverá hacia arriba y el ingreso nacional (medido en el eje horizontal) aumentará. E
C+I+G ' C+I+G C+I C
45 00
Y0
Y1
Y
Un hecho importante que destaca la teoría del ingreso y que se ve claramente en este diagrama, es que un aumento en uno de los componentes del gasto público p rovoca rá un ca mb io má s que p rop orci onal en el in gres o (Y) , que s e den omina EFECTO M ULTIPLICADOR.
XI.3 U n Model o de Creci mi en to Equ i l i brado2 . Los modelos construidos hasta el momento se refiere a condiciones estáticas, sin embargo es posible usar un conjunto de ecuaciones simultáneas para establecer las condiciones para el crecimiento equilibrado de la economía. Usemos los siguientes símbolos: Y= C= A= c, a=
Ingreso nacional=p roducto =gast o Consumo Ahorro p rop ensión a consumir y ahorrar después de capt ar el ingreso.
As í te nem os :
C= cY; A = aY; c+a= 1 I= inversión K= disp onibilidad de capit al
176
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
v= razón capit al/p roduct o (p or ejemp lo si v=4, ello significa que p or cada unidad adicional de p roduct o (Y) se requieren 4 unidades adicionales de capit al. Si sup onemos que el valor de v es const ante de tal manera que to man el mismo valor las razo nes marginal y p romedio p roduct o/capital, entonces p ara la economía como un t odo Y=K/v Ello implica que la disponibilidad de capital es un factor limitante de la capacidad de la economía para generar el producto, y no la disponibilidad de mano de obra ni de recursos naturales. Nuestro conocimiento de la teoría del ingreso nacional nos capacita p ara decir que el gast o t otal es: Y=C+I Y=cY+I Y-cY=I Y(1-c)=I Y=I/1-c Como a=1-c tenemos que Y=I/a.
(1)
La ecuación (1) es la ecuación del multiplicador que muestra como el nivel de inversión y la pro p ensión a ahorrar entre ellos determinen el nivel de ingreso. Para el producto hemos est ablecido que con una razón (capital/producto) const ante k
Y =
v
.
(2)
Combinando las ecuaciones (1) y (2) podemos mostrar que el gasto conduce a la utilización p lena de la capacidad de la economía si y sólo s i: I K = a v
.(3)
Constituyendo el fundamento conciso de las condiciones para el uso pleno de los recursos disponibles. La suma del total de gastos generados I a debe comprar el p roduct o gen er ad o cu ando la ca p acidad de la ec onomía es t ot al me nt e ut iliz ad a Si la razón
I a
es demasiado pequeña t al que
I a
〈
K v
K v
.
la demanda es insu ficiente y la
economía opera sin utilizar toda su capacidad instalada. En estas circunstancias los remedios keynesianos recomiendan aumentar el producto hasta el límite establecido
Pro fesor Genaro Sá nchez Barajas
177
Introducción a la Econometría
p or la ca p ac id ad de la ec onomía. La s dos p os ib ilid ad es s on: Aume nt ar la in ver s ió n o aumentar el consu mo lo que significa disminuir el ahorro. Cualesquiera de estos dos pasos tendería a incrementar la razón
I a
y en su
momento la cap acidad, el ingreso y el gast o. Desafortunadamente el problema para los países pobres como México es mucho más serio. A menudo la dificultad no es trabajar por abajo de la capacidad plena, sino que aún a capacidad p lena, el producto p or p ersona es demasiado p equeño. El remedio simple de ahorrar menos (y gastar más) no es suficiente; para aumentar el producto se debe aumentar la capacidad de producir. En términos del modelo (k) debe crecer. De la ecuación (3) si suponemos que (a) y (v) son constantes, es claro que I también debe crecer. Reordenando la ecuación (3) t endremos: a I = K v
.(3a)
Que es el nivel de inversión que usa plenamente los ahorros generados por el ingreso obtenido a capacidad total de la economía. Dividiendo los dos lados de la ecuación por K, I K
=
a v
.
(3b)
Est a ecuación es más ilustrat iva puest o que I represent a la adición neta al cap ital en un periodo de tiempo dado y K representa el capital existente en ese mismo I p erio do, K es la tasa de crecimiento de la disponibilidad de capital. Esta tasa debe ser
a v
anualmente.
Con lo anterior hemos est ablecido las condiciones p ara una tasa de crecimiento de la economía. Si la dis p onibilidad de cap ital crece a una tasa de av entonces el p roducto extra generado será absorbido por el incremento en el gasto total. De hecho puede mostrarse que no solamente la disponibilidad de capital, pero la inversión y el ingreso también deben crecer a una tasa de
a v
anualmente para que se mantenga el
equilibrio en la economía.
178
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
XI.4 Eje rci ci os
1.-
La economía de un p aís p uede describirse con las siguientes ecuaciones: C= 15+0.9Y I= 20+0.05Y G= 25
(a)
Comp lete el modelo y encuentre los valores de equilibrio Y, C, I y G.
(b) Dibuje la gráfica de las tres funciones C, C+I y C+I+ G y de los equilibrio del ingreso con y sin el gast o del gobierno. 2.El ingreso nacional de Arcadia p uede describirse con las ecuaciones: A=0.25Y-100
niveles
de
siguientes
I=250
a) Comp lete el modelo y encuentre los niveles de equilibrio del ingreso y el ahorro. b) Grafíq ue la in forma ci ón an t erio r en un dia gram a. c) Demuestre algebraicamente que sucede con la función de ahorro y el nivel de equilibrio del ingreso cuando:
i ) La gente decide ahorrar 75 unidades adicionales en to dos los niveles ingreso.
de
i i ) La gente decide ahorrar 50 unidades menos en todos los niveles de ingreso.
Solución del primer problema
a)
Y =C+I+ G
Pro fesor Genaro Sá nchez Barajas
179
Introducción a la Econometría
Y = [ 15+0.9Y] + [ 20+0.05Y] +25 Y=35+0.95Y+25 Y=0.95Y+60 Y-0.95Y=60 Y(1-0.95)=60 Y =
60 0.05
Y=1200 C=15+.9(1200) C=15+1080 =1095 I=20+.05(1200) I=20+60 I=80 G=25 b) P ar a dib uja r la s gráf ic as de las 3 funci ones , les damos valo res y t en emo s :
Y=C Y=15+0.9Y Y-0.9Y=15 0.1Y=15 Y =
15 0.1
Y=C+I 35+0.95Y=Y 35=Y-0.95Y
= 150
Y
=
35 0 . 05
=
700
Y=C+I+G 60 =1200 Y = .05 Y=1, 200 Los niveles de equilibrio son: con gasto del gobierno Y=1200; sin gasto Y=700.
S ol u ci ón del S eg u n do Probl em a a)
Comp lete el modelo: I=A en condiciones de equilibrio, los niveles de equilibrio del ingreso (Y) y del ahorro (A) son:
0.25Y-100=250 0.25Y=250+100 180
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Y =
350 025 .
Y=1400 Para el ahorro tenemos A=0.25Y-100 A=0.25(1400)-100 A=350-100 A=250 b)
Grafíq ue la in forma ci ón an t erio r decimos: Y A 1400 250 0 -100
300
A, I
A=0.25Y-100
250 200 150 100 50
y
0 -50
0
500
1000
1500
-100 -150
C) Demuestre algebraicamente que sucede con la función de ahorro (A) y (Y) cuando: i)
La gente decide ahorrar 75 unidades más. 0.25Y-25=250 0.25Y=275 Y =
ii)
275 025 .
Y=1, 100 La gente decide ahorrar 50 unidades menos entonces 0.25Y-150=250 0.25Y=400 Y =
400 025 .
Pro fesor Genaro Sá nchez Barajas
181
Introducción a la Econometría
Y=1, 600
Probl em a Tres: Un trabajador del Distrito federal está obligado a gastar 110 pesos como consumo necesario fijo para poder vivir. Las encuestas de ingreso y gasto del Banco de M éxico indican que p or cada 10 p esos extra de ingreso (Y) el trabajador ahorra 1.50 p es os al me s (A). Con estos datos ¿Cuál es la ecuación de la función consumo del trabajador? R. Es C=110+0.85Y
Probl em a Cuatro: a)Explique claramente la relación entre la función consumo y la función ahorro en una economía, si la función consumo es C=30+ 0.8Y Explicación como C+A=Y, tenemos que a medida que aumente C disminuye A y viceversa, p or cons iguiente A= 0.2Y-30; grafiquelos. b)Ahora s up onga que la in ver s ió n es igu al a 20, mu es t re gráf ic am en t e que el niv el de equilibrio de C+I está en el punto donde A=I. Demostración si A = 0.2 y -30; con A=I 0.2y-30=20 Y=50/.2
I = 20 Y=250
Comprobación con: 0.2y-30=20 0.2(250)-30=20 20=20 A=I
X1.4.1 Aplicaciones de Eviews en la obtención de los coeficientes de un modelo multiecuacional En la actualidad la estimación de los coeficientes de las variables que integran un modelo multiecuacional se realiza fácilmente con la aplicación del software llamado Econometric Views, Eviews, como se demuestra enseguida. 182
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría
Se empieza con el encendido de la PC, enseguida se busca y accede al software Eviews, dentro del cual nos vamos en forma secuenciada a File,new, workfile,data: Start (primer año), end( último año),ok. Con esas especificaciones vamos a quick,empty group (edit series) en la que aparece una pantalla con los años arriba enunciados y con celdas que llenamos con los datos de la demanda, la oferta y el precio, ahí mismo, una vez que capturamos los datos, vamos a name para darle un nombre al archivo, puede ser el que aparece por default: obs 1999 2000 2001 2002 2003 2004 2005
OFERTA 11 15 17 20 25 28 28
PRECIO 5 6 6 7 8 8 8
DEMANDA 12 13 14 15 16 17 18
Con esas referencias nos vamos a la barra principal al comando objects , p ulsamos new object, luego sy stem, ok y aparece una pantalla en la que escribimos para cada una de las dos ecuaciones así: Demanda=c(1)-c(2)*precio Oferta=c(3)+c(4)*precio En esa misma pantalla está el comando “estimate”,pulsamos el cursor una vez y nos preguntan que método de estimación queremos usar, seleccionamos entre varios de ellos a LS, ok y aparecen los valores de los cuatro coeficientes: el de c1,c2,c3 y c4, como se muestra en la siguiente tabla. Con esos datos enseguida podemos encontrar el precio de equilibrio que iguala la oferta con la demanda. System: MINCUADRADOS Estima tion Method : Le ast Squ ares Date: 11/07/04 Tim e: 00:18 Sample: 1999 2005 Included observation s: 7 Total system (balanced) observations 14 Coeffici ent
Std. Error
t-Statistic
Prob.
3.38709 7 -1.693548 -16.25806 5.37096 8
1.68265 3 0.24215 0 3.33644 1 0.48014 7
2.01295 0 6.99378 6 -4.872876 11.1860 9
0.0718 0.0000 0.0006 0.0000
Determi nant residu al covariance
0.13956 6
C(1) C(2) C(3) C(4)
Equa tio n: DEMANDA=C(1)+C(2)*PRECIO Observatio ns: 7 R-squared 0.90725 8 Mean depen dent var 15.0000 0
Pro fesor Genaro Sá nchez Barajas
183
Introducción a la Econometría Adj usted R-squared S.E. of regression Durbin-Watson stat
0.8 8871 0 0.72066 3 1.71 098 0
S.D. de pe nden t var Sum squared resid
2.1 6024 7 2.5967 74
Equa tio n: OFERTA=C(3)+C(4)*PRECIO Observatio ns: 7 R-squared 0.9615 76 Mean depen dent var 20.571 43 Adj usted R-squared 0.9 5389 2 S.D. de pe nden t var 6.6 5475 1 S.E. of regression 1.42896 3 Sum squared resid 10.209 68 Durbin-Watson stat 2.02 148 0 30
25
20
15
10
5
0 1 99 9
2000
2001
OFERTA
2 00 2
2003
PRECIO
2 004
DEMANDA
System : UNTIT LED Estimati on M ethod: Weigh ted Le ast Squares Sample: 1999 2005 Included observation s: 7 Total system (balanced) observations 14 Coeffici ent
Std. Error
t-Statistic
Prob.
3.38709 7 1.69354 8 -16.25806 5.37096 8
1.4221 01 0.2046 54 2.8198 08 0.4057 98
2.38175 5 8.27515 9 -5.765664 13.2355 6
0.0385 0.0000 0.0002 0.0000
Determin ant residua l covariance
0.13956 6
C(1) C(2) C(3) C(4)
Equa tio n: DEMANDA = C(1) + C(2)*PRECIO Observatio ns: 7
184
2 00 5
Pro fesor Genaro Sá nchez Barajas
Introducción a la Econometría R-squared Adj usted R-squ ared S.E. of regression Durbin-Watson stat
0.90725 8 0.8 88 710 0.72066 3 1.71 098 0
Mean depen dent var 15.0000 0 S.D. depende nt va r 2.1 60 247 Sum squared resid 2.59677 4
Equa tio n: OFERTA =C(3)+C(4)*PRECIO Observation s: 7 R-squared 0.96157 6 Mean depen dent var 20.5714 3 Adj usted R-squ ared 0.9 53 892 S.D. depende nt va r 6.6 54 751 S.E. of regression 1.42896 3 Sum squared resid 10.2096 8 Durbin-Watson stat 2.02 148 0
System : UNTIT LED Estima tion Method : Seemi ngl y Unrelated Regression Sample: 1999 2005 Included observation s: 7 Total system (balanced) observations 14 Coeffici ent
Std. Error
t-Statistic
Prob.
3.38709 7 1.69354 8 -16.25806 5.37096 8
1.42210 1 0.20465 4 2.81980 8 0.40579 8
2.38175 5 8.27515 9 -5.765664 13.2355 6
0.0385 0.0000 0.0002 0.0000
Determi nant residu al covarian ce
0.13956 6
C(1) C(2) C(3) C(4)
Equa tio n: DEM ANDA = C(1) + C(2)*PRECIO Observation s: 7 R-squared 0.90725 8 Mean depen dent var 15.0000 0 Adj usted R-squ ared 0.8 88 710 S.D. depende nt va r 2.1 60 247 S.E. of regression 0.72066 3 Sum squared resid 2.59677 4 Durbin-Watson stat 1.71 098 0 Equa tio n: OFERTA =C(3)+C(4)*PRECIO Observation s: 7 R-squared 0.96157 6 Mean depen dent var 20.5714 3 Adj usted R-squ ared 0.9 53 892 S.D. depende nt va r 6.6 54 751 S.E. of regression 1.42896 3 Sum squared resid 10.2096 8 Durbin-Watson stat 2.02 148 0
Comentarios finales: Puesto al final de cada libro es conveniente poner un epílogo que cierre la descripción de su contenido, yo aprovecho para reiterar que esta obra fue escrita para que los alumnos a manera de autodidactas aprendan econometría, ya que hice mi mejor esfuerzo por simplificar los procedimientos matemáticos, por explicar casi en palabras llanas los conceptos y Pro fesor Genaro Sá nchez Barajas
185
Introducción a la Econometría
métodos que esta disciplina utiliza para hacer estimaciones con MCO. Mi mayor deseo es que así sea. Curso de introducción a la econometría: Facultad de Economía de la UNAM Dr. Genaro Sánchez Barajas : Quinto examen parcial. Nombre del alumno………………………………………………………calif_______ Tema: Modelos multiecuacionales basados en el sistema de ecuaciones simultáneas. A.-Conteste con una “X” en SI cuando la afirmación sea verdadera y también con una “ X” en NO cuando la afirmación sea falsa:
1.-Los modelos uniecuacionales sonn unidireccionales porque sólo la variable regresora, X, influye en la regresada,Y: Si___; No____. 2.-En un modelo multiecuacional, por el contrario, existe la situación en que la variable regresada, Y, influye en la regresada: SI_____;NO_____. 3.-Derivado de 2, es necesario considerar sólo una ecuación para estimar los parámetros de la población : Si_____; No________ 4.-En un modelo multieccuacional el mét odo de MCO es apropiado para estimar los parámetros de cada una de las ecuaciones del modelo, porque sus estimadores son insesgados y consistentes: SI:_______; NO:___________ 5.-P ara estimar los parámetros consistent es, se deben obtener primero los estimadores de las ecuaciones de forma reducida del modelo : SI:__; NO__. 6.-La IDENT IFICACION se refiere a la posibilidad de calcular los parámetros de una ecuación estructural a partir de los coeficientes de una ecuación de forma reducida : SI___; NO____. 7.-Una ecuación de un sistema de ecuaciones simultáneas está exactamente identificada si el número de variables exógenas excluidas de la ecuación es igual al número de variables endógenas en la ecuación menos 1, Está sobreidentificada o subidentificada si el número de variables exógenas excluidas en la ecuación excede o es menor que el número de variables endógenas incluidas en la ecuación menos 1 :: SI____; NO______: 8.-El mét odo de mínimos cuadrados indirectos, MCI, no se usa para calcular los valores de los parámet ros consistentes de ecuaciones exactamente identificadas : SI____;NO_____. 9.-Los MCI suponen el uso de MCO para obtener las ecuaciones de forma reducida : del sistema, para luego usar sus coeficient es en el cálculo de los parámetros estructurales:SI_____; NO____. : 10.-El método de mínimos cuadrados en dos etapas,MC2E, se usa para estimar parámetros estructurales consistentes en ecuaciones sobreidentificadas. Cuando están exactamente identificadas con este método se obtienen los mismos resultados que con el MCI: SI____; NO______.
186
Pro fesor Genaro Sá nchez Barajas