UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
SISTEMA DE ECUACIONES SIMULTÁNEAS
1. Introducción 2. El problema de identificación 3. Estimación de modelos de ecuaciones simultáneas
1. Introducción En la primera parte del curso vimos la estimación de modelos uniecuacionales. Veamos algunos ejemplos un tanto distintos, disti ntos, modelos denominados de ecuaciones simultáneas . 1. Consideremos la siguiente función de consumo y la identidad de cuentas nacionales
Y t t (1) (2) Y t C t Z t Las ecuaciones (1) y (2) (2) es el sistema de ecuaciones en su forma forma estructural, donde: C t
C t Y t Z t t
Es el gasto de consumo agregado Es el ingreso nacional Gasto que no representa consumo (inversión, gasto de gobierno, etc.) Perturbación estocástica
En este sistema, C t e Y t representan variables endógenas y Z t es la variable exógena del modelo. Los parámetros de las ecuaciones son denominados parámetros estructurales. Hagamos los siguientes supuestos: a) t N (0, 2 I ) b) Z t y t son independientes Reemplazando la ecuación (2) en (1), obtenemos:
(C t t ) t (1 )C t Z t t
C t
C t
1
1
Z t
t 1
(3)
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
y
C t Z t
Y t Y t
1
1 1
Z t
t
(4)
1
A las ecuaciones (3) y (4) se les denomina ecuaciones en su forma reducida. Las variables endógenas se expresan en función de variables predeterminadas del modelo (exógenas o endógenas rezagadas) y de la perturbación estocástica del modelo. Sea
vt
t
1
Si los errores en el modelo original no están correlacionados y son homoscedásticos,
2 v N 0, (1 ) 2 De la ecuación (4), se puede demostrar que:
I
2
Cov(Y t ,
t
)
(1
)
Habíamos vistos que bajo los supuestos del modelo lineal clásico, para obtener estimadores con propiedades deseables (insesgados y consistentes) los errores no deberían están correlacionados con ninguna de las variables explicativas del modelo. Por tanto, dado que el ingreso está correlacionado con la perturbación estocástica, concluimos que si aplicamos MCO a la ecuación (1) (es decir, a la función de consumo), obtendríamos estimadores sesgados e inconsistentes. 2. Consideremos el caso en que ambas ecuaciones son estocásticas: y 1t 21
12
y 1t
y 2t
11
1t
y 2t
21
2t
(5) (6)
En lo que sigue, se utilizará la letra y para denotar variables endógenas y la x para las variables predeterminadas (las variables no están en desviaciones a la media). Imponiendo las restricciones 12 0 y 21 0 , denotando y como el precio e y como la cantidad, podríamos interpretar el sistema como uno de una recta de demanda y una recta de oferta, respectivamente. A fin de que el intercepto de la demanda sea positivo, desearíamos imponer la restricción 11 0 1
Si y2 *
el modelo podría ser representado como en la figura 1 donde y1 representan el precio y la cantidad de equilibrio, respectivamente.
1t
2t
0,
2
*
e
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
Figura 1 (Tarea Dibujar el sistema)
Errores aleatorios, distintos de cero harán desplazarse a la curva de demanda y oferta generando una nube de puntos ( y1 , y 2 ) alrededor del equilibrio ( E ) La pregunta que surge es ¿cómo estimar 2 funciones (oferta y demanda) por separado conociendo sólo una nube de puntos ( y1 , y 2 )?. Dicho problema se llama el problema de identificación. Éste se refiere a si una ecuación específica de un modelo de ecuaciones simultáneas puede ser estimada. En particular, si los parámetros estructurales de una de las ecuaciones que constituye el sistema de ecuaciones simultáneas pueden ser estimados. Para investigar el problema de identificación en las ecuaciones anteriores, tenemos que mirar la forma reducida del modelo (expresar las variables endógenas del modelo en términos de los errores del modelo y las variables predeterminadas). y1t
12
(
21
y 1t
21
2t
)
11
1t
(reemplazando la ecuación (6) en (5)) 1
y 1t
1
(
12
11
12
21
)
1t
12
2t
21
Y por lo tanto, y2t
1 1 12 21
(
21 11
21 ) 21 1t 2t )
Las ecuaciones anteriores se pueden escribir como: y1t v1t (7) 1 y 2t v 2 t (8) 2 Donde 11
12
21
1
21
11
21
2
1t
v 1t v 2t 1
12
21
1t
12
21
2t
2t
)
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
Si imponemos: E(
t
E(
)
E
t
t
1t
0
2t
0
')
11
12
21
22
Entonces: E (v t ) var( v 1t )
var( v 2 t )
2 1t
E (v )
22
2
12
12
2 2 21
2 2t
E (v )
Cov(v 1t , v 2 t )
2 12
11
0
11
2
22
21
12
2
21
E (v 1t v 2 t )
11
12
(1
22
12
21
)
12
2
Se sigue de (7) y (8) que: E ( y1 ) 1
E ( y2 ) 2
var( y1 ) var(v1 )
Cov( y1º , y2 ) cov(v1 , v2 )
var( y2 ) var(v2 ),
(9)
Utilizando datos muestrales de y y y podemos estimar los 5 parámetros de la forma reducida ( 1 , 2 , var( v1 ), var( v 2 ), cov( v1 , v 2 ) ). Sin embargo, éstos son funciones de los 7 parámetros estructurales del modelo: 12 , 21 , 11 , 21 , 11 , 22 , 12 . Por lo tanto, los parámetros estructurales no son identificables. 1
2
Hay 3 vías que básicamente pueden ayudar a identificar una o ambas ecuaciones del modelo: (1) restricciones en los parámetros estructurales ' s y ' s , (2) restricciones en la matriz y (3) reespecificaciones del modelo que incorporen variables adicionales. Veamos un ejemplo del caso (1) Supongamos en particular, que 21 0 . Esto reduce el número de parámetros estructurales a 6, pero el número de parámetros de forma reducida sigue siendo 5. Aparentemente, los parámetros estructurales siguen no identificados. Pero si sustituimos la restricción en y 2 obtenemos: 1
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
11 1
21
11
2
2 21 1
Lo anterior implica que
21
puede ser estimado como
ˆ
y2 21
y1
(¿Por qué? R. Las
estimaciones MCO de y 2 en (7) y (8) son las medias muestrales de las variables dependientes). Esto permite identificar la ecuación de oferta pero la ecuación de demanda sigue sin ser identificada. 1
Supongamos ahora una restricción del tipo (2), la cual establece que var(
1t
)
11
Esto implica que
0
12
0 puesto que
es no estocástico.
1t
Ahora las ecuaciones se reducen a: 2 12
var( y 1 )
22 2
22
var( y 2 )
2
cov( y1 , y 2 )
12
22
2
Es decir, 3 ecuaciones con 3 incógnitas, de modo que:
12
var( y 1 )
cov( y 1 , y 2 )
var( y 1 )
var( y 2 )
var( y 2 )
cov( y 1 , y 2 )
Ello implica que la pendiente de la función de demanda está identificada. Tomando la esperanza en (5) da: 11 11
también es identificable
Lo anterior puede ser graficado como:
1 12 2
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
Movimientos de la curva de oferta permiten identificar la curva de demanda Consideremos reespecificar el modelo incluyendo variables exógenas (tercera forma).
12 y2 11 x1 12 x2 1t 21 y1 y 2 21 x1 23 x3 24 x4 2t y1
Con
12
0
y
0
21
La forma reducida del modelo es: x1
(10)
1 (
y1
11
(
y2
21
12
21
11
)
12
21
21
12
12
23
12
23
24 24
x2
v1
x3
v2
x4
Donde
1
12
21
y las
v' s
son aquellas dadas en las ecuaciones (7) y (8)
Las ecuaciones en (10) pueden ser reescritas como: x1 y1
1
11
y2
21
21
22
31 23
41
x2
v1
24
x3
v2
(11)
x4
Ello implica que
22 21
13
,
12
Una vez que encontramos los
14
12 23
's
, los
's
24
pueden ser encontrados de
11
y
21
.
Vemos que hay 8 parámetros de forma reducida pero sólo 7 parámetros estructurales. Ello proviene del hecho que existen dos estimadores posibles para . A priori, no hay razón por la cual estas estimaciones sean iguales (el sistema está sobreidentificado). 12
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
2. Problema de identificación Asumamos un modelo lineal que contiene G ecuaciones, cada una con t observaciones. La i ava ecuación se puede escribir como:
... iG Y Gt it X 1t .... iK X KT it i 1,2...G t 1,2...T i1Y it
(13)
Las variables Y it son las variables endógenas en t y las X it indican variables predeterminadas (corrientes o en rezagos) que puede incluir rezagos de las Y ' s . El modelo anterior puede ser escrito matricialmente como: y t
xt t
t 1,2,....T
donde de dimensión GxG , es la matriz de los coeficientes de las variables endógenas, de dimensión GxK es la matriz de coeficientes de las variables predeterminadas. t , y t y x t son vectores columnas de dimensiones Gx1 , Gx1 y Kx1 respectivamente. Esto es:
11 21 G1
12 22
G 2
11 12 22 21 G1 G 2 Y 1t yt
Y 2 t ...
Y Gt
xt
... 2G ... GG ...
1G
...
1K
...
2 K
...
GK
X 1t
1t
X 2 t
2t
...
X Kt
... Gt
Asumimos que es invertible, de otra forma existirían ecuaciones en el sistema que serían meras combinaciones lineales de otras ecuaciones. Por lo tanto, si existe, el modelo en forma reducida es: 1
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
yt
xt t
t 1,2,...T
(14)
Con 1 t 1 t La matriz es GxK . El problema de identificación surge porque con una muestra de xt y y t (t 1,2,...T ) a lo más podemos conocer los elementos de y los elementos de la matriz varianzacovarianza del vector . A fin de identificar los parámetros estructurales en y es necesario incorporar información adicional al modelo. Tal información usualmente toma la forma de restricciones en los elementos de y y, a veces, en los elementos de (matriz de varianzas-covarianzas de los errores estructurales del modelo)
Restricciones de los coeficientes estructurales El modelo estructural en (13) puede ser escrito como: Azt
y t t xt
(15) y t vector de x t
con A , matriz de todos los coeficientes estructurales, z t observaciones de todas las variables en t .
Consideremos la identificación de la primera ecuación. El procedimiento de identificación es equivalente para el resto de las ecuaciones. Sea la primera fila de como: 1
A.
Entonces la primera ecuación estructural puede ser escrita 1 z t
1t
La mayoría de las restricciones son de exclusión. Por ejemplo la variable Y t no aparece en la primera ecuación. Por lo tanto, 13 0 Esta restricción se puede escribir como: 3
11
12
13
... 11
0 0 1 ... 1K 0 0 0 0 0
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
Por ejemplo, si además 11 12 , tenemos que
11
12
13
... 11
1 1 0 ... 1K 0 0 0 0 0
Si estas son las únicas restricciones a priori sobre , éstas pueden ser resumidas en: 1
1 0
(16)
0 1 0 1 1 0 Con 0 0 ... ... 0 0
En este caso, es de dimensión (G K ) x2 . Además de las restricciones en (16), existen relaciones entre los coeficientes estructurales y aquellos de la forma reducida: 0 AW 0
con: A
y W I
Por lo tanto, las restricciones sobre los coeficientes estructurales de la primera ecuación son: 1 W 0 (17) combinando las dos restricciones anteriores: 1 W
0
(18)
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
Si los elementos de son conocidos, el conjunto de restricciones es un conjunto de ecuaciones de K R ecuaciones en G K incógnitas. A fin de identificar la primera ecuación, el rango de W debe ser G K 1. De otra forma, 1 0W 1 0 (W , ) . En este caso, existirían múltiples soluciones para que pasan por el origen 0 ( es decir, 0 es solución de (18)) 1
Si imponemos 11 1 (normalización) determinamos de forma única. 1
Por lo tanto, tenemos la siguiente condición de rango rangoW
G K 1 (19)
Es una condición necesaria y suficiente para identificar la primera ecuación. (en general, para la ecuación i-ava debe cumplirse la condición de rango anterior) En la práctica la condición de rango es difícil de comprobar porque requiere construir . Por lo tanto, uno primero chequea condiciones necesarias para la identificación. Dado que W tiene K R , una condición necesaria para que se dé es que: K R G K 1 R G 1
(20)
es la condición de orden. Esta establece que el número de restricciones a priori no debe ser inferior al número de ecuaciones en el modelo menos 1. Si hay sólo restricciones de exclusión, la condición de orden es que el número de variables excluidas de la ecuación debe ser al menos tan grande como el número de ecuaciones en el modelo menos 1. Finalmente, podemos expresar
R
como: RG g
K k
Entonces la condición, R G 1 queda como: RG g
K k G g K k G 1 K k g 1
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
El número de variables predeterminadas excluidas de la ecuación debe ser al menos tan grande como el número de variables endógenas incluidas menos 1. Si R G 1, la primera ecuación está exactamente identificada. Si R G 1 se dice que la ecuación está sobreidentificada (esto es, hay más restricciones que las necesarias para la identificación). La condición de rango se puede reescribir como: rango W
la forma rango A
G
K 1
G 1
rango A
G
solo involucra los coeficientes estructurales.
Ejemplo: Supongamos un sistema de 2 ecuaciones:
12Y 2t 11 X 1t 12 X 2t 1t 21Y 1t 22Y 2t 21 X 1t e 2 X 2t 2t 11Y 1t
Supongamos que imponemos las restricciones: 12
0
21
0 (restricciones de exclusión)
Para la primera ecuación:
0 0 0 1
11
12
11
12
21
22
21
22
A
1 (21)
0 A 12 rango( A) G 1 2 1 1 22 22 Si 22 0 . Por lo tanto, la primera ecuación está identificada. 0 0 Para la segunda ecuación, 1 0
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
A 11 rango( A) G 1 2 1 1 . Si 11 0
0 también está identificada.
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
3. Estimación de ecuaciones simultáneas Mínimos cuadrados indirectos Este método es factible para una ecuación que está exactamente identificada. El primer paso consiste en estimar los coeficientes del modelo reducido por MCO ecuación por ecuación. Luego obtenemos los parámetros del modelo estructural de relaciones algebraicas entre estos y los del modelo reducido. El modelo estructural en
t
puede ser escrito como: y t
xt t
(22)
t 1,2,....T
Con Y 1t Y 2 y t t ... Y Gt
X 1t X 2 t x t ... X Kt
Sea:
y1' x 1' ' ' y2 x y x 2 ... ... ' ' y T x T T
observaciones
(Por ejemplo y1' Y11 Y21 ... YG1 , x1 ' X11 X 21 ... X K1 ) Dado
T
observaciones, el modelo estructural puede ser escrito como: y ' x'
11
21
...
G1
12
22
...
G2
... 1T
El modelo en forma reducida es:
(23)
... 2T
... ...
... GT
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
y x'v
' ( ' ) 1 v ( ' )
1
Entonces, la estimación MCO de la forma reducida es:
' ( x' x) 1 x' y ˆ
Supongamos que estamos interesados en estimar la i-ava ecuación: Yi
y1 1 x1 1 i
La cual puede ser reescrita como:
Y
i
y1
1 x 1 1 i 1
o
Y
i
y1
y2
x1
1 1 x 2 0 i 1 0
donde y y x 2 son matrices de G g y K k variables endógenas y predeterminadas respectivamente, excluidas de la ecuación: 2
Sabemos además que:
' ' ' 1 1' ' 1 0 0 Sabemos que ( x' x) 1 x' y Por lo tanto, ˆ
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
1 ' ( x ' x ) 1 x ' y 1 1 0 0 ˆ
ˆ
o
( x ' x ) 1 x ' Yi
1 ' y 2 1 1 0 0 ˆ
y1
ˆ
entonces: 1
( x ' x) x ' Yi
1' 0
1
ˆ
(x ' x ) xy 1 1 ˆ
Sea: x ' Yi
1' (x' x) 0 ˆ
xy 1 1 ˆ
Entonces obtenemos:
(x 1 ' y1 ) 1,ILS (x 1 ' x 1 )1,ILS x 1 ' Yi (x ' y ) 2 1 1,ILS (x 2 ' x 1 )1,ILS x 2 ' Yi ˆ
ˆ
ˆ
ˆ
Este es un sistema de K ecuaciones con g 1 k incógnitas. Dado que para tener identificación de la ecuación bajo consideración requerimos K k g 1 , tenemos el mismo número de ecuaciones que de incógnitas. En consecuencia, existe una solución única para y . Notemos que el método anterior puede interpretarse como un método de variables instrumentales. La ecuación estructural bajo consideración es: Yi
Sabemos que
y1 1 x1 1 i
y1 está correlacionado con i
, por lo que MCO es inconsistente.
Dado que x 2 no está correlacionada con pero sí está correlacionada con y (ver sistema en la forma reducida). Podemos usar x1 x2 como instrumentos de x1 y1 i
1
UNIVERSIDAD CATÓLICA BOLIVIANA
ECONOMETRIA I LIC. FERNANDO ESCOBAR
1
1,IV x 2 ' y1 1,IV x 1 '
x ' x 1 2 Yi x 1 '
ˆ
ˆ
que es idéntica a la solución anterior.
Mínimos cuadrado en dos etapas En la práctica no es común encontrar ecuaciones que estén exactamente identificadas. Mínimos cuadrados en dos etapas es un método de estimación ampliamente usado que sirve para ecuaciones que están exactamente identificadas o sobreidentificadas. Consideremos la ecuación:
y1 1 x1 1 i Sabemos que la condición necesaria para identificar es que K k g 1 . MCO aplicado a la ecuación anterior da estimadores inconsistentes. MC2E reemplaza y por Y1T
1
y1 ˆ
Donde este último es computado como: 1 y1 x( x' x) x' y1 ˆ
Es decir, se corre una regresión de cada variable en predeterminadas del modelo. En el segundo paso, corremos la regresión de
Y 1T
en
y1 ˆ
y
y1
x1
en todas las variables
lo que da:
y1 y1 y1 x 1 1,MC2E y1 ' Y1T x ' y x ' x 1 1 1 1 1,MC2 E x 1 ' Y1T ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
Se puede demostrar que el estimador es consistente. En este caso, el estimador de Mínimos Cuadrados en dos etapas, también puede ser interpretado como un método de variables instrumentales donde la matriz de instrumentos para y1 x1 es y1 x1 ˆ