PUBLI PUBL I CACI CAC I ONES ONES DE 4º 4º CURSO
Licenciatura: ECONOMICAS A sign ignatura ra:: M ODEL ODEL OS REGI REG I ONAL ES
TEM T EMA A 4: 4:
DATOS AT OS PANEL: PANEL : MOD M ODEL EL OS EST EST ÁTI ÁT I COS
A utor utores: J esús M ur; Ana A ngulo ngulo Dep Depar tam tamento nto: ANÁ A NÁLL I SI S ECONÓMI ONÓM I CO
Curso Académico: 2008/2009
Facultad de Ciencias Económicas y Empresariales Unive niverrsidad deZar arag agoza oza
2
Indice
1- Intr I ntrod oducc ucciión. ón. 2- Fuentes uentes de heter heterogeneidad neidad en en conjunt conjuntos os de datos panel. 3- Estima stimaci ción ón en en mode modellos de datos panel estáti estáticos cos.. 4- Contrastes de especificación en modelos de datos panel estáticos. 5- Efectos espaci espacial ale es en modelos modelos de datos panel panel.
3
1. INTRODUCCIÓN
Se dice dice que estam estamos en presenci presencia a de un conjunto conjunto de datos de panel cuando se dispone, simultáneamente, de información de corte transversal y de serie temporal. Esto es cuando se dispone de observaciones sobre determinadas características de un conjunto de agentes (individuos, países, empresas, etc.) a lo largo de un período continuado de tiempo. La recogida recogida de informa nformaci ción ón se lleva a cabo, cabo, por tanto, en dos d diimensi ensione oness y, de este este modo, se generan múltiples observaciones puntuales para cada unidad económica. Generalmente, los paneles de datos se distinguen unos de otros según su amplitud transversal y temporal . Así, los paneles con un número muy amplio de observaciones transversales y un número de períodos reducido se denominan Paneles Micro. En el caso contrario, número de periodos elevado e información transversal reducida se conoce con el nombre de Paneles Macro. Por último, en el caso realmente extraordinario de contar con un panel con amplia dimensión tanto temporal como transversal hablaríamos de un Campo aleatorio (Random Field).
Así mismo, resulta habitual hablar de paneles de datos equilibrados o paneles completos cuando el número de observaciones transversales es el mismo para cada período temporal.
Comenzaremos presentando una breve descripción de las principales ventajas, así como de las limitaciones, del uso de muestras de datos de panel en la investigación económica en relación con las bases de datos que sólo contemplan una dimensión temporal (series temporales) o individual (corte transversal). Para ello nos basaremos en los traba trabajjos de de Hsia Hsiao (2000), (2000), K levma vmarken (1989 (1989), ), Solon Solon (1989 (1989)) y Ba Baltagi tagi (2001). (2001). Entre Entre las principales ventajas hay que destacar las siguientes:
1) Los L os datos datos de pane panell proporci proporcionan onan menos enos problem problemas de multi ulticol coliineal nealiidad dad (presente en numerosas ocasiones al utilizar datos de series temporales), más grados de
4 libertad y, por tanto, mayor eficiencia. En efecto, la utilización de datos de panel, como ya hemos comentado, permite utilizar un conjunto de datos más informativos, en el sentido de que es capaz de recoger con mayor precisión la variabilidad en los datos, tanto la existente entre individuos como la que existe a lo largo del tiempo. 2) Asimismo, la utilización de datos de panel permite identificar y medir algunos efectos que no pueden considerarse al utilizar únicamente datos de corte transversal o datos de series temporales. Ben-Porath (1973) sugiere un ejemplo. Supongamos que tenemos datos de corte transversal correspondientes a un determinado número de mujeres en el que una variable es la participación media anual en el mercado de trabajo. Supongamos que una determinada mujer ha participado una media del 50%. Esta cifra ha podido ser generada por dos situaciones diferentes. O bien ha trabajado el 50% de los años considerados, o bien trabaja a tiempo parcial durante todos los años. Las implicaciones de ambas situaciones son distintas y sólo la utilización de datos de panel permitiría discriminar ambas situaciones. 3) A diferencia de los datos de corte transversal, una ventaja adicional de los datos de panel radica en la posible modelización de efectos dinámicos. Por ejemplo, en los datos de corte transversal podemos determinar qué porcentaje de la población consume un determinado producto en un determinado momento. La utilización de datos de panel permite analizar qué porcentaje de personas que consumían un producto siguen haciéndolo y quienes han dejado de consumirlo. Un ejemplo de esto que acabamos de mencionar referido al desempleo puede encontrarse en Ashenfelter (1978) y Ashenfelter y Solon (1982). 4) Otra de las ventajas atribuidas a los datos de panel con respecto a los datos de corte transversal es la gran capacidad que ofrecen al investigador de construir y contrastar complicados modelos de comportamiento. De hecho, el análisis y la modelización de la eficiencia técnica resulta más interesante realizarla utilizando datos de panel (Baltagi y Griffin, 1988b; Cornwell y otros, 1990; y Kumbhakar, 1990, 1991, 1992, 1993). Además, es necesario introducir menos restricciones a la hora de estimar modelos de retardos distribuidos usando datos de panel, en relación con los que son necesarios cuando se utilizan datos de series temporales (Hsiao, 1986).
5
5) Por otra parte, los datos de panel permiten resolver o reducir la magnitud de un problema econométrico muy importante que, a menudo aparece en los estudios empíricos. Nos referimos a la presencia de variables omitidas (inobservadas u observadas con error) que están correlacionadas con las variables explicativas del modelo. Por ejemplo, consideremos el siguiente modelo de regresión: yit = α + xit' β + zit' ρ + ε it
i = 1,..., N ;
t = 1,..., T
(1)
donde dada la naturaleza de los datos, utilizaremos dos tipos de subíndices: i para los individuos1 ( i = 1,..., N ) y t para el período temporal ( t = 1,...,T ) y donde xit y zit son vectores de variables exógenas, donde el término de error
ε it
se distribuye de forma
idéntica e independiente sobre i y t con media cero y varianza
σ ε 2 .
En estas
circunstancias, es bien conocido que la estimación MCO proporciona estimadores consistentes de los parámetros del modelo α , β y ρ . Sin embargo, si suponemos que las variables incluidas en zit son inobservables, y que además la covarianza entre xit y zit no es cero, (es decir, están correlacionadas con xit ), entonces los estimadores MCO obtenidos al hacer la regresión de yit sobre xit serán sesgados2.
En estas circunstancia, se puede comprobar como la disponibilidad de datos de panel permite solucionar el problema. Al disponer de observaciones repetidas para un grupo de individuos podemos eliminar el efecto de las variables incluidas en z . Si por ejemplo, zit = zi para todo t (los valores de z permanecen constantes a lo largo del tiempo para un individuo, pero varían entre individuos), podemos tomar las primeras diferencias de las observaciones individuales en el tiempo y obtener:
1
Utilizaremos el término individuos para referirnos a las unidades de corte transversal. Como se ha comentado con anterioridad, también puede tratarse de empresas, hogares, países, etc. 2
Siempre que se omiten variables relevantes se incurre en un problema de sesgadez de los parámetros incluidos salvo que las variables incluidas y las omitidas sean ortogonales.
6 '
yit − yi ,t−1 = (xit − xi ,t−1 ) β + (ε it − ε i ,t−1)
i = 1,..., N ;
t = 1,..., T
(2)
De forma análoga, si zit = zt para todo i (los valores de z permanecen constantes entre individuos en un determinado momento del tiempo, pero presentan variación temporal), podemos tomar desviaciones con respecto a la media entre individuos en un periodo de tiempo y obtener: '
− − ⎛ ⎞ ⎛ ⎞ yit − yt = ⎜ xit − xt ⎟ β + ⎜ ε it − ε t ⎟ ⎝ ⎠ ⎝ ⎠ −
N
∑1 y
N
it
donde yt =
i=
N
∑1 x
, xt =
N
t = 1,..., T
(3)
N
it
i=
i = 1,..., N ;
∑1 ε
it
y ε t =
i=
N
.
De esta forma, podemos obtener estimadores insesgados y consistentes para β , en base a las regresiones (2) y (3). Sin embargo, si únicamente se hubiera dispuesto de datos de corte transversal ( T=1) para el primer caso ( zit = zi ), o datos de series temporales (N=1) para el segundo ( zit = zt ), tales transformaciones no se podrían haber llevado a cabo. En consecuencia, no se podrían obtener estimadores consistentes de β a no ser que se contara con instrumentos que estuvieran correlacionados con z, pero incorrelados con x y ε .
Existen numerosas aplicaciones que permiten ilustrar este punto. Utilicemos, por ejemplo, el trabajo de Baltagi y Levin (1992) en el que se estima la demanda de tabaco en Estados Unidos de 46 estados durante 25 años. Concretamente, se modeliza el consumo como una función de la renta, los precios y el consumo retardado. Estas variables varían entre estados y en el tiempo. Sin embargo, hay muchas otras variables que pueden ser invariantes en el tiempo o entre estados y pueden afectar al consumo. Ejemplos de las primeras (invariantes en el tiempo) serían la religión o la educación. Entre las segundas podría citarse la publicidad sobre radio o televisión que, normalmente, relaciona negativamente el consumo de tabaco con la salud. La
7 información referente a dichas variables es difícil de obtener y, en consecuencia, su omisión conlleva problemas de sesgos en las estimaciones, a no ser que se explote la naturaleza de los datos panel para eliminar sus efectos. 6) Finalmente, los datos de panel se recogen a nivel de micro-unidades como individuos, empresas u hogares (familias), eliminándose los sesgos causados principalmente por la agregación de individuos, empresas o productos (Blundell, 1988, Klevmarken, 1989 y; Blundell y Meghir, 1990).
Entre las limitaciones de los datos de panel hay que destacar las siguientes:
i) Problemas asociados al diseño y recogida de la información. Kasprzyk y otros (1989) ofrecen una extensa discusión sobre esta problemática. En cualquier caso, entre estos problemas podemos citar la posible no representatividad de la muestra elegida, las posibles no respuestas por falta de cooperación de los entrevistados, el que el entrevistado no recuerde con exactitud su comportamiento, etc. (Bailar, 1989).
ii) Distorsiones debidas a errores de medida. Kalton y otros (1989) indican que los errores de medida surgen a causa de respuestas falsas que, por su parte, son fruto de respuestas ambiguas, errores de memoria, mentiras deliberadas de los encuestados (sesgo de prestigio) o bien debidos a los sesgos que puede introducir el propio encuestador.
iii) Una tercera limitación hace referencia a los posibles problemas de selección. En ocasiones, es el propio investigador el que establece una especie de autoselección, por ejemplo cuando sólo estamos interesados en aquellos que consumen por encima de un determinado nivel, con lo que artificialmente estamos truncando la muestra con los consiguientes problemas que eso puede traer consigo (Hausman y Wise, 1979). Otro problema asociado con la selección hace referencia a la posible no respuesta debido a que el encuestado rechaza participar o no está en casa, etc, aunque esto sólo ocurre en la etapa inicial de la recogida de datos. Finalmente, destacamos el problema de lo que se
8 denomina “atrición” que, en cierto modo, también se puede catalogar como no respuesta pero una vez que el panel está en funcionamiento. De las personas que originalmente participan algunos pueden renunciar voluntariamente o bien se desplazan del lugar, o bien mueren. En estas ocasiones, suelen sustituirse por personas de similares características. Björklund (1989) y Ridder (1990, 1992) proporcionan una descripción detallada de las consecuencias de la atrición. iv) Finalmente, la última limitación hace referencia a que en la mayoría de los casos la dimensión temporal del panel es generalmente reducida. Ello hace que la mayor parte de los argumentos asintóticos utilizados en los procedimientos de estimación e inferencia recaigan casi exclusivamente en el número de individuos encuestados. En la mayor parte de los casos, la reducida dimensión temporal de los paneles tienen mucho que ver con el coste de obtención de los datos. Además, incrementar la dimensión temporal puede aumentar también los problemas de atrición que acabamos de mencionar.
Un concepto importante en el contexto de datos de panel es lo que se denomina heterogeneidad y, asociada a ella, sesgo de heterogeneidad. Como en todo tipo de modelizaciones, un modelo de datos de panel pretende explicar una variable a través de las variables más importantes, excluyendo ciertas variables cuyo impacto es menos significativo o peculiar de ciertos individuos. En estas circunstancias, la suposición típica de que una variable económica y es generada por una función de distribución probabilística P(y|θ), donde θ es un vector real idéntico para todos los individuos y períodos puede no ser realista. Es decir, el ignorar efectos específicos de individuos y tiempo que existen entre las unidades de tiempo o del corte transversal, y que no se capturan con las variables incluidas en el modelo, puede conducirnos a la presencia de heterogeneidad de los parámetros del modelo especificado. Es decir, la estimación del modelo general, sobre la base del total de las NT observaciones: yit = α + xit' β + ε it
i = 1,..., N ;
t = 1,..., T
(4)
puede conducir a importantes sesgos de heterogeneidad si, por el contrario, es conveniente diferenciar los parámetros en el tiempo o entre individuos.
9
En general, se pueden distinguir las siguientes formulaciones:
1) Los coeficientes de las pendientes son constantes, pero el término independiente varía entre individuos: yit = α i + xit' β + ε it
i = 1,..., N ;
t = 1,..., T
(5)
Esta formulación dará lugar a los modelos de componentes de error en una dirección.
2) Los coeficientes de las pendientes son constantes, pero el término independiente varía entre individuos y tiempo: yit = α it + xit' β + ε it
i = 1,..., N ;
t = 1,..., T
(6)
Esta formulación dará lugar a los modelos de componentes de error en dos direcciones.
3) Todos los coeficientes varían entre individuos: yit = α i + xit' β i + ε it
i = 1,..., N ;
t = 1,..., T
(7)
4) Todos los coeficientes varían entre individuos y tiempo: yit = α it + xit' β it + ε it
i = 1,..., N ;
t = 1,..., T
En todos los casos, se asume que el término de perturbación
(8)
ε it cumple
las
hipótesis básicas; es decir, se supone distribuido de forma idéntica e independiente sobre individuos y sobre el tiempo, con media 0 y varianza σ ε 2 .
Ilustremos con los siguientes gráficos los posibles sesgos al estimar el modelo (4) (con parámetros homogéneos), cuando lo correcto habría sido especificar, por
10 ejemplo, el modelo (5) (pendientes constantes y diferentes términos independientes), suponiendo que consideramos una única variable explicativa:
y
y
x
x
y
x
Donde cada elipse representa la nube de puntos para un individuo en el tiempo y, la línea recta que la atraviesa representan la regresión individual. Por otro lado, la línea más gruesa representa la línea de regresión correspondiente al modelo (4).
Sin embargo entre los modelos 5-8, son los dos primeros los que generalmente son utilizados en el marco de datos de panel. Es decir, lo habitual es incorporar heterogeneidad a través del término independiente. En consecuencia, el efecto de un cambio en las variables explicativas es el mismo para todos los individuos y períodos,
11 pero el nivel medio puede variar entre individuos (en 5) o entre individuos y tiempo (en 6).
Como ya se ha indicado, el supuesto básico de estos modelos radica en el hecho de que el efecto de todas las variables omitidas se recoge a través de tres tipos de variables: 1. Variables idénticas a lo largo del tiempo para cada individuo, pero que varían entre individuos. Por ejemplo, los atributos de la dirección de una empresa, la habilidad, el sexo así como muchas otras variables sociodemográficas. 2. Variables idénticas para todos los individuos en un período de tiempo, pero que varían en el tiempo. Dentro de ellas, se podrían considerar variables tales como los precios, el tipo de interés o el ambiente de pesimismo u optimismo de una economía en un momento del tiempo. 3. Variables que varían tanto entre individuos como en el tiempo. Algunos ejemplos podrían ser los beneficios de una empresa, las ventas o el stock de capital. Las cuales se pueden ver reflejadas a través del término independiente variable del modelo especificado.
Concluiremos esta sección mostrando la especificación propuesta por Hoch (1962) para estimar una función de producción con datos de panel. Se parte de la típica función de producción de tipo Cobb-Douglas: yit = μ + β 1x1it + ... + β k xkit + vit , donde y es el logaritmo del output y x1, ...,xk son los logaritmos de los inputs. A continuación, se trata de solventar la crítica habitual relativa al hecho de haber ignorado variables que reflejan diferencias en las estrategias de dirección de las empresas, diferencias en tecnología, etc., así como otro tipo de variables que afectan a la productividad de todas
12 las empresas pero que fluctúan en el tiempo. En consecuencia, se deberían introducir dichas variables que podemos denotar, respectivamente, como Mi y Pt en el modelo (9), obteniendo: yit =
+ β 1x1it + ... + β k xkit + α M i + λ Pt + ε it
(9)
Sin embargo, dado que las variables definidas como Mi y Pt son habitualmente no observadas, su efecto se traduce en un término independiente que varía entre empresas y/o tiempo tal y como se definió en las ecuaciones (5) y (6). De esta forma, se demuestra en el trabajo mencionado que teniendo en cuenta la heterogeneidad entre empresas y periodos se mejora la especificación del modelo, dado que se reduce o se evita el sesgo por omisión de variables relevantes.
Por último, cabe mencionar que los efectos específicos de los individuos y/o del tiempo recogidos en α i o α it en las ecuaciones (5) y (6), pueden tratarse como fijos o como aleatorios, dando lugar a dos tipos diferentes de modelos: • Si se les trata como parámetros desconocidos fijos, se obtiene el modelo de efectos fijos.
• Si por el contrario, asumimos que, aunque tales términos independientes
difieren entre individuos y/o tiempo, puede considerarse que proceden de una distribución de media
μ
y varianza
σ α 2 ,
se obtiene el modelo de efectos
aleatorios, donde los efectos individuales α i o α it son tratados como
aleatorios. El enfoque de efectos fijos está condicionado a los valores de
α i
o
α it
; es
decir, la distribución de la variable endógena se condiciona al valor de dichos parámetros, los cuales pueden estimarse. Por el contrario, el enfoque de efectos aleatorios no está condicionado a los valores individuales α i o α it sino que los integra. En términos formales:
13 ¾
Efectos fijos: E yit xit α i } = xit' β + α i
¾
Efectos aleatorios: E yit xit }= xit' β
o
}
E yit xit α it = xit' β + α it (10)
Por este motivo los modelos de efectos fijos se obtienen en base al enfoque condicional del modelo, mientras que los modelos de efectos aleatorios en base al enfoque incondicional. Además, como ya se ha mencionado para ambos modelos (de efectos fijos y aleatorios) se habla de modelos de componentes del error en una dirección (one-way) cuando se incorpora el término α i (ecuación 5, solo variación entre individuos), mientras que se habla de modelos de componentes del error en dos direcciones (two-way) cuando se incorpora el término α it (ecuación 6, variación entre individuos y tiempo). A continuación, procederemos a su definición.
2. ENFOQUE CONDICIONAL: EL ESTIMADOR INTRAGRUPO
El modelo de efectos fijos es simplemente un modelo de regresión lineal cuyos términos independientes varían entre individuos y/o tiempo. Consideraremos en primer lugar, el modelo (5) que incorpora, únicamente, la variación entre individuos, y que recibe el nombre de modelo de componente del error en una dirección, dedicando un segundo epígrafe más breve al modelo (6) o modelo de componente del error en dos direcciones.
2.2 MODEL O DE COMPONENTE DEL ERROR EN UNA DIRECCI ÓN
Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión lineal cuyos términos independientes varían entre individuos:
yit = α i + xit' β + ε it
ε it
~IID 0,σ ε 2
(11)
14
donde xit es un vector de variables explicativas de dimensión K (es decir, recoge la observación it de las K variables explicativas consideradas), que se asumen independientes de ε it ; y donde α i recoge el efecto de aquellas variables propias del individuo i que permanecen constantes en el tiempo y, que muy probablemente se encuentran correlacionadas con las variables incluidas en xit . En notación matricial: ⎡ x1 ⎤ ⎡ ε 1 ⎤ ⎡ y1 ⎤ ⎡ι T ⎤ ⎡ 0⎤ ⎡ 0⎤ ⎢ y2 ⎥ ⎢ 0⎥ ⎢ x2 ⎥ ⎢ ε 2 ⎥ ⎢ι T ⎥ ⎢ 0⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢. ⎥ ⎢. ⎥ ... + + + + + = . . α α α β . 1 2 N ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢. ⎥ ⎢ ⎥ ⎢ ⎥ . ⎢ . ⎥ ⎢.⎥ ⎢ .⎥ ⎢ .⎥ ⎢.⎥ ⎢ ⎥ ⎢ y ⎥ ⎢ 0⎥ ⎢x ⎥ ⎢ε ⎥ ⎢⎣ 0⎥⎦ ⎢⎣ι T ⎥⎦ ⎣ N⎦ ⎣ ⎦ ⎣ N⎦ ⎣ N⎦
siendo:
yi
⎡ yi1 ⎤ ⎢ . ⎥ ⎢ ⎥ =⎢ . ⎥ ⎢ . ⎥; ⎢y ⎥ ⎣ iT ⎦
'
ι T = (1,1,...,1)
(1xT )
T ( x1)
xi
⎡ xi'1 ⎤ ⎡ x1i1 ⎢ ' ⎥ ⎢ ⎢ xi 2 ⎥ ⎢ x1i 2 ⎢ .⎥ ⎢ . =⎢ ⎥=⎢ . . ⎢ ⎥ ⎢ ⎢ .⎥ ⎢ . ⎢ x' ⎥ ⎢ x ⎣ iT ⎦ ⎣ 1iT
T ( x K )
x2i1 ... xKi1 ⎤ ⎥ x2i 2 ... xKi 2 ⎥ ⎥ ⎥; ⎥ ⎥ x2iT ... xKiT ⎥⎦
⎡ β 1 ⎤ ⎢ β ⎥ ⎢ 2⎥ ⎢ . ⎥ β = ⎢ . ⎥ ⎢ ⎥ ⎢ . ⎥ ⎢⎣ β K ⎥⎦ (Kx1)
(12)
15 ε i = (ε i1,ε i 2, ..., ε iT , ) '
(1xT ) '
E ε i ε i = σ ε 2I T
con E ε i = 0,
y
'
E ε i ε j = 0 si i ≠ j
siendo I T la matriz identidad de orden T ( T x T).
Es decir, cada ecuación i-ésima, es de la forma: yi = ι Tα i + xi β + ε i
i=1,...,N
Esto puede escribirse en el marco del modelo de regresión tradicional mediante la inclusión de una variable ficticia para cada unidad i en el modelo: N
yit = ∑ α j dij + xit' β + ε it
(13)
j =1
donde dij =1 si i = j y 0, en otro caso. Es decir, se incluyen N variables ficticias en el modelo, tantas como individuos. Los parámetros
α 1,...,α N
y β pueden estimarse por
mínimos cuadrados ordinarios, a partir de (13). A los estimadores β así obtenidos se les denomina estimador de variable ficticia de mínimos cuadrados.
Sin embargo, dado que normalmente N (la dimensión transversal) es elevada, la regresión resultante (13) está constituida por un número muy elevado de regresores, lo cual resulta poco atractivo. No obstante, afortunadamente los estimadores contenidos en β pueden obtenerse de forma más sencilla, efectuando una regresión sobre las variables obtenidas como desviaciones respecto a las medias individuales. Básicamente, esto equivale a una transformación de los datos que implica la eliminación de los efectos individuales
α i .
Para analizar este punto, a partir de las medias temporales de cada
variable se define el modelo: '
yi = α i + xi β + ε i
(14)
16 T
∑1 y
T
it
donde yi =
t=
T
∑1 x
T
it
, xi =
t=
T
∑1 ε
it
y
ε i =
t=
T
.
Restando miembro a miembro las expresiones (5) y (14), se obtiene: '
yit − yi = ( xit − xi ) β + (ε it − ε i )
(15)
A este modelo se le denomina trasformación intragrupos. A los estimadores MCO para β , obtenidos a partir de este modelo transformado en desviaciones con respecto a las medias individuales se les denomina estimadores intragrupos o estimadores de efectos fijos (Fixed effect estimators, FE) y, como ya hemos comentado son idénticos a los obtenidos a partir del estimador de variables ficticias mínimo cuadrático. Estos estimadores, por tanto, se calculan a partir de la siguiente expresión: ^
β FE
⎛ N T ' ⎞ = ⎜ ∑∑ (xit − xi )(xit − xi ) ⎟ ⎠ ⎝ i =1 t=1
−1 N T
(x ∑∑ 1 1
it
i=
− xi )(yit − yi )
(16)
t=
El procedimiento anterior es equivalente a premultiplicar la ecuación i-ésima: (17)
yi = ι Tα i + xi β + ε i
por una matriz Q de orden ( T x T), simétrica e idempotente: Q = I T −
1
T
ι T ι T' :
(18)
Q yi = Qι Tα i + Q xi β + Qε i = Q xi β + Qε i
matriz, que aplicada a cualquier vector, lo transforma en desviaciones con respecto a su media (y, aplicado a una matriz, transforma sus columnas en desviaciones con respecto a su media). De esta forma, se elimina el término
α i
constante en el tiempo,
eliminándose, de esta forma el problema relativo a su probable correlación con las variables incluidas en xit . Por ejemplo:
17 ⎡ yi1 − yi ⎤ ⎢ . ⎥ ⎢ ⎥ Q yi = ⎢ . ⎥ y de forma análoga para Q xi y Qε i . ⎢ . ⎥ ⎢ ⎥ ⎣ yiT − yi ⎦
Haciendo uso de la nomenclatura anterior, el estimador de efectos fijos que se obtiene al aplicar MCO al modelo transformado es igual a: ^
β FE
⎛ N ⎞ = ⎜⎜ ∑ xi' Q xi ⎟⎟ ⎝ i =1 ⎠
−1
N
∑1 x' Q y i
(18)
i
i=
Expresión equivalente a la recogida en (16)3.
En consecuencia, a partir de lo indicado, puede comprobarse como el modelo de efectos fijos se concentra en las diferencias existentes “dentro” de los individuos. Es decir, se explica hasta qué punto yit se diferencia de la media temporal de esa variable, yi y, por tanto, no explica porque yi es diferente de y j .
Si se asume que todas las variables contenidas en xit son independientes de todos los términos β .
ε it , los estimadores de efectos fijos son estimadores insesgados de
Si además se impone normalidad para los términos de perturbación
ε it ,
los
^
estimadores de efectos fijos, β EF , también siguen una distribución normal, por lo que puede utilizarse los procedimientos de inferencia habituales. Para consistencia se requiere: E{(xit − xi )ε it } = 0
3
(19)
Este tipo de estimador es también equivalente al que se obtiene al transformar el modelo en primeras diferencias y después aplicar MCG para corregir el esquema de correlación tipo MA generado en dicha transformación.
18 La condición suficiente para que lo anterior sea cierto es que xit sea estrictamente exógena, lo cual equivale a que: E{xitε is} = 0 para
∀ s,t
(20)
es decir, que las variables explicativas no dependan ni de valores presentes, ni pasados ni futuros del término de error.
Esta condición puede resultar muy restrictiva en algunas aplicaciones. Por ejemplo, excluye la inclusión, como explicativa, de la variable endógena retardada así como la inclusión de cualquier variable que dependa de la historia de la propia variable endógena. Un ejemplo de esto último sería el caso de si para explicar la oferta laboral de un individuo se desea incluir en el modelo los años de experiencia, los cuales dependen de la propia historia laboral del individuo.
Además, en estas mismas circunstancias (variables explicativas estrictamente exógenas), los N términos independientes se estiman de forma insesgada como: ^
^
' α i = yi − xi β FE
i = 1,..., N
(21)
si bien, tales estimadores sólo son consistentes cuando T → ∞ .
^
La matriz de varianzas y covarianzas para los estimadores de efectos fijos β FE , suponiendo que
ε it
se define de forma idéntica e independiente entre individuos y
tiempo, con varianza σ ε 2 (es decir, hay homocedasticidad y no autocorrelación), viene dada por:
−1
N T N ^ ⎞ ' ⎞ ⎧ ⎫ 2 ⎛ 2 ⎛ V ⎨ β FE ⎬ = σ ε ⎜ ∑∑ ( xit − xi )( xit − xi ) ⎟ = σ ε ⎜⎜ ∑ xi' Q xi ⎟⎟ ⎩ ⎭ ⎝ i =1 t=1 ⎠ ⎝ i =1 ⎠
−1
(22)
19
Una estimación consistente de
σ ε 2
se obtiene a partir de la suma de los
( − 1) − K , es decir: cuadrados de los residuos intragrupos dividido entre N T
2 N T ^ ^ 1 ' ⎛ ⎞ σ ε = ⎜ yit − α i − xit β FE ⎟ = N T ( − 1) − K ∑∑ ⎠ i =1 t=1 ⎝ 2 N T 1 ⎛ ( y y ) ( x x )' ^ ⎞ = ⎜ it − i − it − i β FE ⎟ N T ( − 1) − K ∑∑ ⎠ i =1 t=1 ⎝ ^2
(23)
Por último, se debe hacer notar que una formulación alternativa a (11) consiste en introducir un término independiente medio : yit = μ + α i + xit' β + ε it
donde ahora
(24)
y α i son constantes fijas, las cuales no son separadamente identificables
a no ser que se introduzcan restricciones adicionales. Lo habitual es introducir la restricción
N
∑1 α = 0 . Entonces el efecto individual i
α i
representa la desviación del
i=
individuo i de la media común conocido. Los estimadores de ^
'
. El estimador del parámetro β es idéntico al ya y α i son, respectivamente:
^
^
μ = y − x β FE ;
N T
y ∑∑ 1 1
donde y =
t=
NT
'
^
N T
it
i=
^
α i = yi − μ − xi β FE
x ∑∑ 1 1
it
y
x =
i=
t=
NT
2.2 MODEL O DE COMPONENTE DEL ERROR EN DOS DIRECCIONES
(25)
20
Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión lineal cuyos términos independientes varían entre individuos y tiempo:
yit = α it + xit' β + ε it = α i + λ t + xit' β + ε it
(26)
En este caso, para obtener los estimadores de efectos fijos, se debe llevar a cabo una transformación diferente de tal forma que desaparezcan tanto los efectos individuales α i como los temporales
λ t . En este caso, los estimadores resultantes son
los que resultan de aplicar MCO a la siguiente ecuación de variables transformadas:
(yit − yi − yt + y ) = (xit − xi − xt + x)' β + (ε it − ε i − ε t + ε )
(27)
donde, como ya se ha definido con anterioridad: T
∑1 y
it
yi =
t=
T
es la media temporal;
N T
y ∑∑ 1 1
it
y =
i=
t=
NT
es la media total;
N
∑1 y
it
y
yt =
i=
N
es la media por individuos.
Y ahora los estimadores de los efectos α i y λ t vienen dados por: ^
' ^
α i = ( yi − y) − (xi − x ) β EF ^
' ^
λ t = ( yt − y) − (xt − x ) β EF
(28)
21 No obstante, para especificar este tipo de modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles (N elevado, pero T pequeño) este modelo es escasamente utilizado. En estos casos, lo que se suele hacer es incorporar al modelo las correspondientes dummies temporales.
3. ENFOQUE I NCONDICIONAL: EL ESTIMADOR GLS
Al igual que en el caso del modelo de efectos fijos consideraremos en primer lugar, el modelo que incorpora, únicamente, la variación entre individuos ( modelo de componente del error en una dirección), dedicando un segundo epígrafe más breve al modelo de componente del error en dos direcciones.
3.1 MODEL O DE COMPONENTE DEL ERROR EN UNA DIRECCI ÓN
Tal y como se ha comentado con anterioridad, en el modelo de efectos aleatorios los efectos individuales α i son tratados como aleatorios y, además se distribuyen de forma idéntica e independiente entre individuos, es decir: yit = μ + xit' β + α i + ε it ,
donde
ε it
~IID 0,σ ε 2 ;
α i
~IID 0,σ α 2
(29)
denota al término independiente; α i + ε it es tratado como un término de error
compuesto de dos componentes: un componente específico individual (invariante en el tiempo) y otro componente que varía entre individuos y en el tiempo y, que se supone incorrelado temporalmente. Además, se asume que α i y ε it son independientes entre sí e independientes de x js , para todo j y s .
Ó en términos matriciales: yi = ι T μ + xi β + ι Tα i + ε i = xi+δ + vi siendo xi+ = (ι T , xi );
(
δ ' = μ , β '
);
vi' = (vi1,...viT ); y vit = α i + ε it
(29’)
22
En consecuencia, teniendo en cuenta los anteriores supuestos, los estimadores MCO de los parámetros y β ( δ ) en la ecuación (29’): ⎛ N + ' + ⎞ δ = ⎜ ∑ xi xi ⎟ ⎜ i =1 ⎟ ⎝ ⎠ ^
−1
N
∑1 x ' y + i
(30)
i
i=
son insesgados y consistentes.
Sin embargo, la estructura de componentes del error implica que el término de error α i + ε it , presenta una forma particular de autocorrelación (a menos que
σ α 2 = 0).
En efecto, la matriz de varianzas y covarianzas del término de error para el individuo i, vi = ι Tα i + ε i , es igual a:
⎡σ α 2 + σ ε 2 ... σ α 2 σ α 2 ⎤ ⎢ ⎥ 2 σ α 2 + σ ε 2 σ α 2 ⎥ ⎢ σ α . ⎢ ⎥ E (vi vi' ) = Ω = σ ε 2I T + σ α 2ι Tι T' = ⎢ ⎥ . ⎢ ⎥ . ⎢ ⎥ 2 2 2⎥ ⎢ σ 2 ... σ α + σ ε ⎦ σ α α ⎣
(31)
NOTA Una forma muy cómoda de expresar la matriz anterior Ω es la siguiente: 2
2
'
' 2 ι Tι T
2
Ω = σ ε I T + σ α ι Tι T = σ ε I T + Tσ α 2 ⎛
ι Tι T' ⎞
T
' 2 ι Tι T
+ σ ε
T
' 2 ι Tι T
− σ ε
T
=
' 2 ι Tι T
⎟⎟ + T ( σ α + σ ε ) = σ ε ⎜⎜ I T − T T ⎝ ⎠ 2
⎛ ι Tι T' ⎞ ι Tι T' ⎟⎟ y ya que dadas las propiedades de ⎜⎜ I T − se cumple que la potencia r de T T ⎝ ⎠
dicha matriz es igual a:
23 En consecuencia, las desviaciones típicas estimadas por los procedimientos habituales aplicado para MCO son incorrectas y, se debe de recurrir a estimadores mínimo cuadráticos generalizados (Generalized Least Square, GLS) para obtener estimadores más eficientes. Como en casos análogos, se utiliza la inversa de la matriz Ω para derivar el estimador GLS de los parámetros de la ecuación (29’): ⎛ N + ' −1 + ⎞ δ GLS = ⎜ ∑ xi Ω xi ⎟ ⎜ i =1 ⎟ ⎝ ⎠ ^
−1
N
∑1 x ' Ω 1 y + i
−
i
(32)
i=
siendo: −1
1 ⎛ ⎜
ι Tι T' ⎞
1
ι Tι T'
⎟+ = T ⎠⎟ Tσ α 2 + σ ε 2 T ⎛ σ ε 2 ⎞ ι Tι T' ⎤ 1⎡ ⎟ = 2 ⎢ I T − ⎜⎜1− 2 ⎥= 2⎟ T σ ε ⎢⎣ σ σ T + ⎥⎦ ε α ⎠ ⎝ 1 ⎡⎛ 1 ⎞ 1 ⎤ 1⎡ 1 ⎤ = 2 ⎢⎜ I T − ι Tι T' ⎟ + ψ ι Tι T' ⎥ = 2 ⎢Q + ψ ι Tι T' ⎥ T T σ ε ⎣⎝ ⎠ T ⎦ ⎦ σ ε ⎣
Ω =
I T −
σ ε 2 ⎜⎝
con ψ =
σ ε 2 σ ε 2 + Tσ α 2
Por último, teniendo en cuenta que Q transforma los datos en desviaciones con 1 respecto a las medias individuales y que ι Tι T' toma medias individuales, el estimador T
GLS para los parámetros del modelo pueden escribirse como (ver Hsiao, 2003): −1
N ⎛ N ' ' ⎞ β GLS = ⎜ ∑ xi Q xi + ψ T ∑ ( xi − x)( xi − x) ⎟ i =1 ⎝ i =1 ⎠ N ⎛ N ' ⎞ .⎜ ∑ xi Q yi + ψ T ∑ (xi − x)( yi − y)' ⎟ i =1 ⎝ i =1 ⎠
^
(33)
24 ^
^'
μ GLS = y − β GLS x
A partir de la expresión anterior, se puede comprobar fácilmente como si se obtiene el estimador de efectos fijos. Además, dado que
=0
→ 0 si T → ∞ , los
estimadores de efectos fijos y aleatorios son equivalentes para valores elevados de T . Por otra parte, si = 1, el estimador GLS es simplemente el estimador MCO (y Ω es diagonal).
Por último, destacar que a partir de la especificación anterior, puede derivarse la siguiente expresión: ^
^
^
β GLS = Δ β B + (I K − Δ ) β FE
⎛ N ⎞ donde β B = ⎜ ∑ (xi − x)(xi − x)' ⎟ ⎝ i =1 ⎠ ^
(34)
−1 N
∑1 (x − x)(y − y) es el estimador entre grupos i
i
i=
(between estimator) de β . En otras palabras, este último estimador es el estimador MCO en un modelo de medias individuales: '
yi = μ + xi β + α i + ε i
i = 1,2,..., N
(35)
y donde Δ es una matriz de ponderaciones, la cual es proporcional a la inversa de la ^
matriz de covarianzas de β B (ver Hsiao, 2003).
En otros términos, puede observarse como el estimador GLS se obtiene como una media ponderada entre los estimadores “entre” y “dentro” de los grupos ( between y within group estimadores).
El estimador between ignora cualquier información existente dentro de los individuos. Por tanto, el estimador GLS, bajos las suposiciones existentes, es la
25 combinación óptima entre los dos estimadores y, por tanto, es más eficiente que cualquiera de ellos4. Concretamente, si las variables explicativas incluidas en (29) son independientes de todos los términos
ε it
y α i , el estimador GLS es insesgado. Es un
estimador consistente si además de (19), también se cumple que: E{xi ε it } = 0
y
E{xiα i } = 0
(36)
(Observar que las condiciones anteriores son también el requisito para que sea consistente el estimador between).
Una forma sencilla de calcular el estimador GLS consiste en estimar por MCO el siguiente modelo transformado5: '
⎡ y − ⎛ 1− ψ 12 ⎞ y ⎤ = ⎡ μ ⎛ 1− ⎛ 1− ψ 12 ⎞ ⎞⎤ + ⎡ x − ⎛ 1− ψ 12 ⎞ xi ⎤ β + u ⎟ ⎟⎟ ⎜ ⎟ ⎜ ⎜ it ⎢⎣ it ⎜⎝ ⎠ i ⎥⎦ ⎢⎣ ⎝ ⎝ ⎠ ⎠⎥⎦ ⎢⎣ it ⎝ ⎠ ⎥⎦
(37)
donde uit es un término de perturbación aleatorio que carece de autocorrelación. De nuevo, observar que si = 0 , se obtiene el estimador entre grupos o estimador within y si
= 1, el estimador MCO.
Finalmente, indicar que como es habitual los componentes de la varianza σ ε 2
σ α 2
y
son desconocidos en la práctica. En consecuencia, tras estimar dichos términos en
una primera etapa, se derivan, en una segunda etapa, los estimadores GLS factibles. El estimador de σ ε 2 se obtiene fácilmente a partir de los residuos de la regresión dentro de grupos (within), tal y como se muestra en la expresión (23). Por último, un estimador
4
El estimador MCO (obtenido con pero no la eficiente. 5
= 1) es también una combinación lineal de los dos estimadores,
Lógicamente, a este modelo se llegaobteniendo la matriz R, tal que Ω −1 =
σ ε Ω
−
1 2
1 2
σ ε
R' R , la cual es igual a
1 1 ' ⎞ ⎛ = ⎜ I T − ⎛ ⎜1− ψ 2 ⎞⎟ ι Tι T ⎟ , y premultiplicando el modelo original (29’) por dicha matriz. ⎝ ⎠ T ⎝ ⎠
26 consistente de σ α 2 se obtiene teniendo en cuenta que la varianza del error de la regresión entre grupos (between) es igual a σ α 2 +
1
T
σ ε 2 , la cual puede estimarse consistentemente
como: 2 N 1 ⎛ y ^ x' ^ ⎞ σ B = ∑ ⎜ − μ B − i β B ⎠⎟ N − (K + 1) i =1 ⎝ i ^2
(38)
^
donde μ B es el estimador between para μ . En consecuencia: ^2
^2
σ α = σ B −
1 ^2
T
(39)
σ ε
Al estimador GLS Factible (mínimo cuadrático generalizado factible) se le conoce como estimadores de efectos aleatorios (random effects estimator ) para β y ^
y, se denota como β RE .
Bajo ciertas condiciones de regularidad débil, el estimador de efectos aleatorios es asintóticamente normal y, su matriz de varianzas y covarianzas viene dada por la siguiente expresión: N N ^ ' ⎞ ⎧ ⎫ 2 ⎛ ' V ⎨ β RE ⎬ = σ ε ⎜ ∑ xi Q xi + ψ T ∑ (xi − x)(xi − x) ⎟ ⎩ ⎭ i =1 ⎝ i =1 ⎠
−1
(40)
que muestra como el estimador de efectos aleatorios es más eficiente que el de efectos fijos si se cumple que > 0. La ganancia en eficiencia es debida a la utilización de la variación entre grupos (xi − x) .
En resumen, hasta el momento presente, hemos presentado una serie de estimadores del vector de parámetros β . Los básicos son dos: el estimador entre grupos (o between) y el estimador de efectos fijos (o within). Los otros dos estimadores son el estimador MCO y el de efectos aleatorios. Ambos explotan las dos dimensiones
27 de los datos (between y within), pero mientras que el primero lo hace de forma ineficiente, el segundo lo realiza de forma eficiente.
3.2 MODEL O DE COMPONENTE DEL ERROR EN DOS DIRECCIONES
De forma análoga a lo comentado para el caso del modelo de efectos fijos, en este caso se trata de incorporar los efectos temporales
λ t ,
pero también con la
característica de ser considerados de naturaleza aleatoria, distribuidos de forma idéntica e independiente: yit = μ + xit' β + α it + ε it = μ + xit' β + α i + λ t + ε it
(41) α i
~IID(0,σ α 2 );
λ t
~IID(0,σ λ 2 );
Además, igualmente se asume que
α i
~IID(0,σ ε 2 )
ε it
, λ t y
son independientes entre sí e
ε it
independientes de x js , para todo j y s .
A partir de aquí puede seguirse un proceso análogo al anterior, aunque más complejo. (Vease Baltagi, 2001, por ejemplo). En cualquier caso, la estrategia más sencilla es aplicar MCO al modelo original transformado mediante la premultiplicación de las distintas variables por la correspondiente matriz R. Dicha transformación es la siguiente (lo ilustro para la variable dependiente, sería análogo para el resto):
yit* = ( yit − θ 1 yi − θ 2 yt + θ 3 y
siendo
θ 1 = 1−
σ ε
Tσ α 2 + σ ε 2
θ 3 = θ 1 + θ 2 +
;
θ 2 = 1−
σ ε
Tσ α 2 + Nσ λ 2 + σ ε 2
−1
)
(42)
σ ε
Nσ λ 2 + σ ε 2
28
Sin embargo, como ya se comentó con anterioridad, para especificar este tipo de modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles (N elevado, pero T pequeño) este modelo es escasamente utilizado. Como se comentó con anterioridad, lo que se suele hacer es incorporar al modelo las correspondientes dummies temporales.
4. ANÁLI SIS DE ESPECIF ICACIÓN
Tanto el modelo de efectos fijos como el de efectos aleatorios asumen que ε it es incorrelado entre individuos y en el tiempo (no autocorrelación). Sin embargo, como en el caso de los modelos de regresión conocidos, si tal supuesto no se cumple, aunque los estimadores estándares siguen siendo consistentes, se invalida la inferencia realizada a partir de los tradicionales contrastes. Además, los estimadores dejan de ser eficientes. Además, de forma extensiva, la presencia de heteroscedasticidad en
ε it
(o, para los
modelos de efectos aleatorios en α i ) tiene efectos análogos. Como consecuencia de las implicaciones señaladas es importante asegurarse de que nuestro modelo no presenta ninguno de los dos problemas indicados, es decir, ni problema de autocorrelación ni de heteroscedasticidad.
4.1 MODEL O DE EFECTOS FIJ OS
En el caso del modelo de efectos fijos, los contrastes son sencillos, dado que es básicamente un modelo estimado por MCO. Un contraste bastante simple de autocorrelación en el modelo de efectos fijos está basado en el contraste de DurbinWatson (DW). En consecuencia, se contrasta la hipótesis nula de no autocorrelación
29 frente a hipótesis alternativa que el término de perturbación para cada individuo sigue un esquema AR(1), es decir: (43)
ε it = ρε i ,t−1 + υ it
donde υ it se encuentra idéntica e independientemente distribuido entre individuos y tiempo.
En consecuencia, se contrasta autocorrelación en el tiempo con la restricción de que todos los individuos tienen el mismo coeficiente de autocorrelación ρ . Lógicamente, la hipótesis nula se plantea como H 0 : ρ = 0 , frente a la alternativa de una cola ρ < 0 o ρ > 0 .
La generalización del estadístico de Durbin-Watson al caso que nos ocupa fue propuesta por Bhargava, Franzini y Narendranathan (1982) y, sigue la siguiente expresión: N T
⎛ ^ ^ ⎞ ⎜ ε it − ε i ,t−1 ⎟ ∑∑ ⎠ dwp = i =1 t=2N⎝ T ^ ε ∑∑ 1 1
it
i=
2
(44)
2
t=
^
donde ε it son los residuos de la regresión within.
En este caso, los anteriores autores también derivaron los puntos críticos que, lógicamente, ahora dependen de los valores de N , T y K . Además, al contrario que en el caso de series temporales, las zonas de indeterminación para el estadístico de DW para datos de panel son muy pequeñas, particularmente cuando el número de individuos en el panel es elevado.
30 De forma análoga, para contrastar heteroscedasticidad en el término de ^
perturbaciónε it , se puede utilizar también la serie de residuos de efectos fijos ε it para calcular el contraste de tipo de multiplicadores de Lagrange desarrollado por BreuschPagan. Lógicamente, se contrasta la hipótesis nula de homocedasticidad frente a la alternativa de que V {ε it } = σ 2 h zit' α
(45)
donde h es una función continuamente diferenciable, desconocida y, que al evaluarla en 0 se obtiene la unidad, h(0) = 1. Este último requisito permite que la hipótesis nula se plantee como H 0 :α = 0 .
El estadístico de prueba se construye a partir de los resultados de la estimación de una regresión auxiliar que regresa el cuadrado de los residuos de la estimación de ^
efectos fijos (o residuos within), ε it 2 , sobre una constante y sobre las J variables zit que consideramos que pueden estar generando el problema de heteroscedasticidad. Bajo la hipótesis nula, el estadístico de Breusch-Pagan se calcula como N T ( − 1) veces el R2 de la anterior regresión auxiliar y, se distribuye asintóticamente como una distribución χ 2
con J grados de libertad.
No obstante, para este tipo de modelos (modelos de efectos fijos), una estrategia muy utilizada consiste en utilizar la propuesta de Arellano (1987) consistente en utilizar la corrección de White que permite obtener una estimación de la matriz de varianzas y covarianzas asintótica de los estimadores within-groups robusta tanto ante problemas de heteroscedasticidad y correlación serial de cualquier tipo, para valores fijos de T y N grande (caso más habitual) que viene dada por la siguiente expresión:
^ ⎛ N ' ⎞ ⎧ ⎫ V ⎨ β EF ⎬ = ⎜⎜ ∑ xi Q xi ⎟⎟ ⎩ ⎭ ⎝ i =1 ⎠ ^
−1
^ ^ '
⎛ N ' ⎞ ' xi Qε i ε i Q xi ⎜⎜ ∑ xi Q xi ⎟⎟ ∑ i =1 ⎝ i =1 ⎠ N
−1
(43)
31
^
^
donde ε i = Q yi − Q xi β FE son los residuos del modelo within estimado.
No obstante, si uno desea realizar supuestos acerca de ciertas formas de heterocedasticidad o autocorrelación, es posible derivar estimadores más eficientes explotando la estructura de covarianzas del error a través del estimador MCGF, exactamente igual que en los modelos conocidos.
4.2 MODEL O DE EFECTOS ALEATORIOS
La mayoría de los contrastes que permiten contrastar los supuestos de homocedasticidad y no autocorrelación en el marco de modelos de efectos aleatorios son complicados de realizar. No obstante, como el estimador de efectos fijos es consistente incluso cuando realizamos el supuesto de que
α i
se encuentra idéntica e
independientemente distribuido y es independiente de las variables explicativas, los contrastes para el modelo de efectos fijos pueden ser también utilizados en el caso de los modelos de efectos aleatorios.
No obstante, la solución en estos casos viene por la estimación por MCGF tras haber adoptado una forma específica para la matriz de varianzas y covarianzas. Veamos los casos más generales.
Con respecto a la heterocedasticidad, en estos modelos puede aparecer porque la varianza de α i varía con i (en consecuencia hemos de hablar de σ α 2i en vez de
σ α 2 ) o
porque la varianza de ε it varía con i (en consecuencia hemos de hablar de σ ε 2i en vez de σ ε 2 ) o ambos a la vez. En consecuencia la matriz de varianzas y covarianzas del término
de perturbación es ahora:
32
E (vi vi' ) = σ ε 2i I T + σ α 2iι Tι T' = Ω i
(44)
Y la matriz inversa, Ω i −1, sigue la expresión (32), sin mas que sustituir σ α 2 y σ ε 2 por
σ α 2
y i
σ ε 2i ,
respectivamente. Igualmente, el estimador GLS de
δ
sustituir Ω −1 por Ωi −1, en dicha ecuación. Lógicamente, reemplazando
se obtiene al σ α 2i
y
σ ε 2i
(valores desconocidos) por sus estimaciones, se obtiene el estimador GLS Factible, o en dos etapas.
La estimación de σ ε 2 puede efectuarse a partir de la estimación de la estimación i
^
within. La varianza total puede estimarse a través de los residuos MCO vit : 2
⎛ ^ −^ ⎞ 1 ⎜ v − v ⎟ obtenidos a partir de la estimación (30). A partir de aquí, se σ vi = ∑ it i⎟ T − 1 t=1 ⎜⎜ ⎟ ⎝ ⎠ ^2
T
^2
2
^2
^2
i
i
puede obtener la estimación para σ α i como: σ α i = σ v − σ ε .
En el caso de autocorrelación se procede de forma análoga. Tomaremos un esquema de autorrelación tipo AR(1) como ejemplo. Es decir, supongamos que en el modelo de efectos aleatorios en una dirección expresado en (29): yit = μ + xit' β + α i + ε it ,
ε it
~IID 0,σ ε 2 ;
α i
~IID 0,σ α 2
(45)
Ó en términos matriciales: yi = ι T μ + xi β + ι Tα i + ε i = xi+δ + vi
(46)
el término de perturbación ε it deja de ser independiente y sigue el siguiente proceso AR(1):