xtreg — Fixed-, between-, and random-effects and population-averaged linear models. xtreg - Fijo, entre-, y de efectos aleatorios y los modelos lineales de promedio de la población. GL random-effects !"#$ model %etween-effects !%#$ model Fixed-effects !F#$ model &L random-effects !&L#$ model 'opulation-averaged !'($ model e debe especificar sus variables como panel. 'ara xtreg, pa, estructuras de correlación )ue no sean intercambiables e independientes re)uieren )ue una variable de tiempo tambi*n se especifi)ue. xtset declara los datos en la memoria para ser un panel. +sted debe convertir sus datos con xtset antes de usar otros comandos xt. i guarda sus datos despu*s xtset, los datos sern recordados como un grupo especial y no tendr )ue usar xtset de nuevo. ay dos sintaxis para establecer los datos xtset panelvar xtset panelvar timevar
#n la primera sintaxis xtset panelvar-los datos se fijan para ser un panel y el orden de las observaciones dentro del panel se considera irrelevante. 'or ejemplo, el panel var podr/a ser un pa/s y las observaciones en el tiempo podr/a ser la ciudad. #n la segunda sintaxis - xtset timevar panelvar -los datos 0an de ser un panel y el orden de las observaciones dentro del panel se consideran ordenado por timevar. 'or ejemplo, en los datos recogidos de los levantamientos repetidos de las mismas personas en distintos a1os, panelvar podr/a ser persona y timevar, a1os. 2uando se especifica timevar, usted puede entonces utili3ar operadores de series de tiempo de tata como L. y F. entre otros comandos. xtset sin argumentos xtset muestra cómo son actualmente los datos. i los datos se ajustan con un panelvar y un timevar, xtset tambi*n ordena los datos por timevar panelvar. i los datos se establecen con sólo un panelvar, el orden de clasificación no se cambia. #jemplo (lgunos conjuntos de datos de panel contienen una variable de tiempo. (bdata.dta conjunto de datos contiene los datos de demanda de trabajo de un grupo de firmas en el "eino +nido. 4stos son los datos salariales de las dos primeras firmas en el conjunto de datos
id 1 2 3 4 5 6 7 8 9 10 11 12 13 14
year 1 1 1 1 1 1 1 2 2 2 2 2 2 2
1977 1978 1979 1980 1981 1982 1983 1977 1978 1979 1980 1981 1982 1983
wage 131.516 123.018 128.395 138.039 142.897 148.681 137.784 147.909 141.036 149.534 15.491 161.969 161.314 163.051
2omandos . list id year wage if id==1 | id==2, sepby(id) 1. 2. . %. !. ". 7. #. 9. 1$. 11. 12. 1. 1%.
+---------------------+ | id year wage | |---------------------| | 1 1977 11.!1" | | 1 197# 12.$1# | | 1 1979 12#.9! | | 1 19#$ 1#.$9 | | 1 19#1 1%2.#97 | | 1 19#2 1%#."#1 | | 1 19# 17.7#% | |---------------------| | 2 1977 1%7.9$9 | | 2 197# 1%1.$" | | 2 1979 1%9.!% | | 2 19#$ 1!.%91 | | 2 19#1 1"1.9"9 | | 2 19#2 1"1.1% | | 2 19# 1".$!1 | +---------------------+
&' delare tis dataset as a panel dataset, y'* type xtset id year, yearly panel variable id (str'ngly balaned) time variable year, 1977 t' 19# delta 1 year . . list id year wage .wage if id==1 | id==2, sepby(id)
+-------------------------------+ | .|
1. 2. . %. !. ". 7.
#. 9. 1$. 11. 12. 1. 1%.
| id year wage wage | |-------------------------------| | 1 1977 11.!1" . | | 1 197# 12.$1# 11.!1" | | 1 1979 12#.9! 12.$1# | | 1 19#$ 1#.$9 12#.9! | | 1 19#1 1%2.#97 1#.$9 | | 1 19#2 1%#."#1 1%2.#97 | | 1 19# 17.7#% 1%#."#1 | |-------------------------------| | 2 1977 1%7.9$9 . | | 2 197# 1%1.$" 1%7.9$9 | | 2 1979 1%9.!% 1%1.$" | | 2 19#$ 1!.%91 1%9.!% | | 2 19#1 1"1.9"9 1!.%91 | | 2 19#2 1"1.1% 1"1.9"9 | | 2 19# 1".$!1 1"1.1% | +-------------------------------+
Data Panel
#l contexto bsico de un anlisis lineal de datos de panel consiste en un modelo de regresión de la forma y it = x it β + u it
i
donde el sub/ndice toma los valores 5,6, 7 , 8 e indica la unidad de sección
cru3ada,
t = 1,2,..., T i
indica los diferentes periodos de tiempo,
dependientes o explicadas !regresando$,
explicativas !regresor$,
β
xit
yit
son las variables
las variables independientes o
es el vector de parmetros a estimar y
u it
el t*rmino de
error o perturbación aleatoria, todos ellos componentes del modelo clsico de regresión lineal.
i para cada unidad de sección cru3ada existe el mismo n9mero de observaciones T
=
temporales, es decir, si
T i
i
para cada , se dice )ue el panel de datos est
e)uilibrado !balanceado$. #s 0abitual para el estudio de los distintos estimadores disponibles asumir )ue el error aleatorio se descompone en dos o tres t*rminos, a los cuales se les denomina :&odelo de componente de error ! Error Component Regression Model) ;. La mayor/a de las aplicaciones de datos de panel utili3an un modelo de componentes de error de un solo sentido de las perturbaciones, con
&odelo de componente de error <
=enga en cuenta )ue
µ i
u it = µ i
+
v it
es invariante en el tiempo y da cuenta de cual)uier
efecto-individual espec/fico )ue no est* incluido en la regresión. #n este caso podr/amos pensar en ella como la 0abilidad no observada de la persona. La
restante perturbación
v it
var/a con las personas y el tiempo y puede ser pensado
como la perturbación 0abitual en la regresión.
xtreg and associated commands Example
1: Between-effects model
xtreg y asociado comandos
&odelo de #ntre-efectos +sando nlswor>.dta vamos a modelar logaritmo natural de salario en t*rminos de a1os completos de escolaridad !grado$, la edad actual y la edad al cuadrado, a1os actuales trabajados !experiencia$ y experiencia al cuadrado, a1os actuales de la tenencia en el trabajo y la tenencia actual al cuadrado, ya sea negro !carrera ? 6$, tanto si residen en un rea no designada como rea estad/stica metropolitana estndar !(#&#$, y tanto si residen en el ur. . web*se nlsw'r.dta, lear (ati'nal 'ngit*dinal /*rvey.
.
xtreg lnw
grade age
0'*ng 'men 1%-2" years 'f age in 19"#)
.age3.age ttlexp
.ttlexp3.ttlexp ten*re .ten*re3.ten*re
2.rae n'tsmsa s'*t, be
4etween regressi'n (regressi'n 'n gr'*p means)
*mber 'f 'bs
=
2#$91
5r'*p variable id'de
*mber 'f gr'*ps
=
%"97
6-s
= $.1!91
8bs per gr'*p min =
1
between = $.%9$$
avg =
".$
'verall = $."9!
max =
1!
(1$,%"#")
=
%!$.2
:r'b ;
=
$.$$$$
witin
sd(*i + avg(ei.))=
.$"11%
------------------------------------------------------------------------------------lnwage |
<'ef.
/td. rr.
t
:;|t|
>9!? <'nf. @ntervalA
--------------------+---------------------------------------------------------------grade |
.$"$7"$2
.$$2$$$"
$.7
$.$$$
.$!"##2
.$"%"#22
age |
.$21!#
.$$#72!1
.7$
$.$$$
.$1!21$!
.$%9%211
-.$$$!997
.$$$1%29
-%.2$
$.$$$
-.$$$#799
-.$$$19%
.$1##!
.$$!"7%9
2.%!
$.$1%
.$$27!9#
.$2!$1$#
.$$$7%2
.$$$2"7
2.2!
$.$2!
.$$$$9"
.$$17%7
.$"9#%19
.$$"$729
11.!$
$.$$$
.$!79"1
.$#17%7"
-.$$2#7!"
.$$$%$9#
-7.$2
$.$$$
-.$$"7#9
-.$$2$722
2.rae |
-.$!"%1"7
.$1$!11
-!.7
$.$$$
-.$77$272
-.$!#$"1
n'tsmsa |
-.1#"$%$"
.$112%9!
-1".!%
$.$$$
-.2$#$9%9
-.1"9#"2
| .age3.age | | ttlexp | | .ttlexp3.tt lexp | | ten*re | | .ten*re3.ten* re | |
s'*t |
-.$997#
.$1$1"
-9.#$
$.$$$
-.1192$91
-.$79%""!
'ns |
.911
.121$%%
2.7"
$.$$"
.$9""$9
.!7121
-------------------------------------------------------------------------------------
La regresión entre-efectos se estima en personas-promedios, por lo )ue la @n ? ABCD@ n9mero es relevante. xtreg, ya sea los informes del @n9mero de observaciones@ y la información del tama1o del grupo, se demuestra )ue tenemos 6E.A @observaciones@ -person a1os, en realidad- de datos. i tomamos la submuestra )ue no tiene valores perdidos en el salario ln, grado, ..., al sur nos deja con 6E.HC5 observaciones sobre personas-a1o, reflejando A.BCD personas, cada observado durante un promedio de B,H a1os. 'or la bondad de ajuste, el "6 betwen es directamente relevanteI nuestra "6 es H,ACHH. in embargo, si utili3amos estas estimaciones para predecir witin modelo, tenemos un "6 de H,5C5. i utili3amos estas estimaciones para ajustar los datos generales, nuestra "6 es H.BC. wls especifica )ue, para datos desbalanceados, m/nimos cuadrados ponderados ser
utili3ado en lugar de los JL predeterminados. (mbos m*todos producen estimaciones consistentes. La verdadera varian3a de los efectos entre-residuales es K6 M =iK6N !ver xtreg, estar en &*todos y fórmulas abajo$. OL produce una variación @estabili3ado@ de K6 P =i M K6N, Que tambi*n no es constante. (s/, la elección entre JL y OL e)uivale a )ue es ms estable. 2omentario xtreg, be rara ve3 se utili3a, pero entre las estimaciones son un ingrediente en la estimación de efectos aleatorios. 8uestra implementación de xtreg, re utili3a las estimaciones de &2J para este componente, seg9n nuestro criterio )ue K6 es grande en relación con !K6 e$ en la mayor/a de los modelos. Formalmente, sólo se re)uiere una estimación consistente entre las estimaciones. #l anlisis estad/stico F )ue los coeficientes de los regresores grado, edad, ..., al sur son todos conjuntamente cero. 8uestro modelo es significativo. #l error cuadrtico medio de la regresión ajustada, )ue es una estimación de la desviación estndar de i Mei, es H.HB.
'ara nuestros coeficientes, cada a1o de escolaridad aumenta los salarios por 0ora de B,5RI la edad aumenta los salarios 0asta 6B.C a1os y despu*s de eso disminuye !debido a )ue la ecuación cuadrtica ax6 M bx M c se convierte ms en x ? -b P 6a, )ue para nuestra edad y c.age S c.age coeficientes es H,H65E P !6 x H,HHHCCD $ T6B.C$, a)u/ b ? age, c.age S c.age ? aI la experiencia total aumenta los salarios a un ritmo creciente !)ue es sorprendente e inconveniente$I antigUedad en el empleo actual aumenta los salarios 0asta tener 56,5 a1os H,HBCEA5CP !6 x H,HH6EDB $ T56,5$, y posteriormente les disminuyeI los salarios de los negros son, estas cosas mantienen constantes, !aproximadamente$ un ,BR inferior a la de los no negros !aproximadamente por)ue 6.race es un indicador variable$I si reside en un no-&( !3ona rural$ reduce los salarios en 5E,BRI y si residen en el sur reduce los salarios en un C,CR. 2. Fixed-effects model
El modelo de efectos fijos
Vado
u it = µ i
+
vit
#n este caso, los
µ i
se supone )ue son los parmetros fijos a ser estimados y el
resto perturbaciones estocstico con
v it
independientes e id*nticamente
distribuidas con media cero y varian3a sigma cuadrado.
independientemente de
vit
xit
se supone
para todo i y t. #l modelo de efectos fijos es una
especificación adecuada si nos estamos centrando en un conjunto espec/fico de 8 firmas, es decir, <%&, G#, Oesting0ouse, etc. y nuestra inferencia se limita a la
conducta de estos conjuntos de firmas. (lternativamente, podr/a ser un conjunto de pa/ses de la J2V# o #stados (mericanos. La inferencia en este caso est supeditada a los particulares 8 firmas, pa/ses o #stados )ue se observan. Ejemplo: en STT
+tili3ando nlswor>.data, vamos a modelar ln!wage$ en t*rminos de a1os completos de escolaridad !grado$, la edad actual y la edad al cuadrado, a1os actuales trabajados !experiencia$ y la experiencia al cuadrado, a1os en el trabajo actual, a1os en el trabajo actual al cuadrado, si es negro !ra3a ? 6$, tanto si residen en un rea no designada como metropolitana estndar !(#&#$, y tanto si residen en el ur.
. web*se nlsw'r.dta, lear (ati'nal 'ngit*dinal /*rvey.
.
xtreg lnw
grade age
0'*ng 'men 1%-2" years 'f age in 19"#)
.age3.age ttlexp
.ttlexp3.ttlexp ten*re .ten*re3.ten*re
2.rae n'tsmsa s'*t, fe n'te grade 'mitted bea*se 'f 'llinearity n'te 2.rae 'mitted bea*se 'f 'llinearity
ixed-effets (witin) regressi'n
*mber 'f 'bs
=
2#$91
5r'*p variable id'de
*mber 'f gr'*ps
=
%"97
6-s
= $.1727
8bs per gr'*p min =
1
between = $.!$!
avg =
".$
'verall = $.2"2!
max =
1!
(#,2#")
=
"1$.12
:r'b ;
=
$.$$$$
witin
'rr(*i, Bb)
= $.19"
(The errors ui are correlated with the regressors in the fixed effects model)
------------------------------------------------------------------------------------lnwage |
<'ef.
/td. rr.
t
:;|t|
>9!? <'nf. @ntervalA
--------------------+---------------------------------------------------------------grade |
$
('mitted)
age |
.$!99#7
.$$#"%
1$."
$.$$$
.$2 9"11
.$%2""2
-.$$$72
.$$$$!
-1.!#
$.$$$
-.$$$#27%
-.$$$"1#"
| .age3.age | |
ttlexp |
.$%""#
.$$29"!
11.29
$.$$$
.$27"!%!
.$9279
.$$$21"
.$$$1277
1."9
$.$9$
-.$$$$%1
.$$$%"""
.$!7!9
.$$1#%#7
19.%
$.$$$
.$21$
.$977!
-.$$197$1
.$$$12!
-1!.7"
$.$$$
-.$$221!1
-.$$172!1
2.rae |
$
('mitted)
n'tsmsa |
-.$#9$1$#
.$$9!1"
-9.%
$.$$$
-.1$ 7"9
-.$7$2#2
s'*t |
-.$"$"$9
.$1$919
-!.!!
$.$$$
-.$#2$!#2
-.$92$"
'ns |
1.$72
.$%#!!%"
21."
$.$$$
.9% 21%9"
1.1 2%9
| .ttlexp3.tt lexp | | ten*re | | .ten*re3.ten* re | |
--------------------+---------------------------------------------------------------sigma* |
.!!"22$
sigmae |
.29$"#92
r' |
.!99%"2#
(|)
------------------------------------------------------------------------------------ test tat all *i=$
(%"9", 2#") =
"."!
:r'b ; = $.$$$$
#l "6 witin es !H,5D6D$, y la "6 betwen es !H,H$, como se esperaba, debido a )ue el estimador betwen maximi3a "6 betwen y witin de la estimador "6 witin. #n t*rminos de ajuste 'verall, estas estimaciones son !H,6B6). xtreg, fe puede estimar K y Ke, aun)ue la forma de interpretar estas estimaciones depende de si est utili3ando xtreg para ajustar un modelo de efectos fijos o de efectos aleatorios. 'ara aclarar este punto, en el modelo de efectos fijos, i se fija -formalmente no tienen distribución. i se toma este punto de vista, se debe pensar en *l, como una mera forma aritm*tica reportado K para describir el rango de los i estimados por efectos fijos. in embargo, si usted est utili3ando el estimador de efectos fijos del modelo de efectos aleatorios, H.B66 es una estimación de K o ser/a si no existieran variables omitidas. 2uando se testea si se estima por efectos fijos o agrupados por medio de la prueba F, se puede inferir )ue es preferible estimar por efectos fijos )ue con datos agrupados, dado )ue el p-value indica )ue se rec0a3a la 0ipótesis nula.
Ec!aciones
y it
=
y i
=
α + xit β + µ i + vit
(1)
α + xi β + µ i + vi
y it − y i
=
(2)
( xit − xi ) β + (vit − vi )
(3)
l 6-<*adrad'
ˆ + xit β ˆ yˆ it = α
(1′′)
ˆ + xi β ˆ yˆ it = α
( 2′′)
~
ˆ y it = ( yit − yˆ i ) = ( xit − xi ) β
(3′′)
xtreg informa @"-cuadrados@ correspondientes a estas tres ecuaciones. "-cuadrado estn entre comillas por)ue el "-cuadradas reportados no tienen todas las propiedades de la JL. 6-s
witin
= $.1727
C e*aiDn
between = $.!$!
2C e*aiDn
'verall = $.2"2!
1C e*aiDn
#n particular, xtreg, be obtiene sus estimaciones mediante la reali3ación de &2J de la ecuación !6$, y por tanto su "6 reportado betwen es un "6 ordinario. Los otros dos "6 reportados no son ms )ue las correlaciones al cuadrado, o, si lo prefiere, "6s de las regresiones de segunda ronda. #l xtreg, fe obtiene sus estimaciones mediante la reali3ación de &2J de la ecuación !$, por lo )ue su "6 calculado witin es un "6 ordinaria. (l igual )ue con be, los otros "6s son correlaciones al cuadrado, o, si lo prefiere, "6s del regresiones de segunda ronda. #l xtreg, re proporciona el estimador de efectos aleatorios y es un !matri3$ promedio ponderado de las estimaciones producidas por el entre y dentro de los estimadores. #n particular, el estimador de efectos aleatorios r esulta ser e)uivalente a la estimación de ( y it − θ y i ) = (1 − θ )α + ( xit − θ xi ) β ˆ + { (1 − θ ) µ i + ( vit − θ vi ) }
Vonde W est en función de la varian3a de los errores de
errores de
vi
(4)
µ i
y la varian3a de los
. i la primera varian3a es cero, esto significa )ue los primeros
errores son siempre cero, entonces W es siempre cero entonces se puede estimar por la ecuación !5$. #l "6 reportado en la salida corresponde a la ecuación !A$ en ning9n caso a las ecuaciones. Los tres "6s son correlaciones al cuadrado, o, si lo prefiere, "6s de regresiones de segunda ronda. "as pr!e#as para la dependencia de la secci$n trans%ersal & correlaci$n contempor'nea: el !so de Bre!sc(-Pagan ") de la independencia
eg9n %altagi, la dependencia de la sección transversal es un problema en los paneles macro con una larga serie de tiempo !ms de 6H-H a1os$. #sto no es un gran problema en los paneles micro !pocos a1os y gran n9mero de casos$. La 0ipótesis nula en la prueba
de %' P L& de la independencia es )ue los residuos a trav*s de entidades no estn correlacionados. #l comando para ejecutar esta prueba es xttest6 !ejecutarlo despu*s xtreg, fe$ Ejemplo
xttest2
"as pr!e#as para la secci$n trans%ersal dependencia & correlaci$n contempor'nea: El !so de la pr!e#a de *D Pasaran
2omo se mencionó en la diapositiva anterior, la dependencia de la sección transversal es ms de un problema en los paneles macro con series de tiempo largo !ms de 6H a H a1os$ )ue en los micro paneles. 'rueba de 2V 'asaran !dependencia de la sección transversal$ se utili3a para probar si los residuos estn correlacionados entre entidades X. La dependencia de la sección transversal puede llevar a un sesgo en los resultados de pruebas !tambi*n llamado correlación contempornea$. La 0ipótesis nula es )ue los residuos no estn correlacionados. #l comando de la prueba se xtcsd, tienes )ue instalarlo escribiendo ssc install xtcsd Ejemplo
xtsd, pesaran abs
Testing for (eteros+edasticit, Ejemplo . xttest
E'dified ald test f'r gr'*pwise eter'sedastiity in fixed effet regressi'n m'del
F$ sigma(i)G2 = sigmaG2 f'r all i
i2 (%"97) :r'b;i2 =
=
2.2e+" $.$$$$
Las pruebas de correlación serial Las pruebas de correlación en series se aplican a los paneles de macro con una larga serie de tiempo !ms de 6H a H a1os$. 8o es un problema en micro paneles !con muy pocos a1os$. 2orrelación de serie 0ace )ue los errores estndar de los coeficientes a ser ms pe)ue1as de lo )ue realmente son y superior " cuadrado. +na prueba Lagram-&ultiplicador de correlación serial est disponible utili3ando el xtserial comandos. #ste es un programa escrito por el usuario, para instalarlo escriba ssc install xttserial
El modelo de efectos aleatorios
i 0ay demasiados parmetros en el modelo de efectos fijos y se presenta p*rdida de grados de libertad se pueden evitar si el Yi puede suponerse al a3ar. #n este caso Yi Z<
independientes de la Yi y it, para todo i y t. #l modelo de efectos aleatorios es una especificación adecuada si estamos trabajando con 8 individuos al a3ar de una población grande. #ste suele ser el caso de los estudios de panel de los 0ogares. ay )ue tener cuidado en el dise1o del panel para )ue sea @representativa@ de la población sobre la cual estamos tratando de 0acer inferencias. #n este caso, 8 es generalmente grande y un modelo de efectos fijos dar/a lugar a una enorme p*rdida de grados de libertad. #l efecto individual se caracteri3a por ser aleatorio y la inferencia pertenece a la población elegida al a3ar.
#jemplo en =(=( . web*se nlsw'r.dta, lear (ati'nal 'ngit*dinal /*rvey.
0'*ng 'men 1%-2" years 'f age in 19"#)
. xtset panel variable time variable
id'de (*nbalaned) year, "# t' ##, b*t wit gaps
delta
.
xtreg lnw
1 *nit
grade age
.age3.age ttlexp
.ttlexp3.ttlexp ten*re .ten*re3.ten*re
2.rae n'tsmsa s'*t
6and'm-effets 5/ regressi'n
*mber 'f 'bs
=
2#$91
5r'*p variable id'de
*mber 'f gr'*ps
=
%"97
6-s
= $.171!
8bs per gr'*p min =
1
between = $.%7#%
avg =
".$
'verall = $.7$#
max =
1!
ald i2(1$)
=
92%%.7%
:r'b ; i2
=
$.$$$$
witin
'rr(*i, B)
= $ (ass*med)
------------------------------------------------------------------------------------lnwage |
<'ef.
/td. rr.
H
:;|H|
>9!? <'nf. @ntervalA
--------------------+---------------------------------------------------------------grade |
.$"%"%99
.$$17#12
".$
$.$$$
.$"11!#9
.$"#1%$9
age |
.$"#$!9
.$$119!
11.#$
$.$$$
.$ $"91#
.$%292$1
-.$$$71
.$$$$!
-1%.27
$.$$$
-.$$$#11
-.$$$"1!
.$29$2$#
.$$2%22
11.9#
$.$$$
.$2%279
.$7"7#
.$$$$%9
.$$$11"2
2."2
$.$$9
.$$$$77
.$$$!27
.$92!19
.$$17!!%
22."
$.$$$
.$!#11
.$%2"92!
-.$$2$$!
.$$$119
-1".#$
$.$$$
-.$$227
-.$$17"97
2.rae |
-.$!$!
.$$9992"
-!.1
$.$$$
-.$72"#1
-.$%"79
n'tsmsa |
-.1$#2!2
.$$717!1
-1#.2
$.$$$
-.1%%###1
-.11"7"22
s'*t |
-.$#"#922
.$$7$2
-11.9$
$.$$$
-.1$12$"2
-.$72!7#1
'ns |
.2#72$7
.$%9%"9
% .#
$.$$$
.1% 17"
.!"7#1
| .age3.age | | ttlexp | | .ttlexp3.tt lexp | | ten*re | | .ten*re3.ten* re | |
--------------------+---------------------------------------------------------------sigma* |
.2!79$!2"
sigmae |
.29$"#92
r' |
.%%$%!27
(frati'n 'f variane d*e t' *i)
-------------------------------------------------------------------------------------
#stimamos )ue la escolaridad tiene una tasa de retorno del B,RI )ue el aumento de los salarios con la edad gira en torno en 6,E a1osI )ue la experiencia total aumenta a9n ms los salarios cada ve3 msI )ue el efecto de antigUedad en la empresa gira en torno en C,E a1osI )ue el ser negro reduce los salarios en un ,RI )ue vivir en el rea reduce los salarios 5,5RI y )ue vivir en el ur reduce los salarios E,DR.
a interpretaiDn de l's 'efiientes es 'mpliada ya *e inl*yen
tant'
l's
efet's
dentr'
de-entidad
y
entre
entidades. n el as' de l's dat's &/
La prueba L& le ayuda a decidir entre una regresión de efectos aleatorios y una simple regresión &2J. La 0ipótesis nula de la prueba L& es )ue las diferencias a trav*s de organismos son cero. #sto es, no 0ay una diferencia significativa entre las unidades !es decir, sin efecto el panel$. #l comando de tata es xttestH escribirla inmediatamente despu*s de ejecutar el modelo de efectos aleatorios. . xttest$
4re*s and :agan agrangian m*ltiplier test f'r rand'm effets
lnwage>id'de ,tA = Bb + *>id'deA + e>id'de,tA
stimated res*lts |
Kar
sd = srt(Kar)
---------+-----------------------------
&est
lnwage |
.22#2"
.%77#%1"
e |
.$#%!$$2
.29$"#92
* |
.$""!1!1
.2!79$!
Kar(*) = $ ibar2($1) = 1%779.9# :r'b ; ibar2 =
$.$$$$
()u/ se rec0a3a la 0ipótesis nula y concluir )ue los efectos aleatorios son apropiados. #sto es, 0ay evidencia de diferencias significativas entre los distintos pa/ses, por lo tanto, puede ejecutarse el data panel. 8tra salidas
@nterpretaiDn del &/& E
()u/ no pudimos rec0a3ar la 0ipótesis nula y concluir )ue los efectos aleatorios no es apropiado. #sto es, no 0ay evidencia de diferencias significativas entre los distintos pa/ses, por lo tanto, puede ejecutar una sencilla regresión &2J.
Las pruebas para la dependencia de la sección transversal P correlación contempornea el uso de %reusc0-'agan L& de la independencia eg9n %altagi, la dependencia de la sección transversal es un problema en los paneles macro con una larga serie de tiempo !ms de 6H-H a1os$. #sto no es un gran problema en los paneles micro !pocos a1os y gran n9mero de casos$. La 0ipótesis nula en la prueba de %'PL& de la independencia es )ue los residuos a trav*s de organismos no estn correlacionados. #l comando para ejecutar esta prueba es xttest6 !ejecutarlo despu*s xtreg, fe$
Fixed or Random: Hausman test
. web*se nlsw'r.dta, lear
(ati'nal 'ngit*dinal /*rvey.
0'*ng 'men 1%-2" years 'f age in 19"#)
. xtset panel variable
id'de (*nbalaned)
time variable
year, "# t' ##, b*t wit gaps
delta
.
xtreg lnw
1 *nit
grade age
.age3.age ttlexp
.ttlexp3.ttlexp ten*re .ten*re3.ten*re
2.rae n'tsmsa s'*t, fe n'te grade 'mitted bea*se 'f 'llinearity n'te 2.rae 'mitted bea*se 'f 'llinearity
ixed-effets (witin) regressi'n
*mber 'f 'bs
=
2#$91
5r'*p variable id'de
*mber 'f gr'*ps
=
%"97
6-s
= $.1727
8bs per gr'*p min =
1
between = $.!$!
avg =
".$
'verall = $.2"2!
max =
1!
(#,2#")
=
"1$.12
:r'b ;
=
$.$$$$
witin
'rr(*i, Bb)
= $.19"
------------------------------------------------------------------------------------lnwage |
<'ef.
/td. rr.
t
:;|t|
>9!? <'nf. @ntervalA
--------------------+---------------------------------------------------------------grade |
$
('mitted)
age |
.$!99#7
.$$#"%
1$."
$.$$$
.$2 9"11
.$%2""2
-.$$$72
.$$$$!
-1.!#
$.$$$
-.$$$#27%
-.$$$"1#"
.$%""#
.$$29"!
11.29
$.$$$
.$27"!%!
.$9279
.$$$21"
.$$$1277
1."9
$.$9$
-.$$$$%1
.$$$%"""
.$!7!9
.$$1#%#7
19.%
$.$$$
.$21$
.$977!
-.$$197$1
.$$$12!
-1!.7"
$.$$$
-.$$221!1
-.$$172!1
2.rae |
$
('mitted)
n'tsmsa |
-.$#9$1$#
.$$9!1"
-9.%
$.$$$
-.1$ 7"9
-.$7$2#2
s'*t |
-.$"$"$9
.$1$919
-!.!!
$.$$$
-.$#2$!#2
-.$92$"
'ns |
1.$72
.$%#!!%"
21."
$.$$$
.9% 21%9"
1.1 2%9
| .age3.age | | ttlexp | | .ttlexp3.tt lexp | | ten*re | | .ten*re3.ten* re | |
--------------------+---------------------------------------------------------------sigma* |
.!!"22$
sigmae |
.29$"#92
r' |
.!99%"2#
(frati'n 'f variane d*e t' *i)
-------------------------------------------------------------------------------------
test tat all *i=$
(%"9", 2#") =
"."!
:r'b ; = $.$$$$
. estimates st're fixed
.
xtreg lnw
grade age
.age3.age ttlexp
.ttlexp3.ttlexp ten*re .ten*re3.ten*re
2.rae n'tsmsa s'*t, re
6and'm-effets 5/ regressi'n
*mber 'f 'bs
=
2#$91
5r'*p variable id'de
*mber 'f gr'*ps
=
%"97
6-s
= $.171!
8bs per gr'*p min =
1
between = $.%7#%
avg =
".$
'verall = $.7$#
max =
1!
ald i2(1$)
=
92%%.7%
:r'b ; i2
=
$.$$$$
witin
'rr(*i, B)
= $ (ass*med)
------------------------------------------------------------------------------------lnwage |
<'ef.
/td. rr.
H
:;|H|
>9!? <'nf. @ntervalA
--------------------+---------------------------------------------------------------grade |
.$"%"%99
.$$17#12
".$
$.$$$
.$"11!#9
.$"#1%$9
age |
.$"#$!9
.$$119!
11.#$
$.$$$
.$ $"91#
.$%292$1
-.$$$71
.$$$$!
-1%.27
$.$$$
-.$$$#11
-.$$$"1!
| .age3.age | | ttlexp |
.$29$2$#
.$$2%22 1
11.9#
$.$$$
.$2%279
.$7"7#
| .ttlexp3.tt lexp |
.$$$$%9
.$$$11"2
2."2
$.$$9
.$$$$77
.$$$!27
.$92!19
.$$17!!%
22."
$.$$$
.$!#11
.$%2"92!
-.$$2$$!
.$$$119
-1".#$
$.$$$
-.$$227
-.$$17"97
2.rae |
-.$!$!
.$$9992"
-!.1
$.$$$
-.$72"#1
-.$%"79
n'tsmsa |
-.1$#2!2
.$$717!1
-1#.2
$.$$$
-.1%%###1
-.11"7"22
s'*t |
-.$#"#922
.$$7$2
-11.9$
$.$$$
-.1$12$"2
-.$72!7#1
'ns |
.2#72$7
.$%9%"9
% .#
$.$$$
.1% 17"
.!"7#1
| ten*re | | .ten*re3.ten* re | |
--------------------+---------------------------------------------------------------sigma* |
.2!79$!2"
sigmae |
.29$"#92
r' |
.%%$%!27
(frati'n 'f variane d*e t' *i)
-------------------------------------------------------------------------------------
. estimates st're rand'm
. a*sman fixed rand'm
---- <'effiients ---|
(b)
|
fixed
(4) rand'm
(b-4) Lifferene
srt(diag(Kb-K 4)) /..
-------------+---------------------------------------------------------------age |
.$!99#7
.$"#$!9
-.$$$#$7
.$$1177
.age3.age |
-.$$$72
-.$$$71
-9."#e-$"
.$$$$1#%
ttlexp |
.$%""#
.$29$2$#
.$$%%%!9
.$$1711
.ttlexp3Mp |
.$$$21"
.$$$$%9
-.$$$$##"
.$$$$!
ten*re |
.$!7!9
.$92!19
-.$$%9#
.$$$!797
.ten*re3Me |
-.$$197$1
-.$$2$$!
.$$$$%
.$$$$7
n'tsmsa |
-.$#9$1$#
-.1$#2!2
.$%1#1%%
.$$"27%!
s'*t |
-.$"$"$9
-.$#"#922
.$2"2"1
.$$#1%!
-----------------------------------------------------------------------------b = 'nsistent *nder F' and FaN 'btained fr'm xtreg 4 = in'nsistent *nder Fa, effiient *nder F'N 'btained fr'm xtreg
&est
F'
differene in 'effiients n't systemati
i2(#) = (b-4)O>(Kb-K4) G(-1)A(b-4) =
1%9.%
:r'b;i2 =
$.$$$$
If this is < 0.05 (i.e. significant) use fixed effects. .
upongamos )ue disponemos de dos estimadores W5 y W6 y sabemos adems )ue uno de ellos, W6 es el ms eficiente !tiene menor varian3a$. #l test calcula con una formulación especial, con distribución c0i cuadrado, las diferencias en las estimaciones comunes a ambos modelos. i las diferencias, aun)ue sean altas, no son sistemticas !no tienen un sesgo definido$, entonces ambos estimadores son consistentes !la estimación muestral tiende al parmetro poblacional, significa )ue a medida )ue crece el tama1o de la muestra las estimaciones )ue nos proporciona el estimador se aproximan cada ve3 ms al valor del parmetro W poblacional$ y nos )uedaremos con el ms eficiente W6. i las diferencias son sistemticas entonces nuestra 0ipótesis no se cumple, ambos no son consistentes y a0ora tenemos un dilema pensar )ue el modelo est mal especificado en ambos casos o )uedarnos con el estimador consistente, )ue es W5
i el valor de la prueba es alto !p.e. p-valor menor de H.H$ la 0ipótesis de diferencias no sistemticas se rec0a3a, por lo )ue o se reelabora el modelo o se elige al )ue se considera consistente en cual)uier caso W5. i el valor de la prueba es bajo !p.e. p-valor mayor de H.H$ la 0ipótesis nula, de diferencias no sistemticas, se cumple y podemos elegir cual)uiera de los dos estimadores, normalmente el )ue suponemos ms eficiente, W6. #sta prueba se puede reali3ar con cuales)uiera dos modelos de regresión )ue )ueramos comparar. \5 ser el modelo del )ue estemos ms seguros, )ue suponemos consistente en cual)uier caso y W6 ser el modelo )ue )ueremos testar, )ue es ms eficiente pero no estamos seguros de )ue sea consistente. i los coeficientes de ambos modelos no tienen errores sistemticos podremos )uedarnos con W6 , si, por el contrario, aparecen errores sistemticos entonces W6 no es consistente y debemos )uedarnos con W5 . 'or ejemplo esta prueba se puede reali3ar para saber si es mejor el estimador de efectos fijos o variables en una base de datos de panel. 'ara ello se estima el modelo de efectos fijos ! W5 $ y el de efectos variables ! W6 $ si no existen diferencias o sesgo significativo !p-valor alto$ nos )uedamos con el de efectos variables, ms eficiente, pero si se detectan diferencias sistemticas !p-valor bajo$ debemos )uedarnos con el de efectos fijos, )ue 0emos supuesto siempre consistente. #s importante 0acer notar )ue estamos suponiendo )ue un modelo es siempre consistente ! W5 $ y )ue, en caso de igualdad en las estimaciones, otro es el ms eficiente ! W6 $, estas suposiciones son dif/ciles de contrastar y, a menudo, se incumplen. 'ero esa es otra 0istoria.