Eviews Intermedio Apli Ap lica cado do al An´ ali siss alisi Miccro Mi roe eco cono nom´ m´ et rico etri co
Juan Carlos Abanto Orihuela 1 de julio de 2012
2
Eviews Intermedio Aplicado al An´alisis ali sis Microec Micr oeconom´ onom´etrico etri co
www.giddea.com
[email protected]
´Indice general 1. Microeconometr´ Microeconometr´ıa y Tecnicas de Estimaci´ on on 1.1. Estimac Estimaci´ i´ on on y An´alisis alisis . . . . . . . . . . . . . . . 1.1.1. 1.1.1. Funci´ uncion o´n de Verosimilitud . . . . . . . . . . 1.1.2. 1.1.2. Score Score Eficien Eficiente te y Matriz Matriz de Informaci Informaci´ on o´n . . 1.1.3. 1.1.3. Estimad Estimador or MV del Modelo Modelo Lineal Lineal Genera Generall
. . . .
. . . .
. . . .
. . . .
2. Modelos Modelos de Elecc Elecci´ i´ on on Discreta 2.1. Estimac Estimaci´ i´ on on y An´alisis alisis . . . . . . . . . . . . . . . . . . . 2.1.1. 2.1.1. Interp Interpreta retaci´ ci´ on on Estructural . . . . . . . . . . . . . 2.1.2. 2.1.2. Modelo Modelo de Probabi Probabilid lidad ad Lineal Lineal . . . . . . . . . . 2.1.3. 2.1.3. Modelo Modelo de Probabi Probabilid lidad ad No Lineal Lineal . . . . . . . . 2.1. 2.1.4. 4. An An´´alisis alisis de Probabilidades y Cambios Marginales 3. Modelos Modelos de Elecc Elecci´ i´ on on Ordinal 3.1. Estimac Estimaci´ i´ on on y An´alisis alisis . . . . . . . . . . . . . . . . . . . 3.1.1. 3.1.1. Modelo Modelo de Vari Variable able Laten Latente te . . . . . . . . . . . . 3.1.2. 3.1.2. Testeo esteo de de Hip´ Hip´ otesis otesis . . . . . . . . . . . . . . . . . 3.1.3. 3.1.3. Supu Supuesto esto de de Parale Paralelis lismo mo . . . . . . . . . . . . . . 3.1. 3.1.4. 4. An An´´alisis alisis de Probabilidades y Cambios Marginales
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
4. Modelos Trunca Truncados dos y Censurados Censurados 4.1. Variables Dependientes Dependientes con Truncamie Truncamiento nto No Incidental Incidental . . . 4.1.1. Variable Aleatoria Aleatoria Truncada Truncada . . . . . . . . . . . . . . . 4.1.2. 4.1.2. Truncami runcamien ento to en el Modelo de Regresi´ Regresi´ on . . . . . . . . 4.1.3. 4.1.3. Estimac Estimaci´ i´ on del Modelo de Regresi´ on on on con Variable Truncada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.4. 4.1.4. Impacto Impacto Margin Marginal al en el Modelo Modelo de Regresi´ Regresi´ on . . . . . . 4.1.5. Variable Aleatoria Aleatoria Censurada Censurada . . . . . . . . . . . . . . 4.1.6. Censura en el Modelo de Regresi´ Regresi´on on . . . . . . . . . . . 4.1.7. 4.1.7. Estimac Estimaci´ i´ on del Modelo de Regresi´ on on on Censurada . . . . 4.1.8. 4.1.8. Efectos Efectos Margin Marginales ales y Bonda Bondad d de Ajuste Ajuste . . . . . . . . . 4.2. Variable de Truncami Truncamiento ento Incidental Incidental,, Sesgo de Selecci´ on on . . . 4.2.1. El modelo de Truncami Truncamiento ento Incidental Incidental . . . . . . . . . 3
. . . .
5 5 5 6 6
. . . . .
11 11 11 13 15 19
. . . . .
23 24 24 26 27 27
33 . 34 . 34 . 35 . . . . . . . .
36 36 37 37 38 40 42 42
´INDICE GENERAL
4
4.2.2. Estimaci´on del Modelo de Truncamiento Incidental . . . 44 4.2.3. Efectos Marginales . . . . . . . . . . . . . . . . . . . . . 46
5. Modelos de Panel Est´ atico 5.1. Introducci´ on . . . . . . . . . . . . . . . . . . . . . . 5.2. Estructura . . . . . . . . . . . . . . . . . . . . . . . 5.3. Heterogeneidad No Observada . . . . . . . . . . . . 5.4. Estimaci´on . . . . . . . . . . . . . . . . . . . . . . . 5.4.1. Modelo MCO combinado (MCOC) - Pooled 5.4.2. Modelo de Efectos Fijos . . . . . . . . . . . 5.4.3. Modelo de Efectos Aleatorios . . . . . . . . 5.4.4. Test de Hausman . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
51 51 54 56 57 57 57 58 59
6. Panel Din´amico 61 6.1. Especificaci´ on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.2. Especificaci´ on del Modelo Econom´etrico . . . . . . . . . . . . . 62 6.3. Estimaci´on del modelo . . . . . . . . . . . . . . . . . . . . . . . 64
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
Sesi´ on 1 Microeconometr´ıa y Tecnicas de Estimaci´ on 1.1.
Estimaci´ on y An´ alisis
La microeconometr´ıa es la rama de la econometr´ıa que se encarga del estudio de datos microecon´ omicos. La microeconometr´ıa utiliza t´ecnicas estad´ısticas y matem´ aticas para la estimaci´on de diversos par´ ametros en modelos microecon´ omicos. Se divide en dos grandes grupos, principalmente: modelos de datos de panel y modelos de elecci´ on cualitativa, aunque tambi´en estudia otras situaciones, como por ejemplo modelos de variables acotadas.
1.1.1.
Funci´ on de Verosimilitud
El objetivo de la verosimilitud, es el encontrar par´ ametros que maximicen la probabilidad de obtener la verdadera muestra. La tecnica necesita establecer una funci´ on f (y, θ) y maximizar la verosimin litud establecida por L(y, θ) = i=0 f (yi , θ) o su transformaci´ on monot´ onica n LnL(y, θ) = i=0 Lnf (yi , θ).
La funcion anterior (que recibe el nombre de funcion log-verosimil) es precisamente aquella que se busca maximizar en terminos de θ. Esta transformacion puede realizarse debido a que las funciones de probabilidad son monotonicas crecientes y por tanto cualquier transformacion de este tipo no altera los resultados de los puntos de maximizacion. Este tipo de estimaci´on, partiendo de una correcta especificaci´ on y el cumplimiento de ciertas condiciones, garantiza la obtenci´ on de estimadores asint´ oticamente insesgados, eficientes y consistentes.
5
6
1.1.2.
1. Microeconometr´ıa y Tecnicas de Estimaci´ on
Score Eficiente y Matriz de Informaci´ on
Existen dos matrices importantes en el an´alisis de las funciones de verosimilitud. Estas matrices nos dan informaci´on valiosa que es muy importante incorporar en el estudio de los estimadores de m´ axima verosimiltitud. La primera de ellas se conoce como el score eficiente y se define como: ∂LnL(β ) = S (β ) = g(β ) ∂β Este es el vector gradiente de la funci´ on log-veros´ımil. Contiene tantos elementos como par´ ametros a estimar contenga un modelo. El valor de la matriz de score eficiente, evaluada en el estimador de m´ axima verosimilitud (que representa precisamente el m´ aximo de la funci´on) es cero. La segunda matriz se conoce como la matriz de informaci´ on y viene dada por la esperanza del negativo de la segunda derivada de la funci´ on log-veros´ımil respecto al par´ ametro:
−
E
∂ 2 lnL(β ) ∂β∂β
Bajo ciertas condiciones de regularidad, la varianza del estimador de m´ axima verosimilitud viene dada por la inversa de la matriz de informaci´on: ˆM V ) = [I (β ˆ)]−1 V ar(β La expresion anterior se deriva del teorema de la Cota Minima de CramerRao, el cual establece que si la funcion de densidad de x satisface ciertas condiciones de regularidad, la varianza de un estimador insesgado del parametro β sera siempre por lo menos igual a [I (β )]−1 .
1.1.3.
Estimador MV del Modelo Lineal General
El principio de m´axima verosimilitud es muy flexible y se puede aplicar tomando en cuenta varias formas estructurales y distintas funciones de distribuci´on. Consideraremos el estimador m´aximo veros´ımil del modelo lineal general, sabiendo que este puede expresarse de la siguiente manera: y = xβ + µ. En el contexto de m´ axima verosimilitud debemos suponer que la variable aleatoria relevante sigue una funci´ on de probabilidad espec´ıfica. Por ello vamos a introducir el supuesto de que el vector µ sigue una distribuci´on normal manteniendo el supuesto de que su media es igual a cero y su varianza viene dada por la matriz Iσµ . De esta manera la funci´ on de densidad del vector µ seria: 1 1 f (µ) = e (2π)n/2 (σµ2 )n/2 Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
1 2 2σµ
µµ
www.giddea.com
[email protected]
1.1. Estimaci´ on y An´ alisis
7
La funci´on de densidad anterior puede transformarse en la funci´ on de verosimilitud muestral si se expresa µ en funci´ on de x e y. L(β,
σµ2 /x,y)
1 1 = e (2π)n/2 (σµ2 )n/2
1 2 2σµ
(y−xβ) (y−xβ)
Luego de realizar la transformaci´ on monot´ onica LnL(β, σµ2 ) procedemos a optimizar en funci´ on a sus par´ametros: ∂LnL =0 β ∂LnL =0 σµ2 De esta forma, se verifica que, bajo los supuestos de normalidad del termino de error y forma lineal del modelo, el estimador de maxima verosimilitud de β coincide con el estimador MCO. El estimador de la varianza del termino de error, sin embargo, difiere del obtenido a traves de MCO, siendo ahora sesgado. Sin embargo, el sesgo del estimador de m´axima verosimilitud tiende a cero al aumentar el tama˜ no muestral y se aproxima al estimador MCO. En Eviews podemos realizar una estimaci´ on de verosimilitud como sigue: ’=========================================================== ’Aplicaci´ on 01: Estimador MV y Matriz de Varianza Covarianza ’=========================================================== wf u 100 rndseed 123 ’simulaci´ on de datos con distribuci´ on Normal series x1=4+0.2*@rnorm series x2=5+0.3*@rnorm series x3=6+0.5*@rnorm+0.3*@trend ’PGD: proceso generador de datos series y=0.5+0.6*x1+0.32*x2+0.7*x3+0.01*@rnorm ’Estimaci´ o n MCO equation eq1.ls y coef(1) inter coef(3) beta coef(1) sigma2
c
x1
x2
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
x3
www.giddea.com
[email protected]
8
1. Microeconometr´ıa y Tecnicas de Estimaci´ on
inter(1)=eq1.@coef(1) for !w=2 to 4 beta(!w)=eq1.@coef(!w+1) next sigma2(1)=eq1.@se^2 ’Estimaci´ o n MV logl logl1 logl1.append @logl loglike logl1.append @byeqn logl1.append error=y-inter(1)-beta(1)*x1-beta(2)*x2-beta(3)*x3 logl1.append varianza=sigma2(1) logl1.append loglike=log(@dnorm(error/@sqrt(varianza))) - (1/2)*log(varianza) logl1.ml ’Estimaci´ o n de la matriz de VarCov matrix cmatrix =logl1.@coefcov ’Estimaci´ o n por gradientes de la matriz de informaci´on logl1.makegrads(n=gradiente) g_inter gbeta1 gbeta2 gbeta3 g_sigma2 stom(gradiente, g1) matrix info=@transpose(g1)*g1 ’Comparaci´ on de las varianzas estimadas matrix crao=cmatrix-@inverse(info)
Ahora podemos comparar los estimadores de la desviaci´ on estandar y del par´ametro asociado a un modelo AR(1) con drift. ’============================================================= ’Aplicaci´ on 02: Estimaci´ on de la varianza y pendiente mediante MCO y MV ’============================================================= !n=100 wf u !n series mus series rhos series sigmas2 series mus1 series rhos1 series sigmas21
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
1.1. Estimaci´ on y An´ alisis FOR
9
!k=1 to !n
series y=0 series z=nrnd smpl @first+1 @last series y=0.5+0.8*y(-1)+z smpl @all
’genero un ar(1) con intercepto
equation mco.ls y c ar(1) coef(1) mu=mco.@coef(1) ’guardo el valor en un coeficiente coef(1) rho=mco.@coef(2) coef(1) sigma2=mco.@se^2 mus(!k)=mu(1) rhos(!k)=rho(1) sigmas2(!k)=sigma2(1) logl logl1 logl1.append @logl loglike logl1.append res=y-mu(1)-rho(1)*y(-1) logl1.append var=sigma2(1) logl1.append loglike=log(@dnorm(res/@sqrt(var)))-log(var)/2 smpl @first+1 @last logl1.ml mus1(!k)=mu(1) rhos1(!k)=rho(1) sigmas21(!k)=sigma2(1) NEXT group g1 g1.line group g2 g2.line
rhos
rhos1
sigmas2 sigmas21
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
10
1. Microeconometr´ıa y Tecnicas de Estimaci´ on
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
Sesi´ on 2 Modelos de Elecci´ on Discreta 2.1.
Estimaci´ on y An´ alisis
Las estimaciones lineales cl´ asicas permiten la modelizaci´ on de variables dependientes cuantitativas para identificar relaciones estad´ısticas en las que se asume una serie de supuestos sobre la forma del error de la ecuaci´ on lineal (homocedasticidad, normalidad, etc.). Sin embargo, en muchos contextos, el fen´omeno que se quiere modelizar no es continuo sino discreto, por ejemplo cuando se quiere modelar la elecci´ o n de compra de un bien o servicio; o la decisi´on de participar o no en el mercado laboral. Estos son los modelos conocidos como modelos de respuesta cualitativa. Llamamos variables cualitativas a aquellas que no aparecen en forma num´ erica, sino como categor´ıas o atributos como por ejemplo, el sexo o la profesi´on de una persona. En general, se dice que una variable es discreta cuando est´ a formada por un n´ umero finito de alternativas que miden cualidades.
2.1.1.
Interpretaci´ on Estructural
Existen tres enfoques para la interpretaci´ on estructural de los modelos de elecci´on discreta. El primero hace referencia a la modelizaci´ on de una variable latente a trav´es de una funci´ on ´ındice, que trata de modelizar una variable inobservable o latente. El segundo de los enfoques permite interpretar los modelos de elecci´ on discreta ba jo la teor´ıa de la utilidad aleatoria, de tal manera que la alternativa seleccionada en cada caso ser´ a aquella que maximice la utilidad esperada. El tercero pasa por plantear un modelo de probabilidad no lineal. Bajo el primero de los enfoques se trata de modelizar una variable ´ındice, inobservable o latente no limitada en su rango de variaci´ o n y*. Cuando la variable latente supera un determinado nivel, la variable discreta toma el valor 1, y si no lo supera toma el valor 0. La variable latente depende de un conjunto de variables explicativas que generan las alternativas que se dan en la realidad y que permiten expresar el modelo dicot´ omico como: 11
12
2. Modelos de Elecci´ on Discreta
Y =
1, si Y ∗ > 0, 0, si Y ∗ 0.
≤
Donde el supuesto sobre la distribuci´on de error determina el tipo de modelo a estimar. Si se supone una funci´ on de distribuci´ on uniforme, se utiliza el Modelo Lineal de Probabilidad truncado; si se distribuye como una normal con media cero y varianza uno, el modelo generado ser´ a un Probit; mientras que si se supone que se distribuye como una curva log´ıstica, se tratar´ıa de un modelo Logit. La hip´otesis de que el umbral a superar por la variable latente sea cero se puede modificar por cualquier otro valor sugiri´endose, en determinados estudios, que el valor cr´ıtico sea el definido por el t´ermino constante. Bajo este enfoque, el modelo probabilistico quedar´ıa: Y ∗ = X β + P r(Y = 1/X ) = P r(Y ∗ > 0/X ) P r(Y = 1/X ) = P r( > (Xβ )/X ) P r(Y = 1/X ) = F (Xβ )
−
Con el modelo as´ı definido, la variable end´ ogena del modelo dicot´ omico representa la probabilidad de ocurrencia del fen´ omeno analizado, siendo la probabilidad de que ocurra la opci´ o n 1 m´as elevada cuando mayor sea el valor ∗ de Y . El segundo de los enfoques para la interpretaci´ o n de los modelos de respuesta dicot´ omica es el que hace referencia a la modelizaci´ on a trav´es de la formulaci´ on de una utilidad aleatoria. Bajo este enfoque un individuo debe adoptar una decisi´ on que le permita elegir entre dos alternativas excluyentes, la 1 o la 0, lo que har´a maximizando la utilidad esperada que le proporciona cada una de las alternativas posibles sobre las que tiene que decidir. Es decir, el individuo i-´esimo elegir´ a una de las dos alternativas dependiendo de que la utilidad que le proporciona dicha decisi´on sea superior a la que le proporciona su complementaria. La formulaci´ on del modelo bajo esta teor´ıa parte del supuesto de que la utilidad derivada de una elecci´ on, U i0 o U i1 , es funci´on de las variables explicativas de dicha decisi´on, que son las caracter´ısticas propias de cada una de las alternativas de elecci´ on y las caracter´ısticas personales propias del individuo, de manera que suponiendo linealidad en las funciones, se tiene: U i0 = α 0 + X i0β + i0 U i1 = α 1 + X i1β + i1 Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
2.1. Estimaci´ on y An´ alisis
13
Donde los ij recogen las desviaciones que los agentes tienen respecto a lo que ser´ıa el comportamiento del agente medio y que se debe a factores aleatorios. El agente i elegir´a la opci´on 1 si la utilidad de esa decisi´on supera la de la opci´on 0 y viceversa, de manera: Y i =
1, si U i1 > U i0, 0, si U i1 < U i0.
Y el modelo dicot´omico quedar´ıa definido por: P r(Y = 1/X ) = P r(U i1 > U i0 /X ) = P r(i1 P r(Y = 1/X ) = F (Xθ)
−
i0
>
−(Xθ)/X )
Seg´ un que la funci´ on asociada a la perturbaci´ on aleatoria ij (que ser´a la funci´on de distribuci´ on, F (Xθ), que se suponga siga dicha probabilidad), sea una funci´ on de distribuci´on uniforme, la funci´on de distribuci´ on de la normal tipificada o la de la curva log´ıstica, se obtienen el Modelo Lineal de Probabilidad Truncado, el Probit o el Logit, respectivamente. El tercer enfoque pasa por estructurar un modelo de probabilidad no lineal, como lo sugiere Theil - 1970, de tal manera que: P r(Y = 1/X ) = M i = Ω(x) =
P r(Y =1/X ) P r(Y =0/X )
=
exp(Xβ ) 1+exp(Xβ )
P r(Y =1/X ) 1−P r(Y =1/X )
Ln(Ω(x)) = X β + Es decir medir que tan a menudo ocurre algo (Y=1), respecto a que tan a menudo no ocurre (Y=0).
2.1.2.
Modelo de Probabilidad Lineal
La primera alternativa te´ orica desarrollada para estudiar modelos con variables dic´otomas se plante´ o como una extensi´on del modelo lineal general: Y t = α t + X kt β k + t Donde : 1, si ocurre una alternativa, Y t = 0, en caso contrario. X kt =Variables explicativas t =Variable aleatoria que se distribuye N (0, σ 2)
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
14
2. Modelos de Elecci´ on Discreta
En general, la distribuci´ on de los modelos de elecci´ on binaria se caracteriza por configurar una nube de puntos de tal manera que las observaciones se dividen en dos subgrupos. Uno de ellos esta formado por las observaciones en las que ocurri´ o el acontecimiento objeto de estudio (Y i =1), y el otro, por los puntos mu´estrales en los que no ocurri´ o (Y i =0).Para el desarrollo de los modelos de elecci´ on discreta se utilizar´ a la base de datos “bdbinario”. load bdbinario
La base de datos que trabajaremos cuenta con informaci´ on sobre un conjunto de alumnos, los cuales fueron sometidos a un nuevo metodo de ense˜ nanza, luego de aplicado el m´etodo de ense˜ nanza se busco ver si el alumno mejor´ oo no, para ello la variable ´´mejora nos da dicha informaci´ on”. Para predecir si el alumno mejoro o no, se us´o el siguiente set de variables: cm (promedio de calificaciones pasadas del alumno), np (nota del alumno en examen previo) y psi (variable que indica si el alumno estudio con el nuevo m´etodo de ense˜ nanza o no). equation eqlineal.ls mejoro c np
Problemas con esta estimaci´ on La interpretaci´ on de los coeficientes en los modelos de probabilidad es similar a la de los modelos de regresi´ on lineal, en donde el valor de los par´ ametros recoge el efecto de una variaci´ on unitaria en cada una de las variables explicativas sobre la probabilidad de ocurrencia del acontecimiento objeto de estudio, sin embargo, el MPL presenta algunas inconsistencias. Se puede apreciar en el modelo inicial que algunos de los valores estimados se encuentran fuera de rango, lo cual carece de l´ ogica considerando que deben interpretarse como probabilidades. eq1.fit mejoro_hat mejoro_se series e1=resid graph gph1.scat np mejoro_hat mejoro gph1.legend position(-1,3.7)
Soluci´on: ¿Modelo de probabilidad truncada? A trav´es del gr´afico de la densidad de Kernel para el modelo que incluye todas las variables, se observa que los residuos no se distribuyen de manera normal, por lo tanto no es eficiente, es decir, pueden presentarse problemas de minimizaci´on de la varianza a medida que la muestra aumenta. e1.kdensity(k=n) Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
2.1. Estimaci´ on y An´ alisis
15
¿Invalida esto la estimaci´on por MCO? ¿Los estimadores siguen siendo MELI (BLUE)? Problemas de Heterocedasticidad. A´ un en el caso de que se cumpliesen las hip´otesis de media y correlaci´ on nula en la perturbaci´ on aleatoria E(i ) = 0 E(i , j ) = 0 para todo i = j, no se cumple la hip´ otesis de varianza constante, es decir, la perturbaci´ on aleatoria no es homoced´ astica.
V ar(t ) = E [(i
2 i
− E ( ))( − E ( )) ] = E ( ) V ar( ) = (1 − Xβ ) f (1) + (0 − Xβ ) (1 − f (1)) V ar( ) = (1 − f (1)) f (1) + (f (1)) (1 − f (1)) V ar( ) = (1 − f (1))f (1) i
2
t
t
i
t
i
i
i
2
i
2
i
i
i
2
i
i
Veamos ahora si el residuo presenta heterocedasticidad. eq1.white(c) eq1.archtest(2)
Para el presente ejemplo la hip´ otesis nula de varianza constante (homocedasticidad) ser´ a rechazada debido a que el p value de la distribuci´o n del estad´ıstico chicuadrado es muy peque˜ no, acept´ andose la hip´ otesis alterna de varianza no homog´enea. Soluci´on: ¿MCG o MCP?
2.1.3.
Modelo de Probabilidad No Lineal
Los problemas en la interpretaci´ on y estimaci´on de los par´ametros del modelo de probabilidad lineal han llevado a la b´usqueda de modelos alternativos que permitan estimaciones m´ as fiables de las variables dic´otomas. Es el caso de los modelos de probabilidad no lineal, donde la funci´on de especificaci´ on utilizada garantiza un resultado en la estimaci´on comprendido en el rango 0-1. Estos son los modelos logit y probit. Analizaremos a continuaci´on los datos a trav´es de una regresi´ on log´ıstica, la cual se formula a continuaci´ on. eXβ P r(Y = 1) = = ∆(Xβ ) 1 + eXβ equation eqextremo.binary(d=x) mejoro c cm np psi equation eqprobit.binary(d=n) mejoro c cm np psi equation eqlogit.binary(d=l) mejoro c cm np psi Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
16
2. Modelos de Elecci´ on Discreta
Pos-estimaci´ on a. Test de efectos individuales Si los supuestos bases del modelo se sostienen, los estimadores son distribuidos de manera asint´ otica y normal: ˆk β
a
2 ) βˆk
−−→ N (β , σ k
Donde la hip´otesis nula de significancia del par´ ametro puede ser testeada a partir de: ˆk β ∗ β z = σβ2ˆ
−
k
Si la hip´otesis nula es verdadera entonces z se distribuir´ a aproximadamente como una normal con media cero y varianza unitaria para muestras grandes.
b. Test de Wald Podemos analizar el modelo una vez estimado, mediante un testeo de hip´otesis que validen una correcta especificaci´ o n. Para esto el test de Wald calculado para hip´ otesis lineales sobre los par´ ametros de los modelos estimados nos ser´ a de mucha utilidad. Tambi´ en puede usarse el test bajo una estructura no lineal, la cual no abordaremos en esta secci´ on. equation eqprobit.binary(d=n) mejoro c cm np psi eqlogit.wald c(2)=0, c(3)=0
c. Test LR El estad´ıstico de verosimilitud tambi´en nos ser´ a de gran utilidad para evaluar mediante hip´ otesis la significacia de modelos. Este estad´ıstico compara modelos anidados. eqlogit.binary(d=l) mejoro c cm np psi scalar lh1=eqlogit.@logl eqlogit.binary(d=l) mejoro c cm np scalar lh2=eqlogit.@logl scalar ratio=-2*(lh2 - lh1) scalar pval = 1-@cchisq(ratio, 1) Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
2.1. Estimaci´ on y An´ alisis
17
Donde nuestra hip´ otesis nula es H 0 = β psi = 0 Muchas medidas escalares han sido desarrolladas para resumir las bondades de ajuste de modelos de regresi´ on continuo o de variables categ´ oricas. Sin embargo no hay evidencia convincente de selecci´ on de un modelo que maximice los valores de una medida comparada con la medida de otro modelo. Mientras las medidas de ajuste proveen informaci´ on, esta es solo parcial, que deber´ıa ser sostenida con una teor´ıa econ´ omica razonable, o investigaciones anteriores como referencia. A continuaci´on proveeremos de una breve descripci´ on de cada una de las medidas que podemos encontrar en Long(1997).
Medida basada en Log-Likehood Stata comienza su an´ alisis maximizando iteracciones de verosimilitud y calculando sus logaritmos, para determinado modelo, con todos los par´ ametros excepto el intercepto en un nivel de cero L(M intercepto ), mientras que cuando los par´ametros son diferentes de cero, el logaritmo de verosimilitud calculado ser´a L(M full ) Test Chi-Cuadrado de todos los coeficientes Un test LR donde la hip´otesis nula de que todos los coeficientes excepto el intercepto son ceros puede ser calculado comparando el logaritmo de verosimilitud LR=2[Ln(M full )-Ln(M intercepto )], a veces a este estadistico se le designa con el valor G2. McFadden’s R2 R2 en MRL Para una regresi´ on lineal se reporta el coeficiente de determinaci´ on est´andar: R2 = 1
N 1 (yi N 1 (yi
−
− yˆ ) − y¯ ) i i
2
V ar(ˆ y) = =1 V ar(ˆ y ) + V ar(ˆe)
2
−
L(M intercepto ) L(M full )
2
N
Y el R2 ajustado seria: ˜2 = R
R2
K N 1
− −
N
− 1 N − K − 1
R2 en MRNL En modelos no lineales la medida calculada son los pseudos R2 . El R2 de McFadden, tambi´ en conocido como el ´ındice del ratio de verosimilitud, compara dos modelos: 2 RMcF =1
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
−
LnL(M f ull) LnL(M intercepto )
www.giddea.com
[email protected]
18
2. Modelos de Elecci´ on Discreta Y como el R2 de McFadden siempre se incrementa con el numero nuevo de variables explicativas, se ajusta su versi´ on con: 2 RMcF =1
−
LnL(M full ) K ∗ LnL(M intercepto )
−
Donde K ∗ es el numero de variables independientes, no el numero de par´ ametros.
El R2 Count y el R2 Count Ajustado De los valores observados y predichos, se calcula el R2Count. Definimos as´ı el R2Count como: 2 RCount =
1 N
n jj
j
donde n jj es el numero de predicciones correctas en la tabla. Pero el 2 RCount puede darnos una interpretaci´ on fallida del poder de predicci´on del modelo. En un modelo binario sin previo conocimiento de las variables independientes es posible corregir las predicciones en al menos el 50 % de los casos eligiendo una categor´ıa con el mayor porcentaje de casos observados. El ajuste se hace de la siguiente manera: maxr (n++ ) j n jj 2 RCount = N maxr (n++ )
−
−
Donde n ++ es el mayor valor marginal de la ultima fila.
Medidas de Informaci´ on AIC Este criterio compara modelos de diferentes tama˜ nos de muestra o tambi´ en modelos no anidados. Akaike (1973) defini´ o: AIC =
ˆ ) + 2 p −2LnL(M k
N
Donde “p” es el n´ umero de par´ ametros en el modelo (K+1 en los modelos de regresi´ on binaria donde K es el n´umero de regresores) BIC El criterio de informaci´ on Bayesiana fue propuesto por Raftery (1996) como una medida que compara modelos anidados como modelos no anidados. Definimos BIC de la siguiente manera: BI C K = D(M K )
− gl Ln(N ) k
Donde gl k son los grados de libertad asociados con la desviaci´ on. La segunda versi´ on de BIC es basada al ratio de verosimilitud del Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
2.1. Estimaci´ on y An´ alisis
19
Chi2 con gl k definiendo dichos grados de libertad, como el numero de regresores (no par´ ametros) en le modelo. BI C K =
2
k
−G (M ) − gl Ln(N ) K
eqprobit.binary(d=n) mejoro c cm np psi eqprobit.testfit(h,5,u)
Otra posible soluci´on a las inconsistencias que presenta el modelo de probabilidad lineal para explicar el comportamiento de una variable dependiente binaria es el uso del modelo probit de la forma: y = f (β 0 + β 1 x1 + ... + β k xk ) + Donde f es la funci´on de distribuci´on normal est´andar Xβ
f (Xβ ) =
−∞
2.1.4.
√ 12π e
s2 2
ds + i
An´ alisis de Probabilidades y Cambios Marginales
Los efectos marginales suelen proporcionar una buena aproximaci´ o n del cambio que la presencia o no de la variable binaria o continua, originaria sobre la probabilidad predicha de alg´ un modelo.
’<
> ◦◦◦◦◦◦◦◦◦◦ ’ ’Estimacion Modelo Probit ’◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦ equation eqprobit.binary(d=n) mejoro c np eqprobit.fit mejoro_hat1 mejoro_se1 graph gph2.scat np mejoro_hat1 mejoro ooooooooooooooooooooooo
cm
psi
’numero de coeficientes del modelo !p=4 vector(!p) coef_probit for !k=1 to !p coef_probit(!k)=eqprobit.@coef(!k) next
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
20
2. Modelos de Elecci´ on Discreta
vector(!p) efmarg_probit for !k=1 to !p efmarg_probit(!k)=@dnorm(-(coef_probit(1)+coef_probit(2)*@mean(np) +coef_probit(3)*@mean(cm)+coef_probit(4)*@mean(psi)))*coef_probit(!k) next ’Estimacion Modelo Logit ’◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦ equation eqlogit.binary(d=l) mejoro c np
cm
psi
’numero de coeficientes del modelo !p=4 vector(!p) coef_logit for !k=1 to !p coef_logit(!k)=eqlogit.@coef(!k) next vector(!p) efmarg_logit for !k=1 to !p efmarg_logit(!k)=@dlogistic(-(coef_logit(1)+coef_logit(2)*@mean(np) +coef_logit(3)*@mean(cm)+coef_logit(4)*@mean(psi)))*coef_logit(!k) next ’Estimacion Modelo Valor Extremo ’◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦◦ equation eqval.binary(d=x) mejoro c np
cm
psi
’numero de coeficientes del modelo !p=4 vector(!p) coef_VAL for !k=1 to !p coef_val(!k)=eqval.@coef(!k) next vector(!p) efmarg_val scalar z=coef_val(1)+coef_val(2)*@mean(np)+coef_val(3)*@mean(cm) +coef_val(4)*@mean(psi) for !k=1 to !p efmarg_val(!k)=( @exp(-z)*@exp( -@exp(-z) ) )*coef_val(!k) next
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
2.1. Estimaci´ on y An´ alisis
21
Si existe un cambio marginal en alguna variable discreta entonces necesitamos evaluar los cambios totales:
’EMg general en Logit ’ model m_probit m_probit.append assign @all f m_probit.append con_Psi = 1 - @CNORM(-(coef_probit(1)+ coef_probit(2)*CM+ coef_probit(4)*@mean(psi))) m_probit.append sin_Psi = 1 - @CNORM(-(coef_probit(1)+ coef_probit(2)*CM)) m_probit.solve graph gph2.scat cm con_psif sin_psif oooooooooooooooooooooooooooo
Veamos la estimaci´on v´ıa verosimilitud logl ll1 ll1.append @logl logl1 ll1.append xb = c(1)+c(2)*CM + c(3)*NP + c(4)*psi ll1.append logl1 = mejoro*log(@cnorm(xb))+(1-mejoro)*log(1-@cnorm(xb)) equation eq1.ls mejoro c cm np psi ll1.ml(showopts, m=1000, c=1e-5)
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
22
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
2. Modelos de Elecci´ on Discreta
www.giddea.com
[email protected]
Sesi´ on on
3
Modelos de Elecci´ on on Ordinal Cuando la variable dependiente es discreta, pero sus valores indican un orden, no es correcto realizar la estimaci´on on de la misma a trav´es es de d e los modelos presentados en el apartado anterior, ya que la inclusi´ on on de la informaci´on on que aporta el orden de las alternativas en la especificaci´ on del modelo permite obon tener unos mejores resultados. Las variables ordinales son a menudo codificadas como enteros consecutivas de 1 al n´ umero umero de categor´ categor´ıas, no n o ser´ ser´ıa correcto el uso de un modelo de regresi´on on cl´asico, asico, ya que codificadas las posibles alternativas como 1, 2, ...(j+1), ..., J, se estar´ estar´ıa considerando considerando la diferencia diferencia entre (j+1) y (j+2) como la existente existente entre entre 1 y 2, lo cual no tiene tiene porque porque ser as´ as´ı ya que los n´ umeros umeros utilizados en la codificaci´on on solo representan un orden dentro de una clasificaci´ on. on . As´ı, ı, con co n modelos de salida ordinal es mejor usar modelos que eviten el supuesto de que las distancias distancias entre las categor´ categor´ıas sean iguales, iguales, ahora nos enfocaremos en un logit y probit que consideren consideren esta ordenaci´ ordenaci´on, on, modelos introducidos p or McKelvey y Zavoina (1975) en t´erminos erminos de una variable latente. Cuando las salidas son ordinales o nominales la dificultad de explicar m´ as as de dos respuestas se incrementa. Una variable puede ser ordenada de cierta manera cuando consideramos un tema, y ordenada de otra manera cuando consideramos un tema diferente. Millar y Volker (1985) mostraron como diferentes supuestos sobre el ordenamiento de ocupaciones, proyectan diferentes resultados. Una variable podr´ıa ıa reflejar re flejar ordenamiento sobre so bre m´ as de una dimensi´on on tal como escalas de actitudes, que reflejen ambas la intensidad y direcci´on on de opini´on. o n. Mas a´ un u n es muy com´ un que encuestas incluyan la categor´ un categor´ıa “no sabe, no opina”, lo cual probablemente no corresponda correspo nda a la categor´ıa ıa intermedia en una escala, aun cuando en el an´ alisis uno este tentado a colocarla como alisis tal, sobretodo cuando la propuesta de ordenamiento es ambigua, el modelo de salidas nominales podr po dr´´ıa ser considerado. 23
24
3. Modelos de Eleccion o ´n Ordinal
3.1. .1.
Estim stimac aci´ i´ on on y An´ An´ alis al isis is
Los MRO pueden ser desarrollados desarrollados de diferentes maneras, cada una de ellas nos conduce al mismo resultado. El modelo de regresi´ on binaria (MRB) pueden on ser vistos como un caso especial de los MRO, en el cual la variable end´ogena ogena solo tiene dos categor categ or´´ıas.
3.1.1. 3.1.1.
Modelo Modelo de Variabl ariable e Late Laten nte
El modelo de regresi´on on ordinal es com´ unmente unmente presentado como un modelo mo delo ∗ de variable latente. Definida y Definida y como una variable latente cuyo rango va desde - a
∞ ∞
yi∗ = x i β + + Donde la variable end´ ogena toma los siguientes valores: ogena ∗ i
= m, si rm−1 yi = m,
≤ y
< rm m = 1...J
∀
O tambi´en en de manera maner a extendida: exten dida:
yi =
1, 2, 3, .. .
∗ i
−∞ = r ≤ y ≤ y < r , ≤ y < r ,
si si r1 si r2
0
∗ i ∗ i
J, si rJ −1
≤ y
< r1 ,
2 3
∗ i
< rJ =
∞.
Donde los puntos de corte r corte r j son so n estimados. Como ejemplo, podr po dr´´ıamos tener la siguiente pregunta en una encuesta: ¿Una mujer trabajadora establece un fuerte y seguro vinculo vinculo con su hijo, as´ as´ı como una mujer que no trabaja? Las posibles respuestas podr po dr´´ıan ser: 1=Desacuerdo Total, 2=Desacuerdo, 3=Acuerdo, 4=Acuerdo Total La variable latente continua puede imaginarse como el grado de aceptaci´ on on a favor de que las mujeres trabajadoras son buenas madres.
yi =
1 = DT D T , 2 = D, D , 3 = A, 4 = AT ,
Eviews Intermedio Aplicado al An´alisis ali sis Microec Micr oeconom´ onom´etrico etri co
∗ i
−∞ = r ≤ y < r , ≤ y < r , ≤ y < r , ≤ y < r = ∞.
si si r si r 1 si r si r 2 si r si r 3
0
∗ i ∗ i ∗ i
1
2 3 4
www.giddea.com
[email protected]
3.1. Estimaci´ on y An´ alisis
25
La probabilidad de una variable observada dado el valor de x, corresponde a la regi´on on en la que la distribuci´on o n de y∗ cae entre rm−1 y rm P r(y = m/x = m/x)) = P r(rm−1
≤ y
∗
< rm/x) /x)
Sustituyendo xβ + por y∗ y usando algo de algebra obtenemos la formula est´andar andar que predice la probabilidad en el MRO P r(y = m/x = m/x)) = F ( F (rm
F (r − xβ ) − F (
m−1
− xβ )
Donde F es la funci´on on de probabilidad acumulada para . En el probit ordinal, F es una normal con Var( Var()=1, en el logit ordinal, F es una logistica con π Var( Var()= 3 . Notar que cuando y=1 el termino F(xβ )=0 )=0 y cuando y=J el primer termino de F( xβ )=1. )=1. 2
∞−
∞−
Comparando estas ecuaciones con las de un MRB se observa que el MRO es id´entico entico a la regresi´ regr esi´ on on binaria, veamos: load binar binario io equation equat ion eqpr eqprobit. obit.binar binary(d=n y(d=n) ) mejo mejoro ro c np equation equat ion eqlo eqlogit.b git.binary inary(d=l) (d=l) mejo mejoro ro c np equation equat ion eqop eqoprobit robit.orde .ordered(d red(d=n) =n) mejo mejoro ro c np equation equat ion eqol eqologit. ogit.order ordered(d= ed(d=l) l) mejor mejoro o c np
Los coeficientes y sus desviaciones est´ andar son los mismos pero el interandar cepto para el logit, es reportado, mientras que para el ologit ese intercepto es reemplazado por el punto de corte del mismo nivel pero de signo opuesto. En Stata, la identificaci´ on on del MRO asume asum e que el intercepto inter cepto es cero ce ro y as´ı los valores de los puntos de corte son estimados. El modelo de regresion ordinal puede tambien ser desarrollado como un modelo de probabilidad no lineal sin recurrir a la idea de variable latente. Para mostrar esto, primero definimos el odds de que la variable explicada es menor o igual a “m” vs que sea mayor que “m” dado las variables exogenas “x”: Por ejemplo, podriamos calcular el odds de desagrado o fuerte desagrado, versus el agrado o fuerte agrado. Asi el logaritmo del odds es igual a: P r(y m/x) m/x) P r(y > m/x) m/x) Para una simple simple variable independiente y tres categor´ categor´ıas en la explicada, explicada, donde el intercepto fue fijado en “0”, tendriamos: Ω≤m|>m =
≤ |
y ≤1/x) /x) ) = r 1 Ln( Ln( PP rr((y>1 y>1/x) /x) y ≤2/x) /x) Ln( Ln( PP rr((y>2 ) = r 2 y>2/x) /x)
Eviews Intermedio Aplicado al An´alisis ali sis Microec Micr oeconom´ onom´etrico etr ico
− β x − β x
1 1 1 1
www.giddea.com
[email protected]
26
3. Modelos de Elecci´ on Ordinal
Parece confuso que el modelo substraiga xb en lugar de a˜ nadirlo, esto es consecuencia del calculo del logit de y m vs y > m.
≤
Aqu´ı un ejemplo basado en la encuesta realizada entre 1977 y 1989 de General Social Survey, donde el tema y pregunta tratado fue: “¿Una madre trabajadora puede establecer una calida y segura relacion sentimental con su hijo como una madre que no trabaja?” load warm equation eq1.ordered(d=n) warm c yr89 male white equation eq2.ordered(d=l) warm c yr89 male white equation eq3.ordered(x) warm c yr89 male white
Usando los datos, nosotros estimamos el siguiente modelo: P r(warm = m/x i ) = F (rm
− xβ ) − F (r
m−1
− xβ )
Donde xβ = β yr89 yr89 + β male male + β whitewhite + β age age + β prst prst Aqu´ı las salidas sean con ologit, oprobit, pueden ser comparadas: equation eq2.ordered(d=l) warm c yr89 male white age ed prst coef beta1=eq2.@coefs equation eq2.ordered(d=n) warm c yr89 male white age ed prst coef beta2=eq2.@coefs
Como en el an´alisis de los modelos de regresi´ on binaria, la diferencia estriba en que los coeficientes tienen una raz´ on de 1.7, es decir, solo hay diferencia en escala, sin embargo los z-test, son los mismos y no se ven afectados por la escala.
3.1.2.
Testeo de Hip´ otesis
Para el testeo de hip´otesis podremos usar el test de wald o m´axima verosimilitud para elegir el mejor modelo. equation eqlogit.ordered(d=l) warm c yr89 male white eqlogit.wald c(1)=0 eqlogit.wald c(1)=0, c(2)=0 , c(3)=0 equation eqlogit.ordered(d=l) warm c yr89 male white scalar lh1=eqlogit.@logl Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
3.1. Estimaci´ on y An´ alisis
27
equation eqlogit.ordered(d=l) warm c yr89 male scalar lh2=eqlogit.@logl scalar ratio=-2*(lh2 - lh1) scalar pval = 1-@cchisq(ratio, 1)
3.1.3.
Supuesto de Paralelismo
Antes de discutir la interpretaci´ on, es importante entender un supuesto que esta impl´ıcito en el MRO, conocido como paralelismo de la regresi´ on, y para el modelo ologit, el supuesto de odds proporcional. P r(y = 1/x) = F (rm xβ ) P r(y = m/x) = F (rm xβ ) F (rm−1 P r(y = J/x) = 1 F (rm−1 xβ )
−
− −
− −
− xβ ), cuando : m = 2...J − 1
Las ecuaciones presentadas pueden ser usadas para calcular la probabilidad acumulada, lo cual tienen la siguiente forma: P r(y
≤ m/x) = F (r − xβ ), cuando : m = 1...J − 1 m
En esta ecuaci´ on se muestra que el MRO es equivalente para J-1 regresiones binarias con el supuesto de que las pendientes o coeficientes son id´ enticos a lo largo de cada regresi´ on. Por ejemplo, si tenemos cuatro categor´ıas en nuestra end´ ogena y una variable independiente las ecuaciones serian: P r(y 1/x) = F (r1 P r(y 2/x) = F (r2 P r(y < 3/x) = F (r3
≤ ≤
− βx ) − βx ) − βx ) 1 1
1
El intercepto no se encuentra en las ecuaciones dado que se ha asumido que β 0 = 0, cada curva de probabilidad diferir´ au ´nicamente en su inclinaci´on hacia la derecha o izquierda, es decir, son paralelas como consecuencia de que el par´ametro β es el mismo en cada ecuaci´on. De esta manera el supuesto de paralelismo implica que, β 1 = β 2 = ... = β J −1 . El grado de paralelismo se asume con par´ ametros muy cercanos entre s´ı.
3.1.4.
An´ alisis de Probabilidades y Cambios Marginales
El MRO es no lineal, entonces, no hay una sola aproximaci´ on que pueda describir totalmente la relaci´ on entre una variable y las probabilidades, por lo tanto, se deber´ıa considerar cada uno de estos m´etodos antes de decidir que Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
28
3. Modelos de Elecci´ on Ordinal
aproximaci´ on es m´as efectiva en nuestra aplicaci´ on. En el MRO, y∗ = xβ + , el cambio marginal en y ∗ con respecto a xk es: Siendo y ∗ una variable latente (cuya medida es desconocida), el cambio marginal no puede ser interpretado sin la estandarizaci´ on, mediante la desviaci´on estandar de y ∗ . ˆ Vˆ ar(x)β ˆ + V ar() σ ˆy2 = β ∗
Donde Vˆ ar(x) es la matriz de covarianza para las explicativas, V ar() es 1 para los probit ordenados, o π 2/3 para los logit ordenados. Entonces el estandarizaci´on y ∗ del coeficiente de xk es: ∗
S
β k y =
β k σy
∗
Por cada unidad en que se incremente xk , se espera que y∗ se incremente S en β k y desviaciones est´ andar, manteniendo las dem´ as variables constantes. ∗
El coeficiente con una total estandarizaci´ on seria: β kS =
σk β k S = σ k β k y σy
∗
∗
Por cada desviaci´ on est´ andar en que se incremente xk , se espera que y ∗ se incremente en β kS desviaciones est´ andar, manteniendo las dem´ as variables constantes. equation eq4.ordered(d=l) warm ((yr89-@MEAN(YR89))/@STDEV(YR89)) ((male-@MEAN(MALE))/@STDEV(MALE)) ((white-@MEAN(WHITE))/@STDEV(WHITE)) equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM)) ((yr89-@MEAN(YR89))/@STDEV(YR89)) ((male-@MEAN(MALE))/@STDEV(MALE)) ((white-@MEAN(WHITE))/@STDEV(WHITE)) equation eq4.ordered(d=l) ((warm - @MEAN(WARM))/@STDEV(WARM)) c yr89 male white
Por cada desviaci´ on est´ andar en que se incremente la educaci´ on, se incrementa el apoyo para las madres que trabajan en 0.11 desviaciones est´ andar, manteniendo las dem´ as variables constantes.
Predicci´ on de Probabilidades
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
3.1. Estimaci´ on y An´ alisis
29
Predecimos las probabilidades como: Pˆ r(y = m/x) = F (ˆrm
− xβ ˆ) − F (ˆr
m−1
− xβ ˆ)
Con probabilidades acumuladas: Pˆ r(y
≤ m/x) = F (r − xβ ˆ) m
Luego de estimar el modelo es u ´ til calcular las probabilidades, indicando una variable nueva por cada categor´ıa estimada equation eq5.ordered(d=n) warm c yr89 male white eq1.makelimit gamma coef beta=eq5.@coefs series series series series
pwarm1 pwarm2 pwarm3 pwarm4
pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm2=@cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) - @cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm3=@cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) - @cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) group g1
warm pwarm1 pwarm2 pwarm3 pwarm4
g1.scat
Las probabilidades predichas para las categor´ıas extremas tienden a ser menos que 0.25, la mayor cantidad de las predicciones para las categor´ıas intermedias caen entre 0.25 y 0.5, solo unas cuantas tienden a ser mayores que 0.5
Predicci´ on de Probabilidades La predicci´ on de probabilidades para individuos con un conjunto de caracter´ısticas pueden ser calculadas mediante el siguiente comando, por ejemplo, nosotros podr´ıamos desear, examinar las probabilidades predichas para individuos con las siguientes caracter´ısticas: Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
30
3. Modelos de Elecci´ on Ordinal Hombres de la clase trabajadora en 1977 quienes est´ an cerca de retirarse. Mujeres j´ ovenes con elevada educaci´ on y prestigiosos trabajos. Individuo promedio en 1977 Individuo promedio en 1989
equation eq5.ordered(d=l) warm c yr89 male white age ed prst eq1.makelimit gamma coef beta=eq5.@coefs series series series series
pwarm1 pwarm2 pwarm3 pwarm4
pwarm1=@cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm2=@cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) - @cnorm(gamma(1)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm3=@cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) - @cnorm(gamma(2)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ) pwarm4=1- @cnorm(gamma(3)- ( beta(1)*yr89 + beta(2)*male + beta(3)*white ) ’Tarea generar una tabla con las probabilidades promedio en base a estas probabilidades calculadas para cada escenario
Tipo de individuo Hombres de la clase trabajadora en1997 quienes est´ an cerca del retiro Mujeres j´ ovenes con alta educaci´ o n en 1989 con trabajos prestigiosos Individuo promedio en 1977 Individuo promedio en 1989
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
Probabilidad Predicha SD D A SA 0.23 0.42 0.27 0.07 0.02
0.08
0.32
0.59
0.13 0.08
0.36 0.28
0.37 0.43
0.14 0.21
www.giddea.com
[email protected]
3.1. Estimaci´ on y An´ alisis
31
Cambios en las Probabilidades Predichas El cambio marginal en la probabilidad es calculado como: ∂P r(y = m/x) F (rm xβ ) = ∂x k ∂x k
−
− ∂ F (r ∂x − xβ ) m−1
k
La cual es la pendiente de la curva que relaciona xk a P r(y = m/x), manteniendo las otras variables constantes. En nuestro ejemplo, nosotros consideraremos el efecto marginal de la edad ∂P r(y=m/x) , para mujeres en 1989, ∂age manteniendo en su media a las dem´ as variables. equation eq1.ordered(d=n) warm c yr89 male white eq1.makelimit gamma coef beta=eq1.@coefs vector(4) marginal marginal(1)=-( @dnorm(gamma(1)- ( beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ))*beta(1) marginal(2)=-(@dnorm( gamma(2)- (beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ) @dnorm(gamma(1)- (beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ))*beta(1) marginal(3)=-(@dnorm( gamma(3)- (beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ) @dnorm(gamma(2)- (beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ))*beta(1) marginal(4)=(-@dnorm( gamma(3)- (beta(1)*@mean(yr89) + beta(2)*@mean(male) + beta(3)*@mean(white) ) ) )*(-beta(1))
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
32
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
3. Modelos de Elecci´ on Ordinal
www.giddea.com
[email protected]
Sesi´ on 4 Modelos Truncados y Censurados Esta secci´ on1 estudia el conjunto de modelos con soluci´ on de esquina. Para el uso de los modelos, es importante el recordar el por qu´ e se usan variables logit y probit en modelos de elecci´ on binaria, modelos tobit en modelos de respuesta de solucion de esquina o modelos tipo poison en modelos de recuento, y es por eso que se necesitan modelos que tomen en cuenta ciertas caracteristicas importantes de la distribuci´on de y. En e caso de la participaci´ on de la mujer en el mercado laboral, el problema es que una parte importante de las mujeres casadas decide no tener ningun trabajo asalariado. En el caso de notas que se obtinene en una evaluaci´on, las mismas que seg´ un el sistema de calificaci´on pueden fluctuar solo entre 0 y 20. Tambi´ en se presenta cuando solo podemos observar el gasto efectivo de aquellas personas que adquieren un bien pero no su disponibilidad a pagar, m´as a´ un si es inferior al precio m´ınimo con el que es posible acceder al bien. Finalmente, tambi´ en es el caso de los ingresos percibidos por el trabajo remunerado, dado que no es posible observar el ingreso potencial de una persona que no est´ a laborando en el momento en que se recoge la informaci´on por analizar. En cualquiera de estas situaciones, las observaciones correspondientes son excluidas de la muestra (lo que se define como “truncamiento”, ya sea incidental o no ), o su incorporaci´on en ella es distorcionada por un valor espec´ıfico que no es el real (lo cual definimos como “censura”). Podemos tener tres tipos de variables dependientes continuas limitadas: las truncadas, las censuradas y las que poseen sesgo de selecci´ on (o truncamiento incidental). 1
Basado en Introducci´on a la econometr´ıa de Jeffrey M Wooldridge y Modelos de panel y variables limitadas de Arlette Beltran y Juan Francisco Castro
33
34
4. Modelos Truncados y Censurados
4.1.
Variables Dependientes con Truncamiento No Incidental
El truncamiento se produce cuando la variable dependiente (yi ) se observa, si y solo si esta toma un valor mayor que “a”, donde “a” es una constante cualquiera. Lo mismo ocurre con toda la informaci´ on referida a las posibles explicativas del modelo, el vector xi , asociadas con estas observaciones truncadas. Un ejemplo podria ser el an´alisis de la disponibilidad a pagar por un automovil nuevo, si es que es cierto que en el mercado el m´a s barato que se puede encontrar tiene un precio de $7,000. De esta manera, cuando la persona est´a dispuesta a pagar dicho monto o m´ as, es probable que compre el auto y que se registre su gasto efectivo y toda su informaci´on socioecon´ omica (xi ). Si la persona est´ a dispuesta a pagar menos de $7,000, no realiza ninguna compra y no se cuenta con sus datos asociados; es decir est´ a observaci´ on desaparece de la muestra.
4.1.1.
Variable Aleatoria Truncada
Definamos el concepto de variable aleatoria truncada. Es aquella que tiene una tiene funci´ on de densidad de la forma: f (y) f (y y < a) = P r(y > a)
|
Dada la condicionalidad detr´ as de esta ecuaci´ on se justifica la necesidad de escalar la funci´on de densidad original, f(y), de tal manera que su integral sea uno cuando solo se incluyan los valores no truncados, es decir, en este caso, los valores mayores a “a”. Este procedimiento se conoce como “normalizaci´ on de la densidad”, donde el denominador de ´esta ecuaci´ on es la constante normalizada que corresponde al integral del numerador en el rango entre y “a”.
−∞
La distribuci´on de una variable truncada, tiene caracter´ısticas especiales que pueden resumirse como sigue: 2
→ N (µ, µ ) y “a” es una constante, entonces: E (y |truncamiento) = µ + σλ(a) V ar(y|truncamiento) = σ [1 − δ (α)] Si y
2
Donde α =
a−µ σ
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.1. Variables Dependientes con Truncamiento No Incidental
35
La funci´on λ( ) es conocida como la “inversa del ratio de Mills”, que en este caso, puede ser:
∗
f (α) 1 F (α) si el truncamiento es hacia abajo (y > a) λ(α) =
λ(α) =
−
−f (α) F (α)
si el truncamiento es hacia arriba (y
≤ a)
La funci´on δ ( ), por su parte, viene dada por δ (α) = λ(α)[λ(α) α], donde 0 < δ (α) < 1, α Notese que si se truncan los valores por debajo de una constante “a”, la media de la variable truncada ser´ a mayor que la original, mientras que si se truncan hacia arriba, la primera ser´ a menor que la u ´ ltima. De otro lado, la varianza de la variable truncada ser´ a siempre menor que la de la variable original (dado que δ (α) se encuentra entre 0 y 1).
∀
4.1.2.
∗
−
Truncamiento en el Modelo de Regresi´ on
Volviendo al ejemplo de la disponibilidad a pagar por un autom´ ovil (yi ), definamos el siguiente modelo para explicarla a partir de un conjunto de variables explicativas (xi ): yi = x i β + µi donde µ i N (0, σ 2 ), por lo que E (yi xi = x i β ). Recu´ erdese que solo es posible observar la variable dependiente y sus determinantes cuando esta supera el precio m´ as bajo del mercado “a”.Tomando el valor esperado de la disponibilidad pago, condicionado al truncamiento, se tiene:
→
|
E (yi yi > a; xi ) = x i β + E (µi yi > a; xi ) = x i β + E (µi µi > a
|
|
Aplicando las caracteristicas antes descritas, se tiene:
|
− x β ; x ) i
i
E (yi yi > a; xi ) = x i β + σλ(αi )
|
f (αi ) a−xi β Donde λ(αi ) = 1−F (α , α = i ) σ i De esta forma el modelo de variable dependiente truncada ser´ıa:
yi yi > a = x i β + σλ(αi ) + µi
|
el mismo que solo es posible estimar para el conjunto de observaciones no truncadas. Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
36
4.1.3.
4. Modelos Truncados y Censurados
Estimaci´ on del Modelo de Regresi´ on con Variable Truncada
Si se estima linealmente yi en funci´on solo de xi se estar´ıa omitiendo la variable explicativa λ(α), la cual, debido a la perdida de informaci´on que implica el truncamiento, no es posible estimar de manera alguna. Por ello no es adecuado usar directamente MCO, y la alternativa es estimar el modelo por m´axima verosimilitud utilizando la funci´on de verosimilitud truncada: N
L =
i=1
4.1.4.
f (µi ) 1 F (αi )
−
Impacto Marginal en el Modelo de Regresi´ on
¿Qu´ e resultado es el que interesa en el modelo de regresi´ on truncada?¿El ˆ? Si es que solo se quiere analizar efecto impacto o los coeficientes estimados β los efectos del cambio en una variable explicativa sobre la dependiente para aquellas observaciones no truncadas incluidas en la regresi´ on, bastara con el efecto impacto correspondiente. El uso de los coeficientes β ser´a de inter´es si se quiere generalizar los resultados a toda la poblaci´ on, est´e truncado o no. Consistente con nuestro ejemplo, mostremos a continuaci´ on c´omo se deriva el efecto impacto correspondiente cuando la variable dependiente est´ a truncada para valores menores que “a”. ∂E (yi yi > a; xi ) ∂λ(αi ) ∂α i = β j + σ ∂x ij ∂α i ∂x ij
|
∂E (yi yi > a; xi ) ∂λ(αi ) β j = β j + σ ∂x ij ∂α i σ
|
−
−
∂E (yi yi > a; xi ) = β j 1 ∂x ij
|
∂λ(αi ) ∂α i
i) Para hallar el diferencial ∂λ(α es necesario tomar en cuenta que ∂α i f (αi ) y que la funci´on de densidad supuesta es la normal, por lo que αi f (αi ). Con esto, se tiene el siguiente resultado.
−
∂E (yi yi > a; x j ) = β [1 ∂x ij
|
∂F (αi ) ∂α i ∂f (αi ) ∂α i
= =
− λ(α )(λ(α ) − α )] i
i
i
La expresi´ on entre llaves, que se encuentra entre 0 y 1, es el factor de ajuste del coeficiente β j (que corresponde el efecto impacto en un modelo lineal para toda la poblaci´ on), que da cuenta del efecto del truncamiento. Notese que σ afecta la magnitud de los efectos impacto (a trav´es de α) mas no la direcci´on. Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.1. Variables Dependientes con Truncamiento No Incidental
4.1.5.
37
Variable Aleatoria Censurada
Retomando el ejemplo de la disponibilidad a pagar por el autom´ ovil y supongamos que a´ un si la persona no compra el auto, si se registran sus datos xi como cliente potencial. En este caso la variable yi , tomara el valor pagado por la persona si ´esta compra el auto, y el de 0 si no lo compra. En cualquiera de los dos casos, se habr´ a recogido informaci´ o n sobre el cliente. De esta manera, podemos decir que la variable y i ha sido censurada en 0 para disponibilidades a pagar menores que $7,000 valor que es el precio m´ınimo de mercado. El modelo conceptual utilizado para el caso de variables discretas, donde asumimos la existencia de una variable latente continua e ilimitada y cuya media condicional puede ser modelada como una combinaci´ o n lineal de un conjunto de explicativas, tambi´en puede ser modelada como una combinaci´ on lineal de un conjunto de explicativas, tambi´ en puede ser aplicado en este contexto. En el ejemplo anterior, la variable latente es la disponibilidad de pago la cual puede adoptar cualquier valor. La variable observada, en este caso, corresponde a la latente pero solo cuando esta ultima ´ supera el precio m´ınimo de mercado. Otro ejemplo nos ayudara en la formalizaci´ on de este modelo. Supongamos ∗ que la variable latente yi es el puntaje en una prueba de aptitud que incluye puntos en contra, mientras que y i∗ es el puntaje en una prueba de aptitud que incluye puntos en contra, mientras que yi , se define de tal forma que: yi =
yi∗ , si yi∗ > 0, 0, si yi∗ 0.
≤
En cualquiera de los dos casos se conocen los potenciales factores explicativas del puntaje xi . De esta manera la distribuci´ on de la variable yi tiene dos componentes claramente diferenciados: la parte continua, para las observaciones no censuradas, y la discreta, para aquellas a las que se asigna el puntaje de corte. En este caso, no hay necesidad de escalar la distribuci´ on (como lo fue en el de las variables truncadas) ya que la probabilidad acumulada es de 100 % si se considera que a las observaciones censuradas se les asigna la probabilidad de estarlo.
4.1.6.
Censura en el Modelo de Regresi´ on
Si trabajamos en el a´mbito del modelo de regresi´ on, tenemos que la variable latente puede ser representada como: Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
38
4. Modelos Truncados y Censurados
yi∗ = x i β + µi Para establecer el valor esperado de la variable observada (y), que considera tambi´ en las observaciones censuradas, es necesario diferenciar entre dos situaciones alternativas. Al igual que en el ejemplo anterior, en lo que sigue suponemos que el valor de corte es igual a cero (a=0). Para una observaci´ on tomada al azar: E (yi xi ) = (0)P r(yi = 0) + E (yi yi > 0; xi )P r(yi > 0) = E (yi yi > 0; xi )P r(yi > 0) = (xi β + σλ(αi ))(1 F (αi ))
|
|
|
−
N´otese que ahora, como la censura es en 0, se tiene que: αi =
−x β i
σ f ( xi β/σ) f (xi β/σ) λ(αi ) = = 1 F ( xi β/σ) F (xi β/σ)
−
− −
Y su varianza ser´ıa, en cambio: V ar(yi xi ) = σ 2 F (αi )[1
|
2
− δ (α ) + (α − λ(α )) (1 − F (α ))] i
i
i
i
Para una observaci´ on no censurada Como es la situaci´on similar a la de las observaciones no truncadas, el modelo ser´ıa el mismo que el de la ecuaci´ on: E (yi yi > 0; x) = x i β + σλ(αi )
|
Para este modelo aplica todo lo dicho anteriormente, la pregunta seria ahora como estimar los modelos que contienne variables dependientes censuradas y especificamente aquellos planteados antes.
4.1.7.
Estimaci´ on del Modelo de Regresi´ on Censurada
a. Estimaci´on por MCO en 2 Etapas La estimaci´ on MCO se realiza mediante un procedimiento en dos etapas, que consiste en modelar el proceso de censura previamente a la estimaci´ on de la ecuaci´on principal. Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.1. Variables Dependientes con Truncamiento No Incidental
39
Primera Etapa Se utiliza una variable auxiliar “z i ” de la forma: z i =
1, si yi∗ > 0: No hay censura 0, si yi∗ 0: Hay censura
≤
A partir de ella y de un conjunto de explicativas que den cuenta de la censura, se estima un modelo probit para obtener el vector β/σ de estimados y construir α y ˆ λ(ˆ α), seg´ un est´ an definidos en las ecuaciones previas Segunda Etapa Se utiliza α ˆ para estimar por MCO cualquiera de los dos modelos de las ecuaciones para una observacion tomada al azar o para observaciones no censuradas: Modelo con todas las observaciones
yi = (xi β + σλ(αi ))F ( αi ) + µi = F ( αi )xβ + σf (αi ) + µi
−
−
Modelo con todas las observaciones no censuradas yi yi > 0; yi = x i β + σλ(αi ) + µi
|
El uso de uno u otro modelo depender´ a del objetivo de la investigaci´ on. El primero permitira predecir el valor promedio del total de observaciones. En el ejemplo de la disponibilidad a pagar por un automovil, seria el pago promedio realizado por una persona cualquiera de la muestra total, haya comprado el auto o no (el valor promedio de compra, consirando que auellos que no realizaron la compra pagaron un monto igual a cero). El segundo modelo, en cambio, servir´a para calcular el valor promedio pagado por aquellas observaciones no censuradas y haria posible predecir el valor promedio de las ventas efectivas.
b. M´axima Verosimilitud: El Modelo Tobit2 Para estimar un modelo con variable dependiente censurada mediante el m´etodo de m´ axima verosimilitud (MV), es necesario considerar que se tiene dos tipos de informaci´on. Aquella referida a las observaciones no censuradas, para las que se conoce la esperanza condicional de yi , y 2
Tobin (1956) fue el primero en vinvular el problema de censura con el an´alisis de regresi´ on. Relacion´o este problema con el modelo probit el el sentido de que hay dos tipos de observaciones: sobre las que se tiene el valor de la dependiente y las que tienne un valor de cero asignado. Por dicha raz´on se le conoce como el modelo probit de tobin o tobit. Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
40
4. Modelos Truncados y Censurados aquella referida a las observaciones censuradas, para las que se conoce la probabilidad de estar censurada. La funci´on de verosimilitud se construye considerando ambos componentes. As´ı: L =
P r(yi > 0)f (yi yi > 0)
|
yi >0
P r(yi = 0)
yi =0
Si recordamos que la funci´ on de densidad truncada viene dada por: f (yi yi > 0) =
|
f (yi ) P r(yi > 0)
Por lo tanto podemos establecer la funci´ on de verosimilitud como: L =
f (yi )
yi >0
P r(yi = 0)
yi =0
Note que el modelo tobit implica que los coeficientes estimados promedian dos tipos de efectos de las variables explicativas, aquel sobre la probabilidad de estar censurado y dado que no lo est´a, el efecto sobre el valor esperado de yi . Si no es posible garantizar que las mismas variables explicativas den cuenta de la censura, as´ı como del fen´ omeno econ´ omico que se quiere analizar condicionado a dicha censura, el tobit puede no ser el modleo m´as adecuado para realizar la estimaci´ on, ya que el procedimiento que involucra implica restringir ambos modelos a un mismo set de variables explicativas. Por ejemplo, saber conducir un automovil, puede ser una explicativa importante para adquirir o no uno, pero podr´ıa no tener mayor impacto sobre la cantidad que se paga por ´el una vez que se ha decidido comprarlo. En este caso es mejor usar el m´etodo de estimaci´ on en dos etapas visto previamente, en el que se da libertad para incorporar variables explicativas distintas en cada una de ellas. Las estimaciones por MCO sobre toda la muestra que desconocen el problema de censura, son inconsistentes y suelen ser menores en valor absoluto a los del modelo Tobit.
4.1.8.
Efectos Marginales y Bondad de Ajuste
Si se analiza cu´ a l es la medida de bonda de ajuste m´ as apropiada en el caso de un modelo censurado, podr´ıa elegirse el cuadrado del coeficiente de Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.1. Variables Dependientes con Truncamiento No Incidental
41
correlaci´on entre yi e yˆi , donde esta u ´ ltima se construye a partir del modelo dado con todas las observaciones. El estad´ıstico es distinto al R-cuadrado del MCO. La definici´ on basada en el coeficiente de correlaci´ o n es preferida a la del R-cuadrado debido a que tiene la ventaja de fluctuar entre 0 y 1, cosa que no ocurre con el segundo, el que puede ser negativo en regresiones sin intercepto. De todas formas, es necesario tener en cuenta que el R-cuadrado no es tan importante en modelos censurados , especialmente en el caso del tobit, q que a diferencias de MCO, no maximiza este estadistico sino la funci´ on log-verosimil. En cuanto a los efectos impacto, puede ser interesante estimarlos tanto para la muestra completa, como para las observaciones no censuradas. En este segundo caso, el efecto impacto ser´ a similar al de variables truncadas, ´a´u n cuando se observa un cambio de signo (si tomamos en cuenta que se est´a trabajando con una censura hacia abajo, con un corte igual a cero y suponemos una distribuci´ on simetrica). As´ı: ∂E (yi yi > 0; xi ) = β j [1 λ(αi )(αi + λ(αi ))] ∂x ij Este resultado, sin embargo, tiene las mismas consecuencias vistas previamente respecto del problema de truncamiento.
|
−
En el caso para el modelo de la muestra completa, se tiene el siguiente efecto marginal: ∂E (yi xi ) β j xi β β j = β j F ( α j ) + xi βf (αi ) σ f (αi ) ∂x ij σ σ σ ∂E (yi xi ) = β j F ( α j ) ∂x ij De esta manera, en el caso de trabajar con la muestra completa, para que el coeficiente β j refleje el efecto impacto de la variable explicativa j sobre el valor esperado de y, es necesario multiplicarlo por la probabilidad de la no censura, F ( αi ). Si comparamos este efecto impacto con aquel asociado al de toda la poblaci´ on (β ), notaremos que ambos se asemejar´ an en la medida en que F ( αi ) tiende a 1. Como es de esperarse, los resultados que toman en cuenta una potencial censura en la muestra y aquellos referidos a la data sin censurar ser´ an equivalentes en la medida en que la mayoria de observaciones se concentren en la parte no censurada. Bajo estas circunstancias, las estimaciones que toman en cuenta la especificaci´ on para la medida condicional dada en el modelo de censura, ser´ an equivalentes a aquellas que se obtenian si se regresiona y i sobre xi mediante MCO. Es decir, E (yi xi ) = (xi β + σλ(αi ))(1 F (αi )) x i β , en la medida en que a .
|
−
−
|
−
−
−
→∞
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
|
−
→
www.giddea.com
[email protected]
42
4.2.
4. Modelos Truncados y Censurados
Variable de Truncamiento Incidental, Sesgo de Selecci´ on
El problema de sesgo de selecci´ on se produce cuando la inclusi´ o n de una unidad econ´ omica en la muestra depende de una decisi´ o n previa que no es ex´ogena, por lo que resulta ser una muestra no aleatoria, solo se presenta sesgo de selecci´ on cuando la muestra no es aleatoria o la selecci´ on muestral no es ex´ogena. Es decir, si por ejemplo se separan observaciones de una muestra de manera aleatoria, o se utiliza alg´ un criterio ex´ ogeno como la edad, el sexo, la raza, no se producir´ a un problema de sesgo de selecci´ on. En particular, y tal como veremos m´ as adelante, el sesgo ocurre cuando el componente no observable de la decisi´on de pertenecer a la muestra est´ a correlacionado con el componente no observable del fen´ omeno bajo an´ alisis. Por ejemplo, supongamos que se quiere analizar el rendimiento estudiantil pero solo se cuenta con informaci´ on suficiente sobre dicho rendimiento y sus determinantes para el caso de escuelas privadas. Como veremos, el hecho de trabajar solo con aquellos ni˜ nos j´ovenes cuya familias decidieron matricularlos en un colegio particular puede tener un efecto sobre el modelo que se busca estimar y en especial, sobre su media.
4.2.1.
El modelo de Truncamiento Incidental
Analicemos primero la decisi´o n de asistir a determinado tipo de colegio (ecuaci´on de selecci´ on). Para esto, y de acuerdo con la formulaci´ on desarrollada para los modelos de elecci´ on binaria, supongamos que la utilidad de asistar a ∗ un colegio privado (z i ) puede representarse como: z i∗ = w i γ + i Dicha ecuaci´ on seria la ecuaci´ on de selecci´on, la variable z i∗ no es directamente observable. Lo que si se observa es si el estudiante est´a matriculado en un colegio privado o no, resultado que depende de que la utilidad de hacerlo supere determinado umbral (a). De ´esta manera, si z i∗ > a, el alumno se matricula en un colegio privado y, por lo mismo, pertenece a la muestra de trabajo. En lo que respecta al rendimiento, supongamos que, en general, este puede ser representado como: Y i∗ = x i β + µi Que es la ecuaci´ on de rendimiento, donde Y i∗ es la nota final obtenida en determinado a˜ no de estudios escolares. Es necesario notar que en la muestra de trabajo no se tienen observaciones de la distribuci´on completa de Y i∗ , sino solo Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.2. Variable de Truncamiento Incidental, Sesgo de Selecci´on
43
de aquellas observaciones provenientes de estudiantes matriculados en una escuela privada. Es decir, la variable dependiente observada Y i viene dada seg´ un: ∗ ∗ ∗ Y i = Y i si z i > a. Esto implica que si bien E [yi xi wi ] = xi β , lo mismo no ocurre para E [yi xi wi ]. En particular, la esperanza condicional de inter´es viene dada por: E [yi xi wi ] = E [yi∗ z i∗ > a; xi wi ].
|
|
|
|
En este caso ser´ a necesario definir la densidad condicional de yi∗ dado z i∗ de la siguiente manera: f (yi∗ , z i∗ z i∗ > a) =
|
f (yi∗ , z i∗ z i∗ > a) P r(z i∗ > a)
|
y verificar sus propiedades a partir de lo siguiente.
Distribuci´ on truncada conjunta Si dos variables (y, z) tienen una distribuci´on normal bivariada, con medias µy y µz , varianzas σy2 y σz2 y correlaci´ on ρyz (distinta de cero), entonces: E [y truncamientosobrez ] = µ y + ρyz σy λ(αz )
|
V ar[y truncamientosobrez ] = σ y2 [1
|
Donde αz = λ(αz ) =
(a−µz ) , σz
−ρ
2 yz δ (αz )]
y λ(.), la inversa del ratio de Mills, viene dada seg´un:
f (αz ) si el truncamiento es hacia abajo (z 1−F (αz ) −f (αz ) si el truncamiento es hacia arriba (z F (αz )
> a)
λ(αz ) = a) La funci´on δ (.), por su parte, viene dada por δ (αz ) = λ(αz )[λ(αz ) donde 0 < δ (αz ) < 1.
≤
− α ], z
N´otese que la media de la variable truncada incidentalmente se desplaza en igual direcci´on que ρyz cuando el truncamiento es hacia abajo y en direcci´ on opuesta cuando (z a). La varianza se reduce cualquiera sea el caso ya que δ (.) y ρ2yz est´an entre 0 y 1.
≤
Si volvemos al ejemplo planteado y tomamos en cuenta los resultados as´ı como las especificaciones para z i∗ e yi∗ , repectivamente tenemos que: E [yi z i∗ > a; xi wi ] = E [yi∗ z i∗ > a; xi wi ] = x i β + ρu σµ λ(αz )
|
Donde: αz =
a−wi γ σ
|
y λ(αz ) =
αz . 1−F (αz )
Vale la pena destacar varios elementos de la expresi´on anterior. En primer lugar, es claro que E [yi z i∗ > a; xi wi ] = x i β , excepto cuanto ρµ = 0 o cuando a . Es decir, no bastar´a con modelar la esperanza de nuestra variable
→ −∞
|
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
44
4. Modelos Truncados y Censurados
dependiente como una combinaci´ on lineal de sus determinantes si es que solo es posible observarla efectivamente cuando el agente cumple con una caracter´ıstica especial (no es cierto que a ) y dicha caracter´ıstica influye sobre el resultado que estoy modelando (ρµ = 0).
→ −∞
Para el ejemplo considerado, preguntarse si ρ µ = 0 equivale a preguntarse si es que el hecho de estar matriculado en un colegio privado (la caracter´ıstica especial que hace que una unidad sea parte de la muestra) influye sobre el rendimiento del estudiante (el fen´ omeno que se est´a modelando). Al respecto, nuestra respuesta ser´ a afirmativa en la medida en que creamos que, adem´ as de las caracter´ısticas sociecon´ omicas tipicamente observables (como la importancia que da el hogar a la acumulaci´ on del capital humano) que afecta tanto a la decisi´on de qu´ e tipo de colegio elegir como al rendimiento del ni˜ no en el colegio. Estos no observables ser´ an capturados en i y µi y el grado de direcci´on en el que afecten ambos fen´ omenos (selecci´ on y rendimiento) vendr´ a dado, precisamente por la correlaci´on entre los dos t´erminos de error (ρµ ) y su signo.
De considerar un sistema educativo como el peruano, donde la calidad de educaci´on b´asica privada es superior a la p´ ublica, cabria esperar una correlaci´on positiva: m´as importancia asignada a la acumulaci´ on de capital humano por parte del hogar impactar´ a positivamente tanto en la decisi´ on de matricula en una escuela privada (la posibilidad de observar al agente en la muestra considerada) como en el rendimiento en la misma. En este sentido, lo que se plantea es corregir al alza, la esperanza del rendimiento para tomar en cuenta que se est´ a trabajando con aquellos individuos que pertenecen a hogares especialmente preocupados por la educaci´on de sus hijos. Tan o m´as importantes que entender la correcci´ on introducida sobre la esperanza de la variable de inter´es, es entender el riesgo que corremos de omitirla. Es claro que la correcci´on propuesta no es otra cosa que una variable relevante m´ as, cuya inclusi´on es necesaria para lograr una correcta especificaci´on de la media condicional de la variable dependiente. No incluirla, por tanto, conduciria a los conocidos problemas asociados a la omisi´on de variables. En particular, tendr´ıamos estimadores sesgados o para el caso de muestras grandes, un estimador no consistente.
4.2.2.
Estimaci´ on del Modelo de Truncamiento Incidental
La estimaci´on del modelo de una variable dependiente con sesgo de selecci´ on puede hacerse a trav´es de dos alternativas: Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.2. Variable de Truncamiento Incidental, Sesgo de Selecci´on
45
a. MCO: Modelo de Heckit3 En este caso se usa tambi´en un procedimiento de dos etapas, en la primera se estima la ecuaci´on de selecci´ o n, que caracteriza la forma en que las observaciones son incluidas en la ecuaci´ on principal. La segunda etapa consiste en estimar el modelo principal con la muestra no truncada incidentalmente. Primera Etapa Se estima la ecuaci´ on de selecci´on utilizando una variable auxiliar (z i ) de la forma: z i =
1, si z i∗ > 0: Matriculado en colegio privado 0, si z i∗ 0: Matriculado en colegio p´ ublico
≤
Para ello se estima un probit que permitira obtener los par´ ametros γ/σ , con los cuales se construyen αˆz y λ(ˆ αz ). Segunda Etapa En la segunda etapa se utiliza λ(α ˆz ) para estimar por MCO el siguiente modelo: yi = x i β + ρµ σµ λ(ˆ αz ) Es decir, regresionar yi sobre xi y λ(α ˆz ). Es necesario considerar que en la ecuaci´ on de selecci´ o n se debe incluir, por lo menos, una variable explicativa adicional que no est´e en la ecuaci´ on de inter´es. Si bien la inversa del ratio de Mills es una funci´on no lineal de las explicativas de la ecuaci´on de selecci´on, frecuentemente se puede aproximar a trav´ es de una funci´ on lineal. Por lo mismo, no incluir dicho regresor adicional podr´ıa llevar a que la inversa del ratio de Mills est´e altamente correlacionada con las otras explicativas de la ecuaci´on de inter´es.
b. M´axima Verosimilitud Para estimar un modelo con sesgo de selecci´ on a trav´ es del metodo MV es necesario considerar que se tiene dos tipos de informaci´on. Aquella referida a las observaciones no truncadas, para las que se conoce la esperanza condicional y aquella referida a las observaciones truncadas, para las que se cuenta con la probabilidad de estarlo. Entonces, la funci´ on de verosimilitud se construye considerando ambos tipos de informaci´ on: 3
Heckman (1979)
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
46
4. Modelos Truncados y Censurados
L =
P r(z i∗
> 0)f (yi z i∗
|
∗
zi >0
> 0)
P r(z i∗
∗
zi =0
≤ 0)
Si tenemos en cuenta que: f (yi z i∗ > 0) =
|
f (yi ) P r(z i∗ > 0)
Por lo tanto podemos establecer la funci´ on de verosimilitud como: L =
f (yi )
∗
∗
zi >0
4.2.3.
P r(z i∗
zi =0
≤ 0)
Efectos Marginales
Finalmente el efecto impacto de una variable explicativa que se encuentra tanto en la ecuaci´ on de selecci´ on como en la de inter´es, sobre una dependiente con truncamiento incidental, teniendo: E [yi z i∗ > a; xi , wi ] = x i β + ρµ σµ λ(α ˆz )
|
donde λ(αz ) =
f (αz ) 1 F (αz )
−
f (αz ) i γ Si suponemos que a=0 tenemos adem´ as que αz = −w y λ(αz ) = F (−α . σ z) Entonces el impacto de un cambio en una variable explicativa xi sobre la media de yi truncada incidentalmente seria:
∂E (yi z i∗ > 0; xi , wi ) ∂λ(αz ) ∂α z = β j + ρµ σµ ∂x ij ∂α z ∂ ij
|
2
− γ j σ
= β j + ρµ σµ [ αz λ(αz ) + λ(αz ) ] = β j
−ρ
−
µ σµ γ j
σ
[λ(αz )2
− α λ(α )] z
z
Donde el u ´ ltimo corchete es igual a δ (αz ). Recordando que la variable x j se encuentra en ambas ecuaciones, la de selecci´on y la de inter´ es. Si ρµ es positivo y la esperanza de yi es mayor para valores positivos de z i∗, como δ (αz ) se encuentra entre 0 y 1, el segundo t´ermino que aparece restando a β j reduce el efecto impacto. El cambio en la Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.2. Variable de Truncamiento Incidental, Sesgo de Selecci´on
47
probabilidad de que z i = 1 ante un cambio en x j afecta a la media de yi , ya que en el grupo donde z i = 1 la media es m´ as alta. As´ı el termino que resta a β j compensa este efecto, dejando solo el efecto marginal de un cambio en x j sobre la media de yi , dado que z i∗ > 0. Al igual que en el caso del truncamiento, β j se refiere al efecto impacto del j-esimo regresor sobre la media de la variable dependiente en toda la poblaci´on. En otras palabras β j se refiere al efecto impacto sobre el rendimiento estudiantil, mientras que el resultado anterior se refiere al efecto impacto sobre el rendimiento en escuelas privadas de una varianle que afecta tanto al rendimiento como a la probabilidad de estudiar en una escuela de este tipo. La correcci´ on por truncamiento incidental no es solo relevante cuando nos interesa conocer los efectos marginales para la muestra truncada. En muchos casos el inter´es se concentra en determinar el valor del vector β y su estimaci´on requiere considerar la correcci´ on por la inversa del ratio de Mills. Por u´ltimo, es necesario mencionar que en el caso de que las ecuaciones de inter´es tengan especificaciones diferentes para ambos grupos. Esto equivale a que el rendimiento de la escuela privada responda a un modelo distinto al de la p´ ublica. En algunos casos ser´a necesario estimar dos regresiones separadas para cada uno, evaluando en ambas la correcci´on por el sesgo de selecci´ on correspondiente. ’=============================================================== ’Aplicaci´ on 01: Modelos de variable dependiente limitada ’=============================================================== wf u 753 read(a2, sheet="Hoja1") "C:\mroz.xls" 22 ’Modelo Lineal para Horas equation mco1.ls hours c nwifeinc educ exper expersq age kidslt6 kidsge6 ’Modelo Censurado equation eq1.censored(h, l=0) hours c nwifeinc educ exper expersq age kidslt6 kidsge6 ’Modelo Censurado con distribuci´o n normal del error equation eq11.censored(d=n, h, l=0) hours c nwifeinc educ exper expersq age kidslt6 kidsge6 ’Modelo Censurado con distribuci´on logistica del error Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
48
4. Modelos Truncados y Censurados
equation eq12.censored(d=l, h, l=0) hours c nwifeinc educ exper expersq age kidslt6 kidsge6 ’Modelo Censurado con distribuci´o n valor extremo del error equation eq13.censored(d=x, h, l=0) hours c nwifeinc educ exper expersq age kidslt6 kidsge6
’Modelo Lineal para Salario equation mco2.ls wage c educ exper exper^2 ’Modelo Truncado en cero equation eq2.censored(t, l=0) wage c educ exper exper^2 ’Modelo Truncado en cero con distribuci´o n normal del error equation eq21.censored(t, d=n, l=0) wage c educ exper exper^2 ’Modelo Truncado en cero con distribuci´on logistica del error equation eq22.censored(t, d=l, l=0) wage c educ exper exper^2 ’Modelo Truncado en cero con distribuci´o n de valor extremo del error equation eq23.censored(t, d=x, l=0) wage c educ exper exper^2
’=============================================================== ’Aplicaci´ o n 02: Modelo de Sesgo de Selecci´on ’=============================================================== ’Modelo de Truncamiento Incidental: Heckit ’Primera Etapa smpl @all equation logit1.binary(d=l) inlf c nwifeinc educ exper expersq age kidslt6 kidsge6 series e1=resid ’guardamos los coeficientes para usarlos como parametros de inicio coef(8) beta=logit1.@coefs ’calculamos la inversa del ratio de mills logit1.fit xbhat stom(e1, e) matrix sigma2=@transpose(e)*e/(logit1.@regobs-8) scalar sigma=@sqrt(sigma2(1,1)) series imills=@dnorm(-xbhat/sigma)/(1-@cnorm(-xbhat/sigma)) Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
4.2. Variable de Truncamiento Incidental, Sesgo de Selecci´on
49
series delta=imills*(imills(-xbhat/sigma)) ’Segunda Etapa ’smpl @all equation heckman.ls wage
educ exper expersq imills
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
50
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
4. Modelos Truncados y Censurados
www.giddea.com
[email protected]
Sesi´ on 5 Modelos de Panel Est´ atico 5.1.
Introducci´ on
Los modelos de datos de panel son versiones mas generales de los modelos de corte tansversal y series de tiempo. En tal sentido, muchas de las consideraciones utilizadas para estimar estos dos tipos de modelos pueden aplicarse al caso de data panel con algunas modificaciones. En t´erminos pr´ acticos un modelo de corte transversal puede representarse como: yi = α + βxi + µi Este es un modelo donde la variabilidad de los datos es “transversal” o “espacial”. Es decir, las observaciones son obtenidas para diferentes individuos o grupos de individuos (empresas, ciudades, pa´ıses) en un momento dado en el tiempo y existen de estos grupos. Por contraste un modelo de series de tiempo se define como: yt = α + βxt + µt La variabilidad en este caso es “temporal”. Es decir las observaciones son puntos en el tiempo (d´ıas, meses, a˜ nos) para un grupo particular (un hogar, un pa´ıs, una empresa) y existen periodos. En el caso de un modelo de datos de panel se combinan ambas especificaciones en un modelo m´ as general que toma la forma: yit = α + βxit + µit La variabilidad del modelo es “transversal” y “temporal”. Es decir, existen observaciones de individuos o grupos de individuos durante periodos de tiempo. Asimismo, el supuesto sobre los errores (por el momento) es similar a los que se hace para el caso del modelo lineal general, pero esta vez considerando tanto la dimensi´on espacial y temporal. Bajo estos supuestos iniciales se identifican una serie de ventajas de este tipo de modelos: 51
52
5. Modelos de Panel Est´ atico Incrementa la eficiencia econom´etrica de los modelos estimados. Un modelo de corte transversal cuenta con N observaciones y un modelo de series de tiempo con T . En el caso de un modelo de panel data se disponen de un total de NxT observaciones. Al incrementarse el n´ umero de datos (y las fuentes de variabilidad de los mismos) se reducen las posibles fuentes de colinearidad y la eficiencia econom´etrica de los estimadores aumenta. Por ejemplo, en el caso de un modelo de corte transversal la heterogeneidad de los datos esta limitada a aquella que var´ıa de individuo a individuo y no la que es com´ un a todos los individuos, pero que var´ıa en el tiempo. Esta nueva fuente de variabilidad es una fuente de mayor precisi´on en los estimados. En l´ınea con este argumento, un modelo de panel permitir´ a un contexto m´as confiable para estudiar efectos din´ amicos. En un contexto de corte transversal estos efectos simplemente no pueden ser estudiados y en un modelo de series de tiempo la precisi´ on de los resultados puede verse afectada por problemas de multicolinearidad. En un modelo como yt = β t xt−i + µt , donde se intenta estudiar un modelo de rezagos distribuidos para un u´nico individuo o grupos, las explicativas xt−i ser´an altamente colineares. Sin embargo, si es que se pudiera obtener data de las xt−i para diferentes grupos, la colinearidad se reducir´ıa y ser´ıa necesario imponer restricciones ad-hoc a la estructura de rezagos.
Ampl´ıa el ´ambito de las preguntas econ´ omicas que pueden resolverse. En el caso de series tiempo, se puede explicar la variabilidad temporal de los datos o en otras palabras asociar los cambios entre dos variable a lo largo del tiempo. En el caso del corte transversal ocurre lo mismo ya que las diferencias por ser explicadas ocurren al nivel de dos individuos diferentes. En un modelo de corte transversal se puede identificar que el ratio de pobreza de una regi´ on es 20 %, lo cual puede interpretarse como que existe un 20 % de probabilidad de que los individuos en la muestra caigan en situaci´on de pobreza. Luego, en base aun modelo de probabilidades, se pueden identificar los factores que afectan la probabilidad de que un individuo sea pobre. Sin embargo, el modelo de corte no permite identificar si es que esta probabilidad es constante en el tiempo o no. Por contraste, un modelo de series tiempo permitir´ a identificar si es que el ratio de pobreza de 20 % cambia cada a˜ no. Luego a partir de esas variaciones podr´ a estudiar que factores “comunes a toda regi´ on” afectan a la probabilidad de que cualquier individuo sea pobre.
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
5.1. Introducci´ on
53
Las diferencias en las recomendaciones de pol´ıtica que se derivan de cada uno de los enfoques son diferentes. Por ejemplo, a trav´es de un modelo de series de tiempo se puede probar la hip´ otesis que el crecimiento econ´omico a trav´es del manejo macroecon´ omico ordenado (una pol´ıtica com´ un para toda la sociedad) es el mecanismo por el cual se reduce la pobreza. Sin embargo, no se reconoce la existencia de pol´ıticas espec´ıficas para grupos de individuos. Mientras tanto a partir de un modelo de corte transversal se pueden identificar pol´ıticas espec´ıficas para un grupo de individuos (por sector econ´ omico o grupos de vulnerabilidad) y dise˜nar pol´ıticas sociales que intenten suplir ciertas carencias. Sin embargo, una pol´ıtica general como “el crecimiento econ´ omico” no puede ser evaluada. Solo a la luz de un modelo de panel data, ambas estrategias de superaci´ on de la pobreza pueden ser testeadas una contra la otra (en t´erminos de importancia, relevancia y efectividad). No debe caber la duda que es justamente a partir de estos modelos de datos de panel de donde emergen recomendaciones como el crecimiento inclusivo, donde las buena pol´ıtica macroecon´ omica es importante para superar la pobreza, pero insuficiente y debe ser complementada con pol´ıticas sociales o sectoriales (en sentido amplio) que reduzcan las vulnerabilidades particulares de cierto grupo de individuos. Con un modelo de corte o series de tiempo no habr´ıa sido posible llegar a una conclusi´on como esta. Permite solucionar problemas econom´etricos importantes asociados a la mala especificaci´ on por variables omitidas o efectos no observables. Como se recuerda, tales problemas generan resultados sesgados e inconsistentes. El ejemplo t´ıpico ocurre en modelos micro-econom´etricos del mercado laboral. As´ı, imagine que el investigador est´a interesado en estimar una curva de salarios en Lima Metropolitana y para ello dispone del siguiente modelo: wi = α + βxi + θz i + µi . Claramente, esta es una especificaci´on de corte transversal donde las “i” corresponden a los diferentes sujetos dentro de la muestra. La variable w i son las observaciones de los salarios percibidos por los lime˜ nos en el 2009, corresponde a un vector de caracter´ısticas observables de los individuos que potencialmente influyen en sus salarios (educaci´ on y edad, por ejemplo) y las “z i ” son factores no observados en la muestra ya sea porque nuestra encuesta no incluye esa informaci´on (por ejemplo, la calidad de la educaci´ on recibida) o informaci´on simplemente no disponible (habilidad del individuo). Bajo estas condiciones lo que realmente el investigador esta estimando es wi = α + βxi + e i donde ei = θz i + µi En la medida que las “z i ” se encuentren correlacionadas con las “xi ” (como es de suponer). Una estimaci´on MCO de β ser´a incosistente impidiendo una correcta estimaci´ on del efecto de la educaci´ on en los salarios, por ejemplo. Una alternativa es Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
54
5. Modelos de Panel Est´ atico utilizar variables instrumentales, sin embargo, la real capacidad del investigador para obtener instrumentos confiables puede ser limitada. Ante esta dificultad, los modelos de datos de panel ofrecen una alternativa si es que los factores no observados “z i ” var´ıan entre individuos (la habilidad o calidad educativa recibida es diferente entre dos individuos), pero es constante en el tiempo (la habilidad de una persona que trabaja o la calidad de la educaci´ on se mantiene de un a˜ no a otro). Con ello, si es que se disponen de datos de panel, el modelo puede plantearse de la siguiente forma w it = α + βx it + θz i + µit. Al tomar el primer rezago de la ecuaci´ on (si se dispusiera de una base de datos del a˜ no 2008) obtenemos wit−1 = α + βx it−1 + θz i + µit−1 y al restar el primer rezago de la ecuaci´on original se obtiene wit wit−1 = (α α)+β (xit xit−1)+θ(z i z i )+(µit µit−1 ), es decir ∆wit = β ∆xit +∆eit, un modelo que puede ser estimado a trav´es de MCO y ofrecer estimados constantes de β una vez que se toma en cuenta. Sin embargo, la estructura de los errores ahora es de media m´ ovil, lo que puede crear problemas en la estimaci´ on aunque posibles de ser corregidos. En todo caso, la disponibilidad del panel ha permitido corregir la presencia de variables no observables.
−
−
−
−
−
N´otese que una alternativa de estimaci´ on es tomar las diferencias respecto a las medias temporales y estimar la relaci´ on: wit w¯i = β (xit x ¯i ) + (µit µ ¯i ), con lo que se han eliminado tambi´en aquellos factores no observables que son constantes a trav´ es del tiempo, pero que var´ıan de individuo a individuos. Esta es una estimaci´on MCO en diferencias de medias que proveer´ a resultados insesgados y consistentes.
−
−
−
Si por el contrario estos factores fueran constantes entre individuos, pero variar´an con el tiempo (la tasa de desempleo en el pa´ıs o la estructura legal del mercado de trabajo), se tendr´ıa un modelo como: wit = α + βx it + δkt + µit . Ser´ıa posible realizar la misma operaci´ o n, pero esta vez tomando las medias transversales y estimar el modelo wit w¯t = (α α) + β (xit x¯t ) + δ (kt kt ) + (µit µ ¯t ) nuevamente a trav´es de MCO. Con ello, el panel ofrece la posibilidad de controlar por factores no observables que var´ıe tanto a trav´es de los individuos pero constante a trav´es del tiempo o que var´ıe a trav´es de tiempo pero constante entre individuos.
−
5.2.
−
−
−
−
Estructura
El objetivo es estimar una ecuaci´ on de la siguiente forma: yit = α + βxit + µit Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
5.2. Estructura
55
Por esta raz´ o n el modelo recibe el nombre de panel lineal en contraste con los paneles no lineales que ser´ıan la generalizaci´ on de modelos binarios (Probit), multinomiales o censurados. Asimismo, el modelo no est´a considerando un sistema de ecuaciones, sino una u ´nica ecuaci´ on por estimar. Por u ´ltimo, los modelos por ser estudiados no toman en cuenta rezagos en su estructura original que es una caracter´ıstica de los modelos din´ amicos donde los par´ ametros asociados a los x it− j son de inter´es. En este tipo de modelos, la estructura de la base de datos puede ser de dos formas. Primero, un n´ umero elevado de datos transversales ( N es alto) y un n´ umero peque˜ no de datos temporales (T es bajo). Este tipo de paneles se denomina “paneles cortos” y la estructura de datos m´ as com´ un en microeconometr´ıa donde normalmente se dispone de encuestas para muchos individuos u hogares y pocos a˜ n os en las que se ha llevado a cabo a los mismos individuos. Segundo, los “paneles largos” donde m´ as bien N es bajo y T alto. Es decir, se disponen de pocos datos transversales (un n´ umero reducido de pa´ıses por ejemplo), pero una gran cantidad de puntos en el tiempo (varios a˜ nos para realizar el an´ alisis). Este es el caso t´ıpico de estudios macro-econom´etricos. Del mismo modo, los paneles pueden ser balanceados o desbalanceados. El primer caso surge cuando existen las NxT observaciones. Es decir, se tiene datos para cada uno de los individuos u hogares en cada uno de los a˜ nos. En pocas palabras, no hay datos omitidos o faltantes en la base de datos que se dispone. El segundo caso ocurre cuando algunas de las NxT observaciones faltan. Este segundo caso emerge, por ejemplo, en las encuestas a hogares cuando la encuesta se repite anualmente y existe hogares que desaparecen de la muestra ya sea por migraci´on o por disoluci´ on y nuevos hogares aparecen por creaci´ on o subdivisi´on. En este tipo de casos emerge el problema de “atrici´on” (attrition) que se refiere, por ejemplo, a que la proporci´ on de observaciones N en cada uno de los T periodos cambia con el tiempo. Los estimadores que se presentan a continuaci´ o n en el curso aplican de modo general para paneles cortos y balanceados aunque pueden generalizarse (en algunos casos) con ciertas modificaciones. Por ejemplo, en el caso de un panel desbalanceado puede ser de inter´es del investigador restringir las observaciones a aquellas que efectivamente existen en la base de datos (eliminar las observaciones faltantes). Esta es una pr´ actica usual en aplicaciones emp´ıricas, pero al costo de reducir la eficiencia de los estimadores (se reduce el n´ umero de observaciones y por tanto hay menos informaci´ on para estimar) e incurrir en posibles sesgos por atrici´ o n. Este u ´ ltimo caso ocurre cuando la raz´ o n por la que las observaciones no aparecen en el panel se encuentran correlacionadas con el error por lo que pueden existir problemas de consistencia. Por ello, antes de realizar una “compresi´ on” del panel debe estudiarse el costo de dicha deEviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
56
5. Modelos de Panel Est´ atico
cisi´on. Muchos paquetes estad´ısticos permiten controlar autom´ aticamente por problemas de omisi´ on de datos y existe tambi´ en la alternativa de construir pseudos-paneles (a partir de informaci´ on transversal repetida para diferentes individuos u hogares).
5.3.
Heterogeneidad No Observada
El problema de heterogeneidad no observada surge cuando ciertas caracter´ısticas de los individuos potencialmente importantes para explicar su comportamiento simplemente no pueden observase. Este problema es la principal motivaci´ on de los estimadores a ser discutidos en la siguiente nota de clase. La heterogeneidad no observada generar´ a cierta influencia en la naturaleza de los estimadores. De modo general, el modelo por estimar toma la forma yit = α + β itxit + µ it Donde la heterogeneidad determina que los par´ ametros var´ıen entre individuos y a lo largo del tiempo. En este caso general, se tendr´ıan que estimar NxTxk estimadores (siendo k el n´ umero de par´ ametros, en este caso k = 2 ) con NxT datos; lo que resulta imposible (hay menos datos que estimadores por identificar). Por ello, es necesario imponer ciertas restricciones. La restricci´ o n general que se impone es que las pendientes no var´ıan y solo se deja abierta la posibilidad para el intercepto. As´ı, el modelo toma la forma yit = α + βxit + µ it . Para entender de donde surge la naturaleza del nuevo intercepto podemos considerar el siguiente modelo general yit = λ + βxit + θz i + δk t + µit . Que es la forma que consideramos en el ejemplo de la ecuaci´ on de salarios, pero incluyendo los factores “z i ” y “kt ” . Conviene expresar estos factores no observados como “θi = θz i ” y “δ t = δk t ”. De este modo, el modelo tomar´ a la forma y it = α it + βx it + µit donde α it = λ + θi + δ t si es que los factores no observados son absorbidos por la constante. Este caso general, se denomina de efectos fijos y a partir de este surgen los modelos del mismo nombre (MEF, modelos de efectos fijos). Alternativamente, puede que la estimaci´on tome la forma yit = λ +βx it +vit , donde v it = µ it +θi +δ t si es que los factores no observados son variables aleatorias y por lo tanto absorbidos por el error. En este caso, normalmente hace referencia a factores que no son importantes individualmente, pero en conjunto forman una variable aleatoria de importancia y con consecuencias sobre las estimaciones. Este caso general, se denomina de efectos aleatorios y a partir de este surgen los modelos del mismo nombre (MEA, modelos de efectos aleatorios). Los supuestos acerca de c´ omo se comportan los efectos no observados determinar´an las restriccciones por ser impuestas sobre la estructura de errores de modo que la estimaci´on del modelo provea estimadores eficientes y consistentes. Alternativamente, es posible introducir supuestos sobre la existencia o no de algunos de los efectos no observables. As´ı, surgen los siguientes casos Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
5.4. Estimaci´ on
57
Caso 1: Interceptos homog´eneos. Es decir, no existe heterogeneidad transversal (θi = 0 ) ni temporal (δ t = 0 ), es el modelo m´as restringido y toma la forma yit = α + βxit + µit . Caso 2: Interceptos heterog´eneos entre individuos (θi = 0 ), pero homog´eneos a trav´es del tiempo (δ t = 0 ). Este es el modelo m´as popular en datos de panel y toma la forma yit = α i + βxit + µit .
Caso 3: Interceptos homog´eneos entre individuos (θi = 0 ), pero heterog´eneos a trav´es del tiempo ( δ t = 0 ), tambi´ en popular en las aplicaciones que toma la forma yit = α t + βxit + µit .
Caso 4: Interceptos heterog´eneos entre individuos (θi = 0 ), y a lo largo del tiempo ( δ t = 0 ) , que es el caso m´ a s general y toma la forma yit = α i t + βxit + µit.
Los supuestos sobre la naturaleza fija o aleatoria de de los factores no observados pueden aplicarse a cualquiera de los casos anteriores, con mayores o menores consecuencias sobre el m´etodo de estimaci´ on. N´otese adem´ a s que en el caso de los MEF es posible realizar la estimaci´ on incorporando variables dicot´omicas que recojan los cambios en intercepto.
5.4.
Estimaci´ on
5.4.1.
Modelo MCO combinado (MCOC) - Pooled
En este modelo se ha impuesto la restricci´on que los interceptos son homog´eneos, es decir, no existen efectos no observados. De este modo, se considera un modelo de la siguiente forma yit = α + X it beta + µit o yit = W it B + µit
5.4.2.
Modelo de Efectos Fijos
Otra manera de modelar el car´ acter “individual” de cada estado es a trav´es del modelo de efectos fijos. Este modelo no supone que las diferencias entre estados sean aleatorias, sino constantes o “fijas”, y por ello debemos estimar Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
58
5. Modelos de Panel Est´ atico
cada intercepto µi . ¿C´omo podemos permitir que el intercepto var´ıe con respecto a cada estado? Una manera es la t´ecnica de “las variables dicot´ omicas de intersecci´ on diferencial”, que se expresa de la siguiente manera: Y it = υ i + β X it + eit
∗
Donde υ i es un vector de variables dicot´ omicas para cada estado. El modelo de efectos fijos puede ejecutarse con el comando: wf panel01 q 1997.04 2003.04 pool panel _ind1 _ind2 _ind3 _ind4 _ind5 _ind6 panel.read(c35,sheet="Hoja1") "E:\...\data.xls" su? sa? ss? el? eu? p? rmv? ’Efectos Fijos ’ panel.ls(f) log(el?) log(p?) log(ss?) log(rmv?) oooooooooooooooo
5.4.3.
Modelo de Efectos Aleatorios
La ecuaci´ on del modelo Pooled supone que el intercepto de la regresi´ on es la misma para todas las unidades transversales. Sin embargo, es muy probable que necesitemos controlar el car´ acter “individual” de cada estado. El modelo de efectos aleatorios permite suponer que cada unidad transversal tiene un intercepto diferente. Este modelo se expresa como: Y it = α i + β X it + eit
∗
Donde αi = α +µi . Es decir, en vez de considerar a α como fija, suponemos que es una variable aleatoria con un valor medio α y una desviaci´on aleatoria µi de este valor medio. Sustituyendo αi = α + µi en la ecuaci´on anterior obtenemos: Y it = α + β 1 X 1it + µi + eit
’Efectos Aleatorios ’ panel.ls(r) log(el?) log(p?) log(ss?) log(rmv?) oooooooooooooooooooooo
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
5.4. Estimaci´ on
5.4.4.
59
Test de Hausman
¿C´omo decidir cu´al de las dos especificaciones de panel usar? La respuesta depende de la posible correlaci´ on entre el componente de error individual µi y las variables X. El modelo de efectos aleatorios supone que esta correlaci´ on es igual a cero. Pero supongamos que en nuestro ejemplo, µi representa las reglas electorales estatales que favorecen a cierto partido (por ejemplo, gerrymandering); entonces es muy probable que µ i se correlacione con las variables partidarias de nuestro modelo. Si las µi y las variables X est´an correlacionadas, entonces no incluir µi en el modelo producir´ a un sesgo de variable omitida en los coeficientes de X. Hausman demostr´ o que la diferencia entre los coeficientes de efectos fijos y aleatorios (β ef β ea) pude ser usada para probar la hip´ otesis nula de que µi y las variables X no est´an correlacionadas. As´ı pues, la Ho de la prueba de Hausman es que los estimadores de efectos aleatorios y de efectos fijos no difieren sustancialmente. Si se rechaza la Ho, los estimadores s´ı difieren, y la conclusi´on es; que efectos fijos es m´ as conveniente que efectos aleatorios. Si no podemos rechazar Ho, no hay sesgo de qu´ e preocuparnos y preferimos efectos aleatorios que, al no estimar tantas dummies, es un modelo m´as eficiente. La prueba de Hausman se implementa en Stata despu´es de la regresi´on con efectos aleatorios con el comando xthausman:
−
’ Test de Hausman ’
oooooooooooooooooooooo
’Efectos Fijos ’ panel.ls(f) log(el?) log(p?) log(ss?) log(rmv?) vector b_fijo=@subextract(panel.@coefs,2,1,4,1) matrix cov_fijo=@subextract(panel.@cov,2,2,4,4) ooooooooooooooo
’Efectos Variables ’ panel.ls(r) log(el?) log(p?) log(ss?) log(rmv?) vector beta=panel.@coefs matrix covarianza=panel.@cov ooooooooooooooooooooo
vector b_gls=@subextract(beta,2,1,4,1) matrix cov_gls=@subextract(covarianza, 2,2,4,4)
’Calculo de la q de Hausman ’ matrix b_dif=b_fijo - b_gls oooooooooooooooooooooooooooooooooo
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
60
5. Modelos de Panel Est´ atico
matrix v_dif=cov_fijo-cov_gls matrix q_stat=@transpose(b_dif)*@inverse(v_dif)*b_dif scalar p_chi= 1-@cchisq(@abs(q_stat(1,1)), @rows(b_dif))
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
Sesi´ on 6 Panel Din´ amico La t´ecnica para estimar modelos de datos de panel din´ amico son diversas, cada una de las cuales difiere en los supuestos estad´ısticos que se reali-cen. Para la presente metodolog´ıa se usar´ a el m´etodo propuesto por Are-llano y Bond (1991). Esto debido a que es la t´ecnica m´ as usada por los in-vestigadores debido a las bondades de los supuestos estad´ısticos realiza-dos; sin embargo, no se invalidan los resultados si se consideran otras t´ecnicas.
6.1.
Especificaci´ on
El modelo propuesto es: yit = αy it−1 + βxit + ηi + vit Donde x∗it = (yit−1xit ) es Kx1 y vit no est´a serialmente correlacionado. Suponemos inicialmente que los x it est´an correlacionados con ηi . En este contexto la forma de la matriz o´ptima de los instrumentos dependen si las xit son predeterminadas o estrictamente ex´ ogenas. Si las xit son predeterminadas, en el sentido de que E (xit vit ) = 0 para s < t y cero de otra manera, entonces uni´ camente xi1 ,...,xis−1 son instrumentos validos para la ecuaci´ on diferenciada para el periodo s. De ´esta manera el z i o´ptimo es una matriz (T-2)x(T-2)x[(K1)x(T+1)+(T-1)]/2 de la forma z i = diag(yi1 ...yis xi1...xs+1 ), con (s=1,...,T-2). De otro lado, si las x it son estrictamente ex´ ogenas E (xit vit ) = 0 para todo t,s, entonces todos los xit son instrumentos v´alidos para todas las ecuaciones y z i toma la forma z i = diag(yi1...yis xi1 ...xiT ). Claramente las xit pueden tambi´en incluir una combinaci´ on de ambos, es decir de variables predeterminadas y estrictamente ex´ ogenas. En ambos casos, la forma del estimador GMM de Kx1 vector de coeficientes de δ es:
ˆ = (XZ AN Z X )−1 X ZAN Z Y δ Donde las elecciones alternativas de AN producen estimadores en una etapa o en dos etapas. Combinando ahora el caso donde x it pueden ser particionadas 61
62
6. Panel Din´ amico
en (x1itx2it ) y x1it est´an no correlacionadas con ηi , las restricciones de momento adicionales explotan ´esta correlaci´ on en las ecuaciones en niveles que llegan a estar disponibles. Por ejemplo, si x1it es predeterminado y se le permite que µit = ηi + vit , entonces tenemos T restricciones adicionales, es decir E (µi2x1i1 ) = 0 y E (µi2 x1it) = 0. Se observa que todas las restricciones faltantes para las ecuaciones en niveles son redundantes debido a que previamente son explotadas por las ecuaciones en primera diferencia.
6.2.
Especificaci´ on del Modelo Econom´ etrico
on General del Modelo Econom´etrico para EsAplicaci´ o n 1: Especificaci´ timar la Sensibilidad de los Indicadores de Riesgo Crediticio a Choques en Variables Macroecon´ omicas y Microecon´ omicas. El planteamiento de un modelo econom´etrico tiene como base las teor´ıas econ´omicas. Las teor´ıas se refieren a un sistema de leyes que tratan de explicar la realidad y contienen modelos que son una abstracci´on simplificada de ´esta. As´ı, las teor´ıas econ´ omicas proponen modelos que explican el comporta-miento de una o m´as variables en funci´on de otra u otras variables que se determinan fuera del modelo. Consecuentemente, un modelo econ´ omico resulta habitualmente, de acuerdo con el estado actual de desarrollo de la ciencia econ´ omica, demasiado simplificado y excesivamente general como para recoger todos los aspectos de los sistemas generales. En este senti-do, la teor´ıa econ´ omica ha desarrollado modelos espec´ıficos para su apli-caci´ on a sistemas reales concretos: los modelos econom´etricos. As´ı, un modelo econom´etrico se construye para cuantificar y contrastar las relaciones entre variables postuladas por los modelos econ´ omicos a partir de la evidencia emp´ırica proporcionada por los datos, recogiendo la natura-leza estoc´ astica que gobierna las relaciones entre las variables. La evoluci´on de los indicadores de riesgo crediticio de la banca peruana est´a en funci´ on de factores macroecon´omicos y microecon´ omios. Para cuantificar esta sensibilidad a perturbaciones no esperadas de ´estos facto-res se plantea el siguiente modelo econom´etrico general. El modelo econom´etrico: morait = α i + γmorait−1 + βxit + it Donde αi representa la heterogeneidad no observable espec´ıfica de cada Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.2. Especificaci´ on del Modelo Econom´ etrico
63
banco, β es el vector Kx1 de par´ametros asociados a las variables ex´ogenas, X i t es el vector de K variables explicativas y γ es un vector de jx1 par´ametros. Es decir los coeficientes de las variables end´ ogenas predeterminadas, los que corresponden a los rezagos de la mora de cada banco, it es el vector de los errores de cada uno de los bancos en cada uno de los momentos del tiempo. El supuesto es que no est´ an correlacionados. As´ı, nuestro modelo econom´etrico combina datos temporales y de corte transversal, formando un modelo de datos de panel, el cual debido a su especificaci´ on es din´amico.Esta especificaci´ on es consecuencia del comportamiento autorregresivo que presenta los indicadores de morosidad. A fin de ejemplificar una de las alternativas, de uso, de nuestro modelo planteado se propone el siguiente ejemplo: El sistema bancario peruano se caracteriza por presentar un alto grado de dolarizaci´ on en sus activos y pasivos. As´ı, la dolarizaci´ o n de su cartera cre-diticia genera una mayor exposici´ on al riesgo crediticio derivado del riesgo cambiario de estas instituciones. Una manera indirecta de cuantificar esta exposici´on es estimando la sensibilidad de los indicadores de morosidad a choques no esperados de tipo de cambio sol-d´ olar. En el siguiente ejemplo se utilizar´ a la mora en moneda extranjera, como in-dicador de riesgo crediticio, del grupo denominado bancos grandes del sistema bancario peruano. Sin embargo, es sabido que este indicador es tam-bi´en sensible a otras variables, las cuales pueden ser de naturaleza mi-croecon´ omica o macroecon´ omica, tales como: la actividad econ´ omica, la gesti´on de riesgos de cada instituci´ on financiera, etc. A consecuencia de esto u´ltimo y debido a supuestos que subyacen la modelaci´ on de los mode-los econom´etricos (mejorar la especificaci´ on del modelo) se incorporar´ a dos variables adicionales.
Variable End´ ogena La variable end´ ogena, es decir la variable a explicar, ser´a la mora en moneda extranjera del grupo de bancos grandes, siendo ´estos los siguientes: Banco de Cr´edito, Banco Continental, Banco Wiese y Banco Interbank. Variable Ex´ ogena Las variables explicativas ser´an: Variaci´on porcentual del ´ındice del PBI (pbi) Depreciaci´on del d´olar (dev) Inflaci´on (inf) Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
64
6. Panel Din´ amico
Per´ıodo de An´ alisis El per´ıodo en el cual se evaluar´ a el impacto de una devaluaci´ on no esperada de tipo de cambio ser´ a: diciembre de 1994 a septiembre de 2004. Signos Esperados Devaluaci´on: se espera un signo positivo, ante un incremento del tipo de cambio prima el efecto hoja de balance. Actividad Econ´omica: se espera un signo negativo, una expansi´ o n de la actividad econ´ omica mejora los ingresos de los agentes. Inflaci´on: se espera un signo negativo, si la inflaci´on esperada es mayor a la devaluaci´on, se espera que la mora en ME disminuya.
6.3.
Estimaci´ on del modelo
Las opciones necesarias para realizar las estimaciones se encuentran disponibles en el objeto ecuaci´ on. Para crear este objeto se realiza lo siguiente. Seleccionamos las variables (primero elegimos nuestra variable end´ogena seguida de las ex´ogenas), y con el bot´on derecho abrimos ´estas como una ecuaci´on: Open/as equation
Seguidamente nos aparecer´ a la ventana de estimaci´ on en la cual se elegir´an las opciones pertinentes de acuerdo a los supuestos que subyacen a nuestro Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.3. Estimaci´ on del modelo
65
modelo de riesgo crediticio; as´ı tambi´en, se ingresar´ an los datos pertinentes. Como mencionamos anteriormente en este objeto se encuentran todas las opciones disponibles para realizar la estimaci´ on del modelo. El primer paso es elegir el m´etodo de estimaci´ on. En este caso, debido a consideraciones te´ oricas, usaremos el m´etodo generalizados de momentos (GMM). Para lo cual, en el set de estimaci´ on se elegir´a lo siguiente:
GMM/DPD - Generalized Method of Moment / Dynamic Panel Data
El segundo paso es determinar la especificaci´ on de nuestro modelo. Esto se realiza teniendo como base: teor´ıas econ´ omicas, estudios previos, observaci´ on de la realidad entre otras consideraciones relevantes. El modelo considerado se ha presentado en el cap´ıtulo anterior, su especificaci´ on en este objeto se realiza ingresando la variable end´ogena seguida de las ex´ogenas. El programa facilita la estimaci´ on del panel din´ amico a trav´es del Dynamic Panel Wizard. Opci´on que se encuentra disponible, una vez que se haya elegido el m´etodo GMM para trabajar. La opci´on se encuentra ubicada en la parte inferior izquierda de la ventana Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
66
6. Panel Din´ amico
de especificaci´ on.
Luego de elegir tal opci´ on, se presentar´ a:
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.3. Estimaci´ on del modelo
67
Se presiona “siguiente´´ El proceso a trav´ es de este asistente es bastante f´ acil de seguir y consta de 6 pasos. En el primer paso se pedir´ a introduzca la variable dependiente(end´ ogena) as´ı como el numero de rezagos de su componente auto regresivo.
Dado que nuestro modelo a estimar es el siguiente: CC CC(-1) tci(-1) tci(-1)*dm tci(-1)*dp tci(-1)*df tci(-1)*dl tci(-1)*dmu tci(-1)*dru tci(-1)*de vpbi6 Donde CC es la variable cartera deteriorada ampliada que considera las cuentas por cobrar. CC(-1), es su rezago de un periodo. VPBI6 es la variaci´ on del PBI de seis meses con respecto a la producci´ on de similar periodo del a˜ no anterior. TCI(-1) es el tipo de cambio neto de inflaci´ on rezagado un periodo: Al modelo se le introducen variables ficticias con la finalidad de rescatar la diferencia en los com-portamientos de las distintas entidades financieras. Se usa un variable ficticia por banco, Arrendadora, Financiera, Edypyme, Caja rural o Caja Municipal. En este primer cuadro se introduce CC y 1. Luego de ello se procede a presionar “siguiente”.
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
68
6. Panel Din´ amico
En el segundo cuadro se procede a introducir las variables ex´ogenas al modelo. Es decir, aquellas distintas a la end´ ogena o a sus rezagos. Tambi´ en se pueden colocar variables ficticias o dummies. El cuadro ofrece la posibilidad de introducir variables ficticias correspondientes a cada observaci´ on temporal, opci´ on que no se elige en este proceso todas las variables a intervenir ser´ an colocadas expl´ıcitamente.
Se procede a aceptar para, seguidamente, elegir que m´etodo de instrumentalizaci´on usar. Como se explico anteriormente, existen dos formas de estimar un modelo de pa-neles din´ amicos, a trav´es del m´etodo de Arellano Bond o el de Arellano Bover. El primero de ellos hace referencia a la primera elecci´on “Differences”. El segundo a “Orthogonal deviations”. El m´ etodo por el que se opta es el de Arellano Bond (Differences), y se procede a aceptar. El pr´oximo paso el elegir las variables instrumentales. Si bien se puede realizar cambios en ella, se opta por elegir la especificaci´ on que por defecto. Procedemos a aceptar.
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.3. Estimaci´ on del modelo
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
69
www.giddea.com
[email protected]
70
6. Panel Din´ amico
En el siguiente cuadro se va a diferenciar entre aquellas variables que se desee sean transformadas siguiendo el m´etodo elegido de aquellas que se quieran introducir sin ninguna alteraci´ on.
Se procede a incluir en la parte de transformaci´ on a las variables que se encuen-tran en niveles. Es decir, la variable TCI as´ı como todas sus ficticias. La variable VPBI6 se incluye dentro de las variables que no necesitan ser transformadas. Se procede a aceptar. Seguidamente se presenta el u´ltimo paso del Wizard, en ´el se puede relaizar es-pecificaci´ on con respecto al comportamiento de la matriz de varianza covarianza del modelo. Se opta por aceptar la especificaci´ on que por defecto presenta el programa. Luego de aceptar se llega a la u ´ ltima pantalla. En este punto se puede retroceder a revisar lo hecho o a finalizar lo propuesto. Luego de estar conforme con lo espe-cificado se procede a finalizar el “Dynamic Wizard”. Seguidamente se reaparece en la pantalla de estimaci´ on y se procede a hacer clic en aceptar.
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.3. Estimaci´ on del modelo
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
71
www.giddea.com
[email protected]
72
6. Panel Din´ amico
Lo siguiente es esperar por los resultados.
Resultados e Interpretaci´ on Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
6.3. Estimaci´ on del modelo
73
Hay dos aspectos importantes que se deben tener en cuenta.
Primero: Que las variables individuales salgan significativas es decir que su T-statistic sea mayor a 2 en valor absoluto o que su probabilidad sea menor que 5%. Segundo: En este tipo de regresiones el R cuadrado no es relevante, pero si lo es el Test de Sarga. Mientras mas cercano a 1 el modelo ser´ a bueno. El test consiste en realizar una prueba con distribuci´ on Chi cuadrado: Scalar pval=@chisq(j-statistic,Intrument rank - par´a metros a estimar )
En este caso particular: scalar pval3=@chisq(74.50768,85-10) pval=0.494330701975
Lo que nos ofrece una adecuada estimaci´ on
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
www.giddea.com
[email protected]
74
Eviews Intermedio Aplicado al An´alisis Microeconom´etrico
6. Panel Din´ amico
www.giddea.com
[email protected]