PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
Facult Facultad ad de Economía Economía
Modelos Apl Aplicados cados al al Medio edio Ambiente Ambiente
Logit -P -Probit robit : La Pobreza en el “Aplicación de M ult inomial Logit Ecuador”
Leonardo Ochoa R.
mayo ayo de 2013 2013
1. Introducción
La pobreza es una situación o forma de vida que surge como producto de la imposibilidad de acceso o carencia de los recursos para satisfacer las necesidades físicas y psíquicas básicas humanas que inciden en un desgaste del nivel y calidad de vida de las personas, tales como la alimentación, la vivienda, la educación, la asistencia sanitaria o el acceso al agua potable. También se suelen considerar la falta de medios para poder acceder a tales recursos, como el desempleo, la falta de ingresos o un nivel bajo de los mismos. También puede ser el resultado de procesos de exclusión social, segregación social o marginación. En el presente trabajo una vez clasificada la condición de pobreza, se realizará regresiones de la pobreza (como variable categórica ordinal) con los métodos Multinomial Probit y Logit para variables ordinales. En primer lugar se presenta una breve reseña del marco teórico, a continuación la fuente de los datos, después la descripción de las variables utilizadas y la construcción del modelo, y finalmente resultados yconclusiones.
2. M arco Teórico 1
2.1 Pobreza y pobreza extrema por Ingreso
Número de personas pobres expresado como porcentaje del total de la población en un determinado año. Se define como "pobres" a aquellas personas que pertenecen a hogares cuyo ingreso per cápita, en un período determinado, es inferior al valor de la línea de pobreza. La línea de pobreza es el equivalente monetario del costo de una canasta básica de bienes y servicios. Para calcular la incidencia de pobreza, se compara, el ingreso total per-cápita con la línea de pobreza y los individuos cuyo ingreso total per-cápita es menor a la línea de pobreza, y son considerados pobres. Finalmente calculamos la proporción de pobres frente al total de la población calculada mediante la base expandida. El mismo procedimiento seguimos para pobreza extrema.
2.2 Modelos de Probabilidad
Dado que el uso de una función de distribución garantiza que el resultado de la estimación esté acotado entre 0 y 1, en principio las posibles alternativas son varias, siendo las más habituales la 1
Tomado de Sistema Integrado de Indicadores Sociales del Ecuador e INEC (S/F). Disponible en la web: http://www.inec.gob.ec/inec/index.php?option=com_remository&Itemid=420&func=startdown&id=936&la ng=es
función de distribución logística, que ha dado lugar al modelo Logit, y la función de distribución de la normal tipificada, que ha dado lugar al modelo Probit. Tanto los modelos Logit como los Probit relacionan, por tanto, la variable endógena Y i con las variables explicativas X ki a través de una función dedistribución. Los modelos logit y probit se interpretan en términos probabilísticos, es decir, sirve para medir la probabilidad de que ocurra el acontecimiento objeto de estudio (Y i =1). En cuanto a la interpretación de los parámetros estimados en un modelo Logit, el signo de los mismos indica la dirección en que se mueve la probabilidad cuando aumenta la variable explicativa correspondiente, sin embargo, la cuantía del parámetro no coincide con la magnitud de la variación en la probabilidad. No obstante los modelos logit y probit solamente sirven para variables dependientes dicotómicas.
2.3 Modelos Logit-Probit Multinomiales
Los modelos Multinomiales utilizan el método de Máxima Verosimilitud para estimar las probabilidades asociadas a cada elección, dadas las características particulares de los individuos o los atributos de las eleccionesresumidas en los regresores. Se utilizará el comando ol ogi t y opr obi t , ya que para este modelo, la variable dependiente categórica es ordinal. En logit o probit multinomial ordenado, una puntuación subyacente se calcula como una función lineal de las variables independientes y un conjunto de puntos de corte. La probabilidad de observar resultado i corresponde a la probabilidad de que la función lineal estimada, además de error aleatorio, está dentro de la gama de los puntos de corte estimados para el resultado
Pr = = Pr ( < + + ⋯ + + ≤ ) u j se asume está distribuido logísticamente para el caso logit, y distribuido normalmente para el
caso probit. En cualquiera de los casos, se estima los coeficientes b1, b2, …, bk junto con los puntos de corte k1, k2, …,kK-1, donde k es el número de posibles resultados. k0 se toma como - , y kK se toma como + . Todo esto es una generalización directa del modelo logit/ probit de dos resultados ordinarios. ∞
∞
3. Fuent es de Dat os
Encuesta Urbana de Empleo, Desempleo y Subempleo (ENEMDU).- Tiene cobertura nacional, el levantamiento de información se realizó en el área urbana. Del ámbito de estudio se excluye la región insular. La encuesta está dirigida a los hogares y las personas que en ellos residen, establecidos enlas viviendas particulares. La muestra utilizada proviene de la ENEMDU provisto para el cuarto trimestre del 2012. Se cuenta con 73.686 registros, si consideramos con el factor de expansión se estima una población de 14’682.556.
4. Modelo Variable Dependiente
Pobreza.- Variable categórica ordinal calculado por ingreso. Modelo:
( = ) = + + + + + + + + Donde Y i =i
Probabilidad de ser pobre extremo (i =1), pobre (i =2), no pobre(i =3).
b 0
Constante
X 1
Sexo
X 1
Sexo del Jefe de Hogar (1=mujer)
X 3
Edad
X 4
Edad2
X 5
Años de Escolaridad
X 6
Presencia de niños menores a 3 años
X 7
Presencia de adultos mayores a 65 años
X 8
Tamaño del Hogar (número de individuos)
5. Result ados
A continuación se presenta la tabla de resultados de las regresiones logit y probit multinomial para variable dependiente ordinal:
Sexo (mujer =1)
Sexo del je (mujer =1) Edad
Edad2
Años de Escolaridad
Presencia de Niños
Presencia de Viejos
Tamaño del Hogar
Marginal fixed effects after ol ogi t yi =1 yi =2 yi =3
Marginal fixed effects after opr obi t yi =1 yi =2 yi =3
0.013431*
0.0198131*
-0.0296451*
0.0146422*
0.0166052*
-0.0268327*
(0.00392)
(0.00555)
(0.00851)
(0.00446)
(0.00478)
(0.00804)
-0.0022491* -0.0033941* 0.0049829*
-0.0021819*
-0.0025591*
0.0040174*
(0.00053)
(0.00082)
(0.00119)
(0.00061)
(0.00073)
(0.00114)
0.0000188*
0.0000284*
-0.0000418*
0.0000184*
0.0000216*
-0.0000339*
(0.00001)
(0.00001)
(0.00001)
(0.00001)
(0.00001)
(0.00001)
-0.0034857*
-0.0052603* 0.0077226*
-0.0038799*
-0.0045507*
0.007144*
(0.00089)
(0.00552)
(0.00195)
(0.00103)
(0.00118)
(0.00187)
0.0142771*
0.0210288*
-0.0315014*
0.0168551*
0.019016
-0.0308581*
(0.00383)
(0.00552)
(0.0084)
(0.00439)
(0.00481)
(0.008)
0.003614
0.005424
-0.0080019
0.0051007
0.0059177
-0.0093804
(0.00483)
(0.00721)
(0.01068)
(0.00549)
(0.0063)
(0.01008)
0.0121053*
-0.0268191* -0.0268191
0.0136984
0.0160668*
-0.0252228*
(0.00085)
(0.00188)
(0.00096)
(0.00117)
(0.0018)
(omitida)
(0.00188)
R2
0.0698
0.0673
N
17931
17931
*p<0.05 Nota: Corregido por provincia Errores estándar robustos entre paréntesis
Las variables son significativas salvo la presencia de adultos mayores. La variable “sexo del jefe de hogar” fue omitida. Se observa que ser mujer aumenta las probabilidades de ser pobreo y pobre extremo en 1%y 2% respectivamente, y disminuye las probabilidades de no ser pobre en aproximadamente 3%. El efecto de la variable de edad no alcanza el 1%.. Los años de escolaridad tienen una relación inversa con la probabilidad de ser pobre y pobre extremo, es decir a mayor nivel de escolaridad aumentan las probabilidades de no ser pobre aunque no alcanzan el punto porcentual. Tener niños menores de 3 años o adultos mayores a 65 años en el hogar aumenta la probabilidad de ser pobre y pobre extremo.
Los coeficientes obtenidos con logit y probit multinomial son mayormente equivalentes.
6. Conclusiones ∑ ∑ ∑
∑ ∑
∑
El modelo está correctamente específicado ya que solo una de las variables independientes fue omitida y una más no fue significativa. Según se pudo observar, los métodos probit y logit multinovial arrojaron resultados significativos para las variables independientes y muy similares entre si. De acuerdo a lo observado, ser mujer aumenta las probabilidades de ser pobre y pobre extremo. Los años de escolaridad tienen una relación inversa con la probabilidad de ser pobre. Tener niños menores de 3 años aumentala probabilidad de ser pobre. El número de miembros de la familia tiene una relación directa con la probabilidad de pobreza, pero indirecta con pobreza extrema. El modelo construido da bajos valores para los coeficientes de las variables explicativas, por lo que ninguna de las variables independientes parece tener una sensibilidad especialmente alta. Puede existir problemas de endogeneidad por variable omitida como el ingreso, la cual no se incluyo porque explica perfectamente la situación de pobreza. De existir endogeneidad, los coeficientes no serán consistentes ni insesgados. Además por la naturaleza del modelo multinomial se esperaría problemas de endogeneidad. Otra variable omitida que podría dar problemas de endogeneidad es la presencia de asalariados en el hogar.