UNIVERSIDAD NACIONAL DE ALTIPLANO ESCUELA PROFESIONAL DE INGENIERIA ECONOMICA
ECOMETRIA II
Sesió Ses ión n 05: Mode Modelo loss Logit Logit y Probi Pr obitt or ordin dinale aless y multinomiales Docente:: MSc. Andres Vilca Mamani Docente Mamani
•
•
•
•
Modelos de respuesta ordinal: La variable dependiente toma un número de valores finitos y discretos que contienen información ordinal. En los modelos modelos probit probit y logit ordenados, ordenados, las las variables variables de respuesta respuesta tienen más de dos categorías ordenadas o jerarquizadas. Modelos de respuesta multinomial: La variable dependiente toma una serie de valores finitos y discretos que NO contienen información ordinal. Como en los casos casos probit y logit, la variable dependiente dependiente no es estrictamente continua. La estimación se lleva a cabo utilizando el estimador MV.
Modelos ordinales logit y probit •
•
•
En los modelos logit y probit, el interés residía en construir un modelo para una variable de respuesta del tipo sí o no. Pero a menudo la variable de respuesta, o regresada, puede tener más de dos resultados, y con mucha frecuencia son ordinales por naturaleza; es decir, no pueden expresarse en una escala de intervalo Las respuestas pueden estar en escala de tipo Likert, por ejemplo “Estoy satisfecho con los productos de la empresa LexCorp”, “totalmente de acuerdo”, “algo de acuerdo”, o “totalmente en desacuerdo”
•
las respuestas de una encuesta sobre educación quizá sean “menor a la educación media superior”, “educación media superior ”, “licenciatura”, “posgrado”.
•
•
Muy a menudo tales respuestas se codifican como 0 (menor a la educación media superior), 1 (educación media superior), 2 (licenciatura) y 3 (posgrado). Éstas son escalas ordinales, pues hay un orden claro entre las categorías, pero no podemos decir que 2 (licenciatura) es dos veces 1 (educación media superior), o que 3 (posgrado) es tres veces 1 (educación media superior).
•
•
Decisión de permanecer sin trabajar, trabajar a tiempo parcial, o trabajar a tiempo completo En una regresión de ingresos, el nivel de ingresos se codica en intervalos: [0,1000), [1000,1500) [1500,2000), [2000, ∞ ) ¿Está usted de acuerdo o en desacuerdo con el Presidente? 1 'Desacuerdo' 2 'Neutral' 3 'De acuerdo' ¿Cuál es su situación socioeconómica? 1 'bajo' 2 'Medio' 3 'Alto'
•
•
Al igual que en otros modelos no lineales, los efectos marginales se deben calcular para entender los efectos parciales de un pequeño cambio en la variable explicativa xj . Para los modelos ordinales podemos calcular los efectos marginales sobre las probabilidades predichas usando los mismos principios que con los probit y logit.
•
•
•
Los dos modelos estándar son el probit ordenado y el logit ordenado. El enfoque es equivalente: simplemente usamos para el probit ordenado la CDF normal y para el logit ordenado la CDF logística . OLS no funciona porque la variable dependiente no tiene sentido cardinal:
•
El modelo probit ordenado se construye alrededor de una regresión latente de la misma manera que el modelo probit binomial. Comenzamos con Usualmente, y no es observable. Lo que observamos es ∗
que es una forma de censura. Los μ’s son parámetros desconocidos para ser estimados con β.
Probabilidades en el Modelo Probit Ordenado
Asumiendo que ε se distribuye normalmente a través de las observaciones. Por las mismas razones que en el modelo probit binomial (que es el caso especial de J = 1), normalizamos la media y la varianza de ε a cero y uno. Entonces tenemos lo siguientes Probabilidades donde es la función de distribución de probabilidad acumulada normal estándar
Para que todas las probabilidades sean positivas, debemos
0 < μ1 < μ2 < · · · < μJ−1.
Como de costumbre, los efectos parciales de los regresores x sobre las probabilidades no son iguales a los coeficientes. Es útil considerar un ejemplo simple. Supongamos que hay tres categorías. Por lo tanto, el modelo tiene sólo un parámetro de umbral desconocido. Las tres probabilidades son
Para las tres probabilidades, los efectos parciales de los cambios en los regresores son
•
Ejemplo 18.3 Asignación de calificaciones Marcus y Greene (1985) calcularon un modelo probit ordenado para las asignaciones de trabajo de nuevos reclutas de la Armada de US. La Marina intenta dirigir a los reclutas a las clasificaciones laborales en las que serán más productivos. Las clasificaciones amplias que los autores analizaron fueron empleos técnicos con tres calificaciones de habilidad claramente clasificadas: “moderado calificado", “mediano calificado" y "altamente calificado" 1) ENSPE = una variable dummy que indica que el individuo ingresó a la Armada con una garantía de "escuela A" (formación técnica); (2) EDMA = nivel educativo de la madre del participante; (3) AFQT = puntuación en el Test de Calificación de las Fuerzas Armadas; (4) EDYRS = años de educación completados por el estudiante; (5) MARR = una variable dummy que indica que el individuo estaba casado en el momento del reclutamiento; y (6) AGEAT = edad del aprendiz al momento del reclutamiento
Si el
recluta esta casado y tiene una instrucción o calificación moderado la productividad laboral es del 57.4% Pero la mejor opción de contratar para una mejor productividad del recluta es que sea soltero con una habilidad de calificación mediana ya que su productividad laboral es del 62.9 %
Efectos marginales para los modelos logit / probit ordenados •
El efecto marginal de un aumento en un regresor xr sobre la probabilidad de seleccionar la alternativa j es:
• •
Los efectos marginales de cada variable en las diferentes alternativas suman a cero. Interpretación de efectos marginales: cada incremento unitario en la variable independiente aumenta / disminuye la probabilidad de seleccionar la alternativa j por el efecto marginal expresado como porcentaje.
•
•
•
•
En los modelos probit y logit ordenados, las variables de respuesta tienen más de dos categorías ordenadas o jerarquizadas. Pero existen situaciones en las que la regresada no está ordenada. Por ejemplo, considere la elección del transporte para ir al trabajo. Las elecciones son bicicleta, motocicleta, automóvil, autobús o tren. Aunque son respuestas categóricas, no existe jerarquía ni orden Otro ejemplo: las clasificaciones laborales, como mano de obra no especializada, semiespecializada y muy especializada (no hay ningún orden) Las técnicas de los modelos probit y logit multinomiales sirven para estudiar esas categorías nominales.
•
•
•
Elección del modo de transporte: tren, autobús, coche. Situación económica: inactivos, desempleados, trabajadores por cuenta propia, empleado. Elección campo Educación: ciencia dura, ciencias de la salud, ciencias sociales, humanidades. Si se celebraran elecciones hoy, ¿para qué partido votarías? 1 'Demócratas' 2 'Independiente' 3 'Republicanos' ¿Qué te gusta hacer los fines de semana? 1 'Descanso'
•
La principal diferencia en comparación con el logit binario es que ahora hay dos vectores de parámetros, β1 y β2.
•
•
En el caso general con J posibles respuestas, hay J −1 vectores de parámetros. Esto hace que la interpretación de los coeficientes sea más difícil que en los modelos de elección binaria.
•
Cuando la variable dependiente tiene un número finito de valores discretos, podemos extender los modelos probit y logit •
•
•
Cuando la variable dependiente contiene información ordinal, entonces podemos utilizar probit ordinal y logit ordinal. Cuando la variable dependiente no contiene ninguna información ordinal, podemos utilizar modelos multinomiales. Un ejemplo es el logit multinomial.
Estos son todos modelos no lineales, y todos ellos pueden ser estimados por MV.
Logit Multinomial y es una v.a. que toma valores {0, 1, 2, ..., J}
P ( y j | x )
exp( x ) j
j= 1, 2, …, J
1 exp( x J
h 1
h
Dado que las probabilidades deben sumar la unidad, P( y 0 | x )
1
1 exp( x J
h 1
h
Efectos marginales J 1 Pij Pij jk Pim mk , j 1, , J 1 x ik m 1
Elasticidades J 1 Pij x ik x ik jk Pim mk , j 1, , J 1 x ik Pij m 1 relative change of pij if x increases by 1 per cent
Estimación de máxima verosimilitud La función de máxima verosimilitud es
log L dij log pij i
j
es globalmente cóncava y fácil de maximizar (McFadden, 1974) gran ventaja computacional sobre probit multinomial o logit anidado
Estimación por máxima verosimilitud Para cada individuo i : J
l d logP x , i
j 0
ij
j
i
d 1 si el individuo i elige la alternativa j, y cero en cualquier otro c aso. ij
El vector β se obtiene maximizando: N
l ( ) i 1
i
Probit Multinomial •
El modelo multinomial logit (MNL) es el modelo multinomial probit (MNP). La estructura Las ecuaciones del modelo MNP son
El término en la log-verosimilitud que corresponde a la elección de la alternativa q es
La probabilidad de esta ocurrencia es
para el J - 1 otras opciones, que es una probabilidad acumulativa de una (J - 1) -variable distribución normal. Debido a que sólo hacemos comparaciones, una de las variaciones en esta estructura de la variable J - 1