UNIVERSIDAD DEL BIO-BIO INGENIERIA DE TRANSPORTES
1° SEMESTRE DEL 2013
GUIA DE EJERCICIOS RESUELTOS PARTICION MODAL Ejercicio 1
Usted requiere estimar estimar cuantas estudiantes usarían bicicletas en vez vez de preferir caminar. Para ello, usted requiere estimar un modelo de partición modal que considere dos alternativas: caminata y bicicleta. a) Encuentre una especificación de las funciones de utilidad de este modelo, asumiendo que se proyecta cobrar $P por cada vez que se utiliza la bicicleta. Su modelo debe como mínimo ser capaz de estimar valores subjetivos del tiempo de viaje de los estudiantes. Explicite claramente los supuestos que utiliza para su especificación propuesta. b) Discuta el efecto que tendría en su modelo, el cambio de lugar de algunas clases impartidas, en particular en lo que respecta a los coeficientes. c) Utilizando la especificación explicada en la pregunta anterior, muestre cuál es la utilidad marginal del tiempo y cuál es el valor subjetivo del tiempo (VST). d) Muestre la expresión matemática de la probabilidad de elegir bicicleta, sin asumir distribución de probabilidades alguna, y utilizando la especificación explicada en a). e) Si hubiera “n” modos, en donde se incluye la bicicleta, muestre también la expresión matemática para calcular su probabilidad de elección, sin asumir ninguna distribución en particular, asumiendo que hay independencia en las alternativas. f) Muestre la expresión matemática de la probabilidad de elegir bicicleta, pero asumiendo una distribución Gumbel para los errores estocásticos y la especificación explicada en a). ¿Qué tipo de modelo de elección resulta? g) Explique matemáticamente (en forma breve) breve) en que consiste estimar el modelo anterior con los datos discutidos en f) h) Utilizando el modelo estimado, plantee una expresión matemática para calcular , la demanda (número) de estudiantes que utilizan la bicicleta en un día tipo. Sea lo más explícito posible en su notación.
i) Se calcula que el proyecto de las bicicletas cuesta $N millones de pesos. Utilizando el valor subjetivo del tiempo estimado VST, encuentre cual debe ser la demanda (numero) de estudiantes para el proyecto se justifique.
j) Utilizando (h) y (i), establezca una regla de decisión para asesorar a la persona que quiere saber si el proyecto es rentable socialmente.
Solución
a) Una formulación sencilla, es considerar una función de utilidad determinista, del tipo lineal, que refleje los atributos más importantes de ambos modos. Para cada alternativa, las funciones de utilidad pueden ser:
.−− + +. Consideramos que el modo caminata tiene atributos que nos conocemos, no consideramos o que son difíciles de medir (razón para colocar una constante modal). También consideramos que hay suficientes bicicletas para todo estudiante que elija este modo. Por último y de forma intuitiva, consideramos que estos son los atributos que mayor relevancia tienen a la hora de elegir un modo sobre otro (en general, el costo y el tiempo son los atributos de mayor relevancia en la partición modal) b) Dependiendo de la distancia a la cual se cambian las clases, tendría efectos distintos, aunque la elección de modos depende de muchos otros atributos (para este caso, propósito del viaje, inicio del viaje, etc.) Si la distancia a la cual se cambiaron las clases aumenta, se esperaría que la elección favorezca el modo bicicleta. Lo contrario ocurriría si las distancias disminuyen, es decir se favorecería el modo caminata. Notemos que estos cambios no afectan a los coeficientes, debido a que cambian los atributos, razón por la cual se realiza un modelo de este tipo. Pero si realizáramos una estimación de los coeficientes, con la condición expuesta, es probable que estos coeficientes cambien. c) La utilidad marginal, de cualquier índole, representa cuanto cambia la utilidad si se aumenta o se disminuye en una unidad el valor de un atributo. En particular para nuestra formulación, la utilidad marginal del tiempo será para cada modo:
El valor subjetivo del tiempo VST, nos indica cuanto “cuesta” el tiempo en unidades monetarias y se calcula como la razón entre la utilidad marginal del tiempo y del costo
d) Recordemos que la teoría de la utilidad aleatoria, asume se tiene una componente de error , con una cierta distribución de probabilidades. De la teoría de distribuciones
de probabilidades, la función de densidad (la que describe la distribución) a través de la función de distribución acumulada (al integrar bajo un cierto valor), nos entrega la probabilidad de elección. Para dos modos cualesquiera tenemos:
− ( ≤ 2) ∫−∞
Para el modo bicicleta, tenemos que:
− ∫−∞ e) De forma análoga a la pregunta anterior, si asumimos la probabilidad de elección del modo bici, para “n” modos tenemos:
La expresión anterior es igual a:
− ∫−∞
− − ∫−∞ … ∫−∞ 2, ,, ,…, 2,,,,…,,
k es el conjunto de todos los modos, excepto la bicicleta Si hay independencia de las alternativas, error en la estimación de la probabilidad de elección de la bicicleta, no depende de los errores en los otros modos, así:
− − − : ∫−∞ ∫−∞ … ∫−∞ 2,, …, 2,,…,
f) Si se los errores se distribuyen Gumbel, es decir su función de densidad es: Por lo que la probabilidad de elección del modo bicicleta será:
−−
g) Implica maximizar la función de verosimilitud, que corresponde a la multiplicación de las probabilidades de elegir el modo que fue en la realizad elegido, encontrando los coeficientes de las funciones de utilidad, antes especificadas. Se elige este método estimador, en vez de la regresión lineal, debido a que la variable dependiente (la elección), es discreta, por lo que la regresión lineal no es válida (es válida cuando las variables aleatorias son discretas)
∗
h) La demanda de estudiantes que utilizarán la bici, será: en donde T es la cantidad total de viajes que se realizan tanto en bicicleta como a pie (un buen estimador es simplemente la cantidad total de estudiantes) y es la probabilidad de usar bicicleta, según el modelo de partición modal anterior i) El proyecto que se plantea se justifica si la inversión es menor o igual que el ahorro total en tiempo de viajes de los estudiantes, es decir:
$≤∗ ∗ ∗ → $ ≤ $ ≤ Es decir para que el proyecto sea rentable, la demanda por la bicicleta, debe ser mayor a la razón entre el monto de inversión y el VST.
≥ $⁄ → ≤ $⁄ →
j) De las preguntas anteriores se tiene:
Problema 2
Usted está interesado en estimar la elección del modo de viaje al centro de Concepción de funcionarios públicos que viven en San Pedro de la Paz. Usted ha recolectado información de 100 individuos respecto a los tres modos principales: Auto, Bus y Bus-Biotrén combinado. Asuma que las tres primeras observaciones son las siguientes:
a) Escriba explícitamente la forma funcional de la utilidad del individuo 1 para la alternativa Bus- Biotrén b) Escriba explícitamente la forma funcional de un modelo MNL (Logit Multinomial) útil para modelar la probabilidad de que un individuo 2 elija la alternativa bus (Puede escribir las funciones de utilidad de manera sintética, explicando su notación). c) Escriba la función de verosimilitud correspondiente, necesaria para estimar los coeficientes de la función de utilidad. Sea explícito en cómo se incorporan los datos
de los tres individuos anteriores, aunque puede escribir las funciones de utilidad de manera sintética, explicando su notación. d) Dos modelos han sido estimados, uno MNL (Logit Multinomial) y otro HL (Logit jerárquico) (entre paréntesis, se muestra el test t). Critique brevemente la calidad de cada uno de ellos. Coeficiente MNL Constante modal auto 0.33 (2.3) Constante modal bus 0.14 (2.7) Costo -0.001 (-1.6) Tiempo de viaje en -0.025 (-2.5) vehículo Tiempo de acceso y espera -0.040 (-2.5) Coeficiente (nido de transporte público)
∅
HL 0.34 (2.9) 0.34 (2.9) -0.002 (-1.6) -0.046 (-2.6)
-0.046 (-2.9) 0.6 (0.8)
e) Escriba el valor subjetivo del tiempo de viaje en vehículo del individuo 1, según cada modelo. Escriba el valor subjetivo del tiempo de acceso y espera del individuo 2, según cada modelo. f) Utilizando los datos del modelo MNL y sin calcular la probabilidad explícitamente, comente qué escenario es más favorable para la partición modal del bus del individuo 1 Solución:
a) La función de utilidad queda de la forma:
+
que representa la utilidad del usuario n para la alternativa i, es la parte funcional y es el error en los atributos (atributos no considerados o mal medidos).También podemos formular como:
+ , , +., ., + . .
Dónde: : Constante modal del bus-biotrén para el individuo i : Parámetro del costo del bus-biotrén para el individuo i : Parámetro del tiempo de viaje del bus-biotrén para el individuo i : Parámetro del tiempo de acceso y espera del bus-biotrén para el individuo : Valor del atributo j (costo, TV, TA) para el individuo i.
, ., . ,
Por ejemplo, para el individuo 1 el modo Bus-Biotren, su utilidad determinística será:
− − + , ∗630+., ∗60+. ∗15 b) La forma funcional del Logit Multinomial, surge de considerar que los errores se distribuyen Gumbel, asi:
Probabilidad de que el individio i escoja la alternativa n ∑exp exp De forma más específica se tiene que:
exp,2 ,2 exp(,2) +exp( ,2) +exp−,2
Nota: Notemos que general, el parámetro μ, esta presente en la formulación del Logit (que representa la media de la distribución Gumbel, pero μ no se puede estimar por separado de θ, por lo que se estima un θ*=θμ, considerándolos como un solo coeficiente)
c) La función de máxima verosimilitud, en general se representa:
∏ =
con indica si el modo i fue elegido por la persona n. Si fue elegido el modo i , sino vale 0 Para este caso:
1
,,2,
d)
e) Los valores subjetivos del tiempo de viaje para ambos casos serán:
f) Un aumento del tiempo de viaje en automóvil de un 50% o una disminución de la tarifa en un 50%.
PROBLEMA 3
a) Suponga que usted está estudiando la generación de viajes en una cierta ciudad, para lo cual utiliza un modelo de análisis por categorías, basado en una encuesta de viajes, en que ha dividido los hogares según número de personas y tasa de motorización. Se tiene una muestra que corresponde al 10% de la población. Los resultados se reportan en las tablas siguientes: Distribución de hogares en la muestra
Muestra de viajes
Tasa de motorización
nº de
Nº de personas
0
1
2 ó más
Total
<4
300
200
100
600
4
100
500
200
800
Total
400
700
300
1400
personas
Tasa de motorización 0
1
2 ó más
<4
997
840
604
4
512
3549
1657
Considere que todas las zonas tienen igual cantidad de hogares, y que hay un total de 100 zonas. En todos los casos en que carezca de la información sobre distribución en la población, asuma homogeneidad. Calcule la cantidad de viajes generados por Una zona en que sólo hay hogares con dos o más autos. Una zona en que el 50% de los hogares tiene un auto y el 50% no tiene auto
b) Suponga que además, se cuenta con el siguiente modelo de regresión lineal desagregado a nivel hogar, previamente calibrado por un experto: V 2.23 1.59 Z 4 3 (1 0.5 X 0 0.2 X 1 )
M1
donde
1
si el hogar tiene 4 ó más personas
0
si no
Z 4
1
si el hogar tiene1 auto
0
en otro caso
X 1
1
si el hogar no tiene auto
0
en otro caso
X 0
Otro especialista propone un modelo (también desagregado por hogar) de la forma:
V 1 2 Z 4 3 X 1 4 X 2 donde la nueva variable es: X 2
1 0
M2
si el hogar tiene 2 ó más autos en otro caso
¿cuál es el signo esperado de los parámetros beta y qué relaciones de orden se puede establecer entre ellos? Además, señale cómo se espera que sea 1 en relación a la constante del modelo M1. Explique.
Solución a)
Primero se calculan las tasas de generación de viajes por hogar:
Tasas de generación de viajes nº de personas
Tasa de motorización 0
1
2 ó más
<4
3.32
4.20
6.04
4
5.12
7.10
8.29
Como el tamaño de muestra es 10% y hay 100 zonas, cada zona tiene 140 hogares. Aplicando las proporciones que se dan en la muestra:
Una zona en que sólo hay hogares con dos o más autos:
V
140 *
1 3
* 6 .04 140 *
2 3
* 8.29
1055.6
viajes
Una zona en que el 50% de los hogares tiene un auto y el 50% no tiene auto:
V
b)
70 *
2 7
* 4.20 70 *
5 7
* 7.10 70 *
3 4
* 3.32 70 *
1
* 5.12
4
702.9
viajes
Como los modelos están calibrados con variables Dummy, los parámetros (o suma de
ellos) representan directamente los viajes generados por una categoría de hogar.
Opción 1
Para un hogar sin autos y menos de 4 personas (A), no se activa ninguna variable, luego V 1
0 , necesariamente.
Para un hogar con 1 auto y menos de 4 personas, V 1
3 (1). Lógicamente, estos
hogares generan más viajes que (A) 3 0
Para un hogar con dos o más autos y menos de 4 personas, V 1 misma razón que el caso anterior 4
4 (2), por la
0
Por último, para un hogar sin autos con más de 4 personas: V 1 más personas que (A) también genera más viajes
2
2 , que al tener
0
Uniendo (1) y (2), y sabiendo que un hogar con 2 ó más autos genera más viajes que uno con 1 auto, 4
3 . Los demás parámetros son incomparables.
Por construcción, la constante de M1 represe nta los viajes generados por hogares con menos de 4 personas y 2 ó más autos, mientras la constante de M2 ( 1 ) representa los viajes de un hogar sin autos y menos de 4 personas. Luego, por la variable tasa de motorización,
1
5.23
Opción 2
M 1 :
V 5.23 1.59Z 4 1.5 X 0 0.6 X 1
M 2 :
V 1
2 Z
4
3 X 1 4 X 2
Evaluando en M1 para cada categoría e igualando con lo obtenido de M2, se tiene que:
M 1 : M 2 :
M 1 : M 2 :
M 1 : M 2 :
M 1 : M 2 :
Hogares con menos de cuatro personas y sin auto:
5.23 1.5 3.73 3.73 V
V
1
1
Hogares con menos de cuatro personas y 1 a uto:
5.23 0.6 4.63 4.63 4.63 3.73 0.9 V
V
3
1
1
3
Hogares con menos de cuatro personas y 2 o más autos:
5.23 5.23 5.23 3.73 1.5 V
V
4
1
1
4
Hogares con 4 o más personas y sin auto:
5.23 1.59 1.5 5.32 5.32 5.32 3.73 1.59 V
V
2
1
1
2
Lo cual era esperable, dado que es la mis ma variable para ambos modelos.
PROBLEMA 4