Imagine que tiene $5000 para invertir y tendrá la oportunidad de hacerlo en cualquiera de dos inversiones (A o B) al principio de cada uno de los próximos tres años. Existe incertidumbre respecto del rendimiento de ambas inversiones. inversiones. Si invierte en A, puede perder todo el dinero o (con probabilidad más alta) obtener $10000 (una ganancia de $5000) al final del año. Si invierte en B, puede obtener los mismos $5000 que invierte o (con probabilidad más baja) $10000 al terminar el año. Las probabilidades para que sucedan estos eventos son las siguientes:
Inversión
Cantidad Obtenida($)
Probabilidad
0 10000 5000 10000
0.3 0.7 0.9 0.1
A B
Se le permite hacer a lo sumo una inversión al año y sólo puede puede invertir $5000 cada cada vez. Utilice la programación programación dinámica para encontrar la política de inversión que maximice la cantidad de dinero esperada que tendrá después de los tres años. Solución:
B (0.9)(8400)+(0.1)(14000)=8960 (0.9)(8400)+(0. 1)(14000)=8960
Solución Óptima f 1*(s1)
x1*
9800
A
El valor de $9800 es una cantidad referencial que sirve para tomar una decisión de inversión. No es la cantidad real de dinero que se puede obtener.
Juan Pérez, fanático del fútbol, vende poleras del equipo de sus amores al final de los partidos en que juega su equipo. Juan sabe que si ganan vende 400 poleras, pero que si el equipo pierde vende sólo 200 unidades (por simplicidad suponga que este equipo nunca empata). Además Juan ha observado que las probabilidades de ganar o perder son iguales. Cada vez que Juan hace un pedido paga 500 pesos de costo fijo más 5 pesos por cada polera que encargue, las cuales vende en 8 pesos. Una exigencia de su proveedor es que todos los pedidos deben ser realizados en múltiplos de 100 poleras, y la entrega de éstas es inmediata. Debido al costo de capital, almacenamiento, y obsolescencia Juan carga un costo de 2 pesos por cada polera no vendida al final de un partido (poleras que llevó al estadio para vender pero nadie compró). La capacidad de almacenamiento de Juan es de 400 poleras como máximo. Juan está interesado en encontrar la política óptima de pedido para los primeros 3 partidos (su inventario actual de poleras es cero). Cualquier polera que sobre después del tercer partido se valoriza en 6 pesos. ¿Qué debería hacer Juan? (resuelva utilizando programación dinámica).
Solución Valores de la función objetivo antes del último partido:
P3
N3
0
100
200
300
400
P3*
N3*
0
0
-200
200
200
300
400
300
100
800
600
700
800
-
0 ó 300
800
200
1600
1200
1300
-
-
0
1600
300
2200
1800
-
-
-
0
2200
400
2800
-
-
-
-
0
2800
Donde P3* es el pedido óptimo de poleras antes del partido número tres si tengo N3 poleras en stock antes de pedir.
Antes del 2do partido se tendrá:
P2
N2
0
100
200
300
400
P2*
N2 *
0
300
100
400
450
650
400
650
100
1100
900
950
1150
-
300
1150
200
1900
1450
1300
-
-
0
1900
300
2450
2150
-
-
-
0
2450
400
3150
-
-
-
-
0
3150
Mientras que en la primera etapa
P1
N1 0
0
100
200
300
400
P1*
N1 *
650
450
1250
1300
1475
400
1475
De esta manera la estrategia óptima es la siguiente:
Partido 1: Pedir 400 poleras. Partido 2: Si el partido 1 lo ganó su equipo volver a pedir 400 poleras, mientras que si perdió el primer partido no pedir.
Partido 3: Si su equipo ganó el segundo partido (independientemente de lo que pasó en el primero) pedir 400 poleras. Si el equipo perdió el partido 1 y también perdió el partido 2 pedir 400 poleras. Si ganó el primer partido, pero perdió el segundo no pedir.