PROGRAMACION DINAMICA PROBABILÍSTICA
Ing. Manuel Sánchez Terán
INVESTIGACION DE OPERACIONES II
PROGRAMACION DINAMICA PROBABILISTICA (PDP)
INTRODUCCION
La Programación Dinámica Probabilística difiere de la Determinística en que el estado de la siguiente etapa no está determinado por completo por el estado y la política de decisión de la etapa actual. En su lugar existe una distribución de probabilidad para determinar cuál será el siguiente estado. Sin embargo, esta distribución de probabilidad si queda bien determinada por el estado y la decisión de la etapa actual. Hillier-Lieberman
La Programación Dinámica Probabilística difiere de la Determinística en que los estados y los retornos o retribuciones en cada etapa son probabilísticos. Hamdy Taha Un proceso de decisión de N etapas es probabilístico, si el rendimiento asociado con al menos una decisión del proceso es aleatorio. Esta aleatoriedad generalmente se presenta en una de dos formas:
Los es ta do s son determinados exclusivamente por las decisiones, pero los rendimientos asociados con uno o más de los estados son inciertos. Los rendimientos son determinados exclusivamente por los estados, pero los estados que se presentan a partir de una o más de las decisiones son inciertos. Richard Bronson
Debido a la estructura probabilística, la relación entre las funciones de costo o contribución entre las etapas necesariamente es más complicada que en el caso determinístico. Tomando como referencia el modelo de inventario trabajado en programación dinámica determinística, éste supone, al comienzo del problema, la demanda de cada período como conocida. Sin embargo, en la realidad la demanda del período n es una variable aleatoria cuyo valor no se conoce hasta después de tomar la decisión de producción en el período n . Aún si se conoce el nivel de inventario (estado actual) y la cantidad a producir en el presente período (decisión), el estado del siguiente período y el costo del período actual serán variables aleatorias cuyos valores no se conocen hasta que se conozca la demandadel período actual.
c1
1 *
f n+1(1)
p1 Estado:
sn Decisión
xn
p2
c2
2 *
f n(sn,xn)
f n+1(2)
pm
Sea m el número de estados posibles en la etapa n+1. El sistema cambia al estado i con probabilidad p i ( i=1, 2, … m ) dados el estado sn y la decisión x n en la etapa n . Si el sistema cambia al estado i , C i es la contribución o costo de la etapa n a la función objetivo.
Ing. Manuel Sánchez Terán
cm m f n*+1(m)
1
INVESTIGACION DE OPERACIONES II
PROBLEMA 1 Un proyecto de investigación sobre cierto problema de ingeniería tiene 3 equipos de investigadores que buscan resolver el problema desde 3 puntos de vista diferentes. Se estima que en las circunstancias actuales la probabilidad de que los equipos A, B, C fracasen es de: 0.40, 0.60 y 0.80 respectivamente. Así, la probabilidad de que los 3 equipos fracasen es de: 0.40x0.6x0.8 = 0.192. (Un 19.2%). El objetivo es minimizar la probabilidad de fracaso de los 3 equipos y por ello se asignarán al proyecto 2 nuevos científicos de alto nivel. Según la asignación a los equipos, la probabilidad de fracaso cambia según lo indicado en la tabla siguiente. # de científicos adicionales asignados 0 1 2
A
Probabilidad de fracaso de los equipos B
C
0.40 0.20 0.15
0.60 0.40 0.20
0.80 0.50 0.30
¿Cómo deben asignarse los 2 nuevos científicos para minimizar la probabilidad de que los 3 equipos fracasen?
Solución: Etapas:
N = 3 (tres equipos A, B y C)
Función:
f = minimizar probabilidad de fracaso
Estado:
s = # de científicos disponibles
Variable:
x = # de científicos asignados
Etapa 3 (Equipo C) s3
f 3(s3,x 3 ) = p3 x 3 =0 x 3 =1 x 3 =2
0 1
0.8 -
2
-
0.5
-
Solución óptima f 3* (s3 ) x 3*
-
0.8 0.5
0 1
0.3
0.3
2
Etapa 2 (Equipo B) s2
Solución óptima
f 2 (s2 ,x 2 ) = p2 * f 3(s2 -x 2 ) x 2 =0
x 2 =1
x 2 =2
f 2 * (s2 )
x 2*
0
(0.6)(0.8)=0.48
-
-
0.48
0
1
(0.6)(0.5)=0.30
(0.4)(0.8)=0.32
-
0.30
0
2
(0.6)(0.3)=0.18
(0.4)(0.5)=0.20
(0.2)(0.8)=0.16
0.16
2
Etapa 1 (Equipo A) s1 2
Asignación adicional:
2
x 1 =0 (0.4)(0.16)=0.064
f 1(s1,x 1 ) = p1 * f 2 (s1-x 1 ) x 1 =1 (0.2)(0.3)=0.06
x 1 =2
(0.15)(0.48)=0.072
Solución óptima x 1 1 s1 0.06
1
Equipo A: 1; Equipo B: 0; Equipo C: 1
Ing. Manuel Sánchez Terán
INVESTIGACION DE OPERACIONES II
PROBLEMA 2 Un repartidor compra a una ganadería 6 galones de leche a $1 por galón. Cada galón lo vende a $2 y solamente comercia con 3 clientes. La ganadería está dispuesta a comprar los galones de leche que el repartidor no alcance a vender, pero solamente le pagará la mitad de lo que él pagó al inicio. Desafortunadamente para el repartidor la demanda diaria de cada uno de sus clientes es incierta, es por esto que llevó el registro de sus ventas del año pasado y resumió la información en probabilidades de la siguiente manera:
Demanda diaria (galones)
Probabilidad
1 2 3 1 2 3 1 2 3
Cliente 1
Cliente 2
Cliente 3
0.60 0.00 0.40 0.50 0.10 0.40 0.40 0.30 0.30
Si lo que quiere el repartidor es asignar los 6 galones de leche entre los tres clientes para maximizar los ingresos esperados (ya que el costo siempre será $6); sabiendo además que de los galones de leche enviados a un determinado cliente no se pueden enviar los rechazados luego a otro cliente, utilice la programación dinámica para determinar cómo el repartidor debe asignar los 6 galones de leche entre sus tres clientes.
Solución: La demanda de cualquier cliente nunca es más de tres galones. Etapas: Clientes Estados: Galones de leche disponibles Decisión: ¿Cuántos galones enviar a cada cliente? Variables: x n = Galones enviados al cliente n (no necesariamente el cliente c ogerá todos) d n = Demanda del cliente n (galones comprados por el cliente) Función recursiva: Ingreso esperado obtenido i n (x n )=2d n + 0.5(x n-d ) n f n (s ,x )} ó n ) n = max{2d n + 0.5(x n-d ) n + f n+1(s n+1
f n(s n ,x ) n = max{2d n + 0.5(x n-d ) n + f n+1(s n -x )} n
Tabla de ingresos esperados i n(x) x
Cliente1
Cliente2
Cliente3
0
i1(0)=0
i2(0)=0
i3(0)=0
1
i1(1)=(0.6)2.0+(0.0)2.0+(0.4)2.0=2.00
i2(1)=(0.5)2.0+(0.1)2.0+(0.4)2.0=2.00
i3(1)=(0.4)2.0+(0.3)2.0+(0.3)2.0=2.00
2
i1(2)=(0.6)2.5+(0.0)4.0+(0.4)4.0=3.10
i2(2)=(0.5)2.5+(0.1)4.0+(0.4)4.0=3.25
i3(2)=(0.4)2.5+(0.3)4.0+(0.3)4.0=3.40
3
i1(3)=(0.6)3.0+(0.0)4.5+(0.4)6.0=4.20
i2(3)=(0.5)3.0+(0.1)4.5+(0.4)6.0=4.35
i3(3)=(0.4)3.0+(0.3)4.5+(0.3)6.0=4.35
Etapa 3 Solución óptima
f 3(s3,x 3 )= i 3(x 3 ) x 3 =0 x 3 =1
Ing. Manuel Sánchez Terán
x 3 =2 x 3 =3
*
f 3 (s3 )
x 3
*
0
0
-
-
-
0
0
1
-
2
-
-
2
1
2
-
-
3.4
-
3.4
2
3
-
-
-
4.35
4.35
3
3
INVESTIGACION DE OPERACIONES II
Etapa 2 x 2 =0 3 4
0+4.35=4.35 -
5
-
6
-
f 2( s2 ,x 2 )= i 2( x 2 )+f 3(s2 -x 2 ) x 2 =1 x 2 =2 2+3.4=5.40 2+4.35=6.35
-
x 2 =3
Solución óptima f 2*(s2 ) x 2 *
3.25+2-=5.25 3.25+3.4=6.65
4.35 4.35+2=6.35
5.40 6.65
1 2
3.25+4.35=7.60
4.35+3.4=7.75
7.75
3
-
4.35+4.35=8.70
8.70
3
Etapa 1 s1 6
Solución óptima
f 1(s1,x 1 )= i 1(x 1 )+f 2( s1-x 1 ) x 1 =0
x 1 =1
x 1 =2
x 1 =3
f 1*(s1 )
x 1
0+8.70=8.70
2+7.75=9.75
3.10+6.65=9.75
4.20+5.40=9.60
9.75
1 (no 2)
*
$9.75 es el ingreso esperado (en el cual se consideraron las probabilidades), para determinar la utilidad recuerde que la cantidad de inversión es siempre $6. Asignar:
Cliente1: 1 C l i e n t e 2:3 Cliente3:2
No se incluye 2 en la primera etapa por tener probabilidad = 0
4
Ing. Manuel Sánchez Terán