Ejercicios de programaci´ on on din´amica amica Investigaci´on on Operativa II Diploma Dip lomatura tura en Estad Esta d´ıstica ısti ca Curso 07/08 1. Resuelve aplicando programaci´ programaci´ on on din´ amica amica el problema problem a siguiente: siguie nte: Se trata de asignar asign ar d´ d´ıas de estudio es tudio para preparar los ex´amenes amenes de cuatro cuatro asignatur asignaturas. as. Se dispone de 10 d´ıas para todas ellas, ellas, y estos d´ıas han de repartirse de manera que se optimice la mejora prevista en las calificaciones totales de las mismas. Se ha estimado que para un cierto n´umero umero de d´ıas asignado a cada asignatura se pueden conseguir las mejoras en las notas que se indican en la tabla siguiente: D´ıas 1 2 3 4
Asignatura 1 2 3 4 1 3 1 2 3 4 2 4 4 4 4 5 5 5 4 5
A ninguna asignatura se le asignar´an an m´ as as de cuatro cuatro d´ıas, ıas, y a cada una de ellas se le asignar´ asignar´ a al menos me nos un d´ıa. ıa . Sugerencia: Define como etapas la asignaci´ on de d´ıas de estudio a cada una de las asignaturas. asignaturas. Soluci´ on. on. Siguiendo la sugerencia, supondremos que cada etapa se corresponde a la asignaci´on de
d´ıas a cada una de las asignaturas. El estado del sistema ser´a por tanto el n´umero umer o de d´ıas pendi pe ndientes entes de asignar tras la etapa correspondiente. La funci´ on on de valor ser´a el valor acumulado de las mejoras de calificaciones correspondientes a todas las asignaturas asignadas hasta esa etapa. Comenzaremos por asignar d´ıas ıas a la primera asignatura, despu´ despu´es es a la segunda, segunda, etc. (el orden no debe afectar afectar a la soluci´ soluci´on on optima o´ptima obtenida). Por tanto, el estado en la primera etapa ser´a el n´ umero umero de d´ıas pendientes p endientes de asignar para las asignaturas 2, 3 y 4; el estado en la segunda etapa el n´ umero umero de d´ıas pendientes p endientes de asignar para las asignaturas 3 y 4, etc. Como la funci´on on de valor en el estado de partida (sin asignaci´on) on) vale cero, tendremos: Etapa 1 (Asignaci´on on para la asignatura 1) Esta Estado do Asig Asigna naci cion ones es posib posible less F. valor alor 9 1 0+1= 1 8 2 0+3= 3 7 3 0+4= 4 6 4 0+5= 5 Con estos estos valore valoress podemos pasar a la segunda segunda etapa (aqu´ (aqu´ı las asignacion asignaciones es posibles posibles son el estado estado de la etapa anterior, horas pendientes de asignar, y las horas asignadas en la etapa): Estado 8 7 6 5 4 3 2
Etapa 2 (Asignaci´on on para la asignatura 2) Asignaciones posibles F. valor (9,1) 1+3 =4 (9,2), (8,1) m´ax(1 ax(1 + 4, 4, 3 + 3) = 6 (9,3), (8,2), (7,1) m´ax(1 ax(1 + 4, 4, 3 + 4, 4 , 4 + 3) = 7 (9,4) 9,4),, (8,3) 8,3),, (7,2 (7,2)), (6,1 6,1) m´ ax(1 ax(1 + 5, 5, 3 + 4, 4 , 4 + 4, 4, 5 + 3) = 8 (8,4), (7,3), (6,2) m´ax(3 ax(3 + 5, 5, 4 + 4, 4 , 5 + 4) = 9 (7,4), (6,3) m´ax(4 ax(4 + 5, 5, 5 + 4) = 9 (6,4) 5 + 5 = 10 1
Para la tercera etapa tendremos:
Estado 7 6 5 4 3 2 1
Etapa 3 (Asignaci´on para la asignatura 3) Asignaciones posibles F. valor (8,1) 4+1 =5 (8,2), (7,1) m´ax(4 + 2, 6 + 1) = 7 (8,3), (7,2), (6,1) m´ax(4 + 4, 6 + 2, 7 + 1) = 8 (8,4), (7,3), (6,2), (5,1) m´ax(4 + 4, 6 + 4, 7 + 2, 8 + 1) = 10 (7,4), (6,3), (5,2), (4,1) m´ax(6 + 4, 7 + 4, 8 + 2, 9 + 1) = 11 (6,4), (5,3), (4,2), (3,1) m´ax(7 + 4, 8 + 4, 9 + 2, 9 + 1) = 12 (5,4), (4,3), (3,2), (2,1) m´ax(8 + 4, 9 + 4, 9 + 2, 10 + 1) = 13
Por u ´ ltimo, para la cuarta etapa tendremos
Estado 6 5 4 3 2 1 0
Etapa 4 (Asignaci´on para la asignatura 4) Asignaciones posibles F. valor (7,1) 5+2 =7 (7,2), (6,1) m´ax(5 + 4, 7 + 2) = 9 (7,3), (6,2), (5,1) m´ax(5 + 5, 7 + 4, 8 + 2) = 11 (7,4), (6,3), (5,2), (4,1) m´ax(5 + 5, 7 + 5, 8 + 4, 10 + 2) = 12 (6,4), (5,3), (4,2), (3,1) m´ax(7 + 5, 8 + 5, 10 + 4, 11 + 2) = 14 (5,4), (4,3), (3,2), (2,1) m´ax(8 + 5, 10 + 5, 11 + 4, 12 + 2) = 15 (4,4), (3,3), (2,2), (1,1) m´ ax(10 + 5, 11 + 5, 12 + 4, 13 + 2) = 16
De esta ´ultima tabla se ve que la mejor opci´on es acabar con 0 d´ıas sin asignar, y que las asignaciones ´optimas son las siguientes (todas ellas son equivalentes, y mejoran las calificaciones en 16 puntos): (2, 2, 3, 3),
(3, 1, 3, 3),
(3, 2, 3, 2),
(4, 1, 3, 2) .
2. Un operador tur´ıstico organiza viajes de vacaciones, que incluyen el alquiler de coches. Durante las pr´oximas cinco semanas, y en funci´on de los viajes que ha vendido, esta empresa prevee que debe tener disponibles 8, 6, 10, 7 y 8 coches respectivamente. El alquiler de los coches se subcontrata a una empresa local, que cobra una cantidad fija de 50 euros por autom´ovil por cada nuevo alquiler de un coche, m´as 150 euros por cada semana de alquiler de dicho coche. El operador puede por tanto alquilar coches y asignarlos a los viajes organizados, o mantenerlos sin usar, o bien devolverlos cuando ya no quiera usarlos (aunque quiz´as tenga que volver a alquilarlos m´ as tarde pagando la cantidad fija). ¿Cu´a l es el n´ umero ´optimo de autom´oviles a alquilar y/o devolver en cada semana de las pr´oximas cinco? on del problema de PD son: Soluci´ on. Los elementos de la formulaci´ Etapas: las etapas naturales en el problema son las semanas a considerar t = 1, 2, 3, 4, 5. Estados: el estado xt representa el n´umero total de coches disponibles en una semana determinada. Los valores razonables son los n´ umeros enteros entre 6 y 10. Acciones: la acci´on at representa el n´umero de nuevos coches a alquilar (valor positivo) o el n´ umero de coches a devolver (valor negativo) en cada semana. Consideraremos valores entre −4 y 4. Costes: los costes incurridos en la etapa t vienen dados por 150 euros multiplicados por el n´ umero de autom´oviles disponibles, m´ as 50 euros multiplicados por el n´ umero de nuevos coches alquilados en esa semana (150dt + 50nt ). Din´ amica de estados: si en la etapa t el estado es xt y se toma la acci´on at , el estado en la etapa siguiente es x t+1 = x t + at . Denotamos por V t (xt ) la funci´on de valor o´ptimo en la etapa t. Las relaciones de recurrencia que cumple son: V t (x) = m´ın {ti (xi ) + V t+1 (x − xi )} , t = 1, 2, 3 xi
2
Finalmente, necesitamos indicar los valores finales de la funci´on V . Asumiremos que V 6 (x) = 0 para todo x. Para los valores intermedios de V en las etapas desde la 5 hasta la 1, aplicamos la f´ormula de recurrencia para obtener los valores dados en la tabla siguiente (para ahorrar espacio, los valores est´an dados en decenas de euros): Etapa x/y 6 7 8 9 10 Etapa x/y 6 7 8 9 10 Etapa x/y 6 7 8 9 10 Etapa x/y 6 7 8 9 10 Etapa x/y 6 7 8 9 10
5 -4 – – – – –
-3 – – – – –
-2 – – – – 120
-1 – – – 120 140
0 – – 120 140 160
1 – 125 140 160 –
2 130 145 160 – –
3 150 165 – – –
4 170 – – – –
V 5 (x) 130 125 120 120 120
-4 – – – – –
-3 – – – – 105 + 125
-2 – – – 105 + 125 120 + 120
-1 – – 105 + 125 120 + 120 135 + 120
0 – + + + +
1 + + + + –
125 120 120 120
2 130 + 120 145 + 120 160 + 120 – –
3 150 + 120 165 + 120 – – –
4 170 + 120 – – – –
V 4 (x) 235 230 230 230 230
-4 – – – – –
-3 – – – – –
-2 – – – – –
-1 – – – – –
0 – – – – 150 + 230
1 – – – 155 + 230 –
2 – – 160 + 230 – –
3 – 165 + 230 – – –
4 170 + 230 – – – –
V 3 (x) 400 395 390 385 380
-4 – – – – 90 + 400
-3 – – – 90 + 400 105 + 395
-2 – – 90 + 400 105 + 395 120 + 390
-1 – 90 + 400 105 + 395 120 + 390 135 + 385
0 90 + 400 105 + 395 120 + 390 135 + 385 150 + 380
110 125 140 155
1 + + + + –
395 390 385 380
2 130 + 390 145 + 385 160 + 380 – –
3 150 + 385 165 + 380 – – –
4 170 + 380 – – – –
V 2 (x) 490 490 490 490 490
-4 – – – – –
-3 – – – – –
-2 – – – – 120 + 490
-1 – – – 120 + 490 135 + 490
0 – – 120 + 490 135 + 490 150 + 490
1 – 125 + 490 140 + 385 155 + 490 –
2 130 + 490 145 + 490 160 + 380 – –
3 150 + 490 165 + 490 – – –
4 170 + 490 – – – –
V 1 (x) 620 615 610 610 610
4
105 120 135 150
125 120 120 120
110 125 140 155
3
2
1
Con estos valores podemos obtener la pol´ıtica ´optima partiendo del n´ umero de coches disponibles inicialmente. Por ejemplo, si dicho n´ umero de coches fuese de 7, las mejores decisiones a tomar ser´ıan: Etapa Etapa Etapa Etapa Etapa
1 2 3 4 5
Acci´ on 1 -2 4 -3 1
Estado 8 6 10 7 8
3. Est´as encargado de la gesti´on de un desarrollo de software, que requiere que se completen tres tareas en etapas sucesivas. Dispones de un presupuesto de 45.000 euros que puedes emplear para mejorar tus recursos (personal, equipos, medios) en cada una de las etapas. En funci´on del dinero que inviertas, esperas reducir el tiempo necesario para llevar a cabo cada etapa, de acuerdo con las expresiones siguientes: t1 (x1 ) = 16 − x1 /3, t2 (x2 ) = 12 − x2 /5, t3 (x3 ) = 14 − x3 /3,
0 ≤ x 1 ≤ 30 0 ≤ x 2 ≤ 15 0 ≤ x 3 ≤ 30
donde ti denota el tiempo en semanas necesario para completar cada tarea, i = 1, 2, 3, y xi es la cantidad invertida en cada etapa, medida en miles de euros. Las cantidades no invertidas al final del proceso no tienen valor para el desarrollo. Formula las relaciones de recurrencia y los elementos del problema de programaci´on din´ amica correspondientes. Resuelve el problema de programaci´on din´ amica para el caso en que el dinero disponible deba gastarse en m´ ultiplos de 15.000 euros, esto es, los valores aceptables para el gasto en la primera etapa ser´ıan 0, 15 ´o 30 miles de euros, por ejemplo. Obt´ en a partir de ellas la pol´ıtica que permita un tiempo de desarrollo m´ınimo y el plan de gasto o´ptimo. ¿Existe m´as de una soluci´ on? ¿Cu´ales son las soluciones alternativas? Repite el apartado anterior suponiendo que las cantidades a invertir en cada etapa fuesen valores cualesquiera entre 0 y los m´aximos indicados anteriormente. 3
on de PD son: Soluci´ on. Los elementos de la formulaci´ Etapas: las etapas naturales en el problema son las tareas a completar t = 1, 2, 3. Estados: el estado x t ∈ {0, . . . , 45} representa el presupuesto restante al comenzar la etapa t. Acciones: la acci´on at representa la parte del presupuesto disponible invertida en la etapa t. Acciones factibles: A1 (x1 ) = {0, . . . , m´ın(30, x1 )}, A2 (x2 ) = {0, . . . , m´ın(15, x2 )}, A3 (x3 ) = {0, . . . , m´ın(30, x3 )}. Recompensas: la recompensa recibida en la etapa t es Rt (at ) = −st (at ) (la duraci´o n de la tarea correspondiente, cambiada de signo). Din´ amica de estados: si en la etapa t el estado es xt y se toma la acci´on at , el estado en la etapa siguiente es x t+1 = x t − at . Denotamos por V t (xt ) la funci´on de valor o´ptimo en la etapa t. Las relaciones de recurrencia que cumple son: V t (x) = m´ın {ti (xi ) + V t+1 (x − xi )} , t = 1, 2, 3 xi
con V 4 (x) = 0 para todo x. Para x 1 ∈ {0, . . . , 45}: V 1 (x1 ) = m´ axa1 ∈A1 (x1 ) a1 /3 − 16 + V 2 (x1 − a1 ) V 2 (x2 ) = m´ axa2 ∈A2 (x2 ) a2 /5 − 12 + V 3 (x2 − a2 ) V 3 (x3 ) = m´ axa3 ∈A3 (x3 ) a3 /3 − 14. En el caso discreto obtenemos los valores indicados en la tabla siguiente: Etapa 3 x 0 0 14 15 14 30 14 45 14 Etapa 2 0 x 0 12 + 14 15 12 + 9 30 12 + 4 45 12 + 4 Etapa 1 x 0 0 16 + 26 15 16 + 21 30 16 + 16 45 16 + 13
15 – 9
30 – –
9 9
4 4
V 3 (x) 14 9 4 4
15 – 9 + 14 9+9
V 2 (x) 26 21 16 13
9 + 4
15 – 11 + 26 11 + 21 11 + 16
30 – – 6 + 26 6 + 21
V 1 (x) 42 37 32 27
La pol´ıtica o´ptima viene dada por los valores en negrita, y un plan de inversiones ´optimo es invertir 15.000 euros en la primera etapa, nada en la segunda etapa y 30.000 euros en la ´ultima etapa. El otro plan alternativo es el correspondiente a invertir 30.000 euros en la primera etapa y 15.000 en la tercera. Para el caso en que se puede impartir cualquier cantidad dentro de los l´ımites indicados, tenemos para la tercera etapa (dado que x 3 ≤ 30) V 3 (x) = x3 (x) =
m´ın
0≤x3 ≤m´ın(30,x)
x
30
{14 − x3 /3} =
si 0 ≤ x < 30 si 30 ≤ x 4
14 − x/3 4
si 0 ≤ x < 30 si 30 ≤ x
Para la segunda etapa, tenemos que V 2 (x) =
m´ın
{12 − x2 /5 + V 3 (x − x2 )}
0≤x2 ≤m´ın(15,x)
= m´ın{(16 − x2 /5)I {x−x2 ≥30} , (12 − x2 /5 + 14 − (x − x2 )/3)I {x−x2 <30} } = x2 (x) =
26 − x/3 si 0 ≤ x < 30 x ≤ 45 22 0− x/5 si si0 ≤30 x ≤< 30 x − 30
si 30 ≤ x ≤ 45
Por u ´ ltimo, para la primera etapa, V 1 (x) =
m´ın
{16 − x1 /3 + V 2 (x − x1 )}
0≤x1 ≤m´ın(30,x)
=
m´ın{(16 − x1 /3 + 22 − (x − x1 )/5)I {x−x1 ≥30} , (16 − x1 /3 + 26 − (x − x1 )/3)I {x−x1 <30} } = 42 − x/3 0 ≤ x ≤ 45 [0, x] si 0 ≤ x < 30 x1 (x) = [x − 30, x − 15] si 30 ≤ x ≤ 45
La notaci´on [0, x] indica que cualquier valor del intervalo es aceptable. 4. Una empresa de alquiler de autom´ oviles se propone planificar su pol´ıtica de reemplazamientos para los pr´oximos 3 a˜ nos. La adquisici´ on de un coche nuevo le cuesta a la empresa 9.000 euros. Durante su vida u ´ til, los coches incurren costes de mantenimiento que aumentan con su antig¨uedad, mientras que su valor de venta como coches usados disminuye con su edad. Un coche nuevo no incurre costes de mantenimiento. Para cada coche, la empresa toma decisiones el d´ıa 1 de enero de cada a˜no: vender el coche por su valor como coche usado y adquirir uno nuevo, o continuar utiliz´andolo durante un a˜no m´ as, incurriendo los costes de mantenimiento correspondientes. Los gastos de mantenimiento y el valor de venta de un coche usado, en funci´on de su antig¨ uedad en a˜ nos, se muestran en la siguiente tabla: antig¨ uedad (a˜ nos) 1 2 3 4
coste de mantenimiento (euros) 1.800 2.100 2.400 2.700
valor de venta (euros) 6.000 4.000 3.000 2.250
amico el problema de planificaci´on o´ptima para los pr´oximos a ) Formula como un programa din´ 3 a˜nos. b ) Formula las relaciones de recurrencia y los elementos del problema de programaci´on din´ amica
correspondientes. c ) Resuelve el problema. din´ amica, y describe la pol´ıtica ´optima obtenida. d ) ¿Debe la empresa reemplazar un coche que tiene inicialmente 4 a˜nos? ¿Y uno que tiene 3? Soluci´ on. Al igual que en el caso anterior, comenzamos por identificar las etapas, que se corre-
sponden con los a˜ nos transcurridos, as´ı como nuestras variables de estado xt y de decisi´on y t , que en este caso ser´an la edad del autom´ovil y la decisi´on de renovar o no hacerlo (1 ´o 0) al inicio de cada a˜ no. La funci´ on objetivo vendr´a dada por los costes de mantenimiento y de compra, as´ı como el valor de venta del autom´ovil, y tendr´a la forma siguiente: m´ın
c
m (xt )
+ (C − R(xt−1 + 1))yt ,
t
donde c m es la funci´on que da los costes de mantenimiento, C es el coste de compra y R es el valor de venta del autom´ovil.
5
La ley de movimiento vendr´a dada por xt =
x
t−1
+1
0
si yt = 0 si yt = 1
Definimos la funci´on V t (xt−1 ) como el menor coste de operar el autom´ovil a partir del periodo t si la antig¨ uedad del mismo (antes de la decisi´on de renovaci´on) es x t−1 . Tomamos tambi´en V 4 (x3 ) = 0. Se te recomienda que rehagas los c´alculos por ejemplo si definimos V 4 (x3 ) = − R(x3 ). Obs´ervese en relaci´ on con la notaci´on que asociamos el sub´ındice de la variable de estado al periodo al final del cual se toma la decisi´on de renovaci´on o no renovaci´on. El estado inicial ser´a por tanto el dado por x0 . La relaci´on de recurrencia que define V t ser´a la dada por V t (xt−1 ) = m´ın (cm (xt ) + (C − R(xt−1 + 1))yt + V t+1 (xt )) . Llevamos a cabo a continuaci´on los c´alculos de la relaci´on anterior para cada periodo. Etapa final. V 4 (x3 ) = 0
∀x3 .
Tercer a˜ no. V 3 (x2 ) = m´ın(cm (x2 + 1) + V 4 (x2 + 1), C − R(x2 + 1) + V 4 (0))
m´ın(1800, 9000 − 6000) = 1800 m´ın(2100, 9000 − 4000) = 2100 = 9000 − 3000) = 2400 m´ın(2400, 0 si x9000 =−02250 = 6750 0 si x = 1 y = = 2 01 si x si x = 3
si x 2 = si x 2 = si x 2 = si x 2 =
0 1 2 3
2 2
3
2 2
Segundo a˜ no.
V 2 (x1 ) = m´ın(cm (x1 + 1) + V 3 (x1 + 1), C − R(x1 + 1) + V 3 (0))
m´ın(1800 + 2100, 9000 − 6000 + 1800) = 3900 m´ın(2100 + 2400, 9000 − 4000 + 1800) = 4500 = + 6750, 9000 − 3000 + 1800) = 7800 m´ın(24009000 0 si x = 0 − 2250 + 1800 = 8550 0 si x = 1 y = = 2 11 si x si x = 3
si x 1 = si x 1 = si x 1 = si x 1 =
0 1 2 3
1
2
1 1 1
Primer a˜ no.
V 1 (x0 ) = m´ın(cm (x0 + 1) + V 2 (x0 + 1), C − R(x0 + 1) + V 2 (0))
m´ın(1800 + 4500, 9000 − 6000 + 3900) = 6300 m´ın(2100 + 7800, 9000 − 4000 + 3900) = 8900 = + 8550, 9000 − 3000 + 3900) = 9900 m´ın(24009000 0 si x = 0 − 2250 + 3900 = 10650 1 si x = 1 y = = 2 11 si x si x = 3 0
1
0 0 0
6
si x 0 = si x 0 = si x 0 = si x 0 =
0 1 2 3
En los c´alculos anteriores, y debido a la falta de datos, hemos supuesto que un autom´ovil con xt = 3 se renovaba obligatoriamente, ya que no disponemos de datos sobre costes o valores para autom´ oviles de m´as de cuatro a˜ nos de antig¨ uedad. De los datos anteriores, si el autom´ovil tiene una edad inicial de 4 a˜nos (x0 = 3), se debe renovar al principio del periodo. Si tiene una edad inicial de 3 a˜nos (x0 = 2) tambi´en debe ser renovado. En ambos casos y 1 = 1. 5. Tienes que decidir cu´ ando y cu´anto producir de un determinado producto, para hacer frente a la demanda con coste m´ınimo. La demanda prevista para los pr´ oximos 4 meses se indica en la tabla siguiente: Mes Demanda
1 2
2 1
3 2
4 1
El coste de almacenamiento es de 600 Pta./unidad.mes, y el coste de producci´on est´a compuesto por un coste fijo de 3500 Pta. cada vez que se fabrica (independiente de la cantidad fabricada), y un coste variable de 1500 Pta./unidad. Aplica Programaci´on Din´ amica para obtener el plan de producci´on (cantidades y meses) ´optimo, suponiendo que al comienzo del primer mes no dispones de ninguna unidad de producto en inventario, y que no dispones de espacio para llevar un inventario de m´as de dos unidades en ning´ un periodo. El valor de las unidades que est´en en inventario al final del u ´ ltimo periodo es de 2000 Pta./unidad. ¿Cu´ al hubiera sido la pol´ıtica o´ptima si el inventario inicial hubiese sido de dos unidades? Comenzamos por identificar las etapas del problema, correspondientes a cada uno de los meses considerados. Igualmente, identificamos el estado en cada etapa como la cantidad de producto que llevamos en inventario al comienzo de cada mes. La variable de control ser´a la cantidad de producto a fabricar en cada periodo de tiempo. Soluci´ on.
La funci´ on de valor ser´a el coste incurrido hasta el periodo considerado, en funci´on del estado considerado. Supondremos que no es admisible no hacer frente a la demanda, por lo que obligaremos a que la producci´on en cualquier periodo sea al menos la necesaria para hacer frente a dicha demanda. Iniciamos los c´alculos al final del u ´ ltimo periodo (inicio del periodo 5). En ese momento tenemos un valor (en funci´on del n´ umero de unidades en inventario) dado en la tabla siguiente: Estado Valor
Periodo 5 0 1 0 −2000
2 −4000
Para el periodo anterior tendremos que tomar la decisi´on de cu´antas unidades producimos. Supongamos que estamos en el estado 0 (ninguna unidad en inventario al comienzo del mes 4). Como la demanda es de una unidad, al menos deberemos fabricar una unidad (con lo que tendr´ıamos 0 unidades al comienzo del mes 5), y como m´aximo podemos fabricar 4 unidades (3 unidades en inventario al comienzo del mes 5). Adem´as, debemos tener en cuenta los costes de llevar el inventario de un periodo al siguiente. La funci´on de valor correspondiente se obtendr´a como J 4 (0) = m´ın(3500 + 1500 + J 5 (0), 3500+21500+600+ J 5 (1), 3500+31500+2600+ J 5 (2)) = 5000. Haciendo c´alculos similares para el estado 1 tendremos que J 4 (1) = m´ın(0 + J 5 (0), 3500 + 1500 + 600 + J 5 (1), 3500 + 2 1500 + 2 600 + J 5 (2)) = 0. Y en general para todos los valores del estado, Estado F. Valor
Periodo 4 0 1 5000 (1) 0 (0)
2 −1400 (0)
Entre par´entesis se indica la cantidad ´optima a producir. Repitiendo estos c´alculos para los periodos anteriores tenemos 7
Estado F. Valor 3 F. Valor 2 F. Valor 1
0 8600 (3) 13600 (1) 17200 (3)
1 7100 (2) 8600 (0) 15700 (2)
2 5000 (0) 7700 (0) 13600 (0)
De esta tabla tenemos que si inicialmente el inventario es igual a cero, la pol´ıtica ´optima consistir´a en fabricar 3 unidades en el primer periodo (estado 0), 0 unidades en el segundo periodo (estado 1), 3 unidades en el tercer periodo (estado 0) y cero unidades en el cuarto periodo (estado 1). Si inicialmente hubiesemos tenido dos unidades, entonces la pol´ıtica ´optima hubiese consistido en fabricar cero unidades el primer periodo (estado 2), una unidad el segundo periodo (estado 1), tres unidades el tercer periodo (estado 0) y cero unidades en el cuarto periodo (estado 1). 6. Un dispositivo consta de 3 etapas conectadas en serie. En cada etapa podemos tener un n´umero de componentes variable m i , y la probabilidad de fallo en cada una de las etapas en funci´ on de dicho n´ umero de componentes viene dada por las expresiones siguientes: p1 = 0,5m1 ,
p2 = 0,75m2 ,
p3 = 0,6m3 .
Los ingresos que se obtienen de la operaci´on del sistema dependen de que los equipos est´en funcionando correctamente o est´ en averiados. Dichos ingresos se dan en la tabla siguiente: Estado F A
1 1500 −5000
Etapa 2 3000 −8000
3 2500 −6000
Por u ´ ltimo, el coste de cada componente es de: Etapa Coste
1 100
2 150
3 75
Si se dispone de un presupuesto de 750 u.m., encontrar la manera de invertir este presupuesto en componentes de forma que se maximicen los ingresos esperados. Sugerencia: Incluye en el estado informaci´ on sobre el dinero que no te has gastado todav´ıa, y define las etapas de programaci´ on din´ amica como decisiones de gasto en componentes de cada etapa. Soluci´ on. De nuevo siguiendo la sugerencia, y de manera similar al primer problema, tomamos co-
mo estado del sistema el dinero que nos queda pendiente de gastar despu´ es de comprar componentes para cada etapa. Comenzaremos por la primera etapa, luego estudiaremos la segunda etapa, y por u ´ ltimo consideraremos la tercera etapa. Supondremos que en cada etapa tendremos al menos un componente (se podr´ıa calcular un coste aun no teniendo ning´un componente, pero no parece muy razonable tener una etapa que falle con seguridad). La funci´on de valor ser´a el beneficio esperado, teniendo en cuenta la probabilidad de fallo. Su valor de partida ser´a cero (no hay beneficio si no tenemos componentes). Para la primera etapa tendremos:
Estado 650 550 450 350 250
Etapa 1 (Compra de componentes para la etapa 1) Componentes Prob. de fallo F. valor 1 0,5 −100 + 0,5 × 1500 + 0,5 × (−5000) = − 1850 2 0,25 −200 + 0,75 × 1500 + 0,25 × (−5000) = −325 3 0,125 −300 + 0,875 × 1500 + 0,125 × (−5000) = 387,5 4 0,0625 −400 + 0,9375 × 1500 + 0,0625 × (−5000) = 693,8 5 0,03125 −500 + 0,96875 × 1500 + 0,03125 × (−5000) = 796,8
Observese que no calculamos valores del dinero restante menores de 250 porque queremos comprar al menos uno de los dos tipos de componentes que nos quedan. Para la etapa siguiente obtenemos
8
Estado 500 400 350 300 250 200
Etapa 2 (Compra de componentes para la etapa 2) Componentes Prob. de fallo F. valor −1850 − 150 + 0 25 × 3000 + 0 75 × (−5000) = −5000 (650,1) 0 75 −325 − 150 + 0 25 × 3000 + 0 75 × (−5000) = −3425 (550,1) 0 75 (650,2) 0 562 −1850 − 300 + 0 438 × 3000 + 0 562 × (−5000) = −3650 (450,1) 0 75 387 5 − 150 + 0 25 × 3000 + 0 75 × (−5000) = −2762 5 (550,2) 0 562 −325 − 300 + 0 438 × 3000 + 0 562 × (−5000) = −2125 (350,1), (650,3) 0 75 0 422 m´ ax(693 75 − 150 + 0 25 × 3000 + 0 75 × (−5000) −1850 − 450 + 0 578 × 3000 + 0 422 × (−5000)) = −2456 3 (450,2) 0 562 387 5 − 300 + 0 438 × 3000 + 0 562 × (−5000) = −1412 5 (250,1), (550,3) 0 75 0 422 m´ ax(796 8275 − 150 + 0 25 × 3000 + 0 75 × (−5000) −325 − 450 + 0 578 × 3000 + 0 422 × (−5000)) = −1250 ,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
150 100
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
Para la u ´ ltima etapa tendremos los valores siguientes: Etapa 3 (Compra de componentes para la etapa 3) Estado Componentes F. valor 425 (500,1) -7675 350 (500,2) -5710 325 (400,1) -6100 275 (500,3), (350,1) -4561 250 (400,2) -4135 225 (300,1) -5437.5 200 (500,4), (350,2) -3901.6 175 (400,3), (250,1) -2986 150 (300,2) -3472.5 125 (500,5), (350,3), (200,1) -3211 100 (400,4), (250,2) -2327.6 75 (300,3), (150,1) -2323.5 50 (500,6), (350,4), (200,2) -2551.6 25 (400,5), (250,3), (100,1) -1686 0 (300,4), (150,2) -1664.1 Realizando los c´alculos para estos estados se llega a que el valor ´optimo es el correspondiente al estado final 0 (algo razonable), y que ese estado se alcanza seleccionando 3 componentes para la primera etapa, 1 componente para la segunda etapa y 4 componentes para la tercera etapa.
9
EJEMPLO
Figura 1: EJEMPLO: La diligencia
10