Investigación de Operaciones II Teoría de juegos 1.
MARCO GENERAL
1.1. Introducción Son situaciones de decisión en la que dos oponentes inteligentes con objetivos conflictivos (si suman 0) compiten hasta superar al otro. En un combate, cada uno de los jugadores (oponentes) tiene una cantidad de alternativas o estrategias (finita o infinita). De acuerdo a cada estrategia, está la retribución que un jugador recibe del otro. 1.1 Marco conceptual Valor de juego juego es el pago que un jugador tiene garantizado que puede recibir de un juego si toma una decisión racional, independientemente de las decisiones de los demás jugadores1. Se dice que se trata de un juego un juego justo justo cuando cuando el juego tiene valor 0. Punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. http://teoriadejuegosblog.blogspot.com.co/p/punto-desilla.html Estrategia Estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a cada circunstancia posible en cada etapa del juego.
Estrategia dominante dominante es aquella que es preferida por un jugador por sobre las demás estrategias que tiene.
Estrategia pura es cuando ambos jugadores coinciden en la misma estrategia, es decir, el juego tiene una solución estable.
2. DESARROLLO CONCEPTUAL 2.1. Formulación con 2 jugadores y suma 0 Esta teoría tiene que ver con situaciones de decisión en la que dos oponentes inteligentes con objetivos conflictivos (en caso de suma cero) compiten intensamente para superar al otro. En un conflicto, cada uno de los dos jugadores (oponentes) tiene una cantidad (finita o infinita) de alternativas o estrategias. Asociada con cada par de estrategias está la retribución que un jugador recibe del otro. Tal situación se conoce como juego de suma cero entre dos personas porque la ganancia de un jugador es igual a la pérdida del otro. Esto significa que podemos representar el juego en función de la retribución que recibe un jugador. Designando los dos jugadores A y B con m y n estrategias, el juego se presenta usualmente en función de la matriz de retribuciones que recibe el jugador A como
1 Tomado de “valor de juego” (2011) Tomado de http://teoriadejuegosblog.blogspot http://teoriadejuegosblog.blogspot.com.co/p/valor-del-jue .com.co/p/valor-del-juego.html go.html
....
Investigación de Operaciones II Teoría de juegos La representación indica que si A utiliza la estrategia i y B utiliza la estrategia j, la retribución para A es aij, y la retribución para B es 2aij. Criterio minimax y maximin
En el criterio criterio minimax, se deben identificar los los valores mayores de cada columna y seleccionar el menor pago. En el criterio criterio maximax, se deben identificar los valores menores de cada fila y luego seleccionar el mayor pago.
Ejemplo 1.1 Dos 1.1 Dos jugadores, A y B, juegan a tirar la moneda. Cada jugador, sin saberlo el otro, escoge cara (H ) o cruz (T ). ). Ambos jugadores revelan sus elecciones al mismo tiempo. Si coinciden (HH o TT ), ), el jugador A recibe $1 de B. De lo contrario, A le paga $1a B. La siguiente matriz de retribuciones para el jugador A da los valores de fila min y columna máx. correspondientes a las estrategias de A y B, respectivamente. BH
BT
Fila min
AH
1
-1
-1
AT Columna Máx.
-1
1
-1
1
1
Los valores maximin y minimax de los juegos son -$1 y $1, respectivamente, y el juego no tiene una estrategia pura porque los dos valores no son iguales. Si el jugador A selecciona A H, el
jugador B puede seleccionar B T para recibir $1 de A. Si es así, A puede cambiar a la estrategia AT para invertir el resultado al recibir $1 de B. De acuerdo al cambio de estrategia, cuando es pura no es aceptable, lo que se requieres es que ambos jugadores combinen al azar sus estrategias puras respectivas. El valor óptimo del juego ocurrirá entre los valores maximin y minimin del juego Valor maximin (menor) ≤ Valor del juego ≤ Valor minimax (mayor). (mayor). 2.2. Formulación estrategias mixtas Cuando un juego no tiene punto silla, se aconseja a cada jugador asignar una distribución de probabilidad sobre su conjunto de estrategias, y luego determinar cuál de ellas es la que se utilizara. Para expresar esto de manera matemática, sea:
x Probabilidad de que el jugador jugador use la estrategia i (i,,,m) i,,,m). Probabilidad de que el jugador use la estrategia j(j (j,,,n) j,,,n). Donde m y n son los números respectivos de estrategias disponibles. Como estos valores son probabilidades, tendrán que ser no negativos y sumar 1.
∑ ∑ = =
Investigación de Operaciones II Teoría de juegos
Donde representa el pago del jugador 1 si usa la estrategia pura i y el pago del j ugador 2 si usa la estrategia pura j. En el caso de las estrategias mixtas, el criterio minimax sostiene que un jugador debe elegir la estrategia mixta que minimice la máxima pérdida que espera para sí mismo y el criterio maximin es maximizar el pago esperado mínimo para el jugador.
Lo ideal en los juegos con estrategias mixtas es que la solución sea estable.
para que
2.2.1. Solución con programación lineal Cualquier juego de estrategias mixtas puede resolverse, de forma más sencilla, si se transforma a un problema de programación lineal. Primero, debe considerarse como se encuentra la estrategia mixta del jugador 1, es decir, su pago esperado y cuándo la estrategia es óptima. Dicha desigualdad, debe cumplirse para cada una de las estrategias puras del jugador 2; quiere decir que, al sustituirse los valores de y j en la desigualdad, implicará a ese conjunto de n desigualdades, y, a su vez, ese conjunto de n desigualdades implicará la desigualdad original. Como la implicación va en ambas direcciones, se concluye que imponer dicho conjunto de n desigualdades lineales, es igual a requerir que la desigualdad original se cumpla para todas las estrategias (y1, y2, y3,…, yn); pero estas n desigualdades son
restricciones válidas en programación lineal. Es por eso que cualquier solución (x1, x2, x3,…, xm) que satisfaga el conjunto completo de restricciones de programación lineal es la estrategia mixta óptima deseada. Queda así entonces reducido el problema de encontrar una solución mixta óptima a encontrar una solución factible para un problema de programación lineal. Para esto, cabe resaltar que, como se desconoce v y no se cuenta con una función objetivo, la forma de solucionarlo es sustituyendo la constante desconocida v por la variable xm+1, y después maximizarla; así, xm+1 será igual a v en la solución óptima del problema de programación lineal. Se concluye entonces que, el jugador 1 encontrará su estrategia mixta óptima al emplear el método Simplex para resolver el problema de programación lineal. Para el jugador 2, este puede encontrar su estrategia óptima mixta si reescribe la matriz de pagos como los pagos a sí mismo en lugar de al jugador 1, y luego realizando lo mencionado anteriormente; pero, en general, siempre se pueden encontrar las estrategias mixtas de ambos jugadores con solo elegir uno de los modelos y usar el método simplex para obtener una solución óptima y una solución óptima dual. En dado caso que x m+1 y y n+1 no estés restringidas en signo en sus formulaciones de programación lineal, es decir, v < 0, debe hacerse un ajuste. Una de las más utilizadas es agregar una constante fija grande a todos los elementos de la matriz de pagos, para que así el nuevo valor del juego sea positivo.
Investigación Investigación de Operaciones II Teoría de juegos
Programa lineal del jugador B
+3 + + 3 ≥ 0 + − 4 + ≥ 0 +5 + 6 − ≥ 0 + +
Ejemplo 1.2.1: El valor del juego v , queda entre -2 y 2 B1
B2
B3
Fila min
A1
3
-1
-3
-3
A2
-2
4
-1
-2
-5
-6
2
-6
3
4
2
A3 Columna máx.
La solución da y 1 =0.32, y 2 2= 0.08, y 3= 0.60, y v= -0.91. Programa lineal del jugador A
−3 + + 5 ≤ 0 + − 4 + 6 ≤ 0 +3 + − ≤ 0 + + ≤ 0 , , ≥ 0 Solución óptima es x1 =0.39, x2 =0.31, x3= 0.29, y v =-0.91
3.
EJERCICIOS
1. 1. Dos compañías promueven dos productos competidores. En la actualidad, cada producto controla 50% del mercado. Debido a mejoras recientes en los dos productos, cada compañía planea lanzar una campaña publicitaria. Si ninguna de las dos compañías se anuncia, continuarán iguales las partes del mercado. Si alguna de las compañías lanza una campaña más agresiva, la otra compañía con toda certeza perderá un porcentaje proporcional de sus clientes. Una encuesta del mercado muestra que se puede llegar a 50% de los clientes potenciales por medio de la televisión, a 30% por medio de periódicos, y a 20% por medio de la radio. (a) (a) Formule el problema como un juego de suma cero entre dos personas, y determine el medio publicitario para cada compañía.
Investigación Investigación de Operaciones II Teoría de juegos
c)
(b) Determine (b) Determine un intervalo para el valor del juego. ¿Puede operar cada compañía con una estrategia pura única? 2. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A. Cada juego tiene una solución de estrategia pura. En cada caso, determine las estrategias que definan el punto de silla y el valor del juego. B1 B2 B3 B4 b) a) B1 B2 B3 B4 A1 B1 4 B2 -4 B3 -5 B4 6 A2 4 -3 -4-4 -5-9 6 -2 A1 8 6 2 8 A1 A3 -3 6 -4 7 -9-8 -2-9 A2 8 9 4 5 A2 A4 6 7 7 3 -8-9 -9 5 A3 7 5 3 5 A3 A4 7 3 -9 5
3. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A. Especifique el intervalo del valor del juego en cada caso. a)
A1 A2 A3 A4
B1 1 2 -5 7
B2 9 3 -2 4
B3 B4 6 0 8 4 10 -3 -2 -5
A1 A2 A3
B1 3 5 4
B2 6 2 2
d)
B3 1 3 -5
A1 A2 A3
B1 3 4 6
B2 7 8 -9
B3 B4 1 3 0 -6 -2 4
4. Considere el siguiente juego de suma cero entre dos personas: B1
B2
B3
A1
5
50
50
A2
1
1
1
A3
10
1
10
(a) Compruebe (a) Compruebe que las estrategias para A y para B son óptimas, y determine el valor del juego. (b) Demuestre (b) Demuestre que el valor óptimo del juego es igual a:
∑∑
b)
A1 A2 A3 A4
B1 -1 -2 5
B2 9 10 3 -2
B3 6 4 0 8
B4 8 6 7 4
= =
5. 5. El sindicato y la administración de una compañía negocian el nuevo contrato colectivo. Por ahora las negociaciones están congeladas, pues la empresa ha hecho una oferta “fi “ final” nal” de un aumento salarial de $1.10 por hora y el sindicato una demanda “final” final” de un aumento de $1.60 por hora. Ambas partes han acordado que un árbitro imparcial establezca el aumento en alguna cantidad entre $1.10 por hora y $1.60 por hora (inclusive). El arbitraje ha pedido a cada parte que le presente una propuesta confidencial de un aumento salarial económicamente razonable y
Investigación de Operaciones II Teoría de juegos justo (redondeado a los diez centavos más cercanos). Por experiencias anteriores, ambas partes saben que por lo general el árbitro acepta la propuesta del lado que cede más en su cifra final. Si ningún lado cambia su cantidad final o si ambos ceden en la misma cantidad, el arbitraje suele establecer una cifra a la mitad ($1.35 en este caso). Ahora, cada parte necesita determinar qué aumento proponer para obtener un beneficio máximo. máximo. Formule este problema como un juego de dos personas y suma cero 6. Considere el siguiente juego de mesa entre dos jugadores. Un árbitro tira una moneda al aire, anota si cae cara o cruz y la muestra sólo al jugador uno. Este jugador puede: pasar y pagar 5 dólares al jugador dos, o apostar. Si el jugador uno pasa, el juego se termina, pero si apuesta, el juego sigue y el jugador dos puede: pasar y pagar 5 dólares al jugador uno, o apostar. Si el jugador dos apuesta, el árbitro le muestra la moneda; si es cara, el jugador jugador dos paga 10 dólares al jugador uno; si es cruz, el jugador dos recibe 10 dólares del jugador uno. (a) Proporcione (a) Proporcione las estrategias puras de cada jugador. (Sugerencia: El jugador 1 tendrá cuatro estrategias puras que especifican cómo respondería a cada uno de los dos resultados que le muestra el árbitro; el jugador 2 tendrá dos estrategias puras que especifican cómo respondería si el jugador 1 apuesta.)
(b) Desarrolle la matriz de pagos de este juego con valores esperados de los elementos, cuando sea necesario. Identifique y elimine las estrategias dominadas. dominadas.
(c) Muestre que ninguno de los elementos de la matriz de pagos que se obtuvo son punto silla. Explique por qué cualquier elección ja de una estrategia pura de cada jugador tiene que ser una solución inestable, por lo que, en su lugar, deben usarse estrategias mixtas. 7. Robín viaja entre dos ciudades y puede utilizar dos rutas. La ruta A es una carretera rápida de cuatro carriles, y la ruta B es una larga carretera sinuosa. Robín maneja “súper rápido”. La patrulla de caminos cuenta con una fuerza policial limitada. Si se asignara toda la fuerza a la ruta por la que maneja Robín, con toda certeza recibiría una multa de $100 por exceso de velocidad. Si la fuerza se reparte 50-50 entre las dos rutas, hay 50% de probabilidades de que reciba una multa de $100 en la ruta A, y sólo 30% de que reciba la misma multa en la ruta B. Desarrolle una estrategia tanto para Robín como para la patrulla de caminos. 8. En un paseo campestre, 2 equipos de dos personas personas juegan a las escondidas. Hay cuatro escondites (A, B, C y D) y los dos miembros del equipo que se esconden pueden hacerlo por separado en dos de los cuatro escondites. El otro equipo puede entonces buscar en los otros dos escondites restantes. El equipo que busca obtiene un punto si encuentra a los dos miembros del equipo que se esconde; si no encuentra a los dos pierde un punto. De lo contrario, el resultado es un empate. *(a) Desarrolle *(a) Desarrolle el problema como un juego de suma cero entre dos personas. (b) Determine (b) Determine la estrategia óptima y el valor del juego
Investigación de Operaciones II Teoría de juegos 9. La U de A y la U de D están ideando sus estrategias para el juego de básquetbol colegial varonil del campeonato de 1994. Valorando las fuerzas de sus respectivas “bancas”, cada entrenador aparece con cuatro estrategias para rotar a los jugadores durante el encuentro. La habilidad de cada equipo de encestar canastas de 2 puntos, 3 puntos y tiros libres es la clave para determinar el marcador final del juego. La siguiente tabla resume los puntos netos que la U de A anotará por posesión como una función de las diferentes estrategias disponibles para cada equipo:
U de U de D1 D2
U de D3
U de D4
U de A1
3
-2
1
2
U de A2
2
3
-3
0
U de A3
-1
2
-2
2
U de A4
-1
-2
4
1
(a) (a) Resuelva el juego mediante programación lineal, y determine una estrategia para el juego de campeonato. (b) (b) Basado en la información dada, ¿cuál de los dos equipos se perfila para ganar el campeonato? (c) Suponga (c) Suponga que todo el juego constará de 60 posesiones (30 para cada equipo). Pronostique el número de puntos esperado con el cual se ganará el campeonato.
10. El 10. El ejército del coronel Blotto está peleando por el control de dos posiciones estratégicas. Blotto dispone de dos regimientos y el enemigo de tres. Una posición caerá ante el ejército con más regimientos. De lo contrario, el resultado de la batalla es un empate. (a) (a) Formule el problema como un juego de suma cero entre dos personas y resuélvalo mediante programación lineal. (b) ¿Cuál (b) ¿Cuál ejército ganará la batalla?
11. 11. En el juego Morra de dos dedos entre dos jugadores, cada jugador muestra uno o dos dedos, y al mismo tiempo adivina cuántos dedos mostrará el oponente. El jugador que adivina correctamente gana una cantidad igual al número de dedos mostrados. De lo contrario, el juego es un empate. Desarrolle el problema como un juego de suma cero entre dos personas, y resuélvalo mediante programación lineal.
12. 12. Considere un juego de mesa entre dos personas. Cada una comienza con tres fichas: una roja, una blanca y una azul. Cada ficha se puede usar una sola vez. Para comenzar, cada jugador elige una de sus fichas y la coloca sobre la mesa, tapada; después ambos la destapan y determinan el pago para el ganador. En particular, si ambos tienen el mismo color, es un empate; de otra manera, la tabla que sigue indica el ganador y el pago que debe recibir del otro jugador. En seguida, cada jugador elige una de sus dos chas restantes y se repite el proceso con un nuevo pago de
acuerdo con la tabla. Por último, cada jugador juega la ficha que le queda y se determina el tercer pago, que es el final.
Ficha ganadora
Pago ($)
Rojo gana a blanco
90
Blanco gana a azul
70
Azul gana a rojo
50
Fichas iguales
0
Formule este problema como un juego de suma cero entre dos personas, e identifique la forma de las estrategias y pagos.