Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 1.
ENUNCIADO
[Usando la teoría de esta sección] Determine el valor y las estrategias óptimas del juego de dos personas con suma cero de la tabla 15. Tabla 15 2 0
1 2
3 3
SOLUCIÓN Para el jugador de columnas es claro que la tercera estrategia está dominada por las otras dos. Por ello, el juego queda reducido al de matriz: 1 2
2 0
o también
a11 a21
a12 a22
Aplicando Aplicando las fórmulas fórmulas para la resolución de este tipo de problemas de juegos juegos matriciales matriciales de suma cero se obtiene: δ =
*
x1 =
a22 − a21 δ
=
0 −2
−3 y
a11 + a22 − a12 − a21 = 1 + 0 –2 –2 = -3
=
v* =
2 3
y1* =
,
a11a 22 − a12 a 21 δ
=
1.0 - 2.2 3
=
a22 − a12
−4 −3
δ
=
=
0 −2
−3
=
2 3
4 3
Por tanto, la solución óptima es: Para el jugador de filas: ( 2/3, 1/3) Para el jugador de columnas: ( 2/3, 1/3) Valor del juego: 4/3
Mª José Salgado Guinaldo Curso 2002-2003 Página 1 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 2.
ENUNCIADO
El jugador 1 escribe un entero entre 1 y 20 en un trozo de papel. Sin mostrar el papel al jugador 2, le dice lo que ha escrito. El jugador 1 puede mentir o decir la verdad. Entonces, el jugador 2 debe adivinar si el jugador 1 ha dicho o no la verdad. Si descubren que es mentira, el jugador 1 debe pagar 10 dólares al jugador 2. Si lo acusaron falsamente de mentir, el jugador 1 cobra 5 dólares al jugador 2. Si el jugador 1 dice la verdad y el jugador 2 adivina que el jugador 1 ha dicho la verdad, entonces el jugador 1 debe pagar 1 dólares al jugador 2. Si el jugador 1 miente y el jugador 2 no adivina que ha mentido, entonces el jugador 2 paga 5 dólares al jugador 1. Determine el valor de este juego y la estrategia óptima de cada jugador.
SOLUCIÓN El jugador I puede mentir o decir la verdad. El jugador II puede decir que el jugador I ha mentido o decir que no ha mentido. Este juego de suma cero se puede escribir en forma de tabla: Jugador II Dice: “jugador I miente” Dice: “jugador I no miente” Jugador I
Mentir
- 10
5
No mentir
5
-1
Este problema se resuelve de forma análoga al anterior. δ =
*
x1
=
a22
−
a11 + a22 − a12 − a21 = −10−1−5−5=−21
a21
δ
y
−
1
= −
*
v =
−
5
21
2 =
7
,
a11 a22 − a12 a21 δ
*
y1
=
=
a22
−
δ
a12
−
(-10)(-1) - 5 ⋅ 5 − 21
1
= −
=
−
5
21
2 =
7
5 7
Por tanto, la solución óptima es: Para el jugador de filas: (mentir, no mentir)=(2/7 , 5/7) Para el jugador de columnas: (decir que jugador I miente, decir que jugador I no miente)=(2/7 , 5/7) Y el valor del juego es: 5/7.
Mª José Salgado Guinaldo Curso 2002-2003 Página 2 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 3.
ENUNCIADO
Encuentre el valor y las estrategias óptimas para el juego de dos personas de suma cero de la Tabla 16. TABLA 16 2
1
3
4
3
2
SOLUCIÓN Primero analizamos si hay estrategias dominadas . Para el jugador de columnas es claro que la primera estrategia está dominada por la segunda. Por tanto simplificando tenemos: 1
3
3
2
Usando estrategias simples tenemos que max imin jaij = 2 estrategias simples óptimas. Por tanto, usamos
≠
min jmaxiaij=3, luego no existen
estrategias mixtas . Sean:
x1 = 1-x1 = y1 = 1- y1=
probabilidad de que el jugador 1 elija la estrategia 1. probabilidad de que el jugador 1 elija la estrategia 2. probabilidad de que el jugador 2 elija la estrategia 1. probabilidad de que el jugador 2 elija la estrategia 2.
Determinación de la estrategia óptima del jugador 1: Es la solución de la ecuación: x1
+
3(1 − x1 )
=
3 x1
+
2(1 − x1 )
que corresponde al punto de corte de las dos rectas que intervienen. De donde, x1 =1/3 y, por tanto, la estrategia óptima para jugador 1 es (1/3,2/3). Sustituyendo en cualquiera de los miembros de la ecuación anterior se tiene que el valor del juego es 7/3. Con esto aseguramos que para cualquier estrategia mixta que elija el jugador 2, la recompensa esperada del jugador 1 sea como mínimo 7/3.
Determinación de la estrategia óptima del jugador 2: Como la matriz de pagos es simétrica la estrategia óptima es la misma que para el jugador de filas, es decir, es (1/3,2/3) y su valor del juego también es 7/3. Con esto aseguramos que para cualquier estrategia mixta que elija el jugador 1, el jugador 2 no pagará mas de 7/3. Mª José Salgado Guinaldo Curso 2002-2003 Página 3 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc ALTERNATIVA Este problema se ha resuelto usando la ecuación asociada al planteamiento teórico dado en clase. Se obtienen los mismos resultados si usamos las fórmulas explícitas ya utilizadas en los problemas 1 y 2. δ = a11 + a22 − a12 − a21 = 1+2−3−3= −3
x1* =
a22 − a21
=
2-3
δ y
v* =
−3
=
1 3
,
y1* =
a11a22 − a12 a 21
=
a22 − a12 δ
1⋅ 2 - 3 ⋅ 3
δ
=
−3
2 −3 −3
=
=
1 3
7 3
Por tanto, la solución es: para el jugador de filas ( 1/3, 2/3) Y para el jugador de columnas: (1/3, 2/3) Y el valor del juego es: 7/3 La interpretación gráfica de lo anterior es obvia (partiendo de la tabla en la que se ha eliminado la estrategia 2).
4
3
(1/3,7/3)
2
1
0 0.0
0.2
0.4
0.6
0.8
1.0
X1
Mª José Salgado Guinaldo Curso 2002-2003 Página 4 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 4.
ENUNCIADO
Para el ejercicio 3 [anterior al presente], demuestre que si el jugador 1 se aparta de su estrategia óptima, entonces, el jugador 2 puede asegurar que el jugador 1 gane una recompensa esperada que es menor que el {7/3} del juego.
SOLUCIÓN Según lo resuelto en el ejercicio anterior (ejercicio 3 de Winston página 823): - El valor del juego es 7/3. - La estrategia mixta óptima para el jugador 1 es (1/3,2/3). - La estrategia mixta óptima para el jugador 2 es (1/3,2/3). Si el jugador 1 elige una estrategia mixta (x 1,1-x1) con x1<1/3 basta que el jugador 2 elija la estrategia pura 2 para que las ganancias esperadas del jugador 1 sean: 3 x1 + 2(1- x1) = x1 + 2 < (1/3) + 2 = 7/3. Análogamente, si el jugador 1 elige una estrategia mixta (x 1,1-x1) con x1>1/3 basta que el jugador 2 elija la estrategia pura 1 para que las ganancias esperadas del jugador 1 sean: x1 + 3(1- x1) = 3 - 2x 1 < 3 - 2(1/3) = 7/3. La interpretación gráfica de lo anterior es obvia sin mas que observar la figura del ejercicio anterior. Si x1<1/3, el jugador 2 elegirá y 2 para que las ganancias del jugador 1 sean menor que 1/3. Sin embargo, si x 1>1/3, el jugador 2 elegirá y 1 para que las ganancias del jugador 1 sean menores que 1/3. Esta claro que los pagos al jugador I se obtienen al considerar su estrategia definida por x1 y una mixtura de las rectas v = 3 x 1 + 2(1- x1) y v = x 1 + 3(1- x1) determinada por el jugador II, al elegir y1 e y2. Como ambas rectas pasan por el punto (1/3 , 7/3) su mixtura también pasa por este punto, y cuando y 1 = 1/3 e y 2 = 2/3, se obtiene una recta horizontal. En cambio, dando a y un valor mayor o menor de 1/3, se obtiene una recta oblicua inclinada hacia un lado u otro.
Mª José Salgado Guinaldo Curso 2002-2003 Página 5 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
4
Y2 3
(1/3,7/3)
2
1
Y1
0 0.0
0.2
0.4
0.6
0.8
1.0
X1
Mª José Salgado Guinaldo Curso 2002-2003 Página 6 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 5.
ENUNCIADO
Para el ejercicio 3, demuestre que si el jugador 2 se desvía de su estrategia óptima, entonces el jugador 1 puede tener la seguridad de que ha de ganar una recompensa esperada que es mayor que el (7/3) del juego.
SOLUCIÓN Según lo resuelto en el ejercicio 3: - El valor del juego es 7/3. - La estrategia mixta óptima para el jugador 1 es (1/3,2/3). - La estrategia mixta óptima para el jugador 2 es (1/3,2/3).
Si el jugador 2 elige una estrategia mixta (y 1,1-y1) con y1<1/3 basta que el jugador 1 elija la estrategia pura 1 para que las ganancias esperadas del jugador 1 sean: y1 + 3(1- y1) = 3 – 2y 1 > 3 - 2(1/3) = 7/3. Análogamente, si el jugador 2 elige una estrategia mixta (y 1,1-y1) con y1>1/3 basta que el jugador 1 elija la estrategia pura 2 para que las ganancias esperadas del jugador 1 sean: 3y1 + 2(1- y1) = y1 + 2 > (1/3) + 2 = 7/3. Nota: La interpretación gráfica de lo anterior es obvia sin mas que observar la figura del ejercicio 3.
Mª José Salgado Guinaldo Curso 2002-2003 Página 7 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 6.
ENUNCIADO
Dos empresas competidoras deben determinar en forma simultánea cuánto fabricar de un producto. La ganancia total de las dos empresas es siempre 1000 dólares. Si la capacidad de producción son 300 dólares. Si capacidad de producción de la empresa 1 es baja y la de la empresa 2 también es baja, las utilidades de la empresa 1 son 500 dólares. Si capacidad de producción de la empresa 1 es baja y la de la 2 es alta, las ganancias de la empresa 1 son 400 dólares. Si el nivel de producción de la empresa 1 es alto y también el de la 2, entonces la utilidad de la empresa 1 es de 600 dólares, pero si la producción de la empresa 1 es alta mientras de la 2 es baja, entonces las utilidades de la empresa 1 sólo son 300 dólares. Determine el valor y las estrategias óptimas para este juego con suma constante.
SOLUCIÓN Del enunciado deriva la siguiente tabla de utilidades: EMPRESA II
EMPRESA I
BAJA
BAJA ALTA (500,500) (400,600)
ALTA
(300,700) (600,400)
Separamos la tabla para la EMPRESA I: Probabilidad
Y
(1-Y)
X
500
400
(1-X)
300
600
La ganancia esperada para la EMPRESA I es: Ganancia esperada = Y·(500X + (1- X)·300) + (1-Y)·(400X + (1-X)·600) De acuerdo con el criterio minimax, la empresa I debe elegir el valor de X que da la mayor ganancia esperada mínima, de modo que: V= máx {min (300 + 200X, 600 – 200X)}. Por tanto, el valor óptimo de X es el que se encuentra en la intersección de las rectas Z = 300 + 200X
y
Z = 600 – 200X Mª José Salgado Guinaldo Curso 2002-2003
Página 8 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc Resolviendo algebraicamente la ecuación 300 + 200X = 600 – 200X obtenemos que X=3/4. Luego, (3/4,1/4) es la estrategia óptima para la empresa I y sustituyendo en la expresión de V encontramos el valor del juego es:
V = 300 + 200(3/4) = 450. Para la EMPRESA II se realizan los mismos pasos: Probabilida d
X
Y 500
(1-Y) 600
(1-X)
700
400
Ganancia esperada = (500Y+(600(1-Y))X + (700Y+(400(1-Y))(1-X) V = min {máx (600 – 100Y, 400 + 300Y)}. Resolviendo algebraicamente, 600 – 100Y = 400 + 300Y obtenemos que Y=1/2 así, (1/2,1/2) es la estrategia óptima para la empresa II y el valor del juego es: V = 600 + 100(1/2) = 550 .
Conclusiones: La EMPRESA I debe elegir una capacidad de producción baja con una probabilidad de 3/4, y una capacidad de producción alta de 1/4. En cambio, la EMPRESA II debe elegir con probabilidad ½ cada una de sus capacidades de producción.
Nota: A estos mismos resultados se llega si se usan directamente las fórmulas explícitas utilizadas en los problemas 1 y 2.
Mª José Salgado Guinaldo Curso 2002-2003 Página 9 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Winston página 823, problema 7.
ENUNCIADO
La Universidad del Estado jugará ante el Ivy College por el campeonato de tenis. El equipo de la Universidad tiene dos jugadores, A y B, y el Ivy College tres, X, Y, y Z. Se conoce lo siguiente acerca de las capacidades relativas de los jugadores: X siempre le gana a B. Y siempre le gana a A. A siempre le gana a Z. En cualquier otro encuentro, todo jugador tiene una probabilidad ½ de ganar. Antes del juego, el entrenador de la Universidad debe determinar quién jugará el primer individual y quién el segundo. El entrenador de Ivy College, después de haber seleccionado los jugadores para los dos individuales, también debe determinar quién jugará el primero y quién el segundo. Suponga que cada entrenador desea maximizar el número esperado de encuentros individuales que gane su equipo. Utilice la teoría de los juegos para determinar las estrategias óptimas para cada entrenador y el valor del encuentro para cada equipo.
SOLUCIÓN Las estrategias posibles para cada entrenador son las que se detallan en la tabla siguiente, donde AB para la Universidad significa que el primer partido lo juega A y el segundo B y Análogamente para todas las demás. Se trata de un juego de suma constante ya que para cada par de estrategias la suma de los números esperados de ganar es 2. Para la Universidad el número esperado de partidos ganados se detalla en la tabla.
IVY COLLEGE XY
XZ
YX
YZ
ZX
ZY
AB
1
1
0
1/2
1
3/2
BA
0
1
1
3/2
1
1/2
UNIVERSIDAD
A continuación se indica de forma más detallada la construcción de las estrategias posibles para cada entrenador. Para ello debemos tener en cuenta: -X siempre gana a B -Y siempre gana a A -A siempre gana a Z -En el resto de los casos, cualquier jugador tiene probabilidad ½ de ganar
IVY COLLEGE
Mª José Salgado Guinaldo Curso 2002-2003 Página 10 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc
Es claro que para el entrenador del Ivy College cualquier estrategia en la que interviene el jugador Z está dominada por la XY o la YX. Por tanto, simplificando se tiene:
XY
YX
AB
1
0
BA
0
1
Para hallar las estrategias óptimas a seguir, se asignan probabilidades:
Probabilidad
y
(1-y)
x
1
0
(1-x)
0
1
Buscamos la estrategia óptima para la Universidad mediante la resolución de la ecuación: x = 1-x obteniendo un valor óptimo de x=1/2, siendo (1/2,1/2) la estrategia mixta óptima y V= (1-(1/2)) = 1/2 como valor del juego.
Realizamos lo mismo para el equipo de Ivy College. Resolvemos la ecuación: y = 1-y para obtener un valor óptimo y=1/2 y por lo tanto una valor del juego,
estrategia óptima de (1/2,1/2) y como Mª José Salgado Guinaldo Curso 2002-2003
Página 11 de 12 e
Problemas de Teoría de Juegos Fichero W823.doc V= (1-(1/2)) = 1/2.
Este problema también podría haberse resuelto mediante la aplicación de las fórmulas explícitas conocidas: δ = a11 + a 22 − a12 − a 21 = 1 +1 − 0 − 0 = 2 *
x1
=
a 22
−
δ
y
a 21
1 =
* v =
−
2
0
1 =
2
,
a11a 22 − a12 a 21 δ
*
y1
=
=
a 22
−
a12
δ
1 ⋅1 - 0 ⋅ 0 2
=
1 =
−
2
0
1 =
2
1 2
La solución es x=(1/2,1/2), y=(1/2,1/2), y el valor del juego V=1/2
Mª José Salgado Guinaldo Curso 2002-2003 Página 12 de 12 e