TEMA 1. JUEGOS EN FORMA EXTENSIVA Y NORMAL 1.1 Introducción La teoría de grafos proporciona el sustrato sobre el que basar la definición de juego en forma extensiva . Vamos a considerar juegos en los que todos sus elementos son finitos aunque la teoría puede extenderse para superar la restricción de finitud. Al tratar los juegos en forma normal se se prescindirá de la restricción de finitud sobre el número de estrategias de los jugadores. 1.2 Grafos y árboles GRAFO FINITO ORIENTADO: Par (K, Γ ) con K={A,B,...,} conjunto finito de elementos a los que denominamos vértices y Γ una correspondencia de A en A (subconjunto del producto cartesiano AxA) que determina los arcos del grafo. VÉRTICE CONSECUTIVO: B es consecutivo a A si B ∈ Γ( A) . Si B es consecutivo a A, entonces (A,B) forma un arco del grafo. A es el origen y B es el extremo del arco respectivamente. CAMINO: Un camino es una sucesión finita de arcos tal que el extremo de cada arco coincide con el origen del siguiente VÉRTICE POSTERIOR: B es un vértice posterior a a A si existe un camino que une A con B. VÉRTICE TERMINAL: Un vértice L es terminal si si no es origen de ningún arco, es decir, si no tiene vértices consecutivos, esto es, Γ( L ) = vacio VÉRTICE DISTINGUIDO: Un vértice es distinguido si no existe ningún vértice del cual sea consecutivo ÁRBOL: Un árbol es es un grafo finito orientado que cumple las siguientes cuatro propiedades: 1. A ∉ Γ( A)∀ A ∈ K , es decir, no existe ningún vértice que sea consecutivo de sí mismo. 2. Posee un único vértice distinguido 0 ∈ K 3. Para todo vértice vértice del grafo existe existe un camino camino que une une a este vértice con el el distinguido 4. Para cualquier pareja de vértices vértices A,B se cumple que los vértices consecutivos consecutivos de A y de B forman conjuntos disjuntos: Γ( A) ∩ Γ( B ) = vacio∀( A, B ) : A ≠ B 1.3 1.3 Juegos en form a extensiv extensiv a JUEGO n-PERSONAL EN FORMA EXTENSIVA: Estructura matemática que regula el comportamiento de n jugadores J 1,..., Jn y del azar –J 0-, y que consta de los siguientes elementos: 1) Un grafo (K, Γ ) de tipo árbol 2) Una partición de K en n+2 subconjuntos representados por K 1,...,K n, K 0 y K * donde K i es el conjunto de vértices del i-ésimo jugador, K 0 es el conjunto de vértices del azar y K * es el conjunto de vértices terminales del árbol o consecuencias. 3) Una distribución de probabilidad definida sobre los arcos que salen de cada cada uno de de los vértices de azar. 4) Una partición de los vértices de cada jugador K i = K i1 ∪ K i2 ∪ K i3 ∪ ... ∪ K in . A cada uno de los conjuntos se le llama conjunto de información del jugador J i y cumplen que: i
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 1
a) Si B es posterior a A, entonces A y B no pueden formar formar parte del mismo mismo conjunto de información. b) Si A y B son dos vértices vértices del mismo conjunto conjunto de información entonces el número de arcos que parten de A y B es el mismo. 5) Para todo conjunto de información de cada jugador K i j se define un conjunto de índices I i j y una aplicación biunívoca I i j → Γ( A) que identifica cada una de las alternativas posibles a partir de cada conjunto de información 6) Una n-tupla de funciones h( R ) = [h1 ( R),..., hn ( R)] definida sobre los vértices terminales que determina el pago que recibirá cada uno de los jugadores. 7) Todos los jugadores jugadores conocen las reglas reglas del juego y tienen establecido un sistema sistema de preferencias sobre los resultados MOVIMIENTOS PERSONALES DEL JUGADOR i-ÉSIMO: Cada uno de los vértices K i ALTERNATIVAS: Cada uno de los arcos que parten de cada movimiento personal MOVIMIENTOS DE AZAR: Cada uno de los vértices del azar JUGADAS DE AZAR: Arcos que parten de los vértices de azar CONSECUENCIAS: Cada uno de los vértices terminales. PARTIDA o CURSO DE DESARROLLO: Cada uno de los caminos c(0,R) que unen al vértice distinguido con un vértice terminal 1.4 1.4 El con cepto d e estrategia estrategia pura Un jugador es incapaz de distinguir entre aquellos vértices que se encuentran dentro del mismo conjunto de información. Una estrategia pura para un jugador es una función definida sobre sus conjuntos de información y que determina qué alternativa elegirá cuando se encuentre en un vértice correspondiente a cada conjunto de información. i nformación. ESTRATEGIA PURA: Una estrategia pura π i del jugador J i es una aplicación del conjunto K i1 ,..., K i j en el conjunto de índices I i1 ,..., I i j definida de de la siguiente manera: π i ( K i j ) = v(a ) ∈ I i j , donde v(a) es la alternativa de índice v(a) que el jugador J i elige si sabe que se encuentra en el conjunto de información K i j . Se puede establecer una correspondencia biunívoca entre el conjunto de todas las estrategias puras de un jugador y el producto cartesiano de los conjuntos de índices del mismo jugador. Una estrategia pura probabiliza el grafo otorgando la probabilidad 1 a aquellas alternativas que salen de un movimiento del jugador que han resultado elegidas por la estrategia pura y la probabilidad 0 a las demás alternativas. Cuando todos los jugadores eligen su estrategia pura, el grafo queda completamente probabilizado de manera única. i
i
1.5 1.5 Forma normal de un j uego En la forma normal de un juego cada uno de los jugadores actúa una única vez comunicando su estrategia pura a un juez imparcial. El juez imparcial juega el juego en sustitución de todos los jugadores y se realizan los l os pagos correspondientes. FORMA NORMAL DE UN JUEGO: La forma normal de de un juego es una (n+1)-tupla (Π 1 ,..., Π n , M ) donde Π i es el conjunto de estrategias puras del jugador i-ésimo y M es ⎛ P ( R ) ⎞
⎟⎟ una función vectorial definida sobre Π 1 × ... × Π n → ⎜⎜ que a cada elemento h R ( ) ⎝ ⎠ R∈ K * del producto cartesiano de los conjuntos de estrategias puras de los jugadores –es decir,
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 2
a cada posible combinación de estrategias puras- le hace corresponder una distribución de probabilidad sobre los vértices terminales –P(R)- y un conjunto de pagos para los jugadores correspondientes al vértice terminal R. En muchas ocasiones, la función vectorial M se convierte en n funciones de la siguiente forma: M i (π 1 ,..., π n ) = ∑ P ( R )U i (hi ( R )) R∈ K *
JUEGOS DE SUMA NULA O SUMA CERO: Son aquellos en los que existen determinaciones de las funciones de utilidad de los jugadores de manera que n
∑1 M (π ) = 0 i
∀π ∈ Π 1 × ... × Π n
i=
1.6 n-tuplas de equil ibri o n-TUPLA DE EQUILIBRIO: Sea (Π 1 ,..., Π n , M 1 ,..., M n ) un juego en forma normal. Decimos que la n-tupla π * = π 1* ,..., π n* es una n-tupla de equilibrio si M i π 1* ,..., π i* ,..., π n* ≥ M i π 1* ,..., π i ,..., π n* ∀i ∈ {1,..., n} , esto es, si ningún jugador puede mejorar su resultado mediante la elección de otra estrategia pura suponiendo que los demás mantienen sus estrategias puras.
TEMA 2. DESCOMPOSICIÓN DE JUEGOS EN FORMA EXTENSIVA 2.1 Conc eptos y d efinicio nes Se plantea el problema de descomponer un juego en forma extensiva. Esta descomposición es posible siempre que no afecte a los conjuntos de información de los jugadores. JUEGO QUE SE PUEDE DESCOMPONER EN UN VÉRTICE: El juego ( K , Γ ) se puede descomponer en un vértice χ del grafo –con χ un vértice no terminal ni distinguido- si no existen conjuntos de información que contengan a la vez puntos del conjunto formado por χ y sus posteriores –al que llamaremos Γ χ - y del resto del grafo –denotado por Γ χ -. Es decir, un juego se puede descomponer en un vértice si al hacerlo no se “rompe” ningún conjunto de información. Resulta obvio que si un juego se puede descomponer en un vértice χ , entonces χ debe ser por sí solo un conjunto de información de algún jugador (recuérdese que los vértices posteriores a χ no pueden formar parte del mismo conjunto de información que χ y por otra parte, la posibilidad de descomponer el juego en χ hace que χ no esté en el mismo conjunto de información que cualquier vértice de Γ χ . Así, los únicos vértices que serán “candidatos” a descomponer un juego en ellos son aquellos que constituyen un conjunto de información por si mismos, teniendo en cuenta que el hecho de que constituyan un conjunto de información por sí mismos no garantiza que en ellos se pueda descomponer el juego –podría ocurrir que se “rompa” un conjunto de información de algún vértice posterior a χ -.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 3
Γ χ es un juego tal y como está. Por el contrario, Γ χ no es juego, ya que le falta añadir
el vértice terminal –de este juego- χ y asignarle un pago para cada uno de los jugadores. Dada una estrategia pura π i de un jugador –que recordemos, es una aplicación de sus conjuntos de información en los conjuntos de índices- esta estrategia se ve afectada por la descomposición en χ . Como ningún conjunto de información se rompe, cada conjunto de información del jugador i se encuentra ahora bien en Γ χ bien en Γ χ . Vamos a llamar π iΓ a la restricción de la estrategia pura π i a los conjuntos de χ
información que se encuentran en Γ χ y π i Γ a la restricción de la estrategia pura π i a χ
los conjuntos de información de i que se encuentran en Γ χ . Cada estrategia pura π i determina unívocamente un par de estrategias puras ( π iΓ , π i Γ ). Recíprocamente, cada par ( π iΓ , π i Γ ) determina unívocamente una χ
χ
χ
χ
estrategia pura π i . 2.2 Asignación de pagos al grafo coc iente Teorema 1: Si π es una n-tupla del juego ( K , Γ ) y π Γ es la n-tupla inducida en el χ
juego cociente Γ χ con el pago asociado a χ dado por M χ (π ) = M Γ π Γ entonces se χ
χ
⎞ verifica que M (π ) = M Γ ⎛ ⎜ π Γ ⎟ . χ
⎝
⎠
χ
Teorema 2: Supongamos que ( K , Γ ) se puede descomponer en el vértice χ y sea π una n-tupla tal que π Γ y π Γ son n-tuplas de equilibrio de los juegos Γ χ y Γ χ χ respectivamente -este último con el pago asociado a χ dado por M χ (π ) = M Γ π Γ -. χ
χ
χ
Entonces, π es una n-tupla de equilibrio del juego ( K , Γ ) . Teorema 3: Si π es una n-tupla del juego ( K , Γ ) y π Γ es la n-tupla inducida en el χ 1 ,..., χ k
juego cociente Γ χ ,..., χ con el pago asociado a χ 1 ,..., χ j ,..., χ k dado por 1
M χ j (π ) = M Γ χ π Γ χ j
j
k
entonces se verifica que M (π ) = M Γ
χ 1 ,..., χ k
⎛ π ⎞ . ⎜ Γ ⎟ ⎝ χ 1 ,..., χ ⎠ k
Teorema 4: Supongamos que ( K , Γ ) se puede descomponer en los vértices χ 1 ,..., χ j ,..., χ k y sea π una n-tupla tal que π Γ y π Γ son n-tuplas de equilibrio χ j
χ 1 ,..., χ k
de los juegos Γ χ 1 ,..., Γ χ ,..., Γ χ y Γ χ ,..., χ respectivamente -este último con el pago j
k
1
k
asociado a χ 1 ,..., χ j ,..., χ k dado por M χ (π ) = M Γ π Γ j
χ j
χ j
-. Entonces, π es una n-tupla
de equilibrio del juego ( K , Γ ) .
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 4
2.3. Juegos de info rmación perfecta Un juego de información perfecta es aquel en el que, en todo momento, todo jugador está perfectamente informado de lo que han hecho todos los jugadores (incluyéndose a si mismo y también al azar). En términos de los conjuntos de información, un juego es de información perfecta cuando todos los conjuntos de información están formados por un único vértice (no es posible confundir dos vértices). La ventaja que proporcionan los juegos de información perfecta es que de la aplicación de los teoremas 1,2,3 y 4 se puede encontrar una forma muy sencilla de encontrar una ntupla de equilibrio para el juego global a partir de n-tuplas de equilibrio de los juegos parciales. Como todo vértice es un conjunto de información, el juego puede descomponerse en cualquier vértice y, en particular, en aquellos vértices anteriores a los terminales. Así, las n-tuplas de equilibrio de estos subjuegos son precisamente las correspondientes a las mejores alternativas para el único jugador implicado. Procediendo hacia el origen del juego llegaremos a construir una n-tupla de equilibrio para el juego global. Este resultado es cierto si el juego es finito y se recoge en el teorema 5. JUEGO DE INFORMACIÓN PERFECTA: Un juego en forma extensiva ( K , Γ ) se dice que es de información perfecta si todos los conjuntos de información de todos los jugadores están formados por un único vértice. Teorema 5: Todo juego finito de información perfecta posee al menos una n-tupla de equilibrio
TEMA 3. JUEGOS BIPERSONALES DE SUMA CERO El resto de temas se van a centrar en estudiar una clase especial de juegos en los que sólo intervienen dos jugadores –y eventualmente el azar- en el que los intereses de ambos contendientes son contrapuestos, en el sentido de que lo que uno gane lo pierde el otro. Estos juegos reciben el nombre de juegos bipersonales de suma cero. 3.1 Definiciones Vamos a considerar únicamente juegos en forma normal. JUEGO EN FORMA NORMAL: (ver definición en el punto 1.5) Un juego n-personal en forma normal es una estructura formada por n conjuntos no vacíos X 1,...,Xn llamados espacios de estrategias puras de los jugadores J 1,...,Jn y n funciones reales acotadas M1,...,Mn definidas sobre
n
∏1 X
i
y que representan el pago para cada uno de los
i=
jugadores correspondiente a cada elemento del producto cartesiano de los espacios de estrategias puras. JUEGO DE SUMA CERO: Un juego n-personal en forma normal es de suma cero si n
∑1 i=
M i ( x1 , x 2 ,..., x n ) = 0
n
∀( x1 , x 2 ,..., x n ) ∈ ∏ X i i =1
JUEGO BIPERSONAL DE SUMA CERO: Un juego bipersonal de suma cero es una terna (X,Y,M) donde X e Y son los conjuntos de estrategias puras del primer y segundo jugador respectivamente y M es una función real acotada definida sobre X × Y y que representa el pago al primer jugador cuando J 1 elige la estrategia pura x ∈ X y J 2 elige la estrategia pura y ∈ Y
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 5
3.2 Equivalencia de juegos REDUCCIÓN DE UN JUEGO BIPERSONAL DE SUMA CERO: Se dice que el juego G’=(X’,Y’,M’) es una reducción del juego G=(X,Y,M) y lo representamos por G’rG si se verifica alguna de las condiciones siguientes: • X=X’ y existe una aplicación sobreyectiva g:Y en Y’ tal que M’(x,g(y))=M(x,y) para todo x ∈ X y para todo y ∈ Y , esto es, el espacio de estrategias puras del primer jugador es idéntico en ambos juegos y para cualquier estrategia pura del segundo jugador en G, y, existe una estrategia pura y’=g(y) del segundo jugador en Y’ que tiene el mismo pago que y para todo estrategia pura del primer jugador. Se trata de eliminar aquellas estrategias puras de Y que resultan redundantes e identificar todas las estrategias puras de J2 que suponen el mismo pago. • Y=Y’ y existe una aplicación sobreyectiva f:X en X’ tal que M’(f(x),y)=M(x,y) para todo x ∈ X y para todo y ∈ Y . Ahora se trata de agrupar e identificar estrategias puras de J 1 que tienen el mismo pago para todas las estrategias puras de J2. JUEGOS EQUIVALENTES: Dos juegos G y G’ son equivalentes si existe una sucesión finita de juegos G0,...,Gn tal que G=G0, G’=Gn y Gi-1rGi o GirGi-1. JUEGO BIPERSONAL DE SUMA NULA FINITO: Un juego bipersonal de suma nula se dice finito cuando los conjuntos de estrategias puras de ambos jugadores son finitos. JUEGO RECTANGULAR O JUEGO MATRICIAL: Un juego bipersonal de suma nula GA se dice rectangular o matricial cuando su forma es (I m,In,A) siendo Im={1,...,m}, In={1,2,...,n} y A=(aij) con i=1,...,m; j=1,...,n. La función de pago queda definida por la matriz A haciendo M(i,j)=aij. Todo juego finito es equivalente a un juego matricial (obvio). Existen juegos infinitos que son equivalentes a juegos matriciales. JUEGO ESENCIALMENTE FINITO: Un juego esencialmente finito es un juego bipersonal de suma nula equivalente a un juego matricial. Todo juego finito es esencialmente finito, pero existen algunos juegos infinitos que también lo son. 3.3 Elementos esenciales de un j uego bi personal d e suma cero Sea G=(X,Y,M) un juego bipersonal de suma cero. Si el primer jugador elige una estrategia pura x de X, lo peor que le puede ocurrir es que el segundo jugador elija aquella y de Y tal que se dé el ínfimo de la función de inf M ( x, y ) y pago. Así, el primer jugador estará interesado en la función Λ G ( x ) = y ∈ Y
elegirá aquella estrategia pura x de X que haga que esta función tome su valor supremo, sup esto es, Λ G ( x ) = λ *G , valor al que se conoce como valor inferior del juego G. x ∈ X
Análogamente, si el segundo jugador elige la estrategia pura y de Y, lo peor que le puede ocurrir es que el primer jugador elija aquel x de X tal que se dé el supremo de la sup M ( x, y ) . J2 función de pago, es decir, J 2 estará interesado en la función γ G ( y ) = x ∈ X
elegirá aquella estrategia pura y de Y que lleve al ínfimo de esa función, es decir, inf * V G = γ G ( y ) , valor al que se conoce como valor superior del juego G. y ∈ Y
Intuitivamente se ve que el valor inferior de un juego no puede ser superior al valor superior del juego, esto es, λ *G ≤ V G* .
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 6
JUEGO ESTRICTAMENTE DETERMINADO O QUE POSEE VALOR: Un juego bipersonal de suma nula se dice que está estrictamente determinado o que posee valor si el valor inferior y el valor superior del juego coinciden. En ese caso, se dice que λ *G = V G* = V G es el valor del juego. ESTRATEGIA ÓPTIMA: Si un juego bipersonal de suma nula está estrictamente determinado, se dice que una estrategia x 0 de J1 es óptima si Λ G ( x0 ) = λ *G = V G , esto es, si garantiza a J 1 alcanzar el valor del juego. Análogamente, una estrategia y 0 de J2 se dice óptima si γ G ( y 0 ) = V G* = V G . Un juego estrictamente determinado puede no tener estrategias óptimas si el supremo o el ínfimo de las funciones correspondientes no son alcanzables. En ese caso se dice que existen estrategias ε -óptimas. (Ver estrategia maximín y minimax en el apartado 4.3). Teorema 1: Sean G y G’ dos juegos bipersonales de suma nula equivalentes. Entonces el valor inferior de ambos juegos coincide y también coincide el valor superior de ambos juegos. Como corolario de este teorema se tiene que si un juego bipersonal de suma nula posee valor también lo posee cualquier juego que sea equivalente a él –y además, el valor coincide-. También se deduce que si un juego posee estrategias óptimas también las tiene cualquier juego que sea equivalente a él. 3.4 Punto s d e silla PUNTO DE SILLA: Sea M una función definida en el producto cartesiano XxY y con valores en la recta real. Decimos que un punto (x 0,y0) es un punto de silla si se verifica M ( x, y 0 ) ≤ M ( x 0 , y 0 ) ≤ M ( x 0 , y ) , esto es, si en (x 0,y0) se alcanza el mínimo de la función M(x,y) considerada como función de y y simultáneamente se alcanza el máximo de la función M(x,y) considerada como función de x. Teorema 2: Si la función de pago del juego G=(X,Y,M) posee un punto de silla, digamos (x0,y0), entonces el juego está estrictamente determinado y además x 0 e y0 son estrategias óptimas para J 1 y J2 respectivamente. El valor del juego es V G=M(x0,y0). Teorema 3: Si el juego G=(X,Y,M) está estrictamente determinado y además el ínfimo y el supremo son sustituibles por el mínimo y el máximo respectivamente, entonces el juego tiene estrategias óptimas y además existe un punto de silla definido por las estrategias óptimas. Teorema 4: Si la función de pago tiene dos puntos de silla –digamos (x 0,y0) y (x1,y1)entonces (x0,y1) y (x1,y0) son también puntos de silla y la función de pago toma el mismo valor en todos ellos. En los juegos bipersonales de suma nula, los conceptos de bitupla de equilibrio y punto de silla son equivalentes, es decir, toda bitupla de equilibrio se corresponde con un punto de silla de la función de pago y viceversa. 3.5. Resu men En todo juego bipersonal de suma cero se cumple que λ *G ≤ V G* . Si un juego posee valor, λ*G = V G* , entonces posee estrategias ε -óptimas. Si un juego posee valor, λ *G = V G* , y el ínfimo y el supremo se pueden sustituir respectivamente por el mínimo y el máximo, entonces posee estrategias óptimas y además, toda combinación de estrategias óptimas de ambos jugadores constituye un punto de silla de la función de pago. Recíprocamente, si la función de pago M posee un punto de silla, entonces el juego tiene valor y existen estrategias óptimas. Si la función de pago posee un punto de silla el
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 7
primer jugador puede garantizarse un pago igual al valor del juego y el segundo jugador puede garantizarse no pagar más del valor del juego, eligiendo ambos estrategias óptimas. Este concepto de solución coincide con el de bitupla de equilibrio. Nos queda por estudiar qué ocurre cuando la función de pago no tiene puntos de silla.
TEMA 4. EXTENSIÓN MIXTA DE UN JUEGO BIPERSONAL DE SUMA CERO 4.1 Necesidad de extender el con cepto d e estrategia pur a Para todo juego bipersonal de suma cero se cumple λ *G ≤ V G* . En el tema anterior hemos desarrollado una teoría satisfactoria para el caso en que λ *G = V G* . Vamos a desarrollar una teoría satisfactoria para encontrar estrategias óptimas en el caso en que λ *G < V G* , cosa que ocurre cuando en la función de pago no existen puntos de silla. Para ello necesitamos extender el concepto de estrategia pura al de estrategia mixta. 4.2 Defini ción general de la extensión mixt a Dado un juego bipersonal de suma nula G=(X,Y,M) con M función real acotada supongamos que sobre X e Y tenemos definidas sendas sigma-álgebras que representaremos por AX y AY respectivamente. A estas sigma-álgebras les exigimos que contengan a todos los subconjuntos discretos de X y de Y. ESTRATEGIA MIXTA: Una estrategia mixta del primer jugador es una distribución de probabilidad definida sobre (X, AX). Si representamos por X * al conjunto de todas las estrategias mixtas de J 1, una estrategia mixta verificará: ξ : A X → [0,1] ξ ( X ) = 1 ⎛ ∞ ⎞ ∞ ξ ⎜⎜ U Ai ⎟⎟ = ∑ ξ ( Ai ) si los Ai son disjuntos ⎝ i =1 ⎠ i =1
y análogamente si denotamos por Y * el conjunto de estrategias mixtas del segundo jugador. EXTENSIÓN DE LA FUNCIÓN DE PAGO A LAS ESTRATEGIAS MIXTAS: Dadas ξ y η , estrategias mixtas de J 1 y J2 respectivamente se tiene: M (ξ ,η ) = ∫ M ( x, y )d [ξ ( x ) × η ( y )] = ∫ ∫ M ( x, y )d η ( y ) d ξ ( x ) = ∫ ∫ M ( x, y )d ξ ( x ) d η ( y ) X ×Y X Y Y X IDENTIFICACIÓN DE LAS ESTRATEGIAS PURAS CON UN SUBCONJUNTO DE LAS ESTRATEGIAS MIXTAS: por la inclusión de todos los conjuntos discretos de X y de Y, respectivamente en AX y AY , las estrategias puras de J 1 y J2 no son sino casos particulares de las estrategias mixtas. Una estrategia pura x 0 de J1 viene representada por una distribución de probabilidad –estrategia mixta- que asigna el valor 1 a aquellos subconjuntos de X que contienen a x 0 –en particular, al propio x 0 - y 0 a aquellos que no lo contienen y análogamente para las estrategias puras de J 2. EXTENSIÓN MIXTA DE UN JUEGO BIPERSONAL DE SUMA NULA: Sea G=(X,Y,M) un juego bipersonal de suma nula. Al juego E(G)=(X *,Y*,M) donde X* e Y* representan el conjunto de todas las estrategias mixtas de J 1 y J2 respectivamente y donde M (ξ ,η ) = ∫ X ×Y M ( x, y )d [ξ ( x ) × η ( y )] para todo ξ ∈ X * y para todo η ∈ Y * se le llama extensión mixta de G.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 8
4.3 Relación entr e los elementos de un juego y los de su extensión mixta Los espacios de estrategias mixtas de los dos jugadores de un juego bipersonal de suma nula son convexos, es decir, cualquier combinación lineal convexa de estrategias mixtas es una estrategia mixta. Teorema 1: Si G=(X,Y,M) es un juego bipersonal de suma nula y E(G) es su extensión mixta entonces se tiene: inf inf * ( ) M ξ η M (ξ ,y ) y λG* ≤ λ E , Λ E (G ) (ξ ) = = (G ) * γ E (G ) (η ) =
η ∈ Y
y ∈ Y
sup
sup
M (ξ ,η ) = M ( x,η ) ξ ∈ X * x ∈ X
y V E *(G ) ≤ V G*
Es decir, para calcular la función Λ E (G ) (ξ ) no es necesario considerar todas las estrategias mixtas de J 2 sino tan solo sus estrategias puras y análogamente para la función γ E (G ) (η ) . Por otra parte, resulta evidente que λG* ≤ λ E * (G ) ya que sup inf sup inf * * ( ) λ E M ξ ,y y λ M ( x,y ) y X ⊂ X * . Análogamente = (G ) = G * ξ ∈ X y ∈ Y
x ∈ X y ∈ Y
para V E *(G ) ≤ V G* Además, como λG* ≤ λ E * (G ) ≤ V E *(G ) ≤ V G* se tiene que si el juego tiene valor en estrategias puras –esto es, si está estrictamente determinado, entonces el juego tiene valor en estrategias mixtas y el valor coincide y cualquier estrategia óptima de G será una estrategia óptima de E(G). En el tema anterior hemos desarrollado una teoría satisfactoria para aquellos juegos en los que λG* = λ E * (G ) = V E *(G ) = V G* . Aunque sabemos que, en general, se cumple que * * * λG* ≤ λ E (G ) ≤ V E (G ) ≤ V G
esperamos que, en una amplia variedad de juegos, suceda
* * * λG* ≤ λ E (G ) = V E (G ) ≤ V G
y entonces tendríamos una teoría satisfactoria para E(G). En los siguientes temas buscaremos condiciones suficientes para que la extensión mixta de un juego esté estrictamente determinada (en concreto, el teorema del minimax generalizado da condiciones suficientes para que la extensión mixta de un juego esté estrictamente determinada). JUEGO QUE TIENE VALOR: Sea G=(X,Y,M) un juego bipersonal de suma nula y sea E(G) su extensión mixta. Si E(G) tiene valor puro v E(G), entonces diremos que el juego G tiene valor v=vE(G) y a cualquier estrategia óptima de E(G) la llamaremos estrategia óptima de G. ESTRATEGIA MAXIMÍN Y ESTRATEGIA MINIMAX: Sea G=(X,Y,M) un juego bipersonal de suma nula. Si existe una estrategia mixta ξ 0 ∈ X * tal que * * Λ E (G ) (ξ 0 ) = λ E (G ) entonces a ξ 0 ∈ X se le llama una estrategia maximín del jugador J1. Análogamente, si existe una estrategia η 0 ∈ Y * tal que γ E (G ) (η 0 ) = V E *(G ) entonces se dice que η 0 ∈ Y * es una estrategia minimax del jugador J 2. Si E(G) tiene valor, las estrategias maximín y minimax son estrategias óptimas del juego. Toda estrategia óptima de J 1 es maximín y toda estrategia óptima de J 2 es minimax. Si el juego tiene valor, entonces toda estrategia maximín de J 1 es óptima y toda estrategia minimax de J 2 es óptima.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 9
4.4 Sigma-álgebras intrínsecas Para definir las estrategias mixtas ha sido necesario definir sobre los espacios de estrategias puras X e Y sendas sigma-álgebras a las que hemos exigido que incluyan a todos los subconjuntos discretos de X y de Y respectivamente. Así, hemos conseguido que las estrategias puras sean un caso particular de las estrategias mixtas. Se trata ahora de aprovechar la existencia de una función M –función de pago- sobre el producto cartesiano XxY para construir unas métricas sobre X e Y que nos lleven a la definición de sigma-álgebras apropiadas -¡cuidado!: la construcción que vamos a hacer no garantiza que las sigma-álgebras incluyan a todos los subconjuntos discretos-. Sea G=(X,Y,M) un juego bipersonal de suma cero. Vamos a definir una métrica en X del siguiente modo: para cada par de estrategias puras x y x’ de X se define la distancia sup M ( x, y ) − M ( x ' , y ) . entre ellas por ρ 1 ( x, x') = y ∈ Y
Análogamente, para cada par de estrategias puras y,y’ de Y se define sup ρ 2 ( y , y ') = M ( x, y ) − M ( x, y ') x ∈ X
Estas distancias definen sendas semimétricas en X e Y que nos llevan a definir una topología basada en los sistemas de bolas abiertos I ( x; ε ) = { x'∈ X : ρ 1 ( x, x') < ε } y I ( y; ε ) = { y '∈ Y : ρ 2 ( y , y ') < ε }
TEMA 5. JUEGOS RECTANGULARES O MATRICIALES Todo juego bipersonal de suma nula esencialmente finito es equivalente a un juego rectangular o matricial. En este tema se enuncia el “teorema del minimax” que afirma que cualquier juego bipersonal de suma nula y finito –que obviamente es equivalente a un juego matricial- posee valor en estrategias mixtas y los jugadores tienen estrategias óptimas. 5.1 Definición JUEGO RECTANGULAR O JUEGO MATRICIAL: Un juego bipersonal de suma nula GA se dice rectangular o matricial cuando su forma es (I m,In,A) siendo Im={1,...,m}, In={1,2,...,n} y A=(aij) con i=1,...,m; j=1,...,n. La función de pago queda definida por la matriz A –llamada matriz de pagos del primer jugador- haciendo M(i,j)=a ij. Todo juego finito es equivalente a un juego matricial (obvio). Existen juegos infinitos que son equivalentes a juegos matriciales. PUNTO DE SILLA DE UNA MATRIZ: En el apartado 3.4 se ha definido el concepto de punto de silla para una función M definida sobre el producto cartesiano XxY y con valores en la recta real. En el caso de los juegos matriciales o rectangulares, la función de pagos M viene dada por la matriz A. De este modo, es posible encontrar un paralelismo entre el concepto de punto de silla de una función y punto de silla de una matriz. Se dice que un elemento a i*j* de la matriz A es un punto de silla de la matriz si es simultáneamente el mínimo de su fila y el máximo de su columna, esto es si a ij* <= ai*j* <=ai*j para todo i y para todo j. Si la matriz posee un punto de silla la función de pago posee un punto de silla y el juego matricial tiene valor en estrategias puras. En el caso de que no exista un punto de silla en la matriz deberemos considerar la extensión mixta del juego.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 10
5.2 Extensió n mix ta de un ju ego rectangular y pr opiedades En este apartado vamos a aplicar al caso particular de los juegos rectangulares los resultados generales que obtuvimos en los apartados 4.2 y 4.3 en los que nos referíamos a la extensión mixta de un juego bipersonal de suma cero. ESTRATEGIA MIXTA PARA UN JUEGO MATRICIAL: Hemos visto que una estrategia mixta para el primer jugador en un juego bipersonal de suma cero es una distribución de probabilidad definida sobre (X, AX). En este caso, dada la finitud del espacio de estrategias puras del primer jugador se tiene que una estrategia mixta para el primer jugador en un juego matricial es una m-pla (x 1,x2,...,xm) que representa una distribución de probabilidad sobre el espacio de estrategias puras I m. Análogamente, una estrategia mixta para el segundo jugador en un juego matricial es una n-pla de la forma (y1,...,yn) que determina una distribución de probabilidad sobre el conjunto de estrategias puras del segundo jugador. De este modo, el conjunto de todas las estrategias mixtas X* del primer jugador será el conjunto de todas las m-plas (x 1,...,xm) tales que xi>=0 para todo i y x 1+...+xm=1. El conjunto de todas las estrategias mixtas del segundo jugador, Y*, es el conjunto de todas las n-plas (y 1,...,yn) tales que y j>=0 para todo j y y1+...+yn=1. Es decir, una estrategia mixta ξ del primer jugador tiene la forma (x 1,...,xm) y el conjunto de todas las estrategias mixtas del primer jugador –al que llamamos S m- es m ⎧ ⎫ S m = ⎨( x1 ,..., x m ) : xi ≥ 0∀i ∈ {1,..., m} : ∑ xi = 1⎬ i =1 ⎩ ⎭
Análogamente, una estrategia mixta η del segundo jugador tiene la forma (y 1,...,yn) y el conjunto de todas las estrategias mixtas del segundo jugador –al que llamamos S n- es n ⎧ ⎫ S n = ⎨( y1 ,..., y n ) : y i ≥ 0∀i ∈ {1,..., n} : ∑ y i = 1⎬ i =1 ⎩ ⎭
Por ejemplo, S2 es el segmento de recta y=1-x contenido entre los ejes de coordenadas en el primer cuadrante. S 3 es la parte del plano x+y+z=1 contenido entre los tres ejes de coordenadas. EXTENSIÓN DE LA FUNCIÓN DE PAGO PARA UN JUEGO MATRICIAL: Hemos visto en el tema 4 que la forma natural de extender la función del pago al producto cartesiano de los conjuntos de estrategias mixtas venía dada por la expresión M (ξ ,η ) = ∫ M ( x, y )d [ξ ( x ) × η ( y )]. × X Y
Ahora, la probabilidad asignada a la combinación de la estrategia pura i-ésima del primer jugador con la estrategia pura j-ésima del segundo jugador viene dada por el producto xiy j , de donde se deduce que la forma que toma ahora la función de pago para las estrategias mixtas es ⎛ a11 ... a1n ⎞⎛ y1 ⎞ ⎜ ⎟⎜ ⎟ M (ξ ,η ) = ∫ M ( x, y )d [ξ ( x ) × η ( y )] = ξ ' Aη = ( x1 ,..., x m )⎜ ... ... ... ⎟⎜ ... ⎟ X ×Y ⎜a ⎟⎜ ⎟ ⎝ m1 ... a mn ⎠⎝ y n ⎠ Aplicando los resultados de la sección 4.3 tenemos que Mín inf M (ξ ,y ) = ξ ' P j Λ E (G ) (ξ ) = y ∈ Y j ∈ {1,..., n} Max sup γ E (G ) (η ) = M ( x,η ) = Q' i η x ∈ X i ∈ {1,..., m}
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 11
5.3 Teorema fun damental Dado que las funciones Λ E (G ) (ξ ) y γ E (G ) (η ) definidas respectivamente sobre S m y Sn son continuas y los conjuntos sobre los que están definidas son compactos –obviamente son cerrados y acotados-, existen estrategias maximín y minimax para el primer y segundo jugador respectivamente. Sólo falta demostrar que todo juego rectangular posee valor para afirmar que estas estrategias maximín y minimax son estrategias óptimas del juego. TEOREMA DEL MINIMAX: Todo juego matricial posee valor en estrategias mixtas y como todo juego matricial tiene al menos una estrategia maximín para J 1 y una estrategia minimax para J 2, se tiene que todo juego matricial tiene estrategias mixtas óptimas. A los conjuntos de estrategias óptimas de J 1 y J2 en el juego matricial GA=(Im,In,A) los representamos por O(J 1;A) y O(J2;A) y quedan definidos por: O( J 1 ; A) = {ξ 0 ∈ S m : Λ(ξ 0 ) = v} O( J 2 ; A) = {η 0 ∈ S n : γ (η 0 ) = v} El teorema fundamental afirma que O(J 1;A) y O(J2;A) de un juego matricial son no vacíos.
TEMA 6. MÉTODOS GEOMÉTRICOS DE RESOLUCIÓN DE JUEGOS MATRICIALES En este tema se dan tres métodos geométricos para la resolución de juegos matriciales o rectangulares. 6.1 Método b asado en la demostr ación d el teorema fundamental Método aplicable a los juegos matriciales 2xn y mx2. Primer caso: Se trata de resolver un juego (2xn) con matriz de pagos ⎛ a11 ... a1n ⎞ ⎟⎟ A = ⎜⎜ a a ... 2 n ⎠ ⎝ 21 ⎛ a1 j ⎞ • Se dibujan los puntos P j = ⎜⎜ ⎟⎟ en unos ejes de coordenadas colocando la ⎝ a 2 j ⎠
• •
• •
variable t1 en abscisas y la variable t 2 en ordenadas. Se construye la envoltura convexa de los P j, que será un poliedro al que denominaremos S *. Se deslizan a lo largo de la diagonal del primer y del tercer cuadrantes (esto es, a lo largo de la recta de ecuación t 2=t1 escuadras de la forma T a = {(t 1 , t 2 ) : t 1 ≤ a, t 2 ≤ a} hasta que toquen al conjunto S * “por abajo”, es decir, consideramos aquella escuadra Ta* donde a * = sup a : T a ∩ S * = vacio El valor del juego es precisamente a *. La estrategia óptima del primer jugador viene dada por la ecuación del hiperplano que separa los conjuntos T &a* -interior de T a* - y S *, de manera que si la ecuación de dicho hiperplano es u 1t1+u2t2=c, la estrategia óptima del primer ⎛ u1 u ⎞ , 2 ⎟⎟ . Puede haber más de una ⎝ u1 + u 2 u1 + u 2 ⎠
jugador viene dada por (ξ 0 )t = ⎜⎜
estrategia óptima para el primer jugador.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 12
• La estrategia óptima del segundo jugador viene dada por la intersección T a* ∩ S * . Puede haber más de una estrategia óptima para el segundo jugador.
Segundo caso: Se trata de resolver un juego matricial (mx2) con matriz de pagos ⎛ a11 a12 ⎞ ⎜ ⎟ = A ⎜ ... ... ⎟ ⎜a ⎟ ⎝ m1 am 2 ⎠
Se dibujan los puntos Q'i = (ai1 , ai 2 ) en unos ejes de coordenadas colocando la variable q 1 en abscisas y la variable q 2 en ordenadas. • Se construye la envoltura convexa de los Q’ i, que será un poliedro al que denominaremos R *. • Se deslizan a lo largo de la diagonal del primer y del tercer cuadrantes (esto es, a lo largo de la recta de ecuación q 2=q 1 escuadras de la forma Qb = {(q1 , q 2 ) : q1 ≥ b, q 2 ≥ b} hasta que toquen al conjunto R* “por arriba”, es decir, consideramos aquella escuadra Qb* donde b * = inf b : Qb ∩ R * = vacio • El valor del juego es precisamente b *. • La estrategia óptima del segundo jugador viene dada por la ecuación del hiperplano que separa los conjuntos Q& b* -interior de Qb* - y R *, de manera que si la ecuación de dicho hiperplano es u 1q 1+u2q 2=c, la estrategia óptima del segundo ⎛ u1 u ⎞ , 2 ⎟⎟ . Puede haber más de una ⎝ u1 + u 2 u1 + u 2 ⎠
jugador viene dada por (η 0 )t = ⎜⎜
estrategia óptima para el segundo jugador. • La estrategia óptima del primer jugador viene dada por la intersección Qb* ∩ R * . Puede haber más de una estrategia óptima para el primer jugador. 6.2 Segundo método g eométrico Se basa en la forma especial de las funciones Λ(ξ ) =
Mín j
ξ ' P j y γ(η) =
Máx i
Q' i η en el
caso de los juegos matriciales 2xn y mx2. Estas funciones son poligonales cóncavas y convexas respectivamente. Primer caso: Se trata de resolver un juego (2xn) con matriz de pagos ⎛ a11 ... a1n ⎞ ⎟⎟ A = ⎜⎜ a a ... 2 n ⎠ ⎝ 21 Mín inf M (ξ ,y ) = ξ ' P j . Sabemos que Λ E (G ) (ξ ) = y ∈ Y j ∈ {1,..., n} ⎛ x ⎞
⎟⎟ , de donde Además, cualquier estrategia mixta del primer jugador ξ = ⎜⎜ x 1 − ⎝ ⎠ Λ E (G ) (ξ ) =
Mín
ξ ' P j =
j ∈ {1,..., n}
Así, Λ E (G ) ( x ) =
Mín
⎛ a ⎞
Mín
( x 1 − x )⎜⎜ 1 j ⎟⎟ = a1 j x + a 2 j (1 − x ) a { } ∈ j ∈ {1,..., n} j n 1 ,..., ⎝ 2 j ⎠
Mín
a1 j x + a 2 j (1 − x ) con x ∈ [0 ,1] j ∈ {1 ,...,n}
es una función continua y
cóncava.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 13
El máximo de dicha función proporciona el valor del juego. Los puntos de [0,1] donde se alcanza este máximo determinan la primera coordenada de las estrategias óptimas del primer jugador. El cálculo de las estrategias óptimas del segundo jugador se hace seleccionando aquellos puntos de [0,1] donde se alcanza el máximo y considerando las rectas que intervienen en el valor de la función en dicho punto –digamos las correspondientes a las columnas j y j’- La estrategia óptima del segundo jugador será una mixtura de las dos columnas implicadas determinando los coeficientes de la mixtura la solución de la ecuación λ 0 p j + (1 − λ 0 ) p j ' = 0 siendo p j y p j’ las pendientes de las rectas consideradas. Segundo caso: Se trata de resolver un juego matricial (mx2) con matriz de pagos ⎛ a11 a12 ⎞ ⎜ ⎟ ... ⎟ A = ⎜ ... ⎜a ⎟ ⎝ m1 am 2 ⎠
Sabemos que γ E (G ) (η ) =
sup
Max M ( x,η ) = Q' i η . x ∈ X i ∈ {1,..., m}
⎛ y ⎞
⎟⎟, de Además, cualquier estrategia mixta del segundo jugador es de la forma η = ⎜⎜ y 1 − ⎝ ⎠ donde γ E (G ) (η ) =
Max
Q'i η =
i ∈ {1 ,...,m}
Max
(ai1 i ∈ {1 ,...,m}
Max ⎛ y ⎞ ⎟⎟ = ai1 y + ai 2 (1 − y ) con y ∈ [0 ,1] { } − ∈ y i ,...,m 1 1 ⎝ ⎠
ai 2 )⎜⎜
que es una función continua y convexa. El mínimo de dicha función proporciona el valor del juego. Los puntos de [0,1] donde se alcanza dicho mínimo proporcionan la primera coordenada de las estrategias óptimas del segundo jugador. Las estrategias óptimas del primer jugador se determinan considerando las rectas que configuran los valores mínimos de la función. La estrategia óptima del primer jugador será una mixtura de las filas involucradas –digamos i e i’- y los coeficientes de la mixtura vendrán dados por la solución de la ecuación 0 qi + (1 − µ 0 )qi ' = 0 siendo q i y q i’ las pendientes de las rectas consideradas. 6.3 Método de los p unto s fij os Este método puede ser aplicado a juegos matriciales en los que los jugadores no están obligados a utilizar todas sus estrategias sino que la elección se ve restringida por imposiciones de carácter lineal sobre sus posibles estrategias mixtas (¡cuidado! ver ejercicio de autocomprobación 7 de la página 228 de las unidades didácticas). Teorema del minimax generalizado: Sea G=(X,Y,M) un juego bipersonal de suma cero en donde X e Y son subconjuntos convexos y compactos de espacios euclideos de dimensión m y n respectivamente y M es una función continua y cóncava de x para todo y ∈ Y y convexa de y para todo x ∈ X . Entonces G está determinado estrictamente y existen estrategias óptimas para ambos jugadores. Aplicación del teorema del minimax generalizado al caso de la extensión mixta de un juego matricial: Sea GA=(Im,In,A) un juego matricial y sea E(GA)=(S m,Sn,M) su m ⎧ ⎫ extensión mixta, con S m = ⎨( x1 ,..., x m ) : xi ≥ 0∀i ∈ {1,..., m}: ∑ xi = 1⎬ , i =1 ⎩ ⎭
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 14
n ⎧ ⎫ S n = ⎨( y1 ,..., y n ) : y i ≥ 0∀i ∈ {1,..., n} : ∑ y i = 1⎬ y ⎩ i =1 ⎭
⎛ a11 ... a1n ⎞⎛ y1 ⎞ ⎜ ⎟⎜ ⎟ M (ξ ,η ) = ∫ M ( x, y )d [ξ ( x ) × η ( y )] = ξ ' Aη = ( x1 ,..., x m )⎜ ... ... ... ⎟⎜ ... ⎟ X ×Y ⎜a ⎟⎜ ⎟ ⎝ m1 ... a mn ⎠⎝ y n ⎠
Obviamente, los conjuntos S m y Sn son conjuntos convexos y compactos de R m y R n respectivamente y la función M (ξ ,η ) es concavo-convexa. De aquí que este juego –la extensión mixta- esté determinado estrictamente y ambos jugadores posean estrategias óptimas. El método geométrico consiste en la construcción de los conjuntos B x = { y ∈ Y : Λ( x ) = M ( x, y )} y A y = { x ∈ X : γ ( y ) = M ( x, y )}, ambos convexos y compactos y la posterior construcción de las correspondencias x → B x e y → A y y la búsqueda posterior de los puntos fijos de estas correspondencias.
TEMA 7. PROPIEDADES DE LAS SOLUCIONES DE UN JUEGO MATRICIAL En el tema 5 se ha enunciado el teorema fundamental de los juegos matriciales (teorema del minimax para juegos matriciales, que se ha extendido en el tema 6) que afirma que los conjuntos de estrategias óptimas de los jugadores en la extensión mixta de un juego matricial son no vacíos. En este tema vamos a estudiar los conjuntos de estrategias óptimas. 7.1 Propiedades de las estr ategias ó ptim as Teorema 1: Los conjuntos de estrategias óptimas O(J 1,A) y O(J2,A) de un juego rectangular de matriz A son subconjuntos convexos y compactos de R m y R n respectivamente. COLUMNA RELEVANTE: Sea A la matriz de un juego rectangular. Una columna P j de la matriz se dice que es relevante si existe alguna estrategia óptima del segundo jugador η * = y1* ,..., y j* ,... y n* con y j* > 0 . Una columna es relevante si juega algún papel en alguna estrategia óptima del segundo jugador. FILA RELEVANTE: Sea A la matriz de un juego rectangular. Una fila Q’ i de la matriz se dice que es relevante si existe alguna estrategia óptima del primer jugador ξ * = x1* ,..., xi* ,... x m* con xi* > 0 . Una fila es relevante si juega algún papel en alguna estrategia óptima del primer jugador. COLUMNA (FILA) IRRELEVANTE: Aquella que no es relevante. Teorema 2: Si la columna P j es relevante y ξ 0 es una estrategia óptima del primer jugador entonces ξ '0 P j = v . Análogamente si la fila Q’ i es relevante y η 0 es una estrategia óptima del segundo jugador entonces Q'i η 0 = v . Comentario importante: nótese que por ser ξ 0 una estrategia óptima se cumple que v = Λ E (G ) (ξ 0 ) =
Mín
ξ 0 ' P j , luego ξ ' 0 P j ≥ v para toda columna sea ésta relevante j ∈ {1,..., n} o no. Análogamente, por ser η 0 una estrategia óptima para el segundo jugador se
cumple que Q'i η 0 ≤ v para toda fila, sea ésta relevante o no. Para las filas y columnas relevantes se da la igualdad. Tenemos así un criterio para determinar si una columna Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 15
(fila) es o no relevante. Si su producto por alguna estrategia óptima del jugador correspondiente no coincide con el valor del juego podemos asegurar que la columna (fila) es irrelevante. Teorema 3: Sea G un juego matricial de matriz A de dimensiones mxn. Entonces, las estrategias óptimas de los jugadores son una mixtura de a lo sumo min{m,n} estrategias puras. 7.2 Domin ancia y admisib ilid ad Buscamos la eliminación de filas o columnas de la matriz de modo que los conjuntos de estrategias óptimas de los jugadores no se vean afectados. COLUMNA QUE DOMINA ESTRICTAMENTE A OTRA: Se dice que la columna Pj domina estrictamente a la columna Pk si todas los elementos de la columna Pj son menores que los correspondientes elementos de la columna Pk. FILA QUE DOMINA ESTRICTAMENTE A OTRA: Se dice que la fila Q’j domina estrictamente a la fila Q’i si todas los elementos de la fila Q’j son mayores que los correspondientes elementos de la fila Q’i. Teorema 4: Si la columna Pj (fila Q’j) domina estrictamente a la columna Pk (fila Q’i) entonces la columna Pk (fila Q’i) es irrelevante. Teorema 5: Si una columna (fila) está dominada estrictamente por una combinación lineal convexa de otras columnas (filas) entonces la columna (fila) es irrelevante. Corolario: Si de una matriz se eliminan las filas y las columnas dominadas estrictamente, los conjuntos de estrategias óptimas de los dos jugadores permanecen inalterados ya que las columnas y filas eliminadas no jugaban ningún papel en ninguna estrategia óptima de ninguno de los dos jugadores. También permanece inalterado el valor del juego. COLUMNA DOMINADA POR OTRA COLUMNA: Se dice que la columna Pj está dominada por la columna Pk si todos los elementos de la columna Pk son menores o iguales que los correspondientes elementos de la columna Pj y al menos una de las desigualdades es estricta. FILA DOMINADA POR OTRA FILA: Se dice que la fila Q’i está dominada por la fila Q’j si todos los elementos de la fila Q’i son menores o iguales que los correspondientes elementos de la fila Q’j y al menos una de las desigualdades es estricta. Corolario: Si de una matriz se eliminan las filas y las columnas dominadas el valor del juego permanece inalterado. Además, cualquier estrategia óptima del juego una vez eliminadas las columnas o las filas también es una estrategia óptima del juego original aunque es posible que el conjunto de estrategias óptimas del juego original se haya visto reducido por el hecho de que algunas estrategias óptimas estaban dominadas por otras (pero no estrictamente). ESTRATEGIA MIXTA DOMINADA Y ESTRICTAMENTE DOMINADA: Sea G=(X,Y,M) un juego y sea E(G)=(X*,Y*,M) su extensión mixta. Se dice que la estrategia η 1 ∈ Y * está dominada estrictamente por la estrategia η 0 si M ( x,η 0 ) < M ( x,η 1 ) ∀ x ∈ X . Asimismo, se dice que la estrategia η 1 ∈ Y * está ⎧ M ( x,η 0 ) ≤ M ( x,η 1 ) ∀ x ∈ X . dominada por la estrategia η 0 si ⎨ ( ) ( ) ∃ ∈ < x X M x η M x η : , , 0 1 ⎩
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 16
Paralelamente, se dice que la estrategia ξ 1 ∈ X * está dominada estrictamente por la estrategia ξ 0 si M (ξ 0 , y ) > M (ξ 1 , y ) ∀ y ∈ Y . Asimismo, se dice que la estrategia ⎧ M (ξ 0 , y ) ≥ M (ξ 1 , y ) ∀ y ∈ Y ξ 1 ∈ X * está dominada por la estrategia ξ 0 si ⎨ . ⎩∃ y ∈ Y : M (ξ 0 , y ) > M (ξ 1 , y ) ESTRATEGIA ADMISIBLE: Sea G=(X,Y,M) un juego y sea E(G)=(X*,Y*,M) su extensión mixta. Se dice que la estrategia η 1 ∈ Y * es admisible si no está dominada por ninguna otra estrategia de J 2. Asimismo, se dice que la estrategia ξ 1 ∈ X * es admisible si no está dominada por ninguna otra estrategia de J 1. Teorema 6: En todo juego matricial siempre existe al menos una estrategia óptima para cada jugador que es admisible. Teorema 7: Sea A la matriz de un juego rectangular y sea B la matriz del juego que resulta de eliminar aquellas filas y columnas que están dominadas por otras estrategias; entonces se verifica que las estrategias admisibles de los conjuntos O(J 1;A) y O(J1;B) son idénticas (y lo mismo para J 2). Comentarios importantes: • Si una estrategia óptima ξ 0 ∈ X * está dominada por otra estrategia ξ 1 ∈ X * , entonces ξ 1 ∈ X * es una estrategia óptima. Es decir, una estrategia óptima sólo puede estar dominada por otra estrategia óptima. • Una estrategia óptima ξ 1 ∈ X * no puede estar estrictamente dominada por ninguna otra estrategia. En efecto, hemos visto que la estrategia ξ 1 ∈ X * está dominada estrictamente por la estrategia ξ 0 si M (ξ 0 , y ) > M (ξ 1 , y ) ∀ y ∈ Y . Esto implica que
mín
mín M (ξ 0 , y ) > M (ξ 1 , y ) lo que supone que ξ 1 ∈ X * no y ∈ Y y ∈ Y
es una estrategia óptima. En consecuencia, cuando eliminamos las columnas y las filas estrictamente dominadas, no estamos eliminando ninguna estrategia óptima ya que ninguna estrategia óptima está estrictamente dominada por ninguna otra (ni siquiera por una óptima). Si eliminamos columnas o filas dominadas (no estrictamente) estamos eliminando aquellas estrategias óptimas que están dominadas –pero no estrictamente- por otras estrategias –que necesariamente deben ser óptimas-, esto es, estamos eliminando estrategias óptimas inadmisibles. En resumen: • Si eliminamos filas y columnas estrictamente dominadas, el valor del juego y las estrategias óptimas de ambos jugadores permanecen inalteradas. • Si eliminamos filas y columnas dominadas, el valor del juego permanece inalterado, pero las estrategias óptimas de ambos jugadores pueden verse modificadas; no obstante, el conjunto de estrategias óptimas admisibles de ambos jugadores permanece inalterado. 7.3 Juegos com pletamente mixto s ESTRATEGIA ÓPTIMA COMPLETAMENTE MIXTA: Una estrategia óptima es completamente mixta si todos sus componentes son estrictamente positivos, esto es, si la estrategia óptima es una mixtura de todas las estrategias puras del jugador. En caso de que exista una estrategia óptima completamente mixta todas las columnas (si se trata de J2) o todas las filas (si se trata de J 1) son relevantes.
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 17
Teorema 8: Sea A la matriz de un juego de dimensiones mxn cuyo valor es v(A)=0. Si toda estrategia óptima de J 1 es completamente mixta, entonces el rango de la matriz A satisface m − 1 ≤ r ( A) ≤ n − 1 y si el rango de A es m-1, entonces J1 tiene exactamente r una estrategia óptima ξ 0 tal que ξ '0 A = 0 . Teorema 9: Si A es la matriz de un juego de dimensiones mxn con m>n entonces existe una estrategia óptima de J 1 que no es completamente mixta. Teorema 10: Si A es una matriz cuadrada de orden n y si existe una estrategia óptima para J2 que no es completamente mixta entonces J 1 posee una estrategia óptima que no es completamente mixta. JUEGO RECTANGULAR COMPLETAMENTE MIXTO: Un juego matricial se dice completamente mixto si todas las estrategias óptimas de los jugadores son completamente mixtas. Teorema 11: Sea G un juego rectangular de matriz A y de dimensiones mxn con valor del juego cero. Una condición necesaria y suficiente para que el juego sea completamente mixto es que se cumplan las tres condiciones siguientes: • m=n • r(A)=n-1 • Todos los elementos A ij de la matriz adjunta A * son del mismo signo y no nulos Comentario importante: Nótese que si un juego es completamente mixto se cumplen las condiciones del teorema 8 (y del simétrico para J 2) de modo que J 1 tiene exactamente r una estrategia óptima ξ 0 tal que ξ '0 A = 0 y J2 tiene exactamente una estrategia óptima r
tal que Aη 0 = 0 . Teorema 12: Sea A, matriz cuadrada de orden n, la matriz de un juego completamente mixto GA y sea v el valor del juego. Entonces el valor del juego viene dado por η 0
v=
A *
J ' n A J n
, la única estrategia óptima de J 1 es ξ ' 0 = vJ ' n A −1 y la única estrategia
óptima de J 2 es η 0 = vA−1 J n . Comentario final: Hemos obtenido que los juegos completamente mixtos -es decir, aquellos que cumplen que todas sus estrategias óptimas utilizan todas las estrategias puras de los jugadores- tienen una sola solución óptima para J 1 y una sola solución óptima para J 2.
TEMA 8. EL MÉTODO DE LAS SUBMATRICES En el tema 5 se ha mostrado que los conjuntos de estrategias óptimas para un juego matricial O(J1,A) y O(J2,A) son no vacíos. Asimismo, en el tema 7 se ha mostrado (teorema 1) que los conjuntos de estrategias óptimas O(J 1,A) y O(J2,A) de un juego rectangular de matriz A son subconjuntos convexos y compactos de R m y R n respectivamente. En este tema se va a mostrar (teorema de Shapley y Snow) que los conjuntos O(J1,A) y O(J2,A) son de tipo poliédrico, es decir, tienen un número finito de puntos extremos. En este tema se estudiará también un procedimiento sistemático para determinar todos los puntos extremos de O(J 1,A) y O(J2,A), que se conoce como “método de las submatrices”. 8.1 Soluc ion es simpl es SOLUCIÓN SIMPLE DE UN JUEGO EN FORMA NORMAL: Sea G=(X,Y,M) un juego bipersonal de suma cero y sean ξ * ∈ X * y η * ∈ Y * estrategias mixtas de J 1 y J2
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 18
respectivamente tales que M (ξ * , y ) = M ( x,η * ) = c ∀ x ∈ X ∀ y ∈ Y . Entonces al par (ξ * ,η * ) se le denomina una solución simple de G. Resulta obvio que inf sup Λ E (G ) (ξ * ) = M (ξ * ,y ) = c y que γ E (G ) (η * ) = M ( x,η * ) = c y como y ∈ Y
sup
* ( ) * E (G ) = * Λ E (G ) ξ = λ E (G ) ≤ V
ξ ∈ X
x ∈ X
inf η ∈ Y *
γ E (G ) (η ) , se deduce que el juego tiene valor –
concretamente su valor es c- en estrategias mixtas y que (ξ * ,η * ) es una estrategia óptima. Es decir, toda solución simple es un par de soluciones óptimas para ambos jugadores. SOLUCIÓN SIMPLE DE UN JUEGO MATRICIAL: Sea A la matriz de un juego rectangular y sean ξ 0 y η * soluciones óptimas de J 1 y J2 respectivamente. Se dice que el par ( ξ 0 , η * ) es una solución simple de la matriz A si se verifica que ⎧ ξ '0 P j = c ∀ j ∈ {1,..., n} , siendo M ξ * , y = M x,η * = c ∀ x ∈ X ∀ y ∈ Y , es decir, si ⎨ * { } = ∀ ∈ Q η c i m ' 1 ,..., ⎩ i c el valor del juego. Comentario: como se deduce fácilmente, todas las soluciones simples son óptimas pero no todas las soluciones óptimas son simples. De hecho, toda solución óptima ( ξ 0 , η * ) ⎧ ξ ' P ≥ c ∀ j ∈ {1,..., n} debe cumplir que ⎨ 0 j* . Si se da la igualdad, entonces tenemos una { } ≤ ∀ ∈ Q η c i m ' 1 ,..., ⎩ i solución simple. Teorema 1: Sea A una matriz cuadrada de orden n y no singular y sea A *=(Aij) la matriz adjunta. Una condición necesaria y suficiente para que la matriz A tenga alguna n
n
j =1
i =1
solución simple es que las cantidades Ri = ∑ Aij i = 1,2,..., n y C j = ∑ Aij j = 1,2,..., n sean del mismo signo. Además se tiene que: v=
A
∑ C
j
j
⎛ R1 ⎞ ⎟ ξ 0 = ... ⎜ ⎟ ∑i Ri ⎜⎝ Rn ⎠⎟ ⎛ C 1 ⎞ 1 ⎜ ⎟ η * = ⎜ ... ⎟ C ∑ j j ⎜⎝ C n ⎠⎟
1 ⎜
Corolario: Si una matriz cuadrada no singular admite soluciones simples, estas soluciones simples son las únicas soluciones óptimas del juego correspondiente. 8.2 Teorema de Shapley-Snow Teorema 2: TEOREMA DE SHAPLEY-SNOW: Sea G un juego matricial de matriz A y de dimensiones mxn, cuyo valor es v<>0. Entonces, el conjunto de estrategias óptimas extremas –esto es, el conjunto de puntos extremos de O(J 1,A) y O(J2,A)- es finito. Una pareja de estrategias óptimas ( ξ 0 , η * ) son puntos extremos de O(J 1,A) y O(J2,A)
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 19
respectivamente si y sólo si la matriz A posee una submatriz cuadrada no singular B para la cual ( ξ 0 B , η B* ) es una solución simple de B, en donde ξ 0 B es el vector que se obtiene de ξ 0 eliminando aquellas componentes que corresponden a las filas eliminadas al obtener B de A y η B* es el vector que se obtiene de η * eliminando aquellas componentes que corresponden a las columnas eliminadas al obtener B de A. Observaciones: Si el valor del juego es 0 se puede añadir una constante a todos los elementos de la matriz, lo que no altera los conjuntos de estrategias óptimas –aunque sí el valor del juego- y de ese modo se consiguen las condiciones para aplicar el teorema. Por otra parte, como el número de matrices cuadradas de A que admiten soluciones simples es finito, y cada una de ellas caracteriza de modo único una estrategia óptima extrema en el conjunto de estrategias óptimas, los subconjuntos O(J 1,A) y O(J2,A) quedan perfectamente caracterizados como conjuntos convexos, compactos y poliédricos. 8.3 Método pr áctico d e determinar tod as las soluc iones El método práctico consiste, por tanto, en estudiar todas las matrices cuadradas de la matriz A y determinar sus soluciones simples. El esquema es el siguiente: Paso I: Nos aseguramos de que el valor del juego es distinto de cero. Si no lo es, añadimos una constante a todos los elementos de la matriz A. Conviene añadir un elemento tal que todos los elementos de la nueva matriz tengan el mismo signo – digamos positivo-. Paso II: Se examinan las matrices 1x1 y se determina su optimalidad, lo cual equivale a analizar si la matriz posee un punto de silla. Paso III: Se examinan todas las matrices no singulares de orden 2. Paso IV:Se escogen aquellas matrices no singulares de orden 2 que admiten soluciones simples (mediante la aplicación del teorema 1). Si admite soluciones simples se pasa al paso V. En caso contrario, la matriz se desecha. Paso V: Las soluciones simples (determinadas por el teorema 1) del paso IV se completan con ceros en los lugares correspondientes y se comprueba si, en efecto, son soluciones óptimas de la matriz A. Paso VI. Si son óptimas hemos conseguido (por el teorema de Shapley-Snow) una estrategia óptima extrema. En caso contrario se examinan las matrices no singulares de orden 3. Paso VII. Se continúa el proceso hasta examinar todas las submatrices de orden min{m,n} y así se obtienen todos los puntos extremos de los conjuntos de estrategias óptimas de los dos jugadores.
TEMA 9. ALGUNOS TIPOS PARTICULA RES DE JUEGOS 9.1 Juegos si métrico s JUEGO SIMÉTRICO: Un juego bipersonal de suma cero G=(X,Y,M) es simétrico si X=Y y para todo x ∈ X y para todo y ∈ Y se verifica que M ( x, y ) = − M ( y, x ) , es decir, si ambos jugadores tienen el mismo conjunto de estrategias puras y reciben los mismos pagos cuando se intercambian las estrategias (de aquí el signo’-‘). JUEGO MATRICIAL SIMÉTRICO: Un juego matricial G, cuya matriz es A se dice simétrico si la matriz A es antisimétrica, es decir, A t = − A .
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 20
Teorema 1: Sea G un juego matricial simétrico. Entonces su valor es cero y toda estrategia óptima de J 1 es óptima de J 2 y recíprocamente. Teorema 2: Un juego simétrico en el que el orden n de la matriz es par no puede ser completamente mixto. 9.2 Simetrización de juegos A cualquier juego se le puede asociar un juego simétrico mediante una correspondencia que relaciona también los conjuntos de estrategias óptimas del juego con las del juego simétrico asociado. En particular, existen dos métodos propuestos para la simetrización de juegos matriciales de dimensión mxn Teorema 3 (PRIMER MÉTODO DE SIMETRIZACIÓN): Sea G A un juego matricial de matriz A de dimensión mxn, cuyo valor es v A>0. Entonces el juego G B cuya matriz de pago es la matriz antisimétrica B de orden m+n+1 definida por − J m ⎞ A ⎛ 0 r ⎜ ⎟ B = ⎜ − A t J n ⎟ es tal que si W 0 = (u1 ,..., u m , v1 ,..., v n ,θ )' es una estrategia 0 ⎜ J ' 0 ⎠⎟ ⎝ m − J ' n '
⎛ u u u ⎞ óptima de GB, entonces ∑ u i = ∑ v j = a > 0 y ξ 0 = ⎜⎜ 1 , 2 ,..., m ⎟⎟ y a ⎠ i =1 j =1 ⎝ a a m
n
'
⎛ v v v ⎞ θ η = ⎜⎜ 1 , 2 ,..., n ⎟⎟ son estrategias óptimas de J 1 y de J2 en GA. Además v A = . a ⎠ a ⎝ a a *
Recíprocamente, si ξ 0 y η * son estrategias óptimas de J 1 y de J2 en GA, entonces r 1 (ξ 0 ,η * , v A )' es óptima de G B. W 0 = 2 + v A Teorema 4 (SEGUNDO MÉTODO DE SIMETRIZACIÓN): Sea A una matriz de dimensión mxn. Se considera la matriz B=(b pq ) de orden mn en donde r b(i −1)n + j ,(k −1)n+ l = ail − akj . Entonces B es antisimétrica. Además si λ = (λ 1 ,..., λ mn ) es una estrategia óptima del juego cuya matriz es B, entonces los vectores ξ y η definidos por ξ = ( x1 ,..., x m )
t
n
m
j =1
i =1
y η = ( y 1 ,..., y n ) donde xi = ∑ λ (i −1)n + j e y j = ∑ λ (i −1)n + j son t
estrategias óptimas de J 1 y J2 respectivamente en el juego de matriz A. 9.3 Juegos matric iales paramétrico s Vamos a considerar juegos matriciales en los que la matriz de pagos A depende de un parámetro vectorial θ que varía en cierta región del espacio euclídeo R k . JUEGO MATRICIAL PARAMÉTRICO: Es un juego matricial en el que la matriz de pagos A depende de un parámetro vectorial θ que varía en cierta región del espacio euclídeo R k , es decir Gθ = ( I m , I n , A(θ )) . Vamos a estudiar las propiedades de la familia de juegos {Gθ } y en particular el comportamiento del valor del juego y de las estrategias óptimas como función de θ . Teorema 5: Si la familia de juegos {Gθ } es tal que los elementos aij (θ ) de la matriz A(θ ) son funciones continuas de θ , entonces v(Gθ ) = vθ es una función continua de θ .
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 21
Además las funciones O( J 1 ;θ ) = O( J 1 ; A(θ )) y O( J 2 ;θ ) = O( J 2 ; A(θ )) que para cada θ definen el conjunto de soluciones óptimas de J 1 y J2 respectivamente. Teorema 6: Si la familia de juegos {Gθ } es tal que los elementos aij (θ ) de la matriz A(θ ) , donde Ω es un intervalo de la recta real, son funciones monótonas crecientes (decrecientes) de θ , entonces v(Gθ ) = vθ es una función monótona creciente (decreciente) de θ . Además si todos los aij (θ ) lo son estrictamente, también lo es v(Gθ ) = vθ . El método sistemático para la determinación de las funciones v(Gθ ) = vθ ; O ( J 1 ;θ ) = O( J 1 ; A(θ )) y O( J 2 ;θ ) = O( J 2 ; A(θ )) es el método de las submatrices convenientemente modificado para recoger la variabilidad del parámetro θ .
TEMA 10. PROGRAMACIÓN LINEAL Y TEORÍA DE JUEGOS 10.1 Idea de la programación lin eal Visto en Métodos De Programación Matemática . 10.2 Dualidad Visto en Métodos De Programación Matemática . 10.3 Paso de un juego a un pro grama lineal El problema de determinar las estrategias óptimas de los dos jugadores de un juego matricial se puede reducir a sendos problemas de programación lineal con la característica adicional de que éstos son duales. Razonando desde el punto de vista de J 1, si el primer jugador elige una estrategia mixta ξ ' = ( x1 ,..., x m ) puede garantizarse que el pago que va a obtener será mayor o igual que un cierto valor α . El valor del juego matricial es el máximo de los α que el primer jugador se puede garantizar. Así, el problema de J 1 se puede resumir en: Maximizar α r Sujeto a ξ ' P j ≥ α ; ξ ' J m = 1 (es decir, la suma de los x i debe ser 1); ξ ≥ 0 (todos los xi deben ser no negativos). A partir de la formulación de este problema lineal conviene eliminar de los lados derechos de las restricciones la constante α . Así, la restricción ξ ' P j ≥ α se convierte en
1 α
ξ ' P j ≥ 1
variables u i =
⎛ x1 x m ⎞ ,..., ⎟ P j ≥ 1 . Si definimos las nuevas α α ⎠ ⎝
o lo que es lo mismo ⎜ xi α
∀i ∈ {1,..., m} la restricción queda (u1 ,..., u m ) P j ≥ 1 .
Procediendo análogamente, la restricción ξ ' J m = 1 se convierte en (u1 ,..., u m ) J m = podemos sustituir la maximización de α por la minimización de
1 α
1 α
y
.
Así, el problema lineal transformado para J 1 es:
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 22
Minimizar (u1 ,..., u m ) J m =
1 α
r
Sujeto a (u1 ,..., u m ) P j ≥ 1 y (u1 ,..., u m ) ≥ 0 Razonando ahora desde el punto de vista de J 2, si elige una estrategia mixta η = ( y1 ,..., y n ) tiene que Q' i η ≤ β , siendo β el pago máximo que le garantiza la estrategia η = ( y1 ,..., y n ) elegida. Lógicamente, J2 busca minimizar β eligiendo la estrategia η = ( y1 ,..., y n ) más adecuada. En otras palabras, J 2 persigue: Minimizar β r Sujeto a J ' n η = 1 ; Q 'i η ≤ β y η ≥ 0 Nuevamente conviene modificar las restricciones y la función objetivo para que el problema lineal sea de más fácil resolución mediante el algoritmo del simplex. 1 Así, la restricción Q'i η ≤ β se convierte en Q'i η ≤ 1 o lo que es equivalente β
⎛ y1 ⎞ ⎜ ⎟ ⎜ β ⎟ y j Q ' i ⎜ ... ⎟ ≤ 1 . Si ahora definimos las nuevas variables w j = tenemos que la β ⎜ y n ⎟ ⎜ β ⎟ ⎝ ⎠ ⎛ w1 ⎞ ⎜ ⎟ restricción Q' i η ≤ β se convierte en Q' i ⎜ ... ⎟ ≤ 1. ⎜w ⎟ ⎝ n ⎠ ⎛ w1 ⎞ ⎜ ⎟ 1 Por su parte la restricción J ' n η = 1 se convierte en J ' n ⎜ ... ⎟ = . La función objetivo ⎜ w ⎟ β ⎝ n ⎠
pasa de ser la minimización de β a la maximización de
1 β
. En resumen, el programa
lineal para el jugador J2 es el siguiente: ⎛ w1 ⎞ ⎜ ⎟ 1 Maximizar J ' n ⎜ ... ⎟ = ⎜ w ⎟ β ⎝ n ⎠ ⎛ w1 ⎞ ⎛ w1 ⎞ ⎜ ⎟ ⎜ ⎟ sujeto a: Q'i ⎜ ... ⎟ ≤ 1 y ⎜ ... ⎟ ≥ 0 ⎜w ⎟ ⎜w ⎟ ⎝ n ⎠ ⎝ n ⎠
10.4 Equi valencia entre juegos y p rog ramas lin eales Hemos visto como todo juego matricial se puede convertir en sendos programas lineales que son duales. En este apartado vamos a ver que todo programa lineal (y su dual) puede convertirse en un juego matricial simétrico. Dado el problema de programación lineal siguiente: rr Maximizar c x
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 23
r
⎡ 0 − A c ⎤ r r r r r sujeto a x t A ≤ b y x ≥ 0 consideremos el juego G B de matriz B = ⎢⎢ A t 0 − b ⎥⎥ . El r r t ⎢⎣− c b t 0 ⎥⎦
juego es simétrico y por tanto su valor es cero; además las estrategias óptimas de los dos jugadores son idénticas. Una estrategia del juego vendrá dada por x1 ,..., x m , y 1 ,..., y n , λ . Teorema 6: El juego G B posee una estrategia óptima para la cual λ es mayor que 0 si y sólo si el programa lineal y su dual son factibles y acotados, es decir, poseen solución. 10.5 Exposic ión p ráctica del método del sim plex Visto en Métodos De Programación Matemática .
TEMA 11. S-JUEGOS Y EXTENSIONES 11.1 Defini ción y p rop iedades 11.2 Extensió n d el teorema del min imax 11.3 Relació n c on la teoría de la decisió n
Teoría de Juegos. Primera prueba. Ciencias Matemáticas. UNED.
Página 24