Teoría De Juegos César Morán Navarro Escuela de ingeniería informática, Universidad nacional de Piura- Prodeunp Paita Paita, Perú.
I.
determina en qué momento esas acciones están disponibles. c. Información: es el conocimiento, en un determinado momento, de los valores de las distintas variables, los distintos valores que el jugador cree que son posibles. d. Estrategias: es un conjunto de acciones a tomar en cada momento del juego dada la información disponible. Las estrategias se caracterizan por contener elementos de incertidumbre que conllevan a cada jugador a asignar probabilidades a los diferentes resultados del juego. e. Recompensa: es la utilidad que reciben los jugadores al completar el juego, la evaluación posterior a la realización de la acción sobre si el objetivo buscado fue alcanzado. También es importante la recompensa esperada, ya que es ésta en realidad la que motiva la acción. f. Resultado: son las conclusiones que el modelador obtiene una vez que el juego se ha jugado. El resultado de un juego para cada jugador al final del mismo se denomina “ pago”. Estos pueden ser medidos en términos de utilidad o bienestar.
INTRODUCCION
El presente documento nos dará a conocer conceptos concretos sobre sobre la teoría teoría de juegos, la forma de representarse, algunos tipos y ejemplos más conocidos ya que es una herramienta sumamente importante para la teoría económica y ha contribuido a comprender más adecuadamente la conducta humana frente a la toma de decisiones. decisiones . II.
DESARROLLO DE CONTENIDOS
i.
Concepto de Teoría de juegos
La teoría de juegos es una rama de la economía que estudia las decisiones en las que para que un individuo tenga éxito tiene que tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en la situación. La teoría de juegos es una herramienta de análisis económico usada para estudiar problemas caracterizados por la interacción estratégica entre agentes económicos. La teoría de juegos puede ser utilizada para analizar juegos sencillos, problemas de mercados oligopólicos y hasta de negociación política como en el diseño y ubicación de un sistema antimisiles. Todos estos juegos se caracterizan por la interacción entre las decisiones de los agentes y como esas decisiones no solo afectan al jugador que realiza la decisión sino también a otros jugadores envueltos en el problema. ii.
Elementos de un juego
a. Jugadores: son entes decidores que tratan de obtener el mejor resultado posible, o sea maximizar su utilidad. utilidad. b. Acciones: son todas las opciones que el jugador tiene disponible para alcanzar el objetivo buscado. El orden del juego
iii.
Representación de un juego
Los juegos pueden ser representados de manera extensiva, en forma de Árbol, o de manera normal, en forma matricial o tabular. a. Forma normal de un juego: la forma normal (o forma estratégica) de un juego es una matriz una matriz de pagos, que pagos, que muestra los jugadores, las estrategias, y las recompensas. Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan simultáneamente o, al menos, sin saber la elección que toma el otro.
Tabla 1 Ejemplo de estrategia dominante
Img. 1 Ejemplo de forma normal b.
Forma extensiva de un juego:
la
representación de juegos en forma extensiva modela juegos con algún orden que se debe considerar. Los juegos se presentan como árboles. como árboles. Cada vértice Cada vértice o nodo representa un punto donde el jugador toma decisiones. Los juegos en forma extensiva pueden modelar también juegos de movimientos simultáneos.
Estrategia dominante de A: Música Estrategia dominante de B: Estudiar En consecuencia, (Música, Estudiar) es un equilibrio de Nash.
c. Equilibrio múltiple de Nash: Ocurre cuando existen más de dos equilibrios en un juego.
Tabla 2 Ejemplo de equilibrio múltiple
a. Como se puede apreciar ninguno de los dos jugadores posee una estrategia dominante. No obstante, dada la dentición de equilibrio de Nash, (Música, Estudiar) y (Estudiar, Música) constituyen dos equilibrios de Nash.
Img. 2 Ejemplo de forma extensiva
iv.
d. Juegos sin equilibrio de Nash en estrategias puras: en este juego, no
Equilibrio de Nash
a. Concepto: la definición para el equilibrio de Nash se restringe al caso de un equilibrio en estrategias puras; es decir, es un equilibrio en donde ambos jugadores escogen una y solo una estrategia. Cada jugador conoce y ha adoptado su mejor estrategia, y todos conocen las estrategias de los otros. Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demás jugadores. b. Equilibrio en estrategias dominantes: ocurre cuando ambos jugadores tienen cada uno una estrategia dominante.
existe una estrategia dominante para ninguno de los jugadores ni existe un equilibrio de Nash en estrategias puras.
Tabla 3 Ejemplo de juego sin equilibrio
v.
Tipos de Juegos
a. Juegos simétricos y asimétricos: Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular dependen sólo de las estrategias que empleen los otros jugadores y no de quien las juegue. Si las identidades de los jugadores pueden
cambiarse sin que cambien las recompensas de las estrategias, entonces el juego es simétrico. Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias idénticas para ambos jugadores. Por ejemplo, el juego del y el juego del ultimátum dictador tienen diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con estrategias idénticas para cada jugador. b. Juegos de suma cero y suma distinta de cero: En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, El go, el ajedrez, el ajedrez, el el póker póker y el juego el juego del oso son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. La mayoría de los ejemplos reales en negocios y política, al igual que el dilema el dilema del prisionero, prisionero, son juegos de suma distinta de cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la pérdida de otro. c. Juegos Un juego Un juego cooperativos: cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está muy relacionada con la estabilidad. d. Juegos simultáneos y secuenciales: Los juegos simultáneos simultáneos son juegos juegos en los que los jugadores mueven simultáneamente o en los que éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones previas. La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar
juegos simultáneos, y la extensiva para representar juegos secuenciales. e. Juegos de información perfecta: los juegos de información perfecta son un subconjunto importante de los juegos secuenciales. Un juego es de información perfecta si todos los jugadores conocen los movimientos que han efectuado previamente todos los otros jugadores; así que sólo los juegos secuenciales pueden ser juegos de información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo ninguno) conocen las acciones del resto. La información perfecta se confunde a menudo con la información completa, que es un concepto similar. La información completa requiere que cada jugador conozca las estrategias y recompensas del resto pero no necesariamente las acciones f. Juegos de longitud infinita: los juegos estudiados por los economistas y los juegos del mundo real se finalizan generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas restricciones y la teoría la teoría de conjuntos estudia juegos de infinitos movimiento, donde el ganador no se conoce hasta que todos los movimientos se conozcan. g. Juegos combinatorios: combinatorios: los juegos en los que la dificultad de encontrar una estrategia óptima proviene de la multiplicidad de movimientos posibles se denominan juegos combinatorios. Algunos ejemplos de estos juegos pueden ser ajedrez y go. Los juegos que implican información imperfecta o incompleta también pueden tener un fuerte carácter combinatorio. h. Juegos discretos y continuos: c ontinuos: gran parte de la teoría de juegos se refiere a juegos finitos y discretos, que tienen un número finito de jugadores, movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos pueden extenderse. Los juegos continuos permiten a los jugadores elegir elegir una estrategia estrategia a partir de de un conjunto de estrategias continuas. Por ejemplo, la competición de Cournot se modela típicamente con las estrategias de
los jugadores cualesquiera cantidades no negativas, incluyendo cantidades fraccionarias. i. Juegos diferenciales: los juegos diferenciales como el juego de búsqueda continua y evasión son juegos continuos donde la evolución de las variables de estado de los jugadores se rige por ecuaciones diferenciales. El problema de encontrar una estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo. j. Juegos de muchos jugadores y poblaciones: los juegos con un número arbitrario, pero finito, de jugadores a menudo se denominan juegos de la n persona. La teoría evolutiva evolutiva de los juegos considera los juegos que involucran a una población de tomadores de decisiones, donde la frecuencia con la que se toma una decisión particular puede cambiar con el tiempo en respuesta a las decisiones tomadas por todos los individuos de la población. k. Metagames: estos son juegos en los que se trata de desarrollar las reglas para otro juego, el objetivo o el jugador. Los metagames Los metagames buscan buscan maximizar el valor de utilidad del conjunto de reglas desarrollado. La teoría de los metagames está relacionada con la teoría del diseño del diseño de mecanismos III.
frecuentemente en la sociedad. El dilema del prisionero se usa como ejemplo del clásico conflicto entre intereses individuales y colectivos de quienes toman decisiones, y también para justificar los beneficios beneficios de la colaboración. b. Explicación:
Dos individuos hicieron un atraco a un banco y son capturados por la policía. No existen pruebas de que asaltaran al Banco. La única forma de condenarlos es que uno de ellos incrimine al otro. Si ninguno de los prisioneros delata, sólo se les condenará a 1 año de cárcel. Si ambos confiesan, recibirán una sentencia de 10 años de cárcel cada uno. Si uno confiesa (y aporta pruebas para condenar al otro) y el otro no confiesa, el que confiesa sale en libertad y aquel que no confiesa recibe una condena de 15 años.
c. ¿Por qué es un dilema?
Situación estratégica en la que cada uno de los dos jugadores tiene una estrategia dominante, pero jugar este par de estrategias conduce a un resultado en el que ambas partes están peor de lo que estarían si jugaran estrategias alternativas y cooperaran. d. Matriz de pago del dilema del Prisionero:
EJEMPLOS DE JUEGOS
Para este tema nos centraremos en los ejemplos más clásicos para su posterior explicación y su mejor entendimiento de este tema. i. El dilema del Prisionero La Teoría de juegos se usa para analizar comportamientos estratégicos, donde hay dependencia mutua, es decir, donde hay que tener en cuenta el posible comportamiento de otros. Un ejemplo es el famoso Dilema del Prisionero, que suele atribuirse a A.W. Tucker (profesor de Nash). El Dilema del Prisionero ha sido profundamente estudiado por la Teoría de Juegos, ya que es un modelo de conflictos que ocurren
Tabla 4 Ejemplo de Matriz del Dilema del Prisionero
Cada jugador tiene una estrategia dominante: Delatar o confesar. La solución cuando los dos confiesan es el equilibrio no cooperativo, de Nash. Ninguno de los dos tiene incentivos para cambiar estrategias, dada la estrategia escogida por el otro.
otras en las que sólo los entreguen unos pocos. Lo importante es que al final f inal del cuatrimestre, la media de las entregas de todas las semanas supere el 80%.
Sin embargo, estos jugadores habrían estado mejor si se hubieran podido coludir. La alternativa cuando los dos callan es una solución cooperativa, pero inestable
e. Ejemplos de aplicación del dilema del prisionero en la vida real: En la vida
real tenemos muchos ejemplos de interacciones humanas y de interacciones naturales en las que se obtiene la misma matriz de resultados que en el dilema del prisionero. Por ello, el dilema del prisionero ha sido estudiado profundamente por la Teoría de Juegos. Vamos a ver ejemplos donde encontramos situaciones similares a las estudiadas en el dilema del prisionero y a analizar las posibles opciones y resultados del juego. f. Dilema del prisionero en la docencia: Un profesor al comienzo del curso propone un método de evaluación distinto al clásico de realizar un examen final al terminar el curso. Es beneficioso para los alumnos no tener que hacer un examen final, ya que en esa época tienen muchos exámenes y poco tiempo para estudiar todas las asignaturas. Este método consiste en la realización de una evaluación continua mediante la realización y entrega de ejercicios en grupos. Si la mayoría de los ejercicios están bien, no habrá examen final. Pero si los alumnos no se esfuerzan y los ejercicios no son buenos tendrán que hacer un examen al final de curso. Los alumnos deberán entregar ejercicios semanalmente. Consideraremos que los alumnos han trabajado cuando a lo largo de toda la evaluación continua, la media de los alumnos que han realizado bien los ejercicios es superior o igual al 80%. De esta forma, habrá semanas en las que entreguen los ejercicios muchos grupos y
Tabla 5 Matriz método de evaluación
Los alumnos tienen dos opciones ante este método de evaluación: pueden decidir todos esforzarse y hacer bien los ejercicios para librarse del examen final, o pueden “traicionar” a sus compañeros
y no esforzarse, dependiendo de esta forma su suerte de lo que hagan sus compañeros. Normalmente los alumnos intentarán aprobar la asignatura realizando el mínimo esfuerzo y pensarán que el resto de compañeros sí se esforzará para librarse del examen, beneficiándose de ello. El problema es que no se sabe si el resto se esforzará o todos pensarán lo mismo. Para ver las posibilidades, consideraremos uno de los grupos de la clase, que denominaremos grupo A. El grupo A puede pensar que todos los demás grupos decidirán esforzarse para librarse del examen, entonces para ese grupo la opción óptima sería no esforzarse. Serían los únicos que no entregarían unos buenos ejercicios, pero como los de todos los demás están bien, se librarían de hacer examen y aprobarían fácilmente, mientras que el resto de grupos ha tenido que trabajar durante todo el curso.
Si por el contrario, el grupo A piensa que el resto de grupos no se va a esforzar, lo mejor para ellos sería no esforzarse tampoco, ya que tendrían que hacer examen final, pero por lo menos no habrán trabajado durante el curso. Si todos los grupos deciden esforzarse y trabajar para entregar unos buenos ejercicios no tendrán que hacer examen final, y todos habrán trabajado durante el curso. Para todos los grupos él no esforzarse sería una estrategia dominante. Sea cual sea la estrategia del resto de grupos siempre consiguen no trabajar durante el curso. El problema es que esa estrategia no lleva a un resultado óptimo ya que si ninguno se esfuerza, no habrán trabajado durante el curso pero tendrán que hacer un examen final. Si todos los grupos piensan en el interés general, lo mejor sería que todos se esforzaran para no tener que hacer el examen final. Por lo tanto, al igual que en caso del dilema del prisionero, vemos que la estrategia dominante no lleva a una solución óptima, ya que el interés propio de cada uno de los grupos les lleva a este resultado.
g. Dilema del prisionero en el ciclismo: Otro ejemplo de un escenario similar al planteado en el dilema del prisionero ocurre a menudo en las carreras de ciclismo. Supongamos el caso de dos ciclistas, que a mitad de la carrera, se encuentran alejados del pelotón. El problema de ir alejados del pelotón es, que al estar en una posición delantera, no pueden refugiarse del viento. Normalmente ambos ciclistas compartirán la pesada carga de esta posición. Si ninguno de ellos hace un esfuerzo para permanecer delante, el pelotón les alcanzará rápidamente, perdiendo ambos la posibilidad de obtener ventaja en la
carrera. Si uno de los ciclistas hace todo el trabajo y mantiene a ambos alejados del pelotón, posiblemente esto llevará a una victoria del segundo ciclista que ha tenido una carrera fácil gracias al otro corredor y podrá obtener una mayor ventaja. Si ambos ciclistas realizan un esfuerzo por permanecer delante, ambos se cansarán. En este caso es posible que uno de ellos gane la carrera o simplemente que ambos estén muy cansados y sean alcanzados por el resto del pelotón. Esto suele ocurrir muy a menudo en las grandes carreras ciclistas, en las que corredores de un mismo equipo se sacrifican en beneficio del equipo, ya que uno de los ciclistas hace el esfuerzo para que otro corredor con mayores posibilidades gane gane la carrera.
Tabla 6 Matriz de ciclismo
Si los ciclistas actúan buscando su propio beneficio, el resultado será peor, ya que de esta forma no obtendrán ventaja. La estrategia óptima sería buscar el beneficio del grupo.
h. Dilema del prisionero en la ciencia Política: Otro ejemplo del dilema del prisionero podemos encontrarle en ciencias políticas. En este campo encontramos el escenario del dilema del prisionero cuando tenemos dos estados involucrados en una carrera de armas. Las opciones de ambos estados son: incrementar el gasto militar en armas para estar preparados para un conflicto, disponiendo en este caso de menos presupuesto para otras cosas, o llegar a un acuerdo con el otro estado para reducir el armamento y poder invertir ambos más dinero en investigación u otras cosas.
Si llegan a un acuerdo para reducir las armas ninguno de los dos estados estará seguro de que el otro cumplirá el trato, por lo tanto, ambos estados comprarán más armas para estar más preparados en caso de tener que enfrentarse a un conflicto. Ambos estados parecen actuar racionalmente, pero el resultado es irracional, ya que ambos gastarán más dinero en armamento innecesario.
Tabla 7 Matriz compra de armas
Dependiendo de cómo consideremos el juego, podemos tomarlo como secuencial o como simultáneo. Cuando yo tengo que decidir si Seguir o si Apartarme, sé que el otro, al menos hasta ahora, ha decidido Seguir. Porque si él hubiera decidido Apartarse, yo ya habría ganado. Así que desde este punto de vista es secuencial. Pero por el mismo motivo, sabemos que ambos jugadores seguiremos apurando la decisión hasta el ultimísimo momento, en que ya no podamos esperar más a ver qué hace el otro. Por lo tanto, todas las decisiones iniciales son triviales, sabemos que ambos decidiremos Seguir. La única decisión que importa es la que tomamos en el ultimísimo momento. Y por lo tanto, podemos considerarlo simultáneo (la forma más habitual).
c. Matriz de pago para el juego del
En este caso, al igual que en los demás ejemplos mostrados, el resultado óptimo se obtiene cuando se busca el beneficio del grupo y no el beneficio particular. Sin embargo, en una situación como la planteada, es difícil que se consiga la cooperación entre los estados.
Gallina:
Tabla 8 Ejemplo de Matriz del juego del Gallina
ii.
El juego del Gallina
a. Explicación: Dos automóviles se acercan frontalmente en una calle demasiado estrecha. Si uno se espanta y reduce su velocidad actúa como una gallina y pierde autoestima, mientras que el otro actúa como un tipo duro y gana autoestima. b. Características: Es un juego un juego simétrico. de suma cero. No es de suma existe una estrategia una estrategia No dominante para dominante para ninguno de los jugadores. Existen dos equilibrios de Nash en estrategias puras: Seguir/Apartar y Apartar/Seguir.
iii.
Este modelo da por supuesto que uno escoge una estrategia antes de empezar a jugar y se mantiene en la misma lo cual no es realista, ya que si un jugador ve que el otro gira pronto, puede seguir en línea recta, sin importar cuáles fueran sus planes iniciales. En este modelo, en contraste con el dilema el dilema del prisionero, prisionero, en el que una acción es siempre la mejor, uno siempre debe hacer lo contrario de lo que el otro jugador vaya a hacer. Guerra de Sexos
a. Explicación: El siguiente juego describe el estereotipo cultural de una pareja que
dispone de dos espectáculos alternativos donde pasar una velada, la ópera y el fútbol. Aunque ambos prefieren pasar juntos la velada, la mujer, que actúa como jugador I, prefiere la ópera; mientras que el hombre, que actúa como jugador II, prefiere ir al fútbol.
La Teoría de Juegos ha alcanzado un alto grado de sofisticación matemática y ha mostrado una gran versatilidad en la resolución de problemas. Muchos campos como la Economía, la Sociología, la política, la biología y la sicología se han visto beneficiados por las aportaciones de este método de análisis.
Algunas teorías buscan encontrar las estrategias racionales, que se utilizan en situaciones donde el resultado depende no solamente de las estrategias propias y las condiciones del entorno, sino también en las estrategias utilizadas por otros jugadores que posiblemente tienen objetivos objetivos distintos. distintos.
b. Matriz de pago para el juego Guerra de sexos:
Tabla 9 Ejemplo de Matriz del juego Guerra de sexos
Comprobar que este juego tiene dos equilibrios de Nash en estrategias puras que son (ópera, ópera) y (fútbol, fútbol). si ella conoce la matriz de pagos, es decir, las preferencias de él, el problema de coordinación desaparece. está muy claro que él elegirá siembre la estrategia fútbol, sea cual sea la elección de ella. sabiendo esto ella elegirá siempre la estrategia fútbol también, ya que prefiere estar con él aunque sea en el fútbol que estar sola aunque sea en la opera. la estrategia de ambos jugadores coincide. el resultado, marcado con un asterisco, es un óptimo, una solución estable, un punto de equilibrio de Nash. obsérvese que esta solución conduce a una situación estable de dominación social del jugador que podríamos calificar como el más más egoísta.
IV.
CONCLUSIONES
La teoría de juegos plantea como objetivo el análisis de los comportamientos estratégicos de los jugadores. En el mundo real, tanto en las relaciones económicas como en las políticas o sociales, son muy frecuentes las situaciones en las que, al igual que en los juegos, su resultado depende de la conjunción de decisiones de diferentes agentes o jugadores.
V.
REFERENCIAS
https://es.wikipedia.org/wiki/Teor%C3%ADa_d e_juegos
http://lateoriajuegos.blogspot.com/2011/12/tipohttp://lateoriajuegos.blogspot.com /2011/12/tipode-juegos-y-ejemplos.html
https://imarrero.webs.ull.es/sctm05/modulo1lp/5 /ffernandez.pdf
https://matesnoaburridas.files.wordpress.com/20 13/12/teoria-juegos_blog_entrada.pdf