Facultatea de Cibernetică, Statistică și Informatică Economică Academia de Studii Economice București
TEORIA JOCURILOR
~ APLICAȚII REZOLVATE ~
STUDENT: VASILE ELENA-VALENTINA
CSIE, SPECIALIZAREA CIBERNETICĂ ECONOMICĂ PROF. ÎNDRUMĂTOR: PROF. UNIV. DR. MIHAI DANIEL ROMAN
CUPRINS 1. Cuprins ...................................................................................................................................................... 2. JOCURI STATICE ÎN INFORMAȚIE COMPLETĂ ................................................................... .... 2.1. Potrivirea monedelor ( Matching pennies Game) .......................................................... 2.2. Vânătoarea cerbului ( Stag Hunt Game ) ............................................................................ 2.3. Porcii raționali ( Rational Pigs Game ) ................................................................................ 2.4. Parteneriatul ( Partnership Game ) ...................................................................................... 3. JOCURI DINAMICE ÎN INFORMAȚIE COMPLETĂ ................................................................... 3.1. Descurajarea ( The Detterence Game ) ............................................................................... 4. JOCURI STATICE ÎN INFORMAȚIE INCOMPLETĂ .................................................................. 4.1. Donații pentru comunitate ( Donations for the community ) ................................... 4.2. Tortul ( The Cake Game ) .......................................................................................................... 4.3. Holmes-Moriarty ( The Holmes-Moriarty Game ) ......................................................... 5. Bibliografie .............................................................................................................................................
2 3 3 4 5 7 9 9 11 11 14 17 19
A. JOCURI STATICE ÎN INFORMAȚIE COMPLETĂ
1. Potrivirea monedelor ( Matching pennies Game)
Potrivirea monedelor ( Matching pennies ) este numele unui joc simplu folosit în teoria jocurilor. Se realizează între doi jucători, Even și Odd. Fiecare jucător are un bănuț ( penny ) pe trebuie să îl întoarcă în secret pe cap sau pajură. Jucătorii își dezvăluie alegerile simultan. Dacă părțile banilor se potrivesc (ambele cap sau ambele pajură), atunci Even păstrează ambii banuți, deci câștigă unul de la Odd (+1 pentru Even, -1 pentru Odd). Dacă părț ile nu se potrivesc ( unul cap și unul pajură ) Odd păstrează ambele monezi, deci primește unul de la Even (-1 pentru Even, +1 pentru Odd).
ODD Cap
Pajură
Cap
+1 , -1
-1 , +1
Pajură
-1 , +1
+1 , -1
EVEN
Fig. 1 Matricea jocului
Matching Pennies este un joc cu sumă zero, deoarece câștigul unui jucător este exact egal cu pierderea celuilalt jucător. Jocul poate fi scris într-o matrice de compensare (imagine dreapta). Fiecare celulă a matricei arată plățile celor doi jucători, în primul rând fiind afișate plățile lui Even. Jocul este folosit în primul rând pentru a ilustra conceptul de strategii mixte și un echilibru Nash al strategiei mixte. Acest joc nu are un echilibru strategic Nash pur, deoarece nu există o strategie pură ( cap sau pajură) care să fie cel mai bun răspuns la cel mai bun răspuns. Cu alte cuvinte, nu există o pereche de strategii pure, astfel încât niciun jucător să nu vrea să schimbe, dacă i-ar spune ce ar face celălalt. În schimb, echilibrul unic Nash al acestui joc este în strategii mixte: fiecare jucător alege cap sau pajură cu probabilitate egală. În acest fel, fiecare jucător îl face pe celălalt indiferent între alegerea fațetelor monedei, astfel încât niciunul dintre jucători nu are un stimulent să încerce altă strategie. Cele mai bune funcții de răspuns pentru strategiile mixte sunt prezentate în figura de mai jos:
1y
0
1y
1x
1y
1x
0
Fig. 2 Cea mai potrivită pereche de răspunsuri
3
0
1x
Figura din stânga arată strategia pentru jucătorul Even, iar mijlocul arată strategia pentru jucătorul Odd. Singurul echilibru Nash este prezentat în graficul din dreapta. X reprezintă probabilitatea ca jucătorul Odd să aleagă cap, iar y reprezintă probabilitatea ca jucătorul Even să aleagă cap. Intersecția unică este singurul punct în care strategia lui Even reprezintă cel mai bun răspuns la strategia lui Odd și invers. Când oricare dintre jucători joacă echilibrul, câștigul așteptat al fiecăruia este zero.
2. Vânătoarea cerbului ( Stag Hunt Game )
Jocul Vânătoarea cerbului se bazează pe o discuție din partea filosofului Jean -Jacques Rousseau. Este un joc despre cooperarea socială. Imaginați-vă că dumneavoastră și un tovarăș sunteți la vânătoare. Fiecare dintre voi are posibilitatea de a urmări un iepure sau un cerb. Cerbul este premiul mai mare și mai gustos și poate fi prins sigur dacă amândoi alegeți să-l urmăriți. Fiecare dintre voi poate captura un iepure, care este mai mic, dar care este totuși satisfăcător. De asemenea, fiecare persoană poate captura un iepure sigur, indiferent de ceea ce face cealaltă persoană. Înainte de a începe vânătoarea, puteți discuta strategia cu partenerul dumneavoastră, dar jocul este despre supraviețuirea individuală. Nu puteț i fi sigur că partenerul va respecta orice acord. Ce alegere ve ț i face?
Diagrama
Să presupunem că a captura un iepure dă un câștig de 3, a captura un cerb dă un câștig de 5 pentru fiecare persoană, iar în cazul în care nu se va captura nimic, câștigul va fi 0. Prin natura jocului, dacă un jucător urmărește un iepure, el este garantat cu o recompensă de 3, deoarece f iecare persoană este capabilă să captureze un iepure. Pe de altă parte, dacă un jucător urmărește cerbul, câștigul depinde de alegerea celeilalte persoane. Dacă cealaltă persoană alege de asemenea cerbul, atunci cerbul este capturat și fiecare obține o recompensă de 5. Dacă cealaltă persoană alege, în schimb, iepurele, atunci jucătorul nu capturează nimic și câștigul lui va fi 0.
Jucător 2 Cerb
Iepure
Cerb
5, 5
0, 3
Iepure
3, 0
3, 3
Jucător 1
Fig. 3 Matricea jocului
Soluția Jocul poate fi rezolvat prin căutarea celor mai bune răspunsuri. Pentru fiecare alegere a celeilalte persoane, luați în considerare ce este mai bine pentru dumneavoastră. Un echilibru Nash apare când ambii jucători aleg cele mai bune răspunsuri. 4
Care sunt cele mai bune răspunsuri?
Există două opțiuni de luat în considerare. Mai întâi, luați în considerare dacă cealaltă persoană a ales cerbul. În acest caz, este logic să alegeți cerbul (5) în loc de iepure (3). În al doilea rând, luaț i în considerare dacă cealaltă persoană a ales iepurele. În acest caz, este mult mai rațional să alegeți iepurele (3) în loc de cerb (0). Cele mai bune răspunsuri pentru fiecare jucător sunt: • •
Iepurele este cel mai bun raspuns la iepure; Cerbul este cel mai bun răspuns la cerb.
Acest lucru ne conduce la două echilibre Nash în strategii pure ( fără strategii mixte ): alegerea cerbului de către amândoi și alegerea iepurelui de către amândoi. 3. Porcii raționali ( Rational Pigs Game )
O pereche de porci, unul dominant și unul subordonat, se află într-o cutie și au șansa de a fi recompensați cu alimente. La un capăt al cutiei este o pârghie care eliberează mâncarea când este presată. Răsucirea se face astfel încât mâncarea este eliberată la celălalt capăt al cutiei. Porcul care presează pârghia este dezavantajat, pe măsură ce celălalt porc poate ajunge primul la alimente. Jocul poate fi modelat cu ajutorul unor numere. Dacă porcul dominant presează pârghia, porcul subordonat poate mânca 80% din mâncare înainte ca porcul dominant să ajungă și să ia restul. Dacă porcul subordonat presează pârghia, atunci porcul dominant poate lua toată mâncarea înainte ca porcul subordonat să ajungă la cutie. Dacă nici un porc nu apasă pârghia, atunci niciun porc nu primește alimente. Și dacă ambele sunt adiacente atunci când pârghia este apăsată, porcul dominant poate consuma 70% din alimente. Presupunând că mâncarea este în valoare de 10 unități, este nevoie de 1 unitate de energie pentru a apăsa pârghia și a se îndrepta spre cealaltă parte a cutiei pentru a se lupta pentru mâncare.
Porcul dominant
Presează
Nu
pârghia
presează
2, 6
-1 , 10
8, 1
0, 0
Presează Porcul subordonat
pârghia Nu
presează
Fig. 4 Matricea jocului
Cum ar trebui cei doi porci să acționeze dacă vor raționa ca teoreticieni de joc?
Rezolvarea pentru echilibrul Nash
Luați în considerare alegerea porcului subordonat. Dacă porcul dominant presează pârghia, atunci pentru porcul subordonat este mai bine să nu preseze pârghia și să lase mâncarea să fie eliberată pentru a obține 8 unități. Dacă porcul dominant nu apasă pârghia, atunci este mai bine pentru porcul subordonat să nu apese, pentru că este mai avantajos să obțină 0 decât -1 de la a nu primi hrană și a cheltui energie. 5
Observați că porcul subordonat are o strategie dominantă de a nu presa pârghia. Aceste cele mai bune răspunsuri sunt ilustrate prin supralinierea în celulele corespunzătoare neapăsării pârghiei.
Porcul dominant
Presează
Nu
pârghia
presează
2, 6
-1 , 10
Presează Porcul subordonat
pârghia Nu
̅ 8
presează
,
̅ 1
̅ 0
,
̅ 0
Fig. 5 Matricea jocului
Ce ar trebui să facă porcul dominant? Pentru completare, să luăm în considerare fiecare alegere a porcului subordonat. Dacă porcul subordonat apasă pârghia, porcul dominant ar prefera să nu o apese și să primească toate cele 10 unități de mâncare. Dacă porcul subordonat nu apasă pârghia , atunci porcul dominant ar trebui să o preseze pentru a obține o plată de 1 față de o plată de 0 pentru neapăsare. Aceste cele mai bune răspunsuri sunt descrise prin sublinierea în celulele corespunzătoare.
Porcul dominant
Presează
Nu
pârghia
presează
2, 6
-1 , 10
Presează Porcul subordonat
pârghia Nu
̅ 8
presează
,
̅ 1
̅ 0
,
̅ 0
Fig. 6 Matricea jocului
Echilibrul unic Nash al acestui joc este celula care are atât o linie superioară, cât și o linie inferioară, în care ambii porci joacă cel mai bun răspuns. Acesta corespunde apăsării pârghiei porcului dominant și neapăsării porcul subordonat , astfel încât porcul subordonat primește 8, în timp ce porcul dominant primește doar 1.
Experiment real
Baldwin și Messe au făcut acest experiment și au publicat detalii despre el în 1979. În timp ce porcii nu scriu efectiv jocul matricei și îl rezolvă, ei pot învăța un comportament optim. Cercetatorii au descoperit ca porcii dominanti au facut aproape toata presarea. Cu alte cuvinte, porcii au acționat în același mod despre care teoria jocurilor a prezis că vor acționa. În timp ce porcii nu cunosc teoria jocurilor, rolul teoriei jocului este acela de a prezice comportamentul animalelor.
6
4. Parteneriatul ( Partnership Game )
Imaginați-vă că dumneavoastră aveți un partener de muncă. Fiecare dintre voi are posibilitatea de a munci din greu sau de a se eschiva. A munci din greu aduce cel mai mare câștig, care poate fi atins sigur doar dacă amândoi alegeți această variantă. A se eschiva nu aduce niciun câștig, dar nu aduce nici v reo pierdere. În schimb, dacă unul alege să muncească din greu, iar celălalt se eschivează, cel care va munci va avea un câștig mediu de 1, iar cel care se va eschiva, va avea o pierdere ( -1 ).
Partener 2
Muncește Partener 1
din greu Se
eschivează
Muncește
Se
din greu
eschivează
2, 2
-1 , 1
1 , -1
0, 0
Fig. 7 Matricea jocului
Aici, primul număr este câștigul jucătorului ( partenerului ) 1, iar al doilea este câștigul jucătorului 2. Aceste cifre ar putea fi doar plăți monetare sau ar putea include "preferințe sociale" ( faptul că puteți fi altruist față de partenerul dumneavoastră sau puteți fi supărat pe acesta. Ce alegere veți face? Veți juca "muncesc din greu" sau "eschivez"?
Rezolvarea pentru echilibrul Nash
Luați în considerare alegerea partenerului 1. Dacă partenerul 2 alege să muncească din greu, atunci pentru partenerul 1 este mai bine să facă aceeași alegere, pentru a obține 2 unități în loc de 1. Dacă partenerul 2 alege să se eschiveze, atunci este mai bine pentru partenerul 1 să se eschiveze și el, pentru că este mai avantajos să obțină 0 decât -1. Aceste cele mai bune răspunsuri sunt descrise prin supralinierea în celulele corespunzătoare.
Partener 2
Muncește Partener 1
din greu Se
eschivează
Muncește
Se
din greu
eschivează
,
-1 , 1
̅ 2
̅ 2
1 , -1
̅ 0
,
̅ 0
Fig. 8 Matricea jocului
Ce ar trebui să facă porcul dominant? Pentru completare, să luăm în considerare fiecare alegere a porcului subordonat. Dacă partenerul 1 alege să muncească din greu, atunci pentru partenerul 2 este mai 7
bine să facă aceeași alegere, pentru a obține 2 unităț i în loc de 1. Dacă partenerul 1 alege să se eschiveze, atunci este mai bine pentru partenerul 2 să se eschiveze și el, pentru că este mai avantajos să obțină 0 decât -1. Aceste cele mai bune răspunsuri sunt descrise prin sublinierea în celulele corespunză toare.
Partener 2
Muncește
Se
din greu
eschivează
Muncește Partener 1
din greu Se
eschivează
̅ 2
,
̅ 2
1 , -1
-1 , 1 ̅ 0
,
̅ 0
Fig. 9 Matricea jocului
Echilibrele Nash ale acestui joc reprezintă celulele care au atât o linie superioară, cât și o linie inferioară, în care ambii parteneri joacă cel mai bun răspuns. Nu există strategii dominante sau dominate. „Muncesc din greu” reprezintă cel mai bun răspuns pentru „Muncesc din greu” și „Mă eschivez” reprezintă cel mai bun răspuns pentru „Mă eschivez” . Prin urmare, există două strategii pure de echilibru Nash ( muncesc din greu, muncesc din greu ) și ( mă eschivez, mă eschivez ). În funcție de așteptările pe care le aveți din partea partenerului dumneavoastră, puteți ajunge la un rezultat bun sau rău.
8
A. JOCURI DINAMICE ÎN INFORMAȚIE COMPLETĂ
1. Descurajarea ( The Detterence Game )
Jucătorul 1 ( un „nou venit" ) trebuie să decidă dacă să intre pe o piață monopolizată în prezent de un „ocupant ". Jucătorul 2 ( ocupantul ), după ce observă acțiunea participantului, acesta decide dacă să-l găzduiască sau să lupte. Participantul decide dacă „să intre" sau dacă „să stea". Dacă el „rămâne afară", profiturile sale vor fi 0, iar profiturile ocupantului actual vor fi 3. Dacă intră, ocupantul actual trebuie să decidă dacă „va lupta" sau dacă „îl va găzdui ". În cazul în care ocupantul luptă, acesta va avea un profit egal cu 1, în timp ce nou-venitul va avea un profit negativ ( -1 ). În cazul în care ocupantul decide să găzduiască, acesta va avea un profit egal cu 2, iar nou-venitul va avea un profit egal cu 1. Fiecare jucător trebuie să acționeze o singură dată. Astfel, setul de strategie este egal cu setul de acțiuni. Forma normală, atunci, este după cum urmează:
Ocupant
Nou-venit
Luptă
Găzduiește
Intră
-1 , 1
1, 2
Rămâne afară
0, 3
0 , 3
Fig. 10 Matricea jocului
Rezolvarea pentru echilibrul Nash
Luați în considerare alegerea nou-venitului. Dacă ocupantul alege să lupte, atunci pentru nou-venit este mai bine să facă rămână afară, pentru a obține 0 unități în loc de -1. Dacă ocupantul alege să găzduiască, atunci este mai bine pentru nou-venit să intre, pentru a obține 1 unitate în loc de 0 . Aceste cele mai bune răspunsuri sunt descrise prin supralinierea în celulele corespunzătoare.
Ocupant
Luptă Intră Nou-venit
Rămâne afară
-1 , 1 ̅ 0
,
̅ 3
Fig. 11 Matricea jocului
9
Găzduiește ̅ 1
,
̅ 2
0 , 3
Luați în considerare alegerea ocupantului. Dacă nou-venitul alege să intre, atunci pentru ocupant este mai bine să găzduiască, pentru a obține 2 unități în loc de 1. Dacă nou-venitul alege să rămână afară, atunci profiturile sale vor fi 0, iar profiturile ocupantului actual vor fi 3. Aceste cele mai bune răspunsuri sunt descrise prin supralinierea în celulele corespunzătoare.
Ocupant
Luptă Intră Nou-venit
Rămâne afară
Găzduiește
-1 , 1 ̅ 0
,
̅ 1
,
̅ 2
0 , 3
̅ 3
Fig. 12 Matricea jocului
Nou-venitul
I
R
Ocupantul
G
( 1, 2 )
L
( 0, 3 )
( -1, 1) Fig. 13 Arborele jocului
Există două echilibre Nash: ( Intră, Găzduiește ) și ( Rămâne afară, Luptă ). Definiția inducției inverse: Un echilibru de inducție inversă al unui joc cu informație perfectă este un profil de strategie, în care strategia fiecărui jucător este optimă în fiecare punct dat în care el se așteaptă ca alții să urmeze strategii de echilibru în viitor. ( Intră, Găzduiește ) este un echilibru de inducție inversă a l jocului de descurajare.
10
B. JOCURI STATICE ÎN INFORMAȚIE INCOMPLETĂ 1. Donații pentru comunitate ( D onations for the community )
În jocurile cu mișcări secvențiale, cum ar fi jocul cu prăjituri, există o metodă simplă de a găsi un echilibru, numit inducție inversă sau răsturnare. Multe jocuri de comunicare implică un vorbitor, primul care codifică un mesaj și îl transmite, și un ascultător, care primește mesajul și selectează un conținut pentru el. Din moment ce acest mod de a gândi despre comunicare este secvențial, răsturnarea poate fi utilizată pentru a descoperi un profil de strategie de echilibru. După cum sugerează și numele, rollback-ul funcționează pornind de la rezultatul jocului și lucrând în ordinea inversă, având în vedere cea mai bună mișcare pentru obținerea unei anumite alegeri, până când se ajunge la nodul rădăcină al copacului. Să presupunem că sunt trei jucători: Emily, Nina și Talia, care locuiesc în același cartier. Cineva merge de la ușă la ușă, cerând oamenilor care locuiesc în cartier să contribuie la o grădină comunitară. Dimensiunea și splendoarea ultimă a grădinii depind de cât de mulți contribuie. Fiecare jucător este fericit să aibă grădina, mai fericit dacă grădina este mare și magnifică, dar fiecare este reticent să suporte costul contribuției. Dacă nimeni nu contribuie, grădina va fi rară și mizerabilă, un depozit viitor de gunoi, așa cum se întâmplă adesea cu loturile vacante din oraș. În mod clar, nimeni nu vrea asta. Pentru fiecare jucător, există patru rezultate: •
•
•
•
Rezultatul A: Nu contribuie, dar celelalte o fac ( grădina va fi plăcută și economisește și bani ). Rezultatul B: Contribuie, dar o va mai face doar una din vecine sau poate amândouă ( grădina va fi plăcută, dar scumpă pentru ea ). Rezultatul C: Nu contribuie și numai una dintre vecine o va face sau poate niciuna ( grădină va fi neremarcabilă, dar cel puțin ea economisește bani ). Rezultatul D: Contribuie, dar niciuna dintre celelalte nu o face ( grădină va fi groaznică și scumpă pentru ea ).
Emily, Nina și Talia au același rang de preferință: Rezultatul A> Rezultatul B> Rezultatul C> Rezultatul D: Deci posibilele lor acțiuni sunt da (contribuie) sau nu (nu contribuie). Trecând de la rezultate la utilități care reflectă preferințele jucătorilor, putem să alocăm utilități după cum urmează: Rezultat A -> 4 Rezultat B -> 3 Rezultat C -> 2 Rezultat A -> 1
Să presupunem că persoana care colectează donații pentru grădina comunității merge de la casă la casă, înainte vizitând-o pe Emily și de a primi răspunsul ei, apoi vizitând-o pe Nina și de a primi răspunsul ei, vizitând-o în final și pe Talia, pentru a primi și răspunsul ei. Acesta este un joc secvențial. Ce ar trebui să facă fiecare jucător pentru a-și maximiza utilitatea?
Rezultatele sunt prezentate în figura 14. Plățile sunt enumerate în ordine (Emily, Nina, Talia). Cum ar trebui să se calculeze echilibrul de răsturnare?
11
Emily A
da
nu
Nina B
da
C Nina
nu
Talia E
da
( 3, 3, 3 )
da
E Talia
nu
da
( 3, 3, 4 ) ( 3, 4, 3 )
Talia G
nu
( 1, 2, 2 )
nu
da
( 4, 3, 3 )
H Talia
nu
da
( 2, 1, 2 ) ( 2, 2, 1)
nu
( 2, 2, 2 )
Fig. 14 Arborele jocului
Începem cu Talia, deoarece ea este ultima care va oferi un răspuns. Ea este asociată cu punctele E, F, G și H. La punctul E, dacă spune da, primește un câștig de 3, dar dacă spune că nu, primește un câștig de 4. Deoarece ea preferă 4 în loc de 3, ar trebui să ia decizia (E, nu). Apoi, luăm în considerare opțiunile sale la punctul F. Dacă ea spune da, primește un câștig de 3, dar dacă spune nu, primește un câștig de 2. Deoarece ea preferă de 3 în loc de 2, ar t rebui să ia decizia (F, da). La punctul G, dacă ea spune da, primește un câștig de 3, dar dacă spune că nu, ea primește un câștig de 2. Deci, ar trebuie să ia decizia (G, da). La punctul H, dacă spune da, primește un câștig de 1, dar dacă spune că nu, primește un câștig de 2. Deci ar trebui decidă (H, nu). Cele mai bune răspunsuri ale Taliei ( Fig. 15 ) sunt: { (E, nu), (F, da), (G, da), (H, nu) }.
Acum să găsim cele mai bune mișcări ale Ninei. Nina este asociată cu punctele B și C. În ambele cazuri, știe că, oricum se mișcă, Talia va continua să facă cea mai bună mișcare, așa că Nina ia în considerare acest lucru. În punctul B, dacă Nina spune da, primește un câștig de 3, dar dacă spune nu, primește un câștig de 4. În mod evident, la punctul B, ar trebui să decidă (B, nu). În punctul C, dacă spune da, primește un câștig de 3, dar dacă spune nu, primește un câștig de 2. În punctul C, ea ar trebui să decidă (C, da). Cele mai bune răspunsuri ale Taliei ( Fig. 16 ) sunt: { (B, nu), (C, da) }. Acum să luăm în considerare cea mai bună mișcare a lui Emily. Ea este asociată numai cu punctul A. Dacă spune da, primește un câștig de 3, dar dacă spune nu, primește un câștig de 4. În mod evident, ar trebui decidă (A, nu). Cea mai bună mișcare a lui Emily ( Fig. 17 ) este { (A, nu) }.
12
Emily A
da
nu
Nina B
C Nina
da
Talia E ( 3, 3, 4 )
da
( 3, 3, 3 )
nu
nu
da
( 3, 4, 3 ) E Talia
Talia G ( 4, 3, 3 )
da
nu
( 3, 3, 4 ) ( 3, 4, 3 )
da
( 1, 2, 2 )
( 4, 3, 3 )
nu
( 2, 2, 2 ) H Talia
nu
da
( 2, 1, 2 ) ( 2, 2, 1)
nu
( 2, 2, 2 )
Fig. 15 Cele mai bune răspunsuri ale Taliei
Emily A
da
nu
Nina B ( 3, 4, 3 )
da
Talia E ( 3, 3, 4 )
da
( 3, 3, 3 )
nu
( 4, 3, 3 ) C Nina
nu
da
( 3, 4, 3 ) E Talia
Talia G ( 4, 3, 3 )
da
( 3, 3, 4 ) ( 3, 4, 3 )
nu
( 1, 2, 2 )
da
( 4, 3, 3 )
13
nu
nu
( 2, 2, 2 ) H Talia
da
( 2, 1, 2 ) ( 2, 2, 1)
nu
( 2, 2, 2 )
Fig. 16 Cele mai bune răspunsuri ale Ninei
Emily A ( 4, 3, 3 )
da
nu
Nina B ( 3, 4, 3 )
da
Talia E ( 3, 3, 4 )
da
( 3, 3, 3 )
nu
( 4, 3, 3 ) C Nina
nu
da
( 3, 4, 3 ) E Talia
Talia G ( 4, 3, 3 )
da
( 3, 3, 4 ) ( 3, 4, 3 )
nu
( 1, 2, 2 )
da
( 4, 3, 3 )
nu
nu
( 2, 2, 2 ) H Talia
da
( 2, 1, 2 ) ( 2, 2, 1)
nu
( 2, 2, 2 )
Fig. 17 Cele mai bune răspunsuri al e lui Emily, ale Ninei și ale Taliei
Calea de echilibru a jocului poate fi găsită în figura 17, urmând ramurile cu acțiuni în cercuite. Întregul profil de strategie optimă poate fi găsit prin asocierea seturilor generate la fiecare etapă: { (A, nu), (B, nu), (C, da), (E, nu), (F, da), (G, da), (H, nu) }.
Adică, profilul de strategie optimă de strategie oferă cel mai bun răspuns jucătorului la fiecare punct. Calea reală a jocului în echilibrul de redresare se găsește prin punerea în comun a mișcărilor optime ale fiecărui jucător pentru a asambla o istorie reală. În figura 17, aceasta este secvența găsită urmând ramurile cu acțiuni încercuite de la rădăcină la frunză: { (A, nu), (C, da), (G, da) }.
Emily are în mod clar un avantaj față de Nina și Talia. Ea are avantajul primului jucător.
2. Tortul ( The Cake Game )
În acest joc, doi copii au permisiunea de a împărți un tort prin faptul că un singur copil, un feliator, împarte tortul în două bucăți și celălalt copil, selectorul, selectează bucata pe care o dorește. Acesta este un bun exemplu de joc, deoarece rezultatul fiecărui agent depinde de alegerile celuilalt agent. Ambii copii trebuie să gândească strategic pentru a obține cele mai bune rezultate. Să presupunem că feliatorul are următoarele acțiuni posibile: a. Tăierea tortului în două felii egale. b. Tăierea tortului într-o felie mare și o felie mică.
14
Acțiunile feliatorului au ca rezultat trei dimensiuni posibile pentru felii de tort: mici, medii și mari. Aceasta oferă selectorului trei acțiuni posibile: a. Alegerea feliei mari. b. Alegerea feliei medii. c. Alegerea feliei mici. Observăm că rezultatele pentru cei doi jucători depind de acțiunile lor individuale. Dacă feliatorul alege să taie tortul în mod inegal, atunci selectorul poate alege între felie mare și felie mică. Dacă feliatorul alege să împartă tortul în două felii egale, atunci selectorul poate alege doar o felie medie. Feliatorul 1
t ăiere egală
tăiere inegală
Selectorul 2
3 Selectorul
alege medie
alege mare
( medie, medie )
( mică, mare )
alege mică ( mare, mică )
Fig. 18 Arborele jocului
Acum ne îndreptăm spre relația de preferință. Copiii adoră în general tortul, așa că pot fi afirmate confortabil următoarele pentru ambii copii: a. Felie mare ≥ Felie medie b. Felie medie ≥ Felie mică. Dacă copiii sunt raționali, ambii preferă o felie mare față de o felie mică. Figura 18 prezintă o versiune simplă a jocului. Nodurile arborelui sunt numerotate, cu excepția nodurilor frunzelor. În general, mă refer la nodurile numerotate ca stări de informație. Nodul superior, starea de informare 1, este rădăcina și reprezintă opțiunile disponibile pentru feliator. El poate alege fie să taie tort ul în bucăți egale, fie în bucăți inegale. Aceste alegeri sunt reprezentate de ramurile care ies din nodul rădăcină. Aceste ramuri sunt etichetate de alegerile feliatorului. Următorul nivel al arborelui reprezintă opțiunile selectorului. Dacă feliatorul a ales să taie în mod egal (starea de informare 2), selectorul nu are nicio alegere reală: există două bucăți medii, iar lui îi este indiferent pe care o ia, deoarece acestea sunt egale. Altfel, dacă feliatorul a făcut tăieturi inegale (starea de informare 3), selectorul poate alege fie felia mare, fie felia mică. Nodurile frunzelor arborelui arată rezultatele celor doi jucători. Aceste rezultate sunt afișate ca perechi ordonate, câștigul feliatorului fiind primul element, iar câștigul selectorului fiind cel de-al doilea element. Dacă feliatorul a ales să taie două bucăți egale, el și selectorul vor avea felii medii. Dar să presupunem că a tăiat piesele inegal. Astfel, dacă selectorul alege felia mare, feliatorul rămâne cu felia mică, iar dacă selectorul alege felia mică, feliatorul rămâne cu felia mare. În acest moment, există un rezultat intuitiv pentru joc. Dacă feliatorul taie tortul în două felii egale, îi este garantată astfel o felie medie. Dacă taie tortul în două piese inegale, selectorul va lua bucata mare și feliatorul va fi lăsat cu bucata mică. Relația de preferință ne spune că feliatorul preferă o piesă medie față 15
de o bucată mică, așa că, în mod normal, acesta nu va tăia tortul în bucăți inegale. Cea mai bună strategie a slicerului este întotdeaun a să taie tortul în bucăți egale: { (1, tăiere egală) }. Aceasta este o pereche ordonată constând dintr-o stare de informare, în acest caz, starea 1, și o acțiune. Deci, dacă feliatorul este în starea de informare 1, ar trebui să aleagă să taie tortul în f elii egale. Din punctul de vedere al selectorului, lucrurile sunt mai complicate. Dacă acesta este în starea de informare 2, alegerea sa este determinată: el trebuie să aleagă o felie medie. Să presupunem că feliatorul face o greșeală și taie tortul în bucăți inegale. Un jucător rațional ar fi gata să exploateze această greșeală. Deci selectorul ar trebui să aleagă bucata mare, din moment ce o preferă față de bucata mică. Selectorul ar trebui să urmeze strategia { (2, alege medie), (3, alege mare) }. Intuitiv, niciun jucător nu are niciun motiv să -și schimbe strategia. Ambii fac tot ce pot, având în vedere alegerile care le sunt confruntate și așteptarea ca celălalt jucător să -și urmeze preferințele. Suntem justificați în a numi aceste sugestii de strategie o strategie de echilibru. Dacă oricare dintre jucători are defecte la realizarea strategiei, atunci va alege cea mai rea decizie. Dacă feliatorul face o greșeală și taie lucrurile inegal, atunci el va primi o bucată mică, iar selectorul ar trebui să aleagă felia mare, pe care o preferă față de felia mică. Putem asambla opțiunile într-un profil de strategie care le arată jucătorilor ce trebuie să facă în orice caz: { (1, tăiere egală), (2, alege medie), (3, alege mare) }. Feliatorul 1
tăiere egală
tăiere inegală
Selectorul 2
alege medie
( medie, medie )
3 Selectorul
alege mare ( mică, mare )
alege mică ( mare, mică )
Fig. 19 Cele mai bune răspunsuri ale selectorului
Feliatorul 1
tăiere egală
tăiere inegală
Selectorul 2
alege medie
3 Selectorul
alege mare
16
alege mică
( medie, medie )
( mică, mare )
( mare, mică )
Fig. 20 Cele mai bune răspunsuri ale feliatorului și selectorului
Calea reală a jocului în echilibrul de redresare se găsește prin punerea în comun a mișcărilor optime ale fiecărui jucător pentru a asambla o istorie reală. În figura 20, aceasta este secvența găsită urmând ramurile cu acțiuni încercuite de la rădăcină la frunză: { (1, tăiere egală), (2, alege medie) }.
3. Holmes-Moriarty ( The Holmes-Moriarty Game )
Acesta este un joc static în informație incompletă, un joc în care un jucător nu cunoaște alegerea celuilalt atunci când trebuie să se mute. Cu alte cuvinte, jucătorii fac mișcări în condiții de incertitudine. Teoria jocurilor oferă jucătorilor sfaturi sănătoase despre ce să facă în astfel de circumstanțe. Acest exemplu este din cartea celebră de von Neumann și Morgenstern (1944), care a început teoria jocului ca o ramură activă de cercetare. Să presupunem că profesorul Moriarty îl urmărește pe Sherlock Holmes, fără îndoială, cu intenție rea. Desigur, Holmes vrea să se sustragă lui Moriarty. Pentru a face acest lucru, a urcat pe un tren spre Dover, de unde intenționează să fugă pe continent. Cum ar fi norocul, Holmes îl observă pe Moriarty pe platformă în timp ce trenul se retrage. În plus, Holmes are toate motivele să creadă că Moriarty l-a văzut și că acesta știe astfel exact în ce tren se află Holmes. Chiar mai rău, Holmes poate să presupună în siguranță că Moriarty îl va urmări în trenul său privat, care va ajunge în mod inevitabil la trenul lui Holmes înainte de a ajunge la Dover. Trenul face o singură oprire la Canterbury, așa că Holmes putea să schimbe trenul acolo. Bineînțeles, Moriarty știe acest lucru și po ate să și schimbe și el trenul propriu. Ce ar trebui să facă Holmes?
Să stabilim problema ca pe un joc. Figura 21 arată jocul în formă normală. Alegerile jucătorilor sunt aranjate într-o matrice, cu plățile în celulele matricei. Holmes este jucătorul de pe rând. El are două opțiuni: poate să schimbe trenul la Dover sau poate ajunge la Canterbury. Moriarty este jucătorul de pe coloană. El, de asemenea, poate coborî la Dover sau la Canterbury. Moriarty Dover
Canterbury
Dover
-100, 100
50, -50
Canterbury
0, 0
100, 100
Holmes
Fig. 21 Matricea jocului
Observăm că suma plăților din fiecare celulă este zero. Holmes și Moriarty joacă un joc cu sumă zero, un joc strict competitiv, cu un câștigător clar și un pierzător clar. Celulele matricei din figura 21 pot fi citite ca plățile atribuite lui Holmes și lui Moriarty. În general, jucătorul de pe rând primește primul câștigul, iar jucătorul de pe coloană primește al doilea. Deci, dacă Holmes și Moriarty coboară la Dover, Moriarty îl prinde pe Holmes, deoarec e, ajungând acolo mai devreme, a avut șansa de a pregăti o capcană. El primește un câștig de 100 de puncte. Lui Holmes, evident, 17
nu-i place această alternativă. El are o pierdere de 100 de puncte. Plățile sunt aceleași dacă și Holmes și Moriarty își iau trenurile la Canterbury. Să presupunem că Holmes ajunge la Dover, în timp ce Moriarty s -a oprit la Canterbury. Holmes este fericit, deoarece el poate sări acum pe continent, unde are mai multe șanse să scape de ghearele lui Moriarty. În acest caz, Holmes primește un câștig de 50 de puncte, deoarece el l-a evitat pe Moriarty și este probabil să continue să facă acest lucru. Moriarty are o pierdere de 50 puncte. În cele din urmă, să presupunem că Holmes se oprește la Canterbury, în timp ce Moriarty continuă spre Dover. Holmes a scăpat pentru moment de Moriarty, dar scăparea lui prin Dover nu este disponibilă. Moriarty încă nu l -a capturat pe Holmes, dar este bine poziționat pentru a face acest lucru. Fiecare jucător primește un salariu de 0. Holmes, fiind un gânditor strălucit, motiv pentru care cel mai bun mod de a se sustrage lui Moriarty ar fi să-l facă să fie indiferent la alegerea dintre Dover și Canterbury. Ideea este că, dacă Moriarty se poate aștepta la același câștig dacă se oprește la Canterbury, așa cum se poate aștepta dacă merge la Dover, atunci Moriarty devine indiferent de alegere și poate alege între cele două probabilistic i. Altfel, dacă Holmes adoptă o strategie pură, Moriarty ar putea să ghicească și să câștige cu ușurință. Să aplicăm ideea de utilitate așteptată problemei lui Holmes. El vrea să -l facă pe Moriarty infiferent între oprirea la Canterbury și continuarea spre Dover. Cu alte cuvinte, el dorește ca utilitatea așteptată a lui Moriarty pentru alegerea Canterbury să fie aceeași cu utilitatea așteptată pentru alegerea Dover: EU (Canterbury) = EU (Dover). Acum, Holmes va ajunge la Canterbury cu o probabilitate p. Deoarece singura lui opți une este de a merge la Dover, mergând la Dover are probabilitate (1 - P). Deci, utilitatea așteptată a lui Moriarty de a ajunge la Canterbury este: [ ( 1-p ) × (-50) ] + ( p×100 ), iar utilitatea așteptată de a ajunge la Dover este: [ ( 1-p ) × 100 ] + ( p×0 ). Holmes trebuie să stabilească probabilitatea, p, care face utilitatea așteptată de a alege Canterbury egală cu utilitatea așteptată de a alege Dover. Adică, Holmes trebuie să rezolve următoarea ecuație: [ ( 1-p ) × (-50) ] + ( p×100 ) = [ ( 1-p ) × 100 ] + ( p×0 ). Puțină algebră arată că cele două laturi ale ecuației sunt egale când p = 3/5. Adică, Holmes ar trebui să se oprească la Canterbury în proporție de 60% și să continue la Dover în proporție de 20%. Prin urmare, el poate decide prin aruncarea unei monede cu fațete cu probabilități 60%, respectiv 40%. Desigur, Holmes nu este garantat că va scăpa de Moriarty jucând această strategie. Din păcate, viața nu are garanții. Dar nu poate face mai bine decât să joace în acest fel. Oferă cea mai bună șansă să scape de Moriarty. Observați că strategia este o strategie mixtă. Holmes ar trebui să -și facă alegerea prin alegerea probabilistă între mai multe opțiuni. Jocul Holmes-Moriarty arată cum se poate lucra de la utilități la probabilități. Deoarece Hol mes este conștient de utilitățile lui Moriarty, el poate să-și determine probabilitatea de a se opri la Canterbury. Dar utilitatea este încă utilizată ca scară de preferință aici. Atâta timp cât Holmes este conștient de gradul în care Moriarty preferă un rezultat față de celălalt, el poate atribui utilități în așa fel încât să elaboreze o strategie mixtă.
18
BIBLIOGRAFIE
• • • • • •
•
• • •
http://bookzz.org/ http://www.opim.wharton.upenn.edu/~sok/papers/r/graham-romp/romp-chapter2 http://mibe.unipv.it/attach/AdvMicroSolutions.pdf http://faculty.haas.berkeley.edu/stadelis/Game%20Theory/econ160_week7b.pdf http://slantchev.ucsd.edu/courses/gt/06-incomplete-info.pdf https://ocw.mit.edu/courses/economics/14-12-economic-applications-of-game-theoryfall-2012/lecture-notes/MIT14_12F12_chapter14.pdf https://mindyourdecisions.com/blog/2008/06/03/understanding-the-stag-hunt-gamehow-deer-hunting-explains-why-people-are-socially-late/ https://en.wikipedia.org/wiki/Stag_hunt http://faculty.haas.berkeley.edu/stadelis/Game%20Theory/econ160_week7b.pdf https://www.scribd.com/
19