Universitatea din Bucureşti Facultatea de Matematică – Informatică
Aplicaţii ale teoriei jocurilor
Profestor coordonator:
Masterand:
Prof. Univ. r. !asile Preda
Bo"dan #e"rilă
Bucureşti 2013
$uprins
Introducere..................... Introducere................................... .......................... ......................... ......................... ......................... .......................... ......................... .................. ...... % 1. Conceptul de joc......................... joc..................................... ......................... ......................... .......................... .......................... ........................ ............... ... & 1.1 Jocuri în forma extinsă.......................... extinsă...................................... ......................... ......................... ......................... ........................5 ...........5 1.2 trate!ii. "orma normală...................... normală.................................. .......................... .......................... ......................... ........................# ...........# 1.3 $uncte de ec%ili&ru...................... ec%ili&ru................................... ......................... ......................... .......................... ......................... ...................10 .......10 2. Jocuri de două persoane cu sumă nulă.................................... nulă................................................ ......................... ................... ...... '( 2.1 Jocuri cu sumă nulă........................ nulă..................................... ......................... ........................ .......................... .......................... ................1' ....1' 2.2 "orma normală....................... normală................................... .......................... .......................... ......................... ......................... ........................ .............15 .15 2.3 trate!ii mixte........................ mixte..................................... ......................... ......................... .......................... ......................... ......................... .............1( 1( 2.' )eorema )eorema *inimax........... *inimax ...................... ...................... ....................... ........................ ........................ ....................... ...................... ..............1+ ...1+ 3. Jocuri contra naturii...................... naturii.................................. .......................... .......................... ........................ ......................... ......................... .............. )% 3.1 Criteriul lui ,ur-ic...................... ,ur-ic................................... ......................... .......................... .......................... ......................... ...................23 ......23 3.2 Criteriul Ba/es aplace......................... aplace..................................... ......................... ......................... ......................... .....................25 ........25 3.3 Criteriul lui aa!e......................... aa!e..................................... .......................... .......................... ......................... ......................... .................2( .....2( 3.' Criteriul Criteriul lui ald....... ald..................... .......................... ......................... ......................... ........................ .......................... .......................... .............24 .24 '. plica6ii............... plica6ii........................... .......................... .......................... ........................ ......................... ......................... .......................... .......................... .............. %' '.1 $ro&lema amenin6ărilor credi&ile...................... credi&ile.................................. .......................... .......................... ........................31 ............31 '.2 $ro&lema pira6ilor............. pira6ilor.......................... ......................... .......................... .......................... ......................... ......................... ..................33 ......33 '.3 7n experiment în reolarea jocurilor prin eliminarea strate!iilor dominate....................... dominate................................... ........................ .......................... .......................... ......................... .................3( ....3( '.' plica6ii din teoria jocurilor în în jocul de $o8er....... $o8er................... ......................... ......................... ......................3# ..........3# Bi&lio!rafie................... Bi&lio!rafie................................. .......................... ......................... ......................... ......................... .......................... ......................... .................... ........ (&
Introducere 2
$uprins
Introducere..................... Introducere................................... .......................... ......................... ......................... ......................... .......................... ......................... .................. ...... % 1. Conceptul de joc......................... joc..................................... ......................... ......................... .......................... .......................... ........................ ............... ... & 1.1 Jocuri în forma extinsă.......................... extinsă...................................... ......................... ......................... ......................... ........................5 ...........5 1.2 trate!ii. "orma normală...................... normală.................................. .......................... .......................... ......................... ........................# ...........# 1.3 $uncte de ec%ili&ru...................... ec%ili&ru................................... ......................... ......................... .......................... ......................... ...................10 .......10 2. Jocuri de două persoane cu sumă nulă.................................... nulă................................................ ......................... ................... ...... '( 2.1 Jocuri cu sumă nulă........................ nulă..................................... ......................... ........................ .......................... .......................... ................1' ....1' 2.2 "orma normală....................... normală................................... .......................... .......................... ......................... ......................... ........................ .............15 .15 2.3 trate!ii mixte........................ mixte..................................... ......................... ......................... .......................... ......................... ......................... .............1( 1( 2.' )eorema )eorema *inimax........... *inimax ...................... ...................... ....................... ........................ ........................ ....................... ...................... ..............1+ ...1+ 3. Jocuri contra naturii...................... naturii.................................. .......................... .......................... ........................ ......................... ......................... .............. )% 3.1 Criteriul lui ,ur-ic...................... ,ur-ic................................... ......................... .......................... .......................... ......................... ...................23 ......23 3.2 Criteriul Ba/es aplace......................... aplace..................................... ......................... ......................... ......................... .....................25 ........25 3.3 Criteriul lui aa!e......................... aa!e..................................... .......................... .......................... ......................... ......................... .................2( .....2( 3.' Criteriul Criteriul lui ald....... ald..................... .......................... ......................... ......................... ........................ .......................... .......................... .............24 .24 '. plica6ii............... plica6ii........................... .......................... .......................... ........................ ......................... ......................... .......................... .......................... .............. %' '.1 $ro&lema amenin6ărilor credi&ile...................... credi&ile.................................. .......................... .......................... ........................31 ............31 '.2 $ro&lema pira6ilor............. pira6ilor.......................... ......................... .......................... .......................... ......................... ......................... ..................33 ......33 '.3 7n experiment în reolarea jocurilor prin eliminarea strate!iilor dominate....................... dominate................................... ........................ .......................... .......................... ......................... .................3( ....3( '.' plica6ii din teoria jocurilor în în jocul de $o8er....... $o8er................... ......................... ......................... ......................3# ..........3# Bi&lio!rafie................... Bi&lio!rafie................................. .......................... ......................... ......................... ......................... .......................... ......................... .................... ........ (&
Introducere 2
9n majoritatea situa6iilor situa6iilor cu care ne confruntăm i de i suntem puşi în situa6ia de a adopta o deciie dintr:o mul6ime de deciii posi&ile; în ederea atin!erii unui anumit scop. s cop. $erfect natura naturall şi caract caracteri eristi sticc actii actiită6 tă6iiii noastr noastree t mai mare măsură. ?eşi folosim în mod frecent termenul de deciie dec>tt în limit limitel elee unui unui mode modell matem matemat atic ic.. )eoria oria mode modele lelo lor r matematice de adoptare a deciiilor optime într:un anumit sens constituie ai o importantă ramură a matematicii; numită cercetare operaţională. Teoria jocurilor este capitolul cercetării opera6ionale consacrat adaptării deciiilor în Asitua6i a6iii conflictuale; adică situa6ii în care ac6ioneaă mai mul6i situaţii de competiţie Asitu factori ra6ionaliD : fiecare urmărind un anumit scop independen6i în ale!erea deciiilor proprii; dar dependen6i prin reultate; care depind de ansam&lul tuturor deciiilor. ceastă situa6ie situa6ie este formaliată formaliată în conceptul conceptul matematic matematic de joc . )re&uie să specificăm însă că teoria jocurilor repreintă un model a&stract de luare a deciiilor; astfel că nu tre&uie confundat cu o explica6ie de luare a unei deciii în realitatea socială. Eri!inea acestui frumos domeniu matematic începe la 1410; prin studiile lui ei&nie asupra jocurilor de strate!ie; care anticipeaă neoia unor teorii asupra acestui domeniu. )rei ani mai t>riu James alder!rae formuleaă principiul minmax ca ca solu6ie a unui joc de căr6i ce are ca participan6i doar două persoane. Cum persoanele epocii nu au !ăsit utilitatea acestui princpiu; el a fost neutiliat p>nă la începutul secolului FF. &ia la 1#(5 Isaac )od%unter în6ele!e importan6a acestui principiu; pe care îl include în lucrarea sa; @ ,istor/ of t%e mat%ematical t%eor/ of pro&a&ilit/=. 9n 1+21 Gmile Borel a încercat să demonstree teorema lui alder!rae; dar fără Hlle!eH. a 1+2( matematicianul un!ur Jo%n on euman eumannn reuşeş reuşeşte te să demonst demonstre reee teorma teorma minmax . 9n 1+3# economistul *or!enstern I se alătură lui eumann în încercarea de a defini o teorie a jocurilor. Cel care a desă>rşit însă acest domeniu este cele&rul Jo%n as%; Hlle!eHe al premiului o&el pentru economie în 1++' şi su&iectul unuia dintre cele mai appreciate filme de la ,oll/-ood; @ &eautiful mind=. 9n acest moment; teoria jocurilor ne permite să descriem şi să analiăm fenomene economice şi sociale ca nişte jocuri strate!ice; precum şi să sta&ilim ec%ili&rele unui joc; 3
adică stările în care nici un jucător jucător nu doreşte doreşte să:şi modifice modifice comportament comportamentul; ul; indiferent indiferent de comportamentul celorlal6i jucători. Gxistă numeroase concepte de ec%ili&ru într:un joc. 9n cadrul lucrării de fa6ă om insista asupra ec%ili&relor ce se &aeaă pe situa6ii credi&ile. Gconomiştii utilieaă termenul de de echilibre ale subjocurilor perfecte pentru a descrie astfel de ec%ili&re. 7n joc este caracteriat pe cantitatea şi calitatea informa6iei de care dispun jucătorii. stfel; distin!em jocuri cu informaţie completă sau incompletă; precum şi jocuri cu informaţie perfectă sau imperfectă. E altă cate!orisire a jocurilor 6ine cont de numărul participan6ilor; în func6ie de care aem jocuri de 2 persoane şi jocuri de n persoane. Cele mai &une exemple de jocuri în func6ie de cantitatea informa6iei sunt jocul de şa% Ala care informa6ia este completă şi fiecare mutare este decisă de cea a oponentului în afara primei mutări; jocul de &rid!e Aîn care informa6ia este par6ială; la fel ca la jocul de po8er şi ruleta; la care informa6ia este nulă; fiecare nou spin fiind total aleator Anu considerăm situa6iile ipotetice în care o persoană ar juca suficient de multe jocuri astfel înc>t să interină ec%ili&rul dat de statistica jocului. le!erea acestei lucrări a a aut la &aă &a ă numeroasele aplica6ii ale teoriei jocurilor de la apli aplica ca6i6iii în jocu jocurrile ile de soci societ etat ate; e; la apl aplica6 ica6iii deci decii ion onal alee şi de stud studiiu asup asupra ra comportamentului uman; la modelări economice este o teorie foarte utiliată în preent în modelarea riscului opera6ional; în modelarea situa6iilor militare; sau mai preent în motiarea an!aja6ilor; în te%nici de înă6are; medicină şi multe altele. tructura acestei lucrări urmăreşte în primul capitol c>tea no6iuni introductie; mai mult o recapitulare a no6iunilor din timpul cliclului licen6ă master. 9n cel de:al doilea capitol om preenta no6iuni din jocurile contra naturii; folosite în luarea deciiilor în func6ie de eenimentele aleatoare ce pot intereni. 7ltimul capitol este dedicat exclusi aplica6iilor; pre preen ent> t>nd nd unel unelee pro& pro&le leme me foar foarte te frum frumoas oasee şi inte intere resa sant nte; e; cum cum sunt sunt pro& pro&le lema ma amenin6ărilor credi&ile; puleul pira6ilor Aidee folosită în foarte multe filme dar şi în te%nici de ne!ociere reală şi se înc%eie cu un studiu relati amplu asupra jocului de po8er folosind informa6ii din teoria jocurilor.
$apitolul I: $onceptul de joc
4
Ideea de &aă a jocului tratat în această lucrare îşi are ori!inea în jocurile de societate. $ornind dintr:o anumită situa6ie ini6ială; urmeaă o serie de paşi Amişcări; la fiecare pas jucătorii ale!>nd o mişcare dintr:o mul6ime dată de mişcări posi&ile. 7nele din aceste mişcări pot fi aleatoare; de exemplu aruncarea unui ar sau extra!erea unei căr6i dintr:un pac%et de căr6i. 7n aspect interesant al jocului de şa% este acela că jucătorul nu poate sta&ili care din mutările adersarului au fost făcute pe &aa ale!erii unei strate!ii şi care din înt>mplare. umărul uriaş de strate!ii posi&ile în!reuneaă această separare a mutărilor înt>mplătoare de cele ce fac parte din cadrul unei strate!ii. 9n final; la înc%eierea jocului; jucătorii primesc o recompensă ce depinde de modul de desfăşurare a jocului. Gxistă aşadar o func6ie ce asociaă c>şti!uri fiecărei
Conceptul !eneral de joc con6ine trei elemente : succesiunea de mişcări asupra cărora decid persoane sau înt>mplareaK : starea de informare a jucătorilorK : o func6ie de c>şti!. $entru început; om defini no6iunea de arbore de joc, ca o mul6ime finite de noduri A>rfuri care sunt unite prin muchii Aarce, astfel ca să reulte un !raf conex fără circuite Adrumuri înc%ise. $entru oricare >rfuri A şi B există deci exact un şir de muc%ii şi noduri care unesc A cu B. efiniţia '.' "ie τ un ar&ore topolo!ic cu un nod specificat A. punem că nodul C este un succesor al nodului B dacă şirul de muc%ii care uneşte A cu B trece prin C . C este un succesor direct al lui B dacă C este un succesor al lui B şi există o muc%ie care uneşte B cu C . X se numeşte nod final dacă nu are nici un succesor. efiniţia '.) $rin joc de n persoane în formă extinsă se în6ele!e a un ar&ore topolo!ic τ cu un nod specificat A; nodul iniţial al lui τ K & o funcţie de câşti care asociaă fiecărui nod final al lui τ un n:ectorK c o pari6ie a nodurilor lui τ care nu sunt noduri finale în numite mulţimi ale jucătorilor K
n + 1 mul6imi S 0 , S 1 ,..., S n ,
5
d pentru fiecare nod din direc6i ai acestui nodK
S 0
o distri&u6ie de pro&a&ilitate pe mul6imea succesorilor
j S i 1 , = n e o parti6ie a mul6imilor ; în su&mul6imile Amulţimi de informaţie ; astfel înc>t două noduri din aceeaşi su&mul6ime de informa6ie au acelaşi număr de succsesori direc6i1 şi nici un nod al unei mul6imi de informa6ie nu este succesor al unui nod al acestei mul6imiK
S i
i
j
j
f pentru fiecare mul6ime de informa6ie S i există o mul6ime I i 2. emnifica6ia acestor elemente esen6iale ale unui joc este următoarea a existen6a unui nod esen6ialK & existen6a unei func6ii de c>şti!K c totalitatea mişcărilor se împarte în mişcări aleatoare
( S 0 )
şi cele efectuate de cei
n
jucători ( S 1 ,..., S n ) K d pentru fiecare mişcare aleatoare se defineşte o sc%emă aleatoareK e mişcările unui jucător se împart în şti!ă un dolar de la I. 9n ca contrar; I c>şti!ă un dolar de la II. 9n ar&orele jocului; repreentat în fi!ura 1.1; ectorul ataşat nodurilor finale repreintă func6ia de c>şti!; iar numerele de l>n!ă celelalte noduri indică jucătorul căruia îi apar6ine mutarea. ?omeniul măr!init de linia punctată con6ine nodurile din aceeaşi mul6ime de informa6ie.
1 Altfel spus, din fiecare nod al lui pornesc acelaşi număr de arce. Conform axiomei f), fiecare din aceste arce corespunde uneia dintre aciunile pe care !ucătorul le poate "nreprinde "n situaia . 2 repre#intă mulimea tuturor mutărilor (aciunilor) posi$ile ale !ucătorului "n situaia . %
"i!. 1.1 -,emplul '.) ?oi jucători primesc fiecare c>te o culoare completă a unui pac%et de căr6i de joc A13 căr6i numerotate de la 1 la 13. Căr6ile unei a treia culori se amestecă şi apoi sunt descoperite una c>te una. ?e fiecare dată c>nd o carte a fost descoperită; fiecare jucător joacă una dintre căr6ile sale; la ale!erea sa; fără a cunoaşte cartea jucată de celălalt. Jucătorul care a jucat cea mai mare carte c>şti!ă un număr de puncte e!al cu numărul căr6ii descoperite Aîn caul în care căr6ile jucate sunt e!ale nu c>şti!ă nici unul. Jocul se continuă p>nă la epuiarea celor 13 căr6i. C>şti!ul este diferen6a dintre punctele acumulate de cei trei jucători. 9n caul a 13 căr6i; ar&orele jocului este prea mare pentru a fi repreentat aici. ?e aceea om considera o repreentare pentru un joc cu doar 3 căr6i A1; 2 şi 3; redată în fi!ura 1.2. in!ura mişcare aleatoare constă în amestecarea căr6ilor; prin care acestea se aşeaă în una dintre cele şase ordini posi&ile; fiecare cu pro&a&ilitatea 1L(. )oate mişcările ulterioare sunt decise de cei doi jucători. ?in ar&orele jocului sunt repreentate aici numai anumite păr6i; între care nodul ini6ial; c>tea ramuri şi patru noduri finale. Celelalte ramuri sunt asemănătoare celor repreentate în desen. Melati la informa6ia jucătorilor introducem defini6ia efiniţa '.% 7n jucător are informaţie completă în τ dacă fiecare dintre mul6imile sale de j
informa6ie S i constau dintr:un sin!ur element. Jocul se numeşte cu informaţie completă dacă fiecare jucător are informa6ie completă în τ . ?e exemplu; şa%ul şi jocul de dame sunt jocuri cu informa6ie completă; în constrast cu jocul de &rid!e sau cu cel de po8er. &
"i!.1.2 '.) trate"ii. Forma normală
Intuiti; o strate!ie este un plan de joc prin care un jucător sta&ileşte cum a reac6iona în fiecare din situa6iile posi&ile ale jocului. *ai precis efiniţia '.( E strateie a jucătorului i este o func6ie care ataşeaă fiecărei mul6imi de
informa6ie
S i j
un arc3 ce succede unui nod din
S i j
.
otăm cu
∑
i
mul6imea tuturor
strate!iilor jucătorului i .
3 'ai precis, este or$a de o clasă de arce, anume toate arcele care corespund unei anumite aciuni din prin corespondena din axioma f) a definiiei 1.2. utem spune că o strate*ie asocia#ă fiecărei mulimi un element din . rin urmare, o strate*ie a !ucătorului este o funcie definită pe mulimea a tuturor mulimilor de informaie ale !ucătorului cu proprietatea că pentru orice . +
9n !eneral; se presupune că un jucător planifică doar c>tea mişcări iitoare; şi de cele mai multe ori acest lucru se înt>mplă doar atunci c>nd el tre&uie să efectuee o mişcare. E asemenea practică este adeseori necesară pentru că; aşa cum se înt>mplă de exemplu la jocul de şa% sau la cel de po8er; numărul mişcărilor posi&ile este at>t de mare înc>t nimeni nu poate 6ine seama de toate posi&ilită6ile iitoare. ?in punct de edere pur teroretic se poate depăşi această dificultate practică şi se poate presupune că înainte de începutul jocului fiecare jucător decide ce a face el în fiecare situa6ie particulară posi&ilă; adică fiecare jucător ale!e; înainte de joc; strate!ia sa. ?upă aceasta răm>n desc%ise numai mişcările aleatoare. Gle pot fi concentrate într:o sin!ură @mişcare=; al cărei reultat; împreună cu strate!iile alese; determină perfect punctul final al jocului. "iecare jucător este interesat; desi!ur; de acea strate!ie care îi asi!ură cel mai mare c>şti! Aadică jucătorul i urmăreşte să maximiee componenta i a ectorului c>şti!urilor. ?eoarece asupra reultatelor paşilor aleatori se pot face doar afirma6ii pro&a&ilistice; se consideră c>şti!ul e!al cu aloarea medie a func6iei de c>şti!. 7n aspect de discutat însă în pro&lema maximiării func6iei de c>şti! este şi profilul decidentului. Gste cunoscută pro&lema inestitorului; în care o persoană dispune de 1.000 de dolari şi are două ariante să nu inestească şi să răm>nă cu cei 1.000 de dolari sau să inestească şi cu o pro&a&ilitate de +0N să c>şti!e 1.100 dolari iar cu o pro&a&ilitate de 10N să piardă +00 de dolari. ?eşi din punct de edere matematic cele două situa6ii sunt e!ale Aa>nd aceeaşi medie; o persoană optimistă a ale!e să inestească &anii în timp ce o persoană pesimistă a ale!e să păstree &anii. ă notăm acum cu
σ i
∈ ∑i
(i
= 1, n)
strate!iile jucătorilor şi cu
π (σ 1 , σ 2 ,..., σ n ) = (π 1 (σ 1 , σ 2 ,..., σ n ),..., π n (σ 1 , σ 2 ,..., σ n ))
aloarea medie a func6iei de c>şti!. "unc6ia π (σ 1 , σ 2 ,..., σ n ) poate fi ta&elată pentru toate alorile posi&ile ale lui σ 1 ,..., σ n fie su& forma unor rela6ii; fie printr:un ta&el n : dimensional de n : ectori. cest ta&el n : dimensional se numeşte forma normală a jocului τ . -,emplul '.% 9n jocul aruncării monedei; fiecare jucător are două strate!ii ale!erea stemei sau &anului. "orma normală a acestui joc este redată de matricea următoare; în care liniile repreintă strate!iile jucătorului I; iar coloanele strate!iile jucătorului II
-,emplul '.( ă considerăm acum următorul joc. E aria&ilă aleatoare ia alorile 1; 2; 3;
'; fiecare cu o pro&a&ilitate de O. Jucătorul I; fără a cunoaşte reultatul experimentului aleator; ale!e un număr x ; iar jucătorul II; fără a cunoaşte reultatul experimentului aleator şi ale!erea lui I; ale!e un număr y . ?rept func6ie de c>şti! se ia ( y − z − x − z , x − z − y − z )
; adică se urmăreşte !%icirea c>t mai exactă a alorii z luate de aria&ila aleatoare. 9n acest joc fiecare jucător dispune de ' strate!ii 1; 2; 3; '. ?acă I ale!e strate!ia 1 şi II ale!e strate!ia 3; atunci c>şti!ul este A2; :2 cu pro&a&ilitatea O; A0; 0 cu pro&a&ilitatea O sau A:2; 2 cu pro&a&ilitatea P. Qaloarea medie este deci π (1,3) = (−1 - 2,1 - 2) . Calcul>nd astfel toate alorile π (σ 1 , σ 2 ) ; se o&6ine următoarea matrice 1 2 3 '
1 A0; 0 AP;:P AP;:P A0; 0
2 A: P ; P A0 ;0 A0; 0 A: P ; P
3 A: P; P A0; 0 A0; 0 A: P ; P
' A0; 0 AP;:P AP;:P A0; 0
efiniţia '.& 7n joc se numeşte finit dacă ar&orele său are un număr finit de noduri.
*ajoritatea jocurilor de societate sunt; conform acestei defini6ii; finite. Gste uşor de ăut că într:un joc finit există doar o mul6ime finită de strate!ii. '.% Puncte de ec/ili0ru
efiniţia '.1 7n sistem
(σ 1 , σ 2 ,.., σ n )
de
n strate!ii
σ i ∈ ∑i
se numeşte punct de
σ ∈ echilibru dacă pentru orice i = 1, n şi orice i ∑i aem π i (σ 1 ,.., σ i−1 , σ i , σ i+1 ,.., σ n ) ≤ π i (σ 1 ,.., σ n ).
10
Cu alte cuinte; un sistem de n strate!ii formeaă un punct de ec%ili&ru dacă nici un jucător nu are un moti reona&il să îşi modifice strate!ia; presupun>nd că to6i ceilal6i jucători îşi păstreaă strate!ia corespunătoare. Qom edea însă în partea de aplica6ii a acestei lucrări că în majoritatea caurilor; c%iar în situa6ii foarte simple; jucătorii nu ale! situa6iile optime. )eoretic; dacă un jucător cunoaşte exact planurile celorlal6i; el a prefera strate!iile care împreună cu acelea ale oponen6ilor formeaă un punct de ec%ili&ru; şi jocul a deeni sta&il. -,emplul '.& Considerăm un joc de două persoane cu forma normală α 1 α 2
β 1
β 2
A2; 1 A0; 0
A0; 0 A1; 2
tunci (α 1 , β 1 ) şi (α 2 , β 2 ) sunt puncte de ec%ili&ru. ?in păcate; nu orice joc posedă puncte de ec%ili&ru.7n exemplu este aruncatul monedei; joc preentat anterior. ?acă un joc nu posedă puncte de ec%ili&ru; atunci fiecare jucător a încerca să:şi păcălească adersarii; păstr>ndu:şi secrete strate!iile. ceastă consecin6ă ne conduce la ideea că în jocuri cu informa6ie completă există întotdeauna puncte de ec%ili&ru. $entru a demonstra această afirma6ie om folosi no6iunea de descompunere a unui joc . 7n joc τ se numeşte decompo!abil în nodul X dacă nici o mul6ime de informa6ie nu con6ine noduri care apar6in at>t mul6imii formate din
X
şi to6i succesorii lui c>t şi restului
ar&orelui jocului. 9n acest ca putem separa jocul par6ial τ X ; a>nd drept noduri pe to6i succesorii lui; de jocul c>t τ - X ; a>nd drept noduri restul nodurilor şi pe jocul c>t
X este
X .
X şi
$entru
un nod finalK c>şti!ul în acest punct; notat τ X ; constă din reultatul su&:
jocului τ X . şa cum am afirmat anterior; o strate!ie pentru jucătorul i este o func6ie al cărei domeniu de defini6ie este totalitatea mul6imilor de informa6ie ale jucătorului i . ?acă un joc este decompoa&il în nodul X ; atunci fiecare strate!ie se poate descompune în două păr6i; anume
σ τ
X
; restric6ia lui σ la
τ X
; respecti
σ τ - X
; restric6ia lui σ la mul6imile de 11
informa6ie ale lui τ - X . Iners; o strate!ie pentru τ - X şi o strate!ie pentru com&inate într:o sin!ură strate!ie pentru jocul τ . 2eorma '.' "ie jocul
τ
decompo!abil în nodul X # $entru
σ i
∈ ∑i
τ X
pot fi
% i = 1, n & se ataşa!ă
nodului X , considerat ca nod final al lui τ - X , câştiul π X σ 1 τ , σ 2 τ ,..., σ n τ X
X
.
X
Atunci a'em( π ( σ 1 ,..., σ n )
= π τ - X σ 1 τ - X ,..., σ 2 τ - X
.
?emonstra6ia acestei teoreme se reduce la a arăta că pentru orice reultat posi&il al paşilor aleatori; acelaşi nod final este atins at>t în jocul ini6ial; c>t şi în descompunerea acestuia. $e &aa acestui reultat aem următoarea teoremă 2eorema '.) "ie τ un joc decompo!abil în nodul X şi fie
a& b&
σ 1 τ , σ 2 τ ,..., σ n τ X
X
σ 1 τ - X ,..., σ n τ - X
σ i
∈ ∑i
% i = 1, n & astfel încât(
este un punct de echilibru pentru τ X şi
X
este un punct de echilibru pentru τ - X a'ând câştiul
π σ 1 τ ,..., σ n τ X
X
în nodul final X # Atunci ( σ 1 ,..., σ n ) este un punct de echilibru pentru τ . )emonstraţie( "ie
/i σ
∈ ∑i
A i = 1, n . 9ntruc>t
2 τ ,..., σ n τ σ 1 τ , σ X
X
este punct de ec%ili&ru
X
pentru τ X ; aem
≤ π i (σ 1 τ
/ i τ X ,..., π i σ 1 τ X ,..., σ σ n τ
X
$e de altă parte; c>şti!ul în nodul X fiind
X
π σ 1 τ ,..., σ n τ
/ i τ - X ,..., σ n τ - X π i σ 1 τ - X ,..., σ
X
X
,..., σ n τ X
).
şi 6in>nd cont de b&, aem
≤ π i σ 1 τ - X ,..., σ n τ - X
. C>şti!ul; pentru o mul6ime dată de strate!ii; este o medie ponderată a c>şti!urilor în unele din nodurile finale ale ar&orelui jocului. ?acă c>şti!ul jucătorului i într:un nod final dat Aîn caul de fa6ă
X
descreşte; atunci; pentru orice ale!ere a strate!iilor; c>şti!ul său
12
mediu deasemenea descreşte sau în cel mai &un ca răm>ne nesc%im&at. plic>nd teorema 1.1; o&6inem / i ,..., σ n ) π i ( σ 1 ,..., σ
≤ π i (σ 1 ,.., σ n ) ;
deci ( σ 1 ,..., σ n ) este un punct de ec%ili&ru. Melati la existen6a punctelor de ec%ili&ru; demonstrăm următoarea teoremă 2eorema '.% *rice joc finit de n persoane cu informaţie completă posedă un punct de echilibru# )emonstraţie( ?efinim lunimea unui ca numărul maxim de noduri parcurse p>nă la atin!erea unui nod final; adică numărul maxim de paşi de la începutul p>nă la sf>rşitul jocului. 7n joc finit are eident lun!ime finită. ?emonstra6ia teoremei se face prin induc6ie completă după lun!imea jocului. ?acă τ are lun!imea 0 afirma6ia este &anală. cum; într:un joc de lun!ime 1; cel mult un jucător efectueaă o mişcare şi el o&6ine strate!ia de ec%ili&ru; ale!>nd cea mai &ună alternatiă. ?acă τ are lun!imea m ; jocul poate fi
descompus Aa>nd informa6ie completă în jocuri par6iale de lun!ime mai mică dec>t m . 9n &aa ipoteei induc6iei; fiecare dintre aceste jocuri are un punct de ec%ili&ru. plic>nd acum teorema 1.2; o&6inem concluia dorită.
13
$apitolul II: *ocuri de două persoane cu sumă nulă ).' *ocuri cu sumă nulă efiniţia ).' 7n joc
se numeşte joc cu sumă nulă dacă; pentru orice nod final; func6ia de c>şti! satisface condi6ia τ
n
∑ p
i
=0
A2.1 9n !eneral; un joc cu sumă nulă repreintă un sistem înc%is; în care orice c>şti! al unui jucător repreintă în mod necesar o pierdere e!ală pentru ansam&lul celorlal6i jucători. *ajoritatea jocurilor de societate sunt jocuri cu sumă nulă. Jocurile de două persoane cu sumă sunt numite antaoniste. ?atorită rela6iei A2.1; a n :a componentă a ectorului de plată este perfect determinată de i =1
.
celelalte n − 1 componente. ?e aceea; în caul unui joc de două persoane cu sumă nulă este suficient să se dea doar prima componentă a ectorului c>şti!urilor. doua componentă este în mod necesar e!ală cu opusul primei. 9n acest ca numim prima componentă; pe scurt; câşti ; în6ele!>nd prin aceasta că al doilea jucător plăteşte această sumă primului jucător. *ai departe se a edea că jocurile de două persoane cu sumă nulă se deose&esc de alte jocuri prin aceea că pentru am&ii jucători este lipsit de sens să cooperee într:un mod oarecare; căci orice c>şti! al unuia înseamnă o pierdere pentru celălalt. emnifica6ia acestei o&sera6ii se în6ele!e din următorul reultat 2eorema ).' "ie ( σ 1 , σ 2 ) şi (τ 1 ,τ 2 ) puncte de echilibru într+un joc de două persoane cu
sumă nulă# Atunci a& ( σ 1 ,τ 2 ) şi (τ 1 , σ 2 ) sunt de asemenea puncte de echilibru b& π ( σ 1 , σ 2 ) = π (τ 1 ,τ 2 ) = π (σ 1 ,τ 2 ) = π (τ 1 , σ 2 ) #
A2.2
)emonstraţie( $entru că (σ 1 , σ 2 ) este punct de ec%ili&ru; aem π ( σ 1 , σ 2 ) ≥ π (τ 1 , σ 2 ) 14
şi analo!; din (τ 1 ,τ 2 ) punct de ec%ili&ru; aem π (τ 1 , σ 2 )
≥ π (τ 1 ,τ 2 ) ;
de unde o&6inem rela6ia π ( σ 1 , σ 2 ) ≥ π (τ 1 , σ 2 ) ≥ π (τ 1 ,τ 2 ) .
9n mod analo!; o&6inem rela6ia π (τ 1 ,τ 2 )
≥ π (σ 1 ,τ 2 ) ≥ π (σ 1 , σ 2 ) ;
rela6ie ce înc%eie demonstra6ia rela6iei A2.2. *ai departe; pentru orice σ / 1 aem π (σ / 1 , σ 2 )
≤ π (σ 1 , σ 2 ) = π (τ 1 , σ 2 )
/2 ) π (τ 1 , σ
≥ π (τ 1 ,τ 2 ) = π (τ 1 , σ 2 ) ;
şi analo! pentru orice σ / 2 deci (τ 1 , σ 2 ) este un punct de ec%ili&ru. imilar; se arată că (σ 1 ,τ 2 ) este punct de ec%ili&ru. firma6ia teoremei nu este ala&ilă pentru un joc ar&itrar. 9n jocul din exemplul 1.5; (α 1 , β 1 ) şi (α 2 , β 2 ) sunt
puncte de ec%ili&ru; dar c>şti!urile corespunătoare sunt diferite.
?e asemenea; nici ( α 1 , β 2 ) şi nici ( α 2 , β 1 ) nu sunt puncte de ec%ili&ru. ).) Forma normală
?upă cum am ăut; forma normală a unui joc finit de două persoane cu sumă nulă se reduce la o matrice' A în care numărul liniilor Arespecti coloanelor este e!al cu numărul strate!iilor jucătorului I Arespecti II. ?acă jucătorul I ale!e a i :a strate!ie; iar jucătorul II a
j :a
strate!ie; atunci c>şti!ul mediu este repreentat de elementul
a ij
din linia
i
şi
coloana j a matricei A . ?upă cum om edea; o perec%e ( i, j ) de strate!ii este un punct de ec%ili&ru dacă şi numai dacă elementul aij corespunător este simultan cel mai mare în coloana lui şi cel mai mic din linia sa. 7n astfel de element se numeşte punct şa Aprin analo!ie cu
4 e unde şi denumirea de joc matriceal 15
suprafa6a unei şei; cur&ată în sus pe o direc6ie şi în jos pe direc6ia perpendiculară. u orice matrice posedă un punct şa. -,emplul ).' a3 Jocul matriceal
5 3 − 3
1
3
2
4
0
1
îl are pe 2 punct şa Aelementul din coloana a doua şi linia a doua. 03 Jocul matriceal
− 1 1 1 1 − nu are punct şa. ă presupunem că cei doi jucători joacă un joc matriceal. 9n acest ca; ale!erea unei strate!ii înseamnă pentru jucătorul I ale!erea unei linii i ; iar pentru jucătorul II ale!erea a
unei coloane j . C>şti!ul este atunci ij . 9ntruc>t aceasta este suma primită de jucătorul I de la jucătorul II; I a încerca să o maximiee în timp ce II a încerca să o minimiee. 9n orice ca; nici unul nu ştie ce strate!ie a ale!e adersarul său şi tocmai acesta este un element esen6ial în ale!erea propriei strate!ii. ă analiăm; de exemplu; jocul aruncării monedei. Jucătorul I poate ra6iona astfel nd că eu oi ale!e &anul. r fi aşadar mai &ine ca eu să ale! totuşi stema. ?ar este posi&il ca jucătorul II să intuiască acest ra6ionament; deci...@. Gident; cu un astfel de ra6ionament jucătorul I nu poate ajun!e în acest ca la nici o deciie satisfăcătoare. cest lucru se datoreaă lipsei punctului şa. ă presupunem acumă că ne aflăm în condi6iile jocului de la punctul a din exemplul 2.1. Jucătorul I se a decide pro&a&il pentru prima sau a doua dintre strate!iile sale şi o a ale!e în cele din urmă pe a doua; ra6ion>nd astfel <)re&uie să ale! prima sau a doua dintre strate!iile mele. Jucătorul II; în6ele!>nd aceasta; a ale!e a doua strate!ie a sa; deci pentru mine cel mai &ine este să ale! a doua strate!ie a mea=. C%iar dacă jucătorul II !%iceşte strate!ia jucătorului I; este &ine pentru primul jucător să şi:o păstree. Gxistă deci o deose&ire fundamentală între acest joc şi precedentul. 9n primul joc păstrarea secretă a strate!iei alese este extrem de importantă; dar în al doilea joc aceasta nu joacă nici un rol. Gxplica6ia reidă deis!ur în existen6a unui punct şa în al doilea joc. 1%
).% trate"ii mi,te
nalia de p>nă acum a indicat cum tre&uie tratat un joc matriceal care posedă un punct şa; dar nu a dat nici o indica6ie asupra comportării optime a jucătorilor în jocurile fără puncte şa. stfel de jocuri sunt însă cele mai des înt>lnite. ă presupunem că jucăm un joc matriceal fără punct şa; de exemplu
4 1
2
3
. ?esi!ur; nu putem preedea desfăşurarea jocului. ă presupunem însă că; strate!ia adeersarului răm>n>ndu:ne impreii&ilă; acesta !%iceşte exact deciia noastră. 9n această situa6ie; ca jucător I; om ale!e cu si!uran6ă prima strate!ie; cu care c>şti!ăm două unită6i; în timp ce cu a doua strate!ie am c>şti!a doar o unitate. cest c>şti! si!ur de cel pu6in două unită6i este pentru noi c>şti!ul minim; notat v I
min a ij = max i i
. A2.3 9n rolul jucătorului II; în aceleaşi condi6ii; ar tre&ui să ale!em a doua strate!ie; care ne aduce o pierdere de cel mult trei unită6i.otăm această pierdere maximă
= min j
i
v II
max aij
. A2.' C>şti!ul minim şi pierderea maximă joacă un rol extrem de important în jocurile matriceale. C>şti!ul minim al jucătorului I este eident cel mult e!al cu pierderea maximă a jucătorului II; adică i
i
v I
≤ v II i
A2.5 ?emonstra6ia acestui reultat este elementară. ?acă în această ine!alitate aem c%iar e!alitate; atunci există un punct şa. 9n caul în care ine!alitatea este strictă; jocul nu are puncte şa. 9ntr:un astfel de joc nu putem preedea nimic; dar putem sta&ili următoarele jucătorul - trebuie să nu câştie mai puţin decât
i
v I ,
iar jucătorul -- să nu piardă mai mult
i
de v II # ?acă îi transmitem adersarului strate!ia noastră; într:un joc fără punct şa putem o&6ine; i
i
în cel mai &un ca; c>şti!ul minim v I ; respecti pierderea maximă v II , după cum repreentăm jucătorul I sau II. $utem o&6ine un reultat mai &un doar eit>nd ca 1&
adersarul să ne afle strate!ia. ceasta este desi!ur !reu de realiat at>ta timp c>t ale!erea noastră se &aeaă pe ra6ionamente lo!ice; căci nimic nu îl împiedică pe adersar să reproducă acest ra6ionament. şadar strate!ia tre&uie aleasă în mod mplare; adică nu pe &aa unui ra6ionament; dar sc%ema aleatoare însăşi tre&uie concepută în mod ra6ional. ceastă idSe stă la &aa no6iunii de strate!ie mixtă. efiniţia ).) E strateie mixtă a unui jucător este o reparti6ie de pro&a&ilitate pe mul6imea strate!iilor sale pure. ?acă jucătorul posedă un număr finit m de strate!ii pure; atunci o strate!ie mixtă a sa constă dintr:un
m :ector x
= ( x1 ,.., xn ) ce erifică proprietă6ile xi
≥ 0, pentru orice i = 1, n
A2.(
şi n
∑ x
i
=1
i =1
otăm cu X şi
.
A2.4
Y mul6imile strate!iilor mixte ale jucătorilor I; respecti II.
ă presupunem acum că jucătorii I şi II joacă jocul matriceal
A şi
ale! strate!iile mixte x
şi y . tunci c>şti!ul mediu este A( x, y )
m
n
= ∑∑ xi aij y j i =1 j =1
;
A2.#
sau; scis su& formă matriceală A( x, y )
= xAy t .
A2.+ Ca şi p>nă acum; jucătorul I tre&uie să se teamă că II a descoperi strate!ia sa x . 9n acest ca II a ale!e cu si!uran6ă strate!ia sa y care minimieaă strate!ia x ; jucătorul I o&6ine deci cel pu6in c>şti!ul mediu v( x) = min xAyt y∈Y
.
A( x, y ) .
"olosind
A2.10
1+
t
?eoarece xAy poate fi considerat ca medie ponderată a c>şti!urilor medii ale jucătorului I; c>nd acesta foloseşte strate!ia x împotria strate!iilor pure ale jucătorului II; minimul acestor medii ponderate se atin!e pentru o strate!ie pură; adică v ( x) = min xA• j j
Aunde A• j repreintă coloana j a matricei
A .
?esi!ur; jucătorul I ale!e x astfel înc>t să maximiee v I
A2.11
min xA• j = max j x∈ X
v ( x) şi
AGxisten6a acestui maxim e asi!urată de faptul că mul6imea v( x )
x
este continuă. 7n asemenea
astfel c>şti!ă cel pu6in A2.12
X este
compactă iar func6ia
se numeşte strateie maximin a jucătorului I.
nalo!; folosind strate!ia y ; jucătorul II are cel mult pierderea medie v( y ) = max Ai • y t i
Gl tre&uie să alea!ă pierderea
y
y
A2.13
astfel înc>t să minimiee această pierdere şi astfel are cel mult v II
E strate!ie
max Ai • y t = min y∈Y i
A2.1'
pentru care se atin!e minimul în A2.1' se numeşte strate!ie minimax
pentru jucătorul II. Qalorile respecti pentru jucătorul II.
v I
şi
v II
se numesc 'alori ale jocului pentru jucătorul I;
).( 2eorema Minima,
e arată cu uşurin6ă că pentru orice func6ie F ( x, y ) definită pe produsul carteian aem max min F ( x, y )
X × Y
≤ min max F ( x, y ) y∈Y x∈ X
A2.15 presupun>nd că minimele şi maximele există. ?in această ine!alitate reultă imediat că x∈ X
y∈Y
v I
≤ v II .
ceastă ine!alitate corespunde celei de la punctul A2.5. ?e fapt; şi în acest ca; este natural ca cel mai mic c>şti! al jucătorului I să nu depăşească pierderea maximă a lui II. 1
9n caul strate!iilor pure am ăut că în A2.5 e!alitatea are loc doar în anumite cauri particulare. 9n acest ca aem însă următorul reultat 2eorema ).) 4Teorema minimax 3. v I =v II .
ceastă teoremă fundamentală a teoriei jocurilor a fost demonstrată în dierse moduri. Qom preenta în continuare demonstra6ia ori!inală dată de on eumann şi *or!enstern. $entru aceasta; om da; fără demonstra6ie; două leme 5ema ).% A.xistenţa hiperplanelor de separare . "ie B o mulţime con'exă închisă în
spaţiul euclidian
n +dimensional
există numerele reale
x
şi
p1 ,..., p n , p n +1
= ( x1 ,.., xn ) un punct ce nu aparţine lui
B #
Atunci
astfel încât ( n
∑ p x i
i
i =1
=
p n +1
A2.1(
şi n
∑ p y i
i
>
p n +1 ,
∀
y ∈ B .
A2.14 Teometric; lema afirmă că există un %iperplan ce trece prin punctul x astfel ca mul6imea i =1
B să fie con6inută într:unul dintre semispa6iile determinate de %iperplan.
A = aij
o matrice m × n # Atunci este ade'ărată una şi numai una dintre următoarele două afirmaţii ( /& $unctul 0 %al spaţiului m + dimensional& aparţine acoperirii con'exe a următoarelor 5ema ).( A Teorema alternati'ei pentru matrice . "ie
m + n puncte
( a1
= ( a11 ,..., a m1 )
1111111 an
= ( a1n ,..., amn )
şi e 1=( 1,0, … , 0 )
1111111 20
e n=( 0,0, … , 1 )
#
2& .xistă numerele reale x1 ,..., xm astfel încât( m
xi
> 0,
∑ x
i
=1
i =1
m
∑ a x ij
,
i
> 0,
i =1
j = 1, n.
)emonstraţia teoremei minimax "ie A un joc matriceal. Conform lemei 2.'; este adeărată fie afirma6ia 1 a acesteia; fie 2. 9n caul 1; ectorul 0 se poate repreenta ca
o com&ina6ie liniară a celor
m+ n
ectori; adică există numerele
s 1 , … , sm + n
astfel
înc>t n
s a + s + =0, i =1,´m ∑ = j
ij
n i
j 1
s j ≥ 0, j =1, m´ + n
;
m+ n
s =1. ∑ = j
j 1
?acă numerele
s 1 , … , sn
ectori unitari
e 1, , … , e m
ar fi toate nule; atunci 0 ar fi o com&ina6ie liniară a celor
m
; ceea ce este imposi&il Adeoarece aceştia sunt liniar
independen6i. ?eci cel pu6in unul dintre
s 1 , … , sn
este poiti; ceea ce implică
n
s >0 ∑ = j
. ot>nd
j 1
y j =
s j n
s ∑ =
;
j
j 1
aem n
y i ≥ 0,
∑= y =1, j
j 1
n
a y = ∑ = ij
j 1
j
− sn+ i n
≤ 0, ∀ i.
s ∑ =
j
j 1
$rin urmare;
v ( y ) ≤ 0
şi
v II ≤ 0
.
9n al doilea ca al lemei 2.'; aem v ( x )> 0 şi deci v I >0 . $rin urmare; ine!alitatea v I ≤ 0 < v II nu poate aea loc. ă înlocuim acum jocul jocul
B =( b ij )
; unde
bij = aij + k .
$entru orice
x
şi
y
A
cu
aem eident 21
t
t
xB y = xA y + k
şi deci v I ( B ) =v I ( A )+ k
,
v II (B )=v II ( A ) + k
#
?eoarece nu putem aea v I ( B ) ≤ 0 < v II ( B )
şi deci nici v I ( A ) ≤ −k < v II ( A ) ,
reultă;
k
v I < v II
fiind ar&itrar; că nu putem aea
; deci
v I ≥ v II
.
Cum ine!alitatea contrară a fost deja demonstrată; răm>ne doar că v I = v II . şadar; c>şti!ul minm al jucătorului I este e!al cu pierderea maximă a lui II; dacă se folosesc strate!ii mixte. umărul v =v I = v II se numeşte 'aloarea jocului# E strate!ie x
cu proprietatea m
x a ≥ v , j =1,´ n ∑ = i
ij
A2.1#
i 1
este optimă pentru primul jucător; în sensul că nu există nici o strate!ie care să:i aducă un c>şti! mediu mare mare ca v ; indiferent de strate!ia folosită de jucătorul II. Iners; dacă y are proprietatea n
a y ≤ v , i = 1,´ n ∑ = ij
j
;
A2.1+
j 1
atunci atunci
y
este optimă pentru jucătorul II în sensul definit mai dereme. em eident xA y
t
=v ,
deoarece folosind rela6iile A2.1# şi A2.1+ aem rela6ia
t
v ≤ xA y ≤ v
.
$rin urmare; strate!iile optime x şi y sunt de asemenea strate!ii optime una împotria celeilalte; ca şi împotria oricărei alte strate!ii a adeersarului. E asemenea perec%e ( x , y ) de strate!ii optime se numeşte; din acest moti; soluţie a jocului . 9n înc%eierea acestui capitol; enun6ăm; fără demonstra6ie; o ariantă mai tare a teoremei minimax
22
2eorema ).& 3ntr+un joc matriceal
strateie optimă
y
cu
y n > 0
A
de dimensiune
m× n
, fie - are o strateie optimă
x
, fie jucătorul -- are o , pentru care
m
a ¿ x > v ∑ = i
.
i 1
$apitolul III: *ocuri contra naturii
$>nă acum ne:am ocupat de jocuri în care ale!erea strate!iilor era determinată de matricea A a c>şti!urilor primului jucător. unt situa6ii în care riscurile cu care se iau %otăr>ri nu pot fi cunoscute; deoarece jucătorul II nu ac6ioneaă rational. 7n astfel de jucător poate fi considerate natura; de unde şi denumirea de jocuri contra naturii. ?e analia unor astfel de situa6ii se ocupă teoria deciiilor. 9n cele ce urmeaă om edea unele criteria de ale!ere a deciiei jucătorului I Ape care îl om numi şi statistician în jocurile contra naturii Anumite şi jocuri în ca de incertitudine. *en6ionăm că atitudinea fa6ă de joc; diferită de la o persoană la alta; face ca în teoria 23
deciiilor să nu existe criterii uniersal ala&ile. plicarea criteriilor poate conduce la reultate diferite. le!erea strate!iei ar putea fi data de reultatul aplicării mai multor criteria. Qom presupune că statisticianul jucătorul I; dispune de natura de
n
stări
"ie matricea
B1, … , Bn
A =( aij )
ale!e strate!ia
A i
strate!ii pure
A 1 , … , A m
; iar
.
i =1,´m; j =1,´ n
;
m
; unde
; iar natura se află în starea
este c>şti!ul jucătorului I c>nd
aij B j
.
%.' $riteriul lui 6ur7ic8 4criteriul optimistului3
Eptimismul jucătorului I se defineşte ca un număr
[
∝∈ 0, 1
] . e determină numere
reale mi= min { a ij } j
M i=max { a ij }
;
j
"iecărei strate!ii
A i
i =1,´m
.
îi asociem expresia ∝ M i
+ ( 1−∝ ) mi , i =1,´m #
trate!ia optimă a fi cea care corespunde la [¿ ∝ M i + ( 1 −∝) mi ] . max ¿ i
9n folosirea acestui criteriu este necesar însă să se definească în preala&il optimismul jucătorului; adică aloarea
[
∝∈ 0, 1
] .
$entru o mai &ună în6ele!ere a acestui criteriu om preenta în cele ce urmeaă un scurt exemplu. -,emplul %.' e consideră jocul contra naturii a cărui matrice a c>şti!urilor jucătorului I
în orice strate!ie a sa A 1 A 2 A 3 A 4
A i ,i= 1,´ 4
şi în orice stare
B j , j =1,´ 4
a naturii este
B1
B2
B3
B4
2 3 1 3
' 2 5 3
3 3 2 2
3 2 1 3
24
∝=
Considerăm
2
şi ne propunem să determinăm strate!ia optimă.
3
taşăm matricei date coloanele elementelor
mi , M i
şi
∝ M i
+(1 −∝) mi ; fiecare
a>nd semnifica6ia descrisă anterior. E&6inem astfel B1
B2
B3
B4
2 3 1 3
' 2 5 3
3 3 2 2
3 2 1 3
A 1 A 2 A 3 A 4
[¿ ∝ M i + ( 1 −∝) mi ] Ca să determinăm ; cum max ¿
mi
2 2 1 2
∝∈
+(1 −∝) mi 2 ∝ +2 ∝+ 2 4 ∝ +1 ∝+ 2
M i
∝ M i
' 3 5 3
[ 0, 1 ] ; o&serăm că
∝+ 2 ≤ 2 ∝ + 2.
i
şadar; studiem doar caurile a
4 ∝ + 1 < ∝ + 2,
&
∝+ 2 ≤ 4 ∝ + 1 < 2 ∝ + 2
c
2 ∝ +2 ≤ 4 ∝ + 1 ∝ ∈ 0,
A 1
$entru
∝∈
$entru
∝∈
[ ) [ ] ,
3 2
2
<
1 3
1
K
3
; de unde ∝≥
2∝ +2
,
1 2
1 3
≤∝<
1 2
.
.
este cea mai mare aloare şi cum ea corespunde
; aceasta este strate!ia optimă.
1 1
1
∝
; de unde
[ )
?eci pentru strate!iei
de unde
,
tot
,1 ,
9n caul nostru; aem
2 ∝ +2
4 ∝ +1 ∝=
2 3
este aloarea maximă; deci
e aloarea maximă şi ∈
[ ] ; deci 1 2
,1
A 3
A 3
A 1
e strate!ie optimă.
este strate!ia optimă.
este strate!ia optimă.
%.) $riteriul Ba9es – 5aplace
9n caul acestui criteriu se presupune că stările naturii sunt e!al pro&a&ile. Cum numărul lor este
n
; pro&a&ilitatea ca natura să se afle în starea
B j
este
1
n
, ∀ j =1,´ n
.
25
?acă jucătorul I a ale!e strate!ia
1
; c>şti!ul său a fi
A i
n
∑a
n j=1
ij
; care este aloarea
medie a aria&ilei aleatoare discrete cu reparti6ia
(
ai 1 ai 2
a¿
1 1 …1
n
n n
)
.
Jucătorul I a ale!e strate!ia care maximieaă c>şti!ul său mediu max 1 ≤i≤m
{∑ }. 1
n
n
i =1
aij
*bse'aţia - ?acă se cunosc totuşi pro&a&ilită6ile diferitelor stări ale naturii; respecti y 1 ,…, y n
; deci strate!ia
y y =(¿ ¿ 1 ,…, y n )
y j ≥ 0, j =1,´ n
cu
n
şi
¿
y =1 ∑ =
; c>şti!ul
j
j 1
mediu al statisticianului I c>nd foloseşte strate!ia
a fi; conform teoremei minimax
A i
n
π ( i , y )=
a y ∑ = ij
j
;
j 1
iar c>şti!ul mediu a fi maxim pentru strate!ia corespunătoare alorii max π ( i , y ) . 1≤i≤m
*bser'aţia -- Criteriul lui aplace introduce toate neajunsurile alorii medii. ?acă estimările au fost făcute !rosolan apar erori mari în apreciere; ce or duce la deciii
!reşite. Criteriul deine de multe ori inaccepta&il atunci c>nd elementele jocului sunt foarte dispersate. -,emplul %.). e propunem ca pentru jocul de la exemplul 3.1 să determinăm strate!ia optimă a jucătorului I în caurile a c>nd stările naturii sunt e!al pro&a&ileK & c>nd pro&a&ilită6ile ca natura să se afle în stările ei sunt respecti $entru caul a; ataşăm matricei jocului coloana
1
1 2 4 2
,
,
,
9 9 9 9
.
4
∑a
4 j =1
ij
2%
B1
B2
B3
B4
1
4
∑a
n j =1
2
A 1
'
3
3
1
° 12
4
3
A 2
2
3
2
1
° 10
4
1
A 3
5
2
1
1 4
3
A 4
3
2
3
1 4
?eci
max 1 ≤i ≤ 4
{
1
n
∑a 4 =
ij
j 1
}
este
1 4
; ce corespunde strate!iei
° 12
A 1
ij
°9 ° 11
; deci aceasta este
aloarea optimă conform criteriului aplace. $entru &; calculăm pentru fiecare strate!ie i=1,´ 4 . E&6inem π ( 1, y )=
1
A i
aloarea expresiei date de
2
4
2
28
9
9
9
9
1
2
4
2
23
9
9
9
9
9
2
4
2
21
9
9
9
9
2
4
2
23
9
9
9
9
9
∗2 + ∗4 + ∗3 + ∗3 =
π ( 2, y )= ∗3 + ∗2+ ∗3 + ∗2= π ( 3, y )=
1
π ( 4, y ) =
1
Cea mai mare aloare este
28 9
9
9
∗1 + ∗5 + ∗2 + ∗1 = ∗3 + ∗3 + ∗2 + ∗3 =
; corespunătoare lui
π ( 1, y )
; deci
π ( i , y )
A 1
;
este
strate!ia optimă. 3.3 $riteriul lui ava"e 4criteriul re"retelor3 aa!e compară reultatul deciiei în caul necunoaşterii stării naturii cu cel care s:ar o&6ine dacă s:ar cunoaşte această stare. ?iferen6a dintre c>şti!ul realiat c>nd se ia deciia fără a cunoaşte stările naturii şi cel realiat dacă se cunosc acestea repreintă reretul sau ce s:ar fi c>şti!at dacă I ar fi cunoscut stările naturii.
2&
A =( aij )
$ornind de la matricea R=( r ij )
i =1,´m
;
j= 1,´ n
; se formeaă o nouă matrice
numită matricea reretelor ; cu elementele r ij = max a kj− aij 1≤k≤m
adică
;
,
j= 1,´ n
este dat de diferen6a dintre cele mai mare element de pe coloana
r ij
elementul
i=1,´m
,
aij
j
şi
.
e o&6ine astfel un nou joc caracteriat de matricea R care a fi tratat după criteriul minimax. Jucătorul I a ale!e strate!ia pe linia căreia se o&6ine
{
min max r ij
1 ≤ i ≤ m 1≤ j ≤ n
}
; adică linia pe care cel mai mare re!ret este minim.
-,emplul %.% Qrem să edem; pentru acelaşi joc folosit şi în primele două exemple; ce
strate!ie ar ale!e jucătorul I aplic>nd criteriul re!retelor. e determină mai înt>i matricea re!retelor ale cărei elemente de pe o coloană se o&6in scă>nd din cel mai mare element al coloanei fiecare element al acesteia. e o&6ine A 1 A 2 A 3 A 4
{
min max r ij
Cum
1 ≤i≤m 1≤ j ≤ n
}
B1
B2
B3
B4
max r ij
1 0 2 0
1 3 0 2
0 0 1 1
0 1 2 0
1 3 2 2
U
min { 1,3,2,2 }
U 1; ne reultă că şi utili>nd acest principiu
❑
jucătorul I a ale!e tot strate!ia
A 1
j
.
%.( $riteriul lui ald
?acă jocul are punct şa; statisticianul I ale!e strate!ia
(
max min aij i
j
)
A i
determinată de condi6ia
.
?acă jocul nu are punct şa; se determină strate!ia mixtă
x =( x 1 , … , x m )
pentru care
{∑ } este maximă. m
min j
i =1
aij x i
2+
-,emplul %.( plicarea criteriului lui ald jocului cercetat şi cu celelalte criterii ne duce la
concluia că jocul nu are punct şa. $roced>nd ca în su&capitolul 2.3 preentat anterior se determină strate!ia mixtă a statisticianului şi se !ăseşte ectorul
(
x =
1 1
,
3 3
, 0,
1 3
);
de unde reultă că jucătorul I poate ale!e oricare dintre strate!iile sale A 4
A 1
;
A 2
sau
.
*bser'aţie ?eşi criteriile aplicate nu au dus mereu la aceeaşi deciie; în majoritatea
caurilor s:a o&6inut că cea mai &ună strate!ie este
A 1 ,
astfel că statisticianul o a
ale!e pe aceasta. Aplicaţie e propunem ca pe &aa criteriilor de mai sus să !ăsim o solu6ie a următoarei pro&leme $atronul unui ma!ain ac%ii6ioneaă un număr de fri!idere de un anumit tip pe o perioadă de ( luni Aprimăară ară; cu scopul de a le inde. ?in o&sera6iile statistice; &aate pe cererea din ultimii trei ani; el estimeaă că a inde un număr de fri!idere cuprins între 15 şi 25 cu pro&a&ilitatea de 0;1K între 25 şi 35 cu pro&a&ilitatea de 0;'K între 35 şi '5 cu 0;3 şi între '5 şi 55 cu 0;2. Costul unitar de ac%ii6ie este de 300 de euro; iar pre6ul unitar de >nare este de '00 euro Ainclu>nd c%eltuielile de transport şi asi!urarea !aran6iei de func6ionare pentru un an de ile. )oate fri!iderele ne>ndute p>nă în toamnă se restituie furniorului pentru 250 de euro &ucata. e propunem să determinăm numărul optim de fri!idere pe care patronul ar tre&ui să le ac%ii6ionee. *ai înt>i determinăm matricea A =( aij ) ; i , j =1,´ 4 ; unde aij este c>şti!ul o&6inut de patron c>nd aplică strate!ia
A i ,i= 1,´ 4
şi cererea este în starea
S j , j= 1,´ 4
. E&6inem
astfel $ererea pieţei ; cantitatea ac/i8iţionată
A 1 : 20 A 2 : 30 A 3 :40 A 4 :50
S 1 :20
S 2 : 30
S 3 : 40
S 4 : 50
2000 1500 1000 500
2000 3000 2500 2000
2000 3000 '000 3500
2000 3000 '000 5000
2
unde de exemplu elementul de pe lina
A 3
şi coloana
S2
se calculeaă astfel din
cele '0 de fri!idere ac%ii6ionate se >nd 30. ?iferen6a dintre pre6ul unitar de >nare şi cel de ac%ii6ionare este de 100 de euro pentru un fri!ider; ce repreintă c>şti!ul patronului. $entru cele 30 de fri!idere >ndute a c>şti!a 3000 de euro. ?ar alte 10 fri!idere ne>ndute or fi restituite furniorului cu o pierdere unitară de 50 de euro dată de diferen6a dintre costul de ac%ii6ie; 300 de euro; şi cel de restituire; 250 de euro. ?eci pierderea a fi de 500 de euro; astfel că &eneficiul final a fi 3000 500 U 2500 euro. ?eoarece în sta&ilirea deciiei conteaă consecin6ele economice se pot aplica în reolarea pro&lemei criteriile maximin; minimax; aa!e şi Ba/es aplace. a $rin criteriul maximin se ale!e minimul fiecărei linii şi dintre acestea se !ăseşte maximul A 1
A2
A3
A4
)<<<
'&<<
'<<<
&<<
care este 2000; astfel că se a recomanda strate!ia A 1 . & Criteriul minimax ; &aat pe pruden6ă; indică ale!erea elementelor maxime pe fiecare linie şi apoi determinarea celui mai mic dintre acestea. A 1
A2
A3
A4
)<<<
%<<<
(<<<
&<<<
cest element este 2000 şi arată că A 1 repreintă şi cea mai prudentă deciie. c& Criteriul lui 4a'ae este de fapt criteriul minimax aplicat pe matricea re!retelor; ce a aea forma R=
(
0 500 1000 1500
500 0 500 1000
2000 1000 0 500
3000 2000 1000 0
)
#
pentru care om căuta maximul pe fiecare linie şi apoi pe cel mai mic dintre ele. Tăsim A 1
A2
A3
A4
%<<<
)<<<
'<<<
'&<<
?eci în acest ca a ale!e strate!ia A 3 ; care dă o pierdere de doar 1000. d Criteriul Ba/es aplace presupune calculul c>şti!ului mediu pentru fiecare strate!ie folosind pro&a&ilită6ile date în enun6ul pro&lemei şi formulele pe care le: am ăut anterior. stfel; aem π ( 1, y )=0,1∗2000 + 0,4∗2000 + 0,3∗2000 + 0,2∗2000= 2000 π ( 2, y )=0,1∗1500 + 0,4∗3000 + 0,3∗3000 + 0,2∗3000=2850 π ( 3, y )=0,1∗1000 + 0,4∗2500 + 0,3∗ 4000 + 0,2∗ 4000=3100 30
π ( 4, y ) =0,1∗500 + 0,4∗2000 + 0,3∗3500 + 0,2∗5000 =2900 Cel mai mar c>şti! se o&6ine c>nd se aplică strate!ia A 3 .
şadar; prin două metode am !ăsit strate!ia două metode am !ăsit strate!ia
A 1
A 3
ca fiind cea mai indicată; iar prin alte
drept optimă.
Gste de remarcat că nici una din aceste metode nu indică şi strate!ia
A 2
care din
punct de edere stric economic are sens prin prisma a două aspecte oferă cea mai &ună pro&a&ilitate de realiare şi un foarte &un cost de oportunitate.
31
$apitolul I!: Aplicaţii
9n cadrul acestui capitol ne propunem să edem solu6iile unora dintre cele mai interesante pro&leme ce se pot reola cu teoria jocurilor. m ales problema ameninţărilor credibile datorită rolului foarte important în te%nicile de ne!ociere; c%iar dacă majoritatea persoanelor nu conştientieaă aspectul mat%ematic al situa6iei; problema piraţilor ; de asemenea foarte folosită în te%nici de ne!ociere; dar şi în sta&ilirea pre6ului pe pia6ă şi c%iar o sursă de inspira6ie în filme. 7lterior am exemplificat felul în care oamenii percep în ia6a de i cu i aceste pro&leme de teoria jocurilor în situa6ii reale cu care se pot confrunta. 7ltimul su&capitol este dedicate jocului de po5er ; din punctul meu de edere unul dintre cele mai complexe jocuri în care se aplică te%nici matematici complexe. (.' Pro0lema ameninţărilor credi0ile
$ro&lema a fost de&ătută de economistul !erman Mei&%ard elten; profesor la 7niersitatea din Bonn; laureat al premiului o&el pentru economie în 1++'. cesta a dorit să demonstree diferen6ele dintre forma extinsă şi cea normală a unui joc ca instrumente de analiă strate!ică; după ce multă reme au fost considerate ec%ialente. Gxemplul pe care îl om preenta se numeşte @copilul răsfă6at= şi are următorul scenariu într:o s>m&ătă după:amiaă un copil capricios Ajucătorul I doreşte să mear!ă la cinema; dar părin6ii săi Ajucătorul II au decis ca toată familia să facă o iită mătuşii ofia. Jucătorul I desc%ide jocul. Gl poate accepta să mear!ă la mătuşa ofia sau să refue. ?acă decide să mear!ă la mătuşă; jocul se termină şi fiecare jucător are un c>şti! de 1. ?acă totuşi copilul refuă să mear!ă; atunci părin6ii sunt în fa6a ale!erii următoare îl pot pedepsi; pri>ndu:l de ieşire sau să cedee şi toată familia a mer!e la cinema. 9n caul în care ale! să îl pedepsească; fiecare are un c>şti! de :1 Acopilul este supărat deoarece este pedepsit; dar nici părin6ii nu or fi mai ferici6i; urm>nd să stea acasă toată iua şi să asculte pl>nsetele copilului. ?acă or ceda şi or mer!e la cinema; atunci copilul a aea un c>şti! de 2 iar părin6ii de 0. ?e aceea; părin6ii nu or pune în aplicare executarea amenin6ării lor; în ciuda refuului copilului de a mer!e la mătuşa ofia. Gi or prefera să reină asupra deciiei şi să mear!ă la cinema. 32
)a&elul următor preintă forma normal a acestui joc
Jucătorul I Acopilul răsfă6at
Qiită la mătuşa Mefu
Jucătorul II Apărin6ii $edeapsă Cedare A1; 1 A1; 1 A:1; :1 A2; 0
9n forma normal; jocul are 2 ec%ili&re primul este acceptul copilului de a mer!e la mătuşă şi pedeapsa din partea părin6ilor; iar al doilea corespunde refuului copilului de a mer!e la mătuşă şi cedarea din partea părin6ilor. )otuşi; jucătorul II are o încita6ie sla&ă în a adera la primul din aceste ec%ili&re; căci din moment ce jucătorul I ale!e să mear!ă la mătuşă; jucătorul II este indiferent între cele 2 strate!ii ale sale Apedeapsa sau nu. 9n plus; în această situa6ie pedeapsa nu este justificată. 9n ciuda acestui lucru; fiecare din aceste ec%ili&re de la forma normal satisfac defini6ia unui ec%ili&ru as% nici unul din jucătoru nu a face mai &ine deiind de la strate!ia sa de ec%ili&ru. ă analiăm acum pro&lema utili>nd forma extinsă. em următorul ar&ore
Gc%ili&rul st>n!a st>n!a se &aeaă pe o amenin6are noncredi&ilă din partea jucătorului II de a se deplasa la st>n!a dacă jucătorul I se deplaseaă la dreapta.
33
Cunosc>nd amenin6area jucătorului II cel mai &un răspuns al jucătorului I este să accepte şi dacă jucătorul I ale!e să mear!ă la mătuşă; ale!erea jucătorului II nu are nici o importan6ă pentru că el nu a aea neoie să joace. cest ec%ili&ru pune însă pro&leme; deoarece amenin6area jucătorului II nu este credi&ilă. ă presupunem că părin6ii or 6ine discursul de mai sus; dar în ciuda amenin6ării copilul refuă să mear!ă la mătuşă. 9n acest ca; părin6ii se !ăsesc în nodul 2 al ar&orelui; unde se confruntă cu ale!erea următoare fie îşi pun în aplicare amenin6area şi au un c>şti! de :1; fie cedeaă şi au un c>şti! de 0. ?acă părin6ii sunt reona&ili; ei preferă o satisfac6ie nulă uneia de :1. ?oar rancuna i:ar putea conduce să:şi pună în aplicare amenin6area. ?eine eident că a ec%ili&rul dat de Aa mer!e la mătuşă; a pedepsi nu este un ec%ili&ru satisfăcător; căci el nu se sprijină pe o amenin6are credi&ilă. $uşi în fa6a faptului împlinit Arefuul copilului de a mer!e la mătuşă părin6ii prefer să mear!ă la cinema mai cur>nd dec>t să:l pedepsească. cesta constituie de fapt ec%ili&rul jocului. 7n exemplu concret al acestei pro&leme îl constituie ne!ocierea pentru ac%ii6ionarea )um&lr de către Va%oo. ?eşi oferta de #00 de milioane de dolari a fost considerată prea mică de către cei de la )um&lr; care au cerut o sumă aproape du&lă pentru a inde; Va%oo a ales să men6ină aceeaşi ofertă. le!erea a fost dată de amenin6area noncredi&ilă din partea platformei de &lo!!in!; deoarece nielul eniturilor acestora este mult su& nielul c%eltuielilor; astfel că fără să >ndă ar fi fost neoie să înc%idă platforma. ?esi!ur că proprietarii afacerii au preferat o sumă de aproape 1 miliard de dolari în detrimentul falimentului. Eferta celor de la Va%oo nu ar fi putut fi însă nici prea scăută; deoarece în această situa6ie alte companii ar fi fost interesate şi s:ar fi ajuns la o licita6ie. (.) Pro0lema piraţilor
"orma simplificată a pro&lemei se preintă în felul următor trei pira6i; ; B şi C; !ăsesc 100 de &ani de aur; pe care îi or împăr6i conform unui ec%i cod al pira6ilor. Conform acestui cod; pira6ii urmeaă re!uli clare de structură piratul este mai puternic dec>t piratul B; iar acesta din urmă este mai puternic dec>t piratul B. 9n împăr6irea &anilor; modul de ot este următorul 1. Cel mai puternic pirat propune o împăr6ire a &anilor de exemplu @50 mie; 30 lui B şi 20 lui C=K 34
2. )o6i pira6ii; inclusi cel care a propus împăr6irea &anilor; or ota dacă acceptă sau nu împăr6irea propusăK 3. ?acă este majoritar otul pentru; are loc împăr6irea &anilorK '. ltfel; piratul care a propus împăr6irea este aruncat peste &ord şi lăsat să se îneceK 5. 7rmătorul cel mai puternic pirat propune o nouă împăr6ire a &anilor şi procesul se reia p>nă c>nd se sta&ileşte o împăr6ire acceptată. 9n mod eident; fiecare pirat este interesat în primul r>nd de a scăpa cu ia6ă şi mai apoi de c>t aur primeşte. stfel că la o primă edere a fi dispus să ofere foarte mult aur celorlal6i; fiind dispus să nu păstree c%iar nimic pentru el. )otuşi; cum a decur!e joculR olu6ia se o&6ine rela6ion>nd în sens iners. $iratul C este interesat să accepte orice sumă primită de la piratul . 9n ca contrar; dacă şi B a ota împotriă; piratul a fi aruncat peste &ord iar otul se a da între B şi C. cum; piratul B poate propune ca el să păstree to6i cei 100 de !al&eni; iar C să nu primească nimic. a ot; eident că B îşi a ota propria:i prounere; şi cum este mai puternic dec>t piratul C; indiferent de otul acestuia; propunerea sa a fi acceptată. stfel; pentru C este aantajos să accepte orice ofertă din partea lui în urma căruia el primeşte cea. ?in punctul de edere al piratului B; el este interesat să refue orice propunere a piratului ; cu excep6ia caului c>nd îi sunt oferi6i to6i cei 100 de !al&eni Asolu6ie nerealistă. ltfel; el a ota împotriă deoarece dacă piratul a fi aruncat peste &ord el a decide împăr6irea &anilor şi automat a opri to6i !al&enii. ?e aceea indiferent de suma propusă de piratul ; el a ota împotriă. $entru piratul ; care are eident otul propriu; este suficient să mai atra!ă un sin!ur pirat de partea sa. Conform celor descries mai sus; îi este practic imposi&il să fie pe aceeaşi lun!ime de undă cu piratul B; dar îl poate conin!e pe C. ?e aceea; solu6ia optimă pentru piratul este o împăr6ire de !enul A++; 0; 1. Cum se extinde această situa6ieR ă considerăm caul a ' pira6i; ; B; C şi ? care impart &anii conform aceloraşi re!uli. $iratul are neoie de un sin!r ot; iar cel mai simplu este să îl o&6ină pe cel al lui C. ?acă ar fi aruncat peste ⩝ am ajun!e la situa6ia descrisă anterior; iar B ar păstra ++ de !al&eni şi ? un sin!ur !al&en. Gident; C a prefera să primească cea; în timp ce B a refua orice ofertă su& ++ de !al&eni. ? aşteaptă o ofertă de minim 1 !al&en; pe care i:ar o&6ine în caul în care este aruncat. şadar; ar putea împăr6i astfel !al&enii A++;
35
0; 0 ;1 sau A++; 0; 1; 0. )otuşi; el a prefera otul unui pirat mai puternic; anume al lui C; astfel că a ale!e a doua ariantă. ceasta constituie reolarea pro&lemei de fa6ă. $ro&lema se poate !eneralia pentru orice număr de pira6i şi orice număr de monede. Gxistă însă o mare diferen6ă între situa6iile teoretice şi situa6iile practice. E a&ordare a acestei pro&lem; experimentată practic; este pro&lema ultimatumului 2 jucători primesc 100 de dolari. Jucătorul I este cel care împarte &anii. ?acă jucătorul II acceptă; împăr6irea are loc. ?acă nu; nici unul nu primeşte nimic. )eoretic; jucătorul II este mul6umit cu orice sumă primeşte; deoarece în ca contrar nu a primi nimic. ?e aceea; o împăr6ire de A++; 1 ar tre&ui să satisfacă am&ii jucători. ?in punct de edere al ec%ili&rului as%; şi o împăr6ire de A100; 0 ar tre&ui să repreinte un punct de ec%ili&ru; deoarece fie că refuă fie că acceptă jucătorul II nu primeşte nimic; astfel că îi este indiferent. u om considera însă o astfel de solu6ie pentru pro&lema ultimatumului. $ractic; s:a constatat însă că solu6iile su& 20 de dolari au fost respinse de majoritatea persoanelor care au aut rolul celui de:al doilea jucător 5. ?eranja6i de lăcomia primului jucător ei prefer să nu primească nimic dec>t ca acesta să răm>nă cu o mare parte a sumei. $rocente mari de acceptare s:au o&6inut a&ia pentru împăr6iri de 50 : 50. $ro&lema ini6ială proine din )almud Atextul central al iudaismului islamic din perioada Ba&/loniană; şi a fost nesolu6ionată pentru mai &ine de 1#00 de ani. 9ntr:unul din pasaje; )almudul trateaă situa6ia unei persoane care moare lăs>nd în urmă o datorie de (00 de !al&eni; 100 către Creditorul I; 200 către Creditorul II şi 300 către Creditorul III. erea sa nu acoperă însă această datorie; astfel că se pune pro&lema cum or fi împăr6i6i &anii. olu6ia dată în )almud nu ieaă propor6iile între nielul datoriilor şi aerea defunctului; ci preede următoarele • •
?acă aerea este de 100; fiecare creditor primeşte o cotă e!ală; de 33;A3K ?acă aerea este de 200; primul creditor primeşte 50 de !al&eni iar ceilal6i doi c>te
•
45K ?acă aerea este de 300; primul primeşte 50 de !al&eni; al doilea 100 iar cel de:al
treilea 150 Aîn acest ca se respectă propor6iile. l!oritmul prin care se împart &anii a fost descoperit de matematicienii Mo&ert umann şi *ic%ael *asc%ler; în 1+#0(. 5 tudiu pu$licat de osep enric "n 2004 "n 67e 8ltimate 9ame, :airness, and Cooperation amon* ;i* 9ame unters<. % Aumann, =. . and 'ascler '., 69ame teoretic anal>sis of a $an?ruptc> pro$lem from te 7almud<, ournal of @conomic 7eor> 3% (1+5), 15 213. 3%
(.% Un e,periment +n re8olvarea jocurilor prin eliminarea strate"iilor dominate
9n su&capitolul '.1 am ăut că există o diferen6ă între solu6iile considerate optime !enerate de descrierea în formă extinsă şi de cea în formă normală. e propunem în cele ce urmeaă să preentăm un experiment ce demonstreaă că forma extinsă este şi mai utilă în ceea ce prieşte luarea deciiilor; fiind mai intuitiă. ?esi!ur; are deaantajul dificultă6ii de expunere atunci c>nd numărul jucătorilor este mare sau c>nd aem mai multe strate!ii posi&ile. Gste eident că un jucător ra6ional nu a utilia niciodată o strate!ie dominată. Cu toate acestea; c>nd participăm la un joc; nu ştim întodeauna dacă adersarul nostru este suficient de ra6ional sau inteli!ent pentru a sesia că anumite strate!ii ale sale sunt dominate. ?acă apar astfel de îndoieli; nu este si!ur că ec%ili&rul reultat din eliminarea strate!iilor dominate să fie acela pe care îl o&serăm în realitate. $entru a studia această pro&lemă; c%otter; ei!elt şi ilson au cerut unui număr de '0 de studen6i să participe la jocul descris în ta&elul următor *ucătorul II
*ucătorul I
trate!ia a trate!ia &
trate!ia A'; ' A0; 1
trate!ia B A'; ' A(; 3
Gxperimentul a arătat că studen6ii afla6i în rolul jucătorului I ale!eau strate!ia a în 54N din cauri; pe c>nd cei în rolul jucătorului II îşi ale!eau strate!ia dominată în 20N din cauri. ltfel spus; mul6i studen6i în rolul jucătorului I îşi &ănuiau clar adersarii de a nu fi suficient de inteli!en6i sau ra6ionali pentru a în6ele!e că ei nu ar tre&ui să utiliee niciodată strate!ia A. ltfel spus; pentru a eita riscul unui c>şti! nul Acelula din st>n!a jos a ta&elului; ei preferau să joace în si!uran6ă şi ale!eau strate!ia a care le !arana un c>şti! de '. Cei trei autori au descoperit în timpul experimentului că lu>nd un alt !rup de studen6i şi pun>ndu:i în fa6a aceluiaşi joc; dar în forma sa extinsă; reultatele au fost cu totul diferite. Jocul a fost repreentat în forma următoare
3&
ă notăm că situa6ia strate!ică din repreentarea extensiă din !raficul de mai sus este exact aceeaşi cu cea preentată su& formă normală sau matriceală primilor studen6i. Cu toate acestea; numai +N din noii studen6i interpret>nd rolul jucătorului I au optat pentru si!uran6ă Astrate!ia a. Ceilal6i +1N s:au comportat ca şi c>nd !>ndeau că jucătorul II în6elesese că una din strate!iile lor era dominată. ceastă diferen6ă de apreciere între cele 2 !rupe de jucători I în ceea ce prieşte capacită6ile jucătorilor II de a recunoaşte strate!ia dominată este fără îndoială datorată faptului că strate!ia A a jucătorului II era mai ii&il dominată de strate!ia B în forma extinsă a jocului. şa cum am indicat şi în pro&lema amenin6ărilor credi&ile; suntem în măsură să !>ndim că modul de repreentare a unui joc Aforma normală sau extinsă modifică reultatul. cest reultat experimental este pro&lematic pentru teoria jocurilor pentru că situa6ia strate!ică era identică în cele 2 experimente Aîn am&ele cauri jucătorii dispuneau de aceeaşi informa6ie; dar aeau fără îndoială mai multe dificultă6i în a trata această informa6ie în forma normală dec>t în forma extinsă. celaşi lucru se înt>mplă şi în caul pro&lemei amenin6ărilor credi&ile. ceasta permite poate să se explice diferen6ele de comportament o&serate. C>nd acelaşi joc este preentat unui !rup în forma normală şi unui alt !rup în forma sa extinsă; reultatele sunt diferite. *odul de repreentare a unui joc afecteaă aparent modul în care fiecare !rup concepe situa6ia strate!ică şi conduce jucătorii să se comporte diferit. 3+
(.( Aplicaţii din teoria jocurilor +n jocul de Po=er
Qom începe acest su&capitol cu cu un joc simplu de căr6i; numit @$o8erul de o carte=. Jocul este jucat de două persoane care folosesc un set cu doar trei căr6i un as; un trei şi un doi. $entru a se începe joculm; unul din jucători a fi ales dealer; iar celălalt se a numi desc%iător. ?upă ce dealerul este selectat; fiecare jucător pune c>te 100 de dolari; form>ndu:se un pot de 200 de dolari. poi; dealerul împarte c>te o carte fiecărui jucător. ?upă ce fiecare jucător îşi ede cartea; desc%iătorul are prima mişcare. $oate să dea c%ec8 sau să mărească mia cu al6i 100 de dolari. ?acă ale!e să mărească mia; dealerul poate răspunde sau se poate arunca. ?acă dealerul aruncă; desc%iătorul ia între!ul potK altfel; am&ii jucători îşi arată căr6ile şi c>şti!ă cel care are cartea mai mare. sul e considerată cea mai mică carte; urmată de doi şi apoi de trei. ?acă desc%iătorul începe jocul cu un c%ec8; atunci dealerul poate de asemenea să dea c%ec8 sau să mărească pariul cu 100 de dolari. ?acă dealerul ale!e c%ec8:ul; se arată căr6ile. 9n ca contrar; desc%iătorul fie se aruncă fie răspunde pariului. cum; a>nd aceste re!uli; să considerăm următoarea situa6ie dealerul a primit doiul; iar desc%iătorul ale!e să pariee. Gident; doiul dealerului poate înin!e doar un &luff din partea desc%iătorului Adacă acesta are în m>nă asul. e propunem să determinăm care este frecen6a teoretică cu care dealerul ar tre&ui să răspundă acestui pariu. 9n cartea @)eoria $o8erului=; ?aid 8lans8/ foloseşte elemente de teoria jocurilor pentru a determina situa6iile în care tre&uie răspuns la un &luff. $rintre altele; noteaă @în !eneral; c>nd m>na ta înin!e doar un &luff; î6i ei folosi experien6a şi judecata pentru a determina şansele ca oponentul să &lufee. )otuşi; în fa6a unui adersar a cărui lo!ică este la fel de &ună ca a ta sau c%iar mai &ună; sau în fa6a unuia ce este capa&il să folosească teoria jocurilor; la r>ndul tău a tre&ui să foloseşti această teorie măcar pentru a:i minimia profitul=. Gl preintă următorul exemplu @?acă oponentul tău măreşte mia cu al6i 20 de dolari pentru a c>şti!a 100 Aaloarea potului deja existent; a mer!e la &luff în 5 situa6ii din (. şadar; faci cotele de 5 la 1 împotria aruncării tale. ltfel spus; ei răspunde pariului de 5 ori şi ei arunca căr6ile o dată= $e &aa acestei o&sera6ii; să ne întoarcem la exemplul de la care am plecat. ?ealerul are un doi şi poate c>şti!a doar în fa6a unui &luff. ?esc%iătorul a adău!at 100 de dolari la un pot de 200; deci sunt şanse de 2 la 1 să &lufee. m putea !>ndi atunci că dealerul 3
tre&uie să răspundă de două ori şi să se arunce o dată. ltfel spus; frecen6a cu care dealerul ar tre&ui să răspundă a>nd doiarul este de
2 3
. ?upă cum om edea însă;
această frecen6ă este !reşită. "recen6a teoretică optimă a jocului cu care dealerul ar tre&ui să răspundă pariului este de
1 3
.
O altă situaţie interesantă este următoarea: dealerul are asul iar deschizătorul alege să nu crească miza. Ar trebui dealerul să blufeze? Dacă deschizătorul are treiarul, atunci va pierde automat, dar dacă totuşi primul ucător are doiul, este posibil ca blu!ul să funcţioneze. "acem presupunerea că totuşi deschizătorul are #n m$nă un doi, deoarece #n caz contrar el ar % mărit miza #ncă de la #nceput. &are este frecvenţa optima teoretică cu care dealerul ar trebui să blufeze? &onform aceleiaşi cărţi citate mai sus, frecvenţa blu!ului ar trebui să %e
1 3
.
Dar analiza acestui e'emplu pleacă de la supoziţia că deschizătorul va paria mereu atunci c$nd deţine treiul. Dar dacă el foloseşte o tehnică #nşelătoare şi uneori alege să nu mărească miza, deşi are cea mai bună carte? (au dacă nu pariază niciodată atunci c$nd are treiul? &u at$t mai mult cu c$t poate dă chec) şi atunci c$nd are doiul, ce concluzie ar mai putea trage dealerul? Aşadar dealerul tine #n m$nă asul şi deschizătorul a dat chec). *n umătate din cazuri, statistic, el va avea treiul şi blufatul va % fatal. *n cealalată umătate va avea doiul, iar #n
1 3
din aceste situaţii dealerul ar trebui să blufeze. Aşadar,
frecvenţa optimă cu care ar trebui să blufeze este
1 6
.
Dar din nou, aşa cum vodea, această presupunere este greşită. "recvenţa teoretică optimă cu care primul ucător ar trebui să blufeze este
1 3
,
indiferent de frecvenţa cu care primul ucător alege să dea chec) av$nd treiul #n m$nă. De fapt, dacă dealerul ar alege să blufeze doar #ntr+o şesime de 40
cazuri, deschizătorul ar putea folosi această strategie #n favoarea sa, aleg$nd să nu mărească miza de %ecare dată c$nd are un trei #n m$nă. &um vrem ca #n continuare să folosim teoria ocurilor pentru determinarea frecvenţelor optime, este important să de%nim strategiile posibile ale dealerului şi cele ale deschizătorului. &um vrem ca analiza să %e c$t mai scurtă, vom elimina strategiile aberante, ca de e'emplu să plăteşti creşterea pariului cu un as #n m$nă. (trategiile neacceptate sunt: (: Aruncatul cărţii atunci c$nd aceasta este treiul. -resupunem că nici un ucător nu se va arunca av$nd treiul #n m$nă. (: /ăspunsul la pariu av$nd asul. (0: &hec) la chec)+ul primului ucător cu treiul #n m$nă. 1om presupune că de %ecare c$nd dealerul are treiul #n m$nă iar deschizătorul a dat chec), dealerul va mări miza. 2vident, prin această tehnică el poate %e să răm$nă cu aceiaşi bani 3dacă primul ucător se aruncă4, %e să #şi dubleze pariul 3dacă primul are doiul #n m$nă şi g$ndeşte că primul blufează4. (5: &reşterea mizei av$nd doiul #n m$nă. Atunci c$nd deschizătorul are doiul #n m$nă, el nu are nici un motiv să crească miza. Dacă adversarul său are asul, se va arunca 3conform (4, deci deschizătorul nu va c$ştiga nimic #n plus. *n schimb, dacă dealerul are treiul el va răspunde pariului şi deschizătorul va pierde cu 66 de dolari mai mult. (ituaţia se aplică şi #n cazul #n care dealerul are doiul iar deschizătorul a dat chec). &reşterea pariului av$nd doiul #n m$nă este o situaţie din care nu se poate c$ştiga. &um am limitat strategiile ucătorilor, dealerul trebuie acum doar să decidă c$t de frecvent să blufeze atunci c$nd are asul #n m$nă şi deschizătorul dă chec) şi c$t de frecvent să răspundă pariului av$nd doiul #n m$nă atunci c$nd deschizătorul creşte miza. 1om nota aceste probabilităţi cu
q1
, respectiv
.
q2
*n ceea ce priveşte deschizătorul, el are de luat trei decizii: c$t de des să blufeze cresc$nd miza atunci c$nd are asul #n m$nă 3 p1 4, c$t de des să răspundă pariului atunci c$nd are doiul #n m$nă iar dealerul a crescut miza
( p ) , şi c$t de des alege să mărească miza av$nd treiul #n m$nă ( p ) . 2
3
41
1rem să folosim aceste valori pentru a calcula valoarea aşteptată de deschizător. -entru aceasta vom privi potul initial de 66 de dolari ca neaparţin$nd nici unui ucător. Astfel, dacă de e'emplu primul ucător dă chec), al doilea creşte miza iar primul se aruncă, vedem cei 66 de dolari ca un c$ştig pentru dealer şi un c$ştig de 6 dolari pentru primul ucător. &onsider$nd toate situaţiile posibile, deschizătorul are trei valori nenule ale valorii aşteptate: astfel, el poate pierde 66 de dolari, c$ştiga 66 de dolari sau c$ştiga 066 de dolari. 1om calcula probabilităţile pentru %ecare din aceste cazuri. *ai înt>i să descriem pe lar! caurile posi&ile
Caul 1 desc%iătorul are asul iar dealerul are doiul. ?esc%iătorul poate &lufa şi să i se răspundă; ca în care pierde 100 de dolari cu pro&a&ilitatea
p1 q 2
; sau să c>şti!e 200
de dolari dacă &lufeaă şi dealerul se aruncă; pentru care aem o pro&a&ilitate de p1 ( 1 −q2 ) .
Caul 2 desc%iătorul are asul; iar dealerul are trei. ?acă desc%iătorul încearcă să &lufee; atunci automat el pierde 100 de dolari. $ro&a&ilitatea este
p1
.
Caul 3 desc%iătorul are doiul; iar dealerul are asul. Conform celor de mai sus; desc%iătorul nu măreşte mia. Caul ' ?esc%iătorul are doiul; iar dealerul are treiul; ca în care desc%iătorul nu poate c>şti!a; ci doar pierde 100 dolari cu o pro&a&ilitate
dacă răspunde pariului
p2
dealerului. Caul 5 ?esc%iătorul are treiul; iar dealerul are asul. Caul ( ?esc%iătorul are treiul; iar dealerul are doiul. *n %nal, •
Qa pierde 100 de dolari cu pro&a&ilitatea 1 1= ( p1 q 2+ p1 + p2 )
A'.1
6
•
Qa c>şti!a 200 de dolari cu pro&a&ilitatea 1 2= ( p1 − p 1 q 2+ 3−2 q 1+ p3 q 1− p 3 q2 ) 6
•
A'.2
Qa c>şti!a 300 de dolari cu pro&a&ilitatea 3=
1 6
( p
2
q 1+ q1− p3 q 1+ p3 q 2)
35.04
şadar; aloarea sa aşteptată este −1 + 2 2 + 3 3 . 42
?acă rem să reducem şi cei 100 de dolari inesti6i ini6ial; atunci din fiecare aloare om scădea 1 Aconsiderăm că 100 de dolari este aloarea unitate; astfel că aloarea finală aşteptată a fi −1 + 2 2 + 3 3−1 . A'.' copul desc%iătorului este eident acela de a maximia această aloare. p 9n continuare; rem să edem cum ale!erea lui şi q afecteaă aloarea aşteptată. ?in rela6iile A'.1; A'.2; A'.3 şi A'.'; o&6inem rela6ia 1
1 − p q − p − p ) + ( 2 p −2 p ( 6 6 1
2
1
2
1
1
q2 + 6 − 4 q1 + 2 p3 q1−2 p 3 q2 ) +
1 6
( 3 p
2
q1 + 3 q 1−3 p 3 q1 )−1
care prin efectuarea calculelor se reduce la forma 1
(−3 p
6
1
q 2+ p 1− p2−q 1− p3 q1 + p3 q2 + 3 p 2 q1 ) .
$entru a ne putea folosi c>t mai mult de această formulă; o om rescrie 1
[ p ( 1−3 q ) + p ( 3 q −1 ) + p ( q −q ) −q ]
6
1
2
2
1
3
2
1
1
A'.5
sau din perspectia dealerului 1 6
[ q ( 3 p − p −1 ) +q ( p −3 p ) +( p − p ) ] . 1
2
3
2
3
1
1
E&serăm că în A'.5 aem o situa6ie specială pentru aloarea aşteptată a desc%iătorului este ale!e alorile
p1 , p2 , p3 .
−1 18
2
1
q1 =q2 = . 3
A'.( 9n această situa6ie
; independent de modul în care acesta îşi
şadar; dacă desc%iătorul îşi ale!e aceste alori; atunci
pentru el dein indiferente ale!erile desc%iătorului; a>nd c>şti!ul estimat de
1 18
în
orice situa6ie. ?e aceea om numi această situa6ie drept @strate!ia indiferentă= a dealerului. ?acă dealerul ale!e să deiee de la această strate!ie; face o !reşală întruc>t îi permite desc%iătorului să o&6ină o aloare aşteptată mai &ună; poate c%iar poitiă. ă considerăm de exemplu următorul exemplu; în care dealerul nu &lufeaă suficient de des cu asul; nu răspunde cu doiul destul de des şi &lufeaă cu asul mai des dec>t răspunde cu doiul. ltfel spus; ale!e o strate!ie cu
1
q 2< q 1 < . 3
?acă desc%iătorul identifică 43
această situa6ie; pentru a:şi maximie aloarea aşteptată el nu a răspunde niciodată cu doiul Adin moment ce dealerul nu &lufeaă destul de des; a &lufa mereu cu asul Adeoarece dealerul nu răspunde cu doiul suficient de des şi nu a paria niciodată cu treiul Adin moment ce dealerul a &lufa de mai multe ori dec>t a răspunde. trate!ia sa se exprimă aşadar prin p1=1, p 2=0 şi p3=0 . ?in rela6ia A'.( edem că în acest ca aloarea aşteptată a desc%iătorului este 1 6
Cum
q 2< q1 <
1 3
[−q − 3 q + 1 ] . 1
2
foarte &ine să fie poitiă. ?e exemplu; pentru 1 24
−1
; această aloare a fi mereu mai mare strict dec>t q 2=
1 6
q1 =
şi
1 4
18
; put>nd c%iar
aloarea aşteptată e
.
$entru alt exemplu; să considerăm exemplul în care desc%iătorul este un fel de jucător pasi; în sensul că nu a paria niciodată cu un trei. ?ealerul sesieaă acest lucru şi din 1
motiele indicate în desc%iderea acestui su&capitol ale!e să &lufee doar în
din
6
cauri. cest lucru se a doedi însă !reşit; căci desc%iătorul poate contraataca nefăc>nd efecti nimic. Gl nu a mări niciodată şi a răspunde doar atunci c>nd are treiul în m>nă. trate!ia sa a fi definită de p1= p2= p3 =0. ?in rela6ia A'.5 constatăm că a o&6ine o aloare aşteptată de
−1 36
; ceea ce este mai &ine dec>t
−1 18
.
$entru ultimul exemplu; să presupunem că dealerul a citit @)eoria $o8erului= şi a decis să 1
q1 = .
&lufee cu asul în o treime din cauri. şadar; ale!e
3
*ai ştie că dacă are doiul
nu poate c>şti!a dec>t în fa6a unui as; astfel că atunci c>nd desc%iătorul mai adau!ă 100 de dolari la un pot de 200; dealerul a face şansele de 2 la 1 împotria aruncatului; deci a plăti de două ori şi se a arunca o dată. stfel; se decide asupra lui
q 2=
2 3
.
?in rela6ia A'.5 edem acum că aloare aşteptată de desc%iător este 1 6
[
1
1
3
3
− p1 + p 3−
]
.
44
?esc%iătorul îşi poate maximie acum aloare aşteptată prin ale!erea lui &lufee niciodată;
p3=1
p1=0
Asă nu
Asă mărească mia de fiecare dată c>nd are treiul şi să
alea!ă orice strate!ie atunci c>nd are doiul. Qedem că în acest ca aloarea aşteptată este 0. 9n alte cuinte; răspun>nd în două treimi din cauri cu doiul; dealerul şi:a pierdut aantajul alorii aşteptate de
1 18
; pe care îl are în mod natural deoarece este ultimul
care ac6ioneaă. ?acă cei doi or sc%im&a rolurile; iar primul a deeni dealer; el poate acum să termine; pe termen lun!; în c>şti!. şdar; sin!ura strate!ie corectă a dealerului este să alea!ă mereu
q1 =q2 =
1 3
.
Qrem acum să analiăm situa6ia şi din punctul de edere al desc%iătorului. ?in rela6ia A'.( în6ele!em că un set de p : alori ce satisfac 3 p 2− p3−1 =0 p3−3 p1=0
or repreenta o strate!ie indiferentă pentru desc%iător ce îi a aduce mereu o aloare aşteptată de
1 6
( p − p ) ; indiferent de felul în care dealerul joacă. şadar; desc%iătorul 1
2
poate ale!e ar&itrar aloarea lui
p3
iar apoi să determine
{
1
p 1= p3 3
1
1
3
3
p2 = p 3+
.
$rin această modalitate; îşi a asi!ura o aloare aşteptată de
( (
1 1 6 3
p 3−
1 3
p 3+
1 3
))
=
−1 18
indiferent de strate!ia dealerului. şdar; toate aceste strate!ii repreintă pentru el strate!ii optime.
45
Bi0lio"rafie
W1X. Ber!e; C. < Topoloical 6ames 7ith perfect information=K W2X. Yu%n; ,. . < .xtensi'e ames and the problem of information=K W3X. uce ; M. ?.; Maiffa; ,. < 6ames and decisions=; Jo%n ile/ and ons; e- Vor8; 1+54K W'X. Qon eumann; J; *or!enstern; E.