Vous êtes sur la page 1sur 15

THEORIE DES JEUX

I- Introduction:

Lactivit conomique et sociale se caractrise trs souvent par des situations o le bien-tre
dun agent conomique dpend non seulement de ses propres actions mais galement des
dcisions des autres agents. Conscient de lexistence de cette interdpendance, chaque
agent en tient compte et lintgre dans la prise de dcision.
La thorie des jeux dite aussi thorie de la dcision interactive est un ensemble doutils
analytiques qui ont t dvelopps pour nous faciliter la comprhension de ces situations
dinteraction stratgique entre dcideurs (agent, joueurs) rationnels sous forme de jeux et
en tudier les issues finales.

Qui dit jeu dit situation o des joueurs sont conduits faire des choix stratgiques parmi un
certain nombre dactions possibles et dans un certain cadre dfini lavance qui sera les
rgles du jeu.
Les rgles prcisent :
Linformation dont disposent les joueurs, en particulier linformation sur ce que savent
les autres joueurs.

Les modalits de prise de dcision : simultanit, rptition, coalition,


Le rsultat de ces choix constitue une issue du jeu laquelle est associe un gain
positif ou ngatif pour chacun des participants appel aussi fonction dutilit .

 Qui dit situation stratgique dit situation o :


Il y a plusieurs personnes (au sens large du terme).

Chacun de ces joueurs doit faire quelque chose (choix dactions ou de stratgies).

Lutilit (bonheur procur, paiement montaire, .) que chaque joueur va retirer de


la situation qui va advenir ne dpend pas uniquement de sa propre action, mais aussi des
actions choisies par les autres.

Diffrents contextes dinteraction induisent diffrents types de jeux entre les agents. Mais le
point commun de ces situations est la difficult, pour la thorie conomique, de prdire le
rsultat auquel elles vont aboutir.

Les diffrents contextes dinteraction peuvent tre classs selon trois dimensions bases sur

Le type de relation entre les agents : coopratif vs non coopratif.


Un jeu est coopratif lorsque les joueurs peuvent communiquer librement entre eux et passer
des accords (par exemple sous forme de contrats). Ils forment alors une coalition et
recherchent lintrt gnral suivi dun partage des gains entre tous les joueurs.
Dans un jeu non coopratif, les joueurs agissent selon le principe de rationalit conomique :
chacun cherche prendre les meilleurs dcisions pour lui-mme.

Le droulement dans le temps : statique vs dynamique.

1
Un jeu est statique lorsque les joueurs jouent une seule fois et simultanment. Il est
dynamique si les joueurs jouent de faon squentielle.

Linformation dont dispose les agents : complte vs incomplte et parfaite vs


imparfaite.

Un jeu est information incomplte si au moins lun des joueurs ne connat pas parfaitement
la structure du jeu. Dans le cas contraire, il est information complte.
Un jeu est information parfaite si chaque joueur est parfaitement inform des actions
passes des autres joueurs. Il est information imparfaite quand un joueur ignore certain
des choix qui ont t effectus avant le sien.

2
Chapitre1 Jeux statiques en information complte

I. Dfinitions:
Dfinition I.1: Un jeu statique (dit aussi stratgique) est le modle dune situation o
chaque joueur choisit son plan daction complet une fois pour toute au dbut du jeu. Par
suite, les choix de tous les joueurs sont simultans.

Dfinition I.2: Un jeu est information complte si tous les joueurs connaissent
parfaitement la structure du jeu.

II. La forme stratgique dun jeu statique:


Dfinition II.1: Un jeu sous forme stratgique (dit aussi sous forme normale) est la
donne de = ( N , ( S i )i N , (u i )i N ) o :
 N est un ensemble non vide appel lensemble des joueurs de cardinal n .
 i N , S i est un ensemble non vide appel lensemble dactions ou lensemble
de stratgies du joueur i .
 i N , u i est une application de S = S i
i N

s = ( s i )i N u i ( s ) appele la fonction de
paiement ou la fonction dutilit du joueur i .

Remarque II.1:
 Une stratgie du joueur i est s i avec s i S i . Les stratgies possibles s i sont
appeles stratgies pures. Une issue ou un profil de stratgies s = ( s 1 , s 2 ,K , s n ) =
( s i )i N est une combinaison possible de stratgies des n joueurs.
 u i ( s ) est le paiement ou lutilit obtenu par le joueur i lorsque les n joueurs
choisissent lissue s .

Exemple II.1: Suite une faute de dfenseur dans le carr des 18 mtres, larbitre siffle un
Penalty. Le tireur de Penalty (joueur 1) a le choix entre tirer la balle gauche ou droite du
gardien du but. Le gardien du but (joueur 2) a la possibilit de plonger droite ou gauche.
Le gardien a le droit de bouger au moment o la balle est tire.
- Si le joueur et le gardien vont dans le mme sens alors le gardien gagne un point et le
joueur perd un point.
- Si le joueur et le gardien vont dans des sens opposs alors le gardien perd un point et le
joueur gagne un point.

(
La forme stratgique de ce jeu est = N , ( S i )i {1,2} , (u i )i {1,2} avec )
- N = {1, 2} .
- S i = {d , g } ; i = 1, 2 .
- S = {(d , d ) , (d , g ) , ( g , d ) , ( g , g )} .
- u 1 ( d , d ) = u 1 ( g , g ) = 1 , u 1 ( d , g ) = u 1 ( g , d ) = 1

3
u 2 ( d , d ) = u 2 ( g , g ) =1 et u 2 (d , g ) = u 2 ( g , d ) = 1
La forme stratgique de ce jeu, peut tre reprsent par (ce quon appelle) la matrice
(le tableau) des paiements suivante:

Joueur 2 (le gardien)


g d
Joueur 1 g ( 1,1) (1, 1)
(le tireur)
d (1, 1) ( 1,1)

Exemple II.2: Le dilemme du prisonnier:


Deux individus (Bob et Paul) sont arrts et souponns de crime et placs dans des
cellules spares sans possibilits de communication. Chaque individu est interrog
sparment et il a le choix entre nier davoir commis le crime (N) ou dnoncer son complice
comme seul responsable (D).
Les gains des individus (connus par eux) reprsentent leur situation qui rsulte des
annes de prison auxquelles ils sont condamns en fonction de leurs dpositions et
ngativement lis avec ces annes.

- Si Bob et Paul dnoncent tous les deux, ils sont condamns 8ans de prison.
- Sils nient tous les deux, ils auront 1 anne de prison.
- Si un seul dnonce, il est relch en rcompense de sa coopration et lautre est
condamn 10 ans de prison.

(
La forme stratgique de ce jeu est = N , ( S i )i {1,2} , (u i )i {1,2} avec: )
- N = {B , P } .
- S i = {N , D } ; i = 1, 2 .
- u1 ( N , N ) = u 2 ( N , N ) = 1 ; u1 ( D , N ) = u 2 ( N , D ) =0
u1 ( N , D ) = u 2 ( D , N ) = 10 ; u 2 ( D , D ) = u1 ( D , D ) = 8
Ce qui peut tre reprsent par la matrice des paiements

Joueur 2 (Paul)
N D
Joueur 1 N ( 1, 1) ( 10,0 )
(Bob)
D ( 0, 10 ) ( 8, 8 )
Exemple II.3: Comptition en quantits dite de Cournot ou Duopole de Cournot.
Deux firmes, 1 et 2, produisent des biens identiques. Elles choisissent simultanment leur
quantit q i Q i + , un cot de production c i ( q i ) . Loffre totale du march est donc
Q = q1 + q 2 . Le prix rsultant de la loi de loffre et de la demande est p = p (Q ) = p (q1 + q 2 ) .

(
Dans ce cas, la forme stratgique est = N , ( S i )i {1,2} , ( i )i {1,2} avec )
- N = {1, 2} .

4
+
- Si = .
- 1 (q1 , q 2 ) = q1 p ( q1 + q 2 ) c1 ( q1 )
2 ( q1 , q 2 ) = q 2 p ( q1 + q 2 ) c 2 ( q 2 )

Exemple II.4: Comptition en prix dite de Bertrand ou Duopole de Bertrand.


Deux firmes, 1 et 2, produisent des biens homognes. Elles dcident simultanment dun
prix de vente du bien p i + un cot de production identique c . Les consommateurs
achtent la firme au prix le plus bas.
(
Dans ce cas, la forme stratgique est = N , ( S i )i {1,2} , ( D i )i {1,2} avec )
- N = {1, 2} .
+
- Si = .
D ( p i ) si pi < p j

1
- D i ( p i , p j ) = D ( p i ) si p i = p j o D ( p i ) est la demande du march au prix p i .
2
0 si pi > p j

III- Solution et quilibre dun jeu :


Parmi lensemble des rsultats possibles nous devons dterminer ceux auxquels le jeu peut
aboutir : les rsultats dquilibre.

Introduisons une notation supplmentaire.


Notation : Considrons le profil de stratgies qui contient les stratgies de tous les joueurs
SAUF le joueur i. On le note
s i = ( s 1 , s 2 ,K , s i 1 , s i +1 ,K , s n ) , s i S j
j i

Le profil de stratgies complet s correspond alors s = ( s i , s i ) .

1. Elimination des stratgies quivalentes et des stratgies domines :


Dfinition III.1.1: Deux stratgies s i et s i' sont quivalentes si et seulement si, pour tout
profil de stratgies donn des autres joueurs, tous les joueurs obtiennent la mme utilit
quand i joue s i ou s i'
j N , s i S i , u j ( s i , s i ) = u j ( s i' , s i )
Toutes les stratgies quivalentes une stratgie s i forment une classe dquivalence.

Dfinition III.1.2: La stratgie s i du joueur i est strictement domine par la stratgie s i' si
et seulement si
s i S i , u i ( s i , s i ) < u i ( s i' , s i )

Dfinition III.1.3: La stratgie s i du joueur i est faiblement domine par la stratgie s i' si
et seulement si
s i S i , u i ( s i , s i ) u i ( s i' , s i )

5
et s i S i / u i ( s i , s i ) < u i ( s i' , s i )

Dfinition III ;1 ;4: La forme normale rduite dun jeu sobtient partir de la forme normale
initiale en remplaant toutes les stratgies dune classe dquivalence par une seule
stratgie et en liminant les stratgies strictement domines.

Exemple III.1.1: Considrons la forme stratgique du jeu reprsente par la matrice des
paiements suivante.

Joueur 2
B1 B2 B3
A1 (10,10 ) ( 4,9 ) ( 4,11)
Joueur 1
A2 ( 5, 6 ) ( 8,3) ( 3, 4 )
A3 ( 4, 0 ) ( 8,1) ( 5,3)

La stratgie B 2 est strictement domine par la stratgie B 3 .

Joueur 2
B1 B3
A1 (10,10 ) ( 4,11)
Joueur 1
A2 ( 5, 6 ) ( 3, 4 )
A3 ( 4, 0 ) ( 5,3)

La stratgie A 2 est strictement domine par la stratgie A1 .

Joueur 2
B1 B3
Joueur 1 A1 (10,10 ) ( 4,11)
A3 ( 4, 0 ) ( 5,3)

La stratgie B 1 est strictement domine par la stratgie B 3 .

Joueur 2
B3
Joueur 1 A1 ( 4,11)
A3 ( 5,3)

La stratgie A1 est strictement domine par la stratgie A 3 .


Donc, lissue finale du jeu est ( A 3 , B 3 ) et les joueurs 1 et 2 reoivent un paiement (utilit)
gal respectivement 5 et 3 .

6
Lissue ( A 3 , B 3 ) est appele quilibre en stratgies strictement dominantes.

Remarque III.1 ;1:


 Une stratgie est dite dominante si elle domine toutes les autres stratgies.
 Si une stratgie est dominante, alors elle est unique avoir cette proprit.
 Une stratgie domine nest jamais joue.
 Lordre dlimination des stratgies strictement domines na pas dimportance. Les
stratgies qui subsistent aprs limination sont les mmes quelque soit la squence suivie.
 Si on supprime de manire itre les stratgies faiblement domines le rsultat peut
dpendre de lordre de litration.

2. Equilibre de Nash en stratgies pures:


Il y a des jeux qui nadmettent pas un quilibre en stratgies
strictement dominantes. Cest le cas par exemple du jeu sous forme
normale suivant pour lequel on peut vrifier quil nexiste pas
dquilibre en stratgies strictement dominantes.

Joueur 2
B1 B2 B3
A1 ( 6, 7 ) ( 9, 6 ) ( 0, 4 )
Joueur 1
A2 ( 5, 2 ) ( 8, 2 ) ( 4,5)
A3 ( 7, 7 ) ( 7,8) ( 0,9 )

Dfinition III.2.1: Lissue en stratgies pures s = ( s 1 , s 2 ,K , s n ) est un quilibre de Nash si


et seulement si
i = 1,K , n , s i S i , u i ( s i , s i ) u i ( s i , s i )
Le profil s est un quilibre de Nash strict si et seulement si
i = 1,K , n , s i S i , u i ( s i , s i ) > u i ( s i , s i )

En dautres termes, lquilibre de Nash est une issue o simultanment chaque joueur i
choisit la meilleure stratgie compte tenu du meilleur choix des joueurs j .

Pour trouver lquilibre de Nash, Il faut donc dterminer pour chacun des joueurs les
stratgies qui correspondent sa plus grande satisfaction face tout profil s i . Do la
dfinition suivante.

Dfinition III.2.2: Dans un jeu n joueurs, la fonction de meilleure rponse du joueur i ,


note R i ( s i ) , associe chaque combinaison de stratgies des autres joueurs s i , la
stratgie du joueur i qui maximise son gain i.e.
s i S i s i S i , u i ( R i ( s i ) , s i ) u i ( s i , s i )

7
Ce qui peut tre traduit, en utilisant la notion dargument du maximum, par la dfinition
suivante.

Dfinition III.2.3: La fonction de meilleure rponse du joueur i , note R i ( s i ) , est dfinie


par
R i ( s i ) = arg max u i ( s i , s i )
s i S i

{
= s i S i / u i ( s i , s i ) u i ( s i' , s i ) , s i' S i }
O arg max f ( x ) = {x / y f ( y ) f ( x )} .
x

Proposition III.2.1: Une dfinition quivalente de lquilibre de Nash est:


s i R i ( s i ) i N .
s R (s ) (forme matricielle)
O R ( s ) = R1 ( s 1 ) K R n ( s n ) .

Exemple: Soit la forme normale du jeu reprsente par la matrice de paiement suivante.
.
Joueur 2
B1 B2 B3
A1 ( 6, 7 ) ( 9, 6 ) ( 0, 4 )
Joueur 1
A2 ( 5, 2 ) ( 8, 2 ) ( 4,5)
A3 ( 7, 7 ) ( 7,8) ( 0,9 )

Pour le joueur 1 on a :
R1 ( B 1 ) = A 3 , R1 ( B 2 ) = A1 , R1 ( B 3 ) = A 2
Pour le joueur 2 on a :
R 2 ( A1 ) = B 1 , R 2 ( A 2 ) = B 3 , R 2 ( A 3 ) = B 3
Les fonctions de meilleur rponse montrent que R1 ( B 3 ) = A 2 et R 2 ( A 2 ) = B 3 . Ainsi, le jeu de la
figure3.1 admet un quilibre de Nash en ( A 2 , B 3 ) .

Joueur 2
B1 B2 B3
A1 ( 6, 7 )
(9 , 6)

( 0, 4 )
( 4 ,5 )
Joueur 1
A2 ( 5, 2 ) ( 8, 2 )

A3 (7 , 7)

( 7,8) ( 0,9 )

Lquilibre de Nash est un concept important dans lanalyse conomique des interactions
stratgiques entre agents conomiques. Ce concept dquilibre appelle cependant un certain
nombre de remarques.

Proposition III.2.2: Un quilibre en stratgie dominante est un quilibre de Nash.

8
Remarque III.2.2:
 Il existe des jeux o il nexiste pas dquilibre de Nash en stratgies pures.
 Il existe des jeux qui ont plusieurs quilibres de Nash.
 Si le jeu est soluble par limination itre de stratgies strictement domines alors le
vecteur de stratgies qui en rsulte est lunique quilibre de Nash du jeu initial. .

4. Equilibre de Nash en stratgies mixtes:

Joueur 2 (le gardien)


g d
Joueur 1 g ( 1,1) (1, 1)
(le tireur)
d (1, 1) ( 1,1)

Dfinition III.4.1: Soit S i lensemble fini des stratgies pures du joueur i . Une stratgie
mixte du joueur i est une mesure de probabilit i : S i [ 0,1] affectant chaque stratgie
pure s i S i une probabilit i ( s i ) dtre choisie avec (s ) = 1 .
i i
i S i

Dans ce cas, le calcul du paiement prend la forme de lesprance de paiement i .e un profil


= ( i )i N est valu par le joueur i laide de lutilit espre
U i ( ) = Eu i ( ) = ( s ) u i ( s ) o ( s ) = i ( s i ) .
s S i N

On note i lensemble des stratgies mixtes du joueur i .

Exemple III.4.1: (Calcul de paiements)


Soit la forme normale du jeu reprsente par la matrice de paiement suivante.
.
Joueur 2
L M R

0 1 1
2 2
U
1 ( 4,3) ( 5,1) ( 6, 2 )
Joueur 1 3

M
1 ( 2,1) ( 8, 4 ) ( 3, 6 )
3

D
1 ( 3, 0 ) ( 9, 6 ) ( 2,5 )
3

Le paiement des joueurs 1 et 2 pour, par exemple, les profils de stratgies mixtes
1 1 1 1 1
1 = , , et 2 = 0, , sont :
3 3 3 2 2
1 1 1 1 1 1 1 1 1 11
U 1 ( 1 , 2 ) = 0 4 + 5 + 6 + 0 2 + 8 + 3 + 0 3 + 9 + 2 =
3 2 2 3 2 2 3 2 2 2

9
11 1 1 11 1 1
U 2 ( 1 , 2 ) = 1 + 4 + 6 + 2 + 6 + 5 = 4
23 3 3 23 3 3
On peut galement pour un joueur quelconque, dterminer le paiement procur par une
stratgie pure domine, tant donn que lautre joueur adopte une stratgie mixte donne.
1 1 1
Par exemple, si le joueur 1 choisit la stratgie mixte 1 = , , , lutilit pour le joueur 2 en
3 3 3
retenant la stratgie M est :
1 1 1 11
U 2 ( M , 1 ) = 1 + 4 + 6 = .
3 3 3 3

Dfinition III.4.2: Une stratgie mixte i est dite non dgnre si elle nassigne pas une
probabilit gale un une des stratgies pures.
Une stratgie mixte i est dite compltement mixte si i ( s i ) >0, s i S i .

Remarque III.4.1: La relation de dominance tudie dans le cas des stratgies pures peut
tre tendue au cas des stratgies mixtes. Ainsi, la stratgie pure s i est strictement domine
pour le joueur i sil existe une stratgie mixte i telle que s i S i , u i ( i , s i ) > u i ( s i , s i ) .
Cette remarque signifie qune stratgie non strictement domine en stratgies pures peut le
devenir lorsquon introduit la possibilit de stratgie mixte.

Exemple III.4.2: soit lexemple suivant qui ne fait ressortir que les paiements du joueur 1 :

Joueur 2
L R
U ( 4,.) ( 1,.)
Joueur 1 M ( 0,.) ( 0,.)
D ( 1,.) ( 2,.)

La stratgie M du joueur 1 nest domine ni par la stratgie pure U ni par la stratgie pure
D.
1 1
Mais, si le joueur 1 affecte la probabilit U et D , alors il obtient de cette stratgie
2 2
mixte une utilit espre gale :
1 1 1
2 + ( 1) = , si le joueur 2 joue L .
2 2 2
1 1 1
( 1) + 2 = , si le joueur 2 joue R .
2 2 2
Donc, pour le joueur 1, la stratgie pure M est strictement domine par la stratgie mixte
1 1
= , .
2 2

Dfinition III.4.3: Lissue en stratgies mixtes = ( 1 , 2 ,K , n ) est un quilibre de Nash


si et seulement si i = 1,K , n , i S i , U i ( i , i ) U i ( i , i )

10
Le profil est un quilibre de Nash strict si et seulement si
i = 1,K , n , i S i , U i ( i , i ) > U i ( i , i )

En dautres termes, on a un lquilibre de Nash si aucun joueur na intrt dvier


unilatralement de sa stratgie i quand les autres joueurs continuent jouer le profil i .

Dtermination de lquilibre de Nash en stratgies mixtes:


Pour dterminer lquilibre de Nash en stratgies mixtes on utilise le concept de meilleures
rponses en stratgies mixtes. Pour cela, reprenons le jeu du tireur et du gardien.

Joueur 2 (le gardien)


g d
Joueur 1 g ( 1,1) (1, 1)
(le tireur)
d (1, 1) ( 1,1)
Qui rappelons-le, na pas dquilibre en stratgies pures.

Soit ( p ,1 p ) la stratgie mixte du joueur 1 avec p la probabilit que le joueur1 joue


gauche et (1 p ) la probabilit que le joueur 1 joue droite .
Soit (q ,1 q ) la stratgie mixte du joueur 2 avec q la probabilit que le joueur2 joue
gauche et (1 q ) la probabilit que le joueur 2 joue droite .
Joueur 2 (le gardien)
g d

Joueur 1 q 1q
(le tireur) g p ( 1,1) (1, 1)
d 1 p (1, 1) ( 1,1)

Dterminons la fonction de meilleure rponse du joueur 1 pour que sa stratgie mixte 1 soit
la meilleure rponse la stratgie mixte 2 du joueur 2. Puis, celle du joueur 2 pour sa
stratgie mixte soit meilleure rponse la stratgie mixte du joueur 1.

Premire faon:
Le paiement espr du joueur 1 en adoptant la stratgie mixte 1 tant donn que le joueur
2 adopte la stratgie mixte 2 est :
U 1 ( 1 , 2 ) = Eu1 ( 1 , 2 ) = ( 1) pq + (1) p (1 q ) + (1)(1 p ) q + ( 1)(1 p )(1 q )
= ( 2 4q ) p + ( 2q 1)
U 1 ( 1 , 2 )
= 2 4q .
p
1
Si 2 4q > 0 i.e. q < alors U 1 ( 1 , 2 ) est croissante et par suite atteint sa valeur maximale
2
pour p = 1 i.e. le joueur 1 choisit de tirer gauche.

11
1
Si 2 4q < 0 i.e. q > alors U 1 ( 1 , 2 ) est dcroissante et par suite atteint sa valeur
2
maximale pour p = 0 i.e. le joueur 1 choisit de tirer droite.
1
Si 2 4q = 0 i.e. q = alors U 1 ( 1 , 2 ) ne dpend pas de p et par suite le joueur est
2
indiffrent entre tirer droite ou gauche. Par consquent, la stratgie mixte 1 est
meilleure rponse la stratgie mixte 2 pour toutes les valeurs de p [ 0,1] .
La fonction de meilleures rponses du joueur 1 la stratgie mixte 2 , note p ( q ) , est
donne par :

1
1 si q<
2

1
p (q ) = [ 0,1] si q= (I )
2
1
0 si q>
2

Pour le joueur 2, Le paiement espr du joueur 2 en adoptant la stratgie mixte 2 tant


donn que le joueur 1 adopte la stratgie mixte 1 est :
U 2 ( 1 , 2 ) = Eu 2 ( 1 , 2 ) = (1) pq + ( 1)(1 p ) q + ( 1) p (1 q ) + (1)(1 p )(1 q )
= (1 2 p ) + q ( 4 p 2 )
U 2 ( 1 , 2 )
= 4p 2 .
q
1
Si 4 p 2 > 0 i.e. p > alors U 2 ( 1 , 2 ) est croissante et par suite atteint sa valeur maximale
2
pour q = 1 i.e. le joueur 2 choisit de plonger gauche.
1
Si 4 p 2 < 0 i.e. p < alors U 2 ( 1 , 2 ) est dcroissante et par suite atteint sa valeur
2
maximale pour q = 0 i.e. le joueur 2 choisit de plonger droite.
1
Si 4 p 2 = 0 i.e. p = alors U 2 ( 1 , 2 ) ne dpend pas de q et par suite le joueur est
2
indiffrent entre plonger droite ou gauche. Par consquent, la stratgie mixte 2 est
meilleure rponse la stratgie mixte 1 pour toute les valeurs de q [ 0,1] .
La fonction de meilleures rponses du joueur 2 face la stratgie mixte 1 , note q ( p ) , est
donne par :
1
1 si p >
2

1
q ( p ) = [ 0,1] si p = ( II )
2
1
0 si p <
2

12
Deuxime faon:
Comparons lesprance dutilit du joueur 1 pour ses deux stratgies pures.

g : U 1 ( p , q ) = Eu1 ( p , q ) = ( 1) q + (1)(1 q ) = 1 2q
d : U 1 ( p , q ) = Eu1 ( p , q ) = (1) q + ( 1)(1 q ) = 2q 1

Face la stratgie mixte q du joueur 2, le joueur 1 choisira g ( p = 1) si:


1
1 2q > 2q 1 q <
2
Face la stratgie mixte q du joueur 2, le joueur 1 choisira d (1 p = 1 p = 0 ) si :
1
1 2q < 2q 1 q >
2

Face la stratgie mixte q du joueur 2, le joueur 1 est indiffrent entre choisir g ou d


( p [0,1]) si :
1
1 2q = 2q 1 q =
2

Par consquent, la fonction de meilleures rponses du joueur 1 face la stratgie mixte 2 ,


note p ( q ) , est donne par ( I ) .

De mme pour le joueur 2, nous avons:

g : U 2 ( p , q ) = Eu 2 ( p , q ) = (1) p + ( 1)(1 p ) = 2 p 1
d : U 2 ( p , q ) = Eu 2 ( p , q ) = ( 1) p + (1)(1 p ) = 1 2 p
Face la stratgie mixte p du joueur 1, le joueur 2 choisira g si:
1
2 p 1 > 1 2 p p >
2

Face la stratgie mixte p du joueur 1, le joueur 2 choisira d si:


1
2 p 1 < 1 2 p p <
2

Face la stratgie mixte p du joueur 1, le joueur 2 est indiffrent entre choisir g ou d si :


1
2 p 1 = 1 2 p p =
2
Par suite, la fonction de meilleures rponses du joueur 2 face la stratgie mixte 1 , note
q ( p ) , est donne par ( II ) .
La reprsentation graphique des deux fonctions de meilleures rponses (I ) et ( II ) est
donne par la figure suivante :

13
Remarque III.4.2: La dtermination de lquilibre de Nash en stratgies mixtes devient plus
aise si on note qu cet quilibre, chaque joueur est indiffrent entre ses diffrentes
stratgies. Pures tant donne la stratgie mixte des autres joueurs. Ce qui peut tre
exprim par la proposition suivante :

Proposition III.4.3: (Indiffrence sur les supports) Soit S i+ S i lensemble des stratgies
pures que le joueur joue avec une probabilit strictement positive dans le profil de stratgies
mixtes = ( 1 ,K , n ) i.e. S i+ = {s i S i : i ( s i ) > 0} .
Un profil de stratgies est un quilibre de Nash en stratgies mixtes dun jeu sous forme
normale fini si et seulement si pour tout i N

U i ( s i , i ) = U i ( s i' , i ) s i , s i' S i+
U i ( s i , i ) U i ( s i' , i ) s i S i+ , s i' S i

Dfinition: Lensemble Si+ sappelle le support de i et se note gnralement supp ( i ) .

Remarque: La proposition III.4.3 suggre une procdure de recherche des quilibres :

 Essayer tous les supports possibles.


 Rsoudre les probabilits rendant chaque joueur indiffrent sur son support.
 Vrifier que les stratgies hors du support ne donnent pas un paiement suprieur.

Exemple: Reprenons le jeu du tireur et du gardien.

Joueur 2 (le gardien)


g d

Joueur 1 q 1q
(le tireur) g p ( 1,1) (1, 1)
d 1 p (1, 1) ( 1,1)
En utilisant le principe dindiffrence :
- On cherche si un support de la forme 1 = ( p ,1 p ) et 2 = (q ,1 q ) correspond une
stratgie mixte.
On a :
1 = ( p ,1 p ) ( p ]0,1[ ) implique le joueur 1 est indiffrent entre ses deux stratgies i.e.
q + 1 q = q 1 + q

14
1
q =
2
Et 2 = (q ,1 q ) (q ]0,1[ ) implique le joueur 1 est indiffrent entre ses deux stratgies i.e.
p 1 + p = p + 1 p
1
p=
2
1 1 1 1,
Donc, le jeu admet un quilibre compltement mixte , , .
2 2 2 2
- On cherche si un support de la forme 1 = (1, 0 ) et 2 = (q ,1 q ) correspond une stratgie
mixte.
On a p = 1 et lexamen de la matrice de paiements nous indique que le joueur 2 nest pas
indiffrent jouer lune ou lautre des stratgies. Donc, il joue en pur et daprs la matrice de
paiements il joue q = 1 i.e. q (1) = 1 . Mais dans ce cas, le joueur 1 nest pas indiffrent jouer
lune de ses stratgies et daprs la matrice de paiements il joue p = 0 i.e. p (1) = 0 . Par
consquent, il nexiste pas dquilibre de Nash pur.
- On cherche si un support de la forme 1 = ( 0,1) et 2 = (q ,1 q ) correspond une stratgie
mixte. En faisant le mme raisonnement, on a p = 0 et lexamen de la matrice de paiements
nous indique que le joueur 2 joue forcment en pur et il joue q = 0 i.e. q ( 0 ) = 0 . Mais, dans
ce cas le joueur 1 jouera p = 1 i.e. p ( 0 ) = 1 . Par suite, il nexiste pas dquilibre de Nash pur.
1 1 1 1,
Le jeu admet un seul quilibre mixte , , .
2 2 2 2

Proposition III.4.1: Lensemble des quilibres de Nash en stratgies pures est un sous
ensemble de lensemble des quilibres de Nash en stratgies mixtes.

Lexistence de lquilibre de Nash:


Thorme III.4.1: Soit = ( N , ( S i )i N , (u i )i N ) un jeu sous forme normale. Si pour tout
i N
1. S i est un sous espace euclidien ( S i K
, K entier ) non vide convexe et compact
2. la fonction dutilit u i : S i est continue
i N

3. la fonction u i (., s i ) : S i et quasi-concave pour tout s i S i


alors ce jeu admet un quilibre de Nash en stratgies pures.

Proposition III.4.1: Soit = ( N , ( S i )i N , (u i )i N ) un jeu sous forme normale. Si N est fini et


si les ensembles S i sont des ensembles finis alors ce jeu admet un quilibre de Nash en
stratgies mixtes.

15

Vous aimerez peut-être aussi