Vous êtes sur la page 1sur 99

Thorie des Jeux

L3 - Sciences Economiques
Chapitre 1 : Jeux statiques information
complte
Michel PAUL
September 27, 2009
Contents
1 Forme normale 3
1.1 Dnitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Une illustration : le dilemne du Prisonnier . . . . . . . . . . . . 5
1.3 La bi-matrice des rglements . . . . . . . . . . . . . . . . . . . . 9
2 Concepts dquilibre 10
2.1 Rsolution par les relations de dominance . . . . . . . . . . . . . 10
2.1.1 Equilibre en stratgies strictement dominantes . . . . . . 10
2.1.2 Equilibre par limination itre de stratgies strictement
domi-nes . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Lquilibre de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.1 Dnitions . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.2 Exemples et premires proprits . . . . . . . . . . . . . . 29
2.2.3 Justication du concept dquilibre . . . . . . . . . . . . . 35
2.3 Le critre du max min . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.3.2 Application : le dilemne du prisonnier . . . . . . . . . . . 43
2.3.3 Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3 Le duopole 51
3.1 Premiers lments . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.1 Les donnes . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.2 Lquilibre concurrentiel . . . . . . . . . . . . . . . . . . . 54
3.1.3 Lquilibre de monopole . . . . . . . . . . . . . . . . . . . 58
3.2 Le duopole de Cournot (duopole en quantit) . . . . . . . . . . . 60
3.2.1 La forme normale . . . . . . . . . . . . . . . . . . . . . . . 60
3.2.2 Calcul de lquilibre de Nash . . . . . . . . . . . . . . . . 61
1
3.2.3 Proprits (2) . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2.4 Gnralisation (n-oligopole) . . . . . . . . . . . . . . . . . 69
3.3 Le duopole de Bertrand (duopole en prix) . . . . . . . . . . . . . 74
4 Existence et multiplicit de lquilibre de Nash 88
4.1 Lexistence de lquilibre . . . . . . . . . . . . . . . . . . . . . . . 88
4.2 La multiplicit des quilibres . . . . . . . . . . . . . . . . . . . . 99
2
1 Forme normale
1.1 Dnitions
Type de jeux tudis dans ce chapitre :
(1) 2 joueurs :
= 1, 2
Remarque La gnralisation au cas o le nombre de joueurs : est quelconque
ne pose pas de dicult.
(2) Chaque joueur i choisit une action (ou stratgie) :
i
dans un ensemble de
possibles o
i
:
:
i
o
i
et ces dcisions sont prises au secret,
ie les joueurs prennent leurs dcisions sans connatre le choix de lautre.
Remarque On dit aussi que les joueurs jouent en simultan.
(3) Une fois les actions choisies, les joueurs peroivent leurs rglements (ou
utilits), ces derniers dpendant de la combinaison de stratgies qui a t
joue.
Remarque Chaque joueur est donc muni dune fonction dutilit qui reprsente
ses prfrences, ces dernires tant dnies sur lensemble des rsultats possibles
o via un espace des consquences C. Formellement :
n
i
() : o R
: n
i
(:) = n
i
(:
1
, :
2
)
pour i = 1, 2 avec :
: = (:
1
, :
2
) un rsultat (ou issue) possible du jeu (prol de stratgies)
o lensemble des rsultats possibles du jeu :
o = o
1
o
2
(produit carthsien des ensembles de stratgies des joueurs).
3
Dnition 1 Soit n() la runion des fonctions de rglement des joueurs :
n() : o R
2
: n(:) = (n
1
(:), n
2
(:))
On appelle forme normale du jeu la structure (, o, n()).
Pour nir :
(4) Linformation est complte, ie les joueurs connaissent la forme normale
(, o, n()).
En consquence :
(a) chacun sait avec qui il joue,
ie chacun connat lensemble des joueurs ;
(b) chacun sait ce quil peut faire et galement ce que lautre peut faire,
ie chacun connat les ensembles de stratgies o
1
et o
2
;
(c) chacun connat ses prfrences et celles de lautre joueur,
ie chacun connat les fonctions dutilit n
1
() et n
2
().
En rsum :
Les joueurs connaissent avec certitude les donnes du jeu (par hy-
pothse).
4
1.2 Une illustration : le dilemne du Prisonnier
Lhistoire
=La Police a arrt deux individus dans une aaire de cambriolage.
= Elle na pas de preuve de leur culpabilit moins que lun des
suspects avoue.
= Les inspecteurs sparent les prisonniers et leurs expliquent les
consquences de leurs actions.
(1) Si personne navoue, chacun sera condamn 1 mois de prison (pour
rbellion).
(2) Si les deux avouent, chacun copera dune peine de 6 mois.
(3) Si lun avoue et lautre pas,
celui qui a avou sera relch (indulgence du Tribunal)
lautre copera dune peine de 9 mois :
+ 6 mois pour cambriolage
+ 1 mois pour rbellion
+ 2 mois pour entrave la justive.
5
La forme normale On a :
Ensemble des joueurs :
= 1, 2
Ensemble des stratgies :
o
1
= o
2
= a, aj
Dtermination des fonctions de rglements ???
6
Dtermination des fonctions de rglements
(1) Dtermination de lensemble des rsultats possibles (produit carthsien
des ensembles de stratgies) :
o = o
1
o
2
= (a, a) ; (a, aj) ; (aj, a) ; (aj, aj)
(2) Construction de lespace des consquences C (cf les rgles du jeu) :
(a, a) (6, 6) = c
1
(a, aj) (0, 9) = c
2
(aj, a) (9, 0) = c
3
(aj, aj) (1, 1) = c
4
(3) Sous lhypothse moins de prison, cest mieux :
c
2
~
1
c
4
~
1
c
1
~
1
c
3
(1)
c
3
~
2
c
4
~
2
c
1
~
2
c
2
(2)
(prfrences sur les consquences) do les prfrences sur les prols de
stratgies :
(a, aj) ~
1
(aj, aj) ~
1
(a, a) ~
1
(aj, a) (3)
(aj, a) ~
2
(aj, aj) ~
2
(a, a) ~
2
(a, aj) (4)
(4) Spcication des fonctions dutilit.
En prenant loppos de la peine pour le joueur considr (Gibbons [1994]) :
n
1
(:
1
, :
2
) =
_

_
6 :i (:
1
, :
2
) = (a, a)
0 :i (:
1
, :
2
) = (a, aj)
9 :i (:
1
, :
2
) = (aj, a)
1 :i (:
1
, :
2
) = (aj, aj)
n
2
(:
1
, :
2
) =
_

_
6 :i (:
1
, :
2
) = (a, a)
9 :i (:
1
, :
2
) = (a, aj)
0 :i (:
1
, :
2
) = (aj, a)
1 :i (:
1
, :
2
) = (aj, aj)
7
Commentaires
(1) Dautres spcications sont possibles (1, 2, 3 et 4 par exemple).
(2) Le fait que la fonction dutilit soit valeurs ngatives ne pose pas de
problme.
(3) On passe des ordres (1) et (2) :
c
2
~
1
c
4
~
1
c
1
~
1
c
3
c
3
~
2
c
4
~
2
c
1
~
2
c
2
aux ordres (3) et (4) :
(a, aj) ~
1
(aj, aj) ~
1
(a, a) ~
1
(aj, a)
(aj, a) ~
2
(aj, aj) ~
2
(a, a) ~
2
(a, aj)
sous lhypothse :
la n justie les moyens
(neutralit stratgique).
(4) Vis--vis de linformation :
linformation est complte car les joueurs connaissent toutes les
donnes du jeu (par hypothse) ;
linformation est imparfaite car le joueur 1 lorsquil prend sa
dcision ignore le choix du joueur 2 et rciproquement.
Voir gure 1 pour la reprsentation sous forme extensive.
8
1.3 La bi-matrice des rglements
On synthtise ces informations dans un tableau appel bi-matrice des rgle-
ments.
Dans le cas prsent :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
(5)
Dtails
Par convention, le joueur 1 est en ligne et le joueur 2 en colonne.
On liste les actions des joueurs.
On renseigne les cellules en faisant gurer les rglements obtenus pour les
direntes combinaisons de stratgies.
Par convention, le premier lment du vecteur de rglements indique le
rglement du joueur 1, le second celui du joueur 2.
Remarque Bi-matrice car les lments de la matrice sont des vecteurs de
dimension 2.
Puis question :
Que vont faire les prisonniers sachant (rappel) :
(1) quils nont pas la possibilit de se concerter ;
(2) quils connaissent toutes les donnes du jeu ;
(3) que la n justie les moyens (hypothse de neutralit stratgique).
???
9
2 Concepts dquilibre
2.1 Rsolution par les relations de dominance
2.1.1 Equilibre en stratgies strictement dominantes
A) Dnitions
Dnition 2 Une stratgie :
t
1
du joueur 1 (mutatis mutandis :
t
2
du joueur 2)
domine strictement une stratgie :
tt
1
ssi :
\:
2
o
2
, n
1
(:
t
1
, :
2
) n
1
(:
tt
1
, :
2
) (6)
Littralement :
Quoi que fasse le joueur 2, jouer :
t
1
permet au joueur 1 dobtenir de
meilleurs rglements (strictement) que :
tt
1
Remarque On dit aussi La stratgie :
tt
1
est strictement domine par la stratgie
:
t
1
.
Dnition 3 Une stratgie :
t
1
du joueur 1 est strictement dominante si elle
domine strictement toutes les autres stratgies de ce joueur.
Formellement :
n
1
(:
t
1
, :
2
) n
1
(:
1
, :
2
), \:
1
o
1
:
t
1
, \:
2
o
2
(7)
Littralement :
Quoi que fasse le joueur 2, jouer :
t
1
permet au joueur 1 dobtenir
de meilleurs rglements (strictement) compars ceux que permet
nimporte quelle autre de ses stratgies.
10
Dnition 4 On appelle quilibre en stratgies strictement dominantes le prol
form des stratgies strictement dominantes des joueurs
Remarque En admettant que chaque joueur ait une stratgie strictement dom-
inante.
Justication de la slection dun tel prol :
= Quoi que fasse le joueur 2, le joueur 1 a toujours intrt jouer sa
stratgie strictement dominante
et rciproquement :
= Quoi que fasse le joueur 1, le joueur 2 a toujours intrt jouer sa
stratgie strictement dominante.
C/s :
Chacun joue sa stratgie strictement dominante et la rsolution du
jeu est triviale.
11
B) Application - le dilemne du prisonnier
Si le jeu est ni, il sut de comparer les distributions de rglements
qui sont gnres par chacune des stratgies.
Rappel :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
En ce qui concerne le joueur 1 :
n
1
(a, ) = (6, 0)
n
1
(aj, ) = (9, 1)
et :
(6, 0) (9, 1)
Conclusion :
la stratgie a domine strictement la stratgie aj ;
De plus,
le joueur 1 ne disposant que de 2 stratgies, a est une stratgie strictement
dominante.
Remarque 7 Le ( lire double suprieur) est au sens des vecteurs, ie chaque
coordonne du vecteur est strictement suprieure la coordonne correspondante
de lautre vecteur.
Exemples :
(4, 1) (0, 0)
(4, 1) (4, 0)
(4, 1) _ (4, 0)
(4, 1) ? (1, 4)
12
Rappel :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
Similairement, en ce qui concerne le joueur 2 :
n
2
(, a) =
_
6
0
_
n
2
(, aj) =
_
9
1
_
et :
_
6
0
_

_
9
1
_
Conclusion : idem !
Pour nir :
Comme chaque joueur a une stratgie strictement dominante, il exis-
te un quilibre en stratgies strictement dominantes, le prol :
(:
+
1
, :
+
2
) = (a, a)
do les rglements dquilibre :
(n
+
1
, n
+
2
) = (6, 6)
Remarque Attention !!! On ne confondra pas lquilibre (sous-entendu les
stratgies dquilibre) et les rglements dquilibre.
13
C) Lecacit de lquilibre
Rappel :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
Point remarquable :
Lquilibre obtenu nest pas un optimum de Pareto.
Motif
Le prol (:
+
1
, :
+
2
) = (a, a) est domin par le prol (aj, aj).
On a en eet :
(n
1
(a, a) , n
2
(a, a)) = (6, 6)
(n
1
(aj, aj) , n
2
(aj, aj)) = (1, 1)
et :
(1, 1) (6, 6)
Remarques
(1) Dnition dun optimum au sens de Pareto = on ne peut pas amliorer la
situation dun agent sans dtriorer celle dun autre (au moins).
(2) Dans le dilemne du Prisonnier, les optima de Pareto sont au nombre de 3.
Mthode de rsolution . . .
(3) Paradoxe : . . .
14
D) Linexistence de lquilibre
Problme :
Lquilibre en stratgies strictement dominantes nexiste pas pour
une large classe de jeux !
Exemple Cf le jeu ci-dessous :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
(8)
Le point Ne pouvant ordonner les distributions :
n
1
(a, ) = (1, 1, 0)
n
1
(/, ) = (0, 0, 2)
le joueur 1 na pas de stratgie strictement dominante et :
Le jeu nadmet pas dquilibre en stratgies strictement dominantes.
15
2.1.2 Equilibre par limination itre de stratgies strictement domi-
nes
A) Le principe
Etape 1 On reprend la bi-matrice (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
et lon compare les distributions de rglements du joueur 2 :
n
2
(, r) =
_
0
3
_
n
2
(, j) =
_
2
1
_
n
2
(, .) =
_
1
0
_
Le point :
On ne peut pas ordonner r et j ;
De mme pour r et . ;
. est strictement domine par j car :
n
2
(, j) =
_
2
1
_
n
2
(, .) =
_
1
0
_
Par la suite :
La stratgie . ntant jamais joue (le joueur 2 fera toujours mieux en
jouant j), on peut lliminer auquel cas la bi-matrice des rglements
devient :
r j
a 1, 0 1, 2
/ 0, 3 0, 1
(9)
16
Remarque Largument est prcisment le suivant.
Si on compare le jeu (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
et le jeu (9) :
r j
a 1, 0 1, 2
/ 0, 3 0, 1
on voit que :
= retirer la stratgie . au jeu (8) nenlve rien la situation du joueur 2 ;
= introduire la stratgie . dans le jeu (9) namliore en rien la situation du
joueur 2.
Justication :
La stratgie ., parce quelle est strictement domine, ne sera jamais
joue par un joueur qui entend maximiser son rglement.
Notamment :
Il est toujours prfrable pour 2 de jouer j plutt que ..
Dans ces conditions, on peut considrer :
(i ) que la stratgie . est une stratgie non pertinente (sous-entendu
quant ce quoi doit tre lissue du jeu),
auquel cas :
(ii ) les jeux (8) et (9), parce quils sont quivalents du point de vue stratgique,
doivent admettre le mme quilibre.
17
Etape 2 Reprenant le jeu rduit :
r j
a 1, 0 1, 2
/ 0, 3 0, 1
on constate :
Conditionnellement au fait davoir limin la stratgie ., la stratgie
/ du joueur 1 est strictement domine par la stratgie a car :
(1, 1) (0, 0)
C/s :
On peut lliminer (ie rpter le processus) pour obtenir :
r j
a 1, 0 1, 2
(10)
Justication Reprenant le jeu (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
on a :
1 sait que 2 ne jouera jamais .
et sachant que 2 ne jouera jamais . :
1 ne jouera jamais /, ce que 2 sait.
Par consquent :
Le jeu (8) est quivalent au jeu (10).
ou d faon quivalente :
Tout se passe comme si les joueurs jouaient au jeu (10).
18
Etape 3 Reprenant le jeu (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
et le jeu rduit :
r j
a 1, 0 1, 2
(11)
on constate :
Conditionnellement au fait davoir limin la stratgie ., puis la
stratgie /, la stratgie r est strictement domine par la stratgie j
(car 0 < 2).
C/s :
On peut liminer la stratgie r auquel cas il reste (i) la bi-matrice :
j
a 1, 2
et (ii ) le prol de stratgies (a, j).
Conclusion :
Ce prol reprsente lquilibre par limination itre de stratgies
strictement domines.
Il gnre pour rglements dquilibre (1, 2).
19
En rsum :
Le principe sur lequel repose ce mode de rsolution consiste utiliser
les relations de dominance de tous les joueurs en faisant lhypothse
(raisonnable) quun joueur rationnel ne jouera jamais une stratgie
strictement domine.
Lalgorithme est donc le suivant :
Etape 1 Identier les stratgies strictement domines ;
Etape 2 Les liminer, le cas chant, plusieurs la fois ;
Etape 3 Retourner ltape 1 pour la forme normale rduite obtenue en 2.
auquel sajoute un critre darrt.
20
B) Commentaires
Commentaire 1/3 Dans la rsolution du jeu :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
on a fait (implicitement) une hypothse :
Celle de connaissance mutuelle (mutual knowledge) lordre 1.
Ainsi, il a fallu supposer :
(1) que 1 et 2 taient rationnels ;
(2) que 1 savait que 2 tait rationnel
= dans le cas contraire, il nest pas possible dliminer la stratgie / ;
(3) que 2 savait que 1 savait que 2 tait rationnel.
= si 2 ne sait pas que 1 sait que 2 est rationnel, 2 ne peut pas anticiper
que 1 ne jouera jamais / auquel cas il peut tre optimal de jouer r.
Par la suite . . .
21
Par la suite,
= sil y a plusieurs tapes dans le processus dlimination, on doit faire
chaque fois une hypothse en plus quant ce que les joueurs savent de la
rationnalit de chacun ;
= si on souhaite appliquer le processus pour un nombre indtermin dtapes,
on dira quil y a connaissance commune (common knowledge) dans le
jeu, ce qui quivaut de la connaissance mutuelle un ordre inni.
Techniquement, on suppose donc avec la connaissance commune :
(1) 1 est rationnel,
(2) 2 sait que 1 est rationnel,
(3) 1 sait que 2 sait que 1 est rationnel,
(4) 2 sait que 1 sait que 2 sait que 1 est rationnel
. . .
et de mme :
(1) 2 est rationnel,
(2) 1 sait que 2 est rationnel
(3) 2 sait que 1 sait que 2 est rationnel,
(4) 1 sait que 2 sait que 1 sait que 2 est rationnel
. . .
cela autant de fois que ncessaire.
22
Commentaire 2/3
Un quilibre en stratgies strictement dominantes est galement un quili-
bre par limination itre de stratgies strictement domines.
La rciproque, en revanche, est fausse (lexemple prcdent permet de sen
convaincre).
Commentaire 3/3
Sil existe pour sur au moins un quilibre pour ce concept dquilibre
(au contraire du prcdent), rien ne garantit que ce processus itratif
converge vers un unique rsultat.
En dautres termes :
Il peut exister une multiplicit de prols en quilibre pour ce concept,
le cas chant :
lintgralit des rsultats possibles du jeu !
23
Exemple Pour le jeu ci-dessous :
r j .
a 0, 4 4, 0 5, 3
/ 4, 0 0, 4 5, 3
c 3, 5 3, 5 6, 6
(12)
on ne peut pas ordonner les distributions du joueur 1 :
n
1
(a, ) = (0, 4, 5)
n
1
(/, ) = (4, 0, 5)
n
1
(c, ) = (3, 3, 6)
pas plus que celles du joueur 2 :
n
2
(, r) =
_
_
4
0
5
_
_
n
2
(, j) =
_
_
0
4
5
_
_
n
2
(, .) =
_
_
3
3
6
_
_
Conclusions :
== Aucune stratgie, du joueur 1 ou du joueur 2, nest strictement
domine.
auquel cas :
==Tous les rsultats du jeu sont des quilibres par limination itre
de stratgies strictement domines.
Remarque Attention !
= On ne dira pas que le jeu nadmet pas dquilibre.
De faon plus gnrale,
= On ne confondra pas la question de lexistence de lquilibre avec celle de
lunicit de lquilibre.
24
Question : Que faire ?
Rponse :
(1) Introduire des relations de dominance moins restrictives.
(2) Se tourner vers dautre concepts dquilibre :
(a) lquilibre de Nash
(b) lquilibre en Max-Min
25
2.2 Lquilibre de Nash
2.2.1 Dnitions
Dnition Meilleure rponse On appelle meilleure rponse du joueur 1 (mu-
tatis mutandis du joueur 2) et lon note c
1
() la correspondance, dnie sur o
2
et valeurs dans o
1
, qui donne les stratgies optimales du joueur 1 vis--vis
des stratgies possibles du joueur 2.
Formellement :
c
1
() : o
2
o
1
:
2
c
1
(:
2
)
avec :
c
1
(:
2
) = :
+
1
o
1
[n
1
(:
+
1
, :
2
) _ n
1
(:
1
, :
2
), \:
1
o
1

Remarque :
= c
1
(:
2
) est un sous-ensemble de lensemble de stratgie du joueur 1 (ie on
associe une stratgie du joueur 2 un ensemble de stratgies du joueur
1), cest pourquoi on parle de correspondance.
= Si maintenant c
1
(:
2
) contient un unique lment pour tout :
2
o
2
, on
parle de fonction de meilleure rponse.
26
Exemple Dans le dilemne du prisonnier :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
la meilleure rponse du joueur 1 vaut :
c
1
(:
2
) =
_
_
_
a :i :
2
= a
a :i :
2
= aj
et celle du joueur 2 vaut :
c
2
(:
1
) =
_
_
_
a :i :
1
= a
a :i :
1
= aj
Exemple Dans le jeu :
oni :o:
oni 0, 2 6, 1
:o: 1, 6 7, 7
j 1, 1 1, 1
on a :
c
1
(:
2
) =
_
_
_
:o:, j :i :
2
= oni
:o: :i :
2
= :o:
et :
c
2
(:
1
) =
_

_
oni :i :
1
= oni
:o: :i :
1
= :o:
oni, :o: :i :
1
= j
27
Dnition Equilibre de Nash Un prol de stratgies :
+
= (:
+
1
, :
+
2
) o du
jeu (, o, n()) est en quilibre de Nash si :
_
_
_
n
1
(:
+
1
, :
+
2
) _ n
1
(:
1
, :
+
2
)
n
2
(:
+
1
, :
+
2
) _ n
2
(:
+
1
, :
2
)
soit encore si :
_
_
_
:
+
1
c
1
(:
+
2
)
:
+
2
c
2
(:
+
1
)
ie si la stratgie :
+
1
est en meilleure rponse la stratgie :
+
2
et rciproquement.
En dautres termes :
Un prol est en quilibre de Nash si les stratgies quil spcie sont
en meilleures rponses les unes aux autres.
Par suite, en un tel prol :
= la stratgie de chacun, compte tenu de ce que fait lautre, est optimale ;
= personne nest incit scarter de sa stratgie si lautre en fait autant ;
= personne ne regrette ce quil a jou compte tenu de ce qua jou lautre.
28
2.2.2 Exemples et premires proprits
Exemple 1 Le dilemne du Prisonnier
La bi-matrice des rglements scrit:
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
Puis deux faons de procder pour le calcul des quilibres de Nash.
Mthode I On teste en chaque prol si la dviation est rentable.
Par la suite :
si oui, le prol nest pas en quilibre de Nash ;
si non, le prol est en quilibre de Nash.
Application :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
. . .
Commentaires
(1) La limite de cette mthode est quelle est lourde mettre en oeuvre si lon
souhaite identier tous les quilibres de Nash,
(on doit alors lappliquer tous les prols).
C/s :
Le plus souvent, elle est utilise pour vrier que tel prol est ou
nest pas en quilibre de Nash.
(dans ce cas, elle prsente un intrt certain).
(2) On gardera lesprit que la dviation doit tre strictement rentable.
29
Mthode II Elle consiste :
(i ) calculer les meilleures rponses
puis :
(ii ) localiser lintersection des meilleures rponses.
Plus prcisment :
= on fait gurer les meilleures rponses en soulignant les rglements qui leurs
correspondent dans la bi-matrice de gains (5) :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
On obtient :
a aj
a 6
+
, 6
+
0
+
, 9
aj 9, 0
+
1, 1
= on repre les cellules o il y a 2 croix, ici le prol (a, a). Ce dernier
reprsente alors lquilibre de Nash du jeu.
Commentaires
(1) Bien videmment, cest cette mthode quil faut employer ( moins quil
soit demand de vrier que tel prol est (ou nest pas) en quilibre de
Nash).
(2) On constate que le prol (a, a) est la fois un quilibre de Nash et un
quilibre en stratgies strictement dominantes.
En dautres termes :
Le concept dquilibre de Nash et celui dquilibre en strat-
gies strictement dominantes conduisent slectionner le
mme prol.
Question :
Est-ce toujours le cas ?
30
Rponse : oui !
Proposition 1 Si chaque joueur possde une stratgie strictement dominante,
lquilibre de Nash est unique et coincide avec lquilibre en stratgies strictement
dominantes.
Proposition 2 Si un joueur possde une stratgie strictement dominante, il la
joue lquilibre de Nash.
Preuves : videntes une fois remarqu que la meilleure rponse du joueur 1
vrie :
c
1
(:
2
) = :
t
1
, \:
2
o
2
lorsque :
t
1
est une stratgie strictement dominante.
31
Exemple 2 Le jeu (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
Le calcul des meilleures rponses donne :
r j .
a 1
+
, 0 1
+
, 2
+
0, 1
/ 0, 3
+
0, 1 2
+
, 0
et lon obtient pour lquilibre de Nash :
(:
+
1
, :
+
2
) = (a, j)
Le point :
On constate que lquilibre de Nash coincide avec lquilibre par
limination itre de stratgies strictement domines.
Question :
Est-ce une proprit gnrale ?
Rponse :
Oui condition que lquilibre par limination itre de stratgies
strictement domines soit unique
Proposition 3 Si un jeu admet un unique quilibre par limination itre de
stratgies strictement domines, alors cet quilibre est un quilibre de Nash et
cest le seul.
32
Exemple 3 Le jeu (12) :
r j .
a 0, 4 4, 0 5, 3
/ 4, 0 0, 4 5, 3
c 3, 5 3, 5 6, 6
Le calcul des meilleures rponses donne :
r j .
a 0, 4 4
+
, 0 5, 3
+
/ 4
+
, 0 0, 4
+
5, 3
c 3, 5 3, 5 6
+
, 6
+
et lon obtient pour lquilibre de Nash :
(:
+
1
, :
+
2
) = (c, .)
Le point Dans ce jeu :
= tous les prols sont des quilibres par limination itre de stratgies
strictement domines ;
= il existe un et un seul quilibre de Nash.
Conclusion ???
33
Conclusion :
Lensemble des quilibres de Nash est inclus dans lensemble des
quilibres par limination itre de stratgies strictement domines,
ce qui laisse suggrer :
Lquilibre de Nash est un concept dquilibre plus fort, plus restrictif
que llimination itre de stratgies strictement domines.
(plus restrictif au sens o il conduit liminer plus de prols).
Question :
Est-ce toujours le cas ?
Rponse : oui !
Proposition Un prol en quilibre de Nash est galement un quilibre par lim-
ination itre de stratgies strictement domines.
Proposition Des quilibres par limination itre de stratgies strictement dom-
ines ne sont pas ncessairement en quilibre de Nash.
C/s Vis--vis du calcul des quilibres de Nash, il est possible de procder en
deux tapes.
(1) On dtermine les quilibres par limination itre de stratgies strictement
domines.
(2) On identie les quilibres de Nash dans le jeu rduit.
Intrt :
= cela permet de simplier les calculs ultrieurs dans certains problmes,
notamment lorsque lon suspecte que le ou les quilibres de Nash sont en
stratgies mixtes.
34
2.2.3 Justication du concept dquilibre
Question :
Comment justier le concept de lquilibre de Nash ?
cest--dire :
Comment justier le fait que les joueurs vont eectivement jouer,
mis en situation, des stratgies qui sont en quilibre de Nash ?
Le point :
La rponse cette question nest pas vidente car le concept de
lquilibre de Nash ne nous dit pas comment les joueurs aboutissent
au choix de leurs stratgies dquilibre, P. Cahuc [199x],
Illustration Le jeu (8) :
r j .
a 1, 0 1, 2 0, 1
/ 0, 3 0, 1 2, 0
admet un unique quilibre par limination itre de stratgies strictement do-
mines ((a, j)) et :
On voit bien par quels raisonnements les joueurs sont conduits
faire leurs choix.
En lespce :
(1) 2 est rationnel, ce qui fait quil ne jouera jamais . ;
(2) 1, parce quil sait que 2 est rationnel, sait que 2 ne jouera jamais . auquel
cas il ne lui reste plus qu jouer a (la stratgie / devient strictement
domine et 1 est rationnel) ;
(3) 2, parce quil sait que 1 est rationnel et quil sait que 1 sait quil est
rationnel, sait que 1 va jouer in ne la stratgie a auquel cas il ne lui
reste plus qu jouer j (la stratgie r devient strictement domine et 2 est
rationnel).
Problme :
On ne dispose pas de telles justications avec le concept de lquilibre
de Nash.
So, quels arguments ?
35
Argument 1 : regarder lquilibre de Nash comme le rsultat dun
processus dajustement dans le cadre dun jeu rpt..
Exemple On reprend le jeu (12) :
r j .
a 0, 4 4, 0 5, 3
/ 4, 0 0, 4 5, 3
c 3, 5 3, 5 6, 6
et hypothses :
(1) On part du prol (c, r)
(2) On considre que chaque joueur modie tour de rle son choix de manire
optimale avec le joueur 2 qui commence.
On obtient la trajectoire :
(c, r) (c, .) (c, .) (c, .) . . .
ie :
Une fois que lon est au prol (c, .), on y reste !
(les joueurs le jouent alors indniment).
Conclusion :
Lquilibre de Nash (c, .) est lquilibre stationnaire du processus.
36
Problme 1/2
Rien ne garantit que lon converge vers lquilibre !
Exemple Dans le mme jeu (12) :
r j .
a 0, 4 4, 0 5, 3
/ 4, 0 0, 4 5, 3
c 3, 5 3, 5 6, 6
(1) On part du prol (c, r) (mme point de dpart) mais 1 commence :
(a, r) (a, j)
|
(/, r) (/, j)

(c, r)
(2) 2 commence avec un point de dpart qui se modie pour devenir (/, r) ;
lquilibre stationnaire (c, .) nest pas globalement stable (pour la
rgle dajustement considre) ;
(3) On maintient le point de dpart, le prol (c, r), avec 1 et 2 qui ragissent
de manire simultane en anticipant que lautre ne modie pas son choix
(conjecture de Cournot) :
(c, r) (/, .)
|
(a, .) (c, j)
ie partant du mme point de dpart, lquilibre stationnaire (c, .) est
prsent instable.
Remarque Bien videmment :
Quid de la pertinence des conjectures de Cournot ?
37
Problme 2/2
On est en train de modier les rgles du jeu !
En particulier :
On justie la slection dun prol de stratgies, ici le couple (c, .),
dans un jeu statique en considrant un jeu dynamique.
Ceci est alors gnant :
(1) dabord en soi
mais aussi :
(2) parce que le sentier ainsi identi nest pas un quilibre du jeu dynamique
(voir chapitre suivant).
C/s :
Ce nest pas comme cela que les joueurs vont jouer ce jeu,
ie la trajectoire ainsi identie ne sera pas joue !
38
Argument 2
Un thoricien, sil doit faire une prdiction, se doit de prdire un
prol qui est en quilibre de Nash car il faut que les joueurs soient
prts le jouer.
Plus prcisment :
= Si la thorie fait une prdiction qui nest pas en quilibre de Nash, un
joueur au moins peut faire mieux en jouant autre chose que ce que la
thorie prdit auquel cas il jouera autre chose que ce que la thorie prdit
et la thorie, parce quelle sera inrme par les faits, devra tre rejete.
On peut alors inverser le raisonnement et dire :
= Si lon veut que la thorie puisse ne pas tre inrme, il faut que les
joueurs soient prts jouer ce que la thorie prdit quils joueront.
De ce point de vue :
Lquilibre de Nash est un critre (minimal) de prdictibilit.
39
Argument 3 :
Un quilibre de Nash = un quilibre anticipations rationnelles
avec des prophties (ie des prvisions) auto-ralisatrices.
Reprenant le jeu :
r j .
a 0, 4 4, 0 5, 3
/ 4, 0 0, 4 5, 3
c 3, 5 3, 5 6, 6
lide est la suivante (de manire informelle).
Hypothses :
1 pense que 2 va jouer . ;
2 pense que 1 va jouer c ;
Le point :
si 1 pense que 2 va jouer ., il a intrt jouer c ;
si 2 pense que 1 va jouer c, il a intrt jouer ..
C/s Au prol (c, .) :
en jouant c, 1 conrme lanticipation de 2 et le bien-fond pour 2 de jouer
. ;
en jouant ., 2 conrme lanticipation de 1 et le bien-fond pour 1 de jouer
c.
Sous cette forme, un quilibre de Nash est un quilibre en stratgies :
= il est eectivement optimal pour les joueurs de jouer les stratgies quils
sont censs jouer
et en anticipations :
= les anticipations sont correctes, cest--dire que chacun a bien prvu le
comportement de lautre.
40
2.3 Le critre du max min
Introduction
= A lorigine, le critre du max min est souvent utilis en thorie de la dci-
sion (simple).
Il se justie le plus souvent comme dcrivant le cas (polaire) dun agent
inniment averse lgard du risque.
= Dans le cas prsent, thorie de la dcision multi-agents, il peut conduire
des rsultats qui se rvlent tantt satisfaisants, tantt insatisfaisants.
On est ainsi conduit lui prfrer le concept de lquilibre de Nash.
41
2.3.1 Dnition
Du point de vue formel :
(1) il sagit de dterminer pour le joueur 1 la ou les stratgies :
+
1
solution du
programme suivant :
max
s1S1
min
s2S2
n
1
(:
1
, :
2
) = n
0
1
(13)
(2) De mme pour le joueur 2 :
max
s2S2
min
s1S1
n
2
(:
1
, :
2
) = n
0
2
(14)
Par la suite :
= Les rglements ainsi dtermins sont appels les rglements de scurit
des joueurs" ;
= les stratgies qui leurs sont associes sont appeles les maximin.
Interprtation de la rgle de dcision :
Les joueurs jouent la scurit.
Justication
En faisant de la sorte, chacun sassure un rglement dau moins n
0
i
,
i = 1, 2.
42
2.3.2 Application : le dilemne du prisonnier
A lorigine :
a aj
a 6, 6 0, 9
aj 9, 0 1, 1
Puis :
(1) On repre, ligne par ligne (ie pour chaque stratgie du joueur 1), les r-
glements minimaux du joueur 1.
Il vient :
a aj
a 6
+
, 6 0, 9
aj 9
+
, 0 1, 1
Puis :
(2) On repre le plus grand de ces minima (ie le maximum des minima do
max min).
On obtient :
a aj
a 6
+
, 6 0, 9
aj 9
+
, 0 1, 1
Puis conclusions :
(3) Le rglement de scurit du joueur 1 est 6 ;
(4) La stratgie a est le maximin (ou stratgie de scurit) du joueur 1.
43
Calcul de la stratgie de scurit du joueur 2 De la mme faon :
a aj
a 6, 6
+
0, 9
+
aj 9, 0 1, 1
puis comme :
a aj
a 6
+
, 6
+
0, 9
+
aj 9
+
, 0 1, 1
Conclusion gnrale
Chaque joueur joue, sur la base du critre du max min, la stratgie
aoncr.
Remarque Le prol ainsi slectionn, (a, a), correspond galement celui qui
est slectionn par lquilibre de Nash.
44
2.3.3 Limites
Problme :
Le critre du max min peut conduire des rsultats tantt satis-
faisants, tantt insatisfaisants selon le contexte.
Exemple 1 :
c ,
a 40, 40 10, 50
/ 50, 10 20, 1
(Jeu A)
Dtermination de lquilibre de Nash :
c ,
a 40, 40
+
10
+
, 50
/ 50
+
, 10
+
20, 1
Application du max min :
c ,
a 40, 40 10
+
, 50
+
/ 50, 10
+
20
+
, 1
Conclusions :
(1) Lquilibre de Nash et le critre du max min ne conduisent pas (ici) au
mme rsultat.
(2) En dterminant sa stratgie de scurit, 1 anticipe que 2 joue une stratgie
strictement domine (,), cela dans tous les cas de gure.
De faon plus gnrale :
La nature des anticipations qui accompagnent la slection des ac-
tions joues par les joueurs pose problme.
Deux interprtations sont possibles . . . .
45
(Rappel)
c ,
a 40, 40 10
+
, 50
+
/ 50, 10
+
20
+
, 1
Interprtation n

1 :
Sur la base du critre du max-min, le joueur 1 sattend recevoir
au moins 10 et le joueur 2 sattend recevoir au moins 10.
Le point :
Ces anticipations sont valides dans la mesure o chacun obtient 40
au prol de stratgies ainsi dtermin.
Interprtation n

2 :
Sur la base du critre du max-min,
1 joue a et anticipe que 2 joue , ;
2 joue c et anticipe que 1 joue /.
Le point :
Si les stratgies des joueurs sont, conditionnellement aux anticipa-
tions qui sont tenues, optimales, les anticipations sont en revanche
incorrectes dans la mesure o elles ne sont pas valides par les strat-
gies que jouent les joueurs.
En dautres termes :
Les joueurs font une erreur qui se rvle, pour lun dentre eux,
extrmement grossire (1 anticipe que 2 jouera une stratgie stricte-
ment domine).
Conclusion :
La slection du prol (a, c) repose sur des erreurs danticipations.
46
Exemple 2
c , c
a 100, 100 0, 0 50, 75
/ 0, 0 60, 60 25, 75
c 75, 50 75, 25 30, 30
(Jeu B)
et :
Dtermination de lquilibre de Nash :
c , c
a 100
+
, 100
+
0, 0 50
+
, 75
/ 0, 0 60, 60 25, 75
+
c 75, 50
+
75
+
, 25 30, 30
Application du max min :
c , c
a 100, 100 0
+
, 0
+
50, 75
/ 0
+
, 0
+
60, 60 25, 75
c 75, 50 75, 25 30
+
, 30
+
Le point On slectionne ici par le critre du max min un prol en lequel :
les anticipations tenues par les joueurs sont correctes :
1 joue c et anticipe que 2 joue c,
2 joue c et anticipe que 1 joue c.
Conclusion :
1 parvient bien prvoir ce que va faire 2 et rciproquement,
mais :
conditionnellement aux anticipations qui sont tenues, les actions que jouent
les joueurs ne sont pas optimales.
si 1 pense que 2 joue c, il ferait mieux de jouer a ;
si 2 pense que 1 va joueur c, il ferait mieux de jouer c ;
47
De faon plus gnrale :
le problme du max min tient la nature des conjectures qui
sont prtes aux joueurs.
Plus prcisment, comme :
max
s1S1
min
s2S2
n
1
(:
1
, :
2
) = n
0
1
max
s2S2
min
s1S1
n
2
(:
1
, :
2
) = n
0
2
tout se passe comme si :
1 anticipait que 2 sattachait minimiser, par le choix de ses stratgies, le
rglement de 1,
2 anticipait que 1 sattachait minimiser, par le choix de ses stratgies, le
rglement de 2.
Or Problme :
Lobjectif premier du joueur 1 (resp du joueur 2) nest pas de min-
imiser le rglement du joueur 2 mais bien de maximiser son propre
rglement.
et sauf cas particulier :
Ces conjectures sont alors contradictoires avec la rationalit
des joueurs !
48
Illustration :
c , c
a 100, 100
++
0
+
, 0 50, 75
/ 0
+
, 0 60, 60 25, 75
++
c 75, 50
++
75, 25 30
+
, 30
Indication de lecture
1 toile dsigne lanticipation du joueur 1 quant au comportement du
joueur 2 sous le critre du max min ;
2 toiles dsignent les meilleures rponses du joueurs 2 face aux choix du
joueur 1.
Lquilibre en max min est (c, c) ; les joueurs obtiennent (30, 30).
Lquilibre de Nash est (a, c) ; les joueurs obtiennent (100, 100).
49
Conclusion
(1) Dans certaines circonstances, le critre du max min donne de bons rsul-
tats, essentiellement parce que la maximisation du rglement du joueur 1
(resp du joueur 2) requiert la minimisation du rglement du joueur 2 (resp
du joueur 1).
Cas 1 Les jeux somme nulle dans lesquels :
\(:
1
, :
2
) o, n
1
(:
1
, :
2
) + n
2
(:
1
, :
2
) = 0
Littralement, ce que lun gagne, lautre le perd.
Cas 2 Les jeux strictement concurrentiels dans lesquels les prfrences des
joueurs sur les rsultats sont inverses lune lautre.
Exemple :
c ,
a 8, 1 6, 2
/ 4, 3 2, 4
On a alors :
(a, c) ~
1
(a, ,) ~
1
(/, c) ~
1
(/, ,)
(/, ,) ~
2
(/, c) ~
2
(a, ,) ~
2
(a, c)
Toutefois, le critre du max min est :
(2) dans de tels cas de gure quivalent lquilibre de Nash (ie les deux
concepts amnent slectionner le(s) mme(s) prol(s) de stratgies) ;
(3) insatisfaisant sinon (en toute gnralit).
En c/s :
jeu somme nulle jeu somme non nulle
Critre du max min oui non
Equilibre de Nash oui oui
Tableau 1
50
3 Le duopole
3.1 Premiers lments
3.1.1 Les donnes
On considre un march avec :
H
1
2 rmes, la rme 1 et la rme 2, cherchant maximiser leur prot et
produisant chacune un bien homogne en quantits
1
et
2
;
H
2
une demande linaire de la forme :
Q
d
(j) =
_
_
_
c j :i j _ c
0 :i j _ c
(15)
avec c la taille de la demande et j le prix de vente du produit.
H
3
des rendements dchelle constants avec des fonctions de cot linaires :
C
1
(
1
) = c
1
(16)
C
2
(
2
) = c
2
H
4
une concurrence en prix ou en quantit selon que les rmes dcident (1)
des prix de vente ou (2) des quantits produites.
Remarque :
= Si (2), le prix est x par un commissaire priseur de faon ajuster la
demande lore et lon a :
j = /(Q) = c Q = c (
1
+
2
)
On parle alors du Duopole de Cournot.
= Si (1), les entreprises sont tenues de satisfaire les demandes qui sadressent
elles aux prix annonces (pas de refus de vente). Ceci est le Duopole de
Bertrand.
Pour nir :
H
5
c c (voir plus loin).
H
6
chaque rme fait ses choix, prix ou production, sans connatre ceux de sa
rivale ;
H
7
chaque rme connat toutes les donnes du jeu.
51
10 7.5 5 2.5 0
15
12.5
10
7.5
5
2.5
0
Q
p
Q
p
g 1 Q
d
(j) = max [0, c j]
52
5 3.75 2.5 1.25 0
30
25
20
15
10
5
0
Q
C(Q)
Q
C(Q)
g 2 C() = c et C' = C: = c
53
3.1.2 Lquilibre concurrentiel
Dtermination de lore concurrentielle
s
1
(j) (mutatis mutandis
s
2
(j))
On rsoud :
max
q10

1
(
1
) = j
1
C
1
(
1
)
= j
1
c
1
= (j c)
1
avec :
0
1
0
1
= j c
Le point :
La fonction de prot tant linaire en
1
, on a :

s
1
(j) =
_

_
0 :i j < c
[0, +[ :i j = c
+ :i j c
et de mme pour lore globale :
Q
s
(j) =
s
1
(j) +
s
2
(j)
54
Dtermination de lquilibre concurrentiel Aprs reprsentation de lore
et de la demande globale (cf. g 3), lquilibre de march se ralise en :
j
+
c
= c
Q
+
c
= c c
ie :
le prix est dtermin par le cot moyen c auquel cas la quantit
produite est dtermine par la demande en ce niveau de prix j = c .
10 7.5 5 2.5 0
10
7.5
5
2.5
0
Q
p
Q
p
g 3 Lquilibre concurrentiel I (c c)
55
Calcul des surplus
Prots :

+
1
= (j
+
c
c)
s
1
(j
+
c
) = (c c)
c
1
= 0 =
+
2
Surplus des consommateurs :
o
c
= (c j
+
c
) (Q
+
c
0)
1
2
=
(c c) (c c)
2
=
(c c)
2
2
=
(Q
+
c
)
2
2
10 7.5 5 2.5 0
10
7.5
5
2.5
0
Q
p
Q
p
g 3 Lquilibre concurrentiel I (c c)
56
Remarque
Le rle de H
5
(c c) est de garantir que le march est actif lquilibre
concurrentiel.
Dans le cas contraire (c < c), on a en eet :
Q
+
c
= 0
et :
j
+
c
[c, c]
(cf g 4).
10 7.5 5 2.5 0
5
3.75
2.5
1.25
0
Q
p
Q
p
g 4 Lquilibre concurrentiel II (c c)
57
3.1.3 Lquilibre de monopole
Si les rmes sont 2 tablissements dune seule et mme entreprise, on a :
max
q1;q2
(
1
,
2
) =
1
(
1
,
2
) +
2
(
1
+
2
)
= j
1
C
1
(
1
) + j
2
C
2
(
2
)
= /(
1
+
2
)
1
c
1
+ /(
1
+
2
)
2
c
2
= [c (
1
+
2
) c]
1
+ [c (
1
+
2
) c]
2
Condition du Premier Ordre :
_

_
0
0
1
=
0
1
0
1
+
0
2
0
1
= c
2
c 2
1

2
= 0
0
0
2
=
0
1
0
2
+
0
2
0
2
=
1
+ c
1
c 2
2
= 0
soit encore :
_
_
_
2
1
+ 2
2
= c c
2
1
+ 2
2
= c c
Conclusion
Tous les couples (
1
,
2
) tels que :

1
+
2
=
c c
2
=
+
m
sont solutions du problme.
58
En cet quilibre :
j
+
m
= c
+
m
= c
c c
2
=
c + c
2

+
m
= (j
+
m
c)
+
m
=
_
c + c
2
c
_

c c
2
= (
+
m
)
2
o
m
= (c j
m
)

+
m
2
=
_
c
c + c
2
_


+
m
2
=
(
+
m
)
2
2
De plus :
Les fonctions de cot tant linaires et symtriques, la rpartition de
la production de monopole entre les deux tablissements est indter-
mine.
10 7.5 5 2.5 0
10
5
0
-5
-10
Q
p
Q
p
g 5 : Eq Monopole (
1
+
2
=
c
2
)
59
3.2 Le duopole de Cournot (duopole en quantit)
Rappel Dans ce cas de gure, les rmes slectionnent les quantits et le prix
est x par un commissaire priseur de faon galiser la demande lore.
3.2.1 La forme normale
On a :
(1) Ensemble des joueurs :
= 1, 2
(2) Ensemble des actions possibles :
o
1
= o
2
= R
+
ie nimporte quel niveau de production est a priori possible ;
(3) Fonctions de rglement ???
En ce qui concerne le joueur 1 :

1
(
1
,
2
) = j
1
C
1
(
1
)
= /(
1
+
2
)
1
C(
1
)
= [c (
1
+
2
)]
1
c
1
(17)
= (c c
2
)
1

2
1
et le joueur 2 (par symtrie) :

2
(
1
,
2
) = (c c
1
)
2

2
2
(18)
Remarque Si
1
+
2
c, il ny a pas dquilibre possible entre lore et la
demande. Dans ce cas de gure, le commissaire priseur est suppos minimiser
lexcs dore en xant un prix nul et lcriture correcte du prot est une fonction
dnie par morceaux de la forme :

1
(
1
,
2
) =
_
_
_
(c c
2
)
1

2
1
:i
1
_ c
2
c
1
:i
1
_ c
2
60
3.2.2 Calcul de lquilibre de Nash
Il sagit de trouver le couple de productions (
+
1
,
+
2
) en lequel :
_

1
(
+
1
,
+
2
) _
1
(
1
,
+
2
), \
1
o
1

2
(
+
1
,
+
2
) _
2
(
+
1
,
2
), \
2
o
2
soit encore tel que :
_

+
1
= c
1
(
+
2
)

+
2
= c
2
(
+
1
)
(19)
avec c
i
() la meilleure rponse du joueur i, i = 1, 2.
Le point
Dterminer lquilibre de Nash revient rsoudre le systme (19)
avec des meilleures rponses c
1
() et c
2
() quil reste calculer.
61
Calcul de la meilleure rponse de la rme 1
On cherche, pour toute production
2
mise sur le march par la rme
2, la production
+
1
qui maximise le prot de la rme 1.
ie :
Quelle est la production optimale de la rme 1 lorsque la rme 2
produit
2
?
Le problme rsoudre scrit :
max
q10

1
(
1
,
2
) = (c c
2
)
1

2
1
(20)
Conditions du premier et du second ordre :
0
1
0
1
= c c
2
2
1
= 0
0
2

1
0
2
1
= 2 < 0
Conclusion :
La fonction de prot
1
() est concave en
1
, la condition du premier
ordre est ncessaire et susante pour un maximum global et lon a :

+
1
= c
1
(
2
) =
c c
2


2
2
(21)
(pour une solution intrieure).
62
Calcul de la meilleure rponse de la rme 2
Connaissant la meilleure rponse de la rme 1 :

+
1
= c
1
(
2
) =
c c
2


2
2
on dtermine la meilleure rponse de la rme 2 par symtrie. Il vient :

+
2
= c
2
(
1
) =
c c
2


1
2
(22)
Justication Le calcul de la meilleure rponse de la rme 2 requiert de r-
soudre:
max
q20

2
(
1
,
2
) = (c c
1
)
2

2
2
(23)
ce qui est comparer avec le problme de la rme 1 :
max
q10

1
(
1
,
2
) = (c c
2
)
1

2
1
Le point :
Les deux problmes sont, une permutation dindice prs, iden-
tiques.
Conclusion :
Ils admettent, une permutation dindice prs, la mme solution.
C/s :
Il sut pour calculer la meilleure rponse de la rme 2 de permuter
les indices 1 et 2 dans la meilleure rponse de la rme 1.
63
Dtermination de lquilibre de Nash En considrant que les deux rmes
sont actives lquilibre (
+
1
0,
+
2
0), il sagit de rsoudre le systme :
_

1
= c
1
(
2
) =
c c
2


2
2

2
= c
2
(
1
) =
c c
2


1
2
On trouve :

+
1
=
+
2
=
c c
3
On en dduit :
(1) la production globale :
Q
+
=
+
1
+
+
2
=
2 (c c)
3
(2) le prix :
j
+
= c Q
+
= c
2 (c c)
3
=
c + 2c
3
(3) les prots :

+
i
= (j
+
c)
+
i
=
_
c + 2c
3
c
_

c c
3
=
(c c)
2
9
= (
+
i
)
2
(4) le surplus des consommateurs :
o
+
= (c j
+
)
Q
+
2
=
_
c
c + 2c
3
_

2 (c c)
3

1
2
=
(Q
+
)
2
2
64
Reprsentation graphique (MR1 en rouge, MR2 en vert)
5 3.75 2.5 1.25 0
5
3.75
2.5
1.25
0
q1
q2
q1
q2
g 7 : quilibre de Cournot-Nash
Remarque En ce qui concerne la MR de la rme 2 :
c
2
(
1
) =
c c
2


1
2
on a :
c
2
(0) =
c c
2
c
2
(c c) = 0
ie :
si la production de la rme 1 est nulle, la rme 2 met la production de
monopole ;
la rme 2 ne produit pas si la rme 1 met sur le march la quantit
concurrentielle (globale).
65
De plus, question : Pourquoi
+
2
= c
2
(
1
) dcrot avec
1
?
Expression du CA :
C
2
(
1
,
2
) = (c
1

2
)
2
Calcul du CA marginal :
C:
2
= c
1
2
2
Calcul du cot marginal :
C
t
2
(
2
) = c
Condition doptimalit :
c
1
2
2
= c
Impact de
1
sur le CA marginal de la rme 2 :
0C:
2
0
1
=
0
2
C
2
0
1
0
2
= 1 < 0
C/s : la production optimale
+
2
baisse avec
1
!
8 6 4 2 0
10
5
0
-5
-10
q2
CAm2, c
q2
CAm2, c
g : impact de
1
sur
+
2
= c(
1
)
66
3.2.3 Proprits (2)
(1) Lquilibre de Cournot-Nash dcrit une situation intermdiaire, en termes
de rsultat, entre lquilibre de monopole et lquilibre concurrentiel.
Rappel
A lquilibre concurrentiel :
Q
+
c
= c c
A lquilibre de monopole :
Q
+
m
=
c c
2
=
Q
+
c
2
A lquilibre de Cournot :
Q
+
dc
=
2
3
(c c) =
2Q
+
c
3
C/s Se situant sur la fonction de demande :
o
c
o
dc
o
m
Voir ci-dessous.
10 7.5 5 2.5 0
10
7.5
5
2.5
0
quantite
prix
quantite
prix
g 8 : E de Monopole, E crtl, E Cournot
67
(2) Lquilibre de Nash (
+
1
,
+
2
) = (c c,3, c c,3) nest pas optimal au sens
de Pareto (au sens priv du terme, cest--dire du seul point de vue
des joueurs).
Preuve Si chaque entreprise produit la moiti de la production de monopole :

1
=
2
=

m
2
=
c c
4
on a :
j = c
_

m
2
+

m
2
_
= c
m
= c
c c
2
=
c + c
2
= j
m
et :

1
(
c c
4
,
c c
4
) = (j
m
c)

m
2
=
_
c + c
2
c
_

1
2
c c
2
=
(c c)
2
8
=
2
(
c c
4
,
c c
4
)
avec de plus :

i
(
c c
4
,
c c
4
) =
(c c)
2
8

+
i
=
i
(
c c
3
,
c c
3
) =
(c c)
2
9
pour i = 1, 2.
Conclusion :
Rduire les productions individuelles en les faisant passer de cc,3
cc,4 permet daugmenter les prots des deux rmes la fois et
cet quilibre de Nash nest pas optimal au sens de Pareto !
Remarque Dans le cadre dun jeu rpt (cf chapitre 5), les rmes peuvent,
sous certaines conditions, russir se coordonner sur lquilibre de monopole.
68
3.2.4 Gnralisation (n-oligopole)
Notant :
Q
i
=
n

j=1;j,=i

j
la production totale mise sur le march par les rmes autres que i et :

i
= (
1
, . . . ,
i1
,
i+1
, . . . ,
n
)
le vecteur des stratgies des joueurs autres que i, la fonction de prot scrit :

i
(
i
,
i
) = /(Q)
i
C
i
(
i
) = /(
i
+ Q
i
)
i
c
i
= (c
i
Q
i
)
i
c
i
= (c c Q
i
)
i

2
i
A partir de la condition du premier ordre :
0
i
0
i
= c c Q
i
2
i
= 0
on tire la meilleure rponse de la rme i :

+
i
= c
i
(
i
) =
c c
2

Q
i
2
=
c c
2


1
+ . . . +
i1
+
i+1
+ . . . +
n
2
et lon rsoud en
1
,
2
, . . .,
n
le systme dquations (linaires) :
_

1
=
c c
2

Q
1
2
=
c c
2


2
+
3
+ . . . +
n
2

2
=
c c
2

Q
2
2
=
c c
2


1
+
3
+ . . . +
n
2
.
.
.

n
=
c c
2

Q
n
2
=
c c
2


1
+
2
+ . . . +
n1
2
69
A ces ns :
(1) on montre que lquilibre de Nash est symtrique en faisant :
_


1
2
=
c c
2

Q
1
2


1
2


2
2
=
c c
2

Q
2
2


2
2
.
.
.


n
2
=
c c
2

Q
n
2


n
2
=
_

1
2
=
c c
2

Q
2

2
2
=
c c
2

Q
2
.
.
.

n
2
=
c c
2

Q
2
=
_

1
= c c Q

2
= c c Q
.
.
.

n
= c c Q
ie on a :

1
=
2
. . . =
n
=
lquilibre de Nash.
(2) On poursuit ce calcul pour obtenir :
= c c Q
= = c c :
=
+
=
c c
1 + :
Puis
(3) Calcul de la production globale, du prix et des prots :
Q
+
= :
+
=
: (c c)
1 + :
j
+
= c Q
+
= c
: (c c)
1 + :
=
c + :c
1 + :

+
i
= (j
+
c)
+
=
_
c + :c
1 + :
c
_

c c
1 + :
=
_
c c
1 + :
_
2
= (
+
)
2
70
Proprit 1 Lquilibre nest pas optimal au sens de Pareto (au sens priv du
terme).
Preuve Si les : rmes se coordonnent sur la production de monopole en jouant
chacune :

i
=

m
:
=
c c
2:
on a :

i
(

m
:
, . . .

m
:
) = (j
m
c)

m
:
=
_
c + c
2
c
_

c c
2:
=
(c c)
2
4:
avec :

+
i
= (
+
, . . . ,
+
) <
i
(

m
:
, . . . ,

m
:
)
=
_
c c
1 + :
_
2
<
(c c)
2
4:
= (: 1)
2
0
ce qui est vrai.
Proprit 2 Lquilibre tend avec : vers lquilibre concurrentiel.
En particulier :
lim
n+o
Q
+
= lim
n+o
: (c c)
1 + :
= lim
n+o
c c
1
n
+ 1
= c c
lim
n+o
j
+
= c lim
n+o
Q
+
= c
lim
n+o

+
i
= lim
n+o
_
c c
1 + :
_
2
= 0
(voir gure 9).
71
10 7.5 5 2.5 0
10
7.5
5
2.5
0
quantite
prix
quantite
prix
g 8 : E de Monopole, E crtl, E Cournot
72
10 7.5 5 2.5 0
10
7.5
5
2.5
0
quantite
prix
quantite
prix
g 9 : Evolution de lEquilibre de Cournot avec :
73
3.3 Le duopole de Bertrand (duopole en prix)
Le point de dpart :
Dans le cas du monopole, il est quivalent de raisonner en termes de
prix ou en termes de quantit.
et :
De mme lquilibre concurrentiel lorsque lon sintresse la sta-
bilit de lquilibre (ajustement par les prix ou par les quantits,
hormis le cas des biens de Gien pour lesquels il peut y avoir des
problmes).
Ce que lon va alors voir maintenant est que cette quivalence ne tient plus dans
le cas dun duopole, plus gnralement, dans le cas dun oligopole.
Par la suite, Hypothse :
On modie le cadre thorique en considrant que les rmes dcident
de leurs prix de vente.
ie contrairement au duopole de Cournot, les rmes se font concurrence en prix
(ie les variables stratgiques sont les prix et non pas les quantits).
Puis, Exemple :
= 2 agences bancaires qui vendent un crdit immobilier ;
= mise en vidence dun quilibre.
Conclusion :
Cet exemple laisse penser que le prol (j
1
, j
2
) = (c, c) est en quili-
bre de Nash !
74
Preuve On a :

1
(c, c) = (c c)
d
1
(c, c) = 0
avec
d
1
(j
1
, j
2
) la fonction de demande qui sadresse la rme 1.
De plus :
(1) Si j
1
j
2
= c, personne ne vient acheter chez 1 et :

1
(j
1
, c) = (j
1
c) 0 = 0 :i j
1
c
(2) Si j
1
< j
2
= c, tout le monde vient acheter chez 1 qui vend alors perte
et :

1
(j
1
, c) = (j
1
c)
d
1
(j
1
, c) < 0 :i j
1
< c
Conclusion :

1
(c, c) _
1
(j
1
, c) \j
1
o
1
= R
+
auquel cas :
c c
1
(c) = [c, +[
ie vendre prix cotant est une meilleure rponse du joueur 1 la stratgie
j
2
= c du joueur 2.
De la mme faon :
c c
2
(c) = [c, +[
ie il en va de mme pour le joueur 2 et le prol de stratgies :
(j
1
, j
2
) = (c, c)
est bien en quilibre de Nash.
75
Toutefois, question :
Lquilibre de Nash ainsi identi est-il le seul quilibre du jeu ?
Le point :
Pour pouvoir rpondre, il convient dtudier de faon complte le
problme, en dterminant notamment les meilleures rponse des joueurs.
La forme normale
Ensemble des joueurs :
= 1, 2
Ensembles de stratgies :
o
1
= o
2
= R
+
Fonctions de rglement ???
On a en ce qui concerne le joueur 1 (mutatis mutandis le joueur 2) :

1
(j
1
, j
2
) = [j
1
c]
d
1
(j
1
, j
2
)
avec :

d
1
(j
1
, j
2
) =
_

_
0 :i j
1
j
2
1
2
(c j
1
) :i j
1
= j
2
c j
1
:i j
1
< j
2
(24)
la fonction de demande qui sadresse la rme 1.
Remarque En considrant que j
2
< c (ie la rme 2 est potentiellement active).
Justication :
Ayant faire un mme bien, les consommateurs se fournissent
auprs de la rme qui pratique le prix le plus bas.
76
Reprsentation graphique
100 75 50 25 0
100
75
50
25
0
q
D1 (p1,p2)
q
D1 (p1,p2)
g 10 : graphe de
d
1
(j
1
, j
0
2
)
77
Le point :
La fonction de demande qui sadresse la rme 1 tant dnie par
morceaux, il en va de mme pour la fonction de prot :

1
(j
1
, j
2
) =
_

_
0 :i j
1
j
2
(j
1
c) (c j
1
)
2
:i j
1
= j
2
(j
1
c) (c j
1
) :i j
1
< j
2
(25)
ce que lon peut encore mettre sous la forme :

1
(j
1
, j
2
) =
_

_
0 :i j
1
j
2
)(j
1
)
2
:i j
1
= j
2
)(j
1
) :i j
1
< j
2
avec :
)(j
1
) = (j
1
c) (c j
1
)
le prot de lentreprise 1 en situation de monopole exprim en fonc-
tion du seul prix de vente j
1
.
78
Etude de la fonction )(j
1
) On a :
)(j
1
) = (j
1
c) (c j
1
)
= cj
1
+ cj
1
j
2
1
cc
et :
)
t
(j
1
) = c + c 2j
1
= 0
= j
+
1
=
c + c
2
avec de plus :
)(0) = cc
)(c) = 0
)(c) = 0
Voir ci-dessous.
100 75 50 25 0
2000
1500
1000
500
0
-500
-1000
prix
f(p)
prix
f(p)
g 11 : graphe de )(j
1
)
79
Dtermination de la meilleure rponse du joueur 1
Le point :
Compte tenu de la discontinuit de la fonction de prot, on doit
distinguer plusieurs cas selon les valeurs pris par j
2
.
(1) Le prix pratiqu par la rme 2 (j
2
) est suprieur la tarication de mono-
pole j
m
= c + c,2.
On a alors :
c
1
(j
2
) =
c + c
2
cf g 12-a.
Commentaires Dans ce cas de gure, la rme 1 est en mesure de charger le prix
de monopole, ce qui est alors et de faon vidente la stratgie optimale.
100 75 50 25 0
2000
1500
1000
500
0
-500
-1000
p1
Profit 1
p1
Profit 1
g 12-a : graphe de
1
(j
1
, j
2
), j
2
j
m
80
(2) Le prix pratiqu par la rme 2 est infrieur j
m
mais suprieur (stricte-
ment) au cot moyen de production c.
On a alors :
c
1
(j
2
) = j
2
-
cf g 12-b.
100 75 50 25 0
2000
1500
1000
500
0
-500
-1000
p1
Profit 1
p1
Profit 1
g 12-b : graphe de
1
(j
1
, j
2
), c < j
2
< j
m
Commentaires
= Dans ce cas de gure, la meilleure rponse de la rme 1 consiste se
rapprocher le plus possible de la tarication de monopole tout en restant
moins cher que la rme 2, de faon capter lintgralit de la demande.
En particulier :
= Partant dune situation o j
1
= j
2
, une rduction du prix de vente j
1
permet un accroissement des ventes qui fait plus que compenser la perte
li la baisse de la marge par unit produite.
81
(3) Le prix pratiqu par la rme 2 est (prcisment) gal c.
On a alors :
c
1
(c) = [c, +[
cf g 12-c.
100 75 50 25 0
2000
1500
1000
500
0
-500
-1000
p1
Profit 1
p1
Profit 1
g 12-c : graphe de
1
(j
1
, j
2
), c = j
2
Commentaires
Dans ce cas de gure, la rme 1 ralise un prot nul :
si elle vend plus cher que son concurrent (personne ne vient alors
acheter chez elle),
si elle vend au mme prix que son concurrent (elle vend alors prix
cotant).
Dautre part, vendre moins cher que son concurrent lui permet de capter
toute la demande mais elle vend alors perte.
C/s :
la maximisation du prot sopre en nimporte quel niveau de prix suprieur
ou gal c.
82
(4) Le prix pratiqu par la rme 2 est infrieur (strictement) c.
On a alors :
c
1
(j
2
) = ]j
2
, +[
cf g 12-d.
100 75 50 25 0
2000
1500
1000
500
0
-500
-1000
p1
Profit 1
p1
Profit 1
g 12-d : graphe de
1
(j
1
, j
2
), j
2
< c
Commentaires
Dans ce cas de gure, il est optimal de ne pas vendre, ce qui requiert de
pratiquer un prix plus lev que son concurrent.
C/s :
nimporte quel prix strictement suprieur celui pratiqu par la rme 2
est optimal.
83
Conclusion Combinant ces lments, la meilleure rponse de la rme 1 vrie:
c
1
(j
2
) =
_

_
c + c
2
:i j
2

c + c
2
j
2
- :i c < j
2
_
c + c
2
[c, +[ :i j
2
= c
]j
2
, +[ :i 0 _ j
2
< c
et calcul de la meilleure rponse de la rme 2 (par symtrie) :
c
2
(j
1
) =
_

_
c + c
2
:i j
1

c + c
2
j
1
- :i c < j
1
_
c + c
2
[c, +[ :i j
1
= c
]j
1
, +[ :i 0 _ j
1
< c
84
Reprsentation de la meilleure rponse de la rme 1 :
c
1
(j
2
) =
_

_
c + c
2
:i j
2

c + c
2
j
2
- :i c < j
2
_
c + c
2
[c, +[ :i j
2
= c
]j
2
, +[ :i 0 _ j
2
< c
75 62.5 50 37.5 25 12.5 0
75
62.5
50
37.5
25
12.5
0
p1
p2
p1
p2
g 13 : meilleure rponse de la rme 1 c
1
(j
2
)
85
Calcul de lquilibre de Nash
Aprs reprsention des meilleures rponses, on constate quelles se coupent en
un point unique :
|c jro)i| (c, c)
A lquilibre de Nash, cet quilibre tant bien le seul, les rmes vendent donc
prix cotant auquel cas elles peroivent des prots nuls :

1
(c, c) = (c c)
c c
2
= 0 =
2
(c, c)
75 62.5 50 37.5 25 12.5 0
75
62.5
50
37.5
25
12.5
0
p1
p2
p1
p2
g 14 : lquilibre de Nash / Duopole en prix
86
Proprits de lquilibre de Bertrand
(1) Cet quilibre nest pas optimal au sens de Pareto ;
On a en particulier :

1
(j
m
, j
m
) =
1
(
c + c
2
,
c + c
2
)
=
_
c + c
2
c
_

1
2

c c
2
=
(c c)
2
8
=
2
(j
m
, j
m
)
0
(2) Il sut de : = 2 rmes pour restaurer lquilibre concurrentiel.
87
4 Existence et multiplicit de lquilibre de Nash
4.1 Lexistence de lquilibre
Exemple The matching pennies :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
(26)
Remarques
(1) Ce jeu est somme nulle.
(2) Son quivalent franais est pierre, feuille, ciseaux.
(3) Il nadmet pas dquilibre de Nash (en stratgies pures).
Comme le souligne Gibbons [1992],
Une caractristique de ce jeu est que chacun aimerait induire lautre
en erreur.
Une proprit de mme nature fait jour aux dames, au poker, au
football avec lexercice des penalty, dans les batailles militaires . . . .
Dans de telles situations, lorsque gagner requiert que ladversaire se
trompe sur ce que lon compte jouer, il ne saurait y avoir dquilibre
de Nash (en stratgies pures).
Rappel :
Un quilibre de Nash est un quilibre en actions et en anticipations.
Exemple 2 Les tirs au but.
88
Question :
Que faire ?
Rponse :
Permettre aux joueurs dutiliser des stratgies mixtes, cest--dire de
jouer de manire alatoire (ie au hasard).
Application Si lon retourne au matching pennies :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
on note :
j la probabilit que le joueur 1 joue pile (la probabilit quil joue face est
donc 1 j) ;
la probabilit que le joueur 2 joue pile (la probabilit quil joue face est
donc 1 ).
Par la suite, si les joueurs jouent au hasard selon les stratgies mixtes :
o
1
= (j, 1 j)
o
2
= (, 1 )
(1) le rsultat du jeu est alatoire
(2) Il en va de mme pour les rglements des joueurs.
89
(rappel) Le jeu du matching pennies :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
avec :
j la probabilit que le joueur 1 joue pile ;
la probabilit que le joueur 2 joue pile.
On a en ce qui concerne le rglement du joueur 1 :
n
1
=
_
_
_
n
1
(ji|c, ji|c) n
1
(ji|c, )acc) n
1
()acc, ji|c) n
1
()acc, )acc)
j j (1 ) (1 j) (1 j) (1 )
=
_
_
_
1 1 1 1
j j (1 ) (1 j) (1 j) (1 )
=
_
_
_
1 1
j (1 ) + (1 j) j + (1 j) (1 )
90
(Rappel) Le jeu du matching pennies :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
et :
n
1
=
_
_
_
1 1
j (1 ) + (1 j) j + (1 j) (1 )
Par la suite, hypothse :
Les joueurs sont neutres lgard du risque,
auquel cas :
Les prfrences sur les loteries peuvent tre reprsentes par le critre
du gain espr.
La fonction de rglement du joueur 1 est alors donne par :
l( n
1
) = 1 [ n
1
]
= [j (1 ) + (1 j) ] (1) + [j + (1 j) (1 )] 1
= 4j 2j 2 + 1
= \
1
(j, )
Remarque Les rglements espres peuvent galement se calculer partir de
la bi-matrice (26) :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
en faisant en ce qui concerne le joueur 1 :
1 [ n
1
] = j 1 + j (1 ) (1) + (1 j) (1) + (1 j) (1 ) 1
= 4j 2j 2 + 1
et en ce qui concerne le joueur 2 . . .
91
. . . 2 faons de procder.
Mthode 1 Le jeu tant donn par :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
on fait (directement) :
1 [ n
2
] = j (1) + j (1 ) 1 + (1 j) 1 + (1 j) (1 ) (1)
= 4j + 2j + 2 1
Mthode 2 Le jeu tant somme nulle, on a :
n
2
=
_
_
_
1 1 1 1
j j (1 ) (1 j) (1 j) (1 )
=
_
_
_
1 1 1 1
j j (1 ) (1 j) (1 j) (1 )
= n
1
auquel cas :
1 [ n
2
] = 1 [ n
1
] = 1 [ n
1
]
= (4j 2j 2 + 1) = \
1
(j, )
= 4j + 2j + 2 1
= \
2
(j, )
92
Calcul de la meilleure rponse du joueur 1 (en stratgies mixtes)
On rsoud le programme :
max
p
\
1
(j, ) = 4j 2j 2 + 1
sous les contraintes :
0 _ j _ 1
car j est une probabilit.
Rsolution Comme :
0\
1
0j
= 4 2 = 4
_

1
2
_
_ 0
= _
1
2
on a :
j
+
= j
+
() =
_

_
0 :i 0 _ < 1,2
[0, 1] :i = 1,2
1 :i 1,2 < _ 1
(27)
Interprtation de la stratgie
= sil est vraisemblable que 2 joue pile, 1 joue pile.
A linverse,
= sil est vraisemblable que 2 joue face, 1 joue face.
93
Calcul de la meilleure rponse du joueur 2 (en stratgies mixtes)
On fait :
max
q[0;1]
\
2
(j, ) = 2j + 2 4j 1
et :
0\
2
0
= 2 4j = 4
_
1
2
j
_
_ 0
=
1
2
_ j
do la meilleure rponse :

+
(j) =
_

_
1 :i 0 _ j < 1,2
[0, 1] :i j = 1,2
0 :i 1,2 < j _ 1
(28)
94
Calcul de lquilibre de Nash
Reprsentation des meilleures rponses
j
+
() =
_

_
0 :i 0 _ < 1,2
[0, 1] :i = 1,2
1 :i 1,2 < _ 1

+
(j) =
_

_
1 :i 0 _ j < 1,2
[0, 1] :i j = 1,2
0 :i 1,2 < j _ 1
1 0.75 0.5 0.25 0
1
0.75
0.5
0.25
0
p
q
p
q
g 15
Conclusion Lquilibre de Nash en stratgies mixtes est donn par :
(j, ) = (1,2, 1,2)
ie :
A lquilibre, chacun joue pile avec une probabilit de 1,2 et face
avec la probabilit complmentaire, soit nouveau 1,2.
95
Commentaires
(1) Supposer que les joueurs jouent de manire alatoire est surprenant mais
on ne perd rien faire cette hypothse.
Motif :
Il gure parmi les stratgies mixtes (j, 1 j) du joueur 1 les strat-
gies mixtes dgnres (1, 0) et (0, 1) qui dcrivent des situations o
1 joue les stratgies pures pile et face.
C/s :
= permettre aux joueurs de jouer de manire alatoire, cest tendre leurs
ensembles de stratgies ;
= interdire aux joueurs de jouer de manire alatoire cest restreindre leurs
ensembles de stratgies et ce de manire arbitraire !
96
(2) Etant parvenu ici construire un quilibre de Nash en stratgies mixtes,
la question suivante est :
Y parviendra-t-on toujours ?
ie :
Existe-t-il des jeux qui nadmettent pas dquilibre de Nash, tant en
stratgies pures quen stratgies mixtes ?
Rponse (partielle)
Thorme dexistence de Nash [1950] Tout jeu ni admet au moins un
quilibre de Nash en stratgies mixtes.
(3) Pour nir, interprtation des stratgies mixtes . . .
97
Les stratgies mixtes dquilibre ont une signication concrte dans un cadre
rpt, lorsque lon joue plusieurs fois de suite au matching pennies :
pile face
pile 1
+
, 1 1, 1
+
face 1, 1
+
1
+
, 1
Exemple
1 joue dans un premier temps la stratgie mixte dquilibre (j
+
, 1 j
+
) =
(1,2, 1,2).
2 joue 2 fois sur 3 pile et 1 fois sur 3 face.
l sen rend compte et joue systmatiquement pile.
Le rsultat est 1 gagne 2 fois sur 3, 2 gagne 1 fois sur 3 et lon a en
esprance :
l
1
= :
_
2
3
n
1
(ji|c, ji|c) +
1
3
n
1
(ji|c, )acc)
_
= :
_
2
3
1 +
1
3
(1)
_
= : \
1
(j
+
(2,3), 2,3) = : \
1
(1, 2,3)
=
:
3
et :
l
2
= :
_
2
3
n
2
(ji|c, ji|c) +
1
3
n
2
(ji|c, )acc)
_
= :
_
2
3
(1) +
1
3
1
_
= : \
2
(j
+
(2,3), 2,3) = : \
2
(1, 2,3)
=
:
3
avec : le nombre de parties. La stratgie du joueur 2 apparat ainsi comme une
stratgie perdante.
98
4.2 La multiplicit des quilibres
. . .
99