Vous êtes sur la page 1sur 7

Chapitre 3 (suite) : Equilibre de Nash

1. Introduction
L’équilibre en stratégies dominantes et la rationalisabilité sont des concepts de solutions bien
fondés. Si les joueurs sont rationnels et ils sont prudents dans la mesure où ils attribuent une
probabilité positive à chacune des stratégies des autres joueurs, on s’attendrait alors à ce que
les joueurs jouent selon l’équilibre en stratégies dominantes quand un tel équilibre existe. De
l’autre côté, la rationalisabilité décrit exactement ce qui est impliqué par la définition du jeu
(connue par la connaissance commune de la rationalité). S’il est connaissance commune que
les joueurs sont rationnels (i.e., ils maximisent la valeur espérée de leur fonction d’utilité),
chaque joueur doit donc jouer une stratégie rationalisable. De plus, chaque stratégie
rationalisable peut être rationalisable dans le sens que ce joueur peut jouer cette stratégie et
croît aussi qu’il est connaissance commune que les joueurs sont rationnels. Malheureusement,
ces concepts de solutions ne sont pas utiles dans la plupart des situations économiques. A
l’exception des jeux qui sont spécialement conçus comme l’enchère de Vickrey (enchère au
second prix), il n’y a souvent pas d’équilibres en stratégies dominantes. L’ensemble des
stratégies rationalisables tend à être large dans les jeux analysés en économie. Dans ce cas on
peut seulement faires des prédictions faibles sur les issues des jeux quand on utilise la
rationalisabilité.
Ce chapitre introduit un nouveau concept de solution, notamment l’équilibre de Nash. Il
suppose que les joueurs devinent correctement les stratégies des autres joueurs. Cette
hypothèse pourrait être raisonnable quand il y a une longue interaction qui mène les joueurs à
former des opinions sur comment les joueurs jouent. Il pourrait aussi être raisonnable quand il
y a une convention sociale adhérée par les joueurs.
Pour définir l’équilibre de Nash, considérons le jeu de la bataille des sexes :
Alice\Bob opéra (o) football (f)
opéra (o) (4,1) (0,0)
football (f) (0,0) (1,4)

Dans ce jeu il n’y a pas de stratégie dominante, et toutes les stratégies sont rationalisables.
Supposons qu’Alice joue opéra (o), alors la meilleure chose que Bob peut faire est de jouer
opéra (o) aussi. Ainsi opéra est une meilleure réponse pour Bob quand Alice joue opéra.
D’une manière similaire, opéra est une meilleure réponse pour Alice quand Bob joue opéra.
Ainsi, au niveau de l’issue (opéra, opéra), aucun joueur ne voudrait prendre une autre action.
Cette issue est un équilibre de Nash.
Pour formaliser cette idée dans le cas général, rappelons que pour tout joueur i, une stratégie
𝑠𝑖𝐵𝑅 est une meilleure réponse à 𝑠−𝑖 si et seulement si
𝑢𝑖 (𝑠𝑖𝐵𝑅 , 𝑠−𝑖 ) ≥ 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ), ∀ 𝑠𝑖 ∈ 𝑆𝑖
Rappelons aussi que la définition d’une meilleure réponse diffère de celle d’une stratégie
dominante en exigeant l’inégalité ci-dessous seulement pour une stratégie spécifique 𝑠−𝑖 au
lieu de l’exiger pour tout 𝑠−𝑖 ∈ 𝑆−𝑖 .
Si l’inégalité était vraie pour tout 𝑠−𝑖 , alors 𝑠𝑖𝐵𝑅 serait une stratégie dominante, qui est une
exigence plus forte que d’être une meilleure réponse à une certaine stratégie 𝑠−𝑖 .
Définition 1 : Un profil de stratégies 𝑠 ∗ = (𝑠1∗ , 𝑠2∗ , … , 𝑠𝑛∗ ) est un équilibre de Nash si et
seulement si 𝑠𝑖∗ est une meilleure réponse à 𝑠−𝑖∗ ∗
= (𝑠1∗ , 𝑠2∗ , … , 𝑠𝑖−1 ∗
, 𝑠𝑖+1 … , 𝑠𝑛∗ ) pour chaque
joueur 𝑖. Ainsi, pour tout 𝑖 on a :
𝑢𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) ≥ 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ), ∀ 𝑠𝑖 ∈ 𝑆𝑖
En d’autres termes, aucun joueur n’aurait intérêt à dévier s’il devine correctement les
stratégies des autres joueurs. Si l’on regarde un profil de stratégies comme une convention
sociale, alors être un équilibre de Nash est lié au fait d’être auto-exécutant (self-enforcing).
Ainsi, aucun joueur ne voudrait dévier quand il pense que les autres joueurs vont suivre la
convention.
Par exemple dans le jeu de la bataille des sexes (opéra, opéra) est un équilibre de Nash car :
𝑢𝐴𝑙𝑖𝑐𝑒 (𝑜𝑝é𝑟𝑎, 𝑜𝑝é𝑟𝑎) = 4 > 0 = 𝑢𝐴𝑙𝑖𝑐𝑒 (𝑓𝑜𝑜𝑡𝑏𝑎𝑙𝑙, 𝑜𝑝é𝑟𝑎)
Et
𝑢𝐵𝑜𝑏 (𝑜𝑝é𝑟𝑎, 𝑜𝑝é𝑟𝑎) = 1 > 0 = 𝑢𝐵𝑜𝑏 (𝑜𝑝é𝑟𝑎, 𝑓𝑜𝑜𝑡𝑏𝑎𝑙𝑙)
Egalement (football,football) est aussi un équilibre de Nash.
De l’autre coté (opéra, footaball) n’est pas un équilibre de Nash car Bob voudrait aller à opéra
plutôt que d’aller au match de football :

𝑢𝐵𝑜𝑏 (𝑜𝑝é𝑟𝑎, 𝑜𝑝é𝑟𝑎) = 1 > 0 = 𝑢𝐵𝑜𝑏 (𝑜𝑝é𝑟𝑎, 𝑓𝑜𝑜𝑡𝑏𝑎𝑙𝑙)

Définition 2 (meilleure réponse) : Dans un jeu à 𝑛 joueurs la fonction de meilleure réponse


du joueur 𝑖, noté φ𝑖 (𝑠−𝑖 ) associe à chaque combinaison de stratégies des autres joueurs, 𝑠−𝑖 ,
la stratégie du joueur 𝑖 qui maximise son gain, i.e.,
φ𝑖 : 𝑆−𝑖 = 𝑆1 × 𝑆2 … .× 𝑆𝑖−1 × 𝑆𝑖+1 × … × 𝑆𝑛 → 𝑆𝑖
Qui à 𝑠−𝑖 → φ𝑖 (𝑠−𝑖 ) qui maximise sur 𝑠−𝑖 , 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ). Ceci équivaut à dire que : ∀ 𝑠𝑖 ∈
𝑆𝑖 𝑒𝑡 𝑠−𝑖 ∈ 𝑆−𝑖 on a 𝑢𝑖 (φ𝑖 (𝑠−𝑖 ), 𝑠−𝑖 ) ≥ 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ).
Remarque 1 : La meilleure réponse de 𝑖 pourrait être une correspondance, c.à.d. φ𝑖 (𝑠−𝑖 ) est
un ensemble :
𝑎𝑟𝑔𝑚𝑎𝑥
φ𝑖 (𝑠−𝑖 ) = 𝑠𝑖 ∈𝑆𝑖 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ) = {𝑠𝑖 ∈ 𝑆𝑖 /𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ) ≥ 𝑢𝑖 (𝑠𝑖′ , 𝑠−𝑖 ), ∀ 𝑠𝑖′ ∈ 𝑆𝑖 }

Définition alternative de l’équilibre de Nash : Le profil de stratégies 𝑠 ∗ = (𝑠1∗ , 𝑠2∗ , … , 𝑠𝑛∗ )


est un équilibre de Nash si et seulement si 𝑠𝑖∗ est une meilleure réponse à 𝑠−𝑖

. Il s’n suit que
∗ ∗
𝑠𝑖 ∈ φ𝑖 (𝑠−𝑖 ) ∀𝑖 ∈ 𝑁.
Exemple : Soit le jeu sous forme normale dont les paiements sont représentés par la bi -
matrice suivante :
½ 𝐵1 𝐵2 𝐵3
𝐴1 (6,7) (9,6) (0,4)
𝐴2 (5,2) (8,2) (4,5)
𝐴3 (7,7) (7,8) (0,9)

Pour le joueur 1 on a :
φ1 (𝐵1 ) = 𝐴3
φ1 (𝐵2 ) = 𝐴1
φ1 (𝐵3 ) = 𝐴2
Pour le joueur 2 on a :
φ2 (𝐴1 ) = 𝐵1
φ2 (𝐴2 ) = 𝐵3
φ2 (𝐴3 ) = 𝐵3
Représentons les meilleures réponses des deux joueurs dans un tableau ou on représente la
meilleure réponse du joueur 1 par un cercle (O) et celle du joueur 2 par une croix (X) ;
L’intersection entre un (O) et une (X) est un équilibre de Nash.
½ 𝐵1 𝐵2 𝐵3
𝐴1 X O
𝐴2 O et X
𝐴3 O X

Ce jeu admet un seul équilibre de Nash en (𝐴2 , 𝐵3 ).


2. Relation entre l’équilibre de Nash et les autres concepts d’équilibres
i) Equilibre de Nash vs. Equilibre en stratégies dominantes :
Tout équilibre en stratégies dominantes est un équilibre de Nash, mais l’inverse n’est pas vrai.
Théorème 1 : Si 𝑠 ∗ = (𝑠1∗ , 𝑠2∗ , … , 𝑠𝑛∗ ) est un équilibre en stratégies dominantes, alors 𝑠 ∗ est un
équilibre de Nash.
Démonstration :
Soit 𝑠 ∗ un équilibre en stratégies. Pour tout joueur 𝑖, 𝑠𝑖∗ est une stratégie dominante et ainsi
pour 𝑠𝑖 donnée, on a
𝑢𝑖 (𝑠𝑖∗ , 𝑠−𝑖 ) ≥ 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ), ∀ 𝑠−𝑖 ∈ 𝑆−𝑖
Et en particulier
𝑢𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) ≥ 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ), ∀ 𝑠−𝑖 ∈ 𝑆−𝑖

Puisque 𝑖 et 𝑠𝑖 sont arbitraires, ceci montre que 𝑠 ∗ est un équilibre de Nash.


Pour voire que l’inverse n’est pas vrai, considérons le jeu de la bataille des sexes. Dans ce jeu
(opéra, opéra) et (football, football) sont des équilibres de Nash, mais aucun d’eux n’est un
équilibre en stratégies dominantes.
Example 1 : Considérons le jeu suivant :
½ A B
A (1,1) (0,0)
B (0,0) (0,0)

Dans ce jeu (a,a) est un équilibre en stratégies dominantes, mais (b, b) est aussi un équilibre
de Nash.
Tableau des meilleures réponses des deux joueurs :
½ A B
A O et X O
B X O et X

Ainsi (a,a) et (b, b) sont des équilibres de Nash.


Remarque 2 : (b, b) est un équilibre de Nash formé par des stratégies faiblement dominées.
Dans ce cas (ou les équilibres de Nash sont formés par des stratégies faiblement dominées),
on pourrait éliminer ces équilibres de Nash en éliminant ces stratégies faiblement dominées.
Certains pourraient trouver ce genre d’équilibre non raisonnable et ils voudraient bien les
éliminer. Les exemples qui suivent montrent que tous les équilibres de Nash pourraient bien
être formés par des stratégies faiblement dominées.
Example 2 : Dilemme du prisonnier
½ N D
N (-1,-1) (-10,0)
D (0,-10) (-8, -8)

La meilleure réponse du joueur 1 est :


φ1 (𝑁) = 𝐷
φ1 (𝐷) = 𝐷
Il s’en suit que D est une stratégie dominante pour le joueur 1.
La meilleure réponse du joueur 2 est :
φ2 (𝑁) = 𝐷
φ2 (𝐷) = 𝐷
Il s’en suit que D est une stratégie dominante pour le joueur 2.
Ainsi (D,D) est un équilibre en stratégies dominantes et c’est donc un équilibre de Nash. Par
contre l’issue (N,N) peut assurer aux deux joueurs un meilleur gain. (N,N) est un optimum de
Pareto : aucun joueur ne peut améliorer sa situation sans détériorer celle d’au moins un autre.
Voyant ça : Si le joueur 1 dévie unilatéralement vers D (alors que le joueur 2 continue à jouer
N), le joueur 1 améliore son gain qui passe de -1 à 0, mais le joueur 2 voit sa situation se
détériorer, son gain baisse de -1 à -10 ; La même chose se passe pour le joueur 2 s’il décide de
dévier unilatéralement de (N,N).
Dans ce jeu les deux joueurs gagnent en choisissant N plutôt que D. La situation (N,N) est
socialement préférée à (D,D). (N,N) est la situation ou les deux joueurs coopèrent et (D,D) est
la situation ou les deux joueurs poursuivent leurs intérêts personnels.
Le dilemme d prisonnier est une situation de dilemme social dans laquelle les intérêts
individuels s’opposent aux intérêts collectifs.
ii) Equilibre de Nash vs. Rationalisabilité :
Si une stratégie est jouée dans un équilibre de Nash, elle alors rationalisable, mais il pourrait y
avoir des stratégies rationalisables qui ne sont dans aucun équilibre de Nash.
Théorème 2 : Si 𝑠 ∗ = (𝑠1∗ , 𝑠2∗ , … , 𝑠𝑛∗ ) est un équilibre en stratégies dominantes, alors 𝑠𝑖∗ est
rationalisable pour chaque joueur 𝑖. L’inverse n’est pas toujours vrai. Il pourrait y avoir des
stratégies rationalisables qui ne sont pas jouées dans un équilibre de Nash.
Démonstration :
Il suffit de montrer que toutes les stratégies 𝑠1∗ , 𝑠2∗ , … 𝑒𝑡 𝑠𝑛∗ survivent à l’élimination itérée des
stratégies strictement dominées.
Exemple : Considérons le jeu suivant :
½ A B c
A (1,-2) (-2,1) (0,0)
B (-1,2) (1,-2) (0,0)
C (0,0) (0,0) (0,0)

Dans ce jeu aucune stratégie n’est strictement dominée par une autre. Toutes les stratégies
sont rationalisables. Vérifions s’il existe un ou plusieurs équilibres de Nash. On utilise les
meilleures réponses des deux joueurs :
½ A B c
A O X O
B O et X O
C X X O et X

Il existe deux équilibres de Nash, (c,c) et (b,a). Il s’en suit que la stratégie rationalisable
a pour le joueur 1 et que la stratégie rationalisable b pour le joueur 2 et ne sont pas jouées
dans un équilibre de Nash.
3. Equilibre de Nash en stratégies mixtes
Les définitions précédentes concernent seulement les stratégies pures. On peut définir
l’équilibre de Nash en stratégies mixtes en remplaçant les stratégies pures par les stratégies
mixtes. Encore une fois, étant donnée les stratégies mixtes des autres joueurs, chaque joueur
maximise son paiement espéré sur ses stratégies mixtes.
Définition 3 : Un profil de stratégies mixtes σ∗ = (σ1∗ , σ∗2 , … , σ∗𝑛 ) est un équilibre de Nash si
et seulement si pour chaque joueur 𝑖, σ∗𝑖 est une meilleure réponse à σ∗−𝑖 .
Pour tout 𝑖, si σ∗𝑖 (𝑠𝑖 ) > 0, alors 𝑠𝑖 est une meilleure réponse à σ∗−𝑖 . On a

∑ 𝒖𝒊 (𝑠𝑖 , 𝑠−𝑖 )σ∗−𝑖 (𝑠−𝑖 ) ≥ ∑ 𝒖𝒊 (𝑠𝑖′ , 𝑠−𝑖 )σ∗−𝑖 (𝑠−𝑖 )


𝑠−𝑖 𝑠−𝑖

∀ 𝑠𝑖 𝑎𝑣𝑒𝑐 σ∗𝑖 (𝑠𝑖 ) > 0, ∀ 𝑠𝑖′ 𝑜𝑢 σ∗−𝑖 (𝑠−𝑖 ) = (σ1∗ (𝑠1 ), . . , σ∗𝑖−1 (𝑠𝑖−1 ), σ∗𝑖+1 (𝑠𝑖+1 ), . . σ∗𝑛 (𝑠𝑛 ) )
Définition 4 : Une stratégie mixte est dite non dégénérée sil elle n’assigne pas une probabilité
égale à 1 à une des stratégies pures. Une stratégie est dite complétement mixte si 𝜎𝑖 (𝑠𝑖 ) >
0, ∀ 𝑠𝑖 ∈ 𝑆𝑖 .
Remarque 3 : La relation de dominance étudiée dans le cas des stratégies pures peut être
étendue aux stratégies mixtes. Ainsi, la stratégie pure 𝑠𝑖 est strictement dominée pour le
joueur 𝑖 s’il existe une stratégie mixte 𝜎𝑖 telle que ∀ 𝑠−𝑖 ∈ 𝑆−𝑖 , 𝑢𝑖 (𝜎𝑖 , 𝑠−𝑖 ) > 𝑢𝑖 (𝑠𝑖 , 𝑠−𝑖 ).
3.1. Calcul de l’équilibre de Nash en stratégies
Déterminez les équilibres de Nash en stratégies pures et mixtes du jeu suivant ;
Alice\Bob opéra (o) football (f)
opéra (o) (4,1) (0,0)
football (f) (0,0) (1,4)

Solution : Comme on l’a vu précédemment ce jeu admet deux équilibres de Nash en


stratégies pures, à savoir (opéra, opéra) et (football, football). Pour déterminez l’équilibre en
stratégie mixte, on propose la technique de l’indifférence.
Face à la stratégie mixte de Bob, 𝜎2 = (𝑞, 1 − 𝑞) Alice est indifférente entre jouer opéra ou
football.
Si Alice joue opéra, son utilité espérée est : 4𝑞 +0× (1 − 𝑞) = 4𝑞
Si Alice joue football, son utilité espérée est : 0 × 𝑞 +1× (1 − 𝑞) = (1 − 𝑞)
1
Alice serait indifférente entre jouer opéra ou football si : 4𝑞 = (1 − 𝑞) → 𝑞 ∗ = 5.

Face à la stratégie mixte d’Alice, 𝜎1 = (𝑝, 1 − 𝑝) Bob est indifférent entre jouer opéra ou
football.
Si Bob joue opéra, son utilité espérée est : 1 × 𝑝 +0× (1 − 𝑝) = 𝑝
Si Bob joue football, son utilité espérée est : 0 × 𝑝 +4× (1 − 𝑝) = 4(1 − 𝑃)
4
Bob serait indifférent entre jouer opéra ou football si : 𝑝 = 4(1 − 𝑝) → 𝑝∗ = 5.
Ainsi l’équilibre en stratégies mixtes est :
4 1 1 4
(𝜎1∗ = ( , ) , 𝜎2∗ = ( , ))
5 5 5 5
4 1
ou Alice joue opéra avec la probabilité 5 et joue football avec la probabilité 5 et Bob joue
1 4
opéra avec la probabilité 5 et joue football avec la probabilité 5.

Vous aimerez peut-être aussi