Vous êtes sur la page 1sur 42

Université Mohamed V

Faculté des sciences juridiques, économiques et sociales

Master : Analyse économique et Modélisation


Module : Microéconomie Avancée II

Théorie des jeux

Par T. Mounsif.

2020
Plan

I. Jeux statiques.

1. Jeux statiques avec information parfaite.

1.1. Représentation sous forme normale.


1.2. Action dominée.
1.3. L’issue d’un jeu.
1.4. Equilibre de Nash en actions pures.
1.5. Multiplicité des équilibres.
1.6. Les stratégies mixtes.
1.7. Equilibre de Nash en stratégies mixtes.
1.8. Application1 : le duopole de Cournot.

2. Jeux statiques avec information imparfaite.

2.1. Information incomplète et information imparfaite.


2.2. Equilibre Bayesien de Nash.
2.3. Application1 : le duopole de Cournot (suite).
2.4. Application2 : Les enchères.
2.5. Application3 : Bien public et information imparfaite.

I. Jeux dynamiques.

1. Jeux dynamiques avec information parfaite.

1.1. Représentation sous forme extensive.


1.2. L’issue d’un jeu dynamique.
1.3. Equilibre de Nash Parfait d’un jeu dynamique.
1.4. Exercices et applications.

2. Jeux dynamiques avec information imparfaite.

2.1. Ensembles d’information.


2.2. Les concepts de stratégies et de croyances.
2.3. La règle de Bayes.
2.4. Equilibre de Nash Bayesien Parfait.
2.5. Application : jeu de réputation à deux périodes.

2
INTRODUCTION

La théorie des jeux formalise des situations d’interactions stratégiques sous


forme de jeux et en étudie les issues possibles. Il existe deux grands types de
jeux : les jeux statiques et les jeux dynamiques.

I. Jeux statiques.

Dans beaucoup de jeux et de situations économiques ou politiques, les actions


sont simultanées. Les joueurs sont appelés à prendre chacun une décision, ou
jouer une action, sans connaître les actions des autres ; le résultat de chacun
dépend de sa décision-action et des décisions-actions des autres. Il existe deux
grands types de jeux statiques : les jeux statiques avec information parfaite et
ceux avec information imparfaite.

1. Jeux statiques avec information parfaite.

Un jeu est statique avec information parfaitesi les joueurs jouent une seule fois,
simultanément, en choisissant une action dans un ensemble d’actions possibles,
et si les joueurs connaissent les actions possibles de chacun et les gains associés
à chaque combinaison d’actions. Il peut être représenté sous une forme normale,
dite aussi stratégique.

1.1. Représentation sous forme normale.


La représentation d’un jeu statique sous forme normale spécifie l’ensemble des
joueurs, N, de cardinal n, l’ensemble des actions possiblespour un joueur i, noté

3
Ai et l’ensemble des ensembles d’actions ((Ai)iєN ) et spécifie enfin une fonction
d’utilité par joueur ((ui)iєN ). La fonction d’utilité d’un joueur est défini sur
l’ensemble des combinaisons des actions A : A ≡ XAi et iєN. Elle associe à
chaque combinaison d’actions (a=(a1, … , ai, …, an)) dans A, une valeur réelle
ui(a). Un jeu statique avec information complète peut alors être représenté
comme suit :
Γ = {N, ((Ai)iєN ), ((ui)iєN )}
Exemple1.
Suite à une faute d’un défenseur dans le carré des 18 mètres, l’arbitre siffle une
pénalité. Celui qui va tirer la pénalité a deux choix : tirer la balle à gauche ou à
droite du gardien du but. Le gardien du but a deux actions possibles : plonger à
droite ou plonger à gauche. Le gardien a le droit de bouger au moment où la
balle est tirée.
Cette situation peut être formalisée comme un jeu sous la forme normale
suivante, en notant le tireur par le joueur i et le gardien par le joueur j :
Γ = {N={i,j}; (Ai={d,g}, Aj={d,g}); (ui(,) , uj(,))}, avec ui(d, d) = ui(g, g) = -1 et
ui(d, g) = ui(g, d) = 1 ; uj(d, d) = uj(g, g) = 1 et uj(d, g) = uj(g, d) = -1.
Les jeux qui ressemblent au jeu précédent (le nombre des joueurs est 2 (ou 3) et
l’ensemble des actions n’est pas très grand) se représentent plus simplement
sous la forme d’un tableau. Ainsi, pour le jeu précédent, on a la représentation
suivante :

Joueur j (le gardien)


g d
g (-1, 1) (1, -1)
Joueur i (le tireur) d (1, -1) (-1, 1)

4
1.2. Action dominée.
Soit a - i = (a 1 , …, a 1- i , a 1+i, …, a n ) une combinaison des actions des autres
joueurs que i. Soient ai et ai’ deux actions possibles du joueur i. ai’ est une action
strictement dominée par ai si quelque soit a – i є A – i :
ui (ai, a - i) > ui (ai’, a - i) .
Il est évident qu’un joueur rationnel ne joue jamais une action strictement
dominée.

1.3. L’issue d’un jeu.


Les joueurs voudraient toujours savoir s’il existe une action
« gagnante ».Comme, le gain d’un joueur dépend des combinaisons des actions
de tous les joueurs, il faut, en évaluant le gain d’une action, anticiper les actions
des autres. L’issue d’un jeu statique est une combinaison a* = (a1*, …, ai*, …,
an*) dans laquelle l’action d’un joueur i maximise son gain, en supposant que les
actions des autres sont les meilleures pour eux et en supposant que les autres
supposent que l’action du joueur i maximise son gain, en supposant les autres
maximiser le leur, etc.
Dans l’exemple1, l’issue du jeu est incertaine. Le tireur ne sait pas où plongera
le gardien et le gardien ne sait pas ou partira la balle. En effet, tirer la balle à
droite est une bonne chose si le gardien plonge à gauche, ce n’est pas le cas s’il
plonge à droite et prend la balle. Nous vairons plus loin que souvent le tireur et
le gardien décident la droite ou la gauche en tirant à « pile » ou « face ».
Mais dans certains cas, l’issue du jeu est « prévisible ».
Exemple2.
Considérons la situation du « dilemme du prisonnier ». L’histoire raconte que
deux suspects sont arrêtés par la police parce qu’ils ont très probablement
commis ensemble un crime. La police, pensant qu’il n’y a de meilleure preuve
que l’aveu, a mis chaque suspect dans une cellule et lui a proposé le marché

5
suivant : si tu avoue le crime tu passeras une année si ton complice n’avoue pas
et lui dans ce cas passera 10 ans de prison et si ton complice avoue aussi, vous
passerez7 années de prison ; si tu n’avoue pas et ton complice avoue, tu passeras
10 de prison et lui une année ; si vous n’avouez pas, vous passerez 4 ans de
prison. La police informe chaque suspect que le même marché est offert au
complice. L’issue de ce jeu a beaucoup intéressé les théoriciens des jeux. Les
deux prisonniers avouent et passeront 7 ans de prison. Ils auraient pu passer
seulement 4 ans, en n’avouant pas ; mais ne pas avouer est une décision
strictement dominée. Le dilemme du prisonnier est connu pour montrer que
l’issue d’un jeu peut être prévisible et n’est pas forcément « efficace ». La même
histoire est utilisée pour analyser certaines situations économiques ou politiques.
On raconte alors que deux organisations décident simultanément de coopérer (c)
ou ne pas coopérer (nc). Cette situation se représente par le jeu suivant :
Γ = {N={1, 2} ; (A1={c, nc}, A2={c, nc}) ; (u1(, ) , u2(, ))},avec la matrice des
gains suivante :
Joueur 2
c Nc
c (2, 2) (-3, 3)
Joueur 1 nc (3, -3) (-2, -2)

Dans cet exemple, l’issue du jeu est prévisible. Le joueur 1 fera le raisonnement
suivant, si le joueur 2 joue c, ma meilleure action est nc (gain de 3 supérieur au
gain de 2, résultat de l’action c) et si le joueur 2 joue nc, ma meilleure action est
encore nc (perte de 2 plutôt que perte de 3, résultat de l’action c). L’action c est
dominée strictement par nc. Le joueur 1 joue donc nc, le joueur 2 joue aussi nc,
pour la même raison. L’issue de ce jeu est donc (nc,nc) ; chacun perd 2 alors
qu’ils auraient pu gagner chacun 2.

6
1.4. Equilibre de Nash en actions pures.
Définition.
Soit un jeu Γ = {N, ((Ai)iєN ), ((ui)iєN )}. a* = (a1*, … , ai*, …, an*) est un équilibre
de Nash si et seulement si : pour tout i є N, pour toute action aiє Ai :
ui (ai*, a – i*) ≥ ui (ai, a – i*).
L’équilibre de Nash est l’issue la plus probable quand les joueurs sont rationnels
et « intelligents ». Il est l’issue que les joueurs anticipent et réalisent.
Exemple3.
Deux entreprises en relation d’affaire ont une possibilité d’investissement pour
améliorer la qualité d’un produit. Chaque entreprise a donc deux actions
possibles : investir (I) ou ne pas investir (NI). Pour que l’investissement soit
rentable, il faut qu’il soit réalisé par les deux entreprises. Cette situation est
présentée sous la forme d’un jeu statique :
Γ = {N={ese1, ese2} ; (Aese1={I, NI}, Aese2={I, NI}) ; (uese1 (, ) , uese2 (, ))},
avec la matrice des gains suivante :

Ese2
I NI
I (2, 2) (-1, 0)
Ese1 NI (0, -1) (0, 0)

Ce jeu admet deux équilibres de Nash : (I*, I*) et (NI*, NI*).


Exemple4.
Un couple (une femme et un homme) a le choix de passer une soirée au théâtre
(T) ou aller voir un match de boxe (B). Ils préfèrent aller ensemble voir un des
deux spectacles mais l’homme préfère la boxe et la femme le théâtre. Cette
situation est présentée sous la forme d’un jeu statique :

7
Γ = {N={H, F} ; (AH={T, B}, AF={T, B}) ; (uH (., .) , uF (., .))},avec la matrice
des gains suivante :
H
T B
T (3, 2) (1, 1)
F B (1, 1) (2, 3)

Ce jeu admet deux équilibres de Nash en stratégies pures : (T*, T*) et (B*, B*).
Exemple5.
Deux individus se partageront 100Dh s’ils annoncent simultanément deux
chiffres dont la somme est inférieure ou égale à 100 et chacun recevra alors, en
dirhams, ce qu’il annoncera. Les deux individus recevront 0 Dh s’ils annoncent
des montants dont la somme est supérieure à 100. Cette situation peut être
formalisée sous la forme normale d’un jeu statique. Soit N={1,2} l’ensemble des
joueurs. Les ensembles d’action sont A1=A2=[0,100]. Les fonctions d’utilité sont
u1(a1,a2)=a1 et u2(a1,a2)=a2si a1+a2100 et u1(a1,a2)=u1(a1,a2)=0 si a1+a2>100.
Ce jeu montre bien une faiblesse du concept d’équilibre de Nash ; il est
insuffisant pour prévoir l’issue de beaucoup de jeu. En effet, pour tout x entre 0
et 100, le couple d’action (x,100-x) est un équilibre de Nash. Il y en a donc une
infinité. La meilleure réponse (la réponse rationnelle) à quelqu’un qui veut 98Dh
est 2Dh, car plus rapporte 0Dh. Et la meilleure réponse à quelqu’un qui veut
2Dh est 98Dh. Mais quelle est l’issue la plus probable, la plus raisonnable, d’un
jeu pareil ?

1.5. Multiplicité des équilibres.


Dans beaucoup de jeux, il y a plus qu’un équilibre, et parfois une infinité
d’équilibres. Cela est très mauvais pour la théorie. Dans certains cas, il est
possible de s’attendre à ce que les joueurs jouent un équilibre et pas un autre.
Ainsi, par exemple, dans le jeu de l’exemple3, l’équilibre (I*, I*) est l’issue la

8
plus probable. En effet, bien qu’il y a 2 équilibres, l’un est préférable à l’autre
pour les deux joueurs et il est raisonnable de supposer que chaque entreprise
suppose que l’autre entreprise implémentera le « meilleur » équilibre. Mais dans
le jeu de l’exemple4, il y a deux équilibres et aucun n’est préféré à l’autre par
les deux joueurs. Sans coordination, l’issue du jeu est problématique. Les deux
joueurs joueront-ils (T*, T*) ou (B*, B*) ? Il faudra généralement faire appel à
des raisons extra-rationnelles pour prévoir (et éventuellement conseiller) un
équilibre plutôt qu’un autre. Ainsi par exemple, dans le jeu de l’exemple4, si les
préférence de l’homme sont socialement plus « respectées » que celles des
femmes, alors on peut supposer que l’homme s’attend à ce que la femme joue B,
pour « lui faire » plaisir. Il joue alors lui aussi B, pour ne pas se retrouver au
théâtre tout seul. La femme anticipe ce raisonnement et décide effectivement
d’aller à la boxe, comme prévu par l’homme, non pas pour lui faire plaisir mais
pour ne pas se retrouver seule au théâtre. Ainsi donc, pour des raisons
culturelles, certains équilibres sont plus raisonnables que d’autres. Dans
l’exemple5, bien qu’il existe une infinité d’équilibre, l’équilibre le plus probable
est (50,50), puisqu’il est un équilibre « équitable ». Pour des raisons d’équité, il
est possible de réduire le nombre d’équilibres probables, raisonnables, de façon
importante. Certains équilibres sont improbables pour des raisons
psychologiques. Il se peut très bien qu’il existe dans la population une fraction
de personnes « fous » ou « naïfs » qui préfèrent 0 à 2, quand on leur propose le
partage 2 pour eux et 98 pour les autres. Dans la réalité des jeux, de l’économie
et de la politique, tous les joueurs-décideurs-acteurs ne sont pas parfaitement
rationnels. Il y a ceux qui demanderont 50 quelque soit la demande de l’autre, il
préfère donc 0 plutôt qu’une part plus faible que celle de l’autre. Il y a ceux qui
accepte n’importe quel montant supérieur à 0. Il y a ceux qui voudraient recevoir
98Dh et rien que cela ou 0. Mais ceux qui sont pour l’équité seront le plus
probablement, les plus convaincants si jamais il y a communication, négociation

9
et coordination1. Alors, même sans communication, l’issue des jeux est un
équilibre qui « attire » l’attention.

1.6. Les stratégies mixtes.


Nous avons vu dans l’exemple1 qu’il n’existe pas d’issue évidente. On vérifie
facilement qu’il n’existe pas d’équilibre de Nash en actions pures. Nous savons
que toutes les issues ont une même probabilité de se réaliser parce que les
joueurs ne choisissent pas toujours à droite ou toujours à gauche mais
choisissent parfois la droite parfois la gauche. Nous dirons qu’ils
« randomisent » et nous appelons ce choix une « stratégie mixte ».
Définition.
Dans un jeu statique sous forme normale, Γ = {N, ((Ai)iN ), ((ui)iN )},
supposons que pour un joueur i, l’ensemble d’actions est Ai={ai1, …, aij, …, aik}.
Une stratégie mixte du joueur i est une distribution de probabilité p i = (pi1, … ,
pij, …, pik}, avec 0≤pij≤1 pour tout j = 1, …, k ; et pi1+ … + pij+ …+ pik=1.
Soit D(Ai) l’ensemble de toutes les stratégies mixtes de i et soit X iND(Ai) le
produit des ensembles des stratégies mixtes des n joueurs. p XiєND(Ai) est une
collection de stratégies mixtes, une par joueur. Quand un joueur i joue une
stratégie mixte pi et que les autres jouent p-i , il espère avoir comme gain :
EUi (p) = ∑aA proba (a) ui (a) ; avec proba (a) = ∏jN pj (aj).
Exemple1 (suite).
Reprenons l’exemple1. Une stratégie mixte du tireur est une distribution de
probabilité (p,1-p) avec p probabilité de tirer à gauche. Une stratégie mixte du
gardien est une distribution de probabilité (q,1-q) avec q probabilité de plonger à
gauche.

1
Les jeux statiques n’intègrent pas la dimension temporelle nécessaire à la communication pour la négociation et
la coordination.

10
j (le gardien)
g (q) d (1-q)
g (p) (-1, 1) (1, -1)
i (le tireur) pq p(1-q)
d (1-p) (1, -1) (-1, 1)
q(1-p) (1-p)(1-q)

Une combinaison de stratégies mixtes du tireur et du gardien ((p,1-p);(q,1-q))


donne les espérances d’utilité suivantes :
EU1((p,1-p);(q,1-q))=pqu1(g,g)+(1-p)(1-q)u1(d,d)+q(1-p)u1(d, g)+p(1-q)u1(g, d)
= -pq - (1-p) (1-q) + q(1-p) + p (1-q).
EU2((p,1-p);(q,1-q))=pqu2(g,g)+(1-p)(1-q)u2(d,d)+q(1-p)u2(d,g)+p(1-q)u2(g, d)
= +pq + (1-p) (1-q) - q(1-p) - p (1-q).

1.7. Equilibre de Nash en stratégies mixtes.


Considérons un jeu statique sous forme normale, Γ = {N, ((A i)iєN ), ((ui)iєN )}.
Soit D(Ai) l’ensemble de toutes les stratégies mixtes de i, avec p i є D(Ai) une
distribution quelconque de i, et soit XD(Ai)iєN le produit des ensembles des
stratégies mixtes des n joueurs, avec p є XD(Ai)iєN une collection de stratégies
mixtes, une par joueur.
Définition.
p* est un équilibre de Nash si, et seulement si, pour tout i dans N, et pour toute p i
є D(Ai), on a :
EUi (pi*, p – i*) ≥ EUi (pi, p – i*)
Théorème.
Tout jeu fini (nombre fini d’actions possibles) a au moins un équilibre de Nash.
Démonstration.

11
Exemple1(suite et fin).
Reprenons l’exemple1. Une stratégie mixte du tireur est une distribution de
probabilité (p,1-p) avec p probabilité de tirer à gauche. Une stratégie mixte du
gardien est une distribution de probabilité (q,1-q) avec q probabilité de plonger à
gauche. Quelle est la combinaison de distribution de probabilité d’équilibre
(p*;q*) ?
Supposons que le tireur « croit » que le gardien va à gauche avec une probabilité
q (et donc va à droite avec une probabilité (1-q)). Dans ce cas, s’il tire la balle à
gauche, il espère gagner -1q + 1 (1-q)=1-2q ; s’il tire la balle à droite, il espère
gagner 1q + -1 (1-q)=2q-1. Ainsi, si 1-2q>2q-1, c'est-à-dire si q<1/2, le tireur
tire à gauche et donc p=1; si q>1/2, il tire à droite et donc p=0. Si q=1/2,
l’espérance de gain est la même pour les deux actions et est indépendante de p ;
le tireur est indifférent entre la gauche et la droite ; p є [0,1].
En notant p* (q) la meilleure stratégie mixte du tireur quand le gardien joue la
stratégie mixte (q,1-q), on a :
p* (q)=1 pour q є [0,1/2[
p* (q)=0 pour q є ]1/2,1]
p* (q) є [0,1] pour q=1/2.
Le même raisonnement s’applique au gardien et on a alors, en notant q * (p) la
meilleure stratégie mixte du gardien quand le tireur joue la stratégie (p,1-p) :
q* (p)=0 pour p є [0,1/2[
q* (p)=1 pour p є ]1/2,1]
q* (p) є [0,1] pour p=1/2.
Les deux « correspondances de réaction » peuvent être représentées
graphiquement comme suit :

12
p
p* (q)
q* (p)
1

1/2
Figure 1

q
1/2
1

L’équilibre de Nash en stratégies mixtes est alors (p* = 1/2 ; q*= 1/2).
Exercice.
Trouvez l’équilibre de Nash en stratégies mixtes du jeu de la bataille des sexes.

1.8. Application1 : le duopole de Cournot.


Parfois, dans certains jeux, le nombre d’actions possibles est infini. C’est le cas
de deux entreprises qui choisissent simultanément des quantités de production.
Notons les quantités choisies par les entreprises 1 et 2, respectivement q1 etq2.
Les ensembles des actions sont à priori A1 = A2 = [0, ∞ [. Cette situation est
appelée un duopole de Cournot et peut être résolue en faisant recours aux
concepts de la théorie des jeux. Supposons que la fonction de demande inverse
est p(q)=a-q, avec q= q1+q2. Supposons aussi que la fonction de coût de
production est donnée par ci(qi)=cqi , pour i = 1 ou 2 et avec c<a (sinon
q1=q2=0). Pour compléter la formalisation du duopole de Cournot sous forme
normale d’un jeu statique avec information parfaite, il reste à définir les
fonctions d’utilité (ou du gain). On suppose que chaque entreprise (joueur)
maximise son profit :ui (qi, q j) ≡ πi (qi, qj) = p(q) qi - cq i.(qi*, q j*) est un
équilibre de Nash (et donc est l’issue du jeu) si et seulement si:
ui (qi*, qj*) ≥ ui (qi, qj*), pour tout qi,є Ai et pour tout i,j=1,2 ; i≠j.
Autrement dit, (qi*, q j*) est solution des deux programmes suivants :

13
maxqiπi (qi, q j) , pour i=1,2.
Les conditions de maximisation de premier ordre donne les deux fonctions de
réactionreprésentées par les équations suivantes :
Ri(qj)≡qi*= -1/2 qj+ 1/2 (a-c) , pour i,j=1,2 et i≠j.
L’équilibre de Nashexige que chaque entreprise décide la meilleure quantité en
supposant que l’autre entreprise le sait et fait de même en supposant que l’autre
le sait. Nous avons à l’équilibre :
qi*= -1/2 qj* + 1/2 (a-c) , pour i,j=1,2 et i≠j.
D’où la solution : q1*= q2*= (a-c)/3.
La solution du jeu simple d’un duopole de Cournot mérite une petite discussion.
Considérons les courbes des fonctions de réaction, Ri(qj) dans la figure2. Si une
entreprise décide d’offrir la quantité de la concurrence, soit a-c, l’autre ne
produira rien ; toute quantité strictement positive génère des pertes. Par contre,
si une entreprise décide de ne rien offrir, l’autre voudrait offrir la quantité du
monopole, soit (a-c)/2. Mais si une entreprise décide d’offrir la quantité du
monopole, l’autre décide d’offrir une quantité non nulle, ce qui rend alors le
choix de la quantité du monopole non optimal. Le duopole de Cournot, pour des
raisons stratégiques, et non par entente, génère une quantité d’équilibre entre la
quantité d’équilibre du monopole et celle de la concurrence.

q2

R1(q2)
(0,a-c )

(q1*,q2*)=((a-c)/3,(a-c)/3)
(0,(a-c)/2)
Figure 2
R2(q1)

q1
((a-c)/2,0) (a-c,0)

14
2. Jeux statiques avec information imparfaite.

Nous avons vu qu’un jeu est statique si les joueurs jouent simultanément une
seule fois. L’information est complète quand les joueurs choisissent des actions
dans des ensemblesbien définis d’actions possibles et que les gains associés aux
différentes combinaisons d’actions sont connus. Mais parfois, on ne sait pas quel
jeu on joue, ou, ce qui peut revenir au même, on ne sait pas avec qui on joue.
Les joueurs sont alors incertains quant au gain associé à chaque combinaison
d’action.

2.1. Information incomplète et information imparfaite.


Un jeu est avec information incomplète quand chaque joueur connaît son
ensemble d’actions mais ne cannait pas avec certitude les actions possibles des
autres et les gains associés aux combinaisons d’actions.
Exemple6.
Deux entreprises ont une possibilité de travailler ensemble pour un nouveau
produit. Elles ont à décider d’investir, action notée I, ou ne pas investir, NI.
Mais elles ne savent pas si elles jouent le jeu1 ou le jeu2 :
Jeu1. Jeu2.

Ese2 Ese2
I NI I NI
I (1,1) (0,2) I (2,2) (1,0)
Ese1
NI (2,0) (1,1) NI (0,1) (0,0)

L’analyse d’une situation pareille est impossible. Dans le jeu1, I est une action
dominée et l’équilibre unique est (NI, NI). Dans le jeu2, NI est une action
dominée et l’unique équilibre est (I, I).

15
Si on suppose que les joueurs ont certaines croyances quant au jeu joué, les deux
jeux précédents peuvent être regroupés en un seul jeu dans lequel la « nature »
est le premier joueur qui « décide » un des deux jeux en suivant une « stratégie
aléatoire » (tirage d’un jeu parmi les deux, avec probabilité de 70%de tirer jeu1
et 30% de tirer jeu2, par exemple).Il faut aussi supposer que la distribution de
probabilité est connue des deux joueurs.Et puisque les jeux sont statiques,
aucune information supplémentaire ne permettra d’améliorer les croyances de
départ.
Nature

30%
70%

Jeu1. Jeu2.

Ese2 Ese2
I NI I NI
I (1,1) (0,2) I (2,2) (1,0)
Ese1
NI (2,0) (1,1) NI (0,1) (0,0)

La nature donc joue et choisit un ensemble d’actions pour chaque joueur. On dit
que la nature choisit, pour chaque joueur, un « type » parmi plusieurs types,
selon une distribution de probabilité connue par tous. Chaque joueur connaît son
type, mais ne connaît pas les types des autres. Cette transformation d’un jeu à
information incomplète en un jeu à information imparfaite concernant la
décision de la nature a été proposé par Harsanyi (1967). Le jeu transformé
devient alors analysable.

16
La modélisation de ce genre de jeux a étédonc menée à l’aide de lanotion de
« type » de joueur. On suppose que la « nature » choisit une combinaison de
types t=(t1 , … , ti , … , tn), suivant une distribution de probabilité à priori p(t).
Formellement alors, un jeu statique avec information imparfaite est un ensemble
de joueurs N de cardinal n ; un ensemble de types possibles par joueur i, soit
(Ti)iєN ; un ensemble d’actions par joueur i, soit (Ai)iєN ; des croyances sur les
types des autres, connaissant son type, soit (pi (t-i /ti))iєN ; et une fonction d’utilité
par joueur, définie sur l’ensemble des combinaisons d’actions, soit ((u i)iєN. On le
note :Γ = {N, ((Ti)iєN ), ((Ai)iєN), ((pi)iєN((ui)iєN )}.
Si les distributions de probabilité sur les types sont dépendante, les croyances
d’un joueur i sur les types des autres joueurs, connaissant son type, sont
calculées en utilisant la règle de Bayes :
pi (t-i /ti)) = p (t-i , ti) / p(ti).
Définition.
Une stratégie si du joueur i est une fonction qui associe à chaque type de i une
action dans Ai. Autrement dit :
si : Ti → Ai
ti → ai = si (ti)

2.2. Equilibre Bayesien de Nash.


Définition.
Soit Γ = {N, ((Ti)iєN ), ((Ai)iєN ), ((pi)iєN ((ui)iєN )} un jeu statique avec
information imparfaite. La combinaison des stratégies s* = (s1*, … , si*, …, sn*)
est un équilibre Bayesien de Nash si et seulement si, pour tout i, et pour tout
type ti , si*(ti) est solution du programme :
Max∑pi(t-i /ti)ui(s1*(t1), … , si(ti), …, sn*(tn)) ;
la somme étant pour tous les t-i dans T-i .

17
Proposition.
Dans un jeu fini, statique et avec information imparfaite, il existe un équilibre
Bayesien de Nash.
Démonstration.

2.3. Application1 : le duopole de Cournot(suite).


Reprenons le duopole de Cournot précédemment analysé et supposons cette fois
que l’entreprise 1 continue d’avoir pour fonction de coût de production
c1(q1)=cq1 , mais que l’entreprise 2 est de deux types possibles, les types H et B,
et a maintenant deux fonctions de coût, une par type : c2(q2)=cBq2 ou
c2(q2)=cHq2 , avec cB<cH. L’entreprise 1 ne connaît pas le type de l’entreprise 2
mais dispose d’une distribution de probabilité qui assigne la probabilité β au
type est H et 1- β au type B. L’entreprise 2 connaît son type.
Si l’entreprise 2 est de type H, elle résout : maxq2πH(q1, q2)= [(a-q1-q2) - cH]q2.
Si l’entreprise 2 est de type B, elle résout : maxq2πB (q1, q 2)= [(a-q1-q2) – cB]q2.
L’entreprise 1, ne connaissant pas avec certitude le type de l’entreprise 2,
maximise l’espérance du profit. Elle résout le programme :
maxq1Eπ1 (q1, q 2)= β [(a-q1-q2(cH) – c]q1 + (1-β) [(a-q1-q2(cB) – c]q1.
Les conditions du premier ordre nous donnent trois fonctions de réaction. Les
deux premières sont les réactions optimales de l’entreprise 2, selon le type, au
différentes décisions de l’entreprise1:q2* (cH)= (a-q1-cH)/2 et q2* (cB)= (a-q1-cB)/2.
La fonction de réaction de l’entreprise 1 est :
q1* = [β (a-q2(cH)-c)+(1-β)(a-q2(cB)-c)]/2.
A l’équilibre de Nash, on a :
q2* (cH)= (a- 2cH+c)/3 + (1-β) (cH - cB)/6; q2* (cB)= (a- 2cB+c)/3 - β (cH - cB)/6
q1* = [β cH+(1-β) cB+a-2c]/3.
Discussion.
Pour utiliser tous les aspects de la théorie d’équilibre Bayesien, on considère un
modèle dans lequel chaque entreprise a deux types possibles : H et B. On

18
considère une distribution de probabilité à priori : p(H,H) ; p(H,B) ; p(B,H) et
p(B,B). Chaque entreprise connaissant son type, déduira une croyance sur le
type de l’autre, etc.

2.4. Application2 : Les enchères.


Certaines enchères se prêtent bien à la modélisation sous forme de jeu Bayesien,
c’est le cas de l’enchère au prix le plus élevé, de l’enchère au second prix, de la
double enchère, etc.
Vente au prix le plus élevé.
Un bien économique est mis en vente. Supposons que deux individus se portent
acheteurs potentiels. Le vendeur, ou quelqu’un d’autre, organise une enchère.
Les individus i et j accordent au bien respectivement les valeurs v i et vj. Chaque
individu connaît sa valeur mais ne connaît pas la valeur qu’accorde l’autre
individu au bien objet d’enchère. Mais chacun sait que la valeur de l’autre est
une variable aléatoire distribuée de façon uniforme sur l’intervalle [0,1].Les
individus i et j propose respectivement les prix pi et pj. Celui qui propose le prix
le plus élevé obtient le bien et paye le prix qu’il propose. Son gain est alors égal
à vk – pk , pour k=i ou j. Si les prix proposés sont égaux, chaque individu obtient
le bien avec la probabilité ½.
Cette situation s’analyse comme un jeu Bayesien :Γ = {N, ((Tk)kєN ), ((Ak)kєN ),
((pk)kєN, ((uk)kєN )} ; avec N={i,j}, les ensembles d’actions sont Ai = Aj = [0,∞[,
les ensembles des types sont Ti = Tj = [0,1], les croyances d’un joueur k (i ou j)
sur les types de l’autre sont représentées par la distribution des probabilités qk
(k=i ou j). Les distributions de probabilités sont supposées uniformes et
indépendantes. Les deux joueurs sont supposés neutres au risque et maximise les
fonctions d’utilitéuk(pi,pj,vi,vj) avec k=i ou j. Ainsi, par exemple, pour le joueur
i, on a :ui(pi,pj,vi,vj) = vi-pi si pi>pj ; ui(pi,pj,vi,vj) = 0 si pi<pj ; ui(pi,pj,vi,vj) =
½(vi-pi) si pi=pj(événement de probabilité nulle).

19
La stratégie dans ce jeu est une fonction qui associe à chaque type une action.
Ainsi, une stratégie pour le joueur i est :
si : Ti → Ai
ti → si (ti)= pi(vi).
A l’équilibre Bayesien de Nash (pi*(vi),pj*(vj)), pi*(vi) est la meilleure réponse
àpj*(vj) et vice versa. Autrement dit le joueur i maximise (vi-pi) proba (pi>pj).
Considérons un équilibre avec des stratégies linéaires : pk*(vk)=ak vk+ bk, pour
k=i ou j. Dans le cas des distributions uniformes, on a alors :
proba (pi>pj)= proba (pi> aj vj + bj)=proba (vj<(pi- bj)/aj)=(pi- bj)/aj.
Le joueur i propose le prix qui maximise (vi-pi)(pi- bj)/aj. En considérant qu’un
joueur ayant une valeur nulle propose un prix nul, bj=0 et on a l’équilibre
suivant : (pi*(vi)=vi/2, pj*(vj)=vj/2). A l’équilibre, chaque joueur propose la
moitié de la valeur qu’il accorde au bien. Cela peut s’expliquer par le fait que
chacun veut partager la valeur générée par l’échange au cas où c’est lui qui
obtient le bien.
Exercice.
Montrez que dans le cas où il y a n joueurs, avec des distributions uniformes, les
stratégies d’équilibre sont pour un joueur i : pi*(vi)=vi(n-1)/n, et que donc plus le
nombre de joueurs est grand, plus les joueurs proposent des prix qui se
rapprochent des valeurs qu’ils accordent au bien objet de l’enchère (E.
Rasmusen, 1990, p248).
L’enchère double.
Deux individus, un vendeur et un acheteur, désirent échanger un bien. Les
évaluations de la valeur du bien par le vendeur et l’acheteur sont respectivement
vs et va. Chacun connaît son évaluation et dispose d’une distribution de
probabilité définie sur l’ensemble des évaluations de l’autre. Supposons que les
évaluations sont distribuées uniformément sur l’intervalle [0,1]. Le vendeur et
l’acheteur annoncent simultanément deux prix, respectivement p s et pa. Si ps pa,

20
il y a échange du bien au prix p=(ps+pa)/2 ; le vendeur gagne p-vs et l’acheteur
gagne va-p. Si ps> pa, il n’y a pas d’échange ; le gain de chacun est nul.
Il s’agit d’un jeu Bayesien statique ; les stratégies sont des fonctions qui
associent à chaque valeur vk, un prix pk(vk), k=s ou a.A l’équilibre Bayesien de
Nash, ps*(vs) et pa*(va)) maximisent les espérances du vendeur et de l’acheteur :
(½(ps+E[pa(va)| pa(va)ps])-vs) proba (pa(va)ps)
( va-½(pa+E[ps(vs)| paps(vs)])) proba (paps(vs))
Ce jeu admet une infinité d’équilibres. Considérons un équilibre avec stratégies
linéaires du genre : pk(vk)=ak vk+bk, k=s ou a. Comme on a :
proba (pa(va)ps)=proba(va(ps-ba)/aa)=(aa+ ba- ps)/aa ;
proba (paps(vs))=proba(vs(pa-bs)/as)=(pa- bs)/as ;
E[pa(va)| pa(va)ps]=½(ps+aa+ ba);E[ps(vs)| paps(vs)]=½(pa+as).
Les conditions de premier ordre sont :
ps=2/3 vs + 1/3(ba+aa) ;pa=2/3 va + 1/3 as.
Les stratégies d’équilibre sont alors :
ps*(vs)=2/3 vs + 1/4 ;pa*(va)=2/3 va + 1/12.
Comme l’échange a lieu si paps, à l’équilibre, il y a échange si vavs+1/4, alors
que l’échange est efficace pour vavs.
Exercice.
Montrez que le couple de stratégies suivant est un équilibre :
ps=1/3 si vs1/3 et ps=1 si vs>1/3 ;
pa=1/3 si va1/3 et pa=0 si va<1/3.
Montrez que pour tout x[0,1], les stratégies suivantes forment un équilibre :
ps=x si vsx et ps=1 si vs>x ;
pa=x si vax et pa=0 si va<x.
Montrez que ces équilibres ne sont pas nécessairement efficaces (un équilibre
est efficace s’il génère l’échange chaque fois que l’échange est
bénéfique :vavs).

21
2.5. Application3 : Bien public et information imparfaite.
Deux individus décident simultanément de contribuer (« c ») ou ne pas
contribuer (« nc ») à l’offre d’un bien. Si un individu au moins décide « c »,
chacun des deux obtient 1. Si aucun des deux individus ne joue « c », ils
obtiennent 0. La contribution d’un individu i à l’offre du bien lui coûte ci,
information qu’il est seul à connaître.L’individu j dispose d’une distribution de
probabilité sur les valeurs possibles de ci. On suppose que ci est, pour j,
uniformément distribuée sur l’intervalle [0,1].
Cette situation est représentée sous la forme du jeu Bayesien :
Γ = {N={1,2}, T1 = T2 = [0,1],Ai = Aj = {« c », « nc »}, (p1, p2), (u1,u2)}
avec la matrice des gains suivante :

Joueur 2
«c» « cn »
Joueur 1 «c» (1- c1,1- c2) (1- c1,1)

« nc » (1, 1- c2) (0, 0)

La stratégie d’un joueur i est une fonction si :


si : Ti → Ai
ci → si (ci)= « c » ou « nc ».
A l’équilibre Bayesiende Nash, s1*(c1) est la meilleure réponse à s2*(c2) et vice
versa. Les deux stratégies maximisent : E ui(si,sj*(cj),ci).
Soit zj=proba(sj*(cj)= « c ») et 1-zj=proba(sj*(cj)= « nc »).
Si le joueur i joue « c », cela lui rapporte 1-ci. Si le joueur i joue « nc », cela lui
rapporte zj1+(1-zj)0=zj. On peut donc conclure que i joue « c » si ci<1-zj et
joue « nc » si ci>1-zj. Comme zj=proba(sj*(cj)= « c »)=proba(cj<cj*)=cj*, on a

22
alors = ci*=1-cj*, pour i, j=1,2 et i≠j. L’équilibre symétrique est tel que
ci*=cj*=c*=1/2. Les stratégies d’équilibre sont si*(ci)= « c » si ci1/2, sinon
« nc ». Ainsi, dans certains cas, le joueur i ne contribue pas à l’offre du bien
« public » même s’il gagne à le faire (cas de 1/2<ci<1).

Exercices.
1. Deux entreprises sont sur un marché. Il existe deux types d’investissement I1, et I2. Le
programme I1 coûte 1 et rapporte, si il est choisi par les deux entreprises en même temps, 4
pour l’entreprises 1 et 3 pour l’entreprise 2. Le programme I2 coûte 2 et rapporte, si il est
choisi par les deux entreprises en même temps, 4 pour l’entreprises 1 et 5 pour l’entreprise 2.
Si une entreprise choisit un type d’investissement et l’autre entreprise choisit un autre type,
alors chaque entreprise récupère exactement le coût du programme choisi. Représentez cette
situation sous forme normale d’un jeu (attention, le gain net est la différence entre ce que
rapporte un programme et ce qu’il coûte). Trouvez les équilibres en stratégies pures de ce jeu.

Si vous êtes conseiller de l’entreprise 1, quel programme lui conseillerez-vous ?


Si vous êtes conseiller de l’entreprise 2, quel programme lui conseillerez-vous ?Développez.
Trouvez un équilibre en stratégies mixtes.

2. Dans un jeu, il existe deux joueurs et deux actions pour chaque joueur : coopérer (c) ou ne
pas coopérer (nc). Le joueur 1 ne sait pas s’il joue avec un bon type ou un mauvais type. La
probabilité qu’il s’agisse d’un bon type est β et la matrice des gains dans ce cas est :
Joueur 2 (bon type)
c nc
c 2,2 1,1
nc 1,1 0,0

Avec un mauvais type, la matrice des gains est donnée par :


Joueur 2 (mauvais type)
c nc
c 2,2 -1,3
nc 1,-1 0,0
Trouvez l’équilibre de Nash Bayesien, en fonction de β.

3. Considérez un duopole de Cournot. La fonction de demande inverse est P(x)=4-x. La


fonction de coût de la première entreprise est c(x)=2x et est connue par les deux entreprises.
La fonction de coût de la deuxième entreprise est c(x)=x si elle est une entreprise à coût bas et
est c(x)=3x si elle est à coût élevé. L’entreprise 2 connaît sa fonction de coût mais l’entreprise
1 pense que la probabilité qu’elle fait face à une entreprise à coût faible est β. Trouvez
l’équilibre du duopole, en fonction de β.

23
II. Jeux dynamiques.

Dans beaucoup de jeux et de situations économiques ou politiques, les actions


ne sont pas simultanées mais successives, avec une information supplémentaire
« pertinente » entre les actions. Dans un jeu dynamique, les joueurs sont appelés
à prendre des décisions de façon séquentielle, éventuellement plusieurs fois, en
observant chaque fois les décisions des autres, ou un ensemble de décisions
probables moins important que l’ensemble des décisions possibles au départ.
Ainsi donc, chaque joueur devrait prendre éventuellement une série d’actions
successives, disposant à chaque moment de décisions d’un ensemble
d’information plus important que celui du moment de la décision précédente.

Il existe deux grands types de jeux dynamiques : les jeux dynamiques avec
information parfaite et ceux avec information imparfaite.

1. Jeux dynamiques avec information parfaite.

Un jeu est dynamique avec information parfaite si les joueurs jouent de façon
séquentielle, en observant chaque fois les choix des actions passées. Un exemple
de jeu dynamique simple dans lequel les actions sont séquentielles et
observables et chaque joueur joue une fois est le duopole de Stacklberg : dans un
marché, il existe deux entreprises et une entreprise décide la première (leader) la
quantité à produire et offrir et l’autre (suiveur) décide aussi quelle quantité offrir
mais après l’observation de la quantité du leader.

1.1. Représentation sous forme extensive.

La représentation sous forme extensive est un graphe (ou un arbre) avec des
chemins liants le sommet (ou la racine) avec le résultat (le fruit) à l’aide de

24
segments (branches), en passant chaque fois par des points de décisions (nœuds)
qui représentent la position d’un joueur et les actions possibles à ce niveau. Un
chemin est une série de nœuds liés par des branches ; le premier nœud, la racine
(ou le sommet) représente le début du jeuet du chemin, après le dernier nœud, la
dernière branche aboutit à un résultat pour chaque joueur, ce résultat est une
issue possible du jeu.
Dans la figure ci-dessous, le joueur 1, au nœud N1, dispose de n actions : a1, …,
ai, …, an. Le joueur 2 peut se retrouver alors dans un des n nœuds possibles :
N21, …, N2i, …, N2n. Le nombre d’actions possibles pour le joueur 2, en
position N2i, est m actions et le nombre d’actions pour le joueur 1, en position
N1i est k. Un chemin possible est le passage de N1 à N2i (si le joueur 1 décide
ai), puis le passage de N2i à N1j, à travers la branche (action du joueur 2) bj,
puis le passage aux résultats r1 et r2, respectivement pour les joueur 1 et 2, suite
à l’action du joueur 1 (en suivant la branche) ci.

N21
N11
a1 b1 c1
ai bj ci
N1 N2i N1j (r1 ; r2)
an bm ck
N2n N1m
m

Exercice.
Représentez sous la forme normale un jeu dans lequel deux joueurs jouent
chacun deux fois, observe toujours l’action précédente et dispose à chaque nœud
de décision de trois actions possibles. Montrez qu’il y a 81 chemins possibles.

Remarque1. L’ensemble d’actions possible, à partir d’un nœud, peut être


continu ; c’est le cas du duopole de Stacklberg qui se représente alors comme ci-
dessous.

25
Leader

qL
0 ∞
Suiveur

q S (qL)
0 ∞
(∏L , ∏S )

Remarque2. Un jeu statique peut être représenté sous forme extensive


« améliorée » par la représentation des « ensembles d’information ».
Considérons le jeu statique « bataille des sexes », présenté comme un jeu dans la
première partie. L’homme (H) et la femme (F) disposent chacun de deux actions
possibles : Théâtre (T) et Boxe (B) et décident simultanément où partir. La
représentation ci-dessous n’est pas correcte puisqu’elle laisse voir que le joueur
J2 observe la décision du joueur J1, avant de décider.

J1 (H ou F ?)

T B

J2 (F ou H ?) J2 (F ou H ?)

T B T B

26
Pour montrer que les décisions sont simultanées, il est nécessaire d’ajouter à
l’arbre (nœuds, branches et résultats) une représentation de la non observation
des actions. Dans la représentation ci-dessous, l’ensemble de nœuds de J2 est
entouré de pointillés pour signifier que J2 ne sait pas dans quelles positions il
est.

J1 (H ou F ?)

T B

J2 (F ou H ?) J2 (F ou H ?)

T B T B

Remarque3. Un jeu dynamique peut être représenté sous forme normale.


Reprenons le jeu de « bataille des sexes », en supposant cette fois ci que
l’homme décide le premier et que la femme observe la décision de l’homme
avant de décider. Ci-dessous, la représentation extensive de ce nouveau jeu.
H

T B

F1 F2

T B T B

(2 , 3) (1 , 1) (1 , 1) (3 , 2)

27
La représentation sous forme normale ci-dessous
Γ = {N={H, F} ; (AH={T, B}, AF={T, B}) ; (uH (., .) , uF (., .))},avec la matrice
des gains suivante :
F
T B
T (2, 3) (1, 1)
H B (1, 1) (3, 2)

n’est pas correcte puisqu’elle ne montre pas que le joueur J2 observe la décision
du joueur J1, avant de décider. Dans les jeux dynamiques, la stratégie n’est plus
une action parmi d’autres. Elle est une fonction qui associe à chaque nœud de
décision (position sur un chemin) une action parmi les actions possibles à ce
niveau. Au nœud N1, H dispose de deux actions et ne jouera plus par la suite,
son ensemble de stratégie est son ensemble d’actionsAH={T, B}. Par contre, F
peut se retrouver au nœud F1 comme elle peut se retrouver au nœud F2. Une
stratégie de F est une fonction qui propose une action si F est en F1 et une autre
si F est en F2. Dans ce cas, la stratégie est notée (T, B) propose T si F est en F1
et propose B si F est en F2. L’ensemble des stratégies possibles pour F n’est plus
l’ensemble des actions AF={T, B}mais SF={(T, T) ; (T, B) ; (B, T) ; (B, B)}. La
représentation normale du jeu dynamique de la bataille des sexes est donc
donnée par la figure ci-dessous.
Γ = {N={H, F} ; (SH={T, B}, SF={(T, T) ; (T, B) ; (B, T) ; (B, B)} {T, B}) ; (uH
(., .) , uF (., .))},avec la matrice des gains suivante :

F
(T, T) (T, B) (B, T) (B, B)
T (2, 3) (2, 3) (1, 1) (1, 1)
H
B (1, 1) (3, 2) (1, 1) (3, 2)

28
1.2. L’issue d’un jeu dynamique.

On peut penser que l’issue d’un jeux dynamique peut être identifiée en le
transformant sous forme normale et en lui appliquant alors le concept
d’équilibre de Nash. En effet, on peut chercher, pour chaque joueur, les
stratégies qui sont les meilleures réponses aux stratégies des autres qui sont les
meilleures réponses à sa propre stratégie.Ainsi, le jeu dynamique de la bataille
des sexes, sous sa forme normale, admets trois équilibres de Nash, issues
possibles : (T, (T, T)), (B, (T, B)) et (B, BB)).

Il existe cependant une autre manière de chercher les issues des jeux
dynamiques, sans les transformer sous forme normale, mais en raisonnant
directement à partir de la représentation extensive. Cette démarche appelée
« induction en amont » (Backward induction, en anglais) part de la fin du jeu, et
revient jusqu’au début en passant chaque fois par la branche qui maximise le
gain. Appliquons cette démarche de résolution au jeu précédent.
H

T B

(2 , 3) (3 , 2)
F1 F2

T B T B

(2 , 3) (1 , 1) (1 , 1) (3 , 2)

En commençant par la fin, F joue T au nœud F1B à F2. F1 et F2 peuvent alors


être remplacés par les gains correspondants. H a une action optimale : B.Ainsi, il
y a dans ce jeu trois équilibres de Nash mais l’issue du jeu, selon la méthode

29
d’induction vers l’amont, est unique : (B, (T, B)). La solution unique est un
équilibre de Nash mais les deux autres équilibres de Nash ne sont pas considérés
comme des issues possibles, selon l’induction en amont. L’équilibre de Nash (B,
(B, B)) n’est pas une issue du jeu parce qu’il suppose un choix irrationnel en un
nœud non atteint par le chemin de l’équilibre. Cela se représentera comme ci-
dessous.
H

T B

(1 , 1) (3 , 2)
F1 F2

T B T B

(2 , 3) (1 , 1) (1 , 1) (3 , 2)

L’induction en amont élimine l’équilibre avec une stratégie contenant une action
non rationnelle en dehors du chemin d’équilibre. Elle élimine aussi l’équilibre
de Nash (T, (T, T)), représenté ci-dessous.
H

T B

(2 , 3) (1 , 1)
F1 F2

T B T B

(2 , 3) (1 , 1) (1 , 1) (3 , 2)

30
En effet, T est la meilleure stratégie de H face à la stratégie de F (T, T) ; et (T,
T) est une stratégie parmi les meilleures réponses à T. Cet équilibre de Nash
suppose une action irrationnelle en F2, nœud non atteint par le chemin
d’équilibre. La stratégie (T, T), de F, contraint H à choisir la stratégie T. Mais la
menace de F de partir au théâtre quelque soit la décision de H n’est pas crédible
car si H décide tout de même de partir à la boxe, F se trouvant alors en F2, ne
peut choisir que la boxe, elle aussi.

1.3. Equilibre de Nash Parfait d’un jeu dynamique.

Un jeu dynamique avec information parfaite se décompose en sous-jeux ;


chaque sous-jeu commence à partir d’un des nœuds du jeu, va jusqu’à la fin du
jeu initial et peut être considéré indépendamment de ce qui précède. Dans la
figure ci-dessous, en trait plus foncé, le sous jeu commençant à partir de N2i.

N21
N11
a1 b1 c1
ai bj ci
N1 N2i N1j (r1 ; r2)
an bm ck
N2n N1m
m

Il y a ainsi, dans un jeu à information parfaite, autant de sous jeux que de nœuds,
y compris le jeu initial commençant au nœud racine de la représentation
extensive.

Définitions. Un jeu Γ se décompose en sous jeux Γx, à partir de chaque nœuds x


du jeu Γ. Un équilibre de Nash est Parfait (ENP) si la combinaison de stratégies
d’équilibre induit un équilibre de Nash en chaque sous jeu. L’ENP est le résultat
de l’induction vers l’amont.

31
Théorème. Tout jeu fini à n joueurs, avec information parfaite, a au moins un
Equilibre de Nash Parfait.

1.4. Exercices et applications.

• Duopole de Stacklberg.
• Bataille des sexes si la femme joue la première.
• Le joueur J1 joue le premier et dispose des actions G et D, le joueur J2,
observe l’action de J1 et décide alors g ou d. Les résultats se présentent
comme suit :
si G et g, les gains sont 2 et 0 (respectivement pour J1 et J2) ;
si G et d, les gains sont 2 et -1 (respectivement pour J1 et J2) ;
si D et g, les gains sont 1 et 0 (respectivement pour J1 et J2) ;
si D et d, les gains sont 3 et 1 (respectivement pour J1 et J2) ;
Représentez ce jeu sous forme extensive et sous forme normale ;
Trouvez les équilibres de Nash ;
Trouver l’équilibre de Nash parfait.
• Deux entreprises jouent le jeu suivant : J1 décide d’entrer ou non dans le
marché, J2 observe l’action de J1 et décide aussi d’entrer ou non. Si J1 et J2
n’entrent pas, le jeu se termine et les gains sont 0 et 0. Si une entreprise entre
et l’autre n’entre pas, celle qui n’entre pas gagne 0 et celle qui entre décide
de produire ou non ; si elle produit elle gagne 5 et si elle ne produit pas, elle
gagne -1. Si les deux entreprises entrent et si elles produisent, elles gagnent 1
et 1, si elles ne produisent pas elles gagne -1 et -1.
Représentez ce jeu sous forme extensive et sous forme normale ;
Trouver l’équilibre de Nash parfait.
• Jeux à information presque parfaite. L’exercice précédent, en supposant que
les deux entreprises décident simultanément d’entrer ou non, et après

32
l’observation des décisions d’entrée, elles décident simultanément de
produire ou non. Les gains restent les mêmes que dans l’exercice précédent.
• Introduction aux jeux statiques répétés.Considérez le jeu « dilemme du
prisonnier » joué deux fois, avec, à chaque fois, la matrice des gains
suivante :
J2
c nc
c (4, 4) (0, 5)
J1 nc (5, 0) (1, 1)

Représentez ce jeu (joué deux fois) sous forme extensive et sous forme
normale ;
Trouvez l’équilibre de Nash parfait.

2. Jeux dynamiques avec information imparfaite.

Dans certaines situations, un joueur peut ne pas observer exactement l’action


précédente mais seulement un ensemble d’actions probables. Ce joueur ne
cannait donc pas exactement sa « position » sur l’arbre du jeu (information
imparfaite). Dans certains cas, les joueurs ne savent pas à quel jeu ils jouent,
dans d’autres jeux parce que certaines caractéristiques d’un joueur ne sont pas
« connaissance commune » ou les résultats associés à certaines combinaisons de
stratégies ne sont pas exactement identifiés (information incomplète). Nous
avons vu que les jeux à information incomplète peuvent être transformés en jeux
à information imparfaite en supposant que la « Nature » commence le jeu en
tirant une combinaison de « types » de joueur selon une distribution de
probabilité à priori. Nous avons vu que dans les jeux statiques, connaissant son
type, un joueur peut « corriger, améliorer », ses croyances qui concernent les
types des autres en utilisant la règle de Bayes, si les distributions de probabilité

33
de chaque type ne sont pas indépendantes. Mais, n’ayant aucune autre
information sur les actions des autres (jeu statique), les croyances du départ sont
suffisantes pour déterminer les stratégies d’équilibres. Par contre, dans les jeux
dynamiques, bien que l’information soit imparfaite dès le départ du jeux,
puisque les actions sont séquentielles, des informations supplémentaires
apparaissent aux joueurs avec la progression du jeu. Les joueurs en tiennent
compte et améliorent à chaque fois les croyances du départ.

2.1. Ensembles d’information.

Nous avons vu que chaque nœud dans un arbre de jeu représente un joueur (i) en
une position donnée (k), à une étape donnée (j) du jeu. On note un nœud alors
comme suit : Nijk. Nous avons vu aussi que si tous les joueurs savent, à
n’importe quelle étape du jeu, dans quelle position ils sont exactement, alors le
jeu est à information parfaite. Maintenant, si un joueur, à une étape donnée,
n’observe pas « parfaitement » les actions des joueurs qui le précèdent, il ne sait
pas exactement dans quel nœud il se trouve.

Un ensemble d’information, Fijm est un ensemble de nœuds représentant le


joueur i dans l’étape j dans une position m, qui n’est plus une position contenant
un seul nœud mais une position contenant plusieurs nœuds. Dans la figure ci-
dessous, à partir d’une position Nj-1, le joueur i, au début de l’étape j, observe si
le joueur précédent a joué a1, a2, …, ak-2, (ak-1, ak, ak+1), …, aK. Le joueur i
distingue toutes les actions sauf ak-1, ak et ak+1, qu’on met entre parenthèses pour
signifier qu’elles constituent un même ensemble d’information. Dans la figure
ci-dessous, Fijm est représenté par l’ensemble des nœuds Nijk-1Nijk et Nijk+1.

34
Nij1

Fijm
a1
ak-1 Nijk-1
ak
Nj-1 Nijk
ak+1
Nijk+1

aK

NijK

2.2. Les concepts de stratégies et de croyances.

Supposons qu’un jeu est joué par n joueurs indicés par i, en T étapes indicées
par j. En une étape j, le joueur i dispose de M ensembles d’information indicés
par m. Notons par Fij l’ensemble des ensemble d’information disponible pour i à
l’étape j. Notons Aij l’ensemble des actions de i à l’étape j et par Aijml’ensemble
des actions disponibles au joueur i, à l’étape j, quand l’ensemble d’information
est Fijm. Une stratégie pure du joueur i est une fonction si telle que, pour toutes
les étapes j du jeu:
si :Fij→ Aij
Fijm→ aijr  Aijm Aij
A chaque étape j du jeu, le joueur i dispose d’un ensemble d’information, et la
stratégie adoptée indique l’action à prendre. Quand le jeu arrive à un ensemble
d’information contenant plus d’un nœud, l’information révélée par le chemin
parcouru jusqu’à l’ensemble d’information concerné est « utilisée » par le joueur
pour corriger ses croyances concernant le nœud atteint. Ainsi, si le jeu atteint un
ensemble d’information contenant un seul nœud, le joueur « sait », à posteriori,
où il est ; si le jeu atteint un ensemble contenant plus d’un nœud,alors le joueur
associe des croyances quand au nœud atteint. L’exemple ci-dessous montre les
croyances associées à différents nœuds de différents ensembles d’information.

35
Un premier joueur décide gauche (G1), centre (C1) ou droite (D1). Le joueur
observe G1 mais ne distingue pas C1 de D1. Les deux nœuds qui correspondent à
ces deux dernières actions appartiennent donc à un même ensemble
d’information. Dans ce cas, supposant que le joueur 2 « croit » être au nœud
auquel aboutit C1 avec probabilité 2 et au nœud auquel aboutit D1 avec
probabilité 1-2. Le joueur 2, sans savoir exactement en quel nœud il est, choisit
une action parmi deux actions gauche (G2) ou droite (D2). Un troisième joueur
est appelé lui aussi à prendre une décision parmi deux décisions : gauche (G3) ou
droite (D3), sans savoir si le joueur 2 décide D2 et le joueur 1 C1(croyance 3)
ou si le joueur 2 décide G2 alors que le joueur 1 décide D1(croyance 1-3).
Considérons la représentation ci-dessous de ce jeu en ajoutant les gains
correspondants aux différents chemins.

J1

G1 C1 D1

(2,0,0) 2 J2 1-2

G2 D2 G2 D2

3 J3 1-3
(3,2,0) (1,0,0)
G3 D3 G3 D3

(0,1,3) (1,4,0) (0,1,1) (0,1,0)

Si le jeu arrive jusqu’à J2, alors J1 a joué C1 ou D1. Peut-on préciser les
croyances du deuxième joueur (2, 1- 2), sachant que le jeu est arrivé jusqu’à
J2 ? La réponse est oui si chaque joueur considère les stratégies d’équilibre de
J1, J2 et J3 et cherche alors les croyances cohérentes avec ces stratégies. Ainsi,
si le jeu arrive à J3, alors J3 décide G3 (car D3 est strictement dominée). J2,

36
anticipant l’action optimale de J3, considère le jeu avec la représentation
équivalente suivante.

J1

G1 C1 D1

(2,0,0) 2 = 1 J2 0 = 1-2

G2 D2 G2 D2

(3,2,0) (0,1,3) (0,1,1) (1,0,0)

Le joueur J1, anticipant l’action de J2, joue C1. Le joueur J2, anticipant l’action
optimale de J1, « croit », à posteriori, quand le jeu arrive jusqu’à lui, qu’il est
certainement au nœud du centre, et jamais au nœud de droite (2=1 et 1- 2=0).
Nous disons alors que les croyances de J2 sont compatibles avec les décisions
d’équilibre. Le jeu, à l’équilibre, n’atteindra pas le joueur J3, ses croyances sont
quelconques (3 [0, 1]).

2.3. La règle de Bayes.

Dans un jeu avec information incomplète, transformé en un jeu à information


imparfaite, les joueurs ont, au départ, des croyances concernant les types des
autres (croyances à priori). Avec le déroulement du jeu, des informations
supplémentaires sont constituées en observant certaines actions de certains
joueurs. Ces informations supplémentaires peuvent être utilisées pour
« corriger » les croyances de départ (croyances à posteriori). La « correction »
des croyances est rationnelle si elle utilise la règle de Bayes.

37
Considérons le jeu suivant : la nature choisit un type pour le joueur J1, parmi
deux types possibles (t1, t2) selon la distribution de probabilité (q, 1-q) ; J1
connaît son type et J2 ne connaît que la distribution de probabilité ; J1 décide le
premier A ou B ; J2 observe l’action de J1 et prend alors une décision A ou B.
La représentation (incomplète parce que les gains manquent) sous forme
extensive de ce jeu est donnée dans le graphique ci-dessous.

P(t1)=q P(t2)=1-q

J1.1 J1.2

A B A B

(t1/B) (t2/B)
(t1/A) (t2/A)

A B A B
A B A B

N’observant pas le type de J1, mais observant son action, A par exemple, J2
peut corriger ses croyances à priori quant au type de J1. Considérant les
stratégies d’équilibre de chaque type, J2 déduit d’abord la probabilité de jouer
une action, étant donné un type. Ainsi, J2 dispose des probabilités p(A/t1),
p(B/t1),p(A/t2) etp(B/t2). Les probabilités d’être un type particulier et de prendre
une décision donnée sont :

p(A et t1) = p(t1) * p(A/t1) ; p(B et t1) = p(t1) * p(B/t1) ;


p(A et t2) = p(t2) * p(A/t2) ; p(B et t2) = p(t2) * p(B/t2).

38
Or, ces probabilité s’écrivent aussi comme suit :

p(A et t1) = p(A) * p(t1/A) = [p(A/t1)+ p(A/t2)] *(t1/A) ;


p(B et t1) = p(B)*(t1/B) ;p(A et t2) = p(A)*(t2/A) ; p(B et t2) = p(B)*(t2/B).

En égalisant et en réarrangeant, on finit par trouver l’expression connue sous le


nom de la règle de Bayes.

(t1/A) = [ p(t1) * p(A/t1) ] / p(A) ;


(t1/B) = [ p(t1) * p(B/t1) ] / p(B) ;
(t2/A) = [ p(t2) * p(A/t2) ] / p(A) ;
(t2/B) = [ p(t2) * p(B/t2) ] / p(B).

Ainsi, un joueur peut améliorer sa connaissance quant au type (ti) d’un autre
joueur en observant une action (X) et en utilisant la règle de Bayes qui permet
de calculer la croyance à posteriori (ti/X): le produit de la probabilité du type
p(ti) et la probabilité de l’action X, sachant le type et ses actions optimales,
p(X/ti), rapporté à la probabilité de l’action, quelque soit le type, p(X).

2.4. Equilibre de Nash Bayesien Parfait.

A chaque ensemble d’information, le joueur concerné a des croyances à propos


de sa position parmi les nœuds de l’ensemble. Ces croyances sont des
probabilités assignées aux différents nœuds de l’ensemble d’information une
fois atteint. Au début du jeu, il y a une incertitude quant au type du joueur, ou de
jeu. La définition d’une distribution de probabilités de départ, croyances à priori,
transforme le jeu d’information incomplète en un jeu d’information imparfaite.

39
Au fur et à mesure que le jeu avance, les croyances sont rationnellement
corrigées si elles résultent de l’application de la règle de Bayes.

Etant donné les croyances, les joueurs choisissent des stratégies


séquentiellement rationnelles (à chaque ensemble d’information, l’action du
joueur concerné est optimale étant donné ses croyances et les croyances et
stratégies optimales des autres).

Ainsi, le long du chemin d’équilibre, les croyances sont déterminées par la règle
de Bayes et par les stratégies d’équilibre et les stratégies d’équilibre tiennent
compte des croyances. Formellement, un profil de stratégies d’équilibre est une
fonction des croyances : s*() et un profil de croyances rationnelles
(compatibles au sens de Bayes) est une fonction des stratégies bay(s).

Un équilibre Bayesien parfait est un couple de profil de stratégies et de profil de


croyances (s,) : s  s*(bay(s)) et bay(s*()).

2.5. Application : jeu de réputation à deux périodes.

Une entreprise E1 est installée dans un marché et peut avoir un des deux types
suivants : normale (N, avec probabilité q) ou méchante (M, avec probabilité 1-
q). Une deuxième entreprise E2 s’installe dans le marché sans connaître le type
de E1. E1 peut déclarer la guerre (G), les gains sont alors (P, P), ou s’adapter à
la nouvelle installation (A), les gains sont alors (D, D). Supposons que si E1 est
méchante, son gain, si elle s’adapte est -∞ (la méchante ne s’adapte jamais).
Supposons que, dans une deuxième étape, E2 observe l’action de E1 (G ou A) et
décide alors de sortir du marché (S) ou de rester (R). Si E2 sort, les gains sont,
en deuxième période, Mo, revenu du monopole pour E1, et 0 pour E2. Si E2
reste les gains sont ceux du duopole (D, D). Supposons que le facteur

40
d’escompte est . Supposons enfin que P<0, D>0 et Mo>D. Ce jeu est
représenté ci-dessous, en supposant que la nature tire au début le type de E1.

N (q) M (1-q)

E1N E1M

A G G A
(D, D) (P, P) (P, P) (-∞, .)
E2 E2’ E2’’
(N/A) (N/G) (M/G) (M/A)

S R S R S R

(Mo, 0) (D, D) (Mo, 0) (D, D) (Mo, 0) (P, P)

Pour trouver l’issue de ce jeu, commençons par la fin. Si E2 observe A, elle est
sûre que E1 est normale, sa croyance est (N/A) = 1 et son action optimale est
R. Elle gagne alors D+D. L’entreprise E1 gagne aussi D+D. E2 n’observe
jamais A si E1 est M et donc (M/A) = 0. Si E2 observe G, elle voudrait choisir
R si E1 est N et choisir S si E1 est M. Si E1 est N, elle voudrait bien passer pour
M si P+M>D+D et si E2 sort quand elle observe G. Or dans ce cas,
l’observation de G ne fait pas changer les croyances de départ : (N/G) = q et
(M/G) = 1-q et pour que E2 sort en observant G, il faut que ce que rapporte S
soit supérieur à ce que rapporte R. Autrement dit, il faut que :
P>P+qD+(1-q)P qD + (1-q)P < 0.
Ainsi donc, si qD + (1-q)P < 0 et P+M>D+D, l’équilibre Bayesien parfait est
la combinaison de stratégie ((G, G), S), c-à-d E1 joue toujours G, quelque soit
son type, et E2 sort, et les croyances compatibles avec ce profil de stratégies
sont (N/G) = q et (M/G) = 1-q.

41
Si E1 est N et si P+M < D+D, alors il est dans son intérêt de s’adapter dès le
départ en choisissant A et par là même révèle son type ; E2 décide R si elle
observe A et S si elle observe G. L’équilibre Bayesien parfait est la combinaison
de stratégie ((A, G), (R, S)) et les croyances compatibles avec cette
combinaison : (N/G) = 0 et (M/G) = 1.

42

Vous aimerez peut-être aussi