Académique Documents
Professionnel Documents
Culture Documents
Abdelkader GLIZ
Octobre 2010
Prface ....................................................................................................................................... 4
Introduction .............................................................................................................................. 5
Prface
Le prsent document de travail reprsente les notes de cours du module Economie de
lInformation que jassure dans le cadre du programme de Magister de lEcole Suprieure
de Commerce dAlger. Il inclut galement quelques uns des thmes abords dans un autre
cours de Magister, en loccurrence le cours de Thorie Financire de lEntreprise . Cest le
cas par exemple des applications du modle de lala moral (chapitre 9).
Bien que lintitul du cours soit Economie de lInformation , la premire partie est
consacre la thorie des jeux, car celle-ci constitue un puissant outil danalyse et de
comprhension du rle de linformation dans lactivit conomique. Mais compte tenu de
limportance intrinsque de la thorie des jeux dans les cursus universitaires, je lui rserve une
partie part entire.
La seconde partie de ces notes de cours est conue comme une prsentation dtaille des
principales contributions de lconomie de linformation. Dans cette partie, je me base de ce
fait essentiellement sur les articles lorigine de ces apports.
Le volume horaire de ce cours ne me permet pas daborder tous les thmes contenus dans ce
document de travail. Mais dans un souci de cohrence globale, il tait ncessaire dinclure des
dveloppements non abords avec les tudiants. En particulier, le chapitre 10 nest pas
souvent expos en cours. Le chapitre 5 nest pas trait en tant que tel mais est tout de mme
expos en cours car il constitue un pr requis indispensable pour les modles de signaux
(chapitre 8).
Je remercie vivement tous les tudiants des diffrentes promotions ayant assist ce cours.
Leurs questions et commentaires pertinents ainsi que leur intrt pour les sujets abords mont
permis, danne en anne, damliorer le contenu de ce cours. Pour cela, ma gratitude envers
eux est grande.
Abdelkader GLIZ
Alger, octobre 2010
Introduction
L'activit conomique et sociale se caractrise trs souvent par des situations o le bien-tre
d'un agent conomique dpend non seulement de ses propres actions mais galement des
dcisions des autres agents. Conscient de l'existence de ce type d'interdpendance, chaque
agent en tient compte et l'intgre dans la prise de dcision.
La thorie des jeux est un cadre conceptuel d'analyse de la dcision o cette interaction
stratgique entre les dcideurs est centrale pour la comprhension de l'issue finale. Un des
exemples classiques pour la comprhension de l'interaction stratgique est le cas du duopole.
En prenant sa dcision de production ou de prix de vente, chacune des deux firmes d'un
duopole doit tenir compte de la raction de l'autre firme et doit de ce fait intgrer cette
raction dans sa propre dcision.
Dans la thorie standard de l'quilibre gnral, l'interaction entre les agents est inexistante. En
fait, deux cas extrmes ont particulirement focalis l'attention. Le premier a port sur la
concurrence parfaite. Dans ce cas, le prix des biens est donn par le march et l'entreprise (par
exemple) prend sa dcision de production en ne tenant compte que de ces prix de march et de
son cot marginal et ce, indpendamment de la dcision des autres entreprises. Les dcisions
de consommation des individus sont de mme considres comme tant indpendantes l'une
de l'autre. La deuxime situation particulirement tudie est celle du monopole. Dans une
telle situation, il n'existe qu'une seule entreprise. De ce fait, par construction, le monopoleur
prend sa dcision de production de faon indpendante.
Mais la prise en compte de l'interaction entre agents devient incontournable dans certains
phnomnes, tels que l'oligopole, les contrats, le marchandage, la rgulation, les enchres, le
financement de biens publics, Notons d'ores et dj que tout comme dans le cas de la
thorie standard de l'conomie, les agents conomiques sont supposs tre rationnels, c'est-dire que leur objectif est la maximisation de l'utilit (ou de lesprance dutilit).
La prise en compte explicite et formalise de l'interaction stratgique entre agents
conomiques a dbut avec Cournot (1838) qui a analys la situation de duopole en prenant
explicitement en compte l'interaction entre les dcisions de production des firmes du march.
Bertrand (1883) a analys l'interaction dans un duopole o la dcision des firmes porte sur le
prix de vente proposer, alors que dans le modle de Cournot la dcision des entreprises porte
sur la quantit produire. Les thoriciens considrent cependant que le vritable point de
dpart de la thorie des jeux est la publication par Von Neumann et Morgenstern (1944) du
livre : Theory of Games and Economic Behaviour. La contribution majeure de Nash (1950)
est de montrer l'existence d'un quilibre (d'une solution) pour des jeux somme non nulle.
Harsanyi (1967-1968) et Selten (1965) ont tendu par la suite le concept d'quilibre de Nash
respectivement aux jeux information incomplte (jeux Bayesiens) et aux jeux dynamiques.
Les jeux tudis sont des jeux non coopratifs. Dans cette catgorie de jeux, les seuls
paiements possibles sont ceux reprsents dans les matrices de paiement. Aucun autre
paiement ne peut avoir lieu entre les deux joueurs et ces derniers ne sont censs se proccuper
que de la maximisation de leur utilit.
Nous tudions dans ce chapitre les jeux simultans information complte. En plus de
l'hypothse de rationalit, dans cette classe de jeux, on adopte lhypothse selon laquelle
chaque joueur dispose de toute linformation se rapportant au jeu, savoir le nombre de
joueurs, lensemble des stratgies possibles de chaque joueur et les fonctions de paiement de
chaque joueur. Les jeux de cette forme sont des jeux information complte. Les joueurs sont
censs prendre leur dcision de faon simultane. Nous obtenons ainsi des jeux simultans
information complte. Cette classe de jeux est la plus simple possible et constitue le point de
dpart pour des situations de jeux plus complexes. Elle permet d'tudier le concept d'quilibre
central de la thorie des jeux qui est l'quilibre de Nash.
1.1.
On appelle un jeu sous forme normale (ou stratgique) un jeu ayant les caractristiques
suivantes :
-
Il s'agit d'un jeu simultan (statique) o chaque joueur choisit une stratgie
indpendamment du choix de l'autre joueur et le jeu ne se rpte pas.
Les joueurs sont rationnels et leur objectif est la maximisation de leur paiement.1
Dans la forme normale d'un jeu, chaque joueur choisit une stratgie et le paiement qu'obtient
chaque joueur dpend de la combinaison des stratgies choisies. Pour illustrer la forme
normale, considrons le cas classique du dilemme du prisonnier. Il s'agit d'un jeu dcrivant la
situation de deux individus arrts et souponns de crime et placs dans des cellules spares
sans possibilit de communication. N'ayant pas les preuves suffisantes pour leur inculpation,
le juge, convaincu de leur culpabilit, tente d'obtenir des confessions des deux prisonniers et
chacun d'eux, il propose ce qui suit :
Si un des prisonniers est le seul avouer, alors sa peine sera allge et gale
1 an et l'autre prisonnier aura une peine de 8 ans.
Si les deux prisonniers avouent, alors chacun d'eux aura une peine de 5 ans.
Si personne n'avoue, une peine de 2 ans sera tout de mme applique pour un
dlit plus faible (par exemple la dtention illgale d'armes).
Ce jeu peut tre reprsent par la matrice des paiements suivante :
Voir Fudenberg et Tirole (1991), Game Theory. The MIT press, Cambridge, Massachusetts. 1996. Page 4.
Prisonnier 1
Ne pas avouer
Avouer
Prisonnier 2
Ne pas avouer
-2 , -2
-1 , -8
Avouer
-8 , -1
-5 , -5
Figure 1.1
Nous pouvons maintenant donner une formulation plus gnrale de la forme normale d'un jeu.
La forme normale d'un jeu spcifie 1) les joueurs concerns par le jeu ; 2) les stratgies
disponibles pour chaque joueur et 3) le paiement reu par chaque joueur pour chaque
combinaison de stratgies pouvant tre choisies par les joueurs. Un jeu sous forme normale G
est donc la donne de trois lments :
-
Les ensembles Si des stratgies possibles de chacun des n joueurs. Une stratgie
du joueur i est si avec si Si . Les stratgies possibles si sont appeles stratgies
pures. Nous dfinirons plus loin la notion de stratgie mixte. Une issue
(s1 , s2 ,K, sn ) est une combinaison possible de stratgies des n joueurs ;
Le paiement (ou utilit) obtenu par le joueur i lorsque les n joueurs choisissent
l'issue (s1 , s2 ,K, s n ) est ui (s1 , s2 ,K, sn ) . On considre explicitement que le rsultat
obtenu par lagent i (utilit, profit, ) est fonction non seulement de sa propre
stratgie mais galement de lensemble des stratgies choisies par tous les autres
joueurs. Cette forme de l'utilit est l'expression de l'interaction stratgique. A
leffet de diffrencier entre la stratgie du joueur i et celle des autres joueurs, ui
peut scrire sous la forme suivante :
u i = u i ( s ) = u i ( s i , s i )
avec :
10
1.2.
On tudie ici un type de jeu sous forme normale o l'quilibre est aisment prvisible. Le
concept d'quilibre dvelopp pour cela est celui de l'quilibre en stratgies dominantes. La
solution d'un jeu est obtenue en se basant sur l'ide qu'un joueur rationnel ne choisit jamais
une stratgie strictement domine. Commenons par dfinir la notion de stratgie strictement
domine.2
Dfinition : Une stratgie si Si est une stratgie strictement domine pour le joueur i dans le
jeu G = [n ; {S i } ; {ui ()}] si pour tout si si on a ui (si , s i ) < ui (si , s i ) pour tout s i S i .
A titre illustratif, considrons la forme normale (stratgique) du jeu reprsente par la matrice
des paiements suivante :
Joueur 2
Joueur 1
B1
B2
B3
A1
10 , 10
4,9
4 , 11
A2
5,6
8,3
3,4
A3
4,0
8,1
5,3
Figure 1.2
Cette matrice des paiements indique pour chacun des deux joueurs ( n = 2 ), lensemble des
stratgies possibles et qui sont S1 = {A1 , A2 , A3 } et S 2 = {B1 , B2 , B3 }. Au niveau de chaque
cellule de la matrice, le nombre de gauche reprsente lutilit du joueur 1 et le nombre de
droite lutilit du joueur 2. Il sagit maintenant de dterminer quel pourrait tre lquilibre
prvisible de ce jeu, cest dire le choix simultan de stratgies par les deux joueurs, sachant
que chaque joueur agit de faon rationnelle (maximise son utilit) et prend en considration le
choix de lautre joueur.
Dans le jeu de la figure 1.2, cet quilibre est aisment prvisible. Lquilibre peut ici tre
obtenu par limination successive des stratgies strictement domines. On remarque en effet,
que la stratgie B3 procure au joueur 2 un plus grand paiement que la stratgie B2 et ce,
quelle que soit la stratgie choisie par le joueur 1. On dit dans ce cas que la stratgie B2 est
strictement domine par la stratgie B3 . Un joueur rationnel ne choisira jamais de jouer la
stratgie B2 . La stratgie B2 peut donc tre limine et le jeu devient comme suit :
11
Joueur 2
Joueur 1
B1
B3
A1
10 , 10
4 , 11
A2
5,6
3,4
A3
4,0
5,3
Figure 1.3
Notons que c'est le joueur 2 qui a limin la stratgie B2 . Mais comme le joueur 1 sait que le
joueur 2 est rationnel, il sait que le joueur 2 a limin la stratgie B2 . De plus, le joueur 2 sait
que le joueur 1 sait qu'il a limin la stratgie B2 , Cette structure d'information, appele
connaissance commune, permet de passer de la forme normale reprsente dans la figure 1.2
la forme normale reprsente dans la figure 1.3 et cela pour les deux joueurs.
Le mme type de raisonnement montre qu' partir de la matrice des paiements rduite de la
figure 1.3, le joueur 1 ne peut choisir la stratgie A2 car celle-ci est strictement domine par
la stratgie A1 . Aprs limination de la stratgie strictement domine A2 , le jeu se simplifie
encore comme suit :
Joueur 2
Joueur 1
B1
B3
A1
10 , 10
4 , 11
A3
4,0
5,3
Figure 1.4
12
lquilibre du jeu de la figure 1.2 nest pas ncessairement un quilibre de Pareto.4 Lune des
raisons est quil sagit dun jeu non coopratif, c'est--dire d'un jeu sans autre possibilit de
paiement entre les joueurs. Les seuls paiements du jeu sont ceux indiqus dans la matrice des
paiements.
Le modle du dilemme du prisonnier est un exemple classique o la solution du jeu s'obtient
par limination successive des stratgies strictement domines. Dans ce modle, l'issue
(avouer, avouer) est un quilibre en stratgies strictement dominantes et chaque prisonnier se
voit infliger une peine de 5 ans de prison. En agrgeant les paiements, on remarque que c'est
la solution la plus mauvaise collectivement. Ainsi, par dilemme du prisonnier, on entend une
situation de jeu o l'quilibre du jeu est un quilibre en stratgies dominantes et o le gain
total ne correspond pas un optimum de Pareto.
Le modle du dilemme du prisonnier a plusieurs applications, comme par exemple le
problme du free rider. Nous prsentons ci-dessous une version du modle du dilemme du
prisonnier dans le domaine social, la version traitant du problme du risque moral. Nous
considrons la situation de 2 individus i = 1, 2 faisant partie de la mme quipe.5 Le rsultat
final obtenu par l'quipe dpend de la contribution de chaque joueur i qui peut soit travailler (
si = 1 ) soit tricher ( si = 0 ). Le produit total du groupe est gal 4(s1 + s2 ) et est partag de
faon gale entre les 2 joueurs. Chaque membre du groupe supporte un cot de 3 lorsqu'il
fournit l'effort de travailler et de 0 lorsqu'il triche. La matrice des paiements de ce jeu se
prsente ainsi :
Joueur 1
Joueur 2
Travailler
Travailler
1,1
Tricher
2 , -1
Tricher
-1 , 2
0,0
Figure 1.5
Pour chacun des deux joueurs, la stratgie "travailler" est strictement domine par la stratgie
"tricher". Cet exemple illustre bien la problmatique qui ressort du modle du dilemme du
prisonnier. En effet, le profil de stratgie (travailler, travailler) domine, au sens de Pareto, le
profil de stratgies (tricher, tricher). Mais, il ne constitue pas l'quilibre du jeu.
Cet exemple fait ressortir le cot social qui pourrait apparatre lorsque la rmunration est
faiblement relie leffort. Relevons que cet quilibre peut se modifier si par exemple, le cot
de leffort tait moindre. Ceci pourrait expliquer que dans les socits vnrant ou glorifiant
leffort, lquilibre soit (travailler, travailler).6
Rappelons quun tat de lconomie reprsente un quilibre de Pareto sil nest pas possible damliorer le
bien-tre dun agent conomique sans dtriorer celui dau moins un autre agent conomique.
5
Exemple emprunt Mas-Colell, Whinston & Green (1995). Page 235.
6
Pour sen convaincre, il suffit de reprendre le mme exemple en posant que le cot de leffort est de 1. Dans ce
cas, (Travailler, Travailler) est un quilibre en stratgies strictement dominantes.
13
1.3.
Les jeux admettant un quilibre en stratgies strictement dominantes ne constituent pas le cas
gnral. Cest le cas par exemple du jeu sous forme normale suivant pour lequel on peut
vrifier qu'il nexiste pas d'quilibre en stratgies strictement dominantes :
Joueur 2
Joueur 1
B1
B2
B3
A1
6,7
9,6
0,6
A2
5,2
8,2
4,5
A3
7,7
7,8
0,9
Figure 1.6
Pour caractriser lissue de ce jeu, un nouveau concept dquilibre a t propos en 1950 par
J.F. Nash, dfini comme suit :7
Dfinition : Lissue en stratgies pures s * = s1* ,K, s n* est un quilibre de Nash si pour tout
joueur i et pour toute stratgie si S i , nous avons :
ui ( si* , s * i ) ui ( si , s * i )
En dautres termes, lquilibre de Nash est une issue o simultanment le joueur i choisit la
meilleure stratgie compte tenu du meilleur choix du joueur j et le joueur j choisit la meilleure
stratgie compte tenu du meilleur choix du joueur i. La diffrence entre lquilibre en
stratgies dominantes et lquilibre de Nash est donc la suivante : dans lquilibre en
stratgies dominantes, le choix du joueur i est optimal pour tout choix du joueur j, alors que
dans lquilibre de Nash, le choix de i est optimal pour (seulement) tout choix optimal de j.
Comme pour lquilibre en stratgies dominantes, lquilibre de Nash est stable car cest une
issue o aucun joueur nest incit dvier de faon unilatrale.
Pour trouver lquilibre de Nash, il faut dterminer pour chacun des deux joueurs sa (ses)
meilleure(s) rponse(s) chaque stratgie de lautre joueur. Ainsi, pour le joueur 1, on a :
Laction A3 est sa meilleure rponse si le joueur 2 choisit B1 ;
Laction A1 est sa meilleure rponse si le joueur 2 choisit B2 ;
Laction A2 est sa meilleure rponse si le joueur 2 choisit B3 .
En utilisant le concept de fonction de meilleure rponse bi () , on a pour le joueur 1,
Nash, J. F. (1950). Equilibrium points in n-person games. Proceedings of the National Academy of sciences 36:
48-49.
14
Pour le joueur 2, on :
Laction B1 est sa meilleure rponse si le joueur 1 choisit A1 ;
Laction B3 est sa meilleure rponse si le joueur 1 choisit A2 ;
Laction B3 est sa meilleure rponse si le joueur 1 choisit A3 .
En utilisant le concept de fonction de meilleure rponse bi () , on a pour le joueur 2,
B1 = b2 ( A1 ) , B3 = b2 ( A2 ) et B3 = b2 ( A3 ) .
A2 .
Lquilibre de Nash est un concept important dans lanalyse conomique des interactions
stratgiques entre agents conomiques. Ce concept dquilibre appelle cependant un certain
nombre de remarques, notamment concernant :8
- La possibilit dinexistence dun quilibre de Nash en stratgies pures (mais non en
stratgies mixtes).
- La possibilit dexistence de plusieurs quilibres de Nash.
Remarques : On peut montrer que :9
Dans un jeu sous forme normale, si le processus d'limination itrative des
stratgies strictement domines limine toutes les stratgies, sauf l'issue
Dans un jeu sous forme normale, si l'issue s * = s1* ,K, s n* est un quilibre de Nash,
alors cette issue survivra au processus d'limination des stratgies strictement
domines.
Parmi les motivations proposes pour justifier la dfinition de l'quilibre de Nash, supposons
qu'avant de jouer, les joueurs tentent de et arrivent harmoniser leur stratgie. Ainsi, chacun
des joueurs s'engage raliser une action donne. Cela peut tre par exemple la clarification
de l'apport de chaque actionnaire la cration en commun d'une entreprise. Tous les
paiements issus de cette activit commune sont dcrits dans la matrice des paiements. En
particulier, si l'un des joueurs venait ne pas respecter son engagement, aucune pnalit
supplmentaire n'existe. Pour que cet engagement soit crdible, il est ncessaire qu'aucun des
joueurs ne puisse, en changeant unilatralement de stratgie, augmenter son niveau d'utilit.
Dans ces conditions, il est possible de prdire la solution du jeu. Une telle prdiction est dite
stratgiquement stable ou auto-impose (Self enforcing agreement) et est prcisment un
quilibre de Nash.
8
9
15
1.4.
Joueur 1
Pile (P)
Face (F)
Joueur 2
Pile (P)
1 ; -1
-1 ; 1
Face (F)
-1 ; 1
1 ; -1
Figure 1.7
Ce jeu, qui est un jeu somme nulle, nadmet aucun quilibre de Nash en stratgies pures. En
effet, pour des annonces identiques, le joueur 2 est incit dvier. De mme, si les deux
annonces sont diffrentes, c'est le joueur 1 qui est incit dvier.
Une caractristique de ce type de jeu est que d'une part chaque joueur va tenter de deviner la
stratgie adopte par l'autre joueur et d'autre part, de bluffer afin de perturber l'autre joueur.
En raison de l'incertitude concernant la stratgie de chaque joueur, l'quilibre (en stratgie
pure) ne peut tre dtermin. Le tir au but (penalty) dans un match de football est une
situation similaire celle du jeu Apparier les sous . En effet, les spcialistes de cette
discipline sportive soutiennent que le gardien de but et le tireur choisissent chacun,
indpendamment l'un de l'autre, une direction pour plonger pour le premier et pour tirer pour
le second. La situation favorable (sans pour autant que l'issue ne soit certaine) au gardien de
but est celle o les deux joueurs choisissent la mme direction. Par contre, la situation
favorable pour le tireur au but est celle o les deux directions sont opposes.11
Dans une telle situation, chaque joueur adopte une stratgie mixte, c'est--dire une stratgie
consistant affecter une probabilit pour chacune des stratgies si de S i . Dans l'exemple de
Apparier les sous , une stratgie mixte est la distribution de probabilit ( 1 , 2 ) avec
10
11
16
i (si ) = 1 .
si S i
Supposons que le joueur i possde K stratgies pures, c'est--dire S i = {si1 , si 2 ,L, siK }. On
notera par (S i ) , lensemble des stratgies mixtes possibles du joueur i. On a donc :
(S i ) = ( i1 , L , iK ) R K / ik = 1 et 0 ik 1 pour k = 1, L , K
k
Par exemple pour K = 3 , l'ensemble des stratgies mixtes (S i ) est reprsent par les points
d'un triangle quilatral de hauteur 1, comme le montre la figure 1.8 :12
si1
i2
i3
i
i1
si 2
si 3
Figure 1.8
12
Rappelons que dans un triangle quilatral, la somme des perpendiculaires de n'importe quel point intrieur ou
frontire vers les cts opposs est gale la hauteur du triangle. Pour un nombre de stratgies K = 3, si on
choisit un triangle quilatral avec une hauteur gale 1, on peut reprsenter une stratgie mixte par un point
l'intrieur de ce triangle, puisque dans ce cas on a ik = 1 .
k
17
Remarque : Une stratgie pure est un cas particulier de stratgie mixte. Soit Si = (si1,L, siK )
l'ensemble des stratgies pures du joueur i. La stratgie pure si1 est alors la stratgie mixte
Lorsqu'on introduit les stratgies mixtes, le calcul du paiement prend la forme de l'esprance
de paiement. Pour illustrer ce mode de calcul, considrons par exemple le jeu suivant :
Joueur 1
U
M
D
Joueur 2
L
M
4,3
5,1
2,1
8,4
3,0
9,6
R
6,2
3,6
2,5
Figure 1.9
1 1 1
Le paiement des joueurs 1 et 2 pour, par exemple, les profils de stratgies 1 = , , et
3 3 3
1 1
2 = 0, , sont :
2 2
1
1
1
1 1
1
1
1
11
1
u1 ( 1 , 2 ) = 0 4 + 5 + 6 + 0 2 + 8 + 3 + 0 3 + 9 + 2 =
3
2
2
2
2 3
2
2
2
3
11
1
1 11
1
1 24
u 2 ( 1 , 2 ) = 1 + 4 + 6 + 2 + 6 + 5 =
= 4.
23
3
3 23
3
3 6
On peut galement pour un joueur quelconque, dterminer le paiement procur par une
stratgie pure donne, tant donn que l'autre joueur adopte une stratgie mixte donne. Par
1 1 1
exemple, si le joueur 1 choisit la stratgie mixte 1 = , , , l'utilit pour le joueur 2 en
3 3 3
retenant la stratgie M est :
1 1 11
1
u 2 (M , 1 ) = 1 + 4 + 6 =
3
3 3
3
Pour donner une expression plus formelle de l'esprance de paiement lorsque les joueurs
adoptent des stratgies mixtes, considrons le jeu sous forme normale dcrit dans la matrice
des paiements suivante :
18
Joueur 2
Joueur 1
1 (s11 )
s11
1 (s1 )
s1
1 (s1J )
s1J
2 (s21 )
2 (s 2 )
2 (s 2 K )
s21
s2
s2 K
(s11 , s21 )
s = (s1 , s 2 )
Figure 1. 10
Dans un jeu sous forme normale, c'est--dire un jeu o le choix des stratgies s'effectue de
faon simultan, le choix d'une stratgie mixte par un joueur se fait indpendamment du choix
des autres joueurs. En consquence, la probabilit (s ) d'une issue quelconque s = (s1 ,L sn ) ,
est le produit de probabilits suivant :
Le niveau d'utilit du joueur 1 associ une issue en stratgies mixtes = ( 1 , 2 ) est une
esprance d'utilit et est donc dtermin comme suit :
s2S 2
1 (s1 ) u1 (s1 , 2 )
s1S1
D'une faon gnrale, en remplaant le joueur 1 par le joueur i et le joueur 2 par le joueur i,
on obtient, sachant que = ( i , i ) :
ui ( ) =
i (s i ) u i ( s i , i )
si Si
Les fonctions ui sont continues car elles sont polynomiales. De mme, elles sont linaires par
19
u1 ( ) = 1 (s11 ) 2 (s21 )u1 (s11 , s21 ) + L + 1 (s1J ) 2 (s2 k )u1 (s1J , s2 K ) = (s )u1 (s )
sS
ui ( ) = (s )ui (s )
sS
Avec S = S1 L Sn .
Remarque : La relation de dominance tudie dans le cas des stratgies pures peut tre
tendue au cas des stratgies mixtes. Ainsi, la stratgie pure si est strictement domine pour
le joueur i s'il existe une stratgie mixte i telle que :
Joueur 1
U
M
D
Joueur 2
L
2,
0,
-1 ,
R
-1 ,
0,
2,
Figure 1.11
La stratgie M du joueur 1 n'est domine ni par la stratgie pure U ni par la stratgie pure D.
Mais, si le joueur 1 affecte la probabilit U et D, alors il obtient de cette stratgie
mixte une utilit espre gal :
1 1
1
- 2 + ( 1) = si le joueur 2 joue L ;
2 2
2
1 1
1
- ( 1) + 2 = si le joueur 2 joue R.
2 2
2
Donc, quelque soit la stratgie du joueur 2, la stratgie M procurera au joueur 1 une utilit
moindre. Pour le joueur 1, la stratgie pure M est donc strictement domine par la stratgie
1 1
mixte = , .
2 2
20
Dfinition : Lissue en stratgies mixtes * = ( 1* , L , n* ) est un quilibre de Nash si pour
ui ( i* , * i ) ui ( i , * i )
Pour montrer comment obtenir un quilibre de Nash en stratgies mixtes, considrons le jeu
Apparier les sous (qui, rappelons-le, n'a pas d'quilibre en stratgies pures) et soit
maintenant (r , 1 r ) la stratgie mixte du joueur 1 avec r reprsentant la probabilit que le
joueur 1 joue Pile et 1 r la probabilit que le joueur 1 joue Face et soit (q, 1 q ) la stratgie
mixte du joueur 2 avec q reprsentant la probabilit que le joueur 2 joue Pile et 1 q la
probabilit que le joueur 2 joue Face.
2
1
Joueur 1
1 r
Pile (P)
Face (F)
Joueur 2
q
Pile (P)
1 ; -1
-1 ; 1
1 q
Face (F)
-1 ; 1
1 ; -1
Figure 1.12
L'quilibre de Nash est obtenu lorsque pour chacun des joueurs, la stratgie choisie est une
meilleure rponse aux meilleurs choix des autres joueurs. Pour cela, la recherche de l'quilibre
de Nash commence par la dtermination de la fonction (ou correspondance) de meilleure
rponse de chaque joueur.13
Commenons par dterminer la correspondance r (q ) du joueur 1 pour que sa stratgie mixte
1 = (r , 1 r ) soit la meilleure rponse la stratgie mixte 2 = (q, 1 q) du joueur 2.14 Le
paiement espr du joueur 1 en adoptant la stratgie mixte (r , 1 r ) tant donn que le joueur
2 adopte la stratgie mixte (q, 1 q ) est :
21
1
, le paiement espr du joueur 1 est indpendant de la
2
valeur de r. Le joueur 1 est donc indiffrent entre Pile et Face. Dans ce cas, la stratgie mixte
(r, 1 r ) est la meilleure rponse la stratgie mixte (q, 1 q) pour toutes les valeurs de r
1
comprises entre 0 et 1 incluses. Notons que pour q = , r (q ) prend plus d'une valeur. On dira
2
dans ce cas que r (q ) est une correspondance de meilleure rponse. La correspondance de
meilleure rponse r (q ) du joueur 1 est donc de la forme suivante :
1
si
q
>
1
r (q ) = [0,1] si q =
2
1
0
si q <
r (q )
(Pile) 1
(Face) 0
0
(Face)
Figure 1.13
1
(Pile)
22
1 si r < 2
1
q (r ) = [0,1] si r =
2
1
0
si r >
q(r )
q(r )
(Pile) 1
(Pile) 1
1/2
(Face) 0
(Face) 0
0
(Face)
Figure 1.14
1 r
(Pile)
0
(Face)
1
(Pile)
Figure 1.15
r (q )
(Pile) 1
Equilibre de Nash
1/2
q(r )
(Face) 0
0
(Face)
1
(Pile)
Figure 1.16
( )
( )
23
La dtermination de l'quilibre de Nash en stratgies mixtes devient plus aise si on note qu'
cet quilibre, chaque joueur est indiffrent entre ses diffrentes stratgies pures tant donne
la stratgie mixte des autres joueurs. En d'autres termes, l'quilibre de Nash en stratgies
mixtes, les stratgies pures entrant avec une probabilit non nulle dans la stratgie mixte de
chacun des joueurs procurent la mme esprance de paiement tant donne la stratgie mixte
des autres joueurs.
Pour comprendre cette proprit de l'quilibre de Nash en stratgies mixtes, reprenons le jeu
Apparier les sous et supposons que le joueur 1 affecte une probabilit faible (disons 1%)
que le joueur 2 joue Pile. Dans ce cas, le joueur 1 obtient une esprance de paiement gale
0,01 1 + 0,99 1 = 0,98 en jouant Pile et une esprance de paiement gale
0,01 1 + 0,99 1 = 0,98 en jouant Face. Dans ce cas, pour q = 1% , aucune stratgie mixte
ne peut exister pour le joueur 1 car ce dernier peut toujours augmenter strictement son
esprance de paiement en jouant la stratgie pure Face. Le mme raisonnement s'applique si
le joueur 1 affecte une probabilit leve (disons 99%) que le joueur 2 joue Pile.
Dans le jeu Apparier les sous , pour qu'une stratgie mixte puisse exister pour le joueur 1,
il faut que la stratgie mixte du joueur 2 soit telle que le joueur 1 soit indiffrent entre jouer
Pile ou jouer Face. Ainsi, pour trouver l'quilibre de Nash en stratgies mixtes du jeu, on doit
avoir pour chaque joueur l'galit des paiements esprs des stratgies pures entrant avec
probabilit strictement positive dans sa stratgie mixte tant donne la stratgie mixte des
autres joueurs. Pour le joueur 1, cette proprit implique que :
u1 (Pile, 2 ) = u1 (Face, 2 )
q(+ 1) + (1 q )( 1) = q( 1) + (1 q )(+ 1)
1
1
. La mme dmarche applique au joueur 2 donne r = . L'quilibre de
2
2
1 1
Nash en stratgies mixtes du jeu est donc = ( 1 , 2 ) avec 1 = (r , 1 r ) = ; et
2 2
1 1
2 = (q, 1 q ) = ; . L'expression rigoureuse de cette proprit est donne par la
2 2
proposition suivante :
Ceci donne q =
Proprit : Soit S i+ S i l'ensemble des stratgies pures que le joueur i joue avec une
24
des stratgies pures incluses dans la stratgie mixte tant donnes la stratgie mixte des autres
joueurs.15
Corollaire : Si pour le joueur 1, une stratgie pure s1 est strictement domine par une
stratgie mixte 1 , alors cette stratgie pure n'est jamais choisie dans un quilibre de Nash en
stratgies mixtes. En d'autres termes, si u1 (s1 , 2 ) < u1 ( 1 , 2 ) pour tout 2 , alors 1 (s1 ) = 0
dans l'quilibre de Nash 1* , 2* . Sinon, le joueur peut toujours augmenter son utilit en
changeant une stratgie strictement domine par l'une des stratgies la dominant. Ce
changement, lorsqu'il est possible, est une dviation profitable pour le joueur, ce qui contredit
la dfinition de l'quilibre de Nash. Ceci implique qu'un quilibre de Nash en stratgies
mixtes doit assigner une probabilit strictement positive aux stratgies non strictement
domines.
Ce corollaire gnralise le rsultat concernant l'limination des stratgies strictement
domines. En effet, de par cette proprit, on dfinit une stratgie pure domine non
seulement par rapport aux autres stratgies pures, mais galement par rapport aux stratgies
mixtes.
1.5.
Soit un jeu sous forme normale G = [n, {S i }, {ui ()}] ayant le profil de stratgies
) (
une stratgie si diffrente de la stratgie optimale s i* . La question est alors de savoir si, tant
donne cette possibilit derreur pour tout joueur i et pour tout si Si , la meilleure rponse
des autres joueurs est toujours s* i . Il sagit en dautres termes, de savoir si lquilibre de Nash
s * est robuste la possibilit derreur i (si ) pour tout i et pour tout si Si . Cette
problmatique a donn lieu au concept de lquilibre de Nash en mains tremblantes.17
Il sagit dun raffinement de lquilibre de Nash introduit par Selten (1975) pour tenir compte
de la possibilit toujours prsente derreur de la part des joueurs.18 Ce critre de perfection
permet ainsi dcarter certains quilibres de Nash non dsirables , comme par exemple les
quilibres de Nash dans lesquels les joueurs jouent des stratgies faiblement domines. Un
quilibre de Nash est donc considr comme une prdiction raisonnable sil demeure un
quilibre de Nash mme en prsence de la possibilit (trs petite) derreur de la part des
joueurs.
15
Voir dmonstration dans Mas-Colell, Whinston and Green (1995), page 250.
Cette dmarche peut tre tendue lquilibre en stratgies mixtes.
17
Selten, R (1975). Reexamination of the perfectness concept for equilibrium points in extensive games.
International Journal of Game Theory. Volume 4. Pages 25-35
18
En ralit, Selten a introduit ce critre pour la perfection des jeux dynamiques.
16
25
Pour montrer comment le critre de la main tremblante permet dcarter les quilibres de
Nash dans lesquels les joueurs jouent des stratgies faiblement domines, considrons le jeu
sous forme normale reprsent par la matrice des paiements suivante :
Joueur 2
Joueur 1
2,2
1,-3
-3 , 1
1,1
Figure 1.17
Ce jeu admet deux quilibres de Nash : (U, L) et (D, R ) . On remarque cependant que
lquilibre de Nash (D, R ) consiste pour chaque joueur choisir une action faiblement
domine.19 Bien que le concept de lquilibre de Nash nlimine pas les stratgies faiblement
domines, le choix dune telle stratgie nest cependant pas toujours dsirable. En effet,
comme le montre le jeu ci-dessus, pour choisir la stratgie D, le joueur 1 doit tre certain que
le joueur 2 choisira laction R. Le mme raisonnement sapplique au joueur 2. Or, comme
dans ce jeu il existe deux quilibres de Nash, le choix de R par le joueur 2 nest pas certain.
Le joueur 1 ne devrait par consquent pas choisir laction D. Il en est de mme du joueur 2
pour laction R. En dautres termes, le concept de lquilibre de Nash nest pas suffisant pour
carter un profil de stratgies consistant pour les joueurs choisir une action faiblement
domine.
Pour carter ce type dquilibre, on peut se rfrer au raffinement de lquilibre de Nash
propos par Selten (1975). Ce raffinement vise ne slectionner que lquilibre de Nash qui
soit robuste la possibilit que les joueurs commettent une erreur avec une trs faible
probabilit. Un quilibre de Nash satisfaisant ce test de robustesse est appel quilibre de
Nash avec mains tremblantes .
Pour montrer comment ce raffinement permet dliminer lquilibre (D, R ) , considrons la
possibilit que le joueur 2, au moment de choisir laction R, commette une erreur et retient
1
qui peut devenir aussi petite que lon
laction L. Cette possibilit a une probabilit de
n
souhaite, simplement en donnant n une valeur suffisamment grande.
Dans ce cas, en jouant D, le joueur 1 obtient une esprance de paiement gale
1
4
1
et en jouant U, il obtient une esprance de paiement gale
3 + 1 1 = 1
n
n
n
1
4
1
1
1
2 + 1 1 = 1 + . Comme 1 + > 1 , lintroduction de la possibilit derreur
n
n
n
n
n
implique que D nest plus une meilleure rponse du joueur 1 au choix de R par le joueur 2. Le
mme raisonnement implique que R nest plus une meilleure rponse du joueur 2 au choix de
19
Relevons galement que lquilibre de Nash (U , L ) domine lquilibre de Nash (D, R ) au sens de Pareto.
26
D par le joueur 1. En consquence, lquilibre de Nash (D, R ) nest pas un quilibre de Nash
avec mains tremblantes .
De la mme manire, on peut vrifier que lquilibre de Nash (U, L) satisfait ce test de
robustesse et constitue donc un quilibre de Nash avec mains tremblantes . Pour cela, on
doit montrer que simultanment :
U est la meilleure rponse du joueur 1 la stratgie compltement mixte
1
1 1
est la probabilit derreur que le joueur 2
1 , du joueur 2 o
n
n n
choisisse R.
L est la meilleure rponse du joueur 2 la stratgie compltement mixte
1
1 1
est la probabilit derreur que le joueur 1
1 , du joueur 1 o
n
n n
choisisse D.
1 1
Si le joueur 2 joue la stratgie totalement mixte 1 , , le joueur 1 obtient un paiement de
n n
1
1
1 1
1 1
21 + = 2 sil choisit U et de 31 + = 3 + 4 sil choisit D.
n
n
n n
n n
sur n. La mme dmarche montre que u2 1n , L > u2 1n , R . On conclue donc que lquilibre
de Nash (U, L) est un quilibre de Nash avec mains tremblantes .20
1.6.
Bien que historiquement l'existence de l'quilibre de Nash ait t tablie par Nash en 1950, on
peut galement la considrer comme un corollaire au thorme d'existence de Debreu,
Glicksberg, Fan (1952). Ce dernier tablit des conditions suffisantes pour quexiste un
quilibre de Nash en stratgies pures.21
Thorme (Debreu (1952), Glicksberg (1952), Fan (1952)): Un quilibre de Nash existe
dans le jeu sous forme normale G = [n ; {S i } ; {ui ()}] si pour tout i = 1,..., n ,
i)
ii)
Rm ;
22
u i (s1 ,..., s n ) est continue en (s1 ,..., s n ) et quasi-concave en s i .
1
= 0.
n
21
Pour la dmonstration, voir par exemple Mas-Colell, Whinston and Green (1995), page 260.
22
Un sous-ensemble X de R m est dit compact s'il est ferm et born. Un ensemble est dit ferm s'il contient sa
frontire. Un ensemble est dit born s'il peut tre contenu en totalit l'intrieur d'un cercle (ou d'une sphre) de
rayon appropri suffisamment grand. Une fonction f () est quasi-concave si et seulement si
20
Dans cet exemple, la probabilit derreur est une squence qui converge vers 0 car lim
27
La dmonstration de ce thorme se base sur le thorme du point fixe de Kakutani qui est
lui-mme une gnralisation du thorme du point fixe de Brouwer. En premier lieu, on
montre qu'un point fixe de la correspondance de meilleure rponse
b(s1 ,..., s n ) = b1 (s 1 ) ... bn (s n ) est un quilibre de Nash. En second lieu, on montre que la
correspondance de meilleure rponse doit avoir un point fixe.
Un point fixe est un point x X tel que f (x ) = x . Dans le cas o X = [ a , b ] R , l'existence
d'un point fixe est reprsente par la figure suivante :
b
f(x) = x
a
a
x
Figure 1.17
a
a
b
Fonction f non continue sur
[a, b] sans point fixe
(a)
Figure 1.18
a
b
Fonction f non continue sur
[a, b] avec point fixe
(b)
f ( x + (1 ) x ) Min { f (x ) , f (x )} . On remarque qu'une fonction concave est ncessairement quasiconcave, mais l'inverse n'est pas (toujours) vrai.
28
La figure 1.19.a montre, pour le cas de deux joueurs, quun quilibre de Nash est un point fixe
puisque, par exemple dans le cas dune fonction de meilleure rponse, on a, par construction,
s1* , s 2* = b s1* , b s 2* . Dans le cas dune correspondance de meilleures rponses (figure
) ( ( ) ( ))
1.19.b) , on a s b (s ) .
*
S2
S2
b(s ) = b1 (s 2 ) b2 (s1 )
s2 b2 (s1 )
s2 = b2 (s1 )
s b(s )
s1 = b1 (s2 )
(a)
s1 b1 (s2 )
S1
Figure 1.19
S1
(b)
Le thorme de Debreu, Glicksberg et Fan (1952)) est dmontr sur la base du thorme de
Kakutani. Ce thorme permet son tour de dmontrer le thorme de Nash (1959).
Thorme de Nash (1950) : Soit G = [n ; {S i } ; {ui ()}] un jeu sous forme normale. Si n est fini
et si les ensembles S1 , ... , S n sont des ensembles finis, alors ce jeu admet un quilibre de
Nash en stratgies mixtes.
29
2.1.
L'enchre au second prix, appele galement enchre de Vickrey, est un exemple clbre de
jeu dont l'issue est un quilibre en stratgies (non strictement) dominantes. Dans lenchre au
second prix, les offres (enchres) sont soumises sous pli cachet et lobjet est attribu
lenchrisseur qui propose loffre la plus leve. Le prix payer est gal la deuxime offre
la plus leve. Vickrey (1961) a montr que lenchre au second prix implique que la stratgie
dominante des acheteurs est lannonce de leur vraie valuation subjective.24 Lenchre au
second prix est de ce fait un mcanisme direct rvlateur.
Pour montrer cela, considrons lacheteur potentiel i ayant une valuation subjective vi pour
l'objet qui est donc sa disposition payer et annonant une enchre bi . Appelons ri le
maximum des enchres annonces par les acheteurs potentiels autres que i, cest dire :
ri = Max b j
j i
Pour l'enchrisseur i, la question pose est de savoir o positionner son enchre bi par rapport
sa disposition payer vi . Pour montrer que la stratgie consistant enchrir sa propre
disposition payer, c'est--dire bi = vi , est une stratgie (non strictement) dominante,
considrons les deux autres stratgies denchres possibles, soit bi > vi et bi < vi . Relevons
que ces deux dernires stratgies sont des dviations par rapport la stratgie bi = vi .
La premire stratgie possible, bi > vi , correspond au cas o lacheteur surenchrit par
rapport son valuation subjective de lobjet. On peut envisager trois sous cas. Si ri > bi ,
lobjet nest pas attribu lacheteur i qui obtient une utilit gale 0. Si ri < vi , lacheteur
obtient lobjet et une utilit positive gale vi ri . Dans ces deux sous cas, lacheteur i aurait
obtenu la mme utilit avec la stratgie d'enchre bi = vi . Si vi ri bi , lacheteur i obtient
23
Voir cependant la brve description historique de Osborne (2002) qui fait ressortir les diffrences existant
entre la formulation originelle de ces deux modles et le concept de l'quilibre de Nash.
24
Vichrey. W (1961). Counterspeculation, Auctions and Competitive Sealed Tenders. The Journal of Finance.
Vol. 16, March 1961. P 8-37.
30
lobjet et une utilit ngative ou nulle gale vi ri .25 En cas d'galit, soit bi = ri , le
gagnant est choisi par tirage alatoire et le gain espr est gale (vi ri ) / 2 . L'acheteur peut
toutefois viter cette perte en adoptant la stratgie d'enchre bi = vi . Ainsi, la stratgie
d'enchre bi = vi domine (non strictement) la stratgie d'enchre bi > vi .
La deuxime stratgie possible, bi < vi , correspond au cas o lacheteur i sous-enchrit par
rapport son valuation subjective de lobjet. La mme dmarche adopte au premier cas
montre que dans les deux sous cas o ri vi et ri bi , lacheteur i obtient la mme utilit en
adoptant la stratgie d'enchre bi = vi . Mais si bi < ri < vi , lacheteur i ne prend pas lobjet et
obtient une utilit gale 0. Mais dans ce troisime sous cas, lacheteur i peut gagner
l'enchre et obtenir une utilit positive s'il avait soumis une enchre bi = vi . Ainsi, la stratgie
2.2.
25
31
par la firme i pour toute quantit q j choisie par la firme j. La fonction de raction ri (q j ) avec
i j est galement appele fonction de meilleure rponse de la firme i aux dcisions de la
firme j. Pour la firme 1, la fonction de raction est q1* = r1 (q2 ) et est le rsultat du programme
suivant :
Si la fonction i est diffrentiable et concave, la condition du premier ordre implique que q1*
est dtermin par lquation suivante :
d
d
d
1 (q1 , q2 ) = p (q1* + q2 ) + q1*
p (q1* + q2 )
c1 (q1* ) = 0
dq1
dq1
dq1
( )
( )
(q ,q )
*
1
*
2
est obtenu
lorsque simultanment, on a q1* = r1 q2* et q2* = r2 q1* . Ainsi les deux quations caractrisant
l'quilibre de Nash sont :
et
( )
d
d
p q1* + q2*
c1 q1* = 0
dq1
dq1
d
d
p (q2* + q2* )
c2 (q2* ) = 0
dq2
dq2
Dans lune des versions les plus simples de ce modle, on considre que la fonction de
demande inverse et la fonction de cot sont linaires, soit :28
avec 0 c a
Dans cette version, le cot marginal est constant. On fait ici l'hypothse que les cots fixes
sont nuls. Les quations donnant les conditions du premier ordre des deux firmes scrivent
dans ce cas :
a 2b r1 (q2 ) b q2 c = 0
28
32
a 2b r2 (q1 ) b q1 c = 0
Les fonctions de meilleure raction de Cournot des firmes 1 et 2 prennent alors la forme :
q1* = r1 (q 2 ) =
a bq 2 c
2b
q 2* = r2 (q1 ) =
a bq1 c
2b
a bq2* c
q = r1 q =
2b
( )
*
1
*
2
( )
q 2* = r2 q1* =
a bq1* c
2b
Lquilibre de Nash (de Cournot) obtenu aprs rsolution de ces deux quations est :
q1* = q 2* =
ac
3b
q2
ac
b
q1* = r1 (q2 )
q * = (q1* , q2* ) = r (q * )
ac
2b
q2* = r2 (q1 )
q2*
q1*
ac
2b
ac
b
Figure 2.1
q1
33
L'intersection des droites reprsentatives des deux fonctions de meilleures rponses reprsente
2(a c )
et le prix de march
l'quilibre de Nash. A cet quilibre, la quantit totale offerte est
3b
est :
p (q1 + q2 ) = a b
2(a c )
2
1
2
= a (a c ) = a + c
3b
3
3
3
1
2
1
2
Comme a > c , alors p (q1 + q 2 ) = a + c > c + c = c . En d'autres termes, l'quilibre de
3
3
3
3
Cournot est tel que le prix de march est plus grand que le cot marginal. Il n'est donc pas
Pareto optimal.
*
2
*
1
*
2
*
1
2.3.
Le modle de Bertrand (1838), comme le modle de Cournot, traite de l'quilibre d'un march
en situation de duopole.29 Le modle peut tre tendu au cas de n firmes. Dans le modle de
Bertrand, la variable de dcision des firmes est le prix de vente et non la quantit produire et
en ce sens, on dit que ce modle traite des dcisions court terme des firmes. Dans ce modle,
il existe deux firmes i = 1, 2 produisant un bien partiellement substituables.30 Le cot unitaire
de production, suppos constant et identique pour les deux firmes, est gal c.
Chaque firme i choisit un prix de vente pi et les quantits demandes adresses aux deux
firmes 1 et 2 sont respectivement q1 ( p1 , p2 ) = a bp1 + dp2 et q2 ( p1 , p2 ) = a bp2 + dp1
avec b > d > 0 . Cette fonction de demande exprime l'ide selon laquelle la quantit
demande une firme est ngativement influence par l'augmentation du prix propos par
cette firme et positivement influence par l'augmentation du prix propos par l'autre firme. De
plus, le premier effet marginal est suprieur au second effet marginal.
La forme des fonctions de demande q1 ( p1 , p2 ) et q2 ( p1 , p2 ) fait bien ressortir l'interaction
stratgique existant entre les deux firmes puisque la quantit demande la firme 1 par
exemple est influence simultanment par le prix qu'elle propose et par le prix propose par la
firme 2. Toutes ces donnes sont connaissance commune et les firmes prennent leur dcision
de prix de faon simultane. Le concept d'quilibre appropri ce modle est donc bien
29
30
34
l'quilibre de Nash.31 L'objectif de chaque firme est la maximisation de son profit. Pour la
firme 1, on a donc :
d
1 ( p1 , p 2 ) = a 2bp1 + dp 2 + bc = 0 .32 Ceci permet
dp1
a + dp 2 + bc
d'obtenir la fonction de meilleure rponse p1* ( p2 ) de la firme 1 : p1* ( p 2 ) =
. La
2b
mme dmarche applique la firme 2 permet d'obtenir la fonction de meilleure rponse
a + dp1 + bc
p2* ( p1 ) de la firme 2 : p 2* ( p1 ) =
. L'quilibre de Bertrand est le vecteur de
2b
stratgies p1* , p2* , solution des deux quations suivantes :
a + dp2* + bc
p (p ) =
2b
a + dp1* + bc
p 2* ( p1* ) =
2b
*
1
*
2
La rsolution de ces quations montre que l'quilibre de Bertrand est le couple de stratgies
( p1* , p2* ) = 2ab+bcd , 2ab+bcd . Le schma ci-dessous est la reprsentation graphique de
p1
p2* ( p1 )
p1* ( p2 )
p * = ( p1* , p2* )
a + dp 2* + bc
p =
2b
*
1
a + bc
2b
a + bc
2b
p 2* =
a + dp1* + bc
2b
p2
Figure 2.2
31
32
35
Dans le cas de biens homognes, le modle de Bertrand dbouche sur un rsultat appel
paradoxe de Bertrand.33 Les biens produits par les deux firmes tant non diffrentiables, les
consommateurs dirigeront leur demande vers la firme ayant fix le prix le plus faible. Si les
deux firmes fixent le mme prix, alors elles se partageront le march galit. La quantit
demande la firme i a donc pour expression :
Q( pi ) si pi < p j
1
qi ( pi , p j ) = Q( pi ) si pi = p j
2
si pi > p j
0
Avec Q( pi ) reprsentant la quantit demande totale du march au prix pi . Dans ce jeu,
l'quilibre de Bertrand est tel que les deux firmes fixent un prix gal au cot marginal, c'est-dire que p1* = p2* = c . Pour faire ressortir ce rsultat, montrons tout d'abord qu' l'quilibre,
les deux firmes proposent le mme prix. Supposons le contraire, soit p1* > p2* > c .34 Dans ce
cas, la quantit demande la firme 1 est gale 0 et son profit est galement nul. La firme 1
a de ce fait intrt dvier vers un prix gal p 2* > c o est un scalaire positif petit. La
situation o p1* > p2* > c ne peut donc tre un quilibre. Ce dernier doit donc tre tel que les
deux firmes proposent le mme prix.
Supposons maintenant que ce prix est suprieur au cot marginal, soit p1* = p2* > c . Dans ce
1
cas, chacune des deux firmes reoit une demande gale Q ( p i ) avec i = 1 ou 2 et ralise un
2
profit positif. Pour un suffisamment petit, la firme 1 peut augmenter son profit en proposant
un prix gal p1* > c lui permettant d'obtenir toute la quantit du march.
Ainsi, la seule situation o cette dviation n'augmente pas le profit est celle o p1* = p2* = c
qui constitue donc l'quilibre de duopole de Bertrand. Le paradoxe de ce rsultat rside dans
le fait que le prix d'quilibre en situation de duopole est identique au prix d'quilibre obtenu
dans le cas de concurrence pure et parfaite.35
2.4.
La question tudie ici porte sur l'utilisation prive d'une ressource commune.36 On montre
dans ce cadre que la dcentralisation des dcisions, lorsque celles-ci sont bases sur des
incitations prives, conduit une surexploitation des ressources communes.37 En se basant sur
lexemple de la pche, Levhari et Mirman (1980) ont dmontr que lquilibre non coopratif
(quilibre de Nash) rsultant de linteraction des pays pcheurs entrane une consommation
prsente leve par rapport au stock de poisson. Ils ont galement montr quun quilibre
33
Dans le cas de biens homognes, le seul critre du choix de la firme par l'acheteur est le prix.
Le mme rsultat aurait t obtenu si on avait suppos p2* > p1* > c .
35
Voir J. Tirole (1988) pour une discussion de ce paradoxe et des possibles alternatives pour sa rsolution.
36
Ce modle a t utilis par A. Gliz (2004) dans le thme de la privatisation.
37
Cette question est connue comme tant le problme des commons. A ce propos, voir par exemple Gibbons
(1992), page 27 et Levhari et Mirman (1980).
34
36
coopratif entre les pays pcheurs permet dviter lextinction future du stock de poisson.
Lexplication de cette conclusion est que dans lquilibre non coopratif, chaque agent prend
une dcision individuellement optimale sans tenir compte du cot quil induit sur les autres
agents. Par contre, dans l'option centralise, la consommation du bien commun est plus faible
car l'autorit centrale internalise l'effet externe ngatif induit par la contrainte de la ressource
commune.
Pour faire ressortir ce rsultat, considrons le cas de l'utilisation par des fermiers d'une prairie
pour le pturage de leurs vaches. La prairie est un bien commun aux fermiers considrs. Soit
n le nombre de fermiers. Chaque fermier i peut possder un nombre de vaches gal bi . Le
nombre total de vaches est B = bi . Le cot d'achat et d'entretien d'une vache est c , suppos
i
le mme pour toutes les vaches et pour tous les fermiers. Le bnfice brut (ou revenu brut)
procur par le pturage de chaque vache est v(B) avec v(B) < 0 et v(B ) < 0 . La
reprsentation graphique de la fonction v(B) est la suivante :
v(B)
Bmax
Figure 2.3
La forme de la fonction v(B) signifie que si par exemple, le nombre total de vaches dans la
prairie devient lev, chacune des vaches ne disposera plus que d'une faible possibilit de
pturage, ce qui a pour consquence de rduire son rendement individuel.
Les fermiers choisissent simultanment et indpendamment l'un de l'autre le nombre de
vaches faire patre dans la prairie. En supposant que les vaches sont parfaitement divisibles,
l'espace des stratgies est donc bi [0, Bmax ] R + . L'utilit du fermier i est bi v(B ) cbi et son
programme est donc :
Pour que le profil de stratgies (b1* , L , bi* , L , bn* ) soit un quilibre de Nash, il faut que pour
tout i, bi* maximise l'utilit du fermier i, sachant que les autres fermiers choisissent
37
b*i = b1* ,L, bi*1 , bi*+1 ,L, bn* . La condition du premier ordre pour le programme du fermier i est
donc :
v bi + b*i + bi v bi + b*i c = 0
En raison des caractristiques v(B) < 0 et v(B ) < 0 , la condition du second ordre est
satisfaite. En substituant bi par bi* , la condition du premier ordre devient :
( )
( )
v B * + bi* v B * c = 0
Cette condition est valable pour tout fermier i. En sommant par rapport tous les fermiers, on
obtient :
nv(B * ) + B *v(B * ) nc = 0
En divisant ensuite par n, cette quation devient :
( )
v B* +
( )
1 *
B v B * c = 0
n
Cette quation reprsente l'quilibre de Nash sous une forme implicite. Considrons
maintenant l'alternative de la dcision centralise. Dans ce cas, il existe une autorit centrale,
suppose neutre et sans cot (c'est l'hypothse du bnvolat) qui choisit le nombre total de
vaches de faon maximiser une fonction objectif au niveau social. Soit B ** le nombre total
de vaches socialement optimal. Le nombre B ** est donc la solution du programme suivant :
Max Bv(B ) cB
B
v(B ** ) + B **v(B ** ) c = 0
Nous montrons que dans l'alternative centralise, le nombre de vaches est plus faible, c'est-dire B ** < B * . Pour cela, supposons le contraire. La vrification de ces deux conditions
d'optimalit entrane de faon vidente que B ** B * . Supposons donc que B * < B ** . La
figure 2.4 reprsente cette hypothse.
( ) ( )
( )
( ) ( )
Ainsi que le montre cette figure, si B* < B** , alors v B ** < v B* et v B ** < v B * < 0 .
B **v B ** < B *v B * < 0 .
Comme
B* < B** ,
on
a
Ceci
implique
que
1
1
B ** v (B ** ) < B * v (B * ) < 0 . On a finalement v(B ** ) + B ** v (B ** ) c < v(B * ) + B * v (B * ) c .
n
n
( )
38
On peut vrifier que la condition du second ordre est ici galement satisfaite.
38
Ceci constitue une contradiction car les conditions d'optimalit obtenues plus haut impliquent
1
l'galit v (B** ) + B**v(B** ) c = v (B* ) + B*v(B* ) c = 0 . En consquence, l'hypothse
n
*
**
B < B ne peut tre accepte. On a donc B ** < B * .
v(B)
v(B* )
v(B** )
B*
Figure 2.4 : La fonction
B **
Bmax
avec B < B
*
**
Lexplication de cette conclusion est la suivante : dans lquilibre non coordonn (non
coopratif), chaque fermier prend une dcision individuellement optimale sans tenir compte
du cot quil induit sur les autres fermiers. Lorsqu'un fermier trouve quil est bnfique pour
lui de possder une vache supplmentaire, il provoque, ce faisant, un cot supplmentaire
pour les autres fermiers et ce, travers la diminution de v(B) quil aura provoque. Dans ce
cas, lquilibre de Nash nest pas socialement optimal, car les fermiers ninternalisent pas les
effets externes ngatifs quils sinduisent les uns sur les autres. L'augmentation du bien-tre
induit par l'optique centralise s'explique donc par la capacit de coordination de l'autorit
centrale afin d'internaliser les effets externes. Lorsque le nombre de vaches est choisi de faon
dcentralise, il sensuit donc un plus fort effet de congestion sur la prairie et le cot ainsi
occasionn est un cot de non-coordination. Il faut cependant noter que cette conclusion peut
s'avrer inexact si le n + 1me ne se comporte pas en joueur neutre ou ncessite des cots de
fonctionnement trop importants.
2.5.
Le jeu de l'inspection
39
Joueur 1
NT
(x )
T (1 x )
(y)
Joueur 2
0 , h
w g , v w h
NI (1 y )
w , w
w g , v w
Figure 2.5
Ce jeu n'admet aucun quilibre de Nash en stratgies pures. Pour dterminer l'quilibre de
Nash en stratgies mixtes, dsignons par (x, 1 x) la stratgie mixte du joueur 1 avec x
reprsentant la probabilit de joueur NT et ( y, 1 y ) la stratgie mixte du joueur 2 avec y
reprsentant la probabilit de jouer I.
En jouant NT, le joueur 1 obtient un paiement espr gal 0. y + w.(1 y ) = w.(1 y ) . En
. 1 y ) = w g . On obtient la
jouant T, il obtient un paiement espr gal (w g ). y + (w g )(
stratgie mixte d'quilibre du joueur 2 lorsque les deux stratgies T et NT procurent au joueur
1 la mme esprance de paiement, soit lorsque w.(1 y ) = w g . On obtient ainsi g = y.w ,
g
soit y = .
w
Pour le joueur 2, la stratgie I permet d'obtenir un paiement espr de h x + (v w h)(1 x )
et la stratgie NI un paiement espr de w x + (v w)(1 x ) . On obtient la stratgie mixte
d'quilibre du joueur 1 lorsque les deux stratgies I et NI procurent au joueur 2 le mme
paiement espr, soit lorsque h x + (v w h)(1 x ) = w x + (v w)(1 x ) . On obtient ainsi
h
h = w x , soit x = .
w
Ainsi, l'quilibre de Nash, le principal choisit une probabilit d'inspection y telle que pour
l'agent, le cot de l'effort g soit gal au salaire espr w y . La probabilit d'inspection y est
donc croissante par rapport au cot de l'effort g et dcroissante par rapport au salaire w. En
d'autres termes, la frquence de l'inspection augmente pour les agents ayant une forte aversion
pour l'effort ou recevant un salaire faible.
De mme, l'quilibre de Nash, l'agent choisira une probabilit de ne pas travailler telle que
pour le principal, le cot d'inspection h soit gal au salaire espr w x . La probabilit de ne
pas travailler (tricher) x est donc croissante par rapport au cot de l'inspection et dcroissant
par rapport au salaire. En d'autres termes, la frquence de la tricherie de l'agent augmente avec
le cot (les difficults) de l'inspection ou la faiblesse du salaire.
Les quations g = y.w et h = w x impliquent qu' l'quilibre de Nash, on a
g h
= , soit :
y x
40
2.6.
L'exemple classique du jeu de coordination est le jeu intitul "la bataille des sexes". Ce
modle illustre galement le problme de la multiplicit de l'quilibre de Nash. Il s'agit d'un
jeu deux joueurs, Elle et Lui. Les deux joueurs (Elle et Lui) veulent aller ensemble un
spectacle mais n'ont pas les mmes prfrences propos de la nature du spectacle qui peut
tre le ballet (B) ou le football (F). Chaque joueur doit choisir indpendamment de lautre le
spectacle auquel il souhaite assister. Sil savre que les deux joueurs choisissent le mme
spectacle, Elle (Lui) obtient une utilit 2 sil sagit du ballet (football) et une utilit 1 sil
sagit du football (ballet). Si les deux joueurs ne choisissent pas le mme spectacle, chacun
deux obtient une utilit 0. La matrice des paiements de ce jeu est la suivante :
Lui
F
B
Elle
F
2,1
0,0
Figure 2.7
B
0,0
1,2
Ce jeu admet deux quilibres de Nash en stratgies pures, soit : (B, B) et (F, F). Il est dans ce
cas difficile de prvoir lequel de ces deux quilibres sera finalement retenu. Mme sil
nexiste pas une thorie tablie pour prdire lquilibre dun tel jeu, la littrature a retenu pour
cela le mcanisme du point focal introduit par Schelling (1960).40 Selon cet auteur, des
lments de l'environnement ou de l'histoire du jeu peuvent amener l'attention des joueurs se
focaliser sur un quilibre donn. Dans le jeu de la bataille des sexes, les deux joueurs se
focalisent sur un des deux quilibres de Nash en se rfrant des lments en dehors du jeu.
Par exemple, si les deux joueurs ont l'habitude d'alterner entre le football et le ballet et si la
fois prcdente le ballet a t choisi, alors l'quilibre de Nash le plus plausible est (F, F).
La possibilit de coordination en faveur d'un quilibre de Nash par la communication
pralable est galement une solution possible en cas de multiplicit des quilibres de Nash.
Pour montrer cela, considrons le jeu suivant :
Joueur 1
U
D
Joueur 2
L
R
800 , 800
800 , 0
0 , 800
1000 , 1000
Figure 2.8
Ce jeu admet deux quilibres de Nash, savoir (U, L) et (D, R). Si les deux joueurs pouvaient
se coordonner avant de jouer, ils devraient choisir l'quilibre (D, R) car il est Pareto dominant
par rapport l'autre quilibre (U, L). Mais sans communication pralable, les joueurs peuvent
tre tents de jouer U et L car ainsi, ils peroivent 800 de faon certaine. En d'autres termes,
l'quilibre (U, L) tout en tant Pareto domin par lquilibre (D, R) est moins risqu que ce
dernier. En effet, pour le joueur 1 (resp. 2), le choix de laction U (resp. L) lui procure un
paiement de 800 quelque soit le choix du joueur 2 (resp. 1).
40
Schelling, R. (1960). The Strategy of Conflict. Cambridge, Mass.: Harvard University Press.
41
La classe de jeux tudie aux chapitres 1 et 2 reprsente une version trs simplifie de la
ralit. Nous avons en particulier considr que le jeu se droule en une seule fois, excluant
ainsi la dimension du temps. Dans ce chapitre, nous introduisons le fait qu'en ralit, le jeu est
souvent soit rpt, soit jou de faon squentielle, ce qui donne la possibilit au moins l'un
des joueurs de ragir aux actions des autres joueurs aprs les avoir observes. Nous obtenons
ainsi des jeux dynamiques.
Tout en maintenant l'hypothse de l'information complte (c'est--dire que tous les joueurs
connaissent toutes les donnes du jeu : l'ensemble des joueurs, les ensembles de stratgies et
les fonctions de paiement), nous considrerons que l'information peut tre soit parfaite soit
imparfaite. Par information parfaite, nous entendons la situation o le joueur qui revient le
tour de jouer connat (observe et garde en mmoire) toute l'histoire du jeu. Par consquent,
l'information imparfaite dcrit la situation o, au moins un moment donn du jeu, le joueur
qui revient le tour de jouer ne connat pas toute l'histoire du jeu.
Pour dcrire un jeu dynamique, on utilise souvent un arbre de jeu qu'on appelle la forme
extensive du jeu. La dtermination de l'quilibre de Nash pour un jeu dynamique peut
cependant s'effectuer partir de la forme normale, mais cela ncessite l'utilisation d'une
nouvelle dfinition du concept de stratgie. La contribution majeure dans la classe des jeux
dynamiques est due Selten (1975)41 qui a permis lapplication du concept de lquilibre de
Nash aux jeux dynamiques. Ceci a t rendu possible par lintroduction dune nouvelle
dfinition de la notion de stratgie qui devient un plan d'actions complet indiquant les actions
du joueur en toute circonstance o il intervient. Un profil de stratgies dfinit donc une
trajectoire qui est la squence des choix des joueurs.
Une fois obtenue la forme normale d'un jeu, on peut rechercher le (s) quilibre (s) de Nash du
jeu. L'quilibre de Nash est dans ce cas une trajectoire telle que chaque point de cette
trajectoire, aucun joueur n'a intrt dvier. On parle dans ce cas, d'un quilibre de Nash
parfait ou simplement d'un quilibre parfait.
Nous verrons qu'une question centrale des jeux dynamiques est la crdibilit. En effet, dans
un jeu dynamique en information complte, l'quilibre de Nash tel que dfini pour un jeu
simultan en information complte n'est pas suffisant pour carter des stratgies non
crdibles. Ceci implique la ncessit d'un raffinement du concept d'quilibre de Nash
permettant ainsi d'liminer les quilibres de Nash non crdibles. Le raffinement ainsi introduit
a donn lieu l'mergence de l'quilibre de Nash parfait (Subgame-Perfect Nash Equilibrium
SPNE) ou tout simplement de l'quilibre parfait. L'quilibre parfait, plus restrictif que
l'quilibre de Nash, est bas sur le principe de la rationalit squentielle, principe selon lequel
un tel quilibre doit spcifier un comportement optimal partir de n'importe quel point du jeu.
On peut s'assurer de la satisfaction d'une telle restriction en utilisant la procdure de
rcurrence vers l'amont (Backwards Induction).42
41
Selten "A Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,"
International Journal of Game Theory, IV (1975), 25-55.
42
Appele galement induction rebours.
42
3.1.
La forme extensive
Dans le chapitre 1, nous avons introduit la forme normale pour reprsenter les jeux statiques
information complte. Dans le prsent chapitre, nous introduisons la forme extensive pour
reprsenter les jeux dynamiques. Nous montrerons ainsi comment reprsenter un jeu statique
par la forme extensive et un jeu dynamique par la forme normale. Nous verrons ainsi
comment un jeu statique information complte peut tre interprt comme tant un jeu
dynamique information imparfaite. Il peut tre cependant plus commode d'utiliser telle ou
telle forme pour reprsenter un jeu donn.
43
Voir par exemple Mas-Colell, Whinston and Green (1995). Page 219.
43
Joueur 1
L
Joueur 2
u1
u2
Joueur 2
3
1
1
2
U
2
1
D
0
0
Figure 3.1
Ce schma montre que l'arbre de jeu (la forme extensive du jeu) commence par un nud de
dcision du joueur 1 lorsque le tour de jouer lui revient. Ici, il a choisir entre les actions L et
R. Par la suite apparaissent deux autres nuds de dcision o, aprs avoir observ le choix du
joueur 1, il revient au joueur 2 de choisir entre les actions U et D. A la fin de chaque
combinaison disjointe de choix, on a un nud final qui indique la fin du jeu et o apparaissent
les paiements des joueurs.
L'exemple de cet arbre de jeu reprsente un jeu dynamique information complte et parfaite,
c'est--dire un jeu o 1) les joueurs jouent de faon squentielle et 2) chaque tape du jeu,
tous les prcdents choix sont connaissance commune.
44
On aurait eu galement le mme rsultat si le prisonnier 2 avait jou en premier et le prisonnier 1 en second
avec toujours la mme condition de non observation du choix du joueur ayant jou en premier.
44
Prisonnier 1
Ne pas avouer
Avouer
Prisonnier 2
Ne pas avouer
Avouer
Figure 3.2
On remarque ainsi que les deux jeux dynamiques prcdemment dcrits (figures 3.1 et 3.2)
sont similaires en tout point, sauf concernant l'observabilit de l'action choisie lors de la
premire tape avant le choix de la deuxime tape. L'information disponible pour le joueur
devant jouer est donc cruciale pour la description d'un jeu. Pour reprsenter l'tat des
connaissances des joueurs (ce quils savent et ce quils ne savent pas), on utilise la notion
d'ensemble d'information.
Dfinition de l'ensemble d'information : Un ensemble d'information pour un joueur est une
collection de nuds de dcision ayant les caractristiques suivantes :
- Le joueur joue l'un des nuds de dcision inclus dans l'ensemble d'information ;
- Lorsque le jeu atteint un nud de dcision l'intrieur d'un ensemble
d'information, le joueur qui doit jouer ne sait pas quel est le nud de dcision qui est
atteint.
Notons que la seconde condition de cette dfinition implique que les nuds de dcision inclus
dans un ensemble d'information doivent avoir les mmes actions possibles, sinon le joueur
peut infrer sur le nud de dcision atteint partir des actions qu'il peut choisir. Pour
exprimer l'ide que des nuds de dcision font partie d'un mme ensemble d'information, on
les entoure avec la mme ellipse, comme il ressort dans la figure 3.2 reprsentant la forme
extensive du jeu (simultan) du dilemme du prisonnier. Cette reprsentation de l'ensemble
d'information du prisonnier 2 signifie que ce dernier ne sait pas quel nud de dcision de cet
ensemble est atteint. Tout ce qu'il sait est que le prisonnier 1 a choisi l'une des deux actions
possibles (ne pas avouer, avouer).
Considrons un autre exemple (en ngligeant les paiements) pour illustrer comment utiliser le
concept densemble dinformation pour dcrire ltat des connaissances dun joueur au
moment o il joue.
1. Le joueur 1 choisit une action a1 de l'ensemble des actions A1 = (L, M , R )
2. Le joueur 2 observe si a1 = L ou non et choisit une action a2 de l'ensemble des actions
A2 = (U , D) .
La forme extensive de ce jeu est donne par la figure 3.3.a :
45
Joueur 1
M
L
Joueur 2
U
Joueur 1
R
Joueur 2
D U
D U
Figure 3.3.a
Joueur 2
U
Joueur 2
D
Joueur 3
ba
Joueur 3
ba
Figure 3.3.b
45
46
La restriction c) signifie que si un nud y se trouve la suite du nud x, alors tous les nuds
inclus dans l'ensemble d'information contenant y doivent se trouver galement la suite du
nud x. Une consquence de la condition c) est la suivante : un sous-jeu est tel que tout
nud y suivant le nud x, le joueur qui doit jouer sait que le nud x a t atteint.
Pour illustrer cette dfinition, considrons le jeu dynamique information imparfaite dcrit
dans la figure 3.3.b dans lequel, au moment de joueur, le joueur 3 observe si (a1 , a2 ) = (R, D)
ou non et choisit une action a3 de A3 = (a, b ) .
Dans ce jeu, il n'existe qu'un seul sous-jeu, celui correspondant au nud de dcision du joueur
3 suivant les dcisions R et D. Ainsi, la partie de l'arbre de jeu commenant par le noeud de
dcision du joueur 2 suivant L ne constitue pas un sous jeu car lensemble dinformation qui
suit contient un nud de dcision qui est successeur du choix de R et non de L. La restriction
c) interdit galement de considrer ce nud comme un sous-jeu.
3.2.
Dans un jeu squentiel information complte et parfaite, les joueurs jouent tour de rle. Au
moment de choisir, chaque joueur connat parfaitement lhistoire du jeu. La mthode de
rcurrence vers lamont (Backward Induction) permet de trouver la squence optimale du
jeu.46
Max u 2 (a1 , a2 )
a2A2
46
Voir K. Binmore pour une discussion critique de la relation entre rationalit et mthode de rcurrence vers
lamont.
47
Remarquons que nous n'avons pas utilis le concept d'quilibre de Nash, car la mthode de rcurrence vers
l'amont n'est pas dfinie en termes de stratgies mais en termes d'actions.
47
En supposant, pour simplifier, que cette meilleure rponse est unique, on a donc
a2* = MR2 (a1 ) .48 Etant dans un cadre d'information complte, le joueur 1 connat u 2 (a1 ,a2 ) la
fonction de paiement du joueur 2 et sait qu'il est rationnel. Le joueur 1 peut donc anticiper
MR2 (a1 ) la meilleure rponse du joueur 2. Il intgrera donc MR2 (a1 ) dans son programme.
De ce fait, le joueur 1 choisit son action qui soit la solution du programme suivant :
En supposant encore que ce problme de maximisation n'admette qu'une seule rponse a1* ,
( ))
alors a1* , MR2 a1* est l'issue du jeu selon la mthode de Rcurrence vers l'amont. Notons
que la solution obtenue par la mthode de Rcurrence vers l'amont n'inclut aucune menace
non crdible du joueur 2. En d'autres termes, le joueur 1 n'a aucune croyance selon laquelle,
aprs avoir observ a1 , le joueur 2 n'agira pas dans son propre intrt.
Pour montrer comment obtenir la solution d'un jeu squentiel information complte et
parfaite par la mthode de rcurrence vers l'amont, considrons le jeu dcrit par la figure 3.1.
Etant donnes les hypothses de rationalit et de connaissance commune, le joueur 1 sait que
s'il choisit L , la meilleure rponse du joueur 2 sera de jouer D car il obtient ainsi un
paiement de 2 au lieu de 1. De mme, il sait que s'il joue R , la meilleure rponse du joueur 2
sera de choisir U car lui procurant un paiement de 2 au lieu de 0. Etant donnes ces
anticipations, on peut remplacer le jeu de la figure 3.1 par la forme extensive rduite suivante
:
Joueur 1
L
1
2
2
1
Figure 3.4
Cette forme rduite est obtenue aprs avoir remplac chacun des sous-jeux du joueur 2 (lun
dbutant aprs laction L et lautre aprs laction R) par les paiements rsultants du choix
optimal du joueur 2. Le meilleur choix pour le joueur 1 est de jouer R . La figure suivante
rsume l'issue du jeu obtenue par la mthode de Rcurrence vers l'amont.
48
MR1 (a 2 ) est la fonction (ou correspondance) de meilleure rponse du joueur 1 laction a 2 du joueur 2. Au
48
1
L
2
U
3
1
2
D
1
2
2
1
0
0
Figure 3.5
D'une faon gnrale, la procdure de Rcurrence vers l'amont s'applique la classe des jeux
finis information parfaite.
49
49
P
a
P(Q) = a bQ
ab
Figure 3.6
d 2
= a bq1 2bq2 c = 0
dq2
Ce qui donne q2* = MR2 (q1 ) =
a bq1 c
.
2b
) )
a bq1 c
2
d 1 a 2bq1 c
=
=0
dq1
2
a bq1* c a c
ac
=
et donc q2* = MR2 q1* =
. La solution du modle
2b
4b
2b
ac ac
de duopole de Stackelberg est donc q1* , q 2* =
,
.
4b
2b
( )
50
En comparant par rapport au rsultat du modle de Cournot, on peut remarquer que la quantit
ac
choisie par le leader q1* =
est suprieure la quantit choisie par chaque firme en
2b
ac
, elle-mme suprieure la quantit choisie par
situation de choix simultans q1* = q 2* =
3b
ac
.
le follower q 2* =
4b
La quantit totale produite dans le choix squentiel, Qs* = q1* + q 2* =
3(a c )
est suprieure
4b
2(a c )
. Comme consquence, le
3b
prix de march dans le modle de Stackelberg est infrieur au prix de march correspondant
au modle de Cournot. Il en rsulte que par rapport la situation de choix simultans, le
follower obtient un profit infrieur.
Dans ce modle, la firme 2 (follower) voit son profit diminuer par rapport la situation de
choix simultans. Dans le jeu squentiel information parfaite, la firme 2 observe l'action de
la firme 1 et prend une dcision optimale en tenant compte de la dcision de la firme 1. La
rduction de son profit provient donc du fait que la firme 1 sait que la firme 2 observe sa
dcision et que cette dernire devient une donne pour la firme 2. La firme 1 est donc moins
contrainte, ce qui lui permet d'amliorer sa situation au dtriment de celle de la firme 2. Le
fait donc de joueur en premier devient favorable, mais la condition que le joueur 2 (le joueur
jouant en second) observe la dcision du joueur 1 (le joueur jouant en premier) et que le
joueur 1 sait que le joueur 2 observe la dcision du joueur 1 et en tiendra compte pour prendre
sa propre dcision.
La comparaison entre le modle de Stackelberg et le modle de Cournot montre l'importance
de la question de savoir "qui joue en premier". En d'autres termes, cette question n'est pas
neutre. Par exemple, dans la conqute d'un nouveau march, l'entreprise qui se positionne en
premier a de ce fait un avantage par rapport aux entreprises qui s'installent par la suite.
3.3.
L'quilibre de Nash a t dfini et dmontr pour des jeux sous forme normale, c'est--dire
des jeux simultans information complte. Lorsque le jeu est dynamique, la simultanit des
choix n'est plus possible, car au moins l'un des joueurs a l'opportunit de ragir aux choix des
autres joueurs. Il est cependant possible d'utiliser le concept de l'quilibre de Nash, mais en
utilisant une nouvelle dfinition de la notion de stratgie. Cette dfinition doit pouvoir rtablir
la simultanit du choix des joueurs. Mais, l'application tel quel de l'quilibre de Nash aux
jeux dynamiques ne permet pas toujours d'carter des quilibres non crdibles. Pour liminer
ces derniers, on introduit un raffinement de l'quilibre de Nash et on obtient ainsi l'quilibre
de Nash parfait. Il sagit de la perfection en sous-jeux (subgame perfection).
Pour qu'un profil de stratgies soit un Equilibre de Nash Parfait, il faut non seulement qu'il
soit un quilibre de Nash, mais galement il faut qu'il satisfasse une contrainte
51
50
Selten, R. (1975). "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games".
International Journal of Game Theory. Vol. 4. P 25-55.
52
Avec ces nouveaux espaces de stratgies des 2 joueurs, on obtient la forme normale du jeu
dynamique de la figure 3.1 laquelle on peut appliquer la procdure de recherche de
l'quilibre de Nash.
Joueur 2
Joueur 1
L
R
(U , U)
3;1
2;1
(U , D)
3;1
0;0
(D , U)
1;2
2;1
(D , D)
1;2
0;0
Figure 3.7
La rsolution du jeu en utilisant la forme normale fait apparatre deux quilibres de Nash :
(R, (D, U )) et (L, (D, D)) . L'quilibre de Nash (R, (D, U )) correspond la trajectoire en gras
de la figure 3.8a.
Le profil de stratgies (R, (D, U )) est un quilibre de Nash parfait pour deux raisons : 1)
L'quilibre de Nash (R, (D, U )) spcifie une stratgie complte (une action pour chaque
contingence) pour le second joueur ; 2) Cet quilibre constitue un quilibre de Nash dans tous
les sous-jeux du jeu.52
51
52
53
L
2
3
1
1
2
U
2
1
0
0
3
1
1
2
Figure 3.8a
D
2
1
0
0
Figure 3.8b
Le deuxime quilibre de Nash (L, (D, D )) est dcrit dans la figure 3.8b. Dans cet quilibre, le
joueur 2 choisit D quelque soit le choix du joueur 1. Dans cette ventualit, le meilleur choix
du joueur 1 est L obtenant ainsi le paiement de 1 au lieu de 0. Mais cet quilibre n'est pas un
quilibre de Nash parfait car les stratgies des joueurs ne sont pas des quilibres de Nash dans
tous les sous-jeux. En effet, l'action D du joueur 2 faisant suite l'action R du joueur 1 n'est
pas la meilleure rponse du joueur 2. En effet, aprs R, la meilleure rponse du joueur 2 est U.
Autrement dit, l'action D si le joueur 1 choisit R n'est pas une action (ou menace) crdible. De
ce fait, l'issue (L, (D, D )) n'est pas un quilibre de Nash parfait, car il n'est pas un quilibre de
Nash dans tous les sous-jeux.
Relevons la diffrence existant entre l'issue obtenue par la mthode de Rcurrence vers
l'amont (figure 3.5) et l'quilibre de Nash parfait (figure 3.8a). Mme si les deux
mthodologies aboutissent au mme rsultat (le joueur 1 joue R et obtient un paiement de 2
et le joueur 2 joue U et obtient un paiement de 1), l'quilibre de Nash parfait s'exprime en
termes de stratgies alors de la rcurrence vers l'amont s'exprime en termes d'actions.
53
54
Firme E (joueur 1
Out
In
Firme I
Hostile si
la firme E
choisie "In"
Tolre si
la firme E
choisie "In"
Out
0;2
0;2
In
-2 ; 0
1;1
Firme I (joueur 2)
0
2
Hostile
-2
0
Tolre
Firme E
1
1
Figure 3.9b
Figure 3.9a
En se basant sur la forme normale, on relve que ce jeu admet deux quilibres de Nash :
s E* , s I* = (Out , Hostile si la firme E choisit "In") ;
-
(
(s
*
E
)
, s ) = (In , Tolrer si la firme E choisit "In").
*
I
L'analyse du jeu partir de la forme extensive montre cependant que le premier quilibre n'est
pas une prdiction raisonnable. En effet, cette forme de prsentation du jeu fait bien ressortir
que si la firme E choisie "In", alors la meilleure rponse de la firme I est de tolrer car elle
obtiendra ainsi un paiement de 1 au lieu de 0. En d'autres termes, la stratgie de la firme I "
Hostile si la firme E choisie "In"" n'est pas crdible.
La crdibilit est ainsi une restriction naturelle imposer lquilibre de Nash. Elle consiste
carter les quilibres de Nash (qui sont dtermins partir de la forme normale) qui spcifie
une action non optimale de lun quelconque des joueurs. Dans ce jeu, le seul quilibre de
Nash parfait est donc le profil de stratgies (In, Tolrer si la firme E choisit "In").
Ainsi, pour liminer les prdictions non raisonnables (ici, le profil de stratgies (out, Hostile si
la firme E choisie "In")) les stratgies jouer l'quilibre doivent satisfaire la principe de la
rationalit squentielle. Pour qu'un quilibre soit acceptable, il doit spcifier des actions
optimales en tout point du jeu. Il s'agit d'une condition supplmentaire qui est l'exigence de
rationalit squentielle. En d'autres termes, lorsqu'il revient un joueur le tour de jouer, sa
stratgie doit tre optimale partir de ce point tant donne l'information dont il dispose sur
les stratgies des autres joueurs.
Pour identifier les quilibres de Nash dsirables, c'est--dire les quilibres de Nash satisfaisant
la condition de rationalit squentielle, on dtermine la stratgie optimale partir de la fin de
l'arbre de jeu. On obtient ensuite la stratgie optimale l'tape antrieure tant donn le
rsultat de la dernire tape et ainsi de suite jusqu'au dbut du jeu. Cette procdure de
Rcurrence vers l'amont (Backwards Induction) est drive directement de la condition de
rationalit squentielle car elle assure que les stratgies des joueurs sont optimales chaque
tape du jeu.
Pour dterminer un quilibre de Nash parfait, on commence donc par identifier les plus petits
sous-jeux contenant les nuds terminaux. On remplace par la suite ces plus petits sous-jeux
par les paiements correspondant l'quilibre de Nash. Les nuds initiaux de ces sous-jeux
deviennent les nuds terminaux du jeu tronqu des plus petits sous-jeux. On renouvelle la
55
mme procdure pour le nouveau jeu (le jeu tronqu). En appliquant cette mthode de
Rcurrence vers l'amont pour tout l'arbre de jeu, on obtient l'quilibre de Nash parfait (SPNE)
car les stratgies des joueurs constituent un quilibre de Nash dans tous les sous-jeux.
Dans le jeu de prdation, on peut donc remplacer le sous-jeu de la firme I par son rsultat.
Comme le montre la figure 3.10, on obtient ainsi la forme extensive rduite du jeu o le choix
optimal de la firme E, "In", devient plus ais dterminer.
Firme E
Out
In
0
2
1
1
Figure 3.10
3.4.
Jeux rpts
Dans un jeu squentiel, les joueurs jouent tour de rle. Dans un jeu rpt, les joueurs jouent
simultanment de faon rpte. Un des principaux thmes de la rptition d'un jeu est qu'une
menace / promesse future crdible peut avoir une influence sur le comportement prsent. La
rptition du jeu peut donc changer lquilibre du jeu. On montrera par exemple comment et
dans quelles conditions la rptition du jeu du free riding (ala moral) favorise t-elle la
coopration entre les joueurs.
Pour faire ressortir ces implications, nous commencerons par le cas d'un jeu rpt deux fois,
puis nous aborderons le cas d'un jeu infiniment rpt. Notons par G(T ) , le jeu simultan G
rpt T fois et o l'issue de toutes les tapes passes est observe par les joueurs avant le
droulement de n'importe quelle tape. De mme, notons par G(, ) , le jeu G(T ) avec
T et o les joueurs ont en commun le facteur d'actualisation subjectif . Avec r > 0
1
reprsentant le taux dintrt subjectif, on a =
. Le facteur dactualisation subjectif
1+ r
reprsente donc limpatience de la consommation des individus, cest--dire la prfrence des
individus pour la consommation prsente la consommation future.
54
Il sagit du jeu reprsent dans la figure 1.1 en ayant rajout 8 chaque paiement. Lobjectif recherch est
seulement dobtenir une prsentation plus commode avec des nombres non ngatifs. On peut aisment montrer
que lquilibre dun jeu ne change pas lorsquon rajoute le mme scalaire identiquement tous les paiements
dun jeu.
56
Prisonnier 1
Ne pas avouer
Avouer
Prisonnier 2
Ne pas avouer
6,6
7,0
Figure 3.11
Avouer
0,7
3,3
Considrons maintenant que ce jeu est jou une deuxime fois par les mmes joueurs qui
auront pralablement observ le rsultat de la premire issue du jeu.
Pour dterminer l'quilibre parfait, on suivra la procdure de Rcurrence vers l'amont
(Backwards Induction). On dtermine en premier lieu l'quilibre de la deuxime tape et son
rsultat sera intgr au jeu de la premire tape. Les deux joueurs anticipant le rsultat de la
seconde tape, soit (Avouer, Avouer) avec un paiement pour les deux joueurs gal (3, 3), le
dilemme du prisonnier jou 2 fois revient au jeu suivant jou une seule fois :
Prisonnier 1
Ne pas avouer
Avouer
Prisonnier 2
Ne pas avouer
9,9
10 , 3
Figure 3.12
Avouer
3 , 10
6,6
Les lments de la matrice des paiements de ce jeu sont les lments de la matrice des
paiements du jeu du dilemme du prisonnier auxquels on rajoute les paiements (3, 3), rsultat
de l'quilibre de Nash de la seconde tape (on nglige ici l'actualisation des paiements futurs).
Ce dernier jeu admet un seul quilibre de Nash, soit le profil de stratgies (Avouer, Avouer)
avec un paiement pour les deux joueurs gal (6, 6). Ainsi, l'unique quilibre parfait du
dilemme du prisonnier jou deux fois est le profil de stratgies (Avouer, Avouer) la
premire et la seconde tapes.
Proposition : Si le jeu G admet un quilibre de Nash unique, alors pour tout T fini, le jeu G(T)
admet un seul quilibre parfait : l'quilibre de Nash du jeu G est jou chaque squence.
L'exemple du dilemme du prisonnier rpt deux fois prsente la caractristique particulire
selon laquelle le jeu n'admet qu'un seul quilibre de Nash en stratgies pures. L'implication de
cette dernire est que le jeu rpt 2 (ou T) fois n'admet qu'un seul quilibre parfait dans
lequel l'quilibre de Nash du jeu est rpt 2 (ou T) fois.
57
A titre dillustration, considrons le jeu de free riding (ala moral) du chapitre 1 dans lequel
chacun des deux joueurs a le choix entre travailler et ne pas travailler (tricher). Rappelons que
la matrice des paiements de ce jeu est la suivante :
Joueur 1
Travailler
Tricher
Joueur 2
Travailler
1,1
2 , -1
Tricher
-1 , 2
0,0
Figure 3.13
Considrons que ce jeu soit rpt un nombre infini de fois et quil soit information parfaite,
c'est--dire qu'avant de jouer la tme tape, les deux joueurs observent (et gardent en
mmoire) le rsultat de toutes les (t-1) tapes prcdentes.
En appelant t le paiement reu l'tape t et < 1 le facteur d'actualisation subjectif,
suppos constant et commun aux deux joueurs, la valeur actuelle des paiements d'un jeu
infiniment rpt est :
1 + 2 + 2 3 + L = t 1 t
t =1
Nous montrons que dans ce jeu rpt infiniment, la coopration entre les joueurs toutes les
tapes du jeu peut tre la solution optimale. En d'autres termes, bien que (Tricher, Tricher)
soit l'unique quilibre de Nash du jeu jou une seule fois, les joueurs peuvent choisir
(Travailler, Travailler) toutes les tapes du jeu infiniment rpt. Ce rsultat se base sur
l'ide selon laquelle si les joueurs jouent la coopration aujourd'hui, alors les quilibres futurs
procureront des paiements levs. Sinon, les quilibres futurs procureront des paiements
futurs plus faibles. Considrons pour cela la stratgie suivante du joueur i :
Jouer Travailler la premire tape. A ltape t, jouer encore
Travailler si le rsultat des (t-1) prcdentes tapes est (Travailler,
Travailler). Sinon jouer Tricher .
Cette stratgie est un exemple de stratgie de coopration (trigger strategy).55 Le joueur i
coopre jusqu' ce qu'il constate que l'autre joueur ne coopre plus. Si les deux joueurs
adoptent cette stratgie, alors ils recevront un paiement gal 1 toutes les tapes du jeu
infiniment rpt. Nous montrons que, la condition que le facteur d'actualisation soit
suffisamment proche de 1, jouer la stratgie de coopration par les deux joueurs constitue un
quilibre de Nash du jeu infiniment rpt. De plus, cet quilibre de Nash est parfait
(Subgame-perfect).
Pour montrer que la stratgie de coopration (trigger strategy) est un quilibre de Nash,
supposons que le joueur 2 a adopt cette stratgie de coopration. Nous montrons alors que (
la condition que le facteur d'actualisation soit suffisamment proche de 1), la meilleure
rponse du joueur 1 est d'adopter lui galement cette stratgie. Etant donn que le joueur 2
choisit de cooprer, si le joueur 1 accepte de cooprer, il recevra un paiement gal 1 toutes
les tapes du jeu infiniment rpt.
55
58
Vc = 1 + 1 + 1 2 + L = 1 + + 2 + L =
1
1
L'autre possibilit est la dviation vers la non coopration. Considrons que cette dviation
commence ds la premire tape.56 Dans cette alternative, le joueur 1 joue Tricher, ce qui lui
donne un paiement gal 2, car l'issue est (Tricher, Travailler). L'issue de cette premire
phase tant diffrente de (Travailler, Travailler), le joueur 2, conformment la stratgie de
coopration, jouera Tricher toutes les tapes futures. La meilleure rponse du joueur 1 est
dans ce cas Tricher, ce qui lui donne un paiement de 0 la deuxime tape et toutes les
tapes venir. Ainsi, en choisissant de ne pas cooprer, le joueur 1 obtient un paiement de 2
la premire phase et un paiement de 0 pour toute la dure restante (infinie) du jeu. La valeur
actuelle de ces paiements est :
Vnc = 2 + 0 + 0 2 + L = 2
Ainsi, tant donn que le joueur 2 adopte la stratgie de coopration, la meilleure rponse du
1
joueur 1 est galement la stratgie de coopration si et seulement si Vc > Vnc , soit si
> 2.
1
1
Cette condition implique > , soit r < 1 .
2
Ainsi, choisir Travailler la premire phase et galement toutes les phases ultrieures ( la
condition d'avoir observ (Travailler, Travailler) lors des tapes prcdentes est la meilleure
1
rponse du joueur 1 la stratgie de coopration du joueur 2 si et seulement si > . La
2
mme dmarche s'applique au joueur 2. En conclusion, l'issue (Travailler, Travailler) toutes
1
les phases du jeu est un quilibre de Nash du jeu infiniment rpt si et seulement si > .
2
La stratgie de coopration consiste pour chaque joueur prendre l'initiative de la coopration
et poursuivre la coopration si l'autre joueur a galement fait le premier pas de la coopration.
Cette initiative comporte une menace crdible de retourner la non coopration si l'autre
joueur n'a pas pris l'initiative de la coopration. La crdibilit de cette menace provient du fait
que la non coopration pour le jeu statique G est un quilibre de Nash.
Chacun des deux joueurs dispose donc de deux alternatives (cooprer et ne pas cooprer)
reprsentant deux sries de revenus (utilits) futurs infinis. Pour les comparer, considrons la
diffrence de revenus (utilits) de la troisime alternative (fictive) reprsentant la diffrence
"Cooprer Ne pas cooprer" telle qu'elle apparat dans la figure ci-dessous :
56
On peut montrer que le rsultat ne change pas si la dviation apparat une tape ultrieure.
59
t=
Cooprer
Ne pas cooprer
"Cooprer Ne pas
cooprer"
-1
+1
+1
+1
Figure 3.14
1
La valeur Actuelle Nette de cette troisime alternative (fictive) est gale 1 + . De ce fait,
r
la coopration, soit l'issue (travailler, travailler) toutes les tapes devient prfrable pour les
1
deux joueurs si 1 + > 0 , c'est--dire si r < 1. Un taux d'intrt subjectif faible (en fait ici
r
infrieur 1) signifiant une plus forte prfrence pour la consommation future, la stratgie de
coopration est un quilibre de Nash lorsque l'impatience pour la consommation prsente est
faible.
60
1
Tricher
Travailler
2
Tricher
Travailler
Tricher
Travailler
Figure 3.15
Si les deux joueurs adoptent la stratgie de coopration dans le jeu infiniment rpt, alors :
- Dans les sous-jeux du premier groupe, la stratgie des deux joueurs est galement
la stratgie de coopration qui, comme on l'a montr, est un quilibre de Nash ( la
1
condition que > ) ;
2
- Dans les sous-jeux de la seconde catgorie, les deux joueurs vont rpter
infiniment (Tricher, Tricher), qui constitue galement un quilibre de Nash.
Ainsi, la stratgie de coopration est un quilibre de Nash parfait du jeu de free riding rpt
infiniment.
Comme soulign plus haut, le jeu de free riding (ala moral) est un cas du modle du dilemme
du prisonnier dont la reprsentation gnrale est, avec < < < .
Joueur 1
Joueur 2
Travailler
,
Travailler
tricher
Tricher
,
Figure 3.12
Dans ce cas, on a Vc = + + 2 + L =
condition Vc > Vnc scrit
> +
et Vnc = + + 2 + L = +
. La
Nash du jeu G et (x1 ,L, xn ) un vecteur quelconque des paiements des n joueurs appartenant
57
Friedman, J. (1971). A non-cooperative Equilibrium for Supergames. Review of Economic Studies. Vol. 38.
P 1-12.
61
l'ensemble des paiements ralisables du jeu G. Si xi > ei pour tout joueur i, et si le facteur
d'actualisation est suffisamment proche de 1, alors il existe un quilibre de Nash parfait
(Subgame Perfect Nash Equilibrium SPNE) du jeu infiniment rpt G(, ) qui permet
d'obtenir le vecteur (x1 ,L, xn ) comme paiements moyens des n joueurs.58
lorsque Qm =
ac
.
2
Etant donn que QC > Qm , chacune des deux firmes peut obtenir un profit plus lev si elle
Qm a c
=
au lieu de la quantit de
2
4
Q
(a c )2 et en cas de
ac
. (En cas de quantit m , le profit de l'entreprise est
Cournot qC =
3
2
8
quantit QC , il est de
62
m
2
Qm a c
=
,
2
4
gal :
2
Qm
a c (a c )
ac
a c
= (Pm c )
= ((a Qm ) c )
= a
c
=
2
2
2
8
4
4
Nous avons dj vu que, lorsque chacune des deux firmes produit la quantit de Cournot, elles
2
(
a c)
obtiennent chacune un profit gal C =
.
9
Dterminons maintenant le profit que peut obtenir la firme j si elle dviait de la moiti de la
quantit de monopole
Qm
Q
sachant que l'autre firme choisit de produire m . Etant donn que
2
2
quelque soit le niveau de cette dviation, l'autre firme aura toujours la mme raction, c'est-dire revenir la quantit de Cournot, la firme j choisit la dviation qui maximise son profit,
c'est--dire la quantit qui satisfait le programme suivant :
1
Max a q j Qm c q j
2
qj
La solution est q j =
3(a c )
et le profit rsultant de cette dviation est :
8
3(a c ) 9(a c )
3(a c ) a c
+
d = a
c
=
4
64
8
8
, soit si et seulement si :
C < m
d +
1
2
1
(a c ) 1
(a c )
9(a c )
<
+
64
1
9
8 1
2
8
9
, soit r < 0,9 .
17
9
En suivant la mme dmarche que dans le cas du dilemme du prisonnier infiniment rpt, on
montre que la collusion est un quilibre de Nash parfait, car elle constitue un quilibre de
Nash dans tous les sous-jeux.
63
4.1.
Dans ce chapitre, nous abordons les jeux information incomplte, cest dire les jeux o au
moins un joueur i a une caractristique pertinente pour le jeu qui est son information prive.
Cette caractristique, symbolise par ti , nest pas observable par les autres joueurs.
Les deux exemples de cette section font ressortir trois caractristiques importantes des jeux
statiques en information incomplte :
Le joueur i a une information prive ti quil est le seul observer. Les autres
joueurs ont des croyances propos de cette information prive, croyances
reprsentes par une distribution de probabilit dont le support est ti .
La stratgie des joueurs dpend de leur type, ce qui donne l'expression si (ti ) .
Le paiement prend la forme d'une esprance de paiement (esprance dutilit).
59
Sauf videmment en cas de collusion entre cet enchrisseur et le vendeur ou des autres acheteurs.
Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
June 1995.
60
64
Travailler
Ne pas travailler
Travailler
1;1
0 ; -1
Ne pas travailler
-1 ; 2
0;0
Figure 4.1a
61
Harsanyi, John. Games with Incomplete Information Played by Bayesian Players . Management Science,
I, II et III. 1967, 1968.
62
Rappelons que linformation est imparfaite lorsque le joueur ne connat pas toute lhistoire du jeu.
63
Ce modle est une variante du modle du dilemme du prisonnier avec incertitude sur les prfrences. Voir
Mas-Colell, Whinston & Green (1995).
65
Joueur 2
Joueur 1
Travailler
1;1
0 ; -1
Travailler
Ne pas travailler
Ne pas travailler
-1 ; 0
0 ; -2
Figure 4.1b
Suivant la dmarche de Harsanyi, ce jeu statique information incomplte peut tre interprt
comme tant un jeu dynamique information imparfaite. Ainsi, la premire tape (premier
mouvement) du jeu est ralise par la Nature qui il revient de choisir par tirage alatoire du
type (I ou II) du joueur 2. Ce mouvement est observ par le joueur 2, c'est--dire que ce
joueur connat son type. Mais le joueur 1 n'observe pas le choix de la nature. Tout au plus, il
dispose des croyances ( , 1 ) propos du choix alatoire de la Nature. Lintroduction de la
Nature permet de modliser une situation o le joueur 2 connat son type (I ou II) et le joueur
1 ne connat pas le type du joueur 2 mais sait que le joueur 2 peut tre du type I avec
probabilit ou du type II avec probabilit (1 ) . La reprsentation de ce jeu sous la forme
extensive est la suivante :
Nature
Type I
Joueur 1
Type II
NPT
NPT
Joueur 2
T
1
1
Joueur 2
NPT
-1
2
T
0
-1
Jeu simultan
Joueur 1
Joueur 2 (type I)
T
NPT
T
1;1
-1 ; 2
NPT
0 ; -1
0;0
Figure 4.2 b
NPT
0
0
NPT
1
1
-1
0
Figure 4.2 a
T
0
-1
NPT
0
-2
Jeu simultan
Joueur 1
Lellipse de haut signifie que le joueur 1 ne connat pas le rsultat du tirage alatoire de la
Nature. La rsolution du jeu commence par le joueur 2. Celui-ci connat son type (observe le
choix de la Nature). S'il est du type I, il choisira de ne pas travailler (stratgie strictement
dominante) et s'il est du type II, il choisira de travailler (stratgie strictement dominante). En
d'autres termes, le choix de la stratgie par le joueur i dpend de son type, d'o l'criture de la
66
stratgie du joueur i sous la forme si (ti ) . Etant donns ces choix du joueur 2, la forme
extensive du jeu se rduit :
Nature
Type I
T
-1
2
Joueur 1
Type II
NPT
0
0
Figure 4.3
1
1
NPT
0
-1
Se basant sur ses croyances, le joueur 1 choisit l'action qui maximise son esprance de
paiement. Le choix de la stratgie "travailler" lui donne une esprance de gain gale
1 + 1 (1 ) = 1 2 . Le choix de la stratgie "ne pas travailler" lui donne une esprance
de paiement gale 0 + 0 (1 ) = 0 . L'individu choisira de travailler si 1 2 > 0 , soit si
1
1
1
< et choisira de ne pas travailler si 1 2 < 0 , soit si > . Si = , l'individu 1 sera
2
2
2
indiffrent entre travailler et ne pas travailler. Remarquons que cette mthode de rsolution
est similaire celle de la rcurrence vers l'amont. De plus, l'introduction de la Nature revient
considrer comme si chaque type de joueur est un joueur part entire (player-centred
approach). Ici, cest comme si le joueur 1 avait face lui deux joueurs diffrents, le type I du
joueur 2 et le type II du joueur 2.
2 (q1, q2 ; cH ) = q2 [(a q1 q2 ) cH ]
ou
2 (q1, q2 ; cL ) = q2 [(a q1 q2 ) cL ]
La firme 2 connat la valeur de son cot marginal et donc n'a aucune incertitude sur sa propre
fonction de paiement.
67
On peut par exemple considrer que la firme 2 n'a aucune incertitude quand c1 , la valeur du
cot marginal de la firme 1.64 Par consquence, pour la firme 2, la fonction de paiement de la
firme 1 demeure inchange, soit :
1 (q1, q2 ; c1 ) = q1 [(a q1 q2 ) c1 ]
On dira que l'espace des types de la firme 2 est T2 = {cL , cH } et l'espace des types de la firme
1 est T1 = {c1}.
A titre de simplification, considrons que t1 = a c1 = 1 , cest dire quil nexiste aucune
incertitude relative au cot c1 de la firme 1.65 En dautres termes, la firme 2 dispose dune
information complte sur la firme 1. Par contre, la firme 1 nest pas certaine de la valeur de
t2 = a c2 de la firme 2, cest dire du cot c2 de la firme 2. Elle a seulement des croyances a
3 1
5 1
3
5
Lorsque t2 = , la firme 2 est dite du type cH (cot lev) et lorsque 2 = , la firme 2 est
4
4
66
dite du type cL (cot faible).
Le duopole ainsi dcrit est un jeu baysien deux joueurs. Lquilibre de Nash baysien est le
vecteur de stratgies (q1* , q2H * , q2L* ) o q1* est la quantit optimale choisie par la firme 1, q 2H * la
quantit optimale choisie par la firme 2 lorsque celle-ci est du type cH et q 2L* la quantit
optimale choisie par la firme 2 lorsque celle-ci est du type cL .
La firme 2 choisit une quantit optimale en fonction de son type ( cH ou cL ), ce qui sexprime
par la fonction q2* (t2 ) . Cette quantit satisfait le programme de maximisation suivant :
t2 q1
2
64
Lapplication de la section 4.4 considrera que les deux firmes ont une incertitude propos des cots du
concurrent.
65
Voir Fudenberg D. et Tirole J (1991.
66
Nous verrons plus loin que les probabilits a posteriori sont le rsultat d'une rvision baysienne des
probabilits a priori.
d 2 2
67
On a en effet
= 2 < 0 .
2
d q2
68
q 2H * =
3 4 q1
5 4 q1
et q2L* =
2
2
La firme 1 choisit la quantit optimale q1* en fonction de ses croyances sur la valeur de t2,
cest dire celle qui maximise son esprance de profit, soit :
Max 1 =
q1
[ ( (
1
q1 1 q1 + q2H
2
))] + 12 [q (1 (q
1
+ q2L
))]
2 (q2H + q2L )
q =
4
*
1
Lquilibre de Nash baysien du jeu s'obtient par la combinaison des trois conditions
dquilibre, soit :
q1* =
2 q2H * + q2L*
4
3 4 q1* 5 4 q1*
2
+
2
2
=
4
q1* =
1
3
3 4 q1* 5
=
=
2
24
q2L* =
5 4 q1* 11
=
2
24
1 5 11
Lquilibre baysien est donc le vecteur de stratgies suivantes : (q1* , q2H * , q2L * ) = , , .
3 24 24
Ces deux exemples permettent de faire ressortir les principaux lments suivants des jeux
baysiens:
La dmarche propose par Harsanyi consiste introduire un joueur fictif, la
Nature, qui joue en premier en affectant chaque joueur son type aprs un tirage
alatoire. Lintroduction de la Nature et de la procdure du tirage alatoire
permettent de formaliser lasymtrie de linformation et les croyances des joueurs ;
Le type du joueur i n'est observ que par le joueur i. Les autres joueurs ont des
croyances sur le type du joueur i, reprsentes par une distribution de probabilit ;
Le joueur i choisit sa stratgie en fonction de son type, ce qui donne la fonction
si (ti ) ;
69
4.2.
Le joueur de type ti choisit la stratgie qui maximise son esprance d'utilit (de
gain), l'esprance tant calcule sur la base de ses croyances sur le type des autres
joueurs.
Dans cette section, nous prsentons formellement la dmarche introduite par Harsanyi (19671968) et qui consiste considrer que la caractristique ti est la ralisation dune variable
alatoire et reprsente le rsultat du mouvement dun nouvel agent, la Nature. Cette approche
des jeux statiques information incomplte consiste considrer que la Nature joue en
premier lieu et procde au tirage alatoire du type ti Ti du joueur i. La valeur de ti est
rvle (observe) seulement au (par) le joueur i qui devient donc son information prive. Les
autres joueurs n'observent pas ti . Avec cette approche, on dfinit un jeu baysien dont le
timing est le suivant :
1. Il existe, avant tout dbut de jeu, une fonction de distribution (croyances) a
priori F (t ) donnant les probabilits jointes des types t = (t1 ,L, tn ) . Cette
distribution a priori est connaissance commune tous les joueurs ;
2. Le jeu commence par le mouvement de la Nature qui procde au tirage
alatoire du vecteur t = (t1 ,L, tn ) distribu selon F (t ) ;
3. La Nature rvle le type ti au seul joueur i ;
Cette approche est qualifie de player-centered. Voir J. Harsanyi, "games with incomplete information". The
American Economic Review. Vol 85, n 3; June 1995. Lautre approche quivalente est la type-centred
interprtation dveloppe la section 4.3.
70
lquilibre de Nash, sous rserve d'une nouvelle dfinition des concepts de stratgies et de
paiements.
Pour dterminer l'esprance de paiement lie au choix d'une stratgie, les joueurs doivent
spcifier les probabilits f i (t i / ti ) , ce qui ncessite le recours la formule de Bayes. Dans
P(t i , ti )
=
P(ti )
P(t i , ti )
P(ti , ti )
t i Ti
La formule de Bayes permet de rviser les probabilits (croyances) aprs avoir observ un
vnement donn. Pour expliciter cette formule (de Bayes), on utilise le schma suivant qui
reprsente deux ensembles (vnements) A et B non disjoints.
A
0,4
0,2
0,4
Figure 4.4
P ( A B ) 0,2 1
=
= .
P (B )
0,6 3
Joueur 2
t2
Probabilits
marginales
0,2
0,4
P(t1 = 5) = 0,6
0,3
0,1
P(t1 = 6) = 0,4
Probabilits
marginales
P(t2 = 3) = 0,5
P(t2 = 8) = 0,5
t1
Joueur 1
Figure 4.5
Pour illustrer le calcul des probabilits a posteriori, c'est--dire le processus de rvision des
probabilits, considrons par exemple la matrice de la figure 4.5 donnant les probabilits
71
ou par
72
4.3.
La dmarche propose par Harsanyi pour analyser les jeux statiques information incomplte
consiste considrer ces derniers comme des jeux dynamiques information imparfaite
faisant intervenir un joueur fictif intervenant la premire tape du jeu, la Nature. Pour
appliquer le concept de l'quilibre de Nash un tel jeu, on commence par le mettre sous la
forme normale. Cela ncessite l'introduction d'une nouvelle dfinition de la notion de stratgie
qui est en fait similaire celle introduite pour les jeux dynamiques. Nous obtenons ainsi
l'quilibre de Nash baysien qui est un concept d'quilibre dfini pour la classe des jeux
simultans (statiques) information incomplte.
Comme indiqu par Harsanyi (1995), un jeu information incomplte peut tre analys en
considrant que le centre d'activit est soit le joueur soit les diffrents types de joueur.
Harsanyi qualifie la premire approche de player-centered interpretation et la seconde de
type-centered interpretation. En les utilisant de faon approprie, ces deux approches
s'avrent tre quivalentes (voir proposition ci-dessous).69
~
L'ensemble des stratgies pures contingentes Si du joueur i est donc l'ensemble de toutes les
fonctions si (ti ) .
Exemple : Si les actions possibles du joueur 1 sont A et B et ses types possibles sont tH et t L ,
alors l'ensemble de (toutes) ses stratgies s1 (t1 ) est :
~
s1 : A si tH et A si t L ;
~
s2 : A si tH et B si t L ;
~
s 3 : B si tH et A si t L ;
~
s 4 : B si t H et B si t L .
69
J. Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
June 1995.
73
~
s1 ; ~
s2 ; ~
s3 ; ~
s4 ) dont le cardinal est 4. Il peut sembler trange que la stratgie
On a donc Si = (~
du joueur i soit conditionnelle son type alors qu'il connat et observe son type. En fait, cette
dfinition de la notion de stratgie est une consquence de la dfinition de l'quilibre de Nash.
En effet, pour trouver l'quilibre de Nash, il faut que chaque joueur dtermine la stratgie qui
soit la meilleure rponse aux stratgies des autres joueurs. Mais pour qualifier une stratgie de
meilleure rponse, chaque joueur doit envisager toutes les stratgies possibles des autres
joueurs. Ainsi, mme si chaque joueur i connat son type ti , on doit envisager toutes les
valeurs de ti et les actions qui en dpendent car c'est la dmarche des autres joueurs quand ils
doivent dterminer leur(s) meilleure(s) rponses.
tH
tM
tL
s1
s2
s3
Figure 4.6
Considrons par exemple, le cas du joueur i dont l'espace des types est Ti = (t H , tM , t L ) et son
~
espace de stratgies S i = (s1 , s 2 , s 3 ) . Comme le montre la figure 4.6, le cardinal de Si , l'espace
des stratgies si (ti ) du joueur i, est 27. Pour tH , il existe 3 choix possibles ; s1, s2 et s3. Pour
chacun de ces 3 choix, il existe 3 choix possibles pour tM . Pour chacune de ces 9
combinaisons possibles, il existe 3 choix possibles pour t L . On obtient un espace de stratgies
possibles si (ti ) dont le cardinal est de 27.
Nous pouvons d'ores et dj introduire la distinction entre un quilibre sparant (separating
strategy) et un quilibre mlangeant (pooling strategy). Dans un quilibre sparant (figure
4.7a), chaque type ti Ti choisit une action diffrente de S i . Dans un quilibre mlangeant
(figure 4.7b), tous les types ti Ti choisissent la mme action si S i .
74
ti
si
t i1
ti 2
ti 3
ti
si
s i1
ti 2
ti 3
si1
si 2
si 2
si 3
t i1
si 3
Figure 4.7a
Figure 4.7b
Il est important de remarquer que dans la forme normale d'un jeu, le joueur i doit spcifier une
action pour chaque type ti possible et cela mme s'il connat son type. En effet, du fait de
l'existence de l'interdpendance stratgique entre les joueurs, le choix du joueur i dpend du
choix des autres joueurs. Or, ces derniers ignorent le type ti du joueur i. Ils doivent donc
considrer toutes les stratgies possibles pour les diffrents types ti du joueur i. Le jeu doit
donc spcifier les stratgies du joueur i pour tous les ti possibles. Cette dfinition de la
stratgie permet d'appliquer le concept de l'quilibre de Nash pour un jeu baysien, ce qui
donne l'quilibre de Nash baysien.
P (t ) = P (t1 ,L , tn )
est
la
t T
probabilit
jointe
de
t = (t1 ,L, tn ) .
Le jeu baysien
~
~
(S1 ,L, S n ; u1 ,L, un ; T ; F ()) est ainsi mis sous la forme normale G = S1, L, Sn ; u~1,L, u~n .
est un profil de stratgies pures (s1* (t1 ),L , sn* (t n )) qui soit un quilibre de Nash du jeu sous
~
~
forme normale G = S1, L, Sn ; u~1 ,L, u~n . Le profil de stratgies pures (s1* (t1 ),L , sn* (t n )) est donc
un quilibre de Nash baysien si pour tout i = 1,..., n , on a :
75
~
u~i (si* (ti ), s*i (t i )) u~i (si (ti ), s*i (t i )) pour tout si (ti ) Si
Soit si :
~
P(t ) ui (si* (ti ), s* i (ti ), ti ) P(t ) ui (si (ti ), s* i (ti ), ti ) pour tout si (ti ) Si
t
En dautres termes, le profil de stratgies (s1* (t1 ),L, sn* (t n )) est un quilibre de Nash du jeu
baysien o chaque agent maximise son utilit espre conditionnelle ses croyances sur le
type des autres agents. Lquilibre baysien est donc moins exigeant que lquilibre de Nash
en information complte puisque les joueurs ne maximisent leur utilit quen esprance.
~
~
Si le jeu baysien sous forme normale G = S1, L, Sn ; u~1 ,L, u~n est un jeu fini, c'est--dire si
l'ensemble des joueurs et les ensembles de stratgies f i sont finis, alors on peut appliquer le
thorme de Nash. Pour un tel jeu fini, il existe donc un quilibre de Nash, possiblement en
stratgies mixtes.
A titre d'exemple, considrons le jeu suivant pour lequel il faut identifier tous les quilibres de
Nash baysien en stratgies pures :70 Deux armes opposes sont sur le point de conqurir une
le. Chaque gnral peut choisir soit "attaquer" A soit "ne pas attaquer" NA. Chaque
arme est soit "puissante" soit "faible" avec probabilit gale (le tirage alatoire du type de
chaque arme est indpendant) et le type de chaque arme n'est connu que de l'arme
concerne. La conqute de l'le procure une valeur gale M. Une arme peut conqurir l'le
soit en attaquant seule soit en n'attaquant pas seule sachant qu'elle-mme est du type
"puissante" et l'autre du type "faible". Aucune des deux armes ne peut conqurir l'le si elles
attaquent toutes les deux et sont du mme type. En attaquant, une arme supporte un cot gal
s si elle est du type "puissante" et de w si elle est du type "faible" avec s < w . En attaquant
seule, une arme ne supporte aucun cot.
Pour mettre ce jeu sous la forme normale, nous devons au pralable dfinir l'espace des
stratgies de l'arme i. Dans ce jeu, chaque joueur dispose de quatre stratgies, savoir :
s i1 : Attaquer si type "puissant" s ; Attaquer si type "faible" w : (A/s ; A/w) ;
s i 2 : Attaquer si type "puissant" s ; Ne pas attaquer si type "faible" w : (A/s ; NA/w) ;
s i 3 : Ne pas attaquer si type "puissant" s ; Attaquer si type "faible w (NA/s ; A/w) ;
s i 4 : Ne pas attaquer si type "puissant" s ; Ne pas attaquer si type "faible" w : (NA/s ;
NA/w).
Pour fixer les ides, supposons que M = 10, s = 3 et w = 5. Nous obtenons ainsi la matrice des
paiements suivante :
70
76
Joueur 2
s 21
J
o
u
e
u
r
s12
s14
A/s
A/w
A/s
NA/w
NA/s
A/w
NA/s
NA/w
s11
s13
A/s
-3 -3
-5 7
-3 -3
0 10
0 10
-5 7
0 10
0 10
A/w
7 -5
-5 -5
7 -5
0 10
0 10
-5 -5
0 10
0 10
s 22
A/s
NA/w
-3 -3 10 0
-5 7 10 0
-3 -3 10 0
0
0 10 0
0
0 10 0
-5 7 10 0
0
0 10 0
0
0 10 0
s 23
NA/s
10 0
10 0
10 0
0
0
0
0
10 0
0
0
0
0
s 24
A/w
7 -5
-5 -5
7 -5
0 10
0 10
-5 -5
0 10
0 10
NA/s
10 0
10 0
10 0
0 0
0 0
10 0
0 0
0 0
NA/w
10 0
10 0
10 0
0
0
0
0
10 0
0
0
0
0
Figure 4.8
Pour dterminer l'quilibre de Nash, on calcule les esprances de paiement de chaque joueur
pour tous les profils de stratgies. Par exemple, pour le profil de stratgies (s11 , s21 ) , le gain
du joueur 1 est de :
-3 si les deux joueurs attaquent et sont du type s (la probabilit est de ) ;
-5 si les deux joueurs attaquent, le joueur 1 tant du type w et le joueur 2 du type s
(la probabilit est de ) ;
7 si les deux joueurs attaquent, le joueur 1 tant du type s et le joueur 2 du type w
(la probabilit est de ) ;
-5 si les deux joueurs attaquent et sont du type w (la probabilit est de ).
Pour ce profil, le paiement espr du joueur 1 est donc ( 3 5 + 7 5) / 4 = 1,5 . Ce mme
calcul appliqu, toutes les combinaisons de stratgies, permet dobtenir la matrice des
paiements suivante :
Joueur 2
J
o
u
e
u
r
s 21
s 22
s 23
s 24
s11
-1.5 ; -1.5
3;1
5.5 ; -2.5
10 ; 0
s12
1;3
1.75 ; 1.75
4.25 ; -1.25
5;0
s13
-2.5 ; 5.5
1.25 ; 4.25
1.25 ; 1.25
5;0
s14
0 ; 10
0;5
0;5
0;0
1
Figure 4.9
Ce jeu admet les deux quilibres de Nash baysiens suivants : (s12 , s21 ) et (s11 , s22 ) .
On peut dterminer l'quilibre de Nash baysien en adoptant une dmarche quivalente. Il faut
remarquer en effet, qu'avant de faire son choix, chacun des joueurs i connat (observe) son
type ti . Donc, dans un quilibre de Nash baysien (en stratgies pures), chaque joueur choisit
77
une stratgie (action) qui soit la meilleure rponse aux stratgies des autres joueurs (selon la
distribution conditionnelle f i (t i / ti ) ) et ce pour chacun des types ti pouvant survenir. Cette
dmarche quivalente a donn lieu la proposition suivante :
Proposition : Le profil de stratgies pures (s1* (t1 ),L , sn* (t n )) est un quilibre de Nash baysien
du jeu (S1 ,L, S n ; u1 ,L, un ; T ; F ()) si et seulement si pour tout i, pour tout si Si et pour
tout ti Ti ayant une probabilit d'occurrence non nulle, on a :
[ (
) ]
[ (
) ]
ti
C'est--dire si :
pi (ti / ti ) ui (si* (ti ), s*i (ti ), ti ) pi (ti / ti ) ui (si (ti ), s*i (ti ), ti )
ti
ti
Cette proposition signifie que dans un quilibre de Nash baysien, chaque joueur i choisit une
meilleure rponse la distribution de probabilit conditionnelle des stratgies des autres
joueurs et ce pour chacun des types ti pouvant survenir avec une probabilit non nulle. En
d'autres termes, chaque type ti du joueur i est considr comme si c'tait un joueur part
entire cherchant maximiser son utilit espre tant donn sa distribution conditionnelle sur
les stratgies des autres joueurs. Cette approche est qualifie de type-centered interpretation.71
Cette caractristique est bien mise en vidence par exemple, dans le jeu du free riding avec
asymtrie de l'information. Dans ce jeu, aprs avoir observ son type (I ou II), le joueur 2
choisit sa meilleure rponse. On a bien si* (ti ) .
L'esprance est calcule par rapport aux variables alatoires que constituent la ralisation des
t i des autres joueurs conditionnel la ralisation de ti .
Dmonstration : Nous voulons montrer que :
[ (
) ] [ (
) ]
B : est un quilibre de
Nash Bayesien
J. Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
page 295. June 1995.
78
Pour montrer que l'ingalit est suffisante, il faut remarquer que si elle est vrifie pour tout
ti Ti ayant une probabilit non nulle, le joueur i ne peut amliorer son paiement en dviant
de si* (ti ) .
On a ainsi u1 ( A, s21 , s ) > u1 ( NA, s 21 , s ) et u1 ( NA, s21 , w) > u1 ( A, s21 , w) . Par consquence, la
meilleure rponse s21 est ( A / s, NA / w) = s12 , soit b1 (s21 ) = s12 .
La meilleure rponse du joueur 1 par rapport aux autres stratgies du joueur 2 est obtenue de
la mme manire, ce qui donne b1 (s22 ) = s11 , b1 (s 23 ) = s11 et b1 (s24 ) = s11 . La mme dmarche
est applique au joueur 2 et on a b2 (s11 ) = s22 , b2 (s12 ) = s21 , b2 (s13 ) = s 21 et b2 (s14 ) = s21 . En
rassemblant les meilleures rponses des deux joueurs, on obtient les deux quilibres de Nash
baysiens identifis plus haut, savoir (s12 , s21 ) et (s11 , s22 ) .
Joueur 2
s 21
J
o
u
e
u
r
1
s 22
s11
s12
b1
b1
s 23
b2
b1
s 24
b1
b2
s13
b2
s14
b2
Figure 4.10
79
4.4.
Nous considrons maintenant lexemple du modle de la section 4.1, avec avec une asymtrie
de linformation pour les deux firmes. Chacune des deux firmes choisit une quantit
produire q i avec comme objectif la maximisation de son profit dont l'expression est
i = q i (a (q1 + q 2 ) ci ) = qi (ti (q1 + q2 )) avec ti = a ci . Chaque firme i a une incertitude
concernant le cot marginal c i de l'autre firme de sorte que t i peut tre gal soit 3/4 soit
5/4. Nous avons donc T1 = T2 = {H , L} . Cette incertitude est rsume par la distribution jointe
a priori p(t ) suivante qui est connaissance commune :
Type de
la firme 1
3/4
3/8
3/4
5/4
Type de la firme 2
5/4
1/8
1/8
P (t 2 = 3 / 4 ) = 1 / 2
3/8
P(t 2 = 5 / 4 ) = 1 / 2
P(t1 = 3 / 4 ) = 1 / 2
P(t1 = 5 / 4 ) = 1 / 2
Figure 4.11
On dira que la firme i est du type L (cot marginal faible) si ti = 5 / 4 et du type H (cot
marginal lev) si ti = 3 / 4 . La dtermination du type ti de la firme i est le rsultat du
mouvement de la Nature, mouvement reprsentant la premire tape du jeu. Chacune des
deux firmes observe par la suite son type et en dduit des probabilits rvises pour le type de
l'autre firme. Sur la base de leurs croyances, chaque firme choisit la quantit qui maximise
son esprance de profit. L'quilibre obtenu est un quilibre de Nash baysien et est de la
forme (q1L* , q1H * , q 2L* , q 2H * ) .
Pour la dtermination de l'quilibre de Nash baysien (q1L* , q1H * , q 2L* , q 2H * ) , commenons par la
firme 1 qui peut tre soit du type L soit du type H. On considre (le joueur 2 galement) en
premier lieu que par suite du mouvement de la Nature, le type de la firme 1 est L. Aprs
observation de son type L et par application de la formule de Bayes, la firme 1 en dduit les
probabilits a posteriori (rvises) sur le type t 2 du joueur 2, soit :
1/ 8 1
=
1/ 2 4
3/8 3
P (t 2 = 5 / 4 t1 = 5 / 4 ) =
=
1/ 2 4
P (t2 = 3 / 4 t1 = 5 / 4 ) =
Le type L de la firme 1 dtermine la quantit q1L* qui maximise son esprance de profit
conditionnelle ses croyances. Le programme de la firme 1 lorsqu'elle est du type L est :
1L =
Max
L
q1
1 L 5
3 5
4 4
4 4
80
d 1L 1 5
35
= q1L q 2H q1L + q1L q 2L q1L = 0
L
44
dq1
44
d 1L 1 5
35
= 2q1L q 2H + 2q1L q 2L = 0
L
44
dq1
44
5
3
1
2q1L q 2H + q 2L = 0
4
4
4
q1L*
5 1 H 3 L
q2 + q2
4 4
4
=
2
Maintenant, on considre que par suite du mouvement de la Nature, la firme 1 est du type H.
En se basant sur l'observation de son propre type, la firme 1 dtermine les probabilits
3/8 3
rvises (a posteriori) sur le type du joueur 2, ce qui donne P (t2 = 3 / 4 t1 = 3 / 4 ) =
= et
1/ 2 4
1/ 8 1
P (t2 = 5 / 4 t1 = 3 / 4 ) =
= . Le type H de la firme 1 choisit la quantit q1H * qui maximise
1/ 2 4
son esprance d'utilit conditionnelle ses croyances. Le programme de la firme 1 lorsqu'elle
est du type H est donc :
1H =
Max
H
q1
3 H3
1 3
4 4
4 4
q1H *
3 3 H 1 L
q2 + q2
4 4
4
=
2
81
(q
L*
1
, q1H * , q 2L* , q 2H *
q1L* =
q1H * =
q 2L* =
q 2H * =
5 1 H * 3 L*
q2 + q2
4 4
4
2
3 3 H * 1 L*
q2 + q2
4 4
4
2
5 1 H * 3 L*
q1 + q1
4 4
4
2
3 3 H * 1 L*
q1 + q1
4 4
4
3
4
1
0
2
1
4
3
4
3
4
1
4
2
0
q1L* 5
1
4
H*
3
q1 3
= 4
4
5
L*
0
q
4
2
H*
2
q 2 4
82
Nous abordons maintenant la classe des jeux dynamiques information incomplte (ou
imparfaite).72 Dans cette classe de jeux, on tudie lissue de linteraction des joueurs en
lexistence simultane de deux difficults. En premier lieu, au moins lun des joueurs ne
dispose pas de toute linformation pertinente concernant les caractristiques des autres joueurs
(information incomplte). En second lieu, le jeu est dynamique, ce qui peut donner aux
joueurs lors du droulement du jeu la possibilit dextraire de nouvelles informations partir
de lobservation des actions passes.
Chaque joueur peut donc rviser ses croyances sur lautre joueur et ce dernier doit en tenir
compte lors du choix de son action. Ainsi, dans un jeu dynamique information incomplte
ou imparfaite, il existe non seulement une interaction entre les stratgies des joueurs mais
galement une interaction entre stratgies et croyances. Pour cela, les croyances des joueurs
prennent un rle central dans le concept dquilibre appropri cette classe de jeux.
5.1.
Linteraction entre stratgies et croyances est ainsi au cur de la rsolution dun jeu
dynamique information incomplte. Le concept dquilibre appropri pour cette classe de
jeux est lquilibre de Nash baysien parfait, ou tout simplement quilibre baysien parfait.
Nous exposerons galement brivement deux autres concepts dquilibre, savoir lquilibre
squentiel (Kreps et Wilson, 1982) et lquilibre parfait avec mains tremblantes (Selten,
1975).
Lquilibre baysien parfait est une synthse entre lquilibre baysien des jeux information
incomplte et lquilibre parfait des jeux dynamiques. Mais, lquilibre baysien parfait nest
pas seulement cette synthse car les joueurs peuvent rviser leurs croyances durant le
droulement du jeu.
Nous avons vu que dans un jeu dynamique information complte, le principe de rationalit
squentielle implique qu'un quilibre du jeu est galement un quilibre dans tous les sous-jeux
de l'quilibre (perfection en sous-jeux). Lintroduction du principe de rationalit squentielle a
pu ainsi permettre dcarter les quilibres de Nash non raisonnables.
Mais, lorsque le jeu dynamique est information incomplte (ou imparfaite), le principe de
rationalit squentielle peut tre insuffisant comme le montre ci-dessous l'exemple du jeu de
la figure 5.1. On a dans ce cas besoin d'un concept d'quilibre plus restrictif. La dmarche
consistant dfinir de nouveaux concepts pour des situations de jeux de plus en plus
complexes est un processus de raffinement de lquilibre de Nash qui vise exclure les
72
Nous avons vu au chapitre 4 qu la suite de Harsanyi, un jeu information incomplte peut tre rinterprt
comme tant un jeu information imparfaite.
83
quilibres non plausibles qui auraient t retenus si on devait appliquer le concept d'quilibre
dfini pour des jeux plus simples.
Pour prsenter les concepts dquilibre appropris aux jeux dynamiques information
incomplte (ou imparfaite), nous suivrons les tapes suivantes :
1. Nous devons montrer, partir dun exemple, que la perfection en sous-jeux nest pas
toujours suffisante pour liminer des quilibres de Nash non raisonnables.
2. La solution propose consiste en lextension du principe de rationalit squentielle
tous les ensembles dinformation (et non plus aux seuls sous jeux) et en
lintroduction de croyances ces ensembles dinformation. Le joueur devant joueur
lensemble dinformation H choisit une action optimale tant donnes ses
croyances sur les diffrents nuds de lensemble H.
3. On dfinit ainsi un concept dquilibre pour les jeux dynamiques information
incomplte (ou imparfaite) et qui est lquilibre baysien parfait au sens faible. Un
quilibre dans un jeu dynamique information incomplte (ou imparfaite) doit donc
spcifier les couples composs dune part des stratgies dquilibre et dautre part
des croyances les soutenant. De ce fait, les croyances des joueurs aux ensembles
dinformation atteints lquilibre (appartenant au sentier dquilibre) deviennent
un lment explicite de lquilibre. Ce concept dquilibre est bas sur deux
exigences :
o Principe de rationalit squentielle : En tout point du jeu (ensembles
dinformation singletons ou non), les joueurs choisissent des actions
optimales (maximisation de lesprance de paiement) tant donnes les
croyances sur les actions choisies jusqu ce point du jeu.
o Consistance des croyances : les croyances doivent tre consistantes avec les
stratgies joues cet quilibre.
4. Lquilibre baysien parfait ainsi dfini est au sens faible car il ne prvoit aucune
restriction sur les croyances des joueurs aux ensembles dinformation non atteints
lquilibre (atteint avec probabilit 0). A travers un exemple, nous montrons la
ncessit de spcifier des croyances mme pour des ensembles dinformation hors
sentier dquilibre.
5. Lintroduction de restrictions supplmentaires pour les croyances hors sentier
dquilibre a pris deux principales voies :
o Lune des voies considre les diffrentes applications (par exemple, le
modle de signal) et introduit des restrictions raisonnables spcifiques, ou
raffinements, sur les croyances hors sentier dquilibre. Lquilibre ainsi
obtenu est appel quilibre baysien parfait. Parmi les nombreux
raffinements proposs citons titre dexemple : critre de la perfection en
sous-jeux, critre de domination, critre de domination par l'quilibre, critre
intuitif,
84
o Lautre voie consiste dfinir des concepts dquilibre incluant demble des
exigences sur les croyances sur et en dehors du sentier dquilibre, ceci
travers la notion de stratgies totalement mixtes dues la possibilit derreur
lors du choix des stratgies. Lquilibre squentiel (Kreps et Wilson, 1982) et
lquilibre parfait avec mains tremblantes (Selten, 1975) appartiennent
cette voie.
5.2.
R
Joueur 2
u1 0
u2 2
l
u1 2
u2 1
-1
-1
1
1
-2
0
Figure 5.1.
Dans ce jeu, le joueur 1 joue en premier et a le choix entre les trois actions A, L ou R. Sil
choisit A, le jeu se termine. Sil choisit L ou R, le joueur 2 jouera son tour en choisissant l ou
r. Au moment de jouer, le joueur 2 nobserve pas quelle action (L ou R) le joueur 1 a choisi.
73
Jean Tirole, The Theory of Industrial Organisation. The MIT press, 1988. Page 439.
85
Pour identifier les quilibres de Nash de ce jeu, mettons-le sous la forme normale, ce qui
donne :74
Joueur 1
A
L
R
Joueur 2
l si non A
0,2
2,1
1,1
r si non A
0,2
-1,-1
-2,0
Figure 5.2
Cette forme normale montre que ce jeu admet deux quilibres de Nash et qui sont : (L, l si
non A ) et (A, r si non A ).
Afin de dterminer si ces deux quilibres de Nash sont des quilibres de Nash parfaits, nous
utiliserons la forme extensive pour vrifier s'ils constituent bien des quilibres de Nash dans
tous les sous-jeux. L'analyse de la forme extensive montre cependant que ce jeu n'admet
aucun sous-jeu, hormis le jeu lui-mme. Or, dans un jeu ne contenant aucun sous-jeu,
l'quilibre de Nash se confond avec l'quilibre de Nash parfait. En consquence, les deux
quilibres de Nash (L, l si non A ) et (A, r si non A ) sont galement des quilibres de
Nash parfaits.
Mais un simple examen de ces deux quilibres montre que le second quilibre de Nash nest
pas un quilibre raisonnable. En effet, quelque soit laction (L ou R) choisie par le joueur 1, la
meilleure action du joueur 2 est de jouer l si non A .75 La solution propose pour
llimination de lquilibre de Nash non raisonnable consiste en lintroduction de la notion de
croyances. Ce type de raffinement consiste considrer quau moment de jouer, le joueur 2
dispose de croyances sur laction qui a t choisie par le joueur 1. Ces croyances sont des
probabilits doccurrence affectes aux diffrentes actions possibles du joueur 1. Sur la base
de ces croyances, le joueur 2 choisit une action optimale, en fait laction lui procurant
lesprance de paiement la plus leve.
Cette exigence est en fait une extension du principe de rationalit squentielle. A travers ce
principe, pour quun quilibre de Nash soit considr comme une prdiction raisonnable, il est
exig qu tout ensemble dinformation sur le sentier dquilibre (et non plus seulement au
niveau des sous jeux), le joueur qui cest le tour de joueur choisit une action optimale en
fonction des croyances quil a sur laction choisie par lautre joueur.
En considrant le jeu de la figure 5.1, on peut observer que laction r si non A nest
optimale pour aucune croyance du joueur 2 car en jouant l si non A , le joueur 2 obtient un
paiement suprieur quelque soit le choix du joueur 1. Le second quilibre contient donc une
rponse non crdible du joueur 2. De ce fait, lquilibre de Nash (A, r si non A ) ne peut
tre considr comme une prdiction raisonnable.
74
75
Cet exemple est donn par Kreps et Wilson (1982), page 871.
Pour le joueur 2, laction l domine strictement laction r.
86
5.3.
Lquilibre de Nash dun jeu dynamique information incomplte (ou imparfaite) requiert
quen tout point du jeu, laction de chaque joueur soit optimale tant donne la meilleure
rponse des autres joueurs. Il sagit donc dune extension du principe de rationalit
squentielle qui doit sappliquer tous les ensembles dinformation, quils soient singletons
ou non. Lorsque le joueur i doit joueur lensemble dinformation H, le principe de rationalit
squentielle ncessite que le joueur i affecte une probabilit doccurrence (croyance) chaque
nud x de lensemble H.
Lintroduction de croyances dans la dfinition du concept dquilibre pour les jeux
dynamiques information incomplte (ou imparfaite) savre tre dcisive car un choix nest
optimal qutant donnes des croyances. Les croyances deviennent donc un lment part
entire de lquilibre dun jeu. Avant dnoncer cette premire proprit de lquilibre dun
jeu dynamique information incomplte (ou imparfaite), donnons la dfinition formelle des
croyances.76
Dfinition : Un systme de croyances dun jeu dynamique information incomplte (ou
imparfaite) est la fonction : H [0, 1] tel que ( x ) = 1 pour tout ensemble H du jeu.
xH
En considrant le jeu de la figure 5.1, la proprit 1 signifie que si le jeu atteint l'ensemble
d'information non singleton du joueur 2, ce dernier doit avoir des croyances propos de quel
nud est atteint par le jeu. Un systme de croyances est la distribution de probabilit
( p, 1 p) assigne par le joueur 2 o p est la probabilit que le jeu ait atteint le nud L et
(1 p ) la probabilit que le jeu ait atteint le nud R. Dans la figure 5.3, les croyances
( p, 1 p) du joueur 2 sont indiques lintrieur de lellipse reprsentant lensemble
dinformation du joueur 2.
76
87
Joueur 1
0
2
R
Joueur 2
(1-p)
2
1
-1
-1
1
1
-2
0
Figure 5.3.
88
1
laction A, la probabilit
2
1
1
laction L et la probabilit
laction R.77 Dans ce cas, lensemble dinformation du
3
6
1
joueur 2 est atteint avec la probabilit . Alors, les probabilits conditionnelles de L et de R
2
de lensemble dinformation du joueur 2 tant donn que cet ensemble dinformation est
atteint sont dtermines par application de la rgle de Bayes :
2
1
et
du joueur 2 sont consistantes avec la
3
3
1 1 1
stratgie mixte ( A , L , R ) = , , . La condition de cohrence des croyances sur le
2 3 6
sentier dquilibre est la troisime proprit de lquilibre dun jeu dynamique information
incomplte (ou imparfaite).
Proprit 3 : A chaque ensemble d'information situ sur le sentier d'quilibre (atteint avec
une probabilit strictement positive), les croyances sont dduites des stratgies d'quilibre
des joueurs par utilisation de la rgle de Bayes.
Les proprits 1 3 rendent bien compte de l'esprit de l'quilibre baysien parfait : En tout
ensemble d'information situ sur le sentier dquilibre, un joueur choisit une action qui
77
Rappelons quune stratgie compltement (ou totalement) mixte est une stratgie mixte o toutes les stratgies
pures sont joues avec une probabilit strictement positive.
89
maximise son esprance de paiement, compte tenu des probabilits a posteriori et des
stratgies des autres joueur.
Dans lquilibre de Nash parfait (L, l si non A ), les croyances du joueur 2 doivent tre tel
que p = 1 .78 En effet, cet quilibre prsum, le joueur 2 cherche dterminer sa meilleure
rponse au choix de L par le joueur 1. Il suppose donc que le joueur 1 a choisi L. La croyance
cohrente cette supposition est p = 1 . Lquilibre baysien parfait au sens faible est le
couple stratgies / croyances suivant : (L, l si non A , p = 1 ).79
Lquilibre baysien parfait au sens faible signifie quen tout point du jeu :
Les actions choisies par les joueurs doivent tre optimales tant donnes les
stratgies des autres joueurs et les croyances sur lvolution du jeu ;
Les croyances doivent tre consistantes (cohrentes) avec les stratgies joues.
Lquilibre baysien parfait au sens faible est donc le produit de deux exigences :
La rationalit squentielle : les stratgies joues lquilibre doivent former un
quilibre parfait, compte tenu des croyances ;
La cohrence baysienne : les croyances doivent tre obtenues par rvision
baysienne des croyances a priori, compte tenu des stratgies dquilibre.
Lquilibre baysien parfait est une mixture du concept dquilibre parfait des jeux
dynamiques et du concept dquilibre baysien des jeux information incomplte. De plus,
cette mixture doit satisfaire une condition de point fixe dans la mesure o les stratgies
dquilibre sont optimales tant donnes les croyances et ces dernires sont cohrentes aux
stratgies dquilibre.
Lquilibre baysien parfait permet de tenir compte du fait que durant le droulement du jeu,
de linformation est indirectement transmise entre les joueurs. Ceci donne donc aux joueurs la
possibilit de rviser leurs croyances (probabilits) sur les types des autres joueurs suite
lobservation des choix antcdents de ces autres joueurs. En procdant un choix donn, les
joueurs rvlent de linformation sur leur type.
5.4.
Pour la dfinition de lquilibre baysien parfait au sens faible, lexigence de cohrence des
croyances na port que sur les croyances au niveau des ensembles dinformation situs sur le
sentier dquilibre (ensembles dinformation atteints avec une probabilit non nulle). Cest
dailleurs cette caractristique qui a motiv le qualificatif au sens faible . Afin que
lquilibre soit une prdiction raisonnable (crdible), il est ncessaire de poser des exigences
de cohrence, ceci pour les croyances en dehors du sentier dquilibre.
Pour quun sentier (squence dactions) soit optimal, il faut quil soit une meilleure rponse
par rapport aux actions hors sentier dquilibre. Il faut donc connatre les paiements quon
78
79
90
pourrait obtenir en cas de dviation vers les actions hors sentier dquilibre. Or, ces paiements
dpendent, entre autres, des croyances hors sentier dquilibre. En consquence, un quilibre
baysien parfait doit non seulement spcifier les actions et les croyances sur le sentier
dquilibre, mais galement les croyances hors sentier dquilibre. Ces dernires doivent de
plus satisfaire certains critres, en ce sens quelles doivent tre raisonnables.
Lexemple de la figure 5.4 montre bien la ncessit de spcifier des croyances raisonnables
non seulement au niveau des ensembles dinformation atteints lquilibre mais galement au
niveau des ensembles dinformation non situes sur le sentier dquilibre.
Joueur 1
4
0
R
Joueur 2
2
4
3
2
3
3
5
4
Figure 5.4.
Dans ce jeu, lissue ( A, l si " non A", Pr ob(L) = 1) est bien un quilibre baysien parfait au
sens faible80. En effet, tant donnes les croyances du joueur 2 (c'est--dire Pr ob(L) = 1 ), le
choix optimal du joueur 2 est laction l. De mme, tant donn ce choix du joueur 2, la
meilleure rponse du joueur 1 est de joueur A. Les seules croyances de cet quilibre, soit
Pr ob(L) = 1 et Pr ob(R ) = 0 se rapportent un ensemble dinformation nappartenant pas au
sentier dquilibre (atteint avec une probabilit nulle). Ces croyances ne sont pas en
contradiction avec la dfinition de lquilibre baysien parfait au sens faible et donc lissue
( A, l si " non A", Pr ob(L) = 1) est bien un quilibre baysien parfait au sens faible. Mais un
simple examen de cet quilibre tel que reprsent dans la figure 5.4 montre que ces croyances
hors sentier dquilibre ne sont pas raisonnables. En effet, pour le joueur 1, laction L est
strictement domine par laction R. Raisonnablement, si le joueur 1 ne retient pas laction A,
son choix optimal devient laction R. La croyance raisonnable cet ensemble dinformation
est de ce fait Pr ob(R) = 1 . Etant donne cette dernire croyance, le meilleur choix du joueur 2
est (r si " non A") et la meilleure rponse du joueur 1 est bien laction R. Lquilibre baysien
parfait ainsi obtenu (R, r si " non A", Pr ob(R ) = 1) est repris dans la figure 5.5. Notons qu
cet quilibre, le qualificatif au sens faible na pas t repris car il ne comporte pas de
croyances non raisonnables en dehors du sentier dquilibre.
80
Les actions de cet quilibre sont mises en vidence par les traits gras et les croyances indiques dans
lensemble dinformation du joueur 2.
91
Joueur 1
4
0
Joueur 2
2
4
3
2
3
3
5
4
Figure 5.5.
1
-1
4
0
2
4
R
Joueur 2
r
3
2
Figure 5.6.
81
1
3
5
4
92
Dans ce jeu, lissue ( A, (b si A, l si " non A"), Pr ob(L) = 1) est bien un quilibre baysien
parfait au sens faible.82 Cependant et comme pour le jeu de la figure 5.4, cet quilibre est bas
sur des croyances non raisonnables en dehors du sentier dquilibre (c'est--dire au niveau de
lensemble dinformation du joueur 2). A la diffrence du jeu de la figure 5.4, laction L nest
pas domine par laction R car le paiement du joueur 1 peut tre suprieur ou infrieur celui
obtenu de par laction L. En fait, pour le joueur 1, laction L est domine par lquilibre
( A, (b si A, l si " non A"), Pr ob(L) = 1) car cet quilibre, laction A procure au joueur 1 un
paiement de 4, suprieur au paiement de 2 ou 3 permis par laction L. Il nest donc pas
raisonnable que le joueur 2 puisse croire que Pr ob(L) = 1 car si le joueur 1 venait dvier de
sa stratgie dquilibre A, cest pour obtenir un paiement plus lev. Il choisira dans ce cas
laction R (obtenant ainsi un paiement de 5) et non laction L. Lquilibre baysien parfait au
sens faible dcrit dans la figure 5.6 ne peut tre considr comme une prdiction raisonnable
car il est bas sur des croyances non raisonnables hors sentier dquilibre.
Dautres raffinements sont proposs dans la littrature afin de rendre raisonnables les
croyances en dehors du sentier dquilibre. Parmi ces raffinements, citons le critre intuitif
propos par Cho et Kreps (1987) pour les jeux de signaux.83
Pour des modles ou jeux donns, on peut prvoir des raffinements spcifiques pour les
croyances hors quilibre qui, combins aux proprits 1 3, permettent de dfinir le concept
dquilibre baysien parfait.
Dfinition : Un quilibre baysien parfait pour un jeu dynamique information incomplte
(ou imparfaite) consiste en un couple de stratgies et de croyances satisfaisant les proprits
1 3 et les raffinements rendant raisonnables les croyances en dehors du sentier dquilibre.
5.5.
Pour les croyances hors quilibre indiques dans la figue 5.6, l est la meilleure rponse du joueur 2, ce qui
son tour implique que A (suivi de b) reprsente la meilleure rponse du joueur 1.
83
Le critre intuitif est dvelopp dans la section 5.6 relative aux jeux de signaux.
84
Selten, R. (1975). "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games".
International Journal of Game Theory. Vol. 4. P 25-55.
93
tous les ensembles dinformation sont atteints avec une probabilit non nulle et la rgle de
Bayes est applicable tous les ensembles dinformation.
Lquilibre squentiel
Lquilibre squentiel a t propos par Kreps et Wilson (1982) et, tout comme lquilibre
parfait avec mains tremblantes , il postule demble lexistence de stratgies compltement
mixtes.
{ }
k
k =1
avec
k
k
La premire proprit signifie quen tout point du jeu, les joueurs choisissent des stratgies
optimales tant donnes le systme de croyances et des stratgies des autres joueurs. La
seconde proprit postule que le profil de stratgies de lquilibre est la limite dune
squence de stratgies compltement mixtes. Les croyances associes aux stratgies
compltement mixtes de cette squence sont obtenues par application de la rgle de Bayes et
leur limite sont les croyances de lquilibre.
5.6.
Les modles de signaux sont une des applications du concept dquilibre baysien parfait. Ils
sont trs utiliss dans la thorie conomique, limage du clbre modle de Spence (1973)
dvelopp pour le march du travail. Ils sont galement trs prsents en finance corporative
par exemple pour ltude des politiques dendettement et de distribution de dividendes des
entreprises.86
85
94
La version la plus simple dun jeu de signal comporte deux joueurs ( i = 1, 2 ), deux types
possibles de T = {t1,t2 } avec les probabilits (croyances) a priori P(t1 ) et P(t2 ) , deux
messages (signaux) possibles de M = { m1 , m2 } et deux actions possibles de A = { a1 ,a2 } . En
recourant lune des formes les plus usites dans la littrature, la figure 5.7 montre la forme
extensive dun tel jeu.
Le jeu tel que reprsent par cette forme extensive dmarre au milieu avec le mouvement de
la Nature et se prolonge vers les nuds terminaux situs droite et gauche. La Nature
choisit dune faon alatoire le type t1 ou t 2 du joueur 1 (lmetteur). Ce dernier observe son
type et choisit laction m1 ou m2 . Le joueur 2 (le rcepteur) observe laction retenue par le
joueur 1 et choisit soit laction a1 ou a2 . Les pointills reliant les nuds de dcision du
rcepteur expriment lide quau moment de joueur, le rcepteur ne connat pas le type de
lmetteur.88
87
Nous avons vu au chapitre 4 qu la suite de Harsanyi, un jeu information incomplte peut tre rinterprt
comme tant un jeu dynamique information imparfaite.
88
Pour la commodit de la prsentation, on a utilis les traits en pointills au lieu des ellipses. Ces deux formats
jouent le mme rle, c'est--dire faire ressortir les ensembles dinformation dun jeu information imparfaite.
95
u1 (m1 , a1 , t1 )
u 2 (m1 , a1 , t1 )
a1
Emetteur
t1
m1
u1 (m1 , a 2 , t 2 )
a2
u 2 (m1 , a 2 , t 2 )
a1
a2
Nature
u1 (m1 , a1 , t 2 )
a1
m2
P (t1 )
u1 (m1 , a2 , t1 ) a2
u 2 (m1 , a 2 , t1 )
Rcepteur
u 2 (m1 , a1 , t 2 )
u1 (m2 , a1 , t1 )
Rcepteur
P(t 2 )
m1
t2
Emetteur
a1
m2
a2
u 2 (m2 , a1 , t1 )
u1 (m2 , a 2 , t1 )
u 2 (m2 , a 2 , t1 )
u1 (m2 , a1 , t 2 )
u 2 (m2 , a1 , t 2 )
u1 (m2 , a 2 , t 2 )
u 2 (m2 , a 2 , t 2 )
Figure 5.7
Nature pourrait tirer. Une stratgie pure pour le rcepteur est la fonction a k (m j ) spcifiant
quelle est l'action choisir pour chaque message que l'metteur peut envoyer. Dans le jeu de
signal simple reprsent par la figure 5.7, l'metteur et le rcepteur ont chacun quatre
stratgies pures :
Stratgies pures possibles de l'metteur :
Stratgie (m1 , m1 ) : jouer m1 si la Nature tire t1 et jouer m1 si la Nature tire t 2 .
Stratgie (m1 , m2 ) : jouer m1 si la Nature tire t1 et jouer m2 si la Nature tire t 2 .
Stratgie (m2 , m1 ) : jouer m2 si la Nature tire t1 et jouer m1 si la Nature tire t 2 .
Stratgie (m2 , m2 ) : jouer m2 si la Nature tire t1 et jouer m2 si la Nature tire t 2 .
Stratgies pures possibles du rcepteur :
Stratgie (a1 , a1 ) : jouer a1 si l'metteur choisit m1 et jouer a1 si l'metteur choisit m2.
Stratgie (a1, a2 ) : jouer a1 si l'metteur choisit m1 et jouer a2 si l'metteur choisit m2.
Stratgie (a2 , a1 ) : jouer a2 si l'metteur choisit m1 et jouer a1 si l'metteur choisit m2.
Stratgie (a2 , a2 ) : jouer a2 si l'metteur choisit m1 et jouer a2 si l'metteur choisit m2.
89
Dans cette section, nous traitons la fois des quilibres baysiens parfaits et des quilibres baysiens parfaits
au sens faible, ce qui explique que nous nayons pas rajout le qualificatif au sens faible son titre. Notons
que dans un jeu de signal deux types et deux messages, lquilibre sparant ne requiert pas le qualificatif au
sens faible car dans un tel quilibre, les deux ensembles dinformation sont situs sur le sentier dquilibre.
96
Les stratgies (m1 , m1 ) et (m2 , m2 ) de l'metteur sont appeles des stratgies mlangeantes
(pooling) car les deux types envoient le mme message. Les stratgies (m1 , m2 ) et (m2 , m1 )
sont appeles des stratgies sparantes (separating) car chaque type envoie un message
diffrent. Pour des modles comprenant plus de deux types, on peut avoir des stratgies
partiellement sparantes (semi-separating) si tous les types d'un certain ensemble de types
envoient le mme message et chaque ensemble de types envoie un message diffrent. Un
quilibre sparant est un quilibre rvlateur car partir du message diffrenci envoy, on
peut dduire le type de lmetteur. Un quilibre sparant permet donc de transmettre de
linformation.
Le jeu de signal tant un jeu dynamique information incomplte (ou imparfaite), le concept
dquilibre adquat est donc l'quilibre baysien parfait. Aprs adaptation des proprits
exposes dans les sections 5.3 et 5.4, lquilibre baysien parfait pour un jeu de signal est
dfini comme suit :
Dfinition : Un quilibre baysien parfait pour un jeu de signal est reprsent par les stratgies
m*j (ti ) et a k* m j respectivement de lmetteur et du rcepteur et les croyances a posteriori
( )
(ti / m j ) = 1
satisfaisant les
t i T
proprits suivantes :
1) Pour tout ti , le message m*j (ti ) doit maximiser lutilit de ti tant donne la
( )
u (m , a (m ), t ) .90
Max
*
k
mj
( )
( )
ti
Cette formulation montre que le joueur 1 (lmetteur) prend une dcision optimale en anticipant une raction
optimale du joueur 2 (le rcepteur). Cest une dmarche analogue celle du modle de Stackelberg (1934) car
pour lmetteur, le rcepteur est un joueur rationnel et ce dernier sait que lmetteur sait quil est rationnel,
97
Supposons que chacun des deux types soit quiprobable. Aprs observation de son type,
lmetteur (le joueur 1) choisit une action qui peut tre soit L soit R. Le rcepteur (le joueur 2)
observe le message de lmetteur et non son type et choisit son tour une action qui peut tre
soit u soit d. Il sagit bien dun jeu de signal dans lequel lmetteur choisit un message en
fonction de son type et le rcepteur rvise ses croyances sur le type de lmetteur sur la base
de laction observe de lmetteur et choisit une action optimale en fonction, notamment, des
croyances rvises. On peut reprsenter ce jeu par la forme extensive suivante :
5
2
u
[ p]
2
0
4
4
Rcepteur
HL
Nature
Rcepteur
HR
0,5
t2
Emetteur
u
R
6
1
[q]
0,5
[1-p]
3
5
Emetteur
t1
R
3
4
2
1
[1-q]
7
3
Figure 5.8
91
Pr ob (t1 )
Pr ob (t1 )
1
=
=
Pr ob (H L ) Pr ob (t1 ) + Pr ob (t2 ) 2
98
1 p = (t2 / L ) =
Pr ob (t2 )
Pr ob (t2 )
1
=
=
Pr ob (H L ) Pr ob (t1 ) + Pr ob (t2 ) 2
En dautres termes, en observant le message L dans tous les cas (c'est--dire quelque soit le
type de lmetteur), le rcepteur ne reoit aucune nouvelle information et maintient donc ses
croyances. Ses croyances a posteriori sont ainsi identiques ses croyances a priori.
Quelle est la meilleure rponse du joueur 2 (rcepteur) ? Etant donnes la stratgie (L, L) et
1 1
les croyances a posteriori ( p, 1 p ) = , , la meilleure rponse du rcepteur est laction u
2 2
1
1 5
1
1
car E (u2 (u / L )) = 2 + 4 = 3 > E (u2 (d / L )) = 0 + 5 = . Avec cette meilleure
2
2 2
2
2
raction (u / L) , lmetteur obtient un paiement de 5 sil est du type t1 et de 4 sil est du type
t2 .
Etant donns ces paiements de 5 et de 4, les types t1 et t 2 de lmetteur ont-ils intrt dvier
et jouer laction R au lieu de laction L ? Pour le savoir, il faut considrer la raction du
rcepteur au message R et les paiements qui sen suivent pour le joueur 1. Dans ce jeu, pour le
rcepteur, tant donn R, laction u est domine par laction d. En consquence, si le joueur 1
venait joueur R, la meilleure rponse du joueur 2 sera laction d, ce qui donne un paiement
de 3 et 7 respectivement aux types t1 et t 2 de lmetteur. Le type t 2 est incit dvier car il
obtient un paiement suprieur (7 au lieu de 4). Par consquent, il ne peut exister dquilibre
baysien parfait dans lequel lmetteur joue la stratgie (L / t1 , L / t 2 ) .
Notons que cette conclusion est vraie quelque soient les croyances hors quilibre (q, 1 q ) du
rcepteur car si ce dernier venait observer laction hors quilibre R, sa meilleure rponse est
toujours laction d car elle domine strictement laction u.92
92
Laction R est hors quilibre pour lquilibre baysien parfait postul dans lequel la stratgie du joueur 1 est
(L, L ) .
99
Nature
t1
t2
[0,5]
[0,5]
Emetteur
Emetteur
L
Rcepteur
HL
[p]
u1
u2
5
2
2
0
[1 p]
u
4
4
[0,5]
Rcepteur
HR
3
5
6
1
3
4
[0,5]
u
2
1
d
7
3
Figure 5.9
Le rcepteur observe le message R qui peut provenir soit du type t1 soit du type t 2 . Ses
croyances cohrentes avec la stratgie de l'metteur sont dtermines par application de la
rgle de Bayes, ce qui donne :
q = (t1 / R ) =
Pr ob (t1 )
Pr ob (t1 )
1
=
=
Pr ob (H R ) Pr ob (t1 ) + Pr ob (t2 ) 2
1 q = (t2 / R ) =
Pr ob (t2 )
Pr ob (t2 )
1
=
=
Pr ob (H R ) Pr ob (t1 ) + Pr ob (t2 ) 2
En dautres termes, en observant le message R dans tous les cas (c'est--dire quelque soit le
type de lmetteur), le rcepteur ne reoit aucune nouvelle information. Ses croyances a
posteriori sont donc identiques ses croyances a priori.
Quelle est la meilleure rponse du rcepteur ? Etant donnes la stratgie (R / t1 , R / t 2 ) et les
1 1
croyances a posteriori , , la meilleure rponse du joueur 2 est laction d car
2 2
1
1
1
1 7
93
E (u 2 (d / R )) = 4 + 3 =
> E (u 2 (u / R )) = 1 + 1 = 1 . Avec cette meilleure
2
2
2
2 2
(
)
rponse d / R , le joueur 1 obtient un paiement de 3 sil est du type t1 et de 7 sil est du type
t2 .
En fait, comme indiqu prcdemment, on a E (u 2 (d / R )) > E (u 2 (u / R )) quelque soient les croyances du joueur
2. Laction d si R domine strictement laction u si R.
93
100
Etant donns ces paiements, les types t1 et t 2 ont-ils intrt dvier de la stratgie R ? Pour le
savoir, il faut considrer la raction du rcepteur sil venait observer le message L. Si le
rcepteur choisit laction u, alors le type t1 obtiendra un paiement de 5, suprieur au paiement
de 3 quil aurait obtenu sil avait choisi laction R. Le type t1 tant incit dvier, il ne peut
donc exister dquilibre baysien parfait mlangeant en R o le joueur 2 choisit laction u
aprs observation de L. Par contre, si le joueur 2 choisit laction d, alors les deux types
obtiendront des paiements infrieurs respectivement gaux 2 et 3. Dans ce cas, aucun des
deux types nest incit dvier de laction R. Il reste dterminer les croyances hors sentier
dquilibre p et (1 p ) pour que le joueur 2 choisisse laction d. Laction d est le meilleur
choix du joueur 2 si E(u 2 (d / L)) > E (u 2 (u / L)) , soit si 0 p + 5 (1 p ) > 2 p + 4 (1 p ) ,
1
soit si p < . Il existe donc bien un quilibre baysien parfait au sens faible mlangeant en R
3
1
1
(L, R) :
Les croyances du rcepteur doivent tre cohrentes avec la stratgie de l'metteur et sont
dtermines par application de la rgle de Bayes, ce qui donne p = (t1 / L) = 1 et
1 q = (t 2 / R ) = 1 . En effet, si le rcepteur considre que lmetteur joue (L, R ) , alors il doit
croire quil sagit bien du type t1 sil observe L et quil sagit bien du type t 2 sil observe R.
Ces croyances sont le rsultat de lapplication de la rgle de Bayes avec la particularit
suivante : si l'metteur joue (L, R) , le rcepteur fait face deux ensembles d'information
singletons. Le premier contient le nud L et dcoule de t1 , d'o la croyance p = (t1 / L) = 1 ,
cohrente avec la stratgie dquilibre.95 Le second ensemble d'information, un singleton
galement, contient le nud R et dcoule de t 2 , d'o la croyance 1 q = (t 2 / R ) = 1 ,
cohrente avec la stratgie dquilibre. Pour ces croyances, la meilleure rponse du rcepteur
est la stratgie (u / L, d / R ) . En effet, aprs observation du message L, le rcepteur obtient un
paiement de 2 sil joue u et de 0 sil joue d. De mme, en observant le message R, le rcepteur
obtient un paiement de 1 sil joue u et de 3 sil joue d. Avec cette meilleure rponse du
rcepteur, lmetteur obtient un paiement de 5 sil est du type t1 et de 7 sil est du type t 2 .
94
95
Les nombres entre crochets au sein des ensembles dinformation reprsentent les croyances a posteriori.
Il sagit videmment ce stade dun quilibre prsum.
101
Nature
t1
t2
[0,5]
[0,5]
Emetteur
Emetteur
L
Rcepteur
HL
[1]
u1
u2
5
2
2
0
R
[0]
[0]
Rcepteur
HR
[1]
4
4
3
5
6
1
3
4
2
1
7
3
Figure 5.10
102
message L, le joueur 2 obtient 5 en jouant d et 4 en jouant u, do loptimalit de (d / L) .
Avec cette meilleure rponse du joueur 2, le joueur 1 obtient un paiement de 3 quil soit du
type t1 ou t 2 .
Nous devons maintenant nous assurer que la stratgie (R / t1 , L / t 2 ) constitue bien une
meilleure rponse de lmetteur la meilleure rponse (d / R, d / L) du rcepteur. Si le type t1
dvie et joue L, alors compte tenu de la meilleure rponse (d / R, d / L) du joueur 2, il
obtiendra un paiement de 2, infrieur au paiement de 3 sil joue R. Le type t1 nest donc pas
incit dvier. Si le type t 2 dvie et joue R, alors compte tenu de la meilleure rponse du
joueur 2, il obtiendra un paiement de 7, suprieur au paiement de 3 quil aurait obtenu en
jouant L. Le type t 2 est donc incit dvier de ce suppos quilibre. En consquence, la
stratgie (R / t1 , L / t 2 ) ne peut faire partie dun quilibre baysien parfait.
Dans ce jeu, il existe donc deux quilibres baysiens parfaits, un quilibre mlangeant et un
quilibre sparant. Lexistence de plusieurs quilibres est problmatique car on ne peut
prdire lissue du jeu. Le problme de la multiplicit des quilibres dans un jeu dynamique
information incomplte (ou imparfaite) est en grande partie d limprcision des conditions
concernant les croyances hors quilibre. Dailleurs, dans le jeu de signal ci-dessus, lquilibre
baysien parfait au sens faible mlangeant en L nest en fait un quilibre que pour les
1
croyances hors quilibre p = (t1 / L ) < . Or, aucun argument rationnel nest venu tayer ces
3
croyances hors quilibre. Cest pour cela quune partie importante de la littrature relative la
thorie des jeux traite de la question des raffinements de lquilibre de Nash. Lobjectif de ces
raffinements est dimposer aux croyances hors quilibres des proprits raisonnables avec
pour finalit didentifier un seul quilibre pour les jeux tudis.
Dailleurs, en appliquant le critre intuitif de Cho et Kreps (1987), nous montrerons que
lquilibre baysien parfait au sens faible mlangeant en R ne peut tre accept car il est bas
sur des croyances hors quilibre non raisonnables. De ce fait, le jeu de la figure 5.8 nadmet
quun seul quilibre, lquilibre baysien parfait sparant [(L, R), (u, d ); p = 1, q = 0] .
103
les quilibres baysiens parfaits sauf lquilibre sparant o le travailleur de type t L choisit
un niveau dducation gal 0 et le travailleur de type tH choisit le niveau dducation e .96
Le critre de domination
Dfinition : Le message m est une action domine pour le type t sil existe un autre message
m tel que le paiement maximal obtenu par t jouant m est infrieur au paiement minimal
obtenu par t jouant m, soit si Max u1 (m, a, t ) < Min u1 (m, a, t ) .97
a
Selon ce critre de raffinement, si le message m est une action domine pour le type t, alors
la croyance raisonnable du rcepteur, sil venait observer le message m , est une probabilit
a posteriori nulle du type t, soit (t / m) = 0 . Ce critre de raffinement peut tre renforc en
considrant quen rponse la combinaison (T, m) ou (T , m) , le rcepteur ne choisira pas
nimporte quelle action a , mais jouera la meilleure action b(T , ) pour des croyances donnes.
En consquence, on dira que le message m est une action domine pour le type t sil existe
un autre message m tel que Max u1 (m, a, t ) < Min u1 (m, a, t ) .
ab (T , m )
ab (T , m )
Il peut exister plusieurs types pour lesquels le message m est domin. Soit S (m) lensemble
de ces types. Alors la croyance raisonnable devient (t / m) = 0 . Pour le message hors
tS ( m )
sentier dquilibre m , on doit donc raisonnablement mettre tout le poids sur les types t
appartenant T mais nappartenant pas S (m) , ce qui donne (t / m) > 0 pour tout
t T S (m) (en supposant que lensemble T S (m) soit non vide). Lensemble T S (m)
est donc lensemble des types t pour lesquels le message m nest pas domin.98
Dans le modle de signal deux types de Spence par exemple, le renforcement du critre de
domination permet dliminer tous les quilibres sparants sauf lquilibre sparant o eL* = 0
et eH* = e . Ce critre ne permet cependant pas dcarter tous les quilibres mlangeants.99
Le critre de domination par lquilibre
Le raffinement bas sur le critre de domination peut tre insuffisant pour carter tous les
quilibres baysiens parfaits au sens faible qui paraissent non raisonnables. Pour rduire
encore plus ces types dquilibres, on peut recourir au critre de la domination par lquilibre
qui est un critre plus exigeant que le critre de domination.
Dfinition : Considrons un quilibre baysien parfait postul pour un jeu de signal et soit
u1* (t ) le paiement obtenu par lmetteur de type t cet quilibre. Un message m hors sentier
96
104
dquilibre est domin par lquilibre pour le type t de lmetteur si le plus grand paiement
possible pour le type t jouant m est infrieur au paiement u1* (t ) , soit si
Max u1 (m, a, t ) < u1* ( t ) .
a
Ce critre se base sur lide selon laquelle si un quilibre donn est postul, alors cet
quilibre, les joueurs (en particulier le rcepteur) doivent croire que le type t na aucune
incitation choisir un message m domin par lquilibre. Le critre de domination par
lquilibre peut tre renforc en considrant quen rponse la combinaison (T , m) , le
rcepteur ne choisira pas nimporte quelle action a , mais jouera la meilleure action pour des
croyances donnes. En consquence, un message m hors sentier dquilibre est domin par
lquilibre pour le type t si Max u1 (m, a, t ) < u1* ( t ) . Il peut exister plusieurs types pour
ab (T , m )
lesquels le message m est domin par lquilibre. Soit S * (m) lensemble de ces types.
Selon ce critre de raffinement, il nest donc pas raisonnable que lquilibre postul
comprenne une croyance du rcepteur affectant une probabilit strictement positive au type t
sil venait observer le message m . La croyance raisonnable du rcepteur est donc daffecter
une probabilit nulle la possibilit que le type t choisisse le message m , soit (t / m) = 0
pour tout t S * (m) . Pour le message hors sentier dquilibre m , on doit donc
raisonnablement mettre tout le poids sur les types t appartenant T mais nappartenant pas
S * (m) , ce qui donne (t / m) > 0 pour tout t T S * (m) avec
(t / m) = 1 (en
t T S * ( m )
supposant que lensemble T S (m) soit non vide). Lensemble T S * (m) est donc
lensemble des types t pour lesquels le message m nest pas domin par lquilibre.
*
Dans le modle de signal de Spence deux types, le critre de domination par lquilibre
permet dcarter tous les quilibres sparants sauf lquilibre sparant o eL* = 0 et eH* = e , ce
qui peut tre considr comme une simple consquence au fait que le critre de domination
par lquilibre est plus exigeant que le critre de domination. Ce critre permet galement
dcarter tous les quilibres mlangeants.100
Le critre intuitif
Dans certains jeux, le critre de domination par lquilibre ne permet pas dcarter tous les
quilibres non raisonnables. Cho et Kreps (1987) ont propos le critre intuitif qui est un
raffinement plus exigeant que les raffinements prcdents.101 Considrons un message m
hors sentier dquilibre et soit S * (m) lensemble des types pour lesquels le message m est
domin par lquilibre. La croyance raisonnable cet quilibre est donc (t / m) = 1 . On
t T S * ( m )
dira que lquilibre baysien parfait postul ne satisfait pas au critre intuitif, si pour le
message m , il existe un type t T S * (m) tel que :
u * (t ) <
100
101
Min
ab T S * ( m ), m
u1 (m, a, t )
105
Le type t tant incit dvier vers le message hors quilibre m , lquilibre baysien parfait
postul ne peut tre considr comme une prdiction raisonnable.
Pour simplifier lexpos du critre intuitif, considrons un jeu de signal avec deux type t et t
et deux messages m et m et que ce jeu admette un quilibre mlangeant dans lequel les deux
types choisissent le message m avec des croyances hors quilibre le soutenant. Supposons
qu cet quilibre, pour le type t, le message hors quilibre m est domin par lquilibre. Le
paiement obtenu cet quilibre par le type t est donc suprieur au plus grand paiement quil
pourrait obtenir en dviant vers le message m et ce quelque soit les croyances hors quilibre
du rcepteur. Si le rcepteur venait observer le message m , sa croyance raisonnable est
donc daffecter toute la probabilit au type t , soit (t / m) = 1 . Si en consquence cette
croyance, la meilleure raction du rcepteur au message m permet au type t dobtenir un
paiement suprieur son paiement lquilibre, lincitant ainsi dvier, alors lquilibre
postul est carter sur la base du critre intuitif.
Ainsi, un quilibre baysien parfait est carter sur la base du critre intuitif, si les deux
conditions suivantes sont satisfaites :
1) Quelque soient ses croyances hors sentier dquilibre, la meilleure raction du
rcepteur au message hors quilibre implique une rduction du paiement du type t par
rapport lquilibre ;
2) Etant donne la croyance raisonnable (t / m) = 1 rsultant de cette premire
condition, la meilleure raction du rcepteur au message m implique laccroissement
du paiement du type t par rapport lquilibre.
A titre dillustration de lutilisation du critre intuitif, reconsidrons lquilibre baysien
1
1
parfait au sens faible mlangeant (R, R ), (d , d ); q = , p avec p < dcrit dans la figure
3
2
5.9. Au regard du critre intuitif, cet quilibre nest pas une prdiction raisonnable car il
comprend une croyance non raisonnable. On remarque en effet que pour le type t 2 , le
message L est domine par lquilibre car le meilleur paiement obtenu en jouant L (soit 4) est
infrieur au paiement obtenu lquilibre en jouant R (soit 7). La croyance raisonnable qui en
rsulte est (t2 / L ) = 0 . Donc, si le rcepteur venait observer le message hors quilibre L, la
seule croyance raisonnable est daffecter tout le poids au type t1 , soit (t1 / L) = 1. Ceci
implique que la meilleure rponse du joueur 2 au message hors quilibre L est laction u. De
ce fait, le type t1 obtiendra un paiement de 5, suprieur au paiement de 3 obtenu lquilibre
prsum. Le type t1 tant incit dvier, lquilibre baysien parfait a sens faible
1
1
106
107
108
partie non informe (ici, les acheteurs) et dun segment de la partie informe (ici, les vendeurs
de biens de bonne qualit).
6.1.
1/2
Figure 6.1
La demande de voitures doccasion peut maner des deux groupes dindividus et est donc la
somme des demandes des deux groupes.105 Soient YA et YB le revenu consacr lachat de
voitures doccasion des groupes A et B respectivement. Lors de lachat dune voiture
doccasion, lacheteur base sa dcision sur la comparaison de deux lments, le prix et la
disposition payer, cette dernire dpendant notamment de la qualit du bien. Pour une
104
Rappelons que pour une distribution de probabilit uniforme U (a, b ) , lesprance mathmatique est
105
a+b
.
2
Akerlof considre que la fonction dutilit des individus des groupes A et B est respectivement
U A = M + 1 qi et U B = M + (3 2) qi avec M reprsentant lutilit procure par la consommation des
109
qualit q donne, considrons que les individus du groupe A ont une disposition payer de
1 q et les individus du groupe B une disposition payer de (3 2) q .106 Ainsi, pour une
qualit donne q, lindividu du groupe A nexprime une demande positive que si le prix p est
infrieure sa disposition payer, cest--dire si p <1 q . Les individus du groupe B
3
nexprime une demande positive que si le prix p est tel que p < q . Mais la difficult rside
2
ici dans le fait que la qualit nest pas observable pour lacheteur. Ce dernier doit donc baser
sa dcision sur une approximation de la qualit. Celle-ci est souvent la qualit moyenne
qui est gnralement le rsultat de croyances bases sur lexprience et lobservation passes.
En consquence, il ya une demande positive pour le groupe A et pour le groupe B lorsque le
prix est infrieur la disposition payer, celle-ci tant maintenant base sur la qualit
3
moyenne , soit lorsquon a respectivement p <1 et p < . Les demandes de voitures
2
doccasion DA et DB manant respectivement du groupe A et du groupe B sont donc
donnes par :107
YA
p
DA =
0
si
>p
si
3
YB
p si 2 > p
et DB =
3
0 si 2 p
En agrgeant les demandes des deux groupes dindividus, on obtient la demande globale
D( p, ) = DA + DB , fonction du prix p et de la qualit moyenne :
Y A + YB
p
Y
D ( p, ) = B
p
si
si
si
p<
p<
3
p
2
Loffre
Loffre mane des individus du groupe A, groupe possdant les N voitures doccasion. La
qualit des biens est une caractristique observable pour le vendeur. Il nacceptera donc de
vendre une voiture doccasion que si le prix de march excde la valeur subjective, cest-106
La disposition payer dun individu est le prix maximal quil est prt accepter pour lachat dun bien. Elle
dpend de lvaluation subjective de lutilit que procure le bien. Le fait que la disposition payer de lacheteur
(3/2) soit suprieure celle du vendeur (1) constitue une condition dexistence de lchange.
Y
Y
107
A la condition videmment que A N et B N .
p
p
110
dire si p > 1 q . Pour un prix de march p, les voitures offertes sont ainsi celles qui respectent
1 p
lingalit q < p . La proportion de voitures offertes est donc gale p = , comme il
2 2
ressort de la figure 6.2 :
f (q )
1/2
Figure 6.2
p
avec p 2
2
La quantit totale offerte S par le groupe A est fonction du prix p. Elle est donc de la forme
suivante :
S = S ( p)
p
Relevons que
est la qualit moyenne offerte pour un prix p donn.108 Nous avons en
2
effet :109
p
p
1
p
= E (q / q < p ) = q f (q / q < p ) dq = q dq =
2
p
0
0
6.2.
Le fonctionnement dun march o existe une asymtrie de linformation est donc caractris
par les trois quations suivantes :
D = D( p, )
S = S ( p)
= ( p)
108
Il nest pas ncessaire de donner des symboles diffrents la qualit moyenne initiale de lensemble des
voitures et la qualit moyenne conditionnelle.
109 1
est la distribution de probabilit conditionnelle de la qualit q offerte pour un prix p.
p
111
=p
Zone I
2
p
3
p
2
Zone II
Figure 6.3
Dans la zone I de la figure 6.3, on a p < et qui est la condition pour avoir une demande
Y + YB
p
gale D = A
. Mais le ct offre est tel que = . La condition pour que
2
p
Y + YB
nest donc pas ralise. Le mme rsultat est obtenu dans la zone II de la figure
D= A
p
Y
3
6.3 o on a p < et qui est la condition pour avoir une demande gale D = B . Mais
2
p
Y
p
ici galement, le ct offre est tel que = . La condition pour que D = B nest donc pas
2
p
ralise.
Nous obtenons ainsi le rsultat fondamental mis en avant par Akerlof : En cas dasymtrie
dinformation, lquilibre du march peut tre tel que les quantits changes soient nulles. En
dautres termes, lexistence de lasymtrie de linformation peut impliquer la disparition du
march. Lhypothse de linformation parfaite dans les modles conomiques standards ne
peut plus tre considre comme neutre.
Le processus conduisant ce rsultat est le produit du comportement des acheteurs et des
vendeurs. La situation initiale est caractrise par lexistence de voitures doccasion de
112
diffrentes qualits de moyenne . Les acheteurs ne sont pas en mesure de faire la diffrence
de qualit des voitures. Le prix quils sont disposs payer est donc identique pour toutes les
qualits de voiture et se base, en gnral, sur la qualit moyenne. A un prix quelconque p, les
vendeurs ayant une voiture de qualit q p se retirent du march.110 Seules demeurent sur le
march les voitures de qualit q < p . De ce fait, au prix p, la qualit moyenne des voitures
p
offertes baisse de 1
< 1 . Anticipant cette nouvelle qualit moyenne, les acheteurs
2
nacceptent pas de payer plus de (3 2)( p 2) , soit (3 4) p .111 A leur tour, les vendeurs ayant
une voiture de qualit suprieure ou gale (3/4)p se retirent du march. La qualit moyenne
des voitures restant dans le march baissera de nouveau ((3 4) p ) 2 , soit (3 8) p . La
poursuite de ce processus a pour corollaire la baisse continuelle de la qualit. A lquilibre, le
prix tendra vers 0 et aucune voiture ne sera change. Cet exemple montre comment le risque
de slection adverse est une source dinefficience conomique et sociale.
Le caractre extrme de cette conclusion, soit lexclusion totale du march de toutes les
voitures doccasion, est en fait du lhypothse de continuit de la qualit q. On peut obtenir
les mmes rsultats, moins extrmes et plus intressants du point de vue intuitif, en
considrant que la qualit est une variable discrte. Supposons par exemple que la qualit des
voitures doccasion peut prendre 5 modalits diffrentes : trs mauvaise ( q = 1 ), mauvaise
( q = 2 ), moyenne ( q = 3 ), bonne ( q = 4 ) et trs bonne ( q = 5 ). Le vendeur connat la qualit
de la voiture quil propose la vente. Lacheteur par contre, ne peut observer cette qualit
mais dispose de croyances sur la qualit, croyances acquises par exemple partir de
lobservation des changes passes. Supposons que pour lacheteur, ces croyances sont telles
que chaque modalit a la mme probabilit doccurrence, ce qui donne : probabilit (trs
mauvaise) = probabilit (mauvaise) = probabilit (moyenne) = probabilit (bonne) =
probabilit (trs bonne) = 1/5. Supposons galement titre de simplification, que le vendeur
et lacheteur ont le mme prix subjectif et quil est de 1 pour la trs mauvaise qualit, de 2
pour la mauvaise qualit, de 3 pour la qualit moyenne, de 4 pour la bonne qualit et de 5
pour la trs bonne qualit.
Etant donnes ces croyances de lacheteur, sa disposition payer initiale est gale au prix
moyen et est gale (1 + 2 + 3 + 4 + 5) 5 = 3 . Mais ce prix, les vendeurs ayant des voitures de
trs bonne qualit et de bonne qualit se retirent du march car ils exigent un prix
(respectivement 5 et 4) plus lev. De ce fait, ne restent sur le march que les voitures de
qualits trs mauvaise, mauvaise et moyenne. La nouvelle qualit moyenne est de ce fait,
gale (1 + 2 + 3) 3 = 2 et la nouvelle disposition payer est maintenant de 2, ce qui incite les
propritaires de voitures de qualit moyenne se retirer du march car ils exigent un prix (3)
suprieur. De nouveau, la qualit moyenne baisse et devient 1,5 et les propritaires de voitures
de mauvaise qualit se retirent du march. Ce processus sarrte lorsque ne restent sur le
march que les voitures de trs mauvaise qualit et le prix dquilibre du march est de 1. Ce
rsultat est un quilibre de slection adverse, c'est--dire un quilibre du march o ne
schange que les biens de mauvaise qualit.
110
Rappelons que pour une qualit q, la disposition payer des individus du groupe A est 1 q .
On ne considre ici que les acheteurs du groupe B car ce sont ces individus qui ne possdent pas de voitures
doccasion
111
113
6.3.
N
S ( p) =
0
si
pq
si
p<q
La demande mane des deux groupes A et B et ne dpend que du prix. Les acheteurs
potentiels comparent le prix de march et leur disposition payer. Pour chaque qualit q
observe, lexpression de la demande est :
YA + YB
p
Y
D( p ) = B
p
si
p<q
si q p
3
q
2
p>
3
q
2
si
Y A + YB
p
YB
p
q
Figure 6.4
(3/2)q
114
3
Pour la qualit q, lintervalle de lchange est p q, q . En effet :
2
Y +Y
o Pour p < q , nous avons D( p ) = A B et S ( p ) = 0 . Pour cet intervalle de prix,
p
aucun change na lieu.
3
o Pour p > q , nous avons D( p ) = 0 et S i ( p ) > 0 . Ici galement, aucun change na
2
lieu.
3
Au sein de lintervalle q, q , le prix dpendra du nombre de voitures offert. Trois cas sont
2
considrer :
Pour chaque niveau de qualit q, le tableau suivant permet de comparer les deux situations.
2
YB
3
Nombre de voitures N
Symtrie de linformation
Quantit change
Prix
N
(3 2)q
Asymtrie de linformation
Quantit change
0
Prix
Non dtermin
YB
N
(YB N )q
N partiellement
q
0
Non dtermin
0
Non dtermin
115
CB
pB
E( p)
CG
pG
Figure 6.5
Si les consommateurs pouvaient distinguer sans ambigut le bien de type G du bien de type
B, on aurait un prix pour chaque niveau de qualit, soit p G et p B avec p G > p B . Mais si les
consommateurs ne peuvent pas distinguer clairement entre les deux types de biens (ou ils le
peuvent mais avec un cot trop lev), alors on aura un seul prix de march pour les deux
qualits. Ce prix est un prix moyen E ( p ) et est videmment infrieur p G . A ce prix E ( p ) ,
le producteur de bonne qualit supportera des pertes, ce qui provoquera sa disparition. Ne
survivra donc que le producteur de bien de mauvaise qualit. Ce modle montre que les
mcanismes de march peuvent ne pas suffire lmergence de biens de haute qualit.
Les effets ngatifs de lasymtrie de linformation sur le bien-tre suggrent que des mesures
et des politiques conomiques peuvent tre mises en uvre, en plus des rponses de march
comme le signal et le filtrage, en vue de rduire ces effets ngatifs. Parmi ces mesures et
politiques conomiques, citons titre dexemple la protection des marques, la protection de la
proprit intellectuelle et le contrle indpendant de la qualit. Lexistence de marques
dposes ayant une rputation bien tablie constitue pour les agents conomiques une
assurance de qualit. Pour cette raison, ils sont disposs accepter un prix plus lev.
116
7.1.
Pour la dfinition de la notion d'quilibre du march d'assurance, les auteurs remarquent tout
d'abord que les compagnies d'assurance proposent des contrats qui fixent la fois le prix et la
quantit.114 Par contre, dans la plupart des autres marchs, les firmes fixent un prix et il
revient l'acheteur de choisir la quantit qu'il souhaite acqurir.115
Rothschild & Stiglitz dfinissent l'quilibre du march des assurances comme tant un
ensemble de contrats satisfaisant simultanment les deux conditions suivantes : 1) ces contrats
maximisent l'esprance d'utilit des individus ; 2) ils sont tels que a) aucun des contrats de
l'quilibre ne donne la compagnie d'assurance une esprance de profit ngative ; b) aucun
112
Akerlof, G. (1970). The market for lemons: Quality uncertainty and the market mechanism. Quarterly
Journal of Economics. Vol. 89, P 488-500.
113
Rothschild, M. & Stiglitz, J. (1976). "Equilibrium in Competitive Insurance Markets: an Essay on the
Economics of Imperfect Information". Quarterly Journal of Economics, Vol. 90. P 629-649.
114
Pour ce type de contrats, on parle de prix non linaires, c'est--dire de prix unitaires dpendant de la quantit.
Cette notion sera dveloppe plus loin.
115
Dans ce cas, on parle de prix linaires, c'est--dire de prix unitaires ne dpendant pas de la quantit.
117
contrat hors quilibre, s'il venait tre offert, ne procure la compagnie d'assurance, une
esprance de profit non ngative. Ce type d'quilibre est un quilibre la Cournot-Nash.
Considrons la situation d'un individu ayant une richesse initiale gale w et faisant face au
risque de sinistre pouvant lui occasionner une perte gale d . La probabilit d'occurrence de
ce sinistre est p . La situation de cet individu peut tre reprsente par la figure 7.1 o les axes
reprsentent son revenu dans les deux tats de la nature possibles. Le point E reprsente le
vecteur des revenus (consommations, richesse) contingents de l'individu sans assurance.
Supposons que cet individu ait la possibilit de s'assurer auprs d'une compagnie d'assurance
et que le contrat d'assurance stipule que l'individu doit payer une prime d'assurance gale 1
et reoit une indemnit gale 2 en cas de sinistre. En acceptant ce contrat d'assurance, le
vecteur des revenus (consommations, richesse) contingents est maintenant reprsent par le
point F de la figure 7.1. Avec 2 = 2 1 , le vecteur = (1 , 2 ) caractrise ainsi
compltement le contrat d'assurance.
On montre que si un individu a de l'aversion pour le risque, alors les courbes d'indiffrence
reprsentatives de ses prfrences sont dcroissantes et convexes comme indiqu dans la
figure 7.1. Dans celle-ci, l'individu accepte de s'assurer car le point F est situ sur une courbe
d'indiffrence "suprieure" celle contenant le point E . De plus, si le contrat d'assurance est
actuariellement quitable, alors la dcision optimale de l'individu est l'assurance totale, ce qui
situe son vecteur de revenus sur la ligne de certitude donnant un mme revenu dans tous les
tats de la nature.116
Revenu en cas de
sinistre
Prob = p
Ligne de certitude
+U
F
w d + 2
E
wd
w 1
Revenu en l'absence de
sinistre. Prob = 1 p
Figure 7.1
1 p
compagnie d'assurance est nulle, soit si 1 (1 p ) 2 p = 0 , ce qui donne 2 =
. Le
1
p
rapport 2 1 reprsente la pente de la droite EF . Ainsi, les contrats d'assurance situs sur
116
118
la droite EF ont une pente gale, en valeur absolue, au rapport des probabilits et procurent
la compagnie d'assurance une esprance de profit gale 0.
7.2.
Jusqu' prsent, nous avons fait l'hypothse explicite qu'il n'existait qu'un seul type
d'individus. En ralit, les individus peuvent avoir des caractristiques diffrentes. Une
caractristique pertinente pour la compagnie d'assurance est la probabilit de sinistre de
l'individu. Considrons maintenant qu'il existe deux types diffrents d'individus : 1) des
individus ayant une probabilit de sinistre leve, pH et 2) des individus ayant une
probabilit de sinistre faible, p L avec p H > p L .
Cette probabilit de sinistre est une information prive de l'individu. Elle n'est donc pas
observable par la compagnie d'assurance qui a tout de mme des croyances au regard de cette
probabilit. La compagnie dassurance sait que la proportion dindividus haut risque est .
L'individu observe sa probabilit de sinistre et exprime sa demande d'assurance qui va en
dpendre. En d'autres termes, la stratgie de l'individu (ici la demande d'assurance) dpend de
son type (ici la probabilit de sinistre). Les stratgies des deux types d'individu sont donc
2H = ( p H ) et 2L = ( p L ) .117 Rcrivons le programme de l'individu donnant la prime
dassurance optimale 2 selon qu'il soit du type pH ou du type p L . Comme la compagnie
dassurance ne peut faire la distinction entre les deux types, elle fixe une prime d'assurance
par unit dindemnit commune aux deux types. Soit cette prime dindemnit. On a donc
= 1 , soit 1 = 2 .
2
La demande d'assurance de l'individu de type pH est la solution du programme suivant :
max
E (u (w )) = (1 p H )u w 2H + p H u w d 2H + 2H
H
2
max
E (u (w )) = (1 p L )u w 2L + p L u w d 2L + 2L
L
2
Les conditions du premier ordre, ncessaires et suffisantes, sont telles que respectivement
pour l'individu du type pH et pour l'individu du type p L , on a :
(1 pH )
u w d 2H + 2H
=
H
u w 2
pH (1 )
117
119
(1 pL )
u w d 2L + 2L
=
L
u w 2
pL (1 )
Comme pH > pL , on a
(1 p H ) (1 p L )
et donc :118
<
(1 ) p H (1 ) p L
u w d 2H + 2H
u w d 2L + 2L
<
u w 2H
u w 2L
Cette ingalit implique que 2H > 2L . Pour montrer cela, supposons le contraire, c'est--dire
que 2H < 2L . (Le cas o 2H = 2L est videmment rejeter). Dans ce cas, on aura le
schma de la figure 7.2 :
u ()
wd +
w d + 2H (1 )
2L (1 )
w 2L
w 2H
Figure 7.2
(
(
)
)
(
(
)
)
(
(
u w d + 2H (1 ) u w 2L
u w 2H
>
>
u w d + 2L (1 ) u w 2H
u w 2L
)
)
Ce qui donne :
u w d + 2H (1 ) u w d + 2L (1 )
>
u w 2H
u w 2L
118
pour une mme prime dassurance par unit dindemnit , il nest pas possible davoir simultanment des
contrats dassurance actuariellement quitable pour deux types dindividus p H et p L . Ce point est dvelopp
plus loin.
120
Ceci constitue une contradiction et on a donc bien 2H > 2L . Cette ingalit signifie que pour
un prix dassurance unique, l'individu haut risque a une demande d'assurance suprieure
la demande d'assurance de l'individu bas risque.
Pour la drivation de cette conclusion, nous avons considr que le prix unitaire de l'assurance
est identique pour les deux types d'individu. Il s'agit en fait de prix linaires, c'est--dire de
prix unitaires indpendants de la quantit. La diffrence dans la demande d'assurance ressort
dans la figure 7.3 o le point A reprsente le vecteur de consommations de l'individu du type
L et le point A le vecteur de consommations de l'individu du type H .119
Si le contrat A choisi par l'individu de type L procure la compagnie d'assurance une
esprance de profit gale 0, alors le contrat A choisi par l'individu de type H lui procure
une esprance de profit ngative. En effet, en situation de prix linaires, le mme prix unitaire
1L 1H
=
= . Si le contrat
2L 2H
A du type p L est actuariellement quitable, alors 1L (1 p L ) 2L p L = 0 , soit
1L
L
L
1 2 p L = 0 , ce qui donne L = p L = . Lesprance de profit du contrat A du type pH
2
H
p
p
est 1H 2H p H = 1 2H p H = 1 H = 1 H < 0 . Donc, globalement sur les deux types
pL
1
dassurance sapplique aux deux types dindividus, ce qui donne
w d + 2H
w d + 2L
+U
A
E
wd
w 1H
w 1L
Revenu en l'absence de
sinistre
Prob = 1 p
Figure 7.3
On peut galement faire ressortir la diffrence de la demande d'assurance des deux types
d'individu et donc la dpendance de la demande d'assurance par rapport au type, en analysant
leur comportement au moyen des courbes d'indiffrence. Une caractristique fondamentale
119
Cette figure reprsente le cas gnral o le contrat dassurance nest actuariellement quitable pour aucun
type dindividu. On peut vrifier que le rsultat ne change pas si le contrat dassurance est actuariellement
quitable pour lun des types, par exemple le type p H .
121
des courbes d'indiffrence de deux types diffrents d'individu est connue sous l'expression de
la proprit de lunicit de lintersection (single crossing property).
Revenu en cas
de sinistre.
Prob = p
w d 1 + 2L
w d 1 + 2H
E
wd
H
L
w 1
Revenu en l'absence
de sinistre. Prob = 1 p
Figure 7.4
Cette proprit ressort dans la figure 7.4 qui montre qu'au point d'intersection E, la pente de la
courbe d'indiffrence de l'individu du type L est suprieure la pente de la courbe
d'indiffrence de l'individu du type H. Au point E, le taux marginal de substitution (en valeur
absolue) de lindividu L est suprieur celui de lindividu H.
Pour expliquer cette diffrence de pente des courbes d'indiffrence, considrons que le point
E reprsente la situation o aucun des deux types n'est assur. Leurs revenus contingents sont
donc (w1 , w2 ) = (w, w d ) . Pour chacun des deux types d'individu, la compagnie d'assurance
propose un contrat d'assurance qui laisse inchang le niveau de leur utilit avec une prime
d'assurance gale 1 . En contrepartie, en cas de sinistre, l'individu du type H reoit une
indemnit de 2H et l'individu du type L reoit une indemnit de 2L . Si le montant 2L
permet l'individu du type L de maintenir constant son niveau d'utilit, alors le niveau
d'utilit du type H est maintenu contant avec une indemnit 2H telle que 2H < 2L car la
probabilit d'encaisser la somme 2H est plus leve que la probabilit d'encaisser 2L .
La figure 7.5 fait ressortir trois contrats actuariellement quitables, mais avec des prix (prime
unitaire dassurance) diffrents. Le premier contrat de pente (1 p L ) / p L est un contrat
actuariellement quitable pour les individus bas risque. Le second contrat de pente
(1 p H ) / p H est un contrat actuariellement quitable pour les individus haut risque. Enfin,
le troisime contrat de pente (1 p ) / p est un contrat actuariellement quitable pour un
risque moyen p o p = p H + (1 ) p L avec reprsentant la proportion d'individus
haut risque. Comme p est une probabilit moyenne de sinistre, on a p H > p > p L et les
1 pH 1 p 1 pL
pentes (ngatives) des trois types de contrats sont donc telles que
.
<
<
pH
p
pL
122
(1 p L ) / pL
Revenu en cas
de sinistre.
Prob = p
(1 p ) / p
(1 pH ) / pH
wd
Revenu en l'absence de
sinistre. Prob = 1 p
w
Figure 7.5
La figure 7.6 reprsente le cas o le prix de l'assurance est dtermin de telle faon tre
actuariellement quitable pour les hauts risques. Comme le montre cette figure, ce prix, les
bas risques peuvent prfrer ne pas s'assurer du tout.
Revenu en cas
de sinistre.
Prob = p
(1 p H ) / pH
L
H
wd
Revenu en l'absence de
sinistre. Prob = 1 p
w
Figure 7.6
La figure 7.7 est un autre cas illustrant le fait que pour un prix d'assurance unique , les hauts
risques s'assurent plus et les bas risques s'assurent moins. Ici, la compagnie d'assurance
propose un contrat d'assurance actuariellement quitable pour un risque moyen.
Revenu en cas
de sinistre.
Prob = p
(1 p ) / p
H
L
wd
E
w
Figure 7.7
Revenu en l'absence
de sinistre. Prob = 1 p
123
En rsum, pour un prix d'assurance unique , les hauts risques s'assurent plus que les bas
risques. Cette situation entrane des pertes pour la compagnie d'assurance. Pour rtablir son
quilibre, la compagnie d'assurance augmente son prix, ce qui incite encore plus les bas
risques rduire leur demande d'assurance. Il s'agit donc d'une situation de slection adverse
o les hauts risques chassent les bas risques. Cette situation est essentiellement une
consquence de l'asymtrie de l'information existant entre les compagnies d'assurance et les
individus. Elle est galement la consquence de lexistence de prix linaires, cest--dire de
prix indpendants de la quantit.
7.3.
Considrons maintenant que les compagnies d'assurance mettent en place un mcanisme leur
permettant de segmenter la population en fonction du niveau de risque de l'individu. Des
contrats d'assurance prix non linaires peuvent permettre aux compagnies d'assurance
d'atteindre cet objectif. Dans ce cas, elles proposent des contrats prix / quantit, c'est--dire
des contrats o l'individu n'a plus la possibilit de choisir le montant de l'indemnit (la
quantit). Ce type de contrat est reprsent par un point dans le plan ayant pour axes le revenu
dans le cas de l'tat de nature 1 et le revenu dans le cas de l'tat de la nature 2.
Revenu en cas
de sinistre.
Prob = p
w d + 2
wd
w 1
Revenu en l'absence de
sinistre. Prob = 1 p
Figure 7.8
Le point A par exemple dans la figure 7.8 correspond un contrat d'assurance o l'individu
paie la somme 1 et reoit une indemnit de 2 en cas de sinistre. Les autres points de la
droite EA ne sont plus des contrats d'assurance proposs par la compagnie d'assurance.
Deux types de contrats non linaires sont envisageables :120
Des contrats mlangeants (1 , 2 ) destins indistinctement tous les types
d'individus, qu'ils soient bas risque ou haut risque.
Des contrats sparants ( 1H , 2H ) et ( 1L , 2L ) , le premier tant destin aux et choisi
par les individus haut risque et le second tant destin aux et choisi par les
individus bas risque.
120
124
On montre dabord que les contrats mlangeants ne sont pas robustes la concurrence entre
les compagnies d'assurance. Si reprsente la proportion des hauts risques, alors la
probabilit moyenne de sinistre est p = p H + (1 ) p L . Soit ED la droite correspondant la
pente (1 p ) / p et soit un contrat d'assurance prix non linaire reprsent par le point C
sur cette droite. Ce contrat procure la compagnie d'assurance une esprance de profit nulle.
A ce point, les courbes d'indiffrence des individus du type H et du type L se croisent comme
indiqu dans la figure 7.9.
Revenu en cas
de sinistre.
(1 p H ) / pH
(1 p ) / p
(1 p L ) / pL
C
H
L
wd
Figure 7.9
Revenu en l'absence de
sinistre.
Cette figure montre que tout contrat d'assurance situ dans la zone hachure est prfr par les
individus bas risque. Un tel contrat, s'il est de pente infrieure (1 p L ) / p L et situ dans la
zone hachure, procure la compagnie d'assurance une esprance de profit strictement
positive. En situation de concurrence, un tel contrat sera donc propos par une autre
compagnie d'assurance et sera accept par les individus bas risque. En consquence, la
compagnie ayant propos le contrat reprsent par le point C n'attirera plus que les individus
haut risque, ce qui engendrera une esprance de profit strictement ngative. Donc, le contrat
mlangeant reprsent par le point C ne peut tre un contrat viable dans un march
d'assurance concurrentiel. En d'autres termes, un tel contrat n'est pas robuste la concurrence.
Considrons maintenant le cas o la compagnie d'assurance propose aux individus des
contrats sparants ( 1H , 2H ) et ( 1L , 2L ) . Ces contrats doivent tre tels que chaque type
d'individu choisisse de faon optimale le contrat qui lui est destin. En d'autres termes,
l'individu de type H choisit le contrat ( 1H , 2H ) car c'est sa meilleure rponse aux
propositions de la compagnie d'assurance. Il en est de mme pour l'individu de type L pour
qui le contrat ( 1L , 2L ) est le meilleur choix. On dit dans ce cas, que les choix effectus sont
le rsultat d'un processus d'autoslection.
Le seul couple de contrats sparants possibles o chaque type d'individu choisit par
autoslection le contrat qui lui est destin est reprsent par les points B et A tel qu'il ressort
dans la figure 7.10.
125
Revenu en cas
de sinistre
Ligne de certitude
(1 p L ) / pL
H
(1 pH ) / pH
A
E
wd
Figure 7.10
Revenu en l'absence de
sinistre.
121
Relevons que strictement parlant, l'individu du type p H est indiffrent entre les deux contrats B et A car ils
sont situs sur la mme courbe d'indiffrence. Nous avons donc implicitement considr que l'individu du type
p H choisit de faon naturelle le contrat B. Autrement, pour le forcer faire ce choix, il suffit que le contrat A
soit prs dcal vers le point E sur la droite EA.
126
D
Revenu en cas
de sinistre
(1 p L ) / p L
D'
(1 pH ) / pH
B
A
E
wd
Figure 7.11
Revenu en l'absence
de sinistre.
Dans ce cas, tous les contrats mlangeants situs dans la zone hachure (figure 7.11) seront
prfrs par les deux types d'individus et procureront un profit espr positif. Ce type de
contrats mlangeants rend le couple de contrats sparants (B, A) non viable. Comme ce
contrat mlangeant est lui galement non robuste la concurrence, il n'existe donc pas
d'quilibre lorsque la proportion d'individus haut risque est faible.
Le deuxime cas concerne la situation o la proportion d'individus haut risque est leve.
Dans ce cas, la droite ED' reprsentative des contrats mlangeants esprance de profit nulle
passe au-dessous de la courbe d'indiffrence des individus bas risque passant par le point A.
Dans ce cas, aucun contrat mlangeant ne peut attirer simultanment les individus haut
risque et les individus bas risque. Le couple de contrats sparants (B, A) est donc dans ce
cas bien un quilibre car il est robuste la concurrence.
L'quilibre reprsent par le couple (B, A) procure une assurance totale aux individus haut
risque mais une assurance partielle (sous optimale) aux individus faible risque. C'est une
situation de slection adverse due l'existence de l'asymtrie de l'information.
En clair, pour pouvoir discriminer entre les deux types de risque, la compagnie d'assurance
propose un menu de contrats tel que :
L'un prvoyant une couverture totale du risque avec une prime d'assurance leve ;
L'autre prvoyant une couverture plus faible du risque avec une prime d'assurance
plus faible.
Par autoslection, l'individu haut risque choisit le contrat ayant une couverture totale du
risque et l'individu risque faible choisit le contrat ayant une couverture partielle du risque.
En proposant un tel menu de contrats, la compagnie d'assurance cherche dcourager
l'individu haut risque choisir le mme contrat que l'individu faible risque, ce qui permet
de sparer et didentifier les deux types dindividus.
127
8.1.
L'asymtrie de l'information
Il y a problme d'asymtrie d'information lorsqu'une information pertinente de l'change n'est
pas observe par l'une des parties de l'change. Dans le cas d'un contrat de travail, la
productivit du travailleur est une information pertinente. Or, lors du recrutement d'un
travailleur, l'employeur ne peut observer la capacit productive du candidat. A la place de
cette dernire, l'employeur observe d'autres caractristiques du travailleur comme par exemple
le niveau d'ducation. Dans le modle de signal, chaque travailleur est suppos connatre sa
propre capacit productive.
A titre de simplification, on considre qu'un travailleur peut avoir lun des deux niveaux
possibles de capacit productive : une capacit productive faible L ou une capacit
productive leve H . On a donc = { L , H } avec L < H . La probabilit a priori qu'un
travailleur soit du type H (resp. L ) est p (resp. 1-p). Ces probabilits peuvent galement
tre interprtes comme les proportions de travailleurs de type H et de type L .
122
123
128
La courbe du cot de l'ducation suivant ces caractristiques est donne la figure 8.1 :
C (e, )
C (e, L ) C (e, H )
e
Figure 8.1
Ainsi, le cot total et le cot marginal sont tous deux plus levs pour le travailleur faible
capacit que pour le travailleur forte capacit.
Observant le niveau d'ducation e (et non la capacit productive ) qu'elles interprtent et
acceptent comme tant un signal, les firmes proposent un salaire w(e ) en fonction du niveau
124
C (e, )
. Un
129
Pour rendre le modle plus frappant, Spence (1973) considre que l'ducation n'a aucun effet
sur la capacit productive du travailleur, ce qui donne dans ce cas y ( , e ) = .126
Cette quation est galement l'expression de la stratgie des entreprises (le rcepteur). Elle
spcifie une action (salaire offert) pour chaque message possible (niveau d'ducation). Pour
que la stratgie des firmes soit complte, elle doit spcifier une action (salaire offert) pour
chaque message possible. La probabilit ( H / e ) est la croyance a posteriori des firmes que
le travailleur est du type H (capacit leve) tant donn le niveau d'ducation observ e.
Cette probabilit est commune aux firmes. Ceci implique que les croyances des firmes sont
galement les mmes pour des niveaux d'ducation e en dehors du sentier d'quilibre. La
figure 8.2 reprsente une fonction de salaire w(e ) qui est une esprance base sur les
croyances a posteriori des firmes ( / e ) .
Cette figure montre que le salaire w(e ) est toujours compris entre L et H . Le point
(e, w(e)) par exemple, reprsente le cas o les firmes observent le niveau d'ducation e et
en dduisent les croyances ( L / e = e) = ( H / e = e) = 1 / 2 sur le type du travailleur, ce
125
130
1
1
qui donne le salaire w(e) = L + H . D'une faon gnrale, tout salaire w(e ) strictement
2
2
compris entre L et H est la consquence de croyances a posteriori ( H / e ) ou, de faon
quivalente ( L / e ) .
w
w(e)
e
Figure 8.2
131
+u
wL
wH
w1
e1
e2
Figure 8.3
Voir chapitre 5 pour la dfinition de lquilibre baysien parfait pour un jeu de signal.
Afin de ne pas alourdir lexpos outre mesure, nous ngligerons le qualificatif au sens faible en parlant du
concept de lquilibre baysien parfait. Lquilibre baysien parfait sera implicitement au sens faible sil ne
spcifie aucune restriction sur les croyances hors quilibre et ne sera pas au sens faible sil spcifie des
croyances raisonnables en dehors du sentier dquilibre.
128
132
Les firmes sont en situation de concurrence et font une offre simultane tel que la
fonction de salaire w* (e ) soit un quilibre de Nash de ce jeu (entre les firmes). Le
salaire offert est donc gal la productivit espre tant donnes les croyances
consistantes ( / e ) .
Nous montrerons que ce jeu de signal admet un quilibre baysien sparant dans lequel les
firmes interprtent l'ducation comme un signal de capacit. Donc, le rle du signal est de
permettre aux firmes, partir de l'observation du niveau d'ducation choisi par le travailleur,
d'infrer la capacit productive des travailleurs qui est pour elles une information non
observable. Ainsi, malgr son inutilit (suppose) dans l'amlioration du niveau de
comptence des travailleurs, l'ducation est tout de mme demande par les travailleurs car
elle leur permet de signaler leur capacit productive. Le jeu ainsi dfini admet un quilibre
dans lequel les travailleurs haute productivit choisissent un niveau d'ducation suprieur
celui des travailleurs faible capacit et les firmes interprtent cette diffrence comme tant
un signal de la capacit des travailleurs et donc offrent un salaire lev pour le travailleur
ayant un niveau d'ducation lev et un salaire faible pour le travailleur ayant un niveau
d'ducation faible.
8.2.
A titre de benchmark, considrons en premier lieu la situation d'information complte, c'est-dire la situation o la capacit productive du travailleur n'est pas son information prive, mais
plutt une information commune partage par tous les acteurs du jeu. La comptition entre les
firmes impliquant que les profits sont nuls, le travailleur de capacit et d'ducation e
obtient un salaire gal sa productivit. En d'autres termes, si les entreprises pouvaient
observer la productivit des travailleurs, elles verseraient un salaire diffrenci en fonction de
la capacit productive du travailleur, soit : w( H ) = H et w( L ) = L .
En situation d'information complte, un travailleur de capacit choisit un niveau
d'ducation e qui soit la solution du programme suivant :
Comme le salaire est indpendant du niveau d'ducation et cette dernire est coteuse, le
niveau optimal d'ducation des deux types de travailleur est donc 0, soit e * ( H ) = e * ( L ) = 0 .
La figure 8.4 fait ressortir le choix des travailleurs de type L et H en cas de symtrie de
l'information.
133
H
w
w
+u
+u
wH = H
wH = H
wL = L
wL = L
e * ( H ) = e * ( L ) = 0
e * ( H ) = e * ( L ) = 0
Figure 8.4
8.3.
e
Figure 8.5
Dans le cas d'asymtrie de l'information sans signal, les firmes ne peuvent pas distinguer
entre les deux types de travailleurs. Par consquence, l'asymtrie de l'information donne au
travailleur de faible capacit (le type L ) la possibilit de se faire passer pour le travailleur de
capacit lev (le type H ). La figure 8.5 montre que par rapport au cas de symtrie de
l'information, le type L peut augmenter son utilit en imitant le type H .
Les firmes ne pouvant distinguer les deux types de travailleurs, elles offriront donc un salaire
gal l'esprance de productivit, soit :
E (w) = p H + (1 p ) L
On a videmment wL < E (w) < wH . Le travailleur du type H est donc dfavoris par la
situation d'asymtrie d'information sans possibilit de signal puisqu'il reoit un salaire moyen
infrieur au salaire correspondant sa capacit productive. Il est de ce fait incit mettre un
signal (mme coteux) partir duquel les firmes infrent la qualit du travailleur. La
consquence de cette obligation est que le type H sera contraint de s'loigner de son niveau
optimal correspondant au cas de symtrie de l'information.
L'objectif du modle de Spence est d'tudier la possibilit d'existence d'quilibres pour ce jeu
de signal. Il peut exister deux types d'quilibre : Equilibre sparant et quilibre mlangeant.
Par quilibre, on entend ici un tat partir duquel aucune partie nest incite dvier de faon
unilatrale, ce qui correspond lquilibre de Nash.
134
8.4.
Pour l'tude des quilibres baysiens parfaits, symbolisons par e * ( ) , le niveau d'ducation
d'quilibre du travailleur aprs avoir observ son type et par w* (e ) , le salaire d'quilibre offert
par les firmes aprs avoir observ le niveau d'ducation du travailleur.
Le niveau d'ducation e
w
H
Courbes d'indiffrence
du type L
Figure 8.6
Il est vident que pour e ] 0, e[ , tout travailleur prfre strictement lalternative (e, H ) lalternative
(0, L ) .
129
135
Etant donnes leurs croyances consistantes, les firmes offrent un salaire de H au travailleur
haute capacit et un salaire L au travailleur de faible capacit. On a donc : w* (e * ( H )) = H
et w * (e * ( L )) = L . Etant donne cette meilleure rponse des firmes, la dcision optimale du
travailleur de faible capacit est de choisir un niveau d'ducation gal 0, soit : e * ( L ) = 0 .
En effet, le salaire d'quilibre offert par les firmes tant fix L , le travailleur maximise son
utilit en minimisant son cot d'ducation, ce qui peut tre obtenu par le choix d'un niveau
d'ducation nul. Le choix optimal du travailleur de type L est reprsent par la figure 8.7 qui
fait ressortir sa courbe d'indiffrence passant par son point d'quilibre
(e * ( L ), w(e * ( L ))) = (0, L ) . Dans un quilibre sparant, le travailleur de type L choisit donc
le mme niveau d'ducation que dans le cas d'information complte.
L
w * e * ( L ) = L
0 = e* ( L )
Figure 8.7
136
La figure 8.7 montre que si le travailleur de type H choisit un niveau d'ducation infrieur
e , alors le travailleur de type L sera incit (meilleure rponse) dvier et limiter. En
effet, la courbe d'indiffrence de l'individu de type L passant par le point (e, H ) avec
0 < e < e reprsente un niveau d'utilit suprieur par rapport la courbe d'indiffrence
passant par le point (0, L ) .
Afin d'annihiler l'incitation du travailleur de type L dvier du point (0, L ) , le travailleur
de type H choisira par consquence un niveau d'ducation e * ( H ) tel que le travailleur de
type L ne puisse pas l'imiter. Le niveau d'ducation e * ( H ) doit donc tre tel que
u ( L , 0 / L ) u ( H , e * ( H ) / L ) , soit L C (0, L ) H C (e * ( H ), L ) et finalement
L H C (e * ( H ), L ) . En d'autres termes, e * ( H ) doit tre au moins gal au niveau
d'ducation e comme le montre la figure 8.7.
On peut ainsi construire un quilibre baysien parfait sparant ayant les caractristiques
suivantes :
Stratgies des travailleurs : e * ( L ) = 0 et e * ( H ) = e ;
Une fonction de salaire w * (e ) telle que par exemple celle dcrite par la figure
8.8 avec notamment w * (e * ( L )) = w * (0 ) = L et w * (e * ( H )) = w * (e ) = H ;
Croyances a posteriori des firmes : ( L / e = 0 ) = 1 et ( H / e = e ) = 1 .
L
w* e* ( H ) = H
w* (e )
w* e * ( L ) = L
0 = e * ( L )
e = e * ( H )
Figure 8.8
Cet quilibre est un quilibre sparateur au moindre cot (least cost separating equilibrium).
Pour montrer qu'il s'agit bien d'un quilibre (de Nash) baysien parfait, remarquons en
premier lieu qu'tant donnes les croyances ( H / e = e ) = 1 et ( L / e = 0 ) = 1 , les
entreprises versent chaque travailleur un salaire gal sa productivit, ce qui reprsente une
situation optimale pour les entreprises. La figure 8.8 montre galement, qu'tant donne la
137
fonction de salaire w* (e ) , chaque type de travailleur aura choisi la courbe d'indiffrence la
plus leve possible.130
Notons qu'en fait, le type L est indiffrent entre les points (0, L ) et (e, H ) . Nous
considrons implicitement (sans perte de gnralit) que dans un quilibre baysien parfait, le
type L opte pour le premier quilibre (0, L ) . Autrement, on peut obtenir un quilibre
baysien parfait en posant que le travailleur de type H choisit un niveau d'ducation un
prs, lgrement suprieur e , ce qui force le type L choisir le point (0, L ) .
Une remarque importante est faire propos des croyances des firmes, remarque relier la
multiplicit des quilibres baysiens parfaits. Dans la construction de l'quilibre baysien
parfait de la figure 8.8, aucune restriction n'a t pose propos de ces croyances lorsque le
message du travailleur n'est ni zro ni e , c'est--dire lorsque le signal de l'metteur se situe en
dehors du sentier d'quilibre. Les seules restrictions imposes aux croyances concernent les
croyances du sentier d'quilibre et sont ( L / e = 0 ) = 1 et ( H / e = e ) = 1 . Ces restrictions,
bases sur la rgle de Bayes, sont satisfaites par la fonction de salaire w* (e ) de la figure 8.8
car w * (0 ) = L et w * (e ) = H .
La consquence de l'absence de restrictions imposes aux croyances en dehors du sentier
d'quilibre est que l'quilibre baysien parfait ainsi dfini est compatible avec plusieurs autres
fonctions de salaire. Par exemple, dans lquilibre dcrit la figure 8.9, on obtient les mmes
stratgies d'quilibre ( e * ( L ) = 0 ; e * ( H ) = e ; w * (0 ) = L et w * (e ) = H ) avec les croyances
suivantes : ( H / e e < e ) = 1 et ( H / e < e ) = 0 .
L
w* e* ( H ) = H
w* (e )
w* e* ( L ) = L
0 = e* ( L )
e = e* ( H )
Figure 8.9
Notons que e est le niveau maximal dducation que pourrait choisir le travailleur de type H car ce dernier
prfre en effet un salaire L avec un niveau d'ducation e = 0 un salaire H avec un niveau d'ducation
e>e.
130
138
Ces croyances signifient que les entreprises sont certaines que le travailleur est du type H si
son niveau d'ducation e est suprieur ou gal e . Par contre, si le niveau d'ducation e est
infrieur e , alors les firmes considrent avec certitude que ce dernier est du type L . Etant
donnes ces croyances, le salaire optimal offert par les firmes est w * (e ) = L si e < e et
w * (e ) = H si e e . Le graphe de cette fonction de salaire est donn la figure 8.9. Etant
donne cette fonction de salaire (la meilleure rponse des firmes), les courbes d'indiffrence
montrent que les meilleurs choix des travailleurs de type L et H sont respectivement
e * ( L ) = 0 et e * ( H ) = e .
La multiplicit des quilibres baysiens parfaits peut jeter un doute srieux sur le bien-fond
de ce modle. Cependant, lintroduction de raffinements des croyances hors quilibre permet
dcarter tous les quilibres non raisonnables.
L'interprtation de l'existence d'un quilibre sparant est que les travailleurs de haute capacit
doivent supporter un cot d'ducation leur permettant de se distinguer des travailleurs de
faible capacit et obtenir ainsi un salaire plus lev. Le signal (ici lducation) n'est pas
ncessairement un objectif en tant que tel. Dans un quilibre sparant, le comportement
rationnel des joueurs implique que chaque travailleur choisisse un niveau d'ducation qui est
rvlateur de son type. Malgr l'absence suppose d'impact de l'ducation sur la performance,
la demande d'ducation trouve sa justification dans sa qualit de signal de capacit productive.
Cette aptitude de signal de l'ducation est rendue possible par le fait qu'au del d'un certain
niveau d'ducation e , le cot d'ducation qui en rsulte ne peut tre support par les
travailleurs de faible capacit. Par contre, un travailleur de haute capacit peut supporter ce
cot (mais ne dpassant pas e ). Le choix d'un niveau d'ducation diffrent est clairement d
une diffrence de capacit productive. Ce potentiel de signal de l'ducation est le rsultat de la
caractristique fondamentale C e (e, ) < 0 qui a donn lieu la proprit de lunicit de
lintersection.
( L / e = e p ) = 1 p . La meilleure rponse des firmes est dans ce cas d'offrir un salaire gal
l'esprance de productivit, soit :
w * (e p ) = ( H / e = e p ) H + ( L / e = e p ) L = p H + (1 p ) L = E ( )
La figure 8.10 montre que le niveau d'ducation e p ne peut tre suprieur e~ car cela
correspondrait pour le type L une courbe d'indiffrence (passant par un point (e, E ( ))
139
e ) d'un niveau d'utilit infrieur, ce qui constitue pour le type L une incitation
avec e > ~
dvier vers e = 0 avec un salaire gal L . En d'autres termes, pour qu'un quilibre
mlangeant existe, il faut que u (E ( ), e p / L ) u ( L , 0 / L ) , ce qui entrane 0 e p e~ .
Type L
E ( )
e~
Figure 8.10
La figure 8.11 dcrit un quilibre baysien parfait dans lequel le niveau d'ducation e p choisi
par les deux types est compris entre 0 et e~ ainsi que la fonction de salaire qui soutient cet
quilibre.
Type L
Type H
E ( )
w* (e )
ep
e~
e
Figure 8.11
Pour montrer qu'il s'agit bien d'un quilibre, notons en premier qu'tant donne la fonction de
salaire w* (e ) de la figure 8.11, les deux types de travailleur maximisent leur utilit au point
(e p , E ( )) . En effet, tout autre salaire de la fonction de salaire w* (e) coupe (ou est un point de
tangence avec) une courbe d'indiffrence un niveau d'utilit infrieur. Les firmes sont
galement en situation optimale car le salaire vers E ( ) est gal l'esprance de
productivit. Enfin, la fonction de salaire w * (e ) est consistante avec les croyances
140
d'quilibre de E ( ) . Notons quil existe une grande libert dans le trac de la fonction w* (e ) ,
ceci en raison de labsence de restriction sur les croyances hors quilibre.
8.5.
Un modle de signal peut admettre plusieurs quilibres qui peuvent tre sparants ou
mlangeants. Ceci est en particulier la consquence de l'absence de restrictions relatives aux
croyances des firmes hors sentier d'quilibre. Or, pour une dfinition complte de la stratgie
des firmes, on doit galement spcifier les croyances des firmes si le message (choix du
niveau d'ducation) du travailleur n'est pas le message d'quilibre. Des restrictions sont
proposes afin d'carter les quilibres ayant des croyances hors quilibre non raisonnables.
Ces raffinements ont pour effet de rduire le nombre d'quilibres. En consquence, un
quilibre baysien parfait ne sera considr comme tant une prdiction crdible que si les
croyances hors sentier d'quilibre cet quilibre sont raisonnables.132
Commenons par montrer comment les quilibres mlangeants ne survivent pas au test du
raffinement bas sur le critre de domination par lquilibre et le critre intuitif. Considrons
pour cela un quilibre mlangeant quelconque tel que dcrit la figure 8.12 (quasiment
identique lquilibre de la figure 8.11) ayant comme stratgies dquilibre
e * ( H ) = e * ( L ) = e p et w* (e p ) = E ( ) . A cet quilibre, on a w* (e ) = H pour tout e e car la
131
132
Voir par exemple Salani, B. (1994). Thorie des contrats. Economica, 1994. Paris. Page 54.
Voir chapitre 5 pour lexpos de certains critres de raffinements des quilibres des jeux de signaux.
141
Type L
Type H
w* (e )
H
E ( )
ep
e e
Figure 8.12
La fonction de salaire w* (e ) qui supporte cet quilibre doit tre telle que w* (e ) < H pour
e e e . Autrement, le type H serait incit dvier vers un point ( H , e ) avec e e e .
Mais pour que w* (e ) soit strictement infrieure H , il faut que les croyances des firmes
soient telles que ( H / e ) < 1 pour e e e . Or, ces croyances ne sont pas raisonnables car
l'utilit obtenue par le type L cet quilibre mlangeant est strictement suprieure l'utilit
qu'il obtiendrait pour une issue (w* (e ), e ) avec e e e et ce quelque soit la valeur de
w * (e ) , c'est--dire mme si le salaire est maximal, soit gal H . On a ainsi pour e [e, e] :
u * (E ( ), e p / L ) > Max
u (w, e / L )
*
w W ( , e )
W * (, e ) est l'ensemble des salaires d'quilibre (meilleures rponses) des firmes qui font suite
l'observation par ces firmes du niveau d'ducation e du travailleur. En d'autres termes, pour
le type L , le choix d'un niveau d'ducation e [e, e] est strictement domin par le niveau
d'ducation E ( ) de l'quilibre mlangeant. Par contre, le type H pourrait accrotre son
utilit s'il venait choisir un niveau d'ducation e [e, e] . En consquence, si les firmes
venaient observer un niveau d'ducation e [e, e] , elles devraient tre raisonnablement
convaincues qu'il ne s'agit pas d'un travailleur du type L . Donc, tant donn l'quilibre
mlangeant (e p , E ( )) , l'observation d'un niveau d'ducation hors quilibre e [e, e] , ne
Ceci implique galement la dviation du type L vers le niveau dducation gal 0. En effet,
tant donne la dviation du type H , pour tout choix dducation e [e, e] , les croyances
raisonnables des firmes sont ( L / e [e, e]) = 1 . Les firmes proposeront donc un salaire L ,
142
ce qui incite le type L choisir un niveau dducation gal 0. Lexistence de cette possible
dviation implique qu'aucun quilibre mlangeant ne pourra survivre si l'on imposait aux
croyances hors sentier d'quilibre d'tre raisonnables sur la base du critre intuitif.
Concernant les quilibres sparants, le raffinement selon le critre de la domination par
lquilibre implique que la croyance raisonnable lobservation dun niveau dducation hors
quilibre suprieur e est ( L / e > e ) = 0 ou, de faon quivalente ( H / e > e ) = 1 . En effet,
pour tout niveau dducation suprieur e , le type L obtient une utilit infrieure celle
obtenue lquilibre et ce quelque soit la croyance des firmes. Il en rsulte que pour le
message hors quilibre e e , le salaire dquilibre est w* (e ) = H , comme cela ressort la
figure 8.9.
Ceci implique son tour quun quilibre sparant o le type H choisirait un niveau
dducation suprieur e ne satisfait pas le critre de domination par lquilibre car comme
le montre la figure 8.13 un tel quilibre nest possible quavec un salaire infrieur H pour
des niveaux dducation compris entre e et e , ce qui correspond aux croyances hors quilibre
non raisonnables ( H / e [e, e]) < 1 .
w e ( H ) = H
*
w* (e )
w* e* ( L ) = L
0 = e* ( L )
Figure 8.13
Le seul quilibre qui satisfait aux tests des raffinements des croyances hors sentier quilibre
est celui o le type de faible productivit choisit un niveau dducation gal 0 correspondant
son choix du cas de linformation complte et o le type de haute productivit choisit un
niveau dducation suprieur mais juste suffisant pour dcourager le type de faible
productivit limiter.
8.6.
En cas de symtrie de l'information, chaque type de travailleur reoit le salaire qui correspond
sa capacit productive. On a donc w * ( L ) = L et w * ( H ) = H . L'ducation n'ayant aucun
143
impact (suppos) sur la capacit productive, chaque type de travailleur choisit un niveau
d'ducation gal zro, soit e * ( L ) = e * ( H ) = 0 . En prsence d'asymtrie d'information, dans
un quilibre sparant, la situation du travailleur de type L est identique. Par contre, pour
obtenir un salaire de H , le travailleur de type H , se trouve tre dans l'obligation de choisir
le niveau d'ducation e 0 afin de dcourager le type L l'imiter. En d'autres termes,
l'existence de travailleurs de type L exerce une externalit ngative sur les travailleurs de
type H .133
Par rapport la situation d'asymtrie d'information sans signal, l'existence de la possibilit de
signal a des effets diffrents sur les parties concernes. Pour les firmes, dans les deux cas,
elles paient un salaire gal E ( ) . Pour le travailleur de faible capacit, sans signal, le salaire
peru est gal E ( ) . Mais lorsqu'il existe la possibilit de signal, le type L obtient un
salaire de L . Etant donn que dans les deux cas, le niveau d'ducation est nul, l'existence de
la possibilit de signal implique une rduction du bien-tre des travailleurs de type L .
Par contre, pour le travailleur de type H , l'effet de l'existence du signal dpend entre autres
du niveau de E ( ) , c'est--dire de la distribution ( p, 1 p ) des travailleurs de diffrentes
capacits ainsi que du cot de l'ducation. Comme le montre la figure 8.13, le bien-tre du
travailleur de type H peut soit crotre soit diminuer. Si la proportion p des travailleurs du
type H est faible, alors le salaire moyen E ( ) sera faible (figure 8.13.a). Dans ce cas, le
bien-tre de l'individu du type H augmente car la courbe d'indiffrence passant par le point
(0, E ( )) est situ au-dessous de la courbe d'indiffrence passant par le point (e, H ) . Si la
proportion p est leve, on aura la situation inverse, c'est--dire une diminution du bien-tre
du type H (figure 8.13.b).
L
E ( )
E ( )
0 = e * ( L )
e = e* ( H )
0 = e* ( L )
e = e* ( H )
144
Dans le cas de perte de bien-tre, pourquoi le type H choisit-il tout de mme de signaler sa
capacit productive. En fait, du moment qu'un mcanisme de signal existe, si le type H ne
choisit pas e = e * ( H ) , il sera considr comme tant un travailleur de type L et ne recevra
de ce fait qu'un salaire de L , ce qui correspond un niveau de bien-tre plus faible. La
crainte de se voir catgoriser comme tant du type L est la raison qui pousse le travailleur de
type H choisir le niveau d'ducation e .
L'existence d'un quilibre de signal permet la collectivit d'identifier la capacit productive
de chaque travailleur et donc d'affecter de faon optimale les travailleurs aux diffrents
emplois. Mais cet effet bnfique du signal peut tre annihil par le cot social du signal si ce
dernier est trs lev. L'effet social du signal n'est donc pas tout fait sans ambigut.
145
9.1.
134
M. Jensen and W. Meckling (1976). Theory of the firm: managerial behaviour, agency costs, and ownership
structure. Journal of Financial Economics. 3, 1976, pages 305-360.
135
Relevons que les mcanismes de gouvernement d'entreprise sont des rponses, mme imparfaites, de
l'actionnariat au risque de l'ala moral.
136
Les notions de contraintes de participation et dincitation sont dveloppes plus loin.
137
Il est vident que la description du travail de management par un scalaire ne peut rendre compte de toute la
complexit de celui-ci. En ralit, pour tenir compte du caractre multidimensionnel des actions du repreneur, on
devrait poser E R n , n quelconque et certainement grand.
146
Le niveau deffort ou laction est choisi de faon individuellement optimale par lagent et
affecte aussi bien son utilit que celle du principal. Leffort est source de dsutilit pour
lagent. Mais pour le principal, un niveau lev deffort est prfrable car cela augmente la
probabilit des rsultats levs. Ce niveau deffort nest pas observable par le principal. En
fait, le principal ne peut observer quune consquence de leffort de lagent, laquelle dpend
non seulement de leffort e de lagent, mais galement dun lment stochastique , ce qui
donne y = g (e, ) .
Lobjectif du recrutement du manager est lobtention dun revenu maximal (profit, richesse) y
qui revient au principal duquel est dduite la rmunration t de lagent. Un point central de la
thorie principal/agent est qu'il n'existe pas une relation dterministique entre le revenu et
l'effort. La relation entre y et e est du type stochastique. Etant donn llment stochastique ,
le revenu y est une variable alatoire dont la distribution est conditionnelle de leffort e de
lagent. La densit de y conditionnelle e est f ( y, e ) > 0 pour tout ( y, e ) . Un niveau lev
deffort eH a un effet positif sur le revenu y Y du principal plus fort quun niveau faible
deffort eL . L'hypothse admise pour exprimer la nature de cet effet est la dominance
stochastique du premier ordre.138 Nous dirons ainsi que la distribution de y tant donn eH a
une dominance stochastique du premier ordre par rapport la distribution de y tant donn eL
. En dautres termes, nous avons :
F ( y / e H ) F ( y / e L ) ou
Fe ( y / e ) 0
pour tout y Y
(9.1)
avec une ingalit stricte pour certaines valeurs de y.139 La reprsentation graphique de la
dominance stochastique du premier ordre dans le cas discret deux niveaux d'effort est la
suivante :140
F (y / e)
1
F ( y / eL )
F (y / eH )
Figure 9.1
138
Pour plus de dtails sur la dominance stochastique, voir par exemple Viala, P & Briys E. (1995). Elments de
thorie financire. Nathan. Page 74.
d
139
Fe ( y / e ) =
F ( y / e ) , ceci lorsque leffort e est continu.
de
140
Une consquence de la dominance stochastique du premier ordre est que la valeur moyenne du revenu brut du
principal lorsque e = e H est strictement suprieure la valeur moyenne du revenu brut lorsque e = e L . En
dautres termes, on a
y f ( y / eH ) dy > y f ( y / eL ) dy .
Y
147
Pour sassurer que le manager accepte le contrat, le principal doit dterminer la fonction de
rmunration t ( y ) de telle sorte respecter sa contrainte de participation dont lexpression
est :
E (U (t , e )) = E (u (t )) w(e ) = u (t ( y )) f ( y, e ) dy w(e ) U 0
Y
U 0 est l'utilit de rservation de l'agent, c'est--dire l'utilit quil pourrait obtenir en dehors du
contrat propos par le principal. C'est le minimum que doit lui procurer le contrat pour qu'il
l'accepte. En normalisant 0 lutilit de rservation de lagent et en supposant qu'elle ne
dpend pas du type de l'agent, la contrainte de participation de l'agent devient :
E (U (t , e )) = E (u (t )) w(e ) = u (t ( y )) f ( y, e ) dy w(e ) 0
Y
9.2.
A titre de benchmark et leffet de faire ressortir les effets de lasymtrie dinformation, il est
dusage de supposer dans un premier temps que le propritaire peut observer leffort du
manager.141 Dans ce cas, le propritaire dtermine le contrat en spcifiant dune part le niveau
deffort e consentir et dautre part la fonction de rmunration t ( y ) . Le programme de
maximisation du principal scrit donc :
141
La rmunration du manager demeure cependant fonction du revenu brut y. On continuera donc crire t (y)
en dpit de lobservabilit de leffort e.
148
Max v( y t ( y )) f ( y, e ) dy
e, t
s/c
(9.2)
u (t ( y )) f ( y, e) dy w(e) 0
(9.3)
A loptimum, la contrainte de participation (9.3) de lagent est sature et est donc lgalit.
Pour montrer cela, il suffit de considrer que le contraire est vrai. Supposons que lagent
obtienne une esprance d'utilit strictement suprieure son utilit de rservation. Cette
situation ne peut constituer la solution du programme du principal car ce dernier peut, tout en
continuant respecter lutilit de rservation de lagent, diminuer la rmunration de lagent,
ce qui a pour consquence daugmenter son utilit. En symbolisant par le multiplicateur de
Lagrange associ la contrainte de participation de lagent, le programme du principal peut
tre rcrit comme suit :
v( y t ( y ))
= pour tout y
u (t ( y ))
(9.4)
L
= v( y t ( y )) f e ( y, e )dy + u (t ( y )) f e ( y, e )dy w(e ) = 0
e Y
Y
(9.5)
f e ( y, e ) =
142
143
d
f ( y, e )
de
rapport t est
yi .
149
La condition du premier ordre (9.4) signifie lgalit des taux marginaux de substitution du
revenu entre les diffrents tats de la nature caractriss ici par la valeur de y .144 Pour
montrer cela, on peut crire la condition du premier ordre comme suit pour deux niveaux
diffrents de revenu y et y :
v( y t ( y )) u(t ( y ))
=
v( y t ( y)) u(t ( y))
(9.6)
Cette galit peut tre interprte en se rfrant la bote d'Edgeworth en considrant que les
revenus diffrents y et y reprsentent deux tats diffrents de la nature. Dans ce cas,
l'quation (9.6) exprime l'galit des taux marginaux de substitution du principal et de l'agent,
ce qui correspond, comme le montre la figure 9.2 un partage optimal du risque :
y t(y)
Principal
y t ( y )
t ( y )
t(y)
Agent
Cette condition indique donc quen situation de symtrie de l'information, il existe un partage
optimal du risque entre le principal et lagent. On obtient un cas particulier intressant
lorsqu'on considre que le principal est neutre vis--vis du risque.145 Dans ce cas, tant donn
que v( y t ( y )) = 1 , la premire condition du premier ordre scrit comme suit :146
1
= pour tout y
u(t ( y ))
(9.7)
Le manager tant averse pour le risque, u (t ( y )) est dcroissante par rapport t ( y ) . Par
consquence, la satisfaction de la condition (9.7) implique que la rmunration t ( y ) doit tre
fixe par rapport y. En recevant une rmunration fixe, le manager est compltement assure
contre le risque par le principal. Etant donne sa neutralit envers le risque, le principal joue
un rle d'assurance. Le contrat constitue ainsi un partage optimal du risque entre le principal
et l'agent.
144
150
La contrainte de participation du manager tant sature, on a donc pour chaque niveau d'effort
optimal u (t * ) w(e * ) = 0 . La rmunration fixe du manager est donc t * = u 1 (w(e * )) , ce qui
donne la proposition suivante :
Proposition : Dans le modle principal/agent avec observabilit de leffort du manager et
neutralit au risque du principal, le contrat optimal spcifie leffort optimal e * choisi par le
manager (maximisant le revenu espr du propritaire dduction faite de la rmunration du
manager) et procure au manager une rmunration fixe t * = u 1 (w(e * )) .147
Cette proposition signifie que lorsque leffort est observable et le principal neutre envers le
risque, le manager na pas besoin de recevoir dincitation leffort. Sa rmunration est dans
ce cas fixe et constitue de ce fait une assurance contre le risque (d au caractre alatoire de y)
procure par le propritaire, lequel, suppos neutre vis--vis du risque, joue le rle dassureur.
9.3.
Considrons maintenant que leffort de lagent nest pas observable par le principal. La
rmunration fixe ne demeure plus optimale car ex post l'agent est incit dvier et ne pas
fournir le niveau d'effort spcifi dans le contrat. Ce dernier doit donc intgrer cette
possibilit de dviation ex post et tenir compte de la meilleure rponse de l'agent. Cette
condition est satisfaite par l'introduction dans le programme du principal d'une nouvelle
contrainte, appele contrainte d'incitation. Lors du choix de son niveau optimal de l'effort,
l'agent doit galement intgrer la meilleure rponse du principal. Le contrat ainsi obtenu
constitue un quilibre de Nash du jeu liant le principal et l'agent.
Pour amener lagent respecter ses engagements, le principal se voit donc contraint de
prvoir une forme de rmunration incitant lagent fournir leffort dsir par le principal,
cest dire une rmunration lie au rsultat y de leffort. Sachant que le rsultat y est
alatoire, la rmunration t ( y ) devient son tour alatoire. Lincitation leffort du manager
implique donc pour celui-ci lobligation de supporter un niveau de risque plus lev. Il existe
ainsi un arbitrage entre le partage optimal du risque et lincitation du manager fournir
leffort optimal.
Considrons dans un premier temps qu'il n'existe que deux niveaux d'effort possibles, un
niveau lev e H et un niveau faible e L . On a donc E = {e H , e L } . Leffort du manager ntant
plus observable, le programme doptimisation du principal doit intgrer une nouvelle
contrainte, appele contrainte dincitation pour exprimer le fait que lagent choisit le niveau
d'effort optimal tant donne la fonction de rmunration t ( y ) . Le cas o le choix du principal
147
151
porte sur le niveau deffort faible e L est relativement simple. En effet, comme leffort est
coteux pour lagent, il aura naturellement tendance choisir un niveau deffort faible. Il
suffit donc au principal de retenir une rmunration fixe gale t L* = u 1 (w(eL )) . Lagent
choisira alors le niveau deffort souhait par le principal.
Supposons maintenant que le principal veuille induire l'agent choisir le niveau lev d'effort
e H . La contrainte dincitation prend alors la forme suivante :
(9.8)
Cette contrainte signifie que le principal doit dfinir une fonction de rmunration t ( y ) de
telle sorte qu'en maximisant son esprance d'utilit, l'agent choisira par lui-mme le niveau
lev de l'effort. Le contrat optimal est donc le rsultat du programme suivant du principal :
Max v( y t ( y )) f ( y / eH )dy
t
s/c
152
f ( y / eH ) f ( y / eL )
1
= 0 pour tout y
+ +
u (t ( y ))
f ( y / eH )
Ce qui donne :
f ( y / eL )
1
pour tout y
= + 1
u (t ( y ))
f ( y / e H )
(9.9)
9.3.1.2.
153
f ( y / eL )
u(t ( y ))t ( y )
=
2
(u(t ( y )))
y f (( y / eH ))
t ( y ) =
u(t ( y )) y f (( y / eH ))
(9.10)
Etant donne l'aversion pour le risque de l'agent, on a u < 0 . Par la proposition ci-dessus, on
a galement > 0 . Donc, selon lquation (9.10), pour que la rmunration optimale t ( y ) du
manager soit croissante par rapport au rsultat y, une condition supplmentaire est requise. Il
s'agit de lhypothse appele condition de rapport de vraisemblance monotone (MLRP
Monotone Likelihood Ratio Property) et dont l'expression est :
f ( y / eL )
<0
y f ( y / eH )
(9.11)
t(y)
149
154
Tableau 9.1
P(y / eH)
P(y / eL)
F(y / eH)
F(y / eL)
Dominance stochastique
du premier ordre
F(y / eH)- F(y / eL)
MLRP
P( y e L )
P( y e H )
0,1
0,4
0,1
0,4
- 0,3 0
0,2
0,3
0,3
0,7
- 0,4 0
1,5
0,4
0,3
0,7
- 0,3 0
0,75
0,3
(9.12)
La contrainte d'incitation (9.12) signifie que parmi les efforts possibles e , le manager choisit
de faon rationnelle le niveau d'effort e qui maximise son esprance d'utilit. Cette contrainte
signifie donc qu'tant donne la fonction de rmunration t ( y ) , le manager choisit le niveau
155
d'effort e qui soit sa meilleure rponse. L'expression (9.12) peut avoir plusieurs solutions.
Lapproche du premier ordre de la thorie de lagence consiste remplacer la contrainte
dincitation (9.12) par sa condition du premier ordre et qui est :
(9.13)
Cette approche suppose que la condition du premier ordre (9.13) dfinit une solution unique et
qui est un maximum.150
Comme dans le cas de deux niveaux d'effort, l'optimum la contrainte de participation de
l'agent est sature ( l'galit). En appelant le multiplicateur de Lagrange associ la
contrainte dincitation, le Lagrangien du programme du principal devient :
v( y t ( y ))
f ( y, e )
+ + e
= 0 pour tout y
u(t ( y ))
f ( y, e )
v ' ( y t ( y ))
f ( y, e )
pour tout y
= + e
'
u (t ( y ))
f ( y, e )
L
= v( y t ( y )) f e ( y, e )dy + u (t ( y )) f e ( y, e )dy w(e )
e Y
Y
+ u (t ( y )) f ee ( y, e )dy w(e ) = 0
150
Nous verrons plus loin quelles sont les conditions de validit de lapproche du premier ordre.
(9.14)
156
Etant donn que u (t ( y )) f e ( y, e )dy w(e ) = 0 , cette condition du premier ordre devient :
Y
ee
(9.15)
9.3.2.2.
Comme dans le cas de deux niveaux d'effort, la forme gnrale de la fonction de rmunration
t ( y ) peut tre obtenue. Pour montrer cela, il suffit de diffrencier (driver par rapport y)
lquation (9.14).
v( y t ( y ))(1 t ( y ))u(t ( y )) u(t ( y ))t ( y )v(t ( y ))
f e ( y, e )
=
2
y f ( y, e )
(u(t ( y )))
t ( y ) =
f e ( y, e )
y f ( y, e )
u (t ( y )) v ( y t ( y )) + u (t ( y )) v ( y t ( y ))
u (t ( y )) v ( y t ( y )) [u (t ( y ))]2
(9.16)
Pour les mmes raisons que dans le cas de deux niveaux d'effort, lquation (9.16) montre que
la rmunration optimale t ( y ) du manager n'est croissante par rapport au rsultat y que sous
151
157
f e ( y, e )
>0
y f ( y, e )
(9.17)
9.4.
W. Rogerson (1985). The first-order approach to principal-agent problems. Econometrica, 53. Pages 13571368.
153
S. Grossman & O. Hart (1983). An analysis of the principal-agent problem. Econometrica, 51. Pages 7-45.
154
Il existe plusieurs situations de rationnement. Le cas le plus connu est celui de la situation de guerre. La raret
des biens est tellement forte que lEtat se voit oblig dintervenir dans la sphre commerciale pour rguler la
commercialisation des produits, en particulier ceux de premire ncessit (pain, huile, sucre, ). On trouve
galement le rationnement dans les conomies planifies, notamment pour les importations qui sont limites
quantitativement de faon centralise.
158
ne trouve pas l'offre correspondante. Cette situation est qualifie de rationnement du crdit et
est donc une caractristique fondamentale du march du crdit.
Parmi les explications possibles l'existence du rationnement de crdit l'quilibre du march
du crdit figure celle de l'ala moral.155 A la base de cette explication, il faut d'abord
remarquer que plus le taux d'intrt est lev, moins est grande la part des bnfices revenant
l'emprunteur. Ceci a pour effet de rduire son incitation fournir un effort plus lev, ce qui
a pour consquence d'augmenter la probabilit d'chec du projet financ. Ainsi,
l'augmentation du taux d'intrt peut avoir pour effet d'augmenter le risque pour le prteur et
ne constitue donc pas une rponse tout fait adquate pour la couverture contre le risque.
Dans ce cas, le projet n'est financ par le prteur que si le montant des capitaux propres atteint
un montant appropri. De ce fait, l'existence de l'ala moral devient une explication possible
de la structure du capital et de la notion de capacit d'endettement.
Pour montrer cela, considrons un entrepreneur qui envisage de raliser un projet dont le cot
d'investissement est I.156 Son apport personnel sous forme de capitaux propres (cash) est A
avec A < I . Pour la ralisation de ce projet, il doit donc recourir un financement externe
d'un montant gal I A . En cas de succs, le projet procure un revenu global gal R et en
cas d'chec, le revenu global est 0. La probabilit de succs dpend du comportement de
l'entrepreneur. Cette probabilit est leve p H si l'entrepreneur fournit un effort lev
(comportement loyal) pour la russite du projet. Par contre, si l'entrepreneur ne fournit pas un
effort lev pour le projet (comportement dloyal), la probabilit de russite devient faible p L
, mais l'entrepreneur obtiendra dans ce cas des bnfices privs B. On a videmment p H > p L
. En cas de succs, la part revenant l'entrepreneur (insider) est Ri et la part revenant au
financier (outsider) est Ro , avec R = Ri + Ro .
Pour simplifier l'expos, supposons que l'entrepreneur (qui bnficie de la responsabilit
limite) et le financier sont neutres envers le risque et que le taux d'intrt est gal 0.
Considrons galement qu'en raison de la concurrence entre les financiers, le profit espr du
financier est nul, ce qui donne p H Ro (I A) = 0 . La ralisation du projet s'effectue selon le
timing suivant :
Accord de
Financement
(Rgle de partage)
Investissement
Ala moral
Rsultat
et
partage
Figure 9.4
Stiglitz, Joseph et Andrew Weiss. Credit Rationing in Markets with Imperfect Information. The American
Economic Review. Vol 71, n 3. June 1981.
Le phnomne de slection adverse est galement une explication possible du rationnement du crdit dans le
march du crdit.
156
Voir aussi J. Tirole (2001) Corporate Governance , Econometrica, 69. Pages 1-35.
159
B
avec p = p H p L . En d'autres termes, afin dinciter l'entrepreneur
p
se comporter de faon loyale, le revenu Ri qui doit lui revenir doit tre au moins gal
B
, soit
B p . Sachant que Ri = R Ro , cette contrainte d'incitation implique R Ro
p
B
Ro R
. En d'autres termes, partir de la contrainte d'incitation, il ressort que le montant
p
maximal pouvant tre gag (rserv) en faveur du financier sans compromettre l'incitation de
B
l'entrepreneur est R
. Le montant espr maximum pouvant tre gag est donc
p
B
.
p H R
p
B
et lquilibre financier des apporteurs de fonds
p
B
I A , c'est--dire :
PH Ro = I A impliquent que p H R
p
La contrainte dincitation Ro R
B
( pH R I )
A A = pH
p
La quantit A que nous assumons tre positive est donc le montant minimal exig de
l'entrepreneur pour que le financement externe d'un montant gal I A lui soit accord.
Nous avons ainsi une thorie explicative de l'existence d'une structure optimale du capital
base sur l'existence du phnomne de l'ala moral.157 Le minimum requis a donc la forme
suivante :
157
Relevons que cette thorie de la structure du capital base lexplication de la structure du capital du ct de
loffre du financement.
160
161
Tableau 9.2
Simulation du modle de rationnement du crdit dans le cas d'ala moral
Le projet
Cot de l'investissement
1.000
Probabilit de succs si
comportement loyal
PH
0.8
Probabilit de succs si
comportement dloyal
pL
0.6
Revenus du projet
Simulation 1
Simulation 2
1.300
1.450
Bnfices privs
200
50
Simulation 1
Simulation 2
Rsultats
cl *
(PH R I )
40
160
cd *
(PL R + B ) I
-20
-80
PH (B P )
800
200
PH (B P ) (PH R I )
760
40
A I
76%
4%
Cette thorie permet d'expliquer pourquoi dans certains pays, les banques exigent des niveaux
importants de taux d'autofinancement et galement de garanties. Ces banques tant
confrontes un niveau lev d'ala moral, leur meilleure rponse est d'exiger de l'emprunteur
de s'engager de faon substantielle.158 Le niveau lev d'ala moral est favoris par plusieurs
phnomnes tels que :
Systme judiciaire ne protgeant pas suffisamment les cranciers (par exemple pour
la mise en jeu des garanties) ;
Information comptable manquant de fiabilit et de transparence ;
Structure familiale des entreprises prives qui peut tre un lment favorable la
collusion des actionnaires contre les outsiders ;
Ala moral au sein mme de la banque d'Etat.
9.5.
Cette conclusion est soutenue galement par la thorie Law and Finance. Voir R. La Porta, Lopez-deSilanes, F, Shleifer, A et Vishny, R. Law and Finance . Journal of Political Economy, Vol 106, n 6.
162
S
B
et
reprsentent la structure du capital de la
S+B
S+B
firme. Les premires tentatives formalises reviennent Modigliani et Miller (M&M) qui ont
dvelopp un modle explicatif en se basant sur lquilibre du march financier, suppos
parfait.159 Avec VL reprsentant la valeur totale de la firme endette et Vu la valeur totale de
la firme sans dette et en prenant en considration lexistence de limpt sur le revenu de la
firme au taux , M&M ont montr que la valeur totale de la firme est donne par lquation
suivante :
VL = Vu + B
Comme consquence de cette quation, la structure optimale du capital de la firme est atteinte
lorsque la dette B reprsente 100% du financement de la firme. Il sagit videmment dune
conclusion extrme qui de plus, ne correspond pas la ralit des entreprises. Cette difficult
nenlve cependant en rien la rigueur de lanalyse de M&M.
La littrature sest par la suite attache relaxer les constituants de lhypothse de march
financier parfait afin de rajouter du ralisme la thorie et de produire des rsultats plus
conformes la ralit. Parmi ces facteurs, figure celui du problme dagence existant entre les
apporteurs de fonds (actionnaires et cranciers) et le manager.160
Dans ce cadre, Jensen et Meckling (1976) ont dvelopp une thorie de la structure de la
proprit de lentreprise en se basant sur lala moral. Dans une entreprise o existe une
sparation de la proprit du management, le manager (l'agent) n'agit pas toujours et
ncessairement dans l'intrt des actionnaires (principal). Il existe toujours la possibilit que
le manager ne poursuive pas tout fait lobjectif assign par les actionnaires et qui est la
maximisation de la valeur de la firme. Le manager peut en effet dvier de cet objectif et
favoriser la ralisation de son objectif propre. Cette dviation est possible pour deux raisons,
comme cela a t dcrit plus haut : le conflit dintrt et lasymtrie de linformation. Dans
lapproche de Jensen et Meckling, la structure du capital est considre comme une rponse
des actionnaires au problme caus par la possible dviation du manager de lobjectif.
Le point de dpart de lanalyse est que lexistence du problme dagence va provoquer
lapparition de cots, qualifis de cots dagence. Dans ce cadre, la structure du capital peut
tre un outil permettent de minimiser les cots dagence. Jensen et Meckling ont identifi trois
types de cots dagence :
Les cots de monitoring du principal (cot du contrle). Ce sont les cots des
procdures ou mcanismes destines limiter le comportement du manager
Les cots d'engagement (bonding costs) : Ce sont les cots que dpensent l'agent
pour montrer sa bonne foi et sa loyaut
159
F. Modigliani and M. Miller. The Cost of Capital, Corporation Finance and the Theory of Investment. The
American Economic Review. Volume XLVIII, June 1958. Pages 261-297 et F. Modigliani and M. Miller.
Corporate Income Taxes and the Cost of Capital: a Correction. The American Economic Review. 53, page 433443.
160
Plusieurs autres facteurs ont t proposs pour le dveloppement dune thorie de la structure du capital, tels
que lexistence de cots de la faillite (Scott, 1976) et le signal (Ross 1977).
163
Le versement dun salaire est videmment un avantage pcuniaire. Il est dans le cadre de cette analyse inclus
dans les avantages non pcuniaires car, comme ces derniers, il procure au manager / propritaire une utilit
personnelle qui peut lamener soctroyer un niveau de salaire suprieur au salaire qui aurait t accord un
manager non propritaire.
164
P ( X ) le revenu total pour la firme en fonction de X.
On a donc :
B ( X ) = P( X ) C ( X ) : Bnfice net pour la firme en fonction de X.
B(X * ) P(X * ) C (X * )
=0
=
X *
X *
X *
Si le niveau de X choisi par la firme est suprieur au niveau optimal X * , alors
F = B (X * ) B ( X ) mesure le cot pour la firme de l'incrment X X * , incrment procurant
un surcrot d'utilit pour le manager.162 Donc F est la valeur de march des dpenses non
pcuniaires du manager choisies au-del du niveau optimal. De ce fait, larbitrage entre le
rendement financier et les avantages non pcuniaires revient en un arbitrage entre la valeur V
de la firme et le cot F de ces avantages non pcuniaires.
V
V1
V*
V2
V
A
B
U1
Pente =
U2
U3
Vo
P1
P2
Pente = -1
F F
Figure 9.5
La figure 9.5 fait ressortir larbitrage auquel fait face le manager / propritaire entre la valeur
de march V de la firme et la valeur F des avantages non pcuniaires. Elle montre que si le
manager / propritaire augmente sa consommation d'avantages non pcuniaires de 1 unit
montaire, la valeur de l'entreprise diminue de 1 unit montaire, d'o la pente de 1 pour
V F . La droite V F de pente gale 1 est analogue une contrainte budgtaire et reprsente
le lieu gomtrique des meilleure combinaisons possibles entre valeur de la firme et
consommation d'avantages non pcuniaires.
V est la valeur maximale de l'entreprise. Elle est obtenue lorsque le manager choisit le niveau
X * d'avantages non pcuniaires, soit lorsque F = 0 . La situation o le manager / propritaire
possde 100% de la firme est reprsente par le point D o la valeur de la firme est V * et la
162
Notons que la firme sloigne de loptimum ds lors quau moins un des lments de X diffre de son niveau
optimal.
165
valeur des avantages non pcuniaires consomms est F * . Le point D est le point de tangence
entre la courbe d'indiffrence U 2 et la droite V F .163
Si le manager / propritaire vend 100% des actions de la firme tout en restant manager et si le
nouveau propritaire pouvait, sans cot, imposer au manager le mme niveau de
consommation F * , alors le nouveau propritaire sera prt payer le montant V * pour
acqurir 100% de la firme.
Supposons que le manager / propritaire vende la fraction (1 ) de la firme et conserve la
fraction de la firme. Si l'acheteur anticipe que le manager / propritaire maintiendra le
mme niveau de F * de consommations d'avantages non pcuniaires, alors il sera dispos
payer le montant (1 )V * pour l'acquisition de la fraction (1 ) de la firme.
Mais lorsque le manager / propritaire ne possde plus que la proportion de la firme, s'il
augmente sa consommation d'avantages non pcuniaires de 1 unit montaire, il ne supporte
plus que la proportion de la baisse de la valeur de march de la firme. La pente
reprsentative de larbitrage (trade-off) du manager / propritaire devient gale , comme
par exemple pour la droite V1 F1 . Cette dernire passe par le point D car cette tape de
lanalyse, lacheteur anticipe que le manager / propritaire maintiendra le niveau F * et donc
est dispos payer la somme (1 )V * . Mais face ces croyances, la meilleure rponse du
manager / propritaire nest pas de maintenir le niveau F * car il nen supporte le cot que
dans la limite de .
Lorsque le manager / propritaire ne possde que la proportion de la firme, sa contrainte
budgtaire subjective est V1 P1 . De ce fait, il sera incit choisir le point A, qui est le point de
tangence entre V1 P1 et une courbe d'indiffrence U 1 plus leve. Le point A est l'expression de
la meilleure rponse du manager / propritaire au fait que le nouveau propritaire paie le
montant (1 )V * .
Au point A, la valeur de la consommation d'avantages non pcuniaires augmente de F * F O
. Par consquent, la valeur de march de la firme diminue de V * V O .
De ce fait, si le march anticipe correctement la raction du manager / propritaire, alors le
nouveau propritaire n'acceptera pas de payer le montant (1 )V * . En tenant compte de cette
anticipation rationnelle, pour l'acquisition de la part (1 ) de la firme, le nouveau
propritaire ne paiera que (1 ) la valeur anticipe de la firme tenant compte du changement
dans le comportement du manager / propritaire.
Pour montrer comment se dtermine le prix de march aprs la vente de la proportion (1 )
des actions et comment apparaissent les cots dagence, soit w la richesse du manager /
propritaire aprs avoir vendu la fraction (1 ) de la firme. On a ainsi :
163
Ici, lquilibre est intrieur, mais il peut correspondre aux extrmes V = 0 ou F = 0 avec des courbes
dindiffrence appropries.
166
w = S o + S i = S o + V (F , )
S o est le paiement effectu par les outsiders en contrepartie de la fraction (1 ) de la firme
et S i est la valeur de march des actions (partie ) restant en possession du manager /
Prix de march = V
Prix accept par le vendeur = S o
Figure 9.6.a
La figure 9.6.b montre le cas o le point de tangence se situe droite du point B. Ce cas
correspond une plus grande consommation d'avantages non pcuniaires et donc une plus
faible valeur de march de l'entreprise. En acceptant S o , l'acheteur paie un prix plus lev que
la valeur de march, ce qui lui est dfavorable.
167
Le seul prix mutuellement satisfaisant doit tre tel que le point de tangence se situe sur la
droite V F . A ce point, on a S o = (1 )V . Ceci implique que la richesse du manager /
propritaire aprs la vente de la fraction (1 ) des actions est la valeur rduite V . En effet,
on a :
W = S o + V (F , ) = (1 )V + V = V
168
Figure 9.7
La figure 9.8 fait ressortir les effets de l'existence du monitoring. La courbe BCE est la
contrainte budgtaire lorsqu'on tient en considration les cots de monitoring M. Les points de
la courbe BCE sont le rsultat de l'quation V = V F (M , ) M . La diffrence verticale
entre V F et BCE est le cot de monitoring M.
V
V*
U1
E
C
F*
U2
U3
Pente =
Pente = -1
Figure 9.8
169
V V . Il est donc incit accepter un contrat donnant aux investisseurs le droit de
contrler ses consommations d'avantages non pcuniaires.
On peut obtenir le mme rsultat en considrant cette fois que c'est le manager / propritaire
qui prend en charge le cot M. Dans ce cas, le cot M est le montant pay par le manager /
propritaire pour garantir aux actionnaires externes que la consommation d'avantages non
pcuniaires sera limite. Ce sont les cots des actions par lesquelles le manager / propritaire
montre sa bonne foi et sa loyaut.
Cash-flow Oprationnel
Projet 1
Projet 2
7.000
2.000
11.000
16.000
Ces deux projets sont donc tel que E1 = E 2 et 1 < 2 . Si le besoin de financement est de
7.000, lentreprise prsentera au crancier potentiel (par exemple la banque) uniquement le
projet 1. Mais, tant donne la responsabilit limite, une fois le crdit obtenu, les
actionnaires pourraient tre incits ex post dvier et raliser le projet 2, car leurs revenus
nets, dduction faite de la dette sont :
Tableau 9.4
Probabilit des tats
de la nature
Cash-flow net
Projet 1
Projet 2
0
0
4.000
9.000
Pour les actionnaires, le projet 2 est prfrable car quel que soit ltat de la nature, il leur
procure un revenu net suprieur ou gal au revenu net du projet 1. La ralisation du projet 2
avec une dette destine au projet 1 est en fait un transfert (expropriation) de richesse des
170
164
Rappelons que pour ce modle, on fait lhypothse de marchs efficients de la dette et des actions. Les prix
intgrent donc tous les cots, notamment les cots de monitoring et dengagement. Rappelons galement que les
cots dagence sont supports par le manager / propritaire.
165
Dans cette figure, le dplacement vers la droite signifie + S o et B .
171
( )
AT (E ) = ASo (E ) + AB (E )
AT E * , K1
AB (E , K1 )
AT E *
AS o (E , K1 )
AT E * , K 0
ASo (E )
AB (E , K 0 )
AB (E )
So
E =
B + Si
Figure 9.9.a
*
E * (K 0 )
AS o (E , K 0 )
E * (K1 )
Figure 9.9.b
So
augmente, l'incitation du manager /
B + So
propritaire augmenter les consommations non pcuniaires ou fournir moins deffort
(augmenter F) est plus grande, d'o laugmentation des cots d'agence AS o (E ) . Lorsque le
montant de la dette diminue, l'incitation du manager exproprier les cranciers devient plus
faible, ce qui implique une diminution des cots d'agence associs la dette. Sans avoir
prsent de justifications la forme des courbes reprsentatives des cots dagence ASo (E ) et
AB (E ) , Jensen & Meckling soutiennent que la courbe reprsentant les cots dagence totaux
possde la forme gnrale indique dans la figure 9.9.a et 9.9.b, ce qui montre quil existe une
structure optimale de la proprit des entreprises. Cette structure est celle qui minimise les
cots dagence.
Pour faire ressortir leffet du volume du financement externe, Jensen et Meckling considrent
deux niveaux diffrents de financement externe K 0 et K 1 avec K 0 < K 1 . Un niveau
B + So
lev signifie que la firme recours plus de financement d'origine externe et, par
K=
V*
consquence, moins de financement interne. Lorsque la part des actions externes augmente,
la part du manager / propritaire dans la firme diminue, ce qui cre une incitation plus forte
augmenter ses consommations non pcuniaires. L'activit de monitoring augmente en
consquence. Ainsi, au fur et mesure que K augmente, les cots d'agence augmentent, ce qui
donne AS 0 (E , K1 ) > AS 0 (E , K 0 ) , comme il ressort de la figure 9.9.b.
De mme, comme le montant de la dette augmente, la part du manager / propritaire dans
la firme diminue, ce qui cre une incitation plus forte transfrer le risque vers les cranciers.
L'activit de monitoring des cranciers augmente en consquence. Ainsi, au fur et mesure
que K augmente, ces cots d'agence augmentent, ce qui donne AB (E , K1 ) > AB (E , K 0 ) , comme
il ressort galement de la figure 9.9.b.
D'aprs ce schma, on voit que les cots d'agence totaux augmentent avec le recours accru
aux financements d'origine externe (actions externes et dette).
172
La procdure des enchres est un mcanisme de vente de biens et de dtermination des prix
applicable lorsque le vendeur cherche dterminer la disposition payer des acheteurs
potentiels afin de maximiser son revenu espr et, par voie de consquence, de minimiser la
rente dinformation des acheteurs potentiels. Ce mcanisme vise donc organiser un march
ponctuel et spcifique et ce, par la rencontre du vendeur et des acheteurs potentiels. Les
enchres peuvent galement donner lieu la rencontre entre un acheteur et plusieurs
vendeurs. Cest le cas par exemple, de lattribution par ladministration dun contrat de
fourniture ou de gestion dun monopole naturel. On parle dans ce cas dappel doffres ou
dadjudication.
Dans les conomies modernes, les enchres sont utilises dans plusieurs domaines,
notamment pour lattribution de marchs publics, de concessions minires ou dexploitation
de champs ptroliers, lmission de bons du Trsor, la vente de devises, la vente dobjets
dart, La cotation en bourse des actions est un mcanisme de double enchres.
Pour une description plus dtaille des enchres, voir par exemple Florence Naegelen. Les mcanismes
denchres. Economica, 1988.
173
dattribution du bien ou du contrat. Elle suppose que les caractristiques du bien ou du service
concern sont prcisment dfinies, ce qui reprsente une difficult importante en pratique.
W. Vichrey. Counterspeculation, Auctions and Competitive Sealed Tenders. The Journal of Finance. Vol. 16,
March 1961. P 8-37.
168
Il faut remarquer que le ttonnement Walrasien utilisait dj le mcanisme denchres pour la dtermination
du prix dquilibre dans un march concurrentiel. Dans ce modle, le commissaire priseur est lagent fictif
charg, sans cot, de recueillir les offres et les demandes et de dterminer les prix et les quantits dquilibre.
169
Paul Milgrom et Robert Weber. A theory of auctions and competitive bidding. Econometrica, Vol. 50,
September 1982. P 1088-1122.
174
acheteur donn exclue celle des autres enchrisseurs. Chaque acheteur adopte une stratgie
denchres avec comme objectif de maximiser son esprance dutilit et le rsultat final est le
produit de l'interaction des stratgies des acheteurs. En raison de linteraction de stratgies
conflictuelles des participants et de lincompltude de linformation, les mcanismes
denchres sont typiquement un thme de la thorie des jeux non coopratifs en information
incomplte.
Le problme de lincompltude de linformation rside en ce quil peut donner lieu une suite
infinie danticipations de la part des acheteurs. En effet, lenchre dun acheteur donn
dpend non seulement de sa valeur subjective du bien, mais galement de lanticipation quil
a sur la valeur subjective des autres acheteurs. Il doit, de plus, faire des anticipations sur les
anticipations des autres acheteurs, et ainsi de suite. La solution ces anticipations linfini a
t propose par Harsanyi (1967) travers lintroduction dun agent fictif, la Nature, qui joue
en premier, et ce en affectant chaque enchrisseur une valuation subjective de lobjet mis
en vente. Le concept dquilibre utiliser dans ce cas est lquilibre de Nash baysien.
10.3. Lesprance de
indpendantes
revenu
dans
le
modle
valeurs
prives
Un des rsultats importants de la thorie des enchres valeurs prives indpendantes est que
lesprance de revenu E (R ) du vendeur est identique pour une large tendue denchres,
notamment pour les quatre formes denchres courantes, savoir lenchre anglaise, lenchre
hollandaise, lenchre sous pli cachet au plus haut prix et lenchre sous pli cachet au
second prix. Ce revenu espr dpend du nombre n dacheteurs potentiels, de la distribution
de probabilit des valeurs subjectives vi attribues par les acheteurs potentiels au bien mis en
vente et de la valeur subjective v* au-dessous de laquelle les acheteurs potentiels ne trouvent
pas intressant denchrir. Ce rsultat a t mis en avant en premier par Vickrey (1961) et a
t par la suite confirm par Myerson (1981) et par Riley et Samuelson (1981).170
La littrature traitant du modle de valeurs prives indpendantes dans le cas de la vente dun
bien unique se base sur les hypothses fondamentales suivantes :
i) Le vendeur a une valeur de rservation gale v 0 . Cest le prix au-dessous duquel
il nacceptera pas de vendre le bien.
ii) Le choix des rgles denchre revient gnralement au vendeur qui a ainsi pour
objectif dexploiter sa position monopolistique.
iii) Il existe n enchrisseurs potentiels et la disposition payer de chaque enchrisseur
est v i [v, v ] et nest connue que de lui-mme. Cest son information prive.
170
175
iv) Chaque acheteur i considre la disposition payer des autres acheteurs comme un
tirage alatoire indpendant partir dune distribution de probabilit. Cette
dernire, la mme pour tous les enchrisseurs, est une information commune tous
les joueurs (le vendeur et les n acheteurs potentiels). Ceci est lhypothse IID.171
La figure 10.1 reprsente la fonction de rpartition F (v ) de la valeur de rservation de
lacheteur potentiel. La fonction de rpartition F (v ) est donc telle que F (v ) = 0 , F (v ) = 1 .
Elle est diffrentiable sur tout lintervalle [v, v ] , avec F (v ) = f (v ) > 0 .
F (v )
F (v ) = 1
F (v ) = 0
v
Figure 10.1
Dans ce chapitre, nous nous basons sur la contribution importante de Riley et Samuelson
(1981) pour driver lexpression de lesprance de paiement du vendeur dans le cadre des
enchres appartenant la famille E denchres caractrises par les proprits suivantes :172
- Tout acheteur potentiel peut faire une offre suprieure au prix de rserve b0 annonc
par le vendeur.173
- Le bien est attribu lacheteur ayant propos la plus grande enchre.
- Les rgles de lenchre sont anonymes et donc aucun acheteur ne bnficie dun
traitement prfrentiel.
- Il existe une stratgie dquilibre commune b() , fonction strictement croissante des
valuations vi , cest--dire b(vi ) > 0 .
Riley et Samuelson (1981) ont obtenu les principaux rsultats :
- Lorsque le vendeur et lensemble des n acheteurs potentiels sont neutres au risque, le
revenu espr du vendeur est le mme pour toutes les formes denchres appartenant
la famille E dfinie plus haut. En particulier, comme les quatre formes denchres
dcrites plus haut, savoir lenchre anglaise, lenchre hollandaise, lenchre au
premier prix sous pli cachet et lenchre au second prix sous pli cachet font partie
de la famille E, elles procurent au vendeur la mme esprance de revenu.
- Les acheteurs potentiels proposent une enchre infrieure leur disposition payer,
cest--dire b(vi ) < vi .
171
176
=
de l' acheteur rservation de gagner de paiement
Lobjectif de lanalyse est de faire ressortir les conditions sous lesquelles le profil de
stratgies (b(v1 ), b(v 2 ), , b(v n )) constitue un quilibre de Nash baysien. Il faudra par la suite
dduire les implications de ce rsultat.
Sans perte de gnralit, considrons le cas de lacheteur potentiel 1. Il faut donc montrer que
si les (n 1) autres enchrisseurs adoptent la stratgie denchre b(vi ) , alors la meilleure
rponse du joueur 1 est davoir la stratgie b(v1 ) . Pour montrer cela, considrons la dviation
du joueur 1 vers la stratgie b( x ) , sachant que son valuation pour lobjet est v1 . Il faudra
alors faire ressortir sous quelles conditions le joueur 1 nest pas incit dvier vers b(x ) ce
qui donnera x = v1 comme meilleure rponse du joueur 1 aux choix b(v2 ), , b(vn ) des autres
enchrisseurs. En cas de dviation, lesprance de gain de lacheteur potentiel 1 sera donc :
( x, v1 ) = v1 (F ( x ))n 1 P ( x )
(10.1
Avec :
: La probabilit que lenchrisseur 1 soumette une enchre b(x ) qui soit loffre la
plus leve et remporte ainsi lenchre.
(F (x ))n 1
177
La probabilit que lacheteur 1 gagne lenchre est la probabilit quil soumette lenchre la
plus leve par rapport chacun des (n 1) autres acheteurs. Cette probabilit est donc :
Pr ob (bi < b1 ) pour tout i 1
Dans le modle valeurs prives, les dispositions payer des diffrents acheteurs potentiels
sont indpendantes. De ce fait, cette probabilit est gale au produit suivant :
Pr ob (b2 < b1 ) Pr ob (bn < b1 )
i 1
i 1
= [F ( x )]
n 1
Soit p le paiement effectuer par lenchrisseur 1. Le paiement p est fonction non seulement
de lenchre b1 de lacheteur 1, mais galement de toutes les autres enchres, ce qui donne :
p = p (b1 , b2 , , bn ) = p (b( x ), b(v 2 ), , b(vn ))
Cette expression est celle du paiement p de lenchrisseur 1 lorsquil base son enchre sur une
valeur subjective x tandis que les autres enchrisseurs 2, , n basent leur enchre sur leur
valeur subjective v2 , ..., vn . Par exemple, dans lenchre au premier prix, le prix payer est
gal lenchre du gagnant, tandis que dans lenchre au second prix, le prix payer est la
deuxime meilleure enchre. Lesprance de paiement P (x ) de lacheteur 1 est donc :
P( x ) =
v2 ,..., vn
Lobjectif de lacheteur 1 est de choisir x de telle sorte maximiser son gain espr. Le
programme de lenchrisseur 1 est donc :
Max ( x, v1 ) = v1 (F ( x ))
x
n 1
P(x )
Pour que le profil de stratgies (b(v1 ), b(v 2 ), , b(v n )) soit un quilibre de Nash baysien, il
faut que la stratgie b(v1 ) de lacheteur potentiel 1 soit sa meilleure rponse lorsque les autres
(n 1) enchrisseurs choisissent les stratgies b(v2 ), , b(vn ) . La condition du premier ordre
du programme de maximisation de lacheteur potentiel 1 doit donc tre tel que :
( x, v1 )
d (F ( x ))
= v1
x
dx
n 1
P( x ) = 0 pour x = v1
178
Comme on a F (x ) > 0 , cette condition du premier ordre est bien celle dun maximum.174 En
remplaant x par v1 , on obtient la condition doptimalit suivante :
d (F (v1 ))
d v1
n 1
v1
P(v1 ) = 0
(10.2)
La condition doptimalit (10.2) est vraie pour toute valeur de rserve excdant v* , cette
dernire tant la valeur de rservation pour laquelle un acheteur est indiffrent entre enchrir
b(v* ) et ne pas participer lenchre.175 En dautres termes, un acheteur potentiel ayant une
disposition payer infrieure v* ne sera pas incit participer lenchre. La condition
doptimalit est donc vraie pour tout v1 v* , avec v* satisfaisant lquation (10.3) :
(10.3)
d (F (v1 ))
P(v1 ) = v1
d v1
n1
pour v1 v*
v1
P(x )dx = x
v*
v*
v1
v1
v*
v*
d (F ( x ))
dx
n 1
dx
P(x )dx = x d (F (x ))
n 1
En utilisant la condition aux limites (quation 10.3), le premier terme de cette galit scrit
comme suit :
v1
v1
v*
n 1
v*
x d (F (x ))
n 1
= v1 (F (v1 ))
n 1
v* (F (v* ))
n 1
v*
v1
(F ( x )) dx
n 1
v*
174
En annexe ce chapitre, on montre que cette condition du premier ordre est bien celle dun maximum.
Remarquons que v* peut tre gale v
n 1
176
dx = F (x )n 1 et donc d F (x )n 1 dx dx = F (x )n 1 dx = d F (x )n 1 .
On a d F (x )
177
Voir annexe.
175
((
) )
179
n 1
= v1 (F (v1 ))
n 1
v* (F (v* ))
n 1
v1
(F ( x )) dx , soit :
n 1
v*
P(v1 ) = v1 (F (v1 ))
n 1
v1
(F ( x )) dx pour v1 v*
n 1
v*
Ltape suivante est de considrer le point de vue du vendeur. Pour ce dernier, P(v1 ) est une
variable alatoire car il ne peut observer la valeur v1 . Le vendeur connat la distribution F (v1 )
. Lesprance de revenu du vendeur en provenance de lacheteur 1 est donc :
v
v1
n 1
n 1
v*
v*
P1 =
(v F (v ) + F (v ) 1)(F (v ))
n 1
dv1
v*
E (R ) = n (vf (v ) + F (v ) 1)(F (v ))
n 1
dv
(10.4)
v*
Lquation (10.4) est lexpression du thorme dquivalence-revenu qui signifie que pour les
mcanismes denchre appartenant la famille E dfini plus haut, le revenu espr du vendeur
est identique et est donn par cette quation. Donc, dans le cadre des hypothses du modle
valeurs prives indpendantes, les quatre mcanismes denchre dcrits plus haut, soit
lenchre anglaise, lenchre hollandaise, lenchre sous pli ferm au premier prix et lenchre
sous pli ferm au second prix, procurent au vendeur la mme esprance de revenu. De plus,
cette esprance de revenu est fonction du nombre denchrisseurs n, de la distribution des
valeurs prives F(v) et de la valeur v* .
Cette proposition est dune importance capitale car elle permet de comparer deux diffrentes
enchres simplement en comparant la valeur de rserve minimale v* au-dessous de laquelle il
nest pas intressant dentrer dans chacune des enchres. Ainsi, toutes les formes denchres
aboutissant au mme v* donnent au vendeur le mme revenu espr. Considrons lenchre
au premier prix et lenchre au second prix. Ces dernires rpondent toutes les proprits de
178
Voir annexe.
180
la famille E. Si le vendeur fixe un prix de rservation gale b0 , alors pour ces deux enchres,
on a v* = b0 . Dans ce cas, ces deux enchres procurent au vendeur le mme revenu espr. On
montre par ailleurs lquivalence dune part, entre lenchre anglaise et lenchre sous pli
ferm au second prix (enchre de Vickrey) et dautre part, entre lenchre hollandaise et
lenchre sous pli ferm au premier (plus haut) prix. De ce fait, dans le cadre du modle
valeurs prives indpendantes, lquation (10.4) est vraie pour les quatre formes denchres
qui font donc partie de la famille E.
Ce qui donne P (v ) = (F (v ))
n 1
b(v ) et on a donc :
b(v ) =
P (v )
(F (v ))n 1
v
cette expression dans celle de b(v ) et en tenant compte dun prix de rserve gal b0 annonc
par le vendeur, on obtient :
v
v (F (v ))
(F ( x )) dx
n 1
b(v ) =
P(v )
=
(F (v ))n 1
b0
(F (v ))n 1
v
b(v ) = v
(F (x ))
b0
n 1
n 1
avec v b0
dx
(F (v ))n 1
avec v b0
181
infrieure leur disposition payer, soit b(v ) < v . Ceci est d au fait que le vendeur maximise
une esprance de revenu et est galement la consquence de larbitrage des enchrisseurs
entre la probabilit de gagner lenchre et le paiement net en cas de succs. Notons galement
que cette dernire expression montre que la stratgie denchre b(v ) est strictement croissante
par rapport la valeur subjective v , cest--dire quon a b(v ) > 0 , ce qui confirme la
satisfaction de la quatrime proprit des enchres de la famille E.
La premire partie est constitue du revenu espr du vendeur lorsque le bien est
vendu.
La seconde partie est constitue du revenu du vendeur lorsque le bien nest pas
vendu. Cette situation reprsente le cas o aucun des enchrisseurs ne soumet une
n
offre suprieure v* . Elle survient avec une probabilit gale F (v* ) qui est la
probabilit que pour tous les acheteurs potentiels, la valeur subjective vi est
infrieure v* . Dans ce cas, et avec une probabilit gale F (v* ) , le vendeur
gagne v0 , cest--dire sa propre valuation subjective de lobjet.
n
v*
n 1
=0
Ceci permet dobtenir la proposition 3 de Riley et Samuelson selon laquelle les enchres de la
famille E qui permettent de maximiser le rendement total espr sont celles pour lesquelles :
v* = v0 +
179
Comme
f (x ) dx = F (b ) F (a ) , on a
1 F (v* )
F (v* )
d b
f ( x ) dx = F (a ) = f (a ) .
da a
182
Ainsi, dans les enchres sous pli ferm au premier prix et au second prix avec prix de rserve
b0 annonc par le vendeur, on a b0 = v* . Dans ces enchres, le prix de rserve annonc par le
vendeur est donc survalu par rapport sa valeur subjective v0 , soit b0 > v0 .
Dans lenchre au second prix, les enchrisseurs continuent denchrir leur valeur de
rservation. On a donc toujours bi* = vi .
Dans la procdure de lenchre au plus haut prix, les acheteurs potentiels font des
enchres suprieures leur enchre en cas de neutralit au risque.
En consquence, en cas daversion pour le risque des acheteurs potentiels, le vendeur
obtient un revenu espr plus lev dans lenchre au plus haut prix par rapport
lenchre au second prix.
En cas daversion pour le risque, les acheteurs potentiels font une enchre plus leve que
lenchre en cas de neutralit vis--vis du risque, augmentant ainsi leur probabilit de succs.
La raison de ce comportement est que dans le cas contraire, la probabilit de perdre lenchre
et donc le gain (v i bi ) est plus leve et, en raison de la concavit de la fonction dutilit, a
une pondration plus forte que celle du gain pouvant rsulter dune enchre moins leve.
1 si 0 < x < 1
f (x ) =
sinon
0
et
0 si
F ( x ) = x si
1 si
x0
0 < x <1
x 1
E (R ) = n (2v 1)v
b0
180
n 1
dv =
(n 1) b0 n (2nb0 n 1)
n +1
183
Supposons maintenant que le vendeur accepte des enchres sans prix de rserve, soit b0 = 0.
Son revenu espr devient alors :
1
E (R ) = n (2v 1)v n 1 dv =
0
n 1
n +1
(10.5)
Lquation (10.5) est lexpression du revenu espr du vendeur E(R), pour des enchres sans
prix de rserve lorsque les valeurs subjectives des enchrisseurs suivent une distribution
uniforme entre 0 et 1. Lesprance de revenu E (R ) est donc une fonction croissante et
concave par rapport n, ce qui donne la reprsentation graphique de la figure 10.2, avec
n 2 . Ainsi, lorsque le nombre denchrisseurs est suffisamment lev, le revenu espr du
vendeur tend vers le maximum des valeurs subjectives des acheteurs potentiels.
E (R )
1
1/3
2
Figure 10.2 : Relation entre lesprance de revenu du
vendeur et le nombre dacheteurs potentiels
184
Annexe au chapitre 10
A. La condition du premier ordre est suffisante
( x, v1 )
d (F ( x ))
= v1
Nous montrons que la condition du premier ordre
x
dx
x = v1 est bien celle dun maximum et non celle dun minimum. On a :
n 1
P(x ) = 0 pour
n 1
( x, v1 ) d (F ( x ))
n2
=
= (n 1)(F ( x )) F ( x ) > 0 car F (x ) > 0
v1 x
dx
En dautres termes,
(x, v1 )
est croissante par rapport v1 . On peut de ce fait distinguer
x
deux cas :
(x, v1 )
est croissante par rapport v1 , alors on a
x
( x, x )
( x, x ) ( x, v1 )
. Comme de plus,
= x F ( x ) P ( x ) = 0 , alors on a
<
x
x
x
(x, v1 )
> 0.
x
( x, v1 ) ( x, x )
Deuxime cas : x > v1 . De faon similaire, ceci nous donne
<
=0.
x
x
On a ainsi x < v1
( x, v1 )
( x, v1 )
> 0 et x > v1
< 0.
x
x
x d (F (x ))
v*
181
n 1
= x(F ( x ))
n1 v1
v*
v1
(F (x ))
n 1
dx = v1 (F (v1 ))
n 1
v* (F (v* ))
v*
n 1
v1
(F ( x )) dx
v*
n 1
185
n 1
wdu = wu udw ,
on a pos w = x et
n 1
n 1
P1 = v1 (F (v1 )) (F ( x )) dx F (v1 )dv1
v*
v*
P1 = v1 (F (v1 ))
n 1
v*
v v1
v* v*
Pour simplifier cette expression, on procde lintgration par parties du second terme en
posant w(v1 ) =
v1
(F (x ))
n 1
v*
v v1
v* v*
v*
n 1
(F (x )) F (v1 )dx dv1 = w(v1 )du = w(v1 )F (v1 )
F (v1 )dw(v1 )
v*
v*
n 1
dv1
v*
v*
(F (x ))
n 1
dx = 0 , nous avons :
v*
v v1
(F (x ))
v* v*
n 1
n
F (v1 )dxdv1 = w(v ) (F (v1 )) dv1 =
v*
v v1
v* v*
v*
(F (x ))
v*
n 1
dx (F (v1 )) dv1
n
v*
n 1
n 1
(F (x )) F (v1 )dxdv1 = (F (v1 ) 1)(F (v1 )) dv1 .
186
Rfrences
Akerlof, G. (1970). The Market for "Lemons": Quality Uncertainty and the Market
Mechanism. Quarterly Journal of Economics, Vol. 84, Issue 3. P 488-500.
Bhattacharya, S. (1979). Imperfect Information, Dividend Policy, and "The Bird in the
Hand" Fallacy. The Bell Journal of Economics, Vol. 10, No. 1. P 259-270.
Debreu, G. (1959). Theory of Value. New York, Wiley.
Demange, G. et Ponssard, J. P. (1994). Thorie des jeux et analyse conomique. PUF.
Cho, I-K and Kreps, D. (1987). Signaling game and stable equilibria. Quarterly Journal of
Economics, Vol. 102. P 179-221.
Friedman, J. (1971). A non-cooperative Equilibrium for Supergames. Review of Economic
Studies, Vol. 38. P 1-12.
Fudenberg, D. and Tirole, J. (1996). Game Theory. The MIT press, Cambridge,
Massachusetts.
Gibbons, R. (1992). A Primer in Game Theory. Harvester Wheatsheaf.
Gliz, A. (2004). Risque de sous-valuation et privatisation partielle des entreprises. Les
cahiers du CREAD, n 68/69, 2004. P 5-35.
Grossman, S. et Hart, O. (1983). An analysis of the principal-agent problem. Econometrica,
Vol.51. P 7-45.
Harsanyi, J. (1973). Games with randomly disturbed payoffs: A new rationale for mixedstrategy equilibrium points. International Journal of Game Theory, Vol. 2, P 1-23.
Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review,
Vol. 85, n 3. P 291-303.
Holmstrm, B. (1979). Moral hazard and observability. Bell Journal of Economics, 14, 1979.
P 74-91.
Jensen, M. and Meckling, W. (1976). Theory of the firm: managerial behaviour, agency
costs, and ownership structure. Journal of Financial Economics, 3. P 305-360.
Kreps, D and Wilson, R. (1982). Sequential Equilibria. Econometrica, Vol. 50, No. 4. P 863894.
Laffont, J-J. (1991). Cours de thorie microconomique. Tome 2 : Economie de l'incertain et
de l'information. Economica.
187
La Porta, R., Lopez-de-Silanes, F., Shleifer, A. and Vishny, R. (1998). Law and Finance.
Journal of Political Economy, Vol. 106, n 6. P 1113-1155.
Levhari, D. and Mirman, L. J. (1980). The great fish war : An example using a dynamic
Cournot-Nash solution. Bell Journal of Economics, P.322-334.
Malinvaud, E. (1982). Leons de micro-conomie. Dunod.
Mas-Colell, A., Whinston, M. D. and Green, J. R. (1995). Microeconomic theory. Oxford
University Press. New-York.
Milgrom, P. and Weber, R. (1982). A theory of auctions and competitive bidding.
Econometrica, Vol. 50. P 1088-1122.
Mirrless, J. A. (1971). An exploration in the theory of optimal income taxation. Review of
Economic Studies, Vol. 38. P 175-208.
Modigliani, F. and Miller, M. (1958). The Cost of Capital, Corporation Finance and the
Theory of Investment. The American Economic Review, Vol. 48. P 261-297.
Modigliani, F. and Miller, M. (1963). Corporate Income Taxes and the Cost of Capital: a
Correction. The American Economic Review, 53. P 433-443.
Myerson, R. B. (1981). Optimal Auction Design. Mathematics of Operations Research, Vol.
6. P 58-73.
Naegelen, F. 1988). Les mcanismes denchres. Economica, 1988.
Nash, J. F. (1950). Equilibrium points in n-person games. Proceedings of the National
Academy of sciences, 36: 48-49.
Osborne, M. J. (2002). An introduction to game theory. Oxford University Press. (version
web).
Riley, J. (2001). Silver Signals: Twenty-Five Years of Screening and Signaling. Journal of
Economic Literature, Vol. 39. P 423-478.
Riley, J. and Samuelson, W. (1981). Optimal Auctions. The American Economic Review,
Vol. 71, n 3. P 381-392.
Rogerson, W. (1985). The first-order approach to principal-agent problems. Econometrica,
53. P 1357-1368.
Ross, S. (1977). The Determination of Financial Structure: The Incentive-Signalling
Approach. The Bell Journal of Economics, Vol. 8, No. 1. P 23-40.
Rothschild, M. and Stiglitz, J. (1976). Equilibrium in Competitive Insurance Markets: an
Essay on the Economics of Imperfect Information. Quarterly Journal of Economics, Vol. 90.
P 629-649.
188
189
Exercices
1-) Soit le jeu simultan information complte suivant (jeu sous forme normale) :
A1
A2
A3
A4
B1
0,7
5,2
7,0
0,0
B2
2,5
3,3
2,5
0 , -2
B3
7,0
5,2
5,7
0,0
B4
1,5
3,2
4,4
10 , -1
A1
A2
A3
A4
B1
5,6
4,6
0,0
7 ,5
B2
2,2
3,2
5,5
6,8
B3
6,1
0,2
9,0
3,6
B4
4,0
4,6
1,3
2,9
3-) Supposons qu'il existe 3 firmes dans le modle d'oligopole de Cournot. Soit qi la quantit
produite par la firme i et Q = q1 + q2 + q3 dnote la quantit totale du march. Le prix
d'quilibre P est donn par l'quation P = P(Q ) = a Q avec Q < a . Le cot total de la firme
i est donn par l'quation Ci = Ci (qi ) = cqi avec c < a .
190
Ces informations tant connaissance commune pour les deux joueurs, dterminer les
quilibres de Nash de ce jeu. Parmi ces quilibres, quel est le plus plausible? Pourquoi?
5-) Modle de Stackelberg. On considre un march o existent deux firmes et on souhaite
prdire son quilibre. La firme 1 est le leader et choisit la quantit produire q1 0 en
premier. La firme 2 est le follower et choisit la quantit produire q 2 0 aprs avoir observ
la quantit produite q1 0 de la firme 1. Le cot de production unitaire du bien est constant et
gal 10 pour la firme 1 et 14 pour la firme 2. Le prix d'quilibre du march est dtermin
selon l'expression suivante : P(Q ) = 100 Q avec Q = q1 + q 2 .
Dterminer la quantit produire de chaque firme et le prix d'quilibre du march. Quelle est
la mthode de rsolution utilise pour obtenir l'quilibre de Nash parfait?
6-) Modle de Stackelberg. Considrer le modle de Stackelberg et trouver l'quilibre du jeu
si c1 > c2 , c'est--dire si le follower (joueur 2) peut produire un cot unitaire plus faible.
Considrer que les cots sont tels que c1 = ac 2 avec a > 1 . Quelle est la valeur de a telle que
les deux firmes produisent la mme quantit. Quelle est votre interprtation de ce rsultat en
terme de leadership dans un march ?
7-) Financement d'un bien public. Considrons une situation o existent deux
consommateurs i = 1, 2 . Chacun d'eux choisit librement et simultanment de contribuer pour
un montant x i au financement d'un bien public. L'utilit qu'obtient l'individu i en utilisant le
bien public est donne par u i (x1 + x 2 ) xi . La contribution totale X = x1 + x 2 est
reprsentative de la taille du bien public. La fonction d'utilit u () est telle que u (0 ) = 0 ,
u (0 ) > 1 , u > 0 , u < 0 et lim u (x ) < 1.
x
191
Joueur 1
G1
D1
Joueur 2
u1
u2
G2
D2
G2
a
b
c
d
D2
g
h
Version 1
a) Reprsenter ce jeu par une matrice des paiements dun jeu sous forme normale.
b) Quelles sont les conditions sur les paiements pour que le profil de stratgies (D1 , G2 ) soit
un quilibre de Nash pour ce jeu ?
D1
Joueur 2
u1
u2
Joueur 2
G2
D2
G2
a
b
c
d
D2
g
h
Version 2
c) Quelle est la nature de la modification apporte la version 2 du jeu par rapport la
version 1 ?
d) A-t-on les mmes conditions que dans b) pour que les actions (D1 , G2 ) soient sur le sentier
dquilibre ?
9-) Considrons le jeu de prdation suivant qui fait intervenir 2 firmes, la firme E (Entrant)
souhaitant entrer dans un march et la firme I (Incumbent) ayant actuellement le monopole ou
la domination du march. Il s'agit d'un jeu dynamique qui se droule en deux tapes.
- Premire tape : la firme E doit dcider soit d'entrer ou de ne pas entrer dans le
march.
- Deuxime tape : Si la firme E dcide d'entrer, alors les deux firmes E et I doivent
choisir simultanment et en situation d'information complte soit de tolrer soit d'tre
hostile en engageant une guerre des prix.
192
In
Firme E
0
2
Hostile
Tolre
Firme I
H
-3
-1
T H
1
-2
-2
-1
T
3
1
a) Donner la forme normale du jeu sachant que la firme E dispose des quatre stratgies
suivantes : 1) (Out, Tolre si In) ; 2) (Out, Hostile si In) ; 3) (In, Tolre si In) ; 4) (In,
Hostile si In).
b) Quel est l'Equilibre de Nash Parfait de ce jeu ?
c) Quelle exigence supplmentaire doit satisfaire l'Equilibre de Nash dans un jeu
dynamique ?
10-) Duopole de Cournot et incertitude de la demande. Considrons le cas de deux firmes
en concurrence. La fonction de demande inverse est P(Q ) = a Q o Q = q1 + q 2 est la
quantit totale offerte par les deux firmes. Chacune des deux firmes choisit une quantit
produire qi avec i = 1, 2 et avec comme objectif la maximisation de son profit. Le cot
marginal des deux firmes est identique et gal c . La firme 1 a une asymtrie d'information
par rapport au niveau de la demande. Pour cette firme, la demande peut tre leve avec
probabilit ou faible avec probabilit 1 . La demande leve signifie a = a H et la
demande faible a = a L . La firme 2 par contre sait avec certitude si la demande est leve ou
faible. Toutes ces donnes sont information commune et les deux firmes choisissent les
quantits de faon simultane.
Trouver l'quilibre de Nash Bayesien de ce jeu en faisant ressortir les conditions sur a H , a L ,
et c pour que les quantits d'quilibre soient positives.
11-) G. Akerlof. A travers son article "The Market for "Lemons": Quality Uncertainty and the
Market Mechanism" de 1970, montrer quels sont les principaux apports de G. Akerlof
l'conomie de l'information ?
12-) Considrer le phnomne de slection adverse mis en vidence par G. Akerlof (1970).
Montrer comment ce phnomne peut exister dans la relation d'assurance entre une
193
: Prix subjectif d'un vendeur pour une mauvaise voiture d'occasion : 1.000
v ab
v am
: Prix subjectif d'un acheteur pour une bonne voiture d'occasion : 2.400
: Prix subjectif d'un acheteur pour une mauvaise voiture d'occasion : 1.200
Les acheteurs ne peuvent observer la qualit (bonne ou mauvaise) des voitures d'occasion,
mais estiment que 50% des vhicules sont de bonne qualit et 50% de mauvaise qualit.
1. quel est le prix maximum que les acheteurs sont prts payer pour une voiture
d'occasion ?
2. Quelle (s) est (sont) la (les) qualit (s) change (s) et la fourchette des prix ?
14-) Slection adverse en assurance. En vous rfrant l'analyse du march de l'assurance
en cas d'asymtrie de l'information de Rothschild, M. & Stiglitz, J. (1976), montrer comment
les prix linaires d'assurance impliquent l'apparition du phnomne de slection adverse dans
lequel les individus faible risque s'assurent de faon sous optimale.
15-) En vous rfrant l'analyse du march de l'assurance en cas d'asymtrie de l'information
de Rothschild, M. & Stiglitz, J. (1976), discuter de l'volution du concept d'quilibre du
march, en particulier en expliquant les concepts d'quilibres sparateurs et d'quilibres non
sparateurs.
16-) Equilibre de slection adverse. Considrons une situation dchange entre une
entreprise et un consommateur. La qualit du produit changer peut tre leve H- ou
faible L. Le consommateur ne peut observer la qualit du produit avant son achat mais
dispose de la croyance que la qualit du produit est du type H avec probabilit . Le cot de
production du produit du type H est C H et celui du type L est C L avec C H > C L . Le
consommateur dsire acheter au plus une unit du produit. Le prix de march p est un prix
rgul avec v H > p > v L > C H > C L .
Montrer qu lquilibre (de Nash), seule la qualit L est change. Quelle est la condition sur
pour lexistence dun tel quilibre ?
17-) Asymtrie d'information et quilibre du march des assurances. La figure suivante
montre le cas d'une compagnie d'assurance faisant face une asymtrie d'information relative
la probabilit d'accident des individus. Cette probabilit peut tre leve ( p H ) ou faible ( p L
). Supposons que cette compagnie propose un contrat d'assurance prix non linaire
194
reprsent par le point C sur la droite OD de pente (1 p ) / p o p est la probabilit
d'accident moyenne.
1. Montrer partir de ce schma pourquoi un tel contrat n'est pas robuste la
concurrence.
2. Ce contrat est-il un contrat mlangeant ou sparant ? Quelle est la signification de
ces types d'quilibre ?
Revenu en cas
d'accident.
(1 p H ) / p H
(1 p ) / p
D
(1 p L ) / p L
C
H
wd
Revenu en l'absence
d'accident.
18-) Ala moral et financement. Soit le cas d'une entreprise souhaitant raliser un
investissement d'un cot initial de 3000. Le revenu gnr par ce projet est de 4500 en cas de
succs et de 0 en cas d'chec. La probabilit de succs est de 0,7 si le manager se comporte
honntement et de 0,5 s'il ne se comporte pas honntement. Dans cette seconde alternative, le
manager obtient des bnfices privs de 700. Cette entreprise ne dispose pas de toutes les
ressources financires ncessaires pour raliser cet investissement. Elle doit donc recourir
un financement externe.
: Prix subjectif d'un vendeur pour une bonne voiture d'occasion : 2.000
v vm
v ab
v am
: Prix subjectif d'un vendeur pour une mauvaise voiture d'occasion : 1.000
: Prix subjectif d'un acheteur pour une bonne voiture d'occasion : 2.400
: Prix subjectif d'un acheteur pour une mauvaise voiture d'occasion : 1.200
195
Les acheteurs ne peuvent observer la qualit (bonne ou mauvaise) des voitures d'occasion.
Mais les vendeurs de voitures ont la possibilit de signaler la qualit de leur voiture, ceci par
la proposition d'une garantie qui les oblige remplacer toute pice dfectueuse pendant une
priode d'une anne. Supposons qu'en moyenne, la garantie cote 300 par an pour une bonne
voiture et 1.300 pour une mauvaise voiture. Supposons galement que le march de voitures
est un march de vendeurs (les prix s'tablissent la borne suprieure de l'intervalle de
ngociation).
Montrez que les propritaires de bonne voiture peuvent signaler la qualit de leur voiture en
offrant une garantie d'une anne. (Indication : vrifier si les vendeurs de mauvaise voiture
sont incits imiter les vendeurs de bonne voiture, c'est--dire proposer une garantie d'une
anne).
20-) Jeu de signal. Considrons un jeu dans lequel la premire tape, la nature procde au
tirage alatoire du type (capacit productive) de chaque travailleur partir d'une distribution
de probabilit continue sur [ , ]. A la seconde tape du jeu, chaque travailleur observe son
type qui est son information prive et doit dcider s'il accepte de passer ou non un test sans
cot qui rvle parfaitement son type. A la troisime tape, des firmes en concurrence
observent si le travailleur a accept ou non de passer le test ainsi que le rsultat du test et
proposent un salaire pour le recrutement du travailleur.
Montrer que dans un quilibre Bayesien parfait, les travailleurs de tout type acceptent de
passer le test et les firmes offrent un salaire non suprieur pour tout travailleur n'ayant pas
accept de passer le test. (Indication : assurez-vous que les participants ce jeu ne sont pas
incits dvier de cet quilibre en spcifiant convenablement les croyances l'quilibre).
21-) Considrer l'quilibre de signal suivant du modle de Spence (1973) :
w* e * ( H ) = H
w* (e )
w * e * ( L ) = L
0 = e * ( L )
e = e * ( H )
196
1.) Montrer
que
le
couple
stratgies
croyances
[(R, R, R ); (u, d ); (t1 / R ) = 0,5; (t 2 / R ) = 0,25; (t3 / R ) = 0,5; (t1 / L ) = 0,4; (t2 / L ) = 0,3; (t3 / L ) = 0,3]
Nature
t1
t2
[0,5]
Emetteur
R
Rcepteur
1
3
6
0
2
2
[0,5]
Emetteur
t3
[0,25]
Emetteur
R
Rcepteur
HL
1
4
2
3
6
3
4
3
HR
5
4
3
4
6
2
5
4
3
5
197
1.) Montrer que le couple stratgies / croyances [(R, R ); (u , d ); q = 0,5; p ] avec p >
1
est
4
[p ]
2
3
4
1
Rcepteur
HL
Nature
t2
R
Emetteur
6
1
[q]
d
Rcepteur
HR
0,5
0,5
[1-p]
8
2
Emetteur
L
t1
3
4
4
1
[1-q]
d
7
3
25-) Les enchres. Donnez les arguments montrant que les enchres appartiennent la classe
des jeux Bayesiens. Dcrivez ce mcanisme en utilisant les concepts de cette classe de jeux.
26-) L'enchre au second prix. Dans l'enchre au second prix (enchre de Vickrey), les
enchres bi sont soumises sous pli cachet. Lobjet est attribu lenchrisseur qui propose
loffre la plus leve et le prix payer est gal la deuxime offre la plus leve. Les
valuations subjectives v i pour l'objet des acheteurs potentiels i sont prives et indpendantes
entre elles. Montrer que lannonce de leur vritable valuation de lobjet est une stratgie
dominante pour les enchrisseurs, ce qui donne bi* = vi .