Vous êtes sur la page 1sur 198

ECOLE SUPERIEURE DE COMMERCE

1, Rampe Salah Gherbi, Agha, Alger

THEORIE DES JEUX


ET
ECONOMIE DE LINFORMATION
NotesdeCours

Abdelkader GLIZ

Octobre 2010

Table des matires

Prface ....................................................................................................................................... 4
Introduction .............................................................................................................................. 5

Premire Partie : Thorie des jeux ............................................................................... 6


Chapitre 1 : Jeux simultans information complte, thorie ............................................ 8
1.1.
1.2.
1.3.
1.4.
1.4.1.
1.4.2.
1.5.
1.6.

La forme normale d'un jeu ......................................................................................... 8


Lquilibre en stratgies dominantes........................................................................ 10
L'quilibre de Nash en stratgies pures .................................................................... 13
L'quilibre de Nash en stratgies mixtes .................................................................. 15
La notion de stratgie mixte ..................................................................................... 15
Dtermination de l'quilibre de Nash en stratgies mixtes ...................................... 19
Lquilibre de Nash avec mains tremblantes ..................................................... 24
L'existence de l'quilibre de Nash ............................................................................ 26

Chapitre 2 : Jeux simultans information complte, applications.................................. 29


2.1.
2.2.
2.3.
2.4.
2.5.
2.6.

L'enchre au second prix ......................................................................................... 29


Le modle de duopole (concurrence imparfaite) de Cournot ................................... 30
Le modle de duopole de Bertrand .......................................................................... 33
Le problme des commons ....................................................................................... 35
Le jeu de l'inspection ................................................................................................ 38
Le jeu de coordination et quilibres de Nash multiple ............................................. 40

Chapitre 3 : Jeux dynamiques information complte ...................................................... 41


3.1. La forme extensive ................................................................................................... 42
3.1.1. La forme extensive d'un jeu dynamique ................................................................... 42
3.1.2. Reprsentation d'un jeu statique par la forme extensive .......................................... 43
3.1.3. La notion de sous-jeu ............................................................................................... 45
3.2. Jeu squentiel information complte et parfaite .................................................... 46
3.2.1. La procdure de Rcurrence vers l'amont (Backwards induction) ........................... 46
3.2.2. Application de la rcurrence vers l'amont : le modle de duopole de Stackelberg .. 48
3.3. L'Equilibre de Nash Parfait (SPNE) ......................................................................... 50
3.3.1. Reprsentation d'un jeu dynamique par la forme normale ....................................... 51
3.3.2. Dtermination de l'Equilibre de Nash Parfait pour un jeu dynamique information
complte et parfaite .............................................................................................................. 51
3.3.3. Le jeu de prdation (guerre des prix) ....................................................................... 53
3.4. Jeux rpts .............................................................................................................. 55
3.4.1. Jeux rpts deux fois .............................................................................................. 55
3.4.2. Jeux infiniment rpts............................................................................................. 56
3.4.3. Application : la collusion dans un duopole en quantit ........................................... 61

Chapitre 4 : Jeux simultans information incomplte ..................................................... 63


4.1. Exemples de jeux baysiens : jeu de free riding et duopole de Cournot avec
asymtrie de l'information .................................................................................................... 63
4.1.1. Jeu de free riding avec asymtrie de l'information ................................................... 64
4.1.2. Duopole de Cournot avec asymtrie de l'information .............................................. 66
4.2. La forme normale d'un jeu statique information incomplte................................. 69
4.3. L'quilibre de Nash baysien.................................................................................... 72
4.3.1. La stratgie dans un jeu baysien ............................................................................. 72
4.3.2. Lesprance de paiement dans un jeu baysien ........................................................ 74
4.3.3. L'quilibre de Nash baysien.................................................................................... 74
4.4. Application : Le modle de Cournot selon l'approche de Harsanyi ......................... 79
Chapitre 5 : Jeux dynamiques information incomplte .................................................. 82
5.1. Limportance des croyances dans le concept dquilibre dun jeu dynamique
information incomplte ........................................................................................................ 82
5.2. Linsuffisance de la perfection en sous-jeux dans un jeu dynamique information
incomplte ............................................................................................................................ 84
5.3. L'quilibre baysien parfait au sens faible ............................................................... 86
5.4. Equilibre baysien parfait et croyances hors sentier dquilibre.............................. 89
5.5. Lquilibre squentiel et lquilibre parfait avec mains tremblantes ................... 92
5.6. Les jeux de signaux .................................................................................................. 93
5.6.1. Dfinition et caractristiques dun jeu de signal ...................................................... 94
5.6.2. Lquilibre baysien parfait dun jeu de signal et typologie des quilibres ............. 95
5.6.3. Raffinements des quilibres dun jeu de signal ...................................................... 102

Deuxime Partie : Modles de lconomie de linformation ............................ 106


Chapitre 6 : Le phnomne de slection adverse .............................................................. 107
6.1.
6.2.
6.3.

Lasymtrie de linformation et le modle de slection adverse de Akerlof ......... 108


Lquilibre du march en cas dasymtrie de linformation .................................. 110
Asymtrie de linformation et rduction de bien-tre ............................................ 113

Chapitre 7 : Asymtrie de l'information et quilibre du march des assurances .......... 116


7.1.
7.2.
7.3.

Les donnes de base du modle de Rothschild et Stiglitz ...................................... 116


Asymtrie de linformation et phnomne de slection adverse en assurance ...... 118
Equilibres sparants et quilibres mlangeants ...................................................... 123

Chapitre 8 : Le modle de signal de Spence....................................................................... 127


8.1.
8.2.
8.3.
8.4.
8.5.
8.6.

Les donnes de base du modle de signal .............................................................. 127


Le cas de symtrie de linformation ....................................................................... 132
Le cas de lasymtrie de linformation ................................................................... 133
Les quilibres baysiens parfaits ............................................................................ 134
Raffinements des croyances hors quilibre et slection des quilibres .................. 140
Limpact du signal sur le bien-tre ......................................................................... 142

Chapitre 9 : La thorie de l'agence ..................................................................................... 145


9.1.
9.2.
9.3.
9.3.1.
9.3.2.
9.4.
9.5.
9.5.1.
9.5.2.
9.5.3.
9.5.4.

Leffort de lagent, une information asymtrique .................................................. 145


Relation principal / agent en cas dobservabilit de leffort .................................. 147
Relation principal / agent en cas de non observabilit de leffort .......................... 150
Modle de lala moral en cas avec deux niveaux deffort .................................... 150
Modle de lala moral en cas deffort continu...................................................... 154
Application 1 : ala moral et rationnement du crdit ............................................. 157
Application 2 : ala moral et structure de la proprit des entreprises .................. 161
Les cots dagence des actions externes ................................................................ 163
Le rle du monitoring et de lengagement dans la rduction des cots dagence .. 168
Les cots dagence de la dette ................................................................................ 169
Une thorie de la structure de la proprit base sur les cots dagence ............... 170

Chapitre 10 : Les mcanismes denchres ......................................................................... 172


10.1. Les diffrentes formes denchres.......................................................................... 172
10.2. Les enchres, jeu non coopratif information incomplte................................... 173
10.3. Lesprance de revenu dans le modle valeurs prives indpendantes ............... 174
10.4. La sous enchre des acheteurs potentiels ............................................................... 180
10.5. La surestimation du prix de rserve du vendeur .................................................... 181
10.6. Le cas de laversion pour le risque ......................................................................... 182
10.7. Lesprance de revenu du vendeur avec des valuations subjectives uniformes ... 182
Annexe au chapitre 10 ........................................................................................................ 184
Rfrences ............................................................................................................................. 186
Exercices ................................................................................................................................ 189

Prface
Le prsent document de travail reprsente les notes de cours du module Economie de
lInformation que jassure dans le cadre du programme de Magister de lEcole Suprieure
de Commerce dAlger. Il inclut galement quelques uns des thmes abords dans un autre
cours de Magister, en loccurrence le cours de Thorie Financire de lEntreprise . Cest le
cas par exemple des applications du modle de lala moral (chapitre 9).
Bien que lintitul du cours soit Economie de lInformation , la premire partie est
consacre la thorie des jeux, car celle-ci constitue un puissant outil danalyse et de
comprhension du rle de linformation dans lactivit conomique. Mais compte tenu de
limportance intrinsque de la thorie des jeux dans les cursus universitaires, je lui rserve une
partie part entire.
La seconde partie de ces notes de cours est conue comme une prsentation dtaille des
principales contributions de lconomie de linformation. Dans cette partie, je me base de ce
fait essentiellement sur les articles lorigine de ces apports.
Le volume horaire de ce cours ne me permet pas daborder tous les thmes contenus dans ce
document de travail. Mais dans un souci de cohrence globale, il tait ncessaire dinclure des
dveloppements non abords avec les tudiants. En particulier, le chapitre 10 nest pas
souvent expos en cours. Le chapitre 5 nest pas trait en tant que tel mais est tout de mme
expos en cours car il constitue un pr requis indispensable pour les modles de signaux
(chapitre 8).
Je remercie vivement tous les tudiants des diffrentes promotions ayant assist ce cours.
Leurs questions et commentaires pertinents ainsi que leur intrt pour les sujets abords mont
permis, danne en anne, damliorer le contenu de ce cours. Pour cela, ma gratitude envers
eux est grande.

Abdelkader GLIZ
Alger, octobre 2010

Introduction

L'conomie de l'information analyse les choix conomiques en situation d'asymtrie de


l'information et leurs implications sur la collectivit, les agents conomiques et le
fonctionnement des marchs. Le modle standard de lquilibre gnral est bas entre autres,
sur lhypothse de l'information parfaite selon laquelle tous les agents conomiques ont un
accs identique, immdiat et sans cot l'information. L'abandon de cette hypothse et donc
la prise en compte explicite de lasymtrie de linformation dans lanalyse conomique est
l'objet de l'conomie de l'information. Cette volution a permis une meilleure comprhension
dun grand nombre de phnomnes conomiques.
En mettant en vidence limpact du phnomne de slection adverse sur le fonctionnement du
march, G. Akerlof (1970) a montr que lhypothse de linformation parfaite nest pas neutre
dans lanalyse conomique. De mme, une des conclusions de la thorie de l'agence est que
l'existence de l'ala moral dans la relation principal/agent entrane souvent une diminution du
bien-tre des parties contractantes par rapport un tat o nexisteraient pas ces imperfections
en termes dinformation.
L'conomie de l'information analyse galement la raction des agents conomiques en
prsence de l'asymtrie de l'information, notamment le signal et le filtrage (screening). Ces
types de ractions permettent dexpliquer le rle conomique de certaines institutions et de
mcanismes, telles que la garantie, la rputation, la rglementation, la marque, la
gouvernance, Dans le premier cas, afin de pouvoir se distinguer, la partie informe de type
leve est incite rvler sa qualit. La deuxime raction provient de la partie non informe
qui est incite mettre en place un mcanisme de rvlation de linformation travers
notamment la proposition la partie informe dun menu de contrats.
Sur le plan normatif, les analyses et modles dvelopps ont pour objectif gnral de proposer
des mcanismes conomiques optimaux tenant compte du fait que les agents conomiques
dtiennent de linformation prive. Ces mcanismes sont analyss comme tant des jeux
information incomplte. Cette dmarche est utilise par exemple, dans la thorie de la
taxation optimale (Mirrless, 1971) et la dtermination d'enchres optimales (Myerson, 1981).
Le dveloppement de la thorie des jeux a eu un impact dcisif sur l'tude des situations
d'asymtrie de l'information. L'analyse de l'interaction stratgique permise par la thorie des
jeux se trouve tre bien adapte l'tude de l'change entre individus ayant un accs diffrent
l'information. En particulier, les jeux information incomplte, qu'ils soient statiques ou
dynamiques, prennent en compte de faon explicite l'existence de l'asymtrie de l'information.

Premire Partie : Thorie des jeux

L'activit conomique et sociale se caractrise trs souvent par des situations o le bien-tre
d'un agent conomique dpend non seulement de ses propres actions mais galement des
dcisions des autres agents. Conscient de l'existence de ce type d'interdpendance, chaque
agent en tient compte et l'intgre dans la prise de dcision.
La thorie des jeux est un cadre conceptuel d'analyse de la dcision o cette interaction
stratgique entre les dcideurs est centrale pour la comprhension de l'issue finale. Un des
exemples classiques pour la comprhension de l'interaction stratgique est le cas du duopole.
En prenant sa dcision de production ou de prix de vente, chacune des deux firmes d'un
duopole doit tenir compte de la raction de l'autre firme et doit de ce fait intgrer cette
raction dans sa propre dcision.
Dans la thorie standard de l'quilibre gnral, l'interaction entre les agents est inexistante. En
fait, deux cas extrmes ont particulirement focalis l'attention. Le premier a port sur la
concurrence parfaite. Dans ce cas, le prix des biens est donn par le march et l'entreprise (par
exemple) prend sa dcision de production en ne tenant compte que de ces prix de march et de
son cot marginal et ce, indpendamment de la dcision des autres entreprises. Les dcisions
de consommation des individus sont de mme considres comme tant indpendantes l'une
de l'autre. La deuxime situation particulirement tudie est celle du monopole. Dans une
telle situation, il n'existe qu'une seule entreprise. De ce fait, par construction, le monopoleur
prend sa dcision de production de faon indpendante.
Mais la prise en compte de l'interaction entre agents devient incontournable dans certains
phnomnes, tels que l'oligopole, les contrats, le marchandage, la rgulation, les enchres, le
financement de biens publics, Notons d'ores et dj que tout comme dans le cas de la
thorie standard de l'conomie, les agents conomiques sont supposs tre rationnels, c'est-dire que leur objectif est la maximisation de l'utilit (ou de lesprance dutilit).
La prise en compte explicite et formalise de l'interaction stratgique entre agents
conomiques a dbut avec Cournot (1838) qui a analys la situation de duopole en prenant
explicitement en compte l'interaction entre les dcisions de production des firmes du march.
Bertrand (1883) a analys l'interaction dans un duopole o la dcision des firmes porte sur le
prix de vente proposer, alors que dans le modle de Cournot la dcision des entreprises porte
sur la quantit produire. Les thoriciens considrent cependant que le vritable point de
dpart de la thorie des jeux est la publication par Von Neumann et Morgenstern (1944) du
livre : Theory of Games and Economic Behaviour. La contribution majeure de Nash (1950)
est de montrer l'existence d'un quilibre (d'une solution) pour des jeux somme non nulle.
Harsanyi (1967-1968) et Selten (1965) ont tendu par la suite le concept d'quilibre de Nash
respectivement aux jeux information incomplte (jeux Bayesiens) et aux jeux dynamiques.
Les jeux tudis sont des jeux non coopratifs. Dans cette catgorie de jeux, les seuls
paiements possibles sont ceux reprsents dans les matrices de paiement. Aucun autre
paiement ne peut avoir lieu entre les deux joueurs et ces derniers ne sont censs se proccuper
que de la maximisation de leur utilit.

Chapitre 1 : Jeux simultans information complte, thorie

Nous tudions dans ce chapitre les jeux simultans information complte. En plus de
l'hypothse de rationalit, dans cette classe de jeux, on adopte lhypothse selon laquelle
chaque joueur dispose de toute linformation se rapportant au jeu, savoir le nombre de
joueurs, lensemble des stratgies possibles de chaque joueur et les fonctions de paiement de
chaque joueur. Les jeux de cette forme sont des jeux information complte. Les joueurs sont
censs prendre leur dcision de faon simultane. Nous obtenons ainsi des jeux simultans
information complte. Cette classe de jeux est la plus simple possible et constitue le point de
dpart pour des situations de jeux plus complexes. Elle permet d'tudier le concept d'quilibre
central de la thorie des jeux qui est l'quilibre de Nash.

1.1.

La forme normale d'un jeu

On appelle un jeu sous forme normale (ou stratgique) un jeu ayant les caractristiques
suivantes :
-

Il s'agit d'un jeu information complte.

Il s'agit d'un jeu simultan (statique) o chaque joueur choisit une stratgie
indpendamment du choix de l'autre joueur et le jeu ne se rpte pas.

Les joueurs sont rationnels et leur objectif est la maximisation de leur paiement.1

Dans la forme normale d'un jeu, chaque joueur choisit une stratgie et le paiement qu'obtient
chaque joueur dpend de la combinaison des stratgies choisies. Pour illustrer la forme
normale, considrons le cas classique du dilemme du prisonnier. Il s'agit d'un jeu dcrivant la
situation de deux individus arrts et souponns de crime et placs dans des cellules spares
sans possibilit de communication. N'ayant pas les preuves suffisantes pour leur inculpation,
le juge, convaincu de leur culpabilit, tente d'obtenir des confessions des deux prisonniers et
chacun d'eux, il propose ce qui suit :
Si un des prisonniers est le seul avouer, alors sa peine sera allge et gale
1 an et l'autre prisonnier aura une peine de 8 ans.
Si les deux prisonniers avouent, alors chacun d'eux aura une peine de 5 ans.
Si personne n'avoue, une peine de 2 ans sera tout de mme applique pour un
dlit plus faible (par exemple la dtention illgale d'armes).
Ce jeu peut tre reprsent par la matrice des paiements suivante :

Voir Fudenberg et Tirole (1991), Game Theory. The MIT press, Cambridge, Massachusetts. 1996. Page 4.

Prisonnier 1

Ne pas avouer
Avouer

Prisonnier 2
Ne pas avouer
-2 , -2
-1 , -8

Avouer
-8 , -1
-5 , -5

Figure 1.1

Nous pouvons maintenant donner une formulation plus gnrale de la forme normale d'un jeu.
La forme normale d'un jeu spcifie 1) les joueurs concerns par le jeu ; 2) les stratgies
disponibles pour chaque joueur et 3) le paiement reu par chaque joueur pour chaque
combinaison de stratgies pouvant tre choisies par les joueurs. Un jeu sous forme normale G
est donc la donne de trois lments :
-

Lensemble des n joueurs concerns. Un joueur quelconque est appel i et donc


i = 1, 2,K, n ;

Les ensembles Si des stratgies possibles de chacun des n joueurs. Une stratgie
du joueur i est si avec si Si . Les stratgies possibles si sont appeles stratgies
pures. Nous dfinirons plus loin la notion de stratgie mixte. Une issue
(s1 , s2 ,K, sn ) est une combinaison possible de stratgies des n joueurs ;

Le paiement (ou utilit) obtenu par le joueur i lorsque les n joueurs choisissent
l'issue (s1 , s2 ,K, s n ) est ui (s1 , s2 ,K, sn ) . On considre explicitement que le rsultat
obtenu par lagent i (utilit, profit, ) est fonction non seulement de sa propre
stratgie mais galement de lensemble des stratgies choisies par tous les autres
joueurs. Cette forme de l'utilit est l'expression de l'interaction stratgique. A
leffet de diffrencier entre la stratgie du joueur i et celle des autres joueurs, ui
peut scrire sous la forme suivante :

u i = u i ( s ) = u i ( s i , s i )
avec :

si = (s1 ,L, si 1 , si +1 ,L, s n )


si dsigne le sous-ensemble des stratgies choisies par les joueurs autres que le
joueur i.
Nous utiliserons donc la formulation suivante pour reprsenter un jeu statique sous forme
normale : G = [n ; {S i } ; {ui ()}] .
Remarquons que la forme normale est dfinie pour un jeu o les joueurs choisissent leur
stratgie simultanment. Mais ceci ne signifie pas ncessairement que les joueurs agissent en
mme temps. En fait, pour obtenir la forme normale (jeu simultan), il suffit que chaque
joueur choisisse sa stratgie en ignorant le choix des autres joueurs. Par exemple, dans le

10

modle du dilemme du prisonnier, comme les prisonniers n'ont pas la possibilit de


communiquer entre eux, il n'est pas obligatoire qu'ils prennent leur dcision simultanment.

1.2.

Lquilibre en stratgies dominantes

On tudie ici un type de jeu sous forme normale o l'quilibre est aisment prvisible. Le
concept d'quilibre dvelopp pour cela est celui de l'quilibre en stratgies dominantes. La
solution d'un jeu est obtenue en se basant sur l'ide qu'un joueur rationnel ne choisit jamais
une stratgie strictement domine. Commenons par dfinir la notion de stratgie strictement
domine.2
Dfinition : Une stratgie si Si est une stratgie strictement domine pour le joueur i dans le
jeu G = [n ; {S i } ; {ui ()}] si pour tout si si on a ui (si , s i ) < ui (si , s i ) pour tout s i S i .
A titre illustratif, considrons la forme normale (stratgique) du jeu reprsente par la matrice
des paiements suivante :

Joueur 2

Joueur 1

B1

B2

B3

A1

10 , 10

4,9

4 , 11

A2

5,6

8,3

3,4

A3

4,0

8,1

5,3

Figure 1.2

Cette matrice des paiements indique pour chacun des deux joueurs ( n = 2 ), lensemble des
stratgies possibles et qui sont S1 = {A1 , A2 , A3 } et S 2 = {B1 , B2 , B3 }. Au niveau de chaque
cellule de la matrice, le nombre de gauche reprsente lutilit du joueur 1 et le nombre de
droite lutilit du joueur 2. Il sagit maintenant de dterminer quel pourrait tre lquilibre
prvisible de ce jeu, cest dire le choix simultan de stratgies par les deux joueurs, sachant
que chaque joueur agit de faon rationnelle (maximise son utilit) et prend en considration le
choix de lautre joueur.

Dans le jeu de la figure 1.2, cet quilibre est aisment prvisible. Lquilibre peut ici tre
obtenu par limination successive des stratgies strictement domines. On remarque en effet,
que la stratgie B3 procure au joueur 2 un plus grand paiement que la stratgie B2 et ce,
quelle que soit la stratgie choisie par le joueur 1. On dit dans ce cas que la stratgie B2 est
strictement domine par la stratgie B3 . Un joueur rationnel ne choisira jamais de jouer la
stratgie B2 . La stratgie B2 peut donc tre limine et le jeu devient comme suit :

Gibbons, R. (1992). A Primer in Game Theory. Harvester Wheatsheaf, 1992. Page 4

11

Joueur 2

Joueur 1

B1

B3

A1

10 , 10

4 , 11

A2

5,6

3,4

A3

4,0

5,3

Figure 1.3

Notons que c'est le joueur 2 qui a limin la stratgie B2 . Mais comme le joueur 1 sait que le
joueur 2 est rationnel, il sait que le joueur 2 a limin la stratgie B2 . De plus, le joueur 2 sait
que le joueur 1 sait qu'il a limin la stratgie B2 , Cette structure d'information, appele
connaissance commune, permet de passer de la forme normale reprsente dans la figure 1.2
la forme normale reprsente dans la figure 1.3 et cela pour les deux joueurs.
Le mme type de raisonnement montre qu' partir de la matrice des paiements rduite de la
figure 1.3, le joueur 1 ne peut choisir la stratgie A2 car celle-ci est strictement domine par
la stratgie A1 . Aprs limination de la stratgie strictement domine A2 , le jeu se simplifie
encore comme suit :
Joueur 2
Joueur 1

B1

B3

A1

10 , 10

4 , 11

A3

4,0

5,3

Figure 1.4

Ici galement, l'limination de la stratgie strictement domine A2 est une information


commune aux deux joueurs. Lexamen de la matrice des paiements de la figure 1.4 montre
que pour le joueur 2, la stratgie B1 est strictement domine par la stratgie B3 . Sachant que
la stratgie B1 est limine par le joueur 2, la meilleure rponse du joueur 1 est de choisir la
stratgie A3 . Ainsi, l'issue finale du jeu est ( A3 , B3 ) et les joueurs 1 et 2 reoivent un paiement
(utilit) gal respectivement 5 et 3.
L'issue ( A3 , B3 ) est appele quilibre en stratgies strictement dominantes. L'utilisation de la
notion d'quilibre est ici motive par le fait qu'aucun joueur nest incit dvier de faon
unilatrale vers une autre stratgie.3 Si par exemple le joueur 1 dcidait de faon unilatrale
de jouer la stratgie A1 ou la stratgie A2 , il obtiendrait un paiement de 4 ou de 3, infrieurs
au paiement de 5.
On remarque que lissue (lquilibre) du jeu procure un paiement total de 8 qui est bien
infrieur au gain total procur par lissue ( A1 , B1 ) par exemple, soit 20. En dautres termes,
3

Gibbons, R. (1992). A Primer in Game Theory. Harvester Wheatsheaf, 1992. Page 4.

12

lquilibre du jeu de la figure 1.2 nest pas ncessairement un quilibre de Pareto.4 Lune des
raisons est quil sagit dun jeu non coopratif, c'est--dire d'un jeu sans autre possibilit de
paiement entre les joueurs. Les seuls paiements du jeu sont ceux indiqus dans la matrice des
paiements.
Le modle du dilemme du prisonnier est un exemple classique o la solution du jeu s'obtient
par limination successive des stratgies strictement domines. Dans ce modle, l'issue
(avouer, avouer) est un quilibre en stratgies strictement dominantes et chaque prisonnier se
voit infliger une peine de 5 ans de prison. En agrgeant les paiements, on remarque que c'est
la solution la plus mauvaise collectivement. Ainsi, par dilemme du prisonnier, on entend une
situation de jeu o l'quilibre du jeu est un quilibre en stratgies dominantes et o le gain
total ne correspond pas un optimum de Pareto.
Le modle du dilemme du prisonnier a plusieurs applications, comme par exemple le
problme du free rider. Nous prsentons ci-dessous une version du modle du dilemme du
prisonnier dans le domaine social, la version traitant du problme du risque moral. Nous
considrons la situation de 2 individus i = 1, 2 faisant partie de la mme quipe.5 Le rsultat
final obtenu par l'quipe dpend de la contribution de chaque joueur i qui peut soit travailler (
si = 1 ) soit tricher ( si = 0 ). Le produit total du groupe est gal 4(s1 + s2 ) et est partag de
faon gale entre les 2 joueurs. Chaque membre du groupe supporte un cot de 3 lorsqu'il
fournit l'effort de travailler et de 0 lorsqu'il triche. La matrice des paiements de ce jeu se
prsente ainsi :

Joueur 1

Joueur 2
Travailler
Travailler
1,1
Tricher
2 , -1

Tricher
-1 , 2
0,0

Figure 1.5

Pour chacun des deux joueurs, la stratgie "travailler" est strictement domine par la stratgie
"tricher". Cet exemple illustre bien la problmatique qui ressort du modle du dilemme du
prisonnier. En effet, le profil de stratgie (travailler, travailler) domine, au sens de Pareto, le
profil de stratgies (tricher, tricher). Mais, il ne constitue pas l'quilibre du jeu.
Cet exemple fait ressortir le cot social qui pourrait apparatre lorsque la rmunration est
faiblement relie leffort. Relevons que cet quilibre peut se modifier si par exemple, le cot
de leffort tait moindre. Ceci pourrait expliquer que dans les socits vnrant ou glorifiant
leffort, lquilibre soit (travailler, travailler).6

Rappelons quun tat de lconomie reprsente un quilibre de Pareto sil nest pas possible damliorer le
bien-tre dun agent conomique sans dtriorer celui dau moins un autre agent conomique.
5
Exemple emprunt Mas-Colell, Whinston & Green (1995). Page 235.
6
Pour sen convaincre, il suffit de reprendre le mme exemple en posant que le cot de leffort est de 1. Dans ce
cas, (Travailler, Travailler) est un quilibre en stratgies strictement dominantes.

13

1.3.

L'quilibre de Nash en stratgies pures

Les jeux admettant un quilibre en stratgies strictement dominantes ne constituent pas le cas
gnral. Cest le cas par exemple du jeu sous forme normale suivant pour lequel on peut
vrifier qu'il nexiste pas d'quilibre en stratgies strictement dominantes :
Joueur 2

Joueur 1

B1

B2

B3

A1

6,7

9,6

0,6

A2

5,2

8,2

4,5

A3

7,7

7,8

0,9

Figure 1.6

Pour caractriser lissue de ce jeu, un nouveau concept dquilibre a t propos en 1950 par
J.F. Nash, dfini comme suit :7

Dfinition : Lissue en stratgies pures s * = s1* ,K, s n* est un quilibre de Nash si pour tout
joueur i et pour toute stratgie si S i , nous avons :

ui ( si* , s * i ) ui ( si , s * i )
En dautres termes, lquilibre de Nash est une issue o simultanment le joueur i choisit la
meilleure stratgie compte tenu du meilleur choix du joueur j et le joueur j choisit la meilleure
stratgie compte tenu du meilleur choix du joueur i. La diffrence entre lquilibre en
stratgies dominantes et lquilibre de Nash est donc la suivante : dans lquilibre en
stratgies dominantes, le choix du joueur i est optimal pour tout choix du joueur j, alors que
dans lquilibre de Nash, le choix de i est optimal pour (seulement) tout choix optimal de j.
Comme pour lquilibre en stratgies dominantes, lquilibre de Nash est stable car cest une
issue o aucun joueur nest incit dvier de faon unilatrale.
Pour trouver lquilibre de Nash, il faut dterminer pour chacun des deux joueurs sa (ses)
meilleure(s) rponse(s) chaque stratgie de lautre joueur. Ainsi, pour le joueur 1, on a :
Laction A3 est sa meilleure rponse si le joueur 2 choisit B1 ;
Laction A1 est sa meilleure rponse si le joueur 2 choisit B2 ;
Laction A2 est sa meilleure rponse si le joueur 2 choisit B3 .
En utilisant le concept de fonction de meilleure rponse bi () , on a pour le joueur 1,

A3 = b1 (B1 ) , A1 = b1 (B2 ) et A2 = b1 (B3 ) .

Nash, J. F. (1950). Equilibrium points in n-person games. Proceedings of the National Academy of sciences 36:
48-49.

14

Pour le joueur 2, on :
Laction B1 est sa meilleure rponse si le joueur 1 choisit A1 ;
Laction B3 est sa meilleure rponse si le joueur 1 choisit A2 ;
Laction B3 est sa meilleure rponse si le joueur 1 choisit A3 .
En utilisant le concept de fonction de meilleure rponse bi () , on a pour le joueur 2,

B1 = b2 ( A1 ) , B3 = b2 ( A2 ) et B3 = b2 ( A3 ) .

Les fonctions de meilleure rponse montrent quon A2 = b1 (B3 ) et B3 = b2 ( A2 ) . Ainsi, le jeu


de la figure 1.6 admet un quilibre de Nash et est lissue ( A2 , B3 ) . Cette issue est un quilibre
de Nash car, de faon simultane :
- La stratgie A2 est la meilleure rponse du joueur 1 si le joueur 2 choisit la stratgie
B3 ;

La stratgie B3 est la meilleure rponse du joueur 2 si le joueur 1 choisit la stratgie

A2 .
Lquilibre de Nash est un concept important dans lanalyse conomique des interactions
stratgiques entre agents conomiques. Ce concept dquilibre appelle cependant un certain
nombre de remarques, notamment concernant :8
- La possibilit dinexistence dun quilibre de Nash en stratgies pures (mais non en
stratgies mixtes).
- La possibilit dexistence de plusieurs quilibres de Nash.
Remarques : On peut montrer que :9
Dans un jeu sous forme normale, si le processus d'limination itrative des
stratgies strictement domines limine toutes les stratgies, sauf l'issue

s * = s1* ,K, s n* , alors cette issue est l'unique quilibre de Nash ;


-

Dans un jeu sous forme normale, si l'issue s * = s1* ,K, s n* est un quilibre de Nash,
alors cette issue survivra au processus d'limination des stratgies strictement
domines.

Parmi les motivations proposes pour justifier la dfinition de l'quilibre de Nash, supposons
qu'avant de jouer, les joueurs tentent de et arrivent harmoniser leur stratgie. Ainsi, chacun
des joueurs s'engage raliser une action donne. Cela peut tre par exemple la clarification
de l'apport de chaque actionnaire la cration en commun d'une entreprise. Tous les
paiements issus de cette activit commune sont dcrits dans la matrice des paiements. En
particulier, si l'un des joueurs venait ne pas respecter son engagement, aucune pnalit
supplmentaire n'existe. Pour que cet engagement soit crdible, il est ncessaire qu'aucun des
joueurs ne puisse, en changeant unilatralement de stratgie, augmenter son niveau d'utilit.
Dans ces conditions, il est possible de prdire la solution du jeu. Une telle prdiction est dite
stratgiquement stable ou auto-impose (Self enforcing agreement) et est prcisment un
quilibre de Nash.
8
9

Ces points seront abords ultrieurement.


Voir par exemple Gibbons R (1992). Page 12.

15

On peut galement motiver l'quilibre de Nash en se servant de l'ide de convention sociale


stable. Si une convention doit tre dfinie ou merger dans une communaut ou socit, le
comportement des membres de cette socit doit constituer un quilibre de Nash. Autrement,
au moins un des membres de la communaut sera incit dvier de la convention, ce qui
remet en cause la stabilit de cette convention. Le processus d'mergence d'une telle
convention stable n'est pas ais dcrire. Mais si une telle convention sociale stable devait
exister, elle doit tre un quilibre de Nash.

1.4.

L'quilibre de Nash en stratgies mixtes

1.4.1. La notion de stratgie mixte


Certains jeux peuvent n'admettre aucun quilibre de Nash en stratgies pures. Le jeu intitul
Apparier les sous en est un exemple clbre.10 Ce jeu consiste pour les deux joueurs
annoncer simultanment Pile (P) ou Face (F). Si les deux joueurs font une annonce identique
(resp. diffrente), le joueur 1 obtient une utilit de 1 (resp. 1) et le joueur 2 une utilit de 1
(resp. 1). La matrice des paiements de ce jeu se prsente donc comme suit :

Joueur 1

Pile (P)
Face (F)

Joueur 2
Pile (P)
1 ; -1
-1 ; 1

Face (F)
-1 ; 1
1 ; -1

Figure 1.7

Ce jeu, qui est un jeu somme nulle, nadmet aucun quilibre de Nash en stratgies pures. En
effet, pour des annonces identiques, le joueur 2 est incit dvier. De mme, si les deux
annonces sont diffrentes, c'est le joueur 1 qui est incit dvier.
Une caractristique de ce type de jeu est que d'une part chaque joueur va tenter de deviner la
stratgie adopte par l'autre joueur et d'autre part, de bluffer afin de perturber l'autre joueur.
En raison de l'incertitude concernant la stratgie de chaque joueur, l'quilibre (en stratgie
pure) ne peut tre dtermin. Le tir au but (penalty) dans un match de football est une
situation similaire celle du jeu Apparier les sous . En effet, les spcialistes de cette
discipline sportive soutiennent que le gardien de but et le tireur choisissent chacun,
indpendamment l'un de l'autre, une direction pour plonger pour le premier et pour tirer pour
le second. La situation favorable (sans pour autant que l'issue ne soit certaine) au gardien de
but est celle o les deux joueurs choisissent la mme direction. Par contre, la situation
favorable pour le tireur au but est celle o les deux directions sont opposes.11
Dans une telle situation, chaque joueur adopte une stratgie mixte, c'est--dire une stratgie
consistant affecter une probabilit pour chacune des stratgies si de S i . Dans l'exemple de
Apparier les sous , une stratgie mixte est la distribution de probabilit ( 1 , 2 ) avec

10

Jeu connu sous le nom de Matching Pennies.


On montre que la stratgie mixte peut tre interprte comme l'incertitude d'un joueur sur le choix de l'autre
joueur (J. Harsanyi (1995)).

11

16

0 i 1 o 1 est la probabilit de choisir pile et 2 la probabilit de choisir face par le


joueur i.
Comme il ressortira plus bas, le jeu Apparier les sous admet un quilibre de Nash en
stratgies mixtes. Le thorme de Nash montre que dans un jeu o les ensembles de stratgies
sont finis, il existe toujours un quilibre en stratgies mixtes.
Dfinition : Soit S i lensemble fini des stratgies pures du joueur i. Une stratgie mixte du
joueur i est une distribution de probabilit i : S i [0, 1] assignant chaque stratgie pure

si S i une probabilit dtre choisie i (s i ) avec

i (si ) = 1 .

si S i

Supposons que le joueur i possde K stratgies pures, c'est--dire S i = {si1 , si 2 ,L, siK }. On
notera par (S i ) , lensemble des stratgies mixtes possibles du joueur i. On a donc :

(S i ) = ( i1 , L , iK ) R K / ik = 1 et 0 ik 1 pour k = 1, L , K
k

Par exemple pour K = 3 , l'ensemble des stratgies mixtes (S i ) est reprsent par les points
d'un triangle quilatral de hauteur 1, comme le montre la figure 1.8 :12

si1

i2
i3
i
i1
si 2

si 3
Figure 1.8

12

Rappelons que dans un triangle quilatral, la somme des perpendiculaires de n'importe quel point intrieur ou
frontire vers les cts opposs est gale la hauteur du triangle. Pour un nombre de stratgies K = 3, si on
choisit un triangle quilatral avec une hauteur gale 1, on peut reprsenter une stratgie mixte par un point
l'intrieur de ce triangle, puisque dans ce cas on a ik = 1 .
k

17
Remarque : Une stratgie pure est un cas particulier de stratgie mixte. Soit Si = (si1,L, siK )
l'ensemble des stratgies pures du joueur i. La stratgie pure si1 est alors la stratgie mixte

(1,0,K,0) , , la stratgie pure siK

est la stratgie mixte (0,0,K,1) .

Lorsqu'on introduit les stratgies mixtes, le calcul du paiement prend la forme de l'esprance
de paiement. Pour illustrer ce mode de calcul, considrons par exemple le jeu suivant :

Joueur 1

U
M
D

Joueur 2
L
M
4,3
5,1
2,1
8,4
3,0
9,6

R
6,2
3,6
2,5

Figure 1.9

1 1 1
Le paiement des joueurs 1 et 2 pour, par exemple, les profils de stratgies 1 = , , et
3 3 3
1 1
2 = 0, , sont :
2 2
1
1
1
1 1
1
1
1
11
1
u1 ( 1 , 2 ) = 0 4 + 5 + 6 + 0 2 + 8 + 3 + 0 3 + 9 + 2 =
3
2
2
2
2 3
2
2
2
3
11
1
1 11
1
1 24
u 2 ( 1 , 2 ) = 1 + 4 + 6 + 2 + 6 + 5 =
= 4.
23
3
3 23
3
3 6

On peut galement pour un joueur quelconque, dterminer le paiement procur par une
stratgie pure donne, tant donn que l'autre joueur adopte une stratgie mixte donne. Par
1 1 1
exemple, si le joueur 1 choisit la stratgie mixte 1 = , , , l'utilit pour le joueur 2 en
3 3 3
retenant la stratgie M est :
1 1 11
1
u 2 (M , 1 ) = 1 + 4 + 6 =
3
3 3
3

Pour donner une expression plus formelle de l'esprance de paiement lorsque les joueurs
adoptent des stratgies mixtes, considrons le jeu sous forme normale dcrit dans la matrice
des paiements suivante :

18

Joueur 2

Joueur 1

1 (s11 )

s11

1 (s1 )

s1

1 (s1J )

s1J

2 (s21 )

2 (s 2 )

2 (s 2 K )

s21

s2

s2 K

(s11 , s21 )

s = (s1 , s 2 )

Figure 1. 10

Dans un jeu sous forme normale, c'est--dire un jeu o le choix des stratgies s'effectue de
faon simultan, le choix d'une stratgie mixte par un joueur se fait indpendamment du choix
des autres joueurs. En consquence, la probabilit (s ) d'une issue quelconque s = (s1 ,L sn ) ,
est le produit de probabilits suivant :

(s ) = (s1 , L , sn ) = 1 (s1 ) L n (sn ) = i (si )


i

Le niveau d'utilit du joueur 1 associ une issue en stratgies mixtes = ( 1 , 2 ) est une
esprance d'utilit et est donc dtermin comme suit :

u1 ( ) = u1 ( 1 , 2 ) = 1 (s11 )[ 2 (s 21 )u1 (s11 , s 21 ) + L + 2 (s 2 k )u1 (s11 , s 2 K )]


+L
+ 1 (s1J )[ 2 (s 21 )u1 (s1J , s 21 ) + L + 2 (s 2 k )u1 (s1J , s 2 K )]
u1 ( ) = 1 (s11 ) 2 (s2 ) u1 (s11 , s2 ) + L + 1 (s1J ) 2 (s2 ) u1 (s1J , s2 )
s2S 2

s2S 2

u1 ( ) = 1 (s11 )u1 (s11 , 2 ) + L + 1 (s1J )u1 (s1J , 2 )


u1 ( ) =

1 (s1 ) u1 (s1 , 2 )

s1S1

D'une faon gnrale, en remplaant le joueur 1 par le joueur i et le joueur 2 par le joueur i,
on obtient, sachant que = ( i , i ) :
ui ( ) =

i (s i ) u i ( s i , i )

si Si

Les fonctions ui sont continues car elles sont polynomiales. De mme, elles sont linaires par

rapport i (si ) . L'utilit ui ( ) peut s'crire autrement. En effet,

19

u1 ( ) = 1 (s11 ) 2 (s21 )u1 (s11 , s21 ) + L + 1 (s1J ) 2 (s2 k )u1 (s1J , s2 K ) = (s )u1 (s )
sS

Ce qui donne d'une faon gnrale, en remplaant 1 par i :

ui ( ) = (s )ui (s )
sS

Avec S = S1 L Sn .
Remarque : La relation de dominance tudie dans le cas des stratgies pures peut tre
tendue au cas des stratgies mixtes. Ainsi, la stratgie pure si est strictement domine pour
le joueur i s'il existe une stratgie mixte i telle que :

ui ( i , si ) > ui (si , si ) pour tout si S i


Cette remarque signifie qu'une stratgie non strictement domine en stratgies pures peut le
devenir lorsqu'on introduit la possibilit de stratgie mixte. Pour montrer cela, considrons
l'exemple suivant qui ne fait ressortir que les paiements du joueur 1:

Joueur 1

U
M
D

Joueur 2
L
2,
0,
-1 ,

R
-1 ,
0,
2,

Figure 1.11

La stratgie M du joueur 1 n'est domine ni par la stratgie pure U ni par la stratgie pure D.
Mais, si le joueur 1 affecte la probabilit U et D, alors il obtient de cette stratgie
mixte une utilit espre gal :
1 1
1
- 2 + ( 1) = si le joueur 2 joue L ;
2 2
2
1 1
1
- ( 1) + 2 = si le joueur 2 joue R.
2 2
2
Donc, quelque soit la stratgie du joueur 2, la stratgie M procurera au joueur 1 une utilit
moindre. Pour le joueur 1, la stratgie pure M est donc strictement domine par la stratgie
1 1
mixte = , .
2 2

1.4.2. Dtermination de l'quilibre de Nash en stratgies mixtes


Lextension de lespace des stratgies leffet dinclure les stratgies mixtes entrane
lextension de la dfinition de lquilibre de Nash qui devient :

20
Dfinition : Lissue en stratgies mixtes * = ( 1* , L , n* ) est un quilibre de Nash si pour

tout joueur i = 1, L, n et pour toute stratgie mixte i (S i ) , on a :

ui ( i* , * i ) ui ( i , * i )
Pour montrer comment obtenir un quilibre de Nash en stratgies mixtes, considrons le jeu
Apparier les sous (qui, rappelons-le, n'a pas d'quilibre en stratgies pures) et soit
maintenant (r , 1 r ) la stratgie mixte du joueur 1 avec r reprsentant la probabilit que le
joueur 1 joue Pile et 1 r la probabilit que le joueur 1 joue Face et soit (q, 1 q ) la stratgie
mixte du joueur 2 avec q reprsentant la probabilit que le joueur 2 joue Pile et 1 q la
probabilit que le joueur 2 joue Face.

2
1
Joueur 1

1 r

Pile (P)
Face (F)

Joueur 2
q
Pile (P)
1 ; -1
-1 ; 1

1 q

Face (F)
-1 ; 1
1 ; -1

Figure 1.12

L'quilibre de Nash est obtenu lorsque pour chacun des joueurs, la stratgie choisie est une
meilleure rponse aux meilleurs choix des autres joueurs. Pour cela, la recherche de l'quilibre
de Nash commence par la dtermination de la fonction (ou correspondance) de meilleure
rponse de chaque joueur.13
Commenons par dterminer la correspondance r (q ) du joueur 1 pour que sa stratgie mixte
1 = (r , 1 r ) soit la meilleure rponse la stratgie mixte 2 = (q, 1 q) du joueur 2.14 Le
paiement espr du joueur 1 en adoptant la stratgie mixte (r , 1 r ) tant donn que le joueur
2 adopte la stratgie mixte (q, 1 q ) est :

u1 ( 1 , 2 ) = rq(+ 1) + r (1 q )( 1) + (1 r )q( 1) + (1 r )(1 q )(+ 1) = (1 2q ) + r (4q 2)


On remarque que le paiement espr du joueur 1 tant donn que le joueur 2 joue la stratgie
mixte (q, 1 q ) est croissant par rapport r si (4q 2) > 0 et dcroissant par rapport r si
(4q 2) < 0 . En d'autres termes, si q > 1 , le paiement espr du joueur 1 est son maximum
2
lorsque la probabilit r prend sa valeur maximale. Dans ce cas, nous avons donc r = 1 , c'est1
-dire que le joueur 1 choisit Pile. De mme si q < , nous avons r = 0 , c'est--dire que le
2
La relation y = f (x ) est une fonction lorsque chaque valeur de x est associe au plus une valeur de y. Elle
est appele correspondance lorsque chaque valeur de x peuvent tre associes plusieurs valeurs de y.
14
Dans ce modle, pour dsigner r (q ) et q (r ) , nous parlons de correspondance de meilleure rponse, car une
valeur de q ou de r peut correspondre plusieurs valeurs r (q ) ou de q (r ) . Nous verrons plus loin que dans le cas
du modle de Cournot, nous parlerons de fonction de meilleure rponse.
13

21

1
, le paiement espr du joueur 1 est indpendant de la
2
valeur de r. Le joueur 1 est donc indiffrent entre Pile et Face. Dans ce cas, la stratgie mixte
(r, 1 r ) est la meilleure rponse la stratgie mixte (q, 1 q) pour toutes les valeurs de r
1
comprises entre 0 et 1 incluses. Notons que pour q = , r (q ) prend plus d'une valeur. On dira
2
dans ce cas que r (q ) est une correspondance de meilleure rponse. La correspondance de
meilleure rponse r (q ) du joueur 1 est donc de la forme suivante :

joueur 1 choisit Face. Lorsque q =

1
si
q
>

1
r (q ) = [0,1] si q =
2

1
0
si q <

Sa reprsentation graphique est donne la figure 1.13.


r

r (q )

(Pile) 1

(Face) 0
0
(Face)

Figure 1.13

1
(Pile)

Aprs avoir obtenu r (q ) , la correspondance de meilleure rponse du joueur 1, il faut


dterminer q(r ) , la correspondance de meilleure rponse du joueur 2. La correspondance
q(r ) est dtermine de telle sorte que la stratgie mixte (q, 1 q ) du joueur 2 soit sa meilleure
rponse la stratgie mixte (r , 1 r ) du joueur 1. Le paiement espr du joueur 2 en adoptant
la stratgie mixte (q, 1 q ) tant donn que le joueur 1 adopte la stratgie mixte (r , 1 r ) est :

u 2 ( 1 , 2 ) = qr( 1) + q(1 r )(+ 1) + (1 q )r (+ 1) + (1 q )(1 r )( 1) = (2r 1) + q(2 4r )


En utilisant la mme dmarche que celle utilise pour le joueur 1, on obtient la
correspondance de meilleure rponse q(r ) du joueur 2.

22

1 si r < 2

1
q (r ) = [0,1] si r =
2

1
0
si r >

La figure 1.14 donne la reprsentation graphique de la correspondance de meilleure rponse


q(r ) . La figure 1.15 est obtenue aprs avoir appliqu une rotation la figure 1.14.

q(r )

q(r )

(Pile) 1

(Pile) 1
1/2

(Face) 0

(Face) 0
0
(Face)

Figure 1.14

1 r
(Pile)

0
(Face)

1
(Pile)

Figure 1.15

En combinant les figures 1.13 et 1.15, on obtient la figure suivante:


r

r (q )

(Pile) 1

Equilibre de Nash
1/2

q(r )

(Face) 0
0
(Face)

1
(Pile)

Figure 1.16

( )

( )

L'quilibre de Nash est obtenu lorsqu'on a simultanment r * = r q * et q * = q r * . Il est donc


reprsent par le point d'intersection des courbes r (q ) et q(r ) de la figure 1.16.

23

La dtermination de l'quilibre de Nash en stratgies mixtes devient plus aise si on note qu'
cet quilibre, chaque joueur est indiffrent entre ses diffrentes stratgies pures tant donne
la stratgie mixte des autres joueurs. En d'autres termes, l'quilibre de Nash en stratgies
mixtes, les stratgies pures entrant avec une probabilit non nulle dans la stratgie mixte de
chacun des joueurs procurent la mme esprance de paiement tant donne la stratgie mixte
des autres joueurs.
Pour comprendre cette proprit de l'quilibre de Nash en stratgies mixtes, reprenons le jeu
Apparier les sous et supposons que le joueur 1 affecte une probabilit faible (disons 1%)
que le joueur 2 joue Pile. Dans ce cas, le joueur 1 obtient une esprance de paiement gale
0,01 1 + 0,99 1 = 0,98 en jouant Pile et une esprance de paiement gale
0,01 1 + 0,99 1 = 0,98 en jouant Face. Dans ce cas, pour q = 1% , aucune stratgie mixte
ne peut exister pour le joueur 1 car ce dernier peut toujours augmenter strictement son
esprance de paiement en jouant la stratgie pure Face. Le mme raisonnement s'applique si
le joueur 1 affecte une probabilit leve (disons 99%) que le joueur 2 joue Pile.
Dans le jeu Apparier les sous , pour qu'une stratgie mixte puisse exister pour le joueur 1,
il faut que la stratgie mixte du joueur 2 soit telle que le joueur 1 soit indiffrent entre jouer
Pile ou jouer Face. Ainsi, pour trouver l'quilibre de Nash en stratgies mixtes du jeu, on doit
avoir pour chaque joueur l'galit des paiements esprs des stratgies pures entrant avec
probabilit strictement positive dans sa stratgie mixte tant donne la stratgie mixte des
autres joueurs. Pour le joueur 1, cette proprit implique que :

u1 (Pile, 2 ) = u1 (Face, 2 )
q(+ 1) + (1 q )( 1) = q( 1) + (1 q )(+ 1)
1
1
. La mme dmarche applique au joueur 2 donne r = . L'quilibre de
2
2
1 1
Nash en stratgies mixtes du jeu est donc = ( 1 , 2 ) avec 1 = (r , 1 r ) = ; et
2 2
1 1
2 = (q, 1 q ) = ; . L'expression rigoureuse de cette proprit est donne par la
2 2
proposition suivante :

Ceci donne q =

Proprit : Soit S i+ S i l'ensemble des stratgies pures que le joueur i joue avec une

probabilit strictement positive dans le profil de stratgies mixtes = ( 1 ,L, n ) . Le profil


de stratgies mixtes est un quilibre de Nash si et seulement si :
i) ui (si , i ) = ui (si, i ) pour tout s i , s i S i+ et pour tout joueur i ;
ii) ui (si , i ) ui (si, i ) pour tout si S i+ et pour tout si S i+ et pour tout joueur i.
En d'autres termes, le profil de stratgies mixte est un quilibre de Nash sous les deux
conditions ncessaires et suffisantes suivantes : i) chacun des joueurs est indiffrent entre les
stratgies pures joues avec probabilit strictement positive tant donnes la stratgie mixte
des autres joueurs ; ii) pour aucun joueur, les stratgies pures non incluses dans la stratgie
mixte ne doivent procurer une esprance de paiement suprieure l'esprance de paiement

24

des stratgies pures incluses dans la stratgie mixte tant donnes la stratgie mixte des autres
joueurs.15
Corollaire : Si pour le joueur 1, une stratgie pure s1 est strictement domine par une
stratgie mixte 1 , alors cette stratgie pure n'est jamais choisie dans un quilibre de Nash en
stratgies mixtes. En d'autres termes, si u1 (s1 , 2 ) < u1 ( 1 , 2 ) pour tout 2 , alors 1 (s1 ) = 0

dans l'quilibre de Nash 1* , 2* . Sinon, le joueur peut toujours augmenter son utilit en
changeant une stratgie strictement domine par l'une des stratgies la dominant. Ce
changement, lorsqu'il est possible, est une dviation profitable pour le joueur, ce qui contredit
la dfinition de l'quilibre de Nash. Ceci implique qu'un quilibre de Nash en stratgies
mixtes doit assigner une probabilit strictement positive aux stratgies non strictement
domines.
Ce corollaire gnralise le rsultat concernant l'limination des stratgies strictement
domines. En effet, de par cette proprit, on dfinit une stratgie pure domine non
seulement par rapport aux autres stratgies pures, mais galement par rapport aux stratgies
mixtes.

1.5.

Lquilibre de Nash avec mains tremblantes

Soit un jeu sous forme normale G = [n, {S i }, {ui ()}] ayant le profil de stratgies

) (

s * = s1* , L , s n* = s1* , s *i comme quilibre de Nash.16 Lide la base de lquilibre de Nash


en mains tremblantes est quon considre quil existe toujours la possibilit ayant une trs
petite et strictement positive probabilit i (si ) , que le joueur i commette lerreur de retenir

une stratgie si diffrente de la stratgie optimale s i* . La question est alors de savoir si, tant
donne cette possibilit derreur pour tout joueur i et pour tout si Si , la meilleure rponse
des autres joueurs est toujours s* i . Il sagit en dautres termes, de savoir si lquilibre de Nash

s * est robuste la possibilit derreur i (si ) pour tout i et pour tout si Si . Cette
problmatique a donn lieu au concept de lquilibre de Nash en mains tremblantes.17

Il sagit dun raffinement de lquilibre de Nash introduit par Selten (1975) pour tenir compte
de la possibilit toujours prsente derreur de la part des joueurs.18 Ce critre de perfection
permet ainsi dcarter certains quilibres de Nash non dsirables , comme par exemple les
quilibres de Nash dans lesquels les joueurs jouent des stratgies faiblement domines. Un
quilibre de Nash est donc considr comme une prdiction raisonnable sil demeure un
quilibre de Nash mme en prsence de la possibilit (trs petite) derreur de la part des
joueurs.

15

Voir dmonstration dans Mas-Colell, Whinston and Green (1995), page 250.
Cette dmarche peut tre tendue lquilibre en stratgies mixtes.
17
Selten, R (1975). Reexamination of the perfectness concept for equilibrium points in extensive games.
International Journal of Game Theory. Volume 4. Pages 25-35
18
En ralit, Selten a introduit ce critre pour la perfection des jeux dynamiques.
16

25

Pour montrer comment le critre de la main tremblante permet dcarter les quilibres de
Nash dans lesquels les joueurs jouent des stratgies faiblement domines, considrons le jeu
sous forme normale reprsent par la matrice des paiements suivante :
Joueur 2

Joueur 1

2,2

1,-3

-3 , 1

1,1

Figure 1.17

Ce jeu admet deux quilibres de Nash : (U, L) et (D, R ) . On remarque cependant que
lquilibre de Nash (D, R ) consiste pour chaque joueur choisir une action faiblement
domine.19 Bien que le concept de lquilibre de Nash nlimine pas les stratgies faiblement
domines, le choix dune telle stratgie nest cependant pas toujours dsirable. En effet,
comme le montre le jeu ci-dessus, pour choisir la stratgie D, le joueur 1 doit tre certain que
le joueur 2 choisira laction R. Le mme raisonnement sapplique au joueur 2. Or, comme
dans ce jeu il existe deux quilibres de Nash, le choix de R par le joueur 2 nest pas certain.
Le joueur 1 ne devrait par consquent pas choisir laction D. Il en est de mme du joueur 2
pour laction R. En dautres termes, le concept de lquilibre de Nash nest pas suffisant pour
carter un profil de stratgies consistant pour les joueurs choisir une action faiblement
domine.
Pour carter ce type dquilibre, on peut se rfrer au raffinement de lquilibre de Nash
propos par Selten (1975). Ce raffinement vise ne slectionner que lquilibre de Nash qui
soit robuste la possibilit que les joueurs commettent une erreur avec une trs faible
probabilit. Un quilibre de Nash satisfaisant ce test de robustesse est appel quilibre de
Nash avec mains tremblantes .
Pour montrer comment ce raffinement permet dliminer lquilibre (D, R ) , considrons la
possibilit que le joueur 2, au moment de choisir laction R, commette une erreur et retient
1
qui peut devenir aussi petite que lon
laction L. Cette possibilit a une probabilit de
n
souhaite, simplement en donnant n une valeur suffisamment grande.
Dans ce cas, en jouant D, le joueur 1 obtient une esprance de paiement gale
1
4
1
et en jouant U, il obtient une esprance de paiement gale
3 + 1 1 = 1
n
n
n
1
4
1
1
1
2 + 1 1 = 1 + . Comme 1 + > 1 , lintroduction de la possibilit derreur
n
n
n
n
n
implique que D nest plus une meilleure rponse du joueur 1 au choix de R par le joueur 2. Le
mme raisonnement implique que R nest plus une meilleure rponse du joueur 2 au choix de

19

Relevons galement que lquilibre de Nash (U , L ) domine lquilibre de Nash (D, R ) au sens de Pareto.

26
D par le joueur 1. En consquence, lquilibre de Nash (D, R ) nest pas un quilibre de Nash
avec mains tremblantes .
De la mme manire, on peut vrifier que lquilibre de Nash (U, L) satisfait ce test de
robustesse et constitue donc un quilibre de Nash avec mains tremblantes . Pour cela, on
doit montrer que simultanment :
U est la meilleure rponse du joueur 1 la stratgie compltement mixte
1
1 1
est la probabilit derreur que le joueur 2
1 , du joueur 2 o
n
n n
choisisse R.
L est la meilleure rponse du joueur 2 la stratgie compltement mixte
1
1 1
est la probabilit derreur que le joueur 1
1 , du joueur 1 o
n
n n
choisisse D.
1 1
Si le joueur 2 joue la stratgie totalement mixte 1 , , le joueur 1 obtient un paiement de
n n
1
1
1 1
1 1
21 + = 2 sil choisit U et de 31 + = 3 + 4 sil choisit D.
n
n
n n
n n

Pour n suffisamment grand, la meilleure rponse du joueur 1 est bien U car


u1 U , 2n > u1 D, 2n avec 2n reprsentant la stratgie totalement mixte du joueur 2 indice

sur n. La mme dmarche montre que u2 1n , L > u2 1n , R . On conclue donc que lquilibre
de Nash (U, L) est un quilibre de Nash avec mains tremblantes .20

1.6.

L'existence de l'quilibre de Nash

Bien que historiquement l'existence de l'quilibre de Nash ait t tablie par Nash en 1950, on
peut galement la considrer comme un corollaire au thorme d'existence de Debreu,
Glicksberg, Fan (1952). Ce dernier tablit des conditions suffisantes pour quexiste un
quilibre de Nash en stratgies pures.21
Thorme (Debreu (1952), Glicksberg (1952), Fan (1952)): Un quilibre de Nash existe
dans le jeu sous forme normale G = [n ; {S i } ; {ui ()}] si pour tout i = 1,..., n ,

i)

S i est un sous-ensemble non vide convexe et compact de l'espace Euclidien

ii)

Rm ;
22
u i (s1 ,..., s n ) est continue en (s1 ,..., s n ) et quasi-concave en s i .

1
= 0.
n
21
Pour la dmonstration, voir par exemple Mas-Colell, Whinston and Green (1995), page 260.
22
Un sous-ensemble X de R m est dit compact s'il est ferm et born. Un ensemble est dit ferm s'il contient sa
frontire. Un ensemble est dit born s'il peut tre contenu en totalit l'intrieur d'un cercle (ou d'une sphre) de
rayon appropri suffisamment grand. Une fonction f () est quasi-concave si et seulement si
20

Dans cet exemple, la probabilit derreur est une squence qui converge vers 0 car lim

27

La dmonstration de ce thorme se base sur le thorme du point fixe de Kakutani qui est
lui-mme une gnralisation du thorme du point fixe de Brouwer. En premier lieu, on
montre qu'un point fixe de la correspondance de meilleure rponse
b(s1 ,..., s n ) = b1 (s 1 ) ... bn (s n ) est un quilibre de Nash. En second lieu, on montre que la
correspondance de meilleure rponse doit avoir un point fixe.
Un point fixe est un point x X tel que f (x ) = x . Dans le cas o X = [ a , b ] R , l'existence
d'un point fixe est reprsente par la figure suivante :
b

f(x) = x

a
a

x
Figure 1.17

L'hypothse de continuit de la fonction f () est essentielle pour garantir l'existence d'un


point fixe. La continuit empche le graphe de la fonction f de "sauter par-dessus" la
diagonale qui est le lieu gomtrique des points satisfaisant l'galit f ( x ) = x . Comme le
montre la figure suivante, en cas de non continuit, la fonction f : S S peut ne pas avoir un
point fixe.
b

a
a
b
Fonction f non continue sur
[a, b] sans point fixe
(a)

Figure 1.18

a
b
Fonction f non continue sur
[a, b] avec point fixe
(b)

f ( x + (1 ) x ) Min { f (x ) , f (x )} . On remarque qu'une fonction concave est ncessairement quasiconcave, mais l'inverse n'est pas (toujours) vrai.

28

La figure 1.19.a montre, pour le cas de deux joueurs, quun quilibre de Nash est un point fixe
puisque, par exemple dans le cas dune fonction de meilleure rponse, on a, par construction,
s1* , s 2* = b s1* , b s 2* . Dans le cas dune correspondance de meilleures rponses (figure

) ( ( ) ( ))
1.19.b) , on a s b (s ) .
*

S2

S2

b(s ) = b1 (s 2 ) b2 (s1 )

s2 b2 (s1 )
s2 = b2 (s1 )

s b(s )

(s1 , s2 ) = (b1 (s2 ), b2 (s1 ))

s1 = b1 (s2 )

(a)

s1 b1 (s2 )

S1
Figure 1.19

S1

(b)

Le thorme de Debreu, Glicksberg et Fan (1952)) est dmontr sur la base du thorme de
Kakutani. Ce thorme permet son tour de dmontrer le thorme de Nash (1959).
Thorme de Nash (1950) : Soit G = [n ; {S i } ; {ui ()}] un jeu sous forme normale. Si n est fini

et si les ensembles S1 , ... , S n sont des ensembles finis, alors ce jeu admet un quilibre de
Nash en stratgies mixtes.

29

Chapitre 2 : Jeux simultans information complte, applications

Depuis son apparition, le concept de l'quilibre de Nash a donn lieu d'innombrables


applications tant en conomie que dans les autres domaines des sciences sociales. Nous
prsentons ci-dessous quelques-unes de ces applications afin de mettre en vidence l'apport
fondamental de ce concept dans la comprhension des phnomnes conomiques. Notons que
les modles de Cournot et de Bertrand sont apparus avant le concept de l'quilibre de Nash.23

2.1.

L'enchre au second prix

L'enchre au second prix, appele galement enchre de Vickrey, est un exemple clbre de
jeu dont l'issue est un quilibre en stratgies (non strictement) dominantes. Dans lenchre au
second prix, les offres (enchres) sont soumises sous pli cachet et lobjet est attribu
lenchrisseur qui propose loffre la plus leve. Le prix payer est gal la deuxime offre
la plus leve. Vickrey (1961) a montr que lenchre au second prix implique que la stratgie
dominante des acheteurs est lannonce de leur vraie valuation subjective.24 Lenchre au
second prix est de ce fait un mcanisme direct rvlateur.
Pour montrer cela, considrons lacheteur potentiel i ayant une valuation subjective vi pour
l'objet qui est donc sa disposition payer et annonant une enchre bi . Appelons ri le
maximum des enchres annonces par les acheteurs potentiels autres que i, cest dire :

ri = Max b j
j i

Pour l'enchrisseur i, la question pose est de savoir o positionner son enchre bi par rapport
sa disposition payer vi . Pour montrer que la stratgie consistant enchrir sa propre
disposition payer, c'est--dire bi = vi , est une stratgie (non strictement) dominante,
considrons les deux autres stratgies denchres possibles, soit bi > vi et bi < vi . Relevons
que ces deux dernires stratgies sont des dviations par rapport la stratgie bi = vi .
La premire stratgie possible, bi > vi , correspond au cas o lacheteur surenchrit par
rapport son valuation subjective de lobjet. On peut envisager trois sous cas. Si ri > bi ,
lobjet nest pas attribu lacheteur i qui obtient une utilit gale 0. Si ri < vi , lacheteur
obtient lobjet et une utilit positive gale vi ri . Dans ces deux sous cas, lacheteur i aurait
obtenu la mme utilit avec la stratgie d'enchre bi = vi . Si vi ri bi , lacheteur i obtient

23

Voir cependant la brve description historique de Osborne (2002) qui fait ressortir les diffrences existant
entre la formulation originelle de ces deux modles et le concept de l'quilibre de Nash.
24
Vichrey. W (1961). Counterspeculation, Auctions and Competitive Sealed Tenders. The Journal of Finance.
Vol. 16, March 1961. P 8-37.

30

lobjet et une utilit ngative ou nulle gale vi ri .25 En cas d'galit, soit bi = ri , le

gagnant est choisi par tirage alatoire et le gain espr est gale (vi ri ) / 2 . L'acheteur peut
toutefois viter cette perte en adoptant la stratgie d'enchre bi = vi . Ainsi, la stratgie
d'enchre bi = vi domine (non strictement) la stratgie d'enchre bi > vi .
La deuxime stratgie possible, bi < vi , correspond au cas o lacheteur i sous-enchrit par
rapport son valuation subjective de lobjet. La mme dmarche adopte au premier cas
montre que dans les deux sous cas o ri vi et ri bi , lacheteur i obtient la mme utilit en
adoptant la stratgie d'enchre bi = vi . Mais si bi < ri < vi , lacheteur i ne prend pas lobjet et
obtient une utilit gale 0. Mais dans ce troisime sous cas, lacheteur i peut gagner
l'enchre et obtenir une utilit positive s'il avait soumis une enchre bi = vi . Ainsi, la stratgie

bi = vi domine (non strictement) la stratgie d'enchre bi < vi .

2.2.

Le modle de duopole (concurrence imparfaite) de Cournot

Pour illustrer le concept de lquilibre de Nash dans la thorie du march, considrons le


modle de duopole de Cournot. Le duopole est un march qui est servi par deux producteurs
et sur lequel les demandes proviennent de nombreux agents qui sont individuellement petits.
La thorie conomique reprsente cette situation sous lhypothse que le mme prix
sappliquera aux changes de toutes les units du bien considr et que la demande est
concurrentielle dans le sens suivant : la quantit totale vendue dpend du prix du bien et de
rien dautre .26
Dans le cadre de ce modle, les deux firmes 1 et 2 choisissent simultanment leur quantit
q1 Q1 R + et q2 Q2 R+ . Loffre totale du march est donc Q = q1 + q2 . Le prix de
march p est une fonction dcroissante de la quantit totale offerte, soit p = p(Q) = p(q1 + q2 )
avec p(Q ) < 0 . La fonction p(Q ) est appele fonction de demande inverse. Chaque firme
supporte un cot de production ci en fonction de la quantit produite, soit ci = ci (qi ) . Le
profit de la firme i = 1, 2 est donc :

i (qi , qi ) = qi p ci = qi p(q1 + q2 ) ci (qi )


Cette fonction de profit fait bien ressortir l'interaction stratgique entre les deux firmes.
Chaque firme sait que son profit dpend de son niveau de production mais galement du
niveau de production de l'autre firme car ce dernier a une influence sur le prix de march.
Lquilibre de Cournot suppose que chacune des deux firmes maximise son profit tant donn
que l'autre firme galement prend une dcision de production dans l'objectif de maximiser son
profit. Lquilibre de Cournot q1* , q2* reprsente lquilibre de Nash de ce duopole.27 Cette
approche est formalise dans la notion de fonction de raction de Cournot. La fonction de

25

En toute rigueur, ce troisime cas est vi < ri bi ou vi ri < bi .


E. Malinvaud (1982). P 155.
27
Certains auteurs l'appellent quilibre de Cournot-Nash.
26

31

raction de Cournot est la fonction ri : Q j Qi qui indique la quantit optimale q i* choisie

par la firme i pour toute quantit q j choisie par la firme j. La fonction de raction ri (q j ) avec
i j est galement appele fonction de meilleure rponse de la firme i aux dcisions de la

firme j. Pour la firme 1, la fonction de raction est q1* = r1 (q2 ) et est le rsultat du programme
suivant :

Max 1 (q1 , q2 ) = q1 p(q1 + q2 ) c1 (q1 )


q1

Si la fonction i est diffrentiable et concave, la condition du premier ordre implique que q1*
est dtermin par lquation suivante :
d
d
d
1 (q1 , q2 ) = p (q1* + q2 ) + q1*
p (q1* + q2 )
c1 (q1* ) = 0
dq1
dq1
dq1

De faon similaire, la quantit q2* de la firme 2 satisfait lquation suivante :


d
d
d
2 (q1 , q2 ) = p (q1 + q2* ) + q2*
p (q1 + q2* )
c2 (q2* ) = 0
dq2
dq2
dq2

Lquilibre de Cournot ou plus gnralement lquilibre de Nash

( )

( )

(q ,q )
*
1

*
2

est obtenu

lorsque simultanment, on a q1* = r1 q2* et q2* = r2 q1* . Ainsi les deux quations caractrisant
l'quilibre de Nash sont :

et

( )

p q1* + q2* + q1*

d
d
p q1* + q2*
c1 q1* = 0
dq1
dq1

p (q1* + q2* ) + q2*

d
d
p (q2* + q2* )
c2 (q2* ) = 0
dq2
dq2

Dans lune des versions les plus simples de ce modle, on considre que la fonction de
demande inverse et la fonction de cot sont linaires, soit :28

p(q1 + q2 ) = a b (q1 + q2 ) avec b > 0


ci (qi ) = c qi

avec 0 c a

Dans cette version, le cot marginal est constant. On fait ici l'hypothse que les cots fixes
sont nuls. Les quations donnant les conditions du premier ordre des deux firmes scrivent
dans ce cas :

a 2b r1 (q2 ) b q2 c = 0
28

D. Fudenberg et J. Tirole (1996), p 14

32

a 2b r2 (q1 ) b q1 c = 0
Les fonctions de meilleure raction de Cournot des firmes 1 et 2 prennent alors la forme :
q1* = r1 (q 2 ) =

a bq 2 c
2b

q 2* = r2 (q1 ) =

a bq1 c
2b

Les quations caractrisant lquilibre de Cournot (quilibre de Nash) impliquent que :

a bq2* c
q = r1 q =
2b

( )

*
1

*
2

( )

q 2* = r2 q1* =

a bq1* c
2b

Lquilibre de Nash (de Cournot) obtenu aprs rsolution de ces deux quations est :
q1* = q 2* =

ac
3b

La recherche de l'quilibre de Cournot peut se faire l'aide d'une rsolution graphique en


reprsentant dans des coordonnes cartsiennes (q1 , q2 ) la fonction de meilleure rponse de la
(a bq2 c )
firme 1 en fonction de la quantit q2 , soit r1 (q 2 ) =
et la fonction de meilleure
2b
(a bq1 c )
rponse de la firme 2 en fonction de la quantit q1 , soit r2 (q1 ) =
.
2b

q2
ac
b

q1* = r1 (q2 )

q * = (q1* , q2* ) = r (q * )

ac
2b

q2* = r2 (q1 )

q2*

q1*

ac
2b

ac
b

Figure 2.1

q1

33

L'intersection des droites reprsentatives des deux fonctions de meilleures rponses reprsente
2(a c )
et le prix de march
l'quilibre de Nash. A cet quilibre, la quantit totale offerte est
3b
est :
p (q1 + q2 ) = a b

2(a c )
2
1
2
= a (a c ) = a + c
3b
3
3
3

1
2
1
2
Comme a > c , alors p (q1 + q 2 ) = a + c > c + c = c . En d'autres termes, l'quilibre de
3
3
3
3
Cournot est tel que le prix de march est plus grand que le cot marginal. Il n'est donc pas
Pareto optimal.

) est galement le point


reprsentant le couple des images (r (q ), r (q )) . Si on dfinit (r (q ), r (q )) par r (q ) , alors
l'quilibre de Nash peut tre dfini par la relation q = r (q ) . En d'autres termes, l'quilibre de
A partir de la figure 2.1, on remarque que le point q * = q1* , q2*
1

*
2

*
1

*
2

*
1

Nash est un point fixe pour la fonction r () .

2.3.

Le modle de duopole de Bertrand

Le modle de Bertrand (1838), comme le modle de Cournot, traite de l'quilibre d'un march
en situation de duopole.29 Le modle peut tre tendu au cas de n firmes. Dans le modle de
Bertrand, la variable de dcision des firmes est le prix de vente et non la quantit produire et
en ce sens, on dit que ce modle traite des dcisions court terme des firmes. Dans ce modle,
il existe deux firmes i = 1, 2 produisant un bien partiellement substituables.30 Le cot unitaire
de production, suppos constant et identique pour les deux firmes, est gal c.
Chaque firme i choisit un prix de vente pi et les quantits demandes adresses aux deux
firmes 1 et 2 sont respectivement q1 ( p1 , p2 ) = a bp1 + dp2 et q2 ( p1 , p2 ) = a bp2 + dp1
avec b > d > 0 . Cette fonction de demande exprime l'ide selon laquelle la quantit
demande une firme est ngativement influence par l'augmentation du prix propos par
cette firme et positivement influence par l'augmentation du prix propos par l'autre firme. De
plus, le premier effet marginal est suprieur au second effet marginal.
La forme des fonctions de demande q1 ( p1 , p2 ) et q2 ( p1 , p2 ) fait bien ressortir l'interaction
stratgique existant entre les deux firmes puisque la quantit demande la firme 1 par
exemple est influence simultanment par le prix qu'elle propose et par le prix propose par la
firme 2. Toutes ces donnes sont connaissance commune et les firmes prennent leur dcision
de prix de faon simultane. Le concept d'quilibre appropri ce modle est donc bien

29

Voir par exemple Gibbons (1992). Page 21.


Dans le cas de biens partiellement substituables, le prix n'est pas l'unique facteur de la dcision d'achat du
consommateur. Il pourrait s'agir par exemple de tlphones cellulaires de marques diffrentes et ayant des
caractristiques proches.

30

34

l'quilibre de Nash.31 L'objectif de chaque firme est la maximisation de son profit. Pour la
firme 1, on a donc :

Max 1 ( p1 , p2 ) = ( p1 c )(a bp1 + dp2 )


p1

d
1 ( p1 , p 2 ) = a 2bp1 + dp 2 + bc = 0 .32 Ceci permet
dp1
a + dp 2 + bc
d'obtenir la fonction de meilleure rponse p1* ( p2 ) de la firme 1 : p1* ( p 2 ) =
. La
2b
mme dmarche applique la firme 2 permet d'obtenir la fonction de meilleure rponse
a + dp1 + bc
p2* ( p1 ) de la firme 2 : p 2* ( p1 ) =
. L'quilibre de Bertrand est le vecteur de
2b
stratgies p1* , p2* , solution des deux quations suivantes :

La condition du premier ordre est

a + dp2* + bc
p (p ) =
2b
a + dp1* + bc
p 2* ( p1* ) =
2b
*
1

*
2

La rsolution de ces quations montre que l'quilibre de Bertrand est le couple de stratgies
( p1* , p2* ) = 2ab+bcd , 2ab+bcd . Le schma ci-dessous est la reprsentation graphique de

l'quilibre de Bertrand - Nash.

p1

p2* ( p1 )

p1* ( p2 )
p * = ( p1* , p2* )

a + dp 2* + bc
p =
2b
*
1

a + bc
2b
a + bc
2b

p 2* =

a + dp1* + bc
2b

p2

Figure 2.2

31
32

Certains auteurs parlent d'quilibre de Bertrand-Nash.


Il s'agit bien d'une condition ncessaire et suffisante car la fonction de profit 1 ( p1 , p 2 ) est concave en p1 .

35

Dans le cas de biens homognes, le modle de Bertrand dbouche sur un rsultat appel
paradoxe de Bertrand.33 Les biens produits par les deux firmes tant non diffrentiables, les
consommateurs dirigeront leur demande vers la firme ayant fix le prix le plus faible. Si les
deux firmes fixent le mme prix, alors elles se partageront le march galit. La quantit
demande la firme i a donc pour expression :

Q( pi ) si pi < p j
1
qi ( pi , p j ) = Q( pi ) si pi = p j
2
si pi > p j
0
Avec Q( pi ) reprsentant la quantit demande totale du march au prix pi . Dans ce jeu,
l'quilibre de Bertrand est tel que les deux firmes fixent un prix gal au cot marginal, c'est-dire que p1* = p2* = c . Pour faire ressortir ce rsultat, montrons tout d'abord qu' l'quilibre,
les deux firmes proposent le mme prix. Supposons le contraire, soit p1* > p2* > c .34 Dans ce
cas, la quantit demande la firme 1 est gale 0 et son profit est galement nul. La firme 1
a de ce fait intrt dvier vers un prix gal p 2* > c o est un scalaire positif petit. La
situation o p1* > p2* > c ne peut donc tre un quilibre. Ce dernier doit donc tre tel que les
deux firmes proposent le mme prix.
Supposons maintenant que ce prix est suprieur au cot marginal, soit p1* = p2* > c . Dans ce
1
cas, chacune des deux firmes reoit une demande gale Q ( p i ) avec i = 1 ou 2 et ralise un
2
profit positif. Pour un suffisamment petit, la firme 1 peut augmenter son profit en proposant
un prix gal p1* > c lui permettant d'obtenir toute la quantit du march.
Ainsi, la seule situation o cette dviation n'augmente pas le profit est celle o p1* = p2* = c
qui constitue donc l'quilibre de duopole de Bertrand. Le paradoxe de ce rsultat rside dans
le fait que le prix d'quilibre en situation de duopole est identique au prix d'quilibre obtenu
dans le cas de concurrence pure et parfaite.35

2.4.

Le problme des commons

La question tudie ici porte sur l'utilisation prive d'une ressource commune.36 On montre
dans ce cadre que la dcentralisation des dcisions, lorsque celles-ci sont bases sur des
incitations prives, conduit une surexploitation des ressources communes.37 En se basant sur
lexemple de la pche, Levhari et Mirman (1980) ont dmontr que lquilibre non coopratif
(quilibre de Nash) rsultant de linteraction des pays pcheurs entrane une consommation
prsente leve par rapport au stock de poisson. Ils ont galement montr quun quilibre
33

Dans le cas de biens homognes, le seul critre du choix de la firme par l'acheteur est le prix.
Le mme rsultat aurait t obtenu si on avait suppos p2* > p1* > c .
35
Voir J. Tirole (1988) pour une discussion de ce paradoxe et des possibles alternatives pour sa rsolution.
36
Ce modle a t utilis par A. Gliz (2004) dans le thme de la privatisation.
37
Cette question est connue comme tant le problme des commons. A ce propos, voir par exemple Gibbons
(1992), page 27 et Levhari et Mirman (1980).
34

36

coopratif entre les pays pcheurs permet dviter lextinction future du stock de poisson.
Lexplication de cette conclusion est que dans lquilibre non coopratif, chaque agent prend
une dcision individuellement optimale sans tenir compte du cot quil induit sur les autres
agents. Par contre, dans l'option centralise, la consommation du bien commun est plus faible
car l'autorit centrale internalise l'effet externe ngatif induit par la contrainte de la ressource
commune.
Pour faire ressortir ce rsultat, considrons le cas de l'utilisation par des fermiers d'une prairie
pour le pturage de leurs vaches. La prairie est un bien commun aux fermiers considrs. Soit
n le nombre de fermiers. Chaque fermier i peut possder un nombre de vaches gal bi . Le
nombre total de vaches est B = bi . Le cot d'achat et d'entretien d'une vache est c , suppos
i

le mme pour toutes les vaches et pour tous les fermiers. Le bnfice brut (ou revenu brut)
procur par le pturage de chaque vache est v(B) avec v(B) < 0 et v(B ) < 0 . La
reprsentation graphique de la fonction v(B) est la suivante :

v(B)

Bmax

Figure 2.3

La forme de la fonction v(B) signifie que si par exemple, le nombre total de vaches dans la
prairie devient lev, chacune des vaches ne disposera plus que d'une faible possibilit de
pturage, ce qui a pour consquence de rduire son rendement individuel.
Les fermiers choisissent simultanment et indpendamment l'un de l'autre le nombre de
vaches faire patre dans la prairie. En supposant que les vaches sont parfaitement divisibles,
l'espace des stratgies est donc bi [0, Bmax ] R + . L'utilit du fermier i est bi v(B ) cbi et son
programme est donc :

Max bi v(B ) cbi = bi v(b1 + L + bi 1 + bi + bi +1 + L + bn ) cbi


bi

Pour que le profil de stratgies (b1* , L , bi* , L , bn* ) soit un quilibre de Nash, il faut que pour
tout i, bi* maximise l'utilit du fermier i, sachant que les autres fermiers choisissent

37

b*i = b1* ,L, bi*1 , bi*+1 ,L, bn* . La condition du premier ordre pour le programme du fermier i est
donc :

v bi + b*i + bi v bi + b*i c = 0

En raison des caractristiques v(B) < 0 et v(B ) < 0 , la condition du second ordre est
satisfaite. En substituant bi par bi* , la condition du premier ordre devient :

v bi* + b*i + bi* v bi* + b*i c = 0

( )

( )

v B * + bi* v B * c = 0

Cette condition est valable pour tout fermier i. En sommant par rapport tous les fermiers, on
obtient :

nv(B * ) + B *v(B * ) nc = 0
En divisant ensuite par n, cette quation devient :

( )

v B* +

( )

1 *
B v B * c = 0
n

Cette quation reprsente l'quilibre de Nash sous une forme implicite. Considrons
maintenant l'alternative de la dcision centralise. Dans ce cas, il existe une autorit centrale,
suppose neutre et sans cot (c'est l'hypothse du bnvolat) qui choisit le nombre total de
vaches de faon maximiser une fonction objectif au niveau social. Soit B ** le nombre total
de vaches socialement optimal. Le nombre B ** est donc la solution du programme suivant :

Max Bv(B ) cB
B

La condition du premier ordre est :38

v(B ** ) + B **v(B ** ) c = 0
Nous montrons que dans l'alternative centralise, le nombre de vaches est plus faible, c'est-dire B ** < B * . Pour cela, supposons le contraire. La vrification de ces deux conditions
d'optimalit entrane de faon vidente que B ** B * . Supposons donc que B * < B ** . La
figure 2.4 reprsente cette hypothse.

( ) ( )
( )

( ) ( )

Ainsi que le montre cette figure, si B* < B** , alors v B ** < v B* et v B ** < v B * < 0 .
B **v B ** < B *v B * < 0 .
Comme
B* < B** ,
on
a
Ceci
implique
que
1
1
B ** v (B ** ) < B * v (B * ) < 0 . On a finalement v(B ** ) + B ** v (B ** ) c < v(B * ) + B * v (B * ) c .
n
n

( )

38

On peut vrifier que la condition du second ordre est ici galement satisfaite.

38

Ceci constitue une contradiction car les conditions d'optimalit obtenues plus haut impliquent
1
l'galit v (B** ) + B**v(B** ) c = v (B* ) + B*v(B* ) c = 0 . En consquence, l'hypothse
n
*
**
B < B ne peut tre accepte. On a donc B ** < B * .

v(B)
v(B* )
v(B** )

B*
Figure 2.4 : La fonction

B **

Bmax

v(B) sous l'hypothse que

avec B < B
*

**

Lexplication de cette conclusion est la suivante : dans lquilibre non coordonn (non
coopratif), chaque fermier prend une dcision individuellement optimale sans tenir compte
du cot quil induit sur les autres fermiers. Lorsqu'un fermier trouve quil est bnfique pour
lui de possder une vache supplmentaire, il provoque, ce faisant, un cot supplmentaire
pour les autres fermiers et ce, travers la diminution de v(B) quil aura provoque. Dans ce
cas, lquilibre de Nash nest pas socialement optimal, car les fermiers ninternalisent pas les
effets externes ngatifs quils sinduisent les uns sur les autres. L'augmentation du bien-tre
induit par l'optique centralise s'explique donc par la capacit de coordination de l'autorit
centrale afin d'internaliser les effets externes. Lorsque le nombre de vaches est choisi de faon
dcentralise, il sensuit donc un plus fort effet de congestion sur la prairie et le cot ainsi
occasionn est un cot de non-coordination. Il faut cependant noter que cette conclusion peut
s'avrer inexact si le n + 1me ne se comporte pas en joueur neutre ou ncessite des cots de
fonctionnement trop importants.

2.5.

Le jeu de l'inspection

Le jeu de l'inspection fait intervenir un agent (par exemple un travailleur : joueur 1) et un


principal (par exemple le contrematre : joueur 2).39 Le travailleur a le choix entre travailler
(T) ou tricher (NT). En travaillant, le joueur 1 produit une valeur v mais supporte un cot
d'effort g. Le principal peut dcider soit d'inspecter (I) soit de ne pas inspecter (NI).
L'inspection a un cot h et permet au principal de s'assurer si l'agent a travaill ou a trich. Le
travailleur obtient un salaire w sauf s'il existe une preuve (suite une inspection) qu'il a trich.
Dans ce dernier cas, il obtient 0. Les deux joueurs choisissent leur stratgie de faon
simultane et toutes les donnes du jeu sont information commune. On a de plus
v > w > g > h > 0 . La matrice des paiements de ce jeu est donne dans la figure 2.5 :
39

Voir aussi Fudenberg D. & Tirole J. (1994) page 17.

39

Joueur 1

NT

(x )

T (1 x )

(y)

Joueur 2

0 , h
w g , v w h

NI (1 y )
w , w

w g , v w
Figure 2.5

Ce jeu n'admet aucun quilibre de Nash en stratgies pures. Pour dterminer l'quilibre de
Nash en stratgies mixtes, dsignons par (x, 1 x) la stratgie mixte du joueur 1 avec x
reprsentant la probabilit de joueur NT et ( y, 1 y ) la stratgie mixte du joueur 2 avec y
reprsentant la probabilit de jouer I.
En jouant NT, le joueur 1 obtient un paiement espr gal 0. y + w.(1 y ) = w.(1 y ) . En
. 1 y ) = w g . On obtient la
jouant T, il obtient un paiement espr gal (w g ). y + (w g )(
stratgie mixte d'quilibre du joueur 2 lorsque les deux stratgies T et NT procurent au joueur
1 la mme esprance de paiement, soit lorsque w.(1 y ) = w g . On obtient ainsi g = y.w ,
g
soit y = .
w
Pour le joueur 2, la stratgie I permet d'obtenir un paiement espr de h x + (v w h)(1 x )
et la stratgie NI un paiement espr de w x + (v w)(1 x ) . On obtient la stratgie mixte
d'quilibre du joueur 1 lorsque les deux stratgies I et NI procurent au joueur 2 le mme
paiement espr, soit lorsque h x + (v w h)(1 x ) = w x + (v w)(1 x ) . On obtient ainsi
h
h = w x , soit x = .
w
Ainsi, l'quilibre de Nash, le principal choisit une probabilit d'inspection y telle que pour
l'agent, le cot de l'effort g soit gal au salaire espr w y . La probabilit d'inspection y est
donc croissante par rapport au cot de l'effort g et dcroissante par rapport au salaire w. En
d'autres termes, la frquence de l'inspection augmente pour les agents ayant une forte aversion
pour l'effort ou recevant un salaire faible.
De mme, l'quilibre de Nash, l'agent choisira une probabilit de ne pas travailler telle que
pour le principal, le cot d'inspection h soit gal au salaire espr w x . La probabilit de ne
pas travailler (tricher) x est donc croissante par rapport au cot de l'inspection et dcroissant
par rapport au salaire. En d'autres termes, la frquence de la tricherie de l'agent augmente avec
le cot (les difficults) de l'inspection ou la faiblesse du salaire.
Les quations g = y.w et h = w x impliquent qu' l'quilibre de Nash, on a

Probabilit de l' inspection


Cot de l' effort
=
Probabilit de tricher
Cot de l' inspection

g h
= , soit :
y x

40

2.6.

Le jeu de coordination et quilibres de Nash multiple

L'exemple classique du jeu de coordination est le jeu intitul "la bataille des sexes". Ce
modle illustre galement le problme de la multiplicit de l'quilibre de Nash. Il s'agit d'un
jeu deux joueurs, Elle et Lui. Les deux joueurs (Elle et Lui) veulent aller ensemble un
spectacle mais n'ont pas les mmes prfrences propos de la nature du spectacle qui peut
tre le ballet (B) ou le football (F). Chaque joueur doit choisir indpendamment de lautre le
spectacle auquel il souhaite assister. Sil savre que les deux joueurs choisissent le mme
spectacle, Elle (Lui) obtient une utilit 2 sil sagit du ballet (football) et une utilit 1 sil
sagit du football (ballet). Si les deux joueurs ne choisissent pas le mme spectacle, chacun
deux obtient une utilit 0. La matrice des paiements de ce jeu est la suivante :

Lui

F
B

Elle
F
2,1
0,0
Figure 2.7

B
0,0
1,2

Ce jeu admet deux quilibres de Nash en stratgies pures, soit : (B, B) et (F, F). Il est dans ce
cas difficile de prvoir lequel de ces deux quilibres sera finalement retenu. Mme sil
nexiste pas une thorie tablie pour prdire lquilibre dun tel jeu, la littrature a retenu pour
cela le mcanisme du point focal introduit par Schelling (1960).40 Selon cet auteur, des
lments de l'environnement ou de l'histoire du jeu peuvent amener l'attention des joueurs se
focaliser sur un quilibre donn. Dans le jeu de la bataille des sexes, les deux joueurs se
focalisent sur un des deux quilibres de Nash en se rfrant des lments en dehors du jeu.
Par exemple, si les deux joueurs ont l'habitude d'alterner entre le football et le ballet et si la
fois prcdente le ballet a t choisi, alors l'quilibre de Nash le plus plausible est (F, F).
La possibilit de coordination en faveur d'un quilibre de Nash par la communication
pralable est galement une solution possible en cas de multiplicit des quilibres de Nash.
Pour montrer cela, considrons le jeu suivant :

Joueur 1

U
D

Joueur 2
L
R
800 , 800
800 , 0
0 , 800
1000 , 1000
Figure 2.8

Ce jeu admet deux quilibres de Nash, savoir (U, L) et (D, R). Si les deux joueurs pouvaient
se coordonner avant de jouer, ils devraient choisir l'quilibre (D, R) car il est Pareto dominant
par rapport l'autre quilibre (U, L). Mais sans communication pralable, les joueurs peuvent
tre tents de jouer U et L car ainsi, ils peroivent 800 de faon certaine. En d'autres termes,
l'quilibre (U, L) tout en tant Pareto domin par lquilibre (D, R) est moins risqu que ce
dernier. En effet, pour le joueur 1 (resp. 2), le choix de laction U (resp. L) lui procure un
paiement de 800 quelque soit le choix du joueur 2 (resp. 1).

40

Schelling, R. (1960). The Strategy of Conflict. Cambridge, Mass.: Harvard University Press.

41

Chapitre 3 : Jeux dynamiques information complte

La classe de jeux tudie aux chapitres 1 et 2 reprsente une version trs simplifie de la
ralit. Nous avons en particulier considr que le jeu se droule en une seule fois, excluant
ainsi la dimension du temps. Dans ce chapitre, nous introduisons le fait qu'en ralit, le jeu est
souvent soit rpt, soit jou de faon squentielle, ce qui donne la possibilit au moins l'un
des joueurs de ragir aux actions des autres joueurs aprs les avoir observes. Nous obtenons
ainsi des jeux dynamiques.
Tout en maintenant l'hypothse de l'information complte (c'est--dire que tous les joueurs
connaissent toutes les donnes du jeu : l'ensemble des joueurs, les ensembles de stratgies et
les fonctions de paiement), nous considrerons que l'information peut tre soit parfaite soit
imparfaite. Par information parfaite, nous entendons la situation o le joueur qui revient le
tour de jouer connat (observe et garde en mmoire) toute l'histoire du jeu. Par consquent,
l'information imparfaite dcrit la situation o, au moins un moment donn du jeu, le joueur
qui revient le tour de jouer ne connat pas toute l'histoire du jeu.
Pour dcrire un jeu dynamique, on utilise souvent un arbre de jeu qu'on appelle la forme
extensive du jeu. La dtermination de l'quilibre de Nash pour un jeu dynamique peut
cependant s'effectuer partir de la forme normale, mais cela ncessite l'utilisation d'une
nouvelle dfinition du concept de stratgie. La contribution majeure dans la classe des jeux
dynamiques est due Selten (1975)41 qui a permis lapplication du concept de lquilibre de
Nash aux jeux dynamiques. Ceci a t rendu possible par lintroduction dune nouvelle
dfinition de la notion de stratgie qui devient un plan d'actions complet indiquant les actions
du joueur en toute circonstance o il intervient. Un profil de stratgies dfinit donc une
trajectoire qui est la squence des choix des joueurs.
Une fois obtenue la forme normale d'un jeu, on peut rechercher le (s) quilibre (s) de Nash du
jeu. L'quilibre de Nash est dans ce cas une trajectoire telle que chaque point de cette
trajectoire, aucun joueur n'a intrt dvier. On parle dans ce cas, d'un quilibre de Nash
parfait ou simplement d'un quilibre parfait.
Nous verrons qu'une question centrale des jeux dynamiques est la crdibilit. En effet, dans
un jeu dynamique en information complte, l'quilibre de Nash tel que dfini pour un jeu
simultan en information complte n'est pas suffisant pour carter des stratgies non
crdibles. Ceci implique la ncessit d'un raffinement du concept d'quilibre de Nash
permettant ainsi d'liminer les quilibres de Nash non crdibles. Le raffinement ainsi introduit
a donn lieu l'mergence de l'quilibre de Nash parfait (Subgame-Perfect Nash Equilibrium
SPNE) ou tout simplement de l'quilibre parfait. L'quilibre parfait, plus restrictif que
l'quilibre de Nash, est bas sur le principe de la rationalit squentielle, principe selon lequel
un tel quilibre doit spcifier un comportement optimal partir de n'importe quel point du jeu.
On peut s'assurer de la satisfaction d'une telle restriction en utilisant la procdure de
rcurrence vers l'amont (Backwards Induction).42

41

Selten "A Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,"
International Journal of Game Theory, IV (1975), 25-55.
42
Appele galement induction rebours.

42

Les classes de jeux dynamiques tudis dans ce chapitre sont :


- Jeu squentiel (les joueurs jouent tour de rle) information complte et parfaite
o la solution (l'quilibre de Nash parfait) peut tre obtenue par la mthode de
rcurrence vers l'amont (Backwards induction). L'application considre pour illustrer
cette classe de jeu est le modle de duopole de Stackelberg (1934) ;
- Jeu rpt o les joueurs jouent simultanment de faon rpte. Les applications
considres pour illustrer cette classe de jeux sont le free riding (ala moral) rpt
infiniment et la collusion dans le duopole de Cournot.

3.1.

La forme extensive

Dans le chapitre 1, nous avons introduit la forme normale pour reprsenter les jeux statiques
information complte. Dans le prsent chapitre, nous introduisons la forme extensive pour
reprsenter les jeux dynamiques. Nous montrerons ainsi comment reprsenter un jeu statique
par la forme extensive et un jeu dynamique par la forme normale. Nous verrons ainsi
comment un jeu statique information complte peut tre interprt comme tant un jeu
dynamique information imparfaite. Il peut tre cependant plus commode d'utiliser telle ou
telle forme pour reprsenter un jeu donn.

3.1.1. La forme extensive d'un jeu dynamique


La forme extensive d'un jeu spcifie les donnes suivantes du jeu :43
- Les joueurs concerns par le jeu ;
- Les moments o chaque joueur aura jouer ;
- Les actions possibles de chaque joueur au moment o il joue ;
- L'information dont dispose chaque joueur au moment o il joue ;
- Les paiements des joueurs pour chacune des combinaisons possibles d'actions.
Pour illustrer l'utilisation de la forme extensive, considrons le jeu suivant :
- Le joueur 1 choisit une action a1 de l'ensemble des actions A1 = {L, R} ;
- Le joueur 2 observe a1 et choisit une action a2 de l'ensemble des actions
A2 = {U , D} ;
- Le jeu sarrte et les paiements sont donns par u1 (a1 , a2 ) et u 2 (a1 ,a2 ) .
Ce jeu est reprsent par l'arbre de jeu suivant :

43

Voir par exemple Mas-Colell, Whinston and Green (1995). Page 219.

43

Joueur 1
L

Joueur 2

u1
u2

Joueur 2

3
1

1
2

U
2
1

D
0
0

Figure 3.1

Ce schma montre que l'arbre de jeu (la forme extensive du jeu) commence par un nud de
dcision du joueur 1 lorsque le tour de jouer lui revient. Ici, il a choisir entre les actions L et
R. Par la suite apparaissent deux autres nuds de dcision o, aprs avoir observ le choix du
joueur 1, il revient au joueur 2 de choisir entre les actions U et D. A la fin de chaque
combinaison disjointe de choix, on a un nud final qui indique la fin du jeu et o apparaissent
les paiements des joueurs.
L'exemple de cet arbre de jeu reprsente un jeu dynamique information complte et parfaite,
c'est--dire un jeu o 1) les joueurs jouent de faon squentielle et 2) chaque tape du jeu,
tous les prcdents choix sont connaissance commune.

3.1.2. Reprsentation d'un jeu statique par la forme extensive


Nous avons introduit les jeux statiques comme tant des jeux o les joueurs choisissent leurs
actions simultanment. L'exemple du dilemme du prisonnier a t construit sur cette base.
Mais en fait, le mme rsultat aurait t obtenu si les prisonniers avaient jou de faon
squentielle avec cependant la condition que le joueur jouant en seconde position n'observe
pas le choix du joueur jouant en premire position. On peut de ce fait reprsenter le jeu du
dilemme du prisonnier (jeu simultan) par le jeu dynamique suivant :44
1. Le prisonnier 1 choisit une action a1 de l'ensemble des actions
A1 = {avouer, ne pas avouer} ;
2. Le prisonnier 2 n'observe pas l'action a1 choisie par le prisonnier 1 et choisit
une action a2 de l'ensemble des actions A2 = {avouer, ne pas avouer} .
3. Les paiements sont donns par u1 (a1 ,a2 ) et u2 (a1 , a2 ) .
De ce fait, on a interprt un jeu statique information complte comme tant un jeu
dynamique information complte et imparfaite. La figure 3.2 montre comment peut-on
reprsenter par la forme normale un jeu simultan.

44

On aurait eu galement le mme rsultat si le prisonnier 2 avait jou en premier et le prisonnier 1 en second
avec toujours la mme condition de non observation du choix du joueur ayant jou en premier.

44

Prisonnier 1
Ne pas avouer

Avouer
Prisonnier 2

Ne pas avouer

Avouer Ne pas avouer

Avouer

Figure 3.2

On remarque ainsi que les deux jeux dynamiques prcdemment dcrits (figures 3.1 et 3.2)
sont similaires en tout point, sauf concernant l'observabilit de l'action choisie lors de la
premire tape avant le choix de la deuxime tape. L'information disponible pour le joueur
devant jouer est donc cruciale pour la description d'un jeu. Pour reprsenter l'tat des
connaissances des joueurs (ce quils savent et ce quils ne savent pas), on utilise la notion
d'ensemble d'information.
Dfinition de l'ensemble d'information : Un ensemble d'information pour un joueur est une
collection de nuds de dcision ayant les caractristiques suivantes :
- Le joueur joue l'un des nuds de dcision inclus dans l'ensemble d'information ;
- Lorsque le jeu atteint un nud de dcision l'intrieur d'un ensemble
d'information, le joueur qui doit jouer ne sait pas quel est le nud de dcision qui est
atteint.
Notons que la seconde condition de cette dfinition implique que les nuds de dcision inclus
dans un ensemble d'information doivent avoir les mmes actions possibles, sinon le joueur
peut infrer sur le nud de dcision atteint partir des actions qu'il peut choisir. Pour
exprimer l'ide que des nuds de dcision font partie d'un mme ensemble d'information, on
les entoure avec la mme ellipse, comme il ressort dans la figure 3.2 reprsentant la forme
extensive du jeu (simultan) du dilemme du prisonnier. Cette reprsentation de l'ensemble
d'information du prisonnier 2 signifie que ce dernier ne sait pas quel nud de dcision de cet
ensemble est atteint. Tout ce qu'il sait est que le prisonnier 1 a choisi l'une des deux actions
possibles (ne pas avouer, avouer).
Considrons un autre exemple (en ngligeant les paiements) pour illustrer comment utiliser le
concept densemble dinformation pour dcrire ltat des connaissances dun joueur au
moment o il joue.
1. Le joueur 1 choisit une action a1 de l'ensemble des actions A1 = (L, M , R )
2. Le joueur 2 observe si a1 = L ou non et choisit une action a2 de l'ensemble des actions
A2 = (U , D) .
La forme extensive de ce jeu est donne par la figure 3.3.a :

45

Joueur 1
M

L
Joueur 2
U

Joueur 1
R

Joueur 2
D U

D U

Figure 3.3.a

Joueur 2
U

Joueur 2
D

Joueur 3

ba

Joueur 3

ba

Figure 3.3.b

Cette figure montre que le joueur 2 dispose de deux ensembles d'information :


- Un singleton qui fait suite au choix de L du joueur 1.
- Un ensemble d'information (non singleton) englobant les deux autres nuds de
dcision du joueur 2 et qui fait suite au choix de M ou R par le joueur 1.
Nous pouvons utiliser la notion d'ensemble d'information pour obtenir une dfinition
alternative permettant de distinguer entre un jeu information parfaite et un jeu information
imparfaite. Dans un jeu dynamique information parfaite, le joueur qui revient le tour de
jouer connat toute l'histoire du jeu. Il observe ainsi quel est le nud de dcision atteint dans
le jeu. Les ensembles d'information des joueurs sont donc tous des singletons.
Ainsi, on dira qu'un jeu dynamique est information parfaite quand tous les ensembles
d'information du jeu sont des singletons. Par consquence, un jeu est information imparfaite
lorsquau moins un ensemble d'information du jeu n'est pas un singleton. Ainsi, la forme
extensive d'un jeu simultan information complte (par exemple, le dilemme du prisonnier)
est reprsentative d'un jeu dynamique information imparfaite.

3.1.3. La notion de sous-jeu


La forme extensive d'un jeu dynamique est une succession de nuds de dcision dont certains
sont le dbut d'un jeu part entire qu'on appelle sous-jeu. L'identification de ces sous-jeux
s'avre tre importante pour la dtermination de l'issue d'un jeu dynamique.
Dfinition d'un sous-jeu : Un sous-jeu dans un jeu dynamique est un sous-ensemble du jeu
ayant les proprits suivantes :45
a. Il dbute un nud de dcision x singleton (ensemble d'information contenant un seul
nud de dcision) ;
b. Il contient tous les nuds de dcision successeurs (immdiats ou lointains) et ne
contient que ces nuds ;
c. Si le nud de dcision y appartient ce sous-jeu, alors tout nud y' de H(y) appartient
ce sous-jeu, o H(y) dsigne l'ensemble de dcision contenant le nud de dcision y.
(En d'autres termes, il n'existe pas d'ensemble d'information cass).

45

Voir Mas-Colell, Whinston and Green (1995). Page 219.

46

La restriction c) signifie que si un nud y se trouve la suite du nud x, alors tous les nuds
inclus dans l'ensemble d'information contenant y doivent se trouver galement la suite du
nud x. Une consquence de la condition c) est la suivante : un sous-jeu est tel que tout
nud y suivant le nud x, le joueur qui doit jouer sait que le nud x a t atteint.
Pour illustrer cette dfinition, considrons le jeu dynamique information imparfaite dcrit
dans la figure 3.3.b dans lequel, au moment de joueur, le joueur 3 observe si (a1 , a2 ) = (R, D)
ou non et choisit une action a3 de A3 = (a, b ) .
Dans ce jeu, il n'existe qu'un seul sous-jeu, celui correspondant au nud de dcision du joueur
3 suivant les dcisions R et D. Ainsi, la partie de l'arbre de jeu commenant par le noeud de
dcision du joueur 2 suivant L ne constitue pas un sous jeu car lensemble dinformation qui
suit contient un nud de dcision qui est successeur du choix de R et non de L. La restriction
c) interdit galement de considrer ce nud comme un sous-jeu.

3.2.

Jeu squentiel information complte et parfaite

Dans un jeu squentiel information complte et parfaite, les joueurs jouent tour de rle. Au
moment de choisir, chaque joueur connat parfaitement lhistoire du jeu. La mthode de
rcurrence vers lamont (Backward Induction) permet de trouver la squence optimale du
jeu.46

3.2.1. La procdure de Rcurrence vers l'amont (Backwards induction)


Pour un jeu dynamique information complte et parfaite, l'issue du jeu peut tre dtermin
par la mthode de la rcurrence vers l'amont.47 Pour montrer cela, considrons le jeu suivant :
- Le joueur 1 choisit une action a1 de l'ensemble A1 ;
- Le joueur 2 observe a1 , laction choisie par le joueur 1 et choisit son tour une
action a2 de lensemble A2 ;
- Le jeu s'arrte et le paiement de deux joueurs est donn par les fonctions u1 (a1 ,a2 )
et u 2 (a1 ,a2 ) .
Plusieurs modles correspondent cette classe de jeu comme par exemple le modle de
duopole de Stackelberg (1934). Au moment de jouer, le joueur 2 observe laction a1 choisie
par le joueur 1. Il choisit une action a2 qui soit la meilleure rponse a1 et est donc la
solution du programme suivant :

Max u 2 (a1 , a2 )
a2A2

46

Voir K. Binmore pour une discussion critique de la relation entre rationalit et mthode de rcurrence vers
lamont.
47
Remarquons que nous n'avons pas utilis le concept d'quilibre de Nash, car la mthode de rcurrence vers
l'amont n'est pas dfinie en termes de stratgies mais en termes d'actions.

47

En supposant, pour simplifier, que cette meilleure rponse est unique, on a donc
a2* = MR2 (a1 ) .48 Etant dans un cadre d'information complte, le joueur 1 connat u 2 (a1 ,a2 ) la
fonction de paiement du joueur 2 et sait qu'il est rationnel. Le joueur 1 peut donc anticiper
MR2 (a1 ) la meilleure rponse du joueur 2. Il intgrera donc MR2 (a1 ) dans son programme.
De ce fait, le joueur 1 choisit son action qui soit la solution du programme suivant :

Max u1 (a1 , MR2 (a1 ))


a1A1

En supposant encore que ce problme de maximisation n'admette qu'une seule rponse a1* ,

( ))

alors a1* , MR2 a1* est l'issue du jeu selon la mthode de Rcurrence vers l'amont. Notons
que la solution obtenue par la mthode de Rcurrence vers l'amont n'inclut aucune menace
non crdible du joueur 2. En d'autres termes, le joueur 1 n'a aucune croyance selon laquelle,
aprs avoir observ a1 , le joueur 2 n'agira pas dans son propre intrt.
Pour montrer comment obtenir la solution d'un jeu squentiel information complte et
parfaite par la mthode de rcurrence vers l'amont, considrons le jeu dcrit par la figure 3.1.
Etant donnes les hypothses de rationalit et de connaissance commune, le joueur 1 sait que
s'il choisit L , la meilleure rponse du joueur 2 sera de jouer D car il obtient ainsi un
paiement de 2 au lieu de 1. De mme, il sait que s'il joue R , la meilleure rponse du joueur 2
sera de choisir U car lui procurant un paiement de 2 au lieu de 0. Etant donnes ces
anticipations, on peut remplacer le jeu de la figure 3.1 par la forme extensive rduite suivante
:
Joueur 1
L

1
2

2
1
Figure 3.4

Cette forme rduite est obtenue aprs avoir remplac chacun des sous-jeux du joueur 2 (lun
dbutant aprs laction L et lautre aprs laction R) par les paiements rsultants du choix
optimal du joueur 2. Le meilleur choix pour le joueur 1 est de jouer R . La figure suivante
rsume l'issue du jeu obtenue par la mthode de Rcurrence vers l'amont.

48

MR1 (a 2 ) est la fonction (ou correspondance) de meilleure rponse du joueur 1 laction a 2 du joueur 2. Au

chapitre 2, cette fonction (ou correspondance) a t note par b1 (a2 ) .

48

1
L

2
U
3
1

2
D

1
2

2
1

0
0

Figure 3.5

D'une faon gnrale, la procdure de Rcurrence vers l'amont s'applique la classe des jeux
finis information parfaite.

3.2.2. Application de la rcurrence vers l'amont : le modle de duopole de


Stackelberg
Le modle de duopole de Stackelberg (1934) est un exemple de jeu dynamique information
complte et parfaite qui peut tre rsolu par la mthode de Rcurrence vers l'amont. On
considre un march o existent deux firmes. L'une (la firme 1) est le leader et l'autre (la
firme 2) est le follower. La dcision prendre pour chaque firme porte sur la quantit
produire. Par rapport au modle de Cournot o les quantits sont choisies simultanment par
les deux firmes, dans le modle de Stackelberg, les quantits sont choisies de faon
squentielle. Le droulement du jeu est donc le suivant :49
- La firme 1 choisit une quantit q1 0 .
- La firme 2 observe q1 et choisit une quantit q2 0 .
- Le jeu s'arrte et les deux firmes obtiennent un profit selon la fonction
i (q1 , q2 ) = qi (P(Q) c ) .
Pour simplifier, on considre que le cot unitaire de production c, est constant (les cots fixes
de production supposs nuls) et identique pour les deux entreprises. La quantit totale offerte
par les deux firmes est Q = q1 + q2 et P(Q) est la fonction de demande inverse donnant le
prix d'quilibre du march en fonction de la quantit totale offerte par les deux firmes. Pour
simplifier, on considre que cette fonction prend la forme linaire P(Q) = a bQ avec a c ,
ce qui donne le graphe de la figure 3.6 :

49

Voir galement Gibbons R. (1992). Page 61.

49

P
a

P(Q) = a bQ

ab

Figure 3.6

La rsolution du jeu par la mthode de Rcurrence vers l'amont (Backwards Induction)


commence par la dtermination du choix optimal de la firme 2. Celle-ci choisit la quantit q2
aprs avoir observ la quantit q1 choisie par la firme 1. Le choix de la firme 2 est donc la
solution du programme suivant :

Max 2 (q1 , q2 ) = q2 (a b (q1 + q2 ) c )


q2 0

La condition ncessaire et suffisante est :

d 2
= a bq1 2bq2 c = 0
dq2
Ce qui donne q2* = MR2 (q1 ) =

a bq1 c
.
2b

Etant donne l'hypothse d'information complte (chaque firme connat la fonction de


paiement de l'autre), la firme 1 peut anticiper la rponse MR2 (q1 ) de la firme 2. Elle choisira
donc une quantit q1* en tenant compte de la meilleure rponse q2* = MR2 (q1 ) de la firme 2. La

quantit q1* est donc la solution du programme suivant :

) )

Max 1 q1 , q2* = q1 a b q1 + q2* c = q1 (a b(q1 + MR2 (q1 )) c ) = q1


q1 0

a bq1 c
2

La condition ncessaire et suffisante est donc :

d 1 a 2bq1 c
=
=0
dq1
2

a bq1* c a c
ac
=
et donc q2* = MR2 q1* =
. La solution du modle
2b
4b
2b
ac ac
de duopole de Stackelberg est donc q1* , q 2* =
,
.
4b
2b

( )

Ce qui donne q1* =

50

En comparant par rapport au rsultat du modle de Cournot, on peut remarquer que la quantit
ac
choisie par le leader q1* =
est suprieure la quantit choisie par chaque firme en
2b
ac
, elle-mme suprieure la quantit choisie par
situation de choix simultans q1* = q 2* =
3b
ac
.
le follower q 2* =
4b
La quantit totale produite dans le choix squentiel, Qs* = q1* + q 2* =

3(a c )
est suprieure
4b

2(a c )
. Comme consquence, le
3b
prix de march dans le modle de Stackelberg est infrieur au prix de march correspondant
au modle de Cournot. Il en rsulte que par rapport la situation de choix simultans, le
follower obtient un profit infrieur.

celle produite en situation de choix simultans, soit Qc* =

Dans ce modle, la firme 2 (follower) voit son profit diminuer par rapport la situation de
choix simultans. Dans le jeu squentiel information parfaite, la firme 2 observe l'action de
la firme 1 et prend une dcision optimale en tenant compte de la dcision de la firme 1. La
rduction de son profit provient donc du fait que la firme 1 sait que la firme 2 observe sa
dcision et que cette dernire devient une donne pour la firme 2. La firme 1 est donc moins
contrainte, ce qui lui permet d'amliorer sa situation au dtriment de celle de la firme 2. Le
fait donc de joueur en premier devient favorable, mais la condition que le joueur 2 (le joueur
jouant en second) observe la dcision du joueur 1 (le joueur jouant en premier) et que le
joueur 1 sait que le joueur 2 observe la dcision du joueur 1 et en tiendra compte pour prendre
sa propre dcision.
La comparaison entre le modle de Stackelberg et le modle de Cournot montre l'importance
de la question de savoir "qui joue en premier". En d'autres termes, cette question n'est pas
neutre. Par exemple, dans la conqute d'un nouveau march, l'entreprise qui se positionne en
premier a de ce fait un avantage par rapport aux entreprises qui s'installent par la suite.

3.3.

L'Equilibre de Nash Parfait (SPNE)

L'quilibre de Nash a t dfini et dmontr pour des jeux sous forme normale, c'est--dire
des jeux simultans information complte. Lorsque le jeu est dynamique, la simultanit des
choix n'est plus possible, car au moins l'un des joueurs a l'opportunit de ragir aux choix des
autres joueurs. Il est cependant possible d'utiliser le concept de l'quilibre de Nash, mais en
utilisant une nouvelle dfinition de la notion de stratgie. Cette dfinition doit pouvoir rtablir
la simultanit du choix des joueurs. Mais, l'application tel quel de l'quilibre de Nash aux
jeux dynamiques ne permet pas toujours d'carter des quilibres non crdibles. Pour liminer
ces derniers, on introduit un raffinement de l'quilibre de Nash et on obtient ainsi l'quilibre
de Nash parfait. Il sagit de la perfection en sous-jeux (subgame perfection).
Pour qu'un profil de stratgies soit un Equilibre de Nash Parfait, il faut non seulement qu'il
soit un quilibre de Nash, mais galement il faut qu'il satisfasse une contrainte

51

supplmentaire, savoir celle du principe de rationalit squentielle. Selon ce principe, un


quilibre doit spcifier un comportement optimal partir de n'importe quel point du jeu.
Dfinition (Selten, 1965) : Un quilibre de Nash est parfait si les stratgies des joueurs
constituent un quilibre de Nash dans tous les sous-jeux du jeu.50
Proposition : Tout jeu dynamique fini information complte (nombre fini de joueurs ayant
un nombre fini de stratgies) admet un quilibre de Nash parfait, possiblement en stratgies
mixtes.
Pour montrer cela, rappelons qu'un jeu dynamique (qu'il soit information parfaite ou
information imparfaite) peut tre reprsent par la forme normale tout comme un jeu statique
information complte. Or, on a vu que tout jeu fini simultan information complte admet
un quilibre de Nash, possiblement en stratgies mixtes. En second lieu, un jeu dynamique
fini information complte a un nombre fini de sous-jeux.

3.3.1. Reprsentation d'un jeu dynamique par la forme normale


Rappelons que le concept d'quilibre de Nash a t dfini pour des jeux sous forme normale
o les joueurs prennent leur choix de faon simultane. Pour ces jeux, on n'a introduit aucune
diffrence entre action et stratgie, de sorte que l'ensemble des stratgies d'un joueur est tout
simplement l'ensemble des actions ou choix disponibles. Dans un jeu dynamique, la
simultanit des choix n'existe plus car au moins un des joueurs peut ragir aux dcisions des
autres joueurs. On peut cependant retrouver la simultanit des choix et donc la forme
normale si on donne une nouvelle dfinition la notion de stratgie. Dans un jeu dynamique,
une stratgie devient un plan complet d'actions, comme le prcise la dfinition suivante :
Dfinition de la stratgie : Dans un jeu dynamique, une stratgie pour un joueur est un plan
d'actions complet qui spcifie une action pour le joueur pour toutes les contingences possibles
(pour toutes les histoires possibles des tapes passes) et chaque tape o il doit jouer.
Pour illustrer cette dfinition, prenons le cas d'un dirigeant d'entreprise (le joueur 1) devant
s'absenter et laisser les instructions son adjoint pour par exemple poursuivre la ngociation
d'un contrat. Une stratgie laisse l'adjoint doit lui permettre de jouer le jeu sans aucune
ncessit de se rfrer son responsable. La stratgie doit donc lui indiquer l'action choisir
pour chaque histoire possible du jeu.

3.3.2. Dtermination de l'Equilibre de Nash Parfait pour un jeu dynamique


information complte et parfaite
Pour pouvoir appliquer l'quilibre de Nash, nous devons considrer toutes les stratgies
possibles de chaque joueur, car la recherche de l'quilibre de Nash ncessite la dtermination
de la meilleure rponse d'un joueur toutes les stratgies possibles des autres joueurs.

50

Selten, R. (1975). "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games".
International Journal of Game Theory. Vol. 4. P 25-55.

52

Pour montrer comment passer de la forme extensive la forme normale en utilisant la


dfinition prcdente de la stratgie, considrons de nouveau le jeu squentiel de la figure 3.1.
Pour le joueur 1, il n'existe que deux stratgies possibles, autant que d'actions : L et R. Ceci
est le cas puisque jouant au dbut du jeu, le joueur 1 ne connat aucune contingence. Par
contre, le joueur 2 intervient dans 2 situations contingentes diffrentes : il peut observer soit L
soit R. Il peut choisir parmi 2 actions dans chaque contingence. De ce fait, le joueur 2 dispose
de 4 stratgies diffrentes et qui sont :51
-

Stratgie 1 que nous noterons par (U, U)


o Jouer U si le joueur 1 a choisi L.
o Jouer U si le joueur 1 a choisi R.

Stratgie 2 que nous noterons par (U, D)


o Jouer U si le joueur 1 a choisi L.
o Jouer D si le joueur 1 a choisi R.

Stratgie 3 que nous noterons par (D, U)


o Jouer D si le joueur 1 a choisi L.
o Jouer U si le joueur 1 a choisi R.

Stratgie 4 que nous noterons par (D, D)


o Jouer D si le joueur 1 a choisi L.
o Jouer D si le joueur 1 a choisi R.

Avec ces nouveaux espaces de stratgies des 2 joueurs, on obtient la forme normale du jeu
dynamique de la figure 3.1 laquelle on peut appliquer la procdure de recherche de
l'quilibre de Nash.
Joueur 2
Joueur 1

L
R

(U , U)
3;1
2;1

(U , D)
3;1
0;0

(D , U)
1;2
2;1

(D , D)
1;2
0;0

Figure 3.7

La rsolution du jeu en utilisant la forme normale fait apparatre deux quilibres de Nash :
(R, (D, U )) et (L, (D, D)) . L'quilibre de Nash (R, (D, U )) correspond la trajectoire en gras
de la figure 3.8a.
Le profil de stratgies (R, (D, U )) est un quilibre de Nash parfait pour deux raisons : 1)
L'quilibre de Nash (R, (D, U )) spcifie une stratgie complte (une action pour chaque
contingence) pour le second joueur ; 2) Cet quilibre constitue un quilibre de Nash dans tous
les sous-jeux du jeu.52

51

Voir galement Gibbons R. (1992). Page 118.


Remarquons qu'en plus du jeu lui-mme, ce jeu admet deux sous-jeux commenant au nud de dcision du
joueur 2.

52

53

L
2

3
1

1
2

U
2
1

0
0

3
1

1
2

Figure 3.8a

D
2
1

0
0

Figure 3.8b

Le deuxime quilibre de Nash (L, (D, D )) est dcrit dans la figure 3.8b. Dans cet quilibre, le
joueur 2 choisit D quelque soit le choix du joueur 1. Dans cette ventualit, le meilleur choix
du joueur 1 est L obtenant ainsi le paiement de 1 au lieu de 0. Mais cet quilibre n'est pas un
quilibre de Nash parfait car les stratgies des joueurs ne sont pas des quilibres de Nash dans
tous les sous-jeux. En effet, l'action D du joueur 2 faisant suite l'action R du joueur 1 n'est
pas la meilleure rponse du joueur 2. En effet, aprs R, la meilleure rponse du joueur 2 est U.
Autrement dit, l'action D si le joueur 1 choisit R n'est pas une action (ou menace) crdible. De
ce fait, l'issue (L, (D, D )) n'est pas un quilibre de Nash parfait, car il n'est pas un quilibre de
Nash dans tous les sous-jeux.
Relevons la diffrence existant entre l'issue obtenue par la mthode de Rcurrence vers
l'amont (figure 3.5) et l'quilibre de Nash parfait (figure 3.8a). Mme si les deux
mthodologies aboutissent au mme rsultat (le joueur 1 joue R et obtient un paiement de 2
et le joueur 2 joue U et obtient un paiement de 1), l'quilibre de Nash parfait s'exprime en
termes de stratgies alors de la rcurrence vers l'amont s'exprime en termes d'actions.

3.3.3. Le jeu de prdation (guerre des prix)


Cette situation de jeu fait intervenir 2 firmes, la firme E (Entrant) souhaitant entrer dans un
march et la firme I (la firme en place) ayant actuellement le monopole ou la domination du
march.53 Si la firme E dcide d'entrer dans le march, la firme I peut ragir (rpondre) de
l'une des deux manires suivantes :
- La firme I peut tolrer la prsence de la firme E en lui laissant une part du march
et par consquent laissant inchang le niveau des prix ;
- La firme I peut tre hostile la prsence de la firme E en engageant une guerre des
prix (dumping) occasionnant des pertes (ou faisant rduire les bnfices) pour les deux
parties.
Cette situation de jeu peut tre reprsente sous les formes normale et extensive suivantes :

53

Voir aussi Mas-Colell, Whinston and Green (1995). Page 273.

54

Firme E (joueur 1
Out

In

Firme I
Hostile si
la firme E
choisie "In"

Tolre si
la firme E
choisie "In"

Out

0;2

0;2

In

-2 ; 0

1;1

Firme I (joueur 2)

0
2

Hostile

-2
0

Tolre

Firme E

1
1

Figure 3.9b

Figure 3.9a

En se basant sur la forme normale, on relve que ce jeu admet deux quilibres de Nash :
s E* , s I* = (Out , Hostile si la firme E choisit "In") ;
-

(
(s

*
E

)
, s ) = (In , Tolrer si la firme E choisit "In").
*
I

L'analyse du jeu partir de la forme extensive montre cependant que le premier quilibre n'est
pas une prdiction raisonnable. En effet, cette forme de prsentation du jeu fait bien ressortir
que si la firme E choisie "In", alors la meilleure rponse de la firme I est de tolrer car elle
obtiendra ainsi un paiement de 1 au lieu de 0. En d'autres termes, la stratgie de la firme I "
Hostile si la firme E choisie "In"" n'est pas crdible.
La crdibilit est ainsi une restriction naturelle imposer lquilibre de Nash. Elle consiste
carter les quilibres de Nash (qui sont dtermins partir de la forme normale) qui spcifie
une action non optimale de lun quelconque des joueurs. Dans ce jeu, le seul quilibre de
Nash parfait est donc le profil de stratgies (In, Tolrer si la firme E choisit "In").
Ainsi, pour liminer les prdictions non raisonnables (ici, le profil de stratgies (out, Hostile si
la firme E choisie "In")) les stratgies jouer l'quilibre doivent satisfaire la principe de la
rationalit squentielle. Pour qu'un quilibre soit acceptable, il doit spcifier des actions
optimales en tout point du jeu. Il s'agit d'une condition supplmentaire qui est l'exigence de
rationalit squentielle. En d'autres termes, lorsqu'il revient un joueur le tour de jouer, sa
stratgie doit tre optimale partir de ce point tant donne l'information dont il dispose sur
les stratgies des autres joueurs.
Pour identifier les quilibres de Nash dsirables, c'est--dire les quilibres de Nash satisfaisant
la condition de rationalit squentielle, on dtermine la stratgie optimale partir de la fin de
l'arbre de jeu. On obtient ensuite la stratgie optimale l'tape antrieure tant donn le
rsultat de la dernire tape et ainsi de suite jusqu'au dbut du jeu. Cette procdure de
Rcurrence vers l'amont (Backwards Induction) est drive directement de la condition de
rationalit squentielle car elle assure que les stratgies des joueurs sont optimales chaque
tape du jeu.
Pour dterminer un quilibre de Nash parfait, on commence donc par identifier les plus petits
sous-jeux contenant les nuds terminaux. On remplace par la suite ces plus petits sous-jeux
par les paiements correspondant l'quilibre de Nash. Les nuds initiaux de ces sous-jeux
deviennent les nuds terminaux du jeu tronqu des plus petits sous-jeux. On renouvelle la

55

mme procdure pour le nouveau jeu (le jeu tronqu). En appliquant cette mthode de
Rcurrence vers l'amont pour tout l'arbre de jeu, on obtient l'quilibre de Nash parfait (SPNE)
car les stratgies des joueurs constituent un quilibre de Nash dans tous les sous-jeux.
Dans le jeu de prdation, on peut donc remplacer le sous-jeu de la firme I par son rsultat.
Comme le montre la figure 3.10, on obtient ainsi la forme extensive rduite du jeu o le choix
optimal de la firme E, "In", devient plus ais dterminer.
Firme E
Out

In

0
2

1
1
Figure 3.10

3.4.

Jeux rpts

Dans un jeu squentiel, les joueurs jouent tour de rle. Dans un jeu rpt, les joueurs jouent
simultanment de faon rpte. Un des principaux thmes de la rptition d'un jeu est qu'une
menace / promesse future crdible peut avoir une influence sur le comportement prsent. La
rptition du jeu peut donc changer lquilibre du jeu. On montrera par exemple comment et
dans quelles conditions la rptition du jeu du free riding (ala moral) favorise t-elle la
coopration entre les joueurs.
Pour faire ressortir ces implications, nous commencerons par le cas d'un jeu rpt deux fois,
puis nous aborderons le cas d'un jeu infiniment rpt. Notons par G(T ) , le jeu simultan G
rpt T fois et o l'issue de toutes les tapes passes est observe par les joueurs avant le
droulement de n'importe quelle tape. De mme, notons par G(, ) , le jeu G(T ) avec
T et o les joueurs ont en commun le facteur d'actualisation subjectif . Avec r > 0
1
reprsentant le taux dintrt subjectif, on a =
. Le facteur dactualisation subjectif
1+ r
reprsente donc limpatience de la consommation des individus, cest--dire la prfrence des
individus pour la consommation prsente la consommation future.

3.4.1. Jeux rpts deux fois


Soit le jeu sous forme normale de la figure 3.11 du type du dilemme du prisonnier.54 Ce jeu
admet un seul quilibre de Nash en stratgies pures (en stratgies strictement dominantes),
soit (Avouer, Avouer) et le paiement des deux joueurs est (3; 3).

54

Il sagit du jeu reprsent dans la figure 1.1 en ayant rajout 8 chaque paiement. Lobjectif recherch est
seulement dobtenir une prsentation plus commode avec des nombres non ngatifs. On peut aisment montrer
que lquilibre dun jeu ne change pas lorsquon rajoute le mme scalaire identiquement tous les paiements
dun jeu.

56

Prisonnier 1

Ne pas avouer
Avouer

Prisonnier 2
Ne pas avouer
6,6
7,0
Figure 3.11

Avouer
0,7
3,3

Considrons maintenant que ce jeu est jou une deuxime fois par les mmes joueurs qui
auront pralablement observ le rsultat de la premire issue du jeu.
Pour dterminer l'quilibre parfait, on suivra la procdure de Rcurrence vers l'amont
(Backwards Induction). On dtermine en premier lieu l'quilibre de la deuxime tape et son
rsultat sera intgr au jeu de la premire tape. Les deux joueurs anticipant le rsultat de la
seconde tape, soit (Avouer, Avouer) avec un paiement pour les deux joueurs gal (3, 3), le
dilemme du prisonnier jou 2 fois revient au jeu suivant jou une seule fois :

Prisonnier 1

Ne pas avouer
Avouer

Prisonnier 2
Ne pas avouer
9,9
10 , 3
Figure 3.12

Avouer
3 , 10
6,6

Les lments de la matrice des paiements de ce jeu sont les lments de la matrice des
paiements du jeu du dilemme du prisonnier auxquels on rajoute les paiements (3, 3), rsultat
de l'quilibre de Nash de la seconde tape (on nglige ici l'actualisation des paiements futurs).
Ce dernier jeu admet un seul quilibre de Nash, soit le profil de stratgies (Avouer, Avouer)
avec un paiement pour les deux joueurs gal (6, 6). Ainsi, l'unique quilibre parfait du
dilemme du prisonnier jou deux fois est le profil de stratgies (Avouer, Avouer) la
premire et la seconde tapes.
Proposition : Si le jeu G admet un quilibre de Nash unique, alors pour tout T fini, le jeu G(T)
admet un seul quilibre parfait : l'quilibre de Nash du jeu G est jou chaque squence.
L'exemple du dilemme du prisonnier rpt deux fois prsente la caractristique particulire
selon laquelle le jeu n'admet qu'un seul quilibre de Nash en stratgies pures. L'implication de
cette dernire est que le jeu rpt 2 (ou T) fois n'admet qu'un seul quilibre parfait dans
lequel l'quilibre de Nash du jeu est rpt 2 (ou T) fois.

3.4.2. Jeux infiniment rpts


Comme pour les jeux rpts un nombre fini de fois, dans la classe des jeux infiniment
rpts, une importance capitale est accorde au thme de la crdibilit des
menaces/promesses et leur influence sur le comportement prsent. Un rsultat important est
obtenu dans le cas d'un jeu infiniment rpt G(, ) . En effet, dans cette classe de jeu,
lorsque le jeu G a un quilibre de Nash unique, le jeu G(, ) peut avoir un quilibre de Nash
parfait o aucune tape du jeu, l'quilibre de Nash du jeu G n'est jou.

57

A titre dillustration, considrons le jeu de free riding (ala moral) du chapitre 1 dans lequel
chacun des deux joueurs a le choix entre travailler et ne pas travailler (tricher). Rappelons que
la matrice des paiements de ce jeu est la suivante :

Joueur 1

Travailler
Tricher

Joueur 2
Travailler
1,1
2 , -1

Tricher
-1 , 2
0,0

Figure 3.13

Considrons que ce jeu soit rpt un nombre infini de fois et quil soit information parfaite,
c'est--dire qu'avant de jouer la tme tape, les deux joueurs observent (et gardent en
mmoire) le rsultat de toutes les (t-1) tapes prcdentes.
En appelant t le paiement reu l'tape t et < 1 le facteur d'actualisation subjectif,
suppos constant et commun aux deux joueurs, la valeur actuelle des paiements d'un jeu
infiniment rpt est :

1 + 2 + 2 3 + L = t 1 t
t =1

Nous montrons que dans ce jeu rpt infiniment, la coopration entre les joueurs toutes les
tapes du jeu peut tre la solution optimale. En d'autres termes, bien que (Tricher, Tricher)
soit l'unique quilibre de Nash du jeu jou une seule fois, les joueurs peuvent choisir
(Travailler, Travailler) toutes les tapes du jeu infiniment rpt. Ce rsultat se base sur
l'ide selon laquelle si les joueurs jouent la coopration aujourd'hui, alors les quilibres futurs
procureront des paiements levs. Sinon, les quilibres futurs procureront des paiements
futurs plus faibles. Considrons pour cela la stratgie suivante du joueur i :
Jouer Travailler la premire tape. A ltape t, jouer encore
Travailler si le rsultat des (t-1) prcdentes tapes est (Travailler,
Travailler). Sinon jouer Tricher .
Cette stratgie est un exemple de stratgie de coopration (trigger strategy).55 Le joueur i
coopre jusqu' ce qu'il constate que l'autre joueur ne coopre plus. Si les deux joueurs
adoptent cette stratgie, alors ils recevront un paiement gal 1 toutes les tapes du jeu
infiniment rpt. Nous montrons que, la condition que le facteur d'actualisation soit
suffisamment proche de 1, jouer la stratgie de coopration par les deux joueurs constitue un
quilibre de Nash du jeu infiniment rpt. De plus, cet quilibre de Nash est parfait
(Subgame-perfect).
Pour montrer que la stratgie de coopration (trigger strategy) est un quilibre de Nash,
supposons que le joueur 2 a adopt cette stratgie de coopration. Nous montrons alors que (
la condition que le facteur d'actualisation soit suffisamment proche de 1), la meilleure
rponse du joueur 1 est d'adopter lui galement cette stratgie. Etant donn que le joueur 2
choisit de cooprer, si le joueur 1 accepte de cooprer, il recevra un paiement gal 1 toutes
les tapes du jeu infiniment rpt.
55

Appele galement stratgie de dclic.

58

La valeur actuelle de ces paiements est :

Vc = 1 + 1 + 1 2 + L = 1 + + 2 + L =

1
1

L'autre possibilit est la dviation vers la non coopration. Considrons que cette dviation
commence ds la premire tape.56 Dans cette alternative, le joueur 1 joue Tricher, ce qui lui
donne un paiement gal 2, car l'issue est (Tricher, Travailler). L'issue de cette premire
phase tant diffrente de (Travailler, Travailler), le joueur 2, conformment la stratgie de
coopration, jouera Tricher toutes les tapes futures. La meilleure rponse du joueur 1 est
dans ce cas Tricher, ce qui lui donne un paiement de 0 la deuxime tape et toutes les
tapes venir. Ainsi, en choisissant de ne pas cooprer, le joueur 1 obtient un paiement de 2
la premire phase et un paiement de 0 pour toute la dure restante (infinie) du jeu. La valeur
actuelle de ces paiements est :
Vnc = 2 + 0 + 0 2 + L = 2

Ainsi, tant donn que le joueur 2 adopte la stratgie de coopration, la meilleure rponse du
1
joueur 1 est galement la stratgie de coopration si et seulement si Vc > Vnc , soit si
> 2.
1
1
Cette condition implique > , soit r < 1 .
2
Ainsi, choisir Travailler la premire phase et galement toutes les phases ultrieures ( la
condition d'avoir observ (Travailler, Travailler) lors des tapes prcdentes est la meilleure
1
rponse du joueur 1 la stratgie de coopration du joueur 2 si et seulement si > . La
2
mme dmarche s'applique au joueur 2. En conclusion, l'issue (Travailler, Travailler) toutes
1
les phases du jeu est un quilibre de Nash du jeu infiniment rpt si et seulement si > .
2
La stratgie de coopration consiste pour chaque joueur prendre l'initiative de la coopration
et poursuivre la coopration si l'autre joueur a galement fait le premier pas de la coopration.
Cette initiative comporte une menace crdible de retourner la non coopration si l'autre
joueur n'a pas pris l'initiative de la coopration. La crdibilit de cette menace provient du fait
que la non coopration pour le jeu statique G est un quilibre de Nash.
Chacun des deux joueurs dispose donc de deux alternatives (cooprer et ne pas cooprer)
reprsentant deux sries de revenus (utilits) futurs infinis. Pour les comparer, considrons la
diffrence de revenus (utilits) de la troisime alternative (fictive) reprsentant la diffrence
"Cooprer Ne pas cooprer" telle qu'elle apparat dans la figure ci-dessous :

56

On peut montrer que le rsultat ne change pas si la dviation apparat une tape ultrieure.

59

t=

Cooprer

Ne pas cooprer

"Cooprer Ne pas
cooprer"

-1

+1

+1

+1

Figure 3.14

1
La valeur Actuelle Nette de cette troisime alternative (fictive) est gale 1 + . De ce fait,
r
la coopration, soit l'issue (travailler, travailler) toutes les tapes devient prfrable pour les
1
deux joueurs si 1 + > 0 , c'est--dire si r < 1. Un taux d'intrt subjectif faible (en fait ici
r
infrieur 1) signifiant une plus forte prfrence pour la consommation future, la stratgie de
coopration est un quilibre de Nash lorsque l'impatience pour la consommation prsente est
faible.

En d'autres termes, si le joueur 1 dvie de la coopration sachant que le joueur 2 a choisi la


coopration, alors il obtient un gain net de 1 la premire tape du jeu et une perte nette de 1
1
chacune des tapes futures du jeu. Cette dviation n'est profitable que si < , c'est--dire
2
si r > 1 . A ce taux (suprieur 100%), l'individu obtient un gain net de 1 la premire tape
qu'il peut investir perptuit, ce qui lui permet de gagner plus de 1 chaque tape future,
compensant ainsi la perte nette de 1 rsultant de la dviation.
On a montr que la stratgie de coopration dans un jeu infiniment rpt est un quilibre de
Nash. Il s'agit ici d'une variante du rsultat suivant : Une menace / promesse crdible
concernant un comportement futur peut influencer le comportement prsent. Nous devons
maintenant nous assurer que la stratgie de coopration est bien un quilibre de Nash parfait
(Subgame-Perfect Nash Equilibrium SPNE). Nous devons donc nous assurer que cette
stratgie respecte le principe de rationalit squentielle, principe selon lequel un quilibre de
Nash doit spcifier un comportement optimal n'importe quel point du jeu. Nous devons donc
montrer que tous les sous-jeux de cette stratgie sont galement des quilibres de Nash.
La figure suivante montre que dans le jeu infiniment rpt tudi, tout sous-jeu est identique
au jeu infiniment rpt. Elle montre galement que les sous-jeux peuvent tre classs en deux
groupes :
- Le premier groupe est constitu de tous les sous-jeux dont les rsultats des phases
prcdentes sont tous (Travailler, Travailler) ;
- Le second groupe est constitu de tous les sous-jeux dont au moins un des rsultats
prcdents diffre de (Travailler, Travailler).

60

1
Tricher

Travailler
2

Tricher

Travailler

Tricher

Travailler

Figure 3.15

Si les deux joueurs adoptent la stratgie de coopration dans le jeu infiniment rpt, alors :
- Dans les sous-jeux du premier groupe, la stratgie des deux joueurs est galement
la stratgie de coopration qui, comme on l'a montr, est un quilibre de Nash ( la
1
condition que > ) ;
2
- Dans les sous-jeux de la seconde catgorie, les deux joueurs vont rpter
infiniment (Tricher, Tricher), qui constitue galement un quilibre de Nash.
Ainsi, la stratgie de coopration est un quilibre de Nash parfait du jeu de free riding rpt
infiniment.
Comme soulign plus haut, le jeu de free riding (ala moral) est un cas du modle du dilemme
du prisonnier dont la reprsentation gnrale est, avec < < < .

Joueur 1

Joueur 2
Travailler
,

Travailler

tricher

Tricher
,

Figure 3.12

Dans ce cas, on a Vc = + + 2 + L =
condition Vc > Vnc scrit

> +

et Vnc = + + 2 + L = +

, ce qui donne 1 > >

. La

La gnralisation de ce rsultat a donn lieu au thorme suivant :


Thorme de Friedman (1971) :57 Soit G un jeu fini et statique information complte.
Notons par (e1 ,L, en ) le vecteur des paiements des n joueurs correspondant l'quilibre de

Nash du jeu G et (x1 ,L, xn ) un vecteur quelconque des paiements des n joueurs appartenant

57

Friedman, J. (1971). A non-cooperative Equilibrium for Supergames. Review of Economic Studies. Vol. 38.
P 1-12.

61

l'ensemble des paiements ralisables du jeu G. Si xi > ei pour tout joueur i, et si le facteur
d'actualisation est suffisamment proche de 1, alors il existe un quilibre de Nash parfait
(Subgame Perfect Nash Equilibrium SPNE) du jeu infiniment rpt G(, ) qui permet
d'obtenir le vecteur (x1 ,L, xn ) comme paiements moyens des n joueurs.58

3.4.3. Application : la collusion dans un duopole en quantit


Reconsidrons le modle de duopole de Cournot avec les donnes simplifies suivantes :
- La quantit totale est Q = q1 + q2
- Le prix de march est P(Q) = a Q avec Q < a
- Le cot unitaire de production est c, commun aux deux firmes.
On a ainsi i = qi (P c) = qi (a q1 q2 c ) pour i = 1 , 2
Nous avons vu que dans le modle de duopole de Cournot, l'quilibre de Nash, la quantit
ac
offerte par chacune des 2 firmes est q1 = q 2 = qC =
. La quantit totale est dans ce cas
3
2(a c )
ac
, suprieure la quantit totale en cas de monopole Qm =
. Le profit du
QC =
2
3
d
monopole est m = Qm (a Qm c) . Il est maximum lorsque m = a 2Qm c = 0 , soit
dQm

lorsque Qm =

ac
.
2

Etant donn que QC > Qm , chacune des deux firmes peut obtenir un profit plus lev si elle
Qm a c
=
au lieu de la quantit de
2
4
Q
(a c )2 et en cas de
ac
. (En cas de quantit m , le profit de l'entreprise est
Cournot qC =
3
2
8

pouvait produire la moiti de la quantit de monopole

quantit QC , il est de

(a c )2 ). On montre que cela est possible avec la rptition du jeu et la


9

collusion entre les deux firmes.


Considrons pour cela le jeu du duopole de Cournot infiniment rpt o chaque tape, les
deux firmes observent le rsultat de toutes les tapes prcdentes. L'objectif est de dterminer
les valeurs du facteur d'actualisation subjectif , commun aux deux entreprises, pour
lesquelles la stratgie suivante des deux firmes en situation de duopole constitue un quilibre
de Nash parfait :
Qm
la premire priode. A la
2
Q
Q
priode t, produire m si chacune des 2 firmes a produit la quantit m chacune
2
2

Produire la moiti de la quantit totale de monopole

des (t-1) prcdentes priodes. Sinon, produire la quantit de Cournot qC .


58

Voir galement la notion de Folk theorem. Tirole J (1988). Page 268.

62

Lorsque chacune des deux firmes produit la moiti de la quantit de monopole


elle obtient un profit not

m
2

Qm a c
=
,
2
4

gal :

2
Qm
a c (a c )
ac
a c
= (Pm c )
= ((a Qm ) c )
= a
c
=
2
2
2
8
4
4

Nous avons dj vu que, lorsque chacune des deux firmes produit la quantit de Cournot, elles
2
(
a c)
obtiennent chacune un profit gal C =
.
9
Dterminons maintenant le profit que peut obtenir la firme j si elle dviait de la moiti de la
quantit de monopole

Qm
Q
sachant que l'autre firme choisit de produire m . Etant donn que
2
2

quelque soit le niveau de cette dviation, l'autre firme aura toujours la mme raction, c'est-dire revenir la quantit de Cournot, la firme j choisit la dviation qui maximise son profit,
c'est--dire la quantit qui satisfait le programme suivant :
1

Max a q j Qm c q j
2
qj

La solution est q j =

3(a c )
et le profit rsultant de cette dviation est :
8

3(a c ) 9(a c )

3(a c ) a c
+
d = a
c
=
4
64
8
8

Ainsi, choisir la collusion (trigger strategy) est un quilibre de Nash si et seulement si


1
1

, soit si et seulement si :
C < m
d +
1
2
1

(a c ) 1
(a c )
9(a c )
<
+
64
1
9
8 1
2

Ce qui donne >

8
9
, soit r < 0,9 .
17
9

En suivant la mme dmarche que dans le cas du dilemme du prisonnier infiniment rpt, on
montre que la collusion est un quilibre de Nash parfait, car elle constitue un quilibre de
Nash dans tous les sous-jeux.

63

Chapitre 4 : Jeux simultans information incomplte


Dans la classe des jeux statiques (simultans) en information complte tudie au chapitre 1,
les fonctions de paiement de tous les joueurs sont une information commune. Chaque joueur
connat la fonction de paiement de tous les autres joueurs et sait que tous ces autres joueurs
savent qu'il connat leur fonction de paiement. Dans le prsent chapitre, nous introduisons la
possibilit qu'au moins un des joueurs soit face une incertitude concernant la fonction de
paiement des autres joueurs. Nous abordons ainsi la classe des jeux statiques en information
incomplte appels jeux baysiens. Dans cette classe de jeu, l'information prive dtenue par
le joueur i et non observe par les autres joueurs est appele le type du joueur i.
Un des exemples classiques de jeux en information incomplte est le mcanisme des
enchres. Dans l'enchre sous pli cachet, chaque joueur (enchrisseur) connat sa propre
valuation pour l'objet en vente mais ne connat pas l'valuation pour l'objet des autres
enchrisseurs (joueurs)59. Les enchres tant faites sous pli cachet, aucun des enchrisseurs
ne connat l'offre des autres joueurs. Les choix des enchrisseurs peuvent donc tre considrs
comme tant simultans. De ce fait, l'enchre sous pli cachet est typiquement un jeu statique
(simultan) en information incomplte.
Ce chapitre est organis comme suit :
- Exemples de jeux baysiens : jeu de free riding et duopole de Cournot avec
asymtrie de l'information ;
- La forme normale d'un jeu statique baysien (jeu statique information
incomplte) ;
- L'quilibre de Nash baysien ;
- Application de jeux statiques baysiens : Le modle de Cournot selon la dmarche
de Harsanyi.60

4.1.

Exemples de jeux baysiens : jeu de free riding et duopole de Cournot


avec asymtrie de l'information

Dans ce chapitre, nous abordons les jeux information incomplte, cest dire les jeux o au
moins un joueur i a une caractristique pertinente pour le jeu qui est son information prive.
Cette caractristique, symbolise par ti , nest pas observable par les autres joueurs.
Les deux exemples de cette section font ressortir trois caractristiques importantes des jeux
statiques en information incomplte :
Le joueur i a une information prive ti quil est le seul observer. Les autres
joueurs ont des croyances propos de cette information prive, croyances
reprsentes par une distribution de probabilit dont le support est ti .
La stratgie des joueurs dpend de leur type, ce qui donne l'expression si (ti ) .
Le paiement prend la forme d'une esprance de paiement (esprance dutilit).
59

Sauf videmment en cas de collusion entre cet enchrisseur et le vendeur ou des autres acheteurs.
Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
June 1995.

60

64

A la suite de Harsanyi (1967-1968), on considre que la caractristique ti est la ralisation


dune variable alatoire et reprsente le rsultat du mouvement dun nouvel agent (fictif), la
Nature.61 Pour cette approche des jeux statiques information incomplte, on considre que la
Nature joue en premier lieu en procdant au tirage alatoire du type ti Ti du joueur i. La
valeur de ti est rvle (observe) seulement au (par le) joueur i qui devient donc son
information prive. Les autres joueurs n'observent pas ti .
La dmarche propose par Harsanyi consiste donc interprter un jeu statique information
incomplte en un jeu dynamique information imparfaite.62 De plus, les croyances des
joueurs tant rvises aprs le mouvement de la nature par application de la formule de Bayes,
les jeux de cette classe sont galement appels jeux baysiens.

4.1.1. Jeu de free riding avec asymtrie de l'information


Pour illustrer cette rinterprtation du jeu statique en information incomplte en un jeu
dynamique en information imparfaite, reprenons l'exemple du free riding. Supposons d'abord
que le joueur 1 ressente un cot psychologique de 2 en quivalent montaire s'il venait ne
pas travailler sachant que le joueur 2 a travaill. L'existence de ce cot psychologique pour le
joueur 1 est connaissance commune du jeu, c'est--dire qu'il n'existe aucune asymtrie
d'information concernant le cot psychologique du joueur 1.63
L'asymtrie d'information que nous introduisons dans le modle de free riding porte sur
l'incertitude qu'a l'individu 1 concernant les prfrences de l'individu 2. Cette incertitude
concerne l'existence d'un cot psychologique que pourrait ressentir l'individu 2 s'il venait ne
pas travailler. Lincertitude qua lindividu 1 propos des prfrences de lindividu 2 donne
lieu des croyances qui prennent la forme dune distribution de probabilit. Cest ainsi que
pour lindividu 1 :

Avec probabilit , l'individu 2 ne ressent aucun cot psychologique ne pas


travailler. Dans ce cas, la matrice des gains du jeu est la suivante :
Joueur 2
Joueur 1

Travailler
Ne pas travailler

Travailler
1;1
0 ; -1

Ne pas travailler
-1 ; 2
0;0

Figure 4.1a

61

Avec probabilit (1 ) , l'individu 2 ressent un cot psychologique de 2 en


quivalent montaire s'il ne travaille pas. Dans ce cas, la matrice des gains du jeu
est la suivante :

Harsanyi, John. Games with Incomplete Information Played by Bayesian Players . Management Science,
I, II et III. 1967, 1968.
62
Rappelons que linformation est imparfaite lorsque le joueur ne connat pas toute lhistoire du jeu.
63
Ce modle est une variante du modle du dilemme du prisonnier avec incertitude sur les prfrences. Voir
Mas-Colell, Whinston & Green (1995).

65

Joueur 2
Joueur 1

Travailler
1;1
0 ; -1

Travailler
Ne pas travailler

Ne pas travailler
-1 ; 0
0 ; -2

Figure 4.1b

Suivant la dmarche de Harsanyi, ce jeu statique information incomplte peut tre interprt
comme tant un jeu dynamique information imparfaite. Ainsi, la premire tape (premier
mouvement) du jeu est ralise par la Nature qui il revient de choisir par tirage alatoire du
type (I ou II) du joueur 2. Ce mouvement est observ par le joueur 2, c'est--dire que ce
joueur connat son type. Mais le joueur 1 n'observe pas le choix de la nature. Tout au plus, il
dispose des croyances ( , 1 ) propos du choix alatoire de la Nature. Lintroduction de la
Nature permet de modliser une situation o le joueur 2 connat son type (I ou II) et le joueur
1 ne connat pas le type du joueur 2 mais sait que le joueur 2 peut tre du type I avec
probabilit ou du type II avec probabilit (1 ) . La reprsentation de ce jeu sous la forme
extensive est la suivante :
Nature

Type I

Joueur 1

Type II

NPT

NPT

Joueur 2
T
1
1

Joueur 2

NPT
-1
2

T
0
-1

Jeu simultan

Joueur 1

Joueur 2 (type I)
T
NPT
T
1;1
-1 ; 2
NPT
0 ; -1
0;0
Figure 4.2 b

NPT
0
0

NPT

1
1

-1
0

Figure 4.2 a

T
0
-1

NPT
0
-2

Jeu simultan

Joueur 1

Joueur 2 (type II)


T
NPT
T
1;1
-1 ; 0
NPT
0 ; -1
0 ; -2
Figure 4.2 c

Lellipse de haut signifie que le joueur 1 ne connat pas le rsultat du tirage alatoire de la
Nature. La rsolution du jeu commence par le joueur 2. Celui-ci connat son type (observe le
choix de la Nature). S'il est du type I, il choisira de ne pas travailler (stratgie strictement
dominante) et s'il est du type II, il choisira de travailler (stratgie strictement dominante). En
d'autres termes, le choix de la stratgie par le joueur i dpend de son type, d'o l'criture de la

66
stratgie du joueur i sous la forme si (ti ) . Etant donns ces choix du joueur 2, la forme
extensive du jeu se rduit :
Nature

Type I
T
-1
2

Joueur 1

Type II

NPT
0
0

Figure 4.3

1
1

NPT
0
-1

Se basant sur ses croyances, le joueur 1 choisit l'action qui maximise son esprance de
paiement. Le choix de la stratgie "travailler" lui donne une esprance de gain gale
1 + 1 (1 ) = 1 2 . Le choix de la stratgie "ne pas travailler" lui donne une esprance
de paiement gale 0 + 0 (1 ) = 0 . L'individu choisira de travailler si 1 2 > 0 , soit si
1
1
1
< et choisira de ne pas travailler si 1 2 < 0 , soit si > . Si = , l'individu 1 sera
2
2
2
indiffrent entre travailler et ne pas travailler. Remarquons que cette mthode de rsolution
est similaire celle de la rcurrence vers l'amont. De plus, l'introduction de la Nature revient
considrer comme si chaque type de joueur est un joueur part entire (player-centred
approach). Ici, cest comme si le joueur 1 avait face lui deux joueurs diffrents, le type I du
joueur 2 et le type II du joueur 2.

4.1.2. Duopole de Cournot avec asymtrie de l'information


On peut modifier le modle de duopole de Cournot en introduisant l'asymtrie de
l'information en considrant par exemple que la firme 1 a une incertitude quant au cot
marginal c2 de la firme 2. Elle estime que celui-ci peut tre gal cH (cot lev) ou cL
(cot faible) avec respectivement les probabilits et (1 ) . Pour la firme 1, la firme 2
peut donc avoir l'une des deux diffrentes fonctions de paiement (profit) possibles, soit :

2 (q1, q2 ; cH ) = q2 [(a q1 q2 ) cH ]
ou

2 (q1, q2 ; cL ) = q2 [(a q1 q2 ) cL ]

La firme 2 connat la valeur de son cot marginal et donc n'a aucune incertitude sur sa propre
fonction de paiement.

67

On peut par exemple considrer que la firme 2 n'a aucune incertitude quand c1 , la valeur du
cot marginal de la firme 1.64 Par consquence, pour la firme 2, la fonction de paiement de la
firme 1 demeure inchange, soit :

1 (q1, q2 ; c1 ) = q1 [(a q1 q2 ) c1 ]
On dira que l'espace des types de la firme 2 est T2 = {cL , cH } et l'espace des types de la firme
1 est T1 = {c1}.
A titre de simplification, considrons que t1 = a c1 = 1 , cest dire quil nexiste aucune
incertitude relative au cot c1 de la firme 1.65 En dautres termes, la firme 2 dispose dune
information complte sur la firme 1. Par contre, la firme 1 nest pas certaine de la valeur de
t2 = a c2 de la firme 2, cest dire du cot c2 de la firme 2. Elle a seulement des croyances a
3 1
5 1

posteriori sur t2 rsumes dans les probabilits suivantes : P t2 = = et P t2 = = .


4 2
4 2

3
5
Lorsque t2 = , la firme 2 est dite du type cH (cot lev) et lorsque 2 = , la firme 2 est
4
4
66
dite du type cL (cot faible).
Le duopole ainsi dcrit est un jeu baysien deux joueurs. Lquilibre de Nash baysien est le
vecteur de stratgies (q1* , q2H * , q2L* ) o q1* est la quantit optimale choisie par la firme 1, q 2H * la
quantit optimale choisie par la firme 2 lorsque celle-ci est du type cH et q 2L* la quantit
optimale choisie par la firme 2 lorsque celle-ci est du type cL .
La firme 2 choisit une quantit optimale en fonction de son type ( cH ou cL ), ce qui sexprime
par la fonction q2* (t2 ) . Cette quantit satisfait le programme de maximisation suivant :

Max 2 = q2 (t2 (q1 + q2 ))


q2

La condition du premier ordre, ncessaire et suffisante, de ce programme implique que :67


q2* (t2 ) =

t2 q1
2

Cette condition dquilibre scrit galement comme suit :

64

Lapplication de la section 4.4 considrera que les deux firmes ont une incertitude propos des cots du
concurrent.
65
Voir Fudenberg D. et Tirole J (1991.
66
Nous verrons plus loin que les probabilits a posteriori sont le rsultat d'une rvision baysienne des
probabilits a priori.
d 2 2
67
On a en effet
= 2 < 0 .
2
d q2

68

q 2H * =

3 4 q1
5 4 q1
et q2L* =
2
2

La firme 1 choisit la quantit optimale q1* en fonction de ses croyances sur la valeur de t2,
cest dire celle qui maximise son esprance de profit, soit :
Max 1 =
q1

[ ( (

1
q1 1 q1 + q2H
2

))] + 12 [q (1 (q
1

+ q2L

))]

La condition du premier ordre, ncessaire et suffisante, de ce programme implique que :

2 (q2H + q2L )
q =
4
*
1

Lquilibre de Nash baysien du jeu s'obtient par la combinaison des trois conditions
dquilibre, soit :

q1* =

2 q2H * + q2L*
4

3 4 q1* 5 4 q1*

2
+
2
2

=
4
q1* =

1
3

Ceci implique que :


H*
2

3 4 q1* 5
=
=
2
24

q2L* =

5 4 q1* 11
=
2
24

1 5 11
Lquilibre baysien est donc le vecteur de stratgies suivantes : (q1* , q2H * , q2L * ) = , , .
3 24 24

Ces deux exemples permettent de faire ressortir les principaux lments suivants des jeux
baysiens:
La dmarche propose par Harsanyi consiste introduire un joueur fictif, la
Nature, qui joue en premier en affectant chaque joueur son type aprs un tirage
alatoire. Lintroduction de la Nature et de la procdure du tirage alatoire
permettent de formaliser lasymtrie de linformation et les croyances des joueurs ;
Le type du joueur i n'est observ que par le joueur i. Les autres joueurs ont des
croyances sur le type du joueur i, reprsentes par une distribution de probabilit ;
Le joueur i choisit sa stratgie en fonction de son type, ce qui donne la fonction
si (ti ) ;

69

4.2.

Le joueur de type ti choisit la stratgie qui maximise son esprance d'utilit (de
gain), l'esprance tant calcule sur la base de ses croyances sur le type des autres
joueurs.

La forme normale d'un jeu statique information incomplte

Dans cette section, nous prsentons formellement la dmarche introduite par Harsanyi (19671968) et qui consiste considrer que la caractristique ti est la ralisation dune variable
alatoire et reprsente le rsultat du mouvement dun nouvel agent, la Nature. Cette approche
des jeux statiques information incomplte consiste considrer que la Nature joue en
premier lieu et procde au tirage alatoire du type ti Ti du joueur i. La valeur de ti est
rvle (observe) seulement au (par) le joueur i qui devient donc son information prive. Les
autres joueurs n'observent pas ti . Avec cette approche, on dfinit un jeu baysien dont le
timing est le suivant :
1. Il existe, avant tout dbut de jeu, une fonction de distribution (croyances) a
priori F (t ) donnant les probabilits jointes des types t = (t1 ,L, tn ) . Cette
distribution a priori est connaissance commune tous les joueurs ;
2. Le jeu commence par le mouvement de la Nature qui procde au tirage
alatoire du vecteur t = (t1 ,L, tn ) distribu selon F (t ) ;
3. La Nature rvle le type ti au seul joueur i ;

4. Connaissant F (t ) et ti , chaque joueur i peut en dduire des croyances a


posteriori f i (t i / ti ) sur la valeur t i du type des autres joueurs.
5. Chaque joueur choisit une stratgie de son espace S i . Ce choix se fait en
fonction du type ti rvl par la Nature, d'o l'on peut crire si (ti ) .
6. Chaque joueur i reoit un paiement qui dpend non seulement du profil de
stratgies pures s = (s1 ,L , sn ) , mais galement de sa caractristique prive
ti Ti . Elle prend donc la forme de l'esprance d'utilit E[ui (si , s i ; ti )] .68
t i

Remarquons que l'hypothse selon laquelle la distribution jointe a priori F (t ) est


connaissance commune est une hypothse forte. Elle est la base de l'existence des
probabilits subjectives (a posteriori) f i (t i / ti ) .
En introduisant un joueur fictif, la Nature, une situation de jeu statique information
incomplte est rinterprte comme tant un jeu dynamique information imparfaite. En
effet, lorsque la nature choisit (tire de faon alatoire) la caractristique (type) ti , les autres
joueurs i ne peuvent observer ce choix. Ils ne connaissent donc pas la totalit de l'histoire
du jeu. Cette extension du jeu par sa transformation en un jeu en information imparfaite
permet dappliquer la technique standard de la thorie des jeux, notamment le concept de
68

Cette approche est qualifie de player-centered. Voir J. Harsanyi, "games with incomplete information". The
American Economic Review. Vol 85, n 3; June 1995. Lautre approche quivalente est la type-centred
interprtation dveloppe la section 4.3.

70

lquilibre de Nash, sous rserve d'une nouvelle dfinition des concepts de stratgies et de
paiements.
Pour dterminer l'esprance de paiement lie au choix d'une stratgie, les joueurs doivent
spcifier les probabilits f i (t i / ti ) , ce qui ncessite le recours la formule de Bayes. Dans

l'approche de Harsanyi, connaissant son type ti et la distribution jointe F (t ) , chaque joueur


peut estimer la probabilit des types t i des autres joueurs en se rfrant la formule de
Bayes :
P(t i / ti ) =

P(t i , ti )
=
P(ti )

P(t i , ti )
P(ti , ti )

t i Ti

La formule de Bayes permet de rviser les probabilits (croyances) aprs avoir observ un
vnement donn. Pour expliciter cette formule (de Bayes), on utilise le schma suivant qui
reprsente deux ensembles (vnements) A et B non disjoints.
A

0,4

0,2

0,4

Figure 4.4

Etant donn que P( A) = 0,6 , P(B ) = 0,6 et P( A B) = 0,2 , on a P( A / B ) =

P ( A B ) 0,2 1
=
= .
P (B )
0,6 3

Joueur 2
t2

Probabilits
marginales

0,2

0,4

P(t1 = 5) = 0,6

0,3

0,1

P(t1 = 6) = 0,4

Probabilits
marginales

P(t2 = 3) = 0,5

P(t2 = 8) = 0,5

t1

Joueur 1

Figure 4.5

Pour illustrer le calcul des probabilits a posteriori, c'est--dire le processus de rvision des
probabilits, considrons par exemple la matrice de la figure 4.5 donnant les probabilits

71

jointes (probabilits a priori) de t1 et t 2 . Dans l'approche de Harsanyi, ces probabilits jointes


sont connaissance commune aux joueurs.
A la premire tape du jeu, la Nature procde au tirage alatoire des types des joueurs et
rvle chaque joueur i son type ti . Supposons que dans notre cas, la Nature tire le type 5 du
joueur informe le joueur 1 et le type 8 du joueur 2. Par la suite, chaque joueur en dduit ses
croyances rvises (probabilits a posteriori) en utilisant la formule de Bayes, ce qui donne :
Pour le joueur 1 (qui sait qu'il est du type t1 = 5 ) :
0,2 1
=
P(t2 = 3 / t1 = 5) =
0,6 3
0,4 2
=
P(t2 = 8 / t1 = 5) =
0,6 3
Pour le joueur 2 (qui sait qu'il est du type t2 = 8 ) :
0,4 4
=
P(t1 = 5 / t2 = 8) =
0,5 5
0,1 1
=
P(t1 = 6 / t2 = 8) =
0,5 5
Dans un jeu simultan (statique) en information incomplte, le joueur i connat son type ti
mais est incertain sur les types t i = (t1 ,L , ti1 , ti+1 ,L, t n ) des autres joueurs. Avec
l'introduction dans le jeu de l'incompltude de l'information, la fonction de paiement du
joueur i de type ti Ti est reformule ainsi : ui (s1 ,K , sn , ti ) . Le joueur i dispose de croyances
a posteriori sur les types t i , croyances rsumes dans la distribution de probabilit f i (t i / ti ) .
Lorsque les types ti sont indpendants, les distributions de probabilit f i (t i / ti ) ne dpendent
plus de ti et dans ce cas, les croyances a posteriori du joueur i s'crivent f i (t i ) .
Nous obtenons ainsi la dfinition suivante d'un jeu statique information incomplte.
Dfinition : Un jeu statique information incomplte (jeu baysien) est la donne :
De l'ensemble des joueurs : i = 1,L, n ;
Des espaces des stratgies pures des joueurs : S1 ,L, S n ;

Des espaces des types des joueurs : T1 ,L , Tn ;


Des croyances a posteriori des joueurs : f1 ,L, f n ;
Des fonctions de paiements des joueurs : u1 ,L, un

Avec f i = f i (t i / ti ) et ui = ui (s1 ,L, sn , ti ) .


Nous dnotons un tel jeu par

G = (S1 ,L, S n ; T1 ,L, Tn ; f1 ,L, f n ; u1 ,L, un )

ou par

G = (S1 ,L, S n ; u1 ,L, un ; T ; F ()) , sachant que T = T1 L Tn et que F (t ) est la distribution

jointe des types t = (t1 ,L , t n ) .

72

4.3.

L'quilibre de Nash baysien

La dmarche propose par Harsanyi pour analyser les jeux statiques information incomplte
consiste considrer ces derniers comme des jeux dynamiques information imparfaite
faisant intervenir un joueur fictif intervenant la premire tape du jeu, la Nature. Pour
appliquer le concept de l'quilibre de Nash un tel jeu, on commence par le mettre sous la
forme normale. Cela ncessite l'introduction d'une nouvelle dfinition de la notion de stratgie
qui est en fait similaire celle introduite pour les jeux dynamiques. Nous obtenons ainsi
l'quilibre de Nash baysien qui est un concept d'quilibre dfini pour la classe des jeux
simultans (statiques) information incomplte.
Comme indiqu par Harsanyi (1995), un jeu information incomplte peut tre analys en
considrant que le centre d'activit est soit le joueur soit les diffrents types de joueur.
Harsanyi qualifie la premire approche de player-centered interpretation et la seconde de
type-centered interpretation. En les utilisant de faon approprie, ces deux approches
s'avrent tre quivalentes (voir proposition ci-dessous).69

4.3.1. La stratgie dans un jeu baysien


Rappelons qu'une stratgie est un plan d'actions complet spcifiant les actions possibles du
joueur en toute circonstance o il peut avoir intervenir. Cette dfinition de la stratgie est en
fait similaire celle des jeux dynamiques. Selon le timing du jeu dfini plus haut, l'tape 2,
la Nature rvle chaque joueur i son type ti . Ainsi, une stratgie (pure) du joueur i doit
spcifier une action pour chaque type possible que pourrait lui rvler la Nature. Nous
obtenons ainsi la dfinition de la notion de stratgie.
Dfinition : Dans le jeu baysien (S1 ,L, S n ; u1 ,L, un ; T ; F ()) , une stratgie pure
contingente du joueur i est la fonction si (ti ) qui, pour chaque type possible ti Ti , spcifie
une action si Si que le joueur i choisira si le type ti venait tre tir par la Nature.

~
L'ensemble des stratgies pures contingentes Si du joueur i est donc l'ensemble de toutes les
fonctions si (ti ) .
Exemple : Si les actions possibles du joueur 1 sont A et B et ses types possibles sont tH et t L ,
alors l'ensemble de (toutes) ses stratgies s1 (t1 ) est :
~
s1 : A si tH et A si t L ;
~
s2 : A si tH et B si t L ;
~
s 3 : B si tH et A si t L ;
~
s 4 : B si t H et B si t L .

69

J. Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
June 1995.

73

~
s1 ; ~
s2 ; ~
s3 ; ~
s4 ) dont le cardinal est 4. Il peut sembler trange que la stratgie
On a donc Si = (~
du joueur i soit conditionnelle son type alors qu'il connat et observe son type. En fait, cette
dfinition de la notion de stratgie est une consquence de la dfinition de l'quilibre de Nash.
En effet, pour trouver l'quilibre de Nash, il faut que chaque joueur dtermine la stratgie qui
soit la meilleure rponse aux stratgies des autres joueurs. Mais pour qualifier une stratgie de
meilleure rponse, chaque joueur doit envisager toutes les stratgies possibles des autres
joueurs. Ainsi, mme si chaque joueur i connat son type ti , on doit envisager toutes les
valeurs de ti et les actions qui en dpendent car c'est la dmarche des autres joueurs quand ils
doivent dterminer leur(s) meilleure(s) rponses.

tH

tM

tL

s1

s2

s3

Figure 4.6

Considrons par exemple, le cas du joueur i dont l'espace des types est Ti = (t H , tM , t L ) et son
~
espace de stratgies S i = (s1 , s 2 , s 3 ) . Comme le montre la figure 4.6, le cardinal de Si , l'espace
des stratgies si (ti ) du joueur i, est 27. Pour tH , il existe 3 choix possibles ; s1, s2 et s3. Pour

chacun de ces 3 choix, il existe 3 choix possibles pour tM . Pour chacune de ces 9
combinaisons possibles, il existe 3 choix possibles pour t L . On obtient un espace de stratgies
possibles si (ti ) dont le cardinal est de 27.
Nous pouvons d'ores et dj introduire la distinction entre un quilibre sparant (separating
strategy) et un quilibre mlangeant (pooling strategy). Dans un quilibre sparant (figure
4.7a), chaque type ti Ti choisit une action diffrente de S i . Dans un quilibre mlangeant
(figure 4.7b), tous les types ti Ti choisissent la mme action si S i .

74

ti
si

t i1

ti 2

ti 3

ti
si

s i1

ti 2

ti 3

si1

si 2

si 2

si 3

t i1

si 3

Exemple dquilibre sparant

Exemple dquilibre mlangeant

Figure 4.7a

Figure 4.7b

Il est important de remarquer que dans la forme normale d'un jeu, le joueur i doit spcifier une
action pour chaque type ti possible et cela mme s'il connat son type. En effet, du fait de
l'existence de l'interdpendance stratgique entre les joueurs, le choix du joueur i dpend du
choix des autres joueurs. Or, ces derniers ignorent le type ti du joueur i. Ils doivent donc
considrer toutes les stratgies possibles pour les diffrents types ti du joueur i. Le jeu doit
donc spcifier les stratgies du joueur i pour tous les ti possibles. Cette dfinition de la
stratgie permet d'appliquer le concept de l'quilibre de Nash pour un jeu baysien, ce qui
donne l'quilibre de Nash baysien.

4.3.2. Lesprance de paiement dans un jeu baysien


Dans un jeu baysien, ti Ti est une information prive du joueur i. On dit que ti est le type
du joueur i. Il est observ uniquement par le joueur i. Pour tous les autres joueurs, ti est une
variable alatoire.
Le paiement du joueur i pour le profil de stratgies s = (s1 (t1 ),L , sn (t n )) = (si (ti ), si (t i )) prend
la forme de l'esprance de paiement :
u~i (s1 (t1 ),L , sn (t n )) = E [ui (s1 (t1 ),L , sn (t n ), ti )] = ui (s1 (t1 ),L , sn (t n ), ti ) P (t )
t T

P (t ) = P (t1 ,L , tn )

est

la

t T

probabilit

jointe

de

t = (t1 ,L, tn ) .

Le jeu baysien
~
~
(S1 ,L, S n ; u1 ,L, un ; T ; F ()) est ainsi mis sous la forme normale G = S1, L, Sn ; u~1,L, u~n .

4.3.3. L'quilibre de Nash baysien


Dans le cadre dun tel jeu, lquilibre baysien de Nash est dfini comme suit :
Dfinition: Un quilibre de Nash baysien pour le jeu baysien (S1 ,L , S n ; u1 ,L , un ; T ; F ())

est un profil de stratgies pures (s1* (t1 ),L , sn* (t n )) qui soit un quilibre de Nash du jeu sous
~
~
forme normale G = S1, L, Sn ; u~1 ,L, u~n . Le profil de stratgies pures (s1* (t1 ),L , sn* (t n )) est donc
un quilibre de Nash baysien si pour tout i = 1,..., n , on a :

75

~
u~i (si* (ti ), s*i (t i )) u~i (si (ti ), s*i (t i )) pour tout si (ti ) Si
Soit si :

~
P(t ) ui (si* (ti ), s* i (ti ), ti ) P(t ) ui (si (ti ), s* i (ti ), ti ) pour tout si (ti ) Si
t

En dautres termes, le profil de stratgies (s1* (t1 ),L, sn* (t n )) est un quilibre de Nash du jeu
baysien o chaque agent maximise son utilit espre conditionnelle ses croyances sur le
type des autres agents. Lquilibre baysien est donc moins exigeant que lquilibre de Nash
en information complte puisque les joueurs ne maximisent leur utilit quen esprance.

~
~
Si le jeu baysien sous forme normale G = S1, L, Sn ; u~1 ,L, u~n est un jeu fini, c'est--dire si
l'ensemble des joueurs et les ensembles de stratgies f i sont finis, alors on peut appliquer le
thorme de Nash. Pour un tel jeu fini, il existe donc un quilibre de Nash, possiblement en
stratgies mixtes.
A titre d'exemple, considrons le jeu suivant pour lequel il faut identifier tous les quilibres de
Nash baysien en stratgies pures :70 Deux armes opposes sont sur le point de conqurir une
le. Chaque gnral peut choisir soit "attaquer" A soit "ne pas attaquer" NA. Chaque
arme est soit "puissante" soit "faible" avec probabilit gale (le tirage alatoire du type de
chaque arme est indpendant) et le type de chaque arme n'est connu que de l'arme
concerne. La conqute de l'le procure une valeur gale M. Une arme peut conqurir l'le
soit en attaquant seule soit en n'attaquant pas seule sachant qu'elle-mme est du type
"puissante" et l'autre du type "faible". Aucune des deux armes ne peut conqurir l'le si elles
attaquent toutes les deux et sont du mme type. En attaquant, une arme supporte un cot gal
s si elle est du type "puissante" et de w si elle est du type "faible" avec s < w . En attaquant
seule, une arme ne supporte aucun cot.
Pour mettre ce jeu sous la forme normale, nous devons au pralable dfinir l'espace des
stratgies de l'arme i. Dans ce jeu, chaque joueur dispose de quatre stratgies, savoir :
s i1 : Attaquer si type "puissant" s ; Attaquer si type "faible" w : (A/s ; A/w) ;
s i 2 : Attaquer si type "puissant" s ; Ne pas attaquer si type "faible" w : (A/s ; NA/w) ;
s i 3 : Ne pas attaquer si type "puissant" s ; Attaquer si type "faible w (NA/s ; A/w) ;
s i 4 : Ne pas attaquer si type "puissant" s ; Ne pas attaquer si type "faible" w : (NA/s ;
NA/w).

Pour fixer les ides, supposons que M = 10, s = 3 et w = 5. Nous obtenons ainsi la matrice des
paiements suivante :

70

Exemple tir de Mas-Colell, Whinston and Green (1995), page 265.

76

Joueur 2
s 21

J
o
u
e
u
r

s12

s14

A/s
A/w
A/s
NA/w
NA/s
A/w
NA/s
NA/w

s11

s13

A/s
-3 -3
-5 7
-3 -3
0 10
0 10
-5 7
0 10
0 10

A/w
7 -5
-5 -5
7 -5
0 10
0 10
-5 -5
0 10
0 10

s 22
A/s
NA/w
-3 -3 10 0
-5 7 10 0
-3 -3 10 0
0
0 10 0
0
0 10 0
-5 7 10 0
0
0 10 0
0
0 10 0

s 23

NA/s
10 0
10 0
10 0
0
0
0
0
10 0
0
0
0
0

s 24

A/w
7 -5
-5 -5
7 -5
0 10
0 10
-5 -5
0 10
0 10

NA/s
10 0
10 0
10 0
0 0
0 0
10 0
0 0
0 0

NA/w
10 0
10 0
10 0
0
0
0
0
10 0
0
0
0
0

Figure 4.8

Pour dterminer l'quilibre de Nash, on calcule les esprances de paiement de chaque joueur
pour tous les profils de stratgies. Par exemple, pour le profil de stratgies (s11 , s21 ) , le gain
du joueur 1 est de :
-3 si les deux joueurs attaquent et sont du type s (la probabilit est de ) ;
-5 si les deux joueurs attaquent, le joueur 1 tant du type w et le joueur 2 du type s
(la probabilit est de ) ;
7 si les deux joueurs attaquent, le joueur 1 tant du type s et le joueur 2 du type w
(la probabilit est de ) ;
-5 si les deux joueurs attaquent et sont du type w (la probabilit est de ).
Pour ce profil, le paiement espr du joueur 1 est donc ( 3 5 + 7 5) / 4 = 1,5 . Ce mme
calcul appliqu, toutes les combinaisons de stratgies, permet dobtenir la matrice des
paiements suivante :
Joueur 2

J
o
u
e
u
r

s 21

s 22

s 23

s 24

s11

-1.5 ; -1.5

3;1

5.5 ; -2.5

10 ; 0

s12

1;3

1.75 ; 1.75

4.25 ; -1.25

5;0

s13

-2.5 ; 5.5

1.25 ; 4.25

1.25 ; 1.25

5;0

s14

0 ; 10

0;5

0;5

0;0

1
Figure 4.9

Ce jeu admet les deux quilibres de Nash baysiens suivants : (s12 , s21 ) et (s11 , s22 ) .
On peut dterminer l'quilibre de Nash baysien en adoptant une dmarche quivalente. Il faut
remarquer en effet, qu'avant de faire son choix, chacun des joueurs i connat (observe) son
type ti . Donc, dans un quilibre de Nash baysien (en stratgies pures), chaque joueur choisit

77

une stratgie (action) qui soit la meilleure rponse aux stratgies des autres joueurs (selon la
distribution conditionnelle f i (t i / ti ) ) et ce pour chacun des types ti pouvant survenir. Cette
dmarche quivalente a donn lieu la proposition suivante :
Proposition : Le profil de stratgies pures (s1* (t1 ),L , sn* (t n )) est un quilibre de Nash baysien
du jeu (S1 ,L, S n ; u1 ,L, un ; T ; F ()) si et seulement si pour tout i, pour tout si Si et pour
tout ti Ti ayant une probabilit d'occurrence non nulle, on a :

[ (

) ]

[ (

) ]

E ui si* (ti ), s*i (t i ) ; ti / ti E ui si (ti ), s*i (t i ); ti / ti


t i

ti

C'est--dire si :

pi (ti / ti ) ui (si* (ti ), s*i (ti ), ti ) pi (ti / ti ) ui (si (ti ), s*i (ti ), ti )
ti

ti

Cette proposition signifie que dans un quilibre de Nash baysien, chaque joueur i choisit une
meilleure rponse la distribution de probabilit conditionnelle des stratgies des autres
joueurs et ce pour chacun des types ti pouvant survenir avec une probabilit non nulle. En
d'autres termes, chaque type ti du joueur i est considr comme si c'tait un joueur part
entire cherchant maximiser son utilit espre tant donn sa distribution conditionnelle sur
les stratgies des autres joueurs. Cette approche est qualifie de type-centered interpretation.71
Cette caractristique est bien mise en vidence par exemple, dans le jeu du free riding avec
asymtrie de l'information. Dans ce jeu, aprs avoir observ son type (I ou II), le joueur 2
choisit sa meilleure rponse. On a bien si* (ti ) .
L'esprance est calcule par rapport aux variables alatoires que constituent la ralisation des
t i des autres joueurs conditionnel la ralisation de ti .
Dmonstration : Nous voulons montrer que :

[ (

) ] [ (

) ]

E ui si* (ti ), s* i (t i ) ; ti / ti E ui si (ti ), s* i (t i ); ti / ti


t i
t i
A : pour tout i, tout ti Ti , ayant une probabilit

d' occurrence non nulle et pour tout si Si

s1* (t1 ),L, sn* (t n )

B : est un quilibre de

Nash Bayesien

On doit donc montrer que A B et que non A non B .


Si l'ingalit de A n'est pas satisfaite pour un joueur i pour au moins un type ti Ti survenant
avec une probabilit positive, alors le joueur i peut amliorer son paiement en choisissant une
meilleure stratgie dans le cas d'occurrence de ti . Ceci contredit le fait que (s1* (t1 ),L , sn* (t n ))
est un quilibre de Nash baysien.
71

J. Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review, Vol. 85, n 3,
page 295. June 1995.

78

Pour montrer que l'ingalit est suffisante, il faut remarquer que si elle est vrifie pour tout
ti Ti ayant une probabilit non nulle, le joueur i ne peut amliorer son paiement en dviant
de si* (ti ) .

L'application de cette proposition l'exemple de la conqute de lle permet de vrifier


l'quivalence des deux dmarches. Pour chacun des deux joueurs, on dtermine l'esprance de
paiement lorsqu'il est du type s et lorsqu'il est du type w, l'esprance tant calcule par rapport
ses croyances. Ainsi, lorsque le joueur 2 joue s21 , le joueur 1 obtient :
1
( 3) + 1 (7 ) = 2
2
2
1
1
u1 ( NA, s 21 , s ) = (0 ) + (0 ) = 0
2
2
1
1
u1 ( A, s 21 , w) = ( 5) + ( 5) = 5
2
2
1
1
u1 ( NA, s 21 , w) = (0 ) + (0 ) = 0
2
2
u1 ( A, s 21 , s ) =

On a ainsi u1 ( A, s21 , s ) > u1 ( NA, s 21 , s ) et u1 ( NA, s21 , w) > u1 ( A, s21 , w) . Par consquence, la
meilleure rponse s21 est ( A / s, NA / w) = s12 , soit b1 (s21 ) = s12 .
La meilleure rponse du joueur 1 par rapport aux autres stratgies du joueur 2 est obtenue de
la mme manire, ce qui donne b1 (s22 ) = s11 , b1 (s 23 ) = s11 et b1 (s24 ) = s11 . La mme dmarche

est applique au joueur 2 et on a b2 (s11 ) = s22 , b2 (s12 ) = s21 , b2 (s13 ) = s 21 et b2 (s14 ) = s21 . En
rassemblant les meilleures rponses des deux joueurs, on obtient les deux quilibres de Nash
baysiens identifis plus haut, savoir (s12 , s21 ) et (s11 , s22 ) .
Joueur 2
s 21

J
o
u
e
u
r
1

s 22

s11
s12

b1
b1

s 23
b2

b1

s 24
b1

b2

s13

b2

s14

b2

Figure 4.10

Ce rsultat est identique celui obtenu en utilisant la dfinition de l'quilibre de Nash


baysien partir de la forme normale.

79

4.4.

Application : Le modle de Cournot selon l'approche de Harsanyi

Nous considrons maintenant lexemple du modle de la section 4.1, avec avec une asymtrie
de linformation pour les deux firmes. Chacune des deux firmes choisit une quantit
produire q i avec comme objectif la maximisation de son profit dont l'expression est
i = q i (a (q1 + q 2 ) ci ) = qi (ti (q1 + q2 )) avec ti = a ci . Chaque firme i a une incertitude
concernant le cot marginal c i de l'autre firme de sorte que t i peut tre gal soit 3/4 soit

5/4. Nous avons donc T1 = T2 = {H , L} . Cette incertitude est rsume par la distribution jointe
a priori p(t ) suivante qui est connaissance commune :

Type de
la firme 1

3/4
3/8

3/4
5/4

Type de la firme 2
5/4
1/8

1/8
P (t 2 = 3 / 4 ) = 1 / 2

3/8
P(t 2 = 5 / 4 ) = 1 / 2

P(t1 = 3 / 4 ) = 1 / 2

P(t1 = 5 / 4 ) = 1 / 2

Figure 4.11

On dira que la firme i est du type L (cot marginal faible) si ti = 5 / 4 et du type H (cot
marginal lev) si ti = 3 / 4 . La dtermination du type ti de la firme i est le rsultat du
mouvement de la Nature, mouvement reprsentant la premire tape du jeu. Chacune des
deux firmes observe par la suite son type et en dduit des probabilits rvises pour le type de
l'autre firme. Sur la base de leurs croyances, chaque firme choisit la quantit qui maximise
son esprance de profit. L'quilibre obtenu est un quilibre de Nash baysien et est de la
forme (q1L* , q1H * , q 2L* , q 2H * ) .
Pour la dtermination de l'quilibre de Nash baysien (q1L* , q1H * , q 2L* , q 2H * ) , commenons par la
firme 1 qui peut tre soit du type L soit du type H. On considre (le joueur 2 galement) en
premier lieu que par suite du mouvement de la Nature, le type de la firme 1 est L. Aprs
observation de son type L et par application de la formule de Bayes, la firme 1 en dduit les
probabilits a posteriori (rvises) sur le type t 2 du joueur 2, soit :
1/ 8 1
=
1/ 2 4
3/8 3
P (t 2 = 5 / 4 t1 = 5 / 4 ) =
=
1/ 2 4
P (t2 = 3 / 4 t1 = 5 / 4 ) =

Le type L de la firme 1 dtermine la quantit q1L* qui maximise son esprance de profit
conditionnelle ses croyances. Le programme de la firme 1 lorsqu'elle est du type L est :

1L =
Max
L
q1

1 L 5
3 5

q1 q1L q 2H + q1L q1L q 2L

4 4

4 4

80

La condition du premier ordre, ncessaire et suffisante, est :

d 1L 1 5

35
= q1L q 2H q1L + q1L q 2L q1L = 0
L
44
dq1

44
d 1L 1 5

35
= 2q1L q 2H + 2q1L q 2L = 0
L
44
dq1

44
5
3
1
2q1L q 2H + q 2L = 0
4
4
4

q1L*

5 1 H 3 L
q2 + q2
4 4
4
=
2

Maintenant, on considre que par suite du mouvement de la Nature, la firme 1 est du type H.
En se basant sur l'observation de son propre type, la firme 1 dtermine les probabilits
3/8 3
rvises (a posteriori) sur le type du joueur 2, ce qui donne P (t2 = 3 / 4 t1 = 3 / 4 ) =
= et
1/ 2 4
1/ 8 1
P (t2 = 5 / 4 t1 = 3 / 4 ) =
= . Le type H de la firme 1 choisit la quantit q1H * qui maximise
1/ 2 4
son esprance d'utilit conditionnelle ses croyances. Le programme de la firme 1 lorsqu'elle
est du type H est donc :

1H =
Max
H
q1

3 H3
1 3

q1 q1H q 2H + q1H q1H q 2L

4 4
4 4

La condition du premier ordre, ncessaire et suffisante, donne :

q1H *

3 3 H 1 L
q2 + q2
4 4
4
=
2

La mme dmarche, applique la firme 2, permet de dterminer les quantits q 2L* et q 2H * ,


soit :
5 1 H 3 L
q1 + q1
4 4
4
L*
q2 =
2
3 3 H 1 L
q1 + q1
4 4
4
H*
q2 =
2
Dans les quatre quations ci-dessus, q1L* , q1H * , q 2L* et q 2H * reprsentent les fonctions de
meilleure rponses des firmes 1 et 2 pour chaque type possible. L'quilibre de Nash baysien

81

(q

L*
1

, q1H * , q 2L* , q 2H *

est la solution de ces quatre fonctions de meilleure rponse mais en


remplaant q par q1L* , q1H par q1H * , q2L par q 2L* et q 2H par q 2H * , ce qui donne :
L
1

q1L* =

q1H * =

q 2L* =

q 2H * =

5 1 H * 3 L*
q2 + q2
4 4
4

2
3 3 H * 1 L*
q2 + q2
4 4
4

2
5 1 H * 3 L*
q1 + q1
4 4
4

2
3 3 H * 1 L*
q1 + q1
4 4
4

Ce systme de quatre quations peut s'crire comme suit :


3 L* 1 H * 5
q2 + q2 =
4
4
4
1
3
3
0 q1L* + 2 q1H * + q 2L* + q 2H * =
4
4
4
3 L* 1 H *
5
q1 + q1 + 2 q 2L* + 0 q 2H * =
4
4
4
1 L* 3 H *
3
q1 + q1 + 0 q 2L* + 2 q 2H * =
4
4
4
2 q1L* + 0 q1H * +

Sous forme matricielle, ce systme d'quations est donne par :

3
4
1

0
2
1
4
3
4

3
4
1
4
2
0

q1L* 5
1

4
H*
3
q1 3

= 4
4

5
L*
0
q

4
2

H*
2

q 2 4

La solution de ce systme d'quations donne l'quilibre de Nash baysien, c'est--dire :


7 13 7
(q1L* , q1H * , q 2L* , q 2H * ) = 13
; ; ; .
30 30 30 30

82

Chapitre 5 : Jeux dynamiques information incomplte

Nous abordons maintenant la classe des jeux dynamiques information incomplte (ou
imparfaite).72 Dans cette classe de jeux, on tudie lissue de linteraction des joueurs en
lexistence simultane de deux difficults. En premier lieu, au moins lun des joueurs ne
dispose pas de toute linformation pertinente concernant les caractristiques des autres joueurs
(information incomplte). En second lieu, le jeu est dynamique, ce qui peut donner aux
joueurs lors du droulement du jeu la possibilit dextraire de nouvelles informations partir
de lobservation des actions passes.
Chaque joueur peut donc rviser ses croyances sur lautre joueur et ce dernier doit en tenir
compte lors du choix de son action. Ainsi, dans un jeu dynamique information incomplte
ou imparfaite, il existe non seulement une interaction entre les stratgies des joueurs mais
galement une interaction entre stratgies et croyances. Pour cela, les croyances des joueurs
prennent un rle central dans le concept dquilibre appropri cette classe de jeux.

5.1.

Limportance des croyances dans le concept dquilibre dun jeu


dynamique information incomplte

Linteraction entre stratgies et croyances est ainsi au cur de la rsolution dun jeu
dynamique information incomplte. Le concept dquilibre appropri pour cette classe de
jeux est lquilibre de Nash baysien parfait, ou tout simplement quilibre baysien parfait.
Nous exposerons galement brivement deux autres concepts dquilibre, savoir lquilibre
squentiel (Kreps et Wilson, 1982) et lquilibre parfait avec mains tremblantes (Selten,
1975).
Lquilibre baysien parfait est une synthse entre lquilibre baysien des jeux information
incomplte et lquilibre parfait des jeux dynamiques. Mais, lquilibre baysien parfait nest
pas seulement cette synthse car les joueurs peuvent rviser leurs croyances durant le
droulement du jeu.
Nous avons vu que dans un jeu dynamique information complte, le principe de rationalit
squentielle implique qu'un quilibre du jeu est galement un quilibre dans tous les sous-jeux
de l'quilibre (perfection en sous-jeux). Lintroduction du principe de rationalit squentielle a
pu ainsi permettre dcarter les quilibres de Nash non raisonnables.
Mais, lorsque le jeu dynamique est information incomplte (ou imparfaite), le principe de
rationalit squentielle peut tre insuffisant comme le montre ci-dessous l'exemple du jeu de
la figure 5.1. On a dans ce cas besoin d'un concept d'quilibre plus restrictif. La dmarche
consistant dfinir de nouveaux concepts pour des situations de jeux de plus en plus
complexes est un processus de raffinement de lquilibre de Nash qui vise exclure les

72

Nous avons vu au chapitre 4 qu la suite de Harsanyi, un jeu information incomplte peut tre rinterprt
comme tant un jeu information imparfaite.

83

quilibres non plausibles qui auraient t retenus si on devait appliquer le concept d'quilibre
dfini pour des jeux plus simples.
Pour prsenter les concepts dquilibre appropris aux jeux dynamiques information
incomplte (ou imparfaite), nous suivrons les tapes suivantes :
1. Nous devons montrer, partir dun exemple, que la perfection en sous-jeux nest pas
toujours suffisante pour liminer des quilibres de Nash non raisonnables.
2. La solution propose consiste en lextension du principe de rationalit squentielle
tous les ensembles dinformation (et non plus aux seuls sous jeux) et en
lintroduction de croyances ces ensembles dinformation. Le joueur devant joueur
lensemble dinformation H choisit une action optimale tant donnes ses
croyances sur les diffrents nuds de lensemble H.
3. On dfinit ainsi un concept dquilibre pour les jeux dynamiques information
incomplte (ou imparfaite) et qui est lquilibre baysien parfait au sens faible. Un
quilibre dans un jeu dynamique information incomplte (ou imparfaite) doit donc
spcifier les couples composs dune part des stratgies dquilibre et dautre part
des croyances les soutenant. De ce fait, les croyances des joueurs aux ensembles
dinformation atteints lquilibre (appartenant au sentier dquilibre) deviennent
un lment explicite de lquilibre. Ce concept dquilibre est bas sur deux
exigences :
o Principe de rationalit squentielle : En tout point du jeu (ensembles
dinformation singletons ou non), les joueurs choisissent des actions
optimales (maximisation de lesprance de paiement) tant donnes les
croyances sur les actions choisies jusqu ce point du jeu.
o Consistance des croyances : les croyances doivent tre consistantes avec les
stratgies joues cet quilibre.

4. Lquilibre baysien parfait ainsi dfini est au sens faible car il ne prvoit aucune
restriction sur les croyances des joueurs aux ensembles dinformation non atteints
lquilibre (atteint avec probabilit 0). A travers un exemple, nous montrons la
ncessit de spcifier des croyances mme pour des ensembles dinformation hors
sentier dquilibre.
5. Lintroduction de restrictions supplmentaires pour les croyances hors sentier
dquilibre a pris deux principales voies :
o Lune des voies considre les diffrentes applications (par exemple, le
modle de signal) et introduit des restrictions raisonnables spcifiques, ou
raffinements, sur les croyances hors sentier dquilibre. Lquilibre ainsi
obtenu est appel quilibre baysien parfait. Parmi les nombreux
raffinements proposs citons titre dexemple : critre de la perfection en
sous-jeux, critre de domination, critre de domination par l'quilibre, critre
intuitif,

84

o Lautre voie consiste dfinir des concepts dquilibre incluant demble des
exigences sur les croyances sur et en dehors du sentier dquilibre, ceci
travers la notion de stratgies totalement mixtes dues la possibilit derreur
lors du choix des stratgies. Lquilibre squentiel (Kreps et Wilson, 1982) et
lquilibre parfait avec mains tremblantes (Selten, 1975) appartiennent
cette voie.

Les restrictions introduites par l'quilibre baysien parfait rpondent l'exigence de


raffinement de l'quilibre de Nash baysien, car ce dernier t dfini pour des jeux statiques
information incomplte et ne permet donc pas d'exclure les promesses/menaces non
crdibles. Cependant, le raffinement de l'quilibre baysien parfait ne se base pas sur la notion
de sous-jeu, mais sur celle plus gnrale d'ensemble d'information qui peut tre un singleton
ou non. Par analogie l'quilibre de Nash parfait, pour qu'un profil de stratgies soit un
quilibre baysien parfait, il faut qu'il soit un quilibre de Nash non seulement pour le jeu en
tant que tout, mais galement pour tous les ensembles d'information du jeu.
La comprhension de plusieurs phnomnes conomiques a t grandement amliore par
lutilisation du concept dquilibre des jeux dynamiques information incomplte (ou
imparfaite). Nous aborderons ci-dessous une application importante de ce concept dquilibre
savoir les jeux de signaux. Citons galement une autre application importante et qui est le
modle de rputation.73

5.2.

Linsuffisance de la perfection en sous-jeux dans un jeu dynamique


information incomplte

Rappelons que lextension du concept dquilibre de Nash des jeux dynamiques


information complte et parfaite a t rendu possible par lintroduction de la notion de sous
jeux. Mais cette exigence nest pas toujours suffisante lorsque le jeu dynamique est, de plus,
information imparfaite (un des joueurs au moins nobserve pas toute lhistoire du jeu). Pour
faire ressortir lexistence de cette difficult, considrons le jeu reprsent par la figure 5.1.
Joueur 1

R
Joueur 2

u1 0
u2 2

l
u1 2
u2 1

-1
-1

1
1

-2
0

Figure 5.1.

Dans ce jeu, le joueur 1 joue en premier et a le choix entre les trois actions A, L ou R. Sil
choisit A, le jeu se termine. Sil choisit L ou R, le joueur 2 jouera son tour en choisissant l ou
r. Au moment de jouer, le joueur 2 nobserve pas quelle action (L ou R) le joueur 1 a choisi.

73

Jean Tirole, The Theory of Industrial Organisation. The MIT press, 1988. Page 439.

85

Pour identifier les quilibres de Nash de ce jeu, mettons-le sous la forme normale, ce qui
donne :74

Joueur 1

A
L
R

Joueur 2
l si non A
0,2
2,1
1,1

r si non A
0,2
-1,-1
-2,0

Figure 5.2

Cette forme normale montre que ce jeu admet deux quilibres de Nash et qui sont : (L, l si
non A ) et (A, r si non A ).
Afin de dterminer si ces deux quilibres de Nash sont des quilibres de Nash parfaits, nous
utiliserons la forme extensive pour vrifier s'ils constituent bien des quilibres de Nash dans
tous les sous-jeux. L'analyse de la forme extensive montre cependant que ce jeu n'admet
aucun sous-jeu, hormis le jeu lui-mme. Or, dans un jeu ne contenant aucun sous-jeu,
l'quilibre de Nash se confond avec l'quilibre de Nash parfait. En consquence, les deux
quilibres de Nash (L, l si non A ) et (A, r si non A ) sont galement des quilibres de
Nash parfaits.
Mais un simple examen de ces deux quilibres montre que le second quilibre de Nash nest
pas un quilibre raisonnable. En effet, quelque soit laction (L ou R) choisie par le joueur 1, la
meilleure action du joueur 2 est de jouer l si non A .75 La solution propose pour
llimination de lquilibre de Nash non raisonnable consiste en lintroduction de la notion de
croyances. Ce type de raffinement consiste considrer quau moment de jouer, le joueur 2
dispose de croyances sur laction qui a t choisie par le joueur 1. Ces croyances sont des
probabilits doccurrence affectes aux diffrentes actions possibles du joueur 1. Sur la base
de ces croyances, le joueur 2 choisit une action optimale, en fait laction lui procurant
lesprance de paiement la plus leve.
Cette exigence est en fait une extension du principe de rationalit squentielle. A travers ce
principe, pour quun quilibre de Nash soit considr comme une prdiction raisonnable, il est
exig qu tout ensemble dinformation sur le sentier dquilibre (et non plus seulement au
niveau des sous jeux), le joueur qui cest le tour de joueur choisit une action optimale en
fonction des croyances quil a sur laction choisie par lautre joueur.
En considrant le jeu de la figure 5.1, on peut observer que laction r si non A nest
optimale pour aucune croyance du joueur 2 car en jouant l si non A , le joueur 2 obtient un
paiement suprieur quelque soit le choix du joueur 1. Le second quilibre contient donc une
rponse non crdible du joueur 2. De ce fait, lquilibre de Nash (A, r si non A ) ne peut
tre considr comme une prdiction raisonnable.

74
75

Cet exemple est donn par Kreps et Wilson (1982), page 871.
Pour le joueur 2, laction l domine strictement laction r.

86

5.3.

L'quilibre baysien parfait au sens faible

Lquilibre de Nash dun jeu dynamique information incomplte (ou imparfaite) requiert
quen tout point du jeu, laction de chaque joueur soit optimale tant donne la meilleure
rponse des autres joueurs. Il sagit donc dune extension du principe de rationalit
squentielle qui doit sappliquer tous les ensembles dinformation, quils soient singletons
ou non. Lorsque le joueur i doit joueur lensemble dinformation H, le principe de rationalit
squentielle ncessite que le joueur i affecte une probabilit doccurrence (croyance) chaque
nud x de lensemble H.
Lintroduction de croyances dans la dfinition du concept dquilibre pour les jeux
dynamiques information incomplte (ou imparfaite) savre tre dcisive car un choix nest
optimal qutant donnes des croyances. Les croyances deviennent donc un lment part
entire de lquilibre dun jeu. Avant dnoncer cette premire proprit de lquilibre dun
jeu dynamique information incomplte (ou imparfaite), donnons la dfinition formelle des
croyances.76
Dfinition : Un systme de croyances dun jeu dynamique information incomplte (ou
imparfaite) est la fonction : H [0, 1] tel que ( x ) = 1 pour tout ensemble H du jeu.
xH

(x) est la probabilit doccurrence du nud x H assign par le joueur i(H ) .


Nous nonons maintenant la proprit 1 de lquilibre dun jeu dynamique information
incomplte (ou imparfaite).
Proprit 1 : A chaque ensemble dinformation H, le joueur i(H ) qui doit joueur cet
ensemble dinformation H, dispose de croyances propos des nuds atteints par le jeu.

En considrant le jeu de la figure 5.1, la proprit 1 signifie que si le jeu atteint l'ensemble
d'information non singleton du joueur 2, ce dernier doit avoir des croyances propos de quel
nud est atteint par le jeu. Un systme de croyances est la distribution de probabilit
( p, 1 p) assigne par le joueur 2 o p est la probabilit que le jeu ait atteint le nud L et
(1 p ) la probabilit que le jeu ait atteint le nud R. Dans la figure 5.3, les croyances
( p, 1 p) du joueur 2 sont indiques lintrieur de lellipse reprsentant lensemble
dinformation du joueur 2.

76

Voir Kreps et Wilson (1982), page 871.

87

Joueur 1

0
2

R
Joueur 2

(1-p)

2
1

-1
-1

1
1

-2
0

Figure 5.3.

Le principe de rationalit squentielle donne lieu la deuxime proprit de lquilibre dun


jeu dynamique information incomplte (ou imparfaite).
Proprit 2 : A chaque ensemble dinformation H, laction choisie par le joueur i(H ) doit
tre optimale tant donnes ses croyances cet ensemble dinformation.

La rationalit est ici interprte comme tant un comportement de maximisation de


lesprance de paiement (dutilit).
Etant donnes les croyances du joueur 2, celui-ci obtient une esprance de paiement gale
p.(1) + (1 p ).(1) = 1 sil joue l et gal p.( 1) + (1 p ).0 = p sil joue r. Comme 1 > p pour
tout p, la proprit 2 empche le joueur 2 de jouer r. Ainsi, en exigeant de chaque joueur qu'il
ait des croyances et qu'il agisse de faon optimale tant donnes ces croyances, suffit
liminer l'quilibre non plausible (A, r si non A ).
Les proprits 1 et 2 imposent que les joueurs aient des croyances et qu'ils agissent de faon
optimale, mais ne formulent aucune exigence propos de ces croyances. Afin d'imposer des
conditions supplmentaires, notamment de cohrence interne, nous devons distinguer au
pralable les ensembles d'information situs sur le sentier d'quilibre de ceux situs en dehors
du sentier d'quilibre.
Dfinition : Pour un quilibre donn dans un jeu sous forme extensive, un ensemble
d'information est situ sur le sentier d'quilibre s'il sera atteint avec une probabilit positive
si le jeu est jou conformment aux stratgies d'quilibre. Un ensemble d'information est situ
en dehors du sentier d'quilibre s'il est certain qu'il ne sera pas atteint si le jeu est jou
conformment aux stratgies d'quilibre.

Comme le concept dquilibre pour un jeu dynamique information incomplte (ou


imparfaite) comporte la fois les stratgies des joueurs et leurs croyances, la question de la
cohrence entre ces deux composants devient centrale. Ainsi, pour quun quilibre dun jeu
dynamique information incomplte (ou imparfaite) soit une prdiction raisonnable, il est
ncessaire que les croyances cet quilibre soient cohrentes avec les stratgies de cet
quilibre. Commenons lanalyse de cette notion de cohrence par un ensemble dinformation
atteint lquilibre, celle concernant les ensembles dinformation non atteints lquilibre
tant reporte la section 5.4. Supposons pour cela que dans le jeu de la figure 5.1, le joueur 1

88

utilise la stratgie compltement mixte assignant la probabilit

1
laction A, la probabilit
2

1
1
laction L et la probabilit
laction R.77 Dans ce cas, lensemble dinformation du
3
6
1
joueur 2 est atteint avec la probabilit . Alors, les probabilits conditionnelles de L et de R
2
de lensemble dinformation du joueur 2 tant donn que cet ensemble dinformation est
atteint sont dtermines par application de la rgle de Bayes :

La probabilit de L tant donn que lensemble dinformation du joueur 2 est


atteint est :
1
3 =2
1 1 3
+
3 6

La probabilit de R tant donn que lensemble dinformation du joueur 2 est


atteint est :
1
6 =1
1 1 3
+
3 6

Les probabilits (croyances) a posteriori

2
1
et
du joueur 2 sont consistantes avec la
3
3

1 1 1
stratgie mixte ( A , L , R ) = , , . La condition de cohrence des croyances sur le
2 3 6
sentier dquilibre est la troisime proprit de lquilibre dun jeu dynamique information
incomplte (ou imparfaite).

Proprit 3 : A chaque ensemble d'information situ sur le sentier d'quilibre (atteint avec
une probabilit strictement positive), les croyances sont dduites des stratgies d'quilibre
des joueurs par utilisation de la rgle de Bayes.

Les proprits 1 3 permettent de donner la dfinition de lquilibre baysien parfait au sens


faible.
Dfinition : Un quilibre baysien parfait au sens faible pour un jeu dynamique
information incomplte (ou imparfaite) consiste en un couple de stratgies et de croyances
satisfaisant les proprits 1 3.

Les proprits 1 3 rendent bien compte de l'esprit de l'quilibre baysien parfait : En tout
ensemble d'information situ sur le sentier dquilibre, un joueur choisit une action qui

77

Rappelons quune stratgie compltement (ou totalement) mixte est une stratgie mixte o toutes les stratgies
pures sont joues avec une probabilit strictement positive.

89

maximise son esprance de paiement, compte tenu des probabilits a posteriori et des
stratgies des autres joueur.
Dans lquilibre de Nash parfait (L, l si non A ), les croyances du joueur 2 doivent tre tel
que p = 1 .78 En effet, cet quilibre prsum, le joueur 2 cherche dterminer sa meilleure
rponse au choix de L par le joueur 1. Il suppose donc que le joueur 1 a choisi L. La croyance
cohrente cette supposition est p = 1 . Lquilibre baysien parfait au sens faible est le
couple stratgies / croyances suivant : (L, l si non A , p = 1 ).79
Lquilibre baysien parfait au sens faible signifie quen tout point du jeu :
Les actions choisies par les joueurs doivent tre optimales tant donnes les
stratgies des autres joueurs et les croyances sur lvolution du jeu ;
Les croyances doivent tre consistantes (cohrentes) avec les stratgies joues.
Lquilibre baysien parfait au sens faible est donc le produit de deux exigences :
La rationalit squentielle : les stratgies joues lquilibre doivent former un
quilibre parfait, compte tenu des croyances ;
La cohrence baysienne : les croyances doivent tre obtenues par rvision
baysienne des croyances a priori, compte tenu des stratgies dquilibre.
Lquilibre baysien parfait est une mixture du concept dquilibre parfait des jeux
dynamiques et du concept dquilibre baysien des jeux information incomplte. De plus,
cette mixture doit satisfaire une condition de point fixe dans la mesure o les stratgies
dquilibre sont optimales tant donnes les croyances et ces dernires sont cohrentes aux
stratgies dquilibre.
Lquilibre baysien parfait permet de tenir compte du fait que durant le droulement du jeu,
de linformation est indirectement transmise entre les joueurs. Ceci donne donc aux joueurs la
possibilit de rviser leurs croyances (probabilits) sur les types des autres joueurs suite
lobservation des choix antcdents de ces autres joueurs. En procdant un choix donn, les
joueurs rvlent de linformation sur leur type.

5.4.

Equilibre baysien parfait et croyances hors sentier dquilibre

Pour la dfinition de lquilibre baysien parfait au sens faible, lexigence de cohrence des
croyances na port que sur les croyances au niveau des ensembles dinformation situs sur le
sentier dquilibre (ensembles dinformation atteints avec une probabilit non nulle). Cest
dailleurs cette caractristique qui a motiv le qualificatif au sens faible . Afin que
lquilibre soit une prdiction raisonnable (crdible), il est ncessaire de poser des exigences
de cohrence, ceci pour les croyances en dehors du sentier dquilibre.
Pour quun sentier (squence dactions) soit optimal, il faut quil soit une meilleure rponse
par rapport aux actions hors sentier dquilibre. Il faut donc connatre les paiements quon
78

Rappelons que p est la croyance du joueur 2 que le joueur 1 ait jou L.


En anticipant quelque peu sur la section suivante, relevons que dans cet quilibre, il nexiste pas densemble
dinformation en dehors du sentier de lquilibre. Il nexiste pas donc pas de croyances hors quilibre. De ce fait,
(L, l si non A , p = 1 ) est un quilibre baysien parfait (sans rajout de la notion au sens faible ).

79

90

pourrait obtenir en cas de dviation vers les actions hors sentier dquilibre. Or, ces paiements
dpendent, entre autres, des croyances hors sentier dquilibre. En consquence, un quilibre
baysien parfait doit non seulement spcifier les actions et les croyances sur le sentier
dquilibre, mais galement les croyances hors sentier dquilibre. Ces dernires doivent de
plus satisfaire certains critres, en ce sens quelles doivent tre raisonnables.
Lexemple de la figure 5.4 montre bien la ncessit de spcifier des croyances raisonnables
non seulement au niveau des ensembles dinformation atteints lquilibre mais galement au
niveau des ensembles dinformation non situes sur le sentier dquilibre.
Joueur 1

4
0

R
Joueur 2

2
4

3
2

3
3

5
4

Figure 5.4.

Dans ce jeu, lissue ( A, l si " non A", Pr ob(L) = 1) est bien un quilibre baysien parfait au
sens faible80. En effet, tant donnes les croyances du joueur 2 (c'est--dire Pr ob(L) = 1 ), le
choix optimal du joueur 2 est laction l. De mme, tant donn ce choix du joueur 2, la
meilleure rponse du joueur 1 est de joueur A. Les seules croyances de cet quilibre, soit
Pr ob(L) = 1 et Pr ob(R ) = 0 se rapportent un ensemble dinformation nappartenant pas au
sentier dquilibre (atteint avec une probabilit nulle). Ces croyances ne sont pas en
contradiction avec la dfinition de lquilibre baysien parfait au sens faible et donc lissue
( A, l si " non A", Pr ob(L) = 1) est bien un quilibre baysien parfait au sens faible. Mais un
simple examen de cet quilibre tel que reprsent dans la figure 5.4 montre que ces croyances
hors sentier dquilibre ne sont pas raisonnables. En effet, pour le joueur 1, laction L est
strictement domine par laction R. Raisonnablement, si le joueur 1 ne retient pas laction A,
son choix optimal devient laction R. La croyance raisonnable cet ensemble dinformation
est de ce fait Pr ob(R) = 1 . Etant donne cette dernire croyance, le meilleur choix du joueur 2
est (r si " non A") et la meilleure rponse du joueur 1 est bien laction R. Lquilibre baysien
parfait ainsi obtenu (R, r si " non A", Pr ob(R ) = 1) est repris dans la figure 5.5. Notons qu
cet quilibre, le qualificatif au sens faible na pas t repris car il ne comporte pas de
croyances non raisonnables en dehors du sentier dquilibre.

80

Les actions de cet quilibre sont mises en vidence par les traits gras et les croyances indiques dans
lensemble dinformation du joueur 2.

91

Joueur 1

4
0

Joueur 2

2
4

3
2

3
3

5
4

Figure 5.5.

Raffinement sur la base du critre de domination


Dans lquilibre dcrit dans la figure 5.5, le caractre raisonnable des croyances en dehors du
sentier dquilibre est bas sur un raffinement des croyances obtenu par application du critre
de domination.

Raffinement sur la base du critre de perfection en sous-jeux


Mas-Colell, Whinston & Green (1995) montrent partir dun exemple quun jeu dynamique
en information imparfaite peut admettre un quilibre baysien parfait au sens faible sans que
ce dernier ne soit un quilibre de Nash dans tous les sous-jeux.81 La raison de cette
incohrence est labsence, dans la dfinition de lquilibre baysien parfait au sens faible, de
restrictions portant sur les croyances hors quilibre. Il rsulte de cet exemple, quune exigence
immdiate imposer aux croyances hors quilibre est un raffinement bas sur la perfection en
sous-jeux. Pour quun quilibre baysien parfait soit une prdiction raisonnable, il faut quil
spcifie un quilibre de Nash dans tous les sous-jeux.

Raffinement sur la base du critre de domination par lquilibre


Le critre de domination par lquilibre permet dobtenir un raffinement supplmentaire des
croyances en dehors du sentier dquilibre. Considrons pour cela le jeu de la figure 5.6.
Joueur 1

1
-1

4
0

2
4

R
Joueur 2

r
3
2

Figure 5.6.

81

A. Mas-Colell, M. Whinston & J. Green,1995. Page 290.

1
3

5
4

92
Dans ce jeu, lissue ( A, (b si A, l si " non A"), Pr ob(L) = 1) est bien un quilibre baysien
parfait au sens faible.82 Cependant et comme pour le jeu de la figure 5.4, cet quilibre est bas
sur des croyances non raisonnables en dehors du sentier dquilibre (c'est--dire au niveau de
lensemble dinformation du joueur 2). A la diffrence du jeu de la figure 5.4, laction L nest
pas domine par laction R car le paiement du joueur 1 peut tre suprieur ou infrieur celui
obtenu de par laction L. En fait, pour le joueur 1, laction L est domine par lquilibre
( A, (b si A, l si " non A"), Pr ob(L) = 1) car cet quilibre, laction A procure au joueur 1 un
paiement de 4, suprieur au paiement de 2 ou 3 permis par laction L. Il nest donc pas
raisonnable que le joueur 2 puisse croire que Pr ob(L) = 1 car si le joueur 1 venait dvier de
sa stratgie dquilibre A, cest pour obtenir un paiement plus lev. Il choisira dans ce cas
laction R (obtenant ainsi un paiement de 5) et non laction L. Lquilibre baysien parfait au
sens faible dcrit dans la figure 5.6 ne peut tre considr comme une prdiction raisonnable
car il est bas sur des croyances non raisonnables hors sentier dquilibre.
Dautres raffinements sont proposs dans la littrature afin de rendre raisonnables les
croyances en dehors du sentier dquilibre. Parmi ces raffinements, citons le critre intuitif
propos par Cho et Kreps (1987) pour les jeux de signaux.83
Pour des modles ou jeux donns, on peut prvoir des raffinements spcifiques pour les
croyances hors quilibre qui, combins aux proprits 1 3, permettent de dfinir le concept
dquilibre baysien parfait.
Dfinition : Un quilibre baysien parfait pour un jeu dynamique information incomplte
(ou imparfaite) consiste en un couple de stratgies et de croyances satisfaisant les proprits
1 3 et les raffinements rendant raisonnables les croyances en dehors du sentier dquilibre.

5.5.

Lquilibre squentiel et lquilibre parfait avec mains tremblantes

Comme mentionn la section 5.3, en prsence de stratgies compltement mixtes,


lapplication de la rgle de Bayes ne rencontre pas de difficults. Dans ce cas, les croyances
sont cohrentes aux stratgies dquilibre dans tous les ensembles dinformation, quils soient
atteints ou non lquilibre.
Les deux concepts dquilibre que sont lquilibre squentiel et lquilibre parfait avec
mains tremblantes sont des concepts dquilibre plus exigeants car ils posent demble
que les joueurs jouent des stratgies compltement mixtes, ce qui permet de rgler le
problme de la cohrence des croyances en dehors du sentier dquilibre. En effet, lexistence
de stratgies compltement mixtes durant tout le jeu implique quil nexiste aucun ensemble
dinformation atteint avec probabilit 0 et donc la rgle de Bayes est applicable partout dans
le jeu. La justification avance lexistence de stratgies compltement mixtes est quavec
une probabilit non nulle, les joueurs commettent une erreur lors du choix de laction
optimale.84 En dautres termes, mme si le joueur a bien identifi sa stratgie optimale, il est
toujours possible que par erreur, il choisisse une autre stratgie (non optimale). De ce fait,
82

Pour les croyances hors quilibre indiques dans la figue 5.6, l est la meilleure rponse du joueur 2, ce qui
son tour implique que A (suivi de b) reprsente la meilleure rponse du joueur 1.
83
Le critre intuitif est dvelopp dans la section 5.6 relative aux jeux de signaux.
84
Selten, R. (1975). "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games".
International Journal of Game Theory. Vol. 4. P 25-55.

93

tous les ensembles dinformation sont atteints avec une probabilit non nulle et la rgle de
Bayes est applicable tous les ensembles dinformation.

Lquilibre parfait avec mains tremblantes


Le critre de la main tremblante a dj t abord pour les jeux simultans.85 Un quilibre de
Nash est ainsi considr comme une prdiction raisonnable sil est robuste la possibilit
derreur. Lextension de ce critre aux jeux dynamiques consiste considrer qu lquilibre
prsum, mme les ensembles dinformation hors sentier dquilibre peuvent tre atteints,
ceci en raison de lexistence dune trs petite et strictement positive probabilit derreur. De
ce fait, mme les croyances hors sentier dquilibre peuvent tre dtermines par application
de la rgle de Bayes.

Lquilibre squentiel
Lquilibre squentiel a t propos par Kreps et Wilson (1982) et, tout comme lquilibre
parfait avec mains tremblantes , il postule demble lexistence de stratgies compltement
mixtes.

Dfinition : Le couple de stratgies et de croyances ( , ) constitue un quilibre squentiel


pour un jeu dynamique information incomplte (ou imparfaite) sil satisfait les deux
proprits suivantes :
1) Le profil de stratgies est squentiellement rationnel tant donn le systme de
croyances .
2) Il existe une squence de stratgies compltement mixtes

{ }

k
k =1

avec

Lim k = tel que = Lim k . ( k reprsente les croyances dduites du


k

profil de stratgies mixtes

k
k

par utilisation de la rgle de Bayes).

La premire proprit signifie quen tout point du jeu, les joueurs choisissent des stratgies
optimales tant donnes le systme de croyances et des stratgies des autres joueurs. La
seconde proprit postule que le profil de stratgies de lquilibre est la limite dune
squence de stratgies compltement mixtes. Les croyances associes aux stratgies
compltement mixtes de cette squence sont obtenues par application de la rgle de Bayes et
leur limite sont les croyances de lquilibre.

5.6.

Les jeux de signaux

Les modles de signaux sont une des applications du concept dquilibre baysien parfait. Ils
sont trs utiliss dans la thorie conomique, limage du clbre modle de Spence (1973)
dvelopp pour le march du travail. Ils sont galement trs prsents en finance corporative
par exemple pour ltude des politiques dendettement et de distribution de dividendes des
entreprises.86
85

Voir section 1.5 ci-dessus.


Ross, S (1977). The Determination of Financial Structure: The Incentive-Signalling Approach . The Bell
Journal of Economics, Vol. 8, No. 1, pp. 23-40.
Bhattacharya, S (1979). Imperfect Information, Dividend Policy, and "The Bird in the Hand" Fallacy . The
Bell Journal of Economics, Vol. 10, No. 1, pp. 259-270.
86

94

5.6.1. Dfinition et caractristiques dun jeu de signal


Un jeu de signal est un jeu dynamique information incomplte (ou imparfaite) dans lequel le
joueur 1, appel lmetteur, est le joueur qui joue en premier en mettant un message (signal)
m j de lensemble des messages possibles M = {m1 , L , m J } .87 Avant de lancer son message,

le joueur 1 observe son type ti de lensemble des types possibles T = {t1 , L, tI } . La


caractristique prive ti , observable seulement par le joueur 1, est le rsultat dun tirage
alatoire effectu par la Nature. Le message m j du joueur 1 dpend de son type ti , ce qui

donne lexpression m j (ti ) de sa stratgie. En observant le message m j de lmetteur et non


son type ti , le joueur 2, appel le rcepteur, choisit une action a k (m j ) de lensemble des

actions possibles A = {a1 , L, a K }. Les paiements des joueurs dpendent du type ti de


lmetteur, de son message m j et de laction a k du rcepteur. Ils prennent donc la forme

u1 (m j , ak , ti ) et u 2 (m j , ak , ti ). Les ensembles T , M et A peuvent tre des intervalles continus

ou des ensembles discrets. Le droulement du jeu est le suivant :


1. La Nature procde au tirage du type ti de l'metteur partir de l'ensemble des

types possibles T = {t1 ,L, tI } selon une distribution de probabilit a priori


P (ti ) = Pr ob(ti ) avec P (ti ) > 0 pour tout i et P(t1 ) + L + P(tI ) = 1 .
2. L'metteur observe ti et choisit un message (signal) m j partir de l'ensemble des
messages possibles M = { m1 , L , m J }.
3. Le rcepteur observe le message m j (mais non le type ti ) et choisit une action a k

partir de l'ensemble des actions possibles A = { a1 , L, a K } .


4. Les paiements sont donns par u1 (m j , ak , ti ) et u 2 (m j , ak , ti ) et le jeu se termine.

La version la plus simple dun jeu de signal comporte deux joueurs ( i = 1, 2 ), deux types
possibles de T = {t1,t2 } avec les probabilits (croyances) a priori P(t1 ) et P(t2 ) , deux
messages (signaux) possibles de M = { m1 , m2 } et deux actions possibles de A = { a1 ,a2 } . En
recourant lune des formes les plus usites dans la littrature, la figure 5.7 montre la forme
extensive dun tel jeu.
Le jeu tel que reprsent par cette forme extensive dmarre au milieu avec le mouvement de
la Nature et se prolonge vers les nuds terminaux situs droite et gauche. La Nature
choisit dune faon alatoire le type t1 ou t 2 du joueur 1 (lmetteur). Ce dernier observe son
type et choisit laction m1 ou m2 . Le joueur 2 (le rcepteur) observe laction retenue par le
joueur 1 et choisit soit laction a1 ou a2 . Les pointills reliant les nuds de dcision du
rcepteur expriment lide quau moment de joueur, le rcepteur ne connat pas le type de
lmetteur.88
87

Nous avons vu au chapitre 4 qu la suite de Harsanyi, un jeu information incomplte peut tre rinterprt
comme tant un jeu dynamique information imparfaite.
88
Pour la commodit de la prsentation, on a utilis les traits en pointills au lieu des ellipses. Ces deux formats
jouent le mme rle, c'est--dire faire ressortir les ensembles dinformation dun jeu information imparfaite.

95

u1 (m1 , a1 , t1 )

u 2 (m1 , a1 , t1 )

a1

Emetteur
t1

m1

u1 (m1 , a 2 , t 2 )

a2

u 2 (m1 , a 2 , t 2 )

a1
a2

Nature

u1 (m1 , a1 , t 2 )

a1

m2

P (t1 )

u1 (m1 , a2 , t1 ) a2
u 2 (m1 , a 2 , t1 )
Rcepteur
u 2 (m1 , a1 , t 2 )

u1 (m2 , a1 , t1 )

Rcepteur

P(t 2 )

m1

t2
Emetteur

a1
m2

a2

u 2 (m2 , a1 , t1 )

u1 (m2 , a 2 , t1 )
u 2 (m2 , a 2 , t1 )
u1 (m2 , a1 , t 2 )
u 2 (m2 , a1 , t 2 )
u1 (m2 , a 2 , t 2 )
u 2 (m2 , a 2 , t 2 )

Figure 5.7

5.6.2. Lquilibre baysien parfait dun jeu de signal et typologie des


quilibres89
Rappelons que dans tout jeu, une stratgie d'un joueur est un plan d'actions complet. Une
stratgie spcifie donc une action ralisable du joueur en toute circonstance o il peut avoir
intervenir. En consquence, dans un jeu de signal, une stratgie pure pour l'metteur est une
fonction m j (ti ) spcifiant quelle est laction (le message) choisir pour chaque type que la

Nature pourrait tirer. Une stratgie pure pour le rcepteur est la fonction a k (m j ) spcifiant
quelle est l'action choisir pour chaque message que l'metteur peut envoyer. Dans le jeu de
signal simple reprsent par la figure 5.7, l'metteur et le rcepteur ont chacun quatre
stratgies pures :
Stratgies pures possibles de l'metteur :
Stratgie (m1 , m1 ) : jouer m1 si la Nature tire t1 et jouer m1 si la Nature tire t 2 .
Stratgie (m1 , m2 ) : jouer m1 si la Nature tire t1 et jouer m2 si la Nature tire t 2 .
Stratgie (m2 , m1 ) : jouer m2 si la Nature tire t1 et jouer m1 si la Nature tire t 2 .
Stratgie (m2 , m2 ) : jouer m2 si la Nature tire t1 et jouer m2 si la Nature tire t 2 .
Stratgies pures possibles du rcepteur :
Stratgie (a1 , a1 ) : jouer a1 si l'metteur choisit m1 et jouer a1 si l'metteur choisit m2.
Stratgie (a1, a2 ) : jouer a1 si l'metteur choisit m1 et jouer a2 si l'metteur choisit m2.
Stratgie (a2 , a1 ) : jouer a2 si l'metteur choisit m1 et jouer a1 si l'metteur choisit m2.
Stratgie (a2 , a2 ) : jouer a2 si l'metteur choisit m1 et jouer a2 si l'metteur choisit m2.

89

Dans cette section, nous traitons la fois des quilibres baysiens parfaits et des quilibres baysiens parfaits
au sens faible, ce qui explique que nous nayons pas rajout le qualificatif au sens faible son titre. Notons
que dans un jeu de signal deux types et deux messages, lquilibre sparant ne requiert pas le qualificatif au
sens faible car dans un tel quilibre, les deux ensembles dinformation sont situs sur le sentier dquilibre.

96
Les stratgies (m1 , m1 ) et (m2 , m2 ) de l'metteur sont appeles des stratgies mlangeantes
(pooling) car les deux types envoient le mme message. Les stratgies (m1 , m2 ) et (m2 , m1 )
sont appeles des stratgies sparantes (separating) car chaque type envoie un message
diffrent. Pour des modles comprenant plus de deux types, on peut avoir des stratgies
partiellement sparantes (semi-separating) si tous les types d'un certain ensemble de types
envoient le mme message et chaque ensemble de types envoie un message diffrent. Un
quilibre sparant est un quilibre rvlateur car partir du message diffrenci envoy, on
peut dduire le type de lmetteur. Un quilibre sparant permet donc de transmettre de
linformation.
Le jeu de signal tant un jeu dynamique information incomplte (ou imparfaite), le concept
dquilibre adquat est donc l'quilibre baysien parfait. Aprs adaptation des proprits
exposes dans les sections 5.3 et 5.4, lquilibre baysien parfait pour un jeu de signal est
dfini comme suit :

Dfinition : Un quilibre baysien parfait pour un jeu de signal est reprsent par les stratgies
m*j (ti ) et a k* m j respectivement de lmetteur et du rcepteur et les croyances a posteriori

( )

(ti / m j ) du rcepteur avec (ti / m j ) 0 pour tout ti T et

(ti / m j ) = 1

satisfaisant les

t i T

proprits suivantes :
1) Pour tout ti , le message m*j (ti ) doit maximiser lutilit de ti tant donne la

( )
u (m , a (m ), t ) .90

stratgie optimale a k* m j du rcepteur. La stratgie m*j (ti ) est donc la solution de

Max

*
k

mj

( )

2) Pour tout message m j du joueur 1 (lmetteur), laction a k* m j du joueur 2 (le


rcepteur) doit maximiser son esprance dutilit tant donnes ses croyances
(ti / m j ) sur le type ti ayant envoy le message m j . La stratgie a k* m j est donc
la solution de Max (ti / m j )u2 (m j , ak , ti ) .
ak

( )

ti

3) Les croyances (ti / m j ) dcoulent des probabilits a priori et de la stratgie


dquilibre m *j () par application de la rgle de Bayes (lorsquelle sapplique).

Ainsi, si H m est lensemble dinformation atteint avec probabilit strictement


positive tant donne la stratgie dquilibre m, alors les croyances du rcepteur
dcoulent de la formule de Bayes et de la stratgie de l'metteur, soit
P(ti )
P(ti )
=
(ti / H m ) =
avec P (H m ) > 0 .
P(H m ) P(ti )
t i H m

Comme exemple de dtermination de(s) l'quilibre(s) baysien(s) parfait(s), considrons le


jeu de signal dcrit la figure 5.8, dans lequel lmetteur (le joueur 1) peut tre soit du type t1
soit du type t 2 . Le type du joueur 1 est le rsultat dun tirage alatoire de la Nature.
90

Cette formulation montre que le joueur 1 (lmetteur) prend une dcision optimale en anticipant une raction
optimale du joueur 2 (le rcepteur). Cest une dmarche analogue celle du modle de Stackelberg (1934) car
pour lmetteur, le rcepteur est un joueur rationnel et ce dernier sait que lmetteur sait quil est rationnel,

97

Supposons que chacun des deux types soit quiprobable. Aprs observation de son type,
lmetteur (le joueur 1) choisit une action qui peut tre soit L soit R. Le rcepteur (le joueur 2)
observe le message de lmetteur et non son type et choisit son tour une action qui peut tre
soit u soit d. Il sagit bien dun jeu de signal dans lequel lmetteur choisit un message en
fonction de son type et le rcepteur rvise ses croyances sur le type de lmetteur sur la base
de laction observe de lmetteur et choisit une action optimale en fonction, notamment, des
croyances rvises. On peut reprsenter ce jeu par la forme extensive suivante :
5
2

u
[ p]

2
0
4
4

Rcepteur
HL

Nature

Rcepteur
HR

0,5

t2
Emetteur

u
R

6
1

[q]

0,5

[1-p]
3
5

Emetteur
t1
R

3
4
2
1

[1-q]

7
3

Figure 5.8

On dsignera par p = (t1 L) , 1 p = (t 2 L ) , q = (t1 R) et 1 q = (t 2 R ) les


croyances a posteriori baysiennes du rcepteur ses ensembles d'information.91
Lidentification des quilibres baysiens parfaits consiste postuler un quilibre et vrifier
si aucun joueur na intrt dvier de cet quilibre prsum. En stratgies pures, dans ce jeu,
il peut exister quatre types dquilibre :
Equilibre mlangeant en L avec t1 et t 2 jouant L ;
Equilibre mlangeant en R avec t1 et t 2 jouant R ;
Equilibre sparant avec t1 jouant L et t 2 jouant R ;
Equilibre sparant avec t1 jouant R et t 2 jouant L.

(L, L) : Equilibre mlangeant en L : Commenons par analyser la possibilit dexistence


dun quilibre baysien parfait mlangeant en L, cest--dire dun quilibre baysien parfait
dans lequel lmetteur joue la stratgie mlangeante (L, L) qui signifie (L / t1 , L / t 2 ) . Etant
donne cette stratgie (L, L) , lensemble dinformation H L se trouve donc sur le sentier
dquilibre. Il est atteint avec probabilit 1. Le rcepteur observe le message L qui peut ainsi
provenir soit du type t1 soit du type t 2 . Les croyances a posteriori du rcepteur doivent tre
cohrentes avec la stratgie de l'metteur et sont dtermines par application de la rgle de
Bayes, ce qui donne :
p = (t1 / L ) =

91

Pr ob (t1 )
Pr ob (t1 )
1
=
=
Pr ob (H L ) Pr ob (t1 ) + Pr ob (t2 ) 2

P (t1 ) et P(t2 ) reprsentent les probabilits a priori et p, 1 p , q et 1 q les probabilits a posteriori.

98

1 p = (t2 / L ) =

Pr ob (t2 )
Pr ob (t2 )
1
=
=
Pr ob (H L ) Pr ob (t1 ) + Pr ob (t2 ) 2

En dautres termes, en observant le message L dans tous les cas (c'est--dire quelque soit le
type de lmetteur), le rcepteur ne reoit aucune nouvelle information et maintient donc ses
croyances. Ses croyances a posteriori sont ainsi identiques ses croyances a priori.
Quelle est la meilleure rponse du joueur 2 (rcepteur) ? Etant donnes la stratgie (L, L) et
1 1
les croyances a posteriori ( p, 1 p ) = , , la meilleure rponse du rcepteur est laction u
2 2
1
1 5
1
1
car E (u2 (u / L )) = 2 + 4 = 3 > E (u2 (d / L )) = 0 + 5 = . Avec cette meilleure
2
2 2
2
2
raction (u / L) , lmetteur obtient un paiement de 5 sil est du type t1 et de 4 sil est du type
t2 .
Etant donns ces paiements de 5 et de 4, les types t1 et t 2 de lmetteur ont-ils intrt dvier
et jouer laction R au lieu de laction L ? Pour le savoir, il faut considrer la raction du
rcepteur au message R et les paiements qui sen suivent pour le joueur 1. Dans ce jeu, pour le
rcepteur, tant donn R, laction u est domine par laction d. En consquence, si le joueur 1
venait joueur R, la meilleure rponse du joueur 2 sera laction d, ce qui donne un paiement
de 3 et 7 respectivement aux types t1 et t 2 de lmetteur. Le type t 2 est incit dvier car il
obtient un paiement suprieur (7 au lieu de 4). Par consquent, il ne peut exister dquilibre
baysien parfait dans lequel lmetteur joue la stratgie (L / t1 , L / t 2 ) .
Notons que cette conclusion est vraie quelque soient les croyances hors quilibre (q, 1 q ) du
rcepteur car si ce dernier venait observer laction hors quilibre R, sa meilleure rponse est
toujours laction d car elle domine strictement laction u.92

(R, R) : Equilibre mlangeant en R : Nous vrifions maintenant lexistence dun quilibre


baysien parfait mlangeant en R, c'est--dire un quilibre dans lequel lmetteur joue la
stratgie mlangeante en R, qui signifie (R / t1 , R / t 2 ) . Dans cet quilibre prsum, lensemble
dinformation H R est situ sur le sentier dquilibre comme le montre la figure 5.9. Il est
atteint avec probabilit 1.

92

Laction R est hors quilibre pour lquilibre baysien parfait postul dans lequel la stratgie du joueur 1 est

(L, L ) .

99

Nature
t1

t2

[0,5]

[0,5]

Emetteur

Emetteur

L
Rcepteur
HL

[p]

u1

u2

5

2

2

0

[1 p]

u
4

4

[0,5]

Rcepteur
HR

3

5

6

1

3

4

[0,5]

u
2

1

d
7

3

Figure 5.9

Le rcepteur observe le message R qui peut provenir soit du type t1 soit du type t 2 . Ses
croyances cohrentes avec la stratgie de l'metteur sont dtermines par application de la
rgle de Bayes, ce qui donne :
q = (t1 / R ) =

Pr ob (t1 )
Pr ob (t1 )
1
=
=
Pr ob (H R ) Pr ob (t1 ) + Pr ob (t2 ) 2

1 q = (t2 / R ) =

Pr ob (t2 )
Pr ob (t2 )
1
=
=
Pr ob (H R ) Pr ob (t1 ) + Pr ob (t2 ) 2

En dautres termes, en observant le message R dans tous les cas (c'est--dire quelque soit le
type de lmetteur), le rcepteur ne reoit aucune nouvelle information. Ses croyances a
posteriori sont donc identiques ses croyances a priori.
Quelle est la meilleure rponse du rcepteur ? Etant donnes la stratgie (R / t1 , R / t 2 ) et les
1 1
croyances a posteriori , , la meilleure rponse du joueur 2 est laction d car
2 2
1
1
1
1 7
93
E (u 2 (d / R )) = 4 + 3 =
> E (u 2 (u / R )) = 1 + 1 = 1 . Avec cette meilleure
2
2
2
2 2
(
)
rponse d / R , le joueur 1 obtient un paiement de 3 sil est du type t1 et de 7 sil est du type
t2 .

En fait, comme indiqu prcdemment, on a E (u 2 (d / R )) > E (u 2 (u / R )) quelque soient les croyances du joueur
2. Laction d si R domine strictement laction u si R.
93

100

Etant donns ces paiements, les types t1 et t 2 ont-ils intrt dvier de la stratgie R ? Pour le
savoir, il faut considrer la raction du rcepteur sil venait observer le message L. Si le
rcepteur choisit laction u, alors le type t1 obtiendra un paiement de 5, suprieur au paiement
de 3 quil aurait obtenu sil avait choisi laction R. Le type t1 tant incit dvier, il ne peut
donc exister dquilibre baysien parfait mlangeant en R o le joueur 2 choisit laction u
aprs observation de L. Par contre, si le joueur 2 choisit laction d, alors les deux types
obtiendront des paiements infrieurs respectivement gaux 2 et 3. Dans ce cas, aucun des
deux types nest incit dvier de laction R. Il reste dterminer les croyances hors sentier
dquilibre p et (1 p ) pour que le joueur 2 choisisse laction d. Laction d est le meilleur
choix du joueur 2 si E(u 2 (d / L)) > E (u 2 (u / L)) , soit si 0 p + 5 (1 p ) > 2 p + 4 (1 p ) ,
1
soit si p < . Il existe donc bien un quilibre baysien parfait au sens faible mlangeant en R
3
1
1

et qui est (R, R ), (d , d ); q = , p avec p < .


2
3

(L, R) :

Equilibre sparant o le type t1 joue L et le type t 2 joue R : Nous vrifions


maintenant lexistence dun quilibre baysien parfait sparant dans lequel lmetteur joue la
stratgie sparante (L / t1 , R / t 2 ) . Dans cet quilibre prsum, les deux ensembles
dinformation H L et H R sont situs sur le sentier dquilibre, comme le montre la figure
5.10.94 Sil existe, lquilibre baysien parfait ne ncessite pas la qualification au sens
faible car il ne comprend pas densembles dinformation hors quilibre.

Les croyances du rcepteur doivent tre cohrentes avec la stratgie de l'metteur et sont
dtermines par application de la rgle de Bayes, ce qui donne p = (t1 / L) = 1 et
1 q = (t 2 / R ) = 1 . En effet, si le rcepteur considre que lmetteur joue (L, R ) , alors il doit
croire quil sagit bien du type t1 sil observe L et quil sagit bien du type t 2 sil observe R.
Ces croyances sont le rsultat de lapplication de la rgle de Bayes avec la particularit
suivante : si l'metteur joue (L, R) , le rcepteur fait face deux ensembles d'information
singletons. Le premier contient le nud L et dcoule de t1 , d'o la croyance p = (t1 / L) = 1 ,
cohrente avec la stratgie dquilibre.95 Le second ensemble d'information, un singleton
galement, contient le nud R et dcoule de t 2 , d'o la croyance 1 q = (t 2 / R ) = 1 ,
cohrente avec la stratgie dquilibre. Pour ces croyances, la meilleure rponse du rcepteur
est la stratgie (u / L, d / R ) . En effet, aprs observation du message L, le rcepteur obtient un
paiement de 2 sil joue u et de 0 sil joue d. De mme, en observant le message R, le rcepteur
obtient un paiement de 1 sil joue u et de 3 sil joue d. Avec cette meilleure rponse du
rcepteur, lmetteur obtient un paiement de 5 sil est du type t1 et de 7 sil est du type t 2 .

94
95

Les nombres entre crochets au sein des ensembles dinformation reprsentent les croyances a posteriori.
Il sagit videmment ce stade dun quilibre prsum.

101

Nature
t1

t2

[0,5]

[0,5]

Emetteur

Emetteur

L
Rcepteur
HL

[1]

u1

u2

5

2

2

0

R
[0]

[0]

Rcepteur
HR

[1]

4

4

3

5

6

1

3

4

2

1

7

3

Figure 5.10

Nous devons vrifier si la stratgie (L / t1 , R / t 2 ) constitue bien une meilleure rponse de


lmetteur la meilleure rponse (u / L, d / R) . Si le type t1 dvie et joue laction R, alors
compte tenu de la meilleure rponse de lmetteur (u / L, d / R) , il obtiendra un paiement de 3,
infrieur au paiement de 5 quil aurait obtenu avec la stratgie (L / t1 , R / t 2 ) . Le type t1 nest
donc pas incit dvier. Si le type t 2 dvie et joue laction L, alors compte tenu de la
meilleure rponse de lmetteur (u / L, d / R) , il obtiendra un paiement de 4, infrieur au
paiement de 7 quil aurait obtenu avec la stratgie (L / t1 , R / t 2 ) . Comme pour le type t1 , le
type t 2 na pas intrt dvier et on a donc bien un quilibre baysien parfait sparant
[(L, R), (u, d ); p = 1, q = 0] .

(R, L) : Equilibre sparant o le type t1 joue R et le type

t 2 joue L : Vrifions maintenant


sil existe un quilibre baysien parfait sparant dans lequel le joueur 1 choisit la stratgie
sparante (R / t1 , L / t 2 ) . Dans ce cas, les deux ensembles dinformation H L et H R du
rcepteur sont situs sur le sentier dquilibre.
Les croyances du rcepteur doivent tre cohrentes avec la stratgie de l'metteur et sont
dtermines par application de la rgle de Bayes, ce qui donne q = (t1 / R) = 1 et
1 p = (t 2 / L) = 1 . Comme l'metteur joue (R, L) , le rcepteur fait face deux ensembles
d'information singletons. Le premier contient le nud R et dcoule du type t1 d'o la croyance
q = (t1 / R ) = 1 , cohrente avec la stratgie dquilibre postul. Le second ensemble
d'information contient le nud L et dcoule du type t 2 , d'o la croyance 1 p = (t 2 / L) = 1 ,
cohrente avec la stratgie dquilibre postul. Pour ces croyances, la meilleure rponse du
rcepteur est la stratgie (d / R, d / L) . En effet, aprs observation du message R, le rcepteur
obtient 4 en jouant d et 1 en jouant u, do loptimalit de (d / R ) . De mme, en observant le

102
message L, le joueur 2 obtient 5 en jouant d et 4 en jouant u, do loptimalit de (d / L) .
Avec cette meilleure rponse du joueur 2, le joueur 1 obtient un paiement de 3 quil soit du
type t1 ou t 2 .
Nous devons maintenant nous assurer que la stratgie (R / t1 , L / t 2 ) constitue bien une
meilleure rponse de lmetteur la meilleure rponse (d / R, d / L) du rcepteur. Si le type t1
dvie et joue L, alors compte tenu de la meilleure rponse (d / R, d / L) du joueur 2, il
obtiendra un paiement de 2, infrieur au paiement de 3 sil joue R. Le type t1 nest donc pas
incit dvier. Si le type t 2 dvie et joue R, alors compte tenu de la meilleure rponse du
joueur 2, il obtiendra un paiement de 7, suprieur au paiement de 3 quil aurait obtenu en
jouant L. Le type t 2 est donc incit dvier de ce suppos quilibre. En consquence, la
stratgie (R / t1 , L / t 2 ) ne peut faire partie dun quilibre baysien parfait.
Dans ce jeu, il existe donc deux quilibres baysiens parfaits, un quilibre mlangeant et un
quilibre sparant. Lexistence de plusieurs quilibres est problmatique car on ne peut
prdire lissue du jeu. Le problme de la multiplicit des quilibres dans un jeu dynamique
information incomplte (ou imparfaite) est en grande partie d limprcision des conditions
concernant les croyances hors quilibre. Dailleurs, dans le jeu de signal ci-dessus, lquilibre
baysien parfait au sens faible mlangeant en L nest en fait un quilibre que pour les
1
croyances hors quilibre p = (t1 / L ) < . Or, aucun argument rationnel nest venu tayer ces
3
croyances hors quilibre. Cest pour cela quune partie importante de la littrature relative la
thorie des jeux traite de la question des raffinements de lquilibre de Nash. Lobjectif de ces
raffinements est dimposer aux croyances hors quilibres des proprits raisonnables avec
pour finalit didentifier un seul quilibre pour les jeux tudis.
Dailleurs, en appliquant le critre intuitif de Cho et Kreps (1987), nous montrerons que
lquilibre baysien parfait au sens faible mlangeant en R ne peut tre accept car il est bas
sur des croyances hors quilibre non raisonnables. De ce fait, le jeu de la figure 5.8 nadmet
quun seul quilibre, lquilibre baysien parfait sparant [(L, R), (u, d ); p = 1, q = 0] .

5.6.3. Raffinements des quilibres dun jeu de signal


Si le message m est hors sentier dquilibre, la rgle de Bayes nest pas applicable et ne pose
donc aucune restriction particulire sur la croyance (t / m) . Mais nimporte quelle croyance
ne peut pour autant tre accepte. Les raffinements des quilibres des jeux dynamiques
information incomplte sont des exigences supplmentaires visant rendre crdibles et
raisonnables ces croyances. Par consquent, un quilibre baysien parfait ayant des croyances
hors quilibre non raisonnables ne peut tre considr comme une prdiction acceptable. Ces
raffinements permettent ainsi dcarter les quilibres qui ne paraissent pas raisonnables, ce qui
rduit le nombre de ces quilibres. Par exemple, dans le modle de signal deux types de
Spence, le critre de domination par lquilibre et le critre intuitif permettent dcarter tous

103

les quilibres baysiens parfaits sauf lquilibre sparant o le travailleur de type t L choisit
un niveau dducation gal 0 et le travailleur de type tH choisit le niveau dducation e .96
Le critre de domination
Dfinition : Le message m est une action domine pour le type t sil existe un autre message
m tel que le paiement maximal obtenu par t jouant m est infrieur au paiement minimal
obtenu par t jouant m, soit si Max u1 (m, a, t ) < Min u1 (m, a, t ) .97
a

Selon ce critre de raffinement, si le message m est une action domine pour le type t, alors
la croyance raisonnable du rcepteur, sil venait observer le message m , est une probabilit
a posteriori nulle du type t, soit (t / m) = 0 . Ce critre de raffinement peut tre renforc en
considrant quen rponse la combinaison (T, m) ou (T , m) , le rcepteur ne choisira pas
nimporte quelle action a , mais jouera la meilleure action b(T , ) pour des croyances donnes.
En consquence, on dira que le message m est une action domine pour le type t sil existe
un autre message m tel que Max u1 (m, a, t ) < Min u1 (m, a, t ) .
ab (T , m )

ab (T , m )

Il peut exister plusieurs types pour lesquels le message m est domin. Soit S (m) lensemble
de ces types. Alors la croyance raisonnable devient (t / m) = 0 . Pour le message hors
tS ( m )

sentier dquilibre m , on doit donc raisonnablement mettre tout le poids sur les types t
appartenant T mais nappartenant pas S (m) , ce qui donne (t / m) > 0 pour tout
t T S (m) (en supposant que lensemble T S (m) soit non vide). Lensemble T S (m)
est donc lensemble des types t pour lesquels le message m nest pas domin.98
Dans le modle de signal deux types de Spence par exemple, le renforcement du critre de
domination permet dliminer tous les quilibres sparants sauf lquilibre sparant o eL* = 0
et eH* = e . Ce critre ne permet cependant pas dcarter tous les quilibres mlangeants.99
Le critre de domination par lquilibre

Le raffinement bas sur le critre de domination peut tre insuffisant pour carter tous les
quilibres baysiens parfaits au sens faible qui paraissent non raisonnables. Pour rduire
encore plus ces types dquilibres, on peut recourir au critre de la domination par lquilibre
qui est un critre plus exigeant que le critre de domination.
Dfinition : Considrons un quilibre baysien parfait postul pour un jeu de signal et soit
u1* (t ) le paiement obtenu par lmetteur de type t cet quilibre. Un message m hors sentier
96

Voir chapitre 8 relatif au modle de signal de Spence (1974).


Cho, I-K et D. Kreps (1987). Signaling game and stable equilibria. Quarterly Journal of Economics. Volume
102, pages 179-221.
Voir aussi Mas-Colell, A, M.D. Whinston and J.R. Green (1995), page 467.
98
Dans le langage de la thorie des ensembles, il sagit du complment de lensemble S (m) par rapport
lensemble T.
99
Voir chapitre 8 relatif au modle de signal de Spence (1974).
97

104

dquilibre est domin par lquilibre pour le type t de lmetteur si le plus grand paiement
possible pour le type t jouant m est infrieur au paiement u1* (t ) , soit si
Max u1 (m, a, t ) < u1* ( t ) .
a

Ce critre se base sur lide selon laquelle si un quilibre donn est postul, alors cet
quilibre, les joueurs (en particulier le rcepteur) doivent croire que le type t na aucune
incitation choisir un message m domin par lquilibre. Le critre de domination par
lquilibre peut tre renforc en considrant quen rponse la combinaison (T , m) , le
rcepteur ne choisira pas nimporte quelle action a , mais jouera la meilleure action pour des
croyances donnes. En consquence, un message m hors sentier dquilibre est domin par
lquilibre pour le type t si Max u1 (m, a, t ) < u1* ( t ) . Il peut exister plusieurs types pour
ab (T , m )

lesquels le message m est domin par lquilibre. Soit S * (m) lensemble de ces types.
Selon ce critre de raffinement, il nest donc pas raisonnable que lquilibre postul
comprenne une croyance du rcepteur affectant une probabilit strictement positive au type t
sil venait observer le message m . La croyance raisonnable du rcepteur est donc daffecter
une probabilit nulle la possibilit que le type t choisisse le message m , soit (t / m) = 0
pour tout t S * (m) . Pour le message hors sentier dquilibre m , on doit donc
raisonnablement mettre tout le poids sur les types t appartenant T mais nappartenant pas
S * (m) , ce qui donne (t / m) > 0 pour tout t T S * (m) avec
(t / m) = 1 (en
t T S * ( m )

supposant que lensemble T S (m) soit non vide). Lensemble T S * (m) est donc
lensemble des types t pour lesquels le message m nest pas domin par lquilibre.
*

Dans le modle de signal de Spence deux types, le critre de domination par lquilibre
permet dcarter tous les quilibres sparants sauf lquilibre sparant o eL* = 0 et eH* = e , ce
qui peut tre considr comme une simple consquence au fait que le critre de domination
par lquilibre est plus exigeant que le critre de domination. Ce critre permet galement
dcarter tous les quilibres mlangeants.100
Le critre intuitif

Dans certains jeux, le critre de domination par lquilibre ne permet pas dcarter tous les
quilibres non raisonnables. Cho et Kreps (1987) ont propos le critre intuitif qui est un
raffinement plus exigeant que les raffinements prcdents.101 Considrons un message m
hors sentier dquilibre et soit S * (m) lensemble des types pour lesquels le message m est
domin par lquilibre. La croyance raisonnable cet quilibre est donc (t / m) = 1 . On
t T S * ( m )

dira que lquilibre baysien parfait postul ne satisfait pas au critre intuitif, si pour le
message m , il existe un type t T S * (m) tel que :
u * (t ) <
100
101

Min

ab T S * ( m ), m

u1 (m, a, t )

Voir chapitre 8 relatif au modle de signal de Spence (1974).


Cho, I-K et D. Kreps (1987), Page 202.

105

Le type t tant incit dvier vers le message hors quilibre m , lquilibre baysien parfait
postul ne peut tre considr comme une prdiction raisonnable.
Pour simplifier lexpos du critre intuitif, considrons un jeu de signal avec deux type t et t
et deux messages m et m et que ce jeu admette un quilibre mlangeant dans lequel les deux
types choisissent le message m avec des croyances hors quilibre le soutenant. Supposons
qu cet quilibre, pour le type t, le message hors quilibre m est domin par lquilibre. Le
paiement obtenu cet quilibre par le type t est donc suprieur au plus grand paiement quil
pourrait obtenir en dviant vers le message m et ce quelque soit les croyances hors quilibre
du rcepteur. Si le rcepteur venait observer le message m , sa croyance raisonnable est
donc daffecter toute la probabilit au type t , soit (t / m) = 1 . Si en consquence cette
croyance, la meilleure raction du rcepteur au message m permet au type t dobtenir un
paiement suprieur son paiement lquilibre, lincitant ainsi dvier, alors lquilibre
postul est carter sur la base du critre intuitif.
Ainsi, un quilibre baysien parfait est carter sur la base du critre intuitif, si les deux
conditions suivantes sont satisfaites :
1) Quelque soient ses croyances hors sentier dquilibre, la meilleure raction du
rcepteur au message hors quilibre implique une rduction du paiement du type t par
rapport lquilibre ;
2) Etant donne la croyance raisonnable (t / m) = 1 rsultant de cette premire
condition, la meilleure raction du rcepteur au message m implique laccroissement
du paiement du type t par rapport lquilibre.
A titre dillustration de lutilisation du critre intuitif, reconsidrons lquilibre baysien
1
1

parfait au sens faible mlangeant (R, R ), (d , d ); q = , p avec p < dcrit dans la figure
3
2

5.9. Au regard du critre intuitif, cet quilibre nest pas une prdiction raisonnable car il
comprend une croyance non raisonnable. On remarque en effet que pour le type t 2 , le
message L est domine par lquilibre car le meilleur paiement obtenu en jouant L (soit 4) est
infrieur au paiement obtenu lquilibre en jouant R (soit 7). La croyance raisonnable qui en
rsulte est (t2 / L ) = 0 . Donc, si le rcepteur venait observer le message hors quilibre L, la
seule croyance raisonnable est daffecter tout le poids au type t1 , soit (t1 / L) = 1. Ceci
implique que la meilleure rponse du joueur 2 au message hors quilibre L est laction u. De
ce fait, le type t1 obtiendra un paiement de 5, suprieur au paiement de 3 obtenu lquilibre
prsum. Le type t1 tant incit dvier, lquilibre baysien parfait a sens faible
1
1

(R, R ), (d , d ); q = 2 , p avec p < 3 nest pas une prdiction raisonnable, et ce en


application du critre intuitif.
En consquence, le jeu de la figure 5.8 admet un seul quilibre baysien parfait et qui est
[(L, R), (u, d ); p = 1, q = 0].

106

Deuxime Partie : Modles de lconomie de linformation

107

Chapitre 6 : Le phnomne de slection adverse

La thorie conomique standard a accord un rle explicite peu important linformation.


Dans le modle de lquilibre gnral par exemple, lhypothse gnralement admise est celle
de linformation parfaite, cest--dire une situation dans laquelle linformation pertinente est
semblablement disponible sans dlai et sans cot pour tous les agents conomiques
concerns.102 Les conomistes taient videmment conscients que cette hypothse de
linformation parfaite pouvait dans certains cas contredire profondment la ralit. Par
exemple, lors de lacquisition du contrle dune entreprise, linformation joue un rle
fondamental.
Nous prsentons dans ce chapitre la contribution majeure de G. Akerlof (1970) qui a fourni
une premire analyse formelle de limportance de linformation dans les mcanismes de
march.103 Il a considr les questions de la dtermination du prix dquilibre et du volume
des changes dans un march o existe une asymtrie dinformation entre les acheteurs et les
vendeurs. Sa contribution capitale a t de montrer quen labsence de lhypothse de
linformation parfaite, certaines conclusions majeures de la thorie conomique standard
peuvent tre remises en cause, notamment celles relatives lquilibre de march, au bien-tre
des consommateurs et au dveloppement des changes.
En considrant titre illustratif lexemple du march des voitures doccasion, la
caractristique centrale introduite par Akerlof est celle de lasymtrie de linformation
existant entre lacheteur et le vendeur, les vendeurs tant mieux informs que les acheteurs sur
les caractristiques de lobjet de la vente. Cet exemple est assez loquent car lors de lachat
dune voiture doccasion, lacheteur est gnralement confront au problme de lincertitude
sur la qualit de la voiture. Akerlof a ainsi montr que l'existence de cette asymtrie de
l'information sur la qualit des biens en vente peut provoquer l'exclusion du march des biens
de bonne qualit et le maintien des biens de mauvaise qualit.
Limpossibilit pour les acheteurs de distinguer les biens de bonne qualit des biens de
mauvaise qualit ne permet pas lmergence dun systme de prix diffrencis selon le niveau
de qualit. En raison de la non observabilit de la qualit, le prix de march dun bien devient
indpendant de sa qualit. Lexistence dun mme prix pour plusieurs niveaux de qualit
reprsente en fait une sous-valuation des biens de bonne qualit et une survaluation des
biens de mauvaise qualit. Cette situation dclenche un processus de ractions dans lequel,
pour un prix donn, les vendeurs de biens de bonne qualit se retirent du march. A
lquilibre, ne restent que les biens de mauvaise qualit et les quantits changes sont
infrieures celles du cas de linformation parfaite.
Cest le phnomne de slection adverse dfini comme tant la situation dans laquelle la
partie informe (les vendeurs dans lexemple du march des voitures doccasion) en se basant
sur linformation dtenue de faon prive (ici, la qualit de la voiture doccasion) prennent
des dcisions de transactions (ici, vendre les mauvaises voitures doccasion et ne pas vendre
les bonnes voitures doccasion) qui affectent de faon ngative (adverse) le bien-tre de la
102

Debreu, G. (1959). Theory of Value. New York, Wiley.


Akerlof, G. (1970). The market for lemons : Quality uncertainty and the market mechanism. Quarterly
Journal of Economics. Vol. 89, P 488-500.
103

108

partie non informe (ici, les acheteurs) et dun segment de la partie informe (ici, les vendeurs
de biens de bonne qualit).

6.1.

Lasymtrie de linformation et le modle de slection adverse de


Akerlof

La modlisation de lasymtrie de linformation consiste dans un premier temps considrer


que pour lacheteur, la qualit de la voiture est une caractristique non observable. Dans ce
cas, la qualit est une variable alatoire. Dans son article pionnier, Akerlof (1970) considre
que la qualit q des voitures doccasion est une variable alatoire continue distribue de faon
uniforme entre 0 et 2. Une voiture de qualit q = 0 (respectivement q = 2 ) est donc de la plus
mauvaise (respectivement meilleure) qualit. Notons que la qualit moyenne des voitures
2
2
1
doccasion est alors gale = q f (q ) dq = q dq = 1 .104 Pour lacheteur, la qualit
2
0
0
non observable de la voiture doccasion est donc reprsente par la distribution de probabilit
qui apparat la figure 6.1 :
f (q )

1/2

Figure 6.1

Pour analyser les effets de lasymtrie de linformation sur le fonctionnement du march,


Akerlof considre quil existe deux groupes dindividus : un groupe A possdant N voitures
doccasion et un groupe B ne possdant pas de voitures doccasion. Pour dterminer lissue du
march en situation dasymtrie dinformation, lanalyse porte sur le comportement de
demande et doffre des deux catgories dindividus et leur confrontation sur le march.
La demande

La demande de voitures doccasion peut maner des deux groupes dindividus et est donc la
somme des demandes des deux groupes.105 Soient YA et YB le revenu consacr lachat de
voitures doccasion des groupes A et B respectivement. Lors de lachat dune voiture
doccasion, lacheteur base sa dcision sur la comparaison de deux lments, le prix et la
disposition payer, cette dernire dpendant notamment de la qualit du bien. Pour une
104

Rappelons que pour une distribution de probabilit uniforme U (a, b ) , lesprance mathmatique est

105

a+b
.
2

Akerlof considre que la fonction dutilit des individus des groupes A et B est respectivement
U A = M + 1 qi et U B = M + (3 2) qi avec M reprsentant lutilit procure par la consommation des

biens autres que les voitures doccasion.

109

qualit q donne, considrons que les individus du groupe A ont une disposition payer de
1 q et les individus du groupe B une disposition payer de (3 2) q .106 Ainsi, pour une
qualit donne q, lindividu du groupe A nexprime une demande positive que si le prix p est
infrieure sa disposition payer, cest--dire si p <1 q . Les individus du groupe B
3
nexprime une demande positive que si le prix p est tel que p < q . Mais la difficult rside
2
ici dans le fait que la qualit nest pas observable pour lacheteur. Ce dernier doit donc baser
sa dcision sur une approximation de la qualit. Celle-ci est souvent la qualit moyenne
qui est gnralement le rsultat de croyances bases sur lexprience et lobservation passes.
En consquence, il ya une demande positive pour le groupe A et pour le groupe B lorsque le
prix est infrieur la disposition payer, celle-ci tant maintenant base sur la qualit
3
moyenne , soit lorsquon a respectivement p <1 et p < . Les demandes de voitures
2
doccasion DA et DB manant respectivement du groupe A et du groupe B sont donc
donnes par :107

YA
p

DA =
0

si

>p

si

3
YB
p si 2 > p

et DB =

3
0 si 2 p

En agrgeant les demandes des deux groupes dindividus, on obtient la demande globale
D( p, ) = DA + DB , fonction du prix p et de la qualit moyenne :
Y A + YB
p

Y
D ( p, ) = B
p

si

si

si

p<

p<

3
p
2

Loffre

Loffre mane des individus du groupe A, groupe possdant les N voitures doccasion. La
qualit des biens est une caractristique observable pour le vendeur. Il nacceptera donc de
vendre une voiture doccasion que si le prix de march excde la valeur subjective, cest-106

La disposition payer dun individu est le prix maximal quil est prt accepter pour lachat dun bien. Elle
dpend de lvaluation subjective de lutilit que procure le bien. Le fait que la disposition payer de lacheteur
(3/2) soit suprieure celle du vendeur (1) constitue une condition dexistence de lchange.
Y
Y
107
A la condition videmment que A N et B N .
p
p

110

dire si p > 1 q . Pour un prix de march p, les voitures offertes sont ainsi celles qui respectent
1 p
lingalit q < p . La proportion de voitures offertes est donc gale p = , comme il
2 2
ressort de la figure 6.2 :
f (q )

Proportion des voitures offertes pour


lesquelles q < p

1/2

Figure 6.2

Le nombre total de voitures offertes S est donc :


S = SA = N

p
avec p 2
2

La quantit totale offerte S par le groupe A est fonction du prix p. Elle est donc de la forme
suivante :
S = S ( p)
p
Relevons que
est la qualit moyenne offerte pour un prix p donn.108 Nous avons en
2
effet :109
p
p
1
p
= E (q / q < p ) = q f (q / q < p ) dq = q dq =
2
p
0
0

6.2.

Lquilibre du march en cas dasymtrie de linformation

Le fonctionnement dun march o existe une asymtrie de linformation est donc caractris
par les trois quations suivantes :

D = D( p, )
S = S ( p)

= ( p)

108

Il nest pas ncessaire de donner des symboles diffrents la qualit moyenne initiale de lensemble des
voitures et la qualit moyenne conditionnelle.
109 1
est la distribution de probabilit conditionnelle de la qualit q offerte pour un prix p.
p

111

Lquilibre du march rsulte de la confrontation entre loffre et la demande. Comme le


montre la premire quation, la demande est le produit de la comparaison par les acheteurs
entre le prix p et la qualit moyenne . Pour loffre (seconde quation), la comparaison porte
sur le prix p et la qualit de la voiture propose q . Enfin, la troisime quation montre que la
qualit moyenne des voitures offertes sur le march dpend du prix de march.
Dans ces conditions, il nexiste aucun prix dquilibre permettant la ralisation de lchange.
p
En effet, pour un prix quelconque p, la qualit moyenne est gale . Comme dans ce
2
3
3 p 3
cas, on a = = p < p , alors la demande D = D( p, ) est gale 0, bien que ce
2
2 2 4
p
prix p, la quantit offerte est gale N . Cette conclusion ressort bien dans la figure 6.3 :
2

=p
Zone I

2
p
3

p
2

Zone II

Figure 6.3

Dans la zone I de la figure 6.3, on a p < et qui est la condition pour avoir une demande
Y + YB
p
gale D = A
. Mais le ct offre est tel que = . La condition pour que
2
p
Y + YB
nest donc pas ralise. Le mme rsultat est obtenu dans la zone II de la figure
D= A
p
Y
3
6.3 o on a p < et qui est la condition pour avoir une demande gale D = B . Mais
2
p
Y
p
ici galement, le ct offre est tel que = . La condition pour que D = B nest donc pas
2
p
ralise.
Nous obtenons ainsi le rsultat fondamental mis en avant par Akerlof : En cas dasymtrie
dinformation, lquilibre du march peut tre tel que les quantits changes soient nulles. En
dautres termes, lexistence de lasymtrie de linformation peut impliquer la disparition du
march. Lhypothse de linformation parfaite dans les modles conomiques standards ne
peut plus tre considre comme neutre.
Le processus conduisant ce rsultat est le produit du comportement des acheteurs et des
vendeurs. La situation initiale est caractrise par lexistence de voitures doccasion de

112
diffrentes qualits de moyenne . Les acheteurs ne sont pas en mesure de faire la diffrence
de qualit des voitures. Le prix quils sont disposs payer est donc identique pour toutes les
qualits de voiture et se base, en gnral, sur la qualit moyenne. A un prix quelconque p, les
vendeurs ayant une voiture de qualit q p se retirent du march.110 Seules demeurent sur le
march les voitures de qualit q < p . De ce fait, au prix p, la qualit moyenne des voitures
p
offertes baisse de 1
< 1 . Anticipant cette nouvelle qualit moyenne, les acheteurs
2
nacceptent pas de payer plus de (3 2)( p 2) , soit (3 4) p .111 A leur tour, les vendeurs ayant
une voiture de qualit suprieure ou gale (3/4)p se retirent du march. La qualit moyenne
des voitures restant dans le march baissera de nouveau ((3 4) p ) 2 , soit (3 8) p . La
poursuite de ce processus a pour corollaire la baisse continuelle de la qualit. A lquilibre, le
prix tendra vers 0 et aucune voiture ne sera change. Cet exemple montre comment le risque
de slection adverse est une source dinefficience conomique et sociale.
Le caractre extrme de cette conclusion, soit lexclusion totale du march de toutes les
voitures doccasion, est en fait du lhypothse de continuit de la qualit q. On peut obtenir
les mmes rsultats, moins extrmes et plus intressants du point de vue intuitif, en
considrant que la qualit est une variable discrte. Supposons par exemple que la qualit des
voitures doccasion peut prendre 5 modalits diffrentes : trs mauvaise ( q = 1 ), mauvaise
( q = 2 ), moyenne ( q = 3 ), bonne ( q = 4 ) et trs bonne ( q = 5 ). Le vendeur connat la qualit
de la voiture quil propose la vente. Lacheteur par contre, ne peut observer cette qualit
mais dispose de croyances sur la qualit, croyances acquises par exemple partir de
lobservation des changes passes. Supposons que pour lacheteur, ces croyances sont telles
que chaque modalit a la mme probabilit doccurrence, ce qui donne : probabilit (trs
mauvaise) = probabilit (mauvaise) = probabilit (moyenne) = probabilit (bonne) =
probabilit (trs bonne) = 1/5. Supposons galement titre de simplification, que le vendeur
et lacheteur ont le mme prix subjectif et quil est de 1 pour la trs mauvaise qualit, de 2
pour la mauvaise qualit, de 3 pour la qualit moyenne, de 4 pour la bonne qualit et de 5
pour la trs bonne qualit.
Etant donnes ces croyances de lacheteur, sa disposition payer initiale est gale au prix
moyen et est gale (1 + 2 + 3 + 4 + 5) 5 = 3 . Mais ce prix, les vendeurs ayant des voitures de
trs bonne qualit et de bonne qualit se retirent du march car ils exigent un prix
(respectivement 5 et 4) plus lev. De ce fait, ne restent sur le march que les voitures de
qualits trs mauvaise, mauvaise et moyenne. La nouvelle qualit moyenne est de ce fait,
gale (1 + 2 + 3) 3 = 2 et la nouvelle disposition payer est maintenant de 2, ce qui incite les
propritaires de voitures de qualit moyenne se retirer du march car ils exigent un prix (3)
suprieur. De nouveau, la qualit moyenne baisse et devient 1,5 et les propritaires de voitures
de mauvaise qualit se retirent du march. Ce processus sarrte lorsque ne restent sur le
march que les voitures de trs mauvaise qualit et le prix dquilibre du march est de 1. Ce
rsultat est un quilibre de slection adverse, c'est--dire un quilibre du march o ne
schange que les biens de mauvaise qualit.

110

Rappelons que pour une qualit q, la disposition payer des individus du groupe A est 1 q .
On ne considre ici que les acheteurs du groupe B car ce sont ces individus qui ne possdent pas de voitures
doccasion
111

113

6.3.

Asymtrie de linformation et rduction de bien-tre

En rduisant le volume des changes, lasymtrie de linformation a pour effet de rduire le


bien-tre des agents conomiques. Pour montrer cela, comparons cette situation celle o
nexiste pas dasymtrie de linformation.
Supposons que la qualit est observable par les deux parties de lchange. On aura ainsi un
quilibre de march pour chaque niveau de qualit q i . Il y aura donc autant de prix
dquilibre p i que de qualits observes q i .
En ngligeant lindice i, pour le niveau de qualit q, loffre est le fait du groupe A et ne
dpend que du prix p. Avec N reprsentant la quantit de voitures de qualit q, on a ainsi :

N
S ( p) =
0

si

pq

si

p<q

La demande mane des deux groupes A et B et ne dpend que du prix. Les acheteurs
potentiels comparent le prix de march et leur disposition payer. Pour chaque qualit q
observe, lexpression de la demande est :
YA + YB
p

Y
D( p ) = B
p

si

p<q

si q p

3
q
2

p>

3
q
2

si

La fonction de demande se prsente ainsi :


D( p )

Y A + YB
p
YB
p

q
Figure 6.4

(3/2)q

114

3
Pour la qualit q, lintervalle de lchange est p q, q . En effet :
2
Y +Y
o Pour p < q , nous avons D( p ) = A B et S ( p ) = 0 . Pour cet intervalle de prix,
p
aucun change na lieu.
3
o Pour p > q , nous avons D( p ) = 0 et S i ( p ) > 0 . Ici galement, aucun change na
2
lieu.
3
Au sein de lintervalle q, q , le prix dpendra du nombre de voitures offert. Trois cas sont
2
considrer :

o Premier cas : YB < N 1 . Ici, le nombre de voitures N est suprieur la capacit


dachat mme value avec la disposition payer minimale. Le march est donc un
march dacheteurs. Le prix sera ainsi minimal, soit p = q .
3
o Deuxime cas : YB > N . Ici, le nombre de voitures N est infrieur la capacit
2
dachat mme value avec la disposition payer maximale. Le march est donc un
3
march de vendeurs. Le prix sera ainsi maximal, soit p = q .
2
2
o Troisime cas : YB < N < YB . Lquilibre du march est tel que D( p ) = S ( p ) , soit
3
YB
3
Y
= N , ce qui donne le prix dquilibre p = B q compris entre q et q.
N
2
p

Pour chaque niveau de qualit q, le tableau suivant permet de comparer les deux situations.
2
YB
3

Nombre de voitures N
Symtrie de linformation
Quantit change
Prix

N
(3 2)q

Asymtrie de linformation
Quantit change
0
Prix
Non dtermin

YB
N
(YB N )q

N partiellement
q

0
Non dtermin

0
Non dtermin

Ce tableau montre quen raison de lexistence de lasymtrie de linformation, les quantits


changes sont plus faibles, inexistantes mme. Lasymtrie de linformation induit donc une
rduction du bien-tre.
Cette conclusion, dveloppe pour lchange, est galement vraie pour la production.
Supposons quil existe deux types de producteurs, un producteur fabriquant un bien de bonne
qualit G et un producteur fabriquant le mme bien mais de mauvaise qualit B.
Supposons que nous ayons le cas, assez plausible, illustr dans la figure 6.5, avec C G et C B

115

reprsentant respectivement le cot de production du produit de bonne qualit et le cot de


production du produit de mauvaise qualit et p G et p B reprsentant respectivement le prix de
march du produit de bonne qualit et le prix de march du produit de mauvaise qualit.

CB

pB

E( p)

CG

pG

Figure 6.5

Si les consommateurs pouvaient distinguer sans ambigut le bien de type G du bien de type
B, on aurait un prix pour chaque niveau de qualit, soit p G et p B avec p G > p B . Mais si les
consommateurs ne peuvent pas distinguer clairement entre les deux types de biens (ou ils le
peuvent mais avec un cot trop lev), alors on aura un seul prix de march pour les deux
qualits. Ce prix est un prix moyen E ( p ) et est videmment infrieur p G . A ce prix E ( p ) ,
le producteur de bonne qualit supportera des pertes, ce qui provoquera sa disparition. Ne
survivra donc que le producteur de bien de mauvaise qualit. Ce modle montre que les
mcanismes de march peuvent ne pas suffire lmergence de biens de haute qualit.
Les effets ngatifs de lasymtrie de linformation sur le bien-tre suggrent que des mesures
et des politiques conomiques peuvent tre mises en uvre, en plus des rponses de march
comme le signal et le filtrage, en vue de rduire ces effets ngatifs. Parmi ces mesures et
politiques conomiques, citons titre dexemple la protection des marques, la protection de la
proprit intellectuelle et le contrle indpendant de la qualit. Lexistence de marques
dposes ayant une rputation bien tablie constitue pour les agents conomiques une
assurance de qualit. Pour cette raison, ils sont disposs accepter un prix plus lev.

116

Chapitre 7 : Asymtrie de l'information et quilibre du march des


assurances
Akerlof (1970) a montr qu'en prsence de l'asymtrie de l'information, l'quilibre de march
est tel que l'change ne porte plus que sur la mauvaise qualit.112 Il s'agit du phnomne de
slection adverse qui a pour consquence de rduire le bien-tre des dtenteurs (producteurs,
vendeurs) de produits de bonne qualit car exclus du march ainsi que des acheteurs
(consommateurs). Un rsultat extrme est obtenu lorsqu'on considre que la qualit est une
variable continue, puisque dans ce cas, l'quilibre de march est tel que le volume des
changes est nul. Cela signifie entre autres la disparition du march, ce qui montre que
l'hypothse de l'information parfaite du modle standard de l'conomie concurrentielle n'est
pas une hypothse anodine.
Les deux principaux mcanismes de march qui apparaissent comme tant des rponses au
problme de la slection adverse sont le signal et le filtrage (screening). Ce dernier
mcanisme de march est le fait de la partie non informe et consiste pour celle-ci proposer
un menu de contrats qui permet, aprs autoslection sur la base de prix non linaires, de
distinguer entre les diffrentes qualits de biens ou dindividus.
En nous basant essentiellement sur larticle de M. Rothschild & J. Stiglitz (1976)113 qui
considrent le march des assurances comme cadre d'analyse, nous montrons dans ce chapitre
qu'avec la prise en compte explicite de l'asymtrie de l'information, le concept d'quilibre de
march change de signification. Deux types d'quilibres existent, qui peuvent tre soit des
quilibres mlangeants (pooling equilibria) soit des quilibres sparants (separating
equilibria). De plus, il existe des cas o l'asymtrie de l'information implique que l'quilibre
de march peut ne pas exister.

7.1.

Les donnes de base du modle de Rothschild et Stiglitz

Pour la dfinition de la notion d'quilibre du march d'assurance, les auteurs remarquent tout
d'abord que les compagnies d'assurance proposent des contrats qui fixent la fois le prix et la
quantit.114 Par contre, dans la plupart des autres marchs, les firmes fixent un prix et il
revient l'acheteur de choisir la quantit qu'il souhaite acqurir.115
Rothschild & Stiglitz dfinissent l'quilibre du march des assurances comme tant un
ensemble de contrats satisfaisant simultanment les deux conditions suivantes : 1) ces contrats
maximisent l'esprance d'utilit des individus ; 2) ils sont tels que a) aucun des contrats de
l'quilibre ne donne la compagnie d'assurance une esprance de profit ngative ; b) aucun

112

Akerlof, G. (1970). The market for lemons: Quality uncertainty and the market mechanism. Quarterly
Journal of Economics. Vol. 89, P 488-500.
113
Rothschild, M. & Stiglitz, J. (1976). "Equilibrium in Competitive Insurance Markets: an Essay on the
Economics of Imperfect Information". Quarterly Journal of Economics, Vol. 90. P 629-649.
114
Pour ce type de contrats, on parle de prix non linaires, c'est--dire de prix unitaires dpendant de la quantit.
Cette notion sera dveloppe plus loin.
115
Dans ce cas, on parle de prix linaires, c'est--dire de prix unitaires ne dpendant pas de la quantit.

117

contrat hors quilibre, s'il venait tre offert, ne procure la compagnie d'assurance, une
esprance de profit non ngative. Ce type d'quilibre est un quilibre la Cournot-Nash.
Considrons la situation d'un individu ayant une richesse initiale gale w et faisant face au
risque de sinistre pouvant lui occasionner une perte gale d . La probabilit d'occurrence de
ce sinistre est p . La situation de cet individu peut tre reprsente par la figure 7.1 o les axes
reprsentent son revenu dans les deux tats de la nature possibles. Le point E reprsente le
vecteur des revenus (consommations, richesse) contingents de l'individu sans assurance.
Supposons que cet individu ait la possibilit de s'assurer auprs d'une compagnie d'assurance
et que le contrat d'assurance stipule que l'individu doit payer une prime d'assurance gale 1
et reoit une indemnit gale 2 en cas de sinistre. En acceptant ce contrat d'assurance, le
vecteur des revenus (consommations, richesse) contingents est maintenant reprsent par le
point F de la figure 7.1. Avec 2 = 2 1 , le vecteur = (1 , 2 ) caractrise ainsi
compltement le contrat d'assurance.
On montre que si un individu a de l'aversion pour le risque, alors les courbes d'indiffrence
reprsentatives de ses prfrences sont dcroissantes et convexes comme indiqu dans la
figure 7.1. Dans celle-ci, l'individu accepte de s'assurer car le point F est situ sur une courbe
d'indiffrence "suprieure" celle contenant le point E . De plus, si le contrat d'assurance est
actuariellement quitable, alors la dcision optimale de l'individu est l'assurance totale, ce qui
situe son vecteur de revenus sur la ligne de certitude donnant un mme revenu dans tous les
tats de la nature.116
Revenu en cas de
sinistre
Prob = p

Ligne de certitude

+U
F

w d + 2
E

wd

w 1

Revenu en l'absence de
sinistre. Prob = 1 p

Figure 7.1

Un contrat dassurance est actuariellement quitable si lesprance de profit quil procure la

1 p
compagnie d'assurance est nulle, soit si 1 (1 p ) 2 p = 0 , ce qui donne 2 =
. Le
1
p
rapport 2 1 reprsente la pente de la droite EF . Ainsi, les contrats d'assurance situs sur

116

Voir Laffont, J. J. (1991), page 129.

118

la droite EF ont une pente gale, en valeur absolue, au rapport des probabilits et procurent
la compagnie d'assurance une esprance de profit gale 0.

7.2.

Asymtrie de linformation et phnomne de slection adverse en


assurance

Jusqu' prsent, nous avons fait l'hypothse explicite qu'il n'existait qu'un seul type
d'individus. En ralit, les individus peuvent avoir des caractristiques diffrentes. Une
caractristique pertinente pour la compagnie d'assurance est la probabilit de sinistre de
l'individu. Considrons maintenant qu'il existe deux types diffrents d'individus : 1) des
individus ayant une probabilit de sinistre leve, pH et 2) des individus ayant une
probabilit de sinistre faible, p L avec p H > p L .
Cette probabilit de sinistre est une information prive de l'individu. Elle n'est donc pas
observable par la compagnie d'assurance qui a tout de mme des croyances au regard de cette
probabilit. La compagnie dassurance sait que la proportion dindividus haut risque est .
L'individu observe sa probabilit de sinistre et exprime sa demande d'assurance qui va en
dpendre. En d'autres termes, la stratgie de l'individu (ici la demande d'assurance) dpend de
son type (ici la probabilit de sinistre). Les stratgies des deux types d'individu sont donc
2H = ( p H ) et 2L = ( p L ) .117 Rcrivons le programme de l'individu donnant la prime
dassurance optimale 2 selon qu'il soit du type pH ou du type p L . Comme la compagnie
dassurance ne peut faire la distinction entre les deux types, elle fixe une prime d'assurance
par unit dindemnit commune aux deux types. Soit cette prime dindemnit. On a donc

= 1 , soit 1 = 2 .
2
La demande d'assurance de l'individu de type pH est la solution du programme suivant :

max
E (u (w )) = (1 p H )u w 2H + p H u w d 2H + 2H
H
2

Concernant l'individu de type p L , sa demande d'assurance est la solution du programme


suivant :

max
E (u (w )) = (1 p L )u w 2L + p L u w d 2L + 2L
L
2

Les conditions du premier ordre, ncessaires et suffisantes, sont telles que respectivement
pour l'individu du type pH et pour l'individu du type p L , on a :

(1 pH )
u w d 2H + 2H
=
H
u w 2
pH (1 )

117

Il sagit donc dun jeu baysien tel quexpos au chapitre 4.

119

(1 pL )
u w d 2L + 2L
=
L
u w 2
pL (1 )
Comme pH > pL , on a

(1 p H ) (1 p L )
et donc :118
<
(1 ) p H (1 ) p L

u w d 2H + 2H
u w d 2L + 2L
<
u w 2H
u w 2L

Cette ingalit implique que 2H > 2L . Pour montrer cela, supposons le contraire, c'est--dire
que 2H < 2L . (Le cas o 2H = 2L est videmment rejeter). Dans ce cas, on aura le
schma de la figure 7.2 :
u ()

wd +

w d + 2H (1 )

2L (1 )

w 2L

w 2H

Figure 7.2

Etant donne la concavit de u() , on a :

(
(

)
)

(
(

)
)

(
(

u w d + 2H (1 ) u w 2L
u w 2H
>
>
u w d + 2L (1 ) u w 2H
u w 2L

)
)

Ce qui donne :

u w d + 2H (1 ) u w d + 2L (1 )
>
u w 2H
u w 2L

118

Comme un contrat dassurance actuariellement quitable est tel que

(1 p ) = 1 , cette ingalit implique que


p (1 )

pour une mme prime dassurance par unit dindemnit , il nest pas possible davoir simultanment des
contrats dassurance actuariellement quitable pour deux types dindividus p H et p L . Ce point est dvelopp
plus loin.

120

Ceci constitue une contradiction et on a donc bien 2H > 2L . Cette ingalit signifie que pour
un prix dassurance unique, l'individu haut risque a une demande d'assurance suprieure
la demande d'assurance de l'individu bas risque.
Pour la drivation de cette conclusion, nous avons considr que le prix unitaire de l'assurance
est identique pour les deux types d'individu. Il s'agit en fait de prix linaires, c'est--dire de
prix unitaires indpendants de la quantit. La diffrence dans la demande d'assurance ressort
dans la figure 7.3 o le point A reprsente le vecteur de consommations de l'individu du type
L et le point A le vecteur de consommations de l'individu du type H .119
Si le contrat A choisi par l'individu de type L procure la compagnie d'assurance une
esprance de profit gale 0, alors le contrat A choisi par l'individu de type H lui procure
une esprance de profit ngative. En effet, en situation de prix linaires, le mme prix unitaire

1L 1H
=
= . Si le contrat
2L 2H
A du type p L est actuariellement quitable, alors 1L (1 p L ) 2L p L = 0 , soit
1L
L
L
1 2 p L = 0 , ce qui donne L = p L = . Lesprance de profit du contrat A du type pH
2
H

p
p
est 1H 2H p H = 1 2H p H = 1 H = 1 H < 0 . Donc, globalement sur les deux types

pL
1
dassurance sapplique aux deux types dindividus, ce qui donne

d'individus runis, la compagnie d'assurance subit des pertes.


Revenu en cas
de sinistre
Prob = p
Ligne de certitude

w d + 2H
w d + 2L

+U
A
E

wd

w 1H

w 1L

Revenu en l'absence de
sinistre
Prob = 1 p

Figure 7.3

On peut galement faire ressortir la diffrence de la demande d'assurance des deux types
d'individu et donc la dpendance de la demande d'assurance par rapport au type, en analysant
leur comportement au moyen des courbes d'indiffrence. Une caractristique fondamentale
119

Cette figure reprsente le cas gnral o le contrat dassurance nest actuariellement quitable pour aucun
type dindividu. On peut vrifier que le rsultat ne change pas si le contrat dassurance est actuariellement
quitable pour lun des types, par exemple le type p H .

121

des courbes d'indiffrence de deux types diffrents d'individu est connue sous l'expression de
la proprit de lunicit de lintersection (single crossing property).
Revenu en cas
de sinistre.
Prob = p

w d 1 + 2L

w d 1 + 2H
E

wd

H
L
w 1

Revenu en l'absence
de sinistre. Prob = 1 p

Figure 7.4

Cette proprit ressort dans la figure 7.4 qui montre qu'au point d'intersection E, la pente de la
courbe d'indiffrence de l'individu du type L est suprieure la pente de la courbe
d'indiffrence de l'individu du type H. Au point E, le taux marginal de substitution (en valeur
absolue) de lindividu L est suprieur celui de lindividu H.
Pour expliquer cette diffrence de pente des courbes d'indiffrence, considrons que le point
E reprsente la situation o aucun des deux types n'est assur. Leurs revenus contingents sont
donc (w1 , w2 ) = (w, w d ) . Pour chacun des deux types d'individu, la compagnie d'assurance
propose un contrat d'assurance qui laisse inchang le niveau de leur utilit avec une prime
d'assurance gale 1 . En contrepartie, en cas de sinistre, l'individu du type H reoit une
indemnit de 2H et l'individu du type L reoit une indemnit de 2L . Si le montant 2L
permet l'individu du type L de maintenir constant son niveau d'utilit, alors le niveau
d'utilit du type H est maintenu contant avec une indemnit 2H telle que 2H < 2L car la
probabilit d'encaisser la somme 2H est plus leve que la probabilit d'encaisser 2L .
La figure 7.5 fait ressortir trois contrats actuariellement quitables, mais avec des prix (prime
unitaire dassurance) diffrents. Le premier contrat de pente (1 p L ) / p L est un contrat
actuariellement quitable pour les individus bas risque. Le second contrat de pente
(1 p H ) / p H est un contrat actuariellement quitable pour les individus haut risque. Enfin,
le troisime contrat de pente (1 p ) / p est un contrat actuariellement quitable pour un
risque moyen p o p = p H + (1 ) p L avec reprsentant la proportion d'individus
haut risque. Comme p est une probabilit moyenne de sinistre, on a p H > p > p L et les
1 pH 1 p 1 pL
pentes (ngatives) des trois types de contrats sont donc telles que
.
<
<
pH
p
pL

122

(1 p L ) / pL

Revenu en cas
de sinistre.
Prob = p

(1 p ) / p
(1 pH ) / pH

wd

Revenu en l'absence de
sinistre. Prob = 1 p

w
Figure 7.5

La figure 7.6 reprsente le cas o le prix de l'assurance est dtermin de telle faon tre
actuariellement quitable pour les hauts risques. Comme le montre cette figure, ce prix, les
bas risques peuvent prfrer ne pas s'assurer du tout.
Revenu en cas
de sinistre.
Prob = p

(1 p H ) / pH

L
H

wd

Revenu en l'absence de
sinistre. Prob = 1 p

w
Figure 7.6

La figure 7.7 est un autre cas illustrant le fait que pour un prix d'assurance unique , les hauts
risques s'assurent plus et les bas risques s'assurent moins. Ici, la compagnie d'assurance
propose un contrat d'assurance actuariellement quitable pour un risque moyen.
Revenu en cas
de sinistre.
Prob = p

(1 p ) / p

H
L

wd
E

w
Figure 7.7

Revenu en l'absence
de sinistre. Prob = 1 p

123

En rsum, pour un prix d'assurance unique , les hauts risques s'assurent plus que les bas
risques. Cette situation entrane des pertes pour la compagnie d'assurance. Pour rtablir son
quilibre, la compagnie d'assurance augmente son prix, ce qui incite encore plus les bas
risques rduire leur demande d'assurance. Il s'agit donc d'une situation de slection adverse
o les hauts risques chassent les bas risques. Cette situation est essentiellement une
consquence de l'asymtrie de l'information existant entre les compagnies d'assurance et les
individus. Elle est galement la consquence de lexistence de prix linaires, cest--dire de
prix indpendants de la quantit.

7.3.

Equilibres sparants et quilibres mlangeants

Considrons maintenant que les compagnies d'assurance mettent en place un mcanisme leur
permettant de segmenter la population en fonction du niveau de risque de l'individu. Des
contrats d'assurance prix non linaires peuvent permettre aux compagnies d'assurance
d'atteindre cet objectif. Dans ce cas, elles proposent des contrats prix / quantit, c'est--dire
des contrats o l'individu n'a plus la possibilit de choisir le montant de l'indemnit (la
quantit). Ce type de contrat est reprsent par un point dans le plan ayant pour axes le revenu
dans le cas de l'tat de nature 1 et le revenu dans le cas de l'tat de la nature 2.
Revenu en cas
de sinistre.
Prob = p

w d + 2

wd

w 1

Revenu en l'absence de
sinistre. Prob = 1 p

Figure 7.8

Le point A par exemple dans la figure 7.8 correspond un contrat d'assurance o l'individu
paie la somme 1 et reoit une indemnit de 2 en cas de sinistre. Les autres points de la
droite EA ne sont plus des contrats d'assurance proposs par la compagnie d'assurance.
Deux types de contrats non linaires sont envisageables :120
Des contrats mlangeants (1 , 2 ) destins indistinctement tous les types
d'individus, qu'ils soient bas risque ou haut risque.
Des contrats sparants ( 1H , 2H ) et ( 1L , 2L ) , le premier tant destin aux et choisi
par les individus haut risque et le second tant destin aux et choisi par les
individus bas risque.

120

Voir aussi J.J. Laffont (1991), page 137.

124

On montre dabord que les contrats mlangeants ne sont pas robustes la concurrence entre
les compagnies d'assurance. Si reprsente la proportion des hauts risques, alors la
probabilit moyenne de sinistre est p = p H + (1 ) p L . Soit ED la droite correspondant la
pente (1 p ) / p et soit un contrat d'assurance prix non linaire reprsent par le point C
sur cette droite. Ce contrat procure la compagnie d'assurance une esprance de profit nulle.
A ce point, les courbes d'indiffrence des individus du type H et du type L se croisent comme
indiqu dans la figure 7.9.

Revenu en cas
de sinistre.
(1 p H ) / pH

(1 p ) / p

(1 p L ) / pL

C
H
L

wd

Figure 7.9

Revenu en l'absence de
sinistre.

Cette figure montre que tout contrat d'assurance situ dans la zone hachure est prfr par les
individus bas risque. Un tel contrat, s'il est de pente infrieure (1 p L ) / p L et situ dans la
zone hachure, procure la compagnie d'assurance une esprance de profit strictement
positive. En situation de concurrence, un tel contrat sera donc propos par une autre
compagnie d'assurance et sera accept par les individus bas risque. En consquence, la
compagnie ayant propos le contrat reprsent par le point C n'attirera plus que les individus
haut risque, ce qui engendrera une esprance de profit strictement ngative. Donc, le contrat
mlangeant reprsent par le point C ne peut tre un contrat viable dans un march
d'assurance concurrentiel. En d'autres termes, un tel contrat n'est pas robuste la concurrence.
Considrons maintenant le cas o la compagnie d'assurance propose aux individus des
contrats sparants ( 1H , 2H ) et ( 1L , 2L ) . Ces contrats doivent tre tels que chaque type
d'individu choisisse de faon optimale le contrat qui lui est destin. En d'autres termes,
l'individu de type H choisit le contrat ( 1H , 2H ) car c'est sa meilleure rponse aux
propositions de la compagnie d'assurance. Il en est de mme pour l'individu de type L pour
qui le contrat ( 1L , 2L ) est le meilleur choix. On dit dans ce cas, que les choix effectus sont
le rsultat d'un processus d'autoslection.
Le seul couple de contrats sparants possibles o chaque type d'individu choisit par
autoslection le contrat qui lui est destin est reprsent par les points B et A tel qu'il ressort
dans la figure 7.10.

125

Revenu en cas
de sinistre

Ligne de certitude
(1 p L ) / pL

H
(1 pH ) / pH

A
E

wd

Figure 7.10

Revenu en l'absence de
sinistre.

Le meilleur choix de l'individu du type H est le contrat B et le meilleur choix de l'individu du


type L est le contrat A. Aucun type d'individu ne sera incit dvier de ces choix.121
Pour qu'un couple de contrats soit un couple de contrats sparants, il est ncessaire que
l'individu du type H ne soit pas incit dvier. Comme tout contrat situ dans la zone grise
est prfr par l'individu du type H au contrat B, il est ncessaire que d'une part, les deux
contrats soient situs tout deux sur la mme courbe d'indiffrence de l'individu du type H,
d'autre part, que cette courbe d'indiffrence soit tangente la droite de pente (1 p H ) / p H .
Notons que la prime d'assurance par unit d'indemnit 1 2 est suprieure pour le contrat B.
En d'autres termes, les contrats d'assurance sparants proposs par les compagnies d'assurance
sont tels que le prix unitaire de l'assurance pour les individus haut risque est suprieur au
prix unitaire pour les individus bas risque. De plus, le contrat B implique une couverture du
risque plus forte que celle du contrat A.
Pour que le couple de contrats sparants soit robuste la concurrence, il faut qu'il ne soit pas
remis en cause par un contrat mlangeant. Deux cas de figure sont envisager et cela en
fonction de la valeur de , la proportion d'individus haut risque. Le premier cas a trait la
situation o la proportion est faible. Ceci implique que la droite ED reprsentative des
contrats mlangeants esprance de profit nulle coupe la courbe d'indiffrence de l'individu
faible risque passant par le point A comme le montre la figure 7.11.

121

Relevons que strictement parlant, l'individu du type p H est indiffrent entre les deux contrats B et A car ils
sont situs sur la mme courbe d'indiffrence. Nous avons donc implicitement considr que l'individu du type
p H choisit de faon naturelle le contrat B. Autrement, pour le forcer faire ce choix, il suffit que le contrat A
soit prs dcal vers le point E sur la droite EA.

126

D
Revenu en cas
de sinistre

(1 p L ) / p L

D'

(1 pH ) / pH

B
A
E

wd

Figure 7.11

Revenu en l'absence
de sinistre.

Dans ce cas, tous les contrats mlangeants situs dans la zone hachure (figure 7.11) seront
prfrs par les deux types d'individus et procureront un profit espr positif. Ce type de
contrats mlangeants rend le couple de contrats sparants (B, A) non viable. Comme ce
contrat mlangeant est lui galement non robuste la concurrence, il n'existe donc pas
d'quilibre lorsque la proportion d'individus haut risque est faible.
Le deuxime cas concerne la situation o la proportion d'individus haut risque est leve.
Dans ce cas, la droite ED' reprsentative des contrats mlangeants esprance de profit nulle
passe au-dessous de la courbe d'indiffrence des individus bas risque passant par le point A.
Dans ce cas, aucun contrat mlangeant ne peut attirer simultanment les individus haut
risque et les individus bas risque. Le couple de contrats sparants (B, A) est donc dans ce
cas bien un quilibre car il est robuste la concurrence.
L'quilibre reprsent par le couple (B, A) procure une assurance totale aux individus haut
risque mais une assurance partielle (sous optimale) aux individus faible risque. C'est une
situation de slection adverse due l'existence de l'asymtrie de l'information.
En clair, pour pouvoir discriminer entre les deux types de risque, la compagnie d'assurance
propose un menu de contrats tel que :
L'un prvoyant une couverture totale du risque avec une prime d'assurance leve ;
L'autre prvoyant une couverture plus faible du risque avec une prime d'assurance
plus faible.
Par autoslection, l'individu haut risque choisit le contrat ayant une couverture totale du
risque et l'individu risque faible choisit le contrat ayant une couverture partielle du risque.
En proposant un tel menu de contrats, la compagnie d'assurance cherche dcourager
l'individu haut risque choisir le mme contrat que l'individu faible risque, ce qui permet
de sparer et didentifier les deux types dindividus.

127

Chapitre 8 : Le modle de signal de Spence

En prsence du phnomne de slection adverse, les agents conomiques peuvent dvelopper


deux principales ractions possibles : le signal et le filtrage (screening). Le filtrage consiste
pour la partie non informe qui joue donc en premier proposer la partie informe un menu
de contrats de telle sorte que chaque type d'individu choisisse le contrat qui lui est destin. Par
ce processus d'autoslection, la partie informe rvle son type. Ce mcanisme de march a
t notamment expos par Rothschild & Stiglitz (1976) pour le march des assurances.122
Dans un mcanisme de signal, c'est la partie informe qui joue en premier. En considrant
l'exemple des voitures d'occasion de Akerloff (1970), le signal est le fait des vendeurs
possdant une voiture de bonne qualit, soit la partie informe de qualit leve. Etant exclus
par les vendeurs possdant une voiture de mauvaise qualit, ceux-ci sont incits signaler la
partie non informe la qualit de leur produit. Le processus de signal est un mcanisme de
march qui est une rponse possible l'asymtrie de l'information, c'est--dire un mcanisme
de march qui permet de transmettre de l'information de la partie informe vers la partie non
informe.
Dans le cadre du march du travail, le modle de signal propos par Spence (1973) montre
que le niveau dducation peut tre un signal (coteux) quutilisent les travailleurs ayant une
capacit productive leve pour signaler leur qualit, ce qui leur permet dobtenir un salaire
plus lev. Ainsi, dans le modle de Spence, l'metteur du signal est le travailleur, le rcepteur
les firmes et le signal est le niveau d'ducation.123

8.1.

Les donnes de base du modle de signal

L'asymtrie de l'information
Il y a problme d'asymtrie d'information lorsqu'une information pertinente de l'change n'est
pas observe par l'une des parties de l'change. Dans le cas d'un contrat de travail, la
productivit du travailleur est une information pertinente. Or, lors du recrutement d'un
travailleur, l'employeur ne peut observer la capacit productive du candidat. A la place de
cette dernire, l'employeur observe d'autres caractristiques du travailleur comme par exemple
le niveau d'ducation. Dans le modle de signal, chaque travailleur est suppos connatre sa
propre capacit productive.
A titre de simplification, on considre qu'un travailleur peut avoir lun des deux niveaux
possibles de capacit productive : une capacit productive faible L ou une capacit
productive leve H . On a donc = { L , H } avec L < H . La probabilit a priori qu'un
travailleur soit du type H (resp. L ) est p (resp. 1-p). Ces probabilits peuvent galement
tre interprtes comme les proportions de travailleurs de type H et de type L .
122

Voir chapitre 7 ci-dessus.


M. Spence (1973). Job Market Signalling". Quarterly Journal of Economics. Vol. 87. P 296-332 et J. Riley
(2001). Silver Signals: Twenty-Five Years of Screening and Signaling. Journal of Economic Literature. Vol.
XXXIX. Pages 423-478.

123

128

L'ducation en tant que signal


Pour signaler sa capacit productive, le travailleur peut choisir un niveau d'ducation e qui est
une information observable par les firmes. Le cot d'obtention d'un niveau d'ducation e pour
un travailleur de capacit est C (e, ) . A titre de simplification, le niveau d'ducation e est
considr comme tant le nombre d'annes de scolarisation.
L'hypothse fondamentale du modle de Spence est que pour le travailleur faible capacit, le
signal est plus coteux que pour le travailleur capacit leve. En d'autres termes, une
condition ncessaire pour qu'une caractristique joue le rle de signal est que le cot du signal
soit ngativement corrl la capacit productive. La relation entre le cot de l'duction et la
capacit productive du travailleur est dcrite par les caractristiques suivantes : C (0, ) = 0 ,
C (e, ) < 0 , Ce (e, ) > 0 , Cee (e, ) > 0 et Ce (e, ) < 0 .124
Ce (e, ) est le cot marginal de l'ducation pour un travailleur de capacit . La dernire
caractristique signifie que le cot marginal d'mission du signal dcrot avec la qualit. En
d'autres termes, le cot marginal de l'ducation est plus lev pour le travailleur faible
capacit par rapport au travailleur capacit leve. Cette condition, appele condition de
Spence-Mirrlees, offre la possibilit de trier les travailleurs selon leur niveau de productivit
et ce, au vu de leur diplme. Donc, dans le cas de deux niveaux de capacit productives L et
H , on a:
Ce (e, L ) > Ce (e, H ) pour tout e.

La courbe du cot de l'ducation suivant ces caractristiques est donne la figure 8.1 :
C (e, )

C (e, L ) C (e, H )

e
Figure 8.1

Ainsi, le cot total et le cot marginal sont tous deux plus levs pour le travailleur faible
capacit que pour le travailleur forte capacit.
Observant le niveau d'ducation e (et non la capacit productive ) qu'elles interprtent et
acceptent comme tant un signal, les firmes proposent un salaire w(e ) en fonction du niveau
124

Lindice de C (e, ) signifie la drive de C (e, ) par rapport . on a donc : C (e, ) =

indice double signifie quil sagit dune drive seconde.

C (e, )
. Un

129

d'ducation e. Sachant que le salaire est li au niveau d'ducation, le travailleur choisira le


niveau d'ducation avec pour objectif la maximisation de son paiement (utilit) qui est
reprsent par la diffrence entre le salaire offert et le cot du signal, soit
u (w, e / ) = w(e ) C (e, ) .

Croyances et fonction de salaire


Pour faire une proposition de salaire, l'employeur ne peut se baser que sur l'information
observable, savoir le niveau d'ducation. Mais l'information pertinente pour la firme est la
capacit productive du travailleur et non pas son niveau d'ducation. En consquence, pour
dcider du recrutement et tablir son offre de salaire, la firme se base sur le niveau
d'ducation pour se faire une opinion sur la capacit productive du travailleur. En d'autres
termes, le niveau d'ducation est utilis pour transmettre (signaler) l'information non
observable relative la capacit productive. Sur la base de l'exprience passe, les firmes
forment des croyances qui sont des probabilits sur la capacit productive conditionnelles au
niveau d'ducation.
La productivit d'un travailleur de capacit et de niveau d'ducation e est y ( , e ) . Le
paiement obtenu par l'entreprise est donc gal y ( , e ) w(e ) lorsque le travailleur est
employ et zro si le travailleur n'est pas employ. Dans le modle de signal de Spence, les
firmes ont pour objectif la maximisation de leur profit espr et la comptition entre les firmes
implique que les profits esprs des firmes sont nuls.125 En consquence, aprs avoir observ
le niveau d'ducation, les firmes offrent un salaire gal l'esprance de la productivit, ce qui
donne :
w(e ) = ( H / e ) y ( H , e ) + [1 ( H / e )] y ( L , e )

Pour rendre le modle plus frappant, Spence (1973) considre que l'ducation n'a aucun effet
sur la capacit productive du travailleur, ce qui donne dans ce cas y ( , e ) = .126
Cette quation est galement l'expression de la stratgie des entreprises (le rcepteur). Elle
spcifie une action (salaire offert) pour chaque message possible (niveau d'ducation). Pour
que la stratgie des firmes soit complte, elle doit spcifier une action (salaire offert) pour
chaque message possible. La probabilit ( H / e ) est la croyance a posteriori des firmes que
le travailleur est du type H (capacit leve) tant donn le niveau d'ducation observ e.
Cette probabilit est commune aux firmes. Ceci implique que les croyances des firmes sont
galement les mmes pour des niveaux d'ducation e en dehors du sentier d'quilibre. La
figure 8.2 reprsente une fonction de salaire w(e ) qui est une esprance base sur les
croyances a posteriori des firmes ( / e ) .
Cette figure montre que le salaire w(e ) est toujours compris entre L et H . Le point
(e, w(e)) par exemple, reprsente le cas o les firmes observent le niveau d'ducation e et
en dduisent les croyances ( L / e = e) = ( H / e = e) = 1 / 2 sur le type du travailleur, ce
125

Voir Mas-Colell, Whinston & Green (1995), page 452.


Voir par exemple R. Gibbons (1992), pour lexpos du modle de Spence dans le cas o lducation modifie
la productivit du travailleur.
126

130

1
1
qui donne le salaire w(e) = L + H . D'une faon gnrale, tout salaire w(e ) strictement
2
2
compris entre L et H est la consquence de croyances a posteriori ( H / e ) ou, de faon
quivalente ( L / e ) .
w

w(e)

e
Figure 8.2

La proprit de lunicit de lintersection


La proprit de lunicit de lintersection (single crossing property) est une consquence de
l'hypothse fondamentale de corrlation ngative entre la capacit productive et le cot de
l'ducation. Pour faire ressortir les implications de cette hypothse fondamentale en termes de
courbes d'indiffrence, considrons un travailleur ayant un niveau d'ducation e1 et qui
peroit un salaire gal w1 . Dterminons l'augmentation de salaire ncessaire pour
compenser le cot induit par une augmentation de son niveau d'ducation de e1 e2 . Pour
le travailleur de faible capacit, il est plus coteux d'obtenir ce supplment d'ducation. Pour
le compenser de ce surcrot de cot et ainsi maintenir constante son utilit, une plus grande
augmentation du salaire ( wL au lieu de wH ) est ncessaire. Il en rsulte les courbes
d'indiffrence suivantes dans l'espace (w, e ) de la figure 8.3.
Une courbe d'indiffrence reprsente les combinaisons de salaire w et de niveau d'ducation e
donnant la mme utilit. Au point d'intersection (e1 , w1 ) et d'une faon gnrale en tout autre
point d'intersection des courbes d'indiffrence (de deux types diffrents de travailleur), la
pente de la courbe d'indiffrence du travailleur de type L est suprieure celle de l'individu
de type H . Cette caractristique est connue sous l'appellation de proprit de lunicit de
lintersection .

131

+u

wL

wH
w1

e1

e2

Figure 8.3

L'quilibre baysien Parfait


Le modle de signal de Spence appartient la classe des jeux dynamiques information
incomplte et son timing est le suivant :
1. La Nature dtermine, par tirage alatoire, la capacit productive du
travailleur qui peut tre soit leve H avec la probabilit p soit faible L avec
la probabilit (1 p ) . Le vecteur ( p,1 p ) est la distribution de probabilit a
priori de la capacit productive. Elle est connaissance commune.
2. Le travailleur observe sa capacit et choisit son niveau d'ducation e( ) 0 .
3. Les firmes observent le niveau d'ducation e du travailleur (mais non sa
capacit productive) quelles interprtent comme un signal du travailleur sur sa
capacit productive et lui font simultanment une offre de salaire w(e) .
4. Le travailleur accepte la plus haute offre de salaire.
L'objectif du modle est l'tude de l'existence d'quilibres de ce jeu et de leurs proprits.
Nous nous contenterons ici des quilibres en stratgies pures. Le concept d'quilibre utilis est
celui de l'quilibre baysien parfait.127 Un quilibre baysien parfait est la donne de
l'ensemble des stratgies d'quilibre (e * ( ), w* (e )) du travailleur et des firmes et des
croyances ( / e ) des firmes satisfaisant les proprits suivantes :128
La stratgie du travailleur e * ( ) est optimale tant donne la stratgie w* (e ) choisie
par les firmes ;
Les croyances des firmes ( / e ) sont consistantes avec la stratgie dquilibre des
travailleurs et sont obtenues par utilisation de la formule de Bayes lorsque cela est
possible ;
127

Voir chapitre 5 pour la dfinition de lquilibre baysien parfait pour un jeu de signal.
Afin de ne pas alourdir lexpos outre mesure, nous ngligerons le qualificatif au sens faible en parlant du
concept de lquilibre baysien parfait. Lquilibre baysien parfait sera implicitement au sens faible sil ne
spcifie aucune restriction sur les croyances hors quilibre et ne sera pas au sens faible sil spcifie des
croyances raisonnables en dehors du sentier dquilibre.
128

132

Les firmes sont en situation de concurrence et font une offre simultane tel que la
fonction de salaire w* (e ) soit un quilibre de Nash de ce jeu (entre les firmes). Le
salaire offert est donc gal la productivit espre tant donnes les croyances
consistantes ( / e ) .
Nous montrerons que ce jeu de signal admet un quilibre baysien sparant dans lequel les
firmes interprtent l'ducation comme un signal de capacit. Donc, le rle du signal est de
permettre aux firmes, partir de l'observation du niveau d'ducation choisi par le travailleur,
d'infrer la capacit productive des travailleurs qui est pour elles une information non
observable. Ainsi, malgr son inutilit (suppose) dans l'amlioration du niveau de
comptence des travailleurs, l'ducation est tout de mme demande par les travailleurs car
elle leur permet de signaler leur capacit productive. Le jeu ainsi dfini admet un quilibre
dans lequel les travailleurs haute productivit choisissent un niveau d'ducation suprieur
celui des travailleurs faible capacit et les firmes interprtent cette diffrence comme tant
un signal de la capacit des travailleurs et donc offrent un salaire lev pour le travailleur
ayant un niveau d'ducation lev et un salaire faible pour le travailleur ayant un niveau
d'ducation faible.

8.2.

Le cas de symtrie de linformation

A titre de benchmark, considrons en premier lieu la situation d'information complte, c'est-dire la situation o la capacit productive du travailleur n'est pas son information prive, mais
plutt une information commune partage par tous les acteurs du jeu. La comptition entre les
firmes impliquant que les profits sont nuls, le travailleur de capacit et d'ducation e
obtient un salaire gal sa productivit. En d'autres termes, si les entreprises pouvaient
observer la productivit des travailleurs, elles verseraient un salaire diffrenci en fonction de
la capacit productive du travailleur, soit : w( H ) = H et w( L ) = L .
En situation d'information complte, un travailleur de capacit choisit un niveau
d'ducation e qui soit la solution du programme suivant :

max u (w, e / ) = w(e) C (e, )


e

Comme le salaire est indpendant du niveau d'ducation et cette dernire est coteuse, le
niveau optimal d'ducation des deux types de travailleur est donc 0, soit e * ( H ) = e * ( L ) = 0 .
La figure 8.4 fait ressortir le choix des travailleurs de type L et H en cas de symtrie de
l'information.

133

H
w

w
+u

+u

wH = H

wH = H
wL = L

wL = L

e * ( H ) = e * ( L ) = 0

e * ( H ) = e * ( L ) = 0

Figure 8.4

8.3.

e
Figure 8.5

Le cas de lasymtrie de linformation

Dans le cas d'asymtrie de l'information sans signal, les firmes ne peuvent pas distinguer
entre les deux types de travailleurs. Par consquence, l'asymtrie de l'information donne au
travailleur de faible capacit (le type L ) la possibilit de se faire passer pour le travailleur de
capacit lev (le type H ). La figure 8.5 montre que par rapport au cas de symtrie de
l'information, le type L peut augmenter son utilit en imitant le type H .
Les firmes ne pouvant distinguer les deux types de travailleurs, elles offriront donc un salaire
gal l'esprance de productivit, soit :
E (w) = p H + (1 p ) L

On a videmment wL < E (w) < wH . Le travailleur du type H est donc dfavoris par la
situation d'asymtrie d'information sans possibilit de signal puisqu'il reoit un salaire moyen
infrieur au salaire correspondant sa capacit productive. Il est de ce fait incit mettre un
signal (mme coteux) partir duquel les firmes infrent la qualit du travailleur. La
consquence de cette obligation est que le type H sera contraint de s'loigner de son niveau
optimal correspondant au cas de symtrie de l'information.
L'objectif du modle de Spence est d'tudier la possibilit d'existence d'quilibres pour ce jeu
de signal. Il peut exister deux types d'quilibre : Equilibre sparant et quilibre mlangeant.
Par quilibre, on entend ici un tat partir duquel aucune partie nest incite dvier de faon
unilatrale, ce qui correspond lquilibre de Nash.

134

8.4.

Les quilibres baysiens parfaits

Pour l'tude des quilibres baysiens parfaits, symbolisons par e * ( ) , le niveau d'ducation
d'quilibre du travailleur aprs avoir observ son type et par w* (e ) , le salaire d'quilibre offert
par les firmes aprs avoir observ le niveau d'ducation du travailleur.

Le niveau d'ducation e
w

H
Courbes d'indiffrence
du type L

Figure 8.6

Soit e un niveau d'ducation tel que u ( H , e / L ) = u ( L , 0 / L ) , c'est--dire H C (e, L ) =


L C (0, L ) . En d'autres termes, le niveau d'ducation e est tel que l'individu de type L est
indiffrent entre d'une part, choisir un niveau d'ducation gal zro et recevoir un salaire de
L et d'autre part choisir le niveau d'ducation e et recevoir un salaire de H . La courbe
d'indiffrence du type L correspondant ces deux alternatives est reprsente par la figure
8.6. Le caractre cruciale de cette courbe d'indiffrence est le suivant : Pour des niveaux
d'ducation e ]0, e[ , le travailleur de type L prfre strictement l'alternative (e, H )
l'alternative (0, L ) .129 Par contre, pour des niveaux d'ducation e e , le travailleur de type
L prfre strictement l'alternative (0, L ) toute autre alternative (e, H ) . En d'autres
termes, mme avec un salaire lev H , l'individu de type L n'est pas dispos acqurir un
niveau d'ducation suprieur ou gal e .
Cette donne cruciale est une information commune tous les joueurs. En consquence, le
travailleur de type H et les entreprises savent que l'individu de type L n'est aucunement
incit choisir un niveau d'ducation suprieur ou gal e . Donc le travailleur de type H
peut utiliser cette information pour se distinguer du travailleur de type L , ceci en choisissant
un niveau d'ducation suprieur ou gal e .

Il est vident que pour e ] 0, e[ , tout travailleur prfre strictement lalternative (e, H ) lalternative
(0, L ) .

129

135

Equilibres sparant (separating equilibria)


On a un quilibre sparant lorsque chaque type de travailleur choisit un niveau dducation
qui lui soit propre, ce qui donne lieu un niveau de salaire pour chaque niveau de
productivit. Donc dans un quilibre sparant, le travailleur de haute capacit choisit le niveau
d'ducation e * ( H ) suprieur au niveau d'ducation e * ( L ) choisi par le travailleur de faible
capacit. En utilisant la formule de Bayes, les firmes dduisent des croyances qui soient
consistantes avec cette stratgie. Donc, si les firmes supposent que le travailleur choisit une
stratgie sparante et si elles observent le niveau d'ducation e * ( H ) , alors leurs croyances
(probabilit) que le travailleur est du type H est gale 1, soit ( H / e = e * ( H )) = 1 . De
mme, si elles observent le niveau d'ducation e * ( L ) , alors leurs croyances (probabilit) que
le travailleur est du type L est gale 1, soit : ( L / e = e * ( L )) = 1 .
Aprs observation du niveau d'ducation choisi par le travailleur, les firmes maximisent leur
esprance de profit et en raison de la concurrence, offrent un salaire gal l'esprance de
productivit, ce qui donne :
w(e ) = ( H / e ) H + [1 ( H / e )] L

Etant donnes leurs croyances consistantes, les firmes offrent un salaire de H au travailleur
haute capacit et un salaire L au travailleur de faible capacit. On a donc : w* (e * ( H )) = H
et w * (e * ( L )) = L . Etant donne cette meilleure rponse des firmes, la dcision optimale du
travailleur de faible capacit est de choisir un niveau d'ducation gal 0, soit : e * ( L ) = 0 .
En effet, le salaire d'quilibre offert par les firmes tant fix L , le travailleur maximise son
utilit en minimisant son cot d'ducation, ce qui peut tre obtenu par le choix d'un niveau
d'ducation nul. Le choix optimal du travailleur de type L est reprsent par la figure 8.7 qui
fait ressortir sa courbe d'indiffrence passant par son point d'quilibre
(e * ( L ), w(e * ( L ))) = (0, L ) . Dans un quilibre sparant, le travailleur de type L choisit donc
le mme niveau d'ducation que dans le cas d'information complte.
L

w * e * ( L ) = L

0 = e* ( L )

Figure 8.7

136

La figure 8.7 montre que si le travailleur de type H choisit un niveau d'ducation infrieur
e , alors le travailleur de type L sera incit (meilleure rponse) dvier et limiter. En
effet, la courbe d'indiffrence de l'individu de type L passant par le point (e, H ) avec
0 < e < e reprsente un niveau d'utilit suprieur par rapport la courbe d'indiffrence
passant par le point (0, L ) .
Afin d'annihiler l'incitation du travailleur de type L dvier du point (0, L ) , le travailleur
de type H choisira par consquence un niveau d'ducation e * ( H ) tel que le travailleur de
type L ne puisse pas l'imiter. Le niveau d'ducation e * ( H ) doit donc tre tel que
u ( L , 0 / L ) u ( H , e * ( H ) / L ) , soit L C (0, L ) H C (e * ( H ), L ) et finalement
L H C (e * ( H ), L ) . En d'autres termes, e * ( H ) doit tre au moins gal au niveau
d'ducation e comme le montre la figure 8.7.
On peut ainsi construire un quilibre baysien parfait sparant ayant les caractristiques
suivantes :
Stratgies des travailleurs : e * ( L ) = 0 et e * ( H ) = e ;
Une fonction de salaire w * (e ) telle que par exemple celle dcrite par la figure
8.8 avec notamment w * (e * ( L )) = w * (0 ) = L et w * (e * ( H )) = w * (e ) = H ;
Croyances a posteriori des firmes : ( L / e = 0 ) = 1 et ( H / e = e ) = 1 .
L

w* e* ( H ) = H

w* (e )

w* e * ( L ) = L

0 = e * ( L )

e = e * ( H )

Figure 8.8

Cet quilibre est un quilibre sparateur au moindre cot (least cost separating equilibrium).
Pour montrer qu'il s'agit bien d'un quilibre (de Nash) baysien parfait, remarquons en
premier lieu qu'tant donnes les croyances ( H / e = e ) = 1 et ( L / e = 0 ) = 1 , les
entreprises versent chaque travailleur un salaire gal sa productivit, ce qui reprsente une
situation optimale pour les entreprises. La figure 8.8 montre galement, qu'tant donne la

137
fonction de salaire w* (e ) , chaque type de travailleur aura choisi la courbe d'indiffrence la
plus leve possible.130
Notons qu'en fait, le type L est indiffrent entre les points (0, L ) et (e, H ) . Nous
considrons implicitement (sans perte de gnralit) que dans un quilibre baysien parfait, le
type L opte pour le premier quilibre (0, L ) . Autrement, on peut obtenir un quilibre
baysien parfait en posant que le travailleur de type H choisit un niveau d'ducation un
prs, lgrement suprieur e , ce qui force le type L choisir le point (0, L ) .
Une remarque importante est faire propos des croyances des firmes, remarque relier la
multiplicit des quilibres baysiens parfaits. Dans la construction de l'quilibre baysien
parfait de la figure 8.8, aucune restriction n'a t pose propos de ces croyances lorsque le
message du travailleur n'est ni zro ni e , c'est--dire lorsque le signal de l'metteur se situe en
dehors du sentier d'quilibre. Les seules restrictions imposes aux croyances concernent les
croyances du sentier d'quilibre et sont ( L / e = 0 ) = 1 et ( H / e = e ) = 1 . Ces restrictions,
bases sur la rgle de Bayes, sont satisfaites par la fonction de salaire w* (e ) de la figure 8.8
car w * (0 ) = L et w * (e ) = H .
La consquence de l'absence de restrictions imposes aux croyances en dehors du sentier
d'quilibre est que l'quilibre baysien parfait ainsi dfini est compatible avec plusieurs autres
fonctions de salaire. Par exemple, dans lquilibre dcrit la figure 8.9, on obtient les mmes
stratgies d'quilibre ( e * ( L ) = 0 ; e * ( H ) = e ; w * (0 ) = L et w * (e ) = H ) avec les croyances
suivantes : ( H / e e < e ) = 1 et ( H / e < e ) = 0 .
L

w* e* ( H ) = H

w* (e )

w* e* ( L ) = L

0 = e* ( L )

e = e* ( H )

Figure 8.9

Notons que e est le niveau maximal dducation que pourrait choisir le travailleur de type H car ce dernier
prfre en effet un salaire L avec un niveau d'ducation e = 0 un salaire H avec un niveau d'ducation
e>e.
130

138

Ces croyances signifient que les entreprises sont certaines que le travailleur est du type H si
son niveau d'ducation e est suprieur ou gal e . Par contre, si le niveau d'ducation e est
infrieur e , alors les firmes considrent avec certitude que ce dernier est du type L . Etant
donnes ces croyances, le salaire optimal offert par les firmes est w * (e ) = L si e < e et
w * (e ) = H si e e . Le graphe de cette fonction de salaire est donn la figure 8.9. Etant
donne cette fonction de salaire (la meilleure rponse des firmes), les courbes d'indiffrence
montrent que les meilleurs choix des travailleurs de type L et H sont respectivement
e * ( L ) = 0 et e * ( H ) = e .
La multiplicit des quilibres baysiens parfaits peut jeter un doute srieux sur le bien-fond
de ce modle. Cependant, lintroduction de raffinements des croyances hors quilibre permet
dcarter tous les quilibres non raisonnables.
L'interprtation de l'existence d'un quilibre sparant est que les travailleurs de haute capacit
doivent supporter un cot d'ducation leur permettant de se distinguer des travailleurs de
faible capacit et obtenir ainsi un salaire plus lev. Le signal (ici lducation) n'est pas
ncessairement un objectif en tant que tel. Dans un quilibre sparant, le comportement
rationnel des joueurs implique que chaque travailleur choisisse un niveau d'ducation qui est
rvlateur de son type. Malgr l'absence suppose d'impact de l'ducation sur la performance,
la demande d'ducation trouve sa justification dans sa qualit de signal de capacit productive.
Cette aptitude de signal de l'ducation est rendue possible par le fait qu'au del d'un certain
niveau d'ducation e , le cot d'ducation qui en rsulte ne peut tre support par les
travailleurs de faible capacit. Par contre, un travailleur de haute capacit peut supporter ce
cot (mais ne dpassant pas e ). Le choix d'un niveau d'ducation diffrent est clairement d
une diffrence de capacit productive. Ce potentiel de signal de l'ducation est le rsultat de la
caractristique fondamentale C e (e, ) < 0 qui a donn lieu la proprit de lunicit de
lintersection.

Equilibres mlangeants (pooling equilibria)


Lorsquil existe, dans un quilibre mlangeant les deux types de travailleurs envoient le mme
signal, c'est--dire choisissent le mme niveau d'ducation, que nous symboliserons par e p .

On a donc : e * ( L ) = e * ( H ) = e p . L'quilibre baysien parfait impose que les croyances des


firmes soient obtenues par application de la rgle de Bayes et soient consistantes avec la
stratgie des travailleurs. En consquence, tant donne la stratgie e * ( L ) = e * ( H ) = e p des
travailleurs, les croyances a posteriori des entreprises sont identiques aux croyances a priori.
Les firmes ne rvisent donc pas leurs croyances. On a donc ( H / e = e p ) = p et

( L / e = e p ) = 1 p . La meilleure rponse des firmes est dans ce cas d'offrir un salaire gal
l'esprance de productivit, soit :
w * (e p ) = ( H / e = e p ) H + ( L / e = e p ) L = p H + (1 p ) L = E ( )

La figure 8.10 montre que le niveau d'ducation e p ne peut tre suprieur e~ car cela
correspondrait pour le type L une courbe d'indiffrence (passant par un point (e, E ( ))

139

e ) d'un niveau d'utilit infrieur, ce qui constitue pour le type L une incitation
avec e > ~
dvier vers e = 0 avec un salaire gal L . En d'autres termes, pour qu'un quilibre
mlangeant existe, il faut que u (E ( ), e p / L ) u ( L , 0 / L ) , ce qui entrane 0 e p e~ .
Type L

E ( )

e~

Figure 8.10

La figure 8.11 dcrit un quilibre baysien parfait dans lequel le niveau d'ducation e p choisi
par les deux types est compris entre 0 et e~ ainsi que la fonction de salaire qui soutient cet
quilibre.
Type L

Type H

E ( )
w* (e )

ep

e~

e
Figure 8.11

Pour montrer qu'il s'agit bien d'un quilibre, notons en premier qu'tant donne la fonction de
salaire w* (e ) de la figure 8.11, les deux types de travailleur maximisent leur utilit au point
(e p , E ( )) . En effet, tout autre salaire de la fonction de salaire w* (e) coupe (ou est un point de
tangence avec) une courbe d'indiffrence un niveau d'utilit infrieur. Les firmes sont
galement en situation optimale car le salaire vers E ( ) est gal l'esprance de
productivit. Enfin, la fonction de salaire w * (e ) est consistante avec les croyances

140

rvises (baysiennes) sur le sentier d'quilibre, car l'observation de e p , les croyances

des firmes sont ( H / e = e p ) = p et ( L / e = e p ) = 1 p , ce qui donne un salaire

d'quilibre de E ( ) . Notons quil existe une grande libert dans le trac de la fonction w* (e ) ,
ceci en raison de labsence de restriction sur les croyances hors quilibre.

Ainsi, dans un quilibre mlangeant, le niveau d'ducation ne transmet aucune information et


ne joue donc pas de fonction de signal. De ce fait, tout niveau d'ducation positif dans un
quilibre mlangeant peut tre considr comme un surinvestissement dans l'ducation.
Comme lutilit du travailleur diminue avec le niveau dducation e, lquilibre Pareto
dominant est lquilibre dans lequel e p = 0 .131
Au mme titre que pour l'quilibre sparant, il existe une multitude d'quilibres mlangeants.
Comme le montre la figure 8.11, il existe un continuum dquilibres mlangeants, autant que
de niveaux dducation e p compris entre 0 et e~ . Comme mentionn plus haut, lexistence de
plusieurs quilibres nest pas un rsultat dsirable. En fait, lintroduction de croyances hors
quilibre raisonnables permet dcarter tous les quilibres mlangeants.

8.5.

Raffinements des croyances hors quilibre et slection des quilibres

Un modle de signal peut admettre plusieurs quilibres qui peuvent tre sparants ou
mlangeants. Ceci est en particulier la consquence de l'absence de restrictions relatives aux
croyances des firmes hors sentier d'quilibre. Or, pour une dfinition complte de la stratgie
des firmes, on doit galement spcifier les croyances des firmes si le message (choix du
niveau d'ducation) du travailleur n'est pas le message d'quilibre. Des restrictions sont
proposes afin d'carter les quilibres ayant des croyances hors quilibre non raisonnables.
Ces raffinements ont pour effet de rduire le nombre d'quilibres. En consquence, un
quilibre baysien parfait ne sera considr comme tant une prdiction crdible que si les
croyances hors sentier d'quilibre cet quilibre sont raisonnables.132
Commenons par montrer comment les quilibres mlangeants ne survivent pas au test du
raffinement bas sur le critre de domination par lquilibre et le critre intuitif. Considrons
pour cela un quilibre mlangeant quelconque tel que dcrit la figure 8.12 (quasiment
identique lquilibre de la figure 8.11) ayant comme stratgies dquilibre
e * ( H ) = e * ( L ) = e p et w* (e p ) = E ( ) . A cet quilibre, on a w* (e ) = H pour tout e e car la

croyance raisonnable ces niveaux dducation est ( H / e e ) = 1 .

131
132

Voir par exemple Salani, B. (1994). Thorie des contrats. Economica, 1994. Paris. Page 54.
Voir chapitre 5 pour lexpos de certains critres de raffinements des quilibres des jeux de signaux.

141

Type L

Type H
w* (e )

H
E ( )

ep

e e

Figure 8.12

La fonction de salaire w* (e ) qui supporte cet quilibre doit tre telle que w* (e ) < H pour
e e e . Autrement, le type H serait incit dvier vers un point ( H , e ) avec e e e .
Mais pour que w* (e ) soit strictement infrieure H , il faut que les croyances des firmes
soient telles que ( H / e ) < 1 pour e e e . Or, ces croyances ne sont pas raisonnables car
l'utilit obtenue par le type L cet quilibre mlangeant est strictement suprieure l'utilit
qu'il obtiendrait pour une issue (w* (e ), e ) avec e e e et ce quelque soit la valeur de
w * (e ) , c'est--dire mme si le salaire est maximal, soit gal H . On a ainsi pour e [e, e] :

u * (E ( ), e p / L ) > Max
u (w, e / L )
*
w W ( , e )

W * (, e ) est l'ensemble des salaires d'quilibre (meilleures rponses) des firmes qui font suite
l'observation par ces firmes du niveau d'ducation e du travailleur. En d'autres termes, pour
le type L , le choix d'un niveau d'ducation e [e, e] est strictement domin par le niveau
d'ducation E ( ) de l'quilibre mlangeant. Par contre, le type H pourrait accrotre son
utilit s'il venait choisir un niveau d'ducation e [e, e] . En consquence, si les firmes
venaient observer un niveau d'ducation e [e, e] , elles devraient tre raisonnablement
convaincues qu'il ne s'agit pas d'un travailleur du type L . Donc, tant donn l'quilibre
mlangeant (e p , E ( )) , l'observation d'un niveau d'ducation hors quilibre e [e, e] , ne

sera considre comme tant raisonnable que la croyance ( H / e ) = 1 . Donc, pour e e e


, on obtient le salaire w* (e ) = H , ce qui cre une incitation pour le travailleur de type H
dvier vers le niveau d'ducation e et obtenir ainsi un salaire de H . Lquilibre mlangeant
de la figure 8.12 ne satisfait donc pas le critre intuitif.

Ceci implique galement la dviation du type L vers le niveau dducation gal 0. En effet,
tant donne la dviation du type H , pour tout choix dducation e [e, e] , les croyances
raisonnables des firmes sont ( L / e [e, e]) = 1 . Les firmes proposeront donc un salaire L ,

142

ce qui incite le type L choisir un niveau dducation gal 0. Lexistence de cette possible
dviation implique qu'aucun quilibre mlangeant ne pourra survivre si l'on imposait aux
croyances hors sentier d'quilibre d'tre raisonnables sur la base du critre intuitif.
Concernant les quilibres sparants, le raffinement selon le critre de la domination par
lquilibre implique que la croyance raisonnable lobservation dun niveau dducation hors
quilibre suprieur e est ( L / e > e ) = 0 ou, de faon quivalente ( H / e > e ) = 1 . En effet,
pour tout niveau dducation suprieur e , le type L obtient une utilit infrieure celle
obtenue lquilibre et ce quelque soit la croyance des firmes. Il en rsulte que pour le
message hors quilibre e e , le salaire dquilibre est w* (e ) = H , comme cela ressort la
figure 8.9.
Ceci implique son tour quun quilibre sparant o le type H choisirait un niveau
dducation suprieur e ne satisfait pas le critre de domination par lquilibre car comme
le montre la figure 8.13 un tel quilibre nest possible quavec un salaire infrieur H pour
des niveaux dducation compris entre e et e , ce qui correspond aux croyances hors quilibre
non raisonnables ( H / e [e, e]) < 1 .

w e ( H ) = H
*

w* (e )

w* e* ( L ) = L

0 = e* ( L )

Figure 8.13

Le seul quilibre qui satisfait aux tests des raffinements des croyances hors sentier quilibre
est celui o le type de faible productivit choisit un niveau dducation gal 0 correspondant
son choix du cas de linformation complte et o le type de haute productivit choisit un
niveau dducation suprieur mais juste suffisant pour dcourager le type de faible
productivit limiter.

8.6.

Limpact du signal sur le bien-tre

En cas de symtrie de l'information, chaque type de travailleur reoit le salaire qui correspond
sa capacit productive. On a donc w * ( L ) = L et w * ( H ) = H . L'ducation n'ayant aucun

143

impact (suppos) sur la capacit productive, chaque type de travailleur choisit un niveau
d'ducation gal zro, soit e * ( L ) = e * ( H ) = 0 . En prsence d'asymtrie d'information, dans
un quilibre sparant, la situation du travailleur de type L est identique. Par contre, pour
obtenir un salaire de H , le travailleur de type H , se trouve tre dans l'obligation de choisir
le niveau d'ducation e 0 afin de dcourager le type L l'imiter. En d'autres termes,
l'existence de travailleurs de type L exerce une externalit ngative sur les travailleurs de
type H .133
Par rapport la situation d'asymtrie d'information sans signal, l'existence de la possibilit de
signal a des effets diffrents sur les parties concernes. Pour les firmes, dans les deux cas,
elles paient un salaire gal E ( ) . Pour le travailleur de faible capacit, sans signal, le salaire
peru est gal E ( ) . Mais lorsqu'il existe la possibilit de signal, le type L obtient un
salaire de L . Etant donn que dans les deux cas, le niveau d'ducation est nul, l'existence de
la possibilit de signal implique une rduction du bien-tre des travailleurs de type L .
Par contre, pour le travailleur de type H , l'effet de l'existence du signal dpend entre autres
du niveau de E ( ) , c'est--dire de la distribution ( p, 1 p ) des travailleurs de diffrentes
capacits ainsi que du cot de l'ducation. Comme le montre la figure 8.13, le bien-tre du
travailleur de type H peut soit crotre soit diminuer. Si la proportion p des travailleurs du
type H est faible, alors le salaire moyen E ( ) sera faible (figure 8.13.a). Dans ce cas, le
bien-tre de l'individu du type H augmente car la courbe d'indiffrence passant par le point
(0, E ( )) est situ au-dessous de la courbe d'indiffrence passant par le point (e, H ) . Si la
proportion p est leve, on aura la situation inverse, c'est--dire une diminution du bien-tre
du type H (figure 8.13.b).
L

E ( )
E ( )

0 = e * ( L )

e = e* ( H )

Figure 8.13.a : Cas o le bien-tre du type


H augmente avec l'existence du signal
133

0 = e* ( L )

e = e* ( H )

Figure 8.13.b : Cas o le bien-tre du type H


diminue avec l'existence du signal

Voir aussi Mas-Colell, Whinston & Green (1995), page 450.

144

Dans le cas de perte de bien-tre, pourquoi le type H choisit-il tout de mme de signaler sa
capacit productive. En fait, du moment qu'un mcanisme de signal existe, si le type H ne
choisit pas e = e * ( H ) , il sera considr comme tant un travailleur de type L et ne recevra
de ce fait qu'un salaire de L , ce qui correspond un niveau de bien-tre plus faible. La
crainte de se voir catgoriser comme tant du type L est la raison qui pousse le travailleur de
type H choisir le niveau d'ducation e .
L'existence d'un quilibre de signal permet la collectivit d'identifier la capacit productive
de chaque travailleur et donc d'affecter de faon optimale les travailleurs aux diffrents
emplois. Mais cet effet bnfique du signal peut tre annihil par le cot social du signal si ce
dernier est trs lev. L'effet social du signal n'est donc pas tout fait sans ambigut.

145

Chapitre 9 : La thorie de l'agence

La thorie de l'agence ou de la relation principal/agent ou encore de l'ala moral traite des


implications de lasymtrie de linformation existant entre le principal et lagent. Selon Jensen
et Meckling (1976), Une relation d'agence est un contrat par lequel une personne (le
principal) engage une autre personne (l'agent) pour raliser un service pour son compte
impliquant la dlgation d'une certaine autorit de dcision .134
Un des principaux thmes abords porte sur la forme optimale de rmunration de l'agent qui
tienne compte de cette asymtrie de l'information. Dans lexemple de la relation
actionnaire/manager, le propritaire ne peut observer parfaitement leffort que consent le
manager. Ou bien, le propritaire peut observer cet effort mais avec un cot exorbitant. Ce
type dasymtrie est appel action cache (hidden action). De mme, aprs la signature du
contrat, le manager peut devenir mieux inform que le propritaire sur les opportunits et les
risques de lentreprise. Ce type dasymtrie est appel information cache (hidden
information).
Etant donn le problme de non observabilit de leffort du manager, lactionnaire (le
propritaire individuel ou le conseil dadministration) aura prvoir des mcanismes incitatifs
pour amener indirectement lagent fournir leffort ncessaire la ralisation de lobjectif
assign.135 Lun des thmes majeurs de la thorie de lagence est prcisment d'tudier ce type
de mcanismes incitatifs. Une des conclusions de la thorie de lagence est que la prsence
post contractuelle dasymtrie en information entrane une diminution du bien-tre des parties
contractantes par rapport un tat o l'information est parfaite.
Au titre des applications du modle principal / agent, nous montrerons comment ce modle
permet damliorer la comprhension du rationnement du crdit et de la structure du capital
des entreprises.

9.1.

Leffort de lagent, une information asymtrique

La thorie de la relation principal/agent postule qu'il revient au principal de dterminer les


modalits de partage du revenu y , c'est--dire la fonction de rmunration de l'agent en
respectant certaines contraintes de participation et dincitation.136 Symbolisons par e E
leffort consenti par le manager pour dvelopper lentreprise. Pour les commodits de
lanalyse, on considrera que E R , cest dire que e est un scalaire.137

134

M. Jensen and W. Meckling (1976). Theory of the firm: managerial behaviour, agency costs, and ownership
structure. Journal of Financial Economics. 3, 1976, pages 305-360.
135
Relevons que les mcanismes de gouvernement d'entreprise sont des rponses, mme imparfaites, de
l'actionnariat au risque de l'ala moral.
136
Les notions de contraintes de participation et dincitation sont dveloppes plus loin.
137
Il est vident que la description du travail de management par un scalaire ne peut rendre compte de toute la
complexit de celui-ci. En ralit, pour tenir compte du caractre multidimensionnel des actions du repreneur, on
devrait poser E R n , n quelconque et certainement grand.

146

Le niveau deffort ou laction est choisi de faon individuellement optimale par lagent et
affecte aussi bien son utilit que celle du principal. Leffort est source de dsutilit pour
lagent. Mais pour le principal, un niveau lev deffort est prfrable car cela augmente la
probabilit des rsultats levs. Ce niveau deffort nest pas observable par le principal. En
fait, le principal ne peut observer quune consquence de leffort de lagent, laquelle dpend
non seulement de leffort e de lagent, mais galement dun lment stochastique , ce qui
donne y = g (e, ) .
Lobjectif du recrutement du manager est lobtention dun revenu maximal (profit, richesse) y
qui revient au principal duquel est dduite la rmunration t de lagent. Un point central de la
thorie principal/agent est qu'il n'existe pas une relation dterministique entre le revenu et
l'effort. La relation entre y et e est du type stochastique. Etant donn llment stochastique ,
le revenu y est une variable alatoire dont la distribution est conditionnelle de leffort e de
lagent. La densit de y conditionnelle e est f ( y, e ) > 0 pour tout ( y, e ) . Un niveau lev
deffort eH a un effet positif sur le revenu y Y du principal plus fort quun niveau faible
deffort eL . L'hypothse admise pour exprimer la nature de cet effet est la dominance
stochastique du premier ordre.138 Nous dirons ainsi que la distribution de y tant donn eH a
une dominance stochastique du premier ordre par rapport la distribution de y tant donn eL
. En dautres termes, nous avons :
F ( y / e H ) F ( y / e L ) ou

Fe ( y / e ) 0

pour tout y Y

(9.1)

avec une ingalit stricte pour certaines valeurs de y.139 La reprsentation graphique de la
dominance stochastique du premier ordre dans le cas discret deux niveaux d'effort est la
suivante :140
F (y / e)

1
F ( y / eL )

F (y / eH )

Figure 9.1

138

Pour plus de dtails sur la dominance stochastique, voir par exemple Viala, P & Briys E. (1995). Elments de
thorie financire. Nathan. Page 74.
d
139
Fe ( y / e ) =
F ( y / e ) , ceci lorsque leffort e est continu.
de
140
Une consquence de la dominance stochastique du premier ordre est que la valeur moyenne du revenu brut du
principal lorsque e = e H est strictement suprieure la valeur moyenne du revenu brut lorsque e = e L . En
dautres termes, on a

y f ( y / eH ) dy > y f ( y / eL ) dy .
Y

147

Le manager a pour objectif la maximisation de son esprance d'utilit. Sa fonction dutilit,


suppose sparable, est compose d'une part de l'utilit de la rmunration u (t ) , d'autre part
de la dsutilit de l'effort w(e) . L'utilit du manager est donc U (t , e ) = u (t ) w(e ) . Les
caractristiques des prfrences du manager sont :
- U t (t , e ) > 0 : Le manager prfre toujours une compensation plus leve pour un
effort donn.
- U tt (t , e ) 0 : Le manager a une aversion envers le risque (lgalit correspond au
cas de la neutralit envers le risque).
- U (t , e H ) < U (t , e L ) : Pour un revenu donn, le manager prfre moins deffort.
Ces caractristiques impliquent que : u (t ) > 0 , u (t ) 0 et w(e ) > 0
La fonction dutilit du principal est v( y t ( y )) et possde les caractristiques suivantes :
v > 0 et v 0 . Lobjectif du principal est de maximiser son esprance d'utilit dont
lexpression est :
E (v( y t ( y ))) = v( y t ( y )) f ( y, e ) dy
Y

Pour sassurer que le manager accepte le contrat, le principal doit dterminer la fonction de
rmunration t ( y ) de telle sorte respecter sa contrainte de participation dont lexpression
est :
E (U (t , e )) = E (u (t )) w(e ) = u (t ( y )) f ( y, e ) dy w(e ) U 0
Y

U 0 est l'utilit de rservation de l'agent, c'est--dire l'utilit quil pourrait obtenir en dehors du
contrat propos par le principal. C'est le minimum que doit lui procurer le contrat pour qu'il
l'accepte. En normalisant 0 lutilit de rservation de lagent et en supposant qu'elle ne
dpend pas du type de l'agent, la contrainte de participation de l'agent devient :

E (U (t , e )) = E (u (t )) w(e ) = u (t ( y )) f ( y, e ) dy w(e ) 0
Y

9.2.

Relation principal / agent en cas dobservabilit de leffort

A titre de benchmark et leffet de faire ressortir les effets de lasymtrie dinformation, il est
dusage de supposer dans un premier temps que le propritaire peut observer leffort du
manager.141 Dans ce cas, le propritaire dtermine le contrat en spcifiant dune part le niveau
deffort e consentir et dautre part la fonction de rmunration t ( y ) . Le programme de
maximisation du principal scrit donc :

141

La rmunration du manager demeure cependant fonction du revenu brut y. On continuera donc crire t (y)
en dpit de lobservabilit de leffort e.

148
Max v( y t ( y )) f ( y, e ) dy
e, t

s/c

(9.2)

u (t ( y )) f ( y, e) dy w(e) 0

(9.3)

A loptimum, la contrainte de participation (9.3) de lagent est sature et est donc lgalit.
Pour montrer cela, il suffit de considrer que le contraire est vrai. Supposons que lagent
obtienne une esprance d'utilit strictement suprieure son utilit de rservation. Cette
situation ne peut constituer la solution du programme du principal car ce dernier peut, tout en
continuant respecter lutilit de rservation de lagent, diminuer la rmunration de lagent,
ce qui a pour consquence daugmenter son utilit. En symbolisant par le multiplicateur de
Lagrange associ la contrainte de participation de lagent, le programme du principal peut
tre rcrit comme suit :

Max L = v( y t ( y )) f ( y , e ) dy + u (t ( y )) f ( y , e )dy w(e )


e, t
Y
Y

Les conditions du premier ordre sont :142


L
= v( y t ( y )) f ( y, e ) + [u(t ( y )) f ( y, e )] = 0 pour tout y.143
t
v( y t ( y )) + u (t ( y )) = 0 pour tout y

v( y t ( y ))
= pour tout y
u (t ( y ))

(9.4)

L
= v( y t ( y )) f e ( y, e )dy + u (t ( y )) f e ( y, e )dy w(e ) = 0
e Y
Y

[v( y t ( y )) + u(t ( y ))]f e ( y, e)dy = w(e)

(9.5)

f e ( y, e ) =

142

143

d
f ( y, e )
de

Pour la comprhension de la drivation de, par exemple,

v( y t ( y )) f ( y, e)dy , il suffit de considrer la


Y

version discrte de la question. On a dans ce cas E (v( y t ( y ))) = v( yi t ( yi )) p( yi , e ) et la drive par


i

rapport t est

v ( y i t ( y i )) p ( y i , e ) . Cette drive est gale zro si v ( y i t ( y i )) p( y i , e) = 0 pour tout


i

yi .

149

La condition du premier ordre (9.4) signifie lgalit des taux marginaux de substitution du
revenu entre les diffrents tats de la nature caractriss ici par la valeur de y .144 Pour
montrer cela, on peut crire la condition du premier ordre comme suit pour deux niveaux
diffrents de revenu y et y :

v( y t ( y )) u(t ( y ))
=
v( y t ( y)) u(t ( y))

(9.6)

Cette galit peut tre interprte en se rfrant la bote d'Edgeworth en considrant que les
revenus diffrents y et y reprsentent deux tats diffrents de la nature. Dans ce cas,
l'quation (9.6) exprime l'galit des taux marginaux de substitution du principal et de l'agent,
ce qui correspond, comme le montre la figure 9.2 un partage optimal du risque :
y t(y)

Principal

y t ( y )

t ( y )

t(y)

Agent

Figure 9.2 : Bote d'Edgeworth et partage optimal de risque

Cette condition indique donc quen situation de symtrie de l'information, il existe un partage
optimal du risque entre le principal et lagent. On obtient un cas particulier intressant
lorsqu'on considre que le principal est neutre vis--vis du risque.145 Dans ce cas, tant donn
que v( y t ( y )) = 1 , la premire condition du premier ordre scrit comme suit :146

1
= pour tout y
u(t ( y ))

(9.7)

Le manager tant averse pour le risque, u (t ( y )) est dcroissante par rapport t ( y ) . Par
consquence, la satisfaction de la condition (9.7) implique que la rmunration t ( y ) doit tre
fixe par rapport y. En recevant une rmunration fixe, le manager est compltement assure
contre le risque par le principal. Etant donne sa neutralit envers le risque, le principal joue
un rle d'assurance. Le contrat constitue ainsi un partage optimal du risque entre le principal
et l'agent.

144

Voir Laffont, J.J. 1991. P 191.


Par exemple en raison d'une richesse trs leve ou d'une bonne diversification des actifs.
146
On considre qu'en cas de neutralit envers le risque, l'utilit marginale de la monnaie est de 1.
145

150

La contrainte de participation du manager tant sature, on a donc pour chaque niveau d'effort
optimal u (t * ) w(e * ) = 0 . La rmunration fixe du manager est donc t * = u 1 (w(e * )) , ce qui
donne la proposition suivante :
Proposition : Dans le modle principal/agent avec observabilit de leffort du manager et
neutralit au risque du principal, le contrat optimal spcifie leffort optimal e * choisi par le
manager (maximisant le revenu espr du propritaire dduction faite de la rmunration du
manager) et procure au manager une rmunration fixe t * = u 1 (w(e * )) .147

Cette proposition signifie que lorsque leffort est observable et le principal neutre envers le
risque, le manager na pas besoin de recevoir dincitation leffort. Sa rmunration est dans
ce cas fixe et constitue de ce fait une assurance contre le risque (d au caractre alatoire de y)
procure par le propritaire, lequel, suppos neutre vis--vis du risque, joue le rle dassureur.

9.3.

Relation principal / agent en cas de non observabilit de leffort

Considrons maintenant que leffort de lagent nest pas observable par le principal. La
rmunration fixe ne demeure plus optimale car ex post l'agent est incit dvier et ne pas
fournir le niveau d'effort spcifi dans le contrat. Ce dernier doit donc intgrer cette
possibilit de dviation ex post et tenir compte de la meilleure rponse de l'agent. Cette
condition est satisfaite par l'introduction dans le programme du principal d'une nouvelle
contrainte, appele contrainte d'incitation. Lors du choix de son niveau optimal de l'effort,
l'agent doit galement intgrer la meilleure rponse du principal. Le contrat ainsi obtenu
constitue un quilibre de Nash du jeu liant le principal et l'agent.
Pour amener lagent respecter ses engagements, le principal se voit donc contraint de
prvoir une forme de rmunration incitant lagent fournir leffort dsir par le principal,
cest dire une rmunration lie au rsultat y de leffort. Sachant que le rsultat y est
alatoire, la rmunration t ( y ) devient son tour alatoire. Lincitation leffort du manager
implique donc pour celui-ci lobligation de supporter un niveau de risque plus lev. Il existe
ainsi un arbitrage entre le partage optimal du risque et lincitation du manager fournir
leffort optimal.

9.3.1. Modle de lala moral en cas avec deux niveaux deffort


9.3.1.1.

Partage optimal du risque et incitation leffort

Considrons dans un premier temps qu'il n'existe que deux niveaux d'effort possibles, un
niveau lev e H et un niveau faible e L . On a donc E = {e H , e L } . Leffort du manager ntant
plus observable, le programme doptimisation du principal doit intgrer une nouvelle
contrainte, appele contrainte dincitation pour exprimer le fait que lagent choisit le niveau
d'effort optimal tant donne la fonction de rmunration t ( y ) . Le cas o le choix du principal
147

Voir Mas Colleil, Whinston & Green, p 481.

151

porte sur le niveau deffort faible e L est relativement simple. En effet, comme leffort est
coteux pour lagent, il aura naturellement tendance choisir un niveau deffort faible. Il
suffit donc au principal de retenir une rmunration fixe gale t L* = u 1 (w(eL )) . Lagent
choisira alors le niveau deffort souhait par le principal.
Supposons maintenant que le principal veuille induire l'agent choisir le niveau lev d'effort
e H . La contrainte dincitation prend alors la forme suivante :

u(t ( y )) f ( y / e )dy w(e ) u(t ( y )) f ( y / e )dy w(e )


H

(9.8)

Cette contrainte signifie que le principal doit dfinir une fonction de rmunration t ( y ) de
telle sorte qu'en maximisant son esprance d'utilit, l'agent choisira par lui-mme le niveau
lev de l'effort. Le contrat optimal est donc le rsultat du programme suivant du principal :
Max v( y t ( y )) f ( y / eH )dy
t

s/c

u(t ( y )) f ( y / e )dy w(e ) 0


H

u(t ( y )) f ( y / e )dy w(e ) u(t ( y )) f ( y / e )dy w(e )


H

En appelant le multiplicateur de Lagrange associ la contrainte dincitation, le


Lagrangien du programme du principal devient :

Max L = v( y t ( y )) f ( y / eH )dy + u (t ( y )) f ( y / eH )dy w(eH )


t
Y
Y

+ u (t ( y )) f ( y / eH )dy w(eH ) u (t ( y )) f ( y / eL )dy w(eL )


Y
Y

Avec t ( y ) 0 , la condition du premier ordre est :


L
= v( y t ( y )) f ( y / eH ) + [u(t ( y )) f ( y / eH )]
pour tout y
t
+ [u(t ( y )) f ( y / eH ) u(t ( y )) f ( y / eL )] = 0

En considrant le cas o le principal est neutre vis--vis du risque, on a v( y t ( y )) = 1 et cette


condition s'crit :

152

f ( y / eH ) + [u (t ( y )) f ( y / eH )] + u (t ( y ))[ f ( y / eH ) f ( y / eL )] = 0 pour tout y.

En divisant par u (t ( y )) f ( y / eH ) , on obtient la caractristique suivante du contrat optimal :

f ( y / eH ) f ( y / eL )
1
= 0 pour tout y
+ +
u (t ( y ))
f ( y / eH )

Ce qui donne :

f ( y / eL )
1
pour tout y
= + 1
u (t ( y ))
f ( y / e H )

(9.9)

Cette condition du premier ordre implique la proposition suivante :


Proposition (Holmstrm (1979) et Shavell (1979)) : Sous les hypothses que u < 0 ,
v > 0 et F ( y / e H ) F ( y / e L ) (avec une ingalit stricte pour certaines valeurs de y), alors
> 0 .148
Cette proposition signifie quen cas dasymtrie dinformation, le contrat ne procure plus de
partage optimal du risque entre le principal et lagent. Cette inefficience dans le partage du
risque a pour effet la rduction du bien-tre d'au moins une partie et provient de la ncessit
de relier la rmunration du manager au rsultat y, car son effort nest plus observable par le
principal. Par exemple, lorsque le principal est neutre envers le risque, la rmunration fixe,
quand bien mme raliserait-elle un partage optimal du risque, nest plus optimale pour le
principal car elle ne procure pour lagent aucune incitation leffort.
L'introduction de la contrainte d'incitation dans le programme du principal montre qu'il existe
ainsi un arbitrage entre deux sous-objectifs, savoir le partage optimal du risque et l'incitation
l'effort. Ceci constitue un des principaux rsultats de la thorie de l'agence.

9.3.1.2.

Lincitation du manager (lagent)

Abordons maintenant la question de la forme gnrale de la fonction de rmunration t ( y ) .


Lintuition voudrait que pour inciter le manager fournir un effort lev, il suffirait que la
fonction t ( y ) soit croissante, cest--dire que le manager devrait recevoir une rmunration
dautant plus leve que le rsultat observ y est lev. La forme gnrale de t ( y ) peut tre
obtenue partir de l'quation (9.9) caractrisant le contrat optimal. Il suffit de diffrencier
(driver par rapport y) cette quation par rapport y, ce qui donne :
148

Pour la dmonstration, voir Holmstrm, B. 1979. P 90.

153

f ( y / eL )
u(t ( y ))t ( y )

=
2
(u(t ( y )))
y f (( y / eH ))

On obtient ainsi l'expression suivante de t ( y ) :


2
(
u(t ( y ))) f ( y / eL )

t ( y ) =
u(t ( y )) y f (( y / eH ))

(9.10)

Etant donne l'aversion pour le risque de l'agent, on a u < 0 . Par la proposition ci-dessus, on
a galement > 0 . Donc, selon lquation (9.10), pour que la rmunration optimale t ( y ) du
manager soit croissante par rapport au rsultat y, une condition supplmentaire est requise. Il
s'agit de lhypothse appele condition de rapport de vraisemblance monotone (MLRP
Monotone Likelihood Ratio Property) et dont l'expression est :
f ( y / eL )

<0
y f ( y / eH )

(9.11)

t(y)

Figure 9.3 : Forme gnrale de t ( y )

Graphiquement, sous cette condition, la relation entre la rmunration de lagent t ( y ) et le


revenu brut y peut tre reprsente par la figure 9.3.
A titre dillustration, nous donnons un exemple de distributions de probabilit discrtes
P ( y / e H ) et P ( y / e L ) satisfaisant la condition MLRP avec lensemble des rsultats possibles
Y = {1, 2, 3, 4} :149

149

Pour ce tableau, on a F ( y / e H ) = P(Y y / e = e H ) et F ( y / eL ) = P(Y y / e = eL ) .

154

Tableau 9.1

P(y / eH)

P(y / eL)

F(y / eH)

F(y / eL)

Dominance stochastique
du premier ordre
F(y / eH)- F(y / eL)

MLRP
P( y e L )
P( y e H )

0,1

0,4

0,1

0,4

- 0,3 0

0,2

0,3

0,3

0,7

- 0,4 0

1,5

0,4

0,3

0,7

- 0,3 0

0,75

0,3

Ce tableau montre que la condition du rapport de vraisemblance monotone MLRP- signifie


quau fur et mesure quaugmente le niveau du rsultat observ par le principal, la
vraisemblance de leffort lev e H devient de plus en plus leve par rapport la
vraisemblance de leffort faible e L . Ceci implique qu'il est possible d'inciter le manager
fournir un effort lev en prvoyant une rmunration croissante par rapport .
Dans ce cas, si par exemple le rsultat observ par le principal passe de 2 3, alors la
rmunration de l'agent augmentera car la vraisemblance que ce rsultat soit le produit d'un
effort lev e H est plus grande que celle d'un effort faible e L . Mais si par contre, le rsultat
observ est y = 1 , la vraisemblance d'un effort faible est trs forte par rapport celle d'un
effort lev. Ceci justifierait que la rmunration de l'agent soit faible mme s'il existe une
probabilit (faible) que ce faible rsultat soit associ un effort lev.

9.3.2. Modle de lala moral en cas deffort continu


9.3.2.1. Partage optimal du risque et incitation leffort : lapproche du
premier ordre
Nous considrons maintenant le cas plus gnral o l'effort est une variable continue, c'est-dire e E R . Comme pour le cas de deux niveaux d'effort, leffort du manager ntant plus
observable, le programme doptimisation du principal doit intgrer une contrainte, appele
contrainte dincitation qui permet de caractriser le niveau d'effort optimal choisi par lagent
tant donne la fonction de rmunration t ( y ) . Cette contrainte dincitation prend la forme
gnrale suivante :

e arg max u (t ( y )) f ( y, e)dy w(e)


eE

(9.12)

La contrainte d'incitation (9.12) signifie que parmi les efforts possibles e , le manager choisit
de faon rationnelle le niveau d'effort e qui maximise son esprance d'utilit. Cette contrainte
signifie donc qu'tant donne la fonction de rmunration t ( y ) , le manager choisit le niveau

155

d'effort e qui soit sa meilleure rponse. L'expression (9.12) peut avoir plusieurs solutions.
Lapproche du premier ordre de la thorie de lagence consiste remplacer la contrainte
dincitation (9.12) par sa condition du premier ordre et qui est :

u(t ( y )) f ( y, e)dy w(e) = 0


e

(9.13)

Cette approche suppose que la condition du premier ordre (9.13) dfinit une solution unique et
qui est un maximum.150
Comme dans le cas de deux niveaux d'effort, l'optimum la contrainte de participation de
l'agent est sature ( l'galit). En appelant le multiplicateur de Lagrange associ la
contrainte dincitation, le Lagrangien du programme du principal devient :

Max L = v( y t ( y )) f ( y, e )dy + u (t ( y )) f ( y, e )dy w(e ) + u (t ( y )) f e ( y, e )dy w(e )


e, t
Y
Y

La condition du premier ordre de ce nouveau programme est :


L
= v( y t ( y )) f ( y, e ) + [u(t ( y )) f ( y, e )] + [u(t ( y )) f e ( y, e )] = 0 pour tout y
t

v( y t ( y ))
f ( y, e )
+ + e
= 0 pour tout y
u(t ( y ))
f ( y, e )
v ' ( y t ( y ))
f ( y, e )
pour tout y
= + e
'
u (t ( y ))
f ( y, e )

La deuxime condition du premier ordre est :

L
= v( y t ( y )) f e ( y, e )dy + u (t ( y )) f e ( y, e )dy w(e )
e Y
Y

+ u (t ( y )) f ee ( y, e )dy w(e ) = 0

150

Nous verrons plus loin quelles sont les conditions de validit de lapproche du premier ordre.

(9.14)

156

Etant donn que u (t ( y )) f e ( y, e )dy w(e ) = 0 , cette condition du premier ordre devient :
Y

v( y t ( y )) f ( y, e)dy + u (t ( y )) f ( y, e)dy w(e) = 0


e

ee

(9.15)

La condition du premier ordre implique la proposition suivante :


Proposition (Holmstrm (1979), Shavell (1979)) : Sous les hypothses que u < 0 , v > 0 et
Fe 0 (avec une ingalit stricte pour certaines valeurs de y), alors > 0 .151
Comme dans le cas de deux niveaux d'effort, cette proposition signifie que le contrat ne
procure plus de partage optimal du risque entre le principal et lagent. L'effort de l'agent
n'tant plus observable par le principal, ce dernier doit prvoir une rmunration qui incite
l'agent l'effort, ce qui a pour consquence de rduire sa couverture contre le risque d au
caractre alatoire de y. L'existence de l'asymtrie de l'information oblige les deux parties au
contrat arbitrer entre le partage optimal du risque et l'incitation l'effort.

9.3.2.2.

Lincitation du manager (lagent)

Comme dans le cas de deux niveaux d'effort, la forme gnrale de la fonction de rmunration
t ( y ) peut tre obtenue. Pour montrer cela, il suffit de diffrencier (driver par rapport y)
lquation (9.14).
v( y t ( y ))(1 t ( y ))u(t ( y )) u(t ( y ))t ( y )v(t ( y ))
f e ( y, e )
=
2
y f ( y, e )
(u(t ( y )))

On obtient ainsi lexpression suivante de t ( y ) :

t ( y ) =

f e ( y, e )
y f ( y, e )
u (t ( y )) v ( y t ( y )) + u (t ( y )) v ( y t ( y ))

u (t ( y )) v ( y t ( y )) [u (t ( y ))]2

(9.16)

Pour les mmes raisons que dans le cas de deux niveaux d'effort, lquation (9.16) montre que
la rmunration optimale t ( y ) du manager n'est croissante par rapport au rsultat y que sous
151

Pour la dmonstration, voir Holmstrm, B. 1979. P 90.

157

lhypothse supplmentaire de la condition de rapport de vraisemblance monotone (MLRP


Monotone Likelihood Ratio Property) qui a pour expression :

f e ( y, e )

>0
y f ( y, e )

(9.17)

L'expression (9.17) est la version continue de la MLRP (quation 9.11).


Comme mentionn plus haut, lapproche du premier ordre consiste remplacer la contrainte
dincitation (9.12) par la condition du premier ordre (9.13). Pour tre suffisante, cette
transformation du programme doptimisation du principal ncessite lintroduction dune
nouvelle hypothse qui est la convexit de la fonction de rpartition F par rapport leffort e
qui est, selon Rogerson (1985) une forme de rendement dchelle stochastique
dcroissant .152 En labsence de cette nouvelle hypothse, Grossman et Hart (1983) ont
propos une approche cot/bnfice en deux tapes dans le cas o lensemble Y est discret et
le principal neutre envers le risque.153

9.4.

Application 1 : ala moral et rationnement du crdit

La thorie du rationnement du crdit est une application importante du modle principal /


agent. En d'autres termes, l'existence du rationnement du crdit peut tre explique par celle
du problme de l'ala moral entre le prteur (par exemple la banque) et l'emprunteur. On dit
qu'il existe une situation de rationnement du crdit lorsque le prteur n'est pas dispos
accorder un crdit mme si l'emprunteur concern par ce refus accepte de payer un taux
d'intrt suprieur au taux d'intrt en vigueur.154
Cette caractristique constitue une diffrence fondamentale du concept d'quilibre entre le
march du crdit et le march des biens. Pour ce dernier, le prix d'quilibre est obtenu lorsque
l'offre est gale la demande. Si la demande est suprieure (resp. infrieure) l'offre, le
rtablissement de l'quilibre s'obtient par l'augmentation (resp. la diminution) du prix.
Ce mcanisme de l'quilibre ne se retrouve pas compltement dans le march du crdit. En
effet, le prteur peut refuser de satisfaire une demande de crdit mme si l'emprunteur est
dispos accepter un taux d'intrt plus lev. L'quilibre du march n'est pas obtenu ici par
l'augmentation du taux d'intrt puisque une demande dispose accepter un prix plus leve
152

W. Rogerson (1985). The first-order approach to principal-agent problems. Econometrica, 53. Pages 13571368.
153
S. Grossman & O. Hart (1983). An analysis of the principal-agent problem. Econometrica, 51. Pages 7-45.
154
Il existe plusieurs situations de rationnement. Le cas le plus connu est celui de la situation de guerre. La raret
des biens est tellement forte que lEtat se voit oblig dintervenir dans la sphre commerciale pour rguler la
commercialisation des produits, en particulier ceux de premire ncessit (pain, huile, sucre, ). On trouve
galement le rationnement dans les conomies planifies, notamment pour les importations qui sont limites
quantitativement de faon centralise.

158

ne trouve pas l'offre correspondante. Cette situation est qualifie de rationnement du crdit et
est donc une caractristique fondamentale du march du crdit.
Parmi les explications possibles l'existence du rationnement de crdit l'quilibre du march
du crdit figure celle de l'ala moral.155 A la base de cette explication, il faut d'abord
remarquer que plus le taux d'intrt est lev, moins est grande la part des bnfices revenant
l'emprunteur. Ceci a pour effet de rduire son incitation fournir un effort plus lev, ce qui
a pour consquence d'augmenter la probabilit d'chec du projet financ. Ainsi,
l'augmentation du taux d'intrt peut avoir pour effet d'augmenter le risque pour le prteur et
ne constitue donc pas une rponse tout fait adquate pour la couverture contre le risque.
Dans ce cas, le projet n'est financ par le prteur que si le montant des capitaux propres atteint
un montant appropri. De ce fait, l'existence de l'ala moral devient une explication possible
de la structure du capital et de la notion de capacit d'endettement.
Pour montrer cela, considrons un entrepreneur qui envisage de raliser un projet dont le cot
d'investissement est I.156 Son apport personnel sous forme de capitaux propres (cash) est A
avec A < I . Pour la ralisation de ce projet, il doit donc recourir un financement externe
d'un montant gal I A . En cas de succs, le projet procure un revenu global gal R et en
cas d'chec, le revenu global est 0. La probabilit de succs dpend du comportement de
l'entrepreneur. Cette probabilit est leve p H si l'entrepreneur fournit un effort lev
(comportement loyal) pour la russite du projet. Par contre, si l'entrepreneur ne fournit pas un
effort lev pour le projet (comportement dloyal), la probabilit de russite devient faible p L
, mais l'entrepreneur obtiendra dans ce cas des bnfices privs B. On a videmment p H > p L
. En cas de succs, la part revenant l'entrepreneur (insider) est Ri et la part revenant au
financier (outsider) est Ro , avec R = Ri + Ro .
Pour simplifier l'expos, supposons que l'entrepreneur (qui bnficie de la responsabilit
limite) et le financier sont neutres envers le risque et que le taux d'intrt est gal 0.
Considrons galement qu'en raison de la concurrence entre les financiers, le profit espr du
financier est nul, ce qui donne p H Ro (I A) = 0 . La ralisation du projet s'effectue selon le
timing suivant :

Accord de
Financement
(Rgle de partage)

Investissement

Ala moral

Rsultat
et
partage

Figure 9.4

On supposera galement que le projet n'est viable que si l'entrepreneur se comporte


loyalement, ce qui donne une valeur actuelle nette du projet conditionnelle au comportement
155

Stiglitz, Joseph et Andrew Weiss. Credit Rationing in Markets with Imperfect Information. The American
Economic Review. Vol 71, n 3. June 1981.
Le phnomne de slection adverse est galement une explication possible du rationnement du crdit dans le
march du crdit.
156
Voir aussi J. Tirole (2001) Corporate Governance , Econometrica, 69. Pages 1-35.

159

loyal VAN H = pH R I > 0 . En cas de comportement dloyal de l'entrepreneur, la valeur


actuelle nette du projet est ngative, ce qui donne VAN L = pL R + B I < 0 .
Comme le projet n'a une valeur actuelle nette positive qu'en cas de comportement loyal, le
contrat de financement doit tre conu de telle sorte inciter l'entrepreneur se comporter de
faon loyale. Cette exigence est formalise travers la contrainte d'incitation suivante :
p H Ri p L Ri + B

B
avec p = p H p L . En d'autres termes, afin dinciter l'entrepreneur
p
se comporter de faon loyale, le revenu Ri qui doit lui revenir doit tre au moins gal
B
, soit
B p . Sachant que Ri = R Ro , cette contrainte d'incitation implique R Ro
p
B
Ro R
. En d'autres termes, partir de la contrainte d'incitation, il ressort que le montant
p
maximal pouvant tre gag (rserv) en faveur du financier sans compromettre l'incitation de
B
l'entrepreneur est R
. Le montant espr maximum pouvant tre gag est donc
p

B
.
p H R
p

Ceci qui donne Ri

B
et lquilibre financier des apporteurs de fonds
p

B
I A , c'est--dire :
PH Ro = I A impliquent que p H R
p

La contrainte dincitation Ro R

B
( pH R I )
A A = pH
p

La quantit A que nous assumons tre positive est donc le montant minimal exig de
l'entrepreneur pour que le financement externe d'un montant gal I A lui soit accord.
Nous avons ainsi une thorie explicative de l'existence d'une structure optimale du capital
base sur l'existence du phnomne de l'ala moral.157 Le minimum requis a donc la forme
suivante :

Rente Valeur Actuelle Nette tant


A=

d' agence donn un comportement loyal

157

Relevons que cette thorie de la structure du capital base lexplication de la structure du capital du ct de
loffre du financement.

160

Pour l'interprtation de la quantit A , rappelons que la contrainte d'incitation de


B
B
B
l'entrepreneur implique que Ri
, ce qui donne pH Ri pH
. Donc p H
est le
p
p
p
revenu espr minimum laisser l'entrepreneur pour satisfaire sa contrainte d'incitation.
B
Pour cela, la quantit p H
est appele "rente d'agence".
p
Cette exigence en fonds propres peut-tre interprte comme suit : la rente d'agence est le
revenu minimal que doit obtenir l'entrepreneur pour l'amener se comporter de faon loyale.
Pour cela, l'apport de l'entrepreneur doit tre au moins gal cette somme. De ce fait, cette
avance constitue une assurance crdible donne par l'entrepreneur pour garantir que son
comportement sera loyal. Cette exigence est rduite du montant de la VAN car cette dernire
sera donne par le projet.
Pour illustrer la dtermination de la contribution minimale de l'entrepreneur en cas d'ala
moral, considrons la simulation suivante d'un projet d'investissement dont le cot de
ralisation est I = 1000 . La probabilit de succs est de 0,8 en cas de comportement loyal de
l'entrepreneur et de 0,6 en cas de comportement dloyal de l'entrepreneur.
Au titre de la simulation1, le revenu (cash-flow) du projet est de 1300 et le bnfice priv est
de 200. Au titre de la simulation 2, le revenu (cash-flow) du projet est de 1450 et le bnfice
priv est de 50. Dans les deux simulations, le revenu global du projet est de 1 500, mais dans
la simulation 1, la proportion des bnfices privs est plus grande. Il sensuit que dans la
simulation 1, lincitation au comportement dloyal est plus grande. Par consquence, la
contribution en fonds propres exig de lentrepreneur dans la simulation 1 est plus importante.
Le tableau 9.2 fait bien ressortir ce rsultat intuitif.
Dans la simulation 1, le risque moral est lev puisqu'en se comportant de faon dloyale,
l'entrepreneur peut obtenir des bnfices privs de 200. Ces derniers constituent donc une
importante incitation ne pas fournir l'effort ncessaire pour augmenter la probabilit de
russite du projet. La meilleure rponse du financier externe (outsider) est d'exiger un
important taux d'autofinancement minimal de 76% ceci afin de contrecarrer cet ala moral et
crer ainsi une contre incitation.
Dans le cas de la simulation 2, l'ala moral est relativement faible ce qui justifie que le taux
d'autofinancement minimal exig par le financier n'est que de 4%.

161

Tableau 9.2
Simulation du modle de rationnement du crdit dans le cas d'ala moral
Le projet

Cot de l'investissement

1.000

Probabilit de succs si
comportement loyal

PH

0.8

Probabilit de succs si
comportement dloyal

pL

0.6

Revenus du projet

Simulation 1

Simulation 2

Revenu (apparent) du projet

1.300

1.450

Bnfices privs

200

50

Simulation 1

Simulation 2

Rsultats
cl *

(PH R I )

40

160

cd *

(PL R + B ) I

-20

-80

PH (B P )

800

200

PH (B P ) (PH R I )

760

40

A I

76%

4%

Valeur Actuelle Nette


Rente d'agence
Apport minimal en fonds
propres de l'entrepreneur
Taux d'autofinancement
minimal exig

* cl : Si comportement loyal. cd : Si comportement dloyal

Cette thorie permet d'expliquer pourquoi dans certains pays, les banques exigent des niveaux
importants de taux d'autofinancement et galement de garanties. Ces banques tant
confrontes un niveau lev d'ala moral, leur meilleure rponse est d'exiger de l'emprunteur
de s'engager de faon substantielle.158 Le niveau lev d'ala moral est favoris par plusieurs
phnomnes tels que :
Systme judiciaire ne protgeant pas suffisamment les cranciers (par exemple pour
la mise en jeu des garanties) ;
Information comptable manquant de fiabilit et de transparence ;
Structure familiale des entreprises prives qui peut tre un lment favorable la
collusion des actionnaires contre les outsiders ;
Ala moral au sein mme de la banque d'Etat.

9.5.

Application 2 : ala moral et structure de la proprit des entreprises

La thorie de la structure du capital est un des thmes majeurs de la finance dentreprise.


Lobjectif de cette thorie est de tenter dexpliquer les choix de la firme en matire de
financement. Plus particulirement, la thorie sest concentre sur lexplication des
proportions des fonds propres S et de la dette B dans le financement de la firme. Ces
158

Cette conclusion est soutenue galement par la thorie Law and Finance. Voir R. La Porta, Lopez-deSilanes, F, Shleifer, A et Vishny, R. Law and Finance . Journal of Political Economy, Vol 106, n 6.

162

S
B
et
reprsentent la structure du capital de la
S+B
S+B
firme. Les premires tentatives formalises reviennent Modigliani et Miller (M&M) qui ont
dvelopp un modle explicatif en se basant sur lquilibre du march financier, suppos
parfait.159 Avec VL reprsentant la valeur totale de la firme endette et Vu la valeur totale de
la firme sans dette et en prenant en considration lexistence de limpt sur le revenu de la
firme au taux , M&M ont montr que la valeur totale de la firme est donne par lquation
suivante :

proportions, cest--dire les rapport

VL = Vu + B

Comme consquence de cette quation, la structure optimale du capital de la firme est atteinte
lorsque la dette B reprsente 100% du financement de la firme. Il sagit videmment dune
conclusion extrme qui de plus, ne correspond pas la ralit des entreprises. Cette difficult
nenlve cependant en rien la rigueur de lanalyse de M&M.
La littrature sest par la suite attache relaxer les constituants de lhypothse de march
financier parfait afin de rajouter du ralisme la thorie et de produire des rsultats plus
conformes la ralit. Parmi ces facteurs, figure celui du problme dagence existant entre les
apporteurs de fonds (actionnaires et cranciers) et le manager.160
Dans ce cadre, Jensen et Meckling (1976) ont dvelopp une thorie de la structure de la
proprit de lentreprise en se basant sur lala moral. Dans une entreprise o existe une
sparation de la proprit du management, le manager (l'agent) n'agit pas toujours et
ncessairement dans l'intrt des actionnaires (principal). Il existe toujours la possibilit que
le manager ne poursuive pas tout fait lobjectif assign par les actionnaires et qui est la
maximisation de la valeur de la firme. Le manager peut en effet dvier de cet objectif et
favoriser la ralisation de son objectif propre. Cette dviation est possible pour deux raisons,
comme cela a t dcrit plus haut : le conflit dintrt et lasymtrie de linformation. Dans
lapproche de Jensen et Meckling, la structure du capital est considre comme une rponse
des actionnaires au problme caus par la possible dviation du manager de lobjectif.
Le point de dpart de lanalyse est que lexistence du problme dagence va provoquer
lapparition de cots, qualifis de cots dagence. Dans ce cadre, la structure du capital peut
tre un outil permettent de minimiser les cots dagence. Jensen et Meckling ont identifi trois
types de cots dagence :
Les cots de monitoring du principal (cot du contrle). Ce sont les cots des
procdures ou mcanismes destines limiter le comportement du manager
Les cots d'engagement (bonding costs) : Ce sont les cots que dpensent l'agent
pour montrer sa bonne foi et sa loyaut
159

F. Modigliani and M. Miller. The Cost of Capital, Corporation Finance and the Theory of Investment. The
American Economic Review. Volume XLVIII, June 1958. Pages 261-297 et F. Modigliani and M. Miller.
Corporate Income Taxes and the Cost of Capital: a Correction. The American Economic Review. 53, page 433443.
160
Plusieurs autres facteurs ont t proposs pour le dveloppement dune thorie de la structure du capital, tels
que lexistence de cots de la faillite (Scott, 1976) et le signal (Ross 1977).

163

Les pertes rsiduelles : Malgr l'existence du contrle et de l'engagement,


lasymtrie de linformation ne sera pas compltement limine. Il existera donc
toujours une divergence entre les dcisions de l'agent et les dcisions maximisant le
bien-tre du principal
Les cots d'agence sont la somme de ces trois types de cots d'agence. Jensen et Meckling ont
montr que ces cots dagence peuvent tre engendrs soit par les actions soit par la dette.

9.5.1. Les cots dagence des actions externes


Quel est l'impact des actions externes sur les cots d'agence? Pour dvelopper leur thorie de
la structure du capital et de la structure de la proprit, Jensen et Meckling montrent que les
cots d'agence sont supports par les actionnaires informs (insiders). Pour montrer cela, on
considre dans un premier temps une firme possde 100% par le manager. On supposera
par la suite que ce propritaire / manager cde une partie de ses actions des actionnaires
externes et lanalyse sattachera dterminer limpact de lexistence dactions externes sur les
cots dagence.
Pour formaliser lexistence de lala moral, Jensen et Meckling considre que lutilit du
manager / propritaire a une double origine : En premier lieu, et de faon trs classique, elle
augmente avec le profit quil peut obtenir de la firme. En second lieu, son utilit augmente
avec les consommations non pcuniaires quil peut tre amen effectuer. Le
manager/propritaire fait cependant face un arbitrage entre ces deux lments car en
augmentant la consommation des avantages non pcuniaires au-del dun certain niveau
optimal, la rentabilit de la firme diminue. La combinaison optimale entre le rendement
financier et les avantages non pcuniaires est obtenue lorsqu'il y'a galisation de l'utilit
marginale de chaque avantage non pcuniaire et l'utilit marginale d'une unit montaire de
pouvoir d'achat.
Les avantages non pcuniaires sont toutes dpenses que le manager / propritaire est appel
effectuer et pour lesquelles il obtient une utilit personnelle. Lexemple classique est le salaire
que le manager / propritaire se fixe en contrepartie de son travail.161 Ce sont galement la
somptuosit du bureau, les dplacements vers des htels luxueux, le recrutement au sein de la
firme, damis ou de membres de la famille. Cest galement lattribution de contrats
avantageux des amis ou des membres de sa famille. Ces dpenses portent sur des biens qui
sont la fois des facteurs de production pour lentreprise et des biens de consommation pour
le manager.
Pour modliser lexistence de ces avantages comme source dala moral, symbolisons par :
X = {x1 , x 2 , L , x N } le vecteur des quantits de facteurs et d'activits de la firme
partir desquels le manager / propritaire obtient une utilit (marginale) positive.
C ( X ) le cot d'obtention de X
161

Le versement dun salaire est videmment un avantage pcuniaire. Il est dans le cadre de cette analyse inclus
dans les avantages non pcuniaires car, comme ces derniers, il procure au manager / propritaire une utilit
personnelle qui peut lamener soctroyer un niveau de salaire suprieur au salaire qui aurait t accord un
manager non propritaire.

164
P ( X ) le revenu total pour la firme en fonction de X.

On a donc :
B ( X ) = P( X ) C ( X ) : Bnfice net pour la firme en fonction de X.

Soit X * le niveau optimal de X. Il est donc donn par la relation suivante :

B(X * ) P(X * ) C (X * )
=0
=

X *
X *
X *
Si le niveau de X choisi par la firme est suprieur au niveau optimal X * , alors
F = B (X * ) B ( X ) mesure le cot pour la firme de l'incrment X X * , incrment procurant
un surcrot d'utilit pour le manager.162 Donc F est la valeur de march des dpenses non
pcuniaires du manager choisies au-del du niveau optimal. De ce fait, larbitrage entre le
rendement financier et les avantages non pcuniaires revient en un arbitrage entre la valeur V
de la firme et le cot F de ces avantages non pcuniaires.

V
V1

V*
V2
V

A
B

U1

Pente =

U2
U3

Vo

P1
P2

Pente = -1

F F

Figure 9.5

La figure 9.5 fait ressortir larbitrage auquel fait face le manager / propritaire entre la valeur
de march V de la firme et la valeur F des avantages non pcuniaires. Elle montre que si le
manager / propritaire augmente sa consommation d'avantages non pcuniaires de 1 unit
montaire, la valeur de l'entreprise diminue de 1 unit montaire, d'o la pente de 1 pour
V F . La droite V F de pente gale 1 est analogue une contrainte budgtaire et reprsente
le lieu gomtrique des meilleure combinaisons possibles entre valeur de la firme et
consommation d'avantages non pcuniaires.
V est la valeur maximale de l'entreprise. Elle est obtenue lorsque le manager choisit le niveau
X * d'avantages non pcuniaires, soit lorsque F = 0 . La situation o le manager / propritaire
possde 100% de la firme est reprsente par le point D o la valeur de la firme est V * et la

162

Notons que la firme sloigne de loptimum ds lors quau moins un des lments de X diffre de son niveau
optimal.

165

valeur des avantages non pcuniaires consomms est F * . Le point D est le point de tangence
entre la courbe d'indiffrence U 2 et la droite V F .163
Si le manager / propritaire vend 100% des actions de la firme tout en restant manager et si le
nouveau propritaire pouvait, sans cot, imposer au manager le mme niveau de
consommation F * , alors le nouveau propritaire sera prt payer le montant V * pour
acqurir 100% de la firme.
Supposons que le manager / propritaire vende la fraction (1 ) de la firme et conserve la
fraction de la firme. Si l'acheteur anticipe que le manager / propritaire maintiendra le
mme niveau de F * de consommations d'avantages non pcuniaires, alors il sera dispos
payer le montant (1 )V * pour l'acquisition de la fraction (1 ) de la firme.
Mais lorsque le manager / propritaire ne possde plus que la proportion de la firme, s'il
augmente sa consommation d'avantages non pcuniaires de 1 unit montaire, il ne supporte
plus que la proportion de la baisse de la valeur de march de la firme. La pente
reprsentative de larbitrage (trade-off) du manager / propritaire devient gale , comme
par exemple pour la droite V1 F1 . Cette dernire passe par le point D car cette tape de
lanalyse, lacheteur anticipe que le manager / propritaire maintiendra le niveau F * et donc
est dispos payer la somme (1 )V * . Mais face ces croyances, la meilleure rponse du
manager / propritaire nest pas de maintenir le niveau F * car il nen supporte le cot que
dans la limite de .
Lorsque le manager / propritaire ne possde que la proportion de la firme, sa contrainte
budgtaire subjective est V1 P1 . De ce fait, il sera incit choisir le point A, qui est le point de
tangence entre V1 P1 et une courbe d'indiffrence U 1 plus leve. Le point A est l'expression de
la meilleure rponse du manager / propritaire au fait que le nouveau propritaire paie le
montant (1 )V * .
Au point A, la valeur de la consommation d'avantages non pcuniaires augmente de F * F O
. Par consquent, la valeur de march de la firme diminue de V * V O .
De ce fait, si le march anticipe correctement la raction du manager / propritaire, alors le
nouveau propritaire n'acceptera pas de payer le montant (1 )V * . En tenant compte de cette
anticipation rationnelle, pour l'acquisition de la part (1 ) de la firme, le nouveau
propritaire ne paiera que (1 ) la valeur anticipe de la firme tenant compte du changement
dans le comportement du manager / propritaire.
Pour montrer comment se dtermine le prix de march aprs la vente de la proportion (1 )
des actions et comment apparaissent les cots dagence, soit w la richesse du manager /
propritaire aprs avoir vendu la fraction (1 ) de la firme. On a ainsi :

163

Ici, lquilibre est intrieur, mais il peut correspondre aux extrmes V = 0 ou F = 0 avec des courbes
dindiffrence appropries.

166
w = S o + S i = S o + V (F , )
S o est le paiement effectu par les outsiders en contrepartie de la fraction (1 ) de la firme
et S i est la valeur de march des actions (partie ) restant en possession du manager /

propritaire. V (F , ) est la valeur de march de l'entreprise tant donn que le manager /


propritaire ne possde que la fraction de la firme et que la valeur des avantages non
pcuniaires consomms est F.
La droite V2 P2 de la figure 9.5 reprsente larbitrage (trade-off) du manager / propritaire
entre la valeur de march de la firme et la consommation d'avantages non pcuniaires. La
pente de cette droite est . Au point B, la droite V2 P2 est tangente la courbe
d'indiffrence U 3 . C'est le choix optimal du manager / propritaire. Ce point de tangence
reprsente la solution de la contrainte dincitation de lagent (le propritaire/manager).
Le prix de march de la fraction (1 ) de la firme qui soit satisfaisant au vendeur et
l'acheteur est tel que ce point de tangence B se situe sur la droite V F . Pour montrer cela,
supposons le contraire. Considrons en premier lieu que le point de tangence se situe gauche
du point B. Comme la pente de V2 P2 est ngative, cela signifie un plus faible niveau de
consommation d'avantages non pcuniaires et donc une plus grande valeur de march de
l'entreprise.
Comme le montre la figure 9.6.a, en acceptant S o , le manager / propritaire peroit un
montant plus faible que le prix de march, ce qui lui est dfavorable.

Prix de march = V
Prix accept par le vendeur = S o

Figure 9.6.a

La figure 9.6.b montre le cas o le point de tangence se situe droite du point B. Ce cas
correspond une plus grande consommation d'avantages non pcuniaires et donc une plus
faible valeur de march de l'entreprise. En acceptant S o , l'acheteur paie un prix plus lev que
la valeur de march, ce qui lui est dfavorable.

167

Prix accept par l'acheteur = S o


Prix de march = V
Figure 9.6.b

Le seul prix mutuellement satisfaisant doit tre tel que le point de tangence se situe sur la
droite V F . A ce point, on a S o = (1 )V . Ceci implique que la richesse du manager /
propritaire aprs la vente de la fraction (1 ) des actions est la valeur rduite V . En effet,
on a :
W = S o + V (F , ) = (1 )V + V = V

De ce fait, la baisse de la valeur de la firme de V * V aprs la vente de la fraction (1 ) est


supporte par le manager / propritaire. La rduction de la valeur de march de la firme
V * V est due l'existence d'une relation d'agence. C'est la mesure de la perte rsiduelle.
Dans cet exemple simplifi o on n'a pas encore introduit la possibilit du monitoring et de
l'engagement, cette perte rsiduelle reprsente le cot d'agence total. Pour le manager /
propritaire, la dcision de vente de la fraction (1 ) de la firme intervient aprs
comparaison entre les cots d'agence (diffrence entre U 3 et U 1 ) et l'utilit procure par la
liquidit S o .
L'appropriation personnelle des avantages non pcuniaires n'est pas la seule forme de cot
induit par la rduction de la part du manager / propritaire dans la firme. Le cot le plus
significatif est certainement la rduction de l'incitation l'effort car pour un effort donn, le
revenu du manager/propritaire diminue au fur et mesure que la proportion diminue. La
rduction de l'effort a pour effet de rduire la valeur de la firme tout comme la consommation
des avantages non pcuniaires. En considrant que lala moral porte sur le niveau deffort e,
F est dtermine par la relation F = B (e * ) B (e ) avec e * dsignant leffort optimal du
manager/propritaire.
En rsum, si le manager / propritaire vend une partie des actions de la firme, il ne
supportera plus qu'une fraction (gale sa part dans la firme) du cot des avantages non
pcuniaires. Les actionnaires externes peuvent limiter la consommation par le manager de ce
type d'avantages par un contrle qui ncessite un cot du contrle Si le march anticipe (et en
gnral il le fait) ce type de cot, ces derniers seront supports par le manager / propritaire.
Le prix que les actionnaires externes sont prts payer va donc tenir compte du cot du
monitoring et du cot de la divergence d'intrt. Le manager / propritaire acceptera de
supporter ces cots si l'utilit du pouvoir d'achat ainsi obtenu est suffisamment leve pour
compenser ces cots. Ce mcanisme s'accentue au fur et mesure que la part du manager /
propritaire diminuera dans la firme

168

9.5.2. Le rle du monitoring et de lengagement dans la rduction des cots


dagence
On considre maintenant la possibilit d'existence d'une activit de monitoring (audit, contrle
interne, restrictions budgtaires, rmunrations incitatives) dont l'objectif est la rduction de
la consommation d'avantages non pcuniaires. On suppose que le monitoring rduit la
consommation d'avantages non pcuniaires un taux dcroissant, soit F M < 0 et
2 F M 2 > 0 . La relation entre les dpenses de monitoring M et le cot F des avantages non
pcuniaires est reprsente par la figure 9.7 :
F

Figure 9.7

La figure 9.8 fait ressortir les effets de l'existence du monitoring. La courbe BCE est la
contrainte budgtaire lorsqu'on tient en considration les cots de monitoring M. Les points de
la courbe BCE sont le rsultat de l'quation V = V F (M , ) M . La diffrence verticale
entre V F et BCE est le cot de monitoring M.

V
V*
U1

E
C

F*

U2

U3

Pente =

Pente = -1

Figure 9.8

L'activit de monitoring rduit la consommation d'avantages non pcuniaires, ce qui a pour


effet d'augmenter la valeur de l'entreprise de V V .
En dpit de la rduction de la consommation d'avantages non pcuniaires de F F , le
manager / propritaire voit son bien-tre augmenter car la valeur de l'entreprise augmente de

169
V V . Il est donc incit accepter un contrat donnant aux investisseurs le droit de
contrler ses consommations d'avantages non pcuniaires.
On peut obtenir le mme rsultat en considrant cette fois que c'est le manager / propritaire
qui prend en charge le cot M. Dans ce cas, le cot M est le montant pay par le manager /
propritaire pour garantir aux actionnaires externes que la consommation d'avantages non
pcuniaires sera limite. Ce sont les cots des actions par lesquelles le manager / propritaire
montre sa bonne foi et sa loyaut.

9.5.3. Les cots dagence de la dette


Le financement par la dette provoque galement lapparition dun problme dagence car la
dette peut constituer pour le manager / propritaire une incitation choisir des activits qui
gnrent de grands profits en cas de succs mme si la probabilit de succs est faible. En
effet, si le projet donne de bons rsultats, c'est au bnfice du manager / propritaire. Par
contre, s'il donne de mauvais rsultats, c'est aux cranciers de supporter les cots, au moins
partiellement.
Le choix de projets risqus quivaut en fait, un transfert de valeur des cranciers vers les
actionnaires. Pour faire ressortir ce mcanisme de transfert, considrons lexemple suivant qui
illustre bien le conflit dintrt pouvant surgir entre les actionnaires et les cranciers.
Supposons que lentreprise (les actionnaires) dispose des deux projets dinvestissement
suivants dune dure de vie gale une anne :
Tableau 9.3
Probabilit des tats
de la nature

Cash-flow Oprationnel
Projet 1
Projet 2
7.000
2.000
11.000
16.000

Ces deux projets sont donc tel que E1 = E 2 et 1 < 2 . Si le besoin de financement est de
7.000, lentreprise prsentera au crancier potentiel (par exemple la banque) uniquement le
projet 1. Mais, tant donne la responsabilit limite, une fois le crdit obtenu, les
actionnaires pourraient tre incits ex post dvier et raliser le projet 2, car leurs revenus
nets, dduction faite de la dette sont :
Tableau 9.4
Probabilit des tats
de la nature

Cash-flow net
Projet 1
Projet 2
0
0
4.000
9.000

Pour les actionnaires, le projet 2 est prfrable car quel que soit ltat de la nature, il leur
procure un revenu net suprieur ou gal au revenu net du projet 1. La ralisation du projet 2
avec une dette destine au projet 1 est en fait un transfert (expropriation) de richesse des

170

cranciers vers les actionnaires. Lorsquils anticipent ce type de comportement des


actionnaires (risque de hold-up), les cranciers peuvent prvoir des clauses de protection et de
contrle. Le cot de ce contrle est un cot dagence et est en dernier ressort la charge des
actionnaires. La nature de ces cots est double : Des cots directs (cot de linformation, de la
procdure,) et des cots indirects (cot de lintervention des cranciers dans la gestion).

9.5.4. Une thorie de la structure de la proprit base sur les cots


dagence
La thorie propose par Jensen & Meckling n'est pas concerne uniquement par le ratio Fonds
Propres / Dette. Elle a une porte plus gnrale et porte plutt sur la structure de la proprit.
Les trois variables concernes sont :
S i : Actions internes (dtenu par le manager / propritaire)
S o : Actions externes (les actionnaires externes la firme)
B : Dette (les cranciers)
V * = Si + S o + B : Valeur totale de la firme
B + So
donn. La
V*
question porte alors sur le choix de la structure optimale entre les actions externes (actions
dtenus par des actionnaires non managers) et la dette. Etant donn que les cots dagence
sont supports par le manager / propritaire, le choix de la structure optimale du financement
So
externe est le choix du ratio E =
qui minimise les cots d'agence. La figure 9.9 permet
B + So
de montrer comment est dtermine la structure optimale des fonds propres externes par
rapport au financement externe.164 Dans cette figure, on a, mesurs en units montaires :165

Considrons dans un premier temps un taux de financement externe K =

ASo (E ) : Cots dagence des actions externes en fonction de E

AB (E ) : Cots dagence de la dette en fonction de E


AT (E ) = ASo (E ) + AB (E ) : Cots dagence totaux en fonction de E.

164

Rappelons que pour ce modle, on fait lhypothse de marchs efficients de la dette et des actions. Les prix
intgrent donc tous les cots, notamment les cots de monitoring et dengagement. Rappelons galement que les
cots dagence sont supports par le manager / propritaire.
165
Dans cette figure, le dplacement vers la droite signifie + S o et B .

171

( )

AT (E ) = ASo (E ) + AB (E )

AT E * , K1
AB (E , K1 )

AT E *

AS o (E , K1 )

AT E * , K 0

ASo (E )

AB (E , K 0 )

AB (E )

So
E =
B + Si
Figure 9.9.a
*

E * (K 0 )

AS o (E , K 0 )

E * (K1 )

Figure 9.9.b

So
augmente, l'incitation du manager /
B + So
propritaire augmenter les consommations non pcuniaires ou fournir moins deffort
(augmenter F) est plus grande, d'o laugmentation des cots d'agence AS o (E ) . Lorsque le

La figure 9.9.a montre que lorsque le ratio E =

montant de la dette diminue, l'incitation du manager exproprier les cranciers devient plus
faible, ce qui implique une diminution des cots d'agence associs la dette. Sans avoir
prsent de justifications la forme des courbes reprsentatives des cots dagence ASo (E ) et
AB (E ) , Jensen & Meckling soutiennent que la courbe reprsentant les cots dagence totaux
possde la forme gnrale indique dans la figure 9.9.a et 9.9.b, ce qui montre quil existe une
structure optimale de la proprit des entreprises. Cette structure est celle qui minimise les
cots dagence.
Pour faire ressortir leffet du volume du financement externe, Jensen et Meckling considrent
deux niveaux diffrents de financement externe K 0 et K 1 avec K 0 < K 1 . Un niveau
B + So
lev signifie que la firme recours plus de financement d'origine externe et, par
K=
V*
consquence, moins de financement interne. Lorsque la part des actions externes augmente,
la part du manager / propritaire dans la firme diminue, ce qui cre une incitation plus forte
augmenter ses consommations non pcuniaires. L'activit de monitoring augmente en
consquence. Ainsi, au fur et mesure que K augmente, les cots d'agence augmentent, ce qui
donne AS 0 (E , K1 ) > AS 0 (E , K 0 ) , comme il ressort de la figure 9.9.b.
De mme, comme le montant de la dette augmente, la part du manager / propritaire dans
la firme diminue, ce qui cre une incitation plus forte transfrer le risque vers les cranciers.
L'activit de monitoring des cranciers augmente en consquence. Ainsi, au fur et mesure
que K augmente, ces cots d'agence augmentent, ce qui donne AB (E , K1 ) > AB (E , K 0 ) , comme
il ressort galement de la figure 9.9.b.
D'aprs ce schma, on voit que les cots d'agence totaux augmentent avec le recours accru
aux financements d'origine externe (actions externes et dette).

172

Chapitre 10 : Les mcanismes denchres

La procdure des enchres est un mcanisme de vente de biens et de dtermination des prix
applicable lorsque le vendeur cherche dterminer la disposition payer des acheteurs
potentiels afin de maximiser son revenu espr et, par voie de consquence, de minimiser la
rente dinformation des acheteurs potentiels. Ce mcanisme vise donc organiser un march
ponctuel et spcifique et ce, par la rencontre du vendeur et des acheteurs potentiels. Les
enchres peuvent galement donner lieu la rencontre entre un acheteur et plusieurs
vendeurs. Cest le cas par exemple, de lattribution par ladministration dun contrat de
fourniture ou de gestion dun monopole naturel. On parle dans ce cas dappel doffres ou
dadjudication.
Dans les conomies modernes, les enchres sont utilises dans plusieurs domaines,
notamment pour lattribution de marchs publics, de concessions minires ou dexploitation
de champs ptroliers, lmission de bons du Trsor, la vente de devises, la vente dobjets
dart, La cotation en bourse des actions est un mcanisme de double enchres.

10.1. Les diffrentes formes denchres


Il existe plusieurs formes denchres, notamment : lenchre anglaise, lenchre hollandaise,
lenchre sous pli ferm au premier (plus haut) prix et lenchre sous pli ferm au second prix.
Dans lenchre au premier prix, le vainqueur paie le prix quil a propos et dans lenchre au
second prix, il paie le deuxime prix le plus lev (le plus haut prix rejet). Il existe deux
principales formes de transmission des offres : la forme orale et la forme crite. La forme
orale est associe lenchre anglaise (enchre ascendante) et lenchre hollandaise
(enchre descendante). La forme crite est associe lappel doffres et ladjudication, car
le prix (loffre) est transmis sous pli ferm (cachet). Lorsque la vente porte sur un bien
homogne divisible, plusieurs vainqueurs peuvent exister. Cest le cas par exemple de la vente
aux enchres des bons du Trsor. La rgle de paiement peut tre discriminante, en ce sens que
chaque soumissionnaire retenu paie le prix quil a propos.166
Dans lenchre anglaise, les offres sont faites de faon squentielle et convergent vers le prix
dquilibre. Le commissaire-priseur commence les enchres en annonant un prix faible,
ventuellement gal la valeur de rserve du vendeur. Les acheteurs surenchrissent jusqu
ce quil ne reste plus quun seul acheteur. Dans lenchre hollandaise, le commissaire-priseur
fixe un prix lev et commence le diminuer progressivement. Le bien est attribu
lacheteur qui manifeste le premier son intention dacqurir le bien.
Lappel doffre est une procdure de mise en concurrence souvent utilise par ladministration
pour lattribution de contrats de fourniture ou de travaux. Le choix du bnficiaire se fait
selon plusieurs critres tels que le prix offert, la qualit du bien ou service, les garanties et les
dlais et dpend donc, entre autres, de la pondration attribue par lacheteur chacun de ces
critres. La procdure de ladjudication est plus stricte, car le prix est le seul critre
166

Pour une description plus dtaille des enchres, voir par exemple Florence Naegelen. Les mcanismes
denchres. Economica, 1988.

173

dattribution du bien ou du contrat. Elle suppose que les caractristiques du bien ou du service
concern sont prcisment dfinies, ce qui reprsente une difficult importante en pratique.

10.2. Les enchres, jeu non coopratif information incomplte


Du point de vue thorique, ltude de la vente aux enchres sest intensifie partir des
annes 60 aprs en particulier la publication de larticle pionnier de Vickrey (1961).167
Ltude thorique des enchres ncessite de faire appel la thorie de lutilit en cas
dincertitude (Von Neumann-Morgenstein) et la notion dquilibre baysien de la thorie
des jeux (Harsanyi). Lanalyse des enchres a donn lieu une multitude de dveloppements
thoriques leffet de tenir compte de leur grande diversit.168
On peut subdiviser la thorie des enchres en deux principales parties : les enchres valeurs
prives indpendantes et les enchres valeur commune. Dans la premire catgorie,
lhypothse adopte est que chaque acheteur potentiel attribue lobjet une valeur subjective
qui lui est propre. Cette valeur, qui est donc sa disposition payer, est prive et indpendante
de celle des autres acheteurs potentiels. Dans les enchres valeur commune, le bien mis en
vente a une valeur unique commune mais inconnue des acheteurs. Chacun deux dispose
dune information (signal) sur cette valeur, indpendamment des autres acheteurs. Milgrom et
Weber (1982) ont montr que ces deux modles peuvent tre considrs comme des cas
particuliers dun modle plus gnral, celui des valeurs affilies.169
Ltude thorique des enchres a volu selon deux principales tapes. La premire tape a
port sur ltude des caractristiques et proprits des mcanismes denchres courants
(enchre anglaise, enchre hollandaise, enchre sous pli ferm au plus haut prix, enchre sous
pli ferm au second prix). La deuxime tape (dbut des annes 80) sest attache la
dtermination denchres optimales du point de vue du vendeur. Le rsultat gnral de cette
seconde tape est que sous certaines conditions, les mcanismes denchres courants sont
optimaux en ce sens quils procurent au vendeur une esprance de revenu maximum.
Lasymtrie de linformation relative la valeur du bien attribue par chacun des joueurs est
une caractristique centrale des enchres. Le vendeur ne connat pas la valeur attribue au
bien par chacun des acheteurs. De mme, un acheteur donne ne connat pas la valeur
attribue au bien par les autres acheteurs. Dans le cadre des mcanismes denchres, les
acheteurs et le vendeur voluent donc dans un environnement information incomplte.
Chaque enchrisseur ignore les caractristiques des autres enchrisseurs, savoir : la fonction
de prfrence ou dutilit (got, attitude vis--vis du risque) et en particulier lvaluation
subjective du bien mis en vente.
Les mcanismes denchres crent une situation de conflits dintrts dune part entre les
acheteurs et dautre part entre les acheteurs et le vendeur. Lacquisition du bien par un
167

W. Vichrey. Counterspeculation, Auctions and Competitive Sealed Tenders. The Journal of Finance. Vol. 16,
March 1961. P 8-37.
168
Il faut remarquer que le ttonnement Walrasien utilisait dj le mcanisme denchres pour la dtermination
du prix dquilibre dans un march concurrentiel. Dans ce modle, le commissaire priseur est lagent fictif
charg, sans cot, de recueillir les offres et les demandes et de dterminer les prix et les quantits dquilibre.
169
Paul Milgrom et Robert Weber. A theory of auctions and competitive bidding. Econometrica, Vol. 50,
September 1982. P 1088-1122.

174

acheteur donn exclue celle des autres enchrisseurs. Chaque acheteur adopte une stratgie
denchres avec comme objectif de maximiser son esprance dutilit et le rsultat final est le
produit de l'interaction des stratgies des acheteurs. En raison de linteraction de stratgies
conflictuelles des participants et de lincompltude de linformation, les mcanismes
denchres sont typiquement un thme de la thorie des jeux non coopratifs en information
incomplte.
Le problme de lincompltude de linformation rside en ce quil peut donner lieu une suite
infinie danticipations de la part des acheteurs. En effet, lenchre dun acheteur donn
dpend non seulement de sa valeur subjective du bien, mais galement de lanticipation quil
a sur la valeur subjective des autres acheteurs. Il doit, de plus, faire des anticipations sur les
anticipations des autres acheteurs, et ainsi de suite. La solution ces anticipations linfini a
t propose par Harsanyi (1967) travers lintroduction dun agent fictif, la Nature, qui joue
en premier, et ce en affectant chaque enchrisseur une valuation subjective de lobjet mis
en vente. Le concept dquilibre utiliser dans ce cas est lquilibre de Nash baysien.

10.3. Lesprance de
indpendantes

revenu

dans

le

modle

valeurs

prives

Un des rsultats importants de la thorie des enchres valeurs prives indpendantes est que
lesprance de revenu E (R ) du vendeur est identique pour une large tendue denchres,
notamment pour les quatre formes denchres courantes, savoir lenchre anglaise, lenchre
hollandaise, lenchre sous pli cachet au plus haut prix et lenchre sous pli cachet au
second prix. Ce revenu espr dpend du nombre n dacheteurs potentiels, de la distribution
de probabilit des valeurs subjectives vi attribues par les acheteurs potentiels au bien mis en
vente et de la valeur subjective v* au-dessous de laquelle les acheteurs potentiels ne trouvent
pas intressant denchrir. Ce rsultat a t mis en avant en premier par Vickrey (1961) et a
t par la suite confirm par Myerson (1981) et par Riley et Samuelson (1981).170
La littrature traitant du modle de valeurs prives indpendantes dans le cas de la vente dun
bien unique se base sur les hypothses fondamentales suivantes :
i) Le vendeur a une valeur de rservation gale v 0 . Cest le prix au-dessous duquel
il nacceptera pas de vendre le bien.
ii) Le choix des rgles denchre revient gnralement au vendeur qui a ainsi pour
objectif dexploiter sa position monopolistique.
iii) Il existe n enchrisseurs potentiels et la disposition payer de chaque enchrisseur
est v i [v, v ] et nest connue que de lui-mme. Cest son information prive.

170

Myerson R. B. (1981). Optimal Auction Design . Mathematics of Operations Research. Vol. 6, N 1,


1981. P 58-73.
John Riley & William Samuelson. Optimal Auctions. The American Economic Review. Vol. 71, n 3. June 1981.
P 381-392.

175

iv) Chaque acheteur i considre la disposition payer des autres acheteurs comme un
tirage alatoire indpendant partir dune distribution de probabilit. Cette
dernire, la mme pour tous les enchrisseurs, est une information commune tous
les joueurs (le vendeur et les n acheteurs potentiels). Ceci est lhypothse IID.171
La figure 10.1 reprsente la fonction de rpartition F (v ) de la valeur de rservation de
lacheteur potentiel. La fonction de rpartition F (v ) est donc telle que F (v ) = 0 , F (v ) = 1 .
Elle est diffrentiable sur tout lintervalle [v, v ] , avec F (v ) = f (v ) > 0 .
F (v )
F (v ) = 1

F (v ) = 0
v

Figure 10.1

Dans ce chapitre, nous nous basons sur la contribution importante de Riley et Samuelson
(1981) pour driver lexpression de lesprance de paiement du vendeur dans le cadre des
enchres appartenant la famille E denchres caractrises par les proprits suivantes :172
- Tout acheteur potentiel peut faire une offre suprieure au prix de rserve b0 annonc
par le vendeur.173
- Le bien est attribu lacheteur ayant propos la plus grande enchre.
- Les rgles de lenchre sont anonymes et donc aucun acheteur ne bnficie dun
traitement prfrentiel.
- Il existe une stratgie dquilibre commune b() , fonction strictement croissante des
valuations vi , cest--dire b(vi ) > 0 .
Riley et Samuelson (1981) ont obtenu les principaux rsultats :
- Lorsque le vendeur et lensemble des n acheteurs potentiels sont neutres au risque, le
revenu espr du vendeur est le mme pour toutes les formes denchres appartenant
la famille E dfinie plus haut. En particulier, comme les quatre formes denchres
dcrites plus haut, savoir lenchre anglaise, lenchre hollandaise, lenchre au
premier prix sous pli cachet et lenchre au second prix sous pli cachet font partie
de la famille E, elles procurent au vendeur la mme esprance de revenu.
- Les acheteurs potentiels proposent une enchre infrieure leur disposition payer,
cest--dire b(vi ) < vi .
171

IID : Independent and Identical Distributions


Riley J et Samuelson W. 1981. P 382. Myerson (1981) est parvenu au mme rsultat en adoptant une
dmarche diffrente.
173
b0 est le prix de rserve annonc par le vendeur, tandis que v 0 est son prix de rserve subjectif, non
observable par les enchrisseurs.
172

176

- Le prix de rserve annonc b0 par le vendeur est suprieur sa valeur subjective,


soit b0 > v 0 .
- Lorsque les enchrisseurs ont de laversion pour le risque, le revenu espr du
vendeur est plus lev avec lenchre sous pli ferm au premier prix par rapport
lenchre sous pli ferm au second prix.
Le revenu du vendeur est le paiement effectu par lacheteur qui remporte lenchre. En
consquence, pour dterminer le revenu espr du vendeur, il faut dterminer le paiement
espr de lacheteur ayant remport lenchre. Cette dmarche implique donc lanalyse de la
stratgie denchre des acheteurs. En participant aux enchres, un acheteur potentiel obtient
une utilit espre (gain espr) gale :

Gain espr Valeur de Probabilit Esprance

=
de l' acheteur rservation de gagner de paiement
Lobjectif de lanalyse est de faire ressortir les conditions sous lesquelles le profil de
stratgies (b(v1 ), b(v 2 ), , b(v n )) constitue un quilibre de Nash baysien. Il faudra par la suite
dduire les implications de ce rsultat.
Sans perte de gnralit, considrons le cas de lacheteur potentiel 1. Il faut donc montrer que
si les (n 1) autres enchrisseurs adoptent la stratgie denchre b(vi ) , alors la meilleure
rponse du joueur 1 est davoir la stratgie b(v1 ) . Pour montrer cela, considrons la dviation
du joueur 1 vers la stratgie b( x ) , sachant que son valuation pour lobjet est v1 . Il faudra
alors faire ressortir sous quelles conditions le joueur 1 nest pas incit dvier vers b(x ) ce
qui donnera x = v1 comme meilleure rponse du joueur 1 aux choix b(v2 ), , b(vn ) des autres
enchrisseurs. En cas de dviation, lesprance de gain de lacheteur potentiel 1 sera donc :

( x, v1 ) = v1 (F ( x ))n 1 P ( x )

(10.1

Avec :

(x, v1 ) : Le gain espr de lenchrisseur 1 ayant la disposition payer v1 et basant sa


stratgie sur une disposition payer gale x.
v1 : Lvaluation subjective de lobjet attribue par lacheteur potentiel i. Cest sa disposition
payer et est comprise entre v et v , ce qui donne v1 [v, v ] .

: La probabilit que lenchrisseur 1 soumette une enchre b(x ) qui soit loffre la
plus leve et remporte ainsi lenchre.

(F (x ))n 1

P (x ) : Lesprance de paiement de lenchrisseur 1 sachant que sa stratgie denchre est


b( x ) .

177

La probabilit que lacheteur 1 gagne lenchre est la probabilit quil soumette lenchre la
plus leve par rapport chacun des (n 1) autres acheteurs. Cette probabilit est donc :
Pr ob (bi < b1 ) pour tout i 1

Dans le modle valeurs prives, les dispositions payer des diffrents acheteurs potentiels
sont indpendantes. De ce fait, cette probabilit est gale au produit suivant :
Pr ob (b2 < b1 ) Pr ob (bn < b1 )

= Pr ob (bi < b1 ) = Pr ob (b(vi ) < b( x )) = Pr ob (vi < x )


i 1

i 1

i 1

= [F ( x )]

n 1

Soit p le paiement effectuer par lenchrisseur 1. Le paiement p est fonction non seulement
de lenchre b1 de lacheteur 1, mais galement de toutes les autres enchres, ce qui donne :
p = p (b1 , b2 , , bn ) = p (b( x ), b(v 2 ), , b(vn ))

Cette expression est celle du paiement p de lenchrisseur 1 lorsquil base son enchre sur une
valeur subjective x tandis que les autres enchrisseurs 2, , n basent leur enchre sur leur
valeur subjective v2 , ..., vn . Par exemple, dans lenchre au premier prix, le prix payer est
gal lenchre du gagnant, tandis que dans lenchre au second prix, le prix payer est la
deuxime meilleure enchre. Lesprance de paiement P (x ) de lacheteur 1 est donc :

P( x ) =

v2 ,..., vn

( p(b(x ), b(v2 ), , b(vn )))

Lobjectif de lacheteur 1 est de choisir x de telle sorte maximiser son gain espr. Le
programme de lenchrisseur 1 est donc :

Max ( x, v1 ) = v1 (F ( x ))
x

n 1

P(x )

Pour que le profil de stratgies (b(v1 ), b(v 2 ), , b(v n )) soit un quilibre de Nash baysien, il
faut que la stratgie b(v1 ) de lacheteur potentiel 1 soit sa meilleure rponse lorsque les autres
(n 1) enchrisseurs choisissent les stratgies b(v2 ), , b(vn ) . La condition du premier ordre
du programme de maximisation de lacheteur potentiel 1 doit donc tre tel que :

( x, v1 )
d (F ( x ))
= v1
x
dx

n 1

P( x ) = 0 pour x = v1

178
Comme on a F (x ) > 0 , cette condition du premier ordre est bien celle dun maximum.174 En
remplaant x par v1 , on obtient la condition doptimalit suivante :

d (F (v1 ))
d v1

n 1

v1

P(v1 ) = 0

(10.2)

La condition doptimalit (10.2) est vraie pour toute valeur de rserve excdant v* , cette
dernire tant la valeur de rservation pour laquelle un acheteur est indiffrent entre enchrir
b(v* ) et ne pas participer lenchre.175 En dautres termes, un acheteur potentiel ayant une
disposition payer infrieure v* ne sera pas incit participer lenchre. La condition
doptimalit est donc vraie pour tout v1 v* , avec v* satisfaisant lquation (10.3) :

(v* , v* ) = v* (F (v* ))n 1 P (v* ) = 0

(10.3)

La condition doptimalit est donc telle que :

d (F (v1 ))
P(v1 ) = v1
d v1

n1

pour v1 v*

En intgrant cette dernire expression sur lintervalle [v* , v1 ] , on obtient :176


v1

v1

P(x )dx = x
v*

v*

v1

v1

v*

v*

d (F ( x ))
dx

n 1

dx

P(x )dx = x d (F (x ))

n 1

En utilisant la condition aux limites (quation 10.3), le premier terme de cette galit scrit
comme suit :
v1

P(x )dx = P(x )

v1
v*

= P (v1 ) P (v* ) = P (v1 ) v* (F (v* ))

n 1

v*

La rsolution du second terme, aprs intgration par parties, donne :177


v1

x d (F (x ))

n 1

= v1 (F (v1 ))

n 1

v* (F (v* ))

n 1

v*

v1

(F ( x )) dx
n 1

v*

174

En annexe ce chapitre, on montre que cette condition du premier ordre est bien celle dun maximum.
Remarquons que v* peut tre gale v

n 1
176
dx = F (x )n 1 et donc d F (x )n 1 dx dx = F (x )n 1 dx = d F (x )n 1 .
On a d F (x )
177
Voir annexe.
175

((

) )

179

On a donc P (v1 ) v* (F (v* ))

n 1

= v1 (F (v1 ))

n 1

v* (F (v* ))

n 1

v1

(F ( x )) dx , soit :
n 1

v*

P(v1 ) = v1 (F (v1 ))

n 1

v1

(F ( x )) dx pour v1 v*
n 1

v*

Ltape suivante est de considrer le point de vue du vendeur. Pour ce dernier, P(v1 ) est une
variable alatoire car il ne peut observer la valeur v1 . Le vendeur connat la distribution F (v1 )
. Lesprance de revenu du vendeur en provenance de lacheteur 1 est donc :
v

P1 = P (v1 )F (v1 )dv1


v*

En substituant P (v1 ) , on obtient :

v1

n 1
n 1

P1 = v1 (F (v1 )) (F ( x )) dx F (v1 )dv1

v*
v*

Aprs une seconde intgration par parties, on obtient :178


v

P1 =

(v F (v ) + F (v ) 1)(F (v ))

n 1

dv1

v*

P1 est le revenu espr du vendeur en provenance de lacheteur potentiel 1. Etant donn le


traitement identique des n acheteurs potentiels, le revenu espr du vendeur est simplement
gal n fois P1 , ce qui donne lexpression suivante de lesprance de revenu du vendeur :
v

E (R ) = n (vf (v ) + F (v ) 1)(F (v ))

n 1

dv

(10.4)

v*

Lquation (10.4) est lexpression du thorme dquivalence-revenu qui signifie que pour les
mcanismes denchre appartenant la famille E dfini plus haut, le revenu espr du vendeur
est identique et est donn par cette quation. Donc, dans le cadre des hypothses du modle
valeurs prives indpendantes, les quatre mcanismes denchre dcrits plus haut, soit
lenchre anglaise, lenchre hollandaise, lenchre sous pli ferm au premier prix et lenchre
sous pli ferm au second prix, procurent au vendeur la mme esprance de revenu. De plus,
cette esprance de revenu est fonction du nombre denchrisseurs n, de la distribution des
valeurs prives F(v) et de la valeur v* .
Cette proposition est dune importance capitale car elle permet de comparer deux diffrentes
enchres simplement en comparant la valeur de rserve minimale v* au-dessous de laquelle il
nest pas intressant dentrer dans chacune des enchres. Ainsi, toutes les formes denchres
aboutissant au mme v* donnent au vendeur le mme revenu espr. Considrons lenchre
au premier prix et lenchre au second prix. Ces dernires rpondent toutes les proprits de
178

Voir annexe.

180

la famille E. Si le vendeur fixe un prix de rservation gale b0 , alors pour ces deux enchres,
on a v* = b0 . Dans ce cas, ces deux enchres procurent au vendeur le mme revenu espr. On
montre par ailleurs lquivalence dune part, entre lenchre anglaise et lenchre sous pli
ferm au second prix (enchre de Vickrey) et dautre part, entre lenchre hollandaise et
lenchre sous pli ferm au premier (plus haut) prix. De ce fait, dans le cadre du modle
valeurs prives indpendantes, lquation (10.4) est vraie pour les quatre formes denchres
qui font donc partie de la famille E.

10.4. La sous enchre des acheteurs potentiels


Pour montrer qu lquilibre, les acheteurs potentiels soumettent des enchres infrieures
leur valeur subjective, prenons le cas de lenchre sous pli cachet au plus haut prix o le
vendeur annonce un prix de rservation gal b0 . Dans ce cas, ne sont incits participer
lenchre que les acheteurs potentiels tels que vi > b0 et on a donc v* = b0 . Tout acheteur
potentiel ayant un prix de rserve v > b0 est donc incit entrer dans lenchre. Dans
lenchre sous pli ferm au plus haut prix, lesprance de paiement dun acheteur potentiel
quelconque est :
P(v ) = Pr ob {b(v ) est l' offre la plus leve} b(v )

Ce qui donne P (v ) = (F (v ))

n 1

b(v ) et on a donc :

b(v ) =

P (v )
(F (v ))n 1
v

Nous avons vu plus haut que P (v ) = v (F (v ))n 1 (F ( x ))n 1 dx pour v v* . En substituant


v*

cette expression dans celle de b(v ) et en tenant compte dun prix de rserve gal b0 annonc
par le vendeur, on obtient :
v

v (F (v ))

(F ( x )) dx

n 1

b(v ) =

P(v )
=
(F (v ))n 1

b0

(F (v ))n 1
v

b(v ) = v

(F (x ))

b0

n 1

n 1

avec v b0

dx

(F (v ))n 1

avec v b0

En dautres termes, en prsence de lhypothse IID et de la neutralit au risque des acheteurs


potentiels avec un prix de rserve b0 annonc par le vendeur, dans un quilibre de Nash
baysien, la stratgie optimale des acheteurs potentiels consiste donc faire une enchre

181
infrieure leur disposition payer, soit b(v ) < v . Ceci est d au fait que le vendeur maximise
une esprance de revenu et est galement la consquence de larbitrage des enchrisseurs
entre la probabilit de gagner lenchre et le paiement net en cas de succs. Notons galement
que cette dernire expression montre que la stratgie denchre b(v ) est strictement croissante
par rapport la valeur subjective v , cest--dire quon a b(v ) > 0 , ce qui confirme la
satisfaction de la quatrime proprit des enchres de la famille E.

10.5. La surestimation du prix de rserve du vendeur


Riley et Samuelson (1981) considrent par la suite la question de la dtermination du prix de
rserve lorsque le vendeur maximise son rendement total espr lequel est compos de deux
parties :
-

La premire partie est constitue du revenu espr du vendeur lorsque le bien est
vendu.

La seconde partie est constitue du revenu du vendeur lorsque le bien nest pas
vendu. Cette situation reprsente le cas o aucun des enchrisseurs ne soumet une
n
offre suprieure v* . Elle survient avec une probabilit gale F (v* ) qui est la
probabilit que pour tous les acheteurs potentiels, la valeur subjective vi est
infrieure v* . Dans ce cas, et avec une probabilit gale F (v* ) , le vendeur
gagne v0 , cest--dire sa propre valuation subjective de lobjet.
n

De ce fait, le rendement total espr du vendeur est donn par :


v

v0 F (v* ) + n (vF (v ) + F (v ) 1)(F (v )) dv


n 1

v*

En diffrenciant ce rendement total espr par rapport v* , on trouve la valeur v* qui


maximise ce rendement total espr. La condition du premier ordre satisfaire est donc :179
n(v0 F (v* ) v* F (v* ) F (v* ) + 1)(F (v* ))

n 1

=0

Ceci permet dobtenir la proposition 3 de Riley et Samuelson selon laquelle les enchres de la
famille E qui permettent de maximiser le rendement total espr sont celles pour lesquelles :
v* = v0 +

179

Comme

f (x ) dx = F (b ) F (a ) , on a

1 F (v* )
F (v* )

d b
f ( x ) dx = F (a ) = f (a ) .
da a

182

Ainsi, dans les enchres sous pli ferm au premier prix et au second prix avec prix de rserve
b0 annonc par le vendeur, on a b0 = v* . Dans ces enchres, le prix de rserve annonc par le
vendeur est donc survalu par rapport sa valeur subjective v0 , soit b0 > v0 .

10.6. Le cas de laversion pour le risque


Tout en maintenant lhypothse de IID, considrons maintenant que les acheteurs potentiels
ont de laversion pour le risque. Riley et Samuelson ont montr que cela implique les
modifications suivantes des rsultats prcdents :180

Dans lenchre au second prix, les enchrisseurs continuent denchrir leur valeur de
rservation. On a donc toujours bi* = vi .
Dans la procdure de lenchre au plus haut prix, les acheteurs potentiels font des
enchres suprieures leur enchre en cas de neutralit au risque.
En consquence, en cas daversion pour le risque des acheteurs potentiels, le vendeur
obtient un revenu espr plus lev dans lenchre au plus haut prix par rapport
lenchre au second prix.

En cas daversion pour le risque, les acheteurs potentiels font une enchre plus leve que
lenchre en cas de neutralit vis--vis du risque, augmentant ainsi leur probabilit de succs.
La raison de ce comportement est que dans le cas contraire, la probabilit de perdre lenchre
et donc le gain (v i bi ) est plus leve et, en raison de la concavit de la fonction dutilit, a
une pondration plus forte que celle du gain pouvant rsulter dune enchre moins leve.

10.7. Lesprance de revenu du vendeur avec des valuations subjectives


uniformes
Pour une meilleure intuition de lexpression du revenu espr du vendeur, supposons la suite
de Vickrey (1961) que les valeurs subjectives des acheteurs sont des tirages alatoires dune
distribution uniforme entre 0 et 1. Nous savons que si la variable alatoire X suit une
distribution uniforme entre 0 et 1, alors :

1 si 0 < x < 1
f (x ) =
sinon
0

et

0 si

F ( x ) = x si
1 si

x0
0 < x <1
x 1

Le revenu espr du vendeur (quation 10.4) devient donc :


1

E (R ) = n (2v 1)v
b0

180

n 1

dv =

(n 1) b0 n (2nb0 n 1)
n +1

Voir la dmonstration donne en annexe de larticle de Riley et Samuelson (1981).

183

Supposons maintenant que le vendeur accepte des enchres sans prix de rserve, soit b0 = 0.
Son revenu espr devient alors :
1

E (R ) = n (2v 1)v n 1 dv =
0

n 1
n +1

(10.5)

Lquation (10.5) est lexpression du revenu espr du vendeur E(R), pour des enchres sans
prix de rserve lorsque les valeurs subjectives des enchrisseurs suivent une distribution
uniforme entre 0 et 1. Lesprance de revenu E (R ) est donc une fonction croissante et
concave par rapport n, ce qui donne la reprsentation graphique de la figure 10.2, avec
n 2 . Ainsi, lorsque le nombre denchrisseurs est suffisamment lev, le revenu espr du
vendeur tend vers le maximum des valeurs subjectives des acheteurs potentiels.

E (R )
1

1/3

2
Figure 10.2 : Relation entre lesprance de revenu du
vendeur et le nombre dacheteurs potentiels

184

Annexe au chapitre 10
A. La condition du premier ordre est suffisante
( x, v1 )
d (F ( x ))
= v1
Nous montrons que la condition du premier ordre
x
dx
x = v1 est bien celle dun maximum et non celle dun minimum. On a :

n 1

P(x ) = 0 pour

n 1
( x, v1 ) d (F ( x ))
n2

=
= (n 1)(F ( x )) F ( x ) > 0 car F (x ) > 0
v1 x
dx

En dautres termes,

(x, v1 )
est croissante par rapport v1 . On peut de ce fait distinguer
x

deux cas :
(x, v1 )
est croissante par rapport v1 , alors on a
x
( x, x )
( x, x ) ( x, v1 )
. Comme de plus,
= x F ( x ) P ( x ) = 0 , alors on a
<
x
x
x
(x, v1 )
> 0.
x
( x, v1 ) ( x, x )
Deuxime cas : x > v1 . De faon similaire, ceci nous donne
<
=0.
x
x

Premier cas : x < v1 . Comme

On a ainsi x < v1

( x, v1 )
( x, v1 )
> 0 et x > v1
< 0.
x
x

En consquence, (x, v1 ) atteint bien un maximum lorsque x = v1 .181

B. La premire intgration par parties


La rsolution du second terme ncessite de procder une intgration par parties, ce qui
donne :
v1

x d (F (x ))

v*

181

n 1

= x(F ( x ))

n1 v1
v*

v1

(F (x ))

n 1

dx = v1 (F (v1 ))

n 1

v* (F (v* ))

v*

Cette dmonstration se base sur la dfinition de la pseudo concavit des fonctions.

n 1

v1

(F ( x )) dx
v*

n 1

185

Dans la formule dintgration par parties


du = d (F (x ))

n 1

wdu = wu udw ,

on a pos w = x et

C. La seconde intgration par parties


On a :
v1
v

n 1
n 1
P1 = v1 (F (v1 )) (F ( x )) dx F (v1 )dv1

v*
v*

P1 = v1 (F (v1 ))

n 1

v*

v v1

F (v1 )dv1 (F ( x )) F (v1 )dx dv1


n 1

v* v*

Pour simplifier cette expression, on procde lintgration par parties du second terme en
posant w(v1 ) =

v1

(F (x ))

n 1

dx et du = F (v1 ) dv1 , ce qui donne :

v*

v v1

v* v*

v*

n 1
(F (x )) F (v1 )dx dv1 = w(v1 )du = w(v1 )F (v1 )

F (v1 )dw(v1 )

v*

v*

= w(v )F (v ) w(v* )F (v* ) F (v1 )(F (v1 ))

n 1

dv1

v*

Sachant que F (v ) = 1 et w(v* ) =

v*

(F (x ))

n 1

dx = 0 , nous avons :

v*
v v1

(F (x ))

v* v*

n 1

n
F (v1 )dxdv1 = w(v ) (F (v1 )) dv1 =
v*

v v1

v* v*

v*

(F (x ))

v*

n 1

dx (F (v1 )) dv1
n

v*

n 1
n 1
(F (x )) F (v1 )dxdv1 = (F (v1 ) 1)(F (v1 )) dv1 .

186

Rfrences
Akerlof, G. (1970). The Market for "Lemons": Quality Uncertainty and the Market
Mechanism. Quarterly Journal of Economics, Vol. 84, Issue 3. P 488-500.
Bhattacharya, S. (1979). Imperfect Information, Dividend Policy, and "The Bird in the
Hand" Fallacy. The Bell Journal of Economics, Vol. 10, No. 1. P 259-270.
Debreu, G. (1959). Theory of Value. New York, Wiley.
Demange, G. et Ponssard, J. P. (1994). Thorie des jeux et analyse conomique. PUF.
Cho, I-K and Kreps, D. (1987). Signaling game and stable equilibria. Quarterly Journal of
Economics, Vol. 102. P 179-221.
Friedman, J. (1971). A non-cooperative Equilibrium for Supergames. Review of Economic
Studies, Vol. 38. P 1-12.
Fudenberg, D. and Tirole, J. (1996). Game Theory. The MIT press, Cambridge,
Massachusetts.
Gibbons, R. (1992). A Primer in Game Theory. Harvester Wheatsheaf.
Gliz, A. (2004). Risque de sous-valuation et privatisation partielle des entreprises. Les
cahiers du CREAD, n 68/69, 2004. P 5-35.
Grossman, S. et Hart, O. (1983). An analysis of the principal-agent problem. Econometrica,
Vol.51. P 7-45.
Harsanyi, J. (1973). Games with randomly disturbed payoffs: A new rationale for mixedstrategy equilibrium points. International Journal of Game Theory, Vol. 2, P 1-23.
Harsanyi, J. (1995). Games with Incomplete Information. The American Economic Review,
Vol. 85, n 3. P 291-303.
Holmstrm, B. (1979). Moral hazard and observability. Bell Journal of Economics, 14, 1979.
P 74-91.
Jensen, M. and Meckling, W. (1976). Theory of the firm: managerial behaviour, agency
costs, and ownership structure. Journal of Financial Economics, 3. P 305-360.
Kreps, D and Wilson, R. (1982). Sequential Equilibria. Econometrica, Vol. 50, No. 4. P 863894.
Laffont, J-J. (1991). Cours de thorie microconomique. Tome 2 : Economie de l'incertain et
de l'information. Economica.

187

La Porta, R., Lopez-de-Silanes, F., Shleifer, A. and Vishny, R. (1998). Law and Finance.
Journal of Political Economy, Vol. 106, n 6. P 1113-1155.
Levhari, D. and Mirman, L. J. (1980). The great fish war : An example using a dynamic
Cournot-Nash solution. Bell Journal of Economics, P.322-334.
Malinvaud, E. (1982). Leons de micro-conomie. Dunod.
Mas-Colell, A., Whinston, M. D. and Green, J. R. (1995). Microeconomic theory. Oxford
University Press. New-York.
Milgrom, P. and Weber, R. (1982). A theory of auctions and competitive bidding.
Econometrica, Vol. 50. P 1088-1122.
Mirrless, J. A. (1971). An exploration in the theory of optimal income taxation. Review of
Economic Studies, Vol. 38. P 175-208.
Modigliani, F. and Miller, M. (1958). The Cost of Capital, Corporation Finance and the
Theory of Investment. The American Economic Review, Vol. 48. P 261-297.
Modigliani, F. and Miller, M. (1963). Corporate Income Taxes and the Cost of Capital: a
Correction. The American Economic Review, 53. P 433-443.
Myerson, R. B. (1981). Optimal Auction Design. Mathematics of Operations Research, Vol.
6. P 58-73.
Naegelen, F. 1988). Les mcanismes denchres. Economica, 1988.
Nash, J. F. (1950). Equilibrium points in n-person games. Proceedings of the National
Academy of sciences, 36: 48-49.
Osborne, M. J. (2002). An introduction to game theory. Oxford University Press. (version
web).
Riley, J. (2001). Silver Signals: Twenty-Five Years of Screening and Signaling. Journal of
Economic Literature, Vol. 39. P 423-478.
Riley, J. and Samuelson, W. (1981). Optimal Auctions. The American Economic Review,
Vol. 71, n 3. P 381-392.
Rogerson, W. (1985). The first-order approach to principal-agent problems. Econometrica,
53. P 1357-1368.
Ross, S. (1977). The Determination of Financial Structure: The Incentive-Signalling
Approach. The Bell Journal of Economics, Vol. 8, No. 1. P 23-40.
Rothschild, M. and Stiglitz, J. (1976). Equilibrium in Competitive Insurance Markets: an
Essay on the Economics of Imperfect Information. Quarterly Journal of Economics, Vol. 90.
P 629-649.

188

Salani, B. (1994). Thorie des contrats. Economica, 1994. Paris.


Schelling, T. (1960). The Strategy of Conflict. Cambridge, Mass.: Harvard University Press.
Selten, R. (1975). Reexamination of the Perfectness Concept for Equilibrium Points in
Extensive Games. International Journal of Game Theory, Vol. 4. P 25-55.
Spence, M. (1973). Job Market Signalling. Quarterly Journal of Economics, Vol. 87. P 296332.
Stiglitz, J. and Weiss, A. (1981). Credit Rationing in Markets with Imperfect Information.
The American Economic Review, Vol. 71, n 3. P 393410
Thakor, A. (1991). Game Theory in Finance. Financial Management, Spring 1991. P 71-94.
Tirole, J. (1988). The Theory of Industrial Organisation. The MIT press, 1988.
Tirole, J. (2001). Corporate Governance, Econometrica, 69. P 1-35.
Viala, P. and Briys, E. (1995). Elments de thorie financire. Nathan.
Vichrey. W. (1961). Counterspeculation, Auctions and Competitive Sealed Tenders. The
Journal of Finance, Vol. 16. P 8-37.

189

Exercices
1-) Soit le jeu simultan information complte suivant (jeu sous forme normale) :

A1
A2
A3
A4

B1
0,7
5,2
7,0
0,0

B2
2,5
3,3
2,5
0 , -2

B3
7,0
5,2
5,7
0,0

B4
1,5
3,2
4,4
10 , -1

1. Donnez la dfinition formelle de l'quilibre de Nash d'un jeu simultan en information


complte.
2. Dterminez l'quilibre de Nash de ce jeu.
3. Quelle interprtation donnez-vous au concept de l'quilibre de Nash ?
4. Aprs avoir donn la dfinition de l'quilibre de Pareto, dites si cet quilibre est Pareto
optimal ? Le cas chant, qu'est ce qui empche les deux joueurs d'atteindre un
quilibre Pareto optimal ?
2-) Dterminer l'quilibre de Nash du jeu simultan information complte suivant (jeu sous
forme normale) :

A1
A2
A3
A4

B1
5,6
4,6
0,0
7 ,5

B2
2,2
3,2
5,5
6,8

B3
6,1
0,2
9,0
3,6

B4
4,0
4,6
1,3
2,9

3-) Supposons qu'il existe 3 firmes dans le modle d'oligopole de Cournot. Soit qi la quantit
produite par la firme i et Q = q1 + q2 + q3 dnote la quantit totale du march. Le prix
d'quilibre P est donn par l'quation P = P(Q ) = a Q avec Q < a . Le cot total de la firme
i est donn par l'quation Ci = Ci (qi ) = cqi avec c < a .

1. Si les trois firmes disposent de toutes ces informations et choisissent la quantit


produire qi de faon simultane, quel est l'quilibre de Nash d'un tel jeu ?
2. Comparer le prix d'quilibre et le profit de la firme i dans les deux cas o le nombre de
firmes est de deux ou de trois ?
4-) Jeu de ngociation. Deux personnes sont en ngociation pour le partage d'un dinar. De
faon simultane, chacun des deux joueurs annonce la part qu'il veut obtenir. Soient s1 et s 2
l'annonce respectivement de la personne 1 et de la personne 2 avec 0 s1 1 et 0 s 2 1 . Si
s1 + s 2 1 , alors chaque joueur obtient la part qu'il a annonce et si s1 + s 2 > 1 , chaque joueur
obtient 0.

190

Ces informations tant connaissance commune pour les deux joueurs, dterminer les
quilibres de Nash de ce jeu. Parmi ces quilibres, quel est le plus plausible? Pourquoi?
5-) Modle de Stackelberg. On considre un march o existent deux firmes et on souhaite
prdire son quilibre. La firme 1 est le leader et choisit la quantit produire q1 0 en
premier. La firme 2 est le follower et choisit la quantit produire q 2 0 aprs avoir observ
la quantit produite q1 0 de la firme 1. Le cot de production unitaire du bien est constant et
gal 10 pour la firme 1 et 14 pour la firme 2. Le prix d'quilibre du march est dtermin
selon l'expression suivante : P(Q ) = 100 Q avec Q = q1 + q 2 .

Dterminer la quantit produire de chaque firme et le prix d'quilibre du march. Quelle est
la mthode de rsolution utilise pour obtenir l'quilibre de Nash parfait?
6-) Modle de Stackelberg. Considrer le modle de Stackelberg et trouver l'quilibre du jeu
si c1 > c2 , c'est--dire si le follower (joueur 2) peut produire un cot unitaire plus faible.
Considrer que les cots sont tels que c1 = ac 2 avec a > 1 . Quelle est la valeur de a telle que
les deux firmes produisent la mme quantit. Quelle est votre interprtation de ce rsultat en
terme de leadership dans un march ?
7-) Financement d'un bien public. Considrons une situation o existent deux
consommateurs i = 1, 2 . Chacun d'eux choisit librement et simultanment de contribuer pour
un montant x i au financement d'un bien public. L'utilit qu'obtient l'individu i en utilisant le
bien public est donne par u i (x1 + x 2 ) xi . La contribution totale X = x1 + x 2 est
reprsentative de la taille du bien public. La fonction d'utilit u () est telle que u (0 ) = 0 ,
u (0 ) > 1 , u > 0 , u < 0 et lim u (x ) < 1.
x

a) Reprsenter graphiquement la fonction d'utilit u () .


b) Montrer que l'quilibre de Nash de ce jeu est tel que u (X * ) = 1 .
c) Sachant que la fonction d'utilit sociale est donne par 2 u ( X ) X , montrer que l'optimum
1
social est caractris par u (X ** ) = .
2
**
*
d) En dduire que X > X .
e) Quel enseignement il en sort en termes de financement des biens publics.
8-) Forme normale et forme extensive. Soit le jeu simultan information complte suivant
(version1) :

191

Joueur 1
G1

D1

Joueur 2

u1

u2

G2

D2

G2

a

b

c

d

D2

g

h

Version 1
a) Reprsenter ce jeu par une matrice des paiements dun jeu sous forme normale.
b) Quelles sont les conditions sur les paiements pour que le profil de stratgies (D1 , G2 ) soit
un quilibre de Nash pour ce jeu ?

Considrons maintenant la version 2 de ce jeu :


Joueur 1
G1

D1

Joueur 2

u1

u2

Joueur 2

G2

D2

G2

a

b

c

d

D2

g

h

Version 2
c) Quelle est la nature de la modification apporte la version 2 du jeu par rapport la
version 1 ?
d) A-t-on les mmes conditions que dans b) pour que les actions (D1 , G2 ) soient sur le sentier
dquilibre ?
9-) Considrons le jeu de prdation suivant qui fait intervenir 2 firmes, la firme E (Entrant)
souhaitant entrer dans un march et la firme I (Incumbent) ayant actuellement le monopole ou
la domination du march. Il s'agit d'un jeu dynamique qui se droule en deux tapes.
- Premire tape : la firme E doit dcider soit d'entrer ou de ne pas entrer dans le
march.
- Deuxime tape : Si la firme E dcide d'entrer, alors les deux firmes E et I doivent
choisir simultanment et en situation d'information complte soit de tolrer soit d'tre
hostile en engageant une guerre des prix.

192

Cette situation de jeu est reprsente par la forme extensive suivante :


Firme E
Out

In
Firme E

0
2

Hostile

Tolre
Firme I

H
-3
-1

T H
1
-2

-2
-1

T
3
1

a) Donner la forme normale du jeu sachant que la firme E dispose des quatre stratgies
suivantes : 1) (Out, Tolre si In) ; 2) (Out, Hostile si In) ; 3) (In, Tolre si In) ; 4) (In,
Hostile si In).
b) Quel est l'Equilibre de Nash Parfait de ce jeu ?
c) Quelle exigence supplmentaire doit satisfaire l'Equilibre de Nash dans un jeu
dynamique ?
10-) Duopole de Cournot et incertitude de la demande. Considrons le cas de deux firmes
en concurrence. La fonction de demande inverse est P(Q ) = a Q o Q = q1 + q 2 est la
quantit totale offerte par les deux firmes. Chacune des deux firmes choisit une quantit
produire qi avec i = 1, 2 et avec comme objectif la maximisation de son profit. Le cot
marginal des deux firmes est identique et gal c . La firme 1 a une asymtrie d'information
par rapport au niveau de la demande. Pour cette firme, la demande peut tre leve avec
probabilit ou faible avec probabilit 1 . La demande leve signifie a = a H et la
demande faible a = a L . La firme 2 par contre sait avec certitude si la demande est leve ou
faible. Toutes ces donnes sont information commune et les deux firmes choisissent les
quantits de faon simultane.

Trouver l'quilibre de Nash Bayesien de ce jeu en faisant ressortir les conditions sur a H , a L ,
et c pour que les quantits d'quilibre soient positives.
11-) G. Akerlof. A travers son article "The Market for "Lemons": Quality Uncertainty and the
Market Mechanism" de 1970, montrer quels sont les principaux apports de G. Akerlof
l'conomie de l'information ?
12-) Considrer le phnomne de slection adverse mis en vidence par G. Akerlof (1970).
Montrer comment ce phnomne peut exister dans la relation d'assurance entre une

193

compagnie d'assurance et un individu. Quels en sont les consquences et les mcanismes


pouvant tre des solutions possibles ?
13-) Considrons un march de voitures d'occasion dans lequel les acheteurs et les vendeurs
ont les prix subjectifs suivants :
v vb : Prix subjectif d'un vendeur pour une bonne voiture d'occasion : 2.000
v vm

: Prix subjectif d'un vendeur pour une mauvaise voiture d'occasion : 1.000

v ab
v am

: Prix subjectif d'un acheteur pour une bonne voiture d'occasion : 2.400
: Prix subjectif d'un acheteur pour une mauvaise voiture d'occasion : 1.200

Les acheteurs ne peuvent observer la qualit (bonne ou mauvaise) des voitures d'occasion,
mais estiment que 50% des vhicules sont de bonne qualit et 50% de mauvaise qualit.
1. quel est le prix maximum que les acheteurs sont prts payer pour une voiture
d'occasion ?
2. Quelle (s) est (sont) la (les) qualit (s) change (s) et la fourchette des prix ?
14-) Slection adverse en assurance. En vous rfrant l'analyse du march de l'assurance
en cas d'asymtrie de l'information de Rothschild, M. & Stiglitz, J. (1976), montrer comment
les prix linaires d'assurance impliquent l'apparition du phnomne de slection adverse dans
lequel les individus faible risque s'assurent de faon sous optimale.
15-) En vous rfrant l'analyse du march de l'assurance en cas d'asymtrie de l'information
de Rothschild, M. & Stiglitz, J. (1976), discuter de l'volution du concept d'quilibre du
march, en particulier en expliquant les concepts d'quilibres sparateurs et d'quilibres non
sparateurs.
16-) Equilibre de slection adverse. Considrons une situation dchange entre une
entreprise et un consommateur. La qualit du produit changer peut tre leve H- ou
faible L. Le consommateur ne peut observer la qualit du produit avant son achat mais
dispose de la croyance que la qualit du produit est du type H avec probabilit . Le cot de
production du produit du type H est C H et celui du type L est C L avec C H > C L . Le
consommateur dsire acheter au plus une unit du produit. Le prix de march p est un prix
rgul avec v H > p > v L > C H > C L .

Montrer qu lquilibre (de Nash), seule la qualit L est change. Quelle est la condition sur
pour lexistence dun tel quilibre ?
17-) Asymtrie d'information et quilibre du march des assurances. La figure suivante
montre le cas d'une compagnie d'assurance faisant face une asymtrie d'information relative
la probabilit d'accident des individus. Cette probabilit peut tre leve ( p H ) ou faible ( p L
). Supposons que cette compagnie propose un contrat d'assurance prix non linaire

194
reprsent par le point C sur la droite OD de pente (1 p ) / p o p est la probabilit
d'accident moyenne.
1. Montrer partir de ce schma pourquoi un tel contrat n'est pas robuste la
concurrence.
2. Ce contrat est-il un contrat mlangeant ou sparant ? Quelle est la signification de
ces types d'quilibre ?

Revenu en cas
d'accident.
(1 p H ) / p H

(1 p ) / p
D

(1 p L ) / p L

C
H

wd

Revenu en l'absence
d'accident.

18-) Ala moral et financement. Soit le cas d'une entreprise souhaitant raliser un
investissement d'un cot initial de 3000. Le revenu gnr par ce projet est de 4500 en cas de
succs et de 0 en cas d'chec. La probabilit de succs est de 0,7 si le manager se comporte
honntement et de 0,5 s'il ne se comporte pas honntement. Dans cette seconde alternative, le
manager obtient des bnfices privs de 700. Cette entreprise ne dispose pas de toutes les
ressources financires ncessaires pour raliser cet investissement. Elle doit donc recourir
un financement externe.

Quel est l'apport minimum qu'exigera le financier externe pour accepter de


participer au financement de cet investissement ?
Comment qualifiez-vous cette situation ?
Quelle est, dans cet exemple, la raison qui incite ce financier exiger une
participation financire minimale de l'entreprise ?
Comment situez-vous cette raison par rapport aux thses de Modigliani & Miller
(1958) ?

19-) La garantie comme signal de qualit. Considrons un march de voitures d'occasion


dans lequel les acheteurs et les vendeurs ont les prix subjectifs suivants :
v vb

: Prix subjectif d'un vendeur pour une bonne voiture d'occasion : 2.000

v vm
v ab
v am

: Prix subjectif d'un vendeur pour une mauvaise voiture d'occasion : 1.000
: Prix subjectif d'un acheteur pour une bonne voiture d'occasion : 2.400
: Prix subjectif d'un acheteur pour une mauvaise voiture d'occasion : 1.200

195

Les acheteurs ne peuvent observer la qualit (bonne ou mauvaise) des voitures d'occasion.
Mais les vendeurs de voitures ont la possibilit de signaler la qualit de leur voiture, ceci par
la proposition d'une garantie qui les oblige remplacer toute pice dfectueuse pendant une
priode d'une anne. Supposons qu'en moyenne, la garantie cote 300 par an pour une bonne
voiture et 1.300 pour une mauvaise voiture. Supposons galement que le march de voitures
est un march de vendeurs (les prix s'tablissent la borne suprieure de l'intervalle de
ngociation).
Montrez que les propritaires de bonne voiture peuvent signaler la qualit de leur voiture en
offrant une garantie d'une anne. (Indication : vrifier si les vendeurs de mauvaise voiture
sont incits imiter les vendeurs de bonne voiture, c'est--dire proposer une garantie d'une
anne).
20-) Jeu de signal. Considrons un jeu dans lequel la premire tape, la nature procde au
tirage alatoire du type (capacit productive) de chaque travailleur partir d'une distribution
de probabilit continue sur [ , ]. A la seconde tape du jeu, chaque travailleur observe son
type qui est son information prive et doit dcider s'il accepte de passer ou non un test sans
cot qui rvle parfaitement son type. A la troisime tape, des firmes en concurrence
observent si le travailleur a accept ou non de passer le test ainsi que le rsultat du test et
proposent un salaire pour le recrutement du travailleur.

Montrer que dans un quilibre Bayesien parfait, les travailleurs de tout type acceptent de
passer le test et les firmes offrent un salaire non suprieur pour tout travailleur n'ayant pas
accept de passer le test. (Indication : assurez-vous que les participants ce jeu ne sont pas
incits dvier de cet quilibre en spcifiant convenablement les croyances l'quilibre).
21-) Considrer l'quilibre de signal suivant du modle de Spence (1973) :

w* e * ( H ) = H

w* (e )

w * e * ( L ) = L

0 = e * ( L )

e = e * ( H )

196

1. S'agit-il d'un quilibre sparateur ou d'un quilibre mlangeant ?


2. Expliquez comment le signal est une rponse possible au problme de slection
adverse.
3. Donnez les caractristiques de l'quilibre de signal dcrit dans la figure ci-dessus.
4. Montrez l'importance de la single crossing property dans la dfinition de la notion
d'quilibre de signal.
5. Faites ressortir l'origine de cette proprit dans la fonction de cot de l'ducation.
22-) Modle de signal de Spence. Dans le cadre du modle de Spence (1973), montrer en
dtaillant quelle est la condition et sa consquence centrales qui rendent possible que le
niveau d'ducation soit un signal crdible de la productivit du travailleur.
23-) Considrer le jeu de signal dcrit dans la figure suivante :

1.) Montrer

que

le

couple

stratgies

croyances

[(R, R, R ); (u, d ); (t1 / R ) = 0,5; (t 2 / R ) = 0,25; (t3 / R ) = 0,5; (t1 / L ) = 0,4; (t2 / L ) = 0,3; (t3 / L ) = 0,3]

est un quilibre baysien parfait au sens faible.


2.) Au regard des critres de domination, peut-on le considrer comme tant un quilibre
raisonnable ?
3.) Obtient-on les mmes rsultats si les croyances hors quilibre taient
structurellement consistantes ?

Nature
t1

t2

[0,5]

Emetteur
R

Rcepteur

1

3

6

0

2

2

[0,5]

Emetteur

t3

[0,25]

Emetteur
R

Rcepteur

HL

1

4

2

3

6

3

4

3

HR

5

4

3

4

6

2

5

4

3

5

197

24-) Considrer le jeu de signal dcrit dans la figure suivante :

1.) Montrer que le couple stratgies / croyances [(R, R ); (u , d ); q = 0,5; p ] avec p >

1
est
4

un quilibre baysien parfait au sens faible mlangeant en R.


2.) Au regard des critres de domination, peut-on le considrer comme tant un quilibre
raisonnable ?
3.) Obtient-on les mmes rsultats si les croyances hors quilibre taient
structurellement consistantes ?
1
6

[p ]
2
3
4
1

Rcepteur
HL

Nature

t2
R
Emetteur

6
1

[q]
d

Rcepteur
HR

0,5

0,5

[1-p]
8
2

Emetteur
L
t1

3
4
4
1

[1-q]
d

7
3

25-) Les enchres. Donnez les arguments montrant que les enchres appartiennent la classe
des jeux Bayesiens. Dcrivez ce mcanisme en utilisant les concepts de cette classe de jeux.
26-) L'enchre au second prix. Dans l'enchre au second prix (enchre de Vickrey), les
enchres bi sont soumises sous pli cachet. Lobjet est attribu lenchrisseur qui propose
loffre la plus leve et le prix payer est gal la deuxime offre la plus leve. Les
valuations subjectives v i pour l'objet des acheteurs potentiels i sont prives et indpendantes
entre elles. Montrer que lannonce de leur vritable valuation de lobjet est une stratgie
dominante pour les enchrisseurs, ce qui donne bi* = vi .

Vous aimerez peut-être aussi