Vous êtes sur la page 1sur 48

Initiation ` a la Theorie des Jeux

Jer ome Renault


Chapitre 1 : Jeux sous forme strategique.
29 octobre 2007
2 Notes de cours Jeux sous forme strategique 2007-2008
Table des mati`eres
Introduction 5
1 Jeux sous forme strategique 7
1.1 Mod`ele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Equilibres en strategies dominantes . . . . . . . . . . . . . . . 13
1.3 Equilibres de Nash . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1 Denition et premi`eres proprietes . . . . . . . . . . . . 14
1.3.2 Existence dun equilibre de Nash . . . . . . . . . . . . 16
1.3.3 Elimination iteree des strategies strictement dominees . 21
1.4 Strategies mixtes . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.1 Jeux nis et strategies mixtes . . . . . . . . . . . . . . 24
1.4.2 Elimination de strategies strictement dominees par une
strategie mixte . . . . . . . . . . . . . . . . . . . . . . 29
1.4.3 Generalisation de lextension mixte . . . . . . . . . . . 30
1.5 Jeux ` a somme nulle . . . . . . . . . . . . . . . . . . . . . . . . 31
1.5.1 Denition, valeur et strategies optimales . . . . . . . . 31
1.5.2 Lien avec les equilibres de Nash et Theor`eme du MinMax 35
1.6 Exercices sur le Chapitre 1 . . . . . . . . . . . . . . . . . . . . 38
1.6.1 Strategies dominantes . . . . . . . . . . . . . . . . . . 38
1.6.2 Equilibres de Nash . . . . . . . . . . . . . . . . . . . . 38
1.6.3 Strategies Mixtes . . . . . . . . . . . . . . . . . . . . . 42
1.6.4 Valeurs de jeux matriciels . . . . . . . . . . . . . . . . 43
Quelques rappels mathematiques 45
1.7 Un peu dalg`ebre . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.7.1 Ensembles convexes . . . . . . . . . . . . . . . . . . . . 45
1.7.2 Applications anes, concaves et convexes . . . . . . . . 46
1.8 Un peu danalyse . . . . . . . . . . . . . . . . . . . . . . . . . 46
3
4 Notes de cours Jeux sous forme strategique 2007-2008
1.8.1 Ordre sur IR et IR . . . . . . . . . . . . . . . . . . . . . 46
1.8.2 Espace Euclidien et topologie . . . . . . . . . . . . . . 47
1.9 Un peu de probabilites . . . . . . . . . . . . . . . . . . . . . . 47
1.9.1 Tribu et probabilite . . . . . . . . . . . . . . . . . . . . 47
1.9.2 Tribu et probabilite produits . . . . . . . . . . . . . . . 48
Introduction
Une interaction strategique est une situation o` u :
a) il y a plusieurs personnes (au sens large du terme : personnes physiques,
mais aussi personnes morales, animaux, automates,..) appelees joueurs,
b) chacun de ces joueurs doit faire quelque chose (choix d actions ou de
strategies),
c) lutilite (bonheur procure, paiement monetaire,...) que chaque joueur
va retirer de la situation qui va advenir ne depend pas uniquement de sa
propre action, mais peut aussi dependre des actions choisies par les autres
joueurs.
La theorie des jeux etudie les interactions strategiques. De telles situa-
tions sont extr`emement frequentes, et quasiment omnipresentes dans les
phenom`enes etudies en sciences sociales. Des exemples parmi dautres sont :
1. une vente aux ench`eres : un encherisseur preferera etre le seul ` a encherir,
et ` a defaut que les prix proposes par les autres agents soient tr`es faibles.
2. une concurrence entre entreprises vendant le meme bien et devant xer
leur prix de vente : une entreprise pref`ere en general que ses concurrentes
pratiquent des prix eleves.
3. le vote, par exemple lors de lelection presidentielle en France.
4. des jeux au sens commun ou ludique du terme, comme les echecs ou le
poker.
Ces notes ne constituent quune introduction ` a la theorie des jeux dite
non cooperative, on ne parle pas de jeux cooperatifs. Lobjet du cours est
lintroduction et letude de concepts strategiques, et le formalisme et la ri-
gueur mathematique sont largement utilises. Ce texte contient aussi quelques
interpretations des situations ou des concepts, mais de fa con generale on ne
5
6 Notes de cours Jeux sous forme strategique 2007-2008
sattardera pas trop sur les interpretations possibles. On etudiera et on calcu-
lera des concepts mathematiquement bien denis, qui font sens par rapport
aux interpretations presentees mais qui peuvent aussi etre etudies en tant
que tels du point de vue mathematique.
Les interpretations et arguments non mathematiques sont mentionnes
en italique, et le lecteur privilegiant laspect mathematique peut ne pas y
attacher trop dimportance. A linverse, certaines parties un peu techniques
comme le passage 1.3.2 avant lenonce du theor`eme de Glicksberg, ou le
paragraphe 1.4.3, peuvent etre survoles par un lecteur plus interesse par les
applications. Le dernier chapitre contient quelques rappels mathematiques
simples.
Chapitre 1
Jeux sous forme strategique
Quand on etudie une interaction strategique qui ne comporte quune
etape, ou que lon ne souhaite pas explicitement tenir compte du deroulement
temporel de linteraction, on se ram`ene aux jeux sous forme strategique.
1.1 Mod`ele
Denition 1.1.1. Un jeu sous forme strategique (on dit aussi : sous forme
normale) est la donnee de G = (N, (A
i
)
iN
, (g
i
)
iN
) o` u :
a) N est un ensemble non vide appele ensemble des joueurs,
b) pour chaque joueur i dans N, A
i
est un ensemble non vide appele
ensemble dactions (ou de strategies) du joueur i.
c) pour chaque joueur i dans N, g
i
est une application de

jN
A
j
dans
IR appelee fonction de paiement du joueur i.
Un jeu sous forme strategique peut etre pense comme un jeu simultane
en un coup. Plus precisement, linterpretation est la suivante.
Chaque joueur i doit choisir une action a
i
dans A
i
. Les choix des joueurs
sont simultanes. A la n du jeu, si chaque joueur j a choisi laction a
j
de A
j
,
le paiement dun joueur i est g
i
(a), o` u a = (a
j
)
jN
. Chaque joueur cherche
uniquement ` a maximiser son propre paiement. Tous les joueurs connaisssent
G.
Remarques 1.1.2. Dans linterpretation, il nest pas necessaire que les choix
dactions soient simultanes, il sut en fait quau moment de choisir, chaque
joueur ne soit pas au courant des choix eventuellement dej` a eectues par les
7
8 Notes de cours Jeux sous forme strategique 2007-2008
autres joueurs. Cest le cas par exemple lorsque chaque joueur ecrit laction
quil choisit dans une enveloppe cachetee, et quensuite toutes les enveloppes
sont recoltees et ouvertes par un arbitre.
Par ailleurs, on a parfois aussi en tete que tous les joueurs savent que tous
les joueurs connaissent G, mais aussi que tous les joueurs savent que tous
les joueurs savent que tous les joueurs connaissent G, ... On peut continuer
comme cela jusqu` a linni, et lon dit alors que G est connaissance com-
mune de la part des joueurs. Cela arrive par exemple si un arbitre explique
publiquement aux joueurs les r`egles du jeu (i.e. les donnees de G) avant de
jouer.
De meme, on a souvent en tete lidee que les joueurs sont des individus
intelligents ou rationnels, et que tous les joueurs savent que les joueurs
sont rationnels, et quils savent que tous les joueurs savent que les joueurs
sont rationnels, etc... On peut aller jusqu` a la connaissance commune de la
rationalite. Cela dit, il nest pas evident du tout de denir ce que lon entend
par rationalite.
De fa con generale ici, on ne sattardera pas trop sur ces dierences entre
les interpretations possibles. Comme indique dans lintoduction, on etudiera
et on calculera des concepts mathematiquement bien denis, qui font sens par
rapport aux interpretations presentees mais qui peuvent aussi etre etudies en
tant que tels du point de vue mathematique.
Voyons quelques exemples de jeux sous forme normale.
Exemple 1 : Il y a deux joueurs : N = {1, 2}. Le joueur 1 doit choisir
une ligne Haut ou Bas, on a : A
1
= {H, B}. Le joueur 2 doit choisir une
colonne Gauche ou Droite, on a : A
2
= {G, D}. Les paiements, cest-` a-dire
les fonctions g
1
et g
2
, sont donnes par la matrice suivante :
G D
H
B
_
(1, 1) (3, 0)
(0, 3) (0, 0)
_
Les cases de cette matrice representent les elements de A
1
A
2
. Dans chaque
case, on trouve un couple de reels : la premi`ere composante donne le paiement
du joueur 1, la seconde celui du joueur 2. Par exemple, dans la case (H, D)
se trouve le couple (3, 0) : cela signie que g
1
(H, D) = 3 et que g
2
(H, D) = 0.
Dans la case (B, D) se trouve le couple (0, 0) : cela signie que g
1
(B, D) = 0
Notes de cours Jeux sous forme strategique J. Renault 9
et que g
2
(B, D) = 0, etc... Cette matrice represente donc de fa con pratique
les fonctions de paiements.
Un jeu sous forme strategique ` a deux joueurs, et dont les ensembles dac-
tions sont nis, sera presque toujours represente par une matrice comme dans
lexemple ci-dessus. Le joueur 1 choisira la ligne, le joueur 2 choisira la co-
lonne, la premi`ere composante des paiements donnera le paiement du joueur
1, la seconde composante donnera celui du joueur 2. Cest le cas notamment
dans les deux exemples suivants. On eectuera parfois labus de notation
qui consiste ` a employer la meme lettre G pour deux choses dierentes : une
des actions (Gauche) dun joueur, et le jeu lui-meme. (Cet abus nentranera
normalement aucune confusion dans la suite.)
Exemple 2 :
G D
H
B
_
(1, 0) (0, 1)
(0, 0) (1, 1)
_
Exemple 3 :
G D
H
B
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
Souvent, une interaction strategique comporte plusieurs etapes. On verra
au chapitre 2 comment ramener une telle interaction en un jeu sous forme
normale. Voici un exemple simple.
Exemple 4 :
Il y a deux joueurs, et linteraction strategique est representee par la gure
suivante :

@
@
@
@
@
@

J
J
J
J
J
J

J
J
J
J
J
J
J2
J1
J2
(10, 9) (0, 10) (1, 2) (3, 1)
G D
g
2
d
2
g
1
d
1
x
0
x
1
x
2
x
3
x
4
x
5
x
6
c
c c
10 Notes de cours Jeux sous forme strategique 2007-2008
Linterpretation dun tel arbre est la suivante. Le jeu commence au noeud
le plus haut (qui sappelle la racine de larbre), donc en x
0
. Cest au joueur
1 (J1) de jouer. Il doit choisir entre jouer G ou D.
Supposons que le joueur 1 choisisse G en x
0
. Le jeu va alors au noeud x
1
.
Cest au joueur 2 (J2) de jouer, et il sait que le jeu est en x
1
, donc que le
joueur 1 a choisi G. Le joueur 2 doit alors choisir entre g
1
et d
1
. Sil a choisi
g
1
, le jeu est termine et le paiement est (10,9). Comme precedemment, la
premi`ere composante donne le paiement du joueur 1 (ici 10), et la seconde le
paiement du joueur 2 (ici 9). Si le joueur 2 choisit d
1
, alors le jeu est termine
et le paiement est (0,10).
Supposons maintenant que le joueur 1 joue D en x
0
. De la meme fa con,
le jeu va en x
2
, cest au joueur 2 de jouer et il sait que le jeu est en x
2
. Il a
alors le choix entre jouer g
2
et d
2
. Dans chacun des cas, le jeu est termine et
les paiements sont indiques sous le noeud terminal atteint.
Nous venons de decrire une interaction strategique en plusieurs etapes ` a
laide dun jeu sous forme darbre, que nous appelerons jeu sous forme exten-
sive. Il est toutefois possible de representer ce jeu comme un jeu simultane en
une etape, cest-` a-dire comme un jeu sous forme strategique. Voici comment.
Lensemble des joueurs est N = {1, 2}. Lensemble des strategies du
joueur 1 est A
1
= {G, D}. La situation est dierente en ce qui concerne
le joueur 2. Imaginons quavant de jouer le jeu, le joueur 2 veuille decrire ` a
un ami sa strategie : il doit specier ce quil jouera si le joueur 1 joue G, mais
aussi ce quil jouera si le joueur 1 joue D. Il doit donc donner un element de
{g
1
, d
1
}, et un element de {g
2
, d
2
}. On pose donc : A
2
= {g
1
, d
1
} {g
2
, d
2
} =
{(g
1
, g
2
), (g
1
, d
2
), (d
1
, g
2
), (d
1
, d
2
)}. On determine maintenant les fonctions de
paiements en suivant, pour chaque paire de strategies de A
1
A
2
, la partie
induite sur larbre par ces strategies. On obtient donc :
(g
1
, g
2
) (g
1
, d
2
) (d
1
, g
2
) (d
1
, d
2
)
G
D
_
(10, 9)) (10, 9) (0, 10) (0, 10)
(1, 2) (3, 1) (1, 2) (3, 1)
_
Fixons pour linstant un jeu sous forme strategique G = (N, (A
i
)
iN
, (g
i
)
iN
).
On utilisera toujours les notations suivantes.
Notations 1.1.3.
A =

iN
A
i
.
Notes de cours Jeux sous forme strategique J. Renault 11
Un element a = (a
i
)
iN
de A sappelle un prol dactions (ou de strategies).
Fixons maintenant un joueur i dans N, pour abreger on notera parfois ce
joueur Ji. On note :
A
i
=

jN\{i}
A
j
.
Si a = (a
j
)
jN
A, on note a
i
= (a
j
)
jN\{i}
A
i
. a
i
correspond ` a
laction jouee par les autres joueurs que i. On notera, avec un leger abus de
notation, a = (a
i
, a
i
) lorsque lon souhaitera insister sur laction du joueur
i. Dune mani`ere generale, lexposant i vise ` a representer tous les autres
joueurs que le joueur i.
Enn, on notera g la fonction de paiement vectoriel du jeu. Plus precisement,
g est lapplication de A dans IR
N
qui associe ` a tout prol dactions a le vec-
teur g(a) = (g
i
(a))
iN
dans IR
N
.
On sinteresse maintenant ` a la signication eventuelle de bien jouer
dans un jeu sous forme normale. Dans lexemple 1, il semble clair que
le joueur 1 a interet ` a jouer H car il gagnera ainsi 1 ou 3 plut ot que 0.
De meme, le joueur 2 a interet ` a jouer G. Donc dans lexemple 1 le prol
dactions (H, G) semble la seule issue rationnelle possible.
Considerons maintenant lexemple 2. Si le joueur 2 est rationnel, il va
jouer D pour gagner 1 plut ot que 0, independamment de ce que va faire le
joueur 1. Un joueur 1 intelligent doit anticiper cela et donc jouer B plut ot
que H. Le prol (B, D) semble ici la seule issue rationnelle possible.
Il nest a priori pas evident de savoir quoi jouer dans lexemple 3. Nous
reviendrons sur ce jeu plus tard. Considerons enn lexemple 4. Un raison-
nement, base sur larbre, est le suivant. Si le jeu se trouve en x
1
, le joueur 2
va choisir d
1
pour avoir un paiement de 10 au lieu de 9. Si le jeu se trouve
en x
2
, le joueur 2 va choisir g
2
pour avoir un paiement de 2 au lieu de 1.
Le joueur 1 doit anticiper cela, et doit donc choisir D en x
0
pour sassu-
rer un paiement de 1 plut ot que de 0. Donc (D, (d
1
, g
2
)) semble etre lissue
rationnelle du jeu. Nous reviendrons plus tard sur ce raisonnement dit de
recurrence amont et sa validite.
Il faut insister sur le fait que les trois derniers paragraphes nont pour
linstant aucun sens mathematique car nous navons pas deni scientique-
ment de concept de solution, ni le mot rationnel ou lexpression bien
jouer. Les arguments developpes sont pour linstant justes des arguments
12 Notes de cours Jeux sous forme strategique 2007-2008
de bon sens qui semblent adaptes aux situations strategiques considerees.
On donne maintenant quelques denitions generales.
Denition 1.1.4. On dit que le jeu G = (N, (A
i
)
iN
, (g
i
)
iN
) est ni si N
et chacun des ensembles A
i
sont nis.
Denition 1.1.5. Soit i dans N, et soient a
i
et b
i
deux actions du joueur i
dans A
i
.
b
i
domine strictement a
i
si : a
i
A
i
, g
i
(b
i
, a
i
) > g
i
(a
i
, a
i
).
b
i
domine faiblement a
i
si :
_
a
i
A
i
, g
i
(b
i
, a
i
) g
i
(a
i
, a
i
),
et a
i
A
i
, g
i
(b
i
, a
i
) > g
i
(a
i
, a
i
).
a
i
est strictement dominee si il existe une strategie c
i
dans A
i
telle que c
i
domine strictement a
i
.
a
i
est faiblement dominee si il existe une strategie c
i
dans A
i
telle que c
i
domine faiblement a
i
.
Lexemple suivant, dit du dilemme du prisonnier est tr`es cel`ebre en
theorie des jeux.
Exemple 5 :
G D
H
B
_
(1, 1) (1, 2)
(2, 1) (0, 0)
_
La strategie H du joueur 1 est strictement dominee par la strategie B. En
ce qui concerne le joueur 2, G est strictement dominee par D.
On peut raconter de nombreuses histoires decrivant cette interaction
strategique (prisonniers dans une cellule devant avouer ou nier, course aux
armements entre deux pays pouvant acquerir une arme decisive,...), mention-
nons ici juste linteraction suivante. Initalement, le Joueur 1 poss`ede un Abri-
cot, et le Joueur 2 poss`ede une Banane. Les joueurs doivent simultanement
decider de donner ou pas leur fruit ` a lautre joueur (donner correspond ` a
laction H pour le J1, et ` a laction G pour le J2). Il se trouve que le joueur 1
pref`ere la Banane ` a lAbricot, et le joueur 2 pref`ere lAbricot ` a la Banane. Plus
precisement, chaque joueur a les preferences suivantes, ordonnees strictement
Notes de cours Jeux sous forme strategique J. Renault 13
par ordre decroissant dutilite : avoir les 2 fruits, puis avoir uniquement son
fruit prefere, puis avoir uniquement son fruit de depart, et enn ne rien avoir.
La notion suivante jouera un grand r ole par la suite.
Denition 1.1.6. Soient i dans N, a
i
dans A
i
, et a
i
dans A
i
. On dit que
a
i
dans A
i
est meilleure reponse du joueur i contre a
i
si :
b
i
A
i
, g
i
(a
i
, a
i
) g
i
(b
i
, a
i
).

Autrement dit, a
i
est meilleure reponse contre a
i
si le joueur i a interet
` a jouer a
i
lorsque les autres joueurs jouent selon a
i
. Cest equivalent ` a :
g
i
(a
i
, a
i
) = max
b
i
A
i
g
i
(b
i
, a
i
).
Lexistence dune meilleure reponse du Ji contre a
i
equivaut ` a lexistence du
maximum de lensemble {g
i
(b
i
, a
i
), b
i
A
i
}. Quand lensemble A
i
est ni, le
maximum existe donc il existe toujours au moins une meilleure reponse. Dans
certains cas, le max peut ne pas exister, et alors le Ji na pas de meilleure
reponse contre a
i
. Par ailleurs, il est frequent quil existe plusieurs meilleures
reponses possibles. Par exemple, dans lexemple 4, les meilleures reponses
contre G sont (d
1
, g
2
) et (d
1
, d
2
). Remarquons quune strategie strictement
dominee ne peut jamais etre meilleure reponse.
Le premier concept de solution que nous verrons est celui dequilibre en
strategies dominantes.
1.2 Equilibres en strategies dominantes
Denition 1.2.1. Soit i dans N, et a
i
dans A
i
.
a
i
est une strategie dominante du joueur i si quoi que jouent les autres
joueurs, le Ji a interet ` a jouer a
i
, cest-` a-dire si :
a
i
A
i
, b
i
A
i
, g
i
(a
i
, a
i
) g
i
(b
i
, a
i
).

De fa con equivalente, une strategie dominante du Ji est une strategie


du Ji qui est meilleure reponse contre nimporte quelle strategie des autres
joueurs.
14 Notes de cours Jeux sous forme strategique 2007-2008
Denition 1.2.2. Un equilibre en strategies dominantes de G est un prol
dactions a = (a
i
)
iN
dans A tel que pour tout joueur i de N, a
i
est une
strategie dominante du joueur i.
Dans lexemple 1, (H, G) est un equilibre en strategies dominantes. Dans
le dilemme du prisonnier (exemple 5), (B, D) est un equilibre en strategies
dominantes. Meme sil est socialement souhaitable que les joueurs echangent
leurs fruits, on peut penser que des joueurs rationnels ne le feront pas. Il
nexiste pas de tels equilibres dans les exemples 2, 3, 4.
Typiquement dans une interaction strategique, la meilleure reponse dun
joueur depend de laction des autres joueurs (voir la denition 1.1.6). Et
lexistence de strategies dominantes est rare. Le concept suivant dequilibre
de Nash est fondamental en theorie des jeux.
1.3 Equilibres de Nash
1.3.1 Denition et premi`eres proprietes
Denition 1.3.1. Un equilibre de Nash est un prol dactions tel que chaque
joueur soit en meilleure reponse contre la strategie des autres joueurs.
Plus formellement, soit a = (a
i
)
iN
un prol dactions dans A.
a est un equilibre de Nash de G si et seulement si :
i N, b
i
A
i
, g
i
(a
i
, a
i
) g
i
(b
i
, a
i
).
Cest equivalent ` a : Pour tout i de N, a
i
est meilleure reponse contre a
i
.
Si les autres joueurs jouent selon a
i
, alors le joueur i a interet ` a jouer
a
i
plut ot quune autre action b
i
. On dit aussi quun equilibre de Nash est un
prol dactions tel quil ny a pas de deviation unilaterale (cest-` a-dire de la
part dun seul joueur), qui soit (strictement) protable.
Linterpretation la plus simple est celle dun contrat. Supposons que les
joueurs saccordent, dune fa con ou dune autre, pour jouer selon le prol
dactions a. Si un joueur i pense que les autres joueurs vont respecter le
contrat, cest-` a-dire jouer selon a
i
, alors ce joueur a interet ` a jouer a
i
, donc
` a respecter le contrat lui aussi. Dans ce sens, un equilibre de Nash est donc
un contrat stable.
On peut penser egalement aux normes sociales ou aux r`eglements en vi-
gueur dans nos societes. Dans certains pays, les voitures roulent ` a gauche.
Notes de cours Jeux sous forme strategique J. Renault 15
Tout conducteur qui se mettrait ` a conduire ` a droite verrait son risque dac-
cident augmenter et son utilite diminuer. Donc rouler ` a gauche pour tout le
monde correspond ` a un equilibre de Nash.
En ce qui concerne lexistence et le nombre dequilibres de Nash des jeux
sous forme strategique, a priori tout est possible. Dans les exemples 1, 2
, 4, 5, il y a un seul equilibre de Nash, respectivement : (H, G), (B, D),
(D, (d
1
, g
2
)), et (B, D). Il nexiste pas dequilibre de Nash dans lexemple 3
(meme si plus tard nous verrons comment etendre ce jeu et obtenir lexistence
dun equilibre de Nash en strategies mixtes). Il nest pas rare quil y ait
plusieurs equilibres de Nash, comme dans lexemple suivant.
Exemple 6 :
G D
H
B
_
(2, 1) (0, 0)
(0, 0) (1, 2)
_
Ce jeu sappelle la bataille des sexes. On peut penser ` a un couple J1,
J2, qui veut avant tout passer la soiree ensemble, mais est en desaccord sur le
th`eme de la soiree. Chaque joueur doit choisir entre aller Danser (actions H
et G) et aller ` a la Boxe (actions B et D), et on suppose ces choix simultanes.
(H, G) et (B, D) sont ici tous les deux des equilibres de Nash du jeu.
Par rapport ` a lequilibre en strategies dominantes, la notion dequilibre
de Nash est moins forte, comme le montre la proposition suivante.
Proposition 1.3.2. Un equilibre en strategies dominantes est un equilibre
de Nash.
Preuve : Soit a = (a
i
)
iN
un equilibre en strategies dominantes de G.
Fixons un joueur i dans N. Comme a
i
est une strategie dominante du
joueur i, on a par denition : b
i
A
i
, b
i
A
i
, g
i
(a
i
, b
i
) g
i
(b
i
, b
i
).
Donc en particulier pour b
i
= a
i
, on obtient : b
i
A
i
, g
i
(a
i
, a
i
)
g
i
(b
i
, a
i
). Donc a
i
est meilleure reponse contre a
i
.
a est donc un equilibre de Nash de G.
La reciproque de la proposition precedente est clairement fausse. On a
seulement le resultat suivant.
Proposition 1.3.3. Si a = (a
i
)
iN
est un equilibre de Nash, alors pour tout
i de N la strategie a
i
nest pas une strategie strictement dominee.
16 Notes de cours Jeux sous forme strategique 2007-2008
Preuve : Soit a = (a
i
)
iN
un equilibre de Nash de G, et soit i dans N. La
strategie a
i
est meilleure reponse contre a
i
, donc ne peut etre strictement
dominee.
Lexemple suivant montre toutefois quun equilibre de Nash peut contenir
des strategies faiblement dominees.
Exemple 7 :
G D
H
B
_
(1, 1) (0, 0)
(0, 0) (0, 0)
_
(B, D) (ainsi que (H, G)) est un equilibre de Nash . Et pourtant B est
faiblement dominee par H, et D est faiblement dominee par G.
1.3.2 Existence dun equilibre de Nash
On sinteresse maintenant ` a lexistence des equilibres de Nash. Com-
men cons par un peu dalg`ebre et danalyse.
Denition 1.3.4. Soient X un sous-ensemble convexe dun espace vectoriel
reel, et f une application de X dans IR. On dit que f est quasi-concave si :
x X, y X, [0, 1], f(x + (1 )y) min{f(x), f(y)}.

Lemme 1.3.5. Soient X un sous-ensemble convexe dun espace vectoriel


reel, et f une application de X dans IR. f est quasi-concave si et seulement
si pour tout reel , lensemble {x X, f(x) } est convexe.
Preuve :
Supposons f quasi-concave. Soit dans IR, et notons A = {x X, f(x)
}. Nous allons montrer que A est convexe. Soient x et y dans A, et
dans [0, 1]. Notons z = x + (1 )y. Comme f est quasi-concave, on a
f(z) min{f(x), f(y)}. Comme x et y sont dans A, min{f(x), f(y)} .
Donc f(z) , et z A. A est convexe.
Reciproquement, supposons que pour tout de IR, lensemble {x
X, f(x) } soit convexe. Soient x et y dans X, et dans [0, 1]. Posons
= min{f(x), f(y)} IR, et A = {z X, f(z) }. On a f(x) ,
Notes de cours Jeux sous forme strategique J. Renault 17
et f(y) , donc x et y sont dans A. Par hypoth`ese A est convexe, donc
x+(1 )y est dans A. Donc f(x+(1 )y) . f est quasi-concave.
Rappelons que f est concave si et seulement si : x X, y X,
[0, 1], f(x + (1 )y) f(x) + (1 )f(y). Comme on a toujours
f(x) + (1 )f(y) min{f(x), f(y)} quand [0, 1], il decoule quune
fonction concave est quasi-concave. La reciproque est fausse. Par exemple,
toute application croissante de IR dans IR est quasi-concave. Il en est de
meme de toute application decroissante de IR dans IR. Lapplication, denie
sur IR
+
, qui ` a tout x associe x
2
, est ` a la fois convexe et quasi-concave.
Nous allons aussi utiliser la notion de correspondance.
Denition 1.3.6.
Soient X et Y des ensembles. Une correspondance (ou multiapplication)
de X dans Y est une application de X dans lensemble P(Y ) des parties de
Y . On note :
F : X Y
x F(x) Y
la correspondance qui ` a tout x de X associe le sous-ensemble F(x) de Y .
Le graphe de la correspondance F est alors deni comme :
Graph F = {(x, y) X Y, y F(x)}.
Pour x dans X, on dit que x est un point xe de la correspondance F si
x F(x).
Remarquons que si f est une application de X dans Y , on peut denir
la correspondance F de X dans Y qui ` a tout x de X associe le singleton
F(x) = {x}. Le graphe de la correspondance F est alors egal au graphe de
de lapplication f .
Nous utiliserons, sans demonstration, le theor`eme suivant dit theor`eme
du point xe de Kakutani. Rappelons quun espace euclidien est simplement
un espace vectoriel reel de dimension nie. Dans un tel espace, toutes les
normes sont equivalentes, et les sous-ensembles compacts concident avec les
sous-ensembles fermes bornes.
Theor`eme 1.3.7. (de Kakutani)
18 Notes de cours Jeux sous forme strategique 2007-2008
Soit X un convexe compact non vide dun espace euclidien, et F : X X
une correspondance de graphe compact telle que pour tout x de X, lensemble
F(x) est convexe compact non vide.
Alors F admet un point xe, cest-` a-dire quil existe x

dans X tel que


x

F(x

).
Remarquons tout de suite que si le graphe de F est compact, alors au-
tomatiquement on a F(x) compact pour tout x de X. Donc cette derni`ere
hypoth`ese (F(x) compact pour tout x) peut tout simplement senlever de
lenonce du theor`eme. La demonstration de ce resultat depasse le cadre de ce
cours. Indiquons un fort lien avec le cel`ebre theor`eme de point xe de Brou-
wer. Si f est une application de X dans X, denissons la correspondance F
de X dans X qui ` a tout x de X associe le singleton {x}. Remarquons quun
singleton est convexe compact non vide. Donc pour appliquer le theor`eme de
Kakutani ` a F, il sut de verier la condition de compacite du graphe de F
(ou de f). Comme X est compact, le graphe de f est ferme dans X X si
et seulement si f est continue. On a donc le theor`eme suivant.
Theor`eme 1.3.8. (de Brouwer) Soit X un convexe compact non vide dun
espace euclidien, et f une application continue de X dans X. Alors f admet
un point xe, cest-` a-dire quil existe x

dans X tel que f(x

) = x

.
Le theor`eme de Brouwer peut donc etre obtenu comme corollaire du
theor`eme de Kakutani. Indiquons toutefois quil est classique de proceder
dans lautre sens et de demontrer le theor`eme de Kakutani apr`es avoir demontre
independamment le theor`eme de Brouwer (noublions pas que nous avons
admis le theor`eme de Kakutani). Revenons maintenant ` a la theorie des jeux
proprement dite.
Fixons un jeu G = (N, (A
i
)
iN
, (g
i
)
iN
) sous forme strategique.
Denition 1.3.9.
1) Soit i un joueur. Pour tout element a
i
dans A
i
, on note R
i
(a
i
)
lensemble des meilleures reponses du joueur i contre a
i
. On a :
R
i
(a
i
) = {a
i
A
i
, g
i
(a
i
, a
i
) = max
b
i
A
i
g
i
(b
i
, a
i
)}.
avec la convention : R
i
(a
i
) = si max
b
i
A
i g
i
(b
i
, a
i
) nexiste pas.
Notes de cours Jeux sous forme strategique J. Renault 19
2) Soit i dans N. On note R
i
: A
i
A
i
.
a
i
R
i
(a
i
)
R
i
sappelle la correspondance de meilleure reponse du joueur i.
3) On denit la correspondance de meilleure reponse du jeu G comme la
correspondance R suivante.
R : A A
a = (a
i
)
iN
R(a) =

iN
R
i
(a
i
) = {(b
i
)
iN
A, i N b
i
R
i
(a
i
)}.

Par denition, un equilibre de Nash de G est un prol dactions a =


(a
i
)
iN
tel que pour tout i de N, a
i
est meilleure reponse contre a
i
. On a
donc clairement le resultat suivant.
Lemme 1.3.10. Soit a dans A.
a est un equilibre de Nash de G si et seulement si a est un point xe de
la correspondance de meilleure reponse de G.
On peut maintenant donner des conditions susantes dexistence dequilibres
de Nash.
Theor`eme 1.3.11. (de Glicksberg)
Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu sous forme strategique o` u N =
{1, ..., n} est un ensemble ni. On suppose que :
1) Pour tout i de N, A
i
est un ensemble convexe compact dun espace eucli-
dien.
2) Pour tout i de N, g
i
est continue.
3) Pour tout i de N , pour tout a
i
dans A
i
,
lapplication : A
i
IR est quasi-concave.
a
i
g
i
(a
i
, a
i
)
Alors il existe un equilibre de Nash de G.
De plus, lensemble des equilibres de Nash de G est ferme dans A. Lensemble
des paiements dequilibres de Nash de G est un sous-ensemble compact de
IR
n
.
Preuve :
Lensemble des prols dactions A est, par deniiton,

iN
A
i
. Comme
chaque A
i
est un sous-ensemble dun espace vectoriel de dimension nie, A est
20 Notes de cours Jeux sous forme strategique 2007-2008
egalement un sous-ensemble dun espace euclidien. De plus, comme chaque
A
i
est convexe compact non vide, A est convexe compact non vide. Nous
allons appliquer le theor`eme de Kakutani ` a la correspondance de meilleure
reponse R.
Soit i dans N et a
i
dans A
i
. Lensemble des meilleures reponses du
joueur i contre a
i
est :
R
i
(a
i
) = {a
i
A
i
, g
i
(a
i
, a
i
) = max
b
i
A
i
g
i
(b
i
, a
i
)}.
Comme g
i
est continue et que A
i
est compact, R
i
(a
i
) est non vide et
ferme dans A
i
. Remarquons que lon peut aussi ecrire : R
i
(a
i
) = {a
i

A
i
, g
i
(a
i
, a
i
) max
b
i
A
i g
i
(b
i
, a
i
)}. Dapr`es lhypoth`ese 3) de quasi-concavite,
et par le lemme 1.3.5, R
i
(a
i
) est convexe. Donc R
i
(a
i
) est convexe compact
non vide.
Pour tout a de A, R(a) =

iN
R
i
(a
i
) est donc convexe compact non
vide. Montrons maintenant que le graphe de R est ferme dans A A.
Considerons donc une suite (a
t
, b
t
)
t0
` a valeurs dans Graph R qui converge
vers une limite (a, b) appartenant ` a AA. Montrons que (a, b) Graph R.
Pour tout t 0, notons a
t
= (a
i
t
)
iN
et b
t
= (b
i
t
)
iN
. On a par denition
de (a
t
, b
t
) Graph R :
i N, c
i
A
i
, g
i
(b
i
t
, a
i
t
) g
i
(c
i
, a
i
t
).
Lapplication g
i
etant continue, on a par passage ` a la limite quand t tend
vers linni :
i N, c
i
A
i
, g
i
(b
i
, a
i
) g
i
(c
i
, a
i
).
Ce qui signie que pour tout joueur i, b
i
est meilleure reponse contre a
i
.
Donc b R(a), et nalement le graphe de R est ferme. Comme A A est
compact, le graphe de R est compact.
On peut donc appliquer le theor`eme de Kakutani ` a R. On obtient lexis-
tence dun element a

de A tel que a

R(a

). Par le lemme 1.3.10, a

est
un equilibre de Nash de G.
Notons EN lensemble des equilibres de Nash de G. On a EN = {a
A, a R(a)} = {a A, (a, a) Graph R}. Comme le graphe de R est ferme
dans A A, et que lapplication de A dans A A qui associe ` a tout a de
A le couple (a, a) est continue, on obtient que EN est ferme dans A, donc
ENest compact.
Notes de cours Jeux sous forme strategique J. Renault 21
Lensemble des paiements dequilibres de Nash de G est {g(a), a EN} =
g(EN). Pour chaque joueur i, g
i
est continue donc g est continue. EN etant
compact, g(EN) lest egalement en tant quimage dun compact par une
application continue. Lensemble des paiements dequilibres de Nash de G
est donc compact.
1.3.3 Elimination iteree des strategies strictement do-
minees
Fixons un joueur i et une strategie b
i
de ce joueur. Supposons que b
i
soit
une strategie strictement dominee du joueur i. Dapr`es la proposition 1.3.3,
a
i
nest jouee dans aucun equilibre de Nash. Considerons maintenant le jeu
G

issu de G o` u lon a supprime la strategie b


i
. Precisement, G

est le jeu
(N, (A
j
)
jN
, (g
j
)
jN
), o` u : A
i
= A
i
\{b
i
}, pour tout joueur j dierent de i
on a A
j
= A
j
, et pour tout prol dactions du nouveau jeu a

dans A

, on a
simplement g
j
(a

) = g
j
(a

) pour tout j de N. On montre ici que lon peut,


pour calculer les equilibres de Nash dun jeu, commencer par eliminer les
strategies strictement dominees.
Proposition 1.3.12. Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu sous forme strategique.
Soit i dans N et b
i
A
i
une strategie strictement dominee du joueur i. Soit
G

le jeu issu de G o` u lon a supprime la strategie b


i
.
Alors lensemble des equilibres de Nash de G est egal ` a lensemble des
equilibres de Nash de G

.
Preuve :
1) Soit a = (a
j
)
jN
un equilibre de Nash de G. Dapr`es la proposition
1.3.3, a
i
nest pas strictement dominee, donc a
i
= b
i
. Le prol dactions a
est jouable dans G

. Pour tout joueur j de N, a


j
est meilleure reponse contre
a
j
dans G, et toutes les actions du joueur j dans G

sont disponibles dans


G, donc a
j
est aussi meilleure reponse contre a
j
dans G

. a est un equilibre
de Nash de G

.
2) Soit a = (a
j
)
jN
un equilibre de Nash de G

. a est jouable dans G.


Pour tout joueur j dans N\{i}, a
j
est meilleure reponse contre a
j
dans
G

, et A
j
= A
j
, donc a
j
est meilleure reponse contre a
j
dans G. Montrons
maintenant que a
i
est meilleure reponse contre a
i
dans G. On a : c
i

A
i
\{b
i
}, g
i
(a
i
, a
i
) g
i
(c
i
, a
i
). Or b
i
est strictement dominee dans G, donc
il existe c
i
dans A
i
\{b
i
} tel que : g
i
(b
i
, a
i
) < g
i
(c
i
, a
i
) g
i
(a
i
, a
i
). Donc
22 Notes de cours Jeux sous forme strategique 2007-2008
on a : c
i
A
i
, g
i
(a
i
, a
i
) g
i
(c
i
, a
i
), et a
i
est meilleure reponse contre a
i
dans G. a est un equilibre de Nash de G.
Remarquons que la partie 2) de la preuve sapplique quand b
i
est seule-
ment une strategie faiblement dominee du joueur i. Donc on peut montrer
que si lon enl`eve une strategie faiblement dominee, lensemble des equilibres
de Nash ne peut que decroire : le nouvel ensemble dequilibre de Nash est
inclus dans lancien.
La proposition 1.3.12 est parfois tr`es utile et implique que pour calculer
les equilibres de Nash dun jeu, on peut toujours commencer par eliminer
(sil y en a) les strategies strictement dominees. Partons dun jeu G. On
elimine toutes les strategies strictement dominees de G. On obtient un jeu
G

. On recommence en eliminant, sil y en a, toutes les strategies strictement


dominees de G

. On obtient un nouveau jeu et on recommence jusqu` a ce quil


ny ait plus de strategie strictement dominee... Si ` a ce moment on obtient un
jeu tel que chaque prol dactions donne le meme vecteur de paiement, on
dit que le jeu G est resoluble par elimination iteree des strategies strictement
dominees.
Remarque 1.3.13. On peut voir lidee de lelimination iteree des strategies
strictement dominees de la fa con suivante. Il est rationel de penser quun
joueur rationel ne joue jamais de strategie strictement dominee. Si chaque
joueur est rationel et pense que les autres joueurs sont rationels, tous les
joueurs vont se mettre ` a considerer le jeu G

. Si tous les joueurs pensent que


tous les joueurs pensent que tous les joueurs sont rationnels, on peut iterer :
tout le monde sait que lon consid`ere G

, on enl`eve donc les strategies stric-


tement dominees dans G

, etc... et ` a chaque fois, par la proposition 1.3.12,


lensemble des equilibres de Nash reste le meme.
Exemple 8 : Soit G le jeu ` a deux joueurs suivant :
g d
H
M
B
_
_
(3, 0) (2, 1)
(0, 0) (3, 1)
(1, 1) (1, 0)
_
_
.
La strategie B est strictement dominee par H pour le joueur 1. Le jeu G

obtenu ` a partir de G par elimination de B, est represente par :


Notes de cours Jeux sous forme strategique J. Renault 23
g d
H
M
_
(3, 0) (2, 1)
(0, 0) (3, 1)
_
.
Maintenant, g est strictement dominee par d pour le joueur 2 dans G

. On
elimine donc g et on obtient le jeu G

represente par :
d
H
M
_
(2, 1)
(3, 1)
_
.
Mais H est maintenant strictement dominee par M, donc on se retouve
avec :
d
M
_
(3, 1)
_
. Le seul equilibre de Nash du jeu de depart G est le
prol dactions (M, d).
1.4 Strategies mixtes
Revenons ` a lexemple 3 (Matching Pennies) :
G D
H
B
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
.
Formellement, ce jeu na pas dequilibre de Nash. Imaginons toutefois que
vous deviez ecrire un programme qui jouerait ` a ce jeu (par exemple en tant
que joueur 1), que ce programme soit destine ` a etre sur un site internet et que
tout le monde puisse acceder ` a ce site pour y jouer vraiment, eventuellement
plusieurs fois, un euro la partie.
Comment ecrire judicieusement un tel programme ? Un programme qui
jouerait H toujours (ou B toujours) serait vite en faillite. Il semble clair ici
quil existe une bonne fa con de proceder, cest decrire un programme qui
choisisse independamment ` a chaque fois de jouer H et B avec probabilite
1/2. Meme si les utilisateurs savent que vous avez employe ce programme,
ils ne peuvent pas, en esperance, gagner de largent : quils jouent G ou D,
lesperance de paiement est nul. (Il vous sut maintenant de faire payer 5
centimes la partie pour, selon toute probabilite et si beaucoup de personnes
jouent, devenir riche rapidement...)
24 Notes de cours Jeux sous forme strategique 2007-2008
1.4.1 Jeux nis et strategies mixtes
On va considerer ici un jeu ni G = (N, (A
i
)
iN
, (g
i
)
iN
). Pour simplier
les notations, on supposera que N = {1, ..., n}, o` u n est le nombre de joueurs.
Nous allons denir un jeu etendu

G, obtenu ` a partir de G en autorisant les
joueurs ` a choisir leur action aleatoirement, et en considerant les esperances
de paiement.
Notation 1.4.1. Soit S un ensemble ni. On note (S) lensemble des
probabilites sur S (muni de la tribu des parties de S). Une probabilite sur S
sera notee x = (x(s))
sS
, avec x(s) 0 pour tout s de S et

sS
x(s) = 1.
Ainsi :
(S) = {x = x(s)
sS
IR
S
, s S x(s) 0 et

sS
x(s) = 1}.

Pour x dans (S), x(s) sappelle la probabilite de s sous x, ou encore


la probabilite que x assigne ` a s. S etant ni, IR
S
est un espace euclidien.
Pour tout x dans (S), on a x(s) [0, 1] pour tout s de S. Donc (S) est
borne. Cest aussi un ensemble ferme de IR
S
, donc (S) est un ensemble
compact. Pour x et y dans (S), et dans [0, 1], on a tr`es classiquement :
x+(1)y = (z(s))
sS
(S), avec pour tout s, z(s) = x(s)+(1)y(s).
(S) est donc un sous-ensemble convexe de IR
S
.
Denition 1.4.2. Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu ni sous forme nor-
male, o` u N = {1, ..., n}. On denit lextension mixte de G comme le jeu sous
forme strategique

G = (N, ((A
i
))
iN
, ( g
i
)
iN
), o` u pour tout joueur i de N
la fonction de paiement g
i
est denie par : (x
1
, ..., x
n
)

jN
(A
j
),
g
i
(x
1
, .., x
n
) = IE
x
1
...x
n(g
i
) =

(a
1
,...,a
n
)A
x
1
(a
1
)...x
n
(a
n
) g
i
(a
1
, ..., a
n
).

Dans

G, chaque joueur peut jouer une lotterie, ou probabilite, sur ses
actions. Si chaque joueur i de N joue la probabilite x
i
sur A
i
, cela denit une
probabilite x
1
x
2
... x
n
sur A. x
1
x
2
...x
n
sappelle le produit (direct)
des probabilites (x
i
)
iN
, cela signie que les tirages aleatoires eectues par
les joueurs sont independants. Les joueurs veulent maximiser leur esperance
Notes de cours Jeux sous forme strategique J. Renault 25
de paiement (ce qui peut se justier dans une certaine mesure ` a laide des
utilites de Von Neumann-Morgenstern, qui ne seront pas presentees ici).
Par exemple, pla cons-nous dans Matching Pennies et supposons que le
joueur 1 joue la probabilite (x
1
(H), x
1
(B)) = (2/3, 1/3) et que le joueur
2 joue la probabilite (x
2
(G), x
2
(D)) = (2/5, 3/5). Ceci induit la proba-
bilite produit x
1
x
2
sur les cases de la matrice : (H, G) a probabilite
(2/3)(2/5)=4/15, (H, D) a probabilite (2/3)(3/5)=6/15, (B, G) a probabi-
lite (1/3)(2/5)=2/15, et (B, D) a probabilite (1/3)(3/5)=3/15. Le paiement
espere est donc g
1
(x
1
, x
2
) = (4/15)1 + (6/15)(1) + (2/15)1 + (3/15)(1)
= 1/5, et g
2
(x
1
, x
2
) = +1/5.
Vocabulaire : Pour i dans N, un element de (A
i
) est appele strategie
mixte du joueur i dans G.
Pour a
i
dans A
i
, on assimile a
i
` a la probabilite qui donne probabilite 1 ` a
laction a
i
. Ainsi confondra-ton a
i
et la mesure de Dirac :
a
i = (x
i
(b
i
))
b
i
A
i
dans (A
i
), o` u x
i
(a
i
) = 1 et pour tout b
i
= a
i
, x
i
(b
i
) = 0. (Du coup, on
pourra noter 2/3 H + 1/3 B la strategie mixte qui joue H avec probabilite
2/3 et B avec probabilite 1/3.) Par opposition avec les autres probabilites,
a
i
A
i
sappelle une strategie pure du joueur i. Une strategie pure est donc
un cas particulier de strategie mixte. Si a = (a
i
)
iN
est un prol de strategies
pures dans A, on a bien g
i
(a) = g
i
(a) pour tout i.
Remarquons que toute strategie mixte x
i
= (x
i
(a
i
))
a
i
A
i peut mainte-
nant secrire : x
i
=

a
i
A
i
x
i
(a
i
)a
i
. Comme x
i
(a
i
) 0 pour tout a
i
et que

a
i
A
i
x
i
(a
i
) = 1, la strategie mixte x
i
est combinaison convexe des strategies
pures du joueur i. En fait, lensemble (A
i
) des strategies mixtes du joueur
i est lenveloppe convexe de lensemble A
i
des strategies pures du joueur i,
cest-` a-dire que (A
i
) est le plus petit ensemble de IR
A
i
qui soit convexe et
qui contienne tous les elements de A
i
.
La formule elementaire suivante, obtenue en conditionnant le paiement
du joueur i par la variable aleatoire de sa propre action dans A
i
, va nous etre
utile par la suite.
Lemme 1.4.3. Soit i un joueur dans N, et soit (x
1
, ..., x
n
) dans (A
1
)
... (A
n
) un prol de strategies mixtes. On a :
g
i
(x) =

a
i
A
i
x
i
(a
i
) g
i
(a
i
, x
i
).

26 Notes de cours Jeux sous forme strategique 2007-2008


Preuve :
g
i
(x) =

(a
1
,...,a
n
)A
x
1
(a
1
)...x
n
(a
n
) g
i
(a
1
, ..., a
n
)
=

a
i
A
i
x
i
(a
i
)

a
i
A
i
x
1
(a
1
)...x
i1
(a
i1
)x
i+1
(a
i+1
)...x
n
(a
n
) g
i
(a
1
, ..., a
n
)
=

a
i
A
i
x
i
(a
i
) g
i
(a
i
, x
i
)
Rappelons que si a = (a
i
)
iN
est un prol de strategies pures dans A, on
a bien g
i
(a) = g
i
(a) pour tout i.
Lemme 1.4.4. Un equilibre de Nash en strategies pures reste un equilibre
de Nash en strategies mixtes.
Formellement, si a A est un equilibre de Nash de G, alors lelement a,
vu comme un prol de strategies mixtes, est un equilibre de Nash de

G.
Preuve : Soit a = (a
1
, ..., a
n
) un equilibre de Nash de G. Soient i dans N et
x
i
= (x
i
(b
i
))
b
i
A
i dans (A
i
). On a : g
i
(x
i
, a
i
) =

b
i
A
i
x
i
(b
i
)g
i
(b
i
, a
i
)

b
i
A
i
x
i
(b
i
)g
i
(a
i
, a
i
) = 1g
i
(a) = g
i
(a). Donc a
i
est meilleure reponse contre
a
i
pour le joueur i dans

G. Ceci etant vrai pour tout joueur i, a est un
equilibre de Nash de

G.
Le theor`eme suivant, qui ne concerne que les jeux nis, est tr`es important.
Theor`eme 1.4.5. (de Nash) Dans un jeu ni, il existe un equilibre de Nash
en strategies mixtes. De plus, lensemble des equilibres de Nash en strategies
mixtes, ainsi que lensemble des paiements de ces equilibres, sont des en-
sembles compacts.
Preuve : Nous allons appliquer le theor`eme de Glicksberg.
Soit i un joueur de N. (A
i
) est convexe compact non vide dans lespace
euclidien IR
A
i
. Lapplication g
i
est multilineaire, donc est continue. Fixons
x
i
dans

j=i
(A
j
), et notons h lapplication de (A
i
) dans IR telle que :
x
i
(A
i
), h(x
i
) = g
i
(x
1
, ..., x
i
, ..., x
n
) = g
i
(x
i
, x
i
).
h associe, ` a toute probabilite x
i
sur A
i
, le paiement du joueur i sil joue x
i
contre x
i
. Dapr`es le lemme 1.4.3, on a h(x
i
) =

a
i
A
i
x
i
(a
i
)h(a
i
), donc h
est ane donc concave donc quasi-concave.
Notes de cours Jeux sous forme strategique J. Renault 27
On peut donc appliquer le theor`eme de Glicksberg ` a

G et on obtient les
resultats voulus.
La proposition suivante sera utile en pratique pour calculer des equilibres
de Nash en strategies mixtes.
Proposition 1.4.6. Caracterisation des equilibres de Nash en strategies
mixtes
Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu ni, et x = (x
i
)
iN
dans

iN
(A
i
)
un prol de strategies mixtes. On a lequivalence suivante :
x est un equilibre de Nash en strategies mixtes de G

_
i N, a
i
A
i
t.q. x
i
(a
i
) > 0, g
i
(a
i
, x
i
) = max
b
i
A
i
g
i
(b
i
, x
i
)
_
.

Autrement dit, x est un equilibre de Nash de



G si et seulement si : les
strategies pures jouees avec probabilite > 0 par le joueur i sont toutes des
meilleures reponses contre la strategie des autres joueurs.
Preuve : Soit i un joueur. Supposons que les autres joueurs vont jouer selon
x
i
, et etudions les meilleures reponses du joueur i contre x
i
. Notons h,
comme dans la preuve du theor`eme de Nash, lapplication de (A
i
) dans IR
telle que :
y
i
(A
i
), h(y
i
) = g
i
(y
i
, x
i
) =

a
i
A
i
y
i
(a
i
)h(a
i
).
h est ane, et (A
i
) est lenveloppe convexe dun nombre ni de points.
Montrons dabord que le maximum de lapplication h est forcement atteint
en un point de A
i
. Notons = max
a
i
A
i h(a
i
). est le meilleur paiement
que peut obtenir le joueur i en jouant en strategies pures contre x
i
. On a :
y
i
(A
i
), h(y
i
) =

a
i
A
i
y
i
(a
i
)h(a
i
)

a
i
A
i
y
i
(a
i
) = . Donc contre
x
i
, le joueur i ne peut obtenir un paiement strictement plus grand que
meme sil utilise des strategies mixtes. Donc = max
y
i
(A
i
)
h(y
i
). Contre la
strategie x
i
, le joueur i a toujours une meilleure reponse en strategies pures.
28 Notes de cours Jeux sous forme strategique 2007-2008
De plus, soit y
i
une strategie mixte du joueur i. On a :
y
i
est meilleure reponse contre x
i
g
i
(y
i
, x
i
) = ,

a
i
A
i
y
i
(a
i
) g
i
(a
i
, x
i
) = ,

a
i
A
i
y
i
(a
i
)
_
g
i
(a
i
, x
i
)
_
= 0.
Or pour tout a
i
de A
i
, on a : y
i
(a
i
) 0 et g
i
(a
i
, x
i
) 0, donc le produit
y
i
(a
i
) ( g
i
(a
i
, x
i
) ) est negatif. Comme une somme de nombres negatifs
est nulle si et seulement si tous les termes de la somme sont nuls, on a :
y
i
est meilleure reponse contre x
i
a
i
A
i
, y
i
(a
i
)
_
g
i
(a
i
, x
i
)
_
= 0,
a
i
A
i
t.q. y
i
(a
i
) > 0, g
i
(a
i
, x
i
) = .
On obtient nalement que y
i
est meilleure reponse contre x
i
ssi y
i
est com-
binaison convexe des strategies pures qui sont meilleure reponses contre x
i
.
Comme, par denition, x est un equilibre de Nash si et seulement (pour
tout joueur i, x
i
est meilleure reponse contre x
i
), la proposition est demontree.

Remarque 1.4.7. Sur linterpretation des equilibres de Nash en strategies


mixtes.
Les probabilites ne representent pas forcement des lotteries que les joueurs
eectuent avant de jouer une action pure. Un equilibre en strategies mixtes
(x
1
, ..., x
n
) peut aussi representer une situation o` u :
- chaque joueur i a une croyance sur la strategie pure qui va etre employee
par les autres joueurs. Plus precisement, chaque joueur i estime laction que
va jouer un joueur j = i ` a laide de la probabilite x
j
. x
j
peut donc juste etre
une croyance, ou probabilite subjective, des autres joueurs sur ce que va faire
le joueur j. Il est important de remarquer que tous les joueurs i dierent de
j ont la meme croyance x
j
sur ce que va faire le joueur j (ce qui est loin
detre evident parfois).
- chaque joueur i joue (aleatoirement ou non, selon ce qui lui passe par
la tete ` a ce moment, de nimporte quelle fa con...) une strategie pure a
i
dans
A
i
qui soit optimale etant donne la croyance du joueur i, cest-` a-dire qui soit
meilleure reponse contre x
i
(voir la proposition 1.4.6).
Notes de cours Jeux sous forme strategique J. Renault 29
1.4.2 Elimination de strategies strictement dominees
par une strategie mixte
Revenons ` a lelimination des strategies strictement dominees. Fixons un
jeu ni G comme precedemment. Supposons que le joueur i ait une strategie
pure b
i
qui soit strictement dominee dans G, ou meme plus generalement
dans lextension mixte

G de G (voir apr`es la proposition 1.4.8 suivante). Il
existe donc une strategie mixte z
i
dans (A
i
) qui domine strictement b
i
, i.e.
qui verie : x
i

j=i
(A
j
), g
i
(z
i
, x
i
) > g
i
(b
i
, x
i
).
Montrons maintenant que toute strategie mixte x
i
dans (A
i
) qui joue b
i
avec probabilite strictement positive est egalement strictement dominee dans

G. Considerons donc x
i
dans (A
i
) telle que x
i
(b
i
) > 0. Lidee est de reporter
tout le poids que x
i
assigne ` a b
i
sur la strategie z
i
. Denissons precisement
y
i
= (y
i
(a
i
))
a
i
A
i avec : a
i
A
i
\{b
i
}, y
i
(a
i
) = x
i
(a
i
) + x
i
(b
i
)z
i
(a
i
) et
y
i
(b
i
) = x
i
(b
i
)z
i
(b
i
). Toutes les coordonnees de y
i
sont positives et il est
facile de voir que leur somme vaut 1, donc y
i
(A
i
). Soit maintenant un
element x
i
dans

j=i
(A
j
). On a :
g
i
(y
i
, x
i
) =
_

a
i
A
i
\{b
i
}
y
i
(a
i
) g
i
(a
i
, x
i
)
_
+y
i
(b
i
) g
i
(b
i
, x
i
)
=
_

a
i
A
i
\{b
i
}
x
i
(a
i
) g
i
(a
i
, x
i
)
_
+
_

a
i
A
i
\{b
i
}
x
i
(b
i
)z
i
(a
i
) g
i
(a
i
, x
i
)
_
+x
i
(b
i
)z
i
(b
i
) g
i
(b
i
, x
i
),
=
_

a
i
A
i
\{b
i
}
x
i
(a
i
) g
i
(a
i
, x
i
)
_
+x
i
(b
i
)
_
a
i
A
i
z
i
(a
i
) g
i
(a
i
, x
i
)
_
,
=
_

a
i
A
i
\{b
i
}
x
i
(a
i
) g
i
(a
i
, x
i
)
_
+x
i
(b
i
) g
i
(z
i
, x
i
).
Comme x
i
(b
i
) > 0 et g
i
(z
i
, x
i
) > g
i
(b
i
, x
i
), on a :
g
i
(y
i
, x
i
) >
_

a
i
A
i
\{b
i
}
x
i
(a
i
) g
i
(a
i
, x
i
)
_
+x
i
(b
i
) g
i
(b
i
, x
i
) = g
i
(x
i
, x
i
).
Donc x
i
est strictement dominee par y
i
. Par la proposition 1.3.12, pour
calculer les equilibres de Nash de

G on peut eliminer x
i
.
Supposons que lon veuille calculer les equilibres en strategies mixtes de
G. On peut enlever d`es le depart toutes les strategies mixtes qui jouent b
i
avec
probabilite strictement positive, donc pour calculer les equilibres de Nash en
strategies mixtes de G, on peut enlever purement et simplement laction pure
b
i
du jeu de depart G, puis considerer les equilibres en strategies mixtes du
jeu restreint ainsi obtenu. On vient donc de demontrer le resultat suivant.
Proposition 1.4.8. Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu ni sous forme
strategique. Soit i dans N et b
i
A
i
une strategie pure du joueur i qui soit
30 Notes de cours Jeux sous forme strategique 2007-2008
strictement dominee dans lextension mixte de G. Soit G

le jeu issu de G o` u
lon a supprime la strategie b
i
.
Alors lensemble des equilibres de Nash en strategies mixtes de G est egal
` a lensemble des equilibres de Nash en strategies mixtes de G

.
Notons que si b
i
est strictement dominee dans G, alors il existe a
i
dans
A
i
t.q. : a
i

j=i
A
j
, g
i
(a
i
, a
i
) > g
i
(b
i
, a
i
). Ceci implique, en passant
` a lesperance, que : x
i

j=i
(A
j
), g
i
(a
i
, x
i
) > g
i
(b
i
, x
i
). Et donc b
i
reste strictement dominee dans

G. La reciproque nest pas forcement vraie,
comme le montre lexemple suivant.
Exemple 9 :
g d
H
M
B
_
_
(3, 0) (0, 1)
(0, 0) (3, 1)
(1, 1) (1, 0)
_
_
Le joueur 1 na pas de strategie strictement dominee dans G. Mais dans
lextension mixte

G, la strategie pure B du joueur 1 est strictement dominee
par la strategie mixte
1
2
H +
1
2
M (car quoique joue joue le joueur 2, cette
strategie donne au joueur 1 un paiement espere de 3/2 qui est strictement
plus grand que le paiement 1 que donne la strategie B).
Par la consideration precedente, pour calculer les equilibres de Nash en
strategies mixtes de G on peut prealablement eliminer la strategie B. On
se retrouve alors avec le jeu suivant :
g d
H
M
_
(3, 0) (0, 1)
(0, 0) (3, 1)
_
. Dans ce
nouveau jeu, g est strictement dominee, donc on elimine g, et on obtient
facilement que : (M, d) est le seul equilibre de Nash en strategies (pures mais
aussi) mixtes du jeu de depart.
1.4.3 Generalisation de lextension mixte
Quand les ensembles de strategies pures ne sont pas nis (par exemple
egaux ` a lintervalle [0, 1], ou lensemble IN des entiers naturels), il peut
etre egalement pratique dintroduire la notion de strategie mixte. Soit G =
Notes de cours Jeux sous forme strategique J. Renault 31
(N, (A
i
)
iN
, (g
i
)
iN
) un jeu sous forme strategique, o` u N = {1, .., n}. On
suppose de plus que :
- chaque ensemble dactions A
i
est muni dune tribu A
i
.
- pour tout joueur i, lapplication g
i
: A IR est mesurable par
rapport ` a la tribu produit
iN
A
i
(i.e. que pour tout reel t, lensemble
{a A, g
i
(a) t} est dans
iN
A
i
) et bornee.
On peut alors denir lextension mixte de G comme le jeu :

G = (N, ((A
i
))
iN
, ( g
i
)
iN
) o` u :
- pour tout joueur i, (A
i
) est lensemble des probabilites sur (A
i
, A
i
)
(voire dans certains cas un sous-ensemble, ` a preciser, de ces probabilites),
- pour tout i de N, pour tout (x
1
, ..., x
n
) dans (A
1
) ... (A
n
), on a :
g
i
(x
1
, ..., x
n
) =
_
A
g
i
(a
1
, ..., a
n
)dx
1
(a
1
)...dx
n
(a
n
).
Remarquons que dans la formule precedente, lintegrale existe car g
i
est
bornee et on int`egre par rapport ` a des probabilites :
_
A
|g
i
(a
1
, ..., a
n
)|dx
1
(a
1
)...dx
n
(a
n
) (sup
aA
|g
i
(a)|)
_
A
dx
1
(a
1
)...dx
n
(a
n
) =
sup
aA
|g
i
(a)| < +.
On conclut maintenant le chapitre 1 en sinteressant ` a une classe tr`es
particuli`ere de jeux sous forme strategique.
1.5 Jeux `a somme nulle
Les jeux ` a somme nulle representent les interactions strategiques ` a deux
joueurs o` u le conit est total (on peut penser ` a des jeux de guerre, il ny
a pas de cooperation possible).
1.5.1 Denition, valeur et strategies optimales
Dans la denition suivante, le mot jeu doit sentendre comme jeu sous
forme strategique.
Denition 1.5.1. Un jeu ` a somme nulle est un jeu ` a deux joueurs tel que
la somme des fonctions de paiement est nulle.
32 Notes de cours Jeux sous forme strategique 2007-2008
Lexemple 3 (Matching Pennies) en est un. Pour simplier les notations,
on represente un jeu ` a somme nulle par un triplet (I, J, g) o` u :
- I est lensemble dactions du joueur 1,
- J est lensemble dactions du joueur 2,
- et g : I J IR est la fonction de paiement du joueur 1.
Rappelons linterpretation dun tel jeu. Simultanement, le J1 choisit i
dans I et le J2 choisit j dans J. Puis, le paiement du J1 est g(i, j), et celui
du J2 est g(i, j) (on peut se representer la situation en considerant que le
joueur 2 paie la somme, eventuellement negative, g(i, j) au joueur 1). Tout
ceci est connu des deux joueurs.
On represente un jeu ni ` a somme nulle par une matrice, o` u le joueur 1
choisit la ligne, le joueur 2 choisit la colonne, et les elements de la matrice
representent le paiement du joueur 1. Par exemple, le jeu Matching Pennies
peut se representer par la matrice :
_
1 1
1 1
_
.
Reciproquement, toute matrice reelle peut etre vue comme un jeu ` a somme
nulle.
Fixons dans la suite un jeu ` a somme nulle G = (I, J, g). Oublions pour
linstant tout ce qui prec`ede, et interessons-nous ` a la signication de lexpres-
sion bien jouer dans le jeu G. Le joueur 1 veut maximiser la fonction de
paiement g, mais cette fonction depend de deux variables i et j, et le joueur
1 ne contr ole que la variable i et pas la variable j. A loppose, le joueur 2
veut minimiser g, et contr ole j mais pas i.
Dans la suite, on emploie la notation classique IR = IR {, +}
(indiquons que certaines denitions autorisent lapplication g ` a prendre ses
valeurs dans IR, ici nous supposons que g est ` a valeurs dans IR).
Denition 1.5.2. Soit x dans IR. On dit que le joueur 1 garantit (ou force)
x dans G sil a une fa con de jouer qui lui assure un paiement au moins egal
` a x, i.e. si il existe i dans I tel que : j J, g(i, j) x.
Le J1 garantit toujours , et ne garantit jamais +. Soit maintenant
i dans I. Si le J1 joue laction i, il est certain davoir, quoi que joue le
J2, un paiement superieur ` a : inf
jJ
g(i, j) IR {} (rappelons que
Notes de cours Jeux sous forme strategique J. Renault 33
lon a inf
jJ
g(i, j) IR si lensemble {g(i, j), j J} est minore, et on a
inf
jJ
g(i, j) = sinon). Donc le J1 garantit inf
jJ
g(i, j).
Denition 1.5.3. On denit lelement suivant de IR :
= sup
iI
inf
jJ
g(i, j).

Dans Matching Pennies, quoique fasse le J1 le J2 a une reponse qui am`ene


au paiement -1 pour le J1, donc dans ce jeu = 1. Considerons maintenant
le jeu
_
1 1
2 0
_
. Si le J1 joue en haut, son paiement sera -1 au pire, et
sil joue en bas son paiement sera -2 au pire. Donc on a aussi ici = 1.
En general, si < + alors pour tout > 0, le J1 garantit . (Si
= +, alors pour tout reel x le J1 a une fa con de jouer qui lui assure au
moins x, et la vie est belle pour le joueur 1 ; par contre si = , alors on
a inf
jJ
g(i, j) = pour tout i de I, et le joueur 1 ne garantit aucun reel).
Considerons maintenant le joueur 2.
Denition 1.5.4.
Soit x dans IR. On dit que le joueur 2 garantit (ou force) x dans G sil a
une fa con de jouer qui assure que le paiement du J1 sera au plus x, i.e. si il
existe j dans J tel que : i I, g(i, j) x.
On denit lelement suivant de IR :
= inf
jJ
sup
iI
g(i, j).

Le J2 garantit toujours +, et ne garantit jamais . En jouant une


action j dans J, le J2 est s ur que le paiement du J1 va etre inferieur ` a
sup
iI
g(i, j) (et donc que son propre paiement sera superieur ` a sup
iI
g(i, j)),
donc le J2 garantit sup
iI
g(i, j). Si > , alors pour tout > 0 le J2
garantit +. Dans Matching Pennies, on a = 1. Dans le jeu
_
1 1
2 0
_
,
on a = 0.
34 Notes de cours Jeux sous forme strategique 2007-2008
Lemme 1.5.5.
.
Preuve : Pour tous i dans I et j dans J, on a : g(i, j) inf
j

J
g(i, j

). En
prenant le sup en i de chaque c ote, on obtient que pour tout j de J, on a :
sup
iI
g(i, j) . En prenant maintenant linf en j, on arrive ` a : .
Remarque 1.5.6. Modions, dans cette remarque uniquement, les r`egles du
jeu.
Considerons une premi`ere variante du jeu o` u : le joueur 1 choisit i dans
I en premier, annonce i au joueur 2 puis ce dernier choisit j dans J et
paye g(i, j) au joueur 1. Dans ce nouveau jeu, il est naturel que lissue
rationnelle de linteraction corresponde ` a . Considerons maintenant une
seconde variante du jeu o` u ` a linverse, cest le J2 qui joue en premier :
le J2 choisit et annonce j dans J au joueur 1, puis celui-ci choisit i dans
I et gagne g(i, j). Alors lissue rationnelle de cette deuxi`eme variante est
naturellement .
Le lemme 1.5.5 indique que le J1 preferera la seconde variante, et que
le J2 preferera la premi`ere variante. Dans un jeu ` a somme nulle, un joueur
pref`ere savoir laction de son adversaire avant de jouer, ce qui est assez
intuitif. On revient dans ce qui suit ` a linterpretation o` u les joueurs jouent
simultanement.
La denition suivante exprime le concept de solution communement adopte
pour les jeux ` a somme nulle.
Denition 1.5.7. On dit que le jeu ` a somme nulle G = (I, J, g) a une valeur
si = , cest-` a-dire si :
sup
iI
inf
jJ
g(i, j) = inf
jJ
sup
iI
g(i, j).
Dans ce cas, le nombre = est appele valeur du jeu G, et on la note
souvent v = = .
Supposons que G a une valeur v. Alors v represente lissue rationnelle
du jeu, au sens de la somme equitable que le J1 devrait payer au J2 pour
pouvoir jouer le jeu. v correspond donc au prix du jeu G. Le J1 garantit
v, le J2 garantit v, et donc on a si v est reel :
> 0, i I, j J, g(i, j) v ,
> 0, j J, i I, g(i, j) v +.
Notes de cours Jeux sous forme strategique J. Renault 35
Denition 1.5.8. Supposons que G a une valeur v.
Une strategie i dans I qui verie : j J, g(i, j) v est appelee strategie
optimale du joueur 1 dans G.
Une strategie j dans J qui verie : i I, g(i, j) v est appelee strategie
optimale du joueur 2 dans G.
Exemple 10 : Soit le jeu ` a somme nulle G = (IN, IN, g), o` u pour tout couple
(i, j) de IN IN, g(i, j) = 1/(j + 1). Le paiement ne depend donc pas de
laction jouee par le J1. On a = 0 = , donc le jeu a une valeur qui est 0.
Toutes les strategies du joueur 1 sont optimales ici, et le joueur 2 na aucune
strategie optimale.
Remarquons rapidement quil est possible que le jeu ait une valeur v qui ne
soit pas un reel, mais qui vaille + ou . v = + signie que pour toute
valeur reelle M, le J1 garantit M, soit : M IR, i I, j J, g(i, j) M.
De meme, v = signie : M IR, j J, i I, g(i, j) M. Dans ces
cas o` u |v| = , aucun joueur na de strategie optimale car nous avons suppose
que g etait une fonction ` a valeurs dans IR. On nattachera pas beaucoup
dimportance ici ` a ces cas dexistence dune valeur non reelle. Quand G est
un jeu ni, ou lextension mixte dun jeu ni, alors lapplication g est bornee
et il est donc impossible davoir |v| = +.
Notation 1.5.9. On note O
1
(resp. O
2
) lensemble des strategies optimales
du joueur 1 (resp. joueur 2) dans G. Si G na pas de valeur, aucun joueur na
de strategie optimale, et donc on pose O
1
= O
2
= .
O
1
I et O
2
J. Lidee est que si G a une valeur et quun joueur a des
strategies optimales dans G, bien jouer pour ce joueur signie jouer une
de ses strategies optimales.
1.5.2 Lien avec les equilibres de Nash et Theor`eme du
MinMax
Noublions pas que le jeu ` a somme nulle G = (I, J, g) nest ` a lorigine
rien dautre quun jeu sous forme strategique particulier. On peut donc aussi
considerer les notions denies precedemment pour de tels jeux. Notons EN
le sous-ensemble de I J constitue des equilibres de Nash de G. Le lien
eblouissant entre equilibres de Nash et strategies optimales est le suivant.
36 Notes de cours Jeux sous forme strategique 2007-2008
Proposition 1.5.10.
O
1
O
2
= EN.
De plus, les trois conditions suivantes sont equivalentes.
1) Il existe un equilibre de Nash de G.
2) G a une valeur, et chaque joueur a des strategies optimales.
3) Il existe un reel v tel que : (i I, j J, g(i, j) v) et (j J, i
I, g(i, j) v).
Enn, si ces conditions sont veriees, v est la valeur de G et lensemble
des paiements dequilibre de Nash de G est reduit au singleton {v, v}.
Preuve :
Soit (i, j) dans O
1
O
2
. Alors O
1
O
2
nest pas vide, donc forcement
le jeu a une valeur v, et on a : i

I, g(i

, j) v g(i, j

) j

J. Donc
g(i, j) v g(i, j), do` u g(i, j) = v. Donc on a : i

I, g(i

, j) g(i, j)
g(i, j

) j

J, ce qui signie que (i, j) est un equilibre de Nash de G.


Reciproquement, soit (i, j) un equilibre de Nash de G. On a : i

I, j


J, g(i

, j) g(i, j) g(i, j

). Donc sup
i

I
g(i

, j) = g(i, j) = inf
j

J
g(i, j

).
Comme sup
i

I
g(i

, j) et que inf
j

J
g(i, j

) , on obtient g(i, j)
. Comme dapr`es le lemme 1.5.5 on a toujours , alors = = g(i, j),
G a une valeur qui est g(i, j), et (x, y) est dans O
1
O
2
.
Ceci ach`eve la demonstration de O
1
O
2
= EN. La condition 1) signi-
e EN = , et la condition 2) signie O
1
O
2
= , donc 1) et 2) sont
equivalentes. 2) implique 3) est clair. Si 3) est verie, on montre facilement
que le couple (i, j) obtenu par les quanticateurs est un equilibre de Nash
de G, donc 3) implique 1). 1), 2) et 3) sont donc equivalentes.
Si ces conditions sont veriees, alors il existe un paiement dequilibre de
Nash, et pour tout equilibre de Nash (i, j) on a g(i, j) = v, donc le paiement
dun equilibre de Nash est v pour le joueur 1 et v pour le joueur 2, soit le
couple (v, v).
Rappelons que tout jeu ni admet un equilibre de Nash en strategies
mixtes. On peut en deduire le resultat suivant, qui implique que lon peut
associer ` a toute matrice un nombre reel appele la valeur de cette matrice.
Theor`eme 1.5.11. Theor`eme du Minmax de Von Neumann
Soit G = (I, J, g) un jeu ` a somme nulle ni. Alors lextension mixte de G
a une valeur, et les deux joueurs y ont des strategies optimales. On a :
min
y(J)
max
x(I)
g(x, y) = max
x(I)
min
y(J)
g(x, y).
Notes de cours Jeux sous forme strategique J. Renault 37

Preuve : Par le theor`eme 1.4.5 de Nash, lextension mixte



G de G a un
equilibre de Nash.

G etant encore un jeu ` a somme nulle, en appliquant la
proposition precedente, on obtient quil a une valeur et que les deux joueurs
y ont des strategies optimales. On a donc en particulier :
inf
y(J)
sup
x(I)
g(x, y) = sup
x(I)
inf
y(J)
g(x, y).
Comme g est continue et que (I) et (J) sont compacts, les sup sont des
max et les inf sont des min.
Indiquons quhistoriquement le theor`eme du Minimax a ete demontre
avant le theor`eme de Nash, et quil est tout ` a fait possible den ecrire une
demonstration directe sans faire appel du tout aux theor`emes de point xe
de type Brouwer et Kakutani. Donnons pour conclure un exemple de jeu
` a somme nulle sans valeur (et prendre des strategies mixtes ny changerait
rien).
Exemple 11 : Soit G = (I, J, g) le jeu ` a somme nulle o` u : I = J = IN, et
o` u pour tout couple dentiers naturels (i, j) :
g(i, j) =
_
1 si i j
1 si i < j
On a = 1 et = 1, donc le jeu na pas de valeur. Dans ce jeu, chaque
joueur doit choisir un entier naturel et celui qui choisit le plus grand a gagne.
On peut considerer que bien jouer ne signie rien ici.
38 Notes de cours Jeux sous forme strategique 2007-2008
1.6 Exercices sur le Chapitre 1
1.6.1 Strategies dominantes
Exercice 1.
Une assemblee composee de 99 membres doit voter ` a la majorite pour
choisir entre deux projets : a et b. Chaque membre i {1, ..., 99} est dote
dune fonction dutilite u
i
: {a, b} {0, 1} supposee bijective. Pour voter,
chacun ecrit a ou b sur un bulletin secret. Le projet remportant la majorite
des surages est adopte.
1- Ecrire le jeu sous forme strategique associe et montrer que voter pour
le projet que lon pref`ere est une strategie dominante.
2- Il y a maintenant 3 votants et 3 projets a, b, c. On suppose u
1
(a) =
u
2
(b) = u
3
(c) = 2, u
1
(b) = u
2
(c) = u
3
(b) = 1, u
1
(c) = u
2
(a) = u
3
(a) = 0.
Pour voter, chacun ecrit a, b ou c sur un bulletin secret. Le projet remportant
la majorite des surages est adopte (si chaque projet re coit un vote, aucun
projet nest realise et lutilite de chacun vaut 0). Y a til un equilibre en
strategies dominantes ?
Exercice 2. Ench`eres au second prix sous plis scelles
Un bien est mis aux ench`eres. Il y a n acheteurs potentiels numerotes
de 1 ` a n. La procedure dench`eres est la suivante : chaque acheteur soumet
une ore ecrite sous pli scelle. Tous les plis sont transmis ` a un commissaire
priseur. Lacheteur ayant soumis lore la plus haute emporte le bien et paye
un prix egal ` a la seconde plus haute ore (en cas de gagants ex-aequo, le
joueur de plus petit numero parmi les gagnants ach`ete lobjet au prix le plus
haut).
Chaque acheteur i a une valuation v
i
dans IR
+
, qui represente la somme
` a laquelle il evalue le bien. Sil ach`ete le bien au prix p, son utilite est v
i
p.
Sil ne lach`ete pas, son utilite est nulle.
Modeliser cette situation par un jeu sous forme strategique. Montrer
quorir sa propre valuation est une strategie dominante.
1.6.2 Equilibres de Nash
Exercice 3.
Notes de cours Jeux sous forme strategique J. Renault 39
Calculer les equilibres de Nash (en strategies pures) du jeu ` a trois joueurs
suivant (le joueur 1 choisit la ligne, le joueur 2 la colonne, le joueur 3 la
matrice, la 1`ere composante donne le paiement du joueur 1, la 2nde celui du
joueur 2, la 3`eme celui du joueur 3).
G D G D
H
B
_
(0, 0, 0) (0, 1, 1)
(2, 2, 2) (1, 3, 4)
_ _
(8, 4, 2) (7, 7, 2)
(9, 2, 5) (10, 1, 0)
_
O E
Exercice 4.
Calculer les equilibres de Nash en strategies pures du jeu ` a trois joueurs
suivant (le joueur 1 choisit la ligne, le joueur 2 la colonne, le joueur 3 la
matrice, la 1`ere composante donne le paiement du joueur 1, la 2nde celui du
joueur 2, la 3`eme celui du joueur 3).
G D G D
H
B
_
(1, 0, 1) (1, 1, 1)
(2, 0, 3) (5, 1, 4)
_ _
(6, 4, 1) (1, 2, 3)
(8, 0, 2) (0, 0, 0)
_
O E
Exercice 5. Duopole de Cournot
Deux entreprises produisent le meme bien ` a un co ut de production mar-
ginal constant egal ` a c ]0, 1[. Si le prix du bien est p, la demande est
D(p) = 1 p.
Simultanement chaque entreprise i {1, 2} choisit la quantite q
i
0
quelle produit. Le marche egalise lore et la demande et le prix setablit
alors ` a p = 1 (q
1
+ q
2
). Chaque entreprise i vend alors la quantite q
i
de
bien au prix p. Chaque entreprise cherche ` a maximiser son prot.
Ecrire le jeu sous forme strategique associe. Montrer quil existe un unique
equilibre de Nash.
Exercice 6. Calculer dans chaque cas les equilibres de Nash du jeu
G = (N, (A
i
)
iN
, (g
i
)
iN
), o` u N = {1, 2}, A
1
= A
2
= [0, 1], et (x represente
la strategie du joueur 1, y celle du joueur 2) :
a) g
1
(x, y) = 5xy x y + 2 ; g
2
(x, y) = 5xy 3x 3y + 5.
b) g
1
(x, y) = 2x
2
+ 7y
2
+ 4xy ; g
2
(x, y) = (x +y 1)
2
.
c) g
1
(x, y) = 2x
2
+ 7y
2
+ 4xy ; g
2
(x, y) = (x y)
2
.
40 Notes de cours Jeux sous forme strategique 2007-2008
Exercice 7.
Un groupe de n pecheurs exploite un lac contenant une quantite de pois-
son consideree comme innie. Si chaque pecheur i prend une quantite x
i
0,
le prix unitaire du poisson setablit ` a p = max(1

n
i=1
x
i
, 0). Chaque pecheur
vend toute sa production au prix p et cherche ` a maximiser son revenu (le co ut
de production est suppose nul).
1- Ecrire le revenu du pecheur i en fonction de (x
1
, ..., x
n
).
2- Calculer la correspondance de meilleure reponse, les equilibres de Nash
et le revenu total ` a chaque equilibre.
3- Etudier le cas du monopole (n = 1) et comparer.
Exercice 8.
Soit G = (N, (A
i
)
iN
, (g
i
)
iN
) un jeu ` a deux joueurs symetrique, cest-` a-
dire tel que : N = {1, 2}, A
1
= A
2
note X, et (x
1
, x
2
) XX, g
1
(x
1
, x
2
) =
g
2
(x
2
, x
1
).
On suppose que X est un convexe compact de IR
n
, que g
1
est continue
et que pour tout x
2
dans X, lapplication qui ` a x
1
associe g
1
(x
1
, x
2
) est
quasiconcave.
Montrer quil existe un equilibre symetrique, i.e. quil existe un element
x

de X tel que (x

, x

) soit un equilibre de Nash de G. (On pourra poser


D = {(x
1
, x
2
) X X, x
1
= x
2
} et appliquer le theor`eme de Kakutani ` a
une correspondance bien choisie de D dans D).
Exercice 9.
Deux entreprises A et B, situees dans une meme ville, produisent le meme
bien. Le co ut unitaire de production de chaque entreprise vaut 1/2. Chaque
entreprise doit xer un prix de vente unitaire, p
A
pour lentreprise A et p
B
pour lentreprise B.
La ville est composee dun continu de consommateurs. Chaque consom-
mateur ach`ete une unite du bien ` a une et une seule des deux entreprises.
Lensemble des consommateurs est situe uniformement dans la ville, qui
est lineaire et representee par le segment [0,1].
Notes de cours Jeux sous forme strategique J. Renault 41
Ville
0 1 x
entreprise A entreprise B consommateur x
c c c
Lentreprise A se situe ` a lextremite ouest (point dabscisse 0) de la ville,
lentreprise B se situe ` a lextremite est (point dabscisse 1) de la ville.
Chaque consommateur subit un co ut de transport lineaire : se deplacer
dune distance y co ute y/2. Ainsi, si un consommateur habitant au point
x [0, 1] ach`ete ` a lentreprise A, il per coit un co ut de p
A
+x/2, et sil ach`ete
` a lentreprise B, il per coit un co ut de p
B
+
1x
2
. Chaque consommateur ach`ete
son bien en choisissant lentreprise dont le prix per cu est le plus bas.
On etudie le jeu o` u chaque entreprise choisit son prix de vente dans
[1/2, +[, et vend aux consommateurs qui se presentent chez elle. Pour
simplier, on consid`ere que le nombre dhabitant de la ville est 1 (lunite
pouvant etre par exemple le million), et donc si 3/4 de la population ach`ete
` a lentreprise A, son prot est 3/4(p
A
1/2) (celui de lentreprise B sera alors
de 1/4(p
B
1/2) car 1/4 de la population ach`ete ` a B). Chaque entreprise
veut maximiser son prot. On note g
A
la fonction de paiement de lentreprise
A, et g
B
celle de lentreprise B.
A) Calcul des fonctions de paiements
Soient p
A
et p
B
dans [1/2, +[ les prix xes par les entreprises.
A1. Soit un consommateur situe en x [0, 1]. Montrer que si x > 1/2 +
p
B
p
A
, le consommateur ach`ete ` a la rme B. Montrer que si x < 1/2 +
p
B
p
A
, le consommateur ach`ete ` a la rme A.
A2. Montrer que si p
B
p
A
> 1/2, on a g
A
(p
A
, p
B
) = p
A
1/2 et
g
B
(p
A
, p
B
) = 0. Calculer g
A
(p
A
, p
B
) et g
B
(p
A
, p
B
) dans le cas o` u p
A
p
B
>
1/2.
A3. On suppose p
B
p
A
[1/2, +1/2]. Montrer que :
g
A
(p
A
, p
B
) = (1/2+p
B
p
A
)(p
A
1/2) et g
B
(p
A
, p
B
) = (1/2+p
A
p
B
)(p
B
1/2).
B) Calcul des meilleures reponses
42 Notes de cours Jeux sous forme strategique 2007-2008
Fixons le prix p
B
de lentreprise B. Montrer que la meilleure reponse de
lentreprise A est de xer un prix p
A
tel que (on pourra faire 3 cas, selon que
p
B
[1/2, 1], p
B
[1, 2] ou p
B
2) :
p
A
=
1+p
B
2
si p
B
2, p
A
= p
B
1/2 si p
B
2.
Enoncer la meilleure reponse de lentreprise B au prix de lentreprise A
(par symetrie, il est inutile de refaire les calculs).
C) Calculer le ou les equilibres de Nash du jeu, et les paiements associes.
1.6.3 Strategies Mixtes
Exercice 10. Pour chacun des jeux suivants, calculer les equilibres de Nash
en strategies mixtes, ainsi que les paiements dequilibre de Nash en strategies
mixtes.
10.a)
G D
H
B
_
(1, 2) (0, 0)
(0, 0) (2, 1)
_
10.b)
G D
H
B
_
(6, 6) (2, 7)
(7, 2) (0, 0)
_
10.c)
G D
H
B
_
(5, 4) (3, 3)
(3, 3) (7, 8)
_
10.d)
G D
H
B
_
(2, 2) (1, 1)
(3, 3) (4, 4)
_
10.e)
G D
H
B
_
(1, 0) (2, 1)
(1, 1) (0, 0)
_
Notes de cours Jeux sous forme strategique J. Renault 43
10.f)
g m d
H
M
B
_
_
(1, 1) (0, 0) (8, 0)
(0, 0) (4, 4) (0, 0)
(0, 8) (0, 0) (6, 6)
_
_
10.g)
G D G D
H
B
_
(1, 1, 1) (0, 0, 0)
(0, 0, 0) (0, 0, 0)
_ _
(0, 0, 0) (0, 0, 0)
(0, 0, 0) (1, 1, 1)
_
O E
1.6.4 Valeurs de jeux matriciels
Exercice 11.
Calculer les valeurs (en strategies mixtes) des jeux ` a somme nulle representes
par les matrices suivantes. Donner egalement dans chaque cas les ensembles
de strategies mixtes optimales.
_
1 2
0 3
_
,
_
3 2
5 0
_
,
_
1 1
2 0
_
, et
_
_
_
_
3 1
0 0
2 4
7 2
_
_
_
_
.
Exercice 12. Soient a, b, c, et d quatre param`etres reels. Determiner en
fonction de a, b, c et d, la valeur en strategies mixtes de la matrice :
_
a b
c d
_
.
44 Notes de cours Jeux sous forme strategique 2007-2008
Quelques rappels
mathematiques
Les quelques rappels suivants ne constituent pas un cours, certaines no-
tions ne sont pas redenies et il ny a pas de demonstration. Ne pas hesiter
` a consulter un cours de premier cycle pour avoir des precisions.
1.7 Un peu dalg`ebre
1.7.1 Ensembles convexes
Soient E un espace vectoriel reel, et X un sous-ensemble de E.
On dit que X est convexe si et seulement si pour tous x et y dans X, le
segment qui joint x et y est inclus dans X. Plus formellement, X est convexe
si et seulement si : x X, y X, [0, 1], x + (1 )y X.
Une combinaison convexe de points de X est un vecteur z qui peut
secrire :
z =
K

k=1

k
x
k
,
o` u : K IN

,
1
,...,
K
sont des reels positifs t.q.

K
k=1

k
= 1 et x
1
,...,x
K
sont dans X. On dit aussi que z est un barycentre de points de X.
On montre que :
X est convexe si et seulement si toute combinaison convexe
de points de X est dans X,
les ensembles convexes de IR sont les intervalles de IR,
une intersection densemble convexe est convexe,
lensemble (notons le conv(X)) compose de toutes les combi-
naisons convexes de points de X est le plus petit ensemble convexe
45
46 Notes de cours Jeux sous forme strategique 2007-2008
contenant X, i.e. que conv(X) est convexe et que tout ensemble
convexe contenant X contient aussi conv(X). conv(X) sappelle
lenveloppe convexe de X.
Par exemple, si E = IR et X = {0, 1}, on a : conv(X) = [0, 1].
1.7.2 Applications anes, concaves et convexes
Soient X un sous-ensemble convexe dun espace vectoriel reel, et f une
application de X dans IR.
On dit que f est ane si :
x X, y X, [0, 1], f(x + (1 )y) = f(x) + (1 )f(y).
On dit que f est concave si :
x X, y X, [0, 1], f(x + (1 )y) f(x) + (1 )f(y).
On dit que f est convexe si :
x X, y X, [0, 1], f(x + (1 )y) f(x) + (1 )f(y).
On montre les proprietes suivantes :
f est ane si et seulement si f est ` a la fois convexe et
concave.
f est convexe si et seulement si f est concave.
f est concave si et seulement si lensemble {(x, y) X
IR, y f(x)}, appele hypographe de f, est un ensemble convexe.
Si f est concave, lensemble {x X, y X, f(x) f(y)}
est un ensemble convexe.
1.8 Un peu danalyse
1.8.1 Ordre sur IR et IR
On note IR = IR {, +}, et on a, x IR : < x < +,
x + (+) = (+) +x = +, et x + () = () +x = .
Soit X un sous-ensemble de IR. On dit que X est majore si : M IR
t.q. : x X, x M.
Si X est non vide et majore, on denit la borne superieure de X, notee
sup X, comme le plus petit des majorants de X. sup x est lunique reel a t.q. :
1) x X, x a, et 2) > 0, x X, x > a . Dans le cas eventuel o` u
Notes de cours Jeux sous forme strategique J. Renault 47
a = sup X appartient ` a X, on dit que a est le maximum de X, et on note
a = max X = sup X.
Si X est non vide mais non majore, on note sup X = . Si X est vide,
on note sup X = .
An de prendre en compte les sous-ensembles de IR, on pose naturelle-
ment : sup(X {+}) = +, et sup(X {}) = sup X.
On denit de fa con analogue la borne inferieure de X, notee inf(X). On
a toujours inf(X) = sup(X) IR, o` u X = {x, x X}.
1.8.2 Espace Euclidien et topologie
Un espace vectoriel reel de dimension nie sappelle un espace Euclidien.
Pour n dans IN

, cest le cas par exemple de lensemble IR


n
= {(x
1
, ..., x
n
), i
{1, ..., n}, x
i
IR}.
Fixons un espace Euclidien E. On montre que toutes les normes de E sont
equivalentes. Les notions douverts, fermes, continuite ne dependent donc pas
de la norme ., que lon peut donc choisir comme on veut.
On dit que X est un ferme de E si toute limite de points de X est dans X,
i.e. si : etant donne nimporte quelle suite (x
n
)
n
de points de X qui converge
vers une limite l E, alors l X.
On dit que X est borne si il existe M dans IR t.q. : x X, x M.
Dans un espace Euclidien, on a le resultat important suivant : X est un
ensemble compact si et seulement si X est ferme et borne.
Si X est compact et que Aest un sous-ensemble de X, on a lequivalence :
A est compact si et seulement si A est ferme dans X.
On montre que limage dun compact par une application continue est
un ensemble compact. En particulier, soient X un ensemble compact non
vide, et f : X IR une application continue. Alors f(X) est un compact
de IR, et en particulier max{f(x), x X} et min{f(x), x X} existent.
1.9 Un peu de probabilites
1.9.1 Tribu et probabilite
Soit un ensemble. On note P() lensemble des parties de , P() est
lensemble qui contient toutes les parties de .
48 Notes de cours Jeux sous forme strategique 2007-2008
Une tribu sur est un ensemble A inclus dans P() t.q. : 1) A, 2)
si A est dans A, alors le complementaire de A dans est aussi dans A, et 3)
si (A
n
)
nIN
est une suite delements de A, alors lunion de tous les A
n
, pour
n dans IN, est aussi dans A. Par exemple, lensemble P() est une tribu sur
.
Etant donnes un ensemble et une tribu A sur , une probabilite P sur
(, A) est une application P de A dans [0, 1] telle que : 1) P() = 1, et 2) si
(A
n
)
nIN
est une suite delements de A qui sont deux ` a deux disjoints, alors
P(
nIN
A
n
) =

nIN
P(A
n
).
Lorsque = {
1
, ...,
K
} est un ensemble ni, il est sous-entendu, sauf
mention contraire, que est muni de la tribu P(). Se donner une probabilite
sur revient alors tout simplement ` a se donner un vecteur de K reels positifs
(p(
1
), ..., p(
K
)) tel que

K
k=1
p(
k
) = 1.
1.9.2 Tribu et probabilite produits
Soient
1
et
2
deux ensembles respectivement munis des tribus A
1
et
A
2
. Notons =
1

2
= {(
1
,
2
),
1

1
,
2

2
}.
On monte quil existe une plus petite (au sens de linclusion) tribu sur
qui contienne tous les ensembles du type : A
1
A
2
, o` u A
1
A
1
et A
2
A
2
.
On la note A
1
A
2
, et on lappelle la tribu produit de (A
1
, A
2
).
Etant donnees une probabilite P
1
sur (
1
, A
1
), et une probabilite P
2
sur
(
2
, A
2
), on denit la probabilite produit P
1
P
2
comme lunique probabilite
sur (, A
1
A
2
) qui verie :
A
1
A
1
, A
2
A
2
, P
1
P
2
(A
1
A
2
) = P
1
(A
1
)P
2
(A
2
).
Pour calculer la probabilite sous P
1
P
2
dun rectangle A
1
A
2
, il sut de
multiplier les probabilites de A
1
(sous P
1
) et de A
2
(sous P
2
). On appelle P
1

P
2
la probabilite produit de (P
1
, P
2
), elle represente la probabilite obtenue
quand on choisit
1
dans
1
et
2
dans
2
, ces choix etant independants.
Lexistence et lunicite de P
1
P
2
ne sont pas immediates et se demontrent
dans un cours de probabilite. On peut ensuite facilement generaliser cette
construction ` a un produit ni de tribu A
1
... A
K
et de probabilites
P
1
... P
K
.