Académique Documents
Professionnel Documents
Culture Documents
ECONOMIQUES 2
Géraldine FROGER
geraldine.froger@univ-tlse2
Sommaire
INTRODUCTION GENERALE .......................................................................................................... 2
A) Deux principes d’un jeu : la rationalité et les interactions stratégiques .......................... 2
B) Historique de la théorie des jeux ................................................................................................... 3
C) Comment « modéliser » un jeu ? Présentation de quelques repères ................................. 3
D) La nature de l’information : quelques repères ......................................................................... 5
CHAPITRE I : ANALYSE DE JEUX SIMULTANES OU STATIQUES EN INFORMATION
COMPLETE ......................................................................................................................................... 6
Section 1- Les formes de représentation des jeux statiques ...................................................... 6
1.1- Représentation stratégique (ou normale) ............................................................................................ 6
1.2- Représentation extensive (arborescente) ............................................................................................. 7
Section 2- Les concepts d’équilibre pour les jeux statiques ...................................................... 8
2.1- La méthode d’élimination des stratégies dominées (MESD) => équilibre avec
élimination des stratégies dominées (équilibre avec ESD) .................................................................... 8
2.2- La méthode de Nash => équilibre de Nash ........................................................................................ 11
2.3- Stratégies de sécurité => équilibre avec stratégie de sécurité (SS) ........................................ 13
2.4- Problèmes associés aux différentes méthodes de détermination de solution en jeux
statiques/simultanés ............................................................................................................................................ 14
Section 3- Stratégies mixtes et équilibre en stratégie mixte .......... Erreur ! Signet non défini.
CHAPITRE II : LES JEUX DYNAMIQUES EN INFORMATION COMPLETE ........................ 17
Section 1- Les formes de représentation des jeux dynamiques .............................................. 17
1.1- Représentation extensive ou arborescente ................................................................................... 17
1.2- Représentation normale ou stratégique ou statique ................................................................ 18
Section 2- Les concepts d’équilibre .................................................................................................. 20
2.1- Equilibre de Nash (forme stratégique) ........................................................................................... 20
2.2- Equilibre parfait en sous-jeux (EPSJ) (forme extensive) ................................................... 21
2.3- Méthode d’Elimination des Stratégies Dominées (MESD) et équilibre avec
élimination des stratégie dominées (ESD) .................................................................................................. 25
2.4- Stratégies de sécurité et solution d’un jeu dynamique ...................................................... 29
BIBLIOGRAPHIE PRINCIPALE ................................................................................................... 30
1
INTRODUCTION GENERALE
L’objectif de cette introduction est de donner des éléments fondamentaux sur la
philosophie, l’objet, la méthodologie de la théorie des jeux, et d’annoncer le plan du
cours. La théorie des jeux fait partie des théories économiques contemporaines, et
s’inscrit dans la « nouvelle micro-économie ». Certaines parties du cours sont en couleur,
il est vivement recommandé aux étudiants de se référer au cours mis en ligne par la SED.
La rationalité : les individus agissent en utilisant au mieux les ressources dont ils
disposent compte tenu des contraintes qu’ils subissent :
- l’individu rationnel (Homo Oeconomicus) est égoïste et tient compte uniquement
de son propre intérêt ;
- l’individu rationnel constitue une unité de décision autonome : son
comportement n’est pas déterminé par des habitudes sociales consciemment ou
inconsciemment assimilées. Son comportement est défini indépendamment de
toute contrainte macro-sociale. La définition de la rationalité est donc a-
historique ;
- l’individu rationnel est maximisateur ; il effectue des choix qui maximisent sa
satisfaction (utilité, profit, gains, etc.).
Au total, la théorie des jeux étudie la manière dont les individus rationnels règlent des
situations conflictuelles. Elle analyse la signification de l’hypothèse de rationalité
lorsque la satisfaction d’un individu est directement affectée par les décisions d’autres
individus. Et elle définit les conceptions des solutions afin de prédire les situations
auxquelles aboutissent les différentes configurations conflictuelles.
2
B) Historique de la théorie des jeux
Il existe deux approches possibles en théorie des jeux : (1) l’approche stratégique ou
non coopérative et (2) l’approche conditionnelle ou coopérative.
Par la suite, le cours ne portera que sur l’approche non coopérative (pour l’approche
coopérative, voir les ouvrages indiqués en bibliographie).
- Qui sont les joueurs ? La réponse à cette question implique d’identifier toutes les
parties impliquées et éventuellement d’en éliminer certaines. La théorie des jeux
3
s’applique à plusieurs joueurs qui peuvent être des individus, des consommateurs, des
collectivités territoriales, des firmes, etc. Par la suite, par souci de pédagogie, le cours
ne portera que sur les jeux à deux joueurs (pour les jeux à n-joueurs, voir les
ouvrages indiqués en bibliographie).
- Quelles sont les règles ? Pour répondre à cette question, il est notamment nécessaire
de connaître précisément l’ordre d’intervention des joueurs et l’information disponible
pour chacun (nous reviendrons sur la notion d’information à la fin de cette introduction,
cf. point D). Un jeu qui ne comporte pas d’ordre d’intervention est un jeu simultané ou
statique (les joueurs jouent de manière simultanée, cf. le jeu « chi-fu-mi » = pierre,
feuille, ciseaux). Un jeu qui comporte un ordre d’intervention (par exemple les échecs,
où les blancs commencent, puis les noirs…) est un jeu séquentiel ou dynamique.
- Quelles sont les actions (ou décisions ou choix) disponibles pour chaque joueur ?
Pour répondre à cette question, il importe de spécifier les actions dont disposent les
joueurs. Il convient aussi de spécifier les différentes stratégies (ou possibilités d’actions)
des joueurs. A ce stade, on va parler de stratégies pures (on verra plus tard dans le
chapitre 1, section 4,ce que sont les stratégies mixtes qui exigent qu’un joueur affecte
des probabilités à ses stratégies pures ; toutes les autres sections de ce cours ne portent
que sur les stratégies pures des joueurs). Une stratégie pure pour un joueur est un plan
de décisions qui définit l’ensemble des décisions que le joueur doit prendre. Dans un jeu
simultané, où chaque joueur ne prend qu’une décision, une stratégie comprend
évidemment une décision unique. Ce n’est pas dans les jeux dynamiques (ou du moins
c’est rarement le cas comme nous le verrons dans le chapitre 2).
Exemples :
(1) Jeu simultané (une seule étape) : pierre, feuille, ciseaux : trois actions possibles (en
cachant les mains derrière le dos, en jouant, chaque joueur ne peut sortir que le symbole
« pierre », ou « ciseau » ou « feuille »), et trois stratégies possibles « pierre » ou « feuille »
ou « ciseau »). Ici les actions se confondent avec les stratégies. Si le joueur 1 joue
« pierre » au moment où le joueur 2 joue « ciseaux », c’est le joueur 1 qui gagne (la pierre
écrase le ciseau) et le joueur 2 qui perd. Si le joueur 2 joue « ciseaux » au moment où le
joueur 1 joue « feuille », c’est le joueur 2 qui gagne puisque la « ciseau» coupe la
« feuille », etc. C’est un JSC.
(2) Jeu séquentiel (deux étapes) : le joueur 1 commence à jouer, à l’étape 1, il peut
déplacer soit une dame de 10 cases, soit un fou de 5 cases. Il dispose donc de deux
actions (« dame 10 cases » ou « fou 5 cases »). Le joueur 2 joue ensuite (étape 2, on ne
s’intéresse pas à ces actions ici). Le joueur 1 re-joue ensuite (étape 3), il peut déplacer
soit un pion de 2 cases, soit une tour de 3 cases, soit un cavalier. Il dispose donc ici de
trois actions (« pion 2 cases » ou « tour 3 cases » ou « cavalier »). Le jeu est ensuite
terminé. Si le joueur 1 dispose ici de deux actions à l’étape 1 et de trois actions à l’étape
3, il dispose au total de 6 stratégies (spécifiant une action possible à l’étape 1 et une
action possible à l’étape 3 puisque toute stratégie correspond à un plan d’actions ou à un
plan de décisions). Ces stratégies sont (« dame 3 cases »,« pion 2 cases »), (« dame 3
cases », « tour 3 cases »), (« dame 3 cases », « cavalier »), (« fou 5 cases », « pion 2
cases »), (« fou 5 cases », « tour 3 cases »), (« fou 5 cases », « cavalier »).
4
- Quels sont les gains (pertes) associés à chaque combinaison de stratégies ? Lorsque
l’on considère l’ensemble des joueurs (que ce soit en jeu simultané ou séquentiel) dans
un jeu, leurs interactions stratégiques débouchent sur des gains pour eux. Ces gains sont
donc associés à des combinaisons de stratégies (du joueur 1 et du joueur 2). Ces valeurs
peuvent aussi bien représenter des sommes d’argent que des niveaux d’utilité, de profit,
etc.
5
CHAPITRE I : ANALYSE DE JEUX SIMULTANES OU STATIQUES EN
INFORMATION COMPLETE
Les jeux simultanés ou statiques ne sont qu’à « un seul coup ». Nous allons d’abord nous
intéresser aux formes de représentations possibles de ces jeux avant d’analyser les
différentes méthodes qui permettent de trouver une issue, ou une solution, ou encore un
équilibre à ce type de jeux (résolution des interactions stratégiques qui est l’objet
principal de la théorie des jeux). Il s’agit d’analyser la portée et les limites de ces
méthodes (ou de l’équilibre associé) pour avoir un regard critique sur la portée de la
théorie des jeux comme « outil d’aide à la décision ».
Exemple : Une collectivité locale lance un appel d’offre pour faire des travaux
d’aménagement. L’appel d’offre se termine à la fin de l’année. Deux entreprises
(l’entreprise 1 et l’entreprise 2) transmettent leur offre (c’est-à-dire un devis pour la
travaux) au même moment (fin de l’année) et de manière indépendante. L’offre
comprend soit un devis élevé d’un million d’euros, soit un devis faible de 0,8 million
d’euros. L’entreprise qui fait l’offre la plus intéressante emporte le marché. Si les
entreprises font une offre identique, alors le marché sera divisé en deux.
Avec l’ensemble des données ci-dessus, nous pouvons établir la forme stratégique ou
statique, ou encore la matrice des paiements, de ce jeu ci-dessous :
E2
E F
E1 E (5, 5) (0, 8)
F (8, 0) (4, 4)
6
On pose 1= 100 000 €
Les préférences de l’E1 sont les suivantes : gagner le marché (GM) avec un devis faible
(DF) est préféré au partage du marché (½ M) avec un devis élevé (DE), qui est préféré au
partage du marché (½ M) avec un devis faible (DF), qui est préféré à la perte du marché
(PM)
ó U (GM avec DF) = 8 >U (½ M avec DE) = 5 >U (½ M avec DF) = 4 >U (PM) = 0
Il en est de même pour l’E2.
Selon l’hypothèse de connaissance commune : l’E1 connaît les décisions qu’elle peut
prendre, les décisions que peut prendre l’E2, ses propres gains et ceux de l’E2. Par
ailleurs, l’E2 sait que l’E1 dispose de l’ensemble de ces informations. De même, l’E1 sait
que l’E2 sait qu’elle (E1) dispose de l’ensemble de ces informations, etc. Le même
raisonnement s’applique en symétrique en commençant par l’E2. Cette hypothèse
(forte) suppose que les anticipations des entreprises (assimilées à des joueurs) sont
parfaites.
E F E F
E2 E2
E F
Nœud initial
E1
Comme le jeu est simultané, au moment où l’E2 joue (cf. figure ci-dessus), elle ne sait pas
si elle se situe au nœud à gauche ou au nœud à droite (l’E2 ne peut pas constater ce qu’a
joué l’E1 au moment où elle même joue). On rassemble donc les deux nœuds par un seul
ensemble d’information (représenté par l’ellipse) pour représenter le caractère
simultané du jeu.
7
Comme il n’y a pas d’ordre d’intervention (ce n’est pas un jeu séquentiel), on peut aussi
représenter le jeu avec l’E2 au nœud initial. Dans ce cas les nœuds où interviennent l’E1
sont rassemblés en un seul ensemble d’information (ellipse).
(5, 5) (0, 8) (8, 0) (4, 4)
E F E F
E1 E1
E F
E2
L’ensemble de l’information d’un joueur est l’ensemble des nœuds (intersections)
auquel il croit pouvoir être situé au moment où il doit choisir son action ou prendre une
décision. Ici dans cet exemple, l’ensemble d’information comprend deux nœuds.
2.1- La méthode d’élimination des stratégies dominées (MESD) => équilibre avec
élimination des stratégies dominées (équilibre avec ESD)
Une stratégie est strictement dominée pour un joueur si elle lui procure des gains
strictement inférieurs à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par l’autre joueur.
La stratégie est faiblement dominée : pour un joueur si elle lui procure des gains
inférieurs ou égaux à ceux associés aux autres stratégies dont il dispose, et ce, quelle que
soit la stratégie choisie par l’autre joueur.
La stratégie est strictement dominante pour un joueur si elle lui procure des gains
strictement supérieur à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par les adversaires.
La stratégie est faiblement dominante pour un joueur si elle lui procure des gains
supérieurs ou égaux à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par les adversaires.
Des joueurs rationnels ne doivent pas choisir des stratégies dominées (au sens faible ou
strict). Ils les éliminent. Cette méthode doit permettre de trouver une issue ou une
solution ou un équilibre au jeu.
8
E2
E F
E1 E (5, 5) (0, 8)
∧ ∧
F (8, 0) (4, 4)
E : 5 (si E2 joue E) ou 0 (si E2 joue F)
E1 ∧ ∧
9
Joueur B
b1 b2
Joueur A a1 (4, 4) (0, 6)
a2 (6, 0) (2, 2)
a3 (8, 0) (0, 2)
Pour le joueur A :
Comparons a1 et a2 :
a1 : 4 (si B joue b1) ou 0 (si B joue b2)
∧ ∧
a2 : 6 (si B joue b1) ou 2 (si B joue b2)
a2 domine strictement a1 car les gains de a2 sont toujours supérieurs à ceux de a1, et ce,
quelle que soit la stratégie retenue par le joueur B. Autrement dit, a1 est strictement
dominée par a2
Comparons a1 et a3 :
a1 : 4 (si B joue b1) ou 0 (si B joue b2)
∧ =
a3 : 8 (si B joue b1) ou 0 (si B joue b2)
a1 est faiblement dominée par a3, car les gains de a1 sont inférieurs ou égaux à ceux de
a3, et ce, quel que soit la stratégie (b1 ou b2) retenue par le joueur B.
Comparons a2 et a3 :
a2 : 6 (si B joue b1) ou 2 (si B joue b2)
∧ ∨
a3 : 8 (si B joue b1) ou 0 (si joueur B joue b2)
a2 ne domine pas a3 et a3 ne domine pas a2.
Pour le joueur B :
10
On obtient un jeu sous forme réduite (chaque joueurs anticipe parfaitement ce que va
faire l’autre ; hypothèses d’information complète et de connaissance commune) :
Joueur B
b2
Joueur A a2 (2, 2)
a3 (0, 2)
Joueur B
b1 b2
a1 (2, 2) (6*, 4*)
Joueur A a2 (4, 4*) (4, 2)
a3 (6*, 2) (2, 4*)
John Forbes NASH (1951) a établi un nouveau critère de sélection des stratégies
(méthode de Nash) : une solution ou un équilibre de Nash est une combinaison de
stratégies, telle que la stratégie de chaque joueur correspond à un meilleur choix
possible étant donné les stratégies choisies par les autres joueurs.
a) Il s’agit de définir les meilleures réponses des joueurs aux stratégies choisies par les
autres joueurs.
11
L’ensemble des meilleures réponses du joueur A (aux différentes stratégies du joueur B)
est : (a3, a1)
ê
(6, 6)
Joueur B
b1 b2 b3 b4
Joueur A a1 3 -2 -1 6
a2 2 2 1 3
C’est un jeu strictement compétitif, ne figure que les gains du joueur en ligne, ceux du
joueur en colonne étant les « symétriques », ce qui donne la matrice des paiements ci-
dessous :
Joueur B
b1 b2 b3 b4
Joueur A a1 3, -3 -2, 2 -1, 1 6, -6
a2 2, -2 2, -2 1, -1 3, -3
En appliquant la MESD, on s’aperçoit que dans le jeu initial, le joueur A n’a pas de
stratégies dominées. Par contre pour le joueur B, b4 est strictement dominée par b1, b2,
b3 et b1 est dominée au sens faible par b2 et au sens fort par b3. Avec la MESD, le joueur
B élimine donc b4 et b1 pendant que le joueur A garde l’ensemble de ces stratégies.
12
On obtient le jeu sous forme réduite suivant :
Joueur B
b2 b3
Joueur A a1 -2, 2 -1, 1
a2 2, -2 1, -1
Dans ce jeu sous forme réduite, a2 domine strictement a1. Donc le joueur A va éliminer
a1.
On obtient un nouveau jeu sous forme encore réduite :
Joueur B
b2 b3
Joueur A a2 2, -2 1, -1
Ici, b3 domine strictement b2. Le joueur B élimine donc b2.
Ce jeu comporte un équilibre avec ESD: (a2, b3) ó (1, -1)
Joueur B
b1 b2 b3 b4
Joueur A a1 3*, -3 -2, 2* -1, 1 6*, -6
a2 2, -2 2*, -2 1*, -1* 3, -3
En appliquant la méthode de Nash (voir plus haut pour la méthodologie), ce jeu
comporte une solution ou un équilibre de Nash : (a2, b3) ó (1, -1).
13
Si le joueur B joue b1 : gain minimum = -3
Si le joueur B joue b2 : gain minimum = -2
Si le joueur B joue b3 : gain minimum = -1
Si le joueur B joue b4 : gain minimum = -6
è Stratégie de sécurité (celle qui a le gain minimum le plus élevé ou la perte la plus
faible) du joueur B = b3
La solution du jeu quand les joueurs adoptent leur stratégie de sécurité correspond à la
combinaison de stratégies (a2, b3), à laquelle correspondent le couple de gains : (1, -1).
Cette solution est-elle stable ? Oui car les joueurs n’ont pas intérêt à dévier : si A choisit
a2, B choisit b3 et inversement si B choisit b3, A choisit a2.
Autre exemple :
Joueur B
b1 b2 b3 b4
Joueur A a1 3*, -3 -2, 2* -1, 1 6*, -6
a2 2, -2 2*, -2 1*, -1 -3, 3*
Avec la méthode de Nash, il n’y a pas d’équilibre de Nash (intersection de l’ensemble des
meilleures réponses est vide ; pas deux * présentes simultanément au niveau des gains
d’une combinaison de stratégies)
Solution préconisée par la méthode des SS : (a1, b3). Est-ce que cette solution est
stable ? Non car si A joue a1, B n’a pas intérêt à jouer b3, il aura intérêt à jouer b1 qui lui
rapporte un gain de 3 supérieur au gain de 1 associé à b1. Une solution déterminée par à
l’aide de la méthode avec SS n’est pas stable à partir du moment où un des joueurs a
intérêt à dévier de sa SS.
Problème 1 : non existence de l’équilibre => jeu indéterminé car il ne comporte aucune
solution (« échec » de la théorie des jeux qui n’arrive pas à prédire la solution d’un jeu) ;
ce problème peut se poser avec la MESD, la méthode de Nash, mais pas avec celle des SS
qui implique toujours une solution (le problème est que cette solution n’est pas
forcément stable).
14
Problème 2 : existence de plusieurs équilibres => jeu indéterminé car il comporte
plusieurs solutions (« échec » de la théorie des jeux qui n’arrive pas à prédire une seule
et unique solution d’un jeu). Ce problème 2 peut se poser avec la méthode de Nash, la
MESD et la méthode des SS.
Exemple de la « Guerre des sexes » (avec application de la méthode de Nash) :
Un couple marié n’est pas d’accord sur le but de leur sortie commune (Monsieur préfère
aller au cinéma/Madame préfère faire du shopping).
Ils disposent chacun de deux stratégies : être intransigeant (I) ou transiger (T).
L’absence d’accord par excès d’intransigeance est la pire des situations possibles
(divorce).Si les deux époux sont transigeant, ils vont être incapables de se mettre
d’accord mais sont dans une situation préférable à la précédente (ils ne sortent pas et
restent chez eux pour bouquiner). Ils préfèrent quand même sortir que de rester chez
eux même si leur préférence n’est pas satisfaite. On obtient donc la matrice des
paiements suivante :
Madame
I T
Monsieur I (1, -1) (4*, 2*)
T (2*, 4*) (1, 1)
Deux équilibres de Nash : (I, T) et (T, I) => jeu indéterminé, on ne sait pas ce que vont
faire les joueurs (à moins de rajouter une hypothèse complémentaire).
Problème 3 : Sous-optimalité de l’équilibre => problème pour la théorie des jeux qui ne
permet pas de déterminer de solution optimale aux jeux. Ce problème 3 peut se poser
avec la méthode de Nash, la méthode d’ESD, et la méthode des SS.
Exemple du « Dilemme des prisonniers »:
Deux individus ont commis ensemble un crime, pour lequel ils ne sont pas arrêtés. Par
la suite, ils commettent un vol pour lequel ils sont arrêtés. Nicolas et Nadège sont
interrogés séparément (dans des pièces différentes) et ils ne peuvent pas communiquer
entre eux. Les deux individus ont deux stratégies : se taire (T) ou parler
(avouer/dénoncer) (P). Le fait de parler, d’avouer ou de dénoncer sert de preuve pour le
crime. Voici le marché proposé par la police :
- Si les deux individus se taisent, seule condamnation pour vol : 5 ans chacun.
- Si l’un parle, alors que l’autre se tait, celui qui parle sera libéré et celui qui a gardé
le silence aura une condamnation de 30 ans.
- Si les deux individus parlent : condamnation de 15 ans chacun (crime + vol).
Les deux individus sont au courant du marché proposé par la police.
Individu B
P T
Individu A P (15 ans, 15 ans) (0, 30 ans)
cas n°1 cas n°2
T (30 ans, 0) (5 ans, 5 ans)
cas n°3 cas n°4
Pour l’individu A: cas n°2 est préféré au cas n°4,qui est lui même préféré au cas n°1, qui
est lui même préféré au cas n°3.
15
Pour l’individu B : cas n°3est préféré au cas n°4 , qui est lui même préféré au cas n°1 ,qui
est lui même préféré au cas n°2.
Pour individu A: U (cas n°2) = 0> U (cas n°4) = -5 > U (cas n°1)= -15 > U (cas n°3)= -30
Pour individu B: U (cas n°3) =0 > U (cas n°4) = -5 > U (cas n°1) = -15 > U (cas n°2)= -30
Nicolas
P T
Nadège P (-15*, -15*) (0*, - 30)
Que ce soit avec la méthode de Nash, avec la MESD ou avec la méthode des SS, la solution
ou l’équilibre du jeu correspond à la combinaison de stratégies (P, P)ó (-15, -15). Cet
équilibre se traduit par la fait que les deux individus parlent et écopent de 15 ans de
prison chacun. Cet équilibre est sous-optimal selon le critère de Pareto car il existe une
autre configuration qui lui est préférée (T, T) ó (-5, -5) mais cette configuration n’est
pas un équilibre (parce ce que les joueurs ont intérêt à dévier ; si l’un des joueurs se tait,
l’autre à intérêt à parler pour être libéré).
16
CHAPITRE II : LES JEUX DYNAMIQUES EN INFORMATION COMPLETE
Les jeux dynamiques sont des jeux séquentiels ou dynamiques en information parfaite
(voir introduction pour la définition des jeux en information parfaite) et ici on suppose
que l’information est également complète (voir introduction pour la définition des jeux
en information complète). Les jeux séquentiels ou dynamiques sont à « plusieurs
coups », i.e. ils comprennent plusieurs étapes (au moins deux) où interviennent les
joueurs. Nous allons d’abord nous intéresser aux formes de représentations possibles de
ces jeux avant d’analyser les différentes méthodes qui permettent de trouver une issue,
ou une solution, ou encore un équilibre à ce type de jeux (résolution des interactions
stratégiques qui est l’objet principal de la théorie des jeux). Il s’agit d’analyser la portée
et les limites de ces méthodes (ou de l’équilibre associé) pour avoir un regard critique
sur la portée de la théorie des jeux comme « outil d’aide à la décision ».
17
V (aux nœuds finals) désigne le fait que A gagne le jeu ó V, P (A gagne et donc B perd)
ó10, -10 (A gagne 10 et donc B perd 10)
P (aux nœuds finals) désigne le fait que A perde le jeu ó P, V (A perd et donc B gagne)
ó -10, 10 (A perd 10 et donc B gagne 10)
Les chiffres 1, 2, 3 ou 4 matérialisent des nœuds qui constituent un seul et unique
ensemble d’information (au moment où il joue, tout joueur sait ce que l’autre a joué
précédemment).
Exemple 2 : Jeu non strictement compétitif(JNSC)
Deux joueurs A et B. A commence le jeu et a le choix entre deux actions : g ou d. S’il joue
d, le jeu est terminé, chacun des joueurs réalise un gain de 6. Si le joueur A joue g, alors B
est amené à choisir entre G ou D ; s’il joue G, le joueur B fait un gain nul et A réalise un
gain de 12 ; s’il joue D, B fait un gain nul et A aussi.
(12, 0) (0, 0)
G D
(6, 6) Etape 2
B 2
g
d
A 1 Etape 1
Les gains du joueur qui commence le jeu figurent à gauche (au niveau des nœuds finals)
et ceux du joueur qui intervient après figurent à droite (au niveau des nœuds finals)
1.2- Représentation normale ou stratégique ou statique
Exemple 1 : JSC
Il faut d’abord définir les stratégies des joueurs pour les situer ensuite dans la forme
normale, stratégique, ou dans la matrice des paiements.
Stratégies du joueur A. A intervient aux nœuds 1 et 4 ó ses stratégies comportent deux
éléments (une action possible au nœud 1 et une action possible au nœud 4). Au nœud 1,
A dispose de deux actions ; au nœud 4, A dispose de deux actions. Au total, A disposera
de 2x2= 4 stratégies. Soit n = nœud.
gg (cela signifie que A envisage de jouer gau n1et g au n4) ;gd (cela signifie que A
envisage de jouer g au n1 et d au n4) ; dg (cela signifie que A envisage de jouer d au n1
et g au n4) ;dd (cela signifie que A envisage de jouer d au n1 et d au n4) .
18
Stratégies du joueur B. B intervient aux nœuds 2 et 3ó ses stratégies comportent deux
éléments. Au nœud 2 : B a deux actions possibles. Au nœud 3 : B a trois actions possibles.
Au total, B disposera de 2x3 => 6 stratégies
Les stratégies comprennent des actions qui ne sont pas amenées à se réaliser lors du
déroulement effectif du jeu (cela vaut pour les deux joueurs) mais selon la définition
analytique de la notion de stratégie, celle-ci est un plan de décisions (ou plan d’actions)
et tous les cas de figure (potentialités) doivent être envisagés avant le déroulement
même du jeu.
Le joueur qui commence le jeu est en ligne (ainsi que ses stratégies) et le joueur qui
intervient ensuite est en colonne (ainsi que ses stratégies). Comme c’est un JSC, les gains
(ou conséquences) qui figurent dans la matrice des paiements sont ceux du joueur qui
est en ligne (joueur qui commence le jeu).
Joueur B
GG GM GD DG DM DD
gg V V V P P P
gd V V V P P P
Joueur A dg P V V P V V
dd V V V V V V
Joueur B
GG GM GD DG DM DD
gg V, P V, P V, P P, V P, V P, V
gd V, P V, P V, P P, V P, V P, V
Joueur A dg P, V V, P V, P P, V V, P V, P
dd V, P V, P V, P V, P V, P V, P
Ici les gains (ou conséquences) qui figurent à gauche sont ceux du joueur qui est en ligne
(joueur qui commence le jeu) et les gains (conséquences) symétriques (JSC) qui figurent
à droite sont ceux du joueur en colonne (celui qui ne commence pas le jeu mais
intervient après)
Exercice 2 : JNSC
19
Stratégies de B : B intervient en un seul nœud. Les stratégiesne comportent qu’un seul
élément. Nœud 2 : B dispose de deux actions possibles. Deux stratégies : G ou D.
Joueur B
G D
Joueur A g (12, 0) (0, 0)
d (6, 6) (6, 6)
Ici les stratégies se confondent avec les actions, ce qui est très rare dans les jeux
dynamiques (uniquement quand un joueur n’intervient qu’à un seul nœud ou ensemble
d’information.
Exemple 1 :
Joueur B
GG GM GD DG DM DD
gg V*, P V*, P V*, P P, V* P, V* P, V*
gd V*, P V*, P V*, P P, V* P, V* P, V*
Joueur A dg P, V* V*, P V*, P P, V* V*, P V*, P
dd V*, P* V*, P* V*, P* V*, P* V*, P* V*, P*
Explications :
Si A joue gg, les meilleures réponses de B sont DG ou DM ou DD (cas où B gagne), B est
indifférent entre ces trois stratégies donc il les sélectionne toutes les trois (il n’a donc
pas une seulement meilleure réponse mais plusieurs).
Même raisonnement pour les autres meilleures réponses de B ou de A face aux
stratégies choisies par l’adversaire.
Si A joue dd, aucune stratégie de B ne lui permet de gagner, mais comme il est obligé de
jouer, il est indifférent entre toutes ses stratégies (qui ne l’amènent qu’à perdre), il les
sélectionne donc toutes par défaut.
20
Exemple 2 :
Joueur B
G D
Joueur A g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)
Ce jeu comporte 2 EN : (g, G) (avec des gains de 12 pour 1 et de 0 pour B) et (d, D) (avec
des gains de 6 pour chacun des joueurs).
Il faut d’abord déterminer les différents sous-jeux sachant qu’un « sous-jeu » est un je
qui commence à partir d’un ensemble d’information donné.
Quatre sous-jeux : J4, J3, J2, J1 (J1 = jeu dans son intégralité)
Il faut ensuite considérer chaque sous-jeu en partant de la fin du jeu (dernière étape)
pour revenir progressivement aux sous-jeux intermédiaires (étapes intermédiaires) et
finalement au premier sous-jeu (première étape).
A chaque étape (en commençant vers la fin pour revenir vers le début), on identifie la ou
les meilleures actions possibles du joueur concerné.
Méthode de l’A.Z :
- A la dernière étape (étape 3), au sous-jeu J4, la meilleure action de A est de jouer
d car il gagne (sinon en jouant g il perd le jeu). On surligne la branche d en rouge.
- A la deuxième étape (étape 2), au sous-jeu J3 (qui comprend ensuite le sous-jeu
J4), B est indifférent entre G, M et D ; en jouant M et D, il perd le jeu ; en jouant G,
21
il sait que A aura intérêt à jouer d, et dans ce cas B perd le jeu. Les « meilleures »
actions de B sont G ou M ou D (par défaut). On les surligne en rouge.
- A la deuxième étape (étape 2), au sous-jeu J2, B a intérêt à jouer D car cela lui
permet de gagner le jeu (sinon il perd le jeu) ; sa meilleure action est D. On la
surligne en rouge.
- A la première étape, au sous-jeu J1, A a intérêt à jouer d, car il sait que B jouera
indifféremment G, M ou D ; si B joue M ou D, A gagne, et si B joue G, A sait qu’il
termine le jeu et qu’il jouera d pour gagner. Si A joue g, il sait que B jouera D et A
sait qu’il perd alors le jeu. Son action rationnelle est de jouer d. On la surligne en
rouge.
On a vu que ce jeu comportait 6 EN : (dd, GG) ; (dd, GM) ; (dd, GD) ; (dd, DG) ; (dd, DM) ;
(dd, DD). Trois de ces équilibres ne sont pas des EPSJ : (dd, GG) ; (dd, GM) ; (dd, GD).
=>Tout Equilibre Parfait en Sous-Jeu (EPSJ) est un Equilibre de Nash (EN), mais tout EN
n’est pas forcément un EPSJ.
Exemple : (dd, GG) est un Equilibre de Nash mais n’est pas un Equilibre Parfait en Sous-
Jeu. Il contient une action irrationnelle pour le joueur B (consistant à jouer G au nœud 2
mais cette action irrationnelle n’est pas amenée à être prise ou à se réaliser lors du
déroulement effectif du jeu (A joue d au nœud 1, et B joue G au nœud 3). Lorsque l’on
suit le sentier d’équilibre (déroulement effectif du jeu), les joueurs agissent de manière
rationnelle, mais hors de ce sentier, les joueurs peuvent être amenés à jouer de manière
irrationnelle. Tout équilibre de Nash qui n’est pas un EPSJ comprend au moins une
action irrationnelle d’un des joueurs qui n’est pas amenée à être effective (menace non
crédible). Par contre, tout équilibre de Nash qui est un EPSJ comporte des actions
rationnelles des joueurs.
- (s, t) et (s’, t’) sont équivalents s’ils aboutissent au même résultat (même conséquence,
ê ê mêmes gains, même utilité).
(dd, DG) et (dd, DM)
22
- (s, t) et (s’, t’) sont interchangeables si le fait d’interchanger les stratégies d’équilibre
entre elles, débouche sur un équilibreó (s, t’) et (s’, t) : les nouvelles combinaisons de
stratégies restent des équilibres.
(s, t’) : (dd, DM) est un équilibre
è donc (dd, DG) et (dd, DM) sont interchangeables.
(s’, t) : (dd, DG) est un équilibre
Exemple 2 : JNSC
Arbre 1 :
(12, 0) (0, 0)
G D
(6, 6)
B 2
g D
A 1
Arbre 2:
(12, 0) (0, 0)
G D
(6, 6)
B 2
g d
A 1
Deux sous-jeux : J2 et J1. Méthode A.Z :
- Etape 2 : au sous-jeu J2, B est indifférent entre jouer G ou D car il reçoit les mêmes
gains (0). Les meilleures actions possibles sont G ou D. dès qu’un joueur a plusieurs
actions rationnelles possibles il faut « dupliquer » l’arbre pour représenter ce qui se
passerait dans chacune des configuration (ici un arbre pour l’action rationnelle G ó
arbre 1 ; et un deuxième arbre pour l’action rationnelle D ó arbre 2).
Dans les JSC, il n’est pas nécessaire de « dupliquer l’arbre, mais pour les JNSC il faut
dupliquer l’arbre dès qu’un joueur a au moins plus d’une action rationnelle à un
nœud/ensemble d’information.
23
- Etape 1 : au sous-jeu J1, avec l’arbre 1, le joueur A va jouer g, car il sait que B joue G et
le gain associé à g est de 12 > au gain associé à d (6). Avec l’arbre 2, A va jouer d, car il
sait que B joue D et le gain associé à d est 6 > au gain associé à g (0).
Ce jeu comporte deux EPSJ correspondant aux combinaisons de stratégies : (g, G) et
(d, D)
(s, t)ó(g, G)ó(12, 0)
èLes deux équilibres ne sont pas équivalents
(s’, t’)ó(d, D)ó(6, 6)
(s, t’) ó (g, D) n’est pas un équilibre
èLes deux équilibres ne sont pas interchangeables
(s’, t) ó (d, G) n’est pas un équilibre
Problèmes posés par l’A.Z :
1/ L’A.Z repose sur une hypothèse forte : chaque joueur est capable d’évaluer l’influence
de ses propres décisions sur les actions futures des autres joueurs en connaissant leurs
gains, leurs décisions possibles et en sachant qu’ils sont rationnels. Ce principe est limité
dès que les individus sont confrontés à des situations qui impliquent un nombre trop
important de décisions (actions) et de séquences temporelles.
2/ l’A.Z conduit à plusieurs EPSJ et une multiplicité d’équilibres ; le jeu est indéterminé.
La théorie des jeux ne peut pas prédire une seule et unique solution au jeu.
3/ l’ A.Z peut conduire à des résultats contre intuitifs : EPSJ sous-optimal selon le critère
de Pareto.
(5, 5) (0, 6)
G D
(1, 1)
B 2
g
d
A 1
Stratégies de A : g ou d
Stratégies de B : G ou D
Ce jeu comporte un EPSJ : (d, D) ó (1, 1) sous-optimal selon le critère de Pareto, car il
existe une configuration qui lui est préférée (g, G) ó (5, 5) où les gains sont supérieurs
pour les deux joueurs, mais cette configuration n’est pas un équilibre (elle ne comprend
pas d’action rationnelle de la part des deux joueurs).
24
2.3- Méthode d’Elimination des Stratégies Dominées (MESD) et équilibre avec
élimination des stratégies dominées (ESD)
Pour les définitions des stratégies dominées (dominantes) au sens strict ou au sens
faible, voir chapitre 1. Cette méthode s’applique à la forme stratégique du jeu mais nous
allons donner les résultats principaux des autres méthodes (exercices supplémentaires)
(1, 0) (2, 3) (0, 1) (3, 2)
b1 b2 b1 b2
B 2 B 3 Etape 2
a1 a2
A 1 Etape 1
Actions de A : a1 ou a2 ; actions de B : b1 ou b2
Stratégies de A : a1 ; a2
Stratégies de B : b1b1 ; b1b2 ; b2b1 ; b2b2
Ce jeu ne comporte qu’un seul EPSJ, soit la combinaison de stratégies : (a2, b2b2) (les
actions rationnelles étant surlignés en rouge)
Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1*, 0) (1, 0) (2*, 3*) (2, 3*)
a2 (0, 1) (3*, 2*) (0, 1) (3*, 2*)
3 EN : (a1, b2b1) ; (a2, b1b2) ; (a2, b2b2). Les EN (a1, b2b1) ; (a2, b1b2) ne sont pas des EPSJ ;
seul l’équilibre de Nash (a2, b2b2) est un EPSJ.
Les EN qui ne sont pas des EPSJ comportent au moins une action irrationnelle d’un
joueur hors du sentier d’équilibre. Tout EN qui n’est pas un EPSJ peut reposer sur des
menaces non crédibles.
Par exemple, prenons l’EN (a1, b2b1) qui n’est pas un EPSJ. Ce dernier repose sur une
menace non crédible.
- MENACE : B dit à A : je veux a1 au nœud 1 (surligné en vert) pour pouvoir jouer b2 au
nœud 2 (surligné en vert), auquel cas B fait un gain de 3 et A ferait un gain de 2. B
menace A en lui disant « si tu ne joues pas a1 et que tu joues a2 au nœud 1, alors je
jouerai b1 », auquel cas A se verrait avoir un gain nul.
- NON CREDIBLE : si A n’écoute pas B et qu’il joue a2 au nœud 1, B se retrouve confronté
au choix suivant : mettre sa menace à exécution auquel cas B ferait un gain de 1, ou ne
pas mettre sa menace à exécution, auquel cas B ferait un gain de 2. Comme il est
rationnel (pas animé par un sentiment de rancune ou autre), alors il aura intérêt à ne
25
pas mettre sa menace à exécution, ce que A sait (hypothèse de connaissance commune
et information parfaite), raison pour laquelle il jouera a2 (et pas a1).
Application de la MESD :
Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1, 0) (1, 0) (2, 3) (2, 3)
Pour appliquer la MESD, il faut suivre l’ordre de l’A.Z., i.e. commencer par s’intéresser
aux stratégies dominées du dernier joueur pour revenir progressivement vers le
premier joueur et s’intéresser à ces stratégies dominées (il y a autant d’itérations que
d’étapes mais pas plus).
Ensuite,
b1b2 est faiblement dominée par b2b2
0 < 3
ou ou
2 = 2
Le Joueur B a donc uns stratégie dominante b2b2, il élimine les trois autres stratégies
dominées.
Joueur B
b2 b2
Joueur A a1 (2, 3)
a2 (3, 2)
Dans ce jeu sous forme réduite, a1 est strictement dominée par a2 car les gains de a1 (=2)
sont strictement inférieurs à ceux de a2 (= 3) et ce quelle que soit la stratégie adoptée
par le joueur B. A élimine sa stratégie dominée a1.
26
Au final ce jeu ne comporte qu’un équilibre avec ESD : (a2, b2b2) = EN = EPSJ.
Autre exemple :
Soit un joueur A qui dispose de deux actions possibles : a1 ou a2 ; il joue en premier.
Ensuite le joueur B intervient avec deux actions possibles : b1 ou b2. En fonction de ce
que jouent les joueurs, les gains sont mentionnés dans l’arbre ci-dessous.
(1, 1) (100, 0) (0, 100) (100, 100)
b1 b2 b1 b2
B 2 B 3 Etape 2
a1 a2
A 1 Etape 1
En appliquant l’A.Z., on voit que le joueur B a deux actions rationnelles possibles au
nœud 3 (b1 et b2 lui rapportent 100), il est donc indifférent entre ces deux actions et il
faut dupliquer l’arbre en deux pour voir ce qui se passe dans chacune des configurations
(quand il choisit b1 ou quand il choisit b2).
Arbre 1 :
(1, 1) (100, 0) (0, 100) (100, 100)
b1 b2 b1 b2
Etape 2
B 2 B 3
a1 a2
A 1 Etape 1
27
Arbre 2 :
b1 b2 b1 b2
Etape 2
B 2 B 3
a1 a2
A 1 Etape 1
Les actions rationnelles des joueurs A et B sont surlignées en rouge (cf. plus haut pour
description de la méthodologie). En appliquant la méthode de l’A.Z. on commence par
identifier les actions rationnelles en chaque sous-jeu (en commençant par la fin du jeu,
dernière étape, pour revenir au début du jeu, première étape).
Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1, 1) (1, 1) (100, 0) (100, 0)
b1b1 et b1b2 dominent faiblement b2b1 et b2b2 ou b2b1 et b2b2 sont faiblement dominées
par b1b1 et b1b2. Le joueur B élimine b2b1 et b2b2
a1 : 1 ou 1
∨ ∧
a2 : 0 ou 100
28
a1 ne domine pas a2 et a2 ne domine pas a1. Le joueur A n ‘élimine aucune de ces
stratégies.
Le jeu comporte 4 équilibres avec ESD : (a1, b1b1) (qui est aussi un EPSJ) ; (a2, b1b2) (qui
n’est pas un EPSJ) ; (a2, b1b1) (qui n’est pas un EPSJ), et (a2, b1b2) (qui est un EPSJ). La
MESD peut déterminer des équilibres qui ne comportent pas tous des actions
rationnelles de la part des joueurs (même si celles-ci ne sont pas amenées à être prises
effectivement lors du déroulement du jeu).
Joueur B
G D
Joueur A : g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)
2 EN : (g, G) et (d, D)
G D
Joueur B : 0 = 0
Si A joue g
ou ou
6 = 6 Si A joue d
Le joueur B n’a pas de stratégies dominées
g : 12 ou 0
Joueur A : ∨ ∧
d : 6 ou 6
si B joue G si B joue D
Le joueur A n’a pas de stratégies dominées
Joueur B
G D
Joueur A g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)
2 EN : (g, G) et (d, D)
29
Joueur A : stratégie g : gain min = 0
stratégie d : gain min = 6
SS de A est d (gain minimum supérieur)
Deux solutions avec la méthodes des SS : (d, G) (qui n’est pas un EN) et (d, D) (qui est
un EN).
La solution (d, G) n’est pas stable : si A joue d, B est indifférent entre jouer G ou D (B ne
dévie pas de sa stratégie de sécurité) ; par contre si B joue G, alors A aura intérêt à
dévier de sa stratégie de sécurité car A a intérêt à jouer g(12) > d(6).
La solution (d, D) est stable : les joueurs n’ont pas intérêt à dévier de leurs stratégies de
sécurité (si A joue d, B a intérêt à jouer D, et vice versa, si B joue D alors A aura intérêt à
garder sa SS et à jouer d).
BIBLIOGRAPHIE INDICATIVE
K. Binmore : Jeux et théorie des jeux, De Boeck Université, 1999.
M. Cavagnac : Théorie des jeux, Gualino éditeur, 2006.
N. Eber : Théorie des jeux, Dunod, 2007.
G. Giraud : La théorie des jeux, Champs Université Flammarion, 2000.
B. Guerrien : La théorie des jeux, Economica, 2002.
D.M. Kreps : Théorie des jeux et modélisation économique, Dunod, 1999.
E. Rasmusen, Jeux et information, introduction à la théorie des jeux, De Boeck, 2004.
C. Schmidt : La théorie des jeux, essai d’interprétation, PUF, 2001.
A.R. Varian : Introduction à la microéconomie, De Boeck Université, 2006.
30