Vous êtes sur la page 1sur 30

THEORIES

ECONOMIQUES 2

Licence Sciences Sociales, Parcours Economie-Sociologie


(3ème Année)

Géraldine FROGER
geraldine.froger@univ-tlse2

Sommaire
INTRODUCTION GENERALE .......................................................................................................... 2
A) Deux principes d’un jeu : la rationalité et les interactions stratégiques .......................... 2
B) Historique de la théorie des jeux ................................................................................................... 3
C) Comment « modéliser » un jeu ? Présentation de quelques repères ................................. 3
D) La nature de l’information : quelques repères ......................................................................... 5
CHAPITRE I : ANALYSE DE JEUX SIMULTANES OU STATIQUES EN INFORMATION
COMPLETE ......................................................................................................................................... 6
Section 1- Les formes de représentation des jeux statiques ...................................................... 6
1.1- Représentation stratégique (ou normale) ............................................................................................ 6
1.2- Représentation extensive (arborescente) ............................................................................................. 7
Section 2- Les concepts d’équilibre pour les jeux statiques ...................................................... 8
2.1- La méthode d’élimination des stratégies dominées (MESD) => équilibre avec
élimination des stratégies dominées (équilibre avec ESD) .................................................................... 8
2.2- La méthode de Nash => équilibre de Nash ........................................................................................ 11
2.3- Stratégies de sécurité => équilibre avec stratégie de sécurité (SS) ........................................ 13
2.4- Problèmes associés aux différentes méthodes de détermination de solution en jeux
statiques/simultanés ............................................................................................................................................ 14
Section 3- Stratégies mixtes et équilibre en stratégie mixte .......... Erreur ! Signet non défini.
CHAPITRE II : LES JEUX DYNAMIQUES EN INFORMATION COMPLETE ........................ 17
Section 1- Les formes de représentation des jeux dynamiques .............................................. 17
1.1- Représentation extensive ou arborescente ................................................................................... 17
1.2- Représentation normale ou stratégique ou statique ................................................................ 18
Section 2- Les concepts d’équilibre .................................................................................................. 20
2.1- Equilibre de Nash (forme stratégique) ........................................................................................... 20
2.2- Equilibre parfait en sous-jeux (EPSJ) (forme extensive) ................................................... 21
2.3- Méthode d’Elimination des Stratégies Dominées (MESD) et équilibre avec
élimination des stratégie dominées (ESD) .................................................................................................. 25
2.4- Stratégies de sécurité et solution d’un jeu dynamique ...................................................... 29
BIBLIOGRAPHIE PRINCIPALE ................................................................................................... 30

1
INTRODUCTION GENERALE
L’objectif de cette introduction est de donner des éléments fondamentaux sur la
philosophie, l’objet, la méthodologie de la théorie des jeux, et d’annoncer le plan du
cours. La théorie des jeux fait partie des théories économiques contemporaines, et
s’inscrit dans la « nouvelle micro-économie ». Certaines parties du cours sont en couleur,
il est vivement recommandé aux étudiants de se référer au cours mis en ligne par la SED.

A) Deux principes d’un jeu : la rationalité et les interactions stratégiques

La théorie des jeux repose sur deux principes fondamentaux :

La rationalité : les individus agissent en utilisant au mieux les ressources dont ils
disposent compte tenu des contraintes qu’ils subissent :
- l’individu rationnel (Homo Oeconomicus) est égoïste et tient compte uniquement
de son propre intérêt ;
- l’individu rationnel constitue une unité de décision autonome : son
comportement n’est pas déterminé par des habitudes sociales consciemment ou
inconsciemment assimilées. Son comportement est défini indépendamment de
toute contrainte macro-sociale. La définition de la rationalité est donc a-
historique ;
- l’individu rationnel est maximisateur ; il effectue des choix qui maximisent sa
satisfaction (utilité, profit, gains, etc.).

La prise en compte des interactions stratégiques : ce sont les situations dans


lesquelles les décisions individuelles sont directement interdépendantes.
Exemple : deux enfants, un garçon et une fille,tous les deux gourmands sont devant un
gâteau homogène parfaitement divisible. Si le parent fait deux parts, il y aura
immanquablement des disputes entre les deux enfants, chacun trouvant plus grosse la
part de l’autre. Le moyen d’éviter toute dispute est, pour le parent, d’imposer la règle
suivante : l’un des deux enfants (par exemple, la fille) effectue le partage et l’autre (le
garçon) choisit sa parten premier. La fille qui coupe le gâteau ne peut pas raisonner en
tenant compte de ses seules préférencesqui la pousseraient à se couper une plus grosse
part (si elle était seule). En effet, elle saitque le garçon va choisir sa part après qu’elle ait
coupé le gâteau. Si elle coupe une part plus grosse que l’autre, elle risque de la retrouver
dans l’assiette de son frère. Elle va donc s’efforcer de couper des parts aussi égales que
possibles à ses yeux. Ainsi quel que soit le choix du garçon, elle ne s’estimera pas lésé. Il
y a bien des interactions stratégiques entre les deux enfants de cet exemple.

Au total, la théorie des jeux étudie la manière dont les individus rationnels règlent des
situations conflictuelles. Elle analyse la signification de l’hypothèse de rationalité
lorsque la satisfaction d’un individu est directement affectée par les décisions d’autres
individus. Et elle définit les conceptions des solutions afin de prédire les situations
auxquelles aboutissent les différentes configurations conflictuelles.

2
B) Historique de la théorie des jeux

La théorie des jeux a été introduite en économie en 1944 parVon Neumann et


Morgenstern dans un ouvrage intitulé « Theory of games and economic behavior », mais
ce n’est que depuis les années 1980 que l’ensemble des problèmes soulevés par les
interactions stratégiques sont systématiquement analysés dans le cadre de la théorie
des jeux (que ce soit en économie, en gestion, en économie politique internationale, en
biologie, etc.).

Il existe deux approches possibles en théorie des jeux : (1) l’approche stratégique ou
non coopérative et (2) l’approche conditionnelle ou coopérative.

- L’approche stratégique ou non coopérative :


Elle suppose que l’on détermine clairement ce que les joueurs ont le droit de faire
au cours du jeu et ensuite que l’on recherche une stratégie « optimale » (ou la
meilleure possible) pour chaque joueur (la notion d’optimalité peut être
ambiguë, comme nous le verrons par la suite). Ce qui semble être« le mieux »
pour un joueur dépend de ce que les autres joueurs ont l’intention de faire et
vice-versa.
On distingue les jeux à somme nulle ou jeux strictement compétitifs (JSC) des
jeux non strictement compétitifs (JNSC).
Les JSC se caractérisent par le fait que les intérêts des joueurs sont
diamétralement opposés ; tout gain d’un joueur a immédiatement pour
contrepartie une perte identique(montant symétrique) pour l’autre joueur (par
exemple, deux individus font un pari mettant en jeu la somme de 10 euros ; il y a
un perdant et un gagnant ; celui qui perd le pari perd 10 euros (il les donne au
gagnant), celui qui gagne le pari gagne 10 euros (il les reçoit du perdant) ; la
sommes des gains est donc nulle)
Les JNSC sont la généralisation des JSC, les gains et les pertes ne sont pas
symétriques.

- L’approche conditionnelle ou coopérative :


Elle concerne les jeux à plusieurs joueurs et ne cherche pas à indiquer les
stratégies optimales. Elle porte sur les modèles de coalition, correspondant à un
comportement rationnel. L’objectif est de savoir comment les coalitions se
forment et si elles sont stables dans le temps.

Par la suite, le cours ne portera que sur l’approche non coopérative (pour l’approche
coopérative, voir les ouvrages indiqués en bibliographie).

C) Comment « modéliser » un jeu ? Présentation de quelques repères

Quand on désire modéliser des comportements économiques faisant apparaître des


interactions stratégiques sous la forme d’un jeu, il est nécessaire de définir précisément
les éléments suivants :

- Qui sont les joueurs ? La réponse à cette question implique d’identifier toutes les
parties impliquées et éventuellement d’en éliminer certaines. La théorie des jeux

3
s’applique à plusieurs joueurs qui peuvent être des individus, des consommateurs, des
collectivités territoriales, des firmes, etc. Par la suite, par souci de pédagogie, le cours
ne portera que sur les jeux à deux joueurs (pour les jeux à n-joueurs, voir les
ouvrages indiqués en bibliographie).

- Quelles sont les règles ? Pour répondre à cette question, il est notamment nécessaire
de connaître précisément l’ordre d’intervention des joueurs et l’information disponible
pour chacun (nous reviendrons sur la notion d’information à la fin de cette introduction,
cf. point D). Un jeu qui ne comporte pas d’ordre d’intervention est un jeu simultané ou
statique (les joueurs jouent de manière simultanée, cf. le jeu « chi-fu-mi » = pierre,
feuille, ciseaux). Un jeu qui comporte un ordre d’intervention (par exemple les échecs,
où les blancs commencent, puis les noirs…) est un jeu séquentiel ou dynamique.

- Quelles sont les actions (ou décisions ou choix) disponibles pour chaque joueur ?
Pour répondre à cette question, il importe de spécifier les actions dont disposent les
joueurs. Il convient aussi de spécifier les différentes stratégies (ou possibilités d’actions)
des joueurs. A ce stade, on va parler de stratégies pures (on verra plus tard dans le
chapitre 1, section 4,ce que sont les stratégies mixtes qui exigent qu’un joueur affecte
des probabilités à ses stratégies pures ; toutes les autres sections de ce cours ne portent
que sur les stratégies pures des joueurs). Une stratégie pure pour un joueur est un plan
de décisions qui définit l’ensemble des décisions que le joueur doit prendre. Dans un jeu
simultané, où chaque joueur ne prend qu’une décision, une stratégie comprend
évidemment une décision unique. Ce n’est pas dans les jeux dynamiques (ou du moins
c’est rarement le cas comme nous le verrons dans le chapitre 2).

Exemples :

(1) Jeu simultané (une seule étape) : pierre, feuille, ciseaux : trois actions possibles (en
cachant les mains derrière le dos, en jouant, chaque joueur ne peut sortir que le symbole
« pierre », ou « ciseau » ou « feuille »), et trois stratégies possibles « pierre » ou « feuille »
ou « ciseau »). Ici les actions se confondent avec les stratégies. Si le joueur 1 joue
« pierre » au moment où le joueur 2 joue « ciseaux », c’est le joueur 1 qui gagne (la pierre
écrase le ciseau) et le joueur 2 qui perd. Si le joueur 2 joue « ciseaux » au moment où le
joueur 1 joue « feuille », c’est le joueur 2 qui gagne puisque la « ciseau» coupe la
« feuille », etc. C’est un JSC.

(2) Jeu séquentiel (deux étapes) : le joueur 1 commence à jouer, à l’étape 1, il peut
déplacer soit une dame de 10 cases, soit un fou de 5 cases. Il dispose donc de deux
actions (« dame 10 cases » ou « fou 5 cases »). Le joueur 2 joue ensuite (étape 2, on ne
s’intéresse pas à ces actions ici). Le joueur 1 re-joue ensuite (étape 3), il peut déplacer
soit un pion de 2 cases, soit une tour de 3 cases, soit un cavalier. Il dispose donc ici de
trois actions (« pion 2 cases » ou « tour 3 cases » ou « cavalier »). Le jeu est ensuite
terminé. Si le joueur 1 dispose ici de deux actions à l’étape 1 et de trois actions à l’étape
3, il dispose au total de 6 stratégies (spécifiant une action possible à l’étape 1 et une
action possible à l’étape 3 puisque toute stratégie correspond à un plan d’actions ou à un
plan de décisions). Ces stratégies sont (« dame 3 cases »,« pion 2 cases »), (« dame 3
cases », « tour 3 cases »), (« dame 3 cases », « cavalier »), (« fou 5 cases », « pion 2
cases »), (« fou 5 cases », « tour 3 cases »), (« fou 5 cases », « cavalier »).

4
- Quels sont les gains (pertes) associés à chaque combinaison de stratégies ? Lorsque
l’on considère l’ensemble des joueurs (que ce soit en jeu simultané ou séquentiel) dans
un jeu, leurs interactions stratégiques débouchent sur des gains pour eux. Ces gains sont
donc associés à des combinaisons de stratégies (du joueur 1 et du joueur 2). Ces valeurs
peuvent aussi bien représenter des sommes d’argent que des niveaux d’utilité, de profit,
etc.

D)La nature de l’information : quelques repères



Les jeux sont caractérisés par des hypothèses sur l’information qu’ils contiennent (cf.
règles du jeu). On distingue les jeux en information complète des jeux en information
incomplète. On distingue également les jeux en information parfaite des jeux en
information imparfaite.

Un jeu à information complète correspond à:
- chacun des joueurs connaît la structure du jeu : ils connaissent l’ordre d’intervention
éventuel, leurs actions, leurs stratégies, leurs gains, ainsi que les
actions/stratégies/gains des autres joueurs. L’hypothèse de connaissance
commune suppose que chaque joueur sait que les autres ont une information complète
du jeu.
- autrement dit, les joueurs connaissent parfaitement toutes leurs caractéristiques ainsi
que celles des autres joueurs auxquels ils sont confrontés.

Un jeu à information incomplète correspond à la situation où :
- au moins un des joueurs ne connaît pas entièrement la structure du jeu (situation de
sélection adverse ou d’aléa moral).
- autrement dit, les joueurs ne connaissent pas parfaitement les caractéristiques des
autres joueurs auxquels ils sont confrontés.

Un jeu à information parfaite correspond à la situation où chacun des joueurs, au
moment de choisir son action, a une connaissance parfaite des décisions prises
antérieurement par les autres joueurs (c’est un jeu séquentiel ou dynamique).

Un jeu à information imparfaite correspond à une situation où un joueur ne connaît pas,
au moment où il joue, ce qu’a joué l’autre joueur (c’est un jeu simultané ou statique).

Les jeux en information complète peuvent comprendre des jeux en information parfaite
(jeu séquentiel ou dynamique) ou en information imparfaite (jeu simultané ou statique).
De même les jeux en information incomplète peuvent comprendre des jeux en
information parfaite (jeu séquentiel ou dynamique) ou en information imparfaite (jeu
simultané ou statique).

Plan du cours :

Chapitre 1 : Analyse de jeux simultanés ou statiques en information complète
Chapitre 2 : Analyse de jeux séquentiels ou dynamiques en information complète

5
CHAPITRE I : ANALYSE DE JEUX SIMULTANES OU STATIQUES EN
INFORMATION COMPLETE
Les jeux simultanés ou statiques ne sont qu’à « un seul coup ». Nous allons d’abord nous
intéresser aux formes de représentations possibles de ces jeux avant d’analyser les
différentes méthodes qui permettent de trouver une issue, ou une solution, ou encore un
équilibre à ce type de jeux (résolution des interactions stratégiques qui est l’objet
principal de la théorie des jeux). Il s’agit d’analyser la portée et les limites de ces
méthodes (ou de l’équilibre associé) pour avoir un regard critique sur la portée de la
théorie des jeux comme « outil d’aide à la décision ».

Section 1- Les formes de représentation des jeux statiques

1.1- Représentation stratégique (ou normale)

Exemple : Une collectivité locale lance un appel d’offre pour faire des travaux
d’aménagement. L’appel d’offre se termine à la fin de l’année. Deux entreprises
(l’entreprise 1 et l’entreprise 2) transmettent leur offre (c’est-à-dire un devis pour la
travaux) au même moment (fin de l’année) et de manière indépendante. L’offre
comprend soit un devis élevé d’un million d’euros, soit un devis faible de 0,8 million
d’euros. L’entreprise qui fait l’offre la plus intéressante emporte le marché. Si les
entreprises font une offre identique, alors le marché sera divisé en deux.

L’entreprise 1 (E1) a deux actions, deux stratégies : E (déposer un devis élevé) ou F


(déposer un devis faible).
L’entreprise 2 (E2) a deux actions, deux stratégies : E (déposer un devis élevé) ou F
(déposer un devis faible).

Ce jeu est non strictement compétitif (JNSC)

Avec l’ensemble des données ci-dessus, nous pouvons établir la forme stratégique ou
statique, ou encore la matrice des paiements, de ce jeu ci-dessous :

E2
E F
E1 E (5, 5) (0, 8)
F (8, 0) (4, 4)

Explications : Les stratégies de l’entreprise 1 sont en ligne ; celles de l’entreprise 2


figurent en colonne ; les gains de l’entreprise mentionnée en ligne figure toujours à
gauche et ceux de l’entreprise en colonne à droite. Si les deux entreprises déposent un
devis élevé, le marché est séparé en deux (les deux entreprises remportent chacune la
moitié du marché). Il en est de même si elles déposent toutes les deux un devis faible.
Par contre, l’entreprise qui fait l’offre la plus intéressante remporte le marché seule (par
exemple si l’entreprise 1 propose un devis faible alors que l’entreprise 2 propose un
devis élevé et vice-versa).

6
On pose 1= 100 000 €

Les préférences de l’E1 sont les suivantes : gagner le marché (GM) avec un devis faible
(DF) est préféré au partage du marché (½ M) avec un devis élevé (DE), qui est préféré au
partage du marché (½ M) avec un devis faible (DF), qui est préféré à la perte du marché
(PM)
ó U (GM avec DF) = 8 >U (½ M avec DE) = 5 >U (½ M avec DF) = 4 >U (PM) = 0

Il en est de même pour l’E2.

Selon l’hypothèse de connaissance commune : l’E1 connaît les décisions qu’elle peut
prendre, les décisions que peut prendre l’E2, ses propres gains et ceux de l’E2. Par
ailleurs, l’E2 sait que l’E1 dispose de l’ensemble de ces informations. De même, l’E1 sait
que l’E2 sait qu’elle (E1) dispose de l’ensemble de ces informations, etc. Le même
raisonnement s’applique en symétrique en commençant par l’E2. Cette hypothèse
(forte) suppose que les anticipations des entreprises (assimilées à des joueurs) sont
parfaites.

1.2- Représentation extensive (arborescente)



Les nœuds (intersections) sont les points d’où partent les actions (décisions) possibles
(chaque branche désigne une action) des entreprises (joueurs). Les gains de l’entreprise
(joueur) qui figure au nœud initial sont à gauche des parenthèses. Les gains qui figurent
à droite des parenthèses sont celles de l’entreprise (joueur) ne figurant pas au nœud
initial.

(5, 5) (0, 8) (8, 0) (4, 4)

E F E F

E2 E2

E F


Nœud initial
E1

Comme le jeu est simultané, au moment où l’E2 joue (cf. figure ci-dessus), elle ne sait pas
si elle se situe au nœud à gauche ou au nœud à droite (l’E2 ne peut pas constater ce qu’a
joué l’E1 au moment où elle même joue). On rassemble donc les deux nœuds par un seul
ensemble d’information (représenté par l’ellipse) pour représenter le caractère
simultané du jeu.

7
Comme il n’y a pas d’ordre d’intervention (ce n’est pas un jeu séquentiel), on peut aussi
représenter le jeu avec l’E2 au nœud initial. Dans ce cas les nœuds où interviennent l’E1
sont rassemblés en un seul ensemble d’information (ellipse).


(5, 5) (0, 8) (8, 0) (4, 4)

E F E F

E1 E1

E F



E2

L’ensemble de l’information d’un joueur est l’ensemble des nœuds (intersections)
auquel il croit pouvoir être situé au moment où il doit choisir son action ou prendre une
décision. Ici dans cet exemple, l’ensemble d’information comprend deux nœuds.

Section 2- Les concepts d’équilibre pour les jeux statiques


2.1- La méthode d’élimination des stratégies dominées (MESD) => équilibre avec
élimination des stratégies dominées (équilibre avec ESD)

Une stratégie est strictement dominée pour un joueur si elle lui procure des gains
strictement inférieurs à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par l’autre joueur.

La stratégie est faiblement dominée : pour un joueur si elle lui procure des gains
inférieurs ou égaux à ceux associés aux autres stratégies dont il dispose, et ce, quelle que
soit la stratégie choisie par l’autre joueur.

La stratégie est strictement dominante pour un joueur si elle lui procure des gains
strictement supérieur à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par les adversaires.

La stratégie est faiblement dominante pour un joueur si elle lui procure des gains
supérieurs ou égaux à ceux associés aux autres stratégies dont il dispose, et ce, quelle
que soit la stratégie choisie par les adversaires.

Des joueurs rationnels ne doivent pas choisir des stratégies dominées (au sens faible ou
strict). Ils les éliminent. Cette méthode doit permettre de trouver une issue ou une
solution ou un équilibre au jeu.

8



E2
E F
E1 E (5, 5) (0, 8)
∧ ∧
F (8, 0) (4, 4)

E : 5 (si E2 joue E) ou 0 (si E2 joue F)
E1 ∧ ∧

F : 8 (si E2 joue F) ou 4 (Si E2 joue F)




Pour l’E1, E est une stratégie strictement dominée.

E : 5 (si E1 joue E) ou 0 (si E1 joue F)
E2 ∧ ∧
F : 8(si E1 joue F) ou 4 (si E1 joue F)


Pour l’E2, E est aussi une stratégie strictement dominée.

=> Les deux entreprises éliminent leur stratégie dominée, l’issue du jeu ou l’équilibre
avec ESD correspond à la combinaison de stratégies : (F, F) qui rapportent
respectivement les gains de (4, 4).

Cet équilibre est sous-optimal selon le critère de Pareto car il existe une autre
configuration (E, E) qui se traduirait par une amélioration de la situation des deux
entreprises (chacune ferait un gain de 5 au lieu d’un gain de 4) mais cette configuration
ne peut pas être un équilibre car elle correspond à l’adoption de stratégies dominées
pour les deux entreprises (ce qui est impossible puisqu’elles sont rationnelles au sens
économique du terme).

Autre exemple : on a deux joueurs A et B. Le joueur A dispose de trois stratégies : a1, a2,
et a3 ; le joueur A est « générique », çà peut être un individu, une entreprise, etc., les
stratégies sont aussi « génériques », si le joueur est une entreprise, elles peuvent se
traduire par une pratique de prix élevés (a1), de prix moyens (a2) ou de prix faibles
(a3). Le joueur B dispose de deux stratégies : b1 et b2 ; le joueur B est aussi
« générique », çà peut être un individu, une entreprise, etc., les stratégies sont aussi
« génériques », si le joueur est une entreprise, elles peuvent se traduire par une pratique
de prix élevés (b1), ou de prix faibles (b2) (ce qui suppose que le joueur B ne peut pas
pratiquer de prix moyens, contrairement au joueur A).



9
Joueur B
b1 b2
Joueur A a1 (4, 4) (0, 6)
a2 (6, 0) (2, 2)
a3 (8, 0) (0, 2)

Pour le joueur A :
Comparons a1 et a2 :
a1 : 4 (si B joue b1) ou 0 (si B joue b2)
∧ ∧
a2 : 6 (si B joue b1) ou 2 (si B joue b2)

a2 domine strictement a1 car les gains de a2 sont toujours supérieurs à ceux de a1, et ce,
quelle que soit la stratégie retenue par le joueur B. Autrement dit, a1 est strictement
dominée par a2

Comparons a1 et a3 :
a1 : 4 (si B joue b1) ou 0 (si B joue b2)
∧ =
a3 : 8 (si B joue b1) ou 0 (si B joue b2)

a1 est faiblement dominée par a3, car les gains de a1 sont inférieurs ou égaux à ceux de
a3, et ce, quel que soit la stratégie (b1 ou b2) retenue par le joueur B.

Comparons a2 et a3 :
a2 : 6 (si B joue b1) ou 2 (si B joue b2)
∧ ∨
a3 : 8 (si B joue b1) ou 0 (si joueur B joue b2)
a2 ne domine pas a3 et a3 ne domine pas a2.

Pour le joueur B :

b1 : 4 (si A joue a1) ou 0 (si A joue a2) ou 0 (si A joue a3)


∧ ∧ ∧
b2 : 6 (si A joue a1) ou 2 (si A jouea2) ou 2 (si A joue a3)

b2 domine strictement b1.

è Méthode d’élimination des stratégies dominées (MESD) : le joueur A va éliminer a1 et


le joueur B va éliminer b1.

10
On obtient un jeu sous forme réduite (chaque joueurs anticipe parfaitement ce que va
faire l’autre ; hypothèses d’information complète et de connaissance commune) :

Joueur B
b2
Joueur A a2 (2, 2)
a3 (0, 2)

Dans ce jeu sous forme réduite :


a2 : 2

a3 : 0

a2 domine strictement a3. Le joueur A va donc éliminer a3.

Avec la méthode d’ESD, on obtient une issue au jeu ou un équilibre avec


ESDcorrespondant à la combinaison de stratégies : (a2, b2). A cet équilibre, les joueurs
réalisent des gains de (2, 2). Cet équilibre est sous optimal selon le critère de Pareto.

2.2- La méthode de Nash => équilibre de Nash

Joueur B
b1 b2
a1 (2, 2) (6*, 4*)
Joueur A a2 (4, 4*) (4, 2)
a3 (6*, 2) (2, 4*)

Le joueur A n’a pas de stratégies dominées et pas de stratégies dominantes.


Le joueur B n’a pas de stratégies dominées, ni dominantes.
Ainsi le jeu n’a pas d’issue, ne comporte pas de solution. Il n’existe pas d’équilibre avec la
MESD.

John Forbes NASH (1951) a établi un nouveau critère de sélection des stratégies
(méthode de Nash) : une solution ou un équilibre de Nash est une combinaison de
stratégies, telle que la stratégie de chaque joueur correspond à un meilleur choix
possible étant donné les stratégies choisies par les autres joueurs.

a) Il s’agit de définir les meilleures réponses des joueurs aux stratégies choisies par les
autres joueurs.

En ce qui concerne le joueur A (détermination de l’ensemble des meilleures réponses du


joueur A en fonction des stratégies choisies par le joueur B)
- Si le joueur B joue b1, la meilleure réponse du joueur A va être de jouer a3 (le gain de
a3 est de 6, supérieur aux gains de a2 (4) et de a1 (2). D’où l’* au niveau du gain de a3
(6).
- Si le joueur B joue b2, la meilleure réponse du joueur A va être de jouer a1 (le gain de
a1 est 6, supérieur aux gains de a2 (4) et de a3 (2). D’où l’* au niveau du gain de a1 (6).

11
L’ensemble des meilleures réponses du joueur A (aux différentes stratégies du joueur B)
est : (a3, a1)
ê
(6, 6)

En ce qui concerne le joueur B (détermination de l’ensemble des meilleures réponses du


joueur B en fonction des stratégies choisies par le joueur A).
- Si le joueur A joue a1, la meilleure réponse de B va être de jouer b2 (car b2 rapporte un
gain de 4qui est supérieur au gain de2 associé à b1 = 2). D’où l’* au niveau du gain de b2
(4).
- Si je joueur A joue a2, la meilleure réponse de B va être de jouer b1 (car b1 rapporte un
gain de 4, supérieur au gain de 2 de b2). D’où l’* au niveau du gain de b1 (4).
- Si je joueur A joue a3, la meilleure réponse de B va être de jouer b2 (car b2 rapporte un
gain de 4, supérieur au gain de 2 de b1). D’où l’* au niveau du gain de b2 (4).

L’ensemble des meilleures réponses du joueur B (aux différentes stratégies du joueur A)


est : (b2, b1, b2)
ê
(4, 4, 4)

b) L’équilibre de Nash correspond ensuite àl’intersection des ensembles des meilleures


réponses des deux joueurs : ici c’est la combinaison de stratégie (a1, b2), à laquelle
correspond le gain (6, 4). Les individus n’ont pas intérêt à dévier de cette solution : « a1
est la meilleure réponse à b2 qui est aussi la meilleure réponse à a1 ».

Autre exemple ci-dessous :

Joueur B
b1 b2 b3 b4
Joueur A a1 3 -2 -1 6
a2 2 2 1 3

C’est un jeu strictement compétitif, ne figure que les gains du joueur en ligne, ceux du
joueur en colonne étant les « symétriques », ce qui donne la matrice des paiements ci-
dessous :

Joueur B
b1 b2 b3 b4
Joueur A a1 3, -3 -2, 2 -1, 1 6, -6
a2 2, -2 2, -2 1, -1 3, -3

En appliquant la MESD, on s’aperçoit que dans le jeu initial, le joueur A n’a pas de
stratégies dominées. Par contre pour le joueur B, b4 est strictement dominée par b1, b2,
b3 et b1 est dominée au sens faible par b2 et au sens fort par b3. Avec la MESD, le joueur
B élimine donc b4 et b1 pendant que le joueur A garde l’ensemble de ces stratégies.

12
On obtient le jeu sous forme réduite suivant :

Joueur B
b2 b3
Joueur A a1 -2, 2 -1, 1
a2 2, -2 1, -1


Dans ce jeu sous forme réduite, a2 domine strictement a1. Donc le joueur A va éliminer
a1.

On obtient un nouveau jeu sous forme encore réduite :

Joueur B
b2 b3
Joueur A a2 2, -2 1, -1

Ici, b3 domine strictement b2. Le joueur B élimine donc b2.

Ce jeu comporte un équilibre avec ESD: (a2, b3) ó (1, -1)

Joueur B
b1 b2 b3 b4
Joueur A a1 3*, -3 -2, 2* -1, 1 6*, -6
a2 2, -2 2*, -2 1*, -1* 3, -3


En appliquant la méthode de Nash (voir plus haut pour la méthodologie), ce jeu
comporte une solution ou un équilibre de Nash : (a2, b3) ó (1, -1).

2.3- Stratégies de sécurité => équilibre avec stratégie de sécurité (SS)



Joueur B
b1 b2 b3 b4
Joueur A a1 3, -3 -2, 2 -1, 1 6, -6
a2 2, -2 2, -2 1, -1 3, -3

Avec cette méthode , il s’agit d’identifier la(les) stratégies(s) de sécurité (SS) des
joueurs. Une SS se caractérise par un comportement prudent et rationnel des joueurs.
La « prudence » pour un joueur consiste à identifier le gain minimum pour chacune de
ces stratégies ; la « rationalité »le conduit à sélectionner la stratégie qui maximise le gain
minimum obtenu avec les différentes stratégies. On parle aussi de stratégie maxi-min.

Si le joueur A joue a1 : gain minimum : -2
Si le joueur A joue a2 : gain minimum : 1
è Stratégie de sécurité (celle qui a le plus grand gain minimum) du joueur A= a2

13
Si le joueur B joue b1 : gain minimum = -3
Si le joueur B joue b2 : gain minimum = -2
Si le joueur B joue b3 : gain minimum = -1
Si le joueur B joue b4 : gain minimum = -6
è Stratégie de sécurité (celle qui a le gain minimum le plus élevé ou la perte la plus
faible) du joueur B = b3

La solution du jeu quand les joueurs adoptent leur stratégie de sécurité correspond à la
combinaison de stratégies (a2, b3), à laquelle correspondent le couple de gains : (1, -1).
Cette solution est-elle stable ? Oui car les joueurs n’ont pas intérêt à dévier : si A choisit
a2, B choisit b3 et inversement si B choisit b3, A choisit a2.

Autre exemple :

Joueur B
b1 b2 b3 b4
Joueur A a1 3*, -3 -2, 2* -1, 1 6*, -6
a2 2, -2 2*, -2 1*, -1 -3, 3*

Avec la méthode de Nash, il n’y a pas d’équilibre de Nash (intersection de l’ensemble des
meilleures réponses est vide ; pas deux * présentes simultanément au niveau des gains
d’une combinaison de stratégies)

Joueur A joue a1 : gain minimum : -2


Joueur A joue a2 : gain minimum : -3
è Stratégie de sécurité de A = a1.

Si le joueur B joue b1 : gain minimum = -3


Si le joueur B joue b2 : gain minimum = -2
Si le joueur B joue b3 : gain minimum = -1
Si le joueur B joue b4 : gain minimum = -6
è Stratégie de sécurité de B = b3.

Solution préconisée par la méthode des SS : (a1, b3). Est-ce que cette solution est
stable ? Non car si A joue a1, B n’a pas intérêt à jouer b3, il aura intérêt à jouer b1 qui lui
rapporte un gain de 3 supérieur au gain de 1 associé à b1. Une solution déterminée par à
l’aide de la méthode avec SS n’est pas stable à partir du moment où un des joueurs a
intérêt à dévier de sa SS.

2.4- Problèmes associés aux différentes méthodes de détermination de solution en jeux


statiques/simultanés

Problème 1 : non existence de l’équilibre => jeu indéterminé car il ne comporte aucune
solution (« échec » de la théorie des jeux qui n’arrive pas à prédire la solution d’un jeu) ;
ce problème peut se poser avec la MESD, la méthode de Nash, mais pas avec celle des SS
qui implique toujours une solution (le problème est que cette solution n’est pas
forcément stable).

14
Problème 2 : existence de plusieurs équilibres => jeu indéterminé car il comporte
plusieurs solutions (« échec » de la théorie des jeux qui n’arrive pas à prédire une seule
et unique solution d’un jeu). Ce problème 2 peut se poser avec la méthode de Nash, la
MESD et la méthode des SS.
Exemple de la « Guerre des sexes » (avec application de la méthode de Nash) :
Un couple marié n’est pas d’accord sur le but de leur sortie commune (Monsieur préfère
aller au cinéma/Madame préfère faire du shopping).
Ils disposent chacun de deux stratégies : être intransigeant (I) ou transiger (T).
L’absence d’accord par excès d’intransigeance est la pire des situations possibles
(divorce).Si les deux époux sont transigeant, ils vont être incapables de se mettre
d’accord mais sont dans une situation préférable à la précédente (ils ne sortent pas et
restent chez eux pour bouquiner). Ils préfèrent quand même sortir que de rester chez
eux même si leur préférence n’est pas satisfaite. On obtient donc la matrice des
paiements suivante :

Madame
I T
Monsieur I (1, -1) (4*, 2*)
T (2*, 4*) (1, 1)

Deux équilibres de Nash : (I, T) et (T, I) => jeu indéterminé, on ne sait pas ce que vont
faire les joueurs (à moins de rajouter une hypothèse complémentaire).

Problème 3 : Sous-optimalité de l’équilibre => problème pour la théorie des jeux qui ne
permet pas de déterminer de solution optimale aux jeux. Ce problème 3 peut se poser
avec la méthode de Nash, la méthode d’ESD, et la méthode des SS.
Exemple du « Dilemme des prisonniers »:
Deux individus ont commis ensemble un crime, pour lequel ils ne sont pas arrêtés. Par
la suite, ils commettent un vol pour lequel ils sont arrêtés. Nicolas et Nadège sont
interrogés séparément (dans des pièces différentes) et ils ne peuvent pas communiquer
entre eux. Les deux individus ont deux stratégies : se taire (T) ou parler
(avouer/dénoncer) (P). Le fait de parler, d’avouer ou de dénoncer sert de preuve pour le
crime. Voici le marché proposé par la police :
- Si les deux individus se taisent, seule condamnation pour vol : 5 ans chacun.
- Si l’un parle, alors que l’autre se tait, celui qui parle sera libéré et celui qui a gardé
le silence aura une condamnation de 30 ans.
- Si les deux individus parlent : condamnation de 15 ans chacun (crime + vol).
Les deux individus sont au courant du marché proposé par la police.

Individu B
P T
Individu A P (15 ans, 15 ans) (0, 30 ans)
cas n°1 cas n°2
T (30 ans, 0) (5 ans, 5 ans)
cas n°3 cas n°4

Pour l’individu A: cas n°2 est préféré au cas n°4,qui est lui même préféré au cas n°1, qui
est lui même préféré au cas n°3.

15
Pour l’individu B : cas n°3est préféré au cas n°4 , qui est lui même préféré au cas n°1 ,qui
est lui même préféré au cas n°2.

Donc, il faut que (U représentant l’utilité procurée par chaque situation) :


Pour individu A : U (cas n°2) > U (cas n°4) > U (cas n°1) > U (cas n°3).
Pour individu B : U (cas n°3) > U (cas n°4) > U (cas n°1) > U (cas n°2).

U(x)= -x (x= nombres d’années passées en prison).

Pour individu A: U (cas n°2) = 0> U (cas n°4) = -5 > U (cas n°1)= -15 > U (cas n°3)= -30
Pour individu B: U (cas n°3) =0 > U (cas n°4) = -5 > U (cas n°1) = -15 > U (cas n°2)= -30

Nicolas
P T
Nadège P (-15*, -15*) (0*, - 30)

T (-30, 0*) (-5, -5)

Que ce soit avec la méthode de Nash, avec la MESD ou avec la méthode des SS, la solution
ou l’équilibre du jeu correspond à la combinaison de stratégies (P, P)ó (-15, -15). Cet
équilibre se traduit par la fait que les deux individus parlent et écopent de 15 ans de
prison chacun. Cet équilibre est sous-optimal selon le critère de Pareto car il existe une
autre configuration qui lui est préférée (T, T) ó (-5, -5) mais cette configuration n’est
pas un équilibre (parce ce que les joueurs ont intérêt à dévier ; si l’un des joueurs se tait,
l’autre à intérêt à parler pour être libéré).

16
CHAPITRE II : LES JEUX DYNAMIQUES EN INFORMATION COMPLETE


Les jeux dynamiques sont des jeux séquentiels ou dynamiques en information parfaite
(voir introduction pour la définition des jeux en information parfaite) et ici on suppose
que l’information est également complète (voir introduction pour la définition des jeux
en information complète). Les jeux séquentiels ou dynamiques sont à « plusieurs
coups », i.e. ils comprennent plusieurs étapes (au moins deux) où interviennent les
joueurs. Nous allons d’abord nous intéresser aux formes de représentations possibles de
ces jeux avant d’analyser les différentes méthodes qui permettent de trouver une issue,
ou une solution, ou encore un équilibre à ce type de jeux (résolution des interactions
stratégiques qui est l’objet principal de la théorie des jeux). Il s’agit d’analyser la portée
et les limites de ces méthodes (ou de l’équilibre associé) pour avoir un regard critique
sur la portée de la théorie des jeux comme « outil d’aide à la décision ».

Section 1- Les formes de représentation des jeux dynamiques


1.1- Représentation extensive ou arborescente



Exemple 1:Jeu strictement compétitif (JSC)

Deux joueurs A et B disposent de plusieurs actions. Le joueur A commence à jouer ; il a le
choix entre jouer g ou d. Ensuite, c’est au joueur B de jouer ; s’il constate que A a joué g,
alors il aura le choix entre jouer G ou D et le jeu se termine par la victoire de A si B joue G
et par la fait que A perde le jeu si B joue D. Par contre si le joueur B constate que A a
commencé par jouer d, il aura le choix entre jouer G, ou M ou D : le jeu s’arrête (avec une
victoire de A), sauf quand le joueur B a joué G. Dans ce cas, A peut rejouer à nouveau et a
le choix entre jouer g ou d. Le jeu est ensuite terminé, par la victoire de A s’il joue d et
par le fait que A perde le jeu s’il joue g.

P V

g
d
Etape 3 (nœud 4)
V P A 4 V V

G D G M D

B 2 B 3 Etape 2 (nœud 2 ou
3)


g d

A 1 Etape 1 (nœud 1)

17
V (aux nœuds finals) désigne le fait que A gagne le jeu ó V, P (A gagne et donc B perd)
ó10, -10 (A gagne 10 et donc B perd 10)
P (aux nœuds finals) désigne le fait que A perde le jeu ó P, V (A perd et donc B gagne)
ó -10, 10 (A perd 10 et donc B gagne 10)

Les chiffres 1, 2, 3 ou 4 matérialisent des nœuds qui constituent un seul et unique
ensemble d’information (au moment où il joue, tout joueur sait ce que l’autre a joué
précédemment).


Exemple 2 : Jeu non strictement compétitif(JNSC)
Deux joueurs A et B. A commence le jeu et a le choix entre deux actions : g ou d. S’il joue
d, le jeu est terminé, chacun des joueurs réalise un gain de 6. Si le joueur A joue g, alors B
est amené à choisir entre G ou D ; s’il joue G, le joueur B fait un gain nul et A réalise un
gain de 12 ; s’il joue D, B fait un gain nul et A aussi.


(12, 0) (0, 0)

G D

(6, 6) Etape 2
B 2

g
d

A 1 Etape 1

Les gains du joueur qui commence le jeu figurent à gauche (au niveau des nœuds finals)
et ceux du joueur qui intervient après figurent à droite (au niveau des nœuds finals)

1.2- Représentation normale ou stratégique ou statique

Exemple 1 : JSC

Il faut d’abord définir les stratégies des joueurs pour les situer ensuite dans la forme
normale, stratégique, ou dans la matrice des paiements.

Stratégies du joueur A. A intervient aux nœuds 1 et 4 ó ses stratégies comportent deux
éléments (une action possible au nœud 1 et une action possible au nœud 4). Au nœud 1,
A dispose de deux actions ; au nœud 4, A dispose de deux actions. Au total, A disposera
de 2x2= 4 stratégies. Soit n = nœud.

gg (cela signifie que A envisage de jouer gau n1et g au n4) ;gd (cela signifie que A
envisage de jouer g au n1 et d au n4) ; dg (cela signifie que A envisage de jouer d au n1
et g au n4) ;dd (cela signifie que A envisage de jouer d au n1 et d au n4) .

18
Stratégies du joueur B. B intervient aux nœuds 2 et 3ó ses stratégies comportent deux
éléments. Au nœud 2 : B a deux actions possibles. Au nœud 3 : B a trois actions possibles.
Au total, B disposera de 2x3 => 6 stratégies

GG (cela signifie que B envisage de jouer G au n2 et G au n3) ; GM (cela signifie que B


envisage de jouer G au n2 et M au n3) ; GD (cela signifie que B envisage de jouer G au
n2 et D au n3) ; DG (cela signifie que B envisage de jouer D au n2 et G au n3) ; DM (cela
signifie que B envisage de jouer D au n2 et M au n3) ; DD (cela signifie que B envisage
de jouer D au n2 et D au n3).

Les stratégies comprennent des actions qui ne sont pas amenées à se réaliser lors du
déroulement effectif du jeu (cela vaut pour les deux joueurs) mais selon la définition
analytique de la notion de stratégie, celle-ci est un plan de décisions (ou plan d’actions)
et tous les cas de figure (potentialités) doivent être envisagés avant le déroulement
même du jeu.

Le joueur qui commence le jeu est en ligne (ainsi que ses stratégies) et le joueur qui
intervient ensuite est en colonne (ainsi que ses stratégies). Comme c’est un JSC, les gains
(ou conséquences) qui figurent dans la matrice des paiements sont ceux du joueur qui
est en ligne (joueur qui commence le jeu).

Joueur B
GG GM GD DG DM DD
gg V V V P P P
gd V V V P P P
Joueur A dg P V V P V V
dd V V V V V V

On peut aussi représenter le jeu comme suit :

Joueur B
GG GM GD DG DM DD
gg V, P V, P V, P P, V P, V P, V
gd V, P V, P V, P P, V P, V P, V
Joueur A dg P, V V, P V, P P, V V, P V, P
dd V, P V, P V, P V, P V, P V, P

Ici les gains (ou conséquences) qui figurent à gauche sont ceux du joueur qui est en ligne
(joueur qui commence le jeu) et les gains (conséquences) symétriques (JSC) qui figurent
à droite sont ceux du joueur en colonne (celui qui ne commence pas le jeu mais
intervient après)

Exercice 2 : JNSC

Stratégies de A : A intervient en un seul nœud. Les stratégies ne comportent qu’un seul


élément. Nœud 1 : A dispose de deux actions possibles. Deux stratégies : g ou d.

19
Stratégies de B : B intervient en un seul nœud. Les stratégiesne comportent qu’un seul
élément. Nœud 2 : B dispose de deux actions possibles. Deux stratégies : G ou D.

Joueur B
G D
Joueur A g (12, 0) (0, 0)
d (6, 6) (6, 6)

Ici les stratégies se confondent avec les actions, ce qui est très rare dans les jeux
dynamiques (uniquement quand un joueur n’intervient qu’à un seul nœud ou ensemble
d’information.

Section 2- Les concepts d’équilibre

2.1- Equilibre de Nash (forme stratégique)

Soit s, une stratégie de A, et soit t, une stratégie de B. La combinaison de stratégie (s, t)


est un équilibre de Nash ó s est la meilleure réponse possible de A lorsque B choisit t, et
t est la meilleure réponse possible de B lorsque A choisit s (intersection des ensembles
des meilleures réponses des joueurs).

Exemple 1 :

Joueur B
GG GM GD DG DM DD
gg V*, P V*, P V*, P P, V* P, V* P, V*
gd V*, P V*, P V*, P P, V* P, V* P, V*
Joueur A dg P, V* V*, P V*, P P, V* V*, P V*, P
dd V*, P* V*, P* V*, P* V*, P* V*, P* V*, P*

Explications :
Si A joue gg, les meilleures réponses de B sont DG ou DM ou DD (cas où B gagne), B est
indifférent entre ces trois stratégies donc il les sélectionne toutes les trois (il n’a donc
pas une seulement meilleure réponse mais plusieurs).
Même raisonnement pour les autres meilleures réponses de B ou de A face aux
stratégies choisies par l’adversaire.
Si A joue dd, aucune stratégie de B ne lui permet de gagner, mais comme il est obligé de
jouer, il est indifférent entre toutes ses stratégies (qui ne l’amènent qu’à perdre), il les
sélectionne donc toutes par défaut.

Au total, le jeu comporte 6 équilibres de Nash (EN) associés aux combinaisons de


stratégies : (dd, GG) ; (dd, GM) ; (dd, GD) ; (dd, DG) ; (dd, DM) ; (dd, DD). Tous ces
équilibres conduisent à la victoire du joueur A quoique fasse B.

20
Exemple 2 :
Joueur B
G D
Joueur A g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)

Ce jeu comporte 2 EN : (g, G) (avec des gains de 12 pour 1 et de 0 pour B) et (d, D) (avec
des gains de 6 pour chacun des joueurs).

2.2- Equilibre parfait en sous-jeux (EPSJ) (forme extensive)



Forme extensive : méthode de l’algorithme de ZERMELO (A.Z) ou de « l’induction
rétrospective » ou de la « récurrence à rebours ».

Exemple 1 : JSC

P V

g d

V P A 4 V V

G D G M D

B 2 3 B

g d

A 1

Il faut d’abord déterminer les différents sous-jeux sachant qu’un « sous-jeu » est un je
qui commence à partir d’un ensemble d’information donné.
Quatre sous-jeux : J4, J3, J2, J1 (J1 = jeu dans son intégralité)

Il faut ensuite considérer chaque sous-jeu en partant de la fin du jeu (dernière étape)
pour revenir progressivement aux sous-jeux intermédiaires (étapes intermédiaires) et
finalement au premier sous-jeu (première étape).
A chaque étape (en commençant vers la fin pour revenir vers le début), on identifie la ou
les meilleures actions possibles du joueur concerné.

Méthode de l’A.Z :
- A la dernière étape (étape 3), au sous-jeu J4, la meilleure action de A est de jouer
d car il gagne (sinon en jouant g il perd le jeu). On surligne la branche d en rouge.
- A la deuxième étape (étape 2), au sous-jeu J3 (qui comprend ensuite le sous-jeu
J4), B est indifférent entre G, M et D ; en jouant M et D, il perd le jeu ; en jouant G,

21
il sait que A aura intérêt à jouer d, et dans ce cas B perd le jeu. Les « meilleures »
actions de B sont G ou M ou D (par défaut). On les surligne en rouge.
- A la deuxième étape (étape 2), au sous-jeu J2, B a intérêt à jouer D car cela lui
permet de gagner le jeu (sinon il perd le jeu) ; sa meilleure action est D. On la
surligne en rouge.
- A la première étape, au sous-jeu J1, A a intérêt à jouer d, car il sait que B jouera
indifféremment G, M ou D ; si B joue M ou D, A gagne, et si B joue G, A sait qu’il
termine le jeu et qu’il jouera d pour gagner. Si A joue g, il sait que B jouera D et A
sait qu’il perd alors le jeu. Son action rationnelle est de jouer d. On la surligne en
rouge.

L’EPSJ correspond à une combinaison de stratégie comprenant des actions rationnelles


des joueurs. Ici il y a 3 EPSJ : (dd, DG) ; (dd, DM) ; (dd, DD).
Pour le premier équilibre, A commence par jouer d, puis au nœud 3, B joue G et A gagne
le jeu (premier sentier d’équilibre). Pour le deuxième équilibre, A commence par jouer d,
puis au nœud 3, B joue M et A gagne le jeu (deuxième sentier d’équilibre). Pour le
troisième équilibre, A commence par jouer d, puis au nœud 3, B joue D, ce qui amène A à
jouer au nœud 4, il joue d et gagne le jeu (troisième sentier d’équilibre). On voit que
dans les stratégies des EPSJ, certaines actions ne sont pas amenées à se réaliser lors du
déroulement effectifs du jeu mais elles correspondent toutes à des actions rationnelles
de la part des joueurs.
Ne pas confondre les sentiers d’équilibre (qui comprennent les actions respectives des
joueurs) des EPSJ qui correspondent à des combinaisons de stratégies.

On a vu que ce jeu comportait 6 EN : (dd, GG) ; (dd, GM) ; (dd, GD) ; (dd, DG) ; (dd, DM) ;
(dd, DD). Trois de ces équilibres ne sont pas des EPSJ : (dd, GG) ; (dd, GM) ; (dd, GD).
=>Tout Equilibre Parfait en Sous-Jeu (EPSJ) est un Equilibre de Nash (EN), mais tout EN
n’est pas forcément un EPSJ.
Exemple : (dd, GG) est un Equilibre de Nash mais n’est pas un Equilibre Parfait en Sous-
Jeu. Il contient une action irrationnelle pour le joueur B (consistant à jouer G au nœud 2
mais cette action irrationnelle n’est pas amenée à être prise ou à se réaliser lors du
déroulement effectif du jeu (A joue d au nœud 1, et B joue G au nœud 3). Lorsque l’on
suit le sentier d’équilibre (déroulement effectif du jeu), les joueurs agissent de manière
rationnelle, mais hors de ce sentier, les joueurs peuvent être amenés à jouer de manière
irrationnelle. Tout équilibre de Nash qui n’est pas un EPSJ comprend au moins une
action irrationnelle d’un des joueurs qui n’est pas amenée à être effective (menace non
crédible). Par contre, tout équilibre de Nash qui est un EPSJ comporte des actions
rationnelles des joueurs.

Comparaison des Equilibres Parfaits en Sous-Jeu :

- (s, t) et (s’, t’) sont équivalents s’ils aboutissent au même résultat (même conséquence,
ê ê mêmes gains, même utilité).
(dd, DG) et (dd, DM)

(dd, DG) è V Les équilibres sont équivalents.


(dd, DM) è V

22
- (s, t) et (s’, t’) sont interchangeables si le fait d’interchanger les stratégies d’équilibre
entre elles, débouche sur un équilibreó (s, t’) et (s’, t) : les nouvelles combinaisons de
stratégies restent des équilibres.

(s, t’) : (dd, DM) est un équilibre
è donc (dd, DG) et (dd, DM) sont interchangeables.
(s’, t) : (dd, DG) est un équilibre


Exemple 2 : JNSC

Arbre 1 :

(12, 0) (0, 0)

G D

(6, 6)
B 2

g D

A 1

Arbre 2:

(12, 0) (0, 0)

G D

(6, 6)
B 2

g d

A 1


Deux sous-jeux : J2 et J1. Méthode A.Z :
- Etape 2 : au sous-jeu J2, B est indifférent entre jouer G ou D car il reçoit les mêmes
gains (0). Les meilleures actions possibles sont G ou D. dès qu’un joueur a plusieurs
actions rationnelles possibles il faut « dupliquer » l’arbre pour représenter ce qui se
passerait dans chacune des configuration (ici un arbre pour l’action rationnelle G ó
arbre 1 ; et un deuxième arbre pour l’action rationnelle D ó arbre 2).
Dans les JSC, il n’est pas nécessaire de « dupliquer l’arbre, mais pour les JNSC il faut
dupliquer l’arbre dès qu’un joueur a au moins plus d’une action rationnelle à un
nœud/ensemble d’information.

23
- Etape 1 : au sous-jeu J1, avec l’arbre 1, le joueur A va jouer g, car il sait que B joue G et
le gain associé à g est de 12 > au gain associé à d (6). Avec l’arbre 2, A va jouer d, car il
sait que B joue D et le gain associé à d est 6 > au gain associé à g (0).

Ce jeu comporte deux EPSJ correspondant aux combinaisons de stratégies : (g, G) et
(d, D)

(s, t)ó(g, G)ó(12, 0)
èLes deux équilibres ne sont pas équivalents
(s’, t’)ó(d, D)ó(6, 6)

(s, t’) ó (g, D) n’est pas un équilibre
èLes deux équilibres ne sont pas interchangeables

(s’, t) ó (d, G) n’est pas un équilibre

Problèmes posés par l’A.Z :

1/ L’A.Z repose sur une hypothèse forte : chaque joueur est capable d’évaluer l’influence
de ses propres décisions sur les actions futures des autres joueurs en connaissant leurs
gains, leurs décisions possibles et en sachant qu’ils sont rationnels. Ce principe est limité
dès que les individus sont confrontés à des situations qui impliquent un nombre trop
important de décisions (actions) et de séquences temporelles.

2/ l’A.Z conduit à plusieurs EPSJ et une multiplicité d’équilibres ; le jeu est indéterminé.
La théorie des jeux ne peut pas prédire une seule et unique solution au jeu.

3/ l’ A.Z peut conduire à des résultats contre intuitifs : EPSJ sous-optimal selon le critère
de Pareto.

(5, 5) (0, 6)

G D

(1, 1)
B 2

g
d

A 1

Stratégies de A : g ou d
Stratégies de B : G ou D
Ce jeu comporte un EPSJ : (d, D) ó (1, 1) sous-optimal selon le critère de Pareto, car il
existe une configuration qui lui est préférée (g, G) ó (5, 5) où les gains sont supérieurs
pour les deux joueurs, mais cette configuration n’est pas un équilibre (elle ne comprend
pas d’action rationnelle de la part des deux joueurs).

24
2.3- Méthode d’Elimination des Stratégies Dominées (MESD) et équilibre avec
élimination des stratégies dominées (ESD)

Pour les définitions des stratégies dominées (dominantes) au sens strict ou au sens
faible, voir chapitre 1. Cette méthode s’applique à la forme stratégique du jeu mais nous
allons donner les résultats principaux des autres méthodes (exercices supplémentaires)


(1, 0) (2, 3) (0, 1) (3, 2)

b1 b2 b1 b2


B 2 B 3 Etape 2

a1 a2


A 1 Etape 1

Actions de A : a1 ou a2 ; actions de B : b1 ou b2

Stratégies de A : a1 ; a2
Stratégies de B : b1b1 ; b1b2 ; b2b1 ; b2b2
Ce jeu ne comporte qu’un seul EPSJ, soit la combinaison de stratégies : (a2, b2b2) (les
actions rationnelles étant surlignés en rouge)

Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1*, 0) (1, 0) (2*, 3*) (2, 3*)
a2 (0, 1) (3*, 2*) (0, 1) (3*, 2*)

3 EN : (a1, b2b1) ; (a2, b1b2) ; (a2, b2b2). Les EN (a1, b2b1) ; (a2, b1b2) ne sont pas des EPSJ ;
seul l’équilibre de Nash (a2, b2b2) est un EPSJ.

Les EN qui ne sont pas des EPSJ comportent au moins une action irrationnelle d’un
joueur hors du sentier d’équilibre. Tout EN qui n’est pas un EPSJ peut reposer sur des
menaces non crédibles.
Par exemple, prenons l’EN (a1, b2b1) qui n’est pas un EPSJ. Ce dernier repose sur une
menace non crédible.
- MENACE : B dit à A : je veux a1 au nœud 1 (surligné en vert) pour pouvoir jouer b2 au
nœud 2 (surligné en vert), auquel cas B fait un gain de 3 et A ferait un gain de 2. B
menace A en lui disant « si tu ne joues pas a1 et que tu joues a2 au nœud 1, alors je
jouerai b1 », auquel cas A se verrait avoir un gain nul.
- NON CREDIBLE : si A n’écoute pas B et qu’il joue a2 au nœud 1, B se retrouve confronté
au choix suivant : mettre sa menace à exécution auquel cas B ferait un gain de 1, ou ne
pas mettre sa menace à exécution, auquel cas B ferait un gain de 2. Comme il est
rationnel (pas animé par un sentiment de rancune ou autre), alors il aura intérêt à ne

25
pas mettre sa menace à exécution, ce que A sait (hypothèse de connaissance commune
et information parfaite), raison pour laquelle il jouera a2 (et pas a1).

Application de la MESD :
Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1, 0) (1, 0) (2, 3) (2, 3)

a2 (0, 1) (3, 2) (0, 1) (3, 2)

Pour appliquer la MESD, il faut suivre l’ordre de l’A.Z., i.e. commencer par s’intéresser
aux stratégies dominées du dernier joueur pour revenir progressivement vers le
premier joueur et s’intéresser à ces stratégies dominées (il y a autant d’itérations que
d’étapes mais pas plus).

Joueur B : b1b1 et b1b2 b1b1 et b2b1 b1b1 et b2b2


0 = 0 0 < 3 0 < 3
ou ou ou ou ou ou
1 < 2 1 = 1 1 < 2
b1b1 est faiblement b1b1 est faiblement b1b1 est strictement
dominée par b1b2 dominée par b2b1 dominée par b2b2

Ensuite,
b1b2 est faiblement dominée par b2b2
0 < 3
ou ou
2 = 2

b2b1 est faiblement dominée par b2b2


3 = 3
ou ou
1 < 2

è b2b2 domine faiblement b1b2 et b2b1

Le Joueur B a donc uns stratégie dominante b2b2, il élimine les trois autres stratégies
dominées.

Ce qui nous donne un jeu sous forme réduite :

Joueur B
b2 b2
Joueur A a1 (2, 3)

a2 (3, 2)

Dans ce jeu sous forme réduite, a1 est strictement dominée par a2 car les gains de a1 (=2)
sont strictement inférieurs à ceux de a2 (= 3) et ce quelle que soit la stratégie adoptée
par le joueur B. A élimine sa stratégie dominée a1.

26

Au final ce jeu ne comporte qu’un équilibre avec ESD : (a2, b2b2) = EN = EPSJ.

Autre exemple :

Soit un joueur A qui dispose de deux actions possibles : a1 ou a2 ; il joue en premier.
Ensuite le joueur B intervient avec deux actions possibles : b1 ou b2. En fonction de ce
que jouent les joueurs, les gains sont mentionnés dans l’arbre ci-dessous.




(1, 1) (100, 0) (0, 100) (100, 100)

b1 b2 b1 b2


B 2 B 3 Etape 2

a1 a2


A 1 Etape 1


En appliquant l’A.Z., on voit que le joueur B a deux actions rationnelles possibles au
nœud 3 (b1 et b2 lui rapportent 100), il est donc indifférent entre ces deux actions et il
faut dupliquer l’arbre en deux pour voir ce qui se passe dans chacune des configurations
(quand il choisit b1 ou quand il choisit b2).

Arbre 1 :

(1, 1) (100, 0) (0, 100) (100, 100)

b1 b2 b1 b2

Etape 2
B 2 B 3

a1 a2


A 1 Etape 1

27
Arbre 2 :

(1, 1) (100, 0) (0, 100) (100, 100)

b1 b2 b1 b2

Etape 2
B 2 B 3

a1 a2

A 1 Etape 1

Les actions rationnelles des joueurs A et B sont surlignées en rouge (cf. plus haut pour
description de la méthodologie). En appliquant la méthode de l’A.Z. on commence par
identifier les actions rationnelles en chaque sous-jeu (en commençant par la fin du jeu,
dernière étape, pour revenir au début du jeu, première étape).

Le jeu comporte 2 EPSJ : (a2, b1b2) et (a1, b1b1)


ê ê
(100, 100) (1, 1)

Joueur B
b1 b1 b1 b2 b2 b1 b2 b2
Joueur A a1 (1, 1) (1, 1) (100, 0) (100, 0)

a2 (0, 100) (100, 100) (0, 100) (100, 100)

Joueur B : b1b1 et b1b2 b2b1 et b2b2


Si A joue a1 : 1 > 0
ou ou
Si A joue a2 : 100 = 100

b1b1 et b1b2 dominent faiblement b2b1 et b2b2 ou b2b1 et b2b2 sont faiblement dominées
par b1b1 et b1b2. Le joueur B élimine b2b1 et b2b2

On obtient un jeu sous forme réduite:


Joueur B
b1 b1 b1 b2
Joueur A a1 (1, 1) (1, 1)
a2 (0, 100) (100, 100)

a1 : 1 ou 1
∨ ∧

a2 : 0 ou 100

28
a1 ne domine pas a2 et a2 ne domine pas a1. Le joueur A n ‘élimine aucune de ces
stratégies.

Le jeu comporte 4 équilibres avec ESD : (a1, b1b1) (qui est aussi un EPSJ) ; (a2, b1b2) (qui
n’est pas un EPSJ) ; (a2, b1b1) (qui n’est pas un EPSJ), et (a2, b1b2) (qui est un EPSJ). La
MESD peut déterminer des équilibres qui ne comportent pas tous des actions
rationnelles de la part des joueurs (même si celles-ci ne sont pas amenées à être prises
effectivement lors du déroulement du jeu).

Autre exemple: reprise JNSC développé aux sections 1 et 2

2 EPSJ : (g, G) et (d, D)


ê ê
(12, 0) (6, 6)

Joueur B
G D
Joueur A : g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)

2 EN : (g, G) et (d, D)

G D
Joueur B : 0 = 0
Si A joue g
ou ou
6 = 6 Si A joue d
Le joueur B n’a pas de stratégies dominées

g : 12 ou 0
Joueur A : ∨ ∧
d : 6 ou 6
si B joue G si B joue D
Le joueur A n’a pas de stratégies dominées

Ce jeu ne comporte pas d’équilibre avec MESD.

2.4- Stratégies de sécurité et solution d’un jeu dynamique

Reprise de l’exemple 2, JNSC aux sections 1 et 2

Joueur B
G D
Joueur A g (12*, 0*) (0, 0*)
d (6, 6*) (6*, 6*)

2 EN : (g, G) et (d, D)

29
Joueur A : stratégie g : gain min = 0
stratégie d : gain min = 6
SS de A est d (gain minimum supérieur)

Joueur B : stratégie G : gain min = 0


stratégie D : gain min = 0
SS de B : G et D (mêmes gains)

Deux solutions avec la méthodes des SS : (d, G) (qui n’est pas un EN) et (d, D) (qui est
un EN).
La solution (d, G) n’est pas stable : si A joue d, B est indifférent entre jouer G ou D (B ne
dévie pas de sa stratégie de sécurité) ; par contre si B joue G, alors A aura intérêt à
dévier de sa stratégie de sécurité car A a intérêt à jouer g(12) > d(6).
La solution (d, D) est stable : les joueurs n’ont pas intérêt à dévier de leurs stratégies de
sécurité (si A joue d, B a intérêt à jouer D, et vice versa, si B joue D alors A aura intérêt à
garder sa SS et à jouer d).

BIBLIOGRAPHIE INDICATIVE
K. Binmore : Jeux et théorie des jeux, De Boeck Université, 1999.
M. Cavagnac : Théorie des jeux, Gualino éditeur, 2006.
N. Eber : Théorie des jeux, Dunod, 2007.
G. Giraud : La théorie des jeux, Champs Université Flammarion, 2000.
B. Guerrien : La théorie des jeux, Economica, 2002.
D.M. Kreps : Théorie des jeux et modélisation économique, Dunod, 1999.
E. Rasmusen, Jeux et information, introduction à la théorie des jeux, De Boeck, 2004.
C. Schmidt : La théorie des jeux, essai d’interprétation, PUF, 2001.
A.R. Varian : Introduction à la microéconomie, De Boeck Université, 2006.

30

Vous aimerez peut-être aussi