Cours Théorie de Jeux

Vous aimerez peut-être aussi

Vous êtes sur la page 1sur 150

Théorie des graphes et

théorie des jeux

Théorie des jeux


Plan de cours
• Définition de jeux, forme normale et extensive
• les jeux simultanés ( statiques informations imparfaites)
• les jeux séquentiels (dynamiques information parfaites)
• Résolution et équilibre du jeu:
- équilibre de Nash,
- le dilemme du prisonnier,
- Stratégie dominante,
- Jeu de la poule mouillée,
• Fonctions de meilleures réponses,
• jeu en stratégies pures et jeu en stratégies mixtes
Qu’est ce qu’un jeu ?

• Un jeu se compose de :

– Un ensemble de joueurs.

– Un ensemble de stratégies/ Actions pour


chaque joueur.

– Des gains/ Play-off associés à chaque


stratégie des joueurs.
Exemple très simple de
jeu entre 2 agents
(sous forme normale )
Exemple

Jeu à 2 joueurs avec 2 stratégies possibles


• Les joueurs s’appellent A et B.
• Le joueur A a deux stratégies : “up” ou “down”.
• Le joueur B a deux stratégies : “Left” ou “Right”.
• La matrice des gains est représentée comme suit :

Joueur B
L R

(3,9) (1,8)
Joueur A U
D (0,0) (2,1)
Théorie des jeux

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

Les gains du joueur A sont (ici, )


Théorie des jeux

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

Les gains du joueur B sont ( , ici)


Théorie des jeux

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

Exemple : Si A joue Up et B joue Right alors A gagne


1 et B gagne 8
Théorie des jeux

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

Une situation de jeu est une paire (ex : (U,R) ) où


le premier élément est la stratégie choisie par le
joueur A et le deuxième élément est la stratégie
choisie par le joueur B
Théorie des jeux

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

Quel est le résultat de ce jeu ?


Théorie des jeux

Joueur B
L R
(U,R) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?
Théorie des jeux

Joueur B
L R
(U,R) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?

Si B joue Right alors la meilleure réponse de


A est Down. Ainsi les gains de A passeront
de 1 à 2. Donc (U,R) n’est pas possible.
Théorie des jeux

Joueur B
L R
(D,R) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?
Théorie des jeux

Joueur B
L R
(D,R) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?

Si B joue Right alors la meilleure réponse de A est Down.


Théorie des jeux

Joueur B
L R
(D,R) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?

Si B joue Right alors la meilleure réponse de A est Down.


Si A joue Down alors la meilleure réponse de
B est Right. Donc, (D,R) est possible.
Théorie des jeux

Joueur B
L R
(D,L) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?
Théorie des jeux

Joueur B
L R
(D,L) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?

Si A joue Down, la meilleure réponse de B est R, donc


(D,L) n’est pas possible.
Théorie des jeux

Joueur B
L R
(U,L) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?
Théorie des jeux

Joueur B
L R
(U,L) est-il
U (3,9) (1,8)
un résultat
Joueur A
D (0,0) (2,1) possible ?

Si A joue Up, la meilleure réponse de B est Left.


Si B joue Left, la meilleure réponse de A est Up.
Donc (U,L) est possible.
Théorie des jeux: notation
Un jeu en forme normale est décrit comme suit:

1. Un ensemble de N joueurs, J ≡ {1,2,…,N}


2. Chaque joueur i, i  J a un ensemble d’actions ( Strategies) Ai qui e
l’ensemble de toutes les actions possibles pour i. Soit ai Ai
, une
action ( Strategie ) particulière de Ai. On appelle ai un résultat du jeu
3. Chaque joueur a une fonction de payoff, Πi qui assigne un nombre
réel Πi(a), à chaque action du joueur i.
Joueur B
1) J= {Joueur A, Joueur B}
L R
2) S1 = S Joueur A= {U, D}; S2= S Joueur B= {L,R}
U (3,9) (1,8)
Joueur
3) Π1 (U)= 3 ou 1 Π1 (D)= 0 ou 2
A
D (0,0) (2,1)
Π2 (L)= 9 ou 0 Π2 (R)= 8 ou 1
Théorie des jeux : Exercice 1
Dilemme du prisonnier
:Enoncé
Deux suspects Ali et Fahd sont arrêtés par la police, mais la police manque de
:preuve pour les emprisonner. La police doit les faire avouer
 Si les deux avouent, ils auront chacun 4 ans de prison
 si l’un avoue et l’autre nie,
 Celui qui a avoué encourera 1 an de prison
 L’aute qui a nié encourera 10 ans de prison
 si les deux nient, ils auront chacun 2 ans de prison
Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions)
2) Représenter le jeu sous forme normale
3) Jouer le jeu: Qu’il sera le résultat de ce jeu ( nombre d’années de prison )?, Peut
on l’améliorer ? Comment ?
Théorie des jeux : Exercice 1
Dilemme du prisonnier

Solution
1) L’ensemble de joueurs J ={ Ali, Fahd}
L’ensemble de Stratégies ( Actions) A1 = A2 ={avoue, nie}
2) La forme normale de ce jeu est :

Fahd
avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

3) Le résultat de jeu est (4,4) ,


oui on peut l’améliorer si les deux prisonniers coopèrent
 Information parfaite/imparfaite
 Forme extensive
 Jeu séquentiel
 Jeu Simultané
Théorie des jeux: Information
parfaite/imparfaite
information parfaite ( jeu séquentiel)

On parle de jeu à information parfaite dans le cas de jeu sous forme extensive,


où chaque joueur a une connaissance parfaite de toute l'histoire du jeu.: On dit
alors qu'un jeu est à information complète si chaque joueur connaît lors de la
prise de décision :
• ses possibilités d'action
• les possibilités d'action des autres joueurs
• les gains résultants de ces actions

Un jeu à information incomplète est aussi à information imparfaite


- Les échecs sont à information complète et parfaite
- Le jeu de Poker : est à information incomplète et imparfaite
Théorie des jeux: Forme extensive
Définition
C’est un arbre (graphe connexe sans cycle) représentant les
déroulements possibles du jeu.:
 à chaque Sommet non terminal est associé un joueur : arrivé à
ce point du jeu c'est à son tour de jouer.
 Chaque arc représente chacune des actions (coups autorisés
par la règle) que ce joueur peut prendre à ce point du jeu.
 à chaque sommet terminal correspond un résultat du jeu donné
par vecteur des paiements (liste des gains attribués à chaque
Théorie des jeux: Forme extensive
Représentation Graphique
Théorie des jeux: Forme extensive
Représentation Graphique : Exemples
Bihi Bihi
L R L R

U (3,9) (1,8) Ali


Ali
U D U
D (0,0) (2,1) D
(3;9) (0;0) (1;8) (2;1)
Le trait …… Signifie que le jeu est simultané : c’est à dire Ali ne connait pas
B
l’action de Bihi
L R
A et B jouent en même temps
Si le jeu est séquentiel et Ali ne connait pas A1 A2
U
l’action de Bihi. la forme extensive du jeu sera D U D
comme suit:
(3;9) (0;0) (2;1)
A joue après B (1;8)
Théorie des jeux: Forme extensive
Exercice 2
papier, ciseau et caillou
• Enoncé : Il s’agit une jeu entre deux enfants Ali et leila, les deux choisissent un
objet parmi les 3 suivant : papier, ciseau et caillou. Selon ces choix, soit l’enfant
gagne le jeu soit il n y a pas de gagnant( s’ils choisissent le même objet) .
• Papier gagne contre caillou , ciseau gagne contre papier et caillou gagne
contre ciseau. Soit 2 le gain de l’enfant qui gagne, 0 le gain de celui qui perd et
1 le gain en cas d égalité.

Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions) de chaque joueur.
2) Représenter le jeu simultané en forme normale
3) Représenter le jeu simultané en forme extensive
4) Même question que (3) si Ali triche et observe le choix de Leila avant de jouer
4) Même question que (3) si Ali n’ observe le choix de Leila que s’elle choisit caillou
Théorie des jeux: Forme extensive
Exercice 2
papier, ciseau et caillou
Solution
Définition d’un
équilibre du jeu
Résolution d’un jeu et Equilibre
Les étapes de résolutions d’un jeu sont comme suit

1. Identifier les décisions de A


 Meilleure décision de A, compte tenu de B1
 Meilleure décision de A, compte tenu de B2, etc.

2. Identifier les décisions de B


 Meilleure décision de B, compte tenu de A1
 Meilleure décision de B, compte tenu de A2, etc.
3. On caractérise la solution du jeu, si elle existe
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (1/2)

1. Seules les décisions de


Ent. B A sont prises en
Matrice
compte
des gains Qd Qe 2. Seules les décisions de
* A sont retenues si B
choisit Qd
Qd (2, 2) (15,0) 3. On retient la décision
qui génère le plus gros
Ent. A gain
Qe (0,15) (10,10)
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (2/2)

1. Seules les décisions de


Ent. B A sont prises en
Matrice
compte
des gains Qd Qe 2. Seules les décisions de
* * A sont retenues si B
choisit Qe
Qd (2, 2) (15,0) 3. On retient la décision
qui génère le plus gros
Ent. A gain
Qe (0,15) (10,10)
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (3/5)

1. Seules les décisions de


Ent. B B sont prises en
Matrice
compte
des gains Qd Qe 2. Seules les décisions de
* ** B sont retenues si A
choisit Qd
Qd (2, 2) (15,0) 3. On retient la décision
qui génère le plus gros
Ent. A gain
Qe (0,15) (10,10)
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (4/5)

1. Seules les décisions de


Ent. B B sont prises en
Matrice
compte
des gains Qd Qe 2. Seules les décisions de
* ** B sont retenues si A
choisit Qe
Qd (2, 2) (15,0) 3. On retient la décision
qui génère le plus gros
Ent. A * gain
Qe (0,15) (10,10)
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (5/5)

1. Un jeu a un équilibre
Ent. B quand il génère une
Matrice
convergence des
des gains Qd Qe décisions stratégiques
* **
2. Le couple de stratégies
Qd (2, 3) (15,0) (Qd;Qd) est la solution
du jeu
Ent. A *
Qe (0,15) (10,10)
Résolution d’un jeu et Equilibre :
Exercice 3
Soient les deux société de l’aéronautique Boeing et Airbus qui décide de
Produire ou de Ne pas produire avec des play-off décrits selon un jeu
:dont la forme normale est la suivante

Airbus
P NP

P (-1,-1) (10,0)
Boeing
NP (0,10) (0,0)
Faites la résolution de ce jeu et trouver son équilibre
Résolution d’un jeu et Equilibre :
solution (1/5)

1. Seules les décisions de


Airbus Boeing sont prises en
P NP compte
2. Seules les décisions de
Boeing sont retenues si
P (-1,-1) (10,0) Airbus choisit de
produire
Boeing 3. On retient la décision
* qui génère le plus gros
NP (0,10) (0,0)
gain
Résolution d’un jeu et Equilibre :
solution (2/5)

1. Seules les décisions de


Airbus Boeing sont prises en
P NP compte
2. Seules les décisions de
*(10,0) Boeing sont retenues si
P (-1,-1) Airbus chosit de ne pas
produire
Boeing 3. On retient la décision
* qui génère le plus gros
NP (0,10) (0,0)
gain
Résolution d’un jeu et Equilibre :
solution (3/5)

1. Seules les décisions de


Airbus Airbus sont prises en
P NP compte
2. Seules les décisions de
* * Airbus sont retenues si
P (-1,-1) (10,0) Boeing choisit de
produire
Boeing 3. On retient la décision
* qui génère le plus gros
NP (0,10) (0,0)
gain
Résolution d’un jeu et Equilibre :
solution (4/5)

1. Seules les décisions de


Airbus Airbus sont prises en
P NP compte
2. Seules les décisions de
* * Airbus sont retenues si
P (-1,-1) (10,0) Boeing choisit de ne
pas produire
Boeing 3. On retient la décision
* * qui génère le plus gros
NP (0,10) (0,0)
gain
Résolution d’un jeu et Equilibre :
solution (5/5)

Ce jeu a deux équilibres


Airbus (convergence des
P NP décisions stratégiques)
 Le couple de tratégies
* *
P (-1,-1) (10,0)
(P;NP) est le premier
équilibre du jeu
Boeing  Le couple de stratégies
* * (NP;P) est le deuxième
NP (0,10) (0,0) équilibre du jeu.
Exemple de jeu sans équilibre
1/2
Faites la résolution de ce jeu et trouver son équilibre

Joueur 2
S1 S2

S1 (0,10) (10,0)
Joueur 1
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
2/2
Joueur 2
S1 S2

* *
S1 (0,10) (10,0)
Joueur 1
* *
S2 (10,0) (0,10)

Puisque il n y a pas de convergence de stratégie, ce jeu est un


jeu sans équilibre
Stratégie dominante ( Dominée)
EISD et équilibre du Nash
Stratégie dominante/ Dominée, EISD et équilibre du Nash

Notations

Un jeu en forme normale est décrit comme suit:


1. Un ensemble de N joueurs, J ≡ {1,2,…,N}
2. Chaque joueur i a un ensemble de Stratégies Si = {s1,s2, ..sni}
3. Chaque joueur i a une fonction de payoff, Πi qui assigne un nombre réel
Πi(s), à chaque action du joueur i.
Notation :
 s un profil de stratégies {s1,…..sn} / qlq soit i, si appartient à Si
 s-i le profil de stratégies autres que celles du joueur i :

s-i = {s1,……si-1, si+1, ……sn}


 On note S l’espace des stratégies ie : S = S1xS2x ……Sn
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Stratégie dominée/dominante J2 Π 2
(U , X ) > Π 2
(U,Y )
Π2 (V , X ) > Π2 (Y,Y )
Principe
Stratégie Stratégie
Une stratégie n’est jamais jouée si une autre assure
dominante dominée
une utilité meilleure dans tous les cas de J2 de J2
J2
Définition: Une stratégie si est (strictement) X Y
J1 U (5 ,3) (4,2)
dominée pour le joueur i s il existe une stratégie s’i
V (3,6) (7, 1)
telle que pour tous les profils s-i
Πi (s’i , s-i ) > Πi (si , s-i ) Π1 (U , X ) > Π1 (U,Y )
J1
• Une stratégie si est faiblement dominée pour le Π1 (U, X ) < Π1 (V,Y )
joueur i si il existe une stratégie s’i telle que pour tous Incomparables: Pas de
stratégie dominante /
les profils s-i
Dominée pour J1
Πi (s’i , s-i ) ≥ Πi (si , s-i )
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Stratégie dominante
Player 2

u v s
Player 1
x 4,2 3,6 3,1
% = par rapport à y 2,5 1,8 3,0
z 8,1 4,2
4,2 6,0
Player 1
% U de P 2 Π1 (z , u ) > Π1 (y, u) Π1 (z , u ) > Π1 (x,u )
 La stratégie Z
% V de P 2 Π1 (z , v ) > Π1 (y, v) Π1 (z , v ) > Π1 (x,v )
domine pour P1
% S de P 2 Π1 (z , s ) > Π1 (y, s) Π1 (z , s ) > Π1 (x,s )
Player 2
% X de P 1 Π2 (x,v ) > Π2 (x,u ) Π2 (x ,v ) > Π2 (x,s )
 La stratégie V
% Y de P 1 Π2 (y , v ) > Π2 (y,u ) Π (y , v ) > Π (y,s)
2 2
domine pour P2
% Z de P 1 Π2 (z , v ) > Π2 (z,u) Π2 (z , v ) > Π2 (z,s)

L’équilibre en Stratégie Dominante existe et vaut ( z,v)


avec une utilité de  (4,2)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a` la The´orie des Jeux – p.20/77


Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Une stratégie s i est (strictement) dominée pour le


joueur i si il existe une stratégie s i J telle que pour tous
les profils s − i

Π i (s i J , s − i ) > Π i (s i , s − i )
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Une stratégie s i est faiblement dominée pour le joueur i


si il existe une stratégie s i J telle que pour tous les
profils s − i

Π i (s i J , s − i ) ≥ Π i (s i , s − i )
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Introduction a` la The´orie des Jeux – p.21/77


Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,3
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

 Un jeu est dit résolvable par élimination itérative des stratégies dominées, si on
obtient un unique profil en éliminant successivement des stratégies
(strictement) dominées.

 Les profils obtenus aprés élimination itérative des stratégies (strictement)


dominées (EISD) ne dépendent pas de l’ordre choisi pour l’élimination des
stratégies.

 Par contre, on peut obtenir des profils différents lorsque l’on choisit des ordres
différents pour l’élimination itérative de stratégies faiblement dominées
(EISfD).

 Les résultats obtenus par EISD sont donc plus robustes que ceux obtenus
par EISfD.
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées

Exercices :: Pour les 3 jeux sous forme normale ci-dessous


1) Y a t il un équilibre en stratégie dominante

2) Existe-t-il un équilibre en EISD ( Elimination Itérative de Stratégie Dominées )

Jeux 1 Jeux 2 Jeux 3


Dilemme de prisonniers 2 sociétés
Joueur B
St Y X Y Z
bas Haut X 3,6 5,7 4,5
Joueur
bas 40,30 45,10 A Y 5 ,1 6,2 6,1
St X
Haut 20,60 50,50 Z 6,0 8,9 3,6
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction
Jeux Dilemme de prisonniers

1) Vérifions qu’il y a un équilibre en stratégie dominante

Pour Ali  (Πali(avoue , nie ) > Πali(nie , nie )


et (Πali(avoue , avoue ) > Πali(nie , avoue )

Donc avoue est une stratégie dominante pour Ali

Pour Fahd  (Πfahd(avoue , nie ) > Πfahd(nie , nie )


et (Πfahd(avoue , avoue ) > Πfahd(nie , avoue )
Donc avoue est une stratégie dominante pour Fahd

Fahd
Résultat , il y a un équilibre en avoue nie
stratégie dominante  ( avoue,avoue)
avoue (-4;-4) (-1;-10)
Ali
nie (-10;-1) (-2;-2)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction (Suite)
Jeux Dilemme de prisonniers
2) Vérifions qu’il y a un équilibre par EISSD
Pour Ali  (Πali(nie , nie ) < Πali(avoue , nie )
et Πali(nie , avoue ) < (Πali(avoue , avoue ) >
Donc nie est une stratégie dominée pour Ali
Pour Fahd  ( Πfahd(nie , nie ) < Πfahd(avoue , nie )
et (Πfahd(nie , avoue ) < Πfahd(avoue , avoue )
Donc nie est une stratégie dominée pour Fahd
Fahd
Résultat , il y a un équilibre en avoue nie
EISSD  ( avoue,avoue)
avoue (-4;-4) (-1;-10)
Ali
nie (-10;-1) (-2;-2)
Remarque : un équilibre en Stratégie Dominante est un Equilibre en EISSD,
l’inverse n’est pas vrai
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction (Suite)
Jeux 2 : 2 sociétés
1) Vérifions qu’il y a un équilibre en stratégie dominante

Pour St X  (Πstx(bas , bas) =40) > ( Πstx(haut , bas ) =20)


et (Πstx(bas , haut ) = 45 ) < ( Πstx(haut , haut)=50 )
Alors : Les deux strategie sont incomparable
il n y a pas une stratégie dominante pour Stx

Pour St y  (Πsty(bas , bas ) =30) > (Πsty(haut , bas )=10)


et (Πsty (bas, haut)=60) > Πsty(haut , bas ) = 50)

Donc bas est une stratégie dominante pour Sty


St Y
Résultat , il y a pas d équilibre
bas Haut
en stratégie dominante pour ce jeu
bas 40,30 45,10
St X
Haut 20,60 50,50
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction (Suite)
Jeux 2 : 2 sociétés
2) Vérifions qu’il y a un équilibre en EISSD

Pour St y  ((Πsty(haut , bas )=10) < Πsty(bas , bas ) =30)


et (Πsty(haut , bas ) = 50) < Πsty (bas, haut)=60)

Donc haut est une stratégie dominée pour Sty

Pour St X  (( Πstx(haut , bas ) =20 < Πstx(bas , bas) =40) )


Rationalité St Y ne jouera jamais Haut
Donc Haut est strictement dominée par bas pour Stx

St Y

Résultat : l’ équilibre par EISD pour ce jeu est bas Haut


bas 40,30 45,10
( bas, bas ) St X
Haut 20,60 50,50
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction (Suite)
Jeux 3 :

1) Vérifions qu’il y a un équilibre en stratégie dominante

Pour A  (ΠA(X , X) =3) < ( ΠA(Y , X ) =20 ) < ΠA(Z , X ) =6 )


et (ΠA(X , Z) =4) > ( ΠA(Z , Z ) =3 ))

Incomparable donc il n y a pas d équilibre en stratégie dominante

Joueur B
X Y Z
X 3,6 5,7 4,5
Joueur
A Y 5 ,1 6,2 6,1
Z 6,0 8,9 3,6

2) Vérifions qu’il y a un équilibre en EISSD


Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Correction (Suite)
2) Vérifions qu’il y a un équilibre en EISSD
Jeux 3 :

J A: 5>3 , 6>5 6 > 4 donc la


stratégie X est dominée par Y pour
le joueur A

J B: 7>5 , 2>1 9 > 6 donc la stratégie Z est dominée par Y pour le joueur B

J A: 6>5 , 8>1 donc la stratégie Y


est dominée par Z pour le joueur A

J B: 9>0 donc la stratégie X est


dominée par Y pour le joueur B Résultat : Existance de l
Equilibre en EISSD  (z,y)
Équilibre de Nash

• Une situation du jeu où chaque stratégie est la


meilleure réponse à l’autre est un équilibre de
Nash.
• L’équilibre de Nash est une situation où aucun
joueur ne peut améliorer sa situation en
changeant unilatéralement de stratégie, compte
tenu des décisions de l’autre joueur
• Dans notre premier exemple, il y a deux
équilibres de Nash : (U,L) et (D,R).
Équilibre de Nash

Joueur 2

u v w
Joueur 1
x 3,0 0,2 0,3
y 2,0 1,1 2,0

z 0,3 0,2 3,0

(Y,V) est un equilibre de Nash


Introduction a` la The´orie des Jeux – p.23/77
Équilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
y 2,0 1,1 2,0 (Y,V) est un equilibre de Nash
Joueur 1
z 0,3 0,2 3,0

 La notion d’e´quilibre de Nash est une situation telle qu’aucun joueur


n’a intérêt à dévier (seul) de la situation obtenue.
 Un e´quilibre de Nash est un profil de stratégies s ∗ = { s ∗1 , . . . , s ∗n }

tel que pour tout joueur i , pour toute stratégie s J ∈ S i :

Πi (s* , s* ) ≥ Πi (sJ,s* ) Introduction a` la The´orie des Jeux – p.23/77


Équilibre de Nash
Equilibre de Nash et fonction de meilleure réponse

 La fonction de meilleure réponse du joueur i est la fonction B i qui

associe à chaque combinaison de stratégies des autres joueurs s − i les

stratégies du joueur i qui maximise son utilité:

B i (s − i ) = { s i ∈ S i t.q. Πi (s i , s − i ) ≥ Πi (s Ji , s − i )
pour tout s Ji ∈ S i }
 Un équilibre de Nash est un profil s∗ tel que la stratégie du joueur i est
une meilleure réponse:

S * i ∈ B i (s* − i ) pour tout i ∈ N


Introduction a` la The´orie des Jeux – p.24/77
Équilibre de Nash
Propriétés

d Un profil (unique) obtenu par élimination itérative de stratégies (strictement)


dominées (EISD) est un équilibre de Nash (et c’est le seul équilibre du jeu).
d Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, mais
il peut aussi n’en avoir aucun !
d Question: comment choisir un équilibre particulier lorsqu’il y en a
plusieurs ?

d Deux équilibres de Nash s ∗ = ( s ∗i , s ∗− i ) et s J ∗ = ( s iJ ∗, s−J ∗i ) sont


interchangeables si pour tout i (s i∗ , s J−∗i ) et (s Ji∗ , s −∗ i ) sont aussi des
équilibres de Nash.
d Deux équilibres de Nash s ∗ et s J ∗ sont équivalents si ils donnent la même
utilité à tous les joueurs, i.e. pour tout i ∈ N µ i (s ∗) = µ i (s J ∗) .

Introduction a` la The´orie des Jeux – p.25/77


Équilibre de Nash
Exemple 1

Joueur B
L R

U (3,9) (1,8)
Joueur A
D (0,0) (2,1)

(U,L) et (D,R) sont deux “équilibres de Nash” pour ce jeu


Équilibre de Nash
Exemple 1 ( suite)
joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

(U,L) et (D,R) sont des équilibres de Nash pour ce jeu. Mais,


lequel va apparaître ?
Nous remarquons que (U,L) est préféré à (D,R) par les deux
joueurs. Pour autant est-ce que (U,L) va apparaître ?
Équilibre de Nash
Exemple 2

l’exemple de Duopole:

Un joueur peut-il seul


Ent. B améliorer sa position ?
Matrice des
gains Qd Qe L’entreprise A ?

L’entreprise B ?
Qd 2,2 15,0
Puisque aucun joueur
Ent. A ne peut améliorer sa
Qe situation, il s’agit d’un
0,15 10,10
équilibre de Nash
Efficacité de l’équilibre
Exemple 2 ( suite)
L’exemple de Duopole:

L’équilibre de Nash est


Matrice des Ent. B
«Qd-Qd» mais n’est pas
gains Qd Qe collectif
l’ optimal est:
Qd 2,2 15,0 Si le nombre d’agents est
Ent. A restreint, la rationalité
individuelle n’amène pas
Qe 0,15 10,10 forcement au bien être
collectif
Efficacité de l’équilibre

L’exemple de Duopole:
Remarquons que puisque
Ent. B les gains en cas d’entente
Matrice des sont supérieurs au gains
gains Qd Qe sans entente, il s’agit d’un
jeu de coordination.

Qd 2,2 15,0 Un jeu de coordination est


un jeu où les paiements
Ent. A sont plus élevés quand les
joueurs peuvent
Qe 0,15 10,10 coordonner leurs
stratégies.
Le dilemme du prisonnier

• Revenons à l’exemple très connu du


dilemme du prisonnier…
Théorie des jeux

Fahd
avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

Quel est le résultat de ce jeu ?


Théorie des jeux

Fahd
avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

Si Ali joue la négation alors la meilleure


réponse de Fahd est d’avouer .
Théorie des jeux

Fahd

avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

Si Ali joue la négation alors la meilleure


réponse de Fahd est d’avouer.
Si Ali avoue alors la meilleure
réponse de Fahd est d’avouer.
Théorie des jeux

Fahd

avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

Donc, quelle que soit la stratégie. de Ali, Fahd doit


toujours avouer .
avouer est la stratégie dominante
pour Fahd. Et aussi pour Ali
La stratégie dominante

Déf.: on appelle une stratégie dominante une stratégie dont


le payoff  est supérieur à toute autre action et ce que
quelle que soit la stratégie des autres joueurs.

Formellement: On note :
La stratégie   dominante est a i  Ai
Les autres strategies est {a i }  Ai / a i
i
Les strategies des autres joueurs {a }

 i  a , a
i i
   a , a  , pour tout a  A
i
i i i i
La stratégie dominante

Fahd
avoue nie
avoue (4;4) (1;10)
Ali
nie (10;1) (2;2)

Donc, le seul équilibre de Nash pour ce


jeu est (avoue, avoue), même si (nie, nie) donne à
Ali et Fahd de meilleurs gains. ( 2,2)
L’équilibre de Nash est inefficace…
La stratégie dominante
Le jeu de la poule mouillée
A
Coopère Trahit
Coopère (6,6) (1,10)
B
Trahit (10,1) (-20,-20)
Y a-t-il une strategie dominate pour de ce jeu ?
NON ; pas de stratégie dominante

Ce Jeu a un Equilibre de Nash ?


Oui : 2 Equilibres de Nash :
(Coopère, Trahir) (10,1) ou (Trahir, Coopère) (1,10)
Jeu séquentiel
(sous forme extensive)
Jeux séquentiels

• Dans nos deux exemples, les joueurs


jouaient simultanément.
• Il existe des jeux où les joueurs jouent l’un
après l’autre : jeux séquentiels.
• Le joueur qui joue en premier est le
leader, celui qui joue en deuxième est le
follower.
Exemple

• Parfois, un jeu a plusieurs équilibres de


Nash et il est difficile de savoir lequel va
sortir du jeu…

• En revanche, quand un jeu est séquentiel,


il est possible de dire quel équilibre de
Nash va sortir du jeu.
Théorie des jeux

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

(U,L) et (D,R) sont deux équilibres de Nash


quand le jeu est simultané. Et, il est
impossible de savoir quel équilibre va arriver.
Théorie des jeux

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

Supposons maintenant que le jeu est


séquentiel : A est le leader et B le follower.
Nous pouvons réécrire ce jeu sous sa forme
extensive…
Théorie des jeux
A
U D A jour en premier
B B B jour en second
L R L R

(3,9) (1,8) (0,0) (2,1)


Théorie des jeux
A
U D
B B
L R L R

(3,9) (1,8) (0,0) (2,1)


(U,L) est un équilibre de Nash
(D,R) est un équilibre de Nash
Quel est celui qui va sortir du jeu?
Théorie des jeux
A
U D
B B
L R L R

(3,9) (1,8) (0,0) (2,1)


Si A joue U alors B joue L; A gagne 3.
Si A joue D alors B joue R; A gagne 2.
Donc (U,L) est l’équilibre de Nash qui sortira
Fonctions de
meilleures réponses
Fonctions de meilleures réponses

• Soit un jeu 2×2; i.e., un jeu avec deux joueurs A


et B, qui ont chacun deux actions possibles

• A peut choisir entre deux actions : aA1 et aA2

• B peut choisir entre deux actions aB1 et aB2

• Il y a 4 paires d’action possibles :

(aA1, aB1), (aA1, aB2), (aA2, aB1), (aA2, aB2)

• Chaque paire d’action donnera des gains


différents aux joueurs
Fonctions de meilleures réponses

• Supposons que les gains des joueurs A et B


quand ils choisissent respectivement les actions
aA1 et aB1 sont :

UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4

• De manière similaire, supposons que :


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7

• Si B choisit l’action aB1, quelle est la meilleure


réponse de A ?
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7

• Si B choisit l’action aB1, la meilleure


réponse de A est aA1 (car 6 > 4)
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si B choisit l’action aB1, la meilleure
réponse de A est aA1 (car 6 > 4)
• Si B choisit l’action aB2, quelle est la
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si B choisit l’action aB1, la meilleure
réponse de A est aA1 (car 6 > 4)
• Si B choisit l’action aB2, la meilleure
Fonctions de meilleures réponses

• Si B choisit aB1 alors A choisit aA1


• Si B choisit aB2 alors A choisit aA2
• La “courbe” de meilleure réponse de
A est donc :

Meilleures a 2
A +
réponses
de A
aA 1 +

aB 1 aB 2 Actions de B
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si A choisit l’action aA1, quelle est la
meilleure réponse de B ?
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si A choisit l’action aA1, la meilleure
réponse de B est aB2 (car 5 > 4)
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si A choisit l’action aA1, la meilleure
réponse de B est aB2 (car 5 > 4)
• Si A choisit l’action aA2, quelle est la
Fonctions de meilleures réponses

• UA(aA1, aB1) = 6 et UB(aA1, aB1) = 4


UA(aA1, aB2) = 3 et UB(aA1, aB2) = 5
UA(aA2, aB1) = 4 et UB(aA2, aB1) = 3
UA(aA2, aB2) = 5 et UB(aA2, aB2) = 7
• Si A choisit l’action aA1, la meilleure
réponse de B est aB2 (car 5 > 4)
• Si A choisit l’action aA2, la meilleure
Fonctions de meilleures réponses

• Si A choisit aA1 alors B choisit aB2


• Si A choisit aA2 alors B choisit aB2
• La courbe de meilleure réponse de B est
donc :
aA 2

Actions
de A aA 1

aB 1 aB 2 Meilleures réponses de B
Fonctions de meilleures réponses

• Si A choisit aA1 alors B choisit aB2


• Si A choisit aA2 alors B choisit aB2
• La courbe de meilleure réponse de B est donc :

a A Notons que aB2 est une


2
action strictement
Actions dominante pour B
de A aA 1

aB 1 aB 2 Meilleures réponses de B
Meilleures réponses & Équilibre de Nash

Comment peut-on utiliser les courbes de meilleures


réponses pour localiser les équilibres de Nash du jeu ?

Réponse de A Choix de A
B A

aA 2 aA 2 +

aA 1 aA 1 +

aB 1 aB 2 a B1 a B2
Choix de B Réponse de B
Meilleures réponses & Équilibre de Nash

Comment peut-on utiliser les courbes de meilleures


réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
Réponse de A Choix de A
B A

aA 2 aA 2 +

aA 1 aA 1 +

aB 1 aB 2 a B1 a B2
Choix de B Réponse de B
Meilleures réponses & Équilibre de Nash

Comment peut-on utiliser les courbes de meilleures


réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…

Réponse de A

aA 2 +
Existe-t-il un équilibre de Nash ?
aA 1 +

aB 1 aB 2
Réponse de B
Meilleures réponses & Équilibre de Nash

Comment peut-on utiliser les courbes de meilleures


réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…

Réponse de A

aA 2 +
Existe-t-il un équilibre de Nash ?
aA 1 +
Oui, (aA2, aB2). Pourquoi ?

aB 1 aB 2
Réponse de B
Meilleures réponses & Équilibre de Nash

Comment peut-on utiliser les courbes de meilleures


réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…

Réponse de A

aA 2 +
Existe-t-il un équilibre de Nash ?
aA 1 +
Oui, (aA2, aB2). Pourquoi ?
aA2 est une meilleure réponse à aB2
aB 1 aB 2 aB2 est une meilleure réponse à aA2
Réponse de B
Meilleures réponses & Équilibre de Nash

Voici la forme
Joueur B stratégique du jeu
aB1 aB2

aA1 6,4 3,5


Joueur A
aA2 4,3 5,7

aA2 est la seule meilleure réponse à aB2


aB2 est la seule meilleure réponse à aA2
Meilleures réponses & Équilibre de Nash

Joueur B
aB1 aB2
Existe-t-il un 2eme
aA1 6,4 3,5
Equilibre de Nash ?
Joueur A
aA2 4,3 5,7

aA2 est la seule meilleure réponse à aB2


aB2 est la seule meilleure réponse à aA2
Meilleures réponses & Équilibre de Nash

Joueur B
aB1 aB2
Existe-t-il un 2eme
aA1 6,4 3,5
équilibre de Nash ?
Joueur A Non, car aB2 est une
aA2 4,3 5,7 action strictement
dominante pour B

aA2 est la seule meilleure réponse à aB2


aB2 est la seule meilleure réponse à aA2
Jeu en Stratégies Mixtes
Stratégies pures

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

Reprenons notre exemple initial. Nous avons


vu que (U,L) and (D,R) sont deux équilibres
de Nash.
Stratégies pures

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

Le joueur A a le choix entre U ou D, mais pas


une combinaison des deux. On parle dans ce
cas de stratégies pures…
Stratégies pures

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

De même, L and R sont les stratégies pures


de B.
Stratégies pures

joueur B
L R

U (3,9) (1,8)
joueur A
D (0,0) (2,1)

Par conséquent, (U,L) et (D,R) sont les


équilibres de Nash en stratégies pures.
Stratégies pures

joueur B
L R
U (1,2) (0,4)
joueur A
D (0,5) (3,2)

Considérons un nouveau jeu... Existe-t-il un


équilibre de Nash en stratégie pure ?
Stratégies pures

joueur B
L R
U (1,2) (0,4)
joueur A
D (0,5) (3,2)

(U,L) est-il un équilibre de Nash ? Non !


Stratégies pures

joueur B
L R
U (1,2) (0,4)
Joueur A
D (0,5) (3,2)

(U,L) est-il un équilibre de Nash ? Non !


(U,R) est-il un équilibre de Nash ? Non !
Stratégies pures

joueur B
L R
U (1,2) (0,4)
joueur A
D (0,5) (3,2)

(U,L) est-il un équilibre de Nash ? Non !


(U,R) est-il un équilibre de Nash ? Non !
(D,L) est-il un équilibre de Nash ? Non !
Stratégies pures

joueur B
L R
U (1,2) (0,4)
joueur A
D (0,5) (3,2)

(U,L) est-il un équilibre de Nash ? Non !


(U,R) est-il un équilibre de Nash ? Non !
(D,L) est-il un équilibre de Nash ? Non !
(D,R) est-il un équilibre de Nash ? Non !
Stratégies pures

joueur B
L R
U (1,2) (0,4)
Joueur A
D (0,5) (3,2)

Donc le jeu n’a pas d’équilibre de Nash.


En revanche, ce jeu peut avoir des équilibres
de Nash en stratégies mixtes.
Stratégies mixtes

• Au lieu de choisir de manière exclusive


entre Up ou Down, le joueur A peut
attribuer à chaque stratégie des
probabilités (pU,1-pU)… c’est à dire que le
joueur A jouera Up avec la prob. pU et
Down avec la prob. 1-pU.
• Le joueur A fait un mix de stratégies pures.
• La distribution de probabilité (pU,1-pU) est la
stratégie mixte du joueur A.
Stratégies mixtes

• De même, le joueur B peut choisir une


distribution de probabilité : (pL,1-pL)… c’est
à dire que le joueur B jouera Left avec la
prob. pL et Right avec la prob. 1-pL.
Stratégies mixtes
joueur B
L,pL R,1-pL

U,pU (1,2) (0,4)


joueur A
D,1-pU (0,5) (3,2)
Stratégies mixtes
joueur B
L,pL R,1-pL

U,pU (1,2) (0,4)


joueur A
D,1-pU (0,5) (3,2)

Si B joue Left son espérance de gain sera :


2 U  5 ( 1   U )
Stratégies mixtes
joueur B
L,pL R,1-pL

U,pU (1,2) (0,4)


joueur A
D,1-pU (0,5) (3,2)

Si B joue Left son espérance de gains sera :


2 U  5( 1   U ).
Si B joue Right son espérance de gains sera:
4  U  2( 1   U ).
Stratégies mixtes
joueur B
L,pL R,1-pL

U,pU (1,2) (0,4)


Joueur A
D,1-pU (0,5) (3,2)

Si 2 U  5(1   U )  4  U  2( 1   U ) alors
B jouera seulement Left.
Mais il n’y a pas d’équilibre de Nash
dans lequel B joue toujours Left.
Stratégies mixtes
joueur B
L,pL R,1-pL

U,pU (1,2) (0,4)


joueur A
D,1-pU (0,5) (3,2)

Si 2 U  5(1   U )  4  U  2( 1   U ) alors
B jouera seulement Right. Mais, il n’existe
pas d’équilibre de Nash où B jouera toujours
Right.
Stratégies mixtes
Joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
Joueur A 2
D, (0,5) (3,2)
5
Donc, pour qu’il existe un équilibre de
Nash, B doit être indifférent entre jouer Left
ou Right; i.e. :
2 U  5(1   U )  4  U  2( 1   U )
  U  3 / 5.
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
Si A joue Up son espérance de gains sera :
1  L  0  (1  L )  L .
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
Si A joue Up son espérance de gain sera :
1   L  0  (1   L )   L .
Si A joue Down, son espérance de gain sera :
0   L  3  (1   L )  3(1   L ).
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
Joueur A 2
D, (0,5) (3,2)
5
si  L  3( 1   L ) Alors A jouera toujours Up.
Mais il n’existe pas d’équilibre de Nash ou A
Jouera toujours Up.
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
If  L  3( 1   L ) Alors A jouera toujours
Down. Mais il n’existe pas d’équilibre de
Nash ou A jouera toujours Down.
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
Donc, pour qu’il existe un équilibre de Nash
A doit être indifférent entre jouer Up ou
Down :  L  3( 1   L )
Stratégies mixtes
joueur B
L,pL R,1-pL
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
Donc, pour qu’il existe un équilibre de Nash,
A doit être indifférent entre Up et Down :
i.e.  L  3( 1   L )   L  3 / 4.
Stratégies mixtes
Joueur B
3 1
L, 4 R, 4
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5
Donc, pour qu’il existe un équilibre de Nash,
A doit être indifférent entre Up et Down :
i.e.  L  3( 1   L )   L  3 / 4.
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3
U, (1,2) (0,4)
5
joueur A 2
D, (0,5) (3,2)
5

Donc, le seul équilibre de Nash du jeu existe


si A a une stratégie mixte (3/5, 2/5) et B
a une stratégie mixte (3/4, 1/4).
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2)
U, (0,4)
5 9/20
joueur A 2
D, (0,5) (3,2)
5

Les gains seront (1,2) avec la proba :


3 3 9
 
5 4 20
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2) (0,4)
U,
5 9/20 3/20
Joueur A 2
D, (0,5) (3,2)
5

Les gains seront (0,4) avec la proba :


3 1 3
 
5 4 20
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2) (0,4)
U,
5 9/20 3/20
joueur A 2
D, (0,5) (3,2)
5 6/20
Les gains seront (0,5) avec proba :
2 3 6
 
5 4 20
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2) (0,4)
U,
5 9/20 3/20
joueur A 2
D, (0,5) (3,2)
5 6/20 2/20
Les gains seront (3,2) avec la proba :
2 1 2
 
5 4 20
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2) (0,4)
U,
5 9/20 3/20
joueur A 2
D, (0,5) (3,2)
5 6/20 2/20
Les gains espérés de A pour l’équilibre de Nash sont :

9 3 6 2 3
1  0  0  3  .
20 20 20 20 4
Stratégies mixtes
joueur B
3 1
L, 4 R, 4
3 (1,2) (0,4)
U,
5 9/20 3/20
joueur A 2
D, (0,5) (3,2)
5 6/20 2/20
Les gains espérés de B pour l’équilibre de Nash sont :

9 3 6 2 16
2  4  5  2  .
20 20 20 20 5
Combien existe-t-il
d’équilibres de Nash ?

• Un jeu avec un nombre fini de joueurs


ayant chacun un nombre fini de stratégies
a au moins un équilibre de Nash (en
stratégie pure ou mixte)

Vous aimerez peut-être aussi