Vous êtes sur la page 1sur 54

Théorie des jeux

(Arbres de Décision)

Meltem OZTURK: ozturk@lamsade.dauphine.fr


www.lamsade.dauphine.fr/∼ozturk, enseignement

AMCD – p. 1
Théorie des jeux

Un jeux est une situation où les joueurs sont conduits à faire des choix
stratégiques parmi un certain nombre d’actions possibles, ,

et dans un cadre défini à l’avance qui sera les règles du jeu.

Le résultat de ces choix constituant une issue du jeu, à laquelle est


associé un gain (ou une perte) pour chacun des participants.

ref: www.sciences.ch/htmlfr/mathsociales

AMCD – p. 2
Théorie des jeux

La théorie des jeux s’intéresse aux situations où des individus


doivent prendre des décisions "en interaction" , dans le sens où le gain
de chacun dépend de ce qu’il fait mais aussi de ce que font les autres.

Pour un joueur, toute la difficulté provient alors de ce qu’il doit anticiper


le choix des autres, avant de faire le sien.

d’où l’hypothèse de rationalité : les joueurs cherchent à maximiser


leur gain, compte tenu de l’information dont ils disposent et ce fait est
connaissanec commune (chacun sait que les autres sont rationnels,
qu’ils savent qu’il sait, etc...)

ref: B. Guerrin, La théorie des jeux, Economica, 2002

AMCD – p. 3
Théorie des jeux : histoire

L’analyse du duopole d’Antoine Augustin Cournot publiée en 1838


dans ses Recherches sur les principes mathématiques de la théorie
des richesses peut être considérée comme la première formulation,
dans un cadre particulier, de la notion d’équilibre de Nash.

Dans son ouvrage de 1938, Applications aux Jeux de Hasard, Émile


Borel développe un théorème du minimax pour les jeux à somme nulle
à deux joueurs, c’est-à-dire les jeux dans lesquels ce que gagne l’un
est perdu par l’autre.

AMCD – p. 4
Théorie des jeux : histoire

La théorie des jeux moderne commence avec la publication en 1944


du livre d’Oskar Morgenstern et John von Neumann, Theory of Games
and Economic Behavior. Cet ouvrage fondateur détaille la méthode de
résolution des jeux à somme nulle

Elle a été principalement développée dans les années 1950,


notamment avec les travaux de John Nash.

Deux prix de Nobel : En 1994, John Nash, Reinhard Selten et John


Harsanyi et en 2005, Thomas Schelling et Robert Aumann

ref : http://fr.wikipedia.org/wiki/Théorie_des_jeux

AMCD – p. 5
Théorie des jeux: premier exemple

Dilemme des prisonniers

deux prisonniers (complices d’un délit) retenus dans des cellules


séparées et qui ne peuvent communiquer. On leur dit que
• si un des deux prisonniers dénonce l’autre, il est remis en liberté
alors que le second obtient la peine maximale (10 ans) ;
• si les deux se dénoncent entre eux, ils seront condamnés à une
peine plus légère (5 ans) ;
• si les deux refusent de dénoncer, la peine sera minimale (6
mois), faute d’éléments au dossier.

AMCD – p. 6
Théorie des jeux: premier exemple

Dilemme des prisonniers

B se tait B denonce
A se tait (0.5,0.5) (10,0)
A denonce (0,10) (5,5)

où les M (i, j) sont à minimiser.

AMCD – p. 7
Théorie des jeux : types de jeux

• Jeux coopératifs et jeux non coopératifs


jeux coopératifs: formation de coalitions entre les joueurs afin
d’obtenir un meilleur résultat pour ses membres;
• Jeux simultanés et jeux séquentiels
jeu simultané: les joueurs décident en même temps de leur
stratégie ;
jeu séquentiel: on peut spécifier l’ordre des décisions de sorte
qu’un joueur peut décider de sa stratégie conditionnellement à
ce qu’ont joué les autres joueurs précédemment.

AMCD – p. 8
Théorie des jeux : types de jeux

• Jeux finis
(l’ensemble des stratégies de chacun des joueurs est fini) .
• Jeux à somme nulle et jeux à somme positive (et aussi jeux à
intérêts communs, ex: lieu de rdv)
• Jeux répétés
(connaissance des résultats intermédiaires, change souvent
fondamentalement son déroulement (les meilleurs coups et la
conclusion). Ex : il peut être utile de prendre ponctuellement le
risque de perdre « pour voir », tester les autres joueurs, et mettre
en place des stratégies de communication par les coups joués.

Notre cours se base sur les jeux non coopératifs, simultanés, finis et à
un seul coup.

AMCD – p. 9
Cadre du cours: jeux à un seul coup

Jeux à un seul coup : Un jeux où les joueurs choisissent


simultanément une, et une seule de leur action possible.

exemple

b1 b2 b3
a1 (7, 5) (3, 7) (1, 8)
a2 (8, 4) (5, 3) (2, 6)

où M (ai , bj ) = (xi , yj ) : le joueur A choisit de jouer ai et B choisit bj . A


l’issue de ces décisions A gagne xi et B gagne yj .

AMCD – p. 10
Cadre du cours: jeux à un seul coup

Remarque : La représentation matricielle des gains s’appelle forme


normale. Il existe aussi une représentation dite forme extensive où on
utilise un arbre.

• La représentation sous forme matricielle ou normale: Adapté


pour des jeux (statiques) avec décisions simultanées
• La représentation sous forme d’arbre ou extensive : Adapté pour
des jeux avec décisions séquentielles

AMCD – p. 11
Théorie des jeux: exemple de stratégie

Dilemme des prisonniers

B se tait B denonce
A se tait (0.5,0.5) (10,0)
A denonce (0,10) (5,5)

où les M (i, j) sont à minimiser.

AMCD – p. 12
Théorie des jeux: exemple de stratégie

le joueur A pense:
• si B dénonce, alors :
• si je me tais j’ai 10 ans de prisons
• si je dénonce j’ai 5 ans de prisons
c’est donc mieux de dénoncer
• si B se tait, alors :
• si je me tais j’ai 6 mois de prisons
• si je denonce j’ai 0 an de prisons
c’est donc mieux de dénoncer
Conclusion je dénonce.

Dénoncer est une stratégie dominante pour A.

AMCD – p. 13
Théorie des jeux: exemple de stratégie

Dilemme des prisonniers

se taire denoncer
se taire (0.5, 0.5) (10,0)
denoncer (0,10) (5,5)

Résultat: tous les deux prisonniers dénoncent pourtant le cas (se


taire, se taire) est mieux pour les deux mais cette issue n’est pas
stable! (voir plus loin l’idéee de l’equilibre de Nash)

AMCD – p. 14
Théorie des jeux: dilemme des prisonniers

Dilemme des prisonniers

Modélisation pour

• problèmes politiques tarifaires: baisser ou pas le prix d’un produit


• politique internationale : avoir ou pas avoir d’armée
• psychologie : couple où chacun trompe l’autre
• sociologie, ecologie, ...

AMCD – p. 15
Petite parenthèse

Exemple de stratégie pour jeux séquentiels

• voir l’exemple de Jérôme Renault (polycopié 1, page 9) : lien sur


le site de Mme Öztürk
• et le dilemme des prisonniers

AMCD – p. 16
Théorie des jeux : dominance

Dominance

Une stratégie si est dominante (resp. faiblement dominante) pour un


joueur A si et seulement si quelles que soient les actions de l’autre
joueur la stratégie si apporte strictement plus (resp. plus ou égal) de
gain que les autres stratégies du joueur A.

AMCD – p. 17
Théorie des jeux : dominance

Dominance

b1 b2 b3
a1 (7,5) (3,7) (1,8)
a2 (8,4) (5,3) (2,6)

AMCD – p. 18
Théorie des jeux : dominance

Dominance

b1 b2 b3
a1 (7,5) (3,7) (1,8)
a2 (8,4) (5,3) (2,6)

• pour A : la stratégie dominante est a2


• pour B : la stratégie dominante est b3

solution "évidente :" (a2 , b3 )

AMCD – p. 18
Théorie des jeux : dominance

Dominance

b1 b2 b3
a1 (7,5) (3,7) (1,8)
a2 (8,4) (5,3) (2,6)

• pour A : la stratégie dominante est a2


• pour B : la stratégie dominante est b3

solution "évidente :" (a2 , b3 )

• Même remarque que les prisonniers : et si c’était (3,7)?

AMCD – p. 18
Théorie des jeux : dominance

Dominance

b1 b2 b3
a1 (7,5) (3,7) (1,8)
a2 (8,4) (5,3) (2,6)

• pour A : la stratégie dominante est a2


• pour B : la stratégie dominante est b3

solution "évidente :" (a2 , b3 )

• Même remarque que les prisonniers : et si c’était (3,7)?


• Et s’il n’y a pas de stratégie dominante?

AMCD – p. 18
Théorie des jeux : dominance

Stratégie dominée

Une stratégie si est strictement dominée (resp. faiblement dominée)


pour un joueur A si et seulement s’il existe une autre stratégie s∗ telle
que, quelles que soient les stratégies adoptées par les autres joueurs,
cette autre stratégie s∗ est toujours strictement meilleure que si (resp.
au moins aussi bonne que si et strictement meilleure dans au moins
l’une des situations) .

AMCD – p. 19
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

AMCD – p. 20
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

on elimine d’abord a1 (dominé par a2 )

AMCD – p. 20
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

on elimine d’abord a1 (dominé par a2 )


après b2 (dominé par b1 ).

AMCD – p. 20
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

on elimine d’abord a1 (dominé par a2 )


après b2 (dominé par b1 ).
L’action a3 devient dominante sur le reste des actions de A.

AMCD – p. 20
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

on elimine d’abord a1 (dominé par a2 )


après b2 (dominé par b1 ).
L’action a3 devient dominante sur le reste des actions de A.
Donc A choisit a3 , alors B choisira b1 (et si (a2 , b2 )?).

AMCD – p. 20
Théorie des jeux

Elimination par iteration des stratégies dominées

b1 b2 b3
a1 (2,4) (3,7) (2,5)
a2 (4,6) (6,5) (3,7)
a3 (5,4) (2,3) (4,2)

on elimine d’abord a1 (dominé par a2 )


après b2 (dominé par b1 ).
L’action a3 devient dominante sur le reste des actions de A.
Donc A choisit a3 , alors B choisira b1 (et si (a2 , b2 )?).

AMCD – p. 20
Théorie des jeux : exemples

• D’autres exemples
• exemple jeux pécheurs
• exemple avec 4 actions
• exemple avec dominance faible
• Et si ces exemples étaient des jeux séquentiels
• exemple avec dominance
• exemple avec élimination par itération des stratégies
dominées

AMCD – p. 21
Théorie des jeux

Elimination par iteration des stratégies dominées

• Un jeu est dit résoluble par élimination itérative des stratégies


dominées, si on obtient un unique profil en éliminant
successivement des stratégies (strictement) dominées
• Les profils obtenus après élimination itérative des stratégies
strictement dominées ne dépendent pas de l’ordre choisi pour
l’élimination des stratégies.
• Les profils obtenus après élimination itérative des stratégies
faiblement dominées dépendent de l’ordre choisi pour
l’élimination des stratégies.

AMCD – p. 22
Théorie des jeux

Elimination par iteration des stratégies dominées

• Si on modélise le même jeux simultané comme un jeux


séquentiel, l’ordre de passage des joueurs est important si
l’élimination en jeux simultanée se fait avec dominance faible.
• et si pas d’actions dominées?

AMCD – p. 23
Théorie des jeux: Croyance

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

AMCD – p. 24
Théorie des jeux: Croyance

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

• pas de dominance
• idée pour continuer : croyance de chaque joueur concernant le
choix des autres fondées sur l’idée que les autres sont rationnels
et cela est connaissance commune.

AMCD – p. 24
Théorie des jeux: Croyance

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

croyance erronées : Si c’est (a1 , b1 ) qui réalise:

AMCD – p. 25
Théorie des jeux: Croyance

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

croyance erronées : Si c’est (a1 , b1 ) qui réalise:


• A dit : ayy ayy j’avais cru que B allait jouer b3 .
• B dit : ayy ayy j’avais cru que A choisira a2 .
• tous les deux joueurs se sont trompés dans leur croyance qui
porte sur l’action de l’autre.

AMCD – p. 25
Théorie des jeux: Croyance, Eq. de Nash

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

Bonne croyance (?) : si c’est (a2 , b1 )

AMCD – p. 26
Théorie des jeux: Croyance, Eq. de Nash

exemple

b1 b2 b3
a1 (2,2) (1,6) (4,4)
a2 (3,3) (2,2) (2,0)
a3 (2,1) (7,5) (2,7)

Bonne croyance (?) : si c’est (a2 , b1 )


• A a joué a2 car il pensait que B choisira b1
• B a joué b1 car il pensait que A choisira a2 .
• Les deux joueurs ont eu raisons.
• Personne n’a intérêt de bouger.

AMCD – p. 26
Théorie des jeux: Equilibre de Nash

Equilibre de Nash: une issue d’un jeu dans lequel aucun joueur n’a
intérêt à modifier sa stratégie unilatéralement, compte tenu des
stratégies des autres joueurs. Les joueurs sont contents de leur
prévision.

Interpretation : issue a∗ , b∗ est un equilibre de Nash :


• a∗ est la meilleure stratégie pour A si B joue b∗
• b∗ est la meilleure stratégie pour B si A joue a∗

AMCD – p. 27
Théorie des jeux: Equilibre de Nash

Equilibre de Nash: une issue d’un jeu dans lequel aucun joueur n’a
intérêt à modifier sa stratégie unilatéralement, compte tenu des
stratégies des autres joueurs. Les joueurs sont contents de leur
prévision.

Remarque :
• (a2 , b1 ) est une équilibre de Nash dans le jeu précédent.
• issue (dénoncer, dénoncer) est l’équilibre de Nash dans le jeu
des prisonniers

AMCD – p. 28
Théorie des jeux: Equilibre de Nash

exemple de jeu de coordination

Femme et mari veulent aller voir un film ensemble. La femme préfère


les films romantiques tandis que son mari veut voir un film d’action.
Néanmoins ils n’ont pas envie de voir des films séparément. Voici le
tableau des utilités (femme sur les lignes et homme sur les colonnes)

romantique action
romantique (3,2) (1,1)
action (1,1) (2,3)

AMCD – p. 29
Théorie des jeux: Equilibre de Nash

exemple de jeu de coordination

Femme et mari veulent aller voir un film ensemble. La femme préfère


les films romantiques tandis que son mari veut voir un film d’action.
Néanmoins ils n’ont pas envie de voir des films séparément. Voici le
tableau des utilités (femme sur les lignes et homme sur les colonnes)

romantique action
romantique (3,2) (1,1)
action (1,1) (2,3)

Deux equilibres : (romantique, romantique) et (action, action)

AMCD – p. 29
Théorie des jeux: Equilibre de Nash

exemple de jeu de coordination

Femme et mari veulent aller voir un film ensemble. La femme préfère


les films romantiques tandis que son mari veut voir un film d’action.
Néanmoins ils n’ont pas envie de voir des films séparément. Voici le
tableau des utilités (femme sur les lignes et homme sur les colonnes)

romantique action
romantique (3,2) (1,1)
action (1,1) (2,3)

Deux equilibres : (romantique, romantique) et (action, action)

Quelle conclusion? (peut-on attendre tout et n’importe quoi?)

AMCD – p. 29
Théorie des jeux: Equilibre de Nash

exemple de jeu : poule mouillée

deux voitures se dirigent l’une vers l’autre au milieu de la chaussée.:


celui qui s’écarte au dernier moment est "poule mouillé", donc son
gain est nul, celui de l’autre étant strictement positif. Si tous les deux
s’écartent le déshonneur est total mais le pire arrive bien sûr quand il
n’y a aucun qui s’écarte.
passer s’écarter
passer (-2, -2) (1,0)
s’écarter (0,1) (-1, -1)

Equilibre(s) : ?

AMCD – p. 30
Théorie des jeux: Equilibre de Nash

exemple de jeu : un gagne l’autre perd

b1 b2
a1 (0, 1) (1,0)
a2 (1, 0) (0,1)

Equilibre(s) : ?

AMCD – p. 31
Théorie des jeux: Equilibre de Nash

exemple de jeu : Pierre/ciseau/papier

pierre ciseau papier


pierre (0, 0) (1,-1) (-1,1)
ciseau (-1, 1) (0, 0) (1, -1)
papier (1, -1) (-1, 1) (0, 0)

Equilibre(s) : ?

AMCD – p. 32
Théorie des jeux: Equilibre de Nash

exemple de jeu : Pierre/ciseau/papier

pierre ciseau papier


pierre (0, 0) (1,-1) (-1,1)
ciseau (-1, 1) (0, 0) (1, -1)
papier (1, -1) (-1, 1) (0, 0)

Equilibre(s) : ?

Deux autres exemples de jeux?

AMCD – p. 32
Théorie des jeux

Equilibre de Nash

• Un profil (unique) obtenu par élimination itérative de stratégies


(strictement) dominées est un équilibre de Nash (et c’est le seul
équilibre du jeu).
• On peut avoir plusieurs équilibres de Nash.
• On peut ne pas avoir d’équilibre de Nash.
• A quoi sert l’équilibre de Nash?
• Expérience (ex: jeux des milles pattes, seuls 1,5% des sujets se
comportent comme le prédit l’eq. de Nash, pas le cas avec les
joueurs professionnels d’échecs)...

AMCD – p. 33
Théorie des jeux: Equilibre de Nash

exemple de jeu : échange de monnaie

b1 b2
a1 (1, -1) (-1,1)
a2 (-1, 1) (1, -1)

• Pas d’équilibre mais Nash est connu avec sa théorème sur


l’existence d’équilibre (1950)?
• Jeux à somme nulle, mais même en 1928 Von Neuman
garantissait l’existence d’équilibre (thm Minimax)?
• Alors où ont-ils trouvé l’équilibre?

AMCD – p. 34
Stratégie pure/ stratégie mixte

• Une stratégie pure du joueur i est un plan d’action qui prescrit


une action de ce joueur pour chaque fois qu’il est susceptible de
jouer.
• Les cas que nous avons vus jusqu’à présent sont à stratégies
pures.
• Une stratégie mixte du joueur i est une distribution de
probabilités pi définie sur l’ensemble des stratégies pures du
joueur i.

AMCD – p. 35
Stratégie pure/ stratégie mixte

exemple de stratégie mixte :

b1 b2 probabilité de A
a1 (2, 0) (0,1) pA
a2 (0, 3) (1, 0) 1 − pA
probabilité de B pB 1 − pB

AMCD – p. 36
Stratégie pure/ stratégie mixte

exemple de stratégie mixte :

b1 b2 probabilité de A
a1 (-3, -2) (10, 0) pA
a2 (0, 0) (1, 0) 1 − pA
probabilité de B pB 1 − pB

AMCD – p. 37
Stratégie pure/ stratégie mixte

• Il existe toujours un équilibre de Nash dans des stratégies


mixtes.
• Donc prendre en compte les stratégies mixtes permet de trouver
des équilibres là où il n’y en a pas.
• Mais cela peut faire apparaître de nouveaux équilibres là où il y
en a déjà trop.
• Quelle interprétation à donner à des stratégies mixtes?

AMCD – p. 38
Stratégie pure/ stratégie mixte

Trouver les equilibres de Nash en stratégies mixtes:

b1 b2
• a1 (2,1) (0,0)
a2 (0,0) (1, 2)

b1 b2
• a1 (1, -1) (-1,1)
a2 (-1, 1) (1, -1)

AMCD – p. 39
si on a du temps

Résoudre l’exemple de jeux séquentiel avec plusieurs niveaux :


stratégie “backward induction” (induction en arrière)

AMCD – p. 40

Vous aimerez peut-être aussi