Vous êtes sur la page 1sur 162

Introduction la Thorie des Jeux

Sebastien Konieczny

konieczny@cril.univ-artois.fr

CRIL-CNRS
Universite dArtois - Lens

Introduction a la Theorie des Jeux p.1/77


Thorie des Jeux

Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.

Introduction a la Theorie des Jeux p.2/77


Thorie des Jeux

Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.

. groupe
. interaction
. stratgique
. rationnels

Introduction a la Theorie des Jeux p.2/77


Thorie des Jeux

Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.

. groupe
. interaction
. stratgique
. rationnels

Normatif vs Descriptif

Introduction a la Theorie des Jeux p.2/77


A quoi sert la thorie des jeux ?

. Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
. Dois-je travailler ou faire semblant ?
. Est-ce que jcoute de la musique ce soir ?
. Enchres, vote
. Comportement animal
. Stratgies militaires/conomiques
. Partages de ressource (marchandage)
. Est-ce quune entreprise doit exploiter ses salaris ?
. Est-ce quune entreprise doit entrer sur un march ou pas ?
. Faut-il contrler les dclarations dimpots sur le revenu ?
. ...

Introduction a la Theorie des Jeux p.3/77


Un peu dhistoire...

. Cournot (1838), Borel (1921)


. Zermelo (1913)
. Von Neumann (1928)
. Theory of Games and Economic Behaviour, Von Neumann et
Morgenstern (1944)
. Nash (1950)
. Selten (1965), Harsanyi (1967)

Introduction a la Theorie des Jeux p.4/77


Bibliographie

. M. Yildizoglu. Introduction a la theorie des jeux. Dunod. 2003.


. D. Kreps. Theorie des jeux et modelisation economique. Dunod. 1990.
. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.
. P. K. Dutta. Strategies and Games. MIT Press. 1999.
. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.
. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Be-
havior. Princeton University Press. 1944.

Introduction a la Theorie des Jeux p.5/77


Terminologie - Une petite taxonomie...

. Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle


. Jeux information complte / Jeux information incomplte
. Jeux information parfaite / Jeux information imparfaite
. Jeux coopratifs / Jeux non-coopratifs
. Jeux 2 joueurs / Jeux n joueurs

Introduction a la Theorie des Jeux p.6/77


Plan du cours

. Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu


sous forme extensive - Stratgie
. Concepts de solution - Stratgies dominantes
. Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies
mixtes
. Rsolution par chainage arrire - Menaces crdibles - Equilibres
parfaits en sous-jeux
. Jeux somme nulle
. Jeux rpts - Dilemme itr du prisonnier
. Jeux information incomplte
. Jeux coopratifs - Marchandage

Introduction a la Theorie des Jeux p.7/77


Formalisation dun Jeu

Quest-ce quun jeu ?

. Qui? Joueurs
. Quoi? Coups (actions/choix) - Stratgies
. Quand? Droulement du jeu
. Combien? Que rapporte chaque issue aux diffrents joueurs ?

Autres informations importantes:

. Information
. Rptition

Introduction a la Theorie des Jeux p.8/77


Jeux sous forme stratgique - Exemple

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a la Theorie des Jeux p.9/77


Utilit

. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.

Introduction a la Theorie des Jeux p.10/77


Utilit

. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Utiliser une fonction dutilit pour dfinir les prfrences de lagent ne
suppose pas que lagent utilise cette fonction, mais quil raisonne con-
formment un ensemble de conditions de rationalit. Von Neuman et
Morgenstern (1944), Savage (1954).

Introduction a la Theorie des Jeux p.10/77


Jeux sous forme stratgique

Un jeu sous forme stratgique est dfini par :


. un ensemble N = {1, . . . , n} de joueurs
. pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni }
. pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR,
qui chaque ensemble de stratgies associe les gains du joueur i.

Notations :
. On notera s un profil de stratgies {s1 , . . . , sn } o i si Si .
. On note si le profil s des stratgies autres que celles du joueur i :
si = {s1 , . . . , si1 , si+1 , . . . , sn }.
. On note S lespace des stratgies, ie : S = n
i=1 Si

Introduction a la Theorie des Jeux p.11/77


Jeux sous forme extensive - Exemple

1 y
x

s 2 t u
2
v

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.12/77


Jeux sous forme extensive

Un jeu sous forme extensive est dfini par :


. un ensemble N = {1, . . . , n} de joueurs
. un arbre fini compos de :
. un ensemble de noeuds {A, B, C, . . .} reprsentant les coups
. un ensemble de branches {x, y, z, . . .} reprsentant les alternatives
chaque coup
. une fonction de nommage qui indique chaque noeud quel est le
joueur qui doit jouer
. une fonction de valuation qui associe chaque noeud terminal un
vecteur de nombres reprsentant les gains de chacun des joueurs
. une partition des noeuds en un ensemble densembles dinformations
reprsentant les croyances (imparfaites) des joueurs

Introduction a la Theorie des Jeux p.13/77


Jeux sous forme extensive - Ensemble dinformations

Joueur 1
A y
x
Joueur 2
s B t u
C v

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77


Jeux sous forme extensive - Ensemble dinformations

A y
x

s B t u
C v

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77


Jeux sous forme extensive - Ensemble dinformations

A y
x

u B v u
C v

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77


Jeux sous forme extensive - Ensemble dinformations

A y
x

u B v u
C v

(4,2) (3,1) (2,5) (9,0)

. Ensembles dinformation : {A} et {B, C}


. Coups simultans
. Incertitude (croyances)

Introduction a la Theorie des Jeux p.14/77


Relation entre formes stratgique et extensive

. A chaque jeu sous forme extensive correspond un jeu sous forme


stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.

Introduction a la Theorie des Jeux p.15/77


Relation entre formes stratgique et extensive

. A chaque jeu sous forme extensive correspond un jeu sous forme


stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.

. Une stratgie est la spcification complte du comportement dun


joueur dans nimporte quelle situation (dans un jeu sous forme
extensive cela signifie donc pour chaque ensemble dinformation o
cest ce joueur de jouer).
. Algorithme

Introduction a la Theorie des Jeux p.15/77


Stratgie

. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

Introduction a la Theorie des Jeux p.16/77


Relation entre formes stratgique et extensive

Joueur 2

Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a la Theorie des Jeux p.17/77


Relation entre formes stratgique et extensive

Joueur 2

Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

A y
x

Forme extensive : u B C v
v u

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.18/77


Relation entre formes stratgique et extensive

Joueur 2

Forme stratgique : s1 s2 s3 s4
Joueur 1 x 4,2 4,2 3,1 3,1
y 2,5 9,0 2,5 9,0

A y
x

Forme extensive : u B C v
v u

(4,2) (3,1) (2,5) (9,0)

s1: u si x, u si y s2: u si x, v si y
s3: v si x, u si y s4: v si x, v si y

Introduction a la Theorie des Jeux p.19/77


Elimination de stratgies domines

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a la Theorie des Jeux p.20/77


Elimination de stratgies domines

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a la Theorie des Jeux p.20/77


Elimination de stratgies domines

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Introduction a la Theorie des Jeux p.20/77


Elimination de stratgies domines

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

. Une stratgie si est (strictement) domine pour le joueur i si il existe


une stratgie si 0 telle que pour tous les profils si

i (si 0 , si ) > i (si , si )

Introduction a la Theorie des Jeux p.20/77


Elimination de stratgies domines

Joueur 2

u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

. Une stratgie si est faiblement domine pour le joueur i si il existe une


stratgie si 0 telle que pour tous les profils si

i (si 0 , si ) i (si , si )

Introduction a la Theorie des Jeux p.20/77


Elimination de stratgies domines

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Introduction a la Theorie des Jeux p.21/77


Elimination de stratgies domines

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Introduction a la Theorie des Jeux p.21/77


Elimination de stratgies domines

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Introduction a la Theorie des Jeux p.21/77


Elimination de stratgies domines

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Introduction a la Theorie des Jeux p.21/77


Elimination de stratgies domines

Joueur 2

u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,3

Introduction a la Theorie des Jeux p.21/77


Elimination de stratgies domines

. Un jeu est dit rsolvable par limination itrative des stratgies


domines, si on obtient un unique profil en liminant successivement
des stratgies (strictement) domines.
. Les profils obtenus aprs limination itrative des stratgies
(strictement) domines (EISD) ne dpendent pas de lordre choisi pour
llimination des stratgies.
. Par contre, on peut obtenir des profils diffrents lorsque lon choisit des
ordres diffrents pour llimination itrative de stratgies faiblement
domines (EISfD).
. Les rsultats obtenus par EISD sont donc plus robustes que ceux
obtenus par EISfD.
. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable
par EISD !

Introduction a la Theorie des Jeux p.22/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash

Joueur 2

u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

. La notion dequilibre de Nash est une situation telle quaucun joueur


na intrt dvier (seul) de la situation obtenue.
. Un equilibre de Nash est un profil de stratgies s = {s1 , . . . , sn } tel
que pour tout joueur i, pour toute stratgie s0 Si :
i (s1 , si ) i (s0 , si )

Introduction a la Theorie des Jeux p.23/77


Equilibre de Nash et fonction de meilleure rponse

. La fonction de meilleure rponse du joueur i est la fonction B i qui


associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:

Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }

Introduction a la Theorie des Jeux p.24/77


Equilibre de Nash et fonction de meilleure rponse

. La fonction de meilleure rponse du joueur i est la fonction B i qui


associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:

Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }

. Un quilibre de Nash est un profil s tel que la stratgie du joueur i est


une meilleure rponse:

si Bi (si ) pour tout i N

Introduction a la Theorie des Jeux p.24/77


Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies


(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).

Introduction a la Theorie des Jeux p.25/77


Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies


(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !

Introduction a la Theorie des Jeux p.25/77


Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies


(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?

Introduction a la Theorie des Jeux p.25/77


Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies


(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
. Deux quilibres de Nash s = (si , si ) et s0 = (s0i , si ) sont
0

interchangeables si pour tout i (si , s0


i ) et (si , si ) sont aussi des
0

quilibres de Nash.

Introduction a la Theorie des Jeux p.25/77


Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies


(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
. Deux quilibres de Nash s = (si , si ) et s0 = (s0i , si ) sont
0

interchangeables si pour tout i (si , s0


i ) et (si , si ) sont aussi des
0

quilibres de Nash.
. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme
utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s0 ).

Introduction a la Theorie des Jeux p.25/77


Critre de Pareto

Joueur 2

u v
Joueur 1 x 4,4 3,1
y 2,3 7,5

Introduction a la Theorie des Jeux p.26/77


Critre de Pareto

Joueur 2

u v
Joueur 1 x 4,4 3,1
y 2,3 7,5

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi


bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .

Introduction a la Theorie des Jeux p.26/77


Critre de Pareto

Joueur 2

u v
Joueur 1 x 4,4 3,1
y 2,3 7,5

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi


bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .

. Un profil s domine strictement un profil s0 au sens de Pareto si s est


strictement meilleur pour tous les joueurs, i.e. pour tout s i s et s0i s0
on a si > s0i .

Introduction a la Theorie des Jeux p.26/77


Critre de Pareto vs niveau de scurit

Joueur 2

u v
Joueur 1 x 9,9 0,8
y 8,0 7,7

Introduction a la Theorie des Jeux p.27/77


Critre de Pareto vs niveau de scurit

Joueur 2

u v
Joueur 1 x 9,9 0,8
y 8,0 7,7

. On dfinit le niveau de securite dune strategie si pour le joueur i


comme le gain minimum que peut apporter cette stratgie quel que soit
le choix des autres joueurs, soit

min i (si , si )
si

. On dfinit le niveau de securite dun joueur i comme le niveau de scu-


rit maximal des stratgies de i.

Introduction a la Theorie des Jeux p.27/77


Points focaux

. Le problme pos par la multiplicit dquilibres de Nash est un


problme de coordination.
. Pour certains jeux, certains quilibres semblent plus vidents que
dautres aux joueurs. Cela est du certaines conventions sociales. Ces
quilibres de Nash obtenus partir de ces conventions sont appels
points focaux.

Introduction a la Theorie des Jeux p.28/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

Introduction a la Theorie des Jeux p.29/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

Introduction a la Theorie des Jeux p.29/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

. Supposons que le joueur 1 joue alatoirement f et c avec une


probabilit de 1/2

1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1

1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

Introduction a la Theorie des Jeux p.29/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

. Supposons que le joueur 1 joue alatoirement f et c avec une


probabilit de 1/2

1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1

1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2


. Avec cette stratgie le niveau de scurit du joueur 1 est 1/2

Introduction a la Theorie des Jeux p.29/77


Stratgies pures - Stratgies mixtes

. Les stratgies que nous avons dfinies et utilises pour le moment sont
des strategies pures, cest--dire les options qui se prsentent aux
joueurs.
. Une strategie mixte i est une distribution de probabilit sur
lensemble des stratgies pures.
. Lensemble des stratgies mixtes dun joueur i se note i .
. Lensemble des stratgies pures utilises (i.e. dont la probabilit nest
pas nulle) par une stratgie mixte i est appel le support de la
stratgie mixte.
. Notons pi (sk ) la probabilit associe sk par i , lutilit dun profil de
stratgies mixtes est dfinie par :

X Yn
i () = ( pj (sj ))i (s)
sS j=1

Introduction a la Theorie des Jeux p.30/77


Stratgie
. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

Introduction a la Theorie des Jeux p.31/77


Stratgie
. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.
. Une strategie mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.

Introduction a la Theorie des Jeux p.31/77


Stratgie
. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.
. Une strategie mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.
. Une strategie locale du joueur i en un ensemble dinformation A est
une distribution de probabilits sur lensemble des actions disponibles
en cet ensemble dinformation. On note iA lensemble des stratgies
locales du joueur i pour lensemble dinformation A et iA une stratgie
locale de ce joueur en A.
. Une strategie comportementale du joueur i est un vecteur de strat-
gies locales de ce joueur, contenant une stratgie locale par ensemble
dinformation de ce joueur. On note i lensemble des stratgies com-
portementales du joueur i, et i une stratgie comportementale de ce
joueur.
Introduction a la Theorie des Jeux p.31/77
Equilibres de Nash en stratgies mixtes

Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies


mixtes tel que pour tout i et tout i i

i (i , i

) i (i , i )

Introduction a la Theorie des Jeux p.32/77


Equilibres de Nash en stratgies mixtes

Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies


mixtes tel que pour tout i et tout i i

i (i , i

) i (i , i )

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout


si S i
i (i , i

) i (si , i )

Introduction a la Theorie des Jeux p.32/77


Equilibres de Nash en stratgies mixtes

Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies


mixtes tel que pour tout i et tout i i

i (i , i

) i (i , i )

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout


si S i
i (i , i

) i (si , i )

Thorme.[Nash, 1950] Tout jeu sous forme strategique a un equilibre de


Nash en strategies mixtes.

Introduction a la Theorie des Jeux p.32/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

Introduction a la Theorie des Jeux p.33/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x


1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x

Introduction a la Theorie des Jeux p.33/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x


1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x

max min(2x, 1 x) = 1/3


x

Introduction a la Theorie des Jeux p.33/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x


1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x

max min(2x, 1 x) = 1/3


x

. Le niveau de scurit du joueur 1 est donc de 2/3.

Introduction a la Theorie des Jeux p.33/77


La guerre des sexes

Joueur 2

f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x


1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x

max min(2x, 1 x) = 1/3


x

. Le niveau de scurit du joueur 1 est donc de 2/3.


. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette
stratgie ?
Introduction a la Theorie des Jeux p.33/77
Reprsentation graphique du jeu

2 2x

0 x
1/3 2/3 1
Introduction a la Theorie des Jeux p.34/77
Reprsentation graphique du jeu

0 x
1/3 2/3 1 1x
Introduction a la Theorie des Jeux p.34/77
Reprsentation graphique du jeu

2 2x

0 x
1/3 2/3 1 1x
Introduction a la Theorie des Jeux p.34/77
La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?

Introduction a la Theorie des Jeux p.35/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y

Introduction a la Theorie des Jeux p.35/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Donc:
. Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f
. Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c
. Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

Introduction a la Theorie des Jeux p.35/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?

Introduction a la Theorie des Jeux p.36/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)

Introduction a la Theorie des Jeux p.36/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Donc:
. Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
. Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c
. Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

Introduction a la Theorie des Jeux p.36/77


La guerre des sexes

Joueur 2

y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:

1 () = x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
= 3xy x y + 1
2 () = x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
= 3xy 2x 2y + 2

Introduction a la Theorie des Jeux p.37/77


La guerre des sexes

Joueur 2

1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2

Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.

Introduction a la Theorie des Jeux p.37/77


La guerre des sexes

Joueur 2

1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2

Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.
Les gains des deux joueurs avec sont :
1 ( ) = 3.2/3.1/3 2/3 1/3 + 1
= 2/3
2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3

Introduction a la Theorie des Jeux p.37/77


Reprsentation graphique du jeu
y

2/3

joueur1
1/3

x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Reprsentation graphique du jeu
y

joueur2
1

2/3

joueur1
1/3

x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Reprsentation graphique du jeu
y

joueur2
1 r

2/3

joueur1
1/3 r

r x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Coopration - Itration - Corrlation

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?

Introduction a la Theorie des Jeux p.39/77


Coopration - Itration - Corrlation

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2

Introduction a la Theorie des Jeux p.39/77


Coopration - Itration - Corrlation

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.

Introduction a la Theorie des Jeux p.39/77


Coopration - Itration - Corrlation

Joueur 2

f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
. Que se passe-t-il si la partie est joue plusieurs fois ?

Introduction a la Theorie des Jeux p.39/77


Itration: Le dilemme des prisonniers...

Deux personnes arrtes ensemble en possession darmes feu sont


souponns dun dlit fait en commun. Les policiers les sparent et disent
chacun :

. Si un des deux avoue et que lautre navoue rien, le premier est libr,
et le second emprisonn (5 ans);
. Si les deux avouent, les deux iront en prison (4 ans);
. Si aucun des deux navoue, les deux seront seront librs assez vite (2
ans).

B Vous tes un des deux prisonniers, que faites-vous ?

Introduction a la Theorie des Jeux p.40/77


[DIP] Le dilemme des prisonniers

Joueur 2

C D
Joueur 1 C 3,3 0,5
D 5,0 1,1

Introduction a la Theorie des Jeux p.41/77


[DIP] Le dilemme itr...

Vous navez pas vraiment les mmes gots que votre voisin en matire de
musique. Il lui arrive souvent dcouter sa musique fond. De mme il
vous arrive (en reprsailles) de mettre votre musique un volume plus que
raisonnable. Ce qui a pour consquences que le lendemain il recommence
nouveau. En dehors de ces priodes agites, vous apprciez les priodes o
aucun de vous ne gne lautre.
Supposons que lon pondre votre satisfaction :
. Vous avez une satisfaction de 5 couter votre musique un volume
important.
. La satisfaction est de 0 lorsque votre voisin met sa musique fond.
. Une soire calme, sans musique vous apporte une satisfaction de 3.
. Le fait dcouter simultanment votre musique mle celle du voisin,
donne une satisfaction de 1.

B Vous savez ce que votre voisin a eu comme comportement les jours


prcdents, que faites-vous aujourdhui?
Introduction a la Theorie des Jeux p.42/77
[DIP] Le dilemme . . .

. Introduction par F LOOD et D RESHER la RAND Corp. en 1952


. Jeu somme non-nulle
. 2 joueurs jouent simultanment
. 2 choix de jeux :
. COOP ERER, i.e. tre gentil, on notera C
. TRAHIR, i.e. tre mchant, on notera D
. Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix
de jeu avec :
(0) S<P <R<T

Introduction a la Theorie des Jeux p.43/77


[DIP] Le dilemme itr . . .

. Les joueurs se rencontrent plusieurs fois


. chaque itration les joueurs ont connaissance des coups prcdents
. Ils ne connaissent pas le terme du jeu
. Le gain dun joueur est le cumul de ses gains dans chaque rencontre
. Pour favoriser la coopration on ajoute la contrainte :

(0) S + T < 2R

Introduction a la Theorie des Jeux p.44/77


[DIP] Dilemme itr des prisonniers (rsum)

Dilemme. . . S<P <R<T


. . . itr S + T < 2R

Cooperate Defect
R=3 S=0
Reward Suckers payoff
Cooperate
rcompense pour salaire de la dupe
coopration mutuelle
T =5 P =1
Temptation Punishment
Defect
tentation trahir punition pour la trahison
mutuelle
Score du joueur de la ligne.

Introduction a la Theorie des Jeux p.45/77


[DIP] Des applications concrtes...

. Deux pays doivent-ils lever des taxes douanires sur les produits
imports de lautre pays.
. Deux entreprises concurrentes doivent-elles essayer de sentendre
pour se partag un march ou se faire concurrence ?
. Deux espces vivant sur un mme territoire doivent-elles cohabiter ou
se disputer la nourriture disponible ?

Introduction a la Theorie des Jeux p.46/77


[DIP] Les stratgies

Quelques exemples :

. gentille . lunatique
. mchante . majoritaire_gentille
. per_CCD . majoritaire_mchante
. rancunire . donnant_donnant

Introduction a la Theorie des Jeux p.47/77


[DIP] Exemples (rencontres)

1 2 3 4 5 6 7 8 9 10

score de gentille 0 0 0 0 0 0 0 0 0 0 = 0
jeu de gentille C C C C C C C C C C

jeu de mchante D D D D D D D D D D
score de mchante 5 5 5 5 5 5 5 5 5 5 = 50

score de per_CCD 3 3 5 0 0 1 0 0 1 0 = 13
jeu de per_CCD C C D C C D C C D C

jeu de rancunire C C C D D D D D D D
score de rancunire 3 3 0 5 5 1 5 5 1 5 = 33

Introduction a la Theorie des Jeux p.48/77


[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :

Introduction a la Theorie des Jeux p.49/77


[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :


mchante, car gnralisation du dilemme non itr

Introduction a la Theorie des Jeux p.49/77


[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :


mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :

Introduction a la Theorie des Jeux p.49/77


[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :


mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :
aucune, car meilleure contre mchante et contre rancunire est impossible

Introduction a la Theorie des Jeux p.49/77


[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :


mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :
aucune, car meilleure contre mchante et contre rancunire est impossible

B Problme de dfinition du critre dvaluation des stratgies

Introduction a la Theorie des Jeux p.49/77


[DIP] Quelle est la meilleure stratgie ?

Sur des confrontations de 100 parties :


. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

Introduction a la Theorie des Jeux p.50/77


[DIP] Quelle est la meilleure stratgie ?

Sur des confrontations de 100 parties :


. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.
Mais...

. 2 gentilles entre elles obtiennent chacune 300 points


. 2 mchantes entre elles obtiennent chacune 100 points

. Chaque stratgie est bonne (au sens du meilleur score) face certaines
et mauvaises face dautres car elle ne sait pas qui elle a affaire.

Introduction a la Theorie des Jeux p.50/77


[DIP] Les tournois

. Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif


. Le gain dune stratgie est le cumul de ses scores face chaque
adversaire
. Toutes les parties ont la mme longueur (mme nombre ditrations),
mais les stratgies ne la connaissent pas et ne peuvent pas le savoir

Introduction a la Theorie des Jeux p.51/77


[DIP] Exemples (tournoi)

gentille mchante per_CCD rancunire


gentille 30 50 36 30
mchante 0 10 3 9
per_CCD 21 38 24 33
rancunire 30 14 13 30

Score 81 112 76 102

1
8
>
> mchante
< 2
>
rancunire
Classement
>
> 3 gentille
4
>
per_CCD
:

Introduction a la Theorie des Jeux p.52/77


[DIP] Un tournoi

Tournois entre 10 stratgies parmi 12 :

. gentille . rancunire . majoritaire_mchante


. mchante . per_DDC . mfiante
. lunatique . per_CCD . sondeur
. donnant_donnant . majoritaire_gentille . donnant_donnant_dur

Nombre de tournois jous par chaque stratgie : 55

B Donnez le classement du tournoi...

Introduction a la Theorie des Jeux p.53/77


[DIP] Un tournoi

. gentille . rancunire . majoritaire_mchante


. mchante . per_DDC . mfiante
. lunatique . per_CCD . sondeur
. donnant_donnant . majoritaire_gentille . donnant_donnant_dur

donnant_donnant : 42
majoritaire_gentille : 19
rancunire : 4
Scores :
sondeur : 1
lunatique : 0
mchante : 0

Introduction a la Theorie des Jeux p.54/77


[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au


coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

Introduction a la Theorie des Jeux p.55/77


[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au


coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

. donnant-donnant ne gagne jamais contre personne !

Introduction a la Theorie des Jeux p.55/77


[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au


coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

. donnant-donnant ne gagne jamais contre personne !


. Au mieux elle fait le mme score.

Introduction a la Theorie des Jeux p.55/77


[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au


coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

. donnant-donnant ne gagne jamais contre personne !


. Au mieux elle fait le mme score.
. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la
longueur de la partie !

Introduction a la Theorie des Jeux p.55/77


[DIP] volution cologique

Simulation de lvolution naturelle :

. Chaque stratgie est reprsente par une population de N entits


. On effectue un tournoi entre toutes les entits
. Les entits de faibles stratgies (au sens du classement dans le
tournoi) sont dfavorises, celles stratgie forte sont favorises
. La favorisation est ralise par une redistribution proportionnelle de la
population

Ce cycle est rpt jusqu stabilisation de la population

Introduction a la Theorie des Jeux p.56/77


[DIP] Exemples (volution)

400
spiteful
all_c
all_d
350 per_ccd

300

250

200

150

100

50

0
0 2 4 6 8 10 12 14 16 18 20

Introduction a la Theorie des Jeux p.57/77


[DIP] Une morale trs morale...

Critres de qualit pour une stratgie (en volution) : [Axelrod,81]


. Gentillesse
. Ractivit
. Pardon
. Simplicit

Introduction a la Theorie des Jeux p.58/77


[DIP] Une morale trs morale...

Critres de qualit pour une stratgie (en volution) : [Axelrod,81]


. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )

Introduction a la Theorie des Jeux p.58/77


[DIP] Une morale trs morale...

Critres de qualit pour une stratgie (en volution) : [Axelrod,81]


. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )
Pour plus de dtails sur le dilemme itr des prisonniers :
http://www.lifl.fr/IPD

Introduction a la Theorie des Jeux p.58/77


Jeux rpts

. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils


de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.

Introduction a la Theorie des Jeux p.59/77


Jeux rpts

. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils


de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.

Introduction a la Theorie des Jeux p.59/77


Jeux rpts

. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils


de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.
. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les
gains obtenus litration courante t soient plus/moins importants aux
yeux de lagent que les gains litration suivante t+1 . Pour modliser
cela on peut utiliser un facteur dactualisation .

t = t+1

Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur


pour les gains actuels. Introduction a la Theorie des Jeux p.59/77
Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

Introduction a la Theorie des Jeux p.60/77


Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T

Introduction a la Theorie des Jeux p.60/77


Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1

Introduction a la Theorie des Jeux p.60/77


Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.

Introduction a la Theorie des Jeux p.60/77


Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.

Introduction a la Theorie des Jeux p.60/77


Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:

i (G, T ) = Tt=0 t i (t)

. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Ce rsultat signifie que lensemble des quilibres de Nash dun jeu
rpt est immense: quasiment toute squence (finie) de jeu correspond
un quilibre de Nash.
Introduction a la Theorie des Jeux p.60/77
Jeux deux joueurs Somme nulle

. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition

Introduction a la Theorie des Jeux p.61/77


Jeux deux joueurs Somme nulle

. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = a

Introduction a la Theorie des Jeux p.61/77


Jeux deux joueurs Somme nulle

. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0

Introduction a la Theorie des Jeux p.61/77


Jeux deux joueurs Somme nulle

. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Exemples :
. Jeux de plateau (echecs, dames, . . .)
. Guerre
. ...

Introduction a la Theorie des Jeux p.61/77


Jeux deux joueurs somme nulle - Exemple

Joueur 2

y1 y2 y3 y4
x1 18,-18 3,-3 0,0 2,-2
Joueur 1 x2 0,0 3,-3 8,-8 20,-20
x3 5,-5 4,-4 5,-5 5,-5
x4 9,-9 3,-3 0,0 20,-20

Introduction a la Theorie des Jeux p.62/77


Jeux deux joueurs somme nulle - Exemple

Joueur 2

y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20

Introduction a la Theorie des Jeux p.62/77


Jeux deux joueurs somme nulle - Exemple

Joueur 2

y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20

. Le joueur 1 tente de maximiser son niveau de scurit


. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))

Introduction a la Theorie des Jeux p.62/77


Jeux deux joueurs somme nulle - Exemple

Joueur 2

y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20

. Le joueur 1 tente de maximiser son niveau de scurit


. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))
. Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant
v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de
Nash et sont des stratgies respectivement maximin et minimax pour
les joueurs 1 et 2. Introduction a la Theorie des Jeux p.62/77
Jeux sous forme extensive

3 1 2 3
1 z w x x w
(3,2,9)

x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u

(4,2,4) (2,3,1)

Introduction a la Theorie des Jeux p.63/77


Jeux sous forme extensive

3 1 2 3
1 z w x x w
(3,2,9)

x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u

(4,2,4) (2,3,1)

. Rcurrence rebours (backward induction)


. On commence par chercher les choix optimaux la dernire
priode (noeuds terminaux).
. On remonte larbre de noeud en noeud, en cherchant chaque
noeud le choix optimal, une fois quon a pris en compte les choix
optimaux pour chaque noeud fils.
Introduction a la Theorie des Jeux p.63/77
Jeux sous forme extensive

Tout jeu (fini) sous forme extensive a information parfaite a un


equilibre de Nash en strategies pures (equilibre obtenable par
recurrence a rebours). (Zermelo (1953), Kuhn (1953))

Introduction a la Theorie des Jeux p.64/77


Forme extensive - Sous-jeu

1

x y
2
(2,2)
u v
1
(3,1)
r s
2
w z z
w
(2,-2) (-2,2) (-2,2) (2,-2)

Introduction a la Theorie des Jeux p.65/77


Forme extensive - Sous-jeu

1

x y
2
(2,2)
u v
1
(3,1) (0,0)

Introduction a la Theorie des Jeux p.65/77


Forme extensive - Sous-jeu

1

x y
2
(2,2)
u v
1
(3,1) (0,0)

Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud
(qui est un ensemble dinformation singleton), de tous les noeuds successeurs
de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes
tous les noeuds terminaux successeurs.

Introduction a la Theorie des Jeux p.65/77


Forme extensive - Menaces non crdibles

1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)

Introduction a la Theorie des Jeux p.66/77


Forme extensive - Menaces non crdibles

1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)

. lquilibre de Nash xv nest pas crdible car il repose sur la menace


non-crdible du joueur 2 de jouer v .

Introduction a la Theorie des Jeux p.66/77


Equilibre parfait en sous-jeux

. Un quilibre de Nash dun jeu sous forme extensive est un equilibre


parfait en sous-jeux si toute restriction du profil de stratgies un sous-
jeu est un quilibre de Nash pour ce sous-jeu.

Introduction a la Theorie des Jeux p.67/77


Equilibre parfait en sous-jeux

. Un quilibre de Nash dun jeu sous forme extensive est un equilibre


parfait en sous-jeux si toute restriction du profil de stratgies un sous-
jeu est un quilibre de Nash pour ce sous-jeu.

. Pour les jeux informations parfaites, la notion dquilibre parfait en


sous-jeux concide avec la notion de rcurrence rebours.

Introduction a la Theorie des Jeux p.67/77


Promesse non crdible

Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2

Pas daccord pour travailler (0,0)

Introduction a la Theorie des Jeux p.68/77


Promesse non crdible

Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2

Pas daccord pour travailler (0,0)

. Rputation

Introduction a la Theorie des Jeux p.68/77


Le mille-pattes - Limites de la rcurrence rebours

1 2 1 1 2 1 2
... (100,100)
R r R R r R r
D d D D d D d

(1,1) (0,3) (2,2) (98,98) (97,100) (99,99) (98,101)

Introduction a la Theorie des Jeux p.69/77


Limites de la rcurrence rebours

. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur


1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

Introduction a la Theorie des Jeux p.70/77


Limites de la rcurrence rebours

. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur


1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

. Ecrire ce jeu sous forme extensive en ne considrant que les partages


(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.

Introduction a la Theorie des Jeux p.70/77


Jeux coopratifs 2 joueurs

. Dans les jeux coopratifs on autorise la communication et les accords


entre joueurs avant la partie.
. Tous les messages formuls par un joueur sont transmis sans
modification lautre joueur.
. Tous les accords entre joueurs seront respects.
. Lvaluation des situations par un joueur nest pas perturbe par les
ngociations prliminaires.

. Guerre des sexes

Introduction a la Theorie des Jeux p.71/77


Jeu de marchandage - Ensemble de ngociation

L ensemble de negociation dun jeu de marchandage est lensemble des


issues :
. ralisables
. appartenant lespace de marchandage
. efficientes
. telles quaucune autre issue ne donne plus un joueur et autant
lautre (non pareto-domine)
. individuellement rationnelles
. chaque joueur gagne au moins autant que le gain quil est sur
dobtenir si il ny a pas daccord.

Introduction a la Theorie des Jeux p.72/77


Jeu de Marchandage - Solution de Nash

. Invariance a lechelle dutilite


Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de
marchandage, ie si ils ne diffrent que sur les units et lorigine des
fonctions dutilits, alors les deux solutions F ([R1 , (u1 , v1 )]) et
F ([R2 , (u2 , v2 )]) doivent tre les mmes au changement dchelle prs.
. Pareto optimalite
La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits
suivantes :
. u0 u et v0 v
. (u0 , v0 ) est un point de R
. il ny a pas de (u, v) dans R (diffrent de (u0 , v0 )) tel que u u0 et
v v0 .

Introduction a la Theorie des Jeux p.73/77


Jeu de Marchandage - Solution de Nash

. Independance des alternatives non disponibles


Soient deux jeux de marchandage avec le mme point de status quo et
tels que les issues du premier sont incluses dans les issues du second.
Si la solution du second jeu est ralisable dans le premier jeu, alors ce
doit tre aussi la solution du premier jeu :
. Si R1 R2 et F ([R2 , (u , v )]) R1 , alors
F ([R1 , (u , v )]) = F ([R2 , (u , v )])
. Symetrie
Si un jeu de marchandage a les proprits suivantes :
. u = v
. (u, v) R implique (v, u) R
. (u0 , v0 ) = F ([R, (u , v )])
Alors
u0 = v 0

Introduction a la Theorie des Jeux p.74/77


Jeu de Marchandage - Solution de Nash

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :

. Changeons lorigine des utilits des joueurs pour que le point (u , v )


soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).

Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

Introduction a la Theorie des Jeux p.75/77


Jeu de Marchandage - Solution de Nash

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :

. Changeons lorigine des utilits des joueurs pour que le point (u , v )


soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).

Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

Thorme. Lunique solution qui verifie les 4 proprietes desirees est la


solution de Nash. (Nash (1950))

Introduction a la Theorie des Jeux p.75/77


Jeux contre la nature

. Si on considre un jeu deux joueurs dont un des deux joueurs est la


nature, on fait de la dcision dans le risque ou dans lincertain.
. En ce sens la thorie de la dcision peut tre vue comme un cas partic-
ulier de la thorie des jeux.

Introduction a la Theorie des Jeux p.76/77


Conclusion

. Jeux coopratifs
. Jeux information incomplte
. Rationalit limite

Introduction a la Theorie des Jeux p.77/77

Vous aimerez peut-être aussi