Académique Documents
Professionnel Documents
Culture Documents
TheorieDesJeux PDF
TheorieDesJeux PDF
Sebastien Konieczny
konieczny@cril.univ-artois.fr
CRIL-CNRS
Universite dArtois - Lens
Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.
Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.
. groupe
. interaction
. stratgique
. rationnels
Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.
. groupe
. interaction
. stratgique
. rationnels
Normatif vs Descriptif
. Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
. Dois-je travailler ou faire semblant ?
. Est-ce que jcoute de la musique ce soir ?
. Enchres, vote
. Comportement animal
. Stratgies militaires/conomiques
. Partages de ressource (marchandage)
. Est-ce quune entreprise doit exploiter ses salaris ?
. Est-ce quune entreprise doit entrer sur un march ou pas ?
. Faut-il contrler les dclarations dimpots sur le revenu ?
. ...
. Qui? Joueurs
. Quoi? Coups (actions/choix) - Stratgies
. Quand? Droulement du jeu
. Combien? Que rapporte chaque issue aux diffrents joueurs ?
. Information
. Rptition
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Utiliser une fonction dutilit pour dfinir les prfrences de lagent ne
suppose pas que lagent utilise cette fonction, mais quil raisonne con-
formment un ensemble de conditions de rationalit. Von Neuman et
Morgenstern (1944), Savage (1954).
Notations :
. On notera s un profil de stratgies {s1 , . . . , sn } o i si Si .
. On note si le profil s des stratgies autres que celles du joueur i :
si = {s1 , . . . , si1 , si+1 , . . . , sn }.
. On note S lespace des stratgies, ie : S = n
i=1 Si
1 y
x
s 2 t u
2
v
Joueur 1
A y
x
Joueur 2
s B t u
C v
A y
x
s B t u
C v
A y
x
u B v u
C v
A y
x
u B v u
C v
. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.
Joueur 2
Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Joueur 2
Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
A y
x
Forme extensive : u B C v
v u
Joueur 2
Forme stratgique : s1 s2 s3 s4
Joueur 1 x 4,2 4,2 3,1 3,1
y 2,5 9,0 2,5 9,0
A y
x
Forme extensive : u B C v
v u
s1: u si x, u si y s2: u si x, v si y
s3: v si x, u si y s4: v si x, v si y
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
i (si 0 , si ) i (si , si )
Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,3
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
quilibres de Nash.
quilibres de Nash.
. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme
utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s0 ).
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5
Joueur 2
u v
Joueur 1 x 9,9 0,8
y 8,0 7,7
Joueur 2
u v
Joueur 1 x 9,9 0,8
y 8,0 7,7
min i (si , si )
si
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Les stratgies que nous avons dfinies et utilises pour le moment sont
des strategies pures, cest--dire les options qui se prsentent aux
joueurs.
. Une strategie mixte i est une distribution de probabilit sur
lensemble des stratgies pures.
. Lensemble des stratgies mixtes dun joueur i se note i .
. Lensemble des stratgies pures utilises (i.e. dont la probabilit nest
pas nulle) par une stratgie mixte i est appel le support de la
stratgie mixte.
. Notons pi (sk ) la probabilit associe sk par i , lutilit dun profil de
stratgies mixtes est dfinie par :
X Yn
i () = ( pj (sj ))i (s)
sS j=1
i (i , i
) i (i , i )
i (i , i
) i (i , i )
i (i , i
) i (i , i )
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
2 2x
0 x
1/3 2/3 1
Introduction a la Theorie des Jeux p.34/77
Reprsentation graphique du jeu
0 x
1/3 2/3 1 1x
Introduction a la Theorie des Jeux p.34/77
Reprsentation graphique du jeu
2 2x
0 x
1/3 2/3 1 1x
Introduction a la Theorie des Jeux p.34/77
La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Donc:
. Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f
. Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c
. Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Donc:
. Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
. Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c
. Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
= 3xy x y + 1
2 () = x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
= 3xy 2x 2y + 2
Joueur 2
1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.
Joueur 2
1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.
Les gains des deux joueurs avec sont :
1 ( ) = 3.2/3.1/3 2/3 1/3 + 1
= 2/3
2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3
2/3
joueur1
1/3
x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Reprsentation graphique du jeu
y
joueur2
1
2/3
joueur1
1/3
x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Reprsentation graphique du jeu
y
joueur2
1 r
2/3
joueur1
1/3 r
r x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
Coopration - Itration - Corrlation
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Si un des deux avoue et que lautre navoue rien, le premier est libr,
et le second emprisonn (5 ans);
. Si les deux avouent, les deux iront en prison (4 ans);
. Si aucun des deux navoue, les deux seront seront librs assez vite (2
ans).
Joueur 2
C D
Joueur 1 C 3,3 0,5
D 5,0 1,1
Vous navez pas vraiment les mmes gots que votre voisin en matire de
musique. Il lui arrive souvent dcouter sa musique fond. De mme il
vous arrive (en reprsailles) de mettre votre musique un volume plus que
raisonnable. Ce qui a pour consquences que le lendemain il recommence
nouveau. En dehors de ces priodes agites, vous apprciez les priodes o
aucun de vous ne gne lautre.
Supposons que lon pondre votre satisfaction :
. Vous avez une satisfaction de 5 couter votre musique un volume
important.
. La satisfaction est de 0 lorsque votre voisin met sa musique fond.
. Une soire calme, sans musique vous apporte une satisfaction de 3.
. Le fait dcouter simultanment votre musique mle celle du voisin,
donne une satisfaction de 1.
(0) S + T < 2R
Cooperate Defect
R=3 S=0
Reward Suckers payoff
Cooperate
rcompense pour salaire de la dupe
coopration mutuelle
T =5 P =1
Temptation Punishment
Defect
tentation trahir punition pour la trahison
mutuelle
Score du joueur de la ligne.
. Deux pays doivent-ils lever des taxes douanires sur les produits
imports de lautre pays.
. Deux entreprises concurrentes doivent-elles essayer de sentendre
pour se partag un march ou se faire concurrence ?
. Deux espces vivant sur un mme territoire doivent-elles cohabiter ou
se disputer la nourriture disponible ?
Quelques exemples :
. gentille . lunatique
. mchante . majoritaire_gentille
. per_CCD . majoritaire_mchante
. rancunire . donnant_donnant
1 2 3 4 5 6 7 8 9 10
score de gentille 0 0 0 0 0 0 0 0 0 0 = 0
jeu de gentille C C C C C C C C C C
jeu de mchante D D D D D D D D D D
score de mchante 5 5 5 5 5 5 5 5 5 5 = 50
score de per_CCD 3 3 5 0 0 1 0 0 1 0 = 13
jeu de per_CCD C C D C C D C C D C
jeu de rancunire C C C D D D D D D D
score de rancunire 3 3 0 5 5 1 5 5 1 5 = 33
. Chaque stratgie est bonne (au sens du meilleur score) face certaines
et mauvaises face dautres car elle ne sait pas qui elle a affaire.
1
8
>
> mchante
< 2
>
rancunire
Classement
>
> 3 gentille
4
>
per_CCD
:
donnant_donnant : 42
majoritaire_gentille : 19
rancunire : 4
Scores :
sondeur : 1
lunatique : 0
mchante : 0
400
spiteful
all_c
all_d
350 per_ccd
300
250
200
150
100
50
0
0 2 4 6 8 10 12 14 16 18 20
t = t+1
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1
. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1
. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) = 1
1
. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Ce rsultat signifie que lensemble des quilibres de Nash dun jeu
rpt est immense: quasiment toute squence (finie) de jeu correspond
un quilibre de Nash.
Introduction a la Theorie des Jeux p.60/77
Jeux deux joueurs Somme nulle
. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = a
. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Exemples :
. Jeux de plateau (echecs, dames, . . .)
. Guerre
. ...
Joueur 2
y1 y2 y3 y4
x1 18,-18 3,-3 0,0 2,-2
Joueur 1 x2 0,0 3,-3 8,-8 20,-20
x3 5,-5 4,-4 5,-5 5,-5
x4 9,-9 3,-3 0,0 20,-20
Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20
Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20
Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20
3 1 2 3
1 z w x x w
(3,2,9)
x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u
(4,2,4) (2,3,1)
3 1 2 3
1 z w x x w
(3,2,9)
x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u
(4,2,4) (2,3,1)
1
x y
2
(2,2)
u v
1
(3,1)
r s
2
w z z
w
(2,-2) (-2,2) (-2,2) (2,-2)
1
x y
2
(2,2)
u v
1
(3,1) (0,0)
1
x y
2
(2,2)
u v
1
(3,1) (0,0)
Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud
(qui est un ensemble dinformation singleton), de tous les noeuds successeurs
de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes
tous les noeuds terminaux successeurs.
1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)
1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)
Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2
Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2
. Rputation
1 2 1 1 2 1 2
... (100,100)
R r R R r R r
D d D D d D d
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
. Jeux coopratifs
. Jeux information incomplte
. Rationalit limite