TheorieDesJeux PDF

Introduction la Thorie des Jeux
Sebastien Konieczny
konieczny@cril.univ-artois.fr
CRIL-CNRS
Universite dArtois - Lens
Introduction a la Theorie des Jeux p.1/77

Thorie des Jeux
Dfinition La theorie des jeux permet une analyse formelle des problemes
poses par linteraction strategique dun groupe dagents rationnels pour-
suivant des buts qui leur sont propres.

Thorie des Jeux
. groupe
. interaction
. stratgique
. rationnels

Thorie des Jeux
. groupe
. interaction
. stratgique
. rationnels
Normatif vs Descriptif

A quoi sert la thorie des jeux ?
. Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
. Dois-je travailler ou faire semblant ?
. Est-ce que jcoute de la musique ce soir ?
. Enchres, vote
. Comportement animal
. Stratgies militaires/conomiques
. Partages de ressource (marchandage)
. Est-ce quune entreprise doit exploiter ses salaris ?
. Est-ce quune entreprise doit entrer sur un march ou pas ?
. Faut-il contrler les dclarations dimpots sur le revenu ?
. ...

Un peu dhistoire...
. Cournot (1838), Borel (1921)

. Zermelo (1913)
. Von Neumann (1928)
. Theory of Games and Economic Behaviour, Von Neumann et
Morgenstern (1944)
. Nash (1950)
. Selten (1965), Harsanyi (1967)

Bibliographie
. M. Yildizoglu. Introduction a la theorie des jeux. Dunod. 2003.

. D. Kreps. Theorie des jeux et modelisation economique. Dunod. 1990.
. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.
. P. K. Dutta. Strategies and Games. MIT Press. 1999.
. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.
. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Be-
havior. Princeton University Press. 1944.

Terminologie - Une petite taxonomie...
. Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle

. Jeux information complte / Jeux information incomplte
. Jeux information parfaite / Jeux information imparfaite
. Jeux coopratifs / Jeux non-coopratifs
. Jeux 2 joueurs / Jeux n joueurs

Plan du cours
. Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu

sous forme extensive - Stratgie
. Concepts de solution - Stratgies dominantes
. Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies
mixtes
. Rsolution par chainage arrire - Menaces crdibles - Equilibres
parfaits en sous-jeux
. Jeux somme nulle
. Jeux rpts - Dilemme itr du prisonnier
. Jeux information incomplte
. Jeux coopratifs - Marchandage

Formalisation dun Jeu
Quest-ce quun jeu ?
. Qui? Joueurs
. Quoi? Coups (actions/choix) - Stratgies
. Quand? Droulement du jeu
. Combien? Que rapporte chaque issue aux diffrents joueurs ?
Autres informations importantes:
. Information
. Rptition

Jeux sous forme stratgique - Exemple
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.

Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Utiliser une fonction dutilit pour dfinir les prfrences de lagent ne
suppose pas que lagent utilise cette fonction, mais quil raisonne con-
formment un ensemble de conditions de rationalit. Von Neuman et
Morgenstern (1944), Savage (1954).

Jeux sous forme stratgique
Un jeu sous forme stratgique est dfini par :

. un ensemble N = {1, . . . , n} de joueurs
. pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni }
. pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR,
qui chaque ensemble de stratgies associe les gains du joueur i.
Notations :
. On notera s un profil de stratgies {s1 , . . . , sn } o i si Si .
. On note si le profil s des stratgies autres que celles du joueur i :
si = {s1 , . . . , si1 , si+1 , . . . , sn }.
. On note S lespace des stratgies, ie : S = n
i=1 Si

Jeux sous forme extensive - Exemple
1 y
x
s 2 t u
2
v
(4,2) (3,1) (2,5) (9,0)

Jeux sous forme extensive
Un jeu sous forme extensive est dfini par :

. un ensemble N = {1, . . . , n} de joueurs
. un arbre fini compos de :
. un ensemble de noeuds {A, B, C, . . .} reprsentant les coups
. un ensemble de branches {x, y, z, . . .} reprsentant les alternatives
chaque coup
. une fonction de nommage qui indique chaque noeud quel est le
joueur qui doit jouer
. une fonction de valuation qui associe chaque noeud terminal un
vecteur de nombres reprsentant les gains de chacun des joueurs
. une partition des noeuds en un ensemble densembles dinformations
reprsentant les croyances (imparfaites) des joueurs

Jeux sous forme extensive - Ensemble dinformations
Joueur 1
A y
x
Joueur 2
s B t u
C v
(4,2) (3,1) (2,5) (9,0)

A y
x
s B t u
C v
(4,2) (3,1) (2,5) (9,0)

A y
x
u B v u
C v
(4,2) (3,1) (2,5) (9,0)

A y
x
u B v u
C v
(4,2) (3,1) (2,5) (9,0)
. Ensembles dinformation : {A} et {B, C}

. Coups simultans
. Incertitude (croyances)

Relation entre formes stratgique et extensive
. A chaque jeu sous forme extensive correspond un jeu sous forme

stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.

. A chaque jeu sous forme extensive correspond un jeu sous forme

stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
. Une stratgie est la spcification complte du comportement dun

joueur dans nimporte quelle situation (dans un jeu sous forme
extensive cela signifie donc pour chaque ensemble dinformation o
cest ce joueur de jouer).
. Algorithme

Stratgie
. Une strategie pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

Joueur 2
Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Joueur 2
Forme stratgique : u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
A y
x
Forme extensive : u B C v
v u
(4,2) (3,1) (2,5) (9,0)

Joueur 2
Forme stratgique : s1 s2 s3 s4
Joueur 1 x 4,2 4,2 3,1 3,1
y 2,5 9,0 2,5 9,0
A y
x
Forme extensive : u B C v
v u
(4,2) (3,1) (2,5) (9,0)
s1: u si x, u si y s2: u si x, v si y
s3: v si x, u si y s4: v si x, v si y

Elimination de stratgies domines
Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0

Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
. Une stratgie si est (strictement) domine pour le joueur i si il existe

une stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) > i (si , si )

Joueur 2
u v
Joueur 1 x 4,2 3,1
y 2,5 9,0
. Une stratgie si est faiblement domine pour le joueur i si il existe une

stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) i (si , si )

Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,2

Joueur 2
u v w
x 3,6 7,1 4,8
Joueur 1
y 5,1 8,2 6,1
z 6,0 6,2 3,3

. Un jeu est dit rsolvable par limination itrative des stratgies

domines, si on obtient un unique profil en liminant successivement
des stratgies (strictement) domines.
. Les profils obtenus aprs limination itrative des stratgies
(strictement) domines (EISD) ne dpendent pas de lordre choisi pour
llimination des stratgies.
. Par contre, on peut obtenir des profils diffrents lorsque lon choisit des
ordres diffrents pour llimination itrative de stratgies faiblement
domines (EISfD).
. Les rsultats obtenus par EISD sont donc plus robustes que ceux
obtenus par EISfD.
. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable
par EISD !

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0

Equilibre de Nash
Joueur 2
u v w
x 3,0 0,2 0,3
Joueur 1
y 2,0 1,1 2,0
z 0,3 0,2 3,0
. La notion dequilibre de Nash est une situation telle quaucun joueur

na intrt dvier (seul) de la situation obtenue.
. Un equilibre de Nash est un profil de stratgies s = {s1 , . . . , sn } tel
que pour tout joueur i, pour toute stratgie s0 Si :
i (s1 , si ) i (s0 , si )

Equilibre de Nash et fonction de meilleure rponse
. La fonction de meilleure rponse du joueur i est la fonction B i qui

associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }

Equilibre de Nash et fonction de meilleure rponse
. La fonction de meilleure rponse du joueur i est la fonction B i qui

associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }
. Un quilibre de Nash est un profil s tel que la stratgie du joueur i est

une meilleure rponse:
si Bi (si ) pour tout i N

Equilibre de Nash: Proprits
. Un profil (unique) obtenu par limination itrative de stratgies

(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).


quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !


quilibre du jeu).
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?


quilibre du jeu).
plusieurs ?
. Deux quilibres de Nash s = (si , si ) et s0 = (s0i , si ) sont
0
interchangeables si pour tout i (si , s0

i ) et (si , si ) sont aussi des
0
quilibres de Nash.


quilibre du jeu).
plusieurs ?
. Deux quilibres de Nash s = (si , si ) et s0 = (s0i , si ) sont
0
interchangeables si pour tout i (si , s0

i ) et (si , si ) sont aussi des
0
quilibres de Nash.
. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme
utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s0 ).

Critre de Pareto
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5

Critre de Pareto
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5
. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .

Critre de Pareto
Joueur 2
u v
Joueur 1 x 4,4 3,1
y 2,3 7,5
. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .
. Un profil s domine strictement un profil s0 au sens de Pareto si s est

strictement meilleur pour tous les joueurs, i.e. pour tout s i s et s0i s0
on a si > s0i .

Critre de Pareto vs niveau de scurit
Joueur 2
u v
Joueur 1 x 9,9 0,8
y 8,0 7,7

Critre de Pareto vs niveau de scurit
Joueur 2
u v
Joueur 1 x 9,9 0,8
y 8,0 7,7
. On dfinit le niveau de securite dune strategie si pour le joueur i

comme le gain minimum que peut apporter cette stratgie quel que soit
le choix des autres joueurs, soit
min i (si , si )
si
. On dfinit le niveau de securite dun joueur i comme le niveau de scu-

rit maximal des stratgies de i.

Points focaux
. Le problme pos par la multiplicit dquilibres de Nash est un

problme de coordination.
. Pour certains jeux, certains quilibres semblent plus vidents que
dautres aux joueurs. Cela est du certaines conventions sociales. Ces
quilibres de Nash obtenus partir de ces conventions sont appels
points focaux.

La guerre des sexes
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

La guerre des sexes
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Sur cet exemple le niveau de scurit des deux joueurs est 0.

La guerre des sexes
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Supposons que le joueur 1 joue alatoirement f et c avec une

probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

La guerre des sexes
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Supposons que le joueur 1 joue alatoirement f et c avec une

probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

. Avec cette stratgie le niveau de scurit du joueur 1 est 1/2

Stratgies pures - Stratgies mixtes
. Les stratgies que nous avons dfinies et utilises pour le moment sont
des strategies pures, cest--dire les options qui se prsentent aux
joueurs.
. Une strategie mixte i est une distribution de probabilit sur
lensemble des stratgies pures.
. Lensemble des stratgies mixtes dun joueur i se note i .
. Lensemble des stratgies pures utilises (i.e. dont la probabilit nest
pas nulle) par une stratgie mixte i est appel le support de la
stratgie mixte.
. Notons pi (sk ) la probabilit associe sk par i , lutilit dun profil de
stratgies mixtes est dfinie par :
X Yn
i () = ( pj (sj ))i (s)
sS j=1

Stratgie

Stratgie
. Une strategie mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.

Stratgie
. Une strategie mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.
. Une strategie locale du joueur i en un ensemble dinformation A est
une distribution de probabilits sur lensemble des actions disponibles
en cet ensemble dinformation. On note iA lensemble des stratgies
locales du joueur i pour lensemble dinformation A et iA une stratgie
locale de ce joueur en A.
. Une strategie comportementale du joueur i est un vecteur de strat-
gies locales de ce joueur, contenant une stratgie locale par ensemble
dinformation de ce joueur. On note i lensemble des stratgies com-
portementales du joueur i, et i une stratgie comportementale de ce
joueur.
Equilibres de Nash en stratgies mixtes
Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies

mixtes tel que pour tout i et tout i i
i (i , i

) i (i , i )


i (i , i

) i (i , i )
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout

si S i
i (i , i

) i (si , i )


i (i , i

) i (i , i )
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout

si S i
i (i , i

) i (si , i )
Thorme.[Nash, 1950] Tout jeu sous forme strategique a un equilibre de

Nash en strategies mixtes.

La guerre des sexes
Joueur 2
f c
Joueur 1 f 2,1 0,0 x
c 0,0 1,2 1x
. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x

maximise-t-il son niveau de scurit ?

La guerre des sexes
Joueur 2
f c
c 0,0 1,2 1x

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x

1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x

La guerre des sexes
Joueur 2
f c
c 0,0 1,2 1x

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x

1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x
max min(2x, 1 x) = 1/3

x

La guerre des sexes
Joueur 2
f c
c 0,0 1,2 1x

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x

1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x
max min(2x, 1 x) = 1/3

x
. Le niveau de scurit du joueur 1 est donc de 2/3.

La guerre des sexes
Joueur 2
f c
c 0,0 1,2 1x

1 (< (f, x), (c, 1 x) >, f ) = x 2 + (1 x) 0 = 2x

1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1x
max min(2x, 1 x) = 1/3

x
. Le niveau de scurit du joueur 1 est donc de 2/3.

. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette
stratgie ?
Reprsentation graphique du jeu
2 2x
0 x
1/3 2/3 1
0 x
1/3 2/3 1 1x
2 2x
0 x
1/3 2/3 1 1x
La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0
c 0,0 1,2
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Donc:
. Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f
. Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c
. Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Donc:
. Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
. Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c
. Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

La guerre des sexes
Joueur 2
y 1y
f c
Joueur 1
f 2,1 0,0 x
c 0,0 1,2 1x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
= 3xy x y + 1
2 () = x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
= 3xy 2x 2y + 2

La guerre des sexes
Joueur 2
1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.

La guerre des sexes
Joueur 2
1/3 2/3
f c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quili-
bre de Nash en stratgie mixte.
Les gains des deux joueurs avec sont :
1 ( ) = 3.2/3.1/3 2/3 1/3 + 1
= 2/3
2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3

y
2/3
joueur1
1/3
x
0 1/3 2/3 1 Introduction a la Theorie des Jeux p.38/77
y
joueur2
1
2/3
joueur1
1/3
x
y
joueur2
1 r
2/3
joueur1
1/3 r
r x
Coopration - Itration - Corrlation
Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2
. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de

jouer ?

Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2

Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.

Joueur 2
f c
Joueur 1 f 2,1 0,0
c 0,0 1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement
alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
. Que se passe-t-il si la partie est joue plusieurs fois ?

Itration: Le dilemme des prisonniers...
Deux personnes arrtes ensemble en possession darmes feu sont

souponns dun dlit fait en commun. Les policiers les sparent et disent
chacun :
. Si un des deux avoue et que lautre navoue rien, le premier est libr,
et le second emprisonn (5 ans);
. Si les deux avouent, les deux iront en prison (4 ans);
. Si aucun des deux navoue, les deux seront seront librs assez vite (2
ans).
B Vous tes un des deux prisonniers, que faites-vous ?

[DIP] Le dilemme des prisonniers
Joueur 2
C D
Joueur 1 C 3,3 0,5
D 5,0 1,1

[DIP] Le dilemme itr...
Vous navez pas vraiment les mmes gots que votre voisin en matire de
musique. Il lui arrive souvent dcouter sa musique fond. De mme il
vous arrive (en reprsailles) de mettre votre musique un volume plus que
raisonnable. Ce qui a pour consquences que le lendemain il recommence
nouveau. En dehors de ces priodes agites, vous apprciez les priodes o
aucun de vous ne gne lautre.
Supposons que lon pondre votre satisfaction :
. Vous avez une satisfaction de 5 couter votre musique un volume
important.
. La satisfaction est de 0 lorsque votre voisin met sa musique fond.
. Une soire calme, sans musique vous apporte une satisfaction de 3.
. Le fait dcouter simultanment votre musique mle celle du voisin,
donne une satisfaction de 1.
B Vous savez ce que votre voisin a eu comme comportement les jours

prcdents, que faites-vous aujourdhui?
[DIP] Le dilemme . . .
. Introduction par F LOOD et D RESHER la RAND Corp. en 1952

. Jeu somme non-nulle
. 2 joueurs jouent simultanment
. 2 choix de jeux :
. COOP ERER, i.e. tre gentil, on notera C
. TRAHIR, i.e. tre mchant, on notera D
. Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix
de jeu avec :
(0) S<P <R<T

[DIP] Le dilemme itr . . .
. Les joueurs se rencontrent plusieurs fois

. chaque itration les joueurs ont connaissance des coups prcdents
. Ils ne connaissent pas le terme du jeu
. Le gain dun joueur est le cumul de ses gains dans chaque rencontre
. Pour favoriser la coopration on ajoute la contrainte :
(0) S + T < 2R

[DIP] Dilemme itr des prisonniers (rsum)
Dilemme. . . S<P <R<T

. . . itr S + T < 2R
Cooperate Defect
R=3 S=0
Reward Suckers payoff
Cooperate
rcompense pour salaire de la dupe
coopration mutuelle
T =5 P =1
Temptation Punishment
Defect
tentation trahir punition pour la trahison
mutuelle
Score du joueur de la ligne.

[DIP] Des applications concrtes...
. Deux pays doivent-ils lever des taxes douanires sur les produits
imports de lautre pays.
. Deux entreprises concurrentes doivent-elles essayer de sentendre
pour se partag un march ou se faire concurrence ?
. Deux espces vivant sur un mme territoire doivent-elles cohabiter ou
se disputer la nourriture disponible ?

[DIP] Les stratgies
Quelques exemples :
. gentille . lunatique
. mchante . majoritaire_gentille
. per_CCD . majoritaire_mchante
. rancunire . donnant_donnant

[DIP] Exemples (rencontres)
1 2 3 4 5 6 7 8 9 10
score de gentille 0 0 0 0 0 0 0 0 0 0 = 0
jeu de gentille C C C C C C C C C C
jeu de mchante D D D D D D D D D D
score de mchante 5 5 5 5 5 5 5 5 5 5 = 50
score de per_CCD 3 3 5 0 0 1 0 0 1 0 = 13
jeu de per_CCD C C D C C D C C D C
jeu de rancunire C C C D D D D D D D
score de rancunire 3 3 0 5 5 1 5 5 1 5 = 33

[DIP] Quelle est la meilleure stratgie ?
. qui batte toutes les autres :


mchante, car gnralisation du dilemme non itr


. qui fasse le meilleur score possible face toutes les autres :


aucune, car meilleure contre mchante et contre rancunire est impossible


aucune, car meilleure contre mchante et contre rancunire est impossible
B Problme de dfinition du critre dvaluation des stratgies

Sur des confrontations de 100 parties :

. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

Sur des confrontations de 100 parties :

. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.
Mais...
. 2 gentilles entre elles obtiennent chacune 300 points

. 2 mchantes entre elles obtiennent chacune 100 points
. Chaque stratgie est bonne (au sens du meilleur score) face certaines
et mauvaises face dautres car elle ne sait pas qui elle a affaire.

[DIP] Les tournois
. Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif

. Le gain dune stratgie est le cumul de ses scores face chaque
adversaire
. Toutes les parties ont la mme longueur (mme nombre ditrations),
mais les stratgies ne la connaissent pas et ne peuvent pas le savoir

[DIP] Exemples (tournoi)
gentille mchante per_CCD rancunire

gentille 30 50 36 30
mchante 0 10 3 9
per_CCD 21 38 24 33
rancunire 30 14 13 30
Score 81 112 76 102
1
8
>
> mchante
< 2
>
rancunire
Classement
>
> 3 gentille
4
>
per_CCD
:

[DIP] Un tournoi
Tournois entre 10 stratgies parmi 12 :
. gentille . rancunire . majoritaire_mchante

. mchante . per_DDC . mfiante
. lunatique . per_CCD . sondeur
. donnant_donnant . majoritaire_gentille . donnant_donnant_dur
Nombre de tournois jous par chaque stratgie : 55
B Donnez le classement du tournoi...

[DIP] Un tournoi
. gentille . rancunire . majoritaire_mchante

. mchante . per_DDC . mfiante
. lunatique . per_CCD . sondeur
. donnant_donnant . majoritaire_gentille . donnant_donnant_dur
donnant_donnant : 42
majoritaire_gentille : 19
rancunire : 4
Scores :
sondeur : 1
lunatique : 0
mchante : 0

[DIP] donnant-donnant : une bonne stratgie
Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au

coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).


. donnant-donnant ne gagne jamais contre personne !



. Au mieux elle fait le mme score.



. Au mieux elle fait le mme score.
. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la
longueur de la partie !

[DIP] volution cologique
Simulation de lvolution naturelle :
. Chaque stratgie est reprsente par une population de N entits

. On effectue un tournoi entre toutes les entits
. Les entits de faibles stratgies (au sens du classement dans le
tournoi) sont dfavorises, celles stratgie forte sont favorises
. La favorisation est ralise par une redistribution proportionnelle de la
population
Ce cycle est rpt jusqu stabilisation de la population

[DIP] Exemples (volution)
400
spiteful
all_c
all_d
350 per_ccd
300
250
200
150
100
50
0
0 2 4 6 8 10 12 14 16 18 20

[DIP] Une morale trs morale...
Critres de qualit pour une stratgie (en volution) : [Axelrod,81]

. Gentillesse
. Ractivit
. Pardon
. Simplicit


. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )


. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du
dilemme (asynchrone, avec renoncement, bruits, . . . )
Pour plus de dtails sur le dilemme itr des prisonniers :
http://www.lifl.fr/IPD

Jeux rpts
. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils

de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.

Jeux rpts

correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.

Jeux rpts

correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.
. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les
gains obtenus litration courante t soient plus/moins importants aux
yeux de lagent que les gains litration suivante t+1 . Pour modliser
cela on peut utiliser un facteur dactualisation .
t = t+1
Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur

pour les gains actuels. Introduction a la Theorie des Jeux p.59/77
Jeux rpts: Thorme Folk
. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)

i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) = 1
1


i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) = 1
1

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur
dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) = 1
1

. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) = 1
1

. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Ce rsultat signifie que lensemble des quilibres de Nash dun jeu
rpt est immense: quasiment toute squence (finie) de jeu correspond
un quilibre de Nash.
Jeux deux joueurs Somme nulle
. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition

. Rle central
. le plus simple
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = a

. Rle central
. le plus simple
. pas de coalition
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0

. Rle central
. le plus simple
. pas de coalition
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Exemples :
. Jeux de plateau (echecs, dames, . . .)
. Guerre
. ...

Jeux deux joueurs somme nulle - Exemple
Joueur 2
y1 y2 y3 y4
x1 18,-18 3,-3 0,0 2,-2
Joueur 1 x2 0,0 3,-3 8,-8 20,-20
x3 5,-5 4,-4 5,-5 5,-5
x4 9,-9 3,-3 0,0 20,-20

Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20

Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20
. Le joueur 1 tente de maximiser son niveau de scurit

. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))

Joueur 2
y1 y2 y3 y4
x1 18 3 0 2
Joueur 1 x2 0 3 8 20
x3 5 4 5 5
x4 9 3 0 20
. Le joueur 1 tente de maximiser son niveau de scurit

. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))
. Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant
v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de
Nash et sont des stratgies respectivement maximin et minimax pour
les joueurs 1 et 2. Introduction a la Theorie des Jeux p.62/77
3 1 2 3
1 z w x x w
(3,2,9)

x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u
(4,2,4) (2,3,1)

3 1 2 3
1 z w x x w
(3,2,9)

x u y y u
y
(3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5)
w u
(4,2,4) (2,3,1)
. Rcurrence rebours (backward induction)

. On commence par chercher les choix optimaux la dernire
priode (noeuds terminaux).
. On remonte larbre de noeud en noeud, en cherchant chaque
noeud le choix optimal, une fois quon a pris en compte les choix
optimaux pour chaque noeud fils.
Tout jeu (fini) sous forme extensive a information parfaite a un

equilibre de Nash en strategies pures (equilibre obtenable par
recurrence a rebours). (Zermelo (1953), Kuhn (1953))

Forme extensive - Sous-jeu
1

x y
2
(2,2)
u v
1
(3,1)
r s
2
w z z
w
(2,-2) (-2,2) (-2,2) (2,-2)

1

x y
2
(2,2)
u v
1
(3,1) (0,0)

1

x y
2
(2,2)
u v
1
(3,1) (0,0)
Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud
(qui est un ensemble dinformation singleton), de tous les noeuds successeurs
de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes
tous les noeuds terminaux successeurs.

Forme extensive - Menaces non crdibles
1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)

Forme extensive - Menaces non crdibles
1
Joueur 2
x y
2 u v
(2,2) u Joueur 1 x 2,2 2,2
v
y 3,1 0,0
(3,1) (0,0)
. lquilibre de Nash xv nest pas crdible car il repose sur la menace

non-crdible du joueur 2 de jouer v .

Equilibre parfait en sous-jeux
. Un quilibre de Nash dun jeu sous forme extensive est un equilibre

parfait en sous-jeux si toute restriction du profil de stratgies un sous-
jeu est un quilibre de Nash pour ce sous-jeu.

Equilibre parfait en sous-jeux
. Un quilibre de Nash dun jeu sous forme extensive est un equilibre

parfait en sous-jeux si toute restriction du profil de stratgies un sous-
jeu est un quilibre de Nash pour ce sous-jeu.
. Pour les jeux informations parfaites, la notion dquilibre parfait en

sous-jeux concide avec la notion de rcurrence rebours.

Promesse non crdible
Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2

Pas daccord pour travailler (0,0)

Promesse non crdible
Exploiter 2 (2,-1)
1
Daccord pour travailler
(1,1)
Ne pas exploiter 2
2

Pas daccord pour travailler (0,0)
. Rputation

Le mille-pattes - Limites de la rcurrence rebours
1 2 1 1 2 1 2
... (100,100)
R r R R r R r
D d D D d D d
(1,1) (0,3) (2,2) (98,98) (97,100) (99,99) (98,101)

Limites de la rcurrence rebours
. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur

1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

Limites de la rcurrence rebours
. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur

1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
. Ecrire ce jeu sous forme extensive en ne considrant que les partages

(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.

Jeux coopratifs 2 joueurs
. Dans les jeux coopratifs on autorise la communication et les accords

entre joueurs avant la partie.
. Tous les messages formuls par un joueur sont transmis sans
modification lautre joueur.
. Tous les accords entre joueurs seront respects.
. Lvaluation des situations par un joueur nest pas perturbe par les
ngociations prliminaires.
. Guerre des sexes

Jeu de marchandage - Ensemble de ngociation
L ensemble de negociation dun jeu de marchandage est lensemble des

issues :
. ralisables
. appartenant lespace de marchandage
. efficientes
. telles quaucune autre issue ne donne plus un joueur et autant
lautre (non pareto-domine)
. individuellement rationnelles
. chaque joueur gagne au moins autant que le gain quil est sur
dobtenir si il ny a pas daccord.

Jeu de Marchandage - Solution de Nash
. Invariance a lechelle dutilite

Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de
marchandage, ie si ils ne diffrent que sur les units et lorigine des
fonctions dutilits, alors les deux solutions F ([R1 , (u1 , v1 )]) et
F ([R2 , (u2 , v2 )]) doivent tre les mmes au changement dchelle prs.
. Pareto optimalite
La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits
suivantes :
. u0 u et v0 v
. (u0 , v0 ) est un point de R
. il ny a pas de (u, v) dans R (diffrent de (u0 , v0 )) tel que u u0 et
v v0 .

. Independance des alternatives non disponibles

Soient deux jeux de marchandage avec le mme point de status quo et
tels que les issues du premier sont incluses dans les issues du second.
Si la solution du second jeu est ralisable dans le premier jeu, alors ce
doit tre aussi la solution du premier jeu :
. Si R1 R2 et F ([R2 , (u , v )]) R1 , alors
F ([R1 , (u , v )]) = F ([R2 , (u , v )])
. Symetrie
Si un jeu de marchandage a les proprits suivantes :
. u = v
. (u, v) R implique (v, u) R
. (u0 , v0 ) = F ([R, (u , v )])
Alors
u0 = v 0

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )

soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )

soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
Thorme. Lunique solution qui verifie les 4 proprietes desirees est la

solution de Nash. (Nash (1950))

Jeux contre la nature
. Si on considre un jeu deux joueurs dont un des deux joueurs est la

nature, on fait de la dcision dans le risque ou dans lincertain.
. En ce sens la thorie de la dcision peut tre vue comme un cas partic-
ulier de la thorie des jeux.

Conclusion
. Jeux coopratifs
. Jeux information incomplte
. Rationalit limite

TheorieDesJeux PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

TheorieDesJeux PDF

Transféré par

Droits d'auteur :

Formats disponibles

Introduction la Thorie des Jeux

Introduction a la Theorie des Jeux p.1/77

Introduction a la Theorie des Jeux p.2/77

Introduction a la Theorie des Jeux p.2/77

Introduction a la Theorie des Jeux p.2/77

Introduction a la Theorie des Jeux p.3/77

. Cournot (1838), Borel (1921)

Introduction a la Theorie des Jeux p.4/77

. M. Yildizoglu. Introduction a la theorie des jeux. Dunod. 2003.

Introduction a la Theorie des Jeux p.5/77

. Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle

Introduction a la Theorie des Jeux p.6/77

. Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu

Introduction a la Theorie des Jeux p.7/77

Quest-ce quun jeu ?

Autres informations importantes:

Introduction a la Theorie des Jeux p.8/77

Introduction a la Theorie des Jeux p.9/77

Introduction a la Theorie des Jeux p.10/77

Introduction a la Theorie des Jeux p.10/77

Un jeu sous forme stratgique est dfini par :

Introduction a la Theorie des Jeux p.11/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.12/77

Un jeu sous forme extensive est dfini par :

Introduction a la Theorie des Jeux p.13/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.14/77

(4,2) (3,1) (2,5) (9,0)

. Ensembles dinformation : {A} et {B, C}

Introduction a la Theorie des Jeux p.14/77

. A chaque jeu sous forme extensive correspond un jeu sous forme

Introduction a la Theorie des Jeux p.15/77

. A chaque jeu sous forme extensive correspond un jeu sous forme

. Une stratgie est la spcification complte du comportement dun

Introduction a la Theorie des Jeux p.15/77

Introduction a la Theorie des Jeux p.16/77

Introduction a la Theorie des Jeux p.17/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.18/77

(4,2) (3,1) (2,5) (9,0)

Introduction a la Theorie des Jeux p.19/77

Introduction a la Theorie des Jeux p.20/77

Introduction a la Theorie des Jeux p.20/77

Introduction a la Theorie des Jeux p.20/77

. Une stratgie si est (strictement) domine pour le joueur i si il existe

i (si 0 , si ) > i (si , si )

Introduction a la Theorie des Jeux p.20/77

. Une stratgie si est faiblement domine pour le joueur i si il existe une

Introduction a la Theorie des Jeux p.20/77

Introduction a la Theorie des Jeux p.21/77

Introduction a la Theorie des Jeux p.21/77

Introduction a la Theorie des Jeux p.21/77

Introduction a la Theorie des Jeux p.21/77

Introduction a la Theorie des Jeux p.21/77

. Un jeu est dit rsolvable par limination itrative des stratgies

Introduction a la Theorie des Jeux p.22/77

Introduction a la Theorie des Jeux p.23/77

Introduction a la Theorie des Jeux p.23/77