Académique Documents
Professionnel Documents
Culture Documents
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Remarque
Parfois, pour alléger les notations, on notera par i ∈ X1 la stratégie Considérons un jeu bi-matriciel (A, B).
x1i ∈ X1 du joueur (P1) et il en serait de même pour le joueur
(P2).
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Concepts de solutions Équilibre en stratégies non dominées
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Dilemme du prisonnier Dilemme du prisonnier
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
(P2) Definition
Avouer Nier Une paire de stratégies (x1i ∗ , x2j ∗ ) ∈ X1 × X2 est une paire de
� �
(P1) Avouer (−8, −8) (0, −30) stratégies de sécurité pour les deux joueurs (P1) et (P2) dans le
Nier (−30, 0) (−2, −2) jeu bimatriciel (2), si
S
Figure: Jeu du dilemme du prisonnier. V1 = min ai ∗ j = max min aij ,
j=1,n i=1,m j=1,n
(3)
V2S = min bij ∗ = max min bij .
i=1,m j=1,n i=1,m
L’équilibre en stratégies non dominées dans cette situation est la
paire de stratégies pures (x11 , x21 )=(avouer, avouer).
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Niveaux de sécurité Exemple
Exemple
(P2)
� A N �
(P1) A −8 0
Les niveaux de sécurité correspondants aux joueurs (P1) et (P2) N −30 −2
respectivement sont V1S et V2S .
Figure: Jeu du dilemme du prisonnier.
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple
(P2)
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
exemple Équilibre de Nash en stratégies pures
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Remarque
(P2)
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Exemple
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Exemple
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Équivalence stratégique
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Proposition Proposition
Tous les jeux bimatriciels stratégiquement équivalents possèdent le Les équilibres de Nash dans un jeu bimatriciel (A, B) sont
même équilibre de Nash. interchangeables, si le jeu (A, B) est stratégiquement équivalent à
(A, −A).
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Équilibre de Pareto Domination au sens de Pareto
Definition
La question que l’on peut se poser est de savoir s’il est possible
Une paire de stratégies (x1i1 , x2j1 ) est dite Pareto-meilleure qu’une
d’ordonner les solutions d’équilibre de Nash pour déclarer une seule
autre paire de stratégies (x1i2 , x2j2 ), si,
d’entre elles comme solution équilibre de Nash la plus favorable.
Ceci n’est pas toujours possible, puisqu’il n’existe pas d’ordre total �
a i 2 j 2 ≤ ai 1 j 1 ,
entre des paires de nombres. Mais quelques notions de meilleure et
b i 2 j 2 ≤ bi 1 j 1 .
admissible peuvent être introduites à travers un ordre partiel.
où, l’une, au moins des inégalités, est stricte.
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple
Definition Considérons le jeu bimatriciel suivant :
Un équilibre de Nash est dit admissible s’il n’existe pas un autre
équilibre de Nash qui est Pareto-meilleur. �x21 x22 � �x21 x22 �
A= x11 3 3 B= x11 3 2
, ;
x12 0 5 x12 0 3
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Calcul de l’équilibre de Nash en stratégies pures
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Definition
Le jeu augmenté correspondant au jeu bimatriciel (2) est défini
par :
Cet algorithme, dû à S. X. BAI, est basé sur la notion du jeu < X1 , X2 , Ã, B̃ >, (4)
augmenté correspondant au jeu bimatriciel (2) avec les mêmes où
espaces de stratégies pures X1 pour le joueur (P1) et X2 pour le �
joueur (P2) et des matrices de gains à et B̃ qui seront définies aij , si aij = max akj ;
à = (ãij )1≤i ≤m,1≤j≤n , ãij = k (5)
d’une manière spécifique. −M, sinon ;
�
� � bij , si bij = max bik ;
B̃ = b̃ij , b̃ij = k (6)
1≤i ≤m,1≤j≤n −M, sinon ;
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Jeu augmenté Algorithme de S. X. BAI
Proposition Exemple
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Exemple Exemple
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Definition
Un couple de stratégies mixtes (α∗ , β ∗ ) ∈ Δm × Δn est un L’une des formulations possibles du problème de la recherche d’un
équilibre de Nash du jeu (8), si équilibre de Nash en stratégies mixtes dans le jeu bimatriciel (8)
est sa transformation en un problème de programmation
αt Aβ ∗ ≤ (α∗ )t Aβ ∗ , ∀α ∈ Δm , (13) nonlinéaire (en fait un programme bilinéaire).
∗ t
(α ) Bβ ≤ (α∗ )t Bβ ∗ , ∀β ∈ Δn (14)
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Preuve Preuve
Posons
Soit (α∗ , β ∗ )
∈ Δm × Δn un équilibre de Nash en stratégies mixtes α∗t Aβ ∗ = −p ∗ et α∗t Bβ ∗ = −q ∗ , (18)
dans le jeu (8). Dans ce cas, α∗ est solution optimale du problème Des relations (17a) et (17b) on aura :
suivant :
αt Aβ ∗ ≤ −p ∗ , ∀α ∈ Δm , (19)
max
α∈Δ αt Aβ ∗ , ∗t ∗
α Bβ ≤ −q , ∀β ∈ Δn , (20)
m
∗
P1 (β ) t α
lm = 1, (17a) Soient α ∈ Δm et β ∈ Δn . Des relations (19) et (20) on aura :
αi ≥ 0, ∀i = 1, . . . , m, n
�
aij βj∗ ≤ −p ∗ , ∀i = 1, . . . , m, (21)
et β ∗ solution optimale du problème suivant : j=1
�m
max α∗t Bβ,
β∈Δ n bij αi∗ ≤ −q ∗ , ∀j = 1, . . . , n. (22)
P2 (α∗ ) lnt v = 1, (17b) i=1
βj ≥ 0, ∀j = 1, . . . , n. D’où
Aβ ∗ ≤ −p ∗ lm , (23)
t ∗ ∗
B α ≤ −q ln . (24)
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Preuve Preuve
Par ailleurs toute solution réalisable (α, β, p, q) du problème (16)
vérifie :
Aβ ≤ −plm , (27)
Des relations (17a), (17b), (23) et (24), on déduit que t
B α ≤ −qln . (28)
(α∗ , β ∗ , p ∗ , q ∗ ) (25) En multipliant les membres de l’inégalité (27) par αt et les
membres de l’inégalité (28) par β on obtient :
est une solution réalisable du problème (16) et de la relation (18)
on déduit que : αt Aβ ≤ −pαt lm = −p,
αt Bβ ≤ −qlnt β = −q.
∗t ∗ ∗t ∗ ∗ ∗
α Aβ + α Bβ + p + q = 0. (26)
Ainsi, pour toute solution réalisable (α, β, p, q), la fonction objectif
du problème (16) satisfait
αt Aβ + αt Bβ + p + q ≤ 0, (29)
et de la relation (26), on déduit que (α∗ , β ∗ , p ∗ , q ∗ ) est la solution
optimale du problème (16).
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Preuve Preuve
Inversement, soit (ᾱ, β̄, p̄, q̄) une solution optimale du problème
(16). L’existence d’une solution réalisable du problème (16) a été
prouvée par (25). Plus précisément chaque jeu bimatriciel (A, B)
admet un équilibre de Nash en stratégies mixtes (α∗ , β ∗ ) et donc
(25) est une solution réalisable de (16). De plus, de (25), on déduit De la relation (31), on aura :
la valeur maximale de la fonction objectif de (16) est non positive, t
∀α ≥ 0/ lm α = 1, αt Aβ̄ ≤ −p̄αt lm = −p̄ (36)
qui, d’après (29), implique
ᾱAβ̄ + ᾱB β̄ + p̄ + q̄ = 0 (30) et de la relation (32) on aura :
et ∀β ≥ 0/ lnt β = 1, ᾱt Bβ ≤ −q̄lnt β = −q̄ (37)
Aβ̄ ≤ −p̄lm (31)
t
B ᾱ ≤ −q̄ln (32)
t
ᾱ lm = 1 (33)
t
β̄ ln = 1 (34)
ᾱ ≥ 0, β̄ ≥ 0 (35)
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Preuve Preuve
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Preuve Calcul d’un équilibre en stratégies pures - Programmation
linéaire bivalente
c’est-à-dire : ᾱ est une solution du problème
max αt Aβ̄,
α
t α = 1,
lm
α ≥ 0,
L’une des formulations possibles du problème de la recherche d’un
et β̄ est une solution du problème équilibre de Nash en stratégies pures dans le jeu bi-matriciel (2) est
la programmation bivalente.
max
ᾱt Bβ,
β
ln1 β = 1,
β ≥ 0,
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Calcul d’un équilibre en stratégies pures - Programmation Calcul d’un équilibre en stratégies pures - Programmation
linéaire bivalente linéaire bivalente
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux
Calcul d’un équilibre en stratégies pures - Programmation Calcul d’un équilibre en stratégies pures - Programmation
linéaire bivalente linéaire bivalente
Proposition Proposition
1 Une situation (x1i ∗ , x2j ∗ ) ∈ X1 × X2 est un équilibre de Nash 1 Une situation (u ∗ , v ∗ ) ∈ U × V est un équilibre de Nash en
en stratégies pures dans le jeu bimatriciel (2), si et seulement stratégies pures dans le jeu bi-matriciel (43), si et seulement,
si il existe une situation (u ∗ , v ∗ ) ∈ U × V qui est un équilibre si u ∗ est solution optimale du problème
de Nash en stratégies pures dans le jeu (43),
où
max u t Av ∗ ,
u
� t u = 1,
em (46a)
0 si k �= i ∗ ;
m
∗ ∗ ∗ ∗ ∗ m
u = (u1 , u2 , . . . , ui ∗ , . . . , um ) ∈ R avec uk =∗ u ∈ {0, 1} ,
1 sinon,
(44) et v ∗ est solution optimale du problème
et
∗T
� max u Bv ,
∗ ∗ ∗ ∗ ∗ n ∗ 0 si l �= j ∗ ; v
v = (v1 , v2 , . . . , vj ∗ , . . . , vn ) ∈ R avec vl = ent v = 1, (46b)
1 sinon.
(45) v ∈ {0, 1}n .
Théorème
Une paire de stratégies (x1i ∗ , x2j ∗ ) ∈ X1 × X2 est un équilibre de
Dans les conditions du théorème précédent, on aura
Nash en stratégies pures dans le jeu bimatriciel (2), si et seulement
si, (u ∗ , v ∗ , p ∗ , q ∗ ) est une solution du problème de programmation �
∗ 0 si k �= i ∗ ;
bi-linéaire suivant : x1i ∗ ⇐⇒ uk =
1 sinon,
max {u t Av + u t Bv + p + q}, �
u,v ,p,q 0 si l �= j ∗ ;
Av ≤ −plm , x2j ∗ ⇐⇒ vl∗ =
1 sinon.
B t u ≤ −qln ,
u t lm = 1, (47) u ∗t Av ∗ = −p ∗ et u ∗t Bv ∗ = −q ∗
t
v ln = 1,
u ∈ {0, 1}m ,
v ∈ {0, 1}n ,
Mohammed Said RADJEF Théorie des Jeux Mohammed Said RADJEF Théorie des Jeux