Académique Documents
Professionnel Documents
Culture Documents
Théorie des jeux nFondée en 1944 par Von Neumann et Morgenstern pour
modéliser le fonctionnement de certains systèmes
économiques
n Hypothèses : (1) des règles régissent un jeu
1- Introduction (2) les joueurs jouent avec les mêmes règles et
cherchent à maximiser leur gain individuel
2- Formalisation par les systèmes dynamiques
3- Le dilemme du prisonnier nPrincipe : règles déterminent le gain de chacun en fonction
de ce qu’il a joué et de ce que les autres ont joué
4- Le jeux Roc-Ciseau-papier
è Chaque joueur doit définir une stratégie (ensemble de
5- Exemples célèbres décisions a priori sur la façon dont il va conduire le jeu) en
1 2
fonction de ce qu’il sait de celle des autres
n Buts : créer des modèles mathématiques simples pour n Entité de base = joueur (individu seul ou groupe d’individus
synthétiser tous les éléments essentiels à la description des prenant une décision (stratégie, comportement)).
interactions −> Solutions décrivent les issues possibles du jeu è Une fois les joueurs définis, 2 types de modèles :
è Modèles à terme pour mieux comprendre les phénomènes
sociaux ou biologiques sous-jacents. Ø Jeux non coopératifs : basés sur les actions des
joueurs individuels modélisation des interactions
n Exemples d’application : dans lesquelles :
¡ Economie : marchandage entre acheteur et vendeur Ø les joueurs sont libres de leurs actions, ont des objectifs
¡ Sciences politiques et relations internationales : compétition propres et indépendants
électorale entre candidats à la présidentielle Ø un joueur rationnel va chercher à maximiser son propre gain
¡ Droit : compétition entre défendeur et partie adverse
n On peut distinguer aussi : n Nouvelle propriété d’équilibre pour les jeux non coopératifs
introduite par Nash (1951) :
Ø Jeux simultanés : chaque joueur choisit son plan
d’action complet une fois pour toute au début du jeu Si aucun joueur n’a intérêt à changer individuellement
(choix simultané de tous les joueurs) sa stratégie en connaissant celle des autres, alors le vecteur
des stratégies = équilibre de Nash
è Représentation sous forme d’un tableau = forme normale
ê
ü prévoit la stabilité d’une interaction vis-à-vis des déviations
Ø Jeux séquentiels : chaque joueur choisit son plan
possibles par rapport aux stratégies individuelles
d’action à chaque fois qu’il doit prendre une décision
ü état stable dont aucun joueur n’a intérêt à dévier, même
è Représentation sous forme d’un arbre = forme extensive sachant les stratégies jouées par les autres
5 6
7 8
Principe Principe
n Rechercher la stratégie optimale dans une situation de nDécrire, pour chaque interaction entre F et C, l’espérance
compétition de gain des individus à l’issu d’une rencontre
n 2 types de stratégies pour animaux en compétition : è matrice des gains
¡ Stratégie F « Faucon » (méchant, Hawk en anglais) : se battre
jusqu’au bout è Victoire ou mort
¡ Stratégie C « Colombe » (gentil, Dove en anglais) : limiter les
A = !"aij #$i, j∈ 1,ω
[ ]
risques et s’échapper avant blessure
Dynamique de populations animales constituées d’une certaine
w : nombre total de stratégies (= 2)
proportion de F et d’une certaine proportion de C
aij : espérance de gain d’un individu adoptant la stratégie i en
n Définition des gains et coûts : jouant contre un individu adoptant la stratégie j
¡ gain G > 0 : gain lors d’un combat
¡ coût C > 0 : pertes dues aux blessures lors des combats 9 10
n Une population est stable d’un point de vue évolutif si elle Définition 2 : Une stratégie pure d’un joueur i est un plan
est à l’abri d’une invasion par des minorités d’action qui prescrit une action de ce joueur chaque fois qu’il
è une stratégie est évolutivement stable s’il n’y a aucune est susceptible de jouer. On note Si l’ensemble des stratégies
stratégie mutante qui donne une meilleure fitness aux pures du joueur i et si ∈ Si une stratégie pure de ce joueur.
individus qui l’adoptent.
Définition 3 : Une stratégie mixte d’un joueur i est une
Définition 1 : Soit WA la fitness darwinienne mesure de probabilité pi définie sur Si. On note Pi l’ensemble
des stratégies mixtes du joueur i et pi ∈ Pi une stratégie mixte
WA = VA f A VA : probabilité pour un porteur de l’allèle A de de ce joueur.
survivre jusqu’à l’âge adulte
fA : nombre moyen de descendants de chaque survivant
13 14
= fitness absolue
Application Application
15 16
è Equilibre si S(F) = S(C)
Définitions
Définition 5 : Un jeu sous forme normale est caractérisé par è2 types de gains :
une matrice de gain A = [aij] de dimension N N, aij étant le • Δi le gain moyen de la stratégie i
gain d’un joueur utilisant la stratégie Si contre un joueur
utilisant la stratégie Sj.
! a a12 $
Si N = 2 : A = # 11 &
# a21 a22 &
" %
• Δ le gain moyen dans la population
" x %
P =$ ' le vecteur population
# 1− x &
19 20
Lien entre S(F), S(C), Δi et Δ ?
! a aFC $ S ( F ) = x aFF + (1− x ) aFC
On a : A = # FF
# aCF
& et
aCC &%
Théorie des jeux
" S (C ) = x aCF + (1− x ) aCC
" %
# x & #% S ( F ) &( ( 1 0 ) A $# 1−x x ' = S (F ) = ΔF
⇒ A% (=
& 1- Introduction
$ 1− x ' %$ S (C ) (' " % 2- Formalisation par les systèmes dynamiques
( 0 1 ) A $# 1−x x ' = S (C ) = Δ C
& 3- Le dilemme du prisonnier
4- Le jeux Roc-Ciseau-papier
5- Exemples célèbres
21 22
Définition
2- Formalisation par les systèmes
nNotion de stabilité évolutive repose sur la notion de
dynamiques dynamique implicite que l’on peut modéliser sur le simplex SN
Soit :
- une population composée de N stratégies Si en proportion xi.
2-1 Les équations du réplicateur - fi la fitness de la stratégie Si : dépend de l’état de la
2-2 Retour sur le jeu Faucon/Colombe : cas où T = 0 population X(t)
2-3 Le jeu Faucon/Colombe : cas où T ≠ 0
è Si la population est grande et que les générations sont
2-4 Définition d’une ESS chevauchantes, alors on peut supposer que X(t) évolue
dans le simplex SN comme une fonction différentielle de t.
23 24
Définition
. 2- Formalisation par les systèmes
Taux d’accroissement relatif de la proportion xi pour Si = xi / xi
dynamiques
è mesure du succès évolutif
xi
= fitness de Si − fitness moyenne ⇒ xi = xi ( fi ( X ) − f ( X )) ∀i = 1, N
xi
Equations du réplicateurs 2-1 Les équations du réplicateur
2-2 Retour sur le jeu Faucon/Colombe : cas où T = 0
Dans le cas linéaire : fi ( X ) = ( AX )i et f ( X ) = X T AX
2-3 Le jeu Faucon/Colombe : cas où T ≠ 0
⇒ xi = xi (( AX )i − X T AX ) ∀i = 1, N 2-4 Définition d’une ESS
2
Jeu F/C pour T ≠ 0
" G −C %
2- Formalisation par les systèmes $
2
G '
A =$ '
dynamiques $
$ 0
G −T '
'
# 2 &
x = x ( Δ F − Δ )
# x & G −C
2-1 Les équations du réplicateur ΔF = 1 0 ( A% )
$ 1− x '
(=
2
x + G (1− x )
2-2 Retour sur le jeu Faucon/Colombe : cas où T = 0 # x & G −C G −T
2-3 Le jeu Faucon/Colombe : cas où T ≠ 0 (
Δ = x 1− x A %
$ 1−
)
x
(=
' 2
x 2 + Gx (1− x ) +
2
(1− x )
2
Une stratégie p est un point dans le simplex : Définition 1 : Une stratégie p* est un équilibre de Nash ssi :
$ '
pT Ap* ≤ p*T Ap*
N
SN = % p = ( p1,..., pN ) ∈ IR N : pi ≥ 0, ∑ pi = 1(
& i=1 )
C’est un équilibre de Nash strict si et seulement si :
A=(aij) : matrice de gain d’un jeu donné
pT Ap* < p*T Ap*
è (Ap) i : gain moyen de la stratégie i
Une stratégie j est un équilibre de Nash strict ssi :
è gain d’une stratégie p contre une stratégie q = pT A q
aij < a jj ∀i = 1, N
La stratégie j fait mieux contre elle-même que contre n’importe quelle
33 autre stratégie donc elle ne peut pas être envahie 34
p*T Ap > pT Ap
1-
n Contexte : 2 individus (Calvin et Hobbes) sont arrêtés par la n Gains : négativement liés aux années de prison auxquelles
police suite à un vol à main armée et sont enfermés dans 2 ils sont condamnés en fonction de leur déposition
cellules séparées sans possibilité de communication. ¡ Si ils dénoncent tous les 2 : 8 ans de prison
41 42
Equations du réplicateur
3-2 Formalisation
3-3 Les équations du réplicateur ⇒ x = x ( Δ N − Δ ) = x (1− x ) ( x ( R − S − T + P ) + S − P )
43 44
ESS ? Bilan
! R S $
P−S A =# & S<P<R<T
n Points d’équilibre : x = 0 *
1
*
x =1 x =
2
*
3 " T P %
R− S −T + P
Il faut vérifier que 0 ≤ x3* ≤ 1 pour S < P < R < T Impossible Une stratégie j est une ESS ssi :
45
è Stratégie D est un ESS ssi :
Exemple numérique
# −1 −10 &
⇒ A =% ( D = ESS 1- Introduction
$ 0 −8 '
2- Formalisation par les systèmes dynamiques
Δ N = −10
2
⇒ x = x (8x 2 − 6x − 2 ) 3- Le dilemme du prisonnier
Δ = −8x + 6x − 8
4- Le jeux Roc-Ciseau-papier
5- Exemples célèbres
47 48
Définition du jeu
¡ Stratégie Ciseau = C
¡ Stratégie Papier = P
4-1 Introduction n Règles du jeu : le Roc l’emporte sur le Ciseau ; le roc perd
4-2 Les équations du réplicateur contre le Papier ; le Ciseau gagne contre le Papier. Quand 2
stratégies identiques se rencontrent, il y a égalité.
4-3 Le portrait de phase
4-4 Les effets d’une perturbation n Gains possibles
¡ +1 quand il y a victoire
¡ 0 en cas d’égalité
49 50
¡ -1 en cas d’échec
Matrice de gain
51 52
B C B C B C
A B x2 C = B x3 ° x1 C = B ¢C C
@ A @ A @ A
x3 x1 ° x2 ¢P
¢ = x1 ¢R + x2 ¢C + x3 ¢P
Equations du réplicateur Equations du
¢ = réplicateur
x1 (x2 ° x3 ) + x2 (x3 ° x1 ) + x3 (x1 ° x2 ) = 0
D’où le système d’équations : 8
n x1= probabilité de jouer la stratégie R, x2 = probabilité de n On a x1 + x2 + x3 = 1 ⇒ x1 + x2 + x3 = 0 >
>
> ẋ1 = x1 (x2 ° x3 )
jouer la stratégie C, x3 = probabilité de jouer la stratégie P >
<
ẋ2 = x2 (x3 ° x1 )
La dynamique est restreinte au triangle
! x $ ! $! x $ " x − x
# 1 & # 0 1 −1 &# 1 & $ 2 3
% " Δ
' $ R
%
'
n
> unitaire :
>
>
>
: ẋ3 = xinvariant
Domaine positivement
A # x2 & = # −1 0 1 &# x2 & = $ −x1 + x3 ' = $ ΔC ' 3 (x1 ° x2 )
## && # 1 −1 0 &## & $ '' $$ ''
" x3 % " %" x3 &% $# x1 − x2 & # ΔP "
& $ x1 = x1 ( x2 − x3 ) = x1 ( x2 − (1− x1 − x2 ))
#
Δ = x1Δ R + x2 Δ C + x3Δ P = 0
On vérifie
$ x2 = que
x2 ( x3ẋ−1 x+ ẋ2 + ẋ3 = 0 car x1 +x2 +x3 = 1
1 ) = x2 ((1− x1 − x2 ) − x1 )
%
de cette égalité est que ⇓ la dynamique est restrein
$ x = x Δ − Δ
&& 1 1 ( R ) #% x1 = x1 (Δ R ) = x1 ( x2 − x3 ) # x = x x − x = x x + 2x −1
% churé%$ sur1 la 1 (figure 3 ) ci-contre.
1( 1 2 On ) la représentera
⇒ % x2 = x2 ( Δ C − Δ ) = $ x2 = x2 ( Δ C ) = x2 ( x3 − x1 ) 2
n 4 points d’équilibre :
55 56
Conservation des centres ? Conservation des centres ?
∂H # 1 & ∂H # 1&
H ( x1, x2 ) − H (1 / 3,1 / 3) = % x1 − ( + % x2 − (
n Soit H ( x1, x2 , x3 ) = x1 x2 x3 intégrale première du système ? ∂x1 #1 1& $
% , (
3 ' ∂x2 #1 1& $
% , (
3'
$ 3 3' $ 3 3'
2 2
∂H ( x1, x2 , x3 ) ∂H ∂H ∂H 2
1∂ H # 2
1& 1 ∂ H # 1& ∂H2
# 1 &# 1&
= x1 + x2 + x3 = 0 + % x1 − ( + % x2 − ( + % x1 − (% x2 − (
∂t ∂x1 ∂x2 ∂x3 2 ∂x12 #1 1&
% , (
$ 3 ' 2 ∂x22 #1 1&
% , (
$ 3 ' ∂x1∂x2 #1 1&
% , (
$ 3 '$ 3'
$ 3 3' $ 3 3' $ 3 3'
4-1 Introduction
4-2 Les équations du réplicateur
4-3 Le portrait de phase
4-4 Les effets d’une perturbation
59 60
Portrait de phase
4- Le jeux Roc-Ciseau-papier
4-1 Introduction
4-2 Les équations du réplicateur
4-3 Le portrait de phase
4-4 Les effets d’une perturbation
61 62
0.4
de Lyapunov)
−0.6
0.2 −0.8
Quand e = 0, V est une
intégrale première
0.0 −1.0
0.0 0.2 0.4 0.6 0.8 1.0 65 66
x1
dV
Fonction de Lyapunov
= x2 x3 ẋ1 + x1 x2 ẋ2 + x1 x2 ẋ3
Fonction de Lyapunov
dt
dV
= V (x1 , x2 , x3 )[x2 ° x3 + ≤x2 ° x1 + x3 + ≤x2 + x1 ° x2 + ≤x1 ° 3≤æ]
dt
dV dV
dV
dt = εV ( x1, x2 , x3 ) [1− 3εσ ]
= V (x1 , x2 , x3 )[≤(x1 + x2 + x3 ) ° 3≤æ] = εV ( x1, x2 , x3 ) [1− 3εσ ]
dV
dt
= ≤V (x1 , x2 , x3 )(1 ° 3æ) dt dt
Commençons par chercher le signe de 1 ° 3æ, au moins localement au voisinage de 2 2
2 σ ( x1 , x2 ) − σ (1 / 3,1 / 3) = − ( x1 −1 / 3) − ( x2 −1 / 3) − ( x1 −1 / 3) ( x2 −1 / 3)
σ(
x1 , xque
(1/3, 1/3, 1/3), sachant 2 , xl’on
3 = )
se xrestreint
1 x2 + x 2 xtriangle
au 3 + x1 xx13+ x2⇒
+ x3 = 1. σ ( x1 , x2 ) = x1 + x2 − x − x2 − x1 x2
1
æ(x1 , x2 , x3 ) = x1 x2 + x2 x3 + x1 x3
Signe au voisinage de (1/3,1/3) ? Développement en série de
æ(x1 , x2 ) = x1 x2 + x2 (1 ° x1 ° x2 ) + x1 (1 ° x1 ° x2 )
Taylor à l’ordre 2 2 2
æ(x1 , x2 ) = x1 + x2 ° x1 ° x2 ° x1 x2
S. Charles scharles@biomserv.univ-lyon1.fr 67 68
Stabilité de stratégie mixte Stabilité de stratégie mixte
V ( x1, x2 , x3 ) = x1 x2 x3
1 2 1 2 1
V ( x1 , x2 ) −V (1 / 3,1 / 3) = − ( x1 −1 / 3) − ( x2 −1 / 3) − ( x1 −1 / 3) ( x2 −1 / 3)
n On avait vu graphiquement que V admet un maximum dans 3 3 3
le simplex. Pour le prouver : développement en série de
Taylor de V au voisinage de (1/3,1/3,1/3)
69 70
73 74
Contexte Modélisation
n Chez les fourmis Wasmannia auropunctata : les reines et n Conflit entre mâles et femelles au sujet du partage des
les mâles sont issus d’une reproduction clonale. Seules les tâches dans l’investissement parental.
ouvrières (stériles) sont issues d’une reproduction sexuée.
n 2 types de mâles et 2 types de femelles :
è Modèle de compétition entre mâles et femelles pour ¡ les mâles M1 infidèles (x1) et les mâles M2 fidèles (x2) : x1 + x2 = 1
transmission de leurs gènes d’une génération à l’autre ¡ les femelles F1 timides (y1) et les femelles F2 faciles (y2) : y1 + y2 = 1
n Coûts :
n Chez l’Homme : cf Charles Darwin, compétition des
¡ le fait d’élever avec succès sa progéniture augmente la fitness des 2
femelles et mâles pour l’accès au partenaire de sexe opposé
parents d’un facteur G
è guerre des sexes opposant la stratégie mâle de
¡ l’investissement parental a un coût –C : entièrement supporté par les
compétition pour contrôler les génitrices, à la stratégie femelle femelles si les mâles désertent , sinon partagé entre les 2 parents
de choix du meilleur géniteur ¡ une longue période d’engagement mutuel a un coût –E pour chacun
75
des 2 parents 76
Matrice des gains Gains des stratégies
n Jeux asymétrique : gain d’un mâle contre une femelle ≠ du n Les mâles (x) jouent contre les femelles (y) et les femelles
gain d’une femelle contre un mâle contre les mâles :
è2 matrice de gains : A matrice de gain des mâles
contre les femelles et B celle des femelles contre les mâles. " Δ M1 % " y1 % " Δ F1 % " x1 %
$ ' = A$ ' et $ ' = B$ '
#ΔM 2 & #1− y1 & #ΔF 2 & #1− x1 &
F1 F2 " M1 M2 %
" % $ C '
M1 $ 0 G ' F1 $ 0 G− −E ' "" %
$ ' 2 " G (1− y1 ) % C %
A =$ B =$ ' " Δ M1 % $ $ $ G − − E ' (1− x1 ) '
' ' " Δ F1 % # 2 &
C C $ ' $ ' = $" C % " C% ' $ ' = $ '
M2 $$ G − 2 − E G − 2 '
' F2 $ G − C G−
C ' # Δ M 2 & $$ G − − E ' y1 + $ G − ' (1− y1 ) ' #ΔF 2 & $ " C% '
# & $ 2 ' # # 2 & # 2 & & $ (G − C ) x1 + $ G − ' (1− x1 ) '
# & # # 2& &
77 78
n On cherche à égaliser les gains n 2 populations (avec chacune 2 stratégies) qui jouent l’une
contre l’autre
$ C ' $ C'
Δ M1 = Δ M 2 ⇔ G (1− y1 ) = & G − − E ) y1 + & G − ) (1− y1 )
% 2 ( % 2( . (! $ ! y $ ! $ ! y $+
0 x = x *# 1 0 & A # & − # x 1− x & A# &-
0 *)" % "1− y % " % "1− y %-,
/
0 (! $ ! x $ ! $ ! x $+
0 y = y * # 1 0 & B# & − # y 1− y & B# &-
1 *)" % "1− x % " % "1− x %-,
$ C ' $ C'
Δ F1 = Δ F 2 ⇔ & G − − E ) (1− x1 ) = (G − C ) x1 + & G − ) (1− x1 )
% 2 ( % 2( nProposition 1 : on ne change pas la dynamique du système si
on rajoute une constante à une colonne de A et/ou de B
79 è On peut rendre A et B diagonale 80
Equations du réplicateur Equations du réplicateur
" % " %
" % "$ C
% "
' $
%
C ' $ C '" % $ C '
$ 0 G ' 0 G −G + 0 $ 0 $ (1− y) '
$ ' $ 2 ' $ 2 ' " Δ M1 % " y % $ 2 '$ y ' 2
'$ '=$ '
A =$ ' =$ '=$ ' $ ' = A$ '=
' $ " '
C C
' $$ ' $ ' #ΔM 2 & #1− y & $ '$
$ G− −E G− C ' $ G−C −E $ G−C −E 0 '$#
1− y ' $ $ G − C − E %' y '
$ 2 2 ' G− −E 0 0 ' $ ' & $ # 2 & ''
# & $ 2 ' $ 2 ' 2 $
# & # & # & # &
" % " %
$ C ' " %
$ 0 G− −E ' $ 0 C C ' " % " Δ F1 % " x % $ 0 −E '" x % " − E (1− x ) %
2 $ G − − E −G + ' $ 0 −E ' $ ' = B$ '=$ '$ '=$ '
B =$ '= 2 2
'=$ ' #ΔF 2 & #1− x & $$ G − C 0 ''#1− x & $# (G − C ) x '&
$ ' $ # &
$ G −C C ' $ ' $ G − C 0 ''
$
G−
$ 2 ' $# G − C 0 ' #
&
&
# & 81 82
x! = x [ Δ M1 − Δ M ] y! = y [ Δ F1 − Δ F ]
83 84
Equations du réplicateur Stabilité des points d’équilibre
( " C%
* x = x (1− x )$( E − G ) y + ' n (0,0) :
) # 2&
* y = y 1− y " C − G + E x − E % M fidèles et F faciles
+ ( )#( ) & n (1,0) :
M infidèles et F faciles
n 5 points d’équilibre :
n Stabilité : n (0,1) :
M fidèles et F timides
n (1,1) :
M infidèles et
85 F timides 86
" E C %
n $$ , '' : La linéarisation prévoit des centres
# C + E − G 2 (G − E ) &
Stratégie mixte
èIntégrale première
n Portrait de phase
87