Vous êtes sur la page 1sur 9

Théorie des Jeux

4BIM
Exercices
Devoirs des années précédentes

Emmanuel Risler

18 avril 2007
2
Théorie des Jeux 4BIM, examen du 13 01 06

I. Deux joueurs A et B jouent au jeu suivant. Ils doivent tout d'abord verser chacun 1
euro. Ensuite le joueur A récupère la mise de 2 euros ainsi constituée et chaque joueur a deux
stratégies possibles : pour le joueur A, 2 euros dans un puit
il peut ou non décider de jeter les
(ils seront alors perdus) ou de les conserver (ils seront alors redistribués, 1 euro chacun, entre
les deux joueurs). Le joueur B doit faire une prédiction sur ce que va faire le joueur A. Si
la prédiction se conrme, le joueur A doit donner (indépendemment de la mise précédente) 2
euros au joueur B , dans le cas contraire c'est le joueur B qui doit donner 2 euros au joueur A.

1. Écrire la matrice de paiement des deux joueurs

2. Décrire, lorsqu'ils existent, les équilibres de Nash et les optima de Pareto

3. Rappeler la dénition d'une stratégie dominante, prudente (peu importe si c'est au sens
strict ou au sens large) et décrire, pour chacun des joueurs, celles qui existent.

4. Que va-t-il se passer si A joue en premier ? si B joue en premier ? Y-a-t-il lutte pour le
premier ou le second coup ?

5. Pour le jeu répété à horizon inni (sans actualisation), quelles paiements moyens (α, β) des
deux joueurs correspondent à des optima de Pareto ?

(question facultative pour la n s'il vous reste du temps : que pensez-vous de la question de
l'existence d'un équilibre de Nash ?).

6. Montrer que pour le jeu répété à horizon ni il n'existe pas d'équilibre de Nash.

7. On suppose maintenant que la matrice de paiement vaut :

(−3, −1) (1, −3)


.
(2, 0) (−2, 2)

(modifée en deux valeurs par rapport à la précédente !). Montrer que le jeu à un coup présente
les mêmes caractéristiques, mais que, pour le jeu répété (à horizon inni), il existe un équilibre
de Nash pour lequel le joueur A reçoit un paiement constant égal à 2 (décrire les stratégies
associées).

II. Un jeu à deux joueurs est caractérisé par la matrice de paiement suivante :

a b
a (0, 0) (−1, 1) .
b (1, −1) (−10, −10)

1. Quelle situation concrète ce jeu pourrait-il modéliser ?

2. Indiquer les optima de Pareto, équilibres de Nash, stratégies prudentes.

On suppose maintenant que cette matrice représente les paiements issus de rencontres entre
des individus de deux populations diérentes, en interaction l'une avec l'autre. Les stratégies
A et B représentent les deux phénotypes possibles (l'un prudent, l'autre agressif ) pour chaque

3
individu de chacune des deux populations, lorsqu'il rencontre un individu de la population
p q
   
opposée. On note P = et Q = les proportions des phénotypes dans les
1−p 1−q
deux populations. On suppose que l'évolution des proportions des phénotypes est gouvernée
par sélection naturelle.

3. Expliquer pourquoi, lorsque p ∈]0; 1[, ṗ est du signe de (M Q)1 − (M Q)2 , où M est la matrice
de paiement du joueur 1.
4. Dessiner, dans le plan (p, q) (limité à des coordonnées entre 0 et 1), les zones associées aux
signes de ṗ et q̇ (zones délimitées par les iscoclines)

5. Donner (sans calcule ni justication) les équilibres, leur stabilité, et décrire qualitativement
la dynamique.

6. Même question si on suppose maintenant qu'il n'y a qu'une seule espèce, donc une seule
proportion p, les rencontres se faisant au sein de cette espèce.

4
Réponses
I.

prédit jette prédit ne jette pas


1. jette ((−3, 1) (1, −3)
ne jette pas (2, −2) (−2, 2)

2. ↓ ↑, pas d'équilibre de Nash, deux optima de Pareto

3. pas de stratégie dominante, stratégie prudente du joueur A : ne pas jeter, et du joueur B :
prédire que A jette

4. si A joue en premier paiements (−2, 2), si c'est B paiements (2, −2), lutte pour le second
coup.

5. tout paiement (α, β) tel que α+β = 0 et −2 ≤ α ≤ 2. Le problème de l'existence d'un


équilibre de Nash est délicat...

6. à horizon ni pas d'équilibre de Nash car au dernier coup l'un des deux joueurs a forcément
intérêt à changer de stratégie

7. le joueur A joue ne jette pas tant que le joueur B prédit qu'il va jeter, et si le joueur
B prédit ne jette pas, alors le joueur A joue ensuite jette dénitivement (donc dissuasion,
menace crédible, car si le joueur B prédit jette il aura pour paiement 0, mais s'il prédit une
fois ne jette pas, alors par la suite quoi qu'il joue il aura moins que 0).
II.

1. jeu de croisement : première stratégie : s'arrêter, seconde : forcer le passage

2. (a, a), (a, b) et (b, a) optima de Pareto, (a, b) et (b, a) équilibres de Nash, stratégie prudente :
s'arrêter

3. cf cours, ṗ = 0 pour q = 9/10


4. ...

5. équilibres : les quatres coins, et le point (9/10, 9/10), qui est de type selle, (0, 0) et (1, 1) sont
instables, (0, 1) et (1, 0) sont stables, la diagonale p = q est la variété stable de (9/10, 9/10)

6. s'il n'y a qu'une espèce, la dynamique correspond à la restriction de la dynamique précédente


à la diagonale (cette fois-ci 9/10 est le seul équilibre stable).

5
Théorie des Jeux 4BIM, examen du 30 03 07

I.

On considère le jeu à deux joueurs dont la matrice de paiements est la suivante :

A B C D
A (5, 2) (2, 6) (1, 4) (0, 4)
B (0, 0) (3, 2) (2, 1) (1, 1)
C (7, 0) (2, 2) (1, 5) (5, 1)
D (9, 5) (1, 3) (0, 2) (4, 8)

1. Pour chacun des deux joueurs, existe-t-il des stratégies dominantes ? dominées ? Quel est le
paiement minimum garanti et quelle stratégie prudente permet de l'obtenir ?

2. Déterminer les optima de Pareto du jeu, et les équilibres de Nash (s'ils existent). Quelle issue
peut-on attendre du jeu ? (on suppose que les deux joueurs ont un comportement rationnel,
qu'on est en en information complète - c'est-à-dire chacun des deux joueurs connaît la matrice
complète des paiements - et que le jeu est simultané - c'est-à-dire que chacun ignore ce que
l'autre a joué).

3. On considère le même jeu, mais répété (à l'inni). Vous êtes le joueur 1 et vous souhaitez,
dans le cadre de ce jeu répété, récupérer le plus souvent possible la valeur 9 (le paiement
maximal). Quelle stratégie pourrait vous permettre d'y parvenir ?

II.

On considère un jeu à deux joueurs symétrique, chaque joueur ayant deux stratégies, et dont
la matrice de paiement (du joueur 1) vaut :

1 0
 
A=
2 −1

1. Ecrire la matrice de paiement complète (les paiements des joueurs 1 et 2 dans une même
matrice).

2. A quel exemple classique de jeu issu de la dynamique des populations ce jeu correspond-il ?

3. Décrire les équilibres de Nash de ce jeu en stratégie pure.

4. Décrire les équilibres de Nash en stratégie mixte (on notera respectivement (p, 1 − p) et
(q, 1 − q), 0 ≤ p, q ≤ 1 les stratégies mixtes des joueurs 1 et 2). Que pouvez-vous dire de la
stabilité de ces équilibres ?

5. On suppose maintenant que le jeu modélise une population en interaction avec elle-même.
On note (p, 1−p) les proportions des individus ayant adopté l'une ou l'autre des deux stratégies
possibles, au sein de la population. Exprimer (en la justiant rapidement) l'équation diéren-
tielle régissant la dynamique de p(t). Quel est le comportement des solutions ? (interpréter le
résultat).

6
6. On supppose maintenant que le jeu modélise deux populations en interaction. On note
(p, 1 − p) et (q, 1 − q) les proportions des individus ayant adopté l'une ou l'autre des deux
stratégies possibles, respectivement au sein de la première et de la seconde population. Exprimer
(en le justiant rapidement) le système diérentiel régissant la dynamique de (p(t), q(t)). Quel
est le comportement des solutions ? (représenter l'espace des phases et interpréter le résultat).

7
Réponses

I.

1. Pour le joueur 1, la stratégie A est dominée (par la stratégie C), il n'y a pas de stratégie
dominante (remarque : pour la recherche des stratégies dominantes et dominées, le meilleur
moyen est encore de comparer deux à deux toutes les stratégies, pour le joueur en question).

Pour le joueur 2, la stratégie A est dominée (par la stratégie D), il n'y a pas de stratégie
dominante.

(remarque : pour la recherche des stratégies dominantes et dominées, le meilleur moyen est
encore de comparer deux à deux toutes les stratégies, pour le joueur en question)

Pour le joueur 1, le paiement minimum garanti est 1, obtenu avec la stratégie (prudente) C.

Pour le joueur 2, le paiement minimum garanti est 2, obtenu avec la stratégie (prudente) B.

2. Optima de Pareto : (D, A) → (9, 5), (D, D) → (4, 8). Equilibres de Nash : (B, B) → (3, 2).
Issue attendue du jeu : (B, B) (l'équiibre de Nash).

3. Jouer a priori la stratégie D de façon constante, et inciter le joueur 2 à jouer A, ce qui lui
rapporte 5 en moyenne. Pour inciter l'autre joueur à jouer A, il faut, dès qu'il ne joue pas A,
le punir lors des coups suivants, en jouant par exemple B (ce qui limite le gain du joueur 2 à
la valeur 2), et ce un nombre de coups susamment élevé pour que ce soit dissuasif.

II.

(1, 1) (0, 2)
 
1. .
(2, 0) (−1, −1)
R
0
 
2. Jeu Colombe-Faucon, matrice de paiement : A = 2 (avec première stratégie :
R−D
R 2
colombe, seconde stratégie : faucon, R=2 etD = 4, R désignant la rétribution correspondant
à une ressource à se partager lors des rencontres, et D le dommage dû au combat lorsque deux
faucons se rencontrent).

3. Si on note C et F les deux stratégies (faucon et colombe), il y a deux équilibres de Nash en


stratégie pure : (C, F ) → (0, 2) et (F, C) → (2, 0).
4. Equilibre de Nash supplémentaire en stratégie mixte : (p, q) = ( 21 , 21 ) (pour le trouver on
résoud : 1 × q + 0 × (1 − q) = 2 × q + (−1) × (1 − q) ⇔ q = 3q − 1 ce qui donne q = 1/2, idem
pour p).
Donc il y a en tout trois équilibres de Nash en stratégie mixte : (1, 0), (0, 1), et ( 21 , 12 ). Les deux
premiers sont stables, le troisième est instable (la justication la plus propre étant apportée
par question 6 plus loin).

5. On note P = (p, 1 − p). L'équation s'écrit :


= (AP )1 − (AP )2 = 1 − 2p.
p(1 − p)

8
Les solutions convergent vers p = 1/2 qui est stable (s'il y a plus de 50% de faucons, on a plutôt
intérêt, à titre individuel, à adopter la stratégie colombe, et vice-versa).

6. On note Q = (q, 1 − q). L'équation s'écrit :

ṗ q̇
= (AQ)1 − (AQ)2 = 1 − 2q, = (AP )1 − (AP )2 = 1 − 2p .
p(1 − p) q(1 − q)

Il y a maintenant cinq équilibres :

1. (p, q) = (0, 0) instable (noeud répulsif ),

2. (p, q) = (1, 1) instable (noeud répulsif ),

3. (p, q) = ( 21 , 12 ) (col, sa variété stable est la diagonale (p = q)),


4. (p, q) = (0, 1) stable (noeud attractif ),

5. (p, q) = (1, 0) stable (noeud attractif )

(remarque : les deux premiers de ces cinq équilibres sont liés au point de vue dynamique des
populations, ils n'apparaissaient pas comme des équilibres en stratégie mixte).

Vous aimerez peut-être aussi