Académique Documents
Professionnel Documents
Culture Documents
La Théorie Des Jeux Cours Hasina 2020 Stratégie Pure
La Théorie Des Jeux Cours Hasina 2020 Stratégie Pure
Recherche opérationnelle
La première valeur dans chaque case correspond au gain du joueur en ligne (joueur A)et la
deuxième valeur au gain du joueur en colonne (joueur B)
Joueur B
Gauche Droite
Joueur A Haut 1;2 0;1
Bas 2;1 1;0
• Que vont faire les joueurs?
Pour le joueur A, la deuxième ligne est toujours meilleure que la première. « Bas » est sa
stratégie dominante.
1 0
2 1
Pour le joueur B, la première colonne est toujours meilleure que la deuxième. « Gauche » est
sa stratégie dominante.
2 1
1 0
Avec ces valeurs : A va toujours jouer « bas » et B va toujours jouer « gauche » donc la
stratégie d’équilibre serait A : « bas » et B : « gauche ». On a une « solution » du jeu par
stratégie dominante.
Joueur B
b1 b2 b3
Joueur A a1 7;5 3;7 1;8
a2 8;4 5;3 2;6
Pour le joueur A, la deuxième ligne est toujours meilleure que la première, « a2 » est sa
stratégie dominante.
Inscae : Ravelonahina Hasina Page 1
7 3 1
8 5 2
Pour le joueur B, la troisième colonne est toujours meilleure que les deux autres, « b3 » est sa
stratégie dominante.
5 7 8
4 3 6
Avec ces valeurs : A va toujours jouer « a2 » et B va toujours jouer « b3 » donc la stratégie
d’équilibre serait A : « a2 » et B : « b3 ». On a une encore une « solution » du jeu par stratégie
dominante.
Joueur B
b1 b2 b3
Joueur A a1 2;4 3;7 2;5
a2 4;6 6;5 3;7
a3 5;4 2;3 4;2
2 3 2
4 6 3
5 2 4
Pour le joueur A, il n’y a pas de meilleur ligne, il n’y a pas de stratégie dominante.
4 7 5
6 5 7
4 3 2
Pour le joueur B, il n’y a pas de meilleur colonne, il n’y a pas de stratégie dominante.
b1 b2 b3
a2 4;6 6;5 3;7
a3 5;4 2;3 4;2
b1 b3
a2 4;6 3;7
a3 5;4 4;2
La solution par élimination par itération des stratégies dominées est ( a3; b1)
Élément important de la théorie des jeux développé par John Forbes Nash en 1950.
Les équilibres (« solution ») avec des stratégies dominantes n’existe pas très souvent. Exiger
un équilibre avec stratégie dominantes est un critère trop sévère ;
Joueur B
Gauche Droite
Joueur A Haut 2;1 0;0
Bas 0;0 1;2
Il n’y a pas de stratégie dominante. Le choix de A dépend de ce qu’il croit que B fera.
Rappelons : Qu’aucun individu ne sait ce que l’autre va faire quand il doit choisir sa propre
stratégie. Mais chaque joueur peut anticiper le choix de l’autre personne.
Définition : Un équilibre de Nash peut être interprété comme une paire d’anticipations
relative aux choix de chaque individu. Cette paire est telle que personne ne désire modifier
son comportement (sa stratégie) si l’autre maintient la sienne.
Dans notre jeu si le joueur A choisit « haut » alors le joueur B choisira « gauche » et on
remarque réciproquement si B choisit « gauche » alors le joueur B choisira « haut ».
Donc dans le couple (A : « haut » ; B : « gauche »), aucun des deux joueurs n’a intérêt à
changer de stratégie si l’autre maintien la sienne. Nous avons alors un équilibre de Nash.
Si l’on fait la moyenne des pourcentages des 4 cases, il vient 79% de chance de marquer pour les
Tireurs (et
21% de chance d’arrêter pour les Gardiens). La problématique est : faut-il plus souvent tirer à
gauche ou à droite ? Et avec quelle fréquence ? Le gardien doit-il plonger plus souvent à gauche ou
à droite ? Et à quelle fréquence ?
Nash peut répondre à cela. Si p est la probabilité du Gardien de jouer Gauche, alors l’espérance de
gain du Tireur est :
S’il joue Gauche, EtireursiG = 58*p + [95*(1 – p)]
S’il joue Droit, EtireursiD = 93*p + [70*(1 – p)]
En posant : 58*p + [95*(1 – p)] = 93*p + [70*(1 – p)], il vient p = 25/60 = 0,42 (42%) qui est
la probabilité avec laquelle le Gardien devrait jouer Gauche (cela correspond pour lui à plonger à sa
droite). Et par voie de conséquence, le Gardien devrait jouer Droit dans 58% des cas (100% moins
42%) Ce qui permettrait au Tireur et au Gardien de trouver leur équilibre (le mieux qu’ils puissent
attendre avec l’assurance que ni l’un, ni l’autre ne gagneront plus en s’écartant de cet équilibre
Il est demandé :
E1. Choisir la décision qui rend maximale la moyenne arithmétique des gains (critère de
Laplace).
E2. Choisir la solution qui rend maximal le gain minimal de chaque décision (critère de Wald
ou du maximin)
E3. Prendre la décision qui rend maximal le résultat pondéré entre valeurs maximale et
minimale de chaque décision : a(mini) + (1-a)(maxi) avec a = 0.5 (critère de Hurwitz).
E4. Choisir la décision pour laquelle on rend minimal le maximum des regrets (critère de
Savage ou du minimax regret). Le regret est défini comme le coût d’opportunité (calculé entre
parenthèses).
E5. Si nous retenons P(Beau)=0.5; P(Couvert) =0.3; P(Pluie) = 0.2 quelle est la décision
ayant la plus grande espérance (critère de l'espérance).