La Théorie Des Jeux: Travail Effectué Par

La Théorie des
Jeux
Sous la direction de:
Travail effectué par:
Pr. Mounia BETTAH
EL ADSSI Abderrahman
Mr. Idriss EL ABBASSI
AMARHYOUZ Mohammed
GUENNOUN Zakaria
De plus en plus de Français s’équipent d’un climatiseur pour
assurer le confort thermique de leur foyer tout au long de
l’année. La climatisation split fait partie des systèmes
actuellement disponibles sur le marché des climatiseurs
réversibles. Comment fonctionne ce type de climatiseur ?
Quels sont ses atouts ? De quel entretien doit-il faire l’objet ?
Introduction
Plan
Introduction à la théorie des jeux
01
La recherche de l’équilibre des jeux 02
Cas particuliers (les jeux séquentiels,
les jeux en information incomplète) 03
Les applications de la théorie de jeux. 04

01 Introduction la théorie des jeux
 La théorie des jeux ne constitue pas une branche

de la microéconomie contemporaine.
 Il s’agit d'un outil mathématique suivant

l’ouvrage fondateur de John Von Neumann et
Morgenstern en 1944 « theory of Games and
economic behavior », mais c’est surtout à partir
des années 1980 qu’elle a connu des
développements importants : elle montre
comment les individus rationnels maximisent
leurs satisfactions dans un cadre logique.
 La théorie des jeux ne se limite pas seulement au

domaine de l’économie, mais peut également
trouver d’autres domaines d’application comme
la sociologie, les sciences politiques et le
domaine militaire...
02 Les éléments du jeu
2-Les règles 1-Les joueurs
4-Les gains 3-Les actions
Les composantes d’un jeu

01 04
I={1,2……n} chaque joueur une fonction de gain
I peut prendre une action ai propre au joueur i est
au sein d’un ensemble associée à chaque
d’actions possibles réalisation 𝞹(ai)
02 03
Il est nécessaire de C’est-à-dire un ensemble
connaitre précisément de décisions prises par les
l’ordre d’intervention des joueurs que l’on note
joueurs et l’information
disponible pour chacun
a={a ,a ….an}
1 2
03 Les differents types de jeux
 Jeu à somme nulle

 Jeu à somme non nulle
 Jeu non coopératif
 Jeu coopératif
 Jeu en information complète /
incomplète
 Jeu en information parfaite /
imparfaite
 Jeu répété
 Jeu séquentiel
La somme des
Jeu à gains de paiement
Les agents se
somme de tous les joueurs
coopèrent et les
nulle est nulle. C’est le
cas où l’un gagne
Jeu décisions avec une
coopératif forte concertation
et l’autre perd.
avec les autres
La somme n’est agents.
Jeu à
pas nulle et
somme
chaque joueur
non nulle
gagne selon sa
propre stratégie.
Jeu Les décisions
Les agents ne simultané sont prises en
coopèrent jamais et / statique même temps.
Jeu non les décisions sont
coopératif prises sans
concertation avec
les autres.
Les décisions ne sont
Jeu pas prises en même
dynamique temps (voir en horizon Jeu répété soit n
infini). Jeu fois, soit
répété infiniment
Lorsque chaque joueur, lors

Jeu en de sa prise de décision,
information connait ses possibilités
complète d’action et celles des autres
joueurs (Hypothèse de Le cas dans
connaissance commune). Jeu lequel les joueurs
prennent leurs
séquentie
Lorsque chaque joueur a décisions à des
l moments
Jeu en connaissance de toutes les
information actions effectuées avant différents.
parfaite son choix. Sinon, on parle
d’un jeu en information
imparfaite.
04 Les formes de jeux
Un jeu sous la forme normale correspond au

cas où tous les joueurs jouent en même temps.
Prenant l’exemple communément connu sous le
nom du « dilemme du prisonnier » proposé par
Al Tucker en 1950.
Un jeu sous une forme extensive lorsque les

joueurs ne jouent pas simultanément alors que A
joue en premier, B observe et joue ensuite, la
représentation usuelle d’un jeu séquentiel
s’effectue en utilisant une représentation
« arborescente ».c’est la forme extensive.
• La matrice des paiements • L’arbre du jeu
Une matrice qui décrit les stratégies du joueur 1 Lorsqu’on a un jeu séquentiel, les actions ne sont
en lignes et le joueur 2 en colonnes et qui plus simultanées mais séquentielles.
représente les gains (paiements) du jeu sous la
forme normale (lorsque les joueurs jouent en
même temps) b1 (a1.b1)
a1 B
b1 b2 b2 (a1.b2)
A
a1 (a1.b1) (a1.b2) b1 (a2.b1)
a2 (a2.b1) (a2.b2) a2 B
b2 (a2.b2)
Le tableau 1 la figure 1
05 Les applications
Le dilemme du
prisonnier
Application 1
La mise en situation du jeu:
Deux malfaiteurs sont arrêtés fortement soupçonnés de cambriolage.

Ils sont interrogés séparément. Le juge donne deux propositions à
chaque suspect:
• Soit ne pas dénoncer son complice et obtenir une peine

d’emprisonnement.
• Soit dénoncer son complice et obtenir une réduction de cette
peine.
05 Les applications
Les éléments du jeu :

Les joueurs :
2 joueurs, les deux sont complices, appelons-les MOHAMMED et ALI : {M, A}
Les actions / stratégies :
2 actions possibles pour chaque joueur :
D = dénoncer ND = ne pas dénoncer.
Les résultats :
4 résultats possibles : {(D, D), (D, ND), (ND, D), (ND, ND)}
Les gains :
Le juge décide une peine de :
• (D, D) 2 ans de prison
• (ND, ND) 4 ans de prison
• (D, ND) (ND , D) 1 an de prison pour D et 5ans de prison pour ND
05 Les applications
Matrice des paiements du jeu:

Lorsque le jeu est sous forme normale, on peut représenter
les gains des individus par une matrice des gains. ALI (Joueur 2)
Représentation stratégique Dénoncer (D) Ne pas dénoncer

(ND)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(Joueur 1) Ne pas dénoncer (– 5, – 1) (– 4, – 4)
(ND)
Les points-clés :
La théorie des jeux : est un ensemble d’outils mathématiques visant à décrire et à prévoir le résultat des actions
d’un ensemble de joueurs, en interaction les uns avec les autres.
Un jeu : On peut décrire un jeu en indiquant les paiements dont bénéficient les différents joueurs pour les divers
types de choix stratégiques qu’ils peuvent effectuer.
Les types d’un jeu :

 Jeux simultanés
 Jeux séquentiels
Les représentations d’un jeu :
 Représentation stratégique dite aussi normale
 Représentation extensive dite aussi arborescente
Le passage de la représentation graphique à la représentation extensive: est possible en passant de la matrice
des paiements à l’arbre de jeu.
Chapitre II: La
recherche de
l’équilibre des jeux
01 L’équilibre en stratégies dominantes
02 La notion d’équilibre de Nash
03 L’équilibre de Nash au sens de Pareto
Les calculs des paiements et la fonction de la

04
meilleure réponse
• Dans les exemples précédents la question qui nous intéresse
est de trouver l’équilibre qui va satisfaire les deux joueurs.
• Dans le cas du dilemme du prisonnier, on veut savoir si les

joueurs vont dénoncer ou non leur complice. Alors on
cherche la solution d’équilibre.
ALI (Joueur 2)
Dénoncer (D) Ne pas dénoncer

(ND)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED Ne pas dénoncer
(Joueur 1) (– 5, – 1) (– 4, – 4)
(ND)
Est-ce qu’il y a une stratégie qui est toujours la meilleure

pour les agents quelque soit la décision des autres?
La méthode des stratégies dominantes
Une stratégie est dite strictement dominante pour un joueur A, si, quelque soit l’action
des autres joueurs, elle lui permet de maximiser ses gains.
• Dans l’exemple du dilemme du
prisonnier :
• La stratégie dominante des deux ALI (Joueur 2)
joueurs est de dénoncer (D.D). Donc,
Ne pas dénoncer
(D,D) est le résultat strictement Dénoncer (D)
(ND)
dominant.
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(ND)
Quand est ce qu’on dit qu’une Stratégie Dominante représente un équilibre ?

Un résultat est un équilibre en stratégies dominantes s’il représente la stratégie
dominante de chaque joueur i.
L’hypothèse de Multiplicité
d’équilibre ≠ L’unicité d’équilibre
ALI (Joueur 2)

(ND)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(ND)
Quand est ce qu’on dit qu’une Stratégie Dominante représente un équilibre ?

Théorème de l’équilibre de Nash :
• Un résultat, est un équilibre de Nash si aucun joueur n’a intérêt à dévier

unilatéralement de sa stratégie quand les autres joueurs continuent à jouer.
• De manière générale, on peut montrer que tout équilibre en stratégies
dominantes est aussi un équilibre de Nash.
Est-ce que la réciproque est vraie?

Prenant l’exemple du dilemme du prisonnier :
Les stratégies dominantes:
Pour Bonnie: -2>-5 et -1>-4
Donc (D) domine strictement (ND).
Pour Clyde: -2>-5 et -1>-4
ALI (Joueur 2)
Donc (D) domine strictement (ND).
Alors (D.D) est un équilibre en SD. Dénoncer (D) Ne pas dénoncer
(ND)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(ND)
L'équilibre de Nash est une solution aux jeux non coopératifs, dans lesquels chaque
joueur cherche à améliorer sa situation personnelle. Cependant, est-ce que cet équilibre
représente l’équilibre optimal/efficace ?
Pour répondre à cette question, nous utilisons la notion d'efficacité au sens de Pareto.
Qu’est-ce qu’un équilibre au sens de Pareto?

Théorème de l’équilibre de Pareto :
Un résultat sera efficace au sens de Pareto

s’il n’existe pas d’autres résultats qui
permettent d’augmenter le gain d’au
moins un agent sans diminuer celui d’un ALI (Joueur 2)
autre.
(ND)
Dans le dilemme du prisonnier,
(D, D) est un équilibre de Nash. Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
Mais, (ND, ND) est un équilibre (Joueur 1) Ne pas
efficace au sens de Pareto. (– 5, – 1) (– 4, – 4)
dénoncer (ND)
(équilibre optimale)
Les calculs des paiements et la fonction de la
04
meilleure réponse
Les stratégies mixtes
 Les stratégies que nous avons étudié jusqu’à maintenant sont des
stratégies dites pures, c’est-à-dire correspondant à des stratégies qui
s’offrent aux joueurs.
 Les stratégies mixtes sont une distribution de probabilité sur l’ensemble
des stratégies pures.
Les points-clés :
Une stratégie dominante : Une stratégie est dite strictement dominante pour un joueur A, si, quelque soit
l’action des autres joueurs, elle lui permet de maximiser ses gains.
Un équilibre avec stratégie dominante : est un ensemble de choix, tel que le choix de chaque joueur est
optimal quelque soit les choix des autres joueurs.
Un équilibre de Nash est un ensemble de choix, tel que le choix de chaque joueur est optimal compte tenu des
choix opérés par les autres joueurs.
Tout équilibre en stratégies dominantes est un équilibre de Nash. L’inverse n’est pas vrai.
L’équilibre de Pareto : est l’équilibre optimal qui permet d’améliorer la situation de chaque joueur sans
détériorer celle de l’autre.
Tout équilibre de Pareto est un équilibre de Nash. L’inverse n’est pas forcément vrai.
Le dilemme du prisonnier est un type de jeu particulier, dans lequel, le résultat efficace au sens de Pareto est
stratégiquement dominé par un équilibre inefficace.
La fonction de meilleur réponse : représente l'ensemble de stratégies qui produisent le résultat le plus favorable
au joueur considéré, étant données les stratégies des autres joueurs.
Chapitre III: Cas particuliers (les
jeux séquentiels et les jeux en
information incomplète)
Les jeux
L’équilibre de simultanés en
Nash parfait information
en sous jeu incomplète
01 02 03 04 05
La méthode de Les jeux

Les jeux
l’induction à séquentiels en
séquentiels et la
rebours information
forme extensive
incomplète
01 Les jeux séquentiels et la forme extensive
branche
Gain
Issu
Dans les jeux séquentiels, les joueurs

b1 (a1.b1) ne jouent pas simultanément mais
chacun d’entre eux a un ordre
a1 B
b2 (a1.b2) d’intervention : Si A joue en premier,
A
b1 B l’observe et joue après.
(a2.b1)
a2 B
b2 (a2.b2)
joueur
joueur
la figure 1
Jusqu’à présent, nous avons envisagé des jeux dans lesquels les deux
joueurs agissaient de façon simultanée. Mais, dans de nombreuses
situations, un joueur doit jouer le premier et l’autre répond. C’est le cas
notamment du modèle de Stackelberg, dans lequel un joueur est « leader »
et l’autre un « follower ».
La question qui se pose est:

Comment on trouve l’équilibre dans un jeu séquentiel?
Qu’est ce que l’équilibre de Nash parfait en sous jeu?
Comment fonctionne la méthode d’induction à rebours (backward
induction)?
Exemple :
Le joueur A intervient en premier. S’il joue a2 le jeu se A
termine et les paiements sont égaux à 2 pour les deux a2 a1
joueurs. S’il joue a1, il donne l’occasion à B pour jouer.
Celui-ci peut jouer b1, et les paiements sont nuls, comme B
il peut jouer b2 et gagner 1 alors que A gagne 3. (2,2) b1 b2
On peut identifier deux équilibres de Nash dans ce (0,0) (3,1)

jeu : (a2 , b1) et (a1 , b2).
02 L’équilibre de Nash parfait en sous jeu
Sous-jeu : un extrait du jeu de référence ayant comme point de départ un des nœuds
intermédiaires et constitué par l’ensemble des nœuds qui lui succèdent. Notre
exemple possède deux sous-jeux :
A
a2 a1
B
b1 b2
(2,2)
(0,0) (3,1)
 Nous allons commencer par résoudre le premier sous-jeu dont l’équilibre est a2
alors B n’a pas d’occasion pour jouer.
 Le deuxième sous-jeu est résolu conditionnellement au résultat du premier.
 L’équilibre de Nash sélectionné par cette procédure est nommé : l’équilibre de
Nash parfait en sous jeux.
03 La méthode de l’induction à rebours
Définition :
La deuxième méthode de la résolution des jeux séquentiels est la méthode d’induction

à rebours : Elle consiste à déterminer les choix des joueurs en partant des nœuds
terminaux, puis remonter progressivement jusqu’au nœud initial de l’arbre.
03 La méthode de l’induction à rebours
L’induction à rebours :
A
a2 a1
B
b1 b2
(2,2)
(0,0) (3,1)
04 Les jeux simultanés en information incomplète
Définition :
Dans les jeux étudiés jusqu’à maintenant, nous avons toujours supposé
que les gains de chaque joueur étaient connus de chacun d’entre eux,
dans ce cadre, on parle de jeux en information complète.
Dans le cas contraire, on parle des jeux en information incomplète.

C’est le cas où la matrice des paiements n’est pas complétement connue
par tous les joueurs.
Exemple :
Soit le jeu, dont le joueur B ne connait pas parfaitement la matrice des paiements, mais,
il sait qu’il n’y a que deux possibilités décrites par les figures suivantes :
b1 b2 b1 b2
a1 (1,1) (0,0) a1 (-1,1) (0,0)
a2 (0,0) (-1,1) a2 (0,0) (1,1)
(1) (2)
La résolution de ce type du jeu passe par sa transformation d’un jeu simultané en information
incomplète en un jeu séquentiel en information imparfaite suivant la procédure de Harsanyi.
Procédure d’Harsanyi:
Le passage d’un jeu simultané en information incomplète en un jeu séquentiel en
information imparfaite se fait suivant la procédure de Harsanyi.
Avec : Pn : la probabilité que A soit de type à A1

1-Pn : la probabilité que A soit de type à A2
L’équilibre de Nash bayésien :

La procédure d’Harsanyi débouche sur ce qu’on appelle l’équilibre de Nash Bayésien.
Autrement dit, c’est l’équilibre de Nash quand B n’observe pas le choix de N et ignore le
type de A.
N
(1) Pn 1-Pn (2)
(1) b1 b2
A1 A2 a1 (1,1) (0,0)
a1 a2 a1 a2 a2 (0,0) (-1,1)
B B B B
(2) b1 b2
(1,1) (0,0) (0,0) (-1,1) (-1,1) (0,0) (0,0) (1,1) a1 (-1,1) (0,0)
a2 (0,0) (1,1)
La résolution de ce type de jeu passe par la détermination des
équilibres de Nash bayésiens.
05 Les jeux séquentiels en information incomplète
Jeux séquentiels en information incomplète:
Dans les jeux séquentiels en information incomplète, les

joueurs ne connaissent pas les types de leur adversaires mais,
ils peuvent observer les choix des joueurs qui les précèdent.
La résolution de ce type de jeu se fait principalement par

l’analyse des croyances de chaque joueur, en utilisant la règle
de Bayes, le concept d’équilibre de Nash bayésien parfait.
N
On a le jeu suivant :
A1 A2
a1 a2 a1 a2
B (1,0) B
(1,0)
(0,1) (2,4) (0,1) (4,2)

Pour compléter les données de ce jeu, il faut préciser les croyances de B concernant les
choix de A pour chacun des types possibles. Tous les croyances prennent la forme de
quatre probabilités conditionnelles.
croyance de B sur le choix de a2 par A lorsque celui-ci joue A1.

 croyance de B sur le choix de a1 par A lorsque celui-ci joue A1.
Pour que B puisse résoudre son problème, il doit évaluer la probabilité que A soit du type
A1 ou A2
La formule de Bayes:
Après le calcul des différentes probabilités qui représentent les données

du jeu, il est possible de calculer l’espérance des gains de B
conditionnellement au fait que A joue a2.
On constate alors que lorsque A joue a2 quelque soit le type du jeu, la
meilleure réponse que peut faire B et celle qui maximise l’espérance de
ses gains est b2.
Le joueur A connait les croyances de B, on peut faire le même

raisonnement pour lui et le jeu se réduit et sera le suivant:
A1 A2
a1 a2 a1 a2
(1,0) (2,4) (1,0) (4,2)

Les points-clés :
Un jeu sous forme extensive : est représenté par un arbre dont les branches correspondent aux actions
possibles, les nœuds précisent quel joueur joue et les gains sont représentés aux nœuds terminaux.
Jeux séquentiels en information parfaite : jeux où chaque joueur connaît parfaitement les choix de
tous les autres joueurs jusqu’à son intervention.
Sous-jeu: un extrait du jeu de référence ayant comme point de départ un des nœuds intermédiaires et
constitué par l’ensemble des nœuds qui lui succèdent.
La méthode d’induction à rebours : permet d’obtenir un équilibre d’un jeu sous forme extensive en
déterminant chaque action optimale en partant des nœuds terminaux.
Jeux en information incomplète : sont les jeux où la matrice des paiements n’est pas complétement
connue par tous les joueurs.
La procédure de Harsanyi : procédure qui permet le passage d’un jeu simultané en information
incomplète en un jeu séquentiel en information imparfaite.
Chapitre IV: Les applications de la théorie des
jeux
Les jeux Les jeux de
d’engagement concurrence
01
Les jeux de Les jeux de
coordination coexistence
01 Les jeux de coordination
Définition:
Il s’agit de jeux où les paiements

pour les joueurs sont les plus
élevés quand ils peuvent
coordonner leurs stratégies.
Le problème, que dans la
pratique est de mettre au point
des mécanismes qui permettent
cette coordination.
Cas du dilemme du prisonnier :
Comment sortir
du dilemme du
prisonnier?
Le jeu du prisonnier, s’il est
répété un nombre infini de
fois, permet d’atteindre le
résultat coopératif.
Grâce à des stratégies qui
permettent de récompenser
la coopération et de punir le
manque de coopération lors
des actions futures.
La stratégie de coopération :
Signer un contrat par lequel les deux parties s’engagent à appliquer la stratégie coopérative.
Il devra payer une amende ou sera

puni d’une façon ou d’une autre.
 Les contrats coopératifs permettent d’atteindre beaucoup de résultats,

mais ils requièrent l’existence d’un cadre légal qui assure leur
application.
Cas du jeu de l’assurance :
Considérons la course aux armements que se sont livrés les USA et URSS dans les années 1950.
Chaque pays pouvait:
Construire des missiles nucléaires Ne pas construire de missiles nucléaires

URSS
Ne pas construire construire
Ne pas construire (4,4) (1,3)

USA
construire (3,1) (2,2)
 L'équilibres de Nash avec stratégies pures (Ne pas construire ; Ne pas construire) est meilleur pour
chacune des deux parties.
 Le problème est qu’aucun pays ne connait le choix que fera l’autre avant de décider de ne pas
construire de missiles nucléaires . Chaque partie souhaite avoir quelques assurances de l’autre.
Pour donner ce type d’assurance, l’un des joueurs peut faire le premier geste (geste unilatéral).
Si un joueur annonce qu’il ne déploiera pas de missiles nucléaires et qu’il donne suffisamment de preuves
de ce choix, il sera assuré que l’autre joueur renoncera également à déployer des missiles.
Cette coordination par la contractualisation conduira à l’équilibre de Nash au sens de Pareto (4 ; 4).
En somme :
ÞJeu de coordination simultané : est résolu par

Þla répétition
Þ Jeu de coordination séquentiel : est résolu

par
Þ la contractualisation

02 Les jeux d'engagement
Les jeux d’engagement font une particularité des jeux avec choix séquentiel, ils se caractérisent
par une stratégie importante, ce que l’on appelle l’engagement.
La stratégie
d’engagement
L’engament doit être à la

fois irréversible et
observable par l’autre
joueur
L’observabilité est
L’irréversibilité est fondamentale si l’autre
essentielle à l’engagement joueur doit être amené à
adapter son comportement
Exemple 1
Un scorpion, cherchant à traverser une rivière, « Pour qui me prends-tu, scorpion ?? Je te connais, La grenouille hésite mais finit par céder sous
demande à une grenouille de le prendre sur son tu vas me piquer !! » les insistances du scorpion. Elle le fait monter
dos. sur son dos et s’engage dans la rivière
« Mais non, grenouille ! Tu peux me faire confiance.

Si je te pique, je me noierai moi aussi ! »
Arrivés au milieu, le
scorpion plante son « Mais enfin,
dard profondément scorpion !
dans le dos de la Pourquoi as-
grenouille. tu fait ça ??
Celle-ci est Nous allons
paralysée et se met mourir tous
à couler, entraînant les deux !! »
le scorpion avec elle.
Examinons cette fatale du point de vue de la théorie des jeux. (-10,5)

er
Piqu
Choix
du
or t er scorpion
P Ne pas
Choix de piquer (5,3)
la
grenouille
Refuse
r de port
er (0,0)
 (0,0) Si la grenouille refuse de porter le scorpion, ils n’obtiennent rien, l’un comme l’autre.
 (5,3) Si la grenouille transporte le scorpion, elle recevra l’utilité de 5 pour avoir fait le bien, et le
scorpion recevra un paiement de 3 pour avoir traversé la rivière.
 (-10,5) Si la grenouille est piquée elle recevra un paiement de -10, et le scorpion 5 représentant la
satisfaction qui découle du respect de ses instincts naturels.
Considérons pour commencer la dernière phase du jeu (-10,2)
er
Piq u
Choix
du
er scorpion
Port Ne pas
piquer
Choix de (5,3)
la
grenouille Piquer représente une utilité supérieure pour
Refuse
r de port le scorpion parce qu’il est dans sa nature.
er (0,0)
Dès lors, la grenouille devrait rationnellement
refuser de transporter le scorpion.
Une grenouille intelligente devrait trouver une façon d’amener le scorpion à s’engager à ne pas piquer.
Elle peut par exemple, engager une grenouille mercenaire chargée de représailles contre la famille du scorpion.
Le but est de modifier les paiements du scorpion de façon à ce que le fait de piquer soit plus coûteux et le fait de
ne pas piquer soit plus attractif.
Exemple 2 Épargne et sécurité sociale
L'épargne en vue de la retraite est un exemple intéressant et actuel.

Chacun reconnaîtra qu’épargner est une bonne chose. Malheureusement, peu de gens épargnent effectivement.
Une raison en est que les individus savent que la société ne les laissera pas mourir de faim de sorte qu’il y a de
fortes chances qu’ils bénéficient ultérieurement d’une aide.
Épargner
Les stratégies de la génération plus
âgée: Dilapider
Aider
Les stratégies de la génération plus
jeune: Ne pas aider
Jeune génération
Aider Ne pas aider
épargner (3,-1) (1,1)

Génération plus
âgée
Dilapider (2,-1) (-2,-2)
Deux équilibres de Nash:

Si les aînés choisissent d’épargner, le choix optimal pour les plus jeunes est de les négliger
Si les aînés décident de dilapider leurs revenus, le choix optimal pour les plus jeunes est de les aider
Toutefois, cette analyse ignore la structure temporelle du jeu

Un des avantages d’être vieux est que vous êtes amené à faire le premier pas.
Aider (2,-1)
Ne pas a
id er (-2,-2)
i d er
Di la p
Aider (3,-1)
Épar
gner
Ne pa
s aider
(1,1)
 Si les aînés épargnent, les jeunes choisiront de les négliger de sorte que les aînés finiront avec un paiement de 1
 Si les aînés dilapident, ils savent que les jeunes ne pourront pas supporter de les regarder mourir de faim de
sorte que les aînés finiront avec un paiement de 2.
Donc les aînés ont intérêt à dilapider sachant qu’ils seront aidés pus tard
03 Les jeux de coexistence
La mise en situation du jeu :
Les jeux de coexistence
Les gains / paiements :

Si les deux chiens sauvages jouent à la colombe : Ils finiront avec (2, 2).
Si l’un joue au faucon et l’autre à la colombe : Le faucon gagnera tout (4, 0) ou (0, 4)
Si les deux joueurs jouent au faucon : Chaque chien sera blessé sérieusement. (-2 ,-2)
Chien 2
Faucon Colombe
Faucon (– 2, – 2) (4 , 0)
Chien 1
Colombe (0 , 4) (2, 2)
La recherche de l’équilibre :
Supposons que :
p : La probabilité qu’un faucon rencontre un autre faucon
1-p : La probabilité qu’un faucon rencontre une colombe

Le paiement attendu pour un Faucon sera :
F = - 2p + 4 (1- p)
Le paiement attendu pour une colombe sera :

C = 2 (1- p)

Chien 2
L’équilibre :
F=C Faucon Colombe
- 2p + 4 (1- p) = 2 (1- p)
P = 1/2 Faucon (– 2, – 2) (4 , 0)
Chien 1
Colombe (0 , 4) (2, 2)
Représentation graphique de l’équilibre :
Un mélange 50-50 de colombes de

faucons est un équilibre stable.
Équilibre stable

Cet équilibre le concept et stratégie
stratégie stable en terme d’évolution.

P< P= P>
04 Les jeux de concurrence
La situation opposée à la coopération est la concurrence, le cas des jeux à somme nulle, le paiements
dont bénéficie un joueur est égal aux pertes de l’autre joueur.
On suppose le jeu suivant dont ces paiements sont illustrés au tableau ci-dessous:
colonne
Plonger à gauche Plonger à droite
Ligne Tirer à gauche ( 50 ; -50 ) ( 80 ; -80 )
Tirer à droite ( 90; -90 ) ( 20 ; -20)
Tableau : un penalty au football.
Le jeu connu sous nom de penalty au football est purement un jeu à somme nulle. La question qui se pose
maintenant, c’est comment trouver l’équilibre de Nash de ce jeu?
04 Les jeux de concurrence.
Soit:
P la probabilité que ligne tire à gauche.
(1-P) la probabilité que celui tire à droite.
Les paiement seront:

50*P+90*(1-P) quand colonne plonge à gauche qu’est égal à 70 si p=0,5.
80*P+20*(1-P) quand colonne plonge à droite qu’est égal à 50 si p=0,5.
à l’équilibre: 50*P+90*(1-P) = 80*P+20*(1-P) 90
Succès de ligne
Alors P=0,7
62
Correspond à l’intersection des deux fonctions linéaire.
Alors on constate que ligne sait que colonne s’efforcera
toujours de minimiser le paiement attendu de son adversaire.
Des lors, pour toute valeur P, le meilleur paiement que ligne 20
peut espérer c’est le paiement minimum obtenu dans les deux
stratégies. 0 Probabilité que ligne tire à gauche P=1
Soit :
q la probabilité que colonne plonge à gauche.
(1-q) la probabilité que colonne plonge à droit.
80
90
Succès de ligne
Les paiements seront:
50*q+80*(1-q) quand ligne tire à gauche qu’est égal à 65. 62
90*q+20*(1-q) quand ligne tire à gauche qu’est égal à 55. 50
A l’équilibre 50*q+80*(1-q) = 90*q+20*(1-q)

Alors que q=0,6 20
Correspond à l’intersection des deux fonctions linéaire que
nous avons trouvé. 0 Probabilité que colonne q=1
plonge à gauche.
1
q
Meilleure réponse
de colonne
0,6
Meilleure réponse
de ligne
1
p
0,7
Les deux courbes de meilleur réponse, notons qu’elles se croisent en un point ou P=0,7 et q=0,6. Les courbes de
meilleure réponse sont intéressantes en ce qu’’elles disent à chaque joueur ce qu’ils doivent faire pour tout
choix fait par l’adversaire, que ce choix soit optimal ou pas. Le seul choix qui est une réponse optimale à un
choix optimal est celui qui correspond au point d’intersection des deux courbes c’est-à-dire l’équilibre de Nash.
Les points-clés :
Jeux de coordination : Il s’agit de jeux où les paiements pour les joueurs sont les plus
élevés quand ils peuvent coordonner leurs stratégies. Mais cela exige l’existence d’un
contrat et l’existence d’une punition venant sanctionner l’engagement préalable.
Jeux d’engagement : Jeux séquentiel qui se base sur une stratégie qui s’appelle
engagement.
Jeux de coexistence : L’idée de ce jeu est que les différents types de comportement
animal sont programmés de façon génétique et que l’évolution sélectionne les
compositions de la population.
Jeux de concurrence : (Jeux à somme nulle) (≠ jeux de coordination) : Jeux où les

paiements dont bénéficie un joueur sont égales aux pertes de l’autre.

La Théorie Des Jeux: Travail Effectué Par

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

La Théorie Des Jeux: Travail Effectué Par

Transféré par

Droits d'auteur :

Formats disponibles

La Théorie des

Les applications de la théorie de jeux. 04

 La théorie des jeux ne constitue pas une branche

 Il s’agit d'un outil mathématique suivant

 La théorie des jeux ne se limite pas seulement au

2-Les règles 1-Les joueurs

4-Les gains 3-Les actions

Les composantes d’un jeu

 Jeu à somme nulle

Lorsque chaque joueur, lors

Un jeu sous la forme normale correspond au

Un jeu sous une forme extensive lorsque les

La mise en situation du jeu:

Deux malfaiteurs sont arrêtés fortement soupçonnés de cambriolage.

• Soit ne pas dénoncer son complice et obtenir une peine

Les éléments du jeu :

Matrice des paiements du jeu:

Représentation stratégique Dénoncer (D) Ne pas dénoncer

Les types d’un jeu :

02 La notion d’équilibre de Nash

03 L’équilibre de Nash au sens de Pareto

Les calculs des paiements et la fonction de la

• Dans le cas du dilemme du prisonnier, on veut savoir si les

Dénoncer (D) Ne pas dénoncer

Est-ce qu’il y a une stratégie qui est toujours la meilleure

Quand est ce qu’on dit qu’une Stratégie Dominante représente un équilibre ?

Dénoncer (D) Ne pas dénoncer

Quand est ce qu’on dit qu’une Stratégie Dominante représente un équilibre ?

Théorème de l’équilibre de Nash :

• Un résultat, est un équilibre de Nash si aucun joueur n’a intérêt à dévier

Est-ce que la réciproque est vraie?

Qu’est-ce qu’un équilibre au sens de Pareto?

Théorème de l’équilibre de Pareto :

Un résultat sera efficace au sens de Pareto

La méthode de Les jeux

Dans les jeux séquentiels, les joueurs

La question qui se pose est:

On peut identifier deux équilibres de Nash dans ce (0,0) (3,1)

La deuxième méthode de la résolution des jeux séquentiels est la méthode d’induction

Dans le cas contraire, on parle des jeux en information incomplète.

a1 (1,1) (0,0) a1 (-1,1) (0,0)

a2 (0,0) (-1,1) a2 (0,0) (1,1)

Avec : Pn : la probabilité que A soit de type à A1

L’équilibre de Nash bayésien :

Jeux séquentiels en information incomplète:

Dans les jeux séquentiels en information incomplète, les

La résolution de ce type de jeu se fait principalement par

(0,1) (2,4) (0,1) (4,2)

croyance de B sur le choix de a2 par A lorsque celui-ci joue A1.

Après le calcul des différentes probabilités qui représentent les données

Le joueur A connait les croyances de B, on peut faire le même

(1,0) (2,4) (1,0) (4,2)

Il s’agit de jeux où les paiements

Il devra payer une amende ou sera

 Les contrats coopératifs permettent d’atteindre beaucoup de résultats,

Construire des missiles nucléaires Ne pas construire de missiles nucléaires

Ne pas construire construire

Ne pas construire (4,4) (1,3)

ÞJeu de coordination simultané : est résolu par

Þ Jeu de coordination séquentiel : est résolu

L’engament doit être à la

« Mais non, grenouille ! Tu peux me faire confiance.

Examinons cette fatale du point de vue de la théorie des jeux. (-10,5)

à l’équilibre: 50P+90(1-P) = 80P+20(1-P) 90

A l’équilibre 50q+80(1-q) = 90q+20(1-q)