Académique Documents
Professionnel Documents
Culture Documents
Jeux
Sous la direction de:
Travail effectué par:
Pr. Mounia BETTAH
EL ADSSI Abderrahman
Mr. Idriss EL ABBASSI
AMARHYOUZ Mohammed
GUENNOUN Zakaria
De plus en plus de Français s’équipent d’un climatiseur pour
assurer le confort thermique de leur foyer tout au long de
l’année. La climatisation split fait partie des systèmes
actuellement disponibles sur le marché des climatiseurs
réversibles. Comment fonctionne ce type de climatiseur ?
Quels sont ses atouts ? De quel entretien doit-il faire l’objet ?
Introduction
Plan
Introduction à la théorie des jeux
01
La recherche de l’équilibre des jeux 02
Cas particuliers (les jeux séquentiels,
les jeux en information incomplète) 03
02 03
Il est nécessaire de C’est-à-dire un ensemble
connaitre précisément de décisions prises par les
l’ordre d’intervention des joueurs que l’on note
joueurs et l’information
disponible pour chacun
a={a ,a ….an}
1 2
03 Les differents types de jeux
Une matrice qui décrit les stratégies du joueur 1 Lorsqu’on a un jeu séquentiel, les actions ne sont
en lignes et le joueur 2 en colonnes et qui plus simultanées mais séquentielles.
représente les gains (paiements) du jeu sous la
forme normale (lorsque les joueurs jouent en
même temps) b1 (a1.b1)
a1 B
b1 b2 b2 (a1.b2)
A
a1 (a1.b1) (a1.b2) b1 (a2.b1)
a2 (a2.b1) (a2.b2) a2 B
b2 (a2.b2)
Le tableau 1 la figure 1
05 Les applications
Le dilemme du
prisonnier
Application 1
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(Joueur 1) Ne pas dénoncer (– 5, – 1) (– 4, – 4)
(ND)
Les points-clés :
La théorie des jeux : est un ensemble d’outils mathématiques visant à décrire et à prévoir le résultat des actions
d’un ensemble de joueurs, en interaction les uns avec les autres.
Un jeu : On peut décrire un jeu en indiquant les paiements dont bénéficient les différents joueurs pour les divers
types de choix stratégiques qu’ils peuvent effectuer.
ALI (Joueur 2)
Une stratégie est dite strictement dominante pour un joueur A, si, quelque soit l’action
des autres joueurs, elle lui permet de maximiser ses gains.
• Dans l’exemple du dilemme du
prisonnier :
• La stratégie dominante des deux ALI (Joueur 2)
joueurs est de dénoncer (D.D). Donc,
Ne pas dénoncer
(D,D) est le résultat strictement Dénoncer (D)
(ND)
dominant.
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(Joueur 1) Ne pas dénoncer (– 5, – 1) (– 4, – 4)
(ND)
L’hypothèse de Multiplicité
d’équilibre ≠ L’unicité d’équilibre
ALI (Joueur 2)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(Joueur 1) Ne pas dénoncer (– 5, – 1) (– 4, – 4)
(ND)
Dénoncer (D) (– 2, – 2) (– 1, – 5)
MOHAMED
(Joueur 1) Ne pas dénoncer (– 5, – 1) (– 4, – 4)
(ND)
03 L’équilibre de Nash au sens de Pareto
L'équilibre de Nash est une solution aux jeux non coopératifs, dans lesquels chaque
joueur cherche à améliorer sa situation personnelle. Cependant, est-ce que cet équilibre
représente l’équilibre optimal/efficace ?
Pour répondre à cette question, nous utilisons la notion d'efficacité au sens de Pareto.
Les stratégies que nous avons étudié jusqu’à maintenant sont des
stratégies dites pures, c’est-à-dire correspondant à des stratégies qui
s’offrent aux joueurs.
Les stratégies mixtes sont une distribution de probabilité sur l’ensemble
des stratégies pures.
Les points-clés :
Une stratégie dominante : Une stratégie est dite strictement dominante pour un joueur A, si, quelque soit
l’action des autres joueurs, elle lui permet de maximiser ses gains.
Un équilibre avec stratégie dominante : est un ensemble de choix, tel que le choix de chaque joueur est
optimal quelque soit les choix des autres joueurs.
Un équilibre de Nash est un ensemble de choix, tel que le choix de chaque joueur est optimal compte tenu des
choix opérés par les autres joueurs.
Tout équilibre en stratégies dominantes est un équilibre de Nash. L’inverse n’est pas vrai.
L’équilibre de Pareto : est l’équilibre optimal qui permet d’améliorer la situation de chaque joueur sans
détériorer celle de l’autre.
Tout équilibre de Pareto est un équilibre de Nash. L’inverse n’est pas forcément vrai.
Le dilemme du prisonnier est un type de jeu particulier, dans lequel, le résultat efficace au sens de Pareto est
stratégiquement dominé par un équilibre inefficace.
La fonction de meilleur réponse : représente l'ensemble de stratégies qui produisent le résultat le plus favorable
au joueur considéré, étant données les stratégies des autres joueurs.
Chapitre III: Cas particuliers (les
jeux séquentiels et les jeux en
information incomplète)
Les jeux
L’équilibre de simultanés en
Nash parfait information
en sous jeu incomplète
01 02 03 04 05
Gain
Issu
la figure 1
01 Les jeux séquentiels et la forme extensive
Jusqu’à présent, nous avons envisagé des jeux dans lesquels les deux
joueurs agissaient de façon simultanée. Mais, dans de nombreuses
situations, un joueur doit jouer le premier et l’autre répond. C’est le cas
notamment du modèle de Stackelberg, dans lequel un joueur est « leader »
et l’autre un « follower ».
Exemple :
Le joueur A intervient en premier. S’il joue a2 le jeu se A
termine et les paiements sont égaux à 2 pour les deux a2 a1
joueurs. S’il joue a1, il donne l’occasion à B pour jouer.
Celui-ci peut jouer b1, et les paiements sont nuls, comme B
il peut jouer b2 et gagner 1 alors que A gagne 3. (2,2) b1 b2
Sous-jeu : un extrait du jeu de référence ayant comme point de départ un des nœuds
intermédiaires et constitué par l’ensemble des nœuds qui lui succèdent. Notre
exemple possède deux sous-jeux :
A
a2 a1
B
b1 b2
(2,2)
(0,0) (3,1)
Nous allons commencer par résoudre le premier sous-jeu dont l’équilibre est a2
alors B n’a pas d’occasion pour jouer.
Le deuxième sous-jeu est résolu conditionnellement au résultat du premier.
L’équilibre de Nash sélectionné par cette procédure est nommé : l’équilibre de
Nash parfait en sous jeux.
03 La méthode de l’induction à rebours
Définition :
L’induction à rebours :
A
a2 a1
B
b1 b2
(2,2)
(0,0) (3,1)
04 Les jeux simultanés en information incomplète
Définition :
Dans les jeux étudiés jusqu’à maintenant, nous avons toujours supposé
que les gains de chaque joueur étaient connus de chacun d’entre eux,
dans ce cadre, on parle de jeux en information complète.
Exemple :
Soit le jeu, dont le joueur B ne connait pas parfaitement la matrice des paiements, mais,
il sait qu’il n’y a que deux possibilités décrites par les figures suivantes :
b1 b2 b1 b2
(1) (2)
La résolution de ce type du jeu passe par sa transformation d’un jeu simultané en information
incomplète en un jeu séquentiel en information imparfaite suivant la procédure de Harsanyi.
04 Les jeux simultanés en information incomplète
Procédure d’Harsanyi:
Le passage d’un jeu simultané en information incomplète en un jeu séquentiel en
information imparfaite se fait suivant la procédure de Harsanyi.
(1,1) (0,0) (0,0) (-1,1) (-1,1) (0,0) (0,0) (1,1) a1 (-1,1) (0,0)
a2 (0,0) (1,1)
La résolution de ce type de jeu passe par la détermination des
équilibres de Nash bayésiens.
05 Les jeux séquentiels en information incomplète
A1 A2
a1 a2 a1 a2
B (1,0) B
(1,0)
Pour compléter les données de ce jeu, il faut préciser les croyances de B concernant les
choix de A pour chacun des types possibles. Tous les croyances prennent la forme de
quatre probabilités conditionnelles.
Pour que B puisse résoudre son problème, il doit évaluer la probabilité que A soit du type
A1 ou A2
05 Les jeux séquentiels en information incomplète
La formule de Bayes:
A1 A2
a1 a2 a1 a2
01
Les jeux de Les jeux de
coordination coexistence
01 Les jeux de coordination
Définition:
Comment sortir
du dilemme du
prisonnier?
Le jeu du prisonnier, s’il est
répété un nombre infini de
fois, permet d’atteindre le
résultat coopératif.
Grâce à des stratégies qui
permettent de récompenser
la coopération et de punir le
manque de coopération lors
des actions futures.
01 Les jeux de coordination
La stratégie de coopération :
Signer un contrat par lequel les deux parties s’engagent à appliquer la stratégie coopérative.
Considérons la course aux armements que se sont livrés les USA et URSS dans les années 1950.
Chaque pays pouvait:
L'équilibres de Nash avec stratégies pures (Ne pas construire ; Ne pas construire) est meilleur pour
chacune des deux parties.
Le problème est qu’aucun pays ne connait le choix que fera l’autre avant de décider de ne pas
construire de missiles nucléaires . Chaque partie souhaite avoir quelques assurances de l’autre.
01 Les jeux de coordination
Pour donner ce type d’assurance, l’un des joueurs peut faire le premier geste (geste unilatéral).
Si un joueur annonce qu’il ne déploiera pas de missiles nucléaires et qu’il donne suffisamment de preuves
de ce choix, il sera assuré que l’autre joueur renoncera également à déployer des missiles.
Cette coordination par la contractualisation conduira à l’équilibre de Nash au sens de Pareto (4 ; 4).
01 Les jeux de coordination
En somme :
Les jeux d’engagement font une particularité des jeux avec choix séquentiel, ils se caractérisent
par une stratégie importante, ce que l’on appelle l’engagement.
La stratégie
d’engagement
L’observabilité est
L’irréversibilité est fondamentale si l’autre
essentielle à l’engagement joueur doit être amené à
adapter son comportement
02 Les jeux d'engagement
Exemple 1
Un scorpion, cherchant à traverser une rivière, « Pour qui me prends-tu, scorpion ?? Je te connais, La grenouille hésite mais finit par céder sous
demande à une grenouille de le prendre sur son tu vas me piquer !! » les insistances du scorpion. Elle le fait monter
dos. sur son dos et s’engage dans la rivière
Arrivés au milieu, le
scorpion plante son « Mais enfin,
dard profondément scorpion !
dans le dos de la Pourquoi as-
grenouille. tu fait ça ??
Celle-ci est Nous allons
paralysée et se met mourir tous
à couler, entraînant les deux !! »
le scorpion avec elle.
02 Les jeux d'engagement
(0,0) Si la grenouille refuse de porter le scorpion, ils n’obtiennent rien, l’un comme l’autre.
(5,3) Si la grenouille transporte le scorpion, elle recevra l’utilité de 5 pour avoir fait le bien, et le
scorpion recevra un paiement de 3 pour avoir traversé la rivière.
(-10,5) Si la grenouille est piquée elle recevra un paiement de -10, et le scorpion 5 représentant la
satisfaction qui découle du respect de ses instincts naturels.
02 Les jeux d'engagement
Considérons pour commencer la dernière phase du jeu (-10,2)
er
Piq u
Choix
du
er scorpion
Port Ne pas
piquer
Choix de (5,3)
la
grenouille Piquer représente une utilité supérieure pour
Refuse
r de port le scorpion parce qu’il est dans sa nature.
er (0,0)
Dès lors, la grenouille devrait rationnellement
refuser de transporter le scorpion.
Une grenouille intelligente devrait trouver une façon d’amener le scorpion à s’engager à ne pas piquer.
Elle peut par exemple, engager une grenouille mercenaire chargée de représailles contre la famille du scorpion.
Le but est de modifier les paiements du scorpion de façon à ce que le fait de piquer soit plus coûteux et le fait de
ne pas piquer soit plus attractif.
02 Les jeux d'engagement
Exemple 2 Épargne et sécurité sociale
Ne pas a
id er (-2,-2)
i d er
Di la p
Aider (3,-1)
Épar
gner
Ne pa
s aider
(1,1)
Si les aînés épargnent, les jeunes choisiront de les négliger de sorte que les aînés finiront avec un paiement de 1
Si les aînés dilapident, ils savent que les jeunes ne pourront pas supporter de les regarder mourir de faim de
sorte que les aînés finiront avec un paiement de 2.
Donc les aînés ont intérêt à dilapider sachant qu’ils seront aidés pus tard
03 Les jeux de coexistence
La mise en situation du jeu :
Les jeux de coexistence
Chien 2
Faucon Colombe
Faucon (– 2, – 2) (4 , 0)
Chien 1
Colombe (0 , 4) (2, 2)
03 Les jeux de coexistence
La recherche de l’équilibre :
Supposons que :
p : La probabilité qu’un faucon rencontre un autre faucon
1-p : La probabilité qu’un faucon rencontre une colombe
Le paiement attendu pour un Faucon sera :
F = - 2p + 4 (1- p)
P< P= P>
04 Les jeux de concurrence
La situation opposée à la coopération est la concurrence, le cas des jeux à somme nulle, le paiements
dont bénéficie un joueur est égal aux pertes de l’autre joueur.
On suppose le jeu suivant dont ces paiements sont illustrés au tableau ci-dessous:
colonne
Plonger à gauche Plonger à droite
Ligne Tirer à gauche ( 50 ; -50 ) ( 80 ; -80 )
Tirer à droite ( 90; -90 ) ( 20 ; -20)
Le jeu connu sous nom de penalty au football est purement un jeu à somme nulle. La question qui se pose
maintenant, c’est comment trouver l’équilibre de Nash de ce jeu?
04 Les jeux de concurrence.
Soit:
P la probabilité que ligne tire à gauche.
(1-P) la probabilité que celui tire à droite.
Succès de ligne
Alors P=0,7
62
Correspond à l’intersection des deux fonctions linéaire.
Alors on constate que ligne sait que colonne s’efforcera
toujours de minimiser le paiement attendu de son adversaire.
Des lors, pour toute valeur P, le meilleur paiement que ligne 20
peut espérer c’est le paiement minimum obtenu dans les deux
stratégies. 0 Probabilité que ligne tire à gauche P=1
04 Les jeux de concurrence.
Soit :
q la probabilité que colonne plonge à gauche.
(1-q) la probabilité que colonne plonge à droit.
80
90
Succès de ligne
Les paiements seront:
50*q+80*(1-q) quand ligne tire à gauche qu’est égal à 65. 62
90*q+20*(1-q) quand ligne tire à gauche qu’est égal à 55. 50
Meilleure réponse
de ligne
1
p
0,7
Les deux courbes de meilleur réponse, notons qu’elles se croisent en un point ou P=0,7 et q=0,6. Les courbes de
meilleure réponse sont intéressantes en ce qu’’elles disent à chaque joueur ce qu’ils doivent faire pour tout
choix fait par l’adversaire, que ce choix soit optimal ou pas. Le seul choix qui est une réponse optimale à un
choix optimal est celui qui correspond au point d’intersection des deux courbes c’est-à-dire l’équilibre de Nash.
Les points-clés :
Jeux de coordination : Il s’agit de jeux où les paiements pour les joueurs sont les plus
élevés quand ils peuvent coordonner leurs stratégies. Mais cela exige l’existence d’un
contrat et l’existence d’une punition venant sanctionner l’engagement préalable.
Jeux d’engagement : Jeux séquentiel qui se base sur une stratégie qui s’appelle
engagement.
Jeux de coexistence : L’idée de ce jeu est que les différents types de comportement
animal sont programmés de façon génétique et que l’évolution sélectionne les
compositions de la population.