Académique Documents
Professionnel Documents
Culture Documents
Oujda
Plan
Introduction……………………………………..2
V –l’équilibre de Nash……………………………………16-19
1. Equilibre de Nash en stratégie pure
2. Equilibre de Nash avec stratégie mixte
Conclusion……………………………………20
Bibliographie
Introduction
1
La théorie des jeux est une approche distincte et interdisciplinaire du
comportement humain, elle a été fondée par les grands mathématiciens
John Von Neumanet Oskar Morgenstern dans leur livre publié en 1944,
intitulé « Theory of Games and EconomicBehavior » (la théorie des jeux et
comportement économique).
Lorsque des personnes interagissent entre elles, on peut dire qu’il y a
un jeu. Lorsqu’un commerçant détermine le prix d’un bien, il joue un
« jeu » avec ses clients et ses concurrents. La négociation des salaires est
un « jeu » entre le patron, les employés et les syndicats. Napoléon et
Wellington jouaient un « jeu » lors de la bataille de Waterlou tout comme
Kroutchev et Kennedy lors de la crise de Cuba.
Donc la théorie des jeux est présente souvent en économie, en
management, en politique, en sociologie, en situation de guerre…là où des
décisions complexes doivent être prises.
L’objet de cette théorie est d’étudier les principes et règles
mathématiques et les mettre à profit dans des situations de conflits lors
d’une interaction stratégique entre plusieurs preneurs de décisions (appelés
agents en économie et joueurs en théorie des jeux). Ces preneurs de
décisions interagissent dans le sens où le sort de chacun dépend non
seulement des décisions qu’il prend mais également des décisions prises
par d’autres preneurs de décisions, donc le choix optimal dépend
généralement de ce que font les autres.
Dans cette recherche, on va essayer en premier lieu de donner un
cadre théorique à cette conception, puis parler des différents types et
formes de jeux, étudier le dilemme du prisonnier et enfin évoquer la notion
d’équilibre de Nash.
2
1. Historique
2. Définition
3
La théorie des jeux peut être définie comme l’étude mathématique des
Interactions Stratégiques entre plusieurs agents Rationnels.
– Interaction : il y a plusieurs agents (appelés aussi joueurs, "décision
makers", etc...), et ils interagissent : le contentement (appelé aussi
paiement, gain, utilité, bien-être) de chacun ne dépend pas que de lui, mais
aussi en partie des autres.
– Stratégique : Les joueurs ont le choix entre plusieurs options.
– Rationnel : un joueur ne joue pas n’importe comment, il cherche à
optimiser son paiement.
3. Hypothèses
• Rationalité
C’est une hypothèse fondamentale. En effet, chaque joueur cherche à
maximiser ses gains. Le gain de chacun dépend autant des décisions des
autres que de sa propre décision. Il est donc nécessaire qu’il y ait
anticipation de ce que vont faire les autres et cela repose sur des
croyances.
• Information Complète
Chaque joueur connaît tous les détails du modèle et peut se mettre à la
place du modélisateur. Il sait que les autres savent qu’il sait, qu’ils
savent qu’il sait qu’ils savent, etc.
4
Lorsque l’on désire modéliser des comportements économiques
faisant apparaitre des interactions stratégiques sous la forme d’un jeu, il est
nécessaire de définir précisément ces éléments :
Les joueurs
Les règles
Les choix possibles: les stratégies
Résultat: les gains ou pertes
5
Conduire à gauche Conduire à droite
6
Un jeu est à somme nulle si la somme des gains est constante : somme
égale à zéro.
Dans ce type de jeu ce que gagne l’un des joueurs l’autre le perd.
Par exemple, les échecs; le poker; la pierre, papier, ciseau sont des jeux à
somme nulle.
J2 Pile Face
J1
Pile (20;-20) (-20;20)
Dit aussi jeux à somme positive. Ils représentent les situations où les
joueurs peuvent potentiellement gagner s’ils parviennent à coopérer ou à
coordonner leurs stratégies.
7
Alors le résultat d’un tel jeu peut être:
*(positif; positif): tous les joueurs sont gagnants.
*(négatif; négatif):tous les joueurs sont perdants.
Exemple:
Soit deux entreprises ont le choix dans leur politique de
communication entre « lancer une compagne de publicité » ou « ne rien
faire ».
E1
Lancer la (40;90) (60;50)
compagne pub
Ne rien faire (25;140) (25;50)
Jeux séquentiels
Il existe des jeux où les joueurs jouent l’un après l’autre: jeux
séquentiels.
Celui qui joue en premier est « le leader », celui qui joue en deuxième est
« le follower ».
8
Le joueur dans ce cas peut savoir ce que l’autre a joué avant de prendre sa
décision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer l’investissement en capital de son
concurrent avant de prendre sa propre décision.
Remarque:
Le duopole: une structure du marché oligopolistique dans laquelle deux
entreprises offreuses font face à une infinité de demandeurs.
Jeux simultanés
4. Jeux finis
On dit qu'un jeu est fini lorsque l'ensemble des stratégies de chacun
des joueurs est fini.
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que
deux stratégies possibles.
9
5. Jeux répétés
1. Forme extensive
11
La construction et l’étude des jeux sous forme extensive offrent un
moyen commode de représenter des interactions stratégiques séquentielles
dans des jeux à information parfaite.
Dans le cas des jeux à information imparfaite, le recours à un arbre de
Kuhn est toujours possible. Dans ce cas l’existence de coups simultanés se
traduit par l’apparition d’ensembles d’informations regroupant des nœuds
de l’arbre relatifs à ces coups.
2. Forme normale
La forme normale est une façon pratique de présenter les gains (ou
utilités) et les stratégies de chaque joueur : elle est constituée d’un tableau
(2 dimensions) lorsqu’il y a 2 joueurs. Lorsqu’il y a N joueurs, on est
obligé de construire plusieurs tableaux pour reproduire la dimension N.
On associe par exemple le gain au nombre 1, le match nul à 0, la défaite à–
1.Si le gain est aléatoire (ex du jeu de carte ou du lancer de dé), son gain
ou son utilité est alors son espérance mathématique.
12
Exemple :
• Le caillou casse les ciseaux (Caillou> Ciseaux).
• La feuille enveloppe le caillou (Feuille > Caillou).
• Les ciseaux coupent la feuille (Ciseaux > Feuille).
13
Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les
deux prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux
parle et l'autre garde le silence, le mouchard sera libre et l'autre ira en
prison pour 10 ans. Si les deux prisonniers se dénoncent mutuellement,
alors ils iront en prison pour 8 ans (et non 10 ans, car ils auront aidé la
justice tous les deux).
P1 Silence P1 Dénonce
P2 Silence 1,1 0,10
P2 Dénonce 10,0 8,8
14
schéma de réflexion alors ils se retrouvent dans une relation de
perdant- perdant.
Mais s’ils identifient tout les deux qu’il y a une solution gagnant-
gagnant, il y aura donc une interdépendance coopérative.
15
d'après le nom du célèbre mathématicien John Forbes Nash.
Lorsque cet équilibre est atteint, aucun joueur ne peut ajuster sa
stratégie unilatéralement pour en tirer profit. C'est exactement ce
qui se passe pour nos deux prisonniers. Imaginons que nous
soyons sur le point d'équilibre de Nash, les deux prisonniers se
dénoncent et vont en prison pour 8 ans. P1 peut changer sa
stratégie et garder le silence, mais il ira en prison pour 10 ans et
n'aura rien gagné. La situation est la même pour P2. Aucun
changement unilatéral de stratégie ne peut profiter à ces
"joueurs".
V –l’équilibre de Nash
choisit une stratégie une fois pour toutes, c’est-à-dire que chaque
agent effectuait un seul choix et s’y tenait: la stabilité.
La matrice des paiements suivante représente les paiements dont
bénéficient les joueurs A et B pour chaque combinaison de stratégies
choisies.
16
Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Une autre façon de définir un équilibre de Nash est une situation dont
personne n’a intérêt à dévier individuellement, sachant la stratégie de
l’autre. Ne pas dévier individuellement veut dire que les individus font un
choix optimal qui maximise leur utilité compte tenu de la stratégie de
l’autre. L’autre fait le même raisonnement compte tenu de la stratégie du
premier joueur.
Exemple 1
Le concept d’équilibre de Nash montre clairement qu’il s’agit
simplement d’une généralisation de l’équilibre de Cournot. Dans le cas de
l’équilibre de Cournot, la variable de décision est la quantité d’output
produite qui est une variable continue et chaque firme choisit l’output qui
maximise son profit compte tenu du choix de l’autre firme.
1John F. Nash junior, né en 1928, a reçu le prix Nobel en 1994 avec ReinhartSelten et
John Harsanyi pour la théorie des jeux non coopératifs.
17
En effet, lorsque le concurrent augmente sa production, la « moins
mauvaise solution » consiste, pour la firme, à diminuer la sienne : ceci
limite la baisse du prix due à la hausse de la production du concurrent,
sans nécessairement éviter la diminution de la recette totale, et permet de
diminuer le coût de production.
Exemple 2
L’équilibre de Bertrand, également est un équilibre de Nash avec des
stratégies en prix. Chaque firme choisit le prix qui maximise son profit,
compte tenu du choix qu’elle pense que l’autre firme fera.
18
Exemple : Pierre Papier et ciseaux
Dans ce jeu, les deux joueurs annoncent leur choix parmi trois
possibilités : le poing (la pierre), la paume de la main(le papier) ou les
deux premiers doigts(les ciseaux).
Les règles sont que la pierre brise les ciseaux, les ciseaux coupent le
papier et le papier enveloppe la pierre.
Le joueur J1 pourrait choisir de jouer pierre avec une probabilité de
1/3, papier avec 1/3 et ciseaux avec 1/3. De même, le joueur J2: pourrait
choisir de jouer pierre avec une probabilité de 1/3, papier avec 1/3 et
ciseauxavec 1/3.
19
Conclusion
20
Bibliographie
21
http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux
http://www.cril.univartois.fr/~konieczny/enseignement/TheorieD
esJeux.pdf
22