Vous êtes sur la page 1sur 26

Faculté des Sciences Juridiques, Economiques et sociales

MASTER ECONOMIE ET FINANCE PARTICIPATIVE

Exposé sous le thème :

La Théorie Des Jeux et stratégie concurrentiel

Encadré par : Mr El Hassani Hafid .


Plan
Introduction……………………………………..3
I –présentation de la théorie des jeux……………………….4-5
1. Historique
2. Définition
3. Hypothèses
4. Eléments des jeux
II –typologie des jeux………………………………...…….6-11
1. Jeux coopératifs et non coopératifs
2. Jeux à somme nulle et jeux à somme positive
3. Jeux simultanés et jeux séquentiels
4. Jeux finis
5. Jeux répétés
6. Jeux à information complète et incomplète
III–Forme des jeux de stratégie…………………………..12-13
1. Forme extensive
2. Forme normale
IV –le dilemme du prisonnier………………………..……15-16
V –l’équilibre des stratégies……………………….………17-24
1. Equilibre des stratégies dominantes
2. Equilibre de Nash en stratégie pure
3. Equilibre de Nash avec stratégie mixte
4. Stratégie Maximin

Conclusion……………………………………25
Bibliographie

2
Introduction

La théorie des jeux est une approche distincte et interdisciplinaire du


comportement humain, elle a été fondée par les grands mathématiciens John Von
Neuman et Oskar Morgenstern dans leur livre publié en 1944, intitulé « Theory
of Games and EconomicBehavior » (la théorie des jeux et comportement
économique).
Lorsque des personnes interagissent entre elles, on peut dire qu’il y a un jeu.
Lorsqu’un commerçant détermine le prix d’un bien, il joue un « jeu » avec ses
clients et ses concurrents. La négociation des salaires est un « jeu » entre le patron,
les employés et les syndicats. Napoléon et Wellington jouaient un « jeu » lors de
la bataille de Waterlou tout comme Kroutchev et Kennedy lors de la crise de Cuba.
Donc la théorie des jeux est présente souvent en économie, en management,
en politique, en sociologie, en situation de guerre…là où des décisions complexes
doivent être prises.
L’objet de cette théorie est d’étudier les principes et règles mathématiques et
les mettre à profit dans des situations de conflits lors d’une interaction stratégique
entre plusieurs preneurs de décisions (appelés agents en économie et joueurs en
théorie des jeux). Ces preneurs de décisions interagissent dans le sens où le sort de
chacun dépend non seulement des décisions qu’il prend mais également des
décisions prises par d’autres preneurs de décisions, donc le choix optimal dépend
généralement de ce que font les autres.
Dans cette recherche, on va essayer en premier lieu de donner un cadre
théorique à cette conception, puis parler des différents types et formes de jeux,
étudier le dilemme du prisonnier et enfin évoquer la notion d’équilibre de Nash.

3
I –présentation de la théorie des jeux

1.Historique

 En 1938, Émile Borel développe, dans son ouvrage « Applications


aux Jeux de Hasard », un théorème du minimax pour les jeux à somme
nulle à deux joueurs, c'est-à-dire les jeux dans lesquels ce que gagne l'un est
perdu par l'autre.

 En 1944, La théorie des jeux devient un champ de recherche à part


entière avec la publication de la Théorie jeux et du comportement
économique (Theory of Games and EconomicBehavior) par John von
Neumann et Oskar Morgenstern

 En 1950, John Nash développe la notion d'équilibre de Nash qui


généralise les travaux de Cournot.

 En 1994, John Nash, Reinhard Selten et John Harsanyi reçoivent le


« prix Nobel d'économie » (prix de la Banque royale de Suède en sciences
économiques en mémoire d'Alfred Nobel) pour leurs travaux sur la théorie
des jeux. Ce choix témoigne de l'importance prise par la théorie des jeux
dans l'analyse économique.

4
2. Définition

La théorie des jeux peut être définie comme l’étude mathématique des
Interactions Stratégiques entre plusieurs agents Rationnels.
– Interaction : il y a plusieurs agents (appelés aussi joueurs, "décision makers",
etc...), et ils interagissent : le contentement (appelé aussi paiement, gain, utilité,
bien-être) de chacun ne dépend pas que de lui, mais aussi en partie des autres.
– Stratégique : Les joueurs ont le choix entre plusieurs options.
– Rationnel : un joueur ne joue pas n’importe comment, il cherche à optimiser
son paiement.

3. Hypothèses

• Rationalité
C’est une hypothèse fondamentale. En effet, chaque joueur cherche à
maximiser ses gains. Le gain de chacun dépend autant des décisions des autres
que de sa propre décision. Il est donc nécessaire qu’il y ait anticipation de ce
que vont faire les autres et cela repose sur des croyances.
• Information Complète
Chaque joueur connaît tous les détails du modèle et peut se mettre à la place
du modélisateur. Il sait que les autres savent qu’il sait, qu’ils savent qu’il sait
qu’ils savent, etc.

4. Eléments des jeux


Lorsque l’on désire modéliser des comportements économiques faisant
apparaitre des interactions stratégiques sous la forme d’un jeu, il est nécessaire de
définir précisément ces éléments :
 Les joueurs
 Les règles
 Les choix possibles: les stratégies
 Résultat: les gains ou pertes

5
II –typologie des jeux
1. Jeux coopératifs et non coopératifs

 Les jeux coopératifs

Les joueurs peuvent communiquer librement et passer entre eux des accords
qui les lient de façon contraignante.
Ils cherchent l’intérêt général suivi d’un partage des gains entre tous les joueurs
(intelligence collective).
Jeux solidaires : les joueurs gagnent ou perdent tous ensemble (ils ne jouent pas
l’un contre l’autre).

Exemple: Le côté de conduite

 Conduire du même côté que les autres permet de se déplacer en relative


sécurité (gain de 100).
 Conduire dans le sens opposé rend un accident très probable (gain 0).
On obtient la matrice suivante:

Conduire à gauche Conduire à droite

Conduire à gauche 100 0

Conduire à droite 0 100

6
 Jeux non coopératifs

Les individus adoptent un comportement égoïste et opportuniste à chaque


instant:
 Absence de la communication entre les joueurs.
 Les joueurs agissent selon le principe de rationalité économique: chacun
cherche son intérêt individuel.
Exemple :

Soit une entreprise 1 et une entreprise 2 ayant à leur disposition les actions: «
produire » et « ne pas produire »:

E2 Produit Ne produit pas


E1
Produit (-3;-2) (10;0)
Ne produit pas (0;8) (0;0)

2. Jeux à somme nulle et jeux à somme positive

 Jeux à somme nulle (ou interdépendance compétitive)

Un jeu est à somme nulle si la somme des gains est constante : somme égale
à zéro.
Dans ce type de jeu ce que gagne l’un des joueurs l’autre le perd.
Par exemple, les échecs; le poker; la pierre, papier, ciseau sont des jeux à somme
nulle.
Exemple : Jeu de « matching »:
Deux joueurs annoncent simultanément Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reçoit 20 € que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 € à 2.

7
La matrice des gains est donc la suivante
J2 Pile Face

J1
Pile (20;-20) (-20;20)
Face (-20;20) (20;-20)

 Jeux à somme non nulle (indépendance coopératifs)

Dit aussi jeux à somme positive. Ils représentent les situations où les joueurs
peuvent potentiellement gagner s’ils parviennent à coopérer ou à coordonner
leurs stratégies.
Alors le résultat d’un tel jeu peut être:
*(positif; positif): tous les joueurs sont gagnants.
*(négatif; négatif):tous les joueurs sont perdants.

Exemple:
Soit deux entreprises ont le choix dans leur politique de communication
entre « lancer une compagne de publicité » ou « ne rien faire ».

E2 Lancer la Ne rien faire


compagne
pub

E1
Lancer la (40;90) (60;50)
compagne
pub
Ne rien faire (25;140) (25;50)

8
3. Jeux simultanés et jeux séquentiels

 Jeux séquentiels

Il existe des jeux où les joueurs jouent l’un après l’autre: jeux séquentiels.
Celui qui joue en premier est « le leader », celui qui joue en deuxième est « le
follower ».
Le joueur dans ce cas peut savoir ce que l’autre a joué avant de prendre sa
décision.
Exemple :
 Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
 Un duopoleur peut observer l’investissement en capital de son concurrent
avant de prendre sa propre décision.

Remarque:
Le duopole: une structure du marché oligopolistique dans laquelle deux
entreprises offreuses font face à une infinité de demandeurs.

 Jeux simultanés

• Chaque joueur choisit son plan d’action complet au début du jeu et une fois
pour toutes.
• Le joueur ne connaît pas les choix effectué par les autres joueurs donc il
doit prévoir les choix des autres.

Exemple: Le dilemme du prisonnier.

9
4. Jeux finis

On dit qu'un jeu est fini lorsque l'ensemble des stratégies de chacun des
joueurs est fini.
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux
stratégies possibles.

5. Jeux répétés

La répétition d’un jeu, avec connaissance des résultats intermédiaires,


change souvent fondamentalement son déroulement (les meilleurs coups et la
conclusion).
Par exemple, il peut être utile de prendre ponctuellement le risque de perdre
« pour voir », tester les autres joueurs, et mettre en place des stratégies de
communication par les coups joués (à défaut d’autre moyen de communication).

6. Jeux à information complète et incomplète :


 Jeux à information complète
On dit qu'un jeu est à information complète si chaque joueur connaît lors de
la prise de décision :
 ses possibilités d'action
 les possibilités d'action des autres joueurs
 Résultats de la décision qui sera prise
 les motivations des joueurs

 Jeux à information incomplète


On dit qu’un jeu est à information incomplète s’il manque de l’information
(lorsqu’il n’y a pas de connaissance des gains, ou de certaines règles …).
On parle de jeu à information parfaite dans le cas de jeu sous forme extensive, où
chaque joueur a une connaissance parfaite de toute l'histoire du jeu.
Un jeu à information incomplète est aussi à information imparfaite. Les jeux
à information complète peuvent être à information imparfaite soit du fait de la

10
simultanéité des choix des joueurs, soit lorsque des événements aléatoires sont
cachés à certains joueurs.

 La forme normale ou stratégique du jeu :

Le modèle de jeux sous forme stratégique supprime la structure séquentielle


de la prise décision. Quand elle est appliquée à des situations dans lesquelles les
preneurs de décisions jouent séquentiellement, elle oblige à supposer que les
joueurs choisissent leur stratégie une fois pour toute, ils sont alors engagés dans
cette stratégie et ne peuvent pas la modifier à mesure que le jeu se déroule.
Cette modélisation est toutes fois très utile pour décrire des situations dans
lesquelles les joueurs jouent en même temps. Ce jeu est connu sous le nom de la
forme normale des jeux.
Donc La forme normale d’un jeu est tout simplement l’écriture condensée sous la
forme d’un tableau. Ce tableau est souvent appelé matrice de gain ou matrice de
paiement. Cette forme de présentation d’un jeu permet de mieux comprendre la
notion de stratégie. Elle décrit les stratégies de l’ensemble des joueurs .Pour
mieux comprendre, on représente le jeu simultané à deux entreprises avec des
stratégies pures finies sous la forme de la matrice de gain ci-dessous.
Prix de SONY
Prix de Marché Guerre de Prix
Prix de Prix de Marché 20,20 -150,-150
HP Guerre de Prix -20,-150 -100,-100

(Matrice de gain)

On trouve 2 cas :
Cas 1 : Ici, Les deux entreprise s'ils pratiquent le prix du marché tout le monde
gagne.) Situation favorable.
Cas 2 : Si Les deux entreprise se lancent dans une guerre de prix, ou ils sont
différent de leurs décision tout le monde perds.) Situation n'est pas favorable.

11
1) Forme extensive :
Dans tous les jeux, les décisions peuvent être représentées par un arbre, dont
chaque nœud est associé au joueur qui décide. Chaque option constitue une
branche. Les gains de tous sont associés aux terminaisons ou feuilles de l'arbre.
Un joueur n’a toutefois pas besoin de savoir comment il est parvenu à un nœud :
Seul compte l'état présent du jeu, et les positions recherchées dans le futur. Lorsque
certains mouvements ne sont autorisés qu’après un événement donné, cet
événement n’est qu’un des éléments à matérialiser dans l’état présent du jeu et n'a
pas besoin de faire partie d'un historique.

Une forme extensive de jeu est un arbre de décision décrivant les actions
possibles des joueurs à chaque étape du jeu, la séquence de tours de jeu des
joueurs, ainsi que l'information dont ils disposent à chaque étape pour prendre
leur décision.
Cette information est représentée sous forme d'ensembles d'information qui
forment une partition des nœuds de l'arbre, chaque classe de la partition
contenant les nœuds non distinguables par le joueur à une étape du jeu. Si ces
classes sont des singletons, c’est-à-dire que chacune est constituée d'un seul
nœud de l'arbre du jeu, le jeu est dit à information parfaite, ce qui signifie
que chaque joueur sait à tout moment où il se situe dans l'arbre du jeu.
Dans le cas contraire, le jeu est dit à information imparfaite. L'information
imparfaite est représentée sous la forme d'un joueur non rationnel : la « Nature »,
joueur qui prend aléatoirement certaines décisions à telle ou telle étape du jeu,
orientant la suite du jeu vers une certaine sous-barbe de l'arbre du jeu.

 La forme extensive avec formation parfaite :


Pour illustrer cette situation, considérons le cas d’un duopole ou deux
entreprises A et B produisent et vendent un bien identique et se demandent si
elles doivent entreprendre une campagne de publicité ou non. Chaque firme
sera par conséquent affectée par la décision de l’autre. Les différents résultats
du jeu sont présentés dans le schéma suivant:

12
100,100
b1

B
b2 750,250

a1

250,750
A b1
a2 B
b2 500,500

Schéma n°1
L’arbre ci-dessous est la forme extensive du jeu représentant les gains que
les entreprises A et B obtiendront en entreprenant une compagne de
publicité ou non. Le jeu commence au sommet représenté par un gros point
et constitue par la même le choix initial effectué par le première entreprise
dont on suppose qu’elle s’agit de l’entreprise A. les deux premieres
branches de l’arbre représentent ses deux possibilités d’action « faire la
publicité : a1 » ou « a2 : ne pas faire de publicité ». Au bout de chacune de
ces deux branches apparaissent des nœuds à partir desquels l’entreprise B
peut à son tour choisir entre deux actions « faire la publicité : b1 » ou « ne
pas faire : b2 », après avoir pris de connaissance de la décision de A.
lorsque l’entreprise B fait son choix, les jeux s’arrête et les branches de
l’arbre se terminent par des nombres représentent les gains ou payement
reçus par chaque entreprise pour toutes les séquences du jeu. Ces gains sont
donnés dans l’ordre d’intervention de chaque entreprise. Par exemple, si les
stratégies choisies par les deux entreprises sont (a2, b2), c'est-à-dire
qu’aucune entreprise ne désire faire de publicité, chacune aura un bénéfice
de 500. Par contre si l’entreprise A décidé de faire la publicité alors que B
refuse, les stratégies (a1, b2 ou inversement), alors l’entreprise A
augmentera ses profits de 50% (750). Les stratégies de l’entreprise B sont
dans ce cas conditionnelles à celle de A. dans ce jeu séquentiel on a

13
supposé que B ne prend sa décision qu’après avoir pris connaissance de
l’action entreprise par A. Dans ce cas, en parle
de jeu dynamique à information parfaite car lorsque B décide de son action,
elle sait si A a choisi de faire la publicité ou non.

 Forme extensive avec formation imparfaite :


Dans certains cas, le second joueur ne connaît pas la décision du joueur 1 au
moment où il prend sa décision. Dans un tel jeu, l’information est « complète »
mais « imparfaite ».

b1 100,100

a1 b2
750,250

A B
b1 250,750

a2
b2 500,500

Schéma n° 2

La surface hachure indique que le second joueur ne connaît pas la decision du


joueur. C’est comme s’il se trouvait dans la situation d’un jeu simultané.

14
IV –le dilemme du prisonnier
Quelque part, un crime est commis et la police arrête deux suspects. La
police est certaine que ces deux hommes sont impliqués dans le crime, mais n'ont
aucune preuve. L'un des policiers a eu alors une idée. Il décide de mettre les
prisonniers dans des cellules séparées et leur fait la proposition suivante: Ils ont
le choix entre dénoncer leur complice et passer moins de temps en prison ou ils
peuvent tous deux garder le silence.

Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les deux
prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux parle et
l'autre garde le silence, le mouchard sera libre et l'autre ira en prison pour 10 ans.
Si les deux prisonniers se dénoncent mutuellement, alors ils iront en prison pour
8 ans (et non 10 ans, car ils auront aidé la justice tous les deux).

Nous pouvons présenter ces informations sous forme de tableau :

P1 Silence P1 Dénonce
P2 Silence 1,1 0,10
P2 Dénonce 10,0 8,8

Ce tableau s'appelle une matrice où nous voyons tous les résultats possibles
pour les deux "joueurs" (les prisonniers) impliqués dans ce jeu. Le premier nombre
est toujours le résultat pour le premier prisonnier (P1) et le nombre après la virgule
est le résultat pour le second prisonnier (P2).

15
En analysant la situation d’interdépendance de chacun des prisonniers, il est
évident que pour eux, la meilleure solution est d’avouer le crime en espérant que
l’autre niera. Il y a donc une interdépendance compétitive ou il y aura un gagnant
et un perdant, sauf que si les deux prisonniers adoptent le même schéma de
réflexion alors ils se retrouvent dans une relation de perdant- perdant.
Tout cela est un problème de confiance, que se portent les deux prisonniers.
Mais s’ils identifient tous les deux qu’il y a une solution gagnant- gagnant, il y
aura donc une interdépendance coopérative.
Imaginons que nous soyons P1. Nous sommes assis dans notre cellule,
réfléchissant à ce qu'il faut faire. Nous ignorons ce que fera P2 et nous n'avons
aucun moyen de communiquer. Si P2 nous dénonce, alors il est préférable pour
nous de le dénoncer également. Si P2, ne nous dénonce pas, alors notre meilleur
choix est aussi de le dénoncer. Dans les deux cas, peu importe ce que choisit P2,
le dénoncer vous permet de réduire le temps que vous passerez en prison.
Pour P2, la situation est exactement la même et il aura intérêt à nous dénoncer
pour les mêmes raisons. Certes, P1 peut penser : "Peut-être que je ne devrais rien
dire, si P2 fait de même, nous serons libres dans 1 an". Mais si P2 décide de parler,
vous irez en prison pour 10 ans ! Avez-vous envie de prendre ce risque ? En
général, non.
Aussi, à la fin du "jeu", les deux prisonniers écoperont de 8 ans de prisons.
Cette situation s'appelle l'équilibre de Nash, d'après le nom du célèbre
mathématicien John Forbes Nash. Lorsque cet équilibre est atteint, aucun joueur
ne peut ajuster sa stratégie unilatéralement pour en tirer profit. C'est exactement ce
qui se passe pour nos deux prisonniers. Imaginons que nous soyons sur le point
d'équilibre de Nash, les deux prisonniers se dénoncent et vont en prison pour 8 ans.
P1 peut changer sa stratégie et garder le silence, mais il ira en prison pour 10 ans
et n'aura rien gagné. La situation est la même pour P2. Aucun changement
unilatéral de stratégie ne peut profiter à ces "joueurs".

16
V- L’équilibre du jeu
- 1) Stratégie dominante :

Le concept de stratégie est fondamental dans la théorie des jeux .une stratégie est
la description parfaite et complète de la manière dont une joueur réagit en présence
de chaque circonstance. Les issues qui découlent de l’intersection des couples de
stratégie sont consignées à l’intérieur d’une matrice de gains.

Entreprise B
Produire plus Produire moins
Entreprise Produire plus 12 ,22 11 ,32
A Produire moins 22,18 20,27
(Matrice de gain)
Supposons d’abord que entreprise a entamé le jeu et B réagit ensuite .Si entreprise
A choisi la stratégie produire plus, le meilleur choix pour B est celui de la stratégie
produire moins, puisqu’ elle lui permet de gagner «32 » au lieu de « 22 » avec la
stratégie produire plus. Si par contre, A choisi la stratégie produire moins, B a
intérêt à répondre en utilisant la stratégie produire moins qui lui rapporte « 27 » au
lieu de « 18 ». On constate alors que l’entreprise B réalise le meilleur gain en
utilisant la stratégie produire moins quelle que soit la stratégie utilisée par
l’entreprise A. on dit alors que la stratégie produire moins est une stratégie
dominante pour l’entreprise B car elle constitue sa meilleure réponse possible à
toutes les stratégies de A.
De même, lorsque B entame le jeu et choisit d’abord la stratégie produire plus,
l’entreprise A a intérêt à choisir la stratégie produire moins qui lui rapporte « 22 »
au lieu de « 12 » avec produire plus. Dans le cas où l’entreprise B choisit la
stratégie produire moins, la meilleure réponse pour A est encore celle avec la
stratégie produire moins, qui lui permet de gagner « 20 » au lieu de « 11 ». On

17
constate là aussi que la stratégie produire moins est une stratégie dominante pour
l’entreprise A, puisque quoi que fasse l’entreprise B, elle réalise le meilleur gain
avec cette stratégie.
On constate dans cet exemple, que les deux entreprises ont la même stratégie
dominante : toute les deux doivent produire moins. Dans ce cas, on dit que le
résultat final du jeu est équilibre stable pour les deux entreprises et on l’appelle
équilibre en stratégie dominante.

-2) Equilibre de Nash en stratégie pure :


Soit un jeu à 2 joueurs avec un nombre fini de stratégies. Considérons que
chaque joueur :
 optimise et poursuit son intérêt individuel: la rationalité ;
 choisit une stratégie une fois pour toutes, c’est-à-dire que chaque agent
effectuait un seul choix et s’y tenait: la stabilité.
La matrice des paiements suivante représente les paiements dont bénéficient
les joueurs A et B pour chaque combinaison de stratégies choisies.

Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit droite,
les gains pour A sont 0 ou 1. Cela signifie que quand B choisit gauche, A préfère
haut et quand B choisit droite, A préfère bas. Le choix optimal de A dépend donc
de ce qu’il croit que B fera.
La stratégie (haut, gauche) est un équilibre de Nash. En effet, si A choisi haut,
la meilleure chose que B puisse faire, c’est choisir gauche puisque son gain est 1
s’il choisit gauche et 0 s’il choisit droite.

18
Nous dirons qu’une paire de stratégies est un équilibre de Nash1 si le choix
de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre façon de définir un équilibre de Nash est une situation dont personne
n’a intérêt à dévier individuellement, sachant la stratégie de l’autre. Ne pas
dévier individuellement veut dire que les individus font un choix optimal qui
maximise leur utilité compte tenu de la stratégie de l’autre. L’autre fait le même
raisonnement compte tenu de la stratégie du premier joueur.

Exemple 1
Le concept d’équilibre de Nash montre clairement qu’il s’agit simplement
d’une généralisation de l’équilibre de Cournot. Dans le cas de l’équilibre de
Cournot, la variable de décision est la quantité d’output produite qui est une
variable continue et chaque firme choisit l’output qui maximise son profit compte
tenu du choix de l’autre firme.
En effet, lorsque le concurrent augmente sa production, la « moins mauvaise
solution » consiste, pour la firme, à diminuer la sienne : ceci limite la baisse du
prix due à la hausse de la production du concurrent, sans nécessairement éviter la
diminution de la recette totale, et permet de diminuer le coût de production.

Exemple 2
L’équilibre de Bertrand, également est un équilibre de Nash avec des
stratégies en prix. Chaque firme choisit le prix qui maximise son profit, compte
tenu du choix qu’elle pense que l’autre firme fera.

Limites de l’équilibre de Nash en stratégie pure :

 Tout d’abord, un jeu peut avoir plus qu’un équilibre de Nash. En fait, les
choix (bas, droite) correspondent également à un équilibre de Nash.
 Le second est que pour certains jeux, de tels équilibres n’existent pas.

1
John F. Nash junior, né en 1928, a reçu le prix Nobel en 1994 avec ReinhartSelten et John Harsanyi pour la théorie des
jeux non coopératifs.

19
3. Les stratégies mixtes :
A. Equilibre de Nash en stratégie mixte :
Certains jeux peuvent ne pas avoir d’équilibre de Nash ou en avoir plusieurs. Dans
ces deux situations, il y a donc indétermination. Afin de contourner ce De
difficulté, il a été proposé de faire intervenir les probabilités au moment de la prise
de décision, plutôt que de retenir une action, les joueurs affectent des probabilités
aux actions parmi les lesquelles ils doivent choisir. On dit alors qu’ils font appel à
des stratégies mixtes plutôt qu’à des stratégies pures (probabilité à Distribuer à une
action est égale à 1).
Le recours à une approche probabiliste pose le problème du critère d’évaluation
des gains, qui ne sont plus certains. Problème qui est résolu en théorie des jeux
comme en théorie de la décision par l’adoption du principe de l’espérance
mathématique. Il s’agit de pondérer les gains associés aux déférentes issues par la
probabilité de survenance de celles-ci.
Le principal argument avancé pour justifier le recours aux stratégies mixtes est
d’ordre mathématique. Nash a montré que tout jeu à information complète et
imparfaite comporte au moins un équilibre en stratégies mixtes. L’équilibre
envisagé est un équilibre de Nash.
Ainsi accepter les stratégies mixtes lève l’hypothèse de l’éventuel non existence
d’un équilibre en information complète et imparfaite, et permet de justifier
l’importance accordée aux équilibres. Cependant, la prise en compte des stratégies
mixtes n’est pas sans inconvénients. Elle ne peut entraîner qu’une augmentation
du nombre d’équilibres.
Exemple :
Reprenons le jeu dans lequel deux entreprises A et B ont la possibilité de
lancer un nouveau produit pour lequel les débouchés sont limités, sans qu’il n’y
ait de compromis
Entre elles si toutes deux décident de produire.la matrice des gains pour les deux
entreprises devraient ressembler à celle présentée dans le tableau 1.

20
Entreprise
B
Produit Ne produit pas
Entreprise Produit 3, 1 1, 3
A Ne produit pas 0, 5 4, 2

Tableau 1 : Matrice de gain d’un jeu stratégie produit

1) Quels sont les équilibres de Nash en stratégies pures ?


2) Montrer qu’il existe aussi un équilibre de Nash en stratégie mixtes ?

 Résoudre le jeu :
Dans ce cas particulier, IL n’y a pas d’équilibre de Nash.
Il n’y a pas de solution ‘naturelle’ au jeu.
Ayant observé les comportements de deux firmes, on peut considérer que
Enterprise B choisira la stratégie produit et ne produit pas avec la même
probabilité 1/2.
Enterprise A choisira la stratégie produit avec une probabilité 0,6 et la stratégie ne
produit pas avec une probabilité égale à :
1-0,6= 0,4
Soit la matrice prenant en compte les probabilités des stratégies.

Entreprise
B
Produit Ne produit
(q=0,5) pas (q=0,5)
Entreprise Produit (p=0,6) 3, 1 1, 3
A Ne produit pas 0, 5 4, 2
(p=0,4)

21
On calcul ainsi les espérances de gains et on les compare.
La valeur espérée d’une stratégie est. Le gain que l’on s’attend à recevoir
pondéré par les probabilités de choix de l’autre joueur.
 Si Enterprise A utilisé la stratégie mixte P=0,6 et (1-p)=0,4, alors le gain
espéré de Enterprise B associé à ses stratégies pures est :
EGB (produit) = (0,6 x 1) + (0,4 x 5) = 2,6
EGB (ne produit pas) = (0,6 x 3) + (0,4 x 2) = 2,6
Enterprise B est indiffèrent entre ses deux stratégies produit et ne produit pas.
Pour Enterprise A :
EGA (produit) = (0,5 x 3) + (0,5 x 1) = 2
EGA (ne produit pas) = (0,5 x 0) + (0,5 x 4) = 2
Enterprise A est aussi donc indifférent entre ses deux stratégies pures mais
comme Enterprise A sait que Enterprise B jouera ne produit pas, elle va choisir
ne produit pas car elle gagnera Si Enterprise B choisira de jouer produit
l’Enterprise A va choisir la stratégie produit puisque elle gagnera 3.
La solution en stratégie mixte est donc (ne produit pas, ne produit pas) et
(Produit, produit) L’imperfection de l’information rend l’analyse nettement
compliquée. Il y a très souvent une multiplicité d’équilibres de Nash possibles.
Pour les sélectionner, on a recours à des concepts de solutions plus complexes,
comme l’équilibre bayé sien ou l’équilibre séquentiel qui permettent de choisir
entre les équilibres de Nash.

B. Limites des stratégies mixtes :


Les stratégies mixtes soulèvent un certain nombre de problèmes :
Ce sont tout d’abord des équilibres de Nash au sens faible. Un changement
unilatéral de stratégie n’aurait pas augmenté les gains, certes, mais il ne les aurait
pas diminués non plus. Rien n’incite un joueur quelconque à retenir sa stratégie
d’équilibre (lorsque les autres l’ont fait) ==>voir l’exemple précédents. Mais

22
évidemment, il suffit qu’un seul joueur ne retienne pas sa stratégie d’équilibre
pour que celui‐ci ne se réalise pas.
Il peut arriver qu’il y ait des équilibres de Nash au sens faible avec des
stratégies pures mais cela est plutôt exceptionnel, alors que cela est toujours le
cas avec les équilibres en stratégies mixtes.
Se pose également la question de savoir quelle signification donner au fait
que les joueurs annoncent des probabilités d’actions, alors que le but de
modélisateur est d’obtenir un ou des résultats précis.
En outre, dès que l’annonce est faite, le jeu est terminé, quelle que soit
l’issue. Pourtant derrière la notion de probabilité, il y a l’idée de répétition qui
permet de se faire une opinion sur le caractère plus
Ou moins probable d’un événement.

4)-La stratégie de Maximin :

Le concept d’équilibre de Nash repose très fortement sur l’hypothèse de


rationalité de l’individu. Le choix stratégique de chaque joueur ne dépend pas
seulement de sa propre rationalité, mais également de celle de ses adversaires.
C’est ce qui peut constituer une limite de ce concept, comme l’illustre l’exemple
dans le tableau 1.
L’entreprise 2
N’investit pas Investit
L’entreprise N’investit pas 0,0 -10,10
Investit -100,0 20,10
1
Tableau 1 : La stratégie de Maximin.

Dans ce jeu, les entreprises se font concurrence en vendant des logiciels de


cryptage de fichiers. Parce que les deux entreprises utilisent la même technique
de cryptage, les fichiers cryptés par le logiciel produit par l’autre entreprise un
avantage pour le consommateur. Cependant, l’entreprise 1 possède une part du
marché bien plus importante que l’entreprise 2. (Elle est entrée sur le marché

23
avant sa concurrente et son logiciel possède une meilleure interface utilisateur)
chacune des deux entreprise se demande à présent si elle doit investir ou non
dans une nouvelle méthode de cryptage.

Elle faut notée que l’entreprise 2 a une stratégie dominante : elle a intérêt à
investir puisque, quoique fasse sa concurrente ses gains sont plus important en
investissant. L’entreprise 1 s’attende donc à ce que l’entreprise 2 investisse. Dans
ce cas, le mieux qu’elle puisse faire est investir également (elle gagnera alors 20
millions d’euros) plutôt que de ne pas investir (et perdre 10 millions d’euros). Il
apparait clairement que la paire de stratégie (investir, investir) est dans ce jeu un
équilibre de Nash, il est facile de vérifier que cet équilibre est unique.

Mais les gestionnaires doivent être absolument sûrs que ceux de l’entreprise 2
ont parfaitement compris le jeu et sont rationnels. Si par malheur l’entreprise 2 se
trompait est décidait de ne pas investir, ce serait extrêmement coûteux que
l’entreprise 1 (les méthodes de cryptage devenant alors incompatibles, cela
créerait de la confusion chez le consommateur, et l’entreprise 1, parc qu’elle
domine une grand part du marché, perdait 100 millions d’euros)

Une telle stratégie est appelé stratégie de Maximin, car elle consiste à
maximiser le gain minimum pouvant être obtenue. Si les deux entreprise en des
stratégies du type Maximin il en résultera que l’entreprise 1 n’investira pas, alors
qu’au contraire l’entreprise 2 investira la stratégie du Maximin est peut risquer
mais ne permet pas de maximiser les profits. (L’entreprise 1, par exemple, perd
10 million au lieu de gagner 20 millions). Remarquons également que si
l’entreprise 1 savait de façon certaine que l’entreprise 2 adoptait une stratégie
Maximin elle aurait préféré investir (est gagner 20 millions d’euros) plutôt que
de suivre sa propre stratégie Maximin qui était de ne pas investir.

24
Conclusion

La théorie des jeux fournit un cadre d'analyse permettant d'étudier les situations
conflictuelles dans lesquelles les individus ou les firmes sont en interaction.
Lorsque peu de firmes dominent un marché ou bien lorsque des pays concluent
un accord sur les politiques commerciales, les agents concernés (individus,
firmes, États) doivent prendre en compte les réactions des autres et anticiper leurs
propres décisions. Il s’agit alors d'analyser la manière dont les agents
coordonnent ou peuvent coordonner leurs décisions dans différentes
configurations.

25
Bibliographie

 Yildizoglu, Introduction à la théorie des jeux, Dunod 2004.

 Umbhaver, Théorie des jeux, Vuilbert 2004.

 Rasmussen, Jeux et info, De Boeck 2004.

 EMMANUELLE BENICOURT, BERNARD GUERRIEN: « La


théorie économique néoclassique : microéconomie, macroéconomie et
théorie des jeux », édition la découverte, 2008.

VARIAN, Hal R.(1996). Intermediate Microeconomics, 4 èm ed., W.


W. Norton and Company, New york/London.

 http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux

 http://www.cril.univartois.fr/~konieczny/enseignement/TheorieDesJe
ux.pdf

 WWW.scholarvox.com

26

Vous aimerez peut-être aussi