Vous êtes sur la page 1sur 32

Facult des Sciences Juridiques, Economiques et

sociales

Expos sous le thme :


Plan
Introduction..3
I prsentation de la thorie des jeux.4-5
1. Historique
2. Dfinition
3. Hypothses
4. Elments des jeux
II typologie des jeux....6-11
1. Jeux coopratifs et non coopratifs
2. Jeux somme nulle et jeux somme positive
3. Jeux simultans et jeux squentiels
4. Jeux finis
5. Jeux rpts
6. Jeux information complte et incomplte
IIIForme des jeux de stratgie..12-13
1. Forme extensive
2. Forme normale
IV le dilemme du prisonnier..15-16
V lquilibre des stratgies.17-24
1. Equilibre des stratgies dominantes
2. Equilibre de Nash en stratgie pure
3. Equilibre de Nash avec stratgie mixte
4. Stratgie Maximin

Conclusion25
Bibliographie

3
Introduction

La thorie des jeux est une approche distincte et interdisciplinaire du


comportement humain, elle a t fonde par les grands mathmaticiens John Von
Neuman et Oskar Morgenstern dans leur livre publi en 1944, intitul Theory
of Games and EconomicBehavior (la thorie des jeux et comportement
conomique).
Lorsque des personnes interagissent entre elles, on peut dire quil y a un jeu.
Lorsquun commerant dtermine le prix dun bien, il joue un jeu avec ses
clients et ses concurrents. La ngociation des salaires est un jeu entre le
patron, les employs et les syndicats. Napolon et Wellington jouaient un jeu
lors de la bataille de Waterlou tout comme Kroutchev et Kennedy lors de la crise
de Cuba.
Donc la thorie des jeux est prsente souvent en conomie, en management,
en politique, en sociologie, en situation de guerrel o des dcisions
complexes doivent tre prises.
Lobjet de cette thorie est dtudier les principes et rgles mathmatiques et
les mettre profit dans des situations de conflits lors dune interaction
stratgique entre plusieurs preneurs de dcisions (appels agents en conomie et
joueurs en thorie des jeux). Ces preneurs de dcisions interagissent dans le sens
o le sort de chacun dpend non seulement des dcisions quil prend mais
galement des dcisions prises par dautres preneurs de dcisions, donc le choix
optimal dpend gnralement de ce que font les autres.
Dans cette recherche, on va essayer en premier lieu de donner un cadre
thorique cette conception, puis parler des diffrents types et formes de jeux,
tudier le dilemme du prisonnier et enfin voquer la notion dquilibre de Nash.

4
I prsentation de la thorie des jeux

1. Historique

En 1938, mile Borel dveloppe, dans son ouvrage Applications aux


Jeux de Hasard , un thorme du minimax pour les jeux somme nulle
deux joueurs, c'est--dire les jeux dans lesquels ce que gagne l'un est perdu
par l'autre.
En 1944, La thorie des jeux devient un champ de recherche part entire
avec la publication de la Thorie jeux et du comportement
conomique (Theory of Games and EconomicBehavior) par John von
Neumann et Oskar Morgenstern
En 1950, John Nash dveloppe la notion d'quilibre de Nash qui gnralise
les travaux de Cournot.
En 1994, John Nash, Reinhard Selten et John Harsanyi reoivent le prix
Nobel d'conomie (prix de la Banque royale de Sude en sciences
conomiques en mmoire d'Alfred Nobel) pour leurs travaux sur la thorie
des jeux. Ce choix tmoigne de l'importance prise par la thorie des jeux
dans l'analyse conomique.

5
2. Dfinition

La thorie des jeux peut tre dnie comme ltude mathmatique des
Interactions Stratgiques entre plusieurs agents Rationnels.
Interaction : il y a plusieurs agents (appels aussi joueurs, "dcision makers",
etc...), et ils interagissent : le contentement (appel aussi paiement, gain, utilit,
bien-tre) de chacun ne dpend pas que de lui, mais aussi en partie des autres.
Stratgique : Les joueurs ont le choix entre plusieurs options.
Rationnel : un joueur ne joue pas nimporte comment, il cherche optimiser
son paiement.

3. Hypothses

Rationalit
Cest une hypothse fondamentale. En effet, chaque joueur cherche
maximiser ses gains. Le gain de chacun dpend autant des dcisions des autres
que de sa propre dcision. Il est donc ncessaire quil y ait anticipation de ce
que vont faire les autres et cela repose sur des croyances.
Information Complte
Chaque joueur connat tous les dtails du modle et peut se mettre la place
du modlisateur. Il sait que les autres savent quil sait, quils savent quil sait
quils savent, etc.

4. Elments des jeux


Lorsque lon dsire modliser des comportements conomiques faisant
apparaitre des interactions stratgiques sous la forme dun jeu, il est ncessaire de
dfinir prcisment ces lments :
Les joueurs
Les rgles
Les choix possibles: les stratgies
Rsultat: les gains ou pertes

6
II typologie des jeux
1. Jeux coopratifs et non coopratifs

Les jeux coopratifs

Les joueurs peuvent communiquer librement et passer entre eux des accords
qui les lient de faon contraignante.
Ils cherchent lintrt gnral suivi dun partage des gains entre tous les joueurs
(intelligence collective).
Jeux solidaires : les joueurs gagnent ou perdent tous ensemble (ils ne jouent pas
lun contre lautre).

Exemple: Le ct de conduite

Conduire du mme ct que les autres permet de se dplacer en relative


scurit (gain de 100).
Conduire dans le sens oppos rend un accident trs probable (gain 0).
On obtient la matrice suivante:

Conduire gauche Conduire droite

Conduire gauche 100 0

Conduire droite 0 100

Jeux non coopratifs

7
Les individus adoptent un comportement goste et opportuniste chaque
instant:
Absence de la communication entre les joueurs.
Les joueurs agissent selon le principe de rationalit conomique: chacun
cherche son intrt individuel.
Exemple :

Soit une entreprise 1 et une entreprise 2 ayant leur disposition les actions:
produire et ne pas produire :

E2 Produit Ne produit pas


E1
Produit (-3;-2) (10;0)
Ne produit pas (0;8) (0;0)

2. Jeux somme nulle et jeux somme positive

Jeux somme nulle (ou interdpendance comptitive)

Un jeu est somme nulle si la somme des gains est constante : somme gale
zro.
Dans ce type de jeu ce que gagne lun des joueurs lautre le perd.
Par exemple, les checs; le poker; la pierre, papier, ciseau sont des jeux somme
nulle.
Exemple : Jeu de matching :
Deux joueurs annoncent simultanment Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reoit 20 que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 2.

La matrice des gains J2 Pile Face est donc la suivante

J1
8
Pile (20;-20) (-20;20)
Face (-20;20) (20;-20)
Jeux somme non nulle (indpendance coopratifs)

Dit aussi jeux somme positive. Ils reprsentent les situations o les joueurs
peuvent potentiellement gagner sils parviennent cooprer ou coordonner
leurs stratgies.
Alors le rsultat dun tel jeu peut tre:
*(positif; positif): tous les joueurs sont gagnants.
*(ngatif; ngatif):tous les joueurs sont perdants.

Exemple:
Soit deux entreprises ont le choix dans leur politique de communication
entre lancer une compagne de publicit ou ne rien faire .

E2 Lancer la Ne rien faire


compagne
pub

E1
Lancer la (40;90) (60;50)
compagne
pub
Ne rien faire (25;140) (25;50)

3. Jeux simultans et jeux squentiels

9
Jeux squentiels

Il existe des jeux o les joueurs jouent lun aprs lautre: jeux squentiels.
Celui qui joue en premier est le leader , celui qui joue en deuxime est le
follower .
Le joueur dans ce cas peut savoir ce que lautre a jou avant de prendre sa
dcision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer linvestissement en capital de son concurrent
avant de prendre sa propre dcision.

Remarque:
Le duopole: une structure du march oligopolistique dans laquelle deux
entreprises offreuses font face une infinit de demandeurs.

Jeux simultans

Chaque joueur choisit son plan daction complet au dbut du jeu et une fois
pour toutes.
Le joueur ne connat pas les choix effectu par les autres joueurs donc il
doit prvoir les choix des autres.

Exemple: Le dilemme du prisonnier.

4. Jeux finis

On dit qu'un jeu est fini lorsque l'ensemble des stratgies de chacun des
joueurs est fini.

10
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux
stratgies possibles.

5. Jeux rpts

La rptition dun jeu, avec connaissance des rsultats intermdiaires,


change souvent fondamentalement son droulement (les meilleurs coups et la
conclusion).
Par exemple, il peut tre utile de prendre ponctuellement le risque de perdre
pour voir , tester les autres joueurs, et mettre en place des stratgies de
communication par les coups jous ( dfaut dautre moyen de communication).

6. Jeux information complte et incomplte :


Jeux information complte
On dit qu'un jeu est information complte si chaque joueur connat lors de
la prise de dcision :
ses possibilits d'action
les possibilits d'action des autres joueurs
Rsultats de la dcision qui sera prise
les motivations des joueurs

Jeux information incomplte

On dit quun jeu est information incomplte sil manque de linformation


(lorsquil ny a pas de connaissance des gains, ou de certaines rgles ).
On parle de jeu information parfaite dans le cas de jeu sous forme extensive, o
chaque joueur a une connaissance parfaite de toute l'histoire du jeu.
Un jeu information incomplte est aussi information imparfaite. Les jeux
information complte peuvent tre information imparfaite soit du fait de la
simultanit des choix des joueurs, soit lorsque des vnements alatoires sont
cachs certains joueurs.
La forme normale ou stratgique du jeu :

11
Le modle de jeux sou s forme stratgiqu e s upprim e la
structure s qu entielle de la pris e dcision. Quand elle e st
appliqu e des situation s dan s le squ elle s le s preneur s de
dci sion s jouent s qu entiellem ent, elle oblige s uppos er que
le s joueurs choisi s s e nt leur stratgie un e fois pour toute, ils sont
alors e ngag s dan s cette stratgie et n e peuvent pa s la modifi er
m e s ure que le jeu s e droule.

Cette modli sation e st toute s fois tr s utile pour dcrire des


s ituation s dan s le squelle s le s joueurs jouent e n m m e temps. Ce
jeu e st connu sou s le nom de la forme normale des jeux.

Donc La forme normale dun jeu e st tout simplem e nt lcriture


conden s e sou s la forme dun tableau. Ce tableau e st souvent
appel m atrice de gain ou m atrice de paiem ent. Cette forme de
pr s e ntation dun jeu permet de mieux comprendre la notion de
stratgie. E ll e dcrit le s stratgie s de len s e mble de s
joueurs . Pour mieux comprendre, on repr s e nte le jeu
s imultan deux e ntrepris e s av ec des stratgie s pure s fi nie s
sou s la forme de la m atrice de gain ci-de s sou s.

Prix de SONY
Prix de Gu erre de
March Prix

Prix de Prix de 20,20 -150,-150


HP March

Gu erre de -20,-150 -100,-100


Prix

(Matrice de gain)

12
On trouve 2 ca s :

Cas 1 : Ici, Le s deux e ntrepris e s 'il s pratiquent le prix du


m arch tout le monde gagne.) S itu ation favorable.

Cas 2 : S i Le s deux e ntrepris e s e lancent dan s u n e guerre de


prix, ou il s sont diffrent de leur s dci sion tout le monde perds.)
S ituation n' e st pa s favorable.

1) Forme extensive :
Dan s tous le s jeux, le s dcision s peuvent tre repr s e nt e s par
u n arbre, dont chaque n ud e st a s soci au joueur qui dcide.
Chaque option constitue un e branche. Le s gain s de tou s sont
a s soci s aux terminai son s ou feuille s de l'arbre.

Un joueur na toutefois pa s be soin de s avoir comm ent il e st


parvenu un n ud : S e ul compte l'tat pr s e nt du jeu, et le s
positions recherch e s dan s le futur. Lorsqu e certain s
mouvem ent s n e sont autoris s quapr s un v n em e nt donn ,
cet v n em e nt n e st quun des l m e nt s m atrialis er dan s
ltat pr s e nt du jeu et n' a pa s besoin de faire partie d'un
hi storique.

Un e forme exten sive de jeu e st un arbre de dci sion dcrivant


le s action s pos sible s de s joueurs chaqu e tape du jeu, la
s quence de tours de jeu des joueur s, ain si que l'information
dont ils dispos e nt chaque tape pour prendre leur dcision.

Cette information e st repr s e nt e sou s forme d'en s emble s


d'information qui forment une partition de s n ud s de l'arbre,
13
chaque cla s s e de la partition contena nt le s n ud s non
distinguable s par le joueur un e tape du jeu. S i ce s cla s s e s
sont des si ngleton s, cest--dire que chacune est constitue
d'un seul nud de l'arbre du jeu, le jeu est dit
information parfaite, ce qui signifie que chaque joueur
sait tout moment o il se situe dans l'arbre du jeu.
Dan s le cas contraire, le jeu e st dit information
imparfaite. L'information imparfaite e st repr s e nt e sou s la
forme d'un joueur non rationnel : la Nature , joueur qui prend
al atoirem ent certain e s dcision s telle ou telle tape du jeu,
orientant la s uite du jeu vers u n e certain e sou s-barbe de l'arbre
du jeu.

La forme extensive avec formation parfaite :

Pour illustrer cette situation, considrons le ca s dun duopole


ou deux entreprises A et B produis e nt et vendent un bien
identique et s e dema ndent s i elle s doivent entreprendre
une campagne de publicit ou non. Chaqu e fi rme s era
par cons qu ent aff ecte par la dcision de lautre. Le s
diffrents rsultats du jeu sont prs e nt s dan s le sch m a
s uiva nt:

100,100
b1

B
b2 750,250

a1

250,750
A b1
a2 B
b2 500,500

Schma n1

14
Larbre ci-de s sou s e st la forme exten siv e du jeu
repr s e ntant le s gain s que le s e ntrepris e s A et B
obtiendront e n e ntreprena nt un e compagne de publicit ou
non. Le jeu comm ence a u somm et repr s e nt par u n gros
point et constitue par la m m e le choix initial eff ectu par le
premire e ntrepris e dont on s uppose quelle s agit de
lentrepris e A. le s deux premiere s branch e s de larbre
repr s e ntent s e s deux pos sibilit s daction faire la
publicit : a 1 ou a 2 : n e pa s faire de publicit . Au bout
de chacun e de ce s deux branch e s apparai s s e nt des n ud s
partir de squel s lentrepris e B peut son tour choisir e ntre
deux action s faire la publicit : b 1 ou n e pa s faire :
b2 , apr s avoir pris de connai s s a nc e de la dcision de A.
lorsque lentrepris e B fait son choix, le s jeux s arrte et le s
branche s de larbre s e termine nt par de s nombre s
repr s e ntent le s gain s ou payem e nt reu s par chaqu e
e ntrepris e pour toute s le s s qu e nce s du jeu. Ces gain s sont
donn s dan s lordre dintervention de chaqu e e ntrepris e.
Par exemple, si le s stratgie s choisie s par le s deux
e ntrepris e s sont (a 2, b2 ), c'e st--dire quaucune e ntrepris e
n e dsire faire de publicit, chacun e a ura un bn fi ce de
500. Par contre si lentrepris e A dcid de faire la publicit
alors que B refus e, le s stratgie s (a 1, b2 ou inver s em e nt),
alors lentrepris e A augm entera s e s profits de 50% (750).
Le s stratgie s de lentrepris e B sont dan s ce ca s
conditionnelle s celle de A. dan s ce jeu s qu e ntiel on a
s uppos que B n e prend s a dci sion quapr s avoir pris
connai s s a nc e de laction e ntrepris e par A. Dan s ce ca s, e n
parle
de jeu dynamique information parfaite car lorsqu e B
dcide de son action, elle s a it si A a choisi de faire la
publicit ou non.
Forme extensive avec formation imparfaite :

15
Dan s certain s ca s, le s econd joueur n e connat pa s la dcision du
joueur 1 a u moment o il prend s a dcision. Dan s un tel jeu,
linformation e st complte m ai s imparfaite .

b1 100,100

a1 b2
750,250

A B
b1 250,750

a2
b2 500,500

Schma n 2

La surface hachure indique que le second joueur ne connat pas


la decision du joueur. Cest comme sil se trouvait dans la
situation dun jeu simultan.

IV le dilemme du prisonnier

16
Quelque part, un crime est commis et la police arrte deux suspects. La
police est certaine que ces deux hommes sont impliqus dans le crime, mais n'ont
aucune preuve. L'un des policiers a eu alors une ide. Il dcide de mettre les
prisonniers dans des cellules spares et leur fait la proposition suivante: Ils ont
le choix entre dnoncer leur complice et passer moins de temps en prison ou ils
peuvent tous deux garder le silence.

Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les deux
prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux parle et
l'autre garde le silence, le mouchard sera libre et l'autre ira en prison pour 10 ans.
Si les deux prisonniers se dnoncent mutuellement, alors ils iront en prison pour
8 ans (et non 10 ans, car ils auront aid la justice tous les deux).

Nous pouvons prsenter ces informations sous forme de tableau :

P1 Silence P1 Dnonce
P2 Silence 1,1 0,10
P2 Dnonce 10,0 8,8

Ce tableau s ' appelle un e matrice o nou s voyon s tou s le s


rsultats pos sible s pour le s deux "joueurs " (le s prisonnier s)
impliqu s dan s ce jeu. Le premier nombre e st toujours le
rsultat pour le premier prisonnier (P1) et le nombre apr s la
virgule e st le rsultat pour le s econd prisonnier (P2).

17
E n a n alys a nt la situation dinterdpendance de chacun des
prisonnier s, il e st vident que pour eux, la m eilleure solution e st
davouer le crim e e n e sp ra nt que lautre ni era. Il y a donc u n e
interdpendance comptitive ou il y a ura u n gagna nt et un
perdant, s a uf que si le s deux prisonnier s adoptent le m m e
sch m a de rfl exion alors il s s e retrouvent dan s u n e relation de
perdant- perdant.
Tout cela e st un problm e de confi ance, que s e portent le s deux
prisonnier s.
Mais s il s identifi ent tous le s deux quil y a u n e solution gagna nt-
gagna nt, il y a ura donc un e interdpenda nce cooprative.
Imaginon s que nou s soyon s P1. Nous somm e s a s si s dan s
notre cellule, rfl chi s s a nt ce qu'il faut faire. Nous ignorons ce
que fera P2 et nou s n'avon s aucun moyen de communiqu er. S i
P2 nou s dnonce, alors il e st prfrable pour nou s de le
dnoncer galem e nt. S i P2, n e nou s dnonce pa s, alors notre
m eilleur choix e st au s si de le dnoncer. Dan s le s deux ca s, peu
importe ce que choisit P2, le dnoncer vou s permet de rduire le
temps que vous pa s s erez e n prison.
Pour P2, la situation e st exactem e nt la m m e et il aura
intrt nous dnoncer pour le s m m e s raison s. Certe s, P1 peut
pen s er : "P eut-tre que je n e devrai s rien dire, si P2 fait de
m m e, nou s s eron s libre s dan s 1 a n ". Mais s i P2 dcide de
parler, vous irez e n prison pour 10 a n s ! Avez-vou s e nvie de
prendre ce risque ? E n gn ral, non.
Aus si, la fi n du "jeu ", le s deux prisonnier s coperont de 8
a n s de prison s. Cette situation s ' appelle l'quilibre de Nash,
d'apr s le nom du cl bre m ath m aticien John Forbe s Nash.
Lorsque cet quilibre e st atteint, aucun joueur n e peut aju ster s a
stratgie unilatral em e nt pour e n tirer profit. C'e st exactem ent
ce qui s e pa s s e pour no s deux prisonnier s. Imaginon s que nou s
soyon s s ur le point d'quilibre de Nash, le s deux prisonnier s s e
dnoncent et vont e n prison pour 8 a n s . P1 peut cha nger s a
stratgie et garder le s ilence, mai s il ira e n prison pour 10 a n s et
18
n' aura rien gagn. La situ ation e st la m m e pour P2. Aucun
cha ngem e nt unilatral de stratgie n e peut profiter ce s
"joueur s ".

V- Lquilibre du jeu
- 1) Stratgie dominante :

Le concept de stratgie e st fondam e ntal dan s la thorie des


jeux .un e stratgie e st la de scription parfaite et complte de la
m a nire dont un e joueur ragit e n pr s e nce de chaqu e
circon sta nce. Le s is s u e s qui dcoulent de linters ection des
couple s de stratgie sont consign e s lintrieur dune m atrice
de gain s.

E ntrepris e B
Produire Produire moin s
plu s
E ntrepris e Produire plus 12 ,22 11 ,32
A Produire moin s 22,18 20,27
(Matrice de gain)
S upposon s dabord que e ntrepris e a e ntam le jeu et B ragit
e n s uite . S i e ntrepris e A choisi la stratgie produire plu s, le
m eilleur choix pour B e st celui de la stratgie produire moin s,
pui squ elle lui permet de gagner 32 au lieu de 22 av ec la
19
stratgie produire plus. S i par contre, A choisi la stratgie
produire moin s, B a intrt rpondre e n utilisa nt la stratgie
produire moin s qui lui rapporte 27 au lieu de 18 . On
constate alors que lentrepris e B rali s e le m eilleur gain e n
utilisa nt la stratgie produire moin s quelle que soit la stratgie
utilis e par lentrepris e A. on dit alors que la stratgie produire
moin s e st un e stratgie domina nte pour lentrepris e B car elle
constitue s a m eilleure rpon s e pos sible toute s le s stratgie s
de A.
De m m e, lorsque B e ntam e le jeu et choisit dabord la stratgie
produire plus, lentrepris e A a intrt choisir la stratgie
produire moin s qui lui rapporte 22 au lieu de 12 av ec
produire plus. Dan s le ca s o lentrepris e B choisit la stratgie
produire moin s, la m eilleure rpons e pour A e st e ncore celle
avec la stratgie produire moin s, qui lui perm et de gagner
20 au lieu de 11 . On constate l a u s si que la stratgie
produire moin s e st un e stratgie domina nte pour lentrepris e A,
pui sque quoi que fa s s e lentrepris e B , elle rali s e le m eilleur
gain av ec cette stratgie.
On con state dan s cet exemple, que le s deux e ntrepris e s ont la
m m e stratgie domina nte : toute le s deux doivent produire
moin s. Dan s ce ca s, on dit que le r sultat fi nal du jeu e st
quilibre stable pour le s deux e ntrepris e s et on lappelle
quilibre e n stratgie domina nte.

-2) Equilibre de Nash en stratgie pure :


Soit un jeu 2 joueurs avec un nombre fini de stratgies. Considrons que
chaque joueur :
optimise et poursuit son intrt individuel: la rationalit ;

choisit une stratgie une fois pour toutes, cest--dire que chaque agent
effectuait un seul choix et sy tenait: la stabilit.

20
La matrice des paiements suivante reprsente les paiements dont bnficient
les joueurs A et B pour chaque combinaison de stratgies choisies.

Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit droite,
les gains pour A sont 0 ou 1. Cela signifie que quand B choisit gauche, A prfre
haut et quand B choisit droite, A prfre bas. Le choix optimal de A dpend donc
de ce quil croit que B fera.
La stratgie (haut, gauche) est un quilibre de Nash. En effet, si A choisi haut,
la meilleure chose que B puisse faire, cest choisir gauche puisque son gain est 1
sil choisit gauche et 0 sil choisit droite.
Nous dirons quune paire de stratgies est un quilibre de Nash1 si le choix
de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre faon de dfinir un quilibre de Nash est une situation dont personne
na intrt dvier individuellement, sachant la stratgie de lautre. Ne pas dvier
individuellement veut dire que les individus font un choix optimal qui maximise
leur utilit compte tenu de la stratgie de lautre. Lautre fait le mme
raisonnement compte tenu de la stratgie du premier joueur.

Exemple 1
Le concept dquilibre de Nash montre clairement quil sagit simplement
dune gnralisation de lquilibre de Cournot. Dans le cas de lquilibre de
Cournot, la variable de dcision est la quantit doutput produite qui est une
variable continue et chaque firme choisit loutput qui maximise son profit compte
tenu du choix de lautre firme.
En effet, lorsque le concurrent augmente sa production, la moins mauvaise
solution consiste, pour la firme, diminuer la sienne : ceci limite la baisse du

1John F. Nash junior, n en 1928, a reu le prix Nobel en 1994 avec ReinhartSelten et John
Harsanyi pour la thorie des jeux non coopratifs.

21
prix due la hausse de la production du concurrent, sans ncessairement viter la
diminution de la recette totale, et permet de diminuer le cot de production.

Exemple 2
Lquilibre de Bertrand, galement est un quilibre de Nash avec des
stratgies en prix. Chaque firme choisit le prix qui maximise son profit, compte
tenu du choix quelle pense que lautre firme fera.

Limites de lquilibre de Nash en stratgie pure :

Tout dabord, un jeu peut avoir plus quun quilibre de Nash. En fait, les
choix (bas, droite) correspondent galement un quilibre de Nash.
Le second est que pour certains jeux, de tels quilibres nexistent pas.

3. Les stratgies mixtes :


A. Equilibre de Nash en stratgie mixte :
Certain s jeux peuvent n e pa s avoir dquilibre de Nash ou e n
avoir plusieur s. Dan s ce s deux situation s, il y a donc
indtermination. Afi n de contourner ce De dicult, il a t
propos de faire intervenir le s probabilit s au mom ent de la
pris e de dci sion, plutt que de retenir un e action, le s joueur s
affectent des probabilit s aux action s parmi le s le squ elle s il s
doivent choisir. On dit alors quils font appel des stratgie s
mixte s plutt qu de s stratgie s pure s (probabilit Distribu er
u ne action e st gale 1).
Le recours un e approche probabiliste pos e le problm e du
critre dvaluation des gain s, qui n e sont plu s certain s.
Problm e qui e st r solu e n thorie de s jeux comm e e n thorie
de la dci sion par ladoption du principe de le spra nce

22
m ath m atique. Il s agit de pondrer le s gain s a s soci s a ux
dfrente s i s su e s par la probabilit de s urven a nce de celle s-ci.
Le principal argum e nt ava nc pour justifi er le recours a ux
stratgie s mixte s e st dordre m athm atiqu e. Nash a montr que
tout jeu information complte et imparfaite comporte au moin s
u n quilibre e n stratgie s mixte s. Lquilibre e nvis ag e st u n
quilibre de Nash.
Ain si accepter le s stratgie s mixte s lve lhypoth s e de
lv entuel non existence dun quilibre e n information complte
et imparfaite, et perm et de ju stifi er limportance accorde aux
quilibres. Cependant, la pris e e n compte des stratgie s mixte s
ne st pa s s a n s inconvnie nts. E ll e n e peut e ntraner quun e
a ugm e ntation du nombre dquilibre s.
Exemple :
R eprenon s le jeu dan s lequ el deux e ntrepris e s A et B ont la
pos sibilit de lancer un nouveau produit pour lequ el le s
dbouch s sont limit s, s a n s quil ny ait de compromis
E ntre elle s si toute s deux dcident de produire.la m atrice de s
gain s pour le s deux e ntrepris e s devraient re s s embler celle
pr s e nt e dan s le tableau 1.

Entreprise
B
Produit Ne produit
pas
Entrepri Produit 3, 1 1, 3
se Ne produit pas 0, 5 4, 2
A

Tableau 1 : Matrice de gain dun jeu stratgie produit

23
1) Quels sont les quilibres de Nash en stratgies pures ?
2) Montrer quil existe aussi un quilibre de Nash en stratgie mixtes ?

Rsoudre le jeu :
Dans ce cas particulier, IL ny a pas dquilibre de Nash.
Il ny a pas de solution naturelle au jeu.
Ayant observ les comportements de deux firmes, on peut considrer que
Enterprise B choisira la stratgie produit et ne produit pas avec la mme
probabilit 1/2.
Enterprise A choisira la stratgie produit avec une probabilit 0,6 et la stratgie
ne produit pas avec une probabilit gale :
1-0,6= 0,4
Soit la matrice prenant en compte les probabilits des stratgies.

Entreprise
B
Produit Ne
(q=0,5) produit
pas
(q=0,5)
Entrepri Produit 3, 1 1, 3
se (p=0,6)
A Ne produit 0, 5 4, 2
pas (p=0,4)

On calcul ain si le s e spra nce s de gain s et on le s compare.


L a valeur e spr e dun e stratgie e st. Le gain que lon s attend
recevoir pondr par le s probabilit s de choix de lautre
joueur.

24
S i E nt erpris e A utilis la stratgie mixte P = 0,6 et (1-
p) = 0,4, alors le gain e spr de E nt erpris e B a s soci s e s
stratgie s pure s e st :
E G B (produit) = (0,6 x 1) + (0,4 x 5) = 2,6
E G B (ne produit pa s) = (0,6 x 3) + (0,4 x 2) = 2,6
E nt erpris e B e st indiff rent e ntre s e s deux stratgie s produit et
n e produit pa s.
Pour E nt erpris e A :
E GA (produit) = (0,5 x 3) + (0,5 x 1) = 2
E GA (ne produit pa s) = (0,5 x 0) + (0,5 x 4) = 2
E nt erpris e A e st a u s si donc indiff rent e ntre s e s deux stratgie s
pure s mai s comm e E nt erpris e A s a it que E nt erpris e B jouera n e
produit pa s, elle va choisir n e produit pa s car elle gagnera S i
E nt erpris e B choisira de jouer produit l E nterpris e A va choisir la
stratgie produit pui squ e elle gagnera 3.
La solution e n stratgie mixte e st donc (ne produit pa s, n e
produit pa s) et
(Produit, produit) Limperfection de linformation rend lanalys e
n ettem e nt compliqu e. Il y a trs souv ent un e multiplicit
dquilibre s de Nash pos sible s. Pour le s s l ectionn er, on a
recours de s concepts de solution s plu s complexes, comm e
lquilibre bay si e n ou lquilibre s qu entiel qui permettent de
choisir e ntre le s quilibre s de Nash.

B. Limites des stratgies mixtes :


Le s stratgie s mixte s soulvent un certain nombre de problm e s
:
Ce sont tout dabord des quilibre s de Nash au s e n s faible. Un
cha ngem e nt unilatral de stratgie naurait pa s a ugm ent le s
gain s, certe s, m ai s il n e le s aurait pa s diminu s non plu s. R i e n

25
nincite un joueur quelconque retenir s a stratgie dquilibre
(lorsque le s a utre s lont fait) = = > v oir lexemple prcdents.
Mais videmm ent, il s u t quun s e ul joueur n e retienn e pa s s a
stratgie dquilibre pour que celuici n e s e rali s e pa s.
Il peut arriver quil y ait de s quilibre s de Nash au s e n s
faible av ec de s stratgie s pure s m ai s cela e st plutt
exceptionnel, alors que cela e st toujours le ca s av ec le s
quilibres e n stratgie s mixte s.
S e pose galem e nt la que stion de s avoir quelle signifi cation
donn er au fait que le s joueurs a nnoncent des probabilit s
daction s, alors que le but de modlis ateur e st dobtenir un ou
de s r sultats prcis.
E n outre, ds que lannonce e st faite, le jeu e st termin,
quelle que soit lis s u e. Pourtant derrire la notion de probabilit,
il y a lide de rptition qui perm et de s e faire un e opinion s ur
le caractre plus
Ou moin s probable dun v n em e nt.

4)-La stratgie de Maximin :

Le concept dquilibre de Nash repos e tr s fortem ent s ur


lhypoth s e de rationalit de lindividu. Le choix stratgique de
chaque joueur n e dpend pa s s e ul em ent de s a propre
rationalit, m ai s galem e nt de celle de s e s advers aire s. Cest ce
qui peut constituer un e limite de ce concept, comm e lillu stre
lexemple dan s le tableau 1 .
Lentreprise 2
Ninvestit Investit
pas
Lentrepri Ninvestit 0,0 -10,10
pas
se Investit -100,0 20,10
1

26
Tableau 1 : La stratgie de Maximin.

Dan s ce jeu, le s e ntrepris e s s e font concurrence e n venda nt


de s logiciel s de cryptage de fi chier s. Parce que le s deux
e ntrepris e s utilis e nt la m m e techniqu e de cryptage, le s fi chier s
crypt s par le logiciel produit par lautre e ntrepris e u n ava ntage
pour le consomm ateur. Cependant, lentrepris e 1 pos s de un e
part du m arch bien plus importante que lentrepris e 2. (Elle e st
e ntre s ur le m arch ava nt s a concurrente et son logiciel
pos s d e un e m eilleure interface utilis ateur) chacun e des deux
e ntrepris e s e dem a nde pr s e nt s i elle doit inve stir ou non dan s
u n e nouvelle m thode de cryptage.

E ll e faut not e que lentrepris e 2 a u ne stratgie domina nte :


elle a intrt inve stir puisqu e, quoiqu e fa s s e s a concurrente
s e s gain s sont plus important e n inve stis s a nt. Le ntrepris e 1
s attende donc ce que lentrepris e 2 inve sti s s e . Dan s ce ca s, le
mieux quelle puis s e faire e st inv e stir gal em e nt (elle gagnera
alors 20 millions deuros) plutt que de n e pa s inve stir (et perdre
10 million s deuros). Il apparait clairem e nt que la paire de
stratgie (inve stir, inve stir) e st dan s ce jeu u n quilibre de Nash,
il e st facile de vrifi er que cet quilibre e st uniqu e.

Mais le s ge stionnaire s doivent tre ab solum ent s r s que ceux


de lentrepris e 2 ont parfaitem e nt compris le jeu et sont
rationn el s. S i par m alheur lentrepris e 2 s e trompait e st dcidait
de n e pa s inve stir, ce s erait extrm em e nt coteux que
lentrepris e 1 (les m thode s de cryptage devena nt alors
incompatible s, cela crerait de la confu sion chez le
consomm ateur, et lentrepris e 1, parc quelle domine u n e grand
part du m arch, perdait 100 million s deuros)

Un e telle stratgie e st appel stratgie de Maximin, car


elle con si ste m aximi s er le gain minimum pouvant tre
obtenue. S i le s deux e ntrepris e e n des stratgie s du type
Maximin il e n rsultera que lentrepris e 1 ninve stira pa s, alors
quau contraire lentrepris e 2 inve stira la stratgie du Maximin

27
e st peut risquer m ai s n e perm et pa s de m aximis er le s profits.
(Lentrepris e 1, par exemple, perd 10 million a u lieu de gagner
20 million s). R e m arquon s galem ent que si lentrepris e 1 s avait
de faon certaine que lentrepris e 2 adoptait u n e stratgie
Maximin elle aurait prfr inve stir (est gagner 20 millions
deuros) plutt que de s uivre s a propre stratgie Maximin qui
tait de n e pa s inve stir.

Conclusion

La thorie des jeux fournit un cadre d'analyse permettant d'tudier les situations
conflictuelles dans lesquelles les individus ou les firmes sont en interaction.
Lorsque peu de firmes dominent un march ou bien lorsque des pays concluent
un accord sur les politiques commerciales, les agents concerns (individus,
firmes, tats) doivent prendre en compte les ractions des autres et anticiper leurs
propres dcisions. Il sagit alors d'analyser la manire dont les agents
coordonnent ou peuvent coordonner leurs dcisions dans diffrentes
configurations.

28
Bibliographie

Yildizoglu, Introduction la thorie des jeux, Dunod 2004.

Umbhaver, Thorie des jeux, Vuilbert 2004.

Rasmussen, Jeux et info, De Boeck 2004.

EMMANUELLE BENICOURT, BERNARD GUERRIEN: La thorie


conomique noclassique : microconomie, macroconomie et thorie
des jeux , dition la dcouverte, 2008.
VARIAN, Hal R.(1996). Intermediate Microeconomics, 4 m ed., W. W.
Norton and Company, New york/London.
http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux

29
http://www.cril.univartois.fr/~konieczny/enseignement/TheorieDesJeux
.pdf
WWW.scholarvox.com

30

Vous aimerez peut-être aussi