Vous êtes sur la page 1sur 26

Facult des Sciences Juridiques, Economiques et sociales

Expos sous le thme :

Ralis par : Nouaman Fanidi


Gmail : nouaman.help@gmail.com
Plan
Introduction..3
I prsentation de la thorie des jeux.4-5
1. Historique
2. Dfinition
3. Hypothses
4. Elments des jeux
II typologie des jeux....6-11
1. Jeux coopratifs et non coopratifs
2. Jeux somme nulle et jeux somme positive
3. Jeux simultans et jeux squentiels
4. Jeux finis
5. Jeux rpts
6. Jeux information complte et incomplte
IIIForme des jeux de stratgie..12-13
1. Forme extensive
2. Forme normale
IV le dilemme du prisonnier..15-16
V lquilibre des stratgies.17-24
1. Equilibre des stratgies dominantes
2. Equilibre de Nash en stratgie pure
3. Equilibre de Nash avec stratgie mixte
4. Stratgie Maximin

Conclusion25
Bibliographie

2
Introduction

La thorie des jeux est une approche distincte et interdisciplinaire du


comportement humain, elle a t fonde par les grands mathmaticiens John Von
Neuman et Oskar Morgenstern dans leur livre publi en 1944, intitul Theory
of Games and EconomicBehavior (la thorie des jeux et comportement
conomique).
Lorsque des personnes interagissent entre elles, on peut dire quil y a un jeu.
Lorsquun commerant dtermine le prix dun bien, il joue un jeu avec ses
clients et ses concurrents. La ngociation des salaires est un jeu entre le patron,
les employs et les syndicats. Napolon et Wellington jouaient un jeu lors de
la bataille de Waterlou tout comme Kroutchev et Kennedy lors de la crise de Cuba.
Donc la thorie des jeux est prsente souvent en conomie, en management,
en politique, en sociologie, en situation de guerrel o des dcisions complexes
doivent tre prises.
Lobjet de cette thorie est dtudier les principes et rgles mathmatiques et
les mettre profit dans des situations de conflits lors dune interaction stratgique
entre plusieurs preneurs de dcisions (appels agents en conomie et joueurs en
thorie des jeux). Ces preneurs de dcisions interagissent dans le sens o le sort de
chacun dpend non seulement des dcisions quil prend mais galement des
dcisions prises par dautres preneurs de dcisions, donc le choix optimal dpend
gnralement de ce que font les autres.
Dans cette recherche, on va essayer en premier lieu de donner un cadre
thorique cette conception, puis parler des diffrents types et formes de jeux,
tudier le dilemme du prisonnier et enfin voquer la notion dquilibre de Nash.

3
I prsentation de la thorie des jeux

1.Historique

En 1938, mile Borel dveloppe, dans son ouvrage Applications


aux Jeux de Hasard , un thorme du minimax pour les jeux somme
nulle deux joueurs, c'est--dire les jeux dans lesquels ce que gagne l'un est
perdu par l'autre.

En 1944, La thorie des jeux devient un champ de recherche part


entire avec la publication de la Thorie jeux et du comportement
conomique (Theory of Games and EconomicBehavior) par John von
Neumann et Oskar Morgenstern

En 1950, John Nash dveloppe la notion d'quilibre de Nash qui


gnralise les travaux de Cournot.

En 1994, John Nash, Reinhard Selten et John Harsanyi reoivent le


prix Nobel d'conomie (prix de la Banque royale de Sude en sciences
conomiques en mmoire d'Alfred Nobel) pour leurs travaux sur la thorie
des jeux. Ce choix tmoigne de l'importance prise par la thorie des jeux
dans l'analyse conomique.

4
2. Dfinition

La thorie des jeux peut tre dnie comme ltude mathmatique des
Interactions Stratgiques entre plusieurs agents Rationnels.
Interaction : il y a plusieurs agents (appels aussi joueurs, "dcision makers",
etc...), et ils interagissent : le contentement (appel aussi paiement, gain, utilit,
bien-tre) de chacun ne dpend pas que de lui, mais aussi en partie des autres.
Stratgique : Les joueurs ont le choix entre plusieurs options.
Rationnel : un joueur ne joue pas nimporte comment, il cherche optimiser
son paiement.

3. Hypothses

Rationalit
Cest une hypothse fondamentale. En effet, chaque joueur cherche
maximiser ses gains. Le gain de chacun dpend autant des dcisions des autres
que de sa propre dcision. Il est donc ncessaire quil y ait anticipation de ce
que vont faire les autres et cela repose sur des croyances.
Information Complte
Chaque joueur connat tous les dtails du modle et peut se mettre la place
du modlisateur. Il sait que les autres savent quil sait, quils savent quil sait
quils savent, etc.

4. Elments des jeux


Lorsque lon dsire modliser des comportements conomiques faisant
apparaitre des interactions stratgiques sous la forme dun jeu, il est ncessaire de
dfinir prcisment ces lments :
Les joueurs
Les rgles
Les choix possibles: les stratgies
Rsultat: les gains ou pertes

5
II typologie des jeux
1. Jeux coopratifs et non coopratifs

Les jeux coopratifs

Les joueurs peuvent communiquer librement et passer entre eux des accords
qui les lient de faon contraignante.
Ils cherchent lintrt gnral suivi dun partage des gains entre tous les joueurs
(intelligence collective).
Jeux solidaires : les joueurs gagnent ou perdent tous ensemble (ils ne jouent pas
lun contre lautre).

Exemple: Le ct de conduite

Conduire du mme ct que les autres permet de se dplacer en relative


scurit (gain de 100).
Conduire dans le sens oppos rend un accident trs probable (gain 0).
On obtient la matrice suivante:

Conduire gauche Conduire droite

Conduire gauche 100 0

Conduire droite 0 100

6
Jeux non coopratifs

Les individus adoptent un comportement goste et opportuniste chaque


instant:
Absence de la communication entre les joueurs.
Les joueurs agissent selon le principe de rationalit conomique: chacun
cherche son intrt individuel.
Exemple :

Soit une entreprise 1 et une entreprise 2 ayant leur disposition les actions:
produire et ne pas produire :

E2 Produit Ne produit pas


E1
Produit (-3;-2) (10;0)
Ne produit pas (0;8) (0;0)

2. Jeux somme nulle et jeux somme positive

Jeux somme nulle (ou interdpendance comptitive)

Un jeu est somme nulle si la somme des gains est constante : somme gale
zro.
Dans ce type de jeu ce que gagne lun des joueurs lautre le perd.
Par exemple, les checs; le poker; la pierre, papier, ciseau sont des jeux somme
nulle.
Exemple : Jeu de matching :
Deux joueurs annoncent simultanment Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reoit 20 que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 2.

7
La matrice des gains est donc la suivante
J2 Pile Face

J1
Pile (20;-20) (-20;20)
Face (-20;20) (20;-20)

Jeux somme non nulle (indpendance coopratifs)

Dit aussi jeux somme positive. Ils reprsentent les situations o les joueurs
peuvent potentiellement gagner sils parviennent cooprer ou coordonner
leurs stratgies.
Alors le rsultat dun tel jeu peut tre:
*(positif; positif): tous les joueurs sont gagnants.
*(ngatif; ngatif):tous les joueurs sont perdants.

Exemple:
Soit deux entreprises ont le choix dans leur politique de communication
entre lancer une compagne de publicit ou ne rien faire .

E2 Lancer la Ne rien faire


compagne
pub

E1
Lancer la (40;90) (60;50)
compagne
pub
Ne rien faire (25;140) (25;50)

8
3. Jeux simultans et jeux squentiels

Jeux squentiels

Il existe des jeux o les joueurs jouent lun aprs lautre: jeux squentiels.
Celui qui joue en premier est le leader , celui qui joue en deuxime est le
follower .
Le joueur dans ce cas peut savoir ce que lautre a jou avant de prendre sa
dcision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer linvestissement en capital de son concurrent
avant de prendre sa propre dcision.

Remarque:
Le duopole: une structure du march oligopolistique dans laquelle deux
entreprises offreuses font face une infinit de demandeurs.

Jeux simultans

Chaque joueur choisit son plan daction complet au dbut du jeu et une fois
pour toutes.
Le joueur ne connat pas les choix effectu par les autres joueurs donc il
doit prvoir les choix des autres.

Exemple: Le dilemme du prisonnier.

9
4. Jeux finis

On dit qu'un jeu est fini lorsque l'ensemble des stratgies de chacun des
joueurs est fini.
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux
stratgies possibles.

5. Jeux rpts

La rptition dun jeu, avec connaissance des rsultats intermdiaires,


change souvent fondamentalement son droulement (les meilleurs coups et la
conclusion).
Par exemple, il peut tre utile de prendre ponctuellement le risque de perdre
pour voir , tester les autres joueurs, et mettre en place des stratgies de
communication par les coups jous ( dfaut dautre moyen de communication).

6. Jeux information complte et incomplte :


Jeux information complte
On dit qu'un jeu est information complte si chaque joueur connat lors de
la prise de dcision :
ses possibilits d'action
les possibilits d'action des autres joueurs
Rsultats de la dcision qui sera prise
les motivations des joueurs

Jeux information incomplte


On dit quun jeu est information incomplte sil manque de linformation
(lorsquil ny a pas de connaissance des gains, ou de certaines rgles ).
On parle de jeu information parfaite dans le cas de jeu sous forme extensive, o
chaque joueur a une connaissance parfaite de toute l'histoire du jeu.
Un jeu information incomplte est aussi information imparfaite. Les jeux
information complte peuvent tre information imparfaite soit du fait de la

10
simultanit des choix des joueurs, soit lorsque des vnements alatoires sont
cachs certains joueurs.

La forme normale ou stratgique du jeu :

Le modle de jeux sous forme stratgique supprime la structure squentielle


de la prise dcision. Quand elle est applique des situations dans lesquelles les
preneurs de dcisions jouent squentiellement, elle oblige supposer que les
joueurs choisissent leur stratgie une fois pour toute, ils sont alors engags dans
cette stratgie et ne peuvent pas la modifier mesure que le jeu se droule.
Cette modlisation est toutes fois trs utile pour dcrire des situations dans
lesquelles les joueurs jouent en mme temps. Ce jeu est connu sous le nom de la
forme normale des jeux.
Donc La forme normale dun jeu est tout simplement lcriture condense sous la
forme dun tableau. Ce tableau est souvent appel matrice de gain ou matrice de
paiement. Cette forme de prsentation dun jeu permet de mieux comprendre la
notion de stratgie. Elle dcrit les stratgies de lensemble des joueurs .Pour
mieux comprendre, on reprsente le jeu simultan deux entreprises avec des
stratgies pures finies sous la forme de la matrice de gain ci-dessous.
Prix de SONY
Prix de March Guerre de Prix
Prix de Prix de March 20,20 -150,-150
HP Guerre de Prix -20,-150 -100,-100

(Matrice de gain)

On trouve 2 cas :
Cas 1 : Ici, Les deux entreprise s'ils pratiquent le prix du march tout le monde
gagne.) Situation favorable.
Cas 2 : Si Les deux entreprise se lancent dans une guerre de prix, ou ils sont
diffrent de leurs dcision tout le monde perds.) Situation n'est pas favorable.

11
1) Forme extensive :
Dans tous les jeux, les dcisions peuvent tre reprsentes par un arbre, dont
chaque nud est associ au joueur qui dcide. Chaque option constitue une
branche. Les gains de tous sont associs aux terminaisons ou feuilles de l'arbre.
Un joueur na toutefois pas besoin de savoir comment il est parvenu un nud :
Seul compte l'tat prsent du jeu, et les positions recherches dans le futur. Lorsque
certains mouvements ne sont autoriss quaprs un vnement donn, cet
vnement nest quun des lments matrialiser dans ltat prsent du jeu et n'a
pas besoin de faire partie d'un historique.

Une forme extensive de jeu est un arbre de dcision dcrivant les actions
possibles des joueurs chaque tape du jeu, la squence de tours de jeu des
joueurs, ainsi que l'information dont ils disposent chaque tape pour prendre
leur dcision.
Cette information est reprsente sous forme d'ensembles d'information qui
forment une partition des nuds de l'arbre, chaque classe de la partition
contenant les nuds non distinguables par le joueur une tape du jeu. Si ces
classes sont des singletons, cest--dire que chacune est constitue d'un seul
nud de l'arbre du jeu, le jeu est dit information parfaite, ce qui signifie
que chaque joueur sait tout moment o il se situe dans l'arbre du jeu.
Dans le cas contraire, le jeu est dit information imparfaite. L'information
imparfaite est reprsente sous la forme d'un joueur non rationnel : la Nature ,
joueur qui prend alatoirement certaines dcisions telle ou telle tape du jeu,
orientant la suite du jeu vers une certaine sous-barbe de l'arbre du jeu.

La forme extensive avec formation parfaite :


Pour illustrer cette situation, considrons le cas dun duopole ou deux
entreprises A et B produisent et vendent un bien identique et se demandent si
elles doivent entreprendre une campagne de publicit ou non. Chaque firme
sera par consquent affecte par la dcision de lautre. Les diffrents rsultats
du jeu sont prsents dans le schma suivant:

12
100,100
b1

B
b2 750,250

a1

250,750
A b1
a2 B
b2 500,500

Schma n1
Larbre ci-dessous est la forme extensive du jeu reprsentant les gains que
les entreprises A et B obtiendront en entreprenant une compagne de
publicit ou non. Le jeu commence au sommet reprsent par un gros point
et constitue par la mme le choix initial effectu par le premire entreprise
dont on suppose quelle sagit de lentreprise A. les deux premieres
branches de larbre reprsentent ses deux possibilits daction faire la
publicit : a1 ou a2 : ne pas faire de publicit . Au bout de chacune de
ces deux branches apparaissent des nuds partir desquels lentreprise B
peut son tour choisir entre deux actions faire la publicit : b1 ou ne
pas faire : b2 , aprs avoir pris de connaissance de la dcision de A.
lorsque lentreprise B fait son choix, les jeux sarrte et les branches de
larbre se terminent par des nombres reprsentent les gains ou payement
reus par chaque entreprise pour toutes les squences du jeu. Ces gains sont
donns dans lordre dintervention de chaque entreprise. Par exemple, si les
stratgies choisies par les deux entreprises sont (a2, b2), c'est--dire
quaucune entreprise ne dsire faire de publicit, chacune aura un bnfice
de 500. Par contre si lentreprise A dcid de faire la publicit alors que B
refuse, les stratgies (a1, b2 ou inversement), alors lentreprise A
augmentera ses profits de 50% (750). Les stratgies de lentreprise B sont
dans ce cas conditionnelles celle de A. dans ce jeu squentiel on a

13
suppos que B ne prend sa dcision quaprs avoir pris connaissance de
laction entreprise par A. Dans ce cas, en parle
de jeu dynamique information parfaite car lorsque B dcide de son action,
elle sait si A a choisi de faire la publicit ou non.

Forme extensive avec formation imparfaite :


Dans certains cas, le second joueur ne connat pas la dcision du joueur 1 au
moment o il prend sa dcision. Dans un tel jeu, linformation est complte
mais imparfaite .

b1 100,100

a1 b2
750,250

A B
b1 250,750

a2
b2 500,500

Schma n 2

La surface hachure indique que le second joueur ne connat pas la decision du


joueur. Cest comme sil se trouvait dans la situation dun jeu simultan.

14
IV le dilemme du prisonnier
Quelque part, un crime est commis et la police arrte deux suspects. La
police est certaine que ces deux hommes sont impliqus dans le crime, mais n'ont
aucune preuve. L'un des policiers a eu alors une ide. Il dcide de mettre les
prisonniers dans des cellules spares et leur fait la proposition suivante: Ils ont
le choix entre dnoncer leur complice et passer moins de temps en prison ou ils
peuvent tous deux garder le silence.

Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les deux
prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux parle et
l'autre garde le silence, le mouchard sera libre et l'autre ira en prison pour 10 ans.
Si les deux prisonniers se dnoncent mutuellement, alors ils iront en prison pour
8 ans (et non 10 ans, car ils auront aid la justice tous les deux).

Nous pouvons prsenter ces informations sous forme de tableau :

P1 Silence P1 Dnonce
P2 Silence 1,1 0,10
P2 Dnonce 10,0 8,8

Ce tableau s'appelle une matrice o nous voyons tous les rsultats possibles
pour les deux "joueurs" (les prisonniers) impliqus dans ce jeu. Le premier nombre
est toujours le rsultat pour le premier prisonnier (P1) et le nombre aprs la virgule
est le rsultat pour le second prisonnier (P2).

15
En analysant la situation dinterdpendance de chacun des prisonniers, il est
vident que pour eux, la meilleure solution est davouer le crime en esprant que
lautre niera. Il y a donc une interdpendance comptitive ou il y aura un gagnant
et un perdant, sauf que si les deux prisonniers adoptent le mme schma de
rflexion alors ils se retrouvent dans une relation de perdant- perdant.
Tout cela est un problme de confiance, que se portent les deux prisonniers.
Mais sils identifient tous les deux quil y a une solution gagnant- gagnant, il y
aura donc une interdpendance cooprative.
Imaginons que nous soyons P1. Nous sommes assis dans notre cellule,
rflchissant ce qu'il faut faire. Nous ignorons ce que fera P2 et nous n'avons
aucun moyen de communiquer. Si P2 nous dnonce, alors il est prfrable pour
nous de le dnoncer galement. Si P2, ne nous dnonce pas, alors notre meilleur
choix est aussi de le dnoncer. Dans les deux cas, peu importe ce que choisit P2,
le dnoncer vous permet de rduire le temps que vous passerez en prison.
Pour P2, la situation est exactement la mme et il aura intrt nous dnoncer
pour les mmes raisons. Certes, P1 peut penser : "Peut-tre que je ne devrais rien
dire, si P2 fait de mme, nous serons libres dans 1 an". Mais si P2 dcide de parler,
vous irez en prison pour 10 ans ! Avez-vous envie de prendre ce risque ? En
gnral, non.
Aussi, la fin du "jeu", les deux prisonniers coperont de 8 ans de prisons.
Cette situation s'appelle l'quilibre de Nash, d'aprs le nom du clbre
mathmaticien John Forbes Nash. Lorsque cet quilibre est atteint, aucun joueur
ne peut ajuster sa stratgie unilatralement pour en tirer profit. C'est exactement ce
qui se passe pour nos deux prisonniers. Imaginons que nous soyons sur le point
d'quilibre de Nash, les deux prisonniers se dnoncent et vont en prison pour 8 ans.
P1 peut changer sa stratgie et garder le silence, mais il ira en prison pour 10 ans
et n'aura rien gagn. La situation est la mme pour P2. Aucun changement
unilatral de stratgie ne peut profiter ces "joueurs".

16
V- Lquilibre du jeu
- 1) Stratgie dominante :

Le concept de stratgie est fondamental dans la thorie des jeux .une stratgie est
la description parfaite et complte de la manire dont une joueur ragit en prsence
de chaque circonstance. Les issues qui dcoulent de lintersection des couples de
stratgie sont consignes lintrieur dune matrice de gains.

Entreprise B
Produire plus Produire moins
Entreprise Produire plus 12 ,22 11 ,32
A Produire moins 22,18 20,27
(Matrice de gain)
Supposons dabord que entreprise a entam le jeu et B ragit ensuite .Si entreprise
A choisi la stratgie produire plus, le meilleur choix pour B est celui de la stratgie
produire moins, puisqu elle lui permet de gagner 32 au lieu de 22 avec la
stratgie produire plus. Si par contre, A choisi la stratgie produire moins, B a
intrt rpondre en utilisant la stratgie produire moins qui lui rapporte 27 au
lieu de 18 . On constate alors que lentreprise B ralise le meilleur gain en
utilisant la stratgie produire moins quelle que soit la stratgie utilise par
lentreprise A. on dit alors que la stratgie produire moins est une stratgie
dominante pour lentreprise B car elle constitue sa meilleure rponse possible
toutes les stratgies de A.
De mme, lorsque B entame le jeu et choisit dabord la stratgie produire plus,
lentreprise A a intrt choisir la stratgie produire moins qui lui rapporte 22
au lieu de 12 avec produire plus. Dans le cas o lentreprise B choisit la
stratgie produire moins, la meilleure rponse pour A est encore celle avec la
stratgie produire moins, qui lui permet de gagner 20 au lieu de 11 . On

17
constate l aussi que la stratgie produire moins est une stratgie dominante pour
lentreprise A, puisque quoi que fasse lentreprise B, elle ralise le meilleur gain
avec cette stratgie.
On constate dans cet exemple, que les deux entreprises ont la mme stratgie
dominante : toute les deux doivent produire moins. Dans ce cas, on dit que le
rsultat final du jeu est quilibre stable pour les deux entreprises et on lappelle
quilibre en stratgie dominante.

-2) Equilibre de Nash en stratgie pure :


Soit un jeu 2 joueurs avec un nombre fini de stratgies. Considrons que
chaque joueur :
optimise et poursuit son intrt individuel: la rationalit ;
choisit une stratgie une fois pour toutes, cest--dire que chaque agent
effectuait un seul choix et sy tenait: la stabilit.
La matrice des paiements suivante reprsente les paiements dont bnficient
les joueurs A et B pour chaque combinaison de stratgies choisies.

Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit droite,
les gains pour A sont 0 ou 1. Cela signifie que quand B choisit gauche, A prfre
haut et quand B choisit droite, A prfre bas. Le choix optimal de A dpend donc
de ce quil croit que B fera.
La stratgie (haut, gauche) est un quilibre de Nash. En effet, si A choisi haut,
la meilleure chose que B puisse faire, cest choisir gauche puisque son gain est 1
sil choisit gauche et 0 sil choisit droite.

18
Nous dirons quune paire de stratgies est un quilibre de Nash1 si le choix
de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre faon de dfinir un quilibre de Nash est une situation dont personne
na intrt dvier individuellement, sachant la stratgie de lautre. Ne pas
dvier individuellement veut dire que les individus font un choix optimal qui
maximise leur utilit compte tenu de la stratgie de lautre. Lautre fait le mme
raisonnement compte tenu de la stratgie du premier joueur.

Exemple 1
Le concept dquilibre de Nash montre clairement quil sagit simplement
dune gnralisation de lquilibre de Cournot. Dans le cas de lquilibre de
Cournot, la variable de dcision est la quantit doutput produite qui est une
variable continue et chaque firme choisit loutput qui maximise son profit compte
tenu du choix de lautre firme.
En effet, lorsque le concurrent augmente sa production, la moins mauvaise
solution consiste, pour la firme, diminuer la sienne : ceci limite la baisse du
prix due la hausse de la production du concurrent, sans ncessairement viter la
diminution de la recette totale, et permet de diminuer le cot de production.

Exemple 2
Lquilibre de Bertrand, galement est un quilibre de Nash avec des
stratgies en prix. Chaque firme choisit le prix qui maximise son profit, compte
tenu du choix quelle pense que lautre firme fera.

Limites de lquilibre de Nash en stratgie pure :

Tout dabord, un jeu peut avoir plus quun quilibre de Nash. En fait, les
choix (bas, droite) correspondent galement un quilibre de Nash.
Le second est que pour certains jeux, de tels quilibres nexistent pas.

1
John F. Nash junior, n en 1928, a reu le prix Nobel en 1994 avec ReinhartSelten et John Harsanyi pour la thorie des
jeux non coopratifs.

19
3. Les stratgies mixtes :
A. Equilibre de Nash en stratgie mixte :
Certains jeux peuvent ne pas avoir dquilibre de Nash ou en avoir plusieurs. Dans
ces deux situations, il y a donc indtermination. Afin de contourner ce De
dicult, il a t propos de faire intervenir les probabilits au moment de la prise
de dcision, plutt que de retenir une action, les joueurs aectent des probabilits
aux actions parmi les lesquelles ils doivent choisir. On dit alors quils font appel
des stratgies mixtes plutt qu des stratgies pures (probabilit Distribuer une
action est gale 1).
Le recours une approche probabiliste pose le problme du critre dvaluation
des gains, qui ne sont plus certains. Problme qui est rsolu en thorie des jeux
comme en thorie de la dcision par ladoption du principe de lesprance
mathmatique. Il sagit de pondrer les gains associs aux dfrentes issues par la
probabilit de survenance de celles-ci.
Le principal argument avanc pour justifier le recours aux stratgies mixtes est
dordre mathmatique. Nash a montr que tout jeu information complte et
imparfaite comporte au moins un quilibre en stratgies mixtes. Lquilibre
envisag est un quilibre de Nash.
Ainsi accepter les stratgies mixtes lve lhypothse de lventuel non existence
dun quilibre en information complte et imparfaite, et permet de justifier
limportance accorde aux quilibres. Cependant, la prise en compte des stratgies
mixtes nest pas sans inconvnients. Elle ne peut entraner quune augmentation
du nombre dquilibres.
Exemple :
Reprenons le jeu dans lequel deux entreprises A et B ont la possibilit de
lancer un nouveau produit pour lequel les dbouchs sont limits, sans quil ny
ait de compromis
Entre elles si toutes deux dcident de produire.la matrice des gains pour les deux
entreprises devraient ressembler celle prsente dans le tableau 1.

20
Entreprise
B
Produit Ne produit pas
Entreprise Produit 3, 1 1, 3
A Ne produit pas 0, 5 4, 2

Tableau 1 : Matrice de gain dun jeu stratgie produit

1) Quels sont les quilibres de Nash en stratgies pures ?


2) Montrer quil existe aussi un quilibre de Nash en stratgie mixtes ?

Rsoudre le jeu :
Dans ce cas particulier, IL ny a pas dquilibre de Nash.
Il ny a pas de solution naturelle au jeu.
Ayant observ les comportements de deux firmes, on peut considrer que
Enterprise B choisira la stratgie produit et ne produit pas avec la mme
probabilit 1/2.
Enterprise A choisira la stratgie produit avec une probabilit 0,6 et la stratgie ne
produit pas avec une probabilit gale :
1-0,6= 0,4
Soit la matrice prenant en compte les probabilits des stratgies.

Entreprise
B
Produit Ne produit
(q=0,5) pas (q=0,5)
Entreprise Produit (p=0,6) 3, 1 1, 3
A Ne produit pas 0, 5 4, 2
(p=0,4)

21
On calcul ainsi les esprances de gains et on les compare.
La valeur espre dune stratgie est. Le gain que lon sattend recevoir
pondr par les probabilits de choix de lautre joueur.
Si Enterprise A utilis la stratgie mixte P=0,6 et (1-p)=0,4, alors le gain
espr de Enterprise B associ ses stratgies pures est :
EGB (produit) = (0,6 x 1) + (0,4 x 5) = 2,6
EGB (ne produit pas) = (0,6 x 3) + (0,4 x 2) = 2,6
Enterprise B est indiffrent entre ses deux stratgies produit et ne produit pas.
Pour Enterprise A :
EGA (produit) = (0,5 x 3) + (0,5 x 1) = 2
EGA (ne produit pas) = (0,5 x 0) + (0,5 x 4) = 2
Enterprise A est aussi donc indiffrent entre ses deux stratgies pures mais
comme Enterprise A sait que Enterprise B jouera ne produit pas, elle va choisir
ne produit pas car elle gagnera Si Enterprise B choisira de jouer produit
lEnterprise A va choisir la stratgie produit puisque elle gagnera 3.
La solution en stratgie mixte est donc (ne produit pas, ne produit pas) et
(Produit, produit) Limperfection de linformation rend lanalyse nettement
complique. Il y a trs souvent une multiplicit dquilibres de Nash possibles.
Pour les slectionner, on a recours des concepts de solutions plus complexes,
comme lquilibre bay sien ou lquilibre squentiel qui permettent de choisir
entre les quilibres de Nash.

B. Limites des stratgies mixtes :


Les stratgies mixtes soulvent un certain nombre de problmes :
Ce sont tout dabord des quilibres de Nash au sens faible. Un changement
unilatral de stratgie naurait pas augment les gains, certes, mais il ne les aurait
pas diminus non plus. Rien nincite un joueur quelconque retenir sa stratgie
dquilibre (lorsque les autres lont fait) ==>voir lexemple prcdents. Mais

22
videmment, il sut quun seul joueur ne retienne pas sa stratgie dquilibre
pour que celuici ne se ralise pas.
Il peut arriver quil y ait des quilibres de Nash au sens faible avec des
stratgies pures mais cela est plutt exceptionnel, alors que cela est toujours le
cas avec les quilibres en stratgies mixtes.
Se pose galement la question de savoir quelle signification donner au fait
que les joueurs annoncent des probabilits dactions, alors que le but de
modlisateur est dobtenir un ou des rsultats prcis.
En outre, ds que lannonce est faite, le jeu est termin, quelle que soit
lissue. Pourtant derrire la notion de probabilit, il y a lide de rptition qui
permet de se faire une opinion sur le caractre plus
Ou moins probable dun vnement.

4)-La stratgie de Maximin :

Le concept dquilibre de Nash repose trs fortement sur lhypothse de


rationalit de lindividu. Le choix stratgique de chaque joueur ne dpend pas
seulement de sa propre rationalit, mais galement de celle de ses adversaires.
Cest ce qui peut constituer une limite de ce concept, comme lillustre lexemple
dans le tableau 1.
Lentreprise 2
Ninvestit pas Investit
Lentreprise Ninvestit pas 0,0 -10,10
Investit -100,0 20,10
1
Tableau 1 : La stratgie de Maximin.

Dans ce jeu, les entreprises se font concurrence en vendant des logiciels de


cryptage de fichiers. Parce que les deux entreprises utilisent la mme technique
de cryptage, les fichiers crypts par le logiciel produit par lautre entreprise un
avantage pour le consommateur. Cependant, lentreprise 1 possde une part du
march bien plus importante que lentreprise 2. (Elle est entre sur le march

23
avant sa concurrente et son logiciel possde une meilleure interface utilisateur)
chacune des deux entreprise se demande prsent si elle doit investir ou non
dans une nouvelle mthode de cryptage.

Elle faut note que lentreprise 2 a une stratgie dominante : elle a intrt
investir puisque, quoique fasse sa concurrente ses gains sont plus important en
investissant. Lentreprise 1 sattende donc ce que lentreprise 2 investisse. Dans
ce cas, le mieux quelle puisse faire est investir galement (elle gagnera alors 20
millions deuros) plutt que de ne pas investir (et perdre 10 millions deuros). Il
apparait clairement que la paire de stratgie (investir, investir) est dans ce jeu un
quilibre de Nash, il est facile de vrifier que cet quilibre est unique.

Mais les gestionnaires doivent tre absolument srs que ceux de lentreprise 2
ont parfaitement compris le jeu et sont rationnels. Si par malheur lentreprise 2 se
trompait est dcidait de ne pas investir, ce serait extrmement coteux que
lentreprise 1 (les mthodes de cryptage devenant alors incompatibles, cela
crerait de la confusion chez le consommateur, et lentreprise 1, parc quelle
domine une grand part du march, perdait 100 millions deuros)

Une telle stratgie est appel stratgie de Maximin, car elle consiste
maximiser le gain minimum pouvant tre obtenue. Si les deux entreprise en des
stratgies du type Maximin il en rsultera que lentreprise 1 ninvestira pas, alors
quau contraire lentreprise 2 investira la stratgie du Maximin est peut risquer
mais ne permet pas de maximiser les profits. (Lentreprise 1, par exemple, perd
10 million au lieu de gagner 20 millions). Remarquons galement que si
lentreprise 1 savait de faon certaine que lentreprise 2 adoptait une stratgie
Maximin elle aurait prfr investir (est gagner 20 millions deuros) plutt que
de suivre sa propre stratgie Maximin qui tait de ne pas investir.

24
Conclusion

La thorie des jeux fournit un cadre d'analyse permettant d'tudier les situations
conflictuelles dans lesquelles les individus ou les firmes sont en interaction.
Lorsque peu de firmes dominent un march ou bien lorsque des pays concluent
un accord sur les politiques commerciales, les agents concerns (individus,
firmes, tats) doivent prendre en compte les ractions des autres et anticiper leurs
propres dcisions. Il sagit alors d'analyser la manire dont les agents
coordonnent ou peuvent coordonner leurs dcisions dans diffrentes
configurations.

25
Bibliographie

Yildizoglu, Introduction la thorie des jeux, Dunod 2004.

Umbhaver, Thorie des jeux, Vuilbert 2004.

Rasmussen, Jeux et info, De Boeck 2004.

EMMANUELLE BENICOURT, BERNARD GUERRIEN: La


thorie conomique noclassique : microconomie, macroconomie et
thorie des jeux , dition la dcouverte, 2008.

VARIAN, Hal R.(1996). Intermediate Microeconomics, 4 m ed., W.


W. Norton and Company, New york/London.

http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux

http://www.cril.univartois.fr/~konieczny/enseignement/TheorieDesJe
ux.pdf

WWW.scholarvox.com

26