Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
sociales
Conclusion25
Bibliographie
3
Introduction
4
I prsentation de la thorie des jeux
1. Historique
5
2. Dfinition
La thorie des jeux peut tre dnie comme ltude mathmatique des
Interactions Stratgiques entre plusieurs agents Rationnels.
Interaction : il y a plusieurs agents (appels aussi joueurs, "dcision makers",
etc...), et ils interagissent : le contentement (appel aussi paiement, gain, utilit,
bien-tre) de chacun ne dpend pas que de lui, mais aussi en partie des autres.
Stratgique : Les joueurs ont le choix entre plusieurs options.
Rationnel : un joueur ne joue pas nimporte comment, il cherche optimiser
son paiement.
3. Hypothses
Rationalit
Cest une hypothse fondamentale. En effet, chaque joueur cherche
maximiser ses gains. Le gain de chacun dpend autant des dcisions des autres
que de sa propre dcision. Il est donc ncessaire quil y ait anticipation de ce
que vont faire les autres et cela repose sur des croyances.
Information Complte
Chaque joueur connat tous les dtails du modle et peut se mettre la place
du modlisateur. Il sait que les autres savent quil sait, quils savent quil sait
quils savent, etc.
6
II typologie des jeux
1. Jeux coopratifs et non coopratifs
Les joueurs peuvent communiquer librement et passer entre eux des accords
qui les lient de faon contraignante.
Ils cherchent lintrt gnral suivi dun partage des gains entre tous les joueurs
(intelligence collective).
Jeux solidaires : les joueurs gagnent ou perdent tous ensemble (ils ne jouent pas
lun contre lautre).
Exemple: Le ct de conduite
7
Les individus adoptent un comportement goste et opportuniste chaque
instant:
Absence de la communication entre les joueurs.
Les joueurs agissent selon le principe de rationalit conomique: chacun
cherche son intrt individuel.
Exemple :
Soit une entreprise 1 et une entreprise 2 ayant leur disposition les actions:
produire et ne pas produire :
Un jeu est somme nulle si la somme des gains est constante : somme gale
zro.
Dans ce type de jeu ce que gagne lun des joueurs lautre le perd.
Par exemple, les checs; le poker; la pierre, papier, ciseau sont des jeux somme
nulle.
Exemple : Jeu de matching :
Deux joueurs annoncent simultanment Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reoit 20 que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 2.
J1
8
Pile (20;-20) (-20;20)
Face (-20;20) (20;-20)
Jeux somme non nulle (indpendance coopratifs)
Dit aussi jeux somme positive. Ils reprsentent les situations o les joueurs
peuvent potentiellement gagner sils parviennent cooprer ou coordonner
leurs stratgies.
Alors le rsultat dun tel jeu peut tre:
*(positif; positif): tous les joueurs sont gagnants.
*(ngatif; ngatif):tous les joueurs sont perdants.
Exemple:
Soit deux entreprises ont le choix dans leur politique de communication
entre lancer une compagne de publicit ou ne rien faire .
E1
Lancer la (40;90) (60;50)
compagne
pub
Ne rien faire (25;140) (25;50)
9
Jeux squentiels
Il existe des jeux o les joueurs jouent lun aprs lautre: jeux squentiels.
Celui qui joue en premier est le leader , celui qui joue en deuxime est le
follower .
Le joueur dans ce cas peut savoir ce que lautre a jou avant de prendre sa
dcision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer linvestissement en capital de son concurrent
avant de prendre sa propre dcision.
Remarque:
Le duopole: une structure du march oligopolistique dans laquelle deux
entreprises offreuses font face une infinit de demandeurs.
Jeux simultans
Chaque joueur choisit son plan daction complet au dbut du jeu et une fois
pour toutes.
Le joueur ne connat pas les choix effectu par les autres joueurs donc il
doit prvoir les choix des autres.
4. Jeux finis
On dit qu'un jeu est fini lorsque l'ensemble des stratgies de chacun des
joueurs est fini.
10
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux
stratgies possibles.
5. Jeux rpts
11
Le modle de jeux sou s forme stratgiqu e s upprim e la
structure s qu entielle de la pris e dcision. Quand elle e st
appliqu e des situation s dan s le squ elle s le s preneur s de
dci sion s jouent s qu entiellem ent, elle oblige s uppos er que
le s joueurs choisi s s e nt leur stratgie un e fois pour toute, ils sont
alors e ngag s dan s cette stratgie et n e peuvent pa s la modifi er
m e s ure que le jeu s e droule.
Prix de SONY
Prix de Gu erre de
March Prix
(Matrice de gain)
12
On trouve 2 ca s :
1) Forme extensive :
Dan s tous le s jeux, le s dcision s peuvent tre repr s e nt e s par
u n arbre, dont chaque n ud e st a s soci au joueur qui dcide.
Chaque option constitue un e branche. Le s gain s de tou s sont
a s soci s aux terminai son s ou feuille s de l'arbre.
100,100
b1
B
b2 750,250
a1
250,750
A b1
a2 B
b2 500,500
Schma n1
14
Larbre ci-de s sou s e st la forme exten siv e du jeu
repr s e ntant le s gain s que le s e ntrepris e s A et B
obtiendront e n e ntreprena nt un e compagne de publicit ou
non. Le jeu comm ence a u somm et repr s e nt par u n gros
point et constitue par la m m e le choix initial eff ectu par le
premire e ntrepris e dont on s uppose quelle s agit de
lentrepris e A. le s deux premiere s branch e s de larbre
repr s e ntent s e s deux pos sibilit s daction faire la
publicit : a 1 ou a 2 : n e pa s faire de publicit . Au bout
de chacun e de ce s deux branch e s apparai s s e nt des n ud s
partir de squel s lentrepris e B peut son tour choisir e ntre
deux action s faire la publicit : b 1 ou n e pa s faire :
b2 , apr s avoir pris de connai s s a nc e de la dcision de A.
lorsque lentrepris e B fait son choix, le s jeux s arrte et le s
branche s de larbre s e termine nt par de s nombre s
repr s e ntent le s gain s ou payem e nt reu s par chaqu e
e ntrepris e pour toute s le s s qu e nce s du jeu. Ces gain s sont
donn s dan s lordre dintervention de chaqu e e ntrepris e.
Par exemple, si le s stratgie s choisie s par le s deux
e ntrepris e s sont (a 2, b2 ), c'e st--dire quaucune e ntrepris e
n e dsire faire de publicit, chacun e a ura un bn fi ce de
500. Par contre si lentrepris e A dcid de faire la publicit
alors que B refus e, le s stratgie s (a 1, b2 ou inver s em e nt),
alors lentrepris e A augm entera s e s profits de 50% (750).
Le s stratgie s de lentrepris e B sont dan s ce ca s
conditionnelle s celle de A. dan s ce jeu s qu e ntiel on a
s uppos que B n e prend s a dci sion quapr s avoir pris
connai s s a nc e de laction e ntrepris e par A. Dan s ce ca s, e n
parle
de jeu dynamique information parfaite car lorsqu e B
dcide de son action, elle s a it si A a choisi de faire la
publicit ou non.
Forme extensive avec formation imparfaite :
15
Dan s certain s ca s, le s econd joueur n e connat pa s la dcision du
joueur 1 a u moment o il prend s a dcision. Dan s un tel jeu,
linformation e st complte m ai s imparfaite .
b1 100,100
a1 b2
750,250
A B
b1 250,750
a2
b2 500,500
Schma n 2
IV le dilemme du prisonnier
16
Quelque part, un crime est commis et la police arrte deux suspects. La
police est certaine que ces deux hommes sont impliqus dans le crime, mais n'ont
aucune preuve. L'un des policiers a eu alors une ide. Il dcide de mettre les
prisonniers dans des cellules spares et leur fait la proposition suivante: Ils ont
le choix entre dnoncer leur complice et passer moins de temps en prison ou ils
peuvent tous deux garder le silence.
Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les deux
prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux parle et
l'autre garde le silence, le mouchard sera libre et l'autre ira en prison pour 10 ans.
Si les deux prisonniers se dnoncent mutuellement, alors ils iront en prison pour
8 ans (et non 10 ans, car ils auront aid la justice tous les deux).
P1 Silence P1 Dnonce
P2 Silence 1,1 0,10
P2 Dnonce 10,0 8,8
17
E n a n alys a nt la situation dinterdpendance de chacun des
prisonnier s, il e st vident que pour eux, la m eilleure solution e st
davouer le crim e e n e sp ra nt que lautre ni era. Il y a donc u n e
interdpendance comptitive ou il y a ura u n gagna nt et un
perdant, s a uf que si le s deux prisonnier s adoptent le m m e
sch m a de rfl exion alors il s s e retrouvent dan s u n e relation de
perdant- perdant.
Tout cela e st un problm e de confi ance, que s e portent le s deux
prisonnier s.
Mais s il s identifi ent tous le s deux quil y a u n e solution gagna nt-
gagna nt, il y a ura donc un e interdpenda nce cooprative.
Imaginon s que nou s soyon s P1. Nous somm e s a s si s dan s
notre cellule, rfl chi s s a nt ce qu'il faut faire. Nous ignorons ce
que fera P2 et nou s n'avon s aucun moyen de communiqu er. S i
P2 nou s dnonce, alors il e st prfrable pour nou s de le
dnoncer galem e nt. S i P2, n e nou s dnonce pa s, alors notre
m eilleur choix e st au s si de le dnoncer. Dan s le s deux ca s, peu
importe ce que choisit P2, le dnoncer vou s permet de rduire le
temps que vous pa s s erez e n prison.
Pour P2, la situation e st exactem e nt la m m e et il aura
intrt nous dnoncer pour le s m m e s raison s. Certe s, P1 peut
pen s er : "P eut-tre que je n e devrai s rien dire, si P2 fait de
m m e, nou s s eron s libre s dan s 1 a n ". Mais s i P2 dcide de
parler, vous irez e n prison pour 10 a n s ! Avez-vou s e nvie de
prendre ce risque ? E n gn ral, non.
Aus si, la fi n du "jeu ", le s deux prisonnier s coperont de 8
a n s de prison s. Cette situation s ' appelle l'quilibre de Nash,
d'apr s le nom du cl bre m ath m aticien John Forbe s Nash.
Lorsque cet quilibre e st atteint, aucun joueur n e peut aju ster s a
stratgie unilatral em e nt pour e n tirer profit. C'e st exactem ent
ce qui s e pa s s e pour no s deux prisonnier s. Imaginon s que nou s
soyon s s ur le point d'quilibre de Nash, le s deux prisonnier s s e
dnoncent et vont e n prison pour 8 a n s . P1 peut cha nger s a
stratgie et garder le s ilence, mai s il ira e n prison pour 10 a n s et
18
n' aura rien gagn. La situ ation e st la m m e pour P2. Aucun
cha ngem e nt unilatral de stratgie n e peut profiter ce s
"joueur s ".
V- Lquilibre du jeu
- 1) Stratgie dominante :
E ntrepris e B
Produire Produire moin s
plu s
E ntrepris e Produire plus 12 ,22 11 ,32
A Produire moin s 22,18 20,27
(Matrice de gain)
S upposon s dabord que e ntrepris e a e ntam le jeu et B ragit
e n s uite . S i e ntrepris e A choisi la stratgie produire plu s, le
m eilleur choix pour B e st celui de la stratgie produire moin s,
pui squ elle lui permet de gagner 32 au lieu de 22 av ec la
19
stratgie produire plus. S i par contre, A choisi la stratgie
produire moin s, B a intrt rpondre e n utilisa nt la stratgie
produire moin s qui lui rapporte 27 au lieu de 18 . On
constate alors que lentrepris e B rali s e le m eilleur gain e n
utilisa nt la stratgie produire moin s quelle que soit la stratgie
utilis e par lentrepris e A. on dit alors que la stratgie produire
moin s e st un e stratgie domina nte pour lentrepris e B car elle
constitue s a m eilleure rpon s e pos sible toute s le s stratgie s
de A.
De m m e, lorsque B e ntam e le jeu et choisit dabord la stratgie
produire plus, lentrepris e A a intrt choisir la stratgie
produire moin s qui lui rapporte 22 au lieu de 12 av ec
produire plus. Dan s le ca s o lentrepris e B choisit la stratgie
produire moin s, la m eilleure rpons e pour A e st e ncore celle
avec la stratgie produire moin s, qui lui perm et de gagner
20 au lieu de 11 . On constate l a u s si que la stratgie
produire moin s e st un e stratgie domina nte pour lentrepris e A,
pui sque quoi que fa s s e lentrepris e B , elle rali s e le m eilleur
gain av ec cette stratgie.
On con state dan s cet exemple, que le s deux e ntrepris e s ont la
m m e stratgie domina nte : toute le s deux doivent produire
moin s. Dan s ce ca s, on dit que le r sultat fi nal du jeu e st
quilibre stable pour le s deux e ntrepris e s et on lappelle
quilibre e n stratgie domina nte.
choisit une stratgie une fois pour toutes, cest--dire que chaque agent
effectuait un seul choix et sy tenait: la stabilit.
20
La matrice des paiements suivante reprsente les paiements dont bnficient
les joueurs A et B pour chaque combinaison de stratgies choisies.
Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit droite,
les gains pour A sont 0 ou 1. Cela signifie que quand B choisit gauche, A prfre
haut et quand B choisit droite, A prfre bas. Le choix optimal de A dpend donc
de ce quil croit que B fera.
La stratgie (haut, gauche) est un quilibre de Nash. En effet, si A choisi haut,
la meilleure chose que B puisse faire, cest choisir gauche puisque son gain est 1
sil choisit gauche et 0 sil choisit droite.
Nous dirons quune paire de stratgies est un quilibre de Nash1 si le choix
de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre faon de dfinir un quilibre de Nash est une situation dont personne
na intrt dvier individuellement, sachant la stratgie de lautre. Ne pas dvier
individuellement veut dire que les individus font un choix optimal qui maximise
leur utilit compte tenu de la stratgie de lautre. Lautre fait le mme
raisonnement compte tenu de la stratgie du premier joueur.
Exemple 1
Le concept dquilibre de Nash montre clairement quil sagit simplement
dune gnralisation de lquilibre de Cournot. Dans le cas de lquilibre de
Cournot, la variable de dcision est la quantit doutput produite qui est une
variable continue et chaque firme choisit loutput qui maximise son profit compte
tenu du choix de lautre firme.
En effet, lorsque le concurrent augmente sa production, la moins mauvaise
solution consiste, pour la firme, diminuer la sienne : ceci limite la baisse du
1John F. Nash junior, n en 1928, a reu le prix Nobel en 1994 avec ReinhartSelten et John
Harsanyi pour la thorie des jeux non coopratifs.
21
prix due la hausse de la production du concurrent, sans ncessairement viter la
diminution de la recette totale, et permet de diminuer le cot de production.
Exemple 2
Lquilibre de Bertrand, galement est un quilibre de Nash avec des
stratgies en prix. Chaque firme choisit le prix qui maximise son profit, compte
tenu du choix quelle pense que lautre firme fera.
Tout dabord, un jeu peut avoir plus quun quilibre de Nash. En fait, les
choix (bas, droite) correspondent galement un quilibre de Nash.
Le second est que pour certains jeux, de tels quilibres nexistent pas.
22
m ath m atique. Il s agit de pondrer le s gain s a s soci s a ux
dfrente s i s su e s par la probabilit de s urven a nce de celle s-ci.
Le principal argum e nt ava nc pour justifi er le recours a ux
stratgie s mixte s e st dordre m athm atiqu e. Nash a montr que
tout jeu information complte et imparfaite comporte au moin s
u n quilibre e n stratgie s mixte s. Lquilibre e nvis ag e st u n
quilibre de Nash.
Ain si accepter le s stratgie s mixte s lve lhypoth s e de
lv entuel non existence dun quilibre e n information complte
et imparfaite, et perm et de ju stifi er limportance accorde aux
quilibres. Cependant, la pris e e n compte des stratgie s mixte s
ne st pa s s a n s inconvnie nts. E ll e n e peut e ntraner quun e
a ugm e ntation du nombre dquilibre s.
Exemple :
R eprenon s le jeu dan s lequ el deux e ntrepris e s A et B ont la
pos sibilit de lancer un nouveau produit pour lequ el le s
dbouch s sont limit s, s a n s quil ny ait de compromis
E ntre elle s si toute s deux dcident de produire.la m atrice de s
gain s pour le s deux e ntrepris e s devraient re s s embler celle
pr s e nt e dan s le tableau 1.
Entreprise
B
Produit Ne produit
pas
Entrepri Produit 3, 1 1, 3
se Ne produit pas 0, 5 4, 2
A
23
1) Quels sont les quilibres de Nash en stratgies pures ?
2) Montrer quil existe aussi un quilibre de Nash en stratgie mixtes ?
Rsoudre le jeu :
Dans ce cas particulier, IL ny a pas dquilibre de Nash.
Il ny a pas de solution naturelle au jeu.
Ayant observ les comportements de deux firmes, on peut considrer que
Enterprise B choisira la stratgie produit et ne produit pas avec la mme
probabilit 1/2.
Enterprise A choisira la stratgie produit avec une probabilit 0,6 et la stratgie
ne produit pas avec une probabilit gale :
1-0,6= 0,4
Soit la matrice prenant en compte les probabilits des stratgies.
Entreprise
B
Produit Ne
(q=0,5) produit
pas
(q=0,5)
Entrepri Produit 3, 1 1, 3
se (p=0,6)
A Ne produit 0, 5 4, 2
pas (p=0,4)
24
S i E nt erpris e A utilis la stratgie mixte P = 0,6 et (1-
p) = 0,4, alors le gain e spr de E nt erpris e B a s soci s e s
stratgie s pure s e st :
E G B (produit) = (0,6 x 1) + (0,4 x 5) = 2,6
E G B (ne produit pa s) = (0,6 x 3) + (0,4 x 2) = 2,6
E nt erpris e B e st indiff rent e ntre s e s deux stratgie s produit et
n e produit pa s.
Pour E nt erpris e A :
E GA (produit) = (0,5 x 3) + (0,5 x 1) = 2
E GA (ne produit pa s) = (0,5 x 0) + (0,5 x 4) = 2
E nt erpris e A e st a u s si donc indiff rent e ntre s e s deux stratgie s
pure s mai s comm e E nt erpris e A s a it que E nt erpris e B jouera n e
produit pa s, elle va choisir n e produit pa s car elle gagnera S i
E nt erpris e B choisira de jouer produit l E nterpris e A va choisir la
stratgie produit pui squ e elle gagnera 3.
La solution e n stratgie mixte e st donc (ne produit pa s, n e
produit pa s) et
(Produit, produit) Limperfection de linformation rend lanalys e
n ettem e nt compliqu e. Il y a trs souv ent un e multiplicit
dquilibre s de Nash pos sible s. Pour le s s l ectionn er, on a
recours de s concepts de solution s plu s complexes, comm e
lquilibre bay si e n ou lquilibre s qu entiel qui permettent de
choisir e ntre le s quilibre s de Nash.
25
nincite un joueur quelconque retenir s a stratgie dquilibre
(lorsque le s a utre s lont fait) = = > v oir lexemple prcdents.
Mais videmm ent, il s u t quun s e ul joueur n e retienn e pa s s a
stratgie dquilibre pour que celuici n e s e rali s e pa s.
Il peut arriver quil y ait de s quilibre s de Nash au s e n s
faible av ec de s stratgie s pure s m ai s cela e st plutt
exceptionnel, alors que cela e st toujours le ca s av ec le s
quilibres e n stratgie s mixte s.
S e pose galem e nt la que stion de s avoir quelle signifi cation
donn er au fait que le s joueurs a nnoncent des probabilit s
daction s, alors que le but de modlis ateur e st dobtenir un ou
de s r sultats prcis.
E n outre, ds que lannonce e st faite, le jeu e st termin,
quelle que soit lis s u e. Pourtant derrire la notion de probabilit,
il y a lide de rptition qui perm et de s e faire un e opinion s ur
le caractre plus
Ou moin s probable dun v n em e nt.
26
Tableau 1 : La stratgie de Maximin.
27
e st peut risquer m ai s n e perm et pa s de m aximis er le s profits.
(Lentrepris e 1, par exemple, perd 10 million a u lieu de gagner
20 million s). R e m arquon s galem ent que si lentrepris e 1 s avait
de faon certaine que lentrepris e 2 adoptait u n e stratgie
Maximin elle aurait prfr inve stir (est gagner 20 millions
deuros) plutt que de s uivre s a propre stratgie Maximin qui
tait de n e pa s inve stir.
Conclusion
La thorie des jeux fournit un cadre d'analyse permettant d'tudier les situations
conflictuelles dans lesquelles les individus ou les firmes sont en interaction.
Lorsque peu de firmes dominent un march ou bien lorsque des pays concluent
un accord sur les politiques commerciales, les agents concerns (individus,
firmes, tats) doivent prendre en compte les ractions des autres et anticiper leurs
propres dcisions. Il sagit alors d'analyser la manire dont les agents
coordonnent ou peuvent coordonner leurs dcisions dans diffrentes
configurations.
28
Bibliographie
29
http://www.cril.univartois.fr/~konieczny/enseignement/TheorieDesJeux
.pdf
WWW.scholarvox.com
30