Vous êtes sur la page 1sur 13

I.

INTRODUCTION :

La théorie des jeux est un outil mathématique introduit en 1928 par JV NEUMANN et appliquée en
1944 { l’analyse des compétences économique. La référence de cette théorie s’intitule Théorie des jeux
et comportement économiques.
La théorie des jeux est maintenant utilisée pour toute sorte de prise de décision où le résultat du
comportement dépend du comportement de cet individu mais aussi du comportement de son ou ses
partenaires.
Dans ce contexte un agent ne contrôle pas tous les variables dont dépend son résultat. Cette théorie se
donne pour objectif la prise en compte et la formalisation des phénomènes d’interaction et
d’interdépendance directe entre les agents économiques. Cette théorie va attirer des spécialistes de
domaine nombreux et variés. Un nombre important de chercheur vont essayer de trouver des
formulations nouvelles en termes de théories des jeux des problèmes importants et anciens en
comparant les solutions nouvelles aux solutions anciennes et découvrant de nouvelles perspectives. L
La théorie des jeux va investir la théorie économique par plusieurs « entrées ».
 Entrée 1 : la théorie de l’échange : La théorie des jeux va permettre la distinction entre la
microéconomie WALRASSIENNE et la microéconomie EDGEWORTHIENNE qui utilise La théorie des
jeux et s’inspire de l’ouvrage de EDGEWORTH « MATHEMATICAL PSYCHICS » où le processus de la
microéconomie WALRASSIENNE et de lui substitué la microéconomie EDGEWORTHIENNE pour
réconcilier entre la microéconomie et la macroéconomie. Pour M.SHUBIK le modèle de Walras est
incomplet et inadéquat pour opérer la jonction micro et macro car il est statique indépendant du
nombre de joueur. Il décrit des états plutôt que des processus et les conditions d’informations sont
pauvres.
 Entrée 2 : la production :

l’application de la théorie des jeux au processus de production dans une économie est
relativement ancien. Il a tout d’abord concerné l’oligopole qui n’est rien d’autre que le faite que la
production d’un bien homogène est assurée par un nombre finit de producteurs.

 Entrée 3 : la théorie des choix sociaux :

la théorie des jeux a était appliqué au choix sociaux en générale et aux biens publique en
particulier. Elle va être appliquée à l’économie publique essentiellement sous la forme d’un jeu
coopératif où le nombre de joueurs est limité. Les théoriciens vont aussi chercher à analyser
comment les membres d’une Sté doivent partager conjointement les coûts lorsqu’ils veulent se
procurer un bien collectif/public.

 Entrée 4 : l’économie de l’information :

où la prise en compte en économie du concept d’informations est une préoccupation ancienne


qui a connue de nos jours en essor considérable. En suivant JP PONSSARD en peut dires que les
travaux sur l’économie de l’information reposent sur deux idées :
idée 1 : chaque agent sur la base de sa propre dotation en information des autres agents.
Idée 2 les comportements sont supposés transmettre au moins en partie les informations sur
lesquelles ces comportements se fondent. L’information dans cette 2ème idée va revêtir un
caractère stratégique qui dépend des canaux de communication existant dans une Sté donné à un
moment donné. Alors que dans le 1er type de travaux les relations interindividuelles sont
secondaires. Elles deviennent l’élément fondamental de la seconde conception qui débouche sur la
théorie des institutions social.

 Entrée 5 : la théorie des institutions sociales :

plus communément appelée Economie institutionnelle. C’est le problème de l’incitation des


agents à trouver des solutions pour faire face à des problèmes répétitifs. La solution est symbolisée
par l’émergence d’une convention de comportement ou l’institution sociale. Dans cette optique la
théorie des jeux est un outil permettant d’analyser la création, l’émergence, le fonctionnement et
l’évolution des institutions sociales.

II. Définition d’un jeu

« On peut associés au mot jeu les mots : règle, joueur, mouvement, stratégies, paiement, certain
concept de concurrence et de coopération et quelque notions souvent mal définit sur la nature et
l’importance de l’information » M.SHUBIK. Un jeu est l’ensemble des règles délimitant pour une
situation particulière les actions des joueurs en leur attribuant sur la base de ces actions des résultats.
La situation particulière est une situation d’interdépendance. Les résultats sur la base des actions
choisit par son ou ses partenaires vont donnés des résultats qui peuvent être positifs, négatifs ou nuls.
Un jeu est donc une suite de décision prise par des unités de décision (joueurs) dans des situations
régit par des règles.
Une stratégie est un plan qui dicte { chaque joueur ce qu’il doit faire dans chaque circonstance de
jeux. La stratégie est un principe de comportement, alors que les règles du jeu sont des contraintes
intransgressibles. Elles délimitent les espaces { l’intérieur desquelles les plans d’action que sont les
stratégies sont opérationnels.

REMARQUE :
dans la théorie des jeux les règles du jeu sont données de façon exogène.
Pour chaque n-tuple (une stratégie par joueur avec n joueurs) de stratégies les règles du jeu spécifient
le paiement ou le résultat que le jeu procure à chaque joueur.

EXEMPLE : « d. KREPS » :

Soit deux joueurs A et B, chacun des joueurs peut choisir chacune des options suivantes (caillou _
feuille _ ciseau)
 Si les 2 individus choisissant la même option alors le match est nul ;
 si un individu choisit caillou et l’autre feuille c’est la feuille qui gagne ;
 si un individu choisit caillou l’autre ciseau c’est le caillou qui gagne ;
 si un individu choisit feuille l’autre ciseau c’est le ciseau qui gagne.
En suppose que :
*le jeu est simultané
**lorsqu’il y a un gain l’individu qui gagne obtient une unité (DH, £,$...) s’il y a perte le résultat =-1
*** et s’il y a match nul le résultat est égal { 0

Joueur B Caillou Feuille Ciseau


joueur A
Caillou (0 ; 0) (-1 ; +1) (+1 ; -1)
Feuille (+1 ; -1) (0 ; 0) (-1 ; +1)
ciseau (-1 ; +1) (+1 ; -1) (0 ; 0)

La représentation sous la forme d’une matrice de décision en tableau { double entrées n’est pas la
seule représentation possible. On peut aussi représenter ce jeu du point de vue de chacun des joueurs,
du point de vue du joueur A :
Arbre de décision :

III. description d’un jeu

On oppose généralement la forme extensive à la forme réduite


1. la forme extensive :
Chaque participant a des actions possibles à chaque mouvement. Ces actions sont limitées par les
règles de jeu. En plus ces règles indiquent l’information disponible pour les joueurs en indiquant ce
qu’un joueur connait sur les actions passés des autres joueurs.
 Si un joueur connait tout les mouvements précédents alors le jeu est dit à information parfaite.
 Si le joueur ignore un mouvement ou un ensemble de mouvements alors le jeu est dit à information
imparfaite.
L’information parfaite est { distinguer de l’information complète. Un jeu est à information complète
si tous les individus connaissent toutes les règles du jeu. Si certains individus ne connaissent pas tout
ou une partie des règles du jeu alors le jeu est dit à information incomplète.
REMARQUE :
l’hypothèse de base de la théorie de jeux version NEUMANN MORGENSTERN est une théorie
des jeux à information parfaite et complète.

En représente généralement la forme extensive par un arbre de décision.

2. La forme réduite ou normale :

Elle se caractérise par 3 choses :


 Ensemble de joueurs noté J avec j= (1,2…i,…, n) s’il ya n joueurs ;
 Un espace de stratégie pour chaque joueur noté 𝑺𝒊 avec ∀𝒊, 𝒊 ∈ 𝑱 ;
 Une fonction de résultats pour chaque joueur noté 𝑹𝒊 avec ∀𝒊, 𝒊 ∈ 𝑱
𝑹𝒊 : définit le paiement que reçoit le joueur 𝒊 sur la base de la stratégie qu’il choisit d’une part et des
(n-1) stratégies de ses partenaires d’autres part. Normalement en devrait écrire 𝑹𝒊 (𝒔) avec S
=(𝑠1 , … . 𝑠𝑖 , … . 𝑠𝑛 ) qui est l’utilité associé aux résultats pour le joueur i lorsque le vecteur de stratégie
est S.
Généralement en représente la forme réduite sous forme d’une matrice ou d’un tableau { double
entrées.
Alors que la forme extensive prend en compte tous les détails (tous les mouvements) la forme réduite
s’attache principalement aux stratégies disponibles pour un joueur et aux résultats de tel stratégie. La
forme extensive est une sorte de livre d’instructions qui contiendrait ce que chaque joueur a
l’intention de faire dans chaque circonstance du jeu. La forme réduite est plus facile d’utilisation même
s’elle ne contient pas autant d’information par rapport { la forme extensive.

3. Relation entre forme extensive et réduite :

Nous disposons de 2 représentations possibles d’un jeu. Qu’il est alors le rapport d’une forme {
l’autre ?
A chaque jeu sous forme extensive correspond un jeu sous forme réduite. En revanche, un jeu sous
forme réduite peut correspondre en générale à plusieurs jeux sous forme extensive différents.
 A plusieurs forme extensive ne peut correspondre qu’une forme réduite
 A une forme réduite peut correspondre 2 ou plusieurs formes extensives.

IV. TYPOLOGIE DES JEUX :

Nous retiendrons principalement 3 typologies :


 Typologie 1 :
elle sera fonction du nombre de joueur n=2 et n>2
lorsque n>2 il u aura alors la possibilité de former des coalitions. (effectif)

 Typologie 2 :
les jeux à somme nulle et jeux à somme non nulle
Les jeux à somme nulle : décrivent des comportements de rivalité pure où le gain d’un joueur est
égal { la perte de son partenaire. Lorsque le gain et la perte ne sont pas fixés en raison inverse l’un
de l’autre, le jeu est appelé à somme non nulle. Dans ce cas tous les joueurs peuvent
simultanément retirer des résultats (positifs ou négatifs) d’une certaine stratégie. (Forme de
résultats)

 Typologie 3 : les jeux avec communication et jeux sans communication.


On appelle jeu avec communication un jeu coopératif. Les individus sont libres de communiquer
entre eux et de passer des contrats (possibilité de former des coalitions). Lorsque la
communication n’est pas permise alors le jeu est appelé non coopératif.
Exemple 1 :
Supposons 2 joueurs, un homme et une femme. Chacun a 2 possibilités, soit aller { l’opéra soit voir
un match de box. La femme préfère l’opéra et l’homme préfère le match de box. Mais leurs
préférences est d’être ensemble.
Homme Match de box Opéra
femme
Match de box (4,2) (1,1)
Opéra (0,0) (2,4)
n=2 à somme nulle (jeu coopératif)

Exemple 2 : le dilemme du prisonnier :

C’est la matrice la plus discuté dans la théorie de jeux. 2 individus sont soupçonnés d’avoir
accomplit un meurtre. Ils sont placés par la police dans 2 cellules différentes. La police propose un
marché { chacun d’entre eux, accuser votre complice et vous serez libre, niez et vous serez
condamné.
On peut représenter ce jeu par la matrice de résultats suivants :

𝑖 𝑗 NIER ACCUSER
NIER (4,4) (0,7)
ACCUSER (7,0) (1,1)

Exemple 3 : le jeu des enchères :

Un objet est mis aux enchères, i représente un acheteur potentiel qui attribut une valeur d’utilité 𝑼𝑖
{ l’objet. Son niveau d’utilité sera de la forme** (𝑽𝒊 − 𝒑) s’il reçoit l’objet et paie le prix P. ** 0 s’il
ne reçoit pas l’objet.
Chaque joueur fait une offre sous pli fermé. L’objet est alloué au plus offrant.
On ne peut pas formaliser ce jeu à travers une matrice. On aura alors recours à la forme réduite ou
normale définit par 3 choses :
* 𝐽 ensemble de joueur 𝐽 = (1,2…i,…, n)
*espace de stratégie : ∀𝑖 , 𝑥𝑖 [0, +∞[
(𝑽𝒊 − 𝒑)
*fonction de résultats ∀𝑖, 𝑅𝑖 =
0

V. Les concepts de résultats

Le but de la théorie des jeux est de trouver des concepts de solutions. L’idéale serai la solution
unique ce qui est rarement atteint.
 Si les conditions imposées sont trop forte alors en risque de ne pas trouver de solution. au contraire
 Si les conditions imposées ne sont pas trop forte il peut y avoir une infinité de solution.
Se posera alors le problème du choix d’une solution dans cette infinité. Ceci pose le problème de
l’approche positive contre l’approche normative.
1. Jeux à 2 personnes à somme nulle :

De façon réduite on peut décrire ce jeu par les éléments suivants :


* 𝑱 = 𝒊, 𝒋
* 𝑺𝒊 = 𝒔𝒊𝟏 , 𝒔𝒊𝟐 , … 𝒔𝒊𝒎
* 𝑺𝒊 = 𝒔𝒋𝟏 , 𝒔𝒋𝟐 , … 𝒔𝒋𝒓
Chaque joueur a un nombre finit de stratégie, m stratégies pour 𝑖 et r stratégies pour 𝑗.
Les stratégies choisit par 𝑖 et 𝑗 vont déterminés les résultats. On appelle 𝑨𝒎𝒓 le résultat pour l’agent 𝑖
s’il choisit sa stratégie m et si 𝑗 choisit sa stratégie r. on appelle le résultat 𝑩𝒓𝒎 pour l’agent 𝑗 s’il choisit
la stratégie r et si 𝑖 choisit la stratégie m. Avec 𝑨𝒎𝒓 = −𝑩𝒓𝒎 car le jeu est à somme nulle.
Problème : chaque joueur se trouve confronté au choix d’une stratégie en l’absence d’information sur
le comportement de son partenaire.
𝑖 𝑗 𝒔𝒋𝟏 𝒔𝒋𝟐 𝒔𝒋𝟑 MIN ligne
𝒔𝒊𝟏 2 4 4 2
𝒔𝒊𝟐 3 5 3 3 max min
𝒔𝒊𝟑 1 -3 1 -3
MAX colonne 3 min max 5 4

Seul les 𝑨𝒎𝒓 sont représentés. Cependant tout le raisonnement est transposable à 𝑩𝒓𝒎. Le but pour
l’individu 𝑖 est de maximiser son résultat. 𝑖 Et 𝑗 connaissent tous les deux la matrice des résultats.
L’incertitude se résume dans quel comportement le partenaire va choisir.
 Si 𝑖 choisit 𝒔𝒊𝟏 il est sur de gagner au moins 2 ;
 Si 𝑖 choisit 𝒔𝒊𝟐 il est sur de gagner au moins 3 ;
 Si 𝑖 choisit 𝒔𝒊𝟑 il est sur de perdre au moins 3 ;
 Si 𝒔𝒊𝟐 est une stratégie particulaire. C’est le maximum des minimums pour l’agent𝑖. C’est la
stratégie optimale appelé MAX MIN. la min des lignes représente les plus mauvais résultats que 𝑖
peut obtenir. Le max des colonnes représente les plus mauvais résultats que 𝑗 peut obtenir.
 𝒔𝒋𝟏 est une stratégie pour 𝑗 où la valeur à payer est la moins élevée possible, en quelque sorte la
min des max { perdre. C’est le MIN MAX.
 Lorsque MAX MIN = MIN MAX le jeu est strictement déterminé et le point d’équilibre s’appelle
point de selle. Et la valeur de ce point est appelée valeur du jeu.
Le comportement max min consiste { prévoir le pire et { se prémunir contre ce risque. C’est le
résultat qu’un agent peut obtenir en supposant que son partenaire lui fera autant de dommage que
possible.
Lorsqu’il existe un point de selle, le résultat sera stable. Autrement dit aucun n’a intérêt à dévier de
stratégie.
Point selle  min max  max min  équilibre  stabilité  pas de
changement de décision

REMARQUE : il existe cependant des jeux qui ne sont pas strictement déterminé. Autrement dit où
min max sera différent de max min. ce jeu ne sera pas stable, autrement dit un agent peut améliorer
ses résultats en choisissant à chaque fois de nouvelles stratégies. Dans les jeux sans col en aura des
difficultés pour trouver des stratégies stable.
EXEMPLE :
𝑖 𝒔𝒋𝟏 𝒔𝒋𝟐 MIN ligne
𝑗
𝒔𝒊𝟏 -4 2 -4
𝒔𝒊𝟐 5 -3 -3
MAX colonne 5 2

Dans cette situation on reformule le problème de la manière suivante : au lieu que les individus
choisissent des stratégies pures comme dans un jeu strictement déterminé, ils choisiront des
probabilités avec lesquelles ils joueront leur stratégies pures. On appelle cela des stratégies mixtes
qui ne sont rien d’autre que des distributions de probabilités sur l’ensemble des stratégies pures.
L’individu se trouve confronter { un problème d’anticipation. Il va choisir ses stratégies de manière
aléatoire étant données 𝑃 = 𝑃𝑠 avec 𝑠 ∈ 𝑆 , ∀𝑠 ≥ 0, 𝑠 𝑃𝑠 = 1 .
On appelle P distribution de probabilité ou stratégies mixtes. Cette conception des stratégies
mixtes même s’elle peut paraitre contre nature n’en reste pas moins très importante pour la théorie
des jeux.
Certains auteurs ont montrés que le passage aux stratégies mixtes permettait d’assigner { n’importe
quel jeu à 2 personnes à somme nulle un point de selle. Lorsqu’il n’existe pas de col (min max ≠max
min) dans un jeu à 2 personnes à somme nulle en présence de stratégie pure, alors le passage aux
stratégies mixtes permet de déterminer un col et donc un équilibre et donc des stratégies stables pour
les joueurs.
Une stratégie mixte a autant de terme qu’il existe de stratégie pure (si on a 185 S. pure 185 S. mixte)

EXEMPLE :
Soit 𝑃 = (𝑝1 , 𝑝2 ) : la stratégie mixte du joueur 𝑖 𝑀 = (𝑚1 , 𝑚2 ) : la stratégie mixte du joueur 𝑗
𝑚1 , 𝑚2 ≥ 0 𝑒𝑡 𝑝1 + 𝑝2 ≥ 0 𝑒𝑡 𝑚1 + 𝑚2 = 𝑝1 + 𝑝2 = 1
𝑖 𝒔𝒋𝟏 𝒔𝒋𝟐
𝑗
𝒔𝒊𝟏 -4 2
𝒔𝒊𝟐 5 -3
Supposons que les résultats obtenus { l’équilibre soit respectivement 𝑹𝒊 pour 𝒊 et 𝑹𝒋 pour𝒋. Nous
disposons donc pour chaque individu d’un système de 3 équations { 2 inconnus que le calcul
algébrique permet de déterminer.
 L’agent 𝒊 va résoudre le programme suivant :
𝒑𝟏 ∗ −𝟒 + 𝒑𝟐 ∗ 𝟓 = 𝑹𝒊 𝟖
𝒑𝟏 = 𝟏𝟒
𝒑𝟏 ∗ 𝟐 + 𝒑𝟐 ∗ (−𝟑) = 𝑹𝒊  𝟔
𝒑𝟏 + 𝒑𝟐 = 𝟏 𝒑𝟐 = 𝟏𝟒
Comme le jeu est { somme nul alors l’agent 𝒋 résoudra le programme suivant :
𝒎𝟏 ∗ 𝟒 + 𝒎𝟐 ∗ (−𝟐) = 𝑹𝒋 𝒎𝟏 =
𝟓
𝟏𝟒
𝒎𝟏 ∗ (−𝟓) + 𝒎𝟐 ∗ (𝟑) = 𝑹𝒋  𝟗
𝒎𝟏 + 𝒎 = 𝟏 𝒎𝟐 = 𝟏𝟒
A l’équilibre en obtient : 𝑹𝒊 =-1/7 et 𝑹𝒋 = +𝟏/𝟕
La valeur espérée pour le joueur 𝒊 est une perte de 𝟏/𝟕 , le pire qui puisse arriver au joueur 𝒊 s’il
𝟖 𝟔
utilise sa stratégie mixte 𝟏𝟒 , 𝟏𝟒
est une perte de 𝟏/𝟕 ce qui est préférable au max min = -3
Ce qui est identique comme raisonnement pour 𝒋 avec 𝑹𝒊 = − 𝑹𝒋
Conclusion : dans un jeu { 2 personnes { somme nulle lorsqu’il y a incertitude sur le comportement
du partenaire en peut arriver à une compatibilité des comportements si chacun choisit de se
comporter selon la stratégie max min. cette compatibilité peut se trouver rompue lorsque min max ≠
max min. dans ce cas le passage aux stratégies mixtes permet de rétablir cette compatibilité et donc
de trouver un équilibre et donc des stratégies stables.
Min max ≠max min  stratégies mixtes  col  équilibre  stabilité.
Cette solution est limitée à un jeu à deux personnes à somme nulle. Il existe cependant des jeux où le
nombre de participant est > 2 et ou la somme des résultats est ≠ 𝟎.

2. Les jeux coopératifs :

Les joueurs vont unirent leurs efforts pour obtenir un profit commun maximum et le répartir en
suite entre eux de façon à ce que chacun reçoive au moins ce qui aurait pus obtenir en agissant seul. Le
concept important dans cette analyse est celui d’imputation. Les individus qui font partie d’une
coalition n’y resteront que s’ils y trouvent un intérêt ou si non ils se rattacheront { d’autre coalitions
ou en créant d’autres. Cette idée touche aux travaux de l’économiste anglais EDGEWORTH dans
« mathemaical psychics » et son fameux contrat répétitif où les membres d’un assemblé essayent de
négocier des contrats et donc créer des coalitions pour maximiser leur utilité, les résilient s’ils
trouvent de meilleures coalitions et ainsi de suite. Cala mène au cœur de l’économie où l’ensemble des
coalitions ne sont pas dominées. Le processus edgeworthien va donner une substance { l’équilibre
coopératif à n personnes.

a. Cœur / noyau de l’économie :

En définira une imputation comme une redistribution des ressources tel que :
 Chaque joueur reçoit au moins autant que ce qu’il peut s’assurer en jouant seul.
 La somme des paiements de tous les joueurs = { la somme des paiements qu’ils détiendraient en
jouant tous ensemble.
Supposant 2 types de consommateur. L’idée centrale du modèle d’Edgeworth est le recontracting.
Autrement dit la répartition du contrat tel que :
 Un agent au moins préfère le nouveau contrat ;
 Aucun agent ne préfère strictement l’ancien contrat.
L’ensemble des contrats que l’en ne peut pas renégocier vont constituer le cœur de l’économie.
Hypothèse 1 : soit un ensemble d’échangiste au sens de négociateur dans une économie d’échange.
Chaque individu a une relation de préférence continue strictement convexe et est insatiable sur son
espace de marchandise.
Hypothèse 2 : les marchandises sont divisibles ;
Hypothèse 3 : une coalition S est un groupe quelconque d’individu (des consommateurs) ;
Hypothèse 4 : une affectation est une allocation d’un panier de consommation à chaque échangiste.
Une affectation ou distribution (𝒙𝟏 , … . 𝒙𝒊 … … , 𝒙𝒏 )qui est un vecteur de marchandise est dite réalisable
pour une coalition S de n membres (𝑺𝒏 ) si 𝒏𝒊=𝟏(𝒙𝒊 − 𝒘𝒊 ) = 𝟎 avec 𝒙𝒊 : demande de l′ agent 𝒊 et 𝒘𝒊 :
dotation initiale de l’agent 𝒊
La distribution 𝒙𝟎𝒊 = (𝒙𝟎𝟏 , … … 𝒙𝟎𝒊 , … … … 𝒙𝟎𝒏 ) par 𝑺𝒏 s’il existe un vecteur 𝒙𝟏𝒊 = (𝒙𝟏𝟏 , … … 𝒙𝟏𝒊 , … … … 𝒙𝟏𝒏 ) tel
que :
 𝒏𝒊=𝟏(𝒙𝟏𝒊 − 𝒘𝒊 ) = 𝟎 : 𝒙𝟏𝒊 doit être réalisable.
 ∀𝒊 ∈ 𝑺 , 𝒙𝟏𝒊 ~𝒊 𝒙𝟎𝒊 ⋰ 𝒊′ ≠ 𝒊 pour lequel 𝒙𝟏𝒊′ >𝒊′ 𝒙𝟎𝒊′ .
Il est possible d’obtenir une allocation préférée par au moins un individu de la coalition S. le cœur
d’une économie sera formé par l’ensemble des allocations qui ne sont bloquée par aucune coalition. Le
cœur est formé d’affectations d’équilibre autrement dit des situations où aucun agent ne peut
améliorer sa situation vis-à-vis de l’échange.

REMARQUE :
pour qu’une affectation du cœur soit Pareto optimale, il faut nécessairement que la coalition S soit
formée par l’ensemble des échangistes dans une économie donnée.
Le cœur est le concept de solution le plus répondu. Il désigne des imputations particulièrement stables
puisqu’aucun individu n’a intérêt { rompre ou { sortir de la coalition dont il fait parti. Après avoir
déterminé comment les individus peuvent atteindre le maximum de résultats se pose la question de la
répartition de ce résultat entre ces individus.
b. La valeur de SHAPLEY :
En 1953 SHAPLEY suppose qu’il y a un nombre finit d’agents et qu’ils peuvent coopérer par
contrat. Il suppose qu’il existe un moyen d’échange pour transférer la valeur entre les membres d’une
coalition (par ex la monnaie) plusieurs axiomes sont nécessaires pour définir la valeur de SHAPLEY
Axiome 1 : l’indépendance de l’ordre. Il y a un traitement égal entre les joueurs.
Axiome 2 : l’absence du joueur inutile. Si un agent n’apporte rien { la coalition il ne gagne rien.
Axiome 3 : l’additivité.
o La valeur obtenue l’hors de 2 jeux successif est la somme des valeurs obtenue la 1ère fois plus la 2ème
fois.
o La valeur d’une coalition est la somme de la valeur de SHAPLEY des individus qui forment cette
coalition.
o Si un jeu se décompose en 2 sous jeux la valeur de SHAPLEY du jeu est pour chaque joueur la
somme des valeurs des 2 sous jeux.
∀𝒊
= 𝒋𝒐𝒖𝒆𝒖𝒓 ; 𝑵: 𝒄𝒐𝒂𝒍𝒊𝒕𝒊𝒐𝒏 𝒅𝒆 𝒕𝒐𝒖𝒔 𝒍𝒆𝒔 𝒋𝒐𝒖𝒆𝒖𝒓𝒔; 𝑺: 𝒄𝒐𝒂𝒍𝒊𝒕𝒊𝒐𝒏 𝒅𝒆 𝒕 𝒋𝒐𝒖𝒆𝒖𝒓𝒔 𝒒𝒖𝒆𝒍𝒄𝒐𝒏𝒒𝒖𝒆
On appelle 𝑉 une fonction caractéristique. 𝑽𝒊 Est la valeur de SHAPLEY pour l’individu 𝒊 , elle est
égale de S inclut dans N et 𝒊 appartenant à la coalition S.
𝒕−𝟏 ! 𝒏−𝟏 !
𝑽𝒊 = ∗ [𝑽 𝑺 − 𝒗( 𝑺 − 𝒊)]
𝒏!
𝑺⊂𝑵
𝒊∈𝑺
𝑽 𝒔 − 𝑽(𝒔 − 𝒊) : représente l’apport marginale du joueur 𝒊 à la coalition S
o Si 𝒊 appartient à la coalition, on dit que la coalition est gagnante et cette expression prendra la valeur
1.
o Si la coalition est non gagnante (𝒊 n’appartient pas { la coalition) l’expression prendra la va leur 0.
n : représente le nombre d’individu dans la coalition N.
t : représente le nombre d’individu dans la coalition S.
Pour toutes les combinaisons gagnantes (qui contiennent i) la valeur de SHAPLEY pour le joueur 𝒊 sera
𝒕−𝟏 ! 𝒏−𝟏 !
égale à 𝒏!

Exemple :
Supposons une Sté formé de 4 personnes (1, 2, 3, 4) qui détiennent respectivement 10%, 20%, 30% et
40% du capital. Les décisions sont prisent à la majorité absolue des voies (50% des voies plus une
voie). Chaque actionnaire a autant de voies que d’actions.
Problème : parmi ces 4 actionnaires qu’il est celui qui a le plus de pouvoir ?
Solution : pour résoudre ce problème il convient tout d’abord de dresser la liste de toutes les
coalitions possibles qui répondent au principe de décision énoncé (50% des voies plus une voie).
2,4 3,4
1,2,3 1,2,4 1,3,4 2,3,4
1,2,3,4
On peut alors calculer pour chacun des joueurs sa valeur de SHAPLEY :
Pour le joueur 1 : on dresse la liste de toutes les combinaisons gagnantes
1,2,3 1,2,3,4 1,3,4 1,2,4 .
𝒕−𝟏 ! 𝒏−𝟏 ! 𝟑−𝟏 ! 𝟒−𝟑 !
Pour la combinaison gagnante 1,2,3 la valeur de SHAPLEY = 𝒏!
= 𝟒!
.

Comme la valeur de SHAPLEY ne dépend pas des individus mais des effectifs de coalition gagnante et
𝟑−𝟏 ! 𝟒−𝟑 ! 4−1 !
des effectifs totaux alors la valeur de HAPLEY pour l’individu i : 3 ∗ + = 0.5 = 𝑉1 et
𝟒! 4!

𝑉2 = 0.58 et 𝑉3 = 0.58 et 𝑉3 = 0.66


Plus le pouvoir de former des coalitions gagnantes seront élevé et plus la valeur de SHAPLEY ne sera
élevée. Donc plus un individu aura une valeur de SHAPLEY élevée est plus son pouvoir de
négociation sera important.
3. Les jeux non coopératifs :
Alors que les jeux coopératifs les coalitions sont en centre de l’analyse, dans les jeux non coopératifs
seuls les individus sont pris en compte. Aucun agent ne transfert une quelconque parcelle de son
pouvoir de décision à une quelconque autorité comme cela est le cas dans les jeux coopératifs.
A partir des années 70 l’approche par la théorie des jeux non coopératifs est devenue quasiment
hégémonique. Dans la théorie des jeux non coopératifs 2 solutions techniques sont généralement
utilisées.
a. L’élimination des stratégies dominées :
Supposons un jeu sous forme réduite suivante :
𝑖 𝑗 𝒔𝒋𝟏 𝒔𝒋𝟐
𝒔𝒊𝟏 (3,6) (7,1)
𝒔𝒊𝟐 (5,1) (8,2)
𝒔𝒊𝟑 (6,0) (6,2)
L’individu 𝑖 ne choisira pas la stratégie 𝒔𝒊𝟏 car quelque soit le choix de 𝑗 ,la stratégie 𝒔𝒊𝟐 lui procure un
gain supérieur. Donc
𝒔𝒊𝟐 domine𝒔𝒊𝟏 . En poursuivant ce même raisonnement avec la même démarche l’agent 𝑗 parvient à la
conclusion que i ne choisira passa stratégie 𝒔𝒊𝟏 alors sa stratégie 𝒔𝒋𝟐 dominera sa stratégie𝒔𝒋𝟏 .
Pour l’agent 𝑖 𝒔𝒊𝟐 domine 𝒔𝒊𝟑 donc l’équilibre est donné pour 𝒔𝒊𝟐 ; 𝒔𝒋𝟐 . C’est une règle simple qui
consiste à éliminer les stratégies dominées et à réduire le jeu après élimination successive des
stratégies dominées. C’est ce que l’on appelle élimination itérative ou récursive ou successive de
stratégies dominées.
Dans certains cas on peut faire des prédictions mais dans beaucoup d’autre cas cette solution
d’élimination des stratégies n’est pas applicable. La solution la plus couramment utilisé est l’équilibre
de NASH

b. L’équilibre de NASH :

Un équilibre de NASH est une liste de stratégie de chacun des joueurs tels qu’aucun d’eux n’a intérêt {
changer de stratégie seul. C’est l’idée selon laquelle tout joueur qui change seul sa décision ne peut
obtenir un niveau d’utilité supérieur { celui qu’il avait en situation d’équilibre. Les autres joueurs
ayant conservé leurs anciennes stratégies.
Dans un jeu { n personnes où la formation de coalition n’est pas possible, 𝑺∗ = 𝒔∗𝟏 , … . . 𝒔∗𝒊 … … … . , 𝒔∗𝒏
est dit équilibre non coopératif ou équilibre de NASH. Si étant donné (n-1) décisions, le nème joueur
ne peut pas augmenté ses résultats en changeant sa propre stratégie.
Supposons que le joueur i anticipe que ses partenaires vont choisir le vecteur de stratégie suivant S-
1= (𝑠1 , . . 𝑠𝑖−1 , 𝑠𝑖+1 .. 𝑠𝑛 )
Alors l’agent i va choisir 𝒔∗𝒊 qui maximise son résultat étant donné son anticipation du comportement
de ses partenaires. Formellement ∀𝑖, 𝑠𝑖 = max⁡
(𝑠𝑖 , 𝑠 − 𝑖) s’il existe un n-tuple de stratégie où un agent
peut rester, car personne n’a intérêt { changer de décisions, alors cette n-tuple est appelé équilibre
non coopératif/équi.de NASH. 𝑺∗ = 𝒔∗𝟏 , … . . 𝒔∗𝒊 … … … . , 𝒔∗𝒏 𝑺∗ Est dit équilibre de NASH si :
∀𝑖, 𝒔∗𝒊 ∈ 𝑺 𝝅𝒊 𝒔∗𝟏 , … . . 𝒔∗𝒊 … … . , 𝒔∗𝒏 ≥ 𝝅𝒊 𝒔∗𝟏 , … . . 𝒔∗𝒊 … … . , 𝒔∗𝒏
Pour tout joueur i et ∀𝑖, 𝒔∗𝒊 ∈ 𝑺 avec 𝝅𝒊 le résultat pour le joueur i si lui et ses partenaires choisissent
certaines stratégies. Aucun joueur ne peut bénéficier d’une déviation, et cela quelque soit la décision
qu’il choisit dans sont espace de stratégie s’il est { l’équilibre de NASH.
Remarques :
 Le dilemme des prisonniers : en 1950, 2 mathématicien DRESHER et FLOOD vont essayer de
tester la robustesse de l’équilibre de NASH. Tucker va inventer l’histoire du dilemme du
prisonnier. 2 personnes accusées d’avoir enfreint la loi sont détenus séparément par la police ou
peut symboliser cela par la matrice de résultat suivante :
𝑖 j Nier Accuser
Nier 8,8 0,10
Accuser 10,0 1,1 équilibre de Nash
Ce célèbre jeu montre que :
La confrontation des intérêts individuels ne débouche pas nécessairement sur l’intérêt collectif ou
optimum de Pareto. On observe une extraordinaire diversité d’application de ce jeu (dans le
domaine militaire, économique, social…etc.)

 L’existence de l’équilibre de NASH :

On peut décrire le processus qui mène vers l’équilibre de NASH de la manière suivante :
** chaque joueur choisit une stratégie dans son espace de stratégies.
**en fonction des résultats que lui procure cette stratégie et au vu des (n-1) stratégies de ses
partenaires il modifie son choix. Cela va se faire simultanément pour les n joueurs.
**le processus se continue à travers la règle de modification des stratégies jusqu’au moment où le
passage entre 2 itérations successives laisse le n-tuple de stratégies inchangé. Autrement dit les
individus n’ont plus intérêts { changer de décision. Cette n-tuple est appelée équilibre de NASH. Ce
processus est basé sur le théorème du point fixe.
La version du théorème du point fixe de BROUWER est : toute fonction continue d’une patrie D fermée
et bornée et convexe de Rn dans elle-même admet un point fixe. Autrement dit 𝑥 ∈ 𝐷 𝑡𝑒𝑙 𝑞𝑢𝑒 𝑓 𝑥 = 𝑥.
 L’équilibre de NASH est stable : une fois se point d’équilibre atteint, il sera stable. Les individus
n’en bougeront pas si l’histoire du jeu ou les événements les y conduisent. Si S* est un équilibre de
NASH alors les joueurs ont toute les chances de respecter se vecteur de stratégies comme l’écrit
H.MOULIN aucun individu n’est tenue { respecter sa promesse de jouer s*. cependant la plus petite
probabilité pour que les autres joueurs jouent s* va augmenter. La probabilité pour l’individu i de
jouer s* puisque cette dernière est la meilleur réponse à S-i et ainsi il existe une sorte de
phénomène de convergence psychologique vers l’issue S*.

 L’équilibre de NASH est non optimal :

NIER ACCUSER
NIER 4 ;4 0 ;7
ACCUSER 7 ;0 1 ;1

Si l’on se situe dans le cas typique d’un équilibre de NASH représenté par la matrice svte : Il se peut
que dans ce cas de figure chaque joueur au nom de l’intérêt individuel joue sa 2ème stratégie. Ce mode
de comportement représente un équilibre de NASH. Cependant cette stratégie est non optimale au
sens de l’intérêt général. En se coalisant, les individus aurait du atteindre une situation où le résultat et
(4 ;4).
La stratégie (si2 ;sj2) n’est pas un optimum au sens de Pareto car elle est dominée par la stratégie
(si1 ;sj1).
Une idée de cet équilibre de NASH se trouve dans le modèle du duopole de COURNOT que l’on peut
représenter comme un jeu non coopératif à 2 personnes qui est soit :
**un cas particulier de l’équilibre de NASH lorsque n=2, les conditions de l’équilibre de COURNOT
satisfaisant aux conditions de l’équilibre de NASH.
**l’équilibre de NASH étant la généralisation de l’équilibre de COURNOT lorsque le nombre de joueur n
augmente.
Pour développer ces idées il convient de définir le concept de duopole.

 Le duopole :

C’est une structure oligopolistique qui se caractérise par la confrontation d’un petit nombre de
vendeur (n=2). La politique de chaque agent va dépendre de la manière dont il pense que ses
concurrents vont réagir. Interdépendance et Incertitude sont les 2 caractéristiques fondamentales
des marchés oligopolistiques. Donc comment dans ces conditions va se faire le partage du marché ?
Les variables sur lesquels vont se porté les choix des oligopoleurs seront soit les quantités offertes soit
les prix affichés soit les deux. Une seconde variable importante concernera la nature du comportement
et sa façon de se tenir { l’égard de ses partenaires. Selon la nature du comportement et les variables
prix ou quantité retenue en distingue 3 modèles du duopole que l’on peut représenter
schématiquement de la façon svte :
Comportements pacifique agressif
variables
quantité Cournot Stackelberg
prix bertrand

**Le duopole de COURNOT :


le mode de comportement est pacifique ; aucun entrepreneur ne cherche à dominer le marché. Chaque
duopoleur observe passivement le marché et anticipe le même comportement chez son partenaire.
Soit C1(q1) et C2(q2) les fonctions de couts des entreprises 1 et 2.
Soit W1 et W2 leur fonctions de profit avec W1=p.q1- C1(q1) et W2=p.q2- C2(q2) et p=p(q)
avec Q=q1+q2
L’équilibre de Cournot sera donné par les 2 équations svtes :
p(q) +p’(q).q1- C’(q1)=0 et p(q) +p’(q).q2- C’(q2)=0
le calcul d’extremum fait que nous pouvons sortir de ces équations un couple d’offres (q*1 ;q*2) qui
va satisfaire et vérifier ces 2 équations qui représentent les fonctions de réaction des 2 entreprises
rivales. Elles expriment les réponses optimales en fonction de leur anticipation sur le comportement
se leur partenaires. La confrontation de ces 2 fonctions conduit { l’équilibre de Cournot.
Si le duopoleur 1 produit une quantité donnée le duopoleur 2 ajustera sa production et ainsi de suite
jusqu'à arriver au point (q*1 ;q*2) ou point de débit optimale ou point d’équilibre de Cournot. Le
point correspond à un équilibre de NASH.
En effet S*=(s1* ….si*….sn*) est un équilibre de naSH si : ∀i ;𝜋𝑖(𝒔𝟏∗ … . 𝒔𝒊∗ … . 𝒔𝒏∗ )
> 𝜋𝑖(𝒔𝟏∗ … . 𝒔𝒊∗ … . 𝒔𝒏∗ ) pour tt si ∈Si
avec E (q*1 ;q*2) qui remplit les conditions d’un équilibre de NASH car 𝜋1 (q*1 ;q*2)> 𝝅𝟏(𝒒𝟏 ; 𝒒∗ 𝟐)
et
𝝅𝟐 (q*1 ;q*2)> 𝝅𝟏(𝒒∗ 𝟏 ; 𝒒𝟐).
q*1 et q*2 sont les niveaux de production optimaux du 1er et du 2ème duopoleur. Une variante de ce
modèle est donné par le duopole de Stackelberg.

**le duopole de stackelberg :

Par opposition au modèle de Cournot ce modèle se distingue par l’information dont dispose un des
2 duopoleurs. On suppose qu’un duopoleur connait la fonction de coût de l’autre duopoleur ce qui
permet de calculer la fonction de réaction de son partenaire et de faire une offre en tenant compte de
cela. Un des duopoleurs va dominer le marché et se conduire en tant que meneur et l’autre en tant que
Suiveur. Le meneur aura un rôle actif sur le marché et le suiveur aura un role passif sur le marché.
C’est le meneur qui choisit en 1er son niveau de production. Il détermine sa politique optimale en
considération de la Qté qu’il supposera que le suiveur mettra sur le marché. Le suiveur maximisera son
profit en acceptant le choix du meneur comme une donné. Et donc le programme de maximisation du
meneur sera max w1(q1,q2) sous contrainte q2=f(q1) qui est la fonction de réaction du suiveur.
Cette équation n’a qu’une seule inconnue ; elle va nous permettre de déterminer la valeur de q1. Celle
du duopoleur 2 sera connue à travers q2=f(q1).
Les courbes d’isoprofit qui correspondent à des niveaux de profit croissants de bas en haut vont
permettre de déterminer l’équilibre de Stackelberg. Il se situe au point de tangence de la courbe de
réaction du suiveur avec l’une des courbes d’isopeofit du meneur. C’est le point de la courbe de
réaction du suiveur qui assure au meneur le profit le plus élevé possible.
Le partage du marché dépendra de la Qté d’information dont dispose chaque duopoleur. Celui qui a le
plus d’informations va dominer le marché et va gagner plus. Le meneur a une information parfaite sur
le suiveur alors que le suiveur n’a aucune information précise sur le meneur. Grace à cet avantage
informationnel le meneur peut manipuler son adversaire pour obtenir un niveau de profit qui est plus
élevé et qui dépasse le profit qu’il aurait pu réaliser au point d’équilibre de Cournot.
**le duopole de BERTRAND :

On suppose dans se cas que les duopoleurs proposent un prix pour le bien qu’ils produisent, ce qui va
changer radicalement la nature des modèles de coordination. Il suffira qu’un duopoleur affiche un prix
même très légèrement inférieur { celui de l’autre duopoleur pour que toute la demande se porte sur
lui. Se sera alors la guerre des prix qui ne s’arrêtera jamais et donc il n’y aura pas d’équilibre.
Bertrand propose un certain nombre de conditions qui permettront de désigner un équilibre :
Un coût unitaire constant.
Des capacités de production tel que chaque duopoleur peut servir toute la demande lorsque le prix
est égale au coût unitaire. Dans ce cas si chaque duopoleur affiche un prix égal au coût unitaire alors il
y’aura équilibre. A cette équilibre (prix=c. unitaire) aucun duopoleur n’a intérêt à baisser son prix
(celui qui le ferait vendrait à perte) ni { l’augmenter car celui qui le ferai n’aurait aucun acheteur.
Remarque : même si l’équilibre au sens de Bertrand existe, il est peut satisfaisant car il implique un
profit nul est donc dans ces conditions pourquoi produire ?

VI. Les jeux impurs

Il s’agit des menaces et de la crédibilité de la menace en théorie des jeux. Dans l’équilibre coopératif en
trouve tout ce qui touche à la menace et à sa crédibilité. En effet la coopération suppose la formation
de coalitions et la décision commune d’une stratégie. Les joueurs transfers une partie de leur povoir {
une autorité collective. Ils s’engagent { respecter les accords émanant de la coalition à laquelle ils
appartiennent. Cependant dans un jeu non coopératif les individus n’abandonnent pas la moindre
parcelle de leur pouvoir dans le choix de leurs stratégies. C’est pourquoi dans un jeu non coopératif le
choi d’une stratégie ne constituera jamais un réel engagement si le jeu ne dure qu’une seule période.
Certains auteurs pour résoudre ce problème vont construire le concept de jeux impurs qui sont des
jeux non purement coopératifs. Ils supposent une hiérarchie dans le jeu. Certains agents reçoivent les
stratégies des autres avant de transmettre les leurs sans un jeu à 2 personnes i et j. j par exemple est
autorisé à choisir une stratégie et à la communiquer à i avant que le jeu ne commence.
Si l’on suppose que i va jouer avant j et que durant le jeu les agents ne communiquent pas, alors la
prise e compte de la capacité de réponse de i à j pose 2 problèmes :
*comment s’assurer que i ne trompera pas j ?? **comment s’assurer que j ne trompera pas i ??
Pour résoudre cela certains auteurs vont introduire la notion de punition.
L’agent qui communique sa stratégie en 1er va jouer en dernier. Cependant, dans un jeu à n
personnes à une seule période, l’agent qui joue en dernier détient le monopole de la punition et
devient don un dictateur. Celui qui passe { l’action en dernier peut punir n’importe lequel de ces
partenaires. Cela va poser le problème du contrôle de l’agent qui passe { l’action en dernier.
Cependant, si toute chose étant égale par ailleurs, le jeu se répète un grand nombre de fois. On peut
assister { un phénomène d’apprentissage de la menace d’une part et { un partage du pouvoir de
punition d’autre part.

VII. la notion de super jeux (jeux répétés à horizon finit)

La vie économique a indéniablement un caractère répétitif. Il semble alors logique d’intégrer cette
donnée dans la représentation de la réalité. Les jeux répétés constituent une catégorie de jeux
essentielle dans la réalité ; c’est le concept de super jeux ou jeux simple qui se répètent { l’identique
un nombre grand mais fini de fois. C’est un schéma plus subtil que le jeu simple. Il permet la prise en
compte du temps d’une part et des phénomènes d’apprentissage d’autre part qui vont aider les joueurs
à stabiliser leurs engagements et à partager le monopole de la punition.
Dans un super jeu, les participants sont soumis à un horizon temporel moins limité que dans un jeu à
une seule période. Les joueurs ne choisiront pas seulement une stratégie pure si ou une stratégie
mixte p(si) mais choisiront un mode de comportement qui gouvernera leur comportements durant
toute la période du jeu.
Ui(si1/sj1) signifie que i jouera sa stratégie si1 aussi long temps que j joue sa stratégie sj1. Si l’agent j
dévie en changeant de stratégie alors i le pénalisera en jouant sa stratégie si2 pour le restant du jeu.
D’après MOULIN un joueur peut se faire piéger une fois mais pas 2.
On peut représenter se mode de comportement de la manière suivante :

Vous aimerez peut-être aussi