Académique Documents
Professionnel Documents
Culture Documents
Année universitaire
2022-2023
SOMMAIRE
INTRODUCTION .................................................................................................................... 3
CONCLUSION ....................................................................................................................... 21
2
INTRODUCTION
La nouvelle microéconomie trouve son origine dans un nouveau modèle cherchant à dépasser
l'ancien modèle walrasien qui plaide pour la concurrence parfaite.
Ce modèle a révélé sa vulnérabilité et son dysfonctionnement face à un marché en constante
évolution et se caractérise par une asymétrie d'information qui a rendu la coordination entre les
agents inégale.
Face à cette situation, le nouveau micro est présenté comme une solution qui traite le problème
de la coordination entre les agents tout en présentant plusieurs théories dont la théorie des jeux
qui vise en particulier le problème d'harmonisation entre des agents en interaction d’où la
question qui se pose ;
Quel mode d’harmonisation ? Quel équilibre possible entre un cadre d'un jeu interactif
entre les agents ?
3
La théorie des jeux : Approche théorique et conceptuelle
1. La théorie des jeux :
La théorie des jeux constitue un ensemble d’outils analytiques qui ont été développés afin de
comprendre et étudier les situations d’interaction entre individus rationnels. Sur le plan de
l’analyse économique, la théorie des jeux s’inscrit dans les limites de la théorie de l'Équilibre
général, théorie dans laquelle les agents économiques interagissent uniquement par
l’intermédiaire du système de prix sur lequel leurs décisions individuelles n’ont aucune
influence.
Ou
La théorie des jeux s’intéresse aux problèmes de décision lorsque les agents concernés sont liés
par des relations d’interdépendance. Dans de telles situations, elle analyse ce que peuvent être
les comportements individuels et évalue leur résultante au plan collectif.
4
♦ En revanche, si elles ne choisissent pas le même procédé, elles sont dans un cas de «
non compatibilité » et chacune ne gagne que 100 millions.
1.2. Le contexte d’information incomplète :
Dans un jeu en information incomplète, les joueurs ignorent certaines caractéristiques de leurs
partenaires. Il peut s’agir d’une connaissance imprécise des préférences des autres joueurs ou
bien d’un manque d’information sur leurs possibilités stratégiques. Dans ce type de jeu, chaque
joueur ne peut ainsi se référer qu’à des croyances plus ou moins précises sur les caractéristiques
de ses partenaires.
Exemple :
On prend le même cas que précédemment. A la différence que Jaouda ne sait pas ce que Danone
a choisi.
Les gains ne sont pas différents de l'exemple précédent mais c'est au niveau de l'entreprise que
cela change. En effet, il devient difficile pour les entreprises de décider de leurs stratégies en
ne sachant pas celles de leurs concurrents.
2. Dilemme du prisonnier :
2.1. Analyse de base du Dilemme du prisonnier :
Le "dilemme du prisonnier" et ses applications dans la théorie de l’oligopole
Le dilemme du prisonnier. Il a été développé pour la première fois par Albert W.Tucker,
détenteur de la chaire de Mathématiques à Princeton dans les années 50 et 60.
Prenons, le cas de Bonnie and Clyde, complices des mêmes forfaits. Ils sont arrêtés par la police,
interrogés séparément et ne disposent d’aucun moyen de communiquer entre eux. La police ne
dispose pas de preuves valables juridiquement. Les policiers essaient donc de faire avouer les
deux prisonniers. Deux alternatives s’offrent à chacun d’eux : nier le crime ou l’avouer,
correspondant à une peine plus ou moins lourde. On peut modéliser ce cas par une matrice
comme précédemment
BONNIE
AVOUER NIER
5
Si les deux complices avouent, ils sont tous les deux condamnés à une lourde peine, mais avec
une remise de peine puisqu’ils ont coopérés. Si tous les deux nient, ils sont tous les deux
condamnés à une faible peine, car il n’y pas assez de preuve pour justifier une lourde peine. Par
contre si l’un des deux avoue et donne son complice qui nie, il obtient une remise de peine pour
avoir coopéré, alors que son complice se voit condamné à une lourde peine. En pensant collectif,
ils auraient intérêt à nier ensemble. Néanmoins, en niant, chacun prend le risque d’être
condamné à une forte peine si l’autre avoue. La tactique dominante de chacun consiste donc à
avouer, et l’équilibre dominant se fait lorsqu’ils avouent, encourant ainsi une lourde peine avec
remise. En conclusion, le choix optimal collectif, ne correspond pas à la conjonction des choix
optimaux individuels. Cette logique aura des conséquences fortes dans l’application de la
théorie des jeux aux stratégies de production des entreprises en Oligopole.
6
JOUEUR B
AVOUER NIER
JOUEUR N
AVOUER (1 ; 1) (5 ; 0)
NIER (0 ; 5) (3 ; 3)
Niveau de production
Durand
Niveau de production
FORT FAIBLE
80 100
Dupont
FORT
80 10
FAIBLE 10 60
100 50
7
ceux de la branche tout entière (cf. 1.1 le volume de production variable stratégique
essentielle).
Cartel :
Dupont et Durant s’entendent préalablement pour réduire tous les deux leur production,
faire grimper les prix et ainsi augmenter leur profit. Ils réalisent alors tous les deux un
profit de 80, ce qui est le choix stratégique collectif optimal. Cet exemple illustre bien
la tentation de conclure des ententes et de contourner les lois sur la concurrence, les lois
antitrust mise en place par un Etat soucieux de conserver une consommation forte
favorable macro économiquement à l’économie. En effet, le surplus de profit enregistré
par les 2 entreprises se fait au détriment des consommateurs qui ont dû débourser plus
pour acheter moins, ce qui aura des effets sur leur consommation générale (effet de
revenu).
Agression gagnante de Dupont :
Dupont décide de produire fortement alors que Durand produit faiblement. Dupont est
à même de baisser ses prix et remporte donc des parts de marché, augmentant ainsi ses
profits, 100 contre 10 pour Durand.
Agression gagnante de Durand :
Inverse du raisonnement précédent.
Contrairement aux cas précédents, Dupont et Durand ne possèdent pas chacun une tactique
dominante. Il n’y a donc pas d’équilibre dominant. En effet, Durand possède bien une tactique
dominante. Quel que soit le choix de son adversaire, s’il décide de produire fortement, il sort
vainqueur. Par contre Dupont n’a pas de tactique dominante. Il n’a pas de meilleur choix quel
que soit le choix de son adversaire. Il doit donc prendre le meilleur choix compte tenu du choix
que fera certainement son adversaire. C’est là que la théorie des jeux devient pertinente. Dans
la pratique, il est rare de trouver des cas d’équilibre dominant, où les deux entreprises auraient
le même poids sur le marché. Sachant que Durand va jouer sa tactique dominante, Dupont a
tout intérêt à assurer ses parts de marché et ainsi son profit en produisant fortement. L’équilibre
du marché se fera donc par une agression réciproque. On appelle cet équilibre, l’équilibre non
coopératif ou encore l’équilibre de Nash, du nom du célèbre mathématicien américain, Nobel
d’Economie, Nobel de Mathématiques, qui l’a mis en évidence.
En conclusion, comme dans le dilemme du prisonnier, la logique majeure que révèle la théorie
des jeux, c’est que le choix optimal collectif, ne correspond pas à la conjonction des choix
optimaux individuels en oligopole.
8
La théorie des jeux : Les différents équilibres possibles
1. En situation de régression réciproque (équilibre de Nash) :
1.1. Duopole de Cournot :
Hypothèses :
- Deux firmes produisent le même produit
- Deux firmes agissent sur leur niveau de production
- Pas d’entente entre les deux firmes
- Elles adaptent leur niveau de production en fonction de celui du concurrent
Producteur 2 : 𝜋 = [𝑎 − 𝑏. (𝑞1 + 𝑞2 ) − 𝐶2 ] × 𝑞2
Donc le profit du producteur 1 sera maximal quand son profit marginal sera nul :
𝜕𝜋1
= 𝑎 − 2𝑏𝑞1 − 𝑏𝑞2 − 𝐶1 = 0
𝜕𝑞1
1
𝑞1 = . (𝑎 − 𝑏𝑞2 − 𝐶1 )
2𝑏
C’est la quantité que va produire la firme 1 que lui permettra de maximiser son profit compte
tenu de𝑞2 , ce qu’on appelle la fonction de réaction de firme 1.
9
On est donc devant un système à deux équations :
1
𝑞1 = . (𝑎 − 𝑏𝑞2 − 𝐶1 )
{ 2𝑏
1
𝑞2 = . (𝑎 − 𝑏𝑞1 − 𝐶2 )
2𝑏
1
L’équilibre optimal est atteint lorsque 𝑞1∗ = 𝑞2∗ = 3𝑏 (𝑎 − 𝑐)
Et on en déduit le prix d’équilibre et les profits des deux firmes, ce que l’on appelle dans la
théorie des jeux l’équilibre de Nash.
Exemple :
Deux firmes f(1) et f(2) sont en situation de duopole de Cournot, on note :
1
𝐶1 = 𝑞1 La fonction de cout supportée par F(1) et 𝐶2 = 2 𝑞2 2
10
La fonction de réaction de la firme (2) est donc :
4 𝑞1
𝑞2 = −
3 3
4 1
𝑞2 = 3 − 3 𝑞1
Les quantités d’équilibre : { 3 1
𝑞1 = 2 − 2 𝑞2
3 1 4 1
𝑞1 = − .( − 𝑞 )
2 2 3 3 1
5 5
𝑞1 =
6 6
𝑞1 = 1
4 1
𝑞2 = − (1)
{ 3 3
3 1
𝑞1 = − 𝑞2
2 2
Donc :
𝑞2 = 1
Donc le prix d’équilibre :
𝑃 = 4−𝑄
𝑃 = 4 − (1 + 1)
𝑃=2
Le profit des deux firmes :
𝑞1 = 1 𝑞2 = 1 𝑃=2
Donc :
𝜋1 = 𝑃. 𝑞1 − 𝐶1
𝜋1 = 1
𝜋2 = 𝑃. 𝑞2 − 𝐶2
𝜋2 = 1.5
11
1.2. Duopole de Stackelberg :
Supposons que :
La fonction de prix pour l'industrie (duopole) soit {\display style P} P, il en va de même
P (q1+q2) où l'indice 1 représente le leader et 2 représente le suiveur.
Supposons la firme i à une structure de coûts{\displaystyle C_{i}(q_{i})} Ci (qi)
Le bénéfice de l'entreprise 2 (le suiveur)
𝝅 = 𝑹𝑻 + 𝑪𝑻
𝝅 = 𝑷. 𝒒 + 𝑪𝑻
Donc le profit est :
𝜋 = 𝑃(𝑞1 + 𝑞2 ). 𝑞2 − 𝐶2 (𝑞2 )
La meilleure réponse est de trouver la valeur de q2 qui maximise 𝝅𝟐 donnée 𝑞1 , c'est-à-dire
étant donné la production du leader (entreprise 1), la production qui maximise le profit du
suiveur est trouvée.
12
D'abord différencier 𝜋2 en ce qui concerne 𝑞2 :
𝜕𝜋2 𝜕𝑃(𝑞1 +𝑞2 ) 𝜕𝐶2 (𝑞2 )
= . 𝑞2 + 𝑃(𝑞1 + 𝑞2 ) −
𝜕𝑞2 𝜕𝑞2 𝜕𝑞2
Exemple :
Les fonctions de réaction des deux firmes sont les suivantes :
1
𝑞1 = 25 − 𝑞2
4
100 1
𝑞2 = − 𝑞1
3 3
𝑃 = 100 − 𝑄
Si la firme (1) est le leader donnez les quantités produites par les deux entreprises
F1 : La fonction de profit
𝜋1 = 𝑅𝑇 − 𝐶𝑇
𝜋1 = 𝑃𝑞1 − 𝐶𝑇1
𝜋1 = 𝑃𝑞1 − 100 − 𝑞12
𝜋1 = [100 − 𝑄]. 𝑞1 − (100 − 𝑞12 )
𝜋1 = [100 − (𝑞1 + 𝑞2 )]. 𝑞1 − (100 − 𝑞1 2 )
Puisque l’information est parfaite le leader connait déjà la fonction de réaction de la firme
(2)
100 1
𝜋1 = [100 − (𝑞1 + − 𝑞1 )] . 𝑞1 − (100 − 𝑞1 2 )
3 3
100 1
𝜋1 = [100 − − 𝑞1 − 𝑞1 ] . 𝑞1 − (100 − 𝑞1 2 )
3 3
200 5
𝜋1 = 𝑞1 − 𝑞1 2 − 100
3 3
𝜕𝜋1
=0
𝜕𝑞1
200 10
− 𝑞1 = 0
3 3
10 200
𝑞1 =
3 3
13
𝑞1 = 20
Pour la firme (2), il suffit de remplacer la quantité du leader dans sa fonction de réaction
100 1
𝑞2 = − 𝑞1
3 3
100 1
𝑞2 = − .20
3 3
80
𝑞2 =
3
𝑞2 = 26.67
En 1883, Joseph Bertrand a critiqué le modèle de Cournot en disant qu’en pratique les firmes
ne choisissent pas les quantités, mais les prix. Il propose le modèle alternatif:
Etant donné la demande du marché D(p), chaque entreprise choisi un prix. Le prix le plus bas
attire les clients. Les entreprises maximisent leur profit, où est la demande pour l’entreprise.
Question clé: comment est déterminé ?
Si les produits des entreprises ne sont pas différenciés et les clients sont bien informés par
rapport aux prix, le modèle de Bertrand a une simple et forte prédiction.
Pour rendre l’argument simple, ajoutons une hypothèse: les deux entreprises en duopole ont
des fonctions de coûts identiques:
C(q) = cq
Alors, à l’optimum, les deux entreprises vont choisir:
p=c
14
Pourquoi?
Supposons que l’entreprise 1 choisisse un prix et. Alors, tous les clients vont aller à
l’entreprise 2, laissant l’entreprise 1 avec un profit nul. L’entreprise 1 serait strictement mieux
si elle offrait un prix légèrement plus faible que celui de l’entreprise 2. Supposons que
l’entreprise 1 choisisse un prix.
Elle serait strictement mieux si elle choisissait un prix légèrement plus élevé (mais toujours
plus bas que le prix du concurrent).
Donc, les deux entreprises doivent à l’optimum mettre un prix identique et partager le marché
(chacune reçoit ½ D(p)). Mais si le prix qu’elles demandent est plus grand que c, une des deux
peut légèrement baisser son prix ce qui fait qu’elle perd un tout petit peu sur chaque pièce
vendue mais
elle aura tout le marché. Résultat: Seulement est possible avec ce genre de concurrence.
Equilibre de Bertrand avec biens identiques :
15
Que faut-il penser de cela ?
♦ Qu’un marché fonctionne d’après Cournot ou d’après Bertrand dépend de l’intensité
de la concurrence (note: ceci ne se réfère pas au nombre d’entreprises
concurrentes!)
♦ Dans un grand nombre de marchés avec seulement peu d’entreprises, elles font des
profits positifs. Donc, Cournot semble plus plausible que Bertrand.
♦ Mais, dans certains marchés avec des biens homogènes, la concurrence est à la
Bertrand. Exemple: instruments financiers et arbitrages entre avoirs financiers, où
mise aux enchères de licences
téléphoniques pour portables.
♦ Le modèle de Bertrand est un bon cadre d’analyse pour une investigation plus
approfondie de biens différenciés
16
2. En situation de Cartel :
Pour éviter une concurrence qui peut se révéler néfaste pour tous, les producteurs en situation
d'oligopole ont souvent intérêt à s'entendre. La collusion, ou entente, est un accord, parfois
explicite, souvent implicite, visant à limiter la concurrence. La forme la plus aboutie de l'entente
est le cartel. Dans ce cas, les entreprises passent un accord explicite qui définit le niveau de
production et donc, par voie de conséquence, le prix du produit à vendre. L'accord peut aussi
porter sur le partage du marché ; le cartel attribue ainsi à chaque entreprise, pourtant
juridiquement indépendante, des quotas de production. Le cartel maximise son profit en
produisant la quantité qui égalise la recette marginale avec le coût marginal. Si l'entente est
parfaite et qu'aucune entreprise ne triche, le profit du cartel sera équivalent à celui d'un
monopole comportant plusieurs établissements. Si les fonctions de coûts des différentes
entreprises composant le cartel sont identiques, la répartition de la production ne posera pas de
problème car chaque entreprise devra réaliser les mêmes niveaux de production et recevra des
profits identiques. La situation est plus difficile si les fonctions de coûts sont différentes. Dans
ce cas, l'entreprise dont les coûts de production sont supérieurs à ceux des autres entreprises se
voit attribuer un volume de production plus faible. L'accord de cartel doit donc prévoir une
compensation financière pour fidéliser cette entreprise.
La formation de cartel impose des coûts de surveillance très élevés. Chacun est incité à tricher
en vendant moins cher et ainsi en s'appropriant une part plus élevée du marché. Par ailleurs,
lorsque le cartel est efficace, les surprofits qu'il engendre incitent de nouvelles entreprises à
entrer sur le marché.
Soient n entreprises constitutives d'un cartel, le profit total du cartel à maximiser est :
π = π1 + π2 + π3 ........................................ πn
Compte tenu de :
P = f(Q) avec Q = Q1 + Q2 + Qn
Soit P = f (Q1 + Q2 + Q3................. + Qn).
Et :
C1 = f(Q1) coût total de l'entreprise 1
C2 = f(Q2) coût total de l'entreprise 2
Cn = f(Qn) coût total de l'entreprise n
17
On aura alors :
π1= R1 –C1
π2 = R2 –C2
πn = Rn –Cn
Avec R= R1+ R2 + R3 +........................ Rn
Et C= C1 + C2 + C3 +............... Cn.
En conséquence :
Π = R- C1- C2 –C3 ...................... –Cn.
Le prix du bien étant le même quelle que soit la firme qui le produit, chaque bien supplémentaire
aura la même recette marginale, quelle que soit l'entreprise dans laquelle il est produit.
Pour maximiser le profit, on a Rm = Cm1 = Cm2 =.................. = Cmn.
La production Q devra donc être répartie de telle sorte que les coûts marginaux de chaque firme
constitutive du cartel soient égaux.
Exemple :
On a deux firmes A et B ;
Dans ce cas, les deux firmes acceptent d'adopter une politique commune de maximisation des
profits. Autrement dit, elles vont tenter de maximiser le profit comme si le marché se transforme
en monopole. On définit ainsi la fonction de profit global comme suit :
𝜋 = 𝑅𝐴 + 𝑅𝐵 − (𝐶𝑇𝐴 + 𝐶𝑇𝐵 )
𝜋 = (𝑄𝐴 × 𝑃) + (𝑄𝐵 × 𝑃) − 𝐶𝑇𝐴 − 𝐶𝑇𝐵
18
On détermine la fonction de réaction des deux firmes A et B en calculant la dérivée de profit
sur la dérivée des quantités A et B.
𝜕𝜋 200 2 14
=0→ − 𝑄𝐵 − 𝑄𝐴 = 0
𝜕𝑄𝐴 3 3 12
400 4
→ 𝑄𝐴 = − 𝑄𝐵
7 7
𝜕𝜋 200 2 10
=0→ − 𝑄𝐴 − 𝑄𝐵 = 0
𝜕𝑄𝐵 3 3 6
2
→ 𝑄𝐵 = 40 − 5 𝑄𝐴
À partir de ces deux conditions de maximum, on tire deux équations à deux inconnues Q A et
QB, et qui donnent à la fois les quantités et le prix d'équilibre. C'est-à-dire la situation dans
laquelle aucun producteur ne cherche à modifier son équilibre. On remarque dans ce cas que
les deux firmes A et B réalisent en commun un profit supérieur à celui qu'ils obtiendraient en
l'absence de stratégie d'entente.
Et on calcule le système suivant :
400 4
𝑄𝐴 = − 𝑄𝐵
7 7
{ 2
𝑄𝐵 = 40 − 5 𝑄𝐴
400 4 2
𝑄𝐴 = − (40 − 𝑄𝐴 )
{ 7 7 5
2
𝑄𝐵 = 40 − 𝑄𝐴
5
𝑄𝐴 = 44
{
𝑄𝐵 = 22
𝑃 = 45
19
Pour le profit, on a :
𝜋 = 𝑃(𝑄𝐴 + 𝑄𝐵 ) − 𝐶𝑇𝐴 − 𝐶𝑇𝐵
𝜋 = (45 × 66) − (0,25 × 442 ) − (0,5 × 222 )
𝜋 = 2244
Il est extrêmement important de préciser que dans le cas du cartel, chaque firme recevra une
part du profit global négociée à l'avance. La part de chacun des deux producteurs sera donc
fonction des rapports de puissance entre les deux entreprises. Autrement dit, la répartition du
profit global du duopole ne dépend pas directement des structures des coûts des firmes.
20
CONCLUSION
Après avoir étudié d’une manière globale les principaux aspects de la théorie des jeux, et
notamment son objectif, la théorie des jeux est un ensemble d’hypothèses ayant trait au monde
tel qu’il est dans le but d’en expliquer tel ou tel aspect.
Essentiellement, elle attire l’attention sur les problèmes que posent les choix d’individus
rationnels en interaction, et anticiper leurs propres décisions. Il s’agit alors d'analyser la manière
dont les agents coordonnent ou peuvent coordonner leurs décisions dans différentes
configurations. En définitive quand on a trouvé les équilibres d’un modèle, celui-ci est résolu,
pour l’essentiel.
21
TABLE DES MATIERES
SOMMAIRE ............................................................................................................................. 2
INTRODUCTION .................................................................................................................... 3
CONCLUSION ....................................................................................................................... 21
22