Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
DE BOUAKE
SUPPORT DE COURS
Chargé du cours :
Dr SANGARE Moussa
Enseignant-chercheur
sangaremou@yahoo.fr
cel. : (+225) 05 40 18 40/02 27 17 90.
Théorie des jeux Année universitaire 2018-2019
Descriptif du cours
De nos jours, la théorie des jeux, en tant que discipline scientifique à part entière, constitue l’un des
puissants outils d’analyse auxquels ont recours de plus en plus les économistes et les gestionnaires
pour mener à bien leur raisonnement et apporter des solutions idoines à certains problèmes auxquels
ils sont confrontés. C’est donc naturellement que l’on se propose dans le cadre de ce cours de
familiariser les étudiants à l’utilisation de cet important outil d’analyse. En effet, la théorie des jeux
est autant utile aux économistes dans leur quête de compréhension d’une situation économique
donnée, qu'aux gestionnaires dans leur volonté de développer des stratégies de marché pour leur
entreprise.
En ce qui concerne particulièrement les économistes, ces derniers pourraient s’en servir pour
comprendre les résultats potentiels des interactions économiques sur les marchés (dans les situations
de concurrence entre entreprises, pour développer des stratégies de marketing, etc.), de même que
les interactions entre des individus ou des communautés (en cas de négociation, de coordination des
décisions et/ou d’exploitation des ressources naturelles), entre des groupes d'agents économiques
(les pouvoirs publics et les ménages) ou entre des pays (établissement de quotas d'exportation ou de
pêche).
Ainsi, il s’agira d’inculquer aux étudiants les concepts de base de la théorie des jeux en adoptant
une démarche méthodique reposant sur de nombreux exemples, faciles à comprendre certes, mais
nécessitant tout au moins, des apprenants qu’ils sont, « une capacité à raisonner de manière
logique » (Yilduzoglu, 2011).
Introduction
Vue sous un certain angle, la théorie des jeux se présente comme une ramification de la
Microéconomie. C’est une discipline scientifique à part entière qui se trouve à cheval sur
l’économie et les mathématiques. Le but de la théorie des jeux est d’établir et d’étudier les principes
et les règles mathématiques pouvant intervenir dans l’analyse des différents types de comportement
et des issues possibles lors d’une interaction stratégique entre plusieurs preneurs de décisions
(appelés agents en Economie et joueurs en Théorie des jeux) ; et ce concernant de nombreux
problèmes sociaux, politiques et économiques.
Ainsi, la théorie des jeux étudie les situations où le sort de chaque participant dépend non seulement
des décisions qu’il prend mais également des décisions prises par d’autres participants. Elle est
donc une théorie interactive des décisions qui se consacre essentiellement aux principes des
comportements (coopératifs ou non coopératifs) des personnes engagées dans une situation de jeux
à plusieurs dont l’objectif est la maximisation de grandeurs personnelles ou collectives. Brièvement,
la théorie des jeux pourrait donc se concevoir comme une théorie des comportements des agents
rationnels (c’est le cas des jeux ordinaires) ou non (exemple des jeux évolutionnaires basés sur
l’hypothèse de la stabilité et non sur celle de la rationalité) en situation d'interaction.
Aujourd’hui, la théorie des jeux s’est révélée, dans le monde des entreprises, comme étant un
instrument très important pour l’analyse de la concurrence et des stratégies que celles-ci
développent pour faire face à la concurrence des autres entreprises.
Plan du cours
INTRODUCTION
Chapitre 1 : CONCEPTS DE BASE
Chapitre 2 : JEUX NON COOPERATIFS A INFORMATION COMPLETE
Chapitre 3 : JEUX NON COOPERATIFS A INFORMATION INCOMPLETE
Chapitre 4 : JEUX COOPERATIFS ET JEUX EVOLUTIONNAIRES
CONCLUSION
Références bibliographiques
Binmore, K.G. (1998), Jeux et Théorie des jeux, De Boeck Université.
Eber, N. (2013), Théorie des jeux, Dunod, Les Topos - ouvrage d'introduction avec de bons
exemples.
Giraud, G. (2000), La théorie des jeux, Champs Université Flammarion - ouvrage d'introduction;
Pfähler, W. et H. Wiese (2000), Les stratégie des entreprises – une analyse par la théorie des jeux,
disponible sur le net.
Umbhauer, G. (2002), Théorie des jeux appliquée à la gestion, Éditions ems.
Yildizoglu, M. (2011), Introduction à la Théorie des jeux, 2eme édition, 175 pages. Collection
Dunod, Eco Sup.
Zamir, S. et Laraki R. (2014), Cours de théories des jeux, CNRS, EUROQua Paris 1 et
LEI/CREST.
Ce chapitre se propose de passer en revue les principaux concepts de base de la théorie des jeux. Il
procède non seulement à la définition de concepts de base mais également à la présentation des
différents types de jeux.
Une personne est engagée dans un jeu stratégique avec une autre personne (ou plusieurs personnes)
quand son utilité et ses gains sont affectés non seulement par les actions qu’elle entreprend mais
aussi par les actions des autres. Parce que chacun n’est pas totalement maitre de son sort, on dit que
ces personnes participant au jeu se trouvent en situation d’interaction stratégique.
Comme exemple de jeu stratégique, on peut citer :
- le jeu de dame, le match de football, etc. car la victoire ou la défaite d’un des joueurs
dépend autant de ses propres choix tactiques que de ceux de son adversaire
- les profits de Green Network ne dépendent pas de ses seuls choix en matière de prix, mais
aussi des prix annoncés par ses concurrents comme MTN, Orange, Moov et Koz.
- Les conflits politiques ont les caractéristiques d’un jeu stratégique.
De façon précise, un jeu stratégique est un ensemble de règles qui encadre ou contraint le
comportement des joueurs et qui détermine les gains des joueurs sur la base des actions entreprises.
Ainsi, un jeu stratégique suppose une définition claire des règles de comportements des joueurs qui
doivent :
1) Dire qui sont les joueurs et si la chance ou le hasard est présent dans le jeu (exemple des
jeux de cartes). Si la chance intervient et peut affecter l’issue du jeu, dans ce cas, on
considère cette dernière comme un joueur imaginaire appelé “chance”.
2) Préciser l’ordre dans lequel les joueurs effectueront leurs choix. Nous devons savoir qui
joue le premier, qui joue le second ainsi de suite ou encore si les individus jouent de manière
simultanée Nous devons connaitre les choix possibles des joueurs.
3) Dire quelle utilité chaque joueur retirera à la fin du jeu pour chaque combinaison de choix
possibles.
Caractéristiques d’un jeu : Un jeu est décrit par les éléments suivants:
1. Un ensemble de N joueurs : I 1, 2,..., N .
2. Pour chaque joueur i, i I , un ensemble de stratégies Ai , qui contient toutes les stratégies
Ai a1i , a2i ,....., aki i si k i stratégies sont disponibles pour le joueur i .
Si chaque joueur i choisit une stratégie a i , nous pouvons représenter le résultat (ou profil de
stratégies) du jeu par un vecteur qui contient toutes ces stratégies : a a1 , a 2 ,....., a N .
3. Pour chaque joueur i ; une fonction de gain, i ; qui donne la valeur pour le joueur i de
chaque résultat du jeu : i (a ) . C'est un nombre réel :
i : A X Ai R
iI
a a1 , a 2 ,....., a N i ( a).
En définitive, une décision stratégique prévaut si et seulement s’il existe une liaison de réactions :
(1) le résultat dépend des décisions de plusieurs décideurs et telle manière qu’aucun d’entre eux
ne puisse pas engendrer le résultat indépendamment du choix des autres.
(2) chaque décideur est conscient de cette interdépendance.
(3) chaque décideur part du principe que tous les autres sont également conscients de cette
interdépendance
(4) chaque décideur, lors de sa prise de décision, tient compte des trois points précédents.
S’agissant d’une entreprise, une action ou une décision de celle-ci sera qualifiée de stratégique ou
est une stratégie si :
(1) une nouvelle conception de la politique d’entreprise est instaurée et très profondément
réfléchie ;
(2) elle vise des objectifs à long terme de l’entreprise ou met en œuvre des ressources à long
terme ;
(3) elle mène une réflexion rationnelle sur toutes les alternatives possibles ;
(4) elle est menée avec détermination ;
(5) elle permet de dégager à long terme un avantage concurrentiel ;
(6) elle tente d’étouffer ou déraciner les concurrents ;
(7) elle tient aussi compte des implications du modèle de réaction des concurrents.
Une stratégie est une des actions que l’agent ou le joueur peut choisir, parmi toutes les actions
possibles et sous toutes les conditions possibles d’information.
Une stratégie pure est une action, ou un plan d’actions, qui est choisie par chaque joueur avec
certitude.
Un jeu en forme normale (ou forme stratégique) est une collection de stratégies décrivant les
actions de chaque joueur dans toutes les situations concevables du jeu, ainsi que les gains (payoffs)
que chacun obtient lorsque les stratégies de tous les joueurs sont connues.
Un jeu en forme extensive ou en forme développée est défini par un arbre qui décrit comment le jeu
est joué. Plus précisément, chaque sommet de l’arbre spécifie le (ou les) joueur(s) qui doit (doivent)
choisir une action à ce moment du jeu ainsi que l’information dispose lors de la prise de décision ;
les gains que chaque joueur peut réaliser après avoir suivi un des chemins possibles au sein de
l’arbre sont donnés aux sommets terminaux.
Caractéristiques d’un jeu en forme extensive
Elles se résument en :
1. Un arbre de jeu contenant un nœud initial, des nœuds de décisions, des nœuds terminaux et
des branches reliant chaque nœud à ceux qui lui succèdent.
2. Un ensemble de N 1 joueurs, indicés par 𝑖 = 1; 2; … ; 𝑁
3. Pour chaque nœud de décision, le nom du joueur qui a le droit de choisir une stratégie à ce
nœud.
4. Pour chaque joueur 𝑖; la spécification de l'ensemble des stratégies permises à chaque nœud
où il a le droit de prendre une décision.
5. La spécification des gains du jeu à chaque nœud terminal.
Etant donné qu’un jeu est caractérisé par la qualité et la quantité d’informations dont les joueurs
disposent, il y a lieu de distinguer les jeux à information complète et incomplète et les jeux à
information parfaite et imparfaite (voir section 1.2. ci-dessous).
Les jeux à somme nulle sont tous les jeux où la somme "algébrique" des gains des joueurs est
constante. Ce que gagne l’un est nécessairement perdu par un autre, l'enjeu est la répartition du
total fixé, qu'on peut supposer réparti à l'avance, ce qui ramène au cas où les gains sont vraiment
nuls (d'où cette dénomination). Les échecs ou le poker sont des jeux à somme nulle car les gains de
l’un sont très exactement les pertes de l’autre.
Les situations d’affaires, la vie politique ou le dilemme du prisonnier sont des jeux à somme non-
nulle car certaines issues sont globalement plus profitables pour tous, ou plus dommageables pour
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 6
Théorie des jeux Année universitaire 2018-2019
tous. On a commencé historiquement par étudier les jeux à somme nulle, plus simples. Au -delà de
la matière-énergie avec la loi de la conservation de la somme algébrique nulle, le jeu à somme non-
nulle est concevable, dans lequel le gain de l'un peut profiter à l'autre.
Un jeu synchrone est un jeu dans lequel les joueurs décident de leur coup simultanément, sans
savoir ce que les autres jouent.
Dans un jeu asynchrone (ou alternatif, à deux joueurs), ils jouent les uns après les autres, en
disposant à chaque fois de l’information sur le coup de l’adversaire.
Une solution est un ensemble de lois (aboutissant à des équations mathématiques) qui permettent de
sélectionner parmi toutes les issues possibles, un sous-ensemble d’issues satisfaisant certaines
propriétés, jugées désirables si les agents possèdent certaines facultés de raisonnement ou de
comportement (rationalité, prudence, connaissance, etc...).
Définition 8 : Résultat
Un résultat ou un vecteur (profil) des stratégies a* (a*1 ,...., a* N ) (a*i Ai , i 1,...N ) est un
équilibre de Nash si aucun joueur n’a intérêt à dévier unilatéralement de sa stratégie a*i quand les
autres joueurs continuent à jouer a *i . Par conséquent, pour tout joueur i = 1…N, nous devons avoir
i (a*i , a*i ) i (ai , a*i ), ai Ai .
Pour tester si un résultat a est un équilibre de Nash, nous devons vérifier si un des joueurs au moins
n'a pas intérêt à choisir une autre stratégie. Si ce n'est pas le cas alors a est un Equilibre de Nash.
Ainsi, l’équilibre de Nash est un concept de solution (ou plus précisément une propriété d’équilibre)
pour les jeux non coopératifs.
Cette notion a permis d’étudier et d’analyser :
la compétition oligopolistique en économie;
les conflits entre les états, les partis politiques, les individus ;
le rapport entre la longueur de la trompe d’une abeille et la longueur du pistil d’une fleur ou
encore les invitations à souper entre le crapaud et le hérisson.
2. Un résultat a* est un optimum de Pareto s'il n'existe pas un autre résultat qui le Pareto-
domine.
3. Les résultats a et a ne sont pas pareto-comparable si
i, j (a ) j (a) et j i, j (a ) j (a)
Optimum de Pareto
Une suite de stratégies 𝑎∗ = 𝑎1∗ , … 𝑎∗𝑖 , … , 𝑎𝑛∗ est un optimum de Pareto lorsqu’aucun des joueurs
ne peut obtenir un paiement plus élevé sans que le paiement d’un des autres joueurs diminue :
𝑢 𝑖 𝑎𝑖 , 𝑎−𝑖 ≥ 𝑢 𝑖 𝑎𝑖 ∗ , 𝑎−𝑖 ∗ , ∀𝑖 ⇒ 𝑢 𝑖 𝑎𝑖 , 𝑎−𝑖 = 𝑢 𝑖 𝑎𝑖 ∗ , 𝑎 −𝑖 ∗ , ∀𝑖
L’optimum de Pareto exprime bien l’idée que collectivement on ne peut pas améliorer la situation.
Souvent il fournit une solution plus efficace que quand chaque joueur raisonne individuellement.
Une stratégie particulière (a i Ai ) d'un joueur est une stratégie dominante du joueur i si, quelles
que soient les stratégies choisies par les autres joueurs, a i maximise le gain de i :
i (a i , a i ) i (ai , a i ), ai Ai , a i Ai
Définition 12 : Rationalité
L’hypothèse fondamentale sur laquelle repose les modèles de la théorie des jeux est la rationalité
des agents : Chaque agent est conscient des alternatifs, fait des anticipations sur les éléments
inconnus, possède des préférences claires et choisit délibérément son action après un processus
d’optimisation.
En d’autres termes, le choix d’une action par agent est rationnel si, étant donné ce qu’il croit et étant
ce qu’il peut choisir, l’action qu’il choisit est celle dont les conséquences satisfont le mieux ses
désirs. Cette hypothèse de base de la théorie des jeux de considérer que les agents sont rationnels,
signifie qu’ils tentent d’arriver à la situation la meilleure pour eux.
Les différents contextes d’interaction permettent de catégoriser les jeux pouvant se dérouler entre
les agents. Ces jeux ont en commun la difficulté de prédire le résultat auquel le jeu va aboutir.
Ainsi, les différents contextes d’interactions peuvent être classés selon trois dimensions basées sur :
Il convient de distinguer entre deux grandes familles de jeux : les jeux coopératifs et les jeux non
coopératifs. Dans un jeu non-coopératif, chaque firme prend sa décision de manière à obtenir la
meilleure situation pour elle et sans chercher la coordination avec les autres. Dans le cas où elle
cherche la coordination avec les autres, on est en présence d’un jeu coopératif.
Ainsi, un jeu est coopératif lorsque des joueurs peuvent passer entre eux des accords qui les lient de
manière contraignante (par exemple, sous la forme d’un contrat qui prévoit une sanction légale dans
le cas du non respect de l’accord). On dit alors qu’ils forment une coalition dont les membres
agissent de concert. Dans le cas contraire, c’est-à-dire lorsque que les joueurs n’ont pas la
possibilité de former des coalitions, le jeu est non-coopératif. Par définition, dans un jeu non
coopératif, on spécifie toutes les options stratégiques offertes aux joueurs, alors que les contrats qui
sous-tendent les coalitions dans un jeu coopératif ne sont pas décrits.
Caractéristiques d’un jeu non-coopératif
- un petit nombre d’agents (les joueurs) qui interagissent ;
- les décisions de chaque agent influencent les gains des autres ;
- la prise en compte de l’information dont chaque agent dispose au moment de prendre sa
décision ;
- la prise en compte du déroulement des décisions dans le temps (décisions simultanées ou
séquentielles).
Les décisions simultanées sont en général représentées sous la forme d’un tableau (jeux en forme
normale) et les décisions séquentielles, sous la forme d’un arbre de jeu (jeux en forme extensive).
Un jeu simultané est un modèle d’une situation ou chaque joueur choisit son plan d’action complet
une fois pour toutes au début du jeu. Ainsi, les choix de tous joueurs sont simultanés. Au moment
de faire son choix, le joueur n’est donc pas informé du choix de l’autre ou des autres joueurs.
On est en présence d’un jeu à information complète si chaque joueur connaît lors de la prise de
décision :
ses possibilités d'action
les possibilités d'action des autres joueurs
les gains résultants de ces actions
les motivations des autres joueurs
Il suffit que l’une des conditions suscitées (voir définition 3 ci-dessus) ne soit pas vérifiée pour que
l’on soit en présence d’un jeu en information incomplète. Cela peut être dû à l'intervention du
hasard au cours du jeu (cas fréquent dans les jeux de société), ou parce qu'une des motivations d'un
acteur est cachée (domaine important pour l'application de la théorie des jeux à l'économie).
Par ailleurs, on parle de jeu à information parfaite ou de jeu à mémoire parfaite dans le cas de jeu
à mécanisme séquentiel, où chaque joueur a connaissance en détail de toutes les actions effectuées
avant son choix.
Les jeux à mémoire imparfaite supposent une sorte d'amnésie de la part des joueurs. Les jeux de
guerre sont des exemples de jeux à mémoire imparfaite si les commandements de zones
opérationnelles ne parviennent pas à communiquer entre eux ou avec l'Etat-major et donc n'ont pas
trace des mouvements déjà effectués par les troupes amies lorsqu'elles doivent décider de leurs
propres mouvements.
Tableau : Typologie des jeux.
Information complète Information incomplète
Jeu statique Equilibre de Nash Equilibre bayésien
Jeu dynamique Equilibre de Nash parfait en sous-jeu Equilibre bayésien parfait (équilibre séquentiel)
Deux individus (Digbeu et Amoin) sont arrêtés par la police pour leur complicité dans un vol à
main armée commis dans la superbe ville de Bouaké. Ils sont enfermés dans deux cellules
différentes du Commissariat central de la ville sans aucune possibilité de communication entre eux.
Chaque individu est interrogé séparément et il a le choix entre nier avoir commis le délit ou avouer
l’avoir commis avec son complice. Nous sommes en présence d’un jeu non-coopératif avec N = 2
joueurs, 𝐼 = {1, 2 = {𝐷𝑖𝑔𝑏𝑒𝑢, 𝐴𝑚𝑜𝑖𝑛}. L’ensemble des stratégies de chaque joueur est A1 = A2 =
{nier, avouer}. On a quatre résultats possibles dans ce jeu :
A = {(a1 = nier, a2 = nier), (nier, avouer), (avouer, avouer), (avouer, nier)}
Les gains des individus représentent leur situation qui résulte des années de prisons auxquelles ils
sont condamnés en fonction de leurs aveux et ils sont négativement liés avec ces années.
- Si Digbeu et Amoin avouent tous les deux leur crime, ils sont condamnés à 8 ans de prison.
- S'ils le nient tous les deux, ils auront une année de prison du fait d'absence de preuves
accablantes.
- Si un seul d’entre eux avoue, celui-ci est relâché en récompense de sa coopération et l'autre
est condamné à 10 ans de prison.
Nous avons donc les gains symétriques suivants :
1 (nier , nier ) 2 (nier , nier ) 1
1 (nier , avouer ) 2 (avouer , nier ) 10
1 (avouer , nier ) 2 (nier, avouer ) 0
1 (avouer , avouer ) 2 (avouer, avouer ) 8
Nous pouvons alors représenter ce jeu en forme normale, sous la forme d’un tableau :
Amoin
nier avouer
nier (-1,-1) (-10,0)
Digbeu avouer (0, -10) (-8,-8)
avouer est une stratégie dominante de Digbeu et Amoin et (avouer; avouer) est un équilibre en
stratégies dominantes car avouer est la stratégie dominante de chaque joueur.
Pour déterminer l’équilibre d’un jeu, il existe une multitude d’approches théoriques alternatives.
Ces approches se distinguent par leurs spécificités propres.
Application
Deux entreprises L4E et J&B sont engagés dans un jeu stratégique. Si l’une décide de coopérer (C)
alors que l’autre choisit la guerre (G), elles ont chacune un gain nul. Si les deux optent pour la
coopération, L4E a un gain de 2 millions et J&B un gain de 1 million ; mais si les deux optent pour
la guerre, L4E a un gain de 1 million et J&B un gain de 2 millions.
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 12
Théorie des jeux Année universitaire 2018-2019
1) Précisez l’ensemble des joueurs et l’ensemble de stratégies de chaque entreprise.
2) Donnez la forme normale du jeu.
3) Déterminez les équilibres de Nash en stratégies pures du jeu.
4) Déterminez graphiquement les équilibres de Nash en stratégies mixtes après avoir précisé les
fonctions de meilleure réponse des joueurs.
Correction
1) Soit J, l’ensemble des joueurs : 𝐽 = L4E; J&𝐵
J&B
C G
C 2;1 0;0
L4E
G 0;0 1;2
1
3
2
𝛼
3
Remarque : Cette approche est typique de la théorie des jeux. Dans cette théorie, on suppose
l’égoïsme absolu des acteurs. En effet, l’utilité ou la satisfaction du joueur dépend seulement de son
gain (ou payoff). Pourtant, il est possible de supposer que les décisions du joueur est basé sur une
sorte d’utilité sociale ; ce à quoi s’adonne l’approche suivante.
Dans cette approche, on suppose que l’utilité du joueur est basée sur une sorte d’utilité sociale. En
effet, on suppose que l’utilité du joueur 1 (𝑈1 ) dépend non seulement de son propre gain (𝑥1 ), mais
également de celui de l’autre joueur (𝑥2) sous la forme suivante :
𝑈1 = 𝑈1 𝑥1 , 𝑥2 .
La formulation la plus simple [due à Edgeworth (1881)] est la suivante :
𝑈1 = 𝑈1 𝑥1 , 𝑥2 = 𝑥1 + 𝛼𝑥2
Dans cette expression, si 𝛼 > 0, on suppose qu’il une sympathie en ce sens que le joueur 1 valorise
les gains du joueur 2 ; mais si 𝛼 < 0, il y a envie dans la mesure où la satisfaction du joueur 1
diminue avec les gains du joueur 2. Ce paramètre 𝛼 est également connu sous le nom de coefficient
de sympathie.
Considérons le vecteur 𝑋 = 𝑥1 , 𝑥2 comme étant une « allocation sociale » issue du jeu avec 𝑥𝑖 le
gain obtenu par le joueur 𝑖 𝑖 = 1, 2 . Pour mener à bien leur analyse, Fehr et Schmidt (1999)
trouvent des motivations sociales aux joueurs. Ils postulent que l’utilité du joueur i est dépendante
de l’allocation sociale X conformément à l’équation suivante :
𝑈𝑖 𝑋 = 𝑥𝑖 − 𝛼𝑖 𝑚𝑎𝑥 𝑥𝑗 − 𝑥𝑖 , 0 − 𝛽𝑖 𝑚𝑎𝑥 𝑥𝑖 − 𝑥𝑗 , 0 𝑎𝑣𝑒𝑐 0 ≤ 𝛽𝑖 < 1 𝑒𝑡 𝛽𝑖 ≤ 𝛼𝑖
L’analyse terme par terme permet de déceler un certain nombre de constats :
Avec le second terme [à savoir −𝛼𝑖 𝑚𝑎𝑥 𝑥𝑗 − 𝑥𝑖 , 0 ] :
Si 𝒙𝒋 > 𝒙𝒊 alors 𝑚𝑎𝑥 𝑥𝑗 − 𝑥𝑖 , 0 = 𝑥𝑗 − 𝑥𝑖 > 0. Dans ce cas, le second terme devient : −𝛼𝑖 𝑥𝑗 −
𝑥𝑖<0⇒𝑈𝑖𝑋 𝑑𝑖𝑚𝑖𝑛𝑢𝑒.
Le coefficient 𝛼𝑖 n’est rien d’autre qu’un « coefficient d’envie » dans la mesure où il permet de
mesurer le degré de sensibilité de l’individu dû au fait que l’autre joueur obtienne plus que lui
(c’est-à-dire 𝑥𝑗 > 𝑥𝑖 ).
Si 𝒙𝒋 < 𝒙𝒊 alors 𝑚𝑎𝑥 𝑥𝑖 − 𝑥𝑗 , 0 = 𝑥𝑖 − 𝑥𝑗 > 0. Dans ce cas, le second terme devient : −𝛽𝑖 𝑥𝑖 −
𝑥𝑗<0⇒𝑈𝑖𝑋 𝑑𝑖𝑚𝑖𝑛𝑢𝑒.
Le coefficient 𝛽𝑖 est un « coefficient de culpabilité » qui évalue le niveau de réduction de la
satisfaction de l’individu suite au fait que l’autre joueur obtienne moins que lui (𝑥𝑗 < 𝑥𝑖 ).
En admettant que 𝛽𝑗 ≤ 𝛼𝑖 , on fait l’hypothèse que le sentiment de culpabilité est moins fort
que le sentiment d’envie.
Exercice d’application avec le célèbre jeu du dilemme du prisonnier
Considérons le jeu du dilemme du prisonnier représenté par le tableau suivant :
XYZ
a A
ABC a (2,2) (0,1)
A (1, 0) (4,4)
Supposons à présent que les deux joueurs ont une fonction d’utilité à la Fehr-Schmidt et que par
souci de simplification, on a : 𝛼1 = 𝛼2 = 𝛼 et que 𝛽1 = 𝛽2 = 𝛽.
Déterminez l’équilibre de ce jeu et faites des observations.
Exemple 1 : Yaya et Fanta doivent décider comment organiser leur soirée. Ils ont le choix entre
aller à un concert de DJ Arafat (A) ou à un garba party (G). Pour les deux, ce qui compte avant tout,
c'est d'être ensemble. Néanmoins, Fanta a une préférence pour DJ Arafat et Yaya pour le garba
party.
Le tableau suivant représente ce jeu. Les gains correspondent à des utilités.
Fanta
G A
Yaya G (5,2) (0,0)
A (0, 0) (2,5)
Bataille des sexes 1
Dans ce jeu (G , G) et (A , A) sont des Equilibres de Nash. Chacun de ces équilibres de Nash est
pareto-optimal. Il existe également un Equilibre de Nash en stratégie mixte.
Dans ce cas, nous ne sommes pas capables, sans aucune information supplémentaire, de prédire
quelle sera exactement la solution du jeu. Les deux résultats sont également vraisemblables.
Le jeu de la bataille des sexes est parfois qualifié de jeu de coordination impur, dans la mesure où
le problème de coordination (aller ensemble au même endroit) est couplé à un conflit d’intérêt (aller
au concert de DJ Arafat ou aller au Garba Party).
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 16
Théorie des jeux Année universitaire 2018-2019
Proposition 2 : L’équilibre de Nash n’est pas nécessairement unique dans un jeu.
Exemple 2 :
Il n'existe pas nécessairement un équilibre de Nash pour les jeux où les stratégies sont des actions
directes des joueurs. Si l'on reprend la bataille des sexes mais après 30 ans de concubinage :
Fanta
G A
Yaya G (2, 0) (0, 2)
A (0, 1) (1, 0)
Bataille des sexes 2
Dans ce cas, le désir de Fanta de passer ses soirées avec Yaya a disparu avec le temps, tandis que
Yaya a gardé son amour romantique et il préfère toujours être avec Fanta plutôt que d’être seul.
Dans ce jeu, il n’existe pas d’EN.
Il est possible de déterminer l’équilibre de Nash d’un jeu en utilisant les fonctions de meilleures
réponses des joueurs.
Proposition 2 : Il est possible que dans un jeu, il n’y ait pas d’Equilibre de Nash.
Proposition 3 : Un Equilibre de Nash n'est pas nécessairement un optimum de Pareto.
Théorème de Nash
Tout jeu statique fini (c’est-à-dire caractérisé par un nombre fini de joueurs et un nombre fini de
stratégie) admet au moins un équilibre de Nash (éventuellement en stratégie mixte).
Exercices d’application
1) Montrer que dans le dilemme du prisonnier (avouer; avouer) est un équilibre de Nash mais
que le résultat (nier; nier) pareto-domine cet équilibre.
2) Montrer que dans la bataille de sexes, les résultats (G ; G) et (A ; A) ne sont pas Pareto-
comparables.
La théorie du Maxmin est également connue sous le nom de théorie du comportement prudent.
Cette théorie tente de prendre en compte des aspects qui ne sont pas capturés par l’équilibre de
Nash tels que le risque et la sécurité.
Application : Considérons le jeu suivant :
LISA
X Y
A (5 , 2) (3 , 3)
ABEL B (0 , 8) (0 , -1)
C (-20 , 4) (5 , 5)
On constate aisément que (C , Y) avec le paiement (5 , 5) est l’unique équilibre de Nash.
Cependant, même si Abel croit que Lisa va jouer Y, va-t-il vraiment jouer C ? Est-ce que jouer C
A B
X (5 , 2) (0 , 6)
Y (3 , 5) (2 , 2)
Si les deux joueurs jouent une stratégie maxmin, le paiement final peut être (3 , 5) ou (2 , 2).
CONSTAT : L’équilibre de Nash capture la stabilité alors que le maxmin capture la sécurité. Très
souvent, les solutions obtenues par les deux méthodes sont différentes, mais dans certains cas, les
solutions coïncident (cas du Dilemme du prisonnier).
Proposition : Une stratégie faiblement dominante est aussi une stratégie maxmin.
Corollaire 1 : Dans un jeu où chaque joueur a une stratégie faiblement dominante, le vecteur des
stratégies dominantes est un équilibre de Nash et aussi un vecteur de stratégies maxmin.
Corollaire 2 : Dans un jeu où chaque joueur a une stratégie strictement dominante, le vecteur des
stratégies strictement dominantes est l’unique équilibre de Nash et aussi l’unique vecteur de
stratégies maxmin.
Les gains étant connus des duopoleuses, on dit qu’elles sont « connaissance commune ».
Dans ce jeux, les intérêts des deux joueurs sont diamétralement opposés : si la part de marché de la
première augmente, celle de la deuxième doit nécessairement diminuer, on parle alors de jeux à
somme nulle (ou constante).
Travail à faire : A supposer que les agents adoptent un comportement prudent, déterminer
l’équilibre de ce jeu et donner la part de marché de chaque entreprise.
La forme extensive d’un jeu est une représentation arborescente et plus intuitive des jeux qui a été
popularisé par Selten en 1975. Elle représente des jeux séquentiels où les décisions sont prises à des
moments différents et où chaque joueur peut être amené à jouer plusieurs fois.
2.1.4.1. Exemple 1: le problème de l’entrant potentiel
Analysons le problème d’entrée d’une nouvelle firme sur un marché monopolistique.
l’entrant E doit choisir entre entrer ou ne pas entrer
Si elle entre, la firme installée (I) peut choisir de le combattre en cassant les prix ou de
coopérer avec lui, de manière à créer un monopole joint.
Ce jeu peut être représenté sous la forme arborescente suivante :
(40 , 50)
Coopérer
E Entrer I
Combattre
Non (-10 , 0)
(0 , 300)
non
(0 , 300)
TAF : Représentez ce jeu sous sa forme normale ou stratégique.
2.1.4.2. Exemple 2
Considérons le jeu qui est décrit par l’arbre suivant :
1) Déterminez si possible les équilibres de Nash du jeu décrit ci-dessous.
2) Déterminez l’équilibre parfait en sous-jeux (EPSJ) de ce jeu.
Joueur 1
A C
Joueur 2
(1 , 5)
B D
(0 , 0) (2 , 2)
Définition : Un ENPSJ est un profil de stratégies du jeu qui correspond à un EN dans chaque sous-
jeu du jeu. Ce profil ne repose aucunement sur des menaces non-crédibles et reste valable pour le
jeu tout entier.
2.1.4.3. Représentation de l’information
Un joueur, lors de sa prise de décision, n’a pas toujours connaissance des choix effectués par les
autres joueurs qui ont joué avant lui. Dans ce cas, il ne connait pas parfaitement le nœud auquel il se
situe. Si à un moment donné, un joueur ne peut distinguer deux nœuds, on dira que ces deux nœuds
appartiennent au même ensemble d’information.
Dans l’arbre du jeu, on représente chaque ensemble d’information soit en reliant par une courbe en
pointillé les nœuds qui appartiennent à cet ensemble, soit en les regroupant dans une ellipse.
Exemple : Dilemme du prisonnier et ensemble d’information
P1 P2
Définition 1 :
Un jeu en forme extensive est :
un jeu avec information imparfaite si au moins un ensemble d’information contient plus
d’un nœud ;
un jeu avec information parfaite si chaque ensemble d’information est réduit à un seul
nœud.
Définition 2 :
Un jeu est à information incomplète si au moins un des joueurs ne connait pas parfaitement la
structure du jeu (l’ensemble des joueurs, les ensembles de stratégies et les fonctions de paiement).
Dans le cas, contraire, il est à information complète.
Rares sont les jeux qui aboutissent à un équilibre en stratégies dominantes. Pour contourner cette
insuffisance, on a souvent recours à d’autres manières pour trouver une « solution » au jeu.
Dans un jeu à deux joueurs, si le premier à une stratégie dominante, alors on peut s’attendre à ce
qu’il choisisse cette stratégie et comme le joueur 2 est capable d’anticiper ce choix, il choisira alors
sa meilleure stratégie contre la stratégie dominante du premier.
Définition 1
Une stratégie strictement dominante est une stratégie qui est préférée à toutes les autres quelle que
soit la stratégie adoptée par l’autre joueur.
Joueur 2
A C
X (4 ; 3) (6 ; 2)
Joueur 1 Y (2 ; 1) (3 ; 6)
Z (3 ; 0) (2 ; 8)
Avec cette matrice, X devient une SD pour le joueur 1. Ce dernier devrait donc jouer cette stratégie.
Le joueur 2 a donc intérêt à jouer A et le résultat du jeu est donné par (X ; A).
Le processus d’élimination auquel nous avons eu recours est connu sous le nom de processus de
dominance successive. Ainsi, l’équilibre auquel on aboutit est qualifié d’équilibre itératif en
stratégies strictement dominantes.
Application 1
Déterminer le résultat probable de ce jeu en utilisant le processus de dominance successive.
Joueur 2
X Y Z
A (2 ; 5) (4 ; 8) (1 ; 3)
Joueur 1 B (1 ; 4) (2 ; 5) (3 ; 6)
C (3 ; 7) (5 ; 8) (2 ; 9)
Application 2
Considérons le jeu suivant dans lequel le joueur 1 est appelé TCHÊFARI et le joueur 2 est appelé
SARAMANI.
SARAMANI
Ne pas répondre Répondre Ecrire SMS
Appeler 1 ,0 1 ,2 0 ,1
TCHÊFARI
Ne pas appeler 0 ,3 0 ,1 2 ,0
Déterminez la solution de ce jeu.
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 22
Théorie des jeux Année universitaire 2018-2019
Application 3
Déterminez l’équilibre de Nash de ce jeu.
Joueur 2
A T B
O (3 ; 0) (0 ; 2) (0 ; 3)
Joueur 1 M (2 ; 0) (1 ; 1) (2 ; 0)
I (0 ; 3) (0 ; 2) (3 ; 0)
Correction
Le jeu commence par la décision de l’entrant potentiel E : il doit choisir s’il met en place ou non les
capacités de production nécessaires à son entrée sur ce nouveau marché. Ayant observé cette
décision, la firme installée (I) doit choisir si elle augmente ses propres capacités de production ou
non. L’entrant doit alors prendre sa décision de procéder effectivement à la production du bien ou
non et cela, sans pouvoir observer la décision de la firme installée. Si E choisit dès le début de ne
pas installer de capacités de production, le problème de l’entrée ne se pose plus et I garde son
monopole.
Dans ce dernier cas, nous ne pouvons réduire la stratégie de E à Non (ne pas installer de capacité)
car cette stratégie ne spécifie pas ce que E fait à son ensemble d’information E 1. Pourtant, comme
nous l’avons vu, chaque stratégie d’un joueur doit préciser une action chaque fois que ce joueur est
susceptible de jouer. Par conséquent, chaque stratégie de E doit préciser ici une action pour
l’ensemble d’information E 0 et une action pour E1 . De la même façon, tout profil de stratégies
doit préciser une action pour la firme I aussi même si elle n’a pas l’occasion de jouer effectivement
une fois que E choisit Non en E0 et termine le jeu. Un profil de stratégie complet de ce jeu serait par
exemple ((Non / E0 , Produire / E1), Non / I).
Dans ce jeu, le joueur E possède deux ensembles d’information (E 0 et E1) et donc chacune de ses
stratégies pures doit préciser une action en E0 et une autre en E 1 :
Avant de chercher un équilibre d’un jeu, il est conseillé de voir s’il est possible de simplifier ce jeu
en éliminant des stratégies redondantes et/ou des stratégies ouvertement inferieures à d’autres. Ce
type d’élimination simplifie le jeu.
Elimination des stratégies strictement équivalentes
Ce processus consiste à éliminer certaines stratégies qui semblent redondantes encore appelées
stratégies équivalentes.
I
Augmenter Non
𝐼𝑛𝑠𝑡𝑎𝑙𝑙𝑒𝑟 𝐸0 , 𝑃𝑟𝑜𝑑𝑢𝑖𝑟𝑒 𝐸1 (-50 , 40) (50 , 60)
𝐼𝑛𝑠𝑡𝑎𝑙𝑙𝑒𝑟 𝐸0 , 𝑁𝑜𝑛 𝐸1 (-10 , 120) (-10 , 100)
E
𝑁𝑜𝑛 𝐸0 (0 , 100) (0 , 100)
Une autre simplification importante du jeu peut être basée sur une évaluation des stratégies.
Elimination des stratégies dominées
Dans la forme normale précédente, on constate que la stratégie 𝐼𝑛𝑠𝑡𝑎𝑙𝑙𝑒𝑟 𝐸0 , 𝑁𝑜𝑛 𝐸1 est
strictement dominée par 𝑁𝑜𝑛 𝐸0 . Par conséquent, si le joueur E est rationnel, il ne devra jamais
choisir la stratégie 𝐼𝑛𝑠𝑡𝑎𝑙𝑙𝑒𝑟 𝐸0 , 𝑁𝑜𝑛 𝐸1 en présence des stratégies 𝑁𝑜𝑛 𝐸0 , 𝑃𝑟𝑜𝑑𝑢𝑖𝑟𝑒 𝐸1 et
𝑁𝑜𝑛 𝐸0 , 𝑁𝑜𝑛 𝐸1 [qui sont des stratégies équivalentes qui se résument à 𝑁𝑜𝑛 𝐸0 ].
En cumulant les deux types d’élimination développés ci-dessus, on obtient le jeu réduit ci-dessus.
Dans un jeu statique tel que le dilemme du prisonnier, il est possible que le résultat (une sorte de
solution naturelle au jeu) soit la défection entre les deux joueurs. Pourtant, intuitivement, il est fort
probable que la coopération émerge plus facilement lors d’interactions répétées plusieurs fois : on
parle de processus d’émergence de la coopération.
Définition 1 : On parle de jeu répété lorsque le jeu considéré consiste en la répétition successive
d’un même jeu, qualifié par ailleurs de jeu de base ou encore de jeu constituant.
Dans l’analyse d’un jeu répété, on fait l’hypothèse que les agents se souviennent du résultat des
tours précédents et même l’utilise dans leur prise de décision. Ils peuvent donc choisir une stratégie
lors d’une des périodes en prenant en compte d’une part les réponses possibles de l’autre joueur, et
d’autre part les stratégies de l’autre joueur depuis le début du jeu. A chaque tour, ils doivent donc
𝑆0 = 𝑢0 𝛿𝑡
𝑡 =0
𝛿 𝑛 +1 −1
On sait par ailleurs que : 1 + 𝛿 + 𝛿 2 + ⋯ + 𝛿 𝑛 = (suite géométrique de raison 𝛿)
𝛿−1
𝑛
𝛿 𝑛+1 − 1
𝑆0 = 𝑢0 𝛿 𝑡 = 𝑢0
𝛿−1
𝑡=0
−1 1
lim 𝑆0 = 𝑢0 = 𝑢0
𝑛→∞ 𝛿−1 1−𝛿
car lim𝑛 →∞ 𝛿 𝑛+1 = 0 avec 𝛿 ≤ 1.
Si nous supposons 𝑆1 comme l’ensemble des gains à venir, on a :
𝑆0 = 𝑢0 + 𝑆1
𝑆1 = 𝑆0 − 𝑢0
1
𝑆1 = 𝑢0 − 𝑢0
1−𝛿
1
𝑆1 = 𝑢0 −1
1−𝛿
𝛿
𝑆1 = 𝑢0
1−𝛿
On distingue deux grandes catégories de jeux répétés. On a d’un côté les jeux dont la fin est connue
avec certitude par l’ensemble des joueurs (les jeux finis) et ceux pour lesquels ce n’est pas le cas
(les jeux infinis).
Ainsi, on pourrait considérer le Dilemme du prisonnier comme un jeu fini si nous supposons qu’il
se répète durant un certain nombre de périodes T connues à l’avance par toutes les parties.
L’élément important ici réside dans la connaissance à l’avance de la date de fin du jeu par les deux
agents.
La détermination de l’équilibre dans les jeux finis se fait selon une méthode de raisonnement bien
particulière et très utile connue sous le nom de méthode de raisonnement à rebours (ou backward
induction). Celle-ci revient à trouver le comportement optimal des agents lors de la dernière
période, puis de raisonner en remontant le temps, à partir de la dernière période du jeu. On
détermine la solution à la période 𝑇 − 1, puis à la période 𝑇 − 2, etc. jusqu’à la première période.
Considérons à nouveau le dilemme du prisonnier en tant qu’un jeu répété un certain nombre de
périodes 𝑇 connues à l’avance (on parle alors de jeu fini). La fin du jeu est connue avec certitude
par tous les joueurs.
A la dernière période, on s’interroge sur la meilleure stratégie sachant que le jeu s’arrête. A cette
période, les joueurs pensent qu’il procède à un jeu statique (il n’y a pas de tour ultérieur) et
défection apparait donc comme une meilleure stratégie. A la période T, (défection ; défection) est
un ESD pour les joueurs. Ensuite la période T-1, un joueur peut coopérer et penser pouvoir inciter
l’autre à coopérer à la période T. Ce ne sera pas le cas car on a la défection qui est à la période T
comme une meilleure stratégie. En T-1, il n’y a aucun avantage coopérer, donc (D , D) y sera
l’équilibre. Idem pour la période T-2, et de proche en proche, on remonte à la période 1. En ayant
recours à la méthode de l’induction à rebours, on établit qu’à toutes les périodes, les agents joueront
la stratégie défection car ils anticiperont tout ce qui va se passer, ce qui se confirmera
rationnellement par la suite.
Ainsi, le seul ENPSJ du dilemme du prisonnier répété un nombre fini 𝑛 de fois est l’EN du jeu de
base répété 𝑛 fois.
Définition : L’effet de fin de jeu est la modification du comportement observé chez les joueurs
participant à un jeu répété, consistant à trahir au fur et à mesure que la fin du jeu approche ; alors
même qu’ils ont eu à coopérer depuis les premières périodes du jeu.
Il existe également deux types de jeux infinis : les situations dans lesquelles le jeu continue jusqu’à
la fin des temps (la date 𝑇 de la dernière période tend vers l’infini) et les situations dans lesquelles
le jeu s’arrêtera de manière imprévue par les agents, aléatoirement par exemple (ces jeux sont
équivalents sur le plan de l’écriture formelle du jeu).
Il est impossible ici de faire le backward induction (ou méthode de l’induction à rebours) car on ne
connait pas la fin du jeu. Comment détermine-t-on alors le raisonnement des agents du jeu ?
Processus d’émergence de la coopération
Reconsidérons l’exemple du Dilemme du prisonnier, mais cette fois-ci dans un contexte de
répétition. On admet donc que ces individus procèdent à l’addition de leurs gains à travers le temps.
Si on instaure ce type de jeu répété entre deux étudiants sans leur donner de date finale. Alors ces
étudiants pourraient de manière plus ou moins tacite au début du jeu choisir de nier tous. Ils peuvent
choisir ces stratégies sous-optimales de prime abor (à court terme), afin de tenir compte de leur
intérêt à long terme.
Application numérique :
Considérons le jeu du dilemme du prisonnier suivant qui est répété un nombre infinis de fois :
2
A B
A (4 , 4) (-1 , 6)
1
B (6 , -1) (2 , 2)
Dans ce cas, les deux joueurs vont évaluer leurs gains totaux en actualisant leurs gains futurs. Soit 𝑖
le taux d’intérêt auquel les joueurs actualisent leurs gains, le facteur d’actualisation s’écrira comme
1
suit : 𝛿 = .
1+𝑖
Supposons à présent que les joueurs adoptent les stratégies suivantes (que l’on qualifie de plan
d’actions) :
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 29
Théorie des jeux Année universitaire 2018-2019
Choisir A au démarrage du jeu et continuer avec A tant que l’autre joueur n’a pas changer
de stratégie (c’est-à-dire n’a pas choisi B)
choisir B le reste du jeu dès lors que l’autre joueur a choisi B.
Il suffit que le facteur d’actualisation soit assez élevé pour que le résultat (A , A) constitue un
équilibre du jeu répété à l’infini (cet équilibre est caractérisé par le fait que les deux joueur
choisissent en permanence A). Cette stratégie de punition « inexorable » est appelé grim strategy).
Ce résultat est prouvé dans l’exemple précédent. Face à un joueur adoptant la grim strategy, le gain
du choix de A est égal à :
4 4 4
𝐺𝐴 = 4 + + 2
+ 3
+⋯
1+𝑖 1+𝑖 1+𝑖
= 4 1 + 𝛿 + 𝛿2 + 𝛿3 + ⋯
4
=
1−𝛿
En choisissant B, le joueur emmène l’autre à actionner une mesure de rétorsion pour toutes les
périodes suivantes. En effet, choisir B permet certes de gagner 6 pour la période courante, mais
entraine par la suite de façon inexorable, un gain égal à 2. Le gain obtenu en choisissant B est donc
égal à :
2 2 2
𝐺𝐵 = 6 + + 2
+ 3
+⋯
1+𝑖 1+𝑖 1+𝑖
= 6 + 2 𝛿 + 𝛿2 + 𝛿3 + ⋯
𝛿
=6+2
1−𝛿
1
Le choix de A est optimal si et seulement si 𝐺𝐴 > 𝐺𝐵 c’est-à-dire si 𝛿 > ⟺ 𝑖 < 1. Dans cet
2
1
exemple, si 𝛿 > , les gains de long terme de A est supérieur au gain de court terme de B. Les deux
2
1
joueurs ont donc intérêt à choisir A à chaque période du jeu. Dans ce cas (si 𝛿 > ), la grim strategy
2
adoptées par les deux joueurs sont des meilleures réponses l’une par rapport à l’autre. Et comme
aucun des joueurs n’a intérêt à changer de stratégie, alors ces stratégies (A , A) définissent un
équilibre du jeu. Si la stratégie A est la coopération et B la défection, on constate donc nettement le
processus d’émergence de la coopération.
L’équilibre déterminé dans ce jeu en est un parmi tant d’autres. Ce résultat a été démontré par de
nombreuses personnes et est connu sous le nom de folk theorem.
Le Folk theorem
Ce théorème est connu sous le nom de « théorème de tout le monde ». Il est relatif aux jeux répétés
indéfiniment. Ce théorème établit l’existence d’un très grand nombre d’équilibre de Nash parfait en
A partir du moment où les agents ne jouent pas simultanément, mais l’un après l’autre (ils jouent
séquentiellement), on est en présence de jeu dynamique ou de jeu séquentiel (par opposition aux
jeux statiques ou simultanés). Par ailleurs, l’ordre des coups est important, raison pour laquelle il est
préférable de représenter ce type de jeu sous forme extensive plutôt que sous la forme normale.
Définition 1
On appelle sous-jeu tout jeu issu de jeu original, partant d’un nœud de décision « isolé » (c’est-à-
dire, un nœud dont l’ensemble de décision ne contient aucun autre nœud) et comprenant tous les
nœuds qui en découlent directement.
NB : le jeu tout entier est un sous-jeu.
Quant un sous-jeu est différent du jeu original, on l’appelle sous-jeu propre.
Exemple : “Attaque publicitaire”
Deux Vendeurs de garba G1 et G 2 sont en duopole sur le marché de la vente de garba et font des
bénéfices respectifs (1 , 5) ; G1 peut ou non lancer une campagne publicitaire (coûteuse) pour
accroitre sa part de marché, ce qui réussira si G 2 ne réagit pas et les amènera alors à (2 , 3) ; en
revanche, si G2 réagit en lançant sa propre campagne, les bénéfices deviendront (0 , 2). TAF :
1) Représentez ce jeu :
a. sous forme normale
b. sous forme séquentiel
2) Déterminer les équilibres de Nash de ce jeu.
3) Identifiez un ENPSJ de ce jeu.
Les analyses qui seront menées ici se baseront toutes sur le modèle de base simple de la
concurrence homogène. La demande du marché est supposée linéaire et de la forme suivante :
𝑝 𝑄 = 𝑎 − 𝑏𝑄. Les coûts marginaux 𝑐 sont supposés constants.
Le modèle duopolistique de Cournot décrit une concurrence par les quantités à une période ou
simultanée. Les entreprises décident de leur production de façon simultanée. Chacune des
L’équilibre de Nash-Cournot du marché est déterminé grâce aux fonctions de réaction par rapport
aux quantités qui se déduisent. Il se trouve à l’intersection des deux fonctions de réaction.
Les fonctions de profit
𝜋1 𝑞1 , 𝑞2 = 𝑝 𝑞1 + 𝑞2 . 𝑞1 − 𝐶 𝑞1 = 𝑎 − 𝑏(𝑞1 + 𝑞2 ) 𝑞1 − 𝑐1 𝑞1
𝜋2 𝑞1 , 𝑞2 = 𝑝 𝑞1 + 𝑞2 . 𝑞2 − 𝐶 𝑞2 = 𝑎 − 𝑏(𝑞1 + 𝑞2 ) 𝑞2 − 𝑐2 𝑞2
Ces fonctions de réactions sont des fonctions concaves (des paraboles ouvertes vers le bas), elles
ont donc chacune un maximum.
Les fonctions de réaction
𝜕𝜋1 𝑞1 , 𝑞2 𝜕𝑝 𝜕𝑄
=𝑝 𝑄 + 𝑞 − 𝐶𝑚 𝑞1 = 0
𝜕𝑞1 𝜕𝑄 𝜕𝑞1 1
𝑄 𝜕𝑝 𝜕𝑄 𝑞1
𝑅𝑚 𝑞1 = 𝑝 𝑄 1 +
𝑝 𝜕𝑄 𝜕𝑞1 𝑄
𝑞1
𝑄
=𝑝 1− = 𝐶𝑚 𝑞1
𝜀𝑄
𝑝
L’équation (*) stipule que le monopoleur peut étendre son offre jusqu’à ce que la recette marginale
soit égale au coût marginal. La partie gauche de l’équation (**) indique, par rapport au prix,
l’importance de l’augmentation du prix que le monopoleur souhaiterait avoir au delà du coût
marginal. Ce quotient est aussi utilisé comme mesure du degré de monopole. Il est qualifié par
ailleurs d’indice de Lerner.
la quantité de concurrence. Les quantités produites par les deux entreprises sont stratégiquement
substituables c’est-à-dire si une entreprise augmente son offre l’autre a intérêt à baisser la sienne.
𝜕𝑞 2𝑅 1
= − < 0 ⇒ Si l’entreprise 2 augmente sa production d’une unité alors l’entreprise 1 réduira
𝜕 𝑞1 2
𝜕𝑞 1𝑅 𝜕𝑞 2𝑅
appelées substituts stratégiques si < 0 𝑒𝑡 < 0.
𝜕 𝑞2 𝜕 𝑞1
1 1
𝑞1𝐶 = 𝑎 − 2𝑐1 + 𝑐2 (1) 𝑞2𝐶 = 𝑎 − 2𝑐2 + 𝑐1 (2)
3𝑏 3𝑏
1 1
𝑄𝐶 = 𝑞1𝐶 + 𝑞2𝐶 = (2𝑎 − 𝑐1 − 𝑐2 ) (3) 𝑝𝐶 = (𝑎 + 𝑐1 + 𝑐2 ) (4)
3𝑏 3
1 1
𝜋1𝐶 = (𝑎 − 2𝑐1 + 𝑐2 )2 (5) 𝜋2𝐶 = (𝑎 − 2𝑐2 + 𝑐1 )2 (6)
9𝑏 9𝑏
𝑞1𝑅 𝑞2
𝑞1𝐶 𝑞1𝑀 𝑞1
Pour la suite de cet exercice, nous allons admettre les formes suivantes des fonctions de profit :
𝜋1𝐶 = 𝜋1 𝑞1 , 𝑞2 , 𝑞1𝑅 𝑞1 , 𝑞2𝑅 𝑞1 𝜋2𝐶 = 𝜋2 𝑞1 , 𝑞2 , 𝑞1𝑅 𝑞1 , 𝑞2𝑅 𝑞1
Les équations (1) (2) (5) et (6) ci-dessus montrent qu’à l’équilibre l’entreprise qui a les coûts les
plus bas obtient une part de marché plus importante, et donc un profit plus élevé. Les entreprises ont
donc intérêt à chercher à être leader par les coûts. Elles disposent pour cela de deux moyens : soit en
baissant ses propres coûts (moyen direct) soit en augmentant les coûts de la concurrente (moyen
indirect). Ces différents moyens peuvent être analysés via la dérivation de la fonction de profit 𝜋1𝐶
par rapport au coût 𝑐1 .
a) Moyen direct de la domination par les coûts
𝜕𝜋1𝐶 𝜕𝜋1 𝜕𝜋1 𝜕𝑞2 𝜕𝜋1 𝜕𝑞1𝐶
= + + . <0
𝜕𝑐1 𝜕𝑐1 𝜕𝑞2 𝜕𝑐1 𝜕𝑞1 𝜕𝑐1
<0 <0 >0 =0
𝑒𝑓𝑓𝑒𝑡 𝑑𝑖𝑟𝑒𝑐𝑡 <0
𝑒𝑓𝑓𝑒𝑡 𝑖𝑛𝑑𝑖𝑟𝑒𝑐𝑡
L’effet direct : La baisse des coûts de production accroit le taux de marge (c’est-à-dire l’écart entre
le prix et le coût) et donc le profit de cette entreprise.
L’effet indirect ou stratégique : D’une part, la baisse du coût de production de l’entreprise 1 nuit à
𝜕𝑞 2
la seconde qui voit sa situation détériorée. L’entreprise 2 réduit donc son offre > 0 . D’autre
𝜕𝑐1
𝜕𝜋 1
part, la réduction de l’offre entraîne une hausse du prix et ainsi une augmentation du profit <
𝜕 𝑞2
𝜕𝜋 1
0 . Quant à = 0, cela s’explique par le fait que l’on a une condition de premier ordre de la
𝜕 𝑞1
maximisation du profit. Tout ceci montre que la diminution des coûts de l’entreprise 1 a un effet
𝜕𝜋 𝐶1
positif sur son profit d’équilibre <0 .
𝜕𝑐1
On remarque que l’accroissement des coûts de l’entreprise 2 ne relève pas d’une action délibérée de
celle-ci pour accroitre le profit de l’entreprise 1. l’entreprise 1 le fait dans le but de nuire en priorité
à l’entreprise 2 plutôt que d’améliorer sa situation (premier terme) mais de façon indirecte (effet
indirect ou stratégique). Si nous supposons à présent que l’effet direct est nul, quelle interprétation
peut-on de l’effet indirect ?
Le modèle de Stackelberg se positionne comme une critique de celui de Cournot. Ce modèle décrit
une concurrence par les quantités à deux périodes ou séquentielle, dans laquelle les entreprises
fixent leurs quantités offertes l’une après l’autre : le Leader par les quantités ou le leader de
Stackelberg fixe sa quantité offerte en première période. Celle-ci est connue de la seconde (le
suiveur par les quantités ou suiveur de Stackelberg). En seconde période, le suiveur accorde sa
quantité offerte afin de maximiser son profit. Cette réalité est prise en compte par le leader dans sa
décision de production, le leader inclut donc la fonction de réaction du suiveur dans son propre
calcul de maximisation. La résolution de ce modèle se fait par le calcul d’un équilibre de sous-jeu
parfait (« résolution par la fin »).
L’équilibre de Stackelberg-Nash du marché est déterminé à partir des mêmes expressions des
fonctions de profit utilisées dans le la concurrence simultanée chez Cournot.
Les fonctions de profit
𝜋1 𝑞1 , 𝑞2 = 𝑎 − 𝑏(𝑞1 + 𝑞2 ) 𝑞1 − 𝑐1 𝑞1
𝜋2 𝑞1 , 𝑞2 = 𝑎 − 𝑏(𝑞1 + 𝑞2 ) 𝑞2 − 𝑐2 𝑞2
La fonction de réaction du suiveur (seconde période)
En adoptant la même démarche que dans le modèle de Cournot et en considérant l’entreprise 2
comme le suiveur, la fonction de réaction de cette dernière devient :
𝑎 − 𝑐2 1
𝑞2𝑅 𝑞1 = − 𝑞1
2𝑏 2
La quantité optimale produite par le leader (première période)
Le leader de Stackelberg, l’entreprise 1, tient compte dans la maximisation de son profit, du fait que
le suiveur réagit de manière optimale à la quantité qu’elle-même produit. Sa fonction (réduite) de
profit est donc la suivante :
𝜋1 𝑞1 = 𝑅1 𝑞1 , 𝑞2𝑅 𝑞1 − 𝐶1 𝑞1
= 𝑝 𝑞1 + 𝑞2𝑅 𝑞1 𝑞1 − 𝑐1 𝑞1
= 𝑎 − 𝑏(𝑞1 + 𝑞2𝑅 𝑞1 ) 𝑞1 − 𝑐1 𝑞1
On peut déterminer la quantité offerte qui maximise le profit du leader via les conditions de premier
ordre, ou encore via la règle d’offre (recette marginale = coût marginal).
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 35
Théorie des jeux Année universitaire 2018-2019
CIO :
𝜕𝜋1 𝑞1 𝜕𝑝 𝜕𝑄 𝜕𝑝 𝜕𝑄 𝜕𝑞2𝑅
=𝑝 𝑄 + 𝑞 + 𝑞 − 𝐶𝑚 𝑞1 = 0
𝜕𝑞1 𝜕𝑄 𝜕𝑞1 1 𝜕𝑄 𝜕𝑞2 𝜕𝑞1 1
ou bien
𝜕𝑝(𝑄) 𝜕𝑝(𝑄) 𝜕𝑞2𝑅 (𝑞1 )
𝑅𝑚1 𝑞1 = 𝑝 𝑄 + 𝑞1 + 𝑞1
𝜕𝑄 𝜕𝑄 𝜕𝑞1
𝑒𝑓𝑓𝑒𝑡 𝑑𝑖𝑟𝑒𝑐𝑡 𝑒𝑓𝑓𝑒𝑡 𝑠𝑢𝑖𝑣𝑒𝑢𝑟 𝑖𝑛𝑑𝑖𝑟𝑒𝑐𝑡
𝜕𝑄 𝜕𝑄 𝜕𝑝 (𝑄) 𝜕𝑞 2𝑅 (𝑞 1 )
Car = = 1; 𝑅𝑚1 𝑞1 = 𝑝 𝑄 + 𝑞1 1+
𝜕 𝑞1 𝜕 𝑞2 𝜕𝑄 𝜕 𝑞1
𝑠1 𝜕𝑞2𝑅 𝑞1
=𝑝 𝑄 1− 1+ = 𝐶𝑚 𝑞1
𝜀𝑄,𝑝 𝜕𝑞1
𝑝 − 𝐶𝑚 𝑞1 𝑠1 𝜕𝑞2𝑅 𝑞1
𝑀𝑃𝐶1𝑆 = = 1+
𝑝 𝜀𝑄,𝑝 𝜕𝑞1
fait que le suiveur s’adapte réduit, toutes choses égales par ailleurs l’offre totale du marché,
ce qui influence positivement le prix et la recette du leader. Ces derniers enregistrent des
augmentations.
La règle d’offre du leader de Stackelberg 𝑅𝑚 𝑞1 = 𝐶𝑚 𝑞1 permet d’écrire :
𝑏 𝑎 − 𝑐2
𝑅𝑚 𝑞1 = 𝑎 − 𝑏𝑞1 − = 𝑐1 = 𝐶𝑚 𝑞1
2𝑏
𝑎−2𝑐1 +𝑐2
On peut ainsi déterminer la quantité offerte qui maximise le profit du leader : 𝑞1𝑆 =
2𝑏
Et la quantité offerte par le suiveur est obtenue en remplaçant dans sa fonction de réaction.
𝑞1𝑅 𝑞2
Equilibre de
𝑞2𝑀
Stackelberg-Nash
𝑞2𝐶 C
𝑞1𝑆 S
𝑞2𝑅 𝑞1
Les raisonnements, que nous avons menés jusque-là, ont été basés sur l’hypothèse du « common
knowledge » (connaissance commune en français). On a donc supposé que le jeu et ses paramètres
sont une connaissance commune entre les joueurs. Nous avons analysé à cet effet les jeux non
coopératifs à information complète.
Dans la réalité, on sait qu’un agent économique (entreprise, consommateur, etc.) peut disposer
d’information privée c’est-à-dire une information que lui seul détient.
Exemple 1 : Le marché de l’occasion où le vendeur est seul à connaitre les éventuels défauts du
bien échangé.
Exemple 2 : Une entreprise connait bien ses propres coûts, mais ne connait pas ceux de son
concurrent, ni la situation financière de celui-ci.
Il est donc possible que dans un jeu donné, un joueur peut avoir un doute sur le type de son
partenaire, sur ses stratégies ou encore sur sa fonction d’utilité. Ce sont ces types de situation de
jeux que ce chapitre se propose d’analyser. Appelés jeux à information incomplète (ou jeux
bayésiens), ces jeux cherchent à analyser le type de jeu dans lesquels les joueurs ne connaissent pas
parfaitement les données du jeu. Dans ces jeux, avec l’incomplétude de l’information, il est encore
plus difficile pour les joueurs de se comporter de manière rationnelle et de prédire le type de
résultats auquel on aboutira.
L’approche proposée par Harsanyi dénommée approche bayésienne consiste à attacher une
distribution de probabilité à tout élément incertain. En recevant une nouvelle information, l’agent
est amené à réviser ses croyances en se basant sur la règle de Bayes pour les probabilités
conditionnelles.
Une information privée est une information qui est détenue par un agent dans un jeu et que cela est
su par les autres agents engagés dans ce jeu.
Mais, si cela n’est pas su par les autres agents, on est en présence d’une information secrète.
Le fait de détenir une information secrète est toujours avantageux pour tout joueur. En effet, si les
autres joueurs ne savent pas que ce joueur détient une information, il peut toujours cacher son jeu
c’est-à-dire il peut jouer comme s’il n’en avait pas et même comme s’il n’avait aucun avantage à
l’utiliser à son profit.
Supposons deux entreprises 1 & 2 engagées dans un jeu stratégique. Il est possible pour l’entreprise
1 (qui n’est pas sûre de ce que fera l’entreprise 2, mais qui est capable d’assigner des probabilités à
chaque action possible de l’entreprise 2) d’adopter une stratégie qui maximise son espérance de
gain.
Application numérique
Entreprise 2
Lancer le produit Ne pas lancer le produit
Lancer le produit 0 ,0 -10 , 10
Entreprise 1
Ne pas lancer le produit -100 , 0 20 , 10
Considérons deux individus (Adjoua & Affoué) qui sont engagés dans un jeu simultané. On
considère que Affoué peut être de deux types A ou B.
Si Affoué est de type A, les gains du jeu sont :
Affoué
N R
N (3 ; 1) (2 ; 0)
Adjoua
R (0 ; 1) (4 ; 0)
1
Cette section et la suivante sont des adaptations réalisées à partir de Eber (2013, pp. 40-44)
Support de cours Dr SANGARE M. cel. : 05 40 18 40 / 02 27 17 90 39
Théorie des jeux Année universitaire 2018-2019
Si Affoué est de type B, les gains du jeu sont :
Affoué
N R
N (3 ; 0) (2 ; 1)
Adjoua
R (0 ; 0) (4 ; 1)
Affoué connait son propre type. Par contre, Adjoua ignore le type de Affoué, mais sait juste qu’elle
peut être de type A ou de type B avec la même probabilité ½.
Adjoua ne connait pas précisément les gains du jeu auquel elle participe. Cependant, elle possède
une croyance sur ces gains. Ces croyances sont représentées sous la forme d’un ensemble de
fonctions de gains possibles et de probabilités attachées à chacune de ces fonctions.
Ce jeu est à information incomplète dans la mesure où Adjoua ne connait pas un élément
fondamental du jeu, à savoir le type de Affoué, dont dépend la matrice des payoffs (gains).
TAF :
1) Vous êtes Affoué de type A. Que jouez-vous ? N ou R ?
2) Vous êtes Affoué de type B. Que jouez-vous ? N ou R ?
3) vous êtes Adjoua. Que jouez-vous ? N ou R ?
Répondre à ces questions nécessite que l’on fasse le rappel de certaines notions.
Rappels
Un jeu à information imparfaite est un jeu dans lequel au moins un des joueurs ne connait pas ce
que les autres joueurs ont fait auparavant. On dit que le jeu est à information parfaite dans le cas
contraire.
Un jeu à information incomplète est un jeu dans lequel au moins un des joueurs ne connait pas
parfaitement la structure du jeu. On dit que le jeu est à information complète dans le cas contraire.
Les travaux de Harsanyi (1967, 1968) ont permis de montrer qu’il est possible de transformer un jeu
à information incomplète en un jeu à information complète, mais imparfaite, dès lors qu’il existe
une distribution de probabilité à priori sur les paramètres inconnus et que cette distribution de
probabilité est connue (et réputée connue) de tous. De manière précise, il faut que la distribution de
probabilité a priori soit connaissance commune, c’est-à-dire que chaque joueur la connaisse, que
chaque joueur sache que les autres la connaissent, que chaque joueur sache que chaque joueur sait
que les autres la connaissent, etc.
Pour répondre aux questions de l’exercice précédent, il importe d’incorporer un nouveau joueur
appelé « nature » dont l’indifférence est constaté à l’issue du jeu et qui décide de la nature du joueur
conformément à la distribution de la probabilité (½ et ½ pour chaque type du joueur). En procédant
ainsi, on transforme le jeu à information incomplète en jeu à information complète, mais imparfaite.
Nature
½ ½
Affoué – type A Affoué – type B
N R N R
Adjoua Adjoua Adjoua Adjoua
N R N R N R N R
Pour résoudre les jeux à information incomplète, il est nécessaire de définir le concept d’équilibre
bayésien. Cela est nécessaire dans la mesure où l’incertitude plane sur une des caractéristiques d’un
joueur (le type de ce joueur). Cette caractéristique est connue seulement de ce joueur et non des
autres.
Définitions :
La stratégie contingente aux types d’un joueur est une règle d’action spécifiant une action
(faisable) pour chacun des types possibles du joueur.
Un équilibre bayésien est un ensemble de stratégies contingentes aux types (une par joueur) tel que
chaque joueur maximise son espérance de gain étant donné les stratégies contingentes à leurs types
des autres joueurs et les distributions de probabilité sur les types de ces autres joueurs.
Remarque : Tout jeu statique fini à information incomplète admet au moins un équilibre bayésien.
Ce constat est une extension du théorème de Nash à ce type de jeux.
Il est plus commode de représenter le jeu précédent sous forme normale suivante :
Affoué
Type A Type B
Probabilité ½ Probabilité ½
N R N R
N 3 ,1 2 ,0 3 ,0 2 ,1
Adjoua
R 0 ,1 4 ,0 0 ,0 4 ,1
Il est aisé de remarquer que chaque type de Affoué a une action strictement dominée. Pour le type
A, la stratégie R est strictement dominée et pour le type B, la stratégie N est strictement dominée.
1) Stratégie adoptée par Affoué de type A ou de type B
Si Adjoua choisit R, elle obtiendra 0 si Affoué est de type A (cette dernière choisit dans ce cas N) et
4 si Affoué est de type B (dans ce cas cette dernière choisit R). Ainsi, comme les deux types ont la
0+4
même probabilité ½, le choix de R donne à Adjoua une espérance de gain égale à =2.
2
5
On constate que le gain espéré de la stratégie N est supérieur à celui de la stratégie R 2 < . On
2
Considérons un jeu à deux joueurs 1 et 2. Le joueur 1 peut être de types A ou B. Il connait son
propre type, alors que le joueur 2 sait juste qu’il y a une probabilité ½ pour que le joueur 1 soit de
type A et une probabilité ½ pour qu’il soit de type B.
Le jeu s’effectue de la façon suivante. Le joueur 1 commence par choisir entre deux options : I et S.
Ce choix est communiqué au joueur 2. Connaissant le choix du joueur 1, le joueur 2 peut choisir
trois options possibles : C, D et E. Les Tableaux A et B décrivent les gains respectivement lorsque
le joueur 1 est de type A ou de type B.
Tableau A.1 : Joueur 1 et type A
Joueur 2
C D E
I 300 , 300 0 ,0 500 , 350
Joueur 1
S 450 , 900 150 , 150 1000 , 300
Nature
½ ½
Joueur 1 – type A Joueur 1 – type B
S I S I
Joueur 2 Joueur 2 Joueur 2 Joueur 2
C C E
D E D C D
E C D E
Comme proposé par Harsanyi, il est possible de transformer le jeu à information incomplète en un
jeu à information imparfaite. cette transformation ajoute au jeu un troisième joueur du nom de
« nature » qui tire au sort le type du joueur 1 conformément à la distribution de probabilité spécifiée
et qui est indifférente à l’issue du jeu.
Définition : Un équilibre bayésien parfait est un ensemble de stratégies (une par joueur) avec un
système de croyances (c’est-à-dire de probabilités affectées à la réalisation de chaque valeur
possible des paramètres inconnus du jeu) associés à ces stratégies tels que, à chaque étape du jeu :
aucun joueur n’a intérêt à changer de stratégie étant donné les stratégies des autres joueurs et
le système de croyances, et
les croyances sont déduites des stratégies d’équilibre et des actions observées en appliquant
la règle de Bayes.
Remarque : Tout jeu dynamique fini à information incomplète admet au moins un équilibre
bayésien parfait.
Joueur 1 de type A
Si ce joueur envoie un signal I, cela lui rapporte, selon la réponse du joueur 2, des gains de (300, 0,
500). Mais, s’il envoie un signal S, il obtient selon la reponse du joueur 2, des gains de (450, 150,
1000). On peut donc naturellement supposer que le joueur 1 de type A semble plutôt enclin à choisir
S.
Joueur 1 de type B
Un signal I lui rapporte des gains de (500, 300, 300) contre (450, 0, 0) pour le signal S. Le joueur 1
de type B semble donc avoir intérêt à donner un signal I.
Quel devra être le comportement du joueur 2 ?
Si le joueur 1 de type B “donne le signal I”, la meilleure réponse du joueur 2 est de choisir C pour
un gain de 500 contre D pour un gain de 450 et E pour un gain de 0 (voir Tableau A.2 ci-après).
Tableau A.2 : Joueur 1 de type B
Joueur 2
C D E
I 500 , 500 300 , 450 300 , 0
Joueur 1
S 450 , 0 0 , 300 0 , 150
En anticipant la réaction du joueur 2 (le fait qu’il donne la réponse C dans les deux cas), le joueur 1
a effectivement intérêt à envoyer un signal S s’il est de type A (cela lui rapporte 450 au lieu de 300
s’il envoie un signal I) et un signal I s’il est de type B (cela lui rapporte 500 au lieu de 450 s’il
envoie un signal S).
En somme, l’équilibre bayésien parfait est caractérisé par l’ensemble des stratégies suivantes :
le joueur 1 envoie le signal S s’il est type A et le signal I s’il est de type B ; et
le joueur 2 donne la réponse C dans les deux cas.
Remarque : le joueur 1 révèle son type par le signal qu’il envoie (type A si le signal envoyé est S,
type B si le signal envoyé est I) ; on parle alors d’équilibre séparateur dans la mesure où il permet
de « séparer » les joueurs selon leur type.
Ce chapitre se propose de passer en revue deux types de jeux qui sont assez connus en Economie
industrielle (pour les premiers) et en biologie (pour les seconds). Dans ce chapitre, on se contentera
donc d’exposer les caractéristiques de ces jeux. On tentera notamment de souligner la particularité
de ces jeux en montrant en quoi ils se différencient des types de jeux que nous avons vus jusque-là.
4.1.1. Définition
De prime abor, coopérer revient tout simplement à « agir ensemble dans un intérêt commun ». En
procédant de la sorte, les agents ou les joueurs se séparent nécessairement de leurs utilités
individuelles pour définir une sorte d’utilité commune capable de déterminer leur comportement
commun. Ainsi, donc on observe une contradiction avec l’hypothèse essentielle sous-jacente au jeu
non-coopératif analysé jusque-là : le but d’un agent est de maximiser son espérance d’utilité étant
donné sa croyance.
Un jeu coopératif, ou jeu de coopération, est un jeu dans lequel tous les participants (encore
appelés joueurs) gagnent ou perdent ensemble. Au lieu de jouer en opposition (les uns contre les
autres), les joueurs jouent conjointement ou ensemble pour réaliser un objectif commun.
Dans ce type de jeu, chaque joueur possède, en plus des options existantes, d’autres options pour
marchander avec les autres joueurs.
La grande difficulté dans ce cas est de modéliser les comportements de coopération sans violer les
fondements de la théorie des jeux.
On distingue les jeux de coopération totale des jeux semi-coopératifs. La première catégorie
répond scrupuleusement aux principes évoqués ci-dessus ; alors que la seconde respecte seulement
en partie ces principes.
Les jeux qui ont été analysés jusque-là sont basés sur l’hypothèse de rationalité des joueurs. Cette
hypothèse a constitué le socle de la détermination de l’équilibre de Nash dans les jeux simultanés,
l’équilibre parfait en sous-jeux dans les jeux séquentiels et les équilibre bayésien parfait et de
l’émergence de la coopération dans les jeux répétés.
A côté de ces situations, force est d’admettre que les individus sont parfois dotés d’une rationalité
limitée dans des situations qu’ils vivent. En effet, le comportement des individus est guidé par un
apprentissage basé sur un processus d’essai et erreur ou d’imitation des autres joueurs. Ce type de
comportement est le plus souvent observé, et ce depuis bien longtemps, au sein des sociétés
animales (exemple les fourmis).
Exemples :
Dans une fourmilière, les fourmis ne sont pas dotées de rationalité, pourtant la fourmilière
fonctionne d’une manière harmonieuse et stable dans le temps.
On constate par ailleurs au sein de certaines communautés d’animaux sauvages (gorilles, fauves,
…) que les combats à mort (qui devait aboutir à la suprématie de l’un suite à la mort de tous ses
concurrents) font de plus en plus place à une symbolique de la domination et de la soumission. La
résolution de ce type de conflit (tout comme l’éclosion d’une société harmonieuse et stable dans une
fourmilière) laisse présager l’instauration au cours du temps de règles de comportements simples,
grâce à un apprentissage par la communauté d’animaux.
On constate que l’évolution observée au sein des communautés animales est caractérisée par la
stabilité des comportements, et non la conformité à tout critère d’optimalité.
S’inspirant des mécanismes de l’évolution biologique (la mutation et la sélection), les jeux
évolutionnaires étudient les solutions auxquelles peuvent aboutir les interactions en l’absence de
rationalité forte. Ce type de jeu est caractérisé par le fait qu’il est joué un grand nombre de fois alors
même que les individus possèdent une rationalité limitée et très peu d’information sur le
déroulement du jeu.
L’évolution des espèces et des populations correspondantes est analysée par la théorie de
l’évolution. Cette évolution est portée par les mutations dans les génomes (ensemble des gênes
porté par les chromosomes) des individus qui constituent l’espèce et par la sélection des
caractéristiques correspondantes à ces génomes par la pression du milieu dans le processus de
reproduction. On remarquera parfois que certains génotypes s’étendent dans l’espèce (avec de plus
en plus d’individus à chaque génération) lors de leur reproduction, alors que la proportion des autres
se réduit. Ainsi, certains auteurs sont arrivés à la conclusion selon laquelle les « inventions » de la
nature résulteraient de mécanismes très efficaces et aboutiraient à des solutions remarquables.
Si aucune mutation opérée dans l’espèce ne peut détrôner un ensemble de caractéristiques (et donc
le génome correspondant) alors on aboutit à une stabilité dans le processus d’évolution.
Ce cours n’a aucunement la prétention de détenir et d’aborder toutes les notions de la théorie des
jeux. D’ailleurs, de nombreux types de jeux contenus dans cette discipline ne sont pas analysés dans
ce cours. Il se propose juste de passer en revue quelques uns des principaux types de jeux. Les
critiques, que l’on pourrait avancer à l’encontre de ce cours, sont évidemment les mêmes adressées
à la théorie des jeux.
Si la théorie des jeux s’est révélée dans le temps comme un puissant outil d’analyse économique, de
nombreuses critiques ne manquent pas de fuser à son encontre. Un auteur comme Guerrien (2010)
ne manque pas de souligner clairement son scepticisme dans l’application concrète de la théorie des
jeux. Eminent théoricien des jeux de formation, Rubinstein (2006, 2012), quant à lui, qualifie cette
discipline de “fable”. Il déplore le fait que les nombreux modèles économiques qui y sont abordés
aboutissent à des résultats fortement sensibles aux hypothèses admises au point d’empêcher
l’adoption de généralités. Ces critiques sont relativisées par Gilboa (2010). Ce dernier met en avant
les avantages de la théorie des jeux en tant que théorie du choix rationnel en interaction stratégique,
même si les résultats de cette discipline ne sont pas toujours robustes.
Pour souligner l’importance de plus en plus grandissante de la théorie des jeux, Eber (2006) énonce
le recours à la théorie des jeux dans la définition des modalités de la vente aux enchères des licences
de téléphonie mobile en 1994 aux USA (considérée comme « la plus grande de tous les temps » ou
encore « le triomphe de la théorie des jeux ») et dans les plus grands cabinets de consultance et des
centres de recherche de certaines firmes multinationales. Pour montrer à quel point la théorie des
jeux pourrait être familière à tous, cet auteur donne l’exemple de la mère qui doit partager un
morceau de pain entre ses deux enfants. Pour éviter qu’aucun de ses enfants ne se fâche, elle
pourrait établir une règle simple de partage. L’un d’entre eux se charge de partager le pain et le
second fait son choix en première position. Sachant très bien que l’autre choisira avant lui, alors
celui qui est chargé du partage se forcera d’être le plus juste possible (on a une sorte d’analyse
basée sur l’induction à rebours). On voit à quel enseigne la théorie des jeux intervient dans la vie de
tous les jours.
Introduction ............................................................................................................................................... 2
2.1.2.3. Approche de l’“aversion à l’inégalité” [ou Méthode de Fehr et Schmidt (1999)] ................ 15
Définition 1 .............................................................................................................................................. 31
2.4.2.1. Equilibre du marché et la domination par les coûts ou par le temps ...................................... 35