Vous êtes sur la page 1sur 62

DE LA PART DE SAWADOGO IBRAHIM :sawadogoibrahim2002@yahoo.fr sawadogoibrahim@Gmail.

com

THEORIE DES JEUX : UNE INTRODUCTION

Jacques-Fran cois Thisse

1. Introduction
1.1. Quest-ce quun jeu ?
La th eorie des jeux est la discipline math ematique qui etudie les situations o` u le sort de chaque participant d epend non seulement des d ecisions quil prend mais egalement des d ecisions prises par dautres participants. En cons equence, le choix optimal pour un participant d epend g en eralement de ce que font les autres. Parce que chacun nest pas totalement ma tre de son sort, on dit que les participants se trouvent en situation dinteraction strat egique. Le mot strat egie vient du grec ancien o` u il d esignait les actions prises par un chef militaire en campagne. Il a gard e ce sens. Toutefois son acceptation sest elargie pour couvrir des situations moins belliqueuses, mais dans lesquelles persiste lid ee de conit. Si les ressources sont rares, il y a obligatoirement conit sur la mani` ere de les r epartir. D` es lors, on peut voir les march es comme des jeux o` u les participants sont des producteurs et des consommateurs. Plus g en eralement, une partie d echecs, la formation dune coalition gouvernementale ou une n egociation au sein de lOMC sont autant de jeux di erents ob eissant a ` des r` egles sp eciques. Les jeux peuvent donc d ecrire des situations sociales tr` es di erentes. Les participants a ` un jeu sont appel es joueurs (players). Chaque joueur une entreprise, un consommateur ou un gouvernement agit pour son propre compte selon le principe de rationalit e economique. Ce principe stipule que chacun cherche a prendre les meilleures d ` ecisions pour lui-m eme; il ne fait pas r ef erence ` a une rationalit e qui transcenderait les participants et le jeu dans lequel ils op` erent. La rationalit e dont il est question ici est celle dun joueur d echecs qui d esire gagner la partie et qui, pour cela, emploie les moyens qui lui paraissent les meilleurs. Pour le producteur, il sagira de maximiser son prot face a ` des concurrents en choisissant, par exemple, le meilleur prix de vente. Le consommateur cherchera quant a ` lui a ` acqu erir le bien qui lint eresse au prix le plus bas apr` es un marchandage avec le vendeur. Cette recherche du seul int er et personnel distingue la th eorie des jeux

de la th eorie des equipes o` u les participants poursuivent par hypoth` ese un objectif commun. La th eorie des jeux fut fond ee par von Neumann et Morgenstern en 1944 lors de la parution de leur ouvrage Theory of Games and Economic Behavior Bien s ur, il y eut des pr ecurseurs; parmi les principaux, il faut citer Cournot et Edgeworth. Toutefois, cest depuis la publication du livre de von Neumann et Morgenstern que la th eorie des jeux est v eritablement consid er ee comme une nouvelle discipline. Ces deux auteurs ont propos e une solution dans le cas particulier dun jeu o` u le gain dun joueur correspond exactement a ` la perte subie par lautre (jeu a ` somme nulle ou duel). Le jeu d echecs est un exemple de jeu o` u lantagonisme entre joueurs est ainsi pouss e` a lextr eme. Les cas dapplication en economie sont rares. En 1951, Nash a montr e comment les id ees d evelopp ees par Cournot d` es 1838 pouvaient servir de base pour construire une th eorie de l equilibre non coop eratif pour des jeux a ` somme variable, qui g en eralise la solution propos ee par von Neumann et Morgenstern. Les applications de ce concept a ` l economie se sont multipli ees ` a partir des ann ees 70 et 80. Cest en economie industrielle que lint er et de ce concept est apparu avec le plus de force parce quil permet d etudier des situations de concurrence imparfaite o` u les entreprises adoptent des comportements strat egiques. Le concept de coeur, anticip e par Edgeworth en 1881, a et e syst ematis e par Gillies en 1953 et appliqu e` a la th eorie de l equilibre g en eral dans les ann ees 60 et 70.1

1.2. Jeux non coope ratifs et coope ratifs


Comme on la vu, la caract eristique essentielle, fondamentale dun jeu est que le gain r ealis e par un joueur d epend de ses choix, mais aussi des choix eectu es par les autres membres du groupe. Cette interd ependance strat egique est tr` es di erente de linterd ependance etudi ee au sein du mod` ele d equilibre g en eral dArrow-Debreu. Dans ce mod` ele, la totalit e des interactions economiques sont r esum ees dans le
1 Un

excellent survol de ces contributions est donn e par Jean Gabszewicz, Th eorie du noyau et de la concurrence

imparfaite, Recherches Economiques de Louvain, vol. 36, 21-37, 1970.

syst` eme des prix. Chaque agent economique peut ainsi eectuer ses choix en prenant ces prix comme donn ees, mais sans se pr eoccuper de ce que font les autres agents dont, a ` la limite, il peut m eme ignorer lexistence. En th eorie des jeux, linteraction qui relie les joueurs est beaucoup plus complexe. Tout dabord, les joueurs se connaissent (ils savent combien il y a de participants et qui ils sont). Ensuite, ils ne peuvent pas se contenter de choisir leurs propres plans dactions, en n egligeant ce que font les autres. Ils doivent au contraire se faire une id ee aussi pr ecise que possible des plans choisis par les autres. Pour cela, la th eorie admet : 1) que chaque joueur seorce de prendre les meilleures d ecisions pour lui-m eme et sait que les autres joueurs font de m eme, 2) que chacun sait quil en va de m eme pour tous les autres et ainsi de suite ad innitum. On convient de distinguer entre deux grandes familles de jeux : les jeux coop eratifs et les jeux non coop eratifs. Un jeu est coop eratif lorsque des joueurs peuvent passer entre eux des accords qui les lient de mani` ere contraignante (par exemple, sous la forme dun contrat qui pr evoit une sanction l egale dans le cas du non respect de laccord). On dit alors quils forment une coalition dont les membres agissent de concert. Dans le cas contraire, cest-` a-dire lorsque que les joueurs nont pas la possibilit e de former des coalitions, le jeu est non coop eratif. Par d enition, dans un jeu non coop eratif on sp ecie toutes les options strat egiques oertes aux joueurs, alors que les contrats qui sous-tendent les coalitions dans un jeu coop eratif ne sont pas d ecrits. Un tel jeu peut etre d eni de deux mani` eres di erentes mais equivalentes : strat egique (on dit aussi normale) et extensive. Un jeu en forme strat egique est une collection de strat egies d ecrivant les actions de chaque joueur dans toutes les situations concevables du jeu, ainsi que les gains (payos) que chacun obtient lorsque les strat egies de tous les joueurs sont connues. Seules certaines actions seront effectivement choisies et donc observ ees, tandis que les strat egies incluent des actions possibles qui ne sont pas choisies durant le jeu. Un jeu en forme extensive (on dit aussi d evelopp ee) est d eni par un arbre qui d ecrit comment le jeu est jou e. Plus pr ecis ement, chaque sommet de larbre sp ecie le (ou les) joueur(s) qui doit (doivent) choisir une action a ` ce moment du jeu ainsi que linformation dont chaque joueur

dispose lors de la prise de d ecision; les gains que chaque joueur peut r ealiser apr` es avoir suivi un des chemins possibles au sein de larbre sont donn es aux sommets terminaux. En outre, les ev enements possibles et leurs probabilit es peuvent aussi etre associ es ` a certains sommets de larbre; la nature nest pas un joueur, mais elle choisit al eatoirement certaines actions a ` des moments particuliers du jeu. Dans un jeu en forme extensive, une strat egie est une collection de r` egles d ecrivant les choix de chaque joueur en fonction de son information. On peut associer un jeu en forme strat egique a ` tout jeu en forme extensive en combinant toutes les strat egies possibles et en evaluant les gains correspondants (on utilise les gains esp er es lorsque la nature intervient dans le d eroulement du jeu).

Remarques : 1. Cette description dun jeu en forme extensive suppose que les ensembles dactions sont nis. 2. La forme extensive permet une description dynamique du jeu parce quelle sp ecie les s equences de d ecisions prises par les joueurs. En revanche, un jeu en forme strat egique est plus facile a ` manipuler et est donc plus souvent utilis ee dans les applications. 3. Larbre dun jeu en forme extensive di` ere dun arbre de d ecision en th eorie de lincertitude parce que plusieurs d ecideurs y sont associ es, Une strat egie pure est une action, ou un plan dactions, qui est choisie par chaque joueur avec certitude. Cette notion a et e etendue ` a celle de strat egie mixte d enie comme une distribution de probabilit e sur lensemble des strat egies pures. Dun point de vue formel, une strat egie mixte peut etre vue comme une simple g en eralisation math ematique o` u lon d econcentre la masse-unit e entre plusieurs strat egies pures. En revanche, on peut sinterroger sur lintuition economique qui sous-tend le concept de strat egie mixte ? Pourquoi un joueur aurait-il recours a ` un m ecanisme al eatoire, quil choisit, auquel il remet son pouvoir de d ecision alors quil pourrait choisir directement ? Cette question sera discut ee plus tard.
5

Le concept de rivalit e est au centre de la th eorie des jeux. Pour cette raison, cette th eorie est capable d etudier des ph enom` enes tr` es di erents. Toutefois, il est important de pr eciser dembl ee que la th eorie des jeux ne fournit pas de solutions toutes faites. Elle constitue plut ot une fa con de penser qui permet de mieux comprendre la nature des conits possibles et de concevoir ce que pourrait etre une solution acceptable et raisonnable. A c ot e de lanalyse economique qui ore des cas dapplication de plus en plus nombreux, on peut citer la science politique o` u la th eorie des jeux tend a ` devenir tr` es r epandue. Il existe dautres disciplines o` u la th eorie des jeux sest av er ee tr` es utile: 1) la biologie quand on cherche a ` expliquer la cohabitation et la proportion de di erents types desp` eces; 2) la philosophie sociale quand on vise a ` comprendre comment les individus membres dune soci et e r egissent leurs relations sociales et construisent a ` cet eet des institutions particuli` eres. La th eorie des jeux non coop eratifs sest av er ee extr emement riche pour lanalyse des comportements oligopolistiques des entreprises, des luttes dinuence entre groupes au sein dune institution (par exemple une entreprise), des n egociations internationales entre gouvernements ou encore de la concurrence electorale entre partis politiques. Cest cette th eorie qui nous retiendra dans la suite de ce cours, parce quelle permet une description d etaill ee des m ecanismes incitatifs qui guident le comportement des joueurs sur la base de leurs seuls objectifs personnels. Par exemple, on verra que certains contrats implicites alliant le b aton et la carotte peuvent amener les joueurs a ` se comporter de mani` ere coop erative sans quils aient a ` former une coalition. A cet egard, elle permet danalyser de mani` ere rigoureuse des situations de concurrence tr` es di erentes o` u les joueurs peuvent etre des acteurs de nature tr` es di erente : des entreprises, des consommateurs, des conducteurs de v ehicules, des gouvernements ou des partis politiques. En fait, la th eorie de loligopole a souvent servi de motivation a ` lintroduction de concepts fondamentaux de la th eorie des jeux. Dans son ouvrage de 1838, Cournot fut ainsi le premier a ` introduire le concept d equilibre non coop eratif dans le cas dentreprises se concurren cant par les quantit es. Lors dune recension du livre de Cournot publi ee en 1883, Bertrand devait objecter que les prix, et non les quantit es, sont les strat egies naturelles des

entreprises. La solution obtenue par Bertrand di` ere compl` etement de celle trouv ee par Cournot. Cette di erence r ev` ele que la sp ecication des strat egies est essentielle pour l etude dun jeu. Edgeworth montrait en 1897 la possibilit e de non-existence dun equilibre non coop eratif en prix lorsque les entreprises sont soumises a ` des contraintes de capacit e de production. Enn, en mod elisant la concurrence en produits et en prix, Hotelling introduisait en 1929 lid ee d equilibre parfait qui occupe une place tr` es importante dans les applications r ecentes de la th eorie des jeux. On constate donc combien th eorie des jeux et th eorie de loligopole ont et e intimement associ ees d` es le d ebut. Il nest donc pas surprenant que les deux disciplines continuent dentretenir des rapports etroits. Pourtant, la th eorie des jeux a acquis le statut dune discipline autonome tant ses d eveloppements et ses domaines dapplication sont devenus nombreux et vari es.

1.3. De nition dun jeu en forme strate gique


Les el ements constitutifs dun jeu G en forme strat egique sont les suivants : (1) N = {1 n} est lensemble des joueurs. On suppose que les joueurs sont en nombre ni. Un joueur quelconque est d esign e par lindice i. Lextension au cas dune innit e de joueurs ne pose pas de probl` emes conceptuels particuliers. esigne une strat egie du joueur i N. (2) si d Une strat egie d ecrit de mani` ere pr ecise tout ce quun joueur fait. Remarquons que si nest pas n ecessairement un nombre; ce peut etre aussi un vecteur ou une fonction. egies du joueur i N. (3) Si est lensemble des strat Cet ensemble d ecrit toutes les strat egies disponibles pour le joueur i.

(4) s = (s1 , , si , , sn ) S1 Si Sn S est une issue du jeu, cest-` a-dire une combinaison de strat egies ` a raison dune strat egie par joueur. On egies choisies sauf celle du joueur i. d esigne par si Si toutes les strat (5) ui (s) R est la fonction de gain du joueur i N. Autrement dit, la fonction dobjectif du joueur ii d epend non seulement de sa esum ees dans si . Le joueur i strat egie si , mais aussi de celles des autres joueurs r pr ef` ere strictement lissue s ` a lissue s si ui (s) > ui (s ). Si ui (s) = ui (s ), le joueur est indi erent entre les deux issues. (6) Chaque joueur conna t les ensembles de strat egies et les fonctions de gains de tous les joueurs, y compris donc les siens. Du fait de cette derni` ere hypoth` ese, on dit que le jeu est en information compl` ete. Dans le cas contraire, le jeu est dit en information incompl` ete. Les joueurs ne connaissent certains el ements constitutifs du jeu quen termes de probabilit e; par exemple, le joueur i ne conna t pas la fonction de gain du joueur k mais dispose dune distribution de probabilit e sur les fonctions possibles. Un jeu ` a deux joueurs est a ` somme nulle si u1 (s) + u2 (s) = 0 quel que soit le prol de strat egies s S. Dans ce cas, les gains dun joueur sont egaux aux pertes de lautre, de sorte que lon peut dire que les joueurs sont des opposants au sens habituel de ce mot. Pendant longtemps, la p enurie a caract eris e le march e des livres en th eorie des jeux. Depuis quelques ann ees, ceux-ci se sont multipli es, sans doute a ` cause du succ` es rencontr e par cette discipline aupr` es des economistes. Parmi les nombreux livres de qualit e, les trois ouvrages suivants vous sont recommand es : - Binmore K , 1992, Fun and Games, Lexington, Mass., Heath. - Gibbons R , 1992, A Primer in Game Theory, London, Harvester. - McMillan J., 1992, Games, Strategies and Managers, Oxford, Oxford University

Press. Ces ouvrages sont, pour lessentiel, consacr es aux jeux non coop eratifs. Le livre - Friedman J. 1990, Game Theory with Applications to Economics, Oxford, Oxford University Press contient egalement une introduction a ` la th eorie des jeux coop eratifs.2 En fran cais, louvrage - Demange G. et J.-P. Ponssard, 1994, Th eorie des jeux et analyse economique, Paris, Presses Universitaires de France dispose pour linstant dune position de monopole. Comme il est fort bien fait, il est susceptible de la conserver un certain temps.

2. Jeux statiques en information compl` ete


2.1. Le dilemme du prisonnier
On dit quun jeu est statique (one-shot game) lorsque les joueurs choisissent simultan ement leurs actions et re coivent ensuite leurs gains respectifs. Parmi les jeux statiques, les jeux nis ` a deux joueurs occupent une place privil egi ee parce quils permettent une pr esentation simple et p edagogique des principales questions pos ees en th eorie des jeux. Ils sont d ecrits sous la forme de matrices dans lesquelles le premier joueur joue verticalement, cest-` a-dire choisit une ligne de la matrice, et le second horizontalement en choisissant une colonne. On parle dans ce cas de jeux matriciels. Nous allons en etudier quelques exemples au cours de cette section.
2 Dans

un genre tr` es di erent, on consultera avec prot louvrage La soci et e de cour de Norbert Elias qui, bien

que nutilisant pas explicitement lappareillage de la th eorie des jeux, montre comment les concepts de cette th eorie permettent une analyse ne de certaines structures sociales. En revanche, le roman de Francis Walder Saint-Germain ou la n egociation met en lumi` ere la complexit e dun v eritable processus de n egociation et le chemin que la th eorie des jeux doit encore parcourir avant de pouvoir appr ehener cette complexit e dans toutes ses dimensions.

Exemple 1 : Pour commencer, on consid` ere le jeu qui est sans doute le plus c el` ebre, a savoir le dilemme du prisonnier. On suppose que deux suspects sont interrog ` es s epar ement par la police pour une action d elictueuse grave. La police ne dispose pas d el ements de preuve susants pour obtenir la condamnation des pr evenus pour lacte dont ils sont accus es. Laveu dau moins lun des deux est donc indispensable. La police propose a ` chaque accus e davouer, dans quel cas il sera rel ach e. Sil navoue pas mais que lautre le fait, il ecope dune peine de prison de 15 ans. Si les deux avouent, ils peuvent esp erer b en ecier de circonstances att enuantes et recevoir une peine de 8 ans chacun. Enn, si aucun des deux navoue, ils seront condamn es pour des d elits mineurs ` a 1 an de prison. La matrice des gains a donc la forme suivante. Avoue Avoue (-8;-8) Navoue pas (-15;0) Navoue pas (0;-15) (-1;-1)

Existe-t-il une mani` ere naturelle de jouer ce jeu ? On remarque imm ediatement quAvouer constitue une strat egie qui conduit toujours a ` une peine moins lourde que Ne pas avouer, et ce quel que soit le choix eectu e par lautre. D` es lors, il semble naturel de penser que chacun des pr evenus va choisir cette strat egie dans lintention de r eduire sa peine. Le r esultat est quils vont tous les deux etre condamn e` a 8 ans de prison, ce qui constitue malgr e tout a une condamnation assez lourde. Dans ce jeu, la strat ` egie Avouer est optimale puisque, si limportance de la condamnation d epend du comportement de lautre pr evenu, chaque joueur peut prendre sa d ecision sans avoir besoin de se faire une id ee de ce que va faire lautre. Dans le dilemme du prisonnier, Avouer est une strat egie dominante pour les deux pr evenus. Dans un jeu en forme strat egique, on dit quune strat egie si Si est dominante pour le joueur i si, quel que soit s i Si et s i = si , les in egalit es ui (si , si ) ui ( si , si )
10

sont satisfaites pour tout si Si . Si dans un jeu donn e tous les joueurs disposent dune strat egie dominante et quils choisissent eectivement cette strat egie, le r esultat du jeu est appel e equilibre en strat egies dominantes. Dans le dilemme du prisonnier, le couple (Avouer, Avouer) est un equilibre en strat egies dominantes. On vient de voir qu` a l equilibre en strat egies dominantes, les pr evenus vont subir une peine de 8 ans. Toutefois, sils coop eraient en navouant rien, la condamnation qui leur serait appliqu ee serait beaucoup plus l eg` ere puisquelle serait de 1 an. Ce jeu, malgr e sa tr` es grande simplicit e, met en evidence la contradiction qui soustend de nombreux conits, a ` savoir que les participants devraient souvent sentendre plut ot que de se combattre. (Bien entendu, toute coop eration est exclue dans un jeu ` a somme nulle. Elle na de sens que dans des jeux a ` somme variable o` u la coop eration permet a ` tous les participants dobtenir des gains plus elev es). Il montre aussi pourquoi la coop eration nest pas facile a ` mettre en oeuvre : chaque pr evenu est incit e` a avouer, cest-` a-dire a ` d evier unilat eralement de la solution coop erative, ce qui mine la stabilit e de la coop eration de lint erieur. Nous verrons plus tard que di erents m ecanismes permettent aux deux joueurs de ne pas avouer et de s electionner le r esultat coop eratif. Disons dembl ee que la loi du silence, qui conduit a ` punir s ev` erement celui qui accuse un autre, constitue justement un tel m ecanisme. Lexemple des accusations port ees pas certains maosi contre dautres pour r eduire leur propre peine montre cependant les limites de tels m ecanismes. Le fait que la Maa reste cependant puissante en montre aussi la force. En outre, la mise en place de m ecanisme permettant la coop eration devient plus complexe lorsque le nombre de joueurs est elev e. Si ceux-ci sont des entreprises, on a coutume de penser en th eorie economique que le march e est capable dassurer cette coordination car on est vraisemblablement dans un contexte proche du mod` ele concurrentiel dont on peut, par ailleurs, montrer que la solution est socialement optimale au sens de Pareto. Les choses se compliquent singuli` erement lorsquil nexiste pas de march es par o` u faire transiter les interd ependances entre d ecideurs, comme
11

par exemple dans les probl` emes pos es par le d eveloppement economique. Certains ont vu dans la planication une mani` ere de r esoudre le probl` eme de coordination entre un grand nombre dagents, mais ils ont n eglig e le r ole central jou e par la transmission de linformation au sein de vastes structures centralis ees. An dillustrer une fois de plus les forces en action dans le dilemme du prisonnier, je vous propose de participer au jeu de la tirelire. Deux etudiants sont choisis au hasard et le jeu suivant leur est propos e. Chacun a la possibilit e de mettre 0 ou 100 francs dans une tirelire. Apr` es que chaque etudiant ait pris sa d ecision sans conna tre la d ecision de lautre, le contenu de la tirelire est multipli e par 1.5 et r eparti en deux parties egales entre les deux joueurs. Par hypoth` ese, ce jeu nest disput e quune seule fois. Que vont faire les etudiants? Apr` es avoir ecrit la matrice des gains, ils vont constater que mettre 0 franc dans la tirelire est une strat egie dominante. Mettonsnous en eet ` a la place du joueur 1 qui tient le raisonnement suivant : si 2 ne met rien dans la tirelire, il est optimal pour moi de ne rien mettre sinon je perdrais 25 francs; sil d epose 100 francs, je gagne 75 francs si je ne mets rien, et 50 francs si je mets 100 francs. Par cons equent, dans les deux cas de gure, jai int er et ` a ne rien mettre dans la tirelire.Si les deux etudiants suivent le m eme raisonnement, le r esultat serait un gain nul pour chacun deux. M eme sils se mettaient daccord avant le d ebut du jeu pour coop erer et mettre 100 francs, il reste optimal pour chacun de ne rien mettre dans la tirelire sils sont motiv es par la recherche de leur seul int er et personnel. Cest l` a bien s ur que lon peut attaquer la solution propos ee. Les etudiants ont, comme tout le monde, des pr ef erences qui incluent dautres variables que leur seul gain imm ediat. Ils sont, par exemple, sensibles a ` ce que les autres vont penser deux et vont peut- etre mettre 100 francs pour ne pas laisser voir quils ont envie de proter de la situation. Soit. Mais en irait-il de m eme si lanonymat leur etait garanti durant le d eroulement du jeu? La logique qui se trouve derri` ere le dilemme du prisonnier est en fait puissante et nous interpelle dans bien des domaines. Elle sut d ej` aa ` montrer quun groupe dindividus ne va pas n ecessairement se comporter dans lint er et du groupe si chacun peut obtenir pour lui-m eme un r esultat meilleur en choisissant pour son propre
12

compte. Do` u limportance de disposer de normes sociales qui imposent un minimum de coop eration entre individus et qui assurent la coh esion du groupe. Mais qui va choisir ces normes et quelles normes faut-il choisir ? Mis a ` part des situations extr emes, il est souvent malais e de donner une r eponse satisfaisante a ` cette question. Elle est pourtant au centre de lorganisation de toute soci et e. D` es que Vendredi rejoint Robinson Cruso e, se pose la question de savoir comment prendre les d ecisions concernant les deux hommes : de commun accord, en se basant sur lopinion dun seul, ou en les laissant vivre s epar ement sans quils puissent b en ecier des avantages du travail en groupe. Il est egalement int eressant dobserver que des individus de culture di erente ou de sexe di erent tendent a ` se comporter di eremment face ` a un dilemme du prisonnier. Ainsi, aux Etats-Unis, des exp eriences faites avec des personnes choisies au hasard donnent a ` penser que lAm ericain blanc est le moins coop eratif tandis que lAm ericaine noire est la plus coop erative. Dans dautres r egions du monde, on a observ e que les etudiants choisissaient la strat egie qui se r ev` ele la plus favorable pour les professeurs, lorsque le jeu implique un repr esentant des deux groupes. Il est peu vraisemblable quil en aille de m eme en Wallonie. Enn, il est tout a ` fait fondamental de rappeler quici le dilemme du prisonnier nest jou e quune seule fois. Lorsque le jeu est r ep et e plusieurs fois, les solutions possibles sont di erentes comme on le verra au chapitre consacr e aux jeux dynamiques. En particulier, la solution coop erative peut emerger comme r esultat dun processus interactif car chaque joueur a la possibilit e de punir son adversaire si celui-ci ne respecte pas laccord, ce qui nest pas faisable dans un contexte statique.

2.2. Processus de dominance successive


Lexistence dun equilibre en strat egies dominantes est rare. Aussi doit-on souvent faire appel a ` dautres mani` eres de raisonner dans lespoir de trouver une solu-

13

tion au jeu. Si joueur 1 poss` ede une strat egie dominante, alors on peut sattendre a ` ce quil choisisse cette strat egie; comme le joueur 2 est capable danticiper ce choix, il choisit alors sa meilleure strat egie contre la strat egie dominante du premier. Exemple 2 : Consid erons le jeu des deux cochons rationnels. Les joueurs sont deux cochons intelligents comme ceux de La ferme des animaux de George Orwell. Les deux cochons se trouvent a ` lextr emit e dun couloir. Chacun peut actionner un levier pour que la nourriture soit disponible a ` lautre extr emit e du couloir. Le cochon qui actionne le levier doit courir pour atteindre lautre extr emit e, mais avant dy arriver, lautre cochon y est d ej` a et a consomm e une partie de la nourriture lib er ee par laction du levier. Il y a un cochon dominant (le joueur 1) et un cochon subordonn e (le joueur 2), ce qui veut dire que le dominant peut toujours se garantir la nourriture qui reste une fois quil se trouve a ` lendroit o` u la nourriture est disponible. Supposons quil y ait 6 unit es de grains dans la r eserve. Si le cochon subordonn e actionne le levier, le cochon dominant mange les 6 unit es car il arrive le premier sur les lieux; en revanche, si le cochon dominant actionne le levier, le cochon subordonn e arrive le premier et est capable de consommer 5 unit es avant larriv ee du cochon dominant a ` qui il ne reste quune seule unit e. Enn, il faut d ecrire ce qui se passe si les deux cochons poussent le levier en m eme temps. On admet que les deux cochons partent aussit ot apr` es et que le cochon subordonn e court plus vite (peut- etre parce quil est moins gros). Il consomme 2 unit es de grain avant d etre rejoint par lautre qui consomme alors les quatre unit es restantes. Lorsquun cochon pousse le levier, il consomme pour son eort 0,5 unit e de nourriture. D` es lors, la matrice des gains est facile ` a construire et est donn ee ci-dessous. Pousse Pousse Ne pousse pas (3,5=4-0,5; 1,5=2-0,5) (6; -0,5) Ne pousse pas (0,5=1-0,5; 5) (0; 0)

Ne pousse pas est une strat egie dominante pour le cochon subordonn e. Si le cochon dominant anticipe quil est optimal pour lautre de choisir cette strat egie, alors le dominant choisit de pousser le levier. Le r esultat du jeu est alors (Ne
14

pousse pas, Pousse) et les consommations de grain sont respectivement 5 et 0,5 unit es de grain. Remarques : 1. Il ny a pas d equilibre en strat egies dominantes dans ce jeu parce que la strat egie optimale pour le cochon dominant d epend de la strat egie choisie par le cochon subordonn e : si celui-ci choisit Pousse, alors il a int er et ` a choisir Ne pousse pas; sil Choisit Ne pousse pas, le cochon dominant pr ef` ere Pousse. En dautres termes, sa meilleure r eponse varie avec le choix de lautre. Si le cochon dominant anticipe que le cochon subordonn e ne choisira pas la strat egie Pousse, il y a pourtant une solution au jeu. N eanmoins, cette solution suppose une d emarche plus elabor ee de la part du joueur 1 que dans le cas du dilemme du prisonnier : le cochon dominant doit etre capable de se mettre a ` la place du cochon subordonn e et de r ealiser que Ne pousse pas est une strat egie dominante pour celui-ci. Les choses se compliquent encore lorsquaucun des deux joueurs ne poss` ede de strat egie dominante (voir Exemple 3). 2. Des comportements rationnels conduisent parfois a ` une solution en apparence paradoxale : le cochon dominant presse le levier et le subordonn e mange lessentiel de la nourriture. Dans ce jeu, la faiblesse implique la force.

Exemple 3 : G H M B M D

(4;3) (5;1) (6;2) (2;1) (8;4) (3;6) (3;0) (9;6) (2;8)

Dans ce jeu, lensemble des strat egies du joueur 1 est donn e par le triplet {H, M, B } tandis que celui de son rival est donn e par {G, M, D}. Chaque cellule du tableau contient un couple de nombres. Le premier nombre correspond au gain du joueur
15

1 et le second a ` celui du joueur 2 pour le couple correspondant de strat egies. Par exemple, si 1 choisit H et 2 choisit D, 1 re coit 6 tandis que 2 re coit 2. Il est clair que ce jeu ne poss` ede pas de strat egies dominantes. Quelle solution peut-on esp erer voir emerger ? Remarquons pour commencer que M est une strat egie strictement domin ee par D qui assure toujours au joueur 2 des gains plus elev es quel que soit le choix de 1 (notons cependant que D nest pas une strat egie dominante). Dans ce cas, il est raisonnable de penser que le joueur 2 ne retiendra jamais la strat egie M . On d ecide donc (y compris le joueur 1) d eliminer la strat egie M de la matrice. Cela etant fait, on remarque alors que, dans la matrice r esultante, H est devenue une strat egie dominante pour le joueur 1. D` es lors, celui-ci devrait jouer H . Par hypoth` ese, le joueur 2 est capable de reconstruire ce raisonnement, de sorte que, anticipant le choix H de 1, il est optimal pour lui de choisir G. En cons equence, si chaque joueur est capable de raisonner comme nous venons de le faire, le r esultat du jeu serait donn e par le couple (H, G). Le processus d elimination quy vient d etre appliqu e dans cet exemple est appel e processus de dominance successive. Il exige un comportement plus sophistiqu e que celui pr et e aux joueurs dans le dilemme du prisonnier, dans la mesure o` u chaque joueur doit etre capable de reconstituer les op erations auxquelles lautre proc` ede et den d eduire de nouvelles implications pour lui-m eme. Par exemple, 1 anticipe que 2 ne jouera pas M ce qui le conduit a ` r ealiser que H est alors son meilleur choix. Sans cela, 1 ne pourrait pas r ealiser que H devient une strat egie dominante. Cet exemple fait appara tre un concept plus faible que celui de strat egie dominante, a ` savoir celui de strat egie strictement domin ee. Formellement, on dit quune ee pour le joueur i sil existe une autre strat egie si Si est strictement domin strat egie s i Si telle que : ui ( si , si ) > ui (si , si ) pour tout si Si .
16

On dit que si est faiblement domin ee si : ui ( si , si ) ui (si , si ), lin egalit e etant stricte pour au moins une combinaison si . Bien entendu, sil existe une strat egie dominante pour un joueur, toutes les autres sont domin ees et peuvent donc etre elimin ees en vertu du processus de dominance successive. Celui-ci est donc de nature plus g en erale et permet de proposer des solutions pour des jeux qui nadmettent pas d equilibre en strat egies dominantes. Toutefois, le processus de dominance successive admet egalement des limites. Exemple 4 :

G H M B

(3;6) (7;1) (5;1) (8;2) (6;0) (6;2) Fig. A

G H M B

(3;6) (7;1) (5;1) (8;0) (6;0) (6;2) Fig. B

Lensemble des strat egies de 1 est maintenant donn e par {H, B }. Dans le cas du jeu d ecrit au tableau A, il est clair que H est strictement domin e par M . On d ecide donc de la n egliger. On remarque que G est alors strictement domin e d` es que H a et e elimin e. Par cons equent, si 2 r ealise que 1 ne choisira pas H , 2 peut eliminer G.
17

A son tour, 1 prend conscience de ce fait en reproduisant le raisonnement de 2 et en d eduit que 2 va jouer D. Il est donc optimal pour 1 de jouer M . En r esum e, les joueurs choisissent (M, D) et vont obtenir des gains donn es par (8,2). Consid erons ensuite le jeu repr esent e par la matrice B . Les gains de 1 nont pas chang e ; seul le gain de 2 a et e modi e lorsque le couple (M, D) est s electionn e. D` es lors, la strat egie H peut toujours etre elimin ee. Toutefois, on ne peut plus aller plus loin car il ny a plus de strat egie strictement domin ee dans la matrice r esultante. Cela revient a ` dire que, dans ce cas, le processus de dominance stricte ne conduit pas a ` un r esultat unique. Le message est clair : une modication mineure dans la matrice des gains peut conduire a ` des conclusions tr` es di erentes. Remarques : 1. Lemploi du processus de dominance successive ne conduit pas n ecessairement a une solution unique, ce qui laisse donc subsister une ind ` etermination quant au r esultat du jeu. La convergence eventuelle du processus vers une solution unique peut d ependre de modications mineures dans la structure des gains. 2. Lordre d elimination des strat egies strictement domin ees na pas dimportance. Les strat egies qui subsistent apr` es elimination sont les m emes quelle que soit la s equence suivie. Il nen va plus de m eme lorsque lon elimine des strat egies faiblement domin ees.

La r esolution dun jeu non coop eratif par application successive de la dominance stricte semble donc fournir une solution satisfaisante quand elle conduit a ` une solution unique. Pourtant, la solution a ` laquelle conduit ce processus ne simpose pas toujours de mani` ere naturelle. Consid erons en eet le jeu suivant :

G B (7;6)

D (6;5)

H (8;10) (-100;9)

18

Pour le joueur 1, D est strictement domin e. Apr` es elimination de cette strat egie, B est strictement domin e pour le joueur 2. D` es lors, le r esultat du jeu serait donn e par (H, G). Toutefois, sil a la moindre incertitude quant au comportement de 2, le joueur 1 pourrait se retrouver dans une situation catastrophique : sil joue H tandis que 2 se trompe et joue D, 1 r ealise une perte enorme. D` es lors, certains individus pr ef` erent jouer B qui leur garantit dans tous les cas un gain signicatif et une perte relative assez faible par rapport a ` H . Cela correspond a ` ce que lon peut appeler un comportement prudent. En outre, lapproche en termes de strat egies dominantes/domin ees peut aussi donner des r esultats en apparence inattendus. Consid erons par exemple le jeu repr esent e ci-dessous. Dans le premier cas de gure, H est une strat egie dominante pour le joueur 1. Le joueur 2 suppose que le joueur 1 va choisir H de sorte quil va jouer G. Le r esultat nal sera (H, G) et les gains correspondants (1,3). Supposons maintenant que la situation a priori du joueur 1 se d et eriore en ce que ses gains associ es ` a la strat egie H sont r eduits de 2 unit es (voir les deuxi` emes couples de la premi` ere ligne de la matrice). Dans ce cas, B est maintenant une strat egie dominante. D` es lors, 2 joue D et le r esultat devient (B, D) avec les gains (3,4). Autrement dit, le Joueur 1 obtient un gain nal plus elev e en d epit dune baisse partielle de ses gains. 2 1 H B G (1;3) (0;2) D (4;1) (3;4)

(-1;3) (2;1)

2.3. Equilibre de Nash


Le processus de dominance successive ne conduit pas n ecessairement ` a un r esultat
19

clair. Il appara t donc n ecessaire de disposer dune solution dont les conditions dexistence soient plus faibles. Exemple 5 : On consid` ere le jeu d ecrit par la matrice suivante :

2 1 H B G (0;0) D (2;2)

(10;11) (-1;0)

Il ny a de strat egie dominante/domin ee pour aucun des deux joueurs. Si 1 joue H , alors il est optimal pour 2 de jouer D; si 1 joue B , il est optimal pour 2 de jouer G. De la m eme mani` ere, si 2 joue G, il est optimal pour 1 de jouer B tandis que la meilleure r eponse de 1 est H si 2 joue H . Toutefois, la paire (B, G) semble une solution raisonnable en ce quaucun joueur ne semble pouvoir faire mieux pour lui-m eme. Plus pr ecis ement, cette paire constitue ce que lon appelle un equilibre de Nash : chaque joueur maximise ses gains compte tenu de laction suppos ee de lautre. Dans les exemples 2 et 3, la solution qui r esulte de lapplication du processus de dominance successive est aussi un equilibre de Nash. Ce dernier peut cependant etre d eni ind ependamment de ce processus dont il constitue d` es lors une g en eralisation. equilibre de Nash (ou un On dit quune combinaison de strat egies s est un equilibre non coop eratif) si lin egalit e suivante est satisfaite pour chaque joueur i = 1, 2, ....n :
ui (s i , si ) ui (si , si ) pour tout si si .

En dautres termes, si le joueur i anticipe correctement que les autres participants au jeu vont choisir les strat egies associ ees ` a s i , il maximise son gain en choisissant egie s et e de stabilit e (le joueur ne au sein de lensemble Si la strat i . Cette propri souhaite pas modier sa d ecision) etant satisfaite pour chaque joueur, la solution
20

d ecrite par l equilibre de Nash capte ainsi lid ee intuitive de ce que lon entend intuitivement par equilibre. Comment peut-on justier le recours a ` l equilibre de Nash comme solution possible dun jeu non coop eratif ? Une premi` ere r eponse est de voir ce concept comme un ensemble de conditions raisonnables a ` imposer sur le comportement des participants au jeu : chaque joueur choisit la meilleure strat egie pour lui-m eme compte tenu des croyances quil a sur les strat egies qui vont etre choisies par les autres. Etant donn e sa capacit e` a se mettre a ` la place des autres et a ` reproduire leurs raisonnements, chaque joueur est a ` m eme de formuler des anticipations correctes. D` es que le jeu est termin e et que chacun en observe les r esultats, il n eprouve aucun regret car il naurait pas pu augmenter son gain en faisant un choix di erent. Cest au travers de la formation des croyances sur les choix strat egiques de chacun que sexprime pleinement linterd ependance strat egique qui relient les joueurs. Lexactitude des croyances d enit pr ecis ement les conditions pour la r ealisation dun equilibre de Nash. Dans le mod` ele concurrentiel, les agents nont pas besoin davoir des anticipations sur le comportement des autres; lobservation du syst` eme de prix sut a ` chacun pour d ecider de ce quil doit faire. Une seconde r eponse consiste ` a imaginer que les joueurs se r eunissent avant de jouer et discutent du choix dune solution possible. Si les joueurs arrivent a ` un accord sur la fa con de jouer et si chaque joueur est personnellement convaincu que les autres participants au jeu vont eectivement se comporter selon les r` egles de laccord, alors il est optimal pour lui den suivre les recommandations car toute d eviation unilat erale conduirait a ` un r esultat qui lui serait moins favorable. Bien quil ne soit pas a priori contraignant, laccord simpose donc a ` chaque joueur consid er e individuellement parce quil repose sur lint er et de chacun. Dans cette interpr etation, linterd ependance strat egique prend forme lors du processus qui permet la s election dun accord. De nouveau, dans le mod` ele concurrentiel, il nest pas n ecessaire de rechercher un tel accord; il r esulte de lexistence de prix d equilibre. Remarque :
21

Il nest peut- etre pas inutile de pr eciser ici que dans la d enition la plus courante dun equilibre de Nash, o` u chaque joueur maximise son gain etant donn e les strat egies des autres joueurs, lexpression etant donn e renvoie aux anticipations quil se fait du choix des autres et non a ` leurs choix eectifs qui ne sont pas observables au moment o` u il s electionne une strat egie puisque, par hypoth` ese, le jeu est simultan e. Cette remarque est importante car certains auteurs ont critiqu e l equilibre de Nash sur la base dune interpr etation erron ee de ce concept en arguant quil n etait pas r ealiste de supposer que les autres joueurs ne r eagiraient pas a ` un changement de la strat egie dun dentre eux. En th eorie de loligopole, cette interpr etation est connue sous le vocable de variation conjecturale nulle. Il sagit l` a dune notion qui na de sens que dans un cadre dynamique car elle repose implicitement sur lobservation des strat egies eectivement choisies par les autres joueurs.3 Exemple 6 : Linterd ependance strat egique qui est r esum ee dans l equilibre de Nash est illustr e une nouvelle fois dans le jeu des marchands de cr` eme glac ee (ou jeu dHotelling). Imaginons une plage o` u deux marchands de cr` eme glac ee doivent sinstaller en d ebut de saison. Ils vendent leur produit a ` un prix x e par le fabriquant, mais sont en revanche libres de choisir leur localisation. Les clients sont les touristes venant tous les jours se reposer a ` la plage. An de proter au mieux du soleil, ils se r epartissent a ` distance egale de leurs voisins. Les touristes naiment pas se d eplacer a ` cause de lencombrement de la plage. D` es lors, ils choisissent dacheter aupr` es du vendeur le plus proche. Si les marchands sont conscients du comportement de leurs clients, comment vont-ils choisir leur emplacement sans avoir la possibilit e dobserver le choix fait par lautre. Mettons-nous a ` la place de 1 et supposons quil imagine une paire de localisation telle que celle repr esent ee ci-dessous.
3A

cet eet, on consultera avec prot larticle de L. Johansen On the Status of the Nash Type of Noncooperative

Equilibrium in Economic Theory, Scandinavian Journal of Economics, 84(1982), 421-441.

22

Il est evident quils se partagent le march e de mani` ere egale. Etant donn e la localisation de 2, le joueur 1 se dit quil aurait pu faire beaucoup mieux en se rapprochant au maximum de 2; en eet, le point milieu qui segmente les deux march es se d eplacent vers la droite, tr` es pr` es de 2 lorsque que 1 choisit une localisation proche de 2 mais situ ee sur sa gauche. Par cons equent, 1 en inf` ere que la meilleure chose ` a faire pour lui est de se situer le plus pr` es possible de 2, du c ot e o` u la plage est la plus longue. En eet, il maximise ainsi son nombre de clients et, donc, son prot. Mais o` u 2 va-t-il simplanter ? Le joueur 1 doit r ealiser que 2 tient le m eme raisonnement que lui ce qui signie que la meilleure chose a ` faire pour 2 est de se placer le plus pr` es possible de 1, du c ot e le plus long de la plage. Est-il possible de concilier ces aspirations respectives, cest-` a-dire de trouver un equilibre de Nash en localisation ? La r eponse est positive : les deux marchands sinstallent au milieu de la plage. Chacun obtient la moiti e des clients. Si lun dentre eux avait choisi une autre localisation, il aurait attir e moins de clients, de sorte que la paire de localisations retenue est eectivement un equilibre de Nash. On v erie ais ement que cet equilibre est unique : toute autre paire de localisations conduirait au moins un des vendeurs ` a regretter son choix. Dans ce jeu, chaque joueur doit se faire une id ee pr ecise de ce que veut faire lautre. La solution propos ee est donc plus sophistiqu ee que dans le cas du dilemme du prisonnier, qui ne r eclame aucune croyance sur ce que veut faire lautre, ou que dans celui des 2 cochons rationnels, o` u seul le cochon dominant doit se mettre a ` la place du cochon subordonn e. A l equilibre de Nash, les deux vendeurs se localisent au centre de la plage. Cette solution nest favorable aux acheteurs qui ne b en ecient pas des avantages li es ` a la dispersion g eographique de lore. Si, au contraire, le choix des localisations etait r eglement e, il est evident que les deux marchands devraient sinstaller au premier et troisi` eme quartiles a ` savoir 1/4 et 3/4, si on suppose sans perte de g en eralit e que la plage est de longueur unitaire. Autrement dit, la concurrence strat egique entre les vendeurs conduit a ` une conguration socialement sous-optimale.

23

Dans certains jeux, des combinaisons de strat egies semblent simposer dellesm emes. On les appelle des points focaux parce quelles polarisent naturellement lattention des joueurs. De tels points sont (souvent) des equilibres de Nash. Toutefois, les equilibres de Nash ne sont pas toujours des solutions evidentes. Exemple 7 : Consid erons ainsi le jeu suivant : 2 1 H B G (0;1) D (5;4)

(3;6) (-1;0)

Dans ce nouveau jeu, (B, G) est encore un equilibre de Nash, mais celui-ci ne semble pas simposer avec la m eme force que dans les cas pr ec edents. En outre, on peut v erier que (H, D) est aussi un equilibre de Nash (comme c etait d ej` a la cas dans lexemple 4). D` es lors, quel equilibre les joueurs vont-ils retenir ? La multiplicit e des equilibres est une des dicult es majeures rencontr ees en th eorie des jeux. Lexemple le plus c el` ebre est probablement celui de la bataille des sexes. Un couple discute des possibilit es de sortie pour la soir ee. Il y a deux possibilit es : le th e atre ou un match de football. Il pr ef` ere le th e atre, elle pr ef` ere le foot. Toutefois, il est encore plus important pour les deux de passer la soir ee ensemble. Tout ceci peut etre r esum e au sein de la matrice suivante o` u les nombres ne sont quindicatifs. Il y a deux equilibres de Nash donn es par (T, T ) et (F, F ). Comment choisir entre eux et donc a ` quelle issue peut-on sattendre ? E L 3/4 1/4 T F T F (3;2) (1;1) (0;0) (2;3)

Dans certains cas, un equilibre de Nash est plus ecace quun autre, en ce sens
24

que chaque joueur y r ealise un gain plus elev e. Il semble alors constituer un candidat naturel puisquune coordination minimale entre les joueurs sut pour le s electionner. Toutefois, cette coordination - m eme implicite - nest pas dans lesprit dun jeu compl` etement non coop eratif. En outre, si un joueur se trompe le r esultat nal peut se r ev eler catastrophique pour un participant comme le montre le cas suivant. Lorsque la structure des gains est donn ee par la matrice ci-dessous, il a un risque consid erable a ` choisir selon le crit` ere par etien sil y a une probabilit e non nulle que lautre joueur se trompe. En eet, puisque 2 r ealise une perte importante dans le cas o` u 1 jouerait B au lieu de H , nest-il pas plus raisonnable de sattendre a ` ce que (B, D), avec les gains (7, 7), emerge comme solution du jeu plut ot que (H, G) qui donne les gains (9, 9).

2 1 H B G (9;9) (8;-100) D (-100;8) (7;7)

Comme on la remarqu e` a loccasion, par exemple, de la bataille des sexes, il peut exister plusieurs equilibres de Nash. Dans ce cas, se pose la question de savoir quel equilibre choisir ? M eme lorsquun equilibre domine les autres, on vient de voir que lemploi du crit` ere par etien peut ne pas etre satisfaisant. Il faut alors reconna tre que la sp ecication du jeu est, en un certain sens, incompl` ete. Des r` egles ext erieures au jeu - telles que des conventions sociales - peuvent conduire a ` s electionner une solution plut ot quune autre. Cela revient a ` admettre que des facteurs culturels sont susceptibles de jouer un r ole important dans l emergence dune solution particuli` ere. Ainsi, le patriarcat ou la matriarcat peuvent constituer des el ements de r eponse ` a lind etermination que lon observe dans la bataille des sexes. Plus g en eralement, on peut penser que lexistence de plusieurs equilibres est une des raisons qui explique la pluralit e observ ee des normes sociales et des institutions. Le choix dune norme ou dune institution permet de s electionner un equilibre particulier. La question fondamentale est alors de comprendre les liens qui relient equilibres, dune part
25

et normes sociales et institutions, dautre part. Dans certains cas, lexistence dun point focal permet la s election dun equilibre de Nash particulier. Consid erons ainsi le jeu des villes. On se donne une liste de villes (Berlin, Bonn, Budapest, Londres, Moscou, Paris, Prague, Varsovie et Washington) et on demande a ` deux joueurs de ranger ces villes en deux groupes, dont lun doit contenir Washington et lautre Moscou. Si les deux joueurs - qui ne peuvent se concerter - proposent la m eme partition des villes, ils gagnent chacun 100 francs et 0 sinon. Comment vont-ils dresser les deux listes ? Ce jeu poss` ede un nombre elev e d equilibres (de Nash) et la s election dun dentre eux - qui donnent tous les m emes gains - est malais ee ` a traiter. Si les joueurs sont encore inuenc es par la dichotomie OTAN/Pacte de Varsovie, ils peuvent penser assez spontan ement a la partition suivante : ` A = Moscou, Berlin, Budapest, Prague, Varsovie B = Washington, Bonn, Londres, Paris qui est eectivement un equilibre de Nash. Par cons equent, les deux joueurs vont gagner. Cependant, une telle issue devient beaucoup plus probl ematique si les joueurs accordent de moins en moins dimportance a ` la division ouest / est. Peut etre un autre crit` ere va-t-il simposer dans le futur qui permettra l emergence dun autre point focal. A c ot e de la multiplicit e d equilibres existe une autre dicult e : il peut ne pas exister d equilibre de Nash (en strat egies pures) pour un jeu particulier. Un exemple bien connu est le jeu matching pennies. Deux joueurs annoncent simultan ement pile ou face. Si les annonces sont identiques, le joueur 1 re coit 100 francs que lui paie le joueur 2; si les annonces ne concordent pas, cest 1 qui verse 100 francs a ` 2. La matrice des gains a evidemment la forme suivante.

26

2 1 P F P F (100;-100) (-100;100) (-100;100) (100;-100)

Ce jeu, qui est un jeu ` a somme nulle, ne poss` ede pas d equilibre de Nash en strat egies pures. D` es lors, on peut penser a ` utiliser un m ecanisme al eatoire qui d ecide pour les joueurs. Toutefois, la nature du probl` eme laisse penser que le choix du m ecanisme al eatoire reste strat egique. Plus pr ecis ement, on suppose que chaque joueur choisit une loterie d enie sur lensemble des strat egies pures : il associe une ` la strat egie si et laisse au m ecanisme al eatoire probabilit e pi (positive ou nulle) a constitu e par la composition des loteries le soin de choisir une strat egie pure. Dans une telle perspective, chaque joueur vise maintenant a ` maximiser ses gains esp er es en choisissant la meilleure loterie possible, cest-` a-dire la meilleure strat egie mixte. Dans le jeu matching pennies, le joueur 1 a une probabilit e x de choisir P et une probabilit e 1 x de choisir F ; pour le joueur 2, ces probabilit es sont respectivement y et 1 y . Le gain esp er e du joueur 1 peut donc s ecrire de la mani` ere suivante : xyu1 (P, P ) + x(1 y )u1 (P, F ) + (1 x)yu1 (f, P ) + (1 x)(1 y )u1 (F, F ). Cette fonction est lin eaire en x. D` es lors, la seule mani` ere pour 1 davoir une probabilit e x positive mais inf erieure a ` lunit e est quil soit indi erent entre les strat egie pures P et F , ce qui implique que les coecients de la probabilit e x soient egaux quil choisisse P ou F : yu1 (P, P ) + (1 y )u1 (P, F ) = yu1 (F, P ) + (1 y )u1 (F, F ) ce qui equivaut a ` y (1 y ) = y + (1 y ) dont la solution est y = 1/2.
27

De la m eme mani` ere, pour le joueur 2 on trouve x = 1/2. Ce r esultat est appel e equilibre en strat egies mixtes. Comme le jeu est ` a somme nulle, les gains esp er es des joueurs sont egaux a ` l equilibre. La matrice des gains etant sym etrique, ils sont donc nuls. Dans matching pennies, les strat egies mixtes d equilibre sont identiques aux probabilit es qui r esultent de lemploi par chaque joueur du m ecanisme choisir a ` pile ou face.

Remarque : On a suppos e dans cet exemple que les joueurs maximisent leurs gains esp er es. On pourrait sans dicult e etendre lapproche pour int egrer di erentes attitudes des joueurs envers le risque en supposant que les nombres donn es dans la matrice sont les utilit es (par exemple, au sens de von Neuman-Morgenstern) des gains des joueurs. On peut sinterroger sur lint er et quil y a pour les joueurs de faire appel a ` un m ecanisme al eatoire puisque, a ` l equilibre en strat egies mixtes, chaque joueur est indi erent entre choisir P ou F . En eet, quelle que soit la strat egie pure jou ee, le gain esp er e est nul. Toutefois, si un joueur d ecide de jouer une strat egie pure particuli` ere, P disons, et que lautre joueur sen rend compte, alors ce dernier va choisir la strat egie pure qui maximise son propre gain et le premier joueur perdra 100 francs avec certitude. Il ne va donc pas courir ce risque et pr ef erera utiliser le m ecanisme al eatoire correspondant a ` l equilibre en strat egies mixtes qui lui laisse lespoir dun gain positif. Cest un peu ce que font les inspecteurs du travail ou des contributions. Ils laissent planer le doute sur leurs intentions de sorte que chacun se sent a priori concern e par la possibilit e dun contr ole. Une critique plus s ev` ere de l equilibre en strat egies mixtes est que les joueurs nont pas la possibilit e de v erier ex post que les strat egies jou ees sont bien des strat egies d equilibre puisque, en n de compte, une seule strat egie pure est eectivement
28

jou ee par chaque joueur. Cette information ne sut pas pour d eterminer si les probabilit es retenues constituent bien des strat egies d equilibre: ces probabilit es ne sont pas observables. Revenons a ` la bataille des sexes o` u, nous lavons vu, il existe deux equilibres de Nash en strat egies pures. Il en existe un troisi` eme en strat egies mixtes auquel les deux joueurs peuvent avoir recours pour eviter lind etermination associ ee au recours aux seules strat egies pures. Comme dans matching pennies, 1 doit etre indi erent entre T et F , de sorte que 3y + (1 y ) = 2(1 y ) 4y = 1 y = 1/4. Pour 2, on a 2x = x + 3(1 x) 4x = 3 x = 3/4. En cons equence, le joueur 1 (lui), qui pr ef` ere le th e atre, met une probabilit e plus elev ee sur T que sur F ; et inversement pour elle qui pr ef` ere le foot. Le gain esp er e de chaque joueur est Eu = (3/16).3 + (1/16).1 + (3/16).2 = 1. Chaque joueur obtient moins en termes de gains esp er es qu` a l equilibre en strat egies pures qui lui est le plus d efavorable. Toutefois, le m ecanisme al eatoire pr esente lavantage de placer les deux joueurs sur un pied d egalit e et, pour cette raison, pourrait etre employ e pour sortir de lind etermination rencontr ee avec les seules strat egies pures. Dans un equilibre en strat egies mixtes, les joueurs choisissent leurs strat egies de mani` ere ind ependante. Supposons maintenant quils aient la possibilit e de communiquer avant que le jeu ne commence. Dans certains cas, les deux joueurs ont int er et a se r ` ef erer a ` un signal quils peuvent observer s epar ement avant de choisir leur strat egie. De cette fa con, les strat egies cessent d etre ind ependantes et deviennent corr el ees. Consid erons lexemple suivant.
29

2 1 H B G D (5;1) (0;0) (4;4) (1;5)

Ce jeu admet les equilibres (H, G) et (B, D) en strat egies pures; il poss` ede egalement un equilibre en strat egies mixtes donn e par (1/2) et (1/2). Cet equilibre est calcul e de la m eme mani` ere que dans matching pennies; les gains esp er es sont donn es par (1/4).5 + (1/4).4 + (1/4)1 = 2.5 pour chaque joueur. Cet equilibre (en strat egies mixtes) peut etre retenu parce que les equilibres en strat egies pures donnent des gains oppos es du point de vue de chaque joueur, de sorte quil pourrait sav erer impossible den s electionner un. En revanche, l equilibre en strat egies mixtes assure des gains esp er es egaux aux deux joueurs, qui sont aussi substantiellement sup erieurs au gain du joueur le plus mal loti a ` un equilibre en strat egies pures. Les joueurs ont pourtant la possibilit e dam eliorer le r esultat du jeu sils saccordent sur un moyen permettant d eliminer la paire (H, D) qui est mauvaise pour les deux joueurs. Comme le propose Aumann, on imagine quils ont recours a ` un signal ext erieur qui leur permet de corr eler leur choix. Admettons, a ` titre dexemple, que les deux joueurs soient daccord pour sen remettre a ` un m ecanisme al eatoire qui conditionne leur choix, tel que jouer a ` pile ou face : si on observe face alors 1 joue H et 2 joue G; si on observe pile, alors 1 joue B et 2 joue D. On suppose bien entendu que les deux joueurs sont capables dobserver la r ealisation de la variable al eatoire (ici pile ou face) avant de choisir une strat egie pure. D` es lors, en utilisant le conditionnement ci-dessus, lesp erance de gains de chaque joueur devient: Eu1 = Eu2 = (1/2).5 + (1/2)1 = 3 > 2, 5. Par lemploi de ce m ecanisme de conditionnement, les deux joueurs eliminent la plus mauvaise combinaison de strat egies, soit (B, D), et se garantissent des gains esp er es plus elev es. On peut montrer quaucun joueur na int er et a ` d evier.
30

Dans cet exemple, on a suppos e une corr elation parfaite entre les signaux. En fait, il est possible de montrer que les joueurs peuvent faire encore mieux en utilisant des signaux imparfaitement corr el es et obtenir des gains esp er es donn es par (31/3, 31/3). Un autre exemple de non existence dun equilibre en strat egies pures est donn e par le probl` eme des marchands de cr` eme glac ee dans le cas de trois marchands. Si plusieurs marchands sont localis es au m eme endroit le long de la plage, il est raisonnable de penser quils se partagent egalement les clients pour qui ils sont les vendeurs les plus proches. Consid erons les deux cas de gure suivants. Si les trois marchands sont spatialement concentr es, chacun obtient un tiers de la client` ele; mais nimporte lequel dentre eux qui se localiserait l eg` erement ` a l ecart des autres sur le plus long segment de march e accroitrait sensiblement son volume de vente. Dans le second cas, (au moins) un des marchands est s epar e de ses deux concurrents et il peut augmenter ses ventes en choisissant une localisation plus proche deux. En dautres termes, il nexiste pas de conguration de localisations stable. Par contre, on peut d emontrer lexistence d equilibres en strat egies mixtes; ces equilibres impliquent une masse de probabilit e sup erieure ` a 1/2 autour du centre de la plage.4

3. Existence et unicite de l equilibre de Nash


3.1. Existence
Comme le montre le jeu matching pennies ou le probl` eme des trois marchands de cr` eme glac ee, un equilibre de Nash en strat egies pures nexiste pas n ecessairement. On peut cependant trouver des conditions susantes pour quun tel equilibre existe. Pour commencer, on d enit la meilleure r eponse (best reply) du joueur i par la correspondance de Si vers Si :
4 On

peut se r ef erer ` a M.J.Osborne et C. Pitchik The Nature of Equilibriurn in,a Location Model, International

Economic Review, 27(1986), 223-237, pour une etude d etaill ee de ces equilibres.

31

ri (si ) = argmax ui (si , si ) pour tout si Si . Dans le dilemme du prisonnier, la meilleure r eponse de chaque joueur est ind ependante de ce que fait lautre. Cela reste vrai d` es quil existe une strat egie strictement dominante.

Question 1 : Quand existe-t-il une meilleure r eponse pour le joueur i ? Lorsque lensemble des strat egies du joueur i est un ensemble compact et lorsque eor` eme de Weierstrass implique alors son gain est une fonction continue de si . Le th lexistence dun maximant.

Question 2 : La meilleure r eponse est-elle une application ou une correspondance? Une application num erique f d enie sur S est dite strictement quasi-concave si f (si , si ) > min{f (si , si ), f (si , si )} pour tout si ]si , si [ (on dit aussi que les courbes dindi erence sont strictirement convexes par rapport a ` lorigine). Si ui est strictement quasi-concave en si , alors la fonction de gain admet un seul ede deux maximants si et si maximant. Supposons au contraire que ui (si , si ) poss` pour si donn e et quelconque. Puisque ui est strictement quasi-concave en si , on a ui (si , si ) > min{ui (si , si ), ui (si , si )} elev es que pour tout si ]si , si [ de sorte que si assurait des gains strictement plus le gain maximum, ce qui constitue une contradiction. enie sur D` es lors, sous les hypoth` eses pr ec edentes, ri (si ) est une application d a-dire quil existe une meilleure r eponse quelque soit le prol lensemble Si , cest-` de strat egies choisies par les autres joueurs. La plupart des preuves dexistence dun equilibre repose sur un th eor` eme de point
32

xe. On dit quune application f dun ensemble X vers lui-m eme admet un point xe si x0 X est sa propre image par f : x0 = f (x0 ). Consid erons lapplication r(s) = (r1 (s1 ), , rn (sn )) de S vers S. On a: Lemme 1 Si lapplication r(s) poss` ede un point xe, ce point est un equilibre de Nash du jeu, et r eciproquement. equilibre de Nash. Alors, pour tout i = 1, n on a 1. Supposons que s soit un
s i = ri (si ) ce qui implique que s soit un point xe de r(s). 2. Soit s un point xe de r(s). Cela equivaut a ` dire que s i = ri (si ) pour tout

i = 1, , n, de sorte que
ui (s i , si ) ui (si , si )

equilibre de Nash. ce qui signie que s est un

Un ensemble de conditions susantes pour quun point xe existe est donn e par le th eor` eme de Brouwer qui s enonce de la mani` ere suivante : soit f une application de C vers C o` u C est un sous-ensemble de Rn . Si C est compact et convexe et si f est continu, alors f poss` ede un point xe. Illustrons ce th eor` eme dans le cas dune dimension. Soit f une application continue de [a, b] vers [a, b]. Si f est continu, alors il existe x0 [a, b] tel que x0 = f (x0 ) (g eom etriquement, cela revient a ` dire que la courbe d ecrite par f (x) intersecte la diagonale du carr e form e par le produit de lintervalle avec lui-m eme). Supposons au contraire que f ne poss` ede pas de point xe. Alors pour tout x [a, b], on a soit (1) x > f (x) ou (2) x < f (x). En eet, si on peut trouver deux points x et x dans eor` eme des valeurs interm ediaires, [a, b] tels que x < f (x ) et x < f (x), par le th il existerait x0 [a, b] tel que x0 = f (x0 ) puisque f est continu. Supposons tout dabord que x > f (x) pour tout x [a, b]. Dans ce cas, on a b > f (b) ce qui est impossible puisque b f (b). De m eme, si x < f (x) pour tout x [a, b], on a
33

a < f (a), alors que a f (a) par d enition de f . Dans les deux cas, il y a donc contradiction, de sorte que lexistence dun point xe est garantie. Dans le cas a ` n dimensions, la d emonstration de ce th eor` eme est beaucoup plus complexe et ne peut etre discut ee ici. En cons equence, si r(s) est continu sur S et si les ensembles de strat egies sont compacts et convexes, r(s) admet un point xe et, par le Lemme 1, celui-ci est un equilibre de Nash. Pour d emontrer la continuit e de r(s), on suppose que ui (s) est continu en s (et emonstration se fait par labsurde. Supposons que ri (s) pas seulement en si ). La d
0 ne soit pas continu. D` es lors, il existe une suite (sn i ) qui tend vers si dans Si n 0 0 telle que (ri ) = (ri (sn i )) ne converge pas vers ri ri (si ) dans Si . Comme la suite nk n 1 ) appartient au compact Si , elle contient une sous-suite (ri ) qui converge vers ri (ri 0 0 di erent de ri . Puisque ri est la meilleure r eponse de i contre s0 i , on peut trouver

positif tel que

0 0 1 0 , si ) ui (ri , si ) = 3. ui (ri

(1)

nk 1 ) converge vers ri et que ui est continu en s (et donc en si ), En outre, comme (ri

egalit es suivantes soient satisfaites: il existe n tel que pour tout nk > n les deux in

0 nk 0 0 , si ) ui (ri , si )| < |ui (ri nk nk 1 0 , si ) ui (ri , si )| < |ui (ri

de sorte que

0 nk 0 0 , si ) + > ui (ri , si ) ui (ri

(2)

et

34

nk nk 1 0 k + ui (ri , si ) < ui (ri , si ) > ui (rnk , sn i )

(3)

En introduisant (2) et (3) dans (1), on obtient


nk nk 0 nk ui (ri , si ) + ui (ri , si ) + > 3

ou encore
nk 0 nk k , si ) ui (ri , Sn ui (ri i ) > nk k ne serait pas la meilleure r eponse de i contre sn ce qui implique que ri i . On a donc

la contradiction cherch ee et r(s) est continu. En r esum e, on a d emontr e le r esultat suivant: Th eor` eme 2 Si les ensembles de strat egie sont des sous-ensembles compacts et convexes de Rn , et si la fonction de gain ui est continu en s et strictement quasieratif admet un equilibre de concave en si pour chaque joueur, alors le jeu non coop Nash en strat egies pures. Remarquons que lon peut rel acher lhypoth` ese de stricte quasi-concavit e pour la remplacer par celle de quasi-concavit e. Dans ce cas, il ny a plus unicit e des maximants, mais lensemble des maximants est convexe (la correspondance de meilleure r eponse nest plus une application mais une correspondance a ` image convexe). Discutons bri` evement la raison d etre des hypoth` eses du th eor` eme. La continuit e de ` si et la compacit e de Si sont suppos ees pour garantir lexistence dun ui par rapport a e par rapport a ` si et la convexit e maximant de ui dans Si . La stricte quasi-concavit e du maximant. Enn, la continuit e de ui (s) par rapport de Si impliquent lunicit e, que le maximant varie peu lorsque si a si garantit, lorsquil y a quasi-concavit ` change peu. Toutes ces conditions impliquent que les courbes de meilleure r eponse sont continues et, par cons equent, quelles sintersectent. Comme on la vu, la stricte quasi-concavit e peut etre remplac ee par la quasi-concavit e. Il est malais e daller plus
35

loin, du moins a ` ce niveau de g en eralit e, car si la fonction ui (s) est multimodale, les courbes de meilleure r eponse ne sont plus n ecessairement continues. Dans ce cas, elles peuvent ne pas sintersecter et on nest plus assur e de lexistence dun equilibre de Nash (ou alors il faut imposer des restrictions sur la monotonicit e des courbes de meilleure r eponse). Le th eor` eme 2 a en outre une implication importante pour les jeux nis. Th eor` eme 2 Tout jeu ni admet un equilibre en strat egies mixtes D emonstration : Si le nombre de strat egies pures du joueur i est egale a ` m, une strat egie mixte es. En cons equence, son pour ce joueur est un vecteur (pi1 , ....pim ) de probabilit ensemble de strat egies est donn e par le simplex si = {(pi1 , , pim ) : 0 pik 1 et math ematique de gain
1 i

pik = 1}

qui est compact et convexe, tandis que sa fonction de gain est d enie par lesp erance

p1j pnh uj kh

qui est lin eaire dans les probabilit es; elle est donc continue dans toutes les probaes lors, les hypoth` eses du Th eor` eme 2 sont satisfaites bilit es et quasi-concave en pik . D` et il existe un equilibre en strat egies mixtes.

3.2. Unicite
Une fonction f de C Rn vers C est une contraction sil existe ]0, 1[ tel que, pour tout x et x , on ait d[f (x ), f (x)] d(x , x). Intuitivement, cela revient a ` supposer que les images sont plus proches que les points de d epart. De proche en proche, on converge vers une solution unique.
36

Th eor` eme 4 Si r(s) est une contraction, alors l equilibre de Nash est unique. D emonstration : Supposons quil existe deux equilibres s et s, de sorte que s = r(s ) et s = r(s). D` es lors, on a

d(s , s) = d[r(s ), r(s)]. Comme r(s) est une contraction, on peut trouver 0 < < 1 tel que d[r(s ), r(s)] d(s , s), ce qui contredit l egalit e (4).

(4)

Corollaire 5 Si les courbes de meilleure r eponse sont contin ument di erentiables et de pente inf erieure a ` lunit e, alors r(s) est une contraction. D emonstration : etrique correspondante. Par le th eor` eme Soit x = max |xi | la max-norme et d la m des accroissement nis, on a :

d[r(s), r(s )]

d[r(s), r(s) + r (s )]

= r (s ) < d(s, s ) max |ri (s )| < d(s, s ) e sup erieurement par un nombre o` u ]0, d(s, s )[ puisque max |ri (s )|) est born inf erieur a ` 1 quel que soit s et i. Les conditions susantes enonc ees dans ce corollaire sont utilis ees dans de nombreuses applications economiques. Il existe de nombreux jeux economiques o` u
37

lexistence et lunicit e de l equilibre de Nash sont v eri ees, mais sans que les conditions du Th eor` eme 2 ou du Corollaire 5 soient satisfaites. Tel est le cas, par exemple, dans le probl` eme des deux marchands de cr` eme glac ee. Toutefois, on ne peut pas dire que cela soit la r` egle: soit lexistence dun equilibre, soit la multiplicit e des equilibres restent des probl` emes majeurs dans les applications economiques de la th eorie des jeux.

3.3. Le mod` ele de Cournot


Les r esultats pr ec edents peuvent etre employ es pour etudier un des mod` eles les plus connus en economie industrielle, a ` savoir le duopole de Cournot. Imaginons une r eserve deau min erale naturelle qui peut etre exploit ee ` a partir de deux sources di erentes. Celles-ci se situent sur des terrains appartenant a ` deux propri etaires qui ne sont pas dispos es ` a coop erer lors de la commercialisation de leau. On peut donc les consid erer comme les participants dun jeu non coop eratif. Ils doivent d ecider simultan ement de la quantit e de bouteilles deau a ` mettre sur le march e. La fonction de demande inverse pour les bouteilles deau est donn ee par p(Q) = max{1 (q1 + q2 ), 0}, esignent le nombre de bouteilles oertes a ` la vente par les producteurs o` u q1 et q2 d ecoul ee aupr` es 1 et 2 et p le prix du march e auquel la quantit e totale Q = q1 + q2 est des consommateurs. Le co ut de production dune bouteille deau est identique pour les deux producteurs et egal a ` une constante 0 < c < 1. La fonction de prot du vendeur i est alors donn ee par : i = qi [p(Q) c] i = 1, 2.

Chaque joueur conna t sa fonction de prot ainsi que celle de son concurrent. En outre, il souhaite maximiser son prot en choisissant son volume de production et sait que son concurrent cherche a ` faire de m eme. Enn, il sait que lautre dispose de la m eme information le concernant.

38

En premier lieu, on v erie si les hypoth` eses du Th eor` eme 1 sont remplies. Tout dabord, les ensembles de strat egies sont donn es par lintervalle [0, 1] qui est compact et convexe. En eet, aucun vendeur na int er et a ` orir une quantit e sup erieure a ` 1 car, quelle que soit la strat egie choisie par son concurrent, il r ealiserait un prot eme pour nul. Ensuite, comme la fonction p(Q) est continue en qi et qk , il en va de m la fonction de prot. Il reste a ` montrer que i est quasi-concave en qi . Soit R. Si p(Q) est positif, lensemble des strat egies qi et qk pour lesquelles i (qi , qk ) est convexe car la fonction de prot est strictement concave en qi et qk . Si p(Q) est nul, cet ensemble est encore convexe car la fonction de prot est maintenant egale a ` equence, i est quasi-concave sur [0, 1]. Les conditions cqi qui est concave. En cons du th eor` eme 1 sont donc satisfaites et il existe un equilibre de Nash en strat egies pures. Il est evident que tout equilibre est tel que les deux vendeurs r ealisent des prots positifs. Cela implique que les conditions du premier ordre soient satisfaites comme des egalit es. Dans le cas du joueur 1, cette condition exprime sa volont e de maximiser son prot; elle s ecrit

1 /q1 = 0.

(5)

Mais le joueur 1 sait que le joueur 2 cherche aussi a ` maximiser son propre prot. Il simule le comportement optimisateur de 2 en calculant sa condition du premier ordre

2 /q2 = 0.

(6)

Du point de vue du joueur 1, les equations (5) et (6) ont un statut di erent : la premi` ere exprime son comportement optimisateur; la seconde repr esente une hypoth` ese que 1 fait sur le comportement de 2. Mettons-nous maintenant a ` la place du joueur 2. Il tient exactement le m eme raisonnement, mais dans lequel les indices 1 et 2 sont invers es. En cons equence, les deux joueurs sont confront es au m eme syst` eme d equations simultan ees, lequel

39

traduit ici linterd ependance strat egique de leurs d ecisions. On v erie sans peine que ce syst` eme est donn e par les deux equations suivantes :

1 2q1 q2 = 0 et

(7)

1 q1 2q2 = 0 qui admettent une solution unique donn ee par


= (1 c)/3 et q2 = (1 c)/3. q1

(8)

(9)

Si 2 choisit de vendre une quantit e q2 , il est alors optimal pour 1 de vendre q1 , et

r eciproquement. Comme, par hypoth` ese, le joueur 1 est capable de se mettre a ` la place de 2, il arrive a ` la m eme conclusion, a ` savoir quil est optimal pour 1 de vendre
si lui, le joueur 2, vend la quantit e q2 . D` es lors, il y a une forte pr esomption que q1 , ce qui implique que 2 va sans doute orir une quantit e 2 pense que 1 va vendre q1 . Il en va de m eme, mutatis mutandis, pour 1 qui est donc incit e ` a choisir qi . q2

Autrement dit, on constate que les duopoleurs sont incit es ` a se comporter comme le sugg` ere l equilibre de Nash. Le prix et les prots qui en r esultent sont donn es par
C = (1 c)2 /9 i = 1, 2. p = (1 + 2c)/3 et i

(10)

Comme les conditions du premier ordre (7) et (8) sont n ecessaires et quelles nadmettent quune seule solution, l equilibre de Nash est unique. De ces conditions, on peut egalement d eterminer les courbes de meilleure r eponse sur le domaine o` u les quantit es sont positives : r1 = (1 q2 )/2 et r2 = (1 q1 )/2
40

dont les pentes sont eectivement inf erieures ` a lunit e comme le r eclame le Corollaire 5. Supposons maintenant que les deux vendeurs d ecident de se comporter de mani` ere collusive et de maximiser leur prot joint. Le prot joint est evidemment le prot `Q de monopole M = Q[p(Q) c]. La maximisation de cette fonction par rapport a donne QM = (1 c)/2, pM = (1 + c)/2etM = (1 c)2/4. Il reste ` a sp ecier comment les vendeurs vont se partager ce prot. Cette question nest en g en eral pas simple a ` r esoudre. Toutefois, dans le cas particulier qui nous retient, la sym etrie du jeu fait quil est raisonnable de supposer quils vont se partager ce prot de mani` ere egale, de sorte que chaque vendeur r ealise un prot egal a ` e sont sup erieurs ` a ceux (1 c)2 /8. On remarque que les prots et le prix de march obtenus a ` l equilibre du duopole. Ces r esultats conrment lintuition selon laquelle la concurrence entre deux entreprises est pr ef erable a ` un monopole du point de vue des consommateurs. En outre, ils sugg` erent que les entreprises ont int er et ` a sentendre de mani` ere ` a r eduire les eets de la concurrence en vendant chacun (1 c)/4 au lieu de (1 c)/3. Mais quen est-il de la stabilit e dun tel accord entre les deux vendeurs ? Si le vendeur 1 est convaincu que le vendeur 2 va respecter laccord et vendre une quantit e (1 c)/4, alors il na pas int er et a ` respecter sa promesse. En e par cette valeur dans la fonction de prot du vendeur 1, on eet, si q2 est remplac a 1 = q1 [1 q1 (1 c)/4] qui est maximis ee lorsque 1 choisit de vendre un montant egal a ` q1 = (3 + c)/8 qui est sup erieure a ` (1 c)/4 (et m eme ` a (1 c)/3). En dautres termes, le vendeur 1 prote du fait que 2 r eduit son volume de vente pour accro tre le sien et r ealis e ainsi un prot plus elev e. Toutefois, si les deux vendeurs se trompent sur les intentions de
41

lautre, ils vont mettre sur le march e une quantit e totale egale a ` (3 + c)/4 et r ealiser un prot (3 + c)(1 c)/32 qui est inf erieur au prot quils font a ` l equilibre de Nash. Cette situation rappelle le dilemme du prisonnier etudi e` a la section 2.1 : les deux vendeurs ont un int er et commun ` a coop erer, mais chacun est incit e individuellement a ne pas respecter laccord de coop ` eration. Il existe une autre mani` ere de justier la solution propos ee ci-dessus pour le duopole de Cournot, a ` savoir le processus de dominance successive etudi e` a la section 2.2. Par soucis de simplicit e, on supposera que c = 0. Dans un premier temps, chaque vendeur constate quil na pas avantage a ` orir une quantit e sup erieure ` a la quantit e de monopole 1/2, et ce quelle que soit la quantit e vendue par son rival, car autrement il r eduirait son prot. On suppose que chaque vendeur est conscient de ce fait, ce qui le conduit a ` penser que son rival choisira dans lensemble de strat egies [0, 1/2] puisque les strat egies appartenant a ` ]1/2, 1] sont strictement domin ees. Le vendeur 1, disons, restreint ensuite le choix du vendeur 2 a ` lintervalle [1/4, 1/2] car il nest jamais protable pour 2 de vendre une quantit e inf erieure ` a 1/4; cette quantit e est la meilleure r eponse de 2 si 1 choisit 1/2 tandis que 1/2 est sa meilleure r eponse lorsque 1 choisit 0. On suppose que 2 proc` ede de la m eme mani` ere. A la deuxi` eme it eration, chaque joueur elimine donc les strat egies appartenant a ` lintervalle [0, 1/4[ de lensemble de strat egies de son concurrent parce quelles sont strictement domin ees. A l etape suivante, 1 r ealise alors que 2 ne va jamais choisir une quantit e exc edant 3/8. Cest en eet la meilleure r eponse de 2 si 1 venait a ` choisir 1/4. En dautres termes, les strat egies appartenant a ` ]3/8, 1/2] sont strictement domin ees du point de vue de 2 une fois que celui-ci est conscient que 1 va conner son choix a ` [1/4, 1/2]. Il en va de m eme pour 2. En poursuivant ce raisonnement (avant que le jeu ne soit eectivement jou e), on constate que chaque joueur elimine de nouveaux intervalles de strat egies et que ce processus converge vers le couple (1/3, 1/3) qui est l equilibre de Nash du duopole de Cournot quand le co ut marginal de production est nul. Comme les ensembles de strat egies sont innis, il faut une innit e dit erations pour que le processus de dominance successive conduise ` a l equilibre. Il est clair que la concavit e du prot joue un r ole essentiel

42

dans cette r esolution du duopole de Cournot.5 Envisageons maintenant le cas plus g en eral de n entreprises qui ont toutes le m eme co ut marginal de production c. On a: Q =
i qi

et i = qi [p(Q) c] pour

tout i = 1, ...n. Lexistence et lunicit e de l equilibre sont etablies comme dans le cas du duopole. Les conditions du premier ordre sont les suivantes : i /qi = 0 implique que 1 egales, de sorte que
= = qn = (1 c)/(n + 1) q1 k = i qk

2qi = 0. On a donc n equations a ` n inconnues. Du fait

de la sym etrie du syst` eme, il est raisonnable de penser que toutes les quantit es sont

qui g en eralisent les expressions obtenues dans le cas du monopole (n = 1) et du duopole (n = 2). Si n est consid er e comme un nombre r eel, on v erie ais ement que Q = (1 c)n/(n 1) et p = (1 + nc)/(n + 1). De plus, comme p /n = (c 1)/(n + 1)2 < 0, on voit que le prix d equilibre d ecro t monoton ement lorsque le nombre dentreprises sur le march e augmente et tend vers le co ut marginal de production quand le nombre de producteurs devient inniment
= (1 c)2 /(n + 1) tendent vers zero grand. De m eme, on v erie que les prots i

(rappelons que les rendements sont constants) lorsque le nombre de rmes devient arbitrairement grand. Une autre mani` ere dillustrer cette propri et e est de calculer l elasticit e-prix a ` l equilibre comme fonction de n :

) p = (dqi /dp)(p /qi

= = =

(dQ/dp)(p /Q )(Q /qi )

(p /Q )n puisque dQ/dp = 1 (1 + nc)/(1 c)

qui tend vers linni avec n. En dautres termes, lorsque le nombre dentreprises
5 Cf.

Moulin H. Dorninance Solvability and Cournot Stability, Matematical Social Sciences, 7(1984), 83-102.

43

devient arbitrairement grand, l elasticit e-prix de la demande dune entreprise tend vers linni comme dans le mod` ele de concurrence parfaite. Le mod` ele concurrentiel peut donc etre vu comme la limite du mod` ele de Cournot.

4. Jeux dynamiques en information compl` ete


On suppose dor enavant que le jeu se d eroule en plusieurs etapes. On admet egalement que toutes les actions pass ees sont observables et connues de tous les joueurs. Une etape peut correspondre a ` une p eriode temporelle, mais cela ne doit pas obligatoirement etre le cas. Les jeux dynamiques permettent de traiter deux aspects fondamentaux pr esents dans la r ealit e economique : 1. certains joueurs ont le pouvoir daecter directement les gains dautres joueurs de mani` ere irr eversible parce quils interviennent a ` des etapes ant erieures du jeu ; 2. le temps est une composante essentielle dans la plupart des processus de d ecision et les etapes du jeu en sont souvent lexpression formelle. Si la seconde observation ne r eclame aucun commentaire tant elle est evidente, il nest peut- etre pas inutile dillustrer la premi` ere au moyen de lexemple suivant. Deux personnes sont devant un g ateau quelles doivent se partager. La premi` ere doit d ecouper le g ateau en deux parties, pas n ecessairement egales, tandis que la seconde choisit le morceau quelle pr ef` ere. Si elle a tr` es faim, toute r` egle de bonne conduite sera oubli ee et elle choisira le plus gros morceau. La premi` ere personne, si elle anticipe correctement le comportement de la seconde, comprend que la seule mani` ere pour elle de se r eserver le plus gros morceau possible est de d ecouper le g ateau en deux parties strictement egales lors de la premi` ere etape. Lors de la seconde etape, les deux options oertes sont essentiellement les m emes, de sorte que le choix du premier joueur contraint eectivement celui du second. Dans un contexte dynamique, une strat egie sp ecie laction gue choisit chaque
44

joueur a ` chague etape o` u il intervient en fonction de l etat du jeu qui pr evaut en ce moment. Autrement dit, le joueur choisit en tenant compte de lhistoire pass ee du jeu. Comme on le verra, la notion d equilibre de Nash se g en eralise au cas des jeux dynamiques lorsque les strat egies sont d enies comme elles le sont ci-dessus. Tout se passe alors comme si tous les joueurs eectuaient leurs choix une fois pour toute d` es le d ebut du jeu ; toutefois un tel comportement nest pas n ecessaire pour le d eroulement du jeu.

4.1 Jeux en information parfaite


On distingue deux types de jeux dynamiques en information compl` ete. Dans le premier, chaque joueur conna t lensemble des actions choisies par tous les joueurs qui sont intervenus avant quil ne s electionne sa propre action. En dautres termes, il est le seul joueur ` a prendre une d ecision a ` l etape consid er ee. On dit alors quon a un jeu en information parfaite (le jeu d echecs est un jeu en information parfaite). Dans le second, plusieurs joueurs choisissent leurs actions simultan ement ` a une etape donn ee du jeu. Ces actions ne sont pas connues et chacun des joueurs intervenant a ` cette etape se comporte un peu comme dans un jeu statique ; la di erence essentielle r eside dans lhistoire du jeu qui inuence le choix de chacun. Il va sans dire que les premiers jeux sont plus faciles a ` traiter que les seconds. Commen cons donc par etudier lexemple suivant (le jeu est d ecrit en forme extensive).

Il faut tout dabord sp ecier ce que sont les strat egies des joueurs. Pour le joueur 1, une strat egie consiste a ` choisir une action, H ou B . Pour le joueur 2, qui joue enie sur lensemble apr` es 1, une strat egie est une fonction : s2 () = [s2 (H ), s2 (G)] d des strat egies de 1. Comment doit-on jouer ce jeu ? Le principe consiste a ` raisonner en remontant par induction vers lamont. (backward induction). Cela veut dire que lon raisonne en sens contraire de la mani` ere dont le jeu va eectivement se d erouler. Le joueur 1 se dit : si je joue H , alors 2 va jouer B de sorte que mon

45

H 2 H B 1 B 2 B H

2, 0

2, 1

1, 1

3, 0

gain sera egal a ` 2 ; si je joue B , alors 2 joue H et mon gain est de 1. D` es lors, si 1 suppose que 2 choisit sa meilleure r eponse ` a la seconde etape, il choisit H ` a la premi` ere. Pour ce qui est de 2, sa strat egie est eectivement sa meilleure r eponse, equence, (H, S2 (H ) = B, S2 (B ) = H ) est a savoir [s2 (H ) = B, s2 (B ) = H ]. En cons ` un equilibre de Nash car aucune d eviation unilat erale nest payante pour un joueur. On admet que lorsque cest le tour du joueur 2 de jouer, il choisit la meilleure equence, sachant action pour lui-m eme, ` a savoir r2 (H ) = B et r2 (B ) = H . En cons que le joueur 2 se comporte de mani` ere optimale a ` la seconde etape, le joueur 1 int` egre cette information dans son comportement et choisit une action optimale conditionnellement au comportement optimal de 2. Il est evident que le joueur 1 souhaiterait jouer B et souhaiterait que 2 joue B egalement. Toutefois, il nest pas raisonnable de la part de 1 desp erer un tel comportement une fois que 1 a ` jou e B et que ce choix est observ e par 2. Un exemple de jeu dynamique bien connu en economie industrielle est constitu e par le duopole de Stackelberg. On consid` ere un environnement economique similaire a ` celui du duopole de Cournot mais on suppose maintenant que 1, disons, choisit sa quantit e` a la premi` ere etape et que, cette quantit e etant observ ee, 2 choisit la sienne. En dautres termes, une strat egie pour lentreprise 1 est un volume de egie pour lentreprise 2 est une fonction s2 (q1 ) production q1 tandis quune strat
46

d ependant de q1 et sp eciant la quantit e que lentreprise 2 souhaite ecouler sur le march e lorsque 1 retient q1 . Dans ce cas, on dit que lentreprise 1 est le meneur (leader) et que la seconde est le suiveur (follower). En fait, il est facile de voir, qu` a la seconde etape, 2 va choisir sa meilleure r eponse donn ee par r2 (q1 ) = (1 q1 )/2. Sachant cela, 1 int` egre cette fonction dans son prot qui devient 1 = q1 [1 q1 (1 q1 )/2] de sorte que d1 /dq1 = 0
S q1 = 1/2

S S r1 (q1 ) = q2 = 1/4.

En cons equence, on obtient : QS = 3/4 et pS = 1/4


S S 1 = 1/8 et 2 = 1/16.

Les deux entreprises ne r ealisent pas le m eme prot, do` u la question de savoir qui va etre le meneur et le suiveur. Il est important de comprendre que les duopoles de Cournot et de Stackelberg correspondent a ` deux situations economiques di erentes d ecrites par deux jeux di erents. Il est inexact de pr esenter la solution du duopole de Stackelberg comme une solution alternative au duopole de Cournot. Dans ce dernier, les deux joueurs prennent leurs d ecisions simultan ement, tandis quun joueur a la possibilit e dobserver la d ecision de son rival avant de prendre sa propre d ecision dans le jeu de Stackelberg. Celui-ci est un jeu en information parfaite, a ` la di erence du jeu de Cournot. Ce genre de distinction est essentielle en th eorie des jeux et recouvre des m ecanismes di erents dinteraction. En revanche, le concept d equilibre appliqu e` a ces deux jeux, ` a savoir l equilibre de Nash, est le m eme dans les deux jeux. Il existe des situations o` u lordre dans lequel les joueurs interviennent r esulte de circonstances ext erieures au jeu lui-m eme. Id ealement, il faudrait pouvoir endog en eiser les r oles. Dans certains jeux, 1 souhaite etre le meneur et 2 le suiveur ; en outre, si les gains ainsi r ealis es par chaque joueur dominent ceux quils obtiendraient en
47

jouant simultan ement, la s equence retenue est une situation d equilibre dun jeu plus g en eral o` u les joueurs choisissent pour commencer un r ole particulier. Ce nest pas
S C S > i > 2 . le cas ici puisquon a les in egalit es 1

Il est int eressant de remarquer que les quantit es d equilibre du duopole de Cournot sont un equilibre de Nash du jeu ` a deux etapes. En eet, si 1 joue 1/3, la meilleure r eponse de 2 est de jouer 1/3. En outre, si pour lune ou lautre raison, 1 pense que 2 va jouer 1/3, alors il est optimal pour lui de jouer 1/3. Dans ce cas, le joueur 2 r ealise un gain sup erieur au d etriment du joueur 1 qui r ealise un manque-` a-gagner. En cons equence, 2 peut menacer 1 de jouer 1/3. Toutefois, cette menace nest pas cr edible : si 1 vend une quantit e di erente de 1/3, il est optimal pour 2 de vendre une quantit e di erente de 1/3 et 1 le sait. Autrement dit, lorsque 2 est mis en face de la situation de mettre sa menace a ` loeuvre, il ne le fera pas. On remarque donc quil existe des equilibres de Nash qui impliquent lemploi de menaces qui se r ev` elent non cr edibles au l du jeu. On verra bient ot comment de telles menaces peuvent etre elimin ees en introduisant un ranement du concept d equilibre de Nash, a ` savoir le concept de perfection. En outre, il nest pas vrai que chaque joueur souhaite etre le meneur. Pour le voir, on consid` ere une variante du jeu des deux marchands de cr` eme glac ee qui sont localis es aux deux extr emit es de la plage mais libres de choisir leur prix de vente. Par hypoth` ese, tout baigneur supporte un co ut de d eplacement qui est une fonction lin eaire de la distance parcourue (tx). Les fonctions de prot s ecrivent alors comme suit : 1 = p1 (p2 p1 + t)/2t et 2 = p2 (p1 p2 + t)/2t. Imaginons que lentreprise 1 situ ee ` a lextr emit e gauche de la plage soit le meneur. La fonction de meilleure r eponse de lentreprise 2 est donn ee par r2 (p1 ) = (p1 + t)/2. Apr` es remplacement de p2 par r2 (p1 ) dans 1 , on obtient p1 = 3t/2 et p2 = 5t/4.
48

On v erie alors ais ement que le prot de 1 est egal a ` 9t/16 tandis que celui de 2 est de 25t/32. Le sort du suiveur est donc pr ef erable a ` celui du meneur. On peut d emontrer le r esultat suivant : Th eor` eme 6 Tout jeu ni en information parfaite admet un equilibre de Nash en strat egie pure. En th eorie, cet equilibre peut etre calcul e en partant des sommets terminaux de larbre et en appliquant le principe dinduction vers lamont. Plus pr ecis ement, on retient les sommets de larbre qui pr ec` edent juste les sommets terminaux et on choisit pour chacun des joueurs laction qui lui assure le gain le plus elev e. On consid` ere ensuite les sommets dont les successeurs imm ediats sont les avant-derniers. Chacun des joueurs s electionne laction qui lui assure le gain le plus elev e parmi les successeurs possibles, sachant comment il joue au tour suivant. Et ainsi de suite jusquau sommet initial. N eanmoins, cette solution nest pas compl` etement satisfaisante. Dans le jeu d echecs, lapplication du Th eor` eme 6 r eclame que chaque joueur soit capable deectuer la totalit e des calculs quimpliquent ce raisonnement. Il sagit l` a dune exigence qui d epasse la capacit e de traitement de linformation des individus (et m eme des plus gros ordinateurs) tant le nombre de cas a ` consid erer, bien que ni, est elev e. Dautres dicult es surgissent lorsque lon applique ce principe comme celles illustr ees dans les deux jeux suivants. Dans le jeu en forme extensive d ecrit ci-dessous, deux joueurs ont le choix entre laction A ou B .

Jouer B est optimal a ` chaque sommet de larbre. D` es lors, si lon applique le principe dinduction vers lamont le jeu sarr ete ` a la premi` ere etape apr` es que le premier joueur ait choisi B . Pourtant, 1 pourrait vouloir jouer A aux ns denvoyer un signal a ` 2. Si tel est le cas, comment 2 va-t-il se comporter ? Va-t-il automatiquement

49

B (1 , 0)

A B

(0 , 1)

A B

A B

(2 , 4)

A B

(5 , 5)

(3 , 0)

(6 , 3)

1 B

2 B

3 B

5 B

(2, 2, , 2)

(1, 1, , 1)

(1, 1 , , 1) 2 2 2

B 1 1 1 ( , , , ) 3 3 3

1 1 1 ( , , , ) 4 4 4

( 1, 1 , , 1) n n n

choisir B ou, au contraire, choisir A dans lespoir dobtenir les gains (5, 5). Dans un tel jeu, la formation des croyances sur le comportement de lautre devient une composante essentielle de la mani` ere dont le jeu se d eroule et lapplication du principe dinduction peut sugg erer une solution di erente de celle eectivement choisie par les deux joueurs. Consid erons maintenant le jeu du mille-pattes dans lequel n joueurs ont le choix entre A et B .

La solution donn ee par le principe dinduction vers lamont donne un equilibre unique o` u chaque joueur choisit A et r ealise un gain egal a ` 2. Toutefois, si n est grand et si le joueur 1 place une probabilit e 0 < p < 1 que chaque joueur se conforte a ` la r` egle dinduction, alors la probabilit e que cette solution soit eectivement choisie est egale pn1 qui est arbitrairement petit lorsque n est grand, de sorte que le joueur 1 peut vouloir choisir B au lieu de A ` a la premi` ere etape sil choisit un comportement prudent. De nouveau, le principe dinduction risque de ne pas etre appliqu e en pratique.

50

4.2 Le concept dengagement


On a dit en d ebut de chapitre quun joueur pouvait contraindre les choix dun autre en prenant certaines d ecisions avant lautre joueur. Pour etre cr edible, le joueur intervenant en premier lieu doit prendre un engagement irr eversible (commitment). Cette id ee est fondamentale dans l etude des comportements des acteurs economiques. A premi` ere vue, il peut sembler absurde pour un joueur de se contraindre a priori puisque le fait de disposer dun plus grand nombre de variables de d ecision semble constituer un avantage et que lengagement conduit a ` r eduire le nombre de ces variables. Ce qui est vrai dans un probl` eme doptimisation ne lest pas n ecessairement dans un environnement strat egique. Bien entendu, il serait faux de croire que tout engagement est toujours protable pour celui qui le choisit. Pourtant, on rencontre de nombreuses situations economiques o` u les joueurs peuvent avoir int er et a ` se contraindre dembl ee ` a ne pouvoir modier leurs d ecisions. Consid erons a ` titre dexemple le jeu des marchands de cr` eme glac ee o` u le nombre de participants est suppos e egal a ` quatre. On v erie sans peine que le seul equilibre de Nash (en strat egies pures) du jeu statique est donn e par deux marchands implant es en 1/4 et par deux autres en 3/4. Changeons maintenant les r` egles du jeu et supposons que les marchands s etablissent s equentiellement sur la plage. Par hypoth` ese, les co uts dinstallation f sont compris entre 1/6 et 1/4 de sorte que chaque marchand peut r ealiser un prot positif si les localisations sont choisies de mani` ere appropri ee. Les deux premiers arrivants disposent dun avantage par rapport aux autres sils ont la possibilit e (r eelle dans les faits) de choisir une localisation une fois pour toute. En eet, dans ce cas, les deux premiers marchands vont simplanter a une distance f de chacune des extr ` emit es de fa con a ` se garantir les clients correspondants. Si le troisi` eme marchand se localise au milieu de la plage, alors le quatri` eme marchand ne dispose plus dun segment de march e susamment grand pour pouvoir couvrir ses co uts dinstallation. Quand bien m eme il se localiserait en 1/2, il r ealiserait un volume de vente egal a ` 1/4 - f /2 qui est strictement inf erieur a ` f puisque f > 1/6. Il d ecide par cons equent de pas entrer. On voit donc comment le comportement strat egique des trois premiers joueurs permet de bloquer lentr ee du

51

quatri` eme. Cela nest possible que dans la mesure o` u celui-ci consid` ere les localisations des trois premiers etablissements comme xes. Autrement dit, en sengageant strat egiquement, les trois premiers entrants se garantissent des prots plus elev es. Lengagement sur les localisations se r ev` ele donc protable.

4.3 L equilibre parfait de Selten


On peut maintenant d enir le cadre conceptuel g en eral des jeux dynamiques. ` l etape du jeu A cette n, on d esigne par a le vecteur des actions choisies a par les participants qui interviennent a ` cette etape (rappelons que dans un jeu en information parfaite, un seul joueur intervient a ` chaque etape du jeu, maintenant, on permet a ` plusieurs joueurs dintervenir simultan ement). Soit t une etape quelconque equence du jeu. On d enit lhistoire du jeu ` a l etape t, ht = (a0 , a1 , at1 ), par la s de toutes les d ecisions prises par les joueurs intervenant lors des etapes ant erieures = 0, 1, , t 1. On suppose que tous les joueurs connaissent lhistoire du jeu a chaque ` etape. En dautres termes, toutes les actions pass ees sont observables et connues par tous les participants (il ny a pas de perte de m emoire). Le reste du a chaque etape t jeu ( > t) est appel e sous-jeu G(ht ). Puisque lhistoire ht du jeu ` est connue, le sous-jeu se d eroulant a ` partir de t peut etre vu comme un jeu a ` part enti` ere induit par lhistoire ht . Lhistoire ht impose des restrictions sur les choix es oerts au joueur i. Soit Ai (ht ) lensemble des actions auxquelles le joueur i a acc` epend a l ` etape t du jeu lorsque lhistoire est donn ee par ht . Comme cet ensemble d a priori de lhistoire du jeu, cela revient a ` supposer que ce joueur est contraint dans ses choix par les actions choisies dans le pass e, aussi bien par lui-m eme que par ` l etape consid er ee. La les autres. Si Ai (ht ) est vide, le joueur i nintervient pas a ` chaque etape t pour chaque joueur i fait partie description des ensembles Ai (ht ) a de la sp ecication des r` egles du jeu. Soit encore H t lensemble de toutes les histoires possibles jusqu` a l etape t. On d esigne alors par Ai (H t ) =
ht H t

Ai (ht )

lensemble de toutes les actions possibles pour le joueur i ` a l etape t selon les histoires
52

H B

(2 , 2)

G (3 , 1)

D (0 , 0)

possibles. Nous sommes maintenant equip es pour d enir une strat egie pure dun jeu dynamique admettant T etapes (o` u T peut converger vers linni). Une strat egie pure pour le joueur i est d enie par une suite de T applications Sit de H t vers egie pure est une suite de r` egles de s election Ai (H t ). En dautres termes, une strat dune action particuli` ere par le joueur i ` a chaque etape du jeu compte tenu de lhistoire qui sest d eroul ee jusqualors. On remarque imm ediatement la di erence davec la d enition dune strat egie pure dans un jeu statique. Ici, la d enition prend en compte les d ecisions choisies ant erieurement et, de cette mani` ere, permet une analyse dynamique des choix. Un jeu dynamique peut admettre plusieurs equilibres de Nash (on la d ej` a remarqu e dans le cas du duopole de Stackelberg). Toutefois, certains dentre eux apparaissent comme plus raisonnables que dautres. Consid erons par exemple le jeu suivant d eni en forme extensive.

R e ecrivons ce jeu en forme strat egique (cest-` a-dire ici sous forme matricielle).

2 1 H B G D 2,2 2,2 3,1 0,0

53

On v erie ais ement quil y a deux equilibres de Nash en strat egies pures, ` a savoir (H, D) et (B, G). Toutefois, (H, D) nest pas une solution raisonnable. En eet, le joueur 1 r ealise que sil joue B , alors le joueur 2 a int er et ` a jouer G qui garantit au joueur 1 un gain egal a ` 3 qui est sup erieur a ` 2. En dautres termes, (H, D) ne devrait pas etre retenu comme solution du jeu parce que D ne constitue pas une menace cr edible pour le joueur 2. De mani` ere ` a ecarter de telles solutions, on va se concentrer sur les equilibres de Nash qui sont des equilibres parfaits de Selten : a ` chaque etape t et pour chaque hisequilibre parfait doit etre un equilibre de Nash pour le sous-jeu r esultant. toire ht , l Cette exigence suppl ementaire (on parle de ranement du concept d equilibre de Nash) permet d eliminer les equilibres qui impliquent des menaces non cr edibles. En eet, quand on atteint le moment o` u un joueur doit eectuer un choix, il ne retiendra jamais une menace non cr edible car celle-ci ne correspond pas a ` un equilibre de Nash du sous-jeu correspondant. A chaque etape t, les strat egies du sous-jeu sont d enies comme celles du jeu initial. La seule di erence est que lhistoire ` a consid erer pour les etapes = ees ` a 0, 1, , t 1 est donn ee par ht : ce sont donc des restrictions sur si impos
, S2 , , Sn ) est un equilibre parfait de lhistoire ht . On dit alors que S = (S1

Selten (subgame perfect Nash equilibrium) si, pour toute histoire ht , la restriction equilibre de Nash du sous-jeu G(ht ). S |ht est un En fait, la perfection au sens de Selten peut etre vue comme une extension du principe dinduction vers lamont dans laquelle il ny a plus information parfaite parce que plusieurs joueurs peuvent choisir simultan ement une action a ` certaines etapes du jeu. Elle exige que les joueurs soient tous daccord sur la mani` ere de jouer quel que soit le sous-jeu consid er e. Cela implique que tous les joueurs acceptent de se comporter comme le sugg` ere la th eorie quand bien m eme ils se trouveraient dans un sous-jeu qui ne correspond pas a ` ce que la th eorie pr edit : des joueurs se seraient tromp es dans le pass e mais on fait comme sils avaient appris ensuite a ` se comporter comme la th eorie le recommande. En outre, les joueurs sattendent
54

aux m emes equilibres. En eet, ` a la di erence de ce que lon observe dans les jeux en information parfaite, il peut exister plusieurs equilibres parfaits de Selten do` u le besoin demployer de nouveaux ranement de ce concept d equilibre dans lespoir darriver a ` une solution unique. Cet espoir est souvent vain et la multiplicit e des equilibres ne doit pas etre vue comme une faiblesse de la th eorie mais plut ot comme une potentialit e inh erente ` a lanalyse des comportements strat egiques. A titre dexemple, consid erons le jeu suivant : Il y a deux entreprises i = 1 et 2. A la premi` ere etape, la rme 1 peut d ecider dun investissement f qui r eduit son co ut marginal de production c > 0 a ` la valeur 0. A la seconde etape, les deux rmes sont dans une situation de concurrence a ` la Cournot. Comment doit-on r esoudre le jeu ? Comme dans le jeu de Stackelberg, on proc` ede par induction vers lamont en supposant 2 cas possibles: (1) lentreprise 1 investit; (2) lentreprise 1 ninvestit pas. Dans le premier cas, on a : c = 0 pour lentreprise 1, do` u 1 q2 2 1 c q1 . = (p c)q2 r2 = 2

1 = pq1 f r1 = 2

Il est alors facile de v erier que les quantit es d equilibre sont donn ees par 1+c 1 2c (1) = et q2 3 3 do` u il r esulte que le prot de lentreprise 1 est dans ce cas egal a `
q1 (1) = 1 (1) =

(1 + c)2 f. 9

Dans le second, les deux entreprises supportent un co ut marginal egal a ` c et on sait que l equilibre de Cournot est donn e par
55

1c 3 de sorte que le prot de lentreprise 1 est maintenant egal a `


q1 (2) = q2 (2) = (2) = 1

(1 c)2 9

On a (1 + c)2 (1 c)2 9 f > c > f. 9 9 4 Autrement dit, si f est susamment faible comparativement a ` la baisse de
(1) > 2 (2) 1

co ut variable, la rme 1 investit dans la nouvelle technologie. Sinon, elle conserve lancienne technologie et supporte le co ut c. L equilibre parfait de Selten est alors donn e par: (a) si c > 9f /4, alors (i) lentreprise 1 investit; 1+c 1 2c 1c (2) = q2 (2) = , q2 (1) = et q1 ; 3 3 3 (b) si c 9f /4, alors (i) lentreprise 1 ninvestit pas;
(1) = q1 (2) = q2 (2) = q1

1c 1+c 1 2c (1) = et q1 , q2 (1) = . 3 3 3

Dans ce jeu, selon les valeurs de c et de f , il y a un chemin unique d equilibre. Cette propri et e nest pas toujours vraie: il peut y avoir plusieurs chemins d equilibre ce qui revient a ` dire que le concept de perfection ne sut pas a ` s electionner un seul r esultat (solution) dans un jeu dynamique.

5. Jeux re pe te s
Un jeu r ep et e est un jeu dynamique o` u le jeu constitutif est le m eme ` a chaque p eriode (ou etape). Ils constituent une classe particuli` ere importante des jeux dynamiques. Consid erons pour commencer le cas dun horizon ni T . La fonction de
56

gain du joueur i est le gain escompt e sur lensemble des p eriodes, d esignant le facteur descompte
T t=0

t1 ui (ait ).

(11)

Consid erons le jeu constitutif d ecrit par la matrice suivante:

2 1 C N C 1,1 2,-1 N -1,2 0,0

Dilemme du prisonnier L equilibre de Nash du jeu statique est (N, N ). Cest aussi un equilibre du jeu r ep et e dont les fonctions de gain sont donn ees par (11). Si les deux joueurs saccordent sur (C, C ) durant les T p eriodes, chacun deux obtient (1 T )/(1 ). En fait, (N, N ) est le seul equilibre parfait de Selten quand T est ni. En eet, ` a la p eriode T les deux joueurs doivent r ealiser que la menace de revenir a ` la solution (N, N ) na plus de sens puisque le jeu sarr ete. En cons equence, les deux joueurs vont etre tent es de jouer N , pour les m emes raisons que celles rencontr ees dans le cas du jeu statique. On se retrouve donc a ` la p eriode T 1. Anticipant ce qui va se passer a la p ` eriode T , les deux joueurs se retrouvent dans une situation similaire a ` celle que lon vient d evoquer. En poursuivant cette d emarche, on constate que les deux joueurs vont nalement choisir de jouer N ` a chacune des etapes du jeu. Dans le cas pr esent, le caract` ere dynamique du jeu ne change rien a ` la solution propos ee parce que la notion de menace (punition) na pas de r ealit e tangible. Exp erimentalement, on constate cependant que les joueurs coop` erent souvent pour un nombre de p eriodes l eg` erement inf erieur a ` T . Ce nest que lorsque la p eriode T nest plus tr` es eloign ee que les joueurs d evient et cessent de coop erer. La th eorie a donc ici un pouvoir
57

pr edictif faible. On peut y rem edier en introduisant du bruit dans les gains des joueurs. Cela se fait dans le cadre des jeux en information incompl` ete que lon ne peut aborder ici. En revanche, si T il existe dautres possibilit es. Par exemple: on commence par coop erer a ` la p eriode initiale et on continue a ` le faire si lautre joueur na pas d evi e au cours dune des p eriodes pr ec edentes. Si un joueur choisit de jouer N ` a la p eriode t, alors les deux joueurs jouent N pour la suite du jeu. On appelle une telle strat egie une strat egie de la g achette (trigger strategy). Plus pr ecis ement, on a: (i) Si aucun joueur ne d evie, les gains respectifs sont egaux et donn es par
t=1

t1 1 = 1/(1 ).

(ii) Si un joueur d evie ` a la p eriode t + 1, il obtient : 1 + + + t1 + 2 t + 0 + =


1 t+1 1

+ t =

1 t (2 1) . 1

Si on compare les deux expressions, on constate quil nest jamais d esirable pour un joueur de d evier si et seulement si 1/2. Autrement dit, (C, C ) est un equilibre parfait de Selten si 1/2, cest-` a-dire si la pr ef erence pour le pr esent nest pas tr` es grande. Le r esultat coop eratif est donc susceptible d etre soutenu comme un equilibre non coop eratif du jeu r ep et e. Cela est possible parce que la r ep etition du jeu permet aux joueurs de s electionner leur action courante sur la base de linformation rassembl ee au cours des p eriodes pr ec edentes et, si n ecessaire, de mettre en place un m ecanisme de punition. Toutefois, la solution (N, N ) est egalement un equilibre parfait du jeu. D` es lors, on peut conclure que la r ep etition du jeu permet, mais nimpose pas, la coop eration.

Plus g en eralement, on peut d emontrer que tout prol de gains dont les valeurs sont sup erieures aux gains minimax du jeu constitutif - qui sont ici donn es par 0 peut etre soutenu comme un equilibre de Nash du jeu r ep et e si le facteur descompte

58

U2 (2 , 1) (1, 1)

(0, 0)

(2 , 1)

U1

est susamment proche de lunit e. Ce sont donc des solutions coop eratives, situ ees sur la fronti` ere sup erieure de la zone hachur ee, mais aussi des solutions imparfaitement coop eratives qui sont susceptibles d etre des equilibres du dilemme du prisonnier. Un jeu r ep et e poss` ede donc de nombreux equilibres di erents de la (des) solution(s) coop erative(s). Ce r esultat est c el` ebre en th eorie des jeux et porte le nom de folk theorem parce que ce r esultat a et e d ecouvert plus ou moins simultan ement par plusieurs auteurs. On peut l enoncer de la mani` ere suivante : equilibre de Nash du jeu statique dont les gains sont u . Th eor` eme 7 Soit a un Alors, pour toute combinaison de gain u telle que ui > u i , i = 1 n, il existe equilibre parfait de Selten dont < 1 tel que pour tout > , on puisse trouver un les gains correspondants sont donn es par u . D emonstration: Supposons que lon puisse trouver un prol dactions a dont les gains corresponeriode 1, le joueur i joue ai (i = 1...n). A la dants soient donn es par u . A la p p eriode t > 1, le joueur i choisit laction ai (i = 1...n) si tel fut le cas pour tous les joueurs a ` chacune des p eriodes pr ec edentes. Si au moins un joueur k ne choisit pas e dans le prol a ` a la p eriode t 1, alors les joueurs laction ak qui lui est attribu
59

jouent a durant toutes les p eriodes suivantes. Il sagit bien dun equilibre parfait pour susamment grand car u ui i < max{ui (a); ai Ai } + 1 1 ou (1 ) max ui (a) + u i < ui pour le sous-jeu commen cant a ` la p eriode t et parce que la combinaison de strat egies propos ee est parfaite pour lensemble de tous les sous-jeux possibles. QED Consid erons une fois encore le duopole de Cournot que lon suppose r ep et e une innit e de fois. La solution de collusion retenue est donn ee par
c c = q2 = 1/4 et pc = 1/2 u1 = u2 = 1/8 q1

tandis que la solution du jeu statique est


= q2 = 1/3 et p = 1/3 u q1 1 = u2 = 1/9.

A la p eriode t > 1, la d eviation optimale pour lentreprise 1 lui assure un prot e de cette entreprise lorsquelle courant egal a ` ud 1 = 9/64 de sorte que le prot escompt d evie est donn e par ud 1 +
=t+1

t1 u 1

qui est inf erieur a ` u1 /(1 ) si et seulement si


d (ud 1 u1 ) (u1 u1 ) < 0 o` u la derni` ere in egalit e est satisfaite pour susamment grand puisque (ud 1 u1 ) >

equilibre parfait (ud 1 u1 ). La solution collusive du duopole de Cournot est donc un

60

du jeu r ep et e. Ce r esultat est obtenu sans que les rmes ne cherchent a ` maximiser leurs prots joints comme elles le feraient dans le cas dun accord de cartel. Dans le cas dun nombre ni de p eriodes, on a vue que le principe dinduction vers lamont montre que la r ep etition de l equilibre de Nash du jeu constitutif est le seul equilibre parfait lorsque le jeu constitutif admet un seul equilibre de Nash. Ce nest plus n ecessairement vrai lorsque le jeu constitutif poss` ede plusieurs equilibres. A titre dillustration, consid erons lexemple suivant d u` a Friedman. 2 1 1 2 3 4 1 5,4 8,8 4,0 0,10 2 0,6 2,2 8,6 3 0,2 5,5 3,4 4 8,0 4,3 17,5 3,17 3,10 15,15

Le jeu statique poss` ede deux equilibres en strat egies pures, ` a savoir (2 , 1 ) et (3 , 3 ) qui assurent des gains (8, 8) et (5, 5), respectivement. Toutefois, (1 , 4 ) domine strictement des equilibres du jeu statique. Montrons comment cette solution peut etre soutenue comme un equilibre parfait du jeu r ep et e un nombre ni de fois. Supposons que ce jeu soit jou e pendant T > 1 p eriodes et consid erons la strat egie suivante pour le joueur 1(2): ` la p eriode 0; (a) choisir 1 (4 ) a eriode t = 1...T 1 si 1 (4 ) a et e eectivement choisi (b) choisir 1 (4 ) durant les p ` partir de + 1 si un durant chacune des p eriodes pr ec edentes, et choisir 3 (3 ) a joueur d evie ` a la p eriode ; ` la p eriode T si (1 , 4 ) a et e choisi devant les p eriodes t = (c) choisir 2 (1 ) a ` la p eriode T sinon. 1 T 1, et choisir 3 (3 ) a
61

Cette paire de strat egies est bien un equilibre parfait si est susamment elev e. Sa raison d etre est que le jeu constitutif poss` ede deux equilibres pour le jeu constief er e` a (3 , 3 ) par les deux joueurs. La menace tutif et que l equilibre (2 , 1 ) est pr consiste donc ` a retourner a ` l equilibre le moins favorable si lun des deux joueurs d evie. Cette menace reste cr edible jusqu` a la derni` ere p eriode. A la p eriode T , il ny a plus de possibilit e dexercer une menace. L equilibre propos e est alors tel que les deux joueurs choisissent l equilibre statique le plus favorable sils ont coop er es pendant toutes les p eriodes pr ec edentes.

62