Vous êtes sur la page 1sur 41

Monsieur Jean-Pierre Dupuy

Convention et Common knowledge


In: Revue conomique. Volume 40, n2, 1989. pp. 361-400.

Abstract Convention and common knowledge Rationality cannot feed on itself only (Aumann). Unless it feeds also on collective entities, such as conventions, that are not amenable to individual rationality, it fails to determine social reality. The concept of Common knowledge is examined in this Hght, as well as its ambition to render the collectivity totally transparent to its individual members. It is shown that this ambition is hindered by logical impossibilities. Perfect information is not the limit of imperfect information when imperfection becomes infinitely small. Perfect information is a self-refuting ideal. Lewis's and Keynes's concepts of convention are compared. Rsum Convention et Common knowledge Le paradigme de la rationalit est radicalement incomplet. Sans le secours d'objets collectifs irrductibles la rationalit individuelle, comme les conventions, les interactions entre acteurs individuels rationels seraient en gnral incapables de produire elles seules une ralit dtermine. On examine dans cette perspective le concept de Common Knowledge et la vise qu'if manifeste de transparence parfaite du collectif par rapport aux individus. On montre que cette ambition se heurte des impossibilits de type logique. Il apparat que l'information parfaite n'est pas la limite d'une information imparfaite lorsque l'imperfection tend vers zro ; et que l'information parfaite est un idal autorfutant. On compare les notions de convention proposes par O.K. Lewis et par J.M. Keynes

Citer ce document / Cite this document : Dupuy Jean-Pierre. Convention et Common knowledge. In: Revue conomique. Volume 40, n2, 1989. pp. 361-400. http://www.persee.fr/web/revues/home/prescript/article/reco_0035-2764_1989_num_40_2_409143

Convention et Common knowledge Jean-Pierre Dupuy

d'objets Le paradigme collectifsde irrductibles la rationalit la est rationalit radicalement individuelle, incomplet. comme Sansles le convent secours ions, les interactions entre acteurs individuels rationels seraient en gnral incapables de produire elles seules une ralit dtermine. On examine dans cette perspective le concept de Common Knowledge et la vise qu'il manifeste de transparence parfaite du collectif par rapport aux individus. On montre que cette ambition se heurte des impossibilits de type logique. Il apparat que l'information parfaite n'est pas la limite d'une information imparf aite lorsque l'imperfection tend vers zro ; et que l'information parfaite est un idal autorfutant. On compare les notions de convention proposes par D.K. Lewis et par J. M. Keyns

HOMO CONOMICUS VERSUS HOMO SOCIOLOGICUS Rationalit conomique et dterminisme sociologique On se souvient de la boutade de J. Duesenberry : L'conomie n'est pas autre chose que l'tude de la faon dont les gens font des choix ; la sociologie n'est rien d'autre que l'tude de la faon dont ils s'arrangent pour ne pas avoir de choix faire. C'est une vision peine caricaturale. Ainsi, dans son dernier livre, J. Elster [1988] peut-il crire : Une des lignes de clivage les plus tenaces l'intrieur du domaine des sciences sociales est celle qui oppose deux formes de pense que l'on associe respectivement aux noms de Adam Smith et de Emile Durkheim : c'est l'opposi tion entre Homo conomicus et Homo sociologicus . Celui-l est cens tre guid par une rationalit instrumentale, tandis que le comportement de celui-ci est dict par des normes sociales. Le premier est tir par la perspective d'avantages venir alors que le second est pouss de derrire par des forces quasi inertielles (...) Il est facile de caricaturer le premier comme un atome asocial et autosuffisant et le dernier comme le jouet stupide des forces sociales. Cette opposition se repre selon deux dimensions. L'une, horizont ale, est celle du temps ; l'autre, verticale, celle qui relie l'individu la socit. Commenons par la dimension temporelle. Homo sociologicus est pouss de l'arrire : il se comporte comme il le fait parce qu'il a acquis et intrioris, selon un processus nomm socialisation, des normes, valeurs, coutumes et habitudes : celles-ci, automatiquement, mcaniqueRevue conomique - N" 2. mars 1989. p. 361-400 361

Revue conomique ment, le dterminent agir, ft-ce au dtriment de son intrt bien compris. Par contraste, Homo conomicus est dgag de tout ce qui fait la vie en socit : influences, imitations, subordinations, dterminations sociales ; c'est ce qu'on nomme son autonomie, ou encore sa souverai net . Il se dtermine rationnellement, agenant les moyens rares dont il dispose de faon maximiser ses fins. Ce sont les consquences de ses actions telles qu'il peut les apprhender qui guident son choix, alors qu'on peut dfinir les normes sociales, comme le fait J. Elster, par ceci qu'elles sont des principes d'action non guids par les rsultats {not outcome-oriented) . Le sociologisme est donc un dterminisme, et l'conomisme un finalisme. La chose est remarquable si l'on se souvient que la stratgie de la science moderne consiste remplacer, partout o elle le peut, les traces de finalits qui subsistent dans ses explications par des dterminat ions causales. En science, la flche du temps va du pass vers l'avenir. L'conomie est donc contre-courant. On peut distinguer deux faons de rduire l'opposition entre les deux paradigmes. La plus rpandue chez les conomistes est la stratgie rductionniste. Les normes, rgles et conventions sociales ne seraient que des outils d'optimisation. Elles n'existeraient que parce qu'elles contribuent en dernire instance maximiser l'utilit individuelle, le bien-tre social ou mme le potentiel gntique de l'espce. La nouv elle conomie institutionnelle (Arrow [1974] ; Williamson [1975] ; Ullman-Margalit [1978] ; Schotter [1981]) a indniablement obtenu des rsultats intressants mais on peut argumenter que son programme de rduction fort ne peut tre men son terme (Elster [1988]). Une autre stratgie est l'clectisme : on admet que certaines formes de comportement relvent plutt d'un paradigme, tandis que d'autres sont mieux expliques par le paradigme concurrent. J. Elster dfend cette position dans son dernier ouvrage. Elle n'est pas sans rapport avec la thse que l'conomie, comme discipline et comme domaine, se serait progressivement mancipe du reste des affaires humaines en spcialisant un type de comportement et un type de moralit (Dumont [1977] ; pour une critique de cette thse, cf. J.-P. Dupuy [1988]). On ne cherchera pas ici discuter ces deux stratgies. On se concentrera uniquement sur le point suivant : le paradigme de la rational it est radicalement incomplet. Si elles ne prenaient appui sur des rfrences extrieures qui les guident en les poussant , les interactions entre acteurs rationnels seraient en gnral incapables de produire elles seules quoi que ce soit de dtermin. Il ne s'agit donc pas tant de rduire un paradigme l'autre ou de dlimiter leurs domaines de pertinence que de saisir comment ils peuvent s'articuler l'un sur l'autre.

362

Jean-Pierre Dupuy March et institution La seconde dimension de l'opposition entre les deux paradigmes est la dimension verticale, de l'individu la socit. Il est une notion de la sociologie durkheimienne que l'conomie rejette absolument, c'est celle de transcendance du social. Il n'y a rien au-dessus des acteurs individuels, rien qui, du dehors, vienne dicter leurs comportements et leurs reprsentations. Le collectif est transparent pour les individus : ils s'y reconnaissent, ils l'ont voulu, ils se sont mis d'accord son sujet. Le seul lien qui unisse les hommes est l'change libre, dont la forme normale est le contrat. De l, comme l'crit O. Favereau [1988], le postulat de base de l'conomie thorique noclassique lorsqu'elle tend son pro gramme l'analyse des institutions : Tout ce qui est institutionnel peut se rduire du contractuel. Cette ambition n'est pas nouvelle et E. Durkheim, dj, avait eu la connatre et la combattre dans l'uvre de H. Spencer. Pour celui-ci, la monte des socits industrielles impliquait que la relation contract uelle devenait universelle . Non pas le contrat social la Rousseau, contrat implicite ou formel sur lequel reposerait la socit : cette fiction est incompatible avec le principe de la division du travail que Spencer, comme Durkheim, voyait au cur des socits industrielles ce dernier la caractrisant comme coopration qui se produit automatiquement, par cela seul que chacun poursuit ses intrts propres ([1911], p. 176). Non, poursuit E. Durkheim commentant Spencer dans De la division du travail social , par relation de contrat celui-ci entend... ...Le vaste systme de contrats particuliers qui lient entre eux les individus. Ceux-ci ne dpendraient du groupe que dans la mesure o ils dpendraient les uns des autres, et ils ne dpendraient les uns des autres que dans la mesure marque par les conventions prives et librement conclues. La solidarit sociale ne serait donc autre chose que l'accord spontan des intrts individuels, accord dont les contrats sont l'expression naturelle. Le type des relations sociales serait la relation conomique, dbarrasse de toute rglementation et telle qu'elle rsulte de l'initiative entirement libre des parties (p. 180). On sait ce que E. Durkheim objectait Spencer : certes, les relations contractuelles se multiplient, mais les relations non contractuell es se dveloppent paralllement. En effet le contrat ne se suffit pas soi-mme (p. 193), car tout n'est pas contractuel dans le contrat (...) : partout o le contrat existe, il est soumis une rglementation qui est l'uvre de la socit et non celle des particuliers... (p. 189). Le contrat n'est possible que grce un droit des contrats d'origine sociale, qui est la norme fondamentale de toute convention particulir e. Cette norme s'impose nous, quoiqu'elle ne soit pas notre uvre, mais celle de la socit et de la tradition (p. 192). E. Durkheim montre plus gnralement dans le mme ouvrage que l'autonomisation croissante de l'individu dans les socits modernes solidarit organique se 363

Revue conomique traduit non par une diminution, mais bien par un renforcement du poids de la socit. Et cependant, la thorie conomique contemporaine fait tout son possible pour liminer ce tiers indsirable : la mdiation par le collectif. Il y a l quelque chose d'tonnant. Au cur mme du modle walrasien du march ou thorie conomique de l'quilibre gnral, on trouve en effet cette mdiation par un tiers en surplomb, cette extriorit de l'objet collectif par rapport aux acteurs individuels, cette opacit du social par rapport ses membres qu'il s'agit aujourd'hui d'extirper. On fait ici videmment rfrence la figure du commissaire-priseur. Comme l'crit A. Schotter (1983) : Le problme que pose cette hypothse n'est pas son manque de ralisme car, bien que ces commissaires-priseurs fictifs de toute vidence n'existent pas, on peut dire que les marchs fonctionnent comme s'ils existaient vraiment. De fait, le commissairepriseur walrasien n'est que la personnification symbolique d'une hypothse cruciale pour la cohrence du modle : l'extriorit des prix. Les agents prennent les prix pour des donnes comme s'ils leur taient imposs par un Deus ex machina, crit A. Schotter alors mme que, du point de vue extrieur occup par le thoricien, ce sont eux qui, collectivement, les font merger. Le double statut, exogne et endogne, de ces variables d'interface a pu apparatre, pour les marxistes, comme une contradiction de la thorie. On pourrait aussi parler d' alina tion : les agents ne voient pas ce que le modlisateur voit, ils mconn aissent que l'obstacle sur lequel ils butent, ce sont eux qui l'ont rig. Or, pour L. Walras, cette alination tait libratrice. C'est ce que montre A. Berthoud [1987], en rapprochant les textes des lments d'conomie politique pure des pages de Y conomie sociale sur la socit, la justice et la libert. C'est en raison de la conception particulire qu'il se faisait de la justice et de la libert que L. Walras fut amen penser que seul un mcanisme d'changes automatique, extrieur, impntrable et inaccessible toute intelligence et toute pratique individuelle pouvait tre le garant de ces valeurs. Etre libre, c'est tre quitte de tous les autres (Walras) ; c'est n'attendre de la mesure d'aucun autre l'apprcia tion de son effort ou de sa valeur. L'incommensurabilit des tres est le principe de toute libert et de toute justice distributive. Il faut donc viter que les tres se comparent, se mettent la place des autres : ce jeu spculaire, comme nous dirons plus loin, ne peut dboucher que sur la mfiance et le soupon. De l la ncessit d'un mcanisme gal pour tous en ce qu'il est galement inaccessible tous, dont le propre, crit A. Berthoud, est de rendre impossible toute ide de soupon parce qu'il s'impose tous d'emble en dehors de leur comprhension et de leur entente possible . Il y a donc, ds le dpart, chez L. Walras, cette ide fondamentale qui constitue l'axe directeur de notre contribution : ce sont l'extriorit et l'opacit du collectif qui bloquent le jeu spculaire des identifications mutuelles conflictuelles.

364

Jean-Pierre Dupuy L'conomie thorique contemporaine a pris le chemin oppos. Elle a bien sr repr depuis longtemps cette opacit indsirable, cette extriorit rsiduelle au cur de son systme. Faute de pouvoir la rduire directement, elle s'est rabattue sur la stratgie singulire suivante. La thorie met en scne une certaine mconnaissance des agents. Faisons-les accder la connaissance de la thorie, dotons-les de la connaissance de leur propre mconnaissance. Cette hypothse hroque, baptise innocemment du nom de prvision parfaite , inspire bien des dveloppements actuels : courant des anticipations rationnelles, modles gnrations imbriques, etc. On devrait reconnatre qu'elle est de nature paradoxale. Les agents se dterminent par rapport un avenir connu qu'ils supposent donn, alors que ce sont eux qui le dterminent. Cette circularit est bien sr la mme que celle du modle walrasien initial, mais la dimension temporelle la rend encore plus singulire. Les agents se laissent tirer par un repre dans l'avenir qu'ils ont eux-mmes projet au-dehors d'eux. Ce bootstrapping devrait donner naissance aux paradoxes temporels bien connus sur le libre arbitre. Les conomistes prtendent les tenir en respect par le concept de point fixe baptis quilibre pour la circonstance et surtout par le postulat que ce point fixe est unique. Malheureusement, il semble bien que le prix payer pour cette recherche de transparence du collectif (ou de l'avenir) par rapport aux individus soit une indtermination accrue de ce dernier. Les quilibres se multiplient et l'on ne voit gure ce qui pourrait dcider de la ralisation de l'un plutt que de l'autre. L'autre grand domaine o le paradigme de la rationalit est roi est la thorie des jeux. Les concepts d'quilibre que celle-ci a forgs prsentent en leur sein une opacit du mme ordre que celle qui affecte l'quilibre walrasien. La forme spcifique que prend cette opacit est lie aux modalits particulires de la rationalit en situation de jeu. Etre rationnel, dans ce contexte, cela implique que l'on se mette la place de l'autre et examine le monde de son point de vue. Chacun faisant de mme, il en rsulte un jeu de miroirs potentiellement illimit. C'est prcisment le propre d'un quilibre que de bloquer un niveau fini cette mise en abyme : la rflexivit n'est pas pousse jusqu' son terme ; au-del d'un certain niveau d'anticipation croise du type : je pense que tu penses que je pense... , le jeu spculaire s'arrte et chacun prend pour donnes les variables (paramtres, fonctions) propres ce niveau. Comme dans l'quilibre conomique, quelque arbitraire que paraisse a priori cette troncature, elle sera valide prcisment si l'on est l'quilibre. Les agents considreront qu'ils ont eu raison de tenir pour donns certains aspects de la situation, tant la valeur de certaines variables que leurs niveau et type d'anticipation sans voir ce que voit le modle, savoir que ce sont leurs ractions ces reprsentations qui ont produit leur autovalidation. Tout quilibre est en dfinitive une reprsentation autoralisatrice (Walliser [1985], p. 124). De l un arbi traire et une indtermination difficilement rductibles. La multiplicit 365

Revue conomique des quilibres est ici double : multiplicit type donn et multiplicit des types. Dans ce qui suit, j'appellerai spculante l'acte mental par lequel un esprit humain se met la place d'un autre ; et degr de spculante, dans une situation o cet acte se redouble un nombre donn de fois, le nombre d'embotements successifs du type : je pense que tu penses qu'il pense... moins un. Toute spculante finie marque un certain degr d'opacit, un certain dficit de rflexivit. Une vise de transparence totale se guide sur l'horizon d'une spculante infinie. On dbouche ainsi sur la notion de Common knowledge (CK), dont on reconnat depuis peu qu'elle joue un rle crucial dans les fondements mmes de la thorie des jeux. Intuitivement, une proposition P est CK dans une communaut de sujets connaissants si : 1) elle est vraie ; 2) elle est connue de chacun ; 3) chacun sait que les autres la connaissent ; 4) chacun sait que chacun sait que les autres la connaissent, etc., jusqu' l'infini. La plupart des analyses de la thorie des jeux postulent, le plus souvent de faon implicite, que sont CK : les donnes du problme, la rationalit des joueurs, les stratgies joues l'quilibre (cette dernire hypothse tant particulirement hroque dans le cas frquent d'une multiplicit d'quili bres). C'est ce prix que l'on espre rduire l'opacit et l'extriorit du niveau collectif. Par rapport cet objectif, il apparat que les thoriciens des jeux et ceux des marchs occupent des positions bien contrastes : les premiers recourent une spculante infinie, les seconds une absence de spculante (ou spculante nulle, suivant notre convention) : les agents conomiques se guident sur un mme ensemble de variables d'interface, ce qui vite leurs regards de se croiser, leurs esprits de se compntrer. Mais cette opposition est trop simple. Puisque le repre que constituent ces variables d'interface n'est accessible aux agents que si on les dote de la capacit improbable de se hisser au niveau d'o ils embrassent leurs propres agissements, en surplomb, on sent bien que l'idal de rflexivit absolue est toujours prsent. Entre la spculante infinie et la spculante nulle, dans la mesure o celle-ci s'appuie sur des repres qui cristallisent et rifient l'change illimit des regards, on pressent une singulire proximit. Des travaux rcents sur les fondements de la thorie des jeux font srieusement douter que l'idal de transparence totale et de rflexivit absolue manifest par le CK puisse jamais venir bout de l'extriorit et de l'opacit du collectif. Ce qui est en cause, plus gnralement, est la capacit du paradigme de la rationalit rendre compte lui seul ne serait-ce que d'une portion de la ralit collective et sociale. Lors du dernier sminaire d't de l'IMSSS Stanford, il a pu tre dit qu'il n'y a fondamentalement plus d'accord entre les thoriciens sur ce que signifie la rationalit. Quant la communication de R.J. Aumann [1988], le premier qui a formalis le concept de CK, elle tait consacre ce dfi 366

Jean-Pierre Dupuy majeur auquel doit faire face la thorie aujourd'hui : l'interface entre la rationalit et l'irrationalit et, dans une envole hglienne, se con cluait par ce principe d'incompltude : La rationalit pure ne peut se suffire elle-mme ; elle ne peut prendre sens que dans un domaine plus vaste, o l'irrationalit a sa place. C'est aussi la thse que nous dfendrons ici au moyen d'illustrations tires de quelques travaux rcents sur le CK ceci prs que nous ne retiendrons pas le mot d' irrationalit pour dsigner ce qui simplement chappe au paradigme de la rationalit. Auparavant, cependant, nous rappellerons ce qui rapproche la notion de CK de la question des conventions.

LE COMMON KNOWLEDGE CK et conventions 1. C'est David K. Lewis qui, le premier, a baptis la notion de CK dans son livre Convention [1969]. Il y traite le problme suivant. Spontanment, nous avons envie de dire que le langage que nous utilisons (la langue franaise dans notre cas) est conventionnel ] . Nous pourrions dire les choses autrement que nous le faisons, le rapport entre signifiants et signifis est arbitraire . Cette intuition se heurte cependant une vidence : le langage ne peut rsulter d'un accord explicite, d'un contrat social , puisque ceux-ci prsupposent le langa ge. Pour sauver l'intuition, il faut donc donner corps et cohrence l'ide d'un accord implicite, d'une convention tacite. D.K. Lewis a, au fond, la mme ambition que les conomistes : il s'agit de rduire l'opacit et l'extriorit de l'objet collectif, ici le langage. Sa dmarche est l'oppos du courant structuraliste, lequel donnait au langage le statut d'une sorte d'inconscient collectif, d'une structure symbolique autonome en sur plomb, matrisant les hommes alors que ceux-ci croient la matriser. Si l'on peut, malgr l'vidence du contraire, donner sens l'ide que c'est par convention qu'un peuple utilise la langue qui est la sienne, on aura russi rendre relativement transparent le premier des objets collectifs ou sociaux. L'outil de base utilis par Lewis est la notion de jeu de coordination labore par Thomas C. Schelling dans son livre The strategy of conflict [I960]. Cette classe de jeux est fort diffrente, en mthode et en contenu, de la catgorie des jeux de pur conflit, et elle n'a gure suscit l'intrt 1. Plus prcisment, on a envie de le dire... en anglais. Conventional a en effet une double signification : a) conventionnel, qui rsulte d'une convention ; b) courant, normal, ordinaire, classique, qui rsulte des usages ou de la tradition. (Traduire : conventional weapons par armements conventionnels est un barbarisme.) 367

Revue conomique des mathmaticiens, rebuts par sa trop grande simplicit. Mais cette simplicit formelle cache une relle complexit cognitive. Voici deux exemples de jeux de coordination, l'un pur, l'autre imparfait (ce dernier est connu dans la littrature sous le nom de guerre des sexes ) : Joueur 2 10 A Joueur 1 B 0 (I) 10 0 30 (II) 10 0 0 10 Joueur 1 20 0 0 20 Joueur 2 30 b 0

b 0

On a affaire des situations de coordination : les intrts des joueurs concident ( peu prs) exactement. Leur problme est de coordonner leurs actions. C'est un vritable problme car, dans le jeu (I) comme dans le jeu (II), il y a deux quilibres de coordination : Aa et Bb. Par dfinition, un quilibre de coordination est un quilibre de Nash (chaque joueur maximise son utilit comportement de l'autre fix) qui a la proprit que chaque joueur, comportement fix, a intrt ce que l'autre ne joue pas autrement qu'il le fait. L'indtermination qui rsulte de cette multiplicit peut prcipiter les joueurs dans les cases dsastreuses AbouBa s'ils chouent harmoniser leurs choix. Le problme est encore plus dlicat en (II) car les deux quilibres favorisent diffremment un joueur par rapport l'autre. Mme dans ce cas, on perd moins accepter l'quilibre qui vous pnalise relativement qu' risquer l'absence de coordination en essayant d'avoir mieux. T.C. Schelling a bien vu que l'intrt de ces jeux ne rside pas dans ce qu'on peut en dire d'un point de vue formel, mais dans les phnomnes cognitifs qu'en pratique ils engendrent. Exemple : un mari perd sa femme dans un grand magasin. Vont-ils se retrouver ? Chacun pense un endroit vident de rencontre mais, videmment, il y en a en gnral plusieurs. Le problme n'est pas simplement de prvoir ce que l'autre va faire, ce n'est pas un problme de prvision objective. Car ce que l'autre va faire dpend de la faon dont elle-mme prvoit que le premier agira, tout en sachant que celui-ci se met sa place, etc. D'emble, s'installe une spculante sans limite, annonciatrice de C.K. T.C. Schelling, dans son ouvrage, montrait qu'en dpit de l'indterminat ion thorique ces problmes sont trs gnralement solubles en pratique 368

Jean-Pierre Dupuy grce aux performances cognitives des agents, chacun russissant se coordonner avec les autres parce qu'il sait que les autres cherchent se coordonner avec lui. La spculante est donc ici stabilisante. L'imagination est plus utile alors que la logique. Chacun cherche les indices auxquels l'autre peut penser que le premier va penser. Il les trouve dans certains traits saillants, remarquables en eux-mmes ou pour leur caractre unique, que l'espace ou l'histoire commune leur prsentent. La posie et l'humour, les symboles et la fantaisie ont plus de poids ici que les mathmatiques. D.K. Lewis a repris l'ide et s'en est servi pour dfinir son concept de convention (tacite). Une convention est la solution d'un problme de coordination qui, ayant russi concentrer sur elle l'imagination des agents, tend se reproduire avec rgularit. La nature de la convention, et le fait qu'une autre convention et pu aussi bien, ou presque aussi bien, faire l'affaire sont supposs tre CK. Plus prcisment, une convention est, par dfinition, une rgularit R de comportement (ou de comportement et de croyance) qui, dans une population P, satisfait les six conditions suivantes ] : 1. Chacun se conforme R. 2. Chacun croit que les autres se conforment R. 3. Cette croyance que les autres se conforment R donne chacun une bonne et dcisive raison de se conformer lui-mme R. 4. Tous prfrent une conformit gnrale R plutt qu'une conformit lgrement moindre que gnrale et en particulier, plutt qu'une conformit de tous sauf un (cette condition assure que l'on est en un quilibre de coordination. Elle est locale et donc n'implique pas qu'une non-conformit gnrale n'et pas t prfrable). 5. R n'est pas la seule rgularit possible satisfaire les deux dernires conditions, une autre au moins, R', les et galement respec tes (cette condition assure qu'il y a un certain arbitraire se conformer R). 6. Les tats de fait qui apparaissent dans les conditions (1) (5) sont CK. Pour fixer les ides, on peut penser la convention qui, pour les conducteurs d'un pays donn, consiste rouler droite ; ou, lorsqu'une communication tlphonique se trouve interrompue, la convention que celui qui rappelle est celui qui a appel en premier. Le rle de la condition (6), celle o s'introduit le CK, est, comme chez T.C. Schelling, un rle de stabilisation (Lewis [1983], p. 166). La simulation par chacun du raisonnement que les autres font pour se 1. Je suis ici la formulation amende que D.K. Lewis a donne dans un article ultrieur ([1983], p. 165-166). 369

Revue conomique convaincre qu'ils doivent se conformer la convention tend le renforcer dans sa propre conviction, au lieu de semer le doute dans son esprit. Cette thorie pousse donc la vise de transparence sociale au point o le savoir de l'arbitraire de l'objet collectif, loin de le dstabiliser, le stabilise. Il serait cependant exagr de dire que la transparence sociale y est complte. Il ne faut pas oublier en effet que le cadre thorique reste celui d'une absence totale de communication 1. Comme dans la thorie cono mique du march, les agents ne se parlent pas, ils ignorent l'engagement et la promesse. Dans sa tension dsespre (Schelling [1960], p. 99) vers l'infini, le CK voudrait tre ce qui totalise et unifie un ensemble de consciences radicalement spares. Cette tension entre la sparation et la communion donne la thorie de D.K. Lewis une position singulire ; de fait, elle s'est fait critiquer de deux cts la fois : d'une part, ceux qui pensent que la stabilit des conventions implique la mconnaissance de leur arbitraire (par exemple, Brge [1975]) ; d'autre part, ceux qui ne conoivent pas la convention sans que quelque chose qui relve de l'engagement, de la promesse, du contrat, explicites et publics, n'entre en jeu (par exemple, Cooper [1977]). Nous allons maintenant examiner une conception cono mique de la convention, qui fait jouer la mconnaissance un rle fondamental. Il s'agit de la conception keynsienne telle que Andr Orlan nous l'a donn lire, dans une srie de textes importants (par exemple Orlan [1986]). 2. L'exercice d'exgse keynsienne auquel s'est livr Orlan consiste rapprocher et rendre cohrentes entre elles deux dfinitions de la convention donnes par l'conomiste britannique. Dans le chapitre XIII de la Thorie gnrale, consacr 1' tat de la prvision long terme [1936, 1971], J.M. Keynes prsente la convention comme une mthode qui rgle l'activit prvisionnelle : Dans la pratique, nous sommes tacitement convenus, en rgle gnrale, d'avoir recours une mthode qui repose vrai dire sur une pure convention. Cette convention consiste essentiellement (...) dans l'h ypothse que l'tat actuel des affaires continuera indfiniment moins qu'on ait des raisons dfinies d'attendre un changement. (p. 164.) J.M. Keynes reprendra plus loin cette mme dfinition propos de la dtermination du taux d'intrt, cruciale pour son systme : Peut-tre serait-il plus exact de dire que le taux d'intrt est au plus haut degr un phnomne conventionnel plutt que psychologique, car sa valeur effective dpend dans une large mesure de sa valeur future telle que l'opinion dominante estime qu'on la prvoit. Un taux d'intrt quelconque que l'on accepte avec une foi suffisante en ses chances de durer durera effectivement (p. 212). 1. On dit qu'un jeu est non coopratif lorsque les agents n'y communiquent pas. Expression malheureuse, comme le fait remarquer T.C. Schelling, puisque l'enjeu est ici au contraire la coopration (la coordination) des agents. 370

Jean-Pierre Dupuy Dans un article publi en 1937 dans Quarterly Journal of Econom ics,J.M. Keynes crit par ailleurs : La psychologie d'une socit compose d'individus qui tentent tous de se copier les uns les autres conduit ce que l'on peut trs prcisment appeler un jugement de convention {a conventional judgement). Qu'est-ce qui peut rattacher ces deux dfinitions l'une l'autre ? A. Orlan suggre que la cl rside dans le jeu clbre que Keynes prsente au chapitre XIII titre mtaphorique. Il s'agit d'illustrer la logique de la spculation financire. De cette logique, J.M. Keynes nous dit que, pour jouer gagnant, il faut deviner mieux que la foule ce que la foule va faire . C'est prcisment ce que son jeu incite faire. On demande une collectivit de joueurs de classer par ordre de prfrence un ensemble donn d'objets (photographies de jolies filles, romans, nombres, titres, etc.). Le gagnant n'est pas celui dont les prfrences s'approchent le plus d'un canon fix a priori, de faon exogne, mais celui dont les prfrences sont les plus proches des prfrences moyennes exprimes par l'ensemble des concurrents. Il s'agit donc pour chacun de choisir en se calant sur une rfrence dont la nature ou la valeur dpend prcisment des choix de tous. Cette circularit est la mme que celle que l'on trouve au cur de l'hypothse de prvision parfaite. Le mrite de ce jeu est de mettre en lumire que cette hypothse peut dboucher sur une radicale indcidabilit. C'est bien le cas ici, car le problme, comme le voit Keynes, n'est pas pour chacun de deviner les prfrences des autres, puisque chacun sait que les autres savent que ce n'est pas cela le problme. Il en rsulte une spculante potentiellement illimite qui ne dtermine rien, parce que coupe de toute rfrence objective. Il est remarquable que, dans The strategy of conflict, T.C. Schelling se rfre cette mtaphore de Keynes, y reconnaisse le type mme de ce qu'il appelle problme de coordination, mais ajoute que la solution propose par Keynes n'est pas du tout celle qu'il propose ([I960], p. 94). Cette observation reste assez nigmatique ; on peut tenter de l'interpr ter ainsi. Pour T.C. Schelling, ce type de jeu est dcidable, sinon formellement, du moins en pratique. Ds que les joueurs partagent un minimum de connaissances et de sensibilit communes, ds que, en d'autres termes, ils ont un mme monde en commun, ils ont une chance de se coordonner autour d'un mme repre dont la saillance, l'originalit, la singularit, l'unicit ou bien le prcdent rendent vidente aux yeux de tous son vidence aux yeux de tous. Si, par ailleurs, chez Schelling comme chez Lewis, la spculante illimite est synonyme d'ordre et de stabilit, c'est qu'ils se placent d'emble en un tat de coordination russie ils se placent d'emble l'quilibre, dirait un conomiste. Or, dans le passage de la Thorie gnrale o il dmonte la logique du jeu en question, J.M. Keynes met en scne une situation tout fait diffrente, hors quilibre : sans repres communs pour coordonner leurs actions, les joueurs se perdent dans les miroirs que leur tendent les autres : la 371

Revue conomique spculante tourne ici vide, elle n'embraye sur rien. La spculante illimite prend donc un sens tout fait diffrent selon qu'elle s'appuie sur un ordre, un sens commun dj constitu ou bien qu'elle manifeste l'absence d'un tel ordre. Dans le premier cas, elle participe du caractre autorenforant de l'ordre institu, dans le second, elle traduit le dsarroi de la crise. L'opposition ne saurait tre plus tranche. Or la lecture que A. Orlan nous donne du texte de Keynes et le prolongement qu'il en propose nous permettent d'tablir un pont entre ces deux positions. Soit une situation de crise non pas au sens strictement conomique de ce terme, mais dans le sens plus gnral d'une perte du sens commun. J.M. Keynes, de fait, n'en reste pas la leon que son jeu suggre, savoir que la spculante de crise ne dbouche sur rien. Il montre au contraire qu'elle est finalement institutrice d'un nouvel ordre conventionnel. Mais elle n'acquiert cette productivit qu'en pre nant une forme spcifique : V imitation. Dans une situation d'incertitude radicale, non probabilisable, comme celle qui prvaut sur les marchs financiers lorsque prcisment ils n'offrent plus aux agents de rfrence commune, la seule conduite rationnelle, selon Keynes, est d'imiter les autres. Une premire raison, d'ordre gnral, est que si je ne sais rien au sujet de la situation dans laquelle je me trouve (en situation de panique, par exemple), je peux me dire qu'il y a une chance que les autres sachent : les imiter, je tirerai parti de leur savoir. Juste avant de dfinir le jugement de convention partir de l'imitation gnralise, J.M. Keynes crit, dans l'article de 1937 dj cit : Sachant que notre propre jugement est sans valeur, nous nous efforons de nous rabattre sur le jugement du reste du monde, qui est peut-tre mieux inform. En d'autres termes, nous tentons de nous conformer au comportement majoritaire ou moyen. On voit ici ce qui diffrencie la version imitative de la version pure de notre jeu spculaire (ou, en l'occurrence, spculat if) : dans cette dernire, chacun sait que chacun sait que chacun sait, etc., que tous sont dans la mme situation, c'est--dire dpourvus de repres communs ; dans la premire, il se peut que tous soient dans la mme situation, dpourvus de repres communs, mais il n'est pas vrai que chacun le sait, encore moins que chacun sait que chacun le sait, etc. C'est ce doute, cette opacit, ft-elle minime, qui, incitant imiter, va permettre la spculation de produire du rel. J.M. Keynes donne une seconde raison au comportement imitatif qui, celle-ci, vaut pour l'expert, celui qui est cens savoir. Il sait, lui, ce que tel titre vaut, objectivement, en fonction des dividendes probables qu'il doit rapporter. Or il s'aperoit que le prix du march qui n'est, crit Keynes, que le rsultat de la psychologie d'une foule faite d'un grand nombre d'individus ignorants est, disons, srieusement sousvalu. Pourra-t-il ignorer l'avis des ignorants ? Non, rpond Keynes, car si notre expert est contraint de liquider son portefeuille, c'est bien au prix du march que, volens nolens, il devra le faire : II serait draison nable d'acheter 25 un titre dont on estime la valeur 30 en raison de son 372

Jean-Pierre Dupuy rapport probable si l'on pense que le march l'valuera 20 dans trois mois. L'expert et les ignorants sont logs la mme enseigne. Comme l'crit A. Orlan ([1986], p. 11), on ne peut avoir raison contre la foule . Soit donc une foule o tous tentent de se copier les uns les autres . En quoi une telle structure est-elle capable de produire quoi que ce soit, comment peut-elle engendrer un jugement de convent ion ? Il y a trs peu d'indications ce sujet chez Keynes, mais A. Orlan a rcemment propos plusieurs modles formels qui fournissent des rponses prcises ces questions (Orlan [1988]). Intuitivement, le schma de base est le suivant. Soient deux sujets A et B qui s'imitent rciproquement. L'objet de leur imitation mutuelle est par hypothse indtermin. Mais supposons qu'un bruit, qu'une rumeur, fasse penser A que B dsire (recherche, veut acheter, se fie , espre, etc.) l'objet O. A sait dsormais ce qu'il lui faut dsirer (respectivement : rechercher, etc.) : il prend les devants, dsigne par l mme B l'objet O et lorsque B manifeste son tour son intrt pour O, A a la preuve que son hypothse de dpart tait correcte. Sa reprsentation, si implausible ft-elle a priori, s'est trouve autoralise. Cette mergence d'une objectivit, d'une extriorit par la clture sur soi d'un systme d'acteurs qui tous s'imitent, acquiert une vigueur accrue mesure qu'augmente le nombre de ceux-ci. Les rumeurs les plus absurdes peuvent polariser une foule unanime sur l'objet le plus inattendu, chacun trouvant la preuve de sa valeur dans le regard ou l'action de tous les autres. Le processus se droule en deux temps : le premier est celui du jeu spculaire et spculatif dans lequel chacun guette chez les autres les signes d'un savoir convoit et qui finit tt ou tard par prcipiter tout le monde dans la mme direction ; le second est la stabilisation de l'objet qui a merg, par oubli de l'arbitraire inhrent aux conditions de sa gense. L'unanimit qui a prsid sa naissance le projette, pour un temps, au-dehors du systme des acteurs lesquels, regardant tous dans le sens qu'il indique, cessent de croiser leurs regards et de s'pier mutuellement. Ce mcanisme imitatif est, suivant la nature du temps dans lequel on le considre, producteur ou rducteur d'incertitude. Dans le temps formel des mathmatiques, il ouvre vers le nouveau, l'indtermin, puisqu'il est capable de faire merger n'importe quel objet. Dans le temps effectif du processus, il se referme sur l'objet qu'il lit selon une dynamique autorenforante. Cette dualit traduit que le mme mca nisme est l'uvre derrire la crise et la rsolution de la crise. L'objet mergent n'est pas dtermin par dduction partir de la structure formelle du jeu, c'est l'histoire relle des vnements, avec ses contingenc es, qui le fait advenir. En adoptant un concept de la philosophie morale, on pourrait dire que c'est une dtermination par procdure pure1. T.C. Schelling exprimait une ide semblable lorsqu'il montrait que les 1. Cf. le concept de justice procdurale pure chez J. Rawls, Thorie de la justice ([1987], p. 118). 373

Revue conomique jeux de coordination ne trouvent de solution effective que lorsqu'on les plonge dans le monde des faits empiriques ([I960], p. 98) *. Cepend ant,on l'a vu, il se plaait d'emble en un quilibre, suivi en cela par D.K. Lewis. Le modle keynsien tabli par A. Orlan retrouve et prcise cette intuition, mais au niveau de la marche vers l'quilibre. La mme remarque vaut en ce qui concerne le lien entre spculante et phnomnes d'autorenforcement et d'autoralisation : Schelling et Lewis reprent ce lien l'quilibre, le modle keynsien dans la gense de l'quilibre 2. Une diffrence fondamentale spare cependant les deux modles. Chez Schelling-Lewis on est, l'quilibre, dans la transparence de la spculante infinie ou CK. Sans le jeu d'une certaine mconnaissance, le mcanisme de l'imitation gnralise serait, lui, dpourvu de productiv it. Il faut d'abord que les agents, ou du moins la plupart d'entre eux, ne sachent pas si les autres partagent leur ignorance ou non. Il faut surtout qu'ils mconnaissent la vritable nature de la gense de l'ordre mergent et le tiennent pour objectif. C'est prcisment ce qui, pour Keynes, caractrise un ordre conventionnel : une rgularit qui a sa source dans les interactions sociales mais qui se prsente aux acteurs sous une forme objective, rifie, naturalise, devant se reproduitre l'identique. Comme l'crit J.M. Keynes propos du taux d'intrt, son niveau tabli par convention est considr comme ancr en des fondements objectifs beaucoup plus rsistants qu'une convention (p. 212). On voit donc ce qui unit profondment les deux dfinitions d'une convention que l'on trouve dans le texte de Keynes. Cette forme particulire de spcularit illimite que constitue l'imitation gnralise dbouche sur l'objectivation et l'extriorisation d'un ordre collectif conventionnel . O l'on comprend que la spculante tendant vers l'infini ne produit pas la spculante infinie du CK, mais en quelque sorte son contraire : la spculante nulle. On pressent ici un bien intressant exemple de disconti nuit l'infini, que des travaux rcents en thorie des jeux permettent de prciser. La figure du CK est l'horizon de la crise, elle s'vanouit lorsque l'on en sort. La rflexivit illimite, symptme d'une crise du sens commun, cristallise en un objet collectif dont l'opacit bloque le jeu spculaire. Pour le dire comme L. Walras, le dsordre du soupon et de la mfiance dbouche sur un ordre qui rend chacun quitte de tous les autres . Un ordre social rifi apparat toujours comme une seconde nature (Pascal). Se prsentant comme une vidence, il peut tre dit, en un certain sens, et l'instar des faits de la nature et des vrits de la logique, CK. Mais ce CK n'implique aucune activit cognitive de type 1. Conclusion reprise dans les mmes termes par K. Binmore ([1988], p. 48), dans sa rcente tentative de synthse. 2. On note cependant avec intrt que, parmi les exemples cits par T.C. Schelling pour illustrer la coordination tacite, on trouve les phnomnes de foule et la sgrgation urbaine, dans lesquels la contagion (l'imitation) joue un rle essentiel ([I960], p. 90-91). 374

Jean-Pierre Dupuy spculaire comparable celle qui accompagne la recherche collective de points de rfrence communs en situation de crise. Si D.K. Lewis fait jouer un tel rle au CK dans sa dfinition des conventions, c'est en ce sens et c'est parce qu'il traite l'ordre collectif comme toujours dj constitu. Se serait-il pos, comme Keynes, la question de la gense de cet ordre qu'il aurait peut-tre remplac le CK par ce qui en est la fois trs proche et trs lointain : l'absence de spculante que favorisent les objets collectifs, les conventions par exemple, lorsqu'ils incarnent un ordre social suffisamment stable et incontestable.

CK et rflexivit Paralllement son utilisation par D.K. Lewis en philosophie du langage, la notion de CK a fait son apparition dans un champ voisin, la pragmatique, c'est--dire l'analyse du contexte dans la communication verbale. Dans son article pionnier de 1957, Meaning , Paul Grice montrait que ce qui rend la communication possible, c'est la capacit qu'a l'auditeur de reconnatre l'intention du locuteur de l'informer de quelque chose. Dans la reformulation propose rcemment par D. Sperber et D. Wilson [1986], on dfinit la communication comme la production par le locuteur d'un certain stimulus avec la double intention : a) d'informer l'auditeur de quelque chose ; b) d'informer l'auditeur de son intention de l'informer de quelque chose. Le propre de la communication rside dans l'intention (b). Comme les discussions qui ont suivi la publication de l'article de Grice l'ont montr (Strawson, Searle, etc.), une communication peut avoir lieu sans que l'intention (a) soit ralise ds lors que l'intention (b) l'est ; inversement, si (a) est ralis mais que (b) ne l'est pas, on ne peut vraiment dire qu'une communication a eu lieu. La vritable intention communicative est donc l'intention (b), l'intention (a) tant une simple intention informative. L'intention communicative se prsente comme une intention informative de degr deux puisque sa ralisation implique que l'intention informative de degr un soit reconnue par l'auditeur. Cette rflexivit apparat comme inhrente l'acte de communication. Trs tt, les pragmaticiens ont reconnu qu'on ne pouvait en rester ce redoublement et qu'une communication vritablement reflexive impli querait une infinit de niveaux intentionnels embots les uns dans les autres. Soit le contre-exemple suivant (Sperber et Wilson [1986], p. 30). Le sche-cheveux de Marie est cass. Elle souhaite que Pierre le rpare, mais elle ne veut pas le lui demander directement. Elle imagine la mise en scne suivante. Elle dmonte le sche-cheveux et en parpille les pices autour d'elle, comme si elle tait en train de le rparer elle-mme. Mais elle s'arrange pour que Pierre se rende compte prcisment qu'il 375

Revue conomique s'agit d'une mise en scne. Son intention est bien d'informer Pierre qu'elle souhaite son aide, et le moyen qu'elle trouve pour transmettre cette information est de rendre manifeste Pierre qu'elle a cette intention de l'informer. Marie a donc bien une double intention, informat ive et communicative, et cette double intention est, supposons-le, ralise. Selon la dfinition donne plus haut, on devrait donc admettre que Marie a communiqu Pierre sa demande d'aide. On a cepen dant du mal mettre sur le mme plan cette stratgie informative contourne et ce que serait une communication transparente par laquelle Marie demanderait directement Pierre de l'aider. La diffrence rside en ceci : ce qui rend opaque le mange de Marie, c'est que son intention de deuxime niveau, son intention communicative, est ignore de Pierre. Marie n'a aucunement l'intention d'informer Pierre de son intention communicative. Une communication ouverte devrait, au contraire, inclure cette intention de troisime niveau. Mais on voit aisment que c'est encore insuffisant. Quel que soit le niveau n o l'on s'arrte, on pourra toujours construire des contre-exemples, certes de plus en plus sophistiqus, de communication opaque dans lesquels manque l'intention d'informer de l'intention de niveau n. De l la solution de S. Schiffer [1972] qui consiste passer l'infini : l'intention vritablement communicative est l'intention de rendre l'intention informative CK entre locuteur et auditeur. De cette petite fable on peut tirer une autre leon. Un certain type de relation sociale existe entre Marie et Pierre. Disons que c'est une femme moderne et il y a deux choses qu'elle hait par-dessus tout : se voir rejete par Pierre et tre en dette vis--vis de lui. A s'adresser ouverte ment lui, elle court ce double risque. Sa mise en scne lui permet d'y chapper totalement. Si Pierre s'excute, c'est de son propre chef : Marie, qui ne lui a rien demand, ne lui doit rien. Mais Pierre peut trs bien ne rien faire sans que cela passe pour une muflerie : aprs tout, il n'est pas cens avoir interprt le mange de Marie comme une demande d'aide. C'est du moins ce qu'il croit, car il croit que Marie ne sait pas qu'il a compris que son intention tait bien de lui demander son aide. Marie lui a mnag cette porte de sortie : il ne s'agira pas d'un refus pnible, mais d'un simple manque d'attention (Sperber et Wilson [1986], p. 62). Il existe ainsi des relations sociales (elles sont sans doute la majorit) dont la stabilit requiert une certaine dose, ft-elle minime, d'opacit, appr cie en dficit par rapport au CK (pour d'autres exemples, voir Dupuy [1988]). La transparence communicationnelle, ft-elle souhaitable, serait de toute faon impossible. C'est la critique principale que D. Sperber et D. Wilson adressent la notion de CK : elle est psychologiquement invraisemblable. Si, pour apprcier la ralit d'une communication, il fallait vrifier que l'intention informative a t rendue CK, une infinit de tests serait ncessaire, ce qui rendrait la question indcidable. L'esprit humain, machine finie, ne saurait accder l'infini actuel que requiert le 376

Jean-Pierre Dupuy CK. Pratiquement, on n'est jamais certain qu'un vnement est CK : un vnement public pourrait l'tre, mais est-on assur que tous l'ont vu ou interprt de la mme manire ? Or, par dfinition, si un vnement est CK, chacun sait qu'il est CK (il suffit de reprendre chacune des propositions qui dfinissent le CK et de voir que le fait que chacun le sait est affirm par les propositions suivantes). Tout doute, ft-il infiniment petit, au sujet du CK prouve donc l'inexistence du CK. On retrouve ici l'ide fondamentale d'une discontinuit l'infini : le CK n'est pas la limite d'une spculante tendant vers l'infini. Cette ide est sans doute la source des paradoxes que nous examinerons plus loin. Nous n'avons pas la possibilit d'tudier ici la solution propose par D. Sperber et D. Wilson. Disons simplement qu'elle consiste 1) remplacer la notion de CK par une notion affaiblie, celle de mutual manifestness : ce qui est manifeste un sujet, c'est beaucoup plus que ce qu'il sait, c'est aussi ce qu'il peut savoir (cette notion de savoir potentiel se trouve dj chez D.K. Lewis) et plus gnralement ce qu'il peut infrer (tenir pour vrai, mme si c'est tort) ; cette premire tape substitue l'infini actuel du CK un infini potentiel ; 2) localiser cette recursion infinie non plus dans l'esprit des sujets mais dans leur environ nement cognitif , c'est--dire l'ensemble des faits qui leur sont manif estes. Deux sujets qui communiquent sont alors caractriss comme cherchant modifier leur environnement cognitif commun. Ce dernier se prsente comme un objet collectif en surplomb, partiellement rifi, et il joue donc le rle de mdiation entre les sujets communicants. C'est dire que la spculante infinie du CK a t finalement remplace par une absence de spculante, appuye sur un objet collectif de type cognitif. A l'idal de transparence absolue s'est substitu le jeu d'une opacit rgulatrice (Anspach [1986]). L'ide que nous allons dfendre dans ce qui suit est que ce n'est pas seulement pour des raisons matrielles (finitude de l'esprit humain) que l'idal de transparence absolue incarn dans la spculante infinie est inatteignable, mais aussi pour des raisons logiques. La vise de rflexivit parfaite bute sur des principes d'incompltude. A l'horizon de la spcula nte tendant vers l'infini, on trouve non pas une dissolution du collectif dans la conscience rflchissante des agents, mais au contraire la place nette pour que des objets collectifs reprennent un pouvoir de dterminat ion causale. Aperu sur la formalisation du CK C'est le thoricien des jeux R.J. Aumann qui, le premier, a propos une formulation mathmatique de la notion de CK, dans un cadre probabiliste, celui de la thorie conomique de l'information [1976]. Plus tard, des formalismes de type logique sont apparus : il s'agit de la logique pistmique , celle qui porte sur les oprateurs de connaissance . Nous n'en dirons rien ici, sauf l'occasion d'un exemple dans la troisime 377

Revue conomique partie. (Pour une tude des rapports entre ces deux modes de formalisat ion, cf. Walliser [1988].) Il va sans dire que la formalisation n'apporte de la rigueur qu'au prix d'un appauvrissement smantique (et pragmatique) de la notion. Soit Q l'ensemble fini des tats du monde, p une distribution de probabilits a priori suppose commune tous les agents (selon le principe pos par Harsanyi : si deux agents affectent une probabilit subjective diffrente un vnement, ce ne peut tre qu'a posteriori, c'est--dire sur la base d'informations et d'expriences diffrentes). Par dfinition, si un agent pouvait discerner quel est l'tat rel du monde : )Q, son information serait totale. Cependant, chaque agent i n'a qu'un pouvoir de rsolution limit, caractris par une partition 0*. Si P'()) est l'lment de 0" qui contient ), l'agent / sait qu'un lment de P'()) est le vritable tat du monde, mais il ne sait pas lequel. C'est par construction, et non par hypothse, que dans ce modle les partitions 0*{ sont CK. Puisqu'en chaque ), chaque agent sait tout, il sait en particulier quels sont les tats indiscernables de ) pour chacun des autres. Toute incertitude de la part d'un agent y compris son incertitude sur l'incertitude des autres est reprsente par sa partition ^". On suppose que les ^" se chevauchent. Soit le cas de deux agents. Considrons, parmi toutes les partitions de O plus grossires1 que, la fois, SP et SP* , la moins grossire d'entre elles. Soit ^ cette partition et R(o>) l'lment de M qui contient . Par dfinition, on dit qu'un vnement E est CK en 0) si : E 3 R (w) Le lien avec la dfinition intuitive du CK n'est pas immdiatement apparent. On pourra mieux le cerner en recourant au systme d'inter prtation suivant : 1. l'agent 1 sait E s'crit : E id P1 (to) ; 2. l'agent 1 sait que l'agent 2 sait E s'crit : E inclut chacun des lments de &* qui coupent P^w). (En effet, 1 ne sait pas P2()), il sait seulement que w P2 (w), donc que P2 (w) f] P1 (w) 9^ 0) et ainsi de suite. Il est cependant plus clairant, comme l'a fait P. Milgrom [1981], de montrer l'quivalence entre cette dfinition formelle et la dfinition axiomatique suivante. Associons chaque vnement E l'ensemble KE des tats du monde tels que E y soit CK. On demande KE de satisfaire les quatre conditions suivantes : (Cl) (C2) KEcE VwKE, Vi, F (w) c KE 1. On dit qu'une partition est plus grossire qu'une autre si chaque lment de la premire est l'union d'lments de la seconde. 378

Jean-Pierre Dupuy (C 3) (C 4) E c F => KE c KF [ V t , V w E , F () c E] => E = KE

Prises ensemble, les deux premires conditions caractrisent le CK comme un point fixe : un vnement n'est CK que s'il se produit effectivement et si chacun sait qu'il est CK. Cette forme autorfrentielle ou recursive, que l'on retrouve dans la dfinition logique, est videmment ce qui permet d'engendrer de faon finie l'infinit des propositions contenues dans la dfinition intuitive : E n'est CK que si E se produit, chaque agent sait E, chaque agent sait que chaque agent sait E, etc. (C3) affirme que si un vnement est CK, ses consquences logiques le sont. La partie entre crochets dans (C4) dfinit un vnement public : c'est un vnement qui, ds lors qu'il se produit, est connu de chacun. (C4) affirme que tout vnement public est CK ds lors qu'il se produit. (Cela ne veut videmment pas dire que si un vnement est connu de chacun, il est ipso facto CK : la condition V w E est ce qui fait la diffrence.) P. Milgrom dmontre que la seule fonction E | KE qui satisfait ces quatre conditions correspond la dfinition formelle de R.J. Aumann : KE = {w/R(()cE} La dmonstration fournit deux caractrisations du CK. L'ensemble KE ainsi dfini apparat d'une part comme l'ensemble le plus englobant qui soit compatible avec (Cl) et (C2). Cette premire caractrisation est mettre en rapport avec la dfinition intuitive du CK. La seconde donne un sens concret la dfinition formelle. Il apparat que KE est l'ensemble le moins englobant qui soit compatible avec (C3) et (C4). Une condition ncessaire et suffisante pour qu'un vnement soit CK en l'tat ) est donc qu'il soit la consquence logique d'un vnement public se produi sant en (0. Tous les lments de M tant l'vidence des vnements publics, la condition R (w) ci E signifie donc bien que E est CK. Smantiquement, sinon pragmatiquement, le type mme de l'vnement public est renonciation publique d'une certaine proposition, par exemple l'affichage des prix par le commissaire-priseur walrasien. Nous en rencont rerons un autre exemple dans ce qui suit. Dans l'article o il proposait cette formalisation du CK, R.J. Aumann dmontrait le rsultat suivant qui, vrai dire, apparat comme une consquence triviale de la dfinition. Deux agents, ayant la mme distribution de probabilit a priori, aboutissent ncessairement la mme valuation a posteriori de la probabilit d'un vnement donn, ds lors qu'ils se communiquent leurs valuations respectives, les rendant par l mme CK. Ces valuations continuent se fonder sur l'information particulire dont chacun dispose et qui reste inaccessible l'autre, mais leur affichage public entrane les agents dans un processus de rvision mutuelle qui converge finalement vers une mme valeur. Or ce rsultat 379

Revue conomique n'est pas atteint si chaque agent connat simplement l'valuation a posteriori de l'autre. On peroit ici la diffrence de nature entre un savoir partag [V i, P! (w) cz E] et un savoir public (CK) [R (co) cz E]. Seul le savoir public permettrait, en principe, d'atteindre l'idal problmatique d'une communaut dans laquelle, comme l'crit R.J. Aumann, il serait impossible de s'accorder sur ses dsaccords sans que ceux-ci disparaissent.

LES PARADOXES DU COMMON KNOWLEDGE L'information parfaite (complte) n'est pas la limite d'une information imparfaite (incomplte) 1 Dans sa vise de transparence absolue, le paradigme de la rational it a toujours pris pour rfrence le cas o l'information de chaque agent est parfaite et complte. Plus tardivement, on a pris conscience que cette perfection et cette compltude ne devaient pas seulement caractriser l'information de chaque agent sur l'tat du monde, mais aussi son information sur l'information des autres agents et ainsi de suite, jusqu' l'infini. Critiqus sur l'irralisme de cette hypothse, les conomistes rpondaient que c'est l un cas limite, dont l'tude est le pralable la comprhension des situations d'imperfection ; le savoir absolu tant assimil ce que devient un savoir imparfait lorsque l'imperfection tend vers zro. Dj problmatique lorsqu'il s'agit d'une information de niveau zro, cette position, on le sait aujourd'hui, est intenable lorsqu'on considre une information spculaire dont le degr tend vers l'infini. La spculante infinie peut possder des proprits que l'on n'obtiendra jamais avec une spculante finie, si grand que soit son degr. Nous nous attacherons surtout, mais non exclusivement, dans ce qui suit l'information sur la rationalit des joueurs. L'hypothse implicite qui sous-tend la plupart des analyses de la thorie des jeux est que cette rationalit est CK. Or on sait aujourd'hui que bien des rsultats paradoxaux de la thorie sont la consquence de cette hypothse paradoxaux au sens o ils s'cartent radicalement des solutions de bon sens que les expriences en laboratoire ou dans la vie quotidienne font apparatre spontanment. Pour retrouver le raisonnable, il suffirait de s'carter du rationnel absolu d'une quantit infinitsimale. 1 . On peut ici prendre les mots de parfait et complet (resp. imparfait et incomplet ) au sens technique prcis que leur donne la thorie des jeux depuis Harsanyi (connaissance des donnes du jeu et connaissance des coups dj jous) ou dans un sens plus lche, permettant les connotations avec prvision parfaite et thormes d'incompltude. 380

Jean-Pierre Dupuy 1. La premire illustration que nous offrirons de cette proposition est le paradoxe du magasin succursales multiples . Ce modle, tudi par R. Selten [1978], illustre le concept d'quilibre parfait. Considrons d'abord le cas d'un monopole qui fait face l'entre potentielle d'un concurrent sur son march. Le concurrent est le premier agir : soit il entre, soit il renonce entrer. S'il entre, le monopoleur a le choix entre partager le march avec lui et lui faire la guerre pour tenter de l'liminer (par exemple, en diminuant les prix de faon drastique). Ce comportement prdateur fait du tort au concurrent, mais il en fait aussi au monopoleur. Le jeu, crit sous forme dveloppe, se prsente ainsi : CONCURRENT

entre MONOPOLEUR

guerre

utilits : monopoleur : -1 concurrent : -1/2

0 1/2

2 0

En raisonnant partir de l'horizon {backward induction), comme en programmation dynamique, on voit ceci : si le concurrent entre, le monopoleur a intrt partager ; le concurrent obtient alors 1/2, contre 0 s'il renonce. Il entre donc, et le monopoleur partage avec lui. C'est un premier quilibre de Nash, mais il en existe un second, soutenu par la menace du monopoleur : Si tu entres, je te fais la guerre : le concurrent alors renonce. Mme si, par le renoncement mme du concurrent, la stratgie de menace du monopoleur ne lui cote rien, cet quilibre n'est pas acceptable, argumentait R. Selten. Suppos ons, en effet, que le monopoleur soit en situation d'excuter sa menace : s'il est rationnel, il ne l'excutera pas puisque lui-mme y perd. Sa menace n'est donc pas crdible, ce qui rend l'quilibre en question imparfait . On objectera que cet argument fait intervenir un vne ment: le monopoleur est en situation d'excuter sa menace que prcisment l'quilibre considr exclut. Mais telle est prcisment la thse de R. Selten : les stratgies des joueurs doivent tre partout 381

Revue conomique rationnelles dans l'arbre du jeu dvelopp, mme en des nuds dont on est sr qu'ils ne seront pas atteints. Le paradoxe est que l'argument en question s'tend au cas o le jeu prcdent est rpt un nombre fini de fois. On suppose que le monopol eur est un magasin succursales multiples. Chacune de ces n succursales fait face, tour de rle, l'entre potentielle d'un parmi n concurrents. Pourquoi est-il paradoxal que la menace : Je fais la guerre si vous entrez reste dans ce cas non crdible ? C'est que la sagesse des nations et l'observation de la concurrence conomique fournissent mille preuves de la pertinence et de l'efficacit de la maxime : II faut montrer sa force pour ne pas avoir s'en servir. Intuitivement, le raisonnement est le suivant : mme s'il en cote au dpart au monopoleur de faire la guerre aux premiers concurrents qui s'aventurent sur son march, il y gagnera finalement, car l'observation de son comportement pass convaincra les concurrents ultrieurs qu'ils feraient mieux de s'abstenir. Sachant cela, les premiers concurrents eux-mmes pourront tre amens renoncer entrer sur le march, de sorte que le monopoleur n'aura jamais l'occasion de se montrer agressif. Cet argument est typiquement sociologique , au sens que nous donnions ce mot en commenant. D'une part, le pass y dtermine l'avenir, par l'intermdiaire des reprsentations, modles et thories que se forgent les acteurs au vu des comportements passs. D'autre part, les agents exercent une influence les uns sur les autres au travers de ces objets collectifs que sont 1' image (ici, de mchant ) qu'ils se donnent les uns aux autres, la rputation qu'ils acquirent, etc. Le problme est que le paradigme de la rationalit invalide cette analyse conforme au sens commun. Il conduit raisonner de faon rtrograde partir de l'horizon, dans les termes suivants. A la dernire priode, l'argument du jeu statique est pleinement valide, le dernier concurrent entre sur le march et le monopoleur ragit pacifiquement. A l'avant-dernire priode, le monopoleur pourrait tre tent par l'arg ument sociologique, se montrant agressif dans l'espoir de dissuader le concurrent ultrieur de pntrer sur le march. Mais, dans le temps invers qui est celui du paradigme de la rationalit, les jeux de la dernire priode sont dj faits lorsqu'on s'interroge au sujet de l'avant-dernire. Le monopoleur n'a donc aucun intrt se montrer agressif, l non plus, et le concurrent entre sur le march. Et ainsi de suite, de priode en priode, d'o il ressort que le seul quilibre de Nash parfait est celui dans lequel les n concurrents passent l'action sans que jamais le monopoleur leur fasse la guerre. On peut mme avancer ceci (Milgrom et Roberts [1982], mais ce point est contestable et contest : cf. ci-dessous) : supposons que le jme concurrent observe que le monopoleur a fait la guerre tous ses prdcesseurs. Ces prcdents ne doivent avoir aucun poids dans sa dcision. Certain de la validit du raisonnement rtrograde, il doit se montrer assur que le monopoleur ragira pacifiquement son entre sur le march. Et donc, il entrera. 382

Jean-Pierre Dupuy Un examen plus approfondi de l'argumentation prcdente rvle qu'elle repose de faon dcisive sur l'hypothse que les donnes du jeu et le comportement pass des joueurs sont CK plus prcisment, qu'est CK le fait que l'entre de la concurrence et la conduite pacifique du monopoleur sont l'une pour l'autre la meilleure rponse. Il suffit de relcher un tant soit peu cette condition pour que la solution sociologique intuitive trouve sa justification. C'est ce qu'auront montr, chacun sa faon, les travaux de Kreps- Wilson [1982] et de Milgrom-Roberts [1982]. Il s'agit d'introduire une dose infime d'imperfection dans le systme d'information du jeu et de montrer que cette lgre impuret suffit briser la logique paradoxale du raisonnement rtrograde, ce qui redonne la flche du temps son sens habituel et des objets collectifs un pouvoir de dtermination causale. On suppose donc que les concurrents ne connaissent pas parfait ement les caractristiques du monopoleur. Ils peuvent ignorer les utilits qu'il assigne chacune des issues possibles et le suspecter, par exemple, de trouver plus intressant, une fois un concurrent entr, de lui faire la guerre que de partager le march avec lui. Ou bien ils ignorent les vritables motivations ou rgles de comportement du monopoleur et le suspectent, par exemple, de vouloir se montrer systmatiquement agress if soit qu'il se soit l'avance li les mains pour telle ou telle raison, soit que sa stratgie sur le march considr fasse partie d'une stratgie plus globale qui le pousse combattre sur ce march, soit tout simple ment qu'il se conduise de faon irrationnelle. A vrai dire, cette distinction entre l'ignorance des utilits et l'ignorance du mode de rationalit de l'autre est assez floue. Il se pourrait, par exemple, que le monopoleur soit envieux, prfrant (irrationnellement) encourir une perte pour ne pas donner satisfaction au concurrent, ce qui le conduirait (rationnellement) combattre celui-ci s'il entre sur le march. Qualitativement, le modle fonctionne ainsi. Les concurrents sont presque certains que le monopoleur possde les caractristiques que le modle avec CK lui assigne. Nous dirons : ils sont presque srs que le monopoleur relve du type mou ( mou parce qu'il prfre cooprer lorsqu'on l'attaque). Cependant, ils assignent une (trs) faible probabilit a priori, e, l'ventualit que le monopoleur relve du type dur (soit par intrt, soit par rgle, il ragit agressivement toute attaque). On a donc affaire un jeu information incomplte (ignorance des donnes du problme) que l'on transforme immdiatement, selon la mthode d'Harsanyi, en un jeu information complte mais imparfaite (ignorance des coups prcdents) : il suffit de considrer qu'un joueur supplmentaire, la Nature , tire l'instant zro le type du monopol eur, avec les probabilits (1 - e) et e. Le monopoleur connat le rsultat du tirage, mais pas les concurrents. La solution propose ce jeu s'appuie sur le concept d'quilibre squentiel, propos par Kreps et Wilson pour tendre aux jeux information incomplte l'ide d'quilibre parfait (une menace doit tre crdible mme si elle n'a pas tre 383

Revue conomique excute). Un quilibre squentiel dfinit une stratgie pour chacun des joueurs, et une volution des croyances que ceux-ci se forgent au sujet des vnements incertains, ces stratgies et ces croyances tant (bayesiennement) cohrentes les unes par rapport aux autres. Ainsi, en chacun de ses coups, tout joueur affecte une distribution de probabilits aux nuds de l'arbre du jeu dvelopp contenus dans son ensemble d'informat ion (l'ensemble des nuds en lesquels le joueur pense qu'il peut se trouver) ; ces croyances sont cohrentes avec l'hypothse que chacun des joueurs a jou jusqu'alors sa stratgie d'quilibre ; en tout ensemble d'information (mme en ceux dont les stratgies d'quilibre excluent qu'ils soient atteints), chaque joueur a recours une stratgie qui maximise son utilit espre tant donn ses croyances l'instant considr, d'une part, tant donn que les autres joueurs continueront jouer leur stratgie d'quilibre, d'autre part. Ce concept d'quilibre implique en particulier que la stratgie d'un joueur dont le type est incertain (et alors mme que lui connat son type) comporte la spcifica tion d'une stratgie pour chacun de ses types possibles. Pour des spcifications particulires du modle, on montre qu'il existe un quilibre squentiel unique dont le profil correspond la solution du sens commun. La stratgie du monopoleur de type mou requiert que, pour tous les concurrents sauf les derniers, il rponde de faon agressive toute entre sur le march. Cette stratgie a un effet dissuasif marqu puisque, 6 > 0 donn, le nombre de concurrents ayant une probabilit positive d'entrer est born par une valeur qui ne dpend que de e. A e > 0 donn, donc, lorsque le nombre de concurrents tend vers l'infini, la dissuasion est effective presque partout, et l'utilit moyenne pour le monopoleur tend vers 2. Pour e = 0, cependant, cette utilit tombe brutalement 0. Cette discontinuit illustre bien ce que nous appelions ci-dessus la discontinuit au niveau du CK. La forme de cette solution s'explique intuitivement de la manire suivante : ds lors que le monopoleur de type mou rpond pacifiquement une entre sur le march, il rend public, et donc CK, son type, ce qui l'emprisonne dans la logique du raisonnement rtrograde et sa solution paradoxale et peu avantageuse o tous les concurrents entrent et il les laisse faire. Les auteurs des articles que nous analysons dcrivent la solution qu'ils proposent comme 1' mergence d'un phnomne de rputa tion . L'incertitude des concurrents sur le type du monopole les conduit prvoir l'avenir en fonction du pass au travers des reprsentations ou croyances qu'ils forment ce sujet. Sachant cela, le monopoleur est incit agir sur ces reprsentations au moyen de son comportement, dmontrant aux suivants, par son agressivit actuelle, qu'il est prt continuer de la sorte, ce qui les conduit renoncer. Pour le coup, et dans le cadre strict des modles en cause, cette description image de type psychosociologique fait trop peu de cas du paradigme de la rationalit. Pour qui se place d'emble l'quilibre, en s'arrangeant de plus pour qu'il soit unique, sans se poser le problme de sa gense dynamique, il est 384

Jean-Pierre Dupuy trop vident que la solution du problme, croyances et stratgies mles, dcoule logiquement de sa donne, dans le temps instantan des dduct ionsmathmatiques. On voudrait bien dcrire cette solution en termes de manipulation des reprsentations ; on voudrait bien, a contrario, caractriser la rputation comme un objet collectif en surplomb, opaque par rapport aux agents, bloquant leur spculante, l'instar de la valeur dans le modle keynsien de la spculation financire. Mais il est clair qu'il y a ici autant de transparence qu'il peut y en avoir, compte tenu de l'imperfection de l'information ] ; et que cette transparence est inhrente la dfinition mme de l'quilibre. Si, en revanche, on se demande pourquoi on devrait se trouver en un quilibre squentiel et comment on peut y arriver ; si, de plus, on complique ces questions en s'intressant des contextes quilibres multiples : tous les problmes de coordination que nous avons analyss se reposent d'emble. Il y a alors place pour une vritable analyse sociologique des phnomnes collectifs. Le rle de l'imitation dans la ralisation d'une coordination russie, le fait que cette ralisation passe par des processus effectifs irrductibles la dduction logique : tout cela reprend droit de cit. Car il est clair que la rputation, ce n'est pas seulement ce qui se btit sur les comportements du sujet, c'est aussi ce que l'on lit dans le regard des tiers. Le mrite des modles que nous analysons est cependant de montrer que tout ceci est rendu possible par un cart au CK, ft-il infime. Nous avons caractris la petitesse de cet cart par la valeur de e. Il y a un moyen supplmentaire de le rendre evanescent, c'est de le rendre lui-mme spculaire. Supposons, en effet, que tous les concurrents sachent que le monopoleur est du type mou, mais qu'ils ne soient pas certains que leurs congnres le sachent. Il y a une chance que le monopoleur ait connaissance de cette possible incertitude de leurs congnres son sujet et choisisse une stratgie de dissuasion : ils feront donc mieux de renoncer. Supposons maintenant que le monopoleur sache que tous les concurrents connaissent son type, mais que les concurrents ne sachent pas cela. Il aura encore intrt jouer la dissuasion afin de convaincre les concurrents qu'il ne sait pas qu'ils savent. Et ainsi de suite2. On chappera la solution paradoxale tant que le type du monopoleur ne sera pas CK. 2. Le mme type d'analyse a t appliqu au dilemme du prisonnier rpt en horizon fini, avec le mme type de rsultats. On sait qu'en horizon infini et pour un taux d'actualisation assez faible, le folk theorem assure que l'issue correspondant au cas o l'un et l'autre 1. Un aspect troublant de cette transparence : les raisonnements impliquent que les donnes de base du problme sont CK, en particulier la probabilit a priori e. 2. Il est noter que la validit de ce raisonnement, d Kreps-Wilson [1982] et Milgrom-Roberts [1982]. est, dans ce cas prcis, conteste par R.J. Aumann ([1988], p. 10) au motif suivant : contrairement au dilemme du prisonnier rpt (voir ci-dessous), le passage de la solution rationnelle la solution raisonnable n'est pas ici dans l'intrt de tous. 385

Revue conomique joueur cooprent peut tre obtenue en permanence, soutenue par une menace approprie. La plus clbre est sans doute la stratgie TIT for TAT (du tac au tac) qui consiste faire dfection si, et seulement si, l'autre joueur a fait dfection au coup prcdent (cette stratgie joue un rle privilgi dans les expriences et simulations menes par Axelrod [1981], sans qu'on puisse parler de son optimalit). Le problme et le paradoxe, c'est qu'en horizon fini le raisonnement rtrograde partir de l'horizon assure que le seul quilibre de Nash est celui o tous font dfection chaque coup. Ce rsultat choque le sens commun, et les expriences ralises en laboratoire ne le confirment pas : en gnral, les joueurs commencent par cooprer et ce n'est qu'en fin de jeu qu'ils se mettent jouer rationnellement , c'est--dire leur dtriment. C'est, ici aussi, l'hypothse que la rationalit des joueurs est CK qui cause le divorce entre le rationnel et le raisonnable. Il suffit de s'en affranchir infiniment peu pour les rconcilier. On suppose (Kreps et al. [1982]) que l'un des joueurs souponne l'autre d'tre d'un naturel doux au point de jouer irrationnellement une stratgie TIT for TAT. Il assigne une probabilit e faible cette ventualit. Le joueur ainsi souponn (et qui le sait) a alors intrt renforcer cette image, en vitant au dpart tout coup qui rendrait public, donc CK, qu'il est en fait rationnel. Mimant le comportement d'un joueur TIT for TAT, il amne son partenaire rpondre par une stratgie approprie, galement gentille au sens d'Axelrod, c'est-dire qui n'attaque jamais la premire ; de telle sorte que tous deux cooprent, leur avantage mutuel. L'tude des quilibres squentiels de ce jeu information incomplte confirme cette analyse qualitative. On montre que le nombre total de coups o l'un ou l'autre joueur fait dfection est born suprieurement par une valeur dpendant de e, mais indpendante du nombre total de coups n. Les quilibres optimaux au sens de Pareto se caractrisent par de la coopration partout, sauf aux tout derniers coups. Ici encore, on peut faire s'vanouir autant que l'on veut l'incertitude en la rendant spculaire sans changer ces rsultats qualitatifs. Supposons que chaque joueur est rationnel et sait que l'autre l'est galement ; mais chacun ignore que l'autre sait qu'il est rationnel. Chacun pense que l'autre lui assigne une faible probabilit d'tre un joueur TIT for TAT. Chacun peut alors tenir le raisonnement du paragraphe prcdent et tenter de se faire passer pour TIT for TAT. L'autre, qui n'est pas dupe, a cependant tout intrt laisser croire qu'il l'est, puisque c'est son avantage aussi bien. Remontons encore d'un niveau : chaque joueur est rationnel, sait que l'autre est rationnel, sait que l'autre sait qu'il est rationnel. Cela a-t-il encore un sens de faire semblant, puisque l'on sait maintenant que l'autre n'est pas dupe ? Oui, car l'autre, peut-tre, ne sait pas que l'on sait cela. Si l'on fait semblant, l'autre continuera donc jouer les dupes et l'on 386

Jean-Pierre Dupuy prendra bien garde de lui signaler que l'on n'est pas dupe de son jeu. Et ainsi de suite. Supposons deux tres qu'un terrible secret spare. Chacun le connat, chacun sait que l'autre le connat et ainsi de suite, sans qu'on aille pourtant l'infini. L'incertitude, l'opacit qui en rsulte, quel que soit le degr de spculante o elle se loge, a le mme effet d'annulation imaginaire du fait en question. On peut faire comme s'il n'existait pas tant qu'il n'est pas dit, c'est--dire tant qu'il n'est pas CK. Ce qu'il s'agit ici d'annuler sur ce mode, c'est la rationalit des joueurs, puisque c'est elle (ou plutt le CK son sujet) qui les enferme dans la destruction mutuelle. C'est donc bien l'opacit, ft-elle dose homop athique, qui leur permet de se coordonner sur le comportement de coopration. 3. On a, dans ce qui prcde, caractris l'cart au CK (ou encore : le degr d'opacit ; ou mme : le degr d' irrationalit ) de deux faons diffrentes : par la probabilit que l'un des joueurs s'carte de sa stratgie d'quilibre en situation de CK ; par le niveau de spculante o cet cart est pens. R.J. Aumann a propos rcemment une mesure de l'opacit qui synthtise ces deux caractrisations [1988]. Le cadre thorique est celui que R.J. Aumann [1987] a fix pour tablir l'quivalence entre le point de vue de la rationalit bayesienne et celui de la thorie des jeux. Pour le premier, tout est susceptible d'tre probabilis, y compris, dans le contexte d'un jeu, les stratgies choisies par les joueurs. Tel n'est pas le point de vue de la thorie des jeux : les stratgies refltent la rationalit des joueurs, elles se dterminent par la contrainte qu'elles doivent tre en quilibre les unes par rapport aux autres. Or on peut rconcilier ces deux points de vue. Considrons, comme dans le modle dfini ci-dessus (p. 378), l'ensemble des tats du monde . La description d'un tat du monde fait intervenir tous les facteurs pertinents, y compris, s'il s'agit d'un jeu, les stratgies de chacun des joueurs. Un tat du monde n'est connu d'un joueur donn qu'au travers de l'lment de la partition SP{ relative ce joueur qui contient l'tat en question (son ensemble d'information ). En un ensemble d'information, un joueur connat sa stratgie (sa stratgie est donc constante sur chaque ensemble d'information), mais il ne connat pas en gnral la stratgie des autres. Tous les joueurs ont la mme distribution de probabilits a priori sur l'ensemble des tats du monde. Supposons que, pour un jeu n personnes sous forme normale, l'ensemble des tats du monde qui ont une probabilit non nulle de survenir soit tel qu'en chaque tat (il soit CK que) x chaque joueur choisit une stratgie qui maximise son utilit, compte tenu de son information (rationalit bayesienne). R.J. Aumann montre que la distribution des 1. Si en chaque tat du monde, on a P (ici : les joueurs sont rationnels bayesiens), alors ncessairement P est CK en chaque tat. On n'a rajout cette clause redondante qu'en vue de ce qui va suivre. 387

Revue conomique complexes de stratgies qui en rsulte correspond un quilibre corrl (tout se passe comme si les joueurs dterminaient leur stratgie en fonction d'un mme vnement alatoire, la fonction de raction de chacun maximisant son utilit fonction des autres donne). L'originalit de ce modle est qu'il inclut la dcision des acteurs dans la description de l'tat du monde. Sa perspective n'est donc pas normative : elle n'est pas de dire ce que chacun doit faire, compte tenu de son information. Le point de vue est celui d'un observateur extrieur, pour qui les actions des joueurs sont partie intgrante de la description des tats du monde. Chaque joueur est tenu, mme par rapport lui-mme, de prendre ce point de vue extrieur, puisqu'il doit se mettre la place des autres qui eux-mmes doivent se mettre sa place avec les informations dont ils disposent. Comme l'crit R.J. Aumann ([1987], p. 8), cette position d'observateur extrieur traduit l'opacit du systme, c'est--dire l'absence de CK sur les donnes : s'il y avait CK, chacun saurait ce que les autres savent simplement en sachant ce que lui-mme sait. C'est donc dans ce cadre que l'on tablit l'quivalence entre une rationalit bayesienne universelle, donc CK, et le concept d'quilibre corrl (un quilibre de Nash est videmment un cas particulier, dg nr , d'quilibre corrl). La question est : que devient ce rsultat lorsqu'on relche, ne serait-ce qu' dose infime, l'hypothse de CK ? Soit l'exemple du mille-pattes de R.W. Rosenthal [1981], sous sa forme plus ramasse, cinq pattes, propose par N. Meggido [1986]. Il y a 10,50 F sur la table. Marie, la premire jouer, a le choix entre : prendre 10 F, laissant 50 centimes Pierre, auquel cas le jeu est termin ; ou bien passer la main Pierre, auquel cas le montant en jeu est multipli par dix et passe 105 F. C'est Pierre de jouer : ou il prend 100 F, laissant 5 F Marie, et le jeu est termin ; ou il passe la main, et le montant est nouveau multipli par dix. Cela se produit trois fois, selon le schma ci-dessous. A la dernire tape, s'il a la main, Pierre prend 1 000 000 F, laissant 50 000 F Marie et le jeu est termin. Marie Pierre Marie Pierre Marie Pierre 50 000 1 000 000

10 0,5 388

5 100

1 000 50

500 10 000

100 000 5 000

Jean-Pierre Dupuy Les nombres suprieurs reprsentent les gains de Marie, les nomb res infrieurs, ceux de Pierre (C = Coopration ; D = Dfection). S'il est CK que Marie et Pierre sont rationnels, le raisonnement rtrograde partir de la dernire tape nous convainc que le seul quilibre parfait (qui est aussi le seul quilibre de Nash et le seul quilibre corrl) est, pour chaque joueur, de faire dfection en chacun des nuds o il a la main. De telle sorte que le jeu s'arrte ds le premier coup, Marie prenant 10 F et laissant 50 centimes Pierre. On a du mal se persuader du caractre raisonnable de cette solution. Le paradoxe , s'il y en a un, est-il cependant d'une nature fondamentalement diffrente de celui du dilemme du prisonnier (quilibre non optimal) ? La forme extensive du jeu lui donne peut-tre une dimension nouvelle. Nous revenons sur cette question dlicate dans ce qui suit. Il s'agit maintenant de relcher, si peu que ce soit, la condition de CK sur la rationalit des joueurs. Il faut donc introduire la fois la possibilit que l'un des joueurs au moins se conduise irrationnellement, et une incertitude spculaire sur la question de savoir ce qu'il en est vraiment dans l'tat du monde ralis. Le cadre formel tabli par R.J. Aumann permet d'atteindre ce double objectif avec une rare lgance (nous suivons ici pas pas sa prsentation de 1988). Soit le mme jeu crit sous forme normale : Pierre a 10 0,5 5 100 Marie 5 100 5 100 Les stratgies pures de Marie sont : a : dfection au nud 1 ; b : coopration en 1 et dfection en 3 ; c : coopration en 1 et 3 et dfection en 5 ; d : coopration en 1, 3 et 5. 389 500 10 000 500 10 000 100 000 5 000 50 000 1 000 000 y 10 0,5 1 000 50 10 0,5 1 000 50

Revue conomique Les stratgies pures de Pierre sont : a : dfection en 2 ; : coopration en 2 et dfection en 4 ; Y ' coopration en 2 et 4. On suppose : que les seuls tats du monde se ralisant avec une probabilit positive sont ceux dont les utilits sont encadres : /, ;, k,l,metn ; qu'il y a une correspondance bi-univoque pour chaque joueur entre ses stratgies et les lments de sa partition d'information. Par exemple, et avec les notations de la page 378 : pour Marie : P(l) = \l,m\ ; et pour Pierre : P(l) = \k,l \. On voit tout de suite que Marie joue de faon irrationnelle en. On va s'arranger pour rendre la probabilit de n trs faible tout en faisant que ce soit le seul tat du monde o se glisse une irrationalit. Considrons d'abord le cas : Prob(/) = Prob(/) = Prob(fc) = 0 ; Prob(/) = 0,99447, Prob(m) = 0,0055, Prob(rc) = 0,00003. On vrifie que Pierre agit rationnellement dans les trois tats probabilit positive. En /, c'est vident puisque alors P(/) = } / j ; en m et n, il joue Y , ce qui lui rapporte une esprance d'utilit de : 550 3 (5 000 X -ggg-) + (1 000 000 X -gg-) suprieure 10 000 qu'il obtiendrait s'il jouait . Il agit donc rationnel lement. On vrifie de mme que Marie est rationnelle en / et m, mais pas en n. La seule irrationalit introduite dans le systme est donc celle de Marie en n, et sa probabilit est seulement de 3.10~5. Supposons alors que l'tat du monde ralis soit /. Chacun y agit rationnellement. Chacun sait que chacun y agit rationnellement : en effet, l'vnement en question est \l,m\ qui inclut bien P(/) pour Marie et pour Pierre. La rationalit de Pierre est videmment CK, puisque Pierre est rationnel partout. En revanche, Marie ne sait pas que Pierre sait qu'elle agit rationnellement (du point de vue de Marie, on pourrait tre en m, que Pierre ne discerne pas de n). En rsum : la rationalit de Marie est sue de tous les deux, celle de Pierre est CK, et cependant il russit obtenir 10 000 F au lieu des 50 centimes que lui rservait la transparence totale. On peut se rapprocher beaucoup plus du CK tout en vitant de retomber dans la case i. On peut ainsi trouver une distribution de probabilits sur | i, j, k, i, m, n J telle que : Pierre est partout rationnel ; Marie galement, saufen n, avec une probabilit de seulement 0,6.1er9 ; Prob(/) > 0, de telle sorte que si / se ralise, il donne 100 F Pierre, avec les caractristiques suivantes : les deux joueurs sont ration390

Jean-Pierre Dupuy nels ; ils savent qu'ils le sont ; ils savent qu'ils le savent ; ils savent qu'ils savent qu'ils le savent ; et la rationalit de Pierre est CK. R.J. Aumann propose une mesure de l'irrationalit pour apprcier l'cart au CK. Pour chacun des joueurs, en chacun des tats o il joue de faon irrationnelle, on multiplie la probabilit de cet tat par l'cart entre ce qu'obtient le joueur et ce qu'il obtiendrait en jouant rationnellement. On somme ensuite sur les tats. Dans l'exemple prcdent, cette mesure donne pour Marie une irrationalit de : 50 000 F x 0,6, 10~9, soit trois millimes de centime, une somme tout fait drisoire. Cette analyse confirme donc qu'une trace d'opacit suffit redonner des solutions beaucoup plus raisonnables et proches du sens commun que la solution standard avec rationalit absolue. Dans l'apprciation de cet effet, la mthode de R.J. Aumann semble beaucoup plus performante que le recours au concept d'quilibre squentiel. On calcule en effet qu'avec ce dernier, c'est une irrationalit de 250 F au moins, soit huit millions de fois plus, que Marie doit manifester pour qu'on s'arrache au pige de la rationalit. 4. La dernire illustration que nous prsentons est d'une nature sensiblement diffrente. Dans les deux exemples prcdents, c'est le travail du doute qui permettait aux joueurs d'viter l'issue domine (au sens de Pareto), laquelle les condamnait le CK sur leur rationalit. Ici, l'issue optimale requiert au contraire une certitude totale sur cette rationalit. Les raisonnements prcdents jouaient par ailleurs sur l'op position entre rationalit et irrationalit. C'est ici l'antagonisme entre deux formes diffrentes de rationalit qui est au cur du dilemme. En dpit de ces traits distinctifs, l'exemple qui suit partage avec les autres la proprit fondamentale que nous tentons de mettre en lumire : quels que soient son importance et le niveau de spculante o elle se situe, l'opacit a des effets qualitativement semblables et radicalement distincts de ce que produit une absence totale d'opacit. Soit le jeu sous forme normale : C Joueur 2 2 2 0 1 1 0 1 D 1

Joueur 1

391

Revue conomique Dans les discussions qui ont suivi la publication de l'ouvrage de D.K. Lewis, ce jeu est apparu comme occupant une position intermd iaire entre le dilemme du prisonnier et le jeu de coordination (Ullman-Margalit [1978] ; Gilbert [1981]). Du second, il conserve l'exi stence de deux quilibres de coordination, CC et DD, avec toutefois cette nuance : si le premier est de coordination au sens strict (si un joueur coopre, il lui importe que l'autre coopre aussi), le second n'est de coordination qu'au sens large (si un joueur fait dfection, le choix de l'autre lui est indiffrent). Du dilemme du prisonnier, ce jeu garde par ailleurs le trait typique suivant : la coopration mutuelle, bien qu'optimal e, va se rvler impraticable. Mieux que le dilemme du prisonnier auquel on a d'ordinaire recours, ce jeu formalise la logique du second tat de nature selon J.-J. Rousseau, cette mauvaise socit naturelle qui ressemble fort l'tat de nature selon Hobbes. L'exemple fameux de la chasse au cerf fournit une smantique la structure formelle : pour chasser le cerf, deux chasseurs doivent cooprer ; chacun peut aussi chasser le lapin sparment, ce qui lui fournit une nourriture de moindre qualit ; mais si l'un se retrouve seul chasser le cerf, il ne peut l'attraper et meurt de faim. On peut envisager dans ce contexte deux formes de rationalit. La rationalit utilitariste habituelle, celle qui sous-tend le concept d'quilibre de Nash ; mais aussi, puisqu'une perte considrable (la mort) est possi ble, la rationalit prudentielle, sous la forme de la stratgie minimax. Cette dernire enjoint ici de faire dfection, ce qui met l'abri des vellits de l'autre. Il serait videmment rationnel de cooprer, mais c'est prendre un risque terrible. De fait, chaque joueur prfrera faire dfection si l'une des propositions mutuellement exclusives suivantes est le cas : il prfre la prudence ; ou bien : ce n'est pas le cas, mais il souponne l'autre de prfrer la prudence ; ou bien : ce n'est pas le cas, mais il souponne l'autre de le souponner de prfrer la prudence ; etc., jusqu' l'infini. Il suffit qu'un soupon se glisse un niveau de spcularit fini, quelle que soit sa profondeur, pour que la prudence l'emporte. Tout se passe comme si le jeu de la spcularit ramenait immdiatement la surface tout doute enfoui au fin fond de la conscience. On ne jouera donc la coopration que si aucun niveau un tel doute n'apparat. En d'autres termes : le fait que l'un et l'autre joueur cartent la rationalit prudent ielle doit tre CK. Il faut concder aux critiques du CK qu'il est psychologiquement implausible que cette condition soit satisfaite. L'quilibre de coopration est donc instable, parce que non immunis contre la logique du soupon qui se confond ici avec le raisonnement spculaire. 392

Jean-Pierre Dupuy La solution apporte par Rousseau ce paradoxe est bien connue. Ce que nous nommons spculante, il l'appelle amour-propre . La mauvaise socit naturelle vit sous le rgne de l'amour-propre et les hommes s'y enferment mutuellement dans le mauvais quilibre (DD). Le passage la bonne socit du contrat (CC) reste une nigme, mais la nature de la solution est assez claire : il faut, par des moyens artificiels, en revenir au rgne de l'amour de soi qui caractrisait le premier tat de nature et qu'on peut dfinir comme absence de spculante que chacun vote par soi-mme dans une sorte d'isoloir absolu, qu'il vote pour soi en se laissant guider par la seule prfrence que chacun se donne . Ceci ne sera ralis que pour autant que les hommes seront devenus citoyens, c'est--dire se seront totalement identifis la Cit. On voit que, comme chez L. Walras, il s'agit de les rendre quittes les uns envers les autres. La transcendance du march est simplement remplace par la transcen dance de cet autre objet collectif : la Cit. Dans les termes de cet article : ce que la spculante infinie et pu raliser si elle avait t possible, c'est l'absence de spculante qui finalement permet de l'obtenir.

L'information parfaite (complte) dbouche sur l'indcidable et l'indtermin 1. Voulant marquer la discontinuit radicale entre le CK et le presque CK, nous avons admis dans ce qui prcde que les solutions standards avec CK, obtenues par raisonnement rtrograde partir de l'horizon {backward induction), ne posent pas de problmes quant leurs fondements. Or il semble bien qu'au moins dans certains cas, en plus d'tre draisonnables et contraires au sens commun, ces solutions sont autorfutantes. Explicitons le raisonnement rtrograde sur l'tre cinq pattes de Meggido. Ce raisonnement se passe tout entier dans la tte de Marie au commencement du jeu. Que fera-t-elle au nud 5 ? Puisqu'elle est rationnelle, elle choisira D. Au nud 4, elle sait que Pierre est rationnel, et elle sait que Pierre sait qu'elle est rationnelle : elle s'attend donc ce que Pierre choisisse D. Et ainsi de suite, d'o la conclusion standard dont on voit bien qu'elle repose sur l'hypothse que la rationalit des joueurs est CK. Le problme est que ce raisonnement prend appui sur des vne ments (Marie a la main au nud 5, Pierre au nud 4, etc.), dont il dmontre qu'ils ne peuvent avoir lieu. Ayant achev son raisonnement et conclu qu'elle devait jouer D en 1, Marie doit le reprendre et se demander, par exemple, ce que Pierre, qui a fait le mme raisonnement, dcidera vraiment s'il a la main en 4 alors qu'il est cens ne pas l'avoir. Il conclura srement, et Marie avec lui, que l'hypothse de CK est infirme. Mais ces tapes successives ne sont introduites que par commodi t, le temps logique les tlescopant dans l'instantanit de la dduction. 393

Revue conomique II faut alors admettre que le raisonnement contient en lui-mme sa propre contradiction. K. Binmore [1987] note que ce paradoxe a la mme forme que celui de la surprise annonce . On dit un condamn mort que c'est par surprise qu'on viendra le chercher, un petit matin de la semaine suivante, pour le conduire l'chafaud. Un raisonnement rtrograde partir du dernier jour de la semaine le convainc qu'il ne peut tre excut. Il comprend alors aussitt que, quel que soit le jour, il sera par l mme surpris. Le raisonnement rtrograde en cas de CK dbouche sur l'indcidable. Si Marie a, par exemple, la main en 3, ce mode de raisonnement ne lui est d'aucun secours. Elle doit, au contraire, se tourner vers le pass et chercher interprter le geste de Pierre en 2 faisant suite son propre geste en 1 . C'est en fonction de son modle interprtatif qu'elle pourra se dcider en connaissance de cause. La flche du temps a repris son sens habituel, du pass vers l'avenir. D'o un mtaparadoxe : la discontinuit entre le presque CK et le CK disparat, pour cause d'impuissance du CK. Sur la raison profonde du paradoxe, les avis divergent sensiblement. Nombre d'auteurs soulignent la contradiction entre l'hypothse de CK et le concept d'quilibre parfait. Ce dernier implique que l'on s'interroge sur ce que c'est qu'tre rationnel dans un contexte dont l'existence mme prouve que des joueurs, dont la rationalit est cense tre CK, se sont comports de faon irrationnelle. Il s'agit d'apprcier ce que peuvent tre des croyances ou anticipations rationnelles dans des circonstances dont la probabilit d'occurrence est nulle (McKelvey [1988]) ; de manier des contrefactuels du genre : si un joueur rationnel a jou la squence suivante de coups irrationnels, alors... (Binmore [1987]). De la rponse ces questions dpend crucialement la thorie laquelle on aboutit. Il est courant de faire l'hypothse dite de main tremblante : les joueurs sont arrivs en ce nud impossible par une suite d'erreurs non corrles entre elles. Cependant, dans le jeu du mille-pattes, si les joueurs ont jusqu'ici systmatiquement viol la logique du raisonnement rtrograde, il est peu raisonnable de faire comme si cela ne donnait aucune indication sur les chances qu'ils continuent le faire dans l'avenir. Mais alors, c'est toute la logique du raisonnement rtrograde partir de l'horizon qui s'effondre. Il faut plonger le jeu dans un contexte plus large et construire une thorie de ce contexte, comme il se doit lorsqu'on a affaire des contrefactuels (background theory). C'est dire Pincompltude essentielle du paradigme de la rationalit. Sur cette lance, plusieurs bons auteurs suggrent, sans le dmont rer, que le caractre autorfutant du raisonnement rtrograde partir de l'horizon en cas de CK s'tend tous les jeux dynamiques, y compris aux jeux rpts. Nous avons quelque rticence partager cette position. Qu'on prenne l'exemple du dilemme du prisonnier rpt : aucune tape, le raisonnement ne fait intervenir d'hypothse qu'il va tre amen rfuter par la suite. Le mal semble cependant profond, et s'tend des 394

Jean-Pierre Dupuy modles nombreux et importants pour la thorie conomique. Ainsi, la dmonstration que la monnaie prend, dans un modle gnrations imbriques, une valeur nulle ds lors que l'horizon est fini et connu, tombe sous le coup de la mme critique. Pour qu'une gnration se pose le problme de savoir si elle accepte ou non de la monnaie en paiement de son travail, il faut bien que la monnaie ait circul jusqu' elle, ce dont le raisonnement montre le caractre irrationnel. L' autorfutation du paradigme de la rationalit laisse ici le champ libre au jeu d'objets collectifs du type : confiance dans la monnaie dont l'effet, sinon la fonction, est de bloquer la spculante. Des notions dont le statut pistmologique tait plus qu'incertain au regard de la rationalit triomphante trouvent ainsi une forme de lgitimit. Une piste de recherche prometteuse mais difficile est suggre par certains auteurs (Binmore [1987] ; Lasry [1984]). Il s'agirait de relier l'incompltude du paradigme de la rationalit aux thormes logiques sur l'incompltude des systmes formels. Il est clair qu'on a affaire dans les deux cas l'impossibilit d'une clture sur soi et que la vise de rflexivit absolue bute sur des limites d'ordre logique. Dans le mme ordre d'ides, on doit mentionner les recherches qui appliquent la notion de complexit algorithmique la thorie des jeux : les joueurs sont des automates finis dont la complexit est borne suprieurement. C'est l une manire originale d'apprhender la notion de rationalit limite. 2. Un autre cas dans lequel le CK engendre une indtermination est celui o, partant d'un jeu statique qui possde plusieurs quilibres de Nash, on cherche dfinir des quilibres pour des niveaux de spcularit de plus en plus profonds. Soit le jeu du carrefour : deux automobiles venant de directions perpendiculaires approchent vive allure d'un mme carrefour. Les conducteurs ont le choix entre ralentir et continuer de foncer. Il y a deux quilibres de Nash en stratgies pures, dissymtri ques, o l'un passe et l'autre laisse le passage. A un niveau de spcularit suprieur, on trouve galement deux quilibres de Stackelberg : le me neur choisit sa stratgie en supposant que le suiveur s'y adaptera ; donc il fonce, se liant les mains, en feignant par exemple de ne pas avoir vu l'autre automobiliste. Communication paradoxale puisqu'il s'agit de communiquer que l'on ne communique pas. A quoi l'autre peut rpondre un niveau suprieur de spcularit en signifiant qu'il n'est pas dupe. Supposons maintenant que leurs regards se croisent, rendant leur pr sence mutuelle CK : l'issue est totalement indtermine, on a affaire un pur rapport de forces. Une institution trs simple, le feu rouge, rintro duit dans le systme une dterminit salutaire en ralisant 1' quilibre corrl du jeu. Sa logique, cependant, est celle d'une extriorit qui bloque la spcularit (Banks et Calvert [1988]), rendant quittes les acteurs les uns envers les autres. 3. La dernire illustration est une classe de jeux spculaires bien connue (jeu des trois prisonniers, cocus de Bagdad, etc.). La thorie en a 395

Revue conomique t faite rcemment par J. Geanakoplos et H. Polemarchakis [1982], qui ont montr qu'il s'agissait d'une simple application du thorme d'Aumann sur l'galisation des probabilits a posteriori en cas de CK (cf. p. 379). Soit une population de N individus qui relvent de l'un ou l'autre de deux types : le type 1, distingu, et le type 0, non distingu. Chacun connat le type de tous les autres mais ignore le sien. Si, par un raisonnement logique, il le dcouvre au jour j, le soir mme minuit il doit le faire savoir. Supposons qu'il y ait n individus de type 1, avec n ^ 2. Au commencement du jeu, un arbitre extrieur nonce publiquement la proposition P : II y a, parmi vous, au moins un individu de type 1. Cette proposition, notons-le, n'apprend rien quiconque qu'il ne sache dj. Et cependant, son nonciation dclenche une srie de raisonne ments spculaires embots qui aboutit ce que le nime soir minuit, mais pas avant, les n individus de type 1 se reconnaissent comme tels. Avant son nonciation publique, la proposition P tait connue de tous, mais elle n'tait pas CK, ce qu'elle devient alors. C'est ce passage d'un savoir partag un savoir public qui permet chacun de dcouvrir la vrit sur son propre compte. On peut s'en convaincre au moyen d'un raisonnement par rcurrence. S'il n'y avait qu'un individu de type 1, la connaissance de P lui apprendrait son type. Supposons qu'il y en ait deux. Chacun se dit : si je ne suis pas du type 1, cet autre qui, je le vois, en est, devrait se manifester au premier soir ; attendons donc et voyons. Ce que tous deux font, observant ainsi qu'il ne se passe rien. Ils en concluent que leur prmisse tait fausse, et donc qu'ils sont du type 1 : ils le font savoir au deuxime soir. Et ainsi de suite. R.J. Aumann a eu l'ide originale de reposer le problme en ces termes. L'arbitre, disant P, n'apprend rien personne et cependant son dire a un effet : qui s'adresse-t-il donc ? La rponse : un (N+l)me sujet, le sujet du CK. La dmonstration de l'existence de ce sujet renvoie la formalisation logique du CK, en termes d'oprateur de connaissance. En logique pistmique, on dfinit un tel oprateur K par les quatre axiomes suivants, tant entendu qu' toute proposition P, on fait corre spondre une nouvelle proposition KP : KP => P KP => KKP K(P et Q)= KP et KQ Non KP => K (Non KP) (1) (2) (3) (4)

Cela dfinit une syntaxe, laquelle on fait correspondre une smantique. A tout oprateur K satisfaisant ces axiomes, on associe un 396

Jean-Pierre Dupuy sujet connaissant k. KP signifie alors : k sait que P (est vraie). Le sens des quatre axiomes en dcoule immdiatement. Etant donn deux sujets kx et k2 auxquels on associe les oprateurs de connaissance Kj et K2, on dfinit leur oprateur de CK par : CP = (P et Ki P et Kj P et Kx Kj P et Kj Kj P et ...) La gnralisation N sujets se fait sans peine. On dmontre le thorme : C est un oprateur de connaissance, car il satisfait les quatre axiomes (Lasry [1984]). Il lui correspond donc un sujet, le sujet du CK. Il est immdiat qu'il ne concide avec aucun des sujets de base, c'est donc un tre fictif, en supplment, dont la principale caractristique est de savoir P si, et seulement si, P est CK. Lorsque l'arbitre dit publiquement P et le rend par l mme CK, c'est donc au sujet du CK qu'il s'adresse. Tout se passe ainsi comme si la spcularit infinie faisait de la collectivit un sujet connaissant. C'est l'apothose de l'individualisme mthodologique, puisque le collectif est rendu totalement transparent aux individus : ce que le sujet du CK sait, en effet, chacun sait qu'il le sait ; et, dans le jeu considr, c'est parce que le sujet du CK sait P, et donc que chacun sait que le sujet du CK sait P, que chacun peut dcouvrir la vrit sur son propre compte : la transparence est donc dans les deux sens. Mais, paradoxalement, ce moment d'apothose est aussi celui qui sonne le glas de l'individualisme mthodologique : le principe de ce dernier n'est-il pas qu'on ne saurait doter un objet collectif des prdicats de la subjectivit ? On sort du paradoxe en comprenant que ce prodige d'un parfait retour sur soi du collectif est ici largement illusoire. Cette tonnante capacit reflexive qui fait que le groupe russit se mettre en surplomb par rapport soi dans un mouvement d'auto-extriorisation , s'appuie en fait, de faon dcisive, sur une dose massive d'extriorit : l'arbitre, les rgles, la scansion du temps. Il suffit de la rduire pour que le raisonne ment standard s'abme, une fois de plus, dans l'autorfutation. Soit l'exemple des trois prisonniers, cher J. Lacan [1966]. Trois condamns mort dans une cellule, chacun a un disque noir dans son dos ; ils savent que ces disques ont t prlevs sur un lot de trois noirs et deux blancs. Le premier dcouvrir la couleur de son disque doit le manifester en sortant de la cellule. Chacun se plonge dans le jeu spculaire, prenant appui sur le seul fait qui, outre les donnes, est CK : les autres ne bougent pas. Chacun croit dcouvrir ainsi la couleur de son disque, il s'avance pour le signifier et, ce moment prcis, sa prmisse s'croule puisque tous font de mme au mme instant.

Revue conomique CONCLUSION Ces quelques illustrations, pas encore trs bien articules et qui sont loin de constituer une thorie alternative, ont cependant le mrite, pensons-nous, d'argumenter de faon convaincante la thse principale de cet article. Le paradigme de la rationalit est radicalement incomplet, et ce dans un double sens. Il est incomplet en ce qu'il choue rendre compte du raisonnable, c'est--dire des solutions que le sens commun et l'exprience courante donnent spontanment aux problmes en question. C'est une critique grave pour une thorie dont l'ambition est prcisment de fonder en logique une philosophie du sens commun, une philosophie du convent ionnel . Pour retrouver le raisonnable, il faut une dose infime de ce qui apparat au paradigme comme imperfection ; il faut surtout le secours de ce qui lui chappe, savoir le pouvoir de dtermination causale d'objets collectifs, comme les conventions. Il est incomplet en un sens plus profond, ou plus trivial, comme l'on voudra, puisque cette seconde incompltude est de type logique. Si le CK tait atteignable et s'il avait une efficace, il donnerait la collectivit une capacit de rflexion totale, il en ferait un sujet. Mais cette ambition se brise sur l'impossibilit logique qu'un systme dductif suffisamment complexe soit la fois cohrent et complet. C'est cette incompltude essentielle qui oblige le temps tlescop de la dduction formelle laisser une place au temps rel des processus effectifs ce que l'on nomme d'ordinaire l'histoire.

RFRENCES BIBLIOGRAPHIQUES

Anspach Mark [1986], " Jamais deux sans trois " dans la communication chez Sperber et Wilson , Cahiers du CREA, 10, dcembre, p. 109-121. Arrow Kenneth [1974], The limits of organization, New York, Norton. Aumann Robert J. [1976]r Agreeing to disagree , The Annals of Statistics , 4 (6), p. 1 2361 239. Aumann Robert J. [1987], Correlated equilibrium as an expression of bayesian rational ity , Econometrica, 55 (1), p. 1-18. Aumann Robert J. [1988], Preliminary notes on irrationality in game theory , communic ation au IMSSS Summer Seminar on Economic Theory , mimo, Universit Stanford, 14 juillet. Axelrod [1981], The emergence of cooperation among egoists , American Political Science Review, 75, p. 306-318. 398

Jean-Pierre Dupuy Banks games Economic Jeffrey, with Theory incomplete Calvert , mimo, Randall information Universit [1988], , communication Stanford, Communication 16 aot. au and IMSSS efficiency Summer in coordination Seminar on Berthoud Arnaud [1987], Production collective, change et libert chez Walras , CAESAR, Paris X-Nanterre, mimo. Binmore Ken [1987], Modeling rational players , partie I, Working Paper, London School of Economics. Binmore Ken [1988], Modeling rational players , partie II, Economics and philosophy, 4, p. 9-55. Brge Tyler [1975], On knowledge and convention , Philosophical Review, avril. Cooper David [1977], Lewis on our knowledge of conventions , Mind, avril. Dumont Louis [1977], Homo Aequalis, Paris, Gallimard. Dupuy Jean-Pierre [1987], De l'mancipation de l'conomie. Retour sur le problme d'Adam Smith , L'Anne sociologique, 37, p. 311-342. Dupuy Jean-Pierre [1988], Common knowledge et sens commun , Cahiers du CREA, 11, avril, p. 11-51. Durkheim Emile [1911], De la division du travail social, Paris, Alcan. Elster Jon [1988], The cement of society ( paratre). Favereau Olivier [1988], Organisation et march. Quelques repres dans la perspective d'un programme de recherches cognitivistes en thorie conomique , mimo. Geanakoplos John, Polemarchakis Heraklis [1982], We can't disagree forever , Journal of Economic Theory, 28, p. 192-200. Gilbert Margaret [1981], Game theory and Convention , Synthese, 46, p. 41-93. GriceH.P. [1957], Meaning , Philosophical Review, 66, p. 377-388. Keynes John M. [1936], Thorie gnrale de l'emploi, de l'intrt et de la monnaie, Paris, Petite Bibliothque Payot, 1971. Keynes John M. [1937], The general theory of employment , Quarterly Journal of Econom ics, 51, p. 209-223. Kreps David, Wilson Robert [1982], Reputation and imperfect information , Journal of Economic Theory, 27, p. 253-279. Kreps David et al. [1982], Rational cooperation in the finitely repeated prisoners' dilemma , Journal of Economic Theory, 27, p. 245-252. Lacan Jacques [1966], Le temps logique et l'assertion de certitude anticipe , crits, Paris, Le Seuil, p. 197-213. Lasry Jean-Michel [1984], Le Common knowledge , Ornicar, 30, juillet-septembre, p. 75-93. Lewis David K. [1969], Convention : a philosophical study, Cambridge, Harvard Univers ity Press. Lewis David K. [1983], Languages and language repris in Philosophical Papers, vol. I, New York, Oxford University Press, chap. 11, p. 163-188. McKelvey Richard D. [1988], Evolutionary explanations of rationality paradoxes , communication au IMSS Summer Seminar on Economic Theory , mimo, Universit Stanford, 16 aot. Meggido N. [1986], Remarks on bounded rationality , IBM Research Report RJ 54310. Milgrom Paul [1981], An axiomatic characterization of Common knowledge , Econometrica, 49 (1), janvier, p. 219-222. Milgrom Paul, Roberts John [1982], Prdation, reputation, and entry deterrence , Journal of Economic Theory, 27, p. 280-312. Orlan Andr [1986], Mimtisme et anticipations rationnelles : une perspective keynsienne , Recherches conomiques de Louvain, 1 , mars. Orlan Andr [1988], Contagion mimtique et bulles spculatives , mimo. Rawls John [1987], Thorie de la justice, Paris, Le Seuil. Rosenthal Robert W. [1981], Games of perfect information, predatory pricing and the chain-store paradox , Journal of Economic Theory, 25, p. 92-100. Schelling Thomas C. [1960], The strategy of conflict, Cambridge (Mass.), Harvard Univers ity Press. Schiffer S. [1972], Meaning, Oxford, Clarendon Press. 399

Revue conomique Schotter Andrew [1981], The economic theory of social institutions, New York, Cambridge University Press. Schotter Andrew [1983], Why take a^game theoretical approach to economics ? Institu tions,economics and game theory , Economie applique, 36, p. 673-695. Selten Reinhard [1978], The chain-store paradox , Theory and decision, 9, p. 127-159. Sperber Dan, Wilson Deirdre [1986], Relevance, Oxford, Basil Blackwell. Ullman-Margalit Edna [1978], The emergence of norms, New York, Oxford University Press. Walliser Bernard [1985], Anticipations, quilibres et rationalit conomique, Paris, Calmann-Lvy. Walliser Bernard [1988], La formalisation des connaissances en logique et en conomie , mimo, septembre. Williamson Oliver [1975], Markets and hierarchies, New York, Free Press.