Vous êtes sur la page 1sur 158
Dans la méme collection HISTOIRE Frangoise Hildesheimer, Du Siécle d'or au Grand Siécle LiEtat en France et en Espagne, XVE-XVIF sicle Christophe Hugoniot, Rome on Afrique. De la chute de Carthage auex débuts de la conquéte arabe Annie Jourdan, L’Empire de Napoléon. Sabrina Mervin, Histoire de slam. Fondements et doctrine, SCIENCES Patrice David, Sarah Samadi, La Théorie de Pécoluton. Une Togique pour la biologie PHILOSOPHIE ‘Anouk Barberousse, Max Kistler, Pascal Ludwig, La Philo sophie des sconces au XX* sil Gaél Giraud La théorie des jeux oNomiE 5 ChampsUNiversiTé Flammarion ‘Ancien éleve de I'licole normale supérioure et diplomé de VENSAE, docteur en mathématiques, Gaél Giraud est chargé de recherches au CNRS. ‘© Flammarion, 2000 ISBN :2-08-083001-5 AVERTISSEMENT. A Catherine, Yoete et Aurile Autant prévenir le lecteur tout de suite : ce livre n'est ni tun cours de mathématiques ni un recueil de recettes des- tiné a vous permetire d’écumer les casinos de la céte ouest. Tout au plus s'agit-il une introduction infor- melle & certains thémes d’une branche des mathéma- tiques appliquées qu’il est convenu de nommet la théorie des jue, Le caractére introductif du propos signifie que je n'aborde que tangentiellement les questions qui font l'ob- jet de recherches contemporaines actives, aspect informel veut dire que le lecteur ne trouvera (presque) aucune demonstration compléte dans ce livre. Une bibliographie ‘qui, sans viser aucunement I'exhaustivité, est relativement abondante *, devrait li permetre de satsfaire sa curiosité ct sa soif de rigueur. En revanche, ce petit livre permettra au lecteur de découvrir deux ou trois choses utiles : qu'un général d’armée ferait mieux de s’en remeutre au jet d’une pice de monnaie avant de prendre une décision ; que le ‘meilleur moyen de vendre votre appartement consiste a Je coder, certes, au plus offrant, mais au prix offert par le second acheteur ; que attribution du droit de vote aux étrangers n’a, en réalité, aucune incidence sur P'ssue des Alections ; qu'un systéme fiscal optimal devrait avoir un * Ble est leurs divisée en deus parties: es ferences clasigues sont répertorées dans une bibliographic 4 la finde Pourragey 9.307, tuna qu les articles pls spéciliss soot eéerencés dn les notes 6 LATHEORIE DES JEUX ‘taux marginal d’imposition supérieur & 50 % ; que vous ne sgagnez pas forcément a étre mieux informé lorsque vous boursicotez sur Internet ; que la solution de Salomon au dilemme qui porte son nom est « fausse »; que vous avez raison, en revanche, de trouver suspectes les prétendues vertus économiques du « laiser-faire »... ‘Autrement dit, vous ne tarderez pas a vous rendre compte que le propos de la théoric des jeux dépasse trés Jargement le cadre étroit des jeux de société ~ méme si ces derniers ont constitué son premier objet d’étude et Iuj ont donné son nom. Les pages qui suivent sont issues, en grande partie, de notes rédigées a Voccasion de cours dispensés aux Ecoles normales supérieures d’Ulm et de Fontenay, a 'Ecole nationale de la statistique et de I’administration écono- mique, aux universités Paris-I (Panthéon-Sorbonne), Paris-II (Assas) et Louis Pasteur (Strasbourg), ainsi qu'a Université catholique de Louvain-la-Neuve (Belgique) cet au lycée Saint-Charles-Lwanga (Tchad). Ce livre doit done beaucoup aux remarques des éléves et des éru- diants que j'ai eu la chance de cétoyer. Qu'lls en soient remerciés. Jexprime aussi ma reconnaissance ceux qui ‘mont enseigné la plus grande part de ce que je connais de la théorie des jeux : Francoise Forges, Jean-Francois Mertens et Sylvain Sorin. Enfin, ce livre doit beaucoup & ‘mes amis et collégues, de qui j'ai appris le reste : Jean- ‘Michel Coulomb, Fabrizio Germano, Thomas Mariotti, Stefano de Michelis, Céline Rochon, Dinah Rosenberg, Hubert Stahn, Tristan Tomala, et d’autres qui me par- donneront de ne pas tous les nommer ici. INTRODUCTION Figure 0.18 Figure 0.16 Figure 0.1¢ LE CHAOS ET APRES? 1, Le solitaire de Schelling Je suggérerai fréquemment au lecteur, dans ce livre, de se ‘munir d'un crayon pour étudier un exemple, Pour com- ‘mencer, je souhaiterais done Pinviter a se procurer un cexemplaire d’un jeu trés connu, le solitaire de Schelling, ou d en dessiner un. Les régles du jeu sont les suivantes chaque pion représente un individu entouré des huit (parfois cing, plus rarement trois, selon que l'individu se trouve sur le bord ou dans un angle de léchiquier) autres individus qui constituent ses voisins. Chaque individu exerce une externalité sur ses voisins : les Noirs ne sont pleinement « heureux + que lorsqu'un tiers exactement de leurs voisins sont des Noirs. Les Blancs, eux, révent d'un monde dans lequel la moitié de leurs voisins seraient des Blancs. Partant d’un échiquier oii Blancs et ‘Noirs sont répartis uniformément (figure 0.1a), étez au hasard quelques pions répartis a peu prés équitablement igure 0.16), Il est clair que Ia situation n'est pas optimale : vous ourriez améliorer en autorisant chaque individu a se déplacer vers une case qui lui est plus favorable, compte tenu des externalités exercées sur lui par ses voisins Dans Micromotives and Macrobehavior, Schelling prétend qu’en modifiant la configuration de Véchiquier de maniére 4 minimiser le nombre d’individus mécontents de leur sort, vous convergerez & peu prés inéluctable- 10 LATHEORIE DES JEUX ‘ment vers une situation dichotomique du gente de la figure 0.1c. Essayer ! L’intérét de cette petite expérience est de vous convainere qu'un ordre relauif peut apparaitre de facon spontange dans une situation initialement chao- tique. En effet, aucun des individus présents sur ’échi- uier, pris isolément, ne peut étre tenu pour responsable de Pévolution d’ensemble des répartitions. Or vous aver fait quressayer de suivre les indications contenues dans la description des préférences des individus. ‘Si je ne eraignais de caricaturer, je dirais que la théo- rie des jeux est essentiellement préoccupée par ce type de problématique : comment un semblant d’s ordre » peut= il émerger dune situation apparemment chaotique sans qu'aucune intention directrice extériewre aux préfé- rences particuliéres de chaque individu ne puisse étre ‘enue pour responsable de ladite émergence ? Vous me direz sans doute que la conclusion de Schelling dépend fortement de la définition adoptée d'une situation cordonnée. Vous ne manquerez pas non plus ~ comme, du reste, Schelling lui-eméme - de remarquer que, si l'on s'en tient aux préférences des individus, la situstion finale a laquelle vous avez abouti est moins + bonne » que Pétat initial de Véchiquier. Enfin, fondamentalement, quand bien méme la répartition finale pourrait tre jugée meilleure que Métat initial de échiquier, vous avez dépensé de énergie pour déplacer chaque pion, de sorte que Pentropie du systéme global que vous constituez avec cet échiquier n’a pu évoluer que dans un sens conforme au deuxiéme principe de la thermodyna- mique ', Et vous aurez sans doute raison ! Pourtant, c'est précisément a élucider les conditions apparition d’un ordre spontané au sein du chaos que sévertuent les théoriciens des jeux. Pour cela, ils com- ‘menceront par vous faire observer qu’avant toute chose, vous devriez formuler un critére rigoureux qui permette apprécier et de comparer entre elles différentes confi- gurations de pions sur léchiquier. Quand et comment décider que telle configuration est « meilleure + qu'une stRopucrion nt autre ? Vous serez sans doute amené a vouloir attribuer des points au nombre de voisins de telle ou telle couleur qui entourent chaque pion, et vouloir les sommer. Mais, &tes-vous certain quill s’agit 1d du + bon « critére ? Pourquoi ne pas compter le nombre d’individus pleine- ‘ment « heureux + (s'il y en a!) et, par exemple, chercher 4 maximiser ce nombre-la? Pourquoi ne pas vouloir, au contraire, minimiser le nombre de pions « malheureux + ? Une fois que vous vous serez mis d’accord sur ce u’est un optimum, les théoriciens des jeux vous deman- deront de réfléchir aux raisons pour lesquelles, alors que vous avez laissé chaque individu libre de choisir sa case (Gi vous faites Vexpérience plusieurs fois, vous vous ren- drez compte que l'ordre dans lequel vous déplacez les pions n'a quasiment aucune importance), la situation n'a fait qu’empirer, alors méme qu'il vous est impossible de nier qu'une certaine logique immanente venait au jour, peu peu, dans la disposition des pions. C’est li un autre probléme important de la théorie des jeux : d’oi vient cet ‘ordre spontané ? Et a quelles conditions conduit-il une situation que nous jugeons « optimale ? Comment évi- ter de le laisser converger vers des états sous-optimaux ? 2. La théorie des jeux et les « Modernes » Ces questions, vous ne serez certes pas le premier & vous les poser. C’est aussi, d'une certaine maniere, celles que se pose la philosophie politique depuis au moins mois sigcles ~ et c'est a ce titre que la théorie des jeux a quelque chose d’essentiel dire aux sciences sociales. I] suffit, pour s’en convaincre, de relire ces lignes célébres de essayist francais Benjamin Constant, Entre deux disputes sentimentales avec Mme de Staél, Constant prononce devant P’Athénée royale de Paris, en 1819, un discours au sujet » De Ia liberté des Anciens comparée celle des Modernes », dont certains, depuis lors, ont fait Yun des actes fondateurs de Ia modernité philosophique. 12 LA THEORIE DES JEUX TT y est expliqué qu’a 'époque des + Anciens », « rien n'[était] accordé a independance individuell, ni sous le rapport des opinions, ni sous celui de l'industrie, ni sur- {oUt sous le rapport de la religion. « Or, « notre liberté & nous {les Modernes) doit se composer de la jouissance paisible de Vindépendance privée +. Et le futur auteur Adolphe de remarquer que « le danger de la iberté moderne, c'est qu'absorbés dans la jouissance de notre indépendance privée, et dans la poursuite de nos intéréts, particuliers, nous ne renoncions top facilement & notre doit de partage dans le pouvoit politique + Pour le dire en quelques mots ?~ et au risque de cari- caturer - le sidcle des Lumiéres, en mettant & mal la vision d'une société hirarchisée autour dune monarchie de droit divin, laisse un grand vide au sein de la pensée politique : puisque le roi n'est plus, quelle instance va désormais garantir la sécurité, le bonheur, la quiétude. des citoyens ? Une fois le monde » désenchanté «, il ne reste plus 4 Candide qu’a remiser la Monadologic de Leibniz, et se chercher un substiut a Pautorté divine Autrement dit, ce que découvre 'Aufklirung, c'est que le bien commun n'est pas donné parla Nature, la Tradition, ou par Dieu, de sorte que la question posée aux penseurs politiques devient la suivante : existe-til quelque chose comme un « bien commun » ? Et, si oui, comment Pat- teindre ? La citation, extrsite d’um article paru dans le Guardian (25 mai 1988), sous la plume de Bryan Gould, un des ténors du part travalliste, prouve, s'il était besoin, com- bien cette problématique est d’actualité «Pour Mme Thatcher, “il n'existe rien de tel que la société” n'y a qu'une collection atomisée d’individus, chacun pour- ‘suivant sans reliche son intérét particulier, certains y parve- rant, d'autres échouant dans leur entreprie, sans qu’aucun ne reconnaisse le moindre objectf ou la moindre responsabi- lite communs rneraopucTION B On s'en doute, si aucune instance transcendante ne garantit plus Vordre social régi par la poursuite d'un + bien commun » clairement repéré, le risque encouru n’est autre que le chaos social. A moins qu'une alterna- tive a Iharmonie leibnizienne ne puisse étre identifie, Sous la plume des empiristes anglo-saxons, et particulié- rement d’Adam Smith, activement mis contribution ar un parti comme celui de Mme Thatcher, c'est le ‘marché + qui sera investi de "extraordinaire privilege de devoir servir d’ersatz a Mharmonie préctablie, Pourquoi une institution telle que le marché ? Parce ‘que, du moins est-ce ce que eroit le moraliste écossais, un systéme de prix décentralisés suffit a transmettre toute information pour que la poursuite de Pintérét privé de chaque individu concoure indirectement & 'harmonie sociale. Plus besoin d'intervention divine : le marché, désormais, se charge de faire émerger Vordre, exactement comme vous Paver fait en jouant au solitaire de Schelling. Rien d’étonnant, dans ces conditions, si le marché se voit si souvent accorder les attributs de omniscience («Tout ce qui est savoir est déja su par le marché, il suffi d’ob- server les prix »), de omnipotence (+ Impossible de lut- ter contre les forces du marché ») et de la bénévolence (« Ce qui est bon pour General Motors... +) (On notera que, d'une certaine maniére, c'est & une question analogue que se trouvent confrontés les grandes -métropoles d’Afrique noite et certains pays d'Europe de Est aujourd"hui. Au « ciment » social que constituaient la Tradition des uns et Ia loi du Parti des autres, les ‘«modernes » Occidentaux n'ont rien d'autre & substituer (du moins est-ce ce que croient le FMI et la Banque mondiale) que le marché. Or, la mort du Roi (qui n’est autre que la traduction politique de la « mort de Dieu ») laisse également place & lune autre tradition de pensée, plus proche de Rousseau et de Kant, et qui se fonde, cette fois, non plus sur I'in- dépendance d’individus isolés, réduits 4 l'état de monades leibniziennes, mais sur V’awonomie des per- 4 LA THEORIE DES JEUX sonnes, en vertu de laquelle les limites imposées a la liberté ne sauraient avoir d'autre fondement que la volomté de se les imposer a soi-méme. De fait, imaginez qu’aprés avoir constaté que vos expériences menaient généralement & des situations sous-optimales, vous décidiez de consulter chaque pion sur la procédure a mettre en ceuvre afin de jouer conve- nablement au solitaire de Schelling. En cela, vous reste- rez fidele a esprit de Constant qui, en face du droit pour chacun + de disposer de sa propriété, d’en abuser ‘méme, daller et venir (...] sans rendre compte de ses motifs ou de ses démarches », souligne Nimportance du « droit, pour chacun, dinfluer sur administration du gouvernement, soit par la nomination de tous ou de cer- tains fonctionnaires, soit par des représentations, des pétitions, des demandes, que l'aucorité est plus ou ‘moins obligée de prendre en considération », Quel type de + contrat social »allez-vous proposer 4 vos pions, qui leur permettrait de sortir de I+ état de nature + dans Iequel nous les avions laissés jusque-li? Serez-vous satisfait de constater, au terme de la procédure que vous ‘urez mise en place, que chacun deux s'est « donne a lui-méme + la configuration éventuellement sous-opti- male a laquelle vous setez parvenu ? Eat-il été finale- ment préférable de vous laisser administrer de facon autoritaire Pévolution de Péchiquier ? 3. Des mathématiques au service de Ia société ? Le probléme qui se pose & nous est donc le suivant, ‘Comment concilier ces trois termes : harmonic sociale, la liberté des individus et Pautonomie des personnes ? Pour le dire en d'autres termes : comment coneilier cette exigence d'indépendance inscrite dans la vision indivi- dualiste d'un monde social composé d’atomes isolés (ce que Constant nomme « liberté des Modernes + et ce que Mme Thatcher, relue par Bryan Gould, semble tenir retRopucon 15 pour 'alpha et Yoméga de Ia réalité sociale) avec lexis tence indispensable ~ si Pon veut échapper au chaos ~ de normes induisant inévitablement une limitation imposée Pindividualité ? Nous allons voir que la théorie des jeux peut se lire aujourd'hui ~ et ce sera le fl d’Ariane de ce livre ~ comme une tentative de réponse rigoureuse & cette difficile question, Diune certaine maniére, les théories économiques centrées autour de articulation de marchés décentrali- sés, et dont Adam Smith est l'un des prophétes les plus connus, prétendent apporter une réponse au probléme essentiel auguel les sociétés modernes se trouvent confrontées. C’est la raison pour laquelle Ia théorie des jeux peut sans doute difficilement se comprendre en dehors du dialogue qu’elle établit avec les sciences éco- nomiques ~ et ce, en dépit de la réticence légitime gu’éprouvent certains mathématiciens & reconnaitre que leur travail n'est pas étranger aux préoccupations philo- sophiques et économiques de leur époque. ‘Comme le remarque Constant, » perdu dans la multi- tude, 'individu n’apergoit presque jamais Pinfluence qu'il cexerce + sil ne pergoit pas, en particulier, Pinfluence qu'il cexerce sur le systime des prix en vigueur sur un marché, ct peut a bon droit se servir d'un tel systéme de prix comme d’une référence extérieure intangible, susceptible d'imposer des normes « d’en haut », Cependant ~ et c'est ‘ce qui distingue le marché des instances extérieures de le philosophie politique + pré-moderne + ~ nul ne peut étre tenu pour responsable de tel systéme de prix plutét que de tel autre. Mieux : dans la mesure oi ces prix sont le résultat de la confrontation d'une offre et d'une demande, et done du comportement des individus eux-mémes, il faut, en toute rigueur, les considérer comme immanents ‘ila sphére des individus, c'est-i-dire comme venus « d’en bas «. Bt voilé la quadrature du cercle réalisée ! Bien entendu, une fois que l'on a dit cela, on n'a fait qu’énoncer le probléme & résoudre. Car tout est & démonarer dans cette prétention du marché régir ensemble d'une 16 LATHEORIE DES JEUX société en lieu et place de la Providence. Des lors, les mémes questions que celles que nous nous posions nai- vement 4 propos du solitaire de Schelling resurgissent comment caractériser un ordre social optimal ? Léequilibre des marchés, s'il existe, permet-il de faire émerger spontanément cet ordre du chaos des intéréts contradictoires des individus qui composent une société? Cette transcendance immanente que les prix décentralisés auraient vocation a représenter est-elle vrai- ment ce qu’elle prétend étre, c’est-d-dire @ la fois indé- pendante de Ia volonté de chacun, et issue pourtant du comportement autonome de tous? Et si notre réponse devait étre sinon négative du moins réservée, quelle pro- cédure alternative imaginer qui puisse faire advenir, au sein de espace social, ce monstre que constituerait une instance & la fois normative et immanente, et dont nous avons pourtant besoin ? Beaucoup de mathématiciens, je I'ai dit, répugnent & voir leurs théories évoquées (généralement dans la plus grande confusion) au sujet de « débats de société. Cette apparente frilosité se comprend aisément :il y a souvent un malentendu sur le rdle prété aux mathématiques dans ce type de « débats de société ». En premier lieu, un théo- réme ne dit rien au sens propre : dans la mesure of il déduit un certain nombre de conclusions des prémisses u'll s'est données, il s’agit ni plus ni moins dune tauto- logie. L’ennui est que l'on fait souvent grief aux mathé- maticiens de parvenir 4 des conclusions désagréables, sans apercevoir que la difficulté principale se trouve dans le lien entre ce que Fon vise et les prémisses utilisées ou Jes enseignements que l’on croit devoir tirer des conclu- sions obtenues et nom, évidemment, dans la chaine de rai sonnements qui a permis de déduire ces conclusions de ces ‘primisses, C'est particuliérement vrai dans un domaine ‘comme la théorie des jeux ou ’on est facilement tenté accuser le théoricien des jeux de promouvoir un modéle organisation du monde social fondé sur une espéce de ‘cynisme machiavélique qui, en réalité, lui est étranger. stRopucrion 1" Par ailleurs, 1a mobilisation des mathématiques par ddes non-spécialistes conduit souvent a des malentendus quand il ne s'agit pas de forfairures #. L’ennui est que, dune certaine maniére, « le mal est déja fait » : on invoque souvent les mathématiques comme garantes de la légitimité des économies de marché dans leur préten- tion a régir intégralement Vordre social. Un seul exemple, trés simple, suffira pour le moment 4 illustrer mon propos. Il est exact qu’en mécanique tout systéme isolé tend vers une situation d’équilibre et que, économie mathématique empruntant une part sub= stantielle de ses outils d’analyse a la physique, la plus grande part des théories dynamiques qu'elle élabore s'évertue a montrer comment un systéme économique devrait évoluer vers telle situation d’équilibre si les hhypothéses que nous avons utilisées pour le décrie Gtaient exactes. Seulement, cela ne veut absolument pas dire que l'équilibre vers lequel convergerait notre sys- téme en absence de toute intervention extérieure (de Etat par exemple) est intéressant, ni méme souhai- table ! Ilse peut fort bien que nous arrivions a la conclu- sion que le marché, abandonné & lui-méme, comme peut Pétre un systéme physique isolé, converge vers un équilibre catastrophique : n’est-ce pas précisément ce que nous avions observé @ propos du solitaire de Schelling ? 4. Jeux coopératifs ou non coopératifs Si la premiére question a laquelle la théorie des jeux sSefforce de répondre ~ comment définir un « bien com- ‘mun +, ou encore : quels sont les critéres d’optimalité de notre systéme? — est cruciale, Ia seconde ne lest pas ‘moins : comment metire en @euvre conerétement ce bien commun ? Ou encore : dans quelles conditions notre sys- téme dynamique risque+-il de converger vers un état sta- tionnaire optimal ? 18 LA THEORE DES BUX Une bonne maniére d’envisager le probleme est de supposer que la société que nous considérons admet un ensemble d’états possibles a priori connu de tous. Notons F cet ensemble. Il peut s'agir aussi bien des différentes ‘maniéres de répartir le PIB au sein d’une économie natio- nale que des différents modes d'organisation d'une République (fauc-il instituer la separation des pouvoits ?) ‘ou encore des diverses répartitions des bénéfices d'une centreprise (entre actionnaires et salariés par exemple) ou méme des modes de gestion possibles des confit latents du couple Bill/Alice?... L'essentiel est que l'ensemble F ne fasse pas Vobjet de débats, et puisse servir de point de depart notre discussion. Bien entendu, chaque citoyen @ tune appréciation subjective qui lui est propre des diffé- rents tats possibles appartenant & F, Louis XVI et le Parlement accordaient certainement une valeur différente au régime parlementaire et & la séparation des pouvoirs Actionnaires et salariés d’une entreprise ne participent pas non plus de la méme fagon a l'engouement récent our les stack options... Cet antagonisme des points de vue sur les différents états de F est une condition nécessaire our que la théorie des jeux ait quelque chose d’intelli- ‘ent & dire ! Si out le monde était d’accord sur Tobjectf, i n’y aurait plus besoin de faire de la théorie des jeux : il suffrait de sélectionner l'état de F qui est unanimement préféré par tous les citoyens et de le mettre en euvre La partie de la théorie des jeux qui soccupe de la détermination des éléments socialement préférables de ensemble F est souvent dite « coopérative » (ou + coali- tionnelle »). La partie dite, au contraire, + non coopéra- tive » (ou « stratégique ») s'intéresse 4 la mise en ceuvre des solutions préconisées par la théorie des jeux coopé- ratifs. Un jeu est + coopératif + lorsqu'll autorise des contrats qui ont force de loi. Autrement dit : lorsque l'on ne se soucie pas de la mise en ceuvre des solutions que ‘Pon tient pour + bonnes ». Une solution coopérative aux problémes de ménage de Bill et d’Alice peut se voir comme un contrat que signerait chacune des deux par- INTRODUCTION 19 ties od, par exemple, Bill s’engagerait & ne jamais se pro- ‘mener dans les mauvais quartiers de New York la nuit, tandis qu’Alice prometirait de ne plus faire de réve licen cieux. Négliger la question de la mise en ceuvre pratique d'un tel contrat ~ et en particulier des motivations qui pourraient inciter l'un et "autre A tenir sa promesse sur Te long terme -, c’est supposer implicitement qu'il existe quelque chose comme une « police » des meeurs qui, si nécessaire, pourra toujours contraindre les deux signa- taires a respecter leurs engagements conjugaux. La théorie des jeux non coopératifs, elle, s'intéresse précisément aux raisons profondes pour lesquelles Bill pourrait bien résister 4 ses tentations nocturnes. Autrement dit, elle suppose qu’aucun contrat n'a force de loi, et focalise son attention sur le détail des négocia- tions qui président au maintien d'un modus non moriendi entre les deux époux. En contrepartie, la théorie des jeux non coopératifs ne s‘interroge pas directement sur la nature du « bien commun + sur lequel Bill et Alice pour- raient s'entendre. Elle se borne décrire dans quelles conditions tel ou tel contrat sera + crédible », ati sens ot ses signataires auront de bonnes raisons de le respecter. Cette distinction entre jeux « coopératifs » et jeux « stratégiques + préte souvent a confusion. Essayons de la dissiper pour partie. Tout d’abord, cette distinetion ne signifie nullement que les comportements que nous concevons intuitivement comme + coopératifs +, au sens of ils induisent une part de sacrifice de nos intéréts propres au profit d’un bien jugé supérieur, ne pourront apparaitre que dans le cadre des jeux coopératifs, au contraire ! Les jeux stratégiques, comme nous le ver- rons, se soucient beaucoup (sinon principalement) de Papparition endogéne de tels comportements (par exemple, dans le cadre des » jeux répétés », voir cha- pitre Iv). Inversement, les jeux coopératifs sont eres attentifs au respect des intéréts des individus. C'est la d'ailleurs l'une des difficultés principales qu'il leur faut affronter : si sacrifice individuel pour le bien commun il 20 LA THEORIE DES JEUX doit y avoir, qui doit se sacrifier ? Et pourquoi tel indi- vidu plut6t que tel autre ? La distinction coopératif versus non coopératif ne stidentifie pas davantage avec la dualité, classique en sciences sociales, entre holisme et individualisme : la théorie des jeux, dans sa toralté, 'interroge sur les fon- dements d'une organisation holiste du corps social qui puisse émerger d’une vision strictement individualiste de ccelui-ci. Le caractére coopératif ou non des jeux que 'on choisit d’étudier correspond seulement a deux maniéres différentes de sinterroger. Enfin, le fait qu’il y soit sou- vent question de coalitions ’individus n’est pas non plus Ja marque distinctive de la théorie des jeux coopératifs : ‘méme dans un cadre rigoureusement non coopératif, il est important de considérer la formation stratégique de ‘groupes de joueurs qui pourraient décider de mettre une partie de leurs intéréts en commun (pourva qu’ils soient tous convaincus d'y trouver leur compte, c'est-i-dire avoir une incitation a respecter leurs engagements au sein du groupe). (On pourrait étre tenté d’assimiler la théorie coopéra- tive & une analyse normative des faits sociaux et la seconde a une vision positive. Mais c'est, la encore, un amalgame dangereux car, comme nous aurons occasion de le constater & plusieurs reprises, méme les jeux straté- sgiques ne prétendent pas fournir une description du com- portement rationnel de groupes d'individus, et leur interprétation, le plus souvent, n'est pas exempte de toute considération normative. Avant d’entrer le vif du sujet, survolons rapidement le plan de cet ouvrage. Les trois premiers chapitres appar- tiennent indéniablement a la partie coopérative de la théorie des jeux. Ils s'efforcent d’introduire aux notions essentielles que sont le cur, le bargaining set, le nucleo Jus la valeur, et donnent quelques intuitions sur les théo- rémes d’équivalence (ou de non-équivalence) avec les équilibres walrasiens. Les quatre chapitres suivants, eux, relevent incontestablement de la théorie des jeux non irooucrion 21 coopératifs et peuvent étre lus indépendamment des trois premiers. Ils rendent compte des aspects les plus essen- tiels des jeux stratégiques sous forme normale et sous forme extensive, des jeux répétés, des jeux a information asymétrique et des raffinements de équilibre de Nash. Les chapitres vil et tx peuvent étre considérés comme ds illustrations de Timbrication complémentaire du point de vue coopératif et de approche stratégique. La connaissance des chapitres précédents facilitera la com- prehension des questions qui y sont abordées, méme s'il est vrai que le noyau dur de la théorie des jeux coopéra- tifs n'y est pas vraiment mis 4 contribution, Les deux derniers chapitres sont des introductions a certaines classes de problémes qui n’ont éré évoqués que succine- tement dans ce qui précéde. Ils ont fait objet, au cours de la derniére décennie, de développements tellement substantiels qu’ls méritent désormais un traitement par- ticulier. On y trouvera des matériaux concernant la théo- rie des jeux épistemique, Ia complexité et les jeux évolutionnaires, qui ne pouvaient évidemment pas figu- rer au sommaire du premier manuel de théorie des jeux, publié en 1952 par John Charles C. McKinsey 7, et qui noccupent qu’une maigre place dans le manuel de second cycle qui, il y a dix ans, fut 'un des premiers & intégrer la théorie des jeux dans lenseignement de la ‘micro-économie — je veux parler, bien sir, du manuel de David M. Kreps®, Faute de place, deux aspects importants ne sont pas abordés dans le corps de ce livre : il s'agit de la théorie des jeux expérimentale d’une part, et des débats qui tournent autour des philosophies du contrat social a la Rawls d'autre part. La premiére de ces deux questions est succintement abordée dans le glossaire critique qui clot cet ouvrage. Pour Ia seconde, je ne peux que ren- voyer le lecteur a louvrage trés accessible de Ken Binmore®, CHAPITRE 1 LA COOPERATION La premitre question a laquelle la théorie des jeux s'ef- force de répondre est la suivante : comment définir un «bien commun 4 un groupe d’individus ayant des inté- réts contradictoires » ? A cette interrogation, ce chapitre apporte quelques premiers éléments de réponse. 1. Le cour Une fois défini ensemble F unanimement considéré comme représentant toutes les solutions possibles du probléme que nous cherchons résoudre, il nous faut determiner des critéres qui permettent de sélectionner le ‘meilleur » état possible, compte tenu des appréciations diverses et contradictoires dont F fait objet par les dif- férents citoyens en présence. Supposons que cette appré- ciation puisse se mesurer au moyen d’une fonction U, definie sur F et prenant ses valeurs dans R (le corps des réels). Ainsi, sila société que nous considérons comporte N individus © I= {1,..., Nj, et six F est issue sélec- tionnée, U(x) est la + valeur» accordée par le joueur ia x. Bien des débats tournent autour du sens qu’il convient d'accorder 8 cette mesure de la « valeur » d'un élément x par Vindividu i. Nous aborderons certaines pieces de ce dossier délicat dans les chapitres qui suivent. Contentons-nous, pour Pinstant, d’admertre qu'une telle fonction U, puisse se construire pour chaque i, et que, si ey LATTHEORIE DES JEUX chaque individu avait le pouvoir d'imposer sa volonté faux autres (quitte, au besoin, & la faire passer pour la ‘ volonté générale») il choisiait rout simplement issue x qui maximise UC. ‘Un premier crtére qui vient & esprit, et qui est da au sociologue italien Vilfredo Pareto, est celui de Poptima- lité qui porte son nom. Considérons deux issues x et ys appartenant toutes deux & F, et supposons que, pour chaque individu i, on ait la situation suivante V5, UG) 2 UG). En dautres termes, aucun citoyen de la Cité ne serait lésé si Pon substituat Métat y a Pat x Supposons, de surcroit, quil existe au moins une per- sonne j¢ I qui préfére strictement y a x : Uj) > U0. Dans ces conditions, on ne voit vraiment pas ce qui devrait retenir le législateur de proposer y plutot que x. Appelons une tele réforme une amélioration paretienne de x. Un optimum de Pareto est alors une issue » réalisable G.e., appartenant & F) qui n'admet aucune amélioration paretienne. La Pareto-optimalité est & comprendre comme une condition sine qua non, un minimum minimorwm, sans lequel le concept de solution d'un jeu coopératif que nous cherchons & élaborer devrait éue immédiatement rejeté. De plus, si la Pareto-optimalité est bien une condition nécessaire que doit vérifier toute + bonne + issue tirge de F, elle n'est pas sulfisante : supposez que Bill Gates parvienne a accaparer la toalité de toutes les richesses disponibles sur la planéte, et qu'il ne reste méme plus de quoi secourir les populations qui crient famine en Erythrée. C'est une organisation Pareto- coptimale des richesses! ‘Une formulation équivalente du ertére «’optimalité paretienne fait bien sentir que celui-invimplique aucune ‘ment un traitement «égalitaire » des indvidus qui compo- sent notre société. Prenez un vecteur A = (hs yhy) dans RX, et maximisez la somme pondérée des utltes de tous es joueurs E, 2,U, sur ensemble des réalisables. Toute solution que’ vous pourrez obtenir (éventuellement en La coorranion 25 faisant varier Je vecteur 2) est un optimum de Pareto. Inversement, & tout optimum correspond un vecteur de « poids ¢ relatif & tel que ledit optimum puisse étre vu ‘comme une solution au probléme d’optimisation précé- dent. Or, si chaque coordonnée du vecteur A doit étre strictement positive (ce qui veut dire, certes, qu’aucun individu n’est « oublié»), elle peut néanmoins devenir arbitrairement proche de 0 (ce qui veut dire que certains individus peuvent avoir moins de + poids » social que d'autres, et méme devenir complétement négligeables par rapport a certains de leurs concitoyens). En quoi le critére d’optimalité paretienne n’est-il pas pleinement satisfaisant ? C’est qu'il existe une coalition diindividus (le syndicat de défense des paysans éry- thréens par exemple) qui pourrait proposer une redistri- bution des richesses qui, certes, ne soit pas favorable 4 Bill Gates, mais qui soit favorable & chacun des membres de ladite coalition. Autrement dit, le défaut de optimum. de Pareto est de ne prendre en consideration que les inté- réts de sous les individus pris dans leur ensemble, et non. ceux de tel ou tel groupe d’agemts. Idéalement, il serait préférable qu’aucun groupement de joueurs ne puisse s'unir et proposer une réforme qui soit Pareto-améliorante ‘Pour le groupement en question. Deux remarques s/imposent : tout d’abord, on voit bien que ce ne sont pas des considérations d’ordre éthique qui, ic, commandent que I’on aille plus loin que la Pareto-optimalité dans notre recherche d'une défini- tion du e bien commun ». C’est bien plutét un souci de stabilité qui incite & dépasser le concept d’optimum de Pareto : si une coalition peut faire une proposition Pareto-améliorante pour alle-méme, optimum de Pareto que nous sélectionnerons au sein de l'ensemble F ne résistera guére a ce type de propositions. Ainsi, une déci- sion politique européenne qui ne recueillerait pas I'as- sentiment de la France au motif que celle-ci pourrait en Proposer une autre qui soit Pareto-améliorante pour les 26 TATHEORIE DES JEUX Frangais serait bien fragile... Seconde remarque : pour que ce critére puisse devenir opérationnel, il faut que chaque coalition ne puisse pas demander systématique- ent tout et n’importe quoi. Il faut donc que la contrainte de réalisabilité que nous avions précédem- ‘ment formalise via Vappartenance & ensemble F puisse se formuler pour chacune des coalitions susceptibles de proposer une réforme Pareto-améliorante Considérons I’ensemble 2" de toutes les coalitions possibles au sein de ensemble I= {1 N} des joueurs. Supposons que les contraintes de réalisabilité du jeu que nous analysons puissent se représenter par une fonction caratristiqu,cesta-dire une application V 2° + F(R), définie sur ensemble de toutes les coalitions de joueurs, eta valeurs dans l'ensemble de toutes les parties de RN, et qui définisse pour chaque groupuscule S € 26 l’en- semble des issues que tous les membres de la coalition S pourraient globalement obtenit sis étaient livrés a cux- mémes. Ainsi, V({I}) ¢ RN est l'ensemble (supposé fermé) de toutes les issues que peut s’assurer la» grande coalition » composée de tous les citoyens de la Cité, et correspond A ce que nous avions baptisé F plus haut. Au contraire, V({i}) est ensemble des issues que I'individu i peut obtenir en ne comptant sur aucune aide de la part du corps social auquel il appartient. Par convention, image de la coalition vide est l'ensemble vide. Dans ce cadre, un optimum de Pareto est une issue xe RN telle quil n'existe pas d'issue y pour laquelle ye VO) et y, > x, pour tous les membres i de la grande Coalition 1. Le caur (appelé aussi, parfois, le noyau) se définit alors comme l'ensemble de toutes les issues réali- sables qui ne peuvent étre contestées par aucune coali- tion. (Certains auteurs réservent I'appellation de noyau a ce que d'autres nomment le Rerna, et dont, faute de place, ii'ne sera pas question dans ce livre.) Formellement, il agit de Pensemble des issues x celles que +32 VC) avec 2,2 x, pour tout fe T (Cest la condition de réalisabilité), LAcoorERATION a * et il n’existe pas de paire (S, y) avec y € V(S) ety>a,Viel (cies a condition de robustesse par rapport aux propositions alternatives des coalition). Clairement, out élement dua caur est Pareto-optimal, mais la réciprogue exten général fausse. Un cas tivial ob Fon pourrait tre tenté de crore que route issue Paretor optimale est dans le coeur est celui ob I = {1, 2}. Pourtant, méme Billet Alice ont quelque chose gagmer, dans leurs négociations conjugates, 4 troquer le cour contre optimum de Pareto. En effet, la fonction carac+ téritique V nous renseigne sur ce que pourrait faire Bil sil cai celibataire + participer joyeusement aux orgies d'une secte new-vorkaise fait probablement partic de Vensemble V({Bill}). Une issue x sera dite individuelle- ‘ment raionnell si elle assure & chaque individu au moins autant de satisfaction quil pourrait en obtenir par ses propres ressources, autrement d,s VieL¥ ve Vl), x2y. Un élément du eceur est donc toujours individuelle- ment rationnel tandis que rien ne garantit qu'un opt ‘mum de Pareto le soit. Historiquement, Pun des premiers exemples appli cation du eteur remonte a 1962 : Gale et Shapley étu- diaient alors ce que Yon sppelle aujourdhui un proleme dle mariage. Le probléme peut se poser dele maniére sui vante : a quelles conditions est possible d'apparier N femmes et N hommes de telle sorte quil n’existe pas de paire consttuée d'un homme et d'une femme apparte- nant & des couples distines, et qui se préferent mutuel- Jement a leur conjoint? Le lecteur n'aura pas de mal & construire un jeu coopératifcorrespondant a cette situa- tion, et @ constater que la question posée se raméne celle de la non-vacuité du cur dudit jew coopera. Crest efectivement ce que frent Gale et Shapley !. De surcroit, ils exhibérent un algorithme permettant de trouver un élément du coeur. C'est ce dernier aspect de leue teavel qui retien Patrention aujourd'hui: Ia mise au 28 LAcTHEORIE DFS JEUX point d’algorithmes de plus en plus performants destinés 2 calculer les solutions de jeux (Finis) associés a des pro- blémes voisins du « probleme de mariage » fait objet d'intenses investigations qui relévent essentiellement de optimisation combinatoire. Le noyau a aussi été utilisé avec succés lors des déli- bérations qui ont présidé au choix de Pallocation des coats au sein du projet de la Tennessee Valley. Enfin, une autre application, non moins spectaculaire, du concept de cerur est due @ Roth qui, en 1984, démontra que la méthode de répartition des internes entre les hopitaux américains mise en ceuvre dans les années cinguante revenait a sélectionner systématiquement un point du noyau du jeu coopératif sous-jacent *! 2. Les jeux balancés Considérons le cas particulier oi la fonction V peut se déduire @’une autre fonction 9 : 2 — R de la fagon sui- vvante Pour toute coalition $I, on a: VS) = fee RN: Dx, < u(S)} Ce type de jeu coopératif est dit « utlité transfé- rable + (jeu UT pour faire court) dans la mesure oi ’en- semble des issues réalisables pour une coalition donnée S se résume a toutes les issues telles que la « somme » de ‘ce que regoit chaque membre de 1a coal ‘pas une certaine quantité fournie par o(S). Ltinterprétation Ja plus immédiate en est la suivante : les issues x du jew sont exprimées en euros, et o(S) est Ia quantité globale euros que peut obtenir la coalition S par ses propres moyens. Le caractére + transférable + de I'utilite provient du fait que chaque curo supplémentaire accordé a la coa- lition $ peut étre attribué aussi bien a Pagent # qu’d agent j (pourvu que tous deux fassent bien partie de S'), En d’autres termes, 'utilité accordée par un joueur 4 une issue peut étre transférée @ un autre joueur. II s'agit LA cooréaation 20 18, bien entendu, d'une hypothése héroique : supposons ue les issues en question soient les futurs programmes musicaux destings étre joués a Vopéra de votre ville natale 5 accepterez-vous de considérer que la valeur que vous accordez aux ceuvres vocales d’Arvo Part puisse se transférer en unités de valeur éprouvées par votre voisin pour les pitees Iyriques de Richard Wagner ? Parcile opération correspondait @ peu prés & additionner des degrés Celsius avec des kilojoules. existe toutefois des situations oi les jeux UT émer- gent plus ou moins naturellement : c'est le cas notam- ment des jewe coopératis de marchés associés 4 une économie d’échange. Supposons qu'une économie soit caractérisée par N individus, qui échangent L biens entre ‘eux, Chaque agent i dispose d'un panier intial de biens, ¢,¢ Rb et apprécie le panier final que lui permertront dobtenir les échanges auxquels il entend se livrer en vertu d'une fonction d’utilité U,: RE» R, qui associe & chaque vecteur x = (xy... x1) un réel représentant le degré de satisfaction que individu i retire du panier de biens x. Sion admet que la fonction U, est continue et concave, alors on peut définir un jeu UT associé a cette Economie de la maniére suivante : v(@) = 0 et, pour toute coalition non vide S, o(S) est égal au maximum de la somme des utiités que les membres de $ pourraient retirer de la consommation de biens sis étaient contrainis 4 wéchanger quientre eux. En. @autres termes, 0(S) est ‘Putte agrégée maximale que les membres de S peuvent s'assurer en redistribuant entre eux-mémes les dotations initiales de Ja coalition. Par ailleurs, méme dans un contexte ot leur interprétation est problématique, les jeux UT constituent un excellent repére pour nous orien ter dans notre enquéte, Pour de tels jeux, un élément x du caer doit dre ralisable (ie. tel que ¥, x, v( {})) et résis- ter aux protestations des coalitions (WZ, , x,> v(S)). Une condition nécessaire évidente pour que le coxur soit non vide est done que, pour toute partition (S,) de I en coa- litions (ée., pour toute famille de coalitions (S,) tele que 30 LA THEORIE DES J5UX union de toutes les S, soit égale & I et intersection de deux quelcongues d’entre elles soit vide), on ait @)E, v8) so). ‘Malheureusement, cette condition n’est pas suffsante : ainsi siN = 3, (S) = I pour toutes les coalitions composées dau moins deux joueurs et x({i})= 0 pour tout singleton {i}, alors la condition (1) est remplie mais le cceur est vide. En autres termes, la contrainte de réalisablité au niveau de la» grande coalition » I entre en confit avec la contrainte de robustesse a ’égard de chacune des coalitions : si les coali- tions sont « trop puissantes «i sera impossible de trouver tune allocation réalisable qui leur résiste, et le coeur sera vide. C'est li, du reste, la principale dificulté a laquelle se heurte usage de la notion de coeur: i s'agit ’un concept tellement exigeant qu'il est vide la plupart du temps ! Une condition suffisante de non-vacuité du cexur a rnéanmoins pu étre dégagée par Bondavera et par Shapley dans le cas UT, et par Scarf dans le cas général (que l'on désigne parfois comme +A utlité non transférable » [UNT] pour écarter toute ambiguité, bien que ce second cas ne soit pas incompatible avec le cas UT) ¢. Elle fait appel au caractére balancé (balanced) d'une famille de coalitions. Une collection (S,, .. S,) de coalitions est «alancée » sil existe des nombres Strictement positifs ‘ys ns hy tels que, pour chaque joueur i dans I, la somme de tous les , sur les indices h tels que # appartienne a la coalition S, soit égale a 1. Ils’agit la d'une généralisation de Vidée de partition. En effet, toute partition de I peut tre vue comme une famille balancée de coalitions cor- respondant a des poids 4, tous égaux 4 1. L’ensemble {1} affecté du poids 1, tout comme Ia partition discrete Ms {2}5 wf) of chaque élément a également une ‘masse unitaire, sont des familles balancées. Un exemple de famille balaneée qui ne soit pas une simple partition est donné par Ia collection de toutes les coalitions S, obtennes en oubliant le joueur hy k = 15 ..y N. (Dy a done N coali- tions, chacune comportant N~ 1 membres) I sufit, dans ce cas, de prendre chaque poids 2, égal a VN = 1. La notion de La coorearion a1 famille balancée de coalitions étant acquis, on définit un Jew quasi balancé comme étant un jeu coopératif tel que, ‘pour toute famille balancée de coalitions (S,,....8,)sl'in~ tersection des V(S,) pour h variant de 1 a est incluse dans V(), Enfin, un jeu balancé est tel que TAVS) cVO pour toute famille balancée. Tout jew balance est claire- ‘ment quasi balancé. Le résultat est alors que tout eu quasi balance admet un coeur non vide et que, dans le cas dum jew UT, ily a équivalence entre la non-vacuité du noyau et le caractire balance du jeu Pour comprendre d’oti provient une telle notion de famille (quasi) balancée de coslitions, il faut revenir & Péquation (1). Nous avons vu qu’elle constituait une condition nécessaire mais non suffisante de non-vacuité du coeur. L’intuition qui a mené les théoriciens des jeux jusqu’’ la notion de famille balancée est qu'il devrait suf- fire de généraiser Pinégaité (1) pour rendre cette condi- tion suffisante, Une manire de généraliser (1) est dexiger qu'elle soit vérifigée méme lorsque chaque coali- tion S, est affectée d'un poids A, compris entre 0 et 1 és lors, on en vient a imaginer qu'une condition di wpe: QE, AyoSp so) pourrait peut-étre faire Vaffaire. Ainsi, dans exemple & trois joueurs donné supra, imposer (2) a la famille de co: litions ((2,3}, {153}, {152}) affectée des coefficients 1/2 pour toutes les coalitions qui la composent implique ‘v(l) 2 1,5, et done garantit que le eceur est non vide. I! ne reste plus alors qu’a constater qu'imposer (2) pour niimporte quelle collection de coalitions et n'importe R et un vecteur de dotations initiles «, ¢ RE.'La corres- pondance caractéristique du jeu de marché associé cette économie océanique est définie dans Pencadré 3. 1, Je maximum étant calculé sur toutes Jes allocations x: (0)1] > RE qui sont intégrables ex qui vérifient la condition de réalisabilité (laquelle n’est autre, bien sti aque Pégalité de Vote et de la demande sur les marchés des L biens). ‘On peut alors montrer, a l'aide du tout premier théo- réme démontré par Aumann et Shapley (1974) que, sila fonction qui a j€ {0,1} et a x € RE associe le réel U(x) est contindment differentiable, alors ce jew de marché UT aadmet un carur qui est réduit un singleton, lequel, de sureoit, coincide avec Punigue allocation induite par la valeur. Le lecteur qui a lu le chapitre précédent en conclura facile- ment que cette économie d'échange admet un unique égui~ libre wealrasien, qui cotncide lui-méme avec le ceur et la valeur diu jeu! Méme si vous ne croyez pas au cur et méme si Ja valeur vous a laisse jusqu’a présent sceptique, cher lec- teur, rendez-vous donc evidence : tous les chemins que la théorie emprunte semblent converger vers 1a 4 LA THEORIE DES JEUX. « solution » du marché. C'est au point que Yon se demande comment échapper cette dernigre Un exemple illustre de maniére frappante ce que peut nous enseigner Pétude de la valeur d’un jeu océanique. Considérons un pays dans lequel les décisions de poli- tique publique sont soumises un vote a la majorite. Tous les citoyens votent, mais tout le monde n’est pas citoyen... Les + résidents » qui ne sont pas citoyens payent leurs impdts, mais n’ont pas le droit de vote. Les décisions publiques dont il est question ici concernent des biens publics non exclusifs, c'est-i-dire dont la jouissance par certains n’exclut pas que d'autres puis- sent en bénéficier. Siricio sensu, tous les biens dispo- nibles sur cette planéte Pétant, physiquement, en uantité finie, il n’existe pas de bien non exclusif, mais, un point de vue économique, on rend certainement mieux compte de la réalité en supposant, par exemple, que loxygéne que nous respirons est un bien non exclu- sif qu’en postulant le contraire. De méme, la sécurité aux frontieres qu’est supposée garantir une armée peut ‘bon droit étze tenue pour un bien public non exclusif, tout comme les ondes hertziennes qui permettent aux radios publiques d’émettre. En revanche, une piscine ‘municipale est un bien exclusif : il suffit de s'y rendre le dimanche matin pour s’en rendre compte! Pourquoi n’accorde-t-on pas le droit de vote & ces résidents, alors qu'on utilise leur impét pour financer des projets Publics qu’lls auront a subir, et sur lesquels ils n’ont aucun droit de regard ? La question mérite d’autant plus dPétre posée qu'il appert, si Pon en croit la théorie de la valeur de Shapley, que le vote des étrangers n'a, en réa- lité, aucune influence sur le résultat des décisions publiques ! A premitre vue, cela parait absolument absurde. Imaginez un pays composé pour moitié d'individus qui préferent Glenn Gould a Wilhelm Kempf, et 'autre moi- 1Hé qui préfére le second au premier. La radio nationale de ce pays a pour objectif de diffuser chaque soir, LavALEUR 6 Vheure du coucher, Pune des Variations Goldberg de Bach, jouée par l'un de ces deux pianistes. Bien entendu, le choix du pianiste chargé d’endormir les tétes blondes du pays est soumis au vote. Supposons que seuls les adeptes de Kempf aient le droit de voter. Ce que nous dit Ja valeur de Shapley, cest que Vissue du vote donnera 50 % des voix a Kempf et 50 % des voix a Gould ! Pour comprendre ce paradoxe apparent, supposez que les votes soient publics et que chaque citoyen puisse vendre son droit de vote. A quel prix un citoyen sera-t-il prét & se défaire de sa prérogative ? Dans une économie océa- nique, un adepte de Kempf sait que Vinfluence qu’il pourra exercer sur T'issue d’un vote est infinitésimale. Il devrait donc étre prét a céder sa voix pour un prix arbi- trairement proche de zéro tout en gardant le sentiment de ¢ gagner « quelque chose. Or, la décision du vote se faisant la majorite simple, les adeptes de Gould n’ont besoin de convaincre que Ia moitié des votants pour ‘garantir que leur pianiste sera au moins ex aequo avec son. concurrent. Poussez le raisonnement a la limite, et vous obtiendrez que les adeptes de Gould pourront convaincre Ja moitié de leurs adversaires de leur eéder leur voix. gratuitement, Ce que montre cet exemple trés sérieux ’, c'est que, aut moins dans le cadre UT, les issues préconisées pat la ‘valeur + miment » en quelque sorte la solution du mar~ ché » : laissez les droits de vote s'échanger sur un marché, et vous obtiendrez Ia solution de la valeur du jeu. Nous retrouvons la la propriété d’équivalence de la valeur de Shapley et de ’équilibre walrasien. L’autre legon a tirer de cela est que, si vous souhaitez organiser la vie politique de votre pays selon des principes différents de ceux du mar- cché, il est trés important que les votes que vous organise- rez soient secrets : l'anonymat de Visoloir est le meilleur rempart contre la tentation de vendre son droit de vote. Liérude de la valeur permet de mettre en lumiére bien autres résultats instructiff, qui ne peuvent étre cités ici Signalons seulement celui-ci ®: si votre société est consti- 16 LA THEORIE DES JEUX tuée de citoyens qui, par leur vote, peuvent décider de TTidentité des contribuables dont une partie des dotations initiales sera prélevée au titre de Pimpét, mais sont égale- ‘ment en mesure de détruire leurs dotations initiales (afin justement de se soustraire a 'impét), alors le taux marginal imposition préconisé par la valeur est supérieur 4 50 %... 5. Les valeurs UNT La premiére extension des idées de Shapley au cadze UNT est due a John Harsanyi °, Comme la valeur 4 Harsanyi paraissait fort complexe et difficile a manier, Shapley en proposa une version alternative en 1969, bap- tisée depuis lors la UNT-valeur de Shapley. Nous allons les examiner successivement, en commencant par celle dde Shapley. On se donne done un jeu UNT (1, V) com- portant un nombre fini de joucurs N, et pour lequel on suppose que V (S) est non vide, strictement inclus dans R° et convexe, et vérife certaines conditions supplémen- taires dans le détail desquelles nous n’entrerons pas ici A Finstar de la valeur de Shapley pour les jeux UT, la UNTaleur de Shapley peut s'obtenir comme unique solution d'une série d'axiomes "°. Celle que nous pré- sentons ici se trouve résumée dans Yencadré 3.2. Les axiomes AO & A5 sont a interpréter de la maniére sui- vante :@ est une application qui, chaque jeu UNT asso- cie un vecteur de paiements dans RN. L’axiome en vertu [(V) + OCW] NV) ‘4, Indépendance par rapport aux alternatives non pertinentes SiVON) WON) et V(S) =W(S) ¥ S #N, alors OW) AVON) < OW) AS. Unanimité : pour toute coalition non vide T, oW,) = 1yITI} Llaxiome A3 est Pavatar de la suradditivité. Le suivant se nomme souvent « Vindépendance par rapport aux alternatives non pertinentes ». Nous aurons l'occasion de le retrouver et de le discuter au chapitre 1X consacré au choix social. AS est évidemment Ia traduction dans le contexte des jeux UNT du dernier axiome que nous avions utilisé pour caractériser la valeur de Shapley pour les jeux UT. Un vecteur de paiements x ¢ RN est une UNT valeur de Shapley pour le jeu (1, V) s'il existe un vecteur i.e RN de coefficients de pondération tel que : 78 LA THEORIE DES JEUX (Q) La restriction, xg) du vecteur x & la coalition $< appartient au bord de V(S) pour toute S ; @) En notant Ag Ia restriction de 4 a S, on a: ‘ago x5 2 Ay-y pour tout vecteur y © V(S) et pour toure coalition $5 (3) Pour tout joueur i, 4, x,est le paiement qui aurait 4é attribué au joueur é par la valeur de Shapley dans le jeu UT associé 4 la fonction caractéristique définie par 0(S) = hs x5 pour toute S. Le résultat d’Aumann est le suivant : il existe une ‘unique fonction qui satisfasse aux axiomes A0-A5 sur la classe des jeux possédant une UNT-valeur de Shapley. il agit de 'UN Fvaleur de Shapley. Nous sommes done autorisés, dans la definition qui précéde, a utiliser un pronom défini au sujet de Ja valeur UNT de Shapley : sur la classe des jeux pour lesquels il existe une UNEvaleur de Shapley, et il n’en existe qu'une. La défintion et la construction axiomatique de la valeur @Harsanyi ressemblent a s'y méprendre celle de la UNT- valeur de Shapley (voir encadré 3.2). Elles ont d’ailleurs été ‘mises au point la méme année, Pune par Aumann, comme je Pai dit, Putre par Sergiu Hart. La difference essentille reside dans la défiition de ce qu'est une solution. Dans le cas de Shapley, revu par Aumann, il s’agit ’un vectcur de RN5 dans le cas d’Harsanyi, revu par Hart il s'agit d'un ensemble de vecteurs (x,).y un vecteur de paiements pour chaque coalition. On pourrait croire, au vu de la similarité des deux élaborations que ce qui distingue une de autre est que marginal. Nous allons voir qu’au contraire, méme pour notre objectif premier ~ trouver d’éventuels’ autres théordmes d’équivalence avec les équilibres walrasiens - le choix de Pune ou autre valeur est d'une importance vitale. 6. Le potentiel et la valeur d’Harsanyi Nous voila préts attaquer ce pour quoi nous avons quelque peu souffert au chapitre précédent : lequiva- EA VALEUR 79 lence des équilibres walrasiens et de la valeur. C'est la que nous attend une sérieuse déconvenue : certes, il est possible d'établir une equivalence de ce type ~ nous avons tout fait pour! -, mais elle demeure beaucoup moins convaincante que l'équivalence du cur, et ce pour des raisons profondes que nous allons examiner. Des travaux récents, menés notamment par Hart ct Mas-Colell au cours des années 1990, ont permis de définic la valeur d’Harsanyi pour des économies UNT ‘océaniques. Leur point de vue consiste & construire la valeur @ l'aide dune fonction de potentil. Pour le com- prendre, revenons pour la derniére fois aux jeux UT avec tun nombre fini, N, de joueurs. Donnons-nous un vecteur ‘ue RX, de coefficients de comparaison interpersonnelle. siinterpréte comme P'équivalent « social» d'une unité d'utilité du joueur i C'est une maniére de ramener toutes les échelles d’utilité des joueurs a une mesure unique, et done de les comparer entre elles. Le principe «égalitariste (egaiarian) en vertu duquel chacun doit recevoir selon sa contribution est défin, ii, au moyen d’une fonction P : 2 + R, appelée le poten tiel du jeu. Admettons, pour commencet, que tous les joueurs «se valent»: 2'= (1, wy 1). Pest alors unique fonction vérifiant : P(2) = 0 et dP(S) = (P{S) - P(SW),. ¢ € AV(S) pour tout Sc, ‘ou: AV(S) designe le bord (au sens géométrique) de V(S), et coincide avec le sous-ensemble des imputations Pareto-optimales pour la coalition S. La « dérivée » en S, P{S), du potentiel P correspond trés exactement a la contribution du joucur i au sein de la coalition S. Le point de vue égalitariste améne considérer le vecteur de paiements E(N) = dP(N) € JV(N). Pris comme solution du jeu UT (N,V), ce vecteur est égalitariste dans Ia ‘mesure oi, pour tout S GN, et tout je S E,S) - E(Sy) = E(S) - ES). En d'autres termes, relativement & la solution mise en euvre, la contribution du joueur ‘au joueur jest égale a 80 LA THEORIE DES JEUX Je contribution du joueur j au joueur i — Ia + contribu- tion» de chacun ant mesurée 4 laune du paiement final implique par la solution. On observera que ce prin cipe n’est pas du tout incompatible a priori avec une repartition tés inégalitaire (au sens « naif») des richesses : supposez. de nouveau que vous ne donnicz quasiment rien & toute Phumanité et tout le reste & Bill Gates ; ls contribution marginale de Bill Gates & ce que resoit un paysan indien sera négligeable (parce que ce ue recoit ce paysan est, de toute facon, dérisoire) tout comme sera celle de ce méme paysan A la fortune de Bill Gates (parce quill y aura bientt un milliard 4’Indiens pauvres) Dans le cas d'un vecteur A arbitraire (Cest-i-tire sion accepte de considérer que certains joueurs sont + sociale- ‘ment plus utiles » que d’autres), notons VAS) = AVS) = tita, ac V(S)}, ensemble des impu- tations de la coalition S exprimées en unité de compte «sociale», (Aa n’est pas le produit scalaire usuel dans RN, mais le produit» agent par agent +:2*a = (yas. dady)>) Nous pouvons a présent considérer la solution égalitarste du jeu pondéré (N, V,). Notons-ia E,(N). La construction de la valeur de Shapley (pour un jeu UT fini) passe désormais par lendogentisation des coef ficients de pondération A. La détermination endogéne des coefficients de comparaison interpersonnelle est obtenue en exigeant que Ia solution finale que nous sommes en train d’élaborer soit » A-utilitarste», C’est-a- dire qu’elle maximise la somme des paiements pondérés au moyen du vecteur 2B, 2 A- a pour tout a € V(N). Le lecteur qui se souvient de la fagon dont nous avions caractérisé les optima de Pareto au chapitre 1 n’aura aucune peine @ identifier ici, un principe d’optimalité paretienne. Par ailleurs, lorsque le bord de ensemble VON) est «lisse», Cest-i-dire est une variété différen- tiable, la condition précédente peut s'exprimer locale- ‘ment au moyen des taux marginaux de substitution des 1LAVALEUR 8 uuilités au point choisi par Fj, ce qui traduit intuition premiére qui avait présidé a la construction de la valeur de Shapley, et dont nous avons évoqué ce qu’elle avait & voir avec le point du vue marginaliste développé a la fin du sicle dernier. Un vecteur de paiement Pareto-otimal ac aV(N) est done une valeur de Shapley s'il existe un vecteur de coefficients A tel que a soit égalitariste pour Péchelle de conversion h. Leextension de 1a construction précédente aux jeux ‘océaniques a été accompli par Hart et Mas-Colell '¥ au ‘moyen de la résolution d'un certain probleme variation- rnel que nous ne pouvons pas aborder ici. Contentons- nous d’énoncer ce fait surprenant : une fois correctement étendue au contexte des économies océaniques, la valeur d'Harsanyi ne vérifie pas l’équivalence avec les équilibres walrasiens. En effet, un contre-exemple a été construit dans lequel il existe un unique équilibre concurrentiel ‘qui n’appartient pas a l'ensemble (non vide) des alloca- tions prescrites par la valeur d’Harsanyi Est-ce a dire que la théorie de la valeur est mal faite ? Que ie + marché » ne tient pas toutes les promesses qu’on uj attribue peut-étre & tort ? Que la valeur n’est pas la ‘bonne » notion qui sied a l'étude des propriétés d'une économie? Il est sans doute encore wop tét pour répondre a ces questions, et nous avons besoin de beau- coup d’autres résultats afin de comprendre vraiment 08 le probleme se situe. II n'en demeure pas moins que, si ‘nous prenons au sérieux le caractére non substituable des utilités de chaque individu (contrairement a ce que suppose implicitement le cadre UT), ce contre-exemple jerte un doute important sur notre aptitude, aujourd'hui, A justifier de maniére rationnelle V'institution du marché dans un cadre UNT. Les adeptes de la valeur UNT de Shapley en conclu- ront peut-étre ~ certains n'ont pas manqué de le faire ~ que cette derniére est la» bonne » extension au cas UNT de la valeur UT de Shapley. ls auraient tort de se hater, 82 LA THEORIE DES JEUX pour deux raisons au moins. La premiére est que beau- coup de théoriciens des jeux considérent que la version proposée par Shapley de sa propre valeur pour le cadre UNT est une simplification de quelque chose & quoi la valeur d’Harsanyi semble plus fidéle, D'une certaine maniére, la valeur UNT de Shapley est trop pressée de se ramener au cas UT, et naffronte pas vraiment le pro- bléme de la non-substituabilité des préférences. C'est probablement la raison pour laquelle il lui est si facile de nous donner le théoréme d’équivalence avec les équi- libres walrasiens auxquels nous nous attendions, ‘Mais cette raison nest sans doute pas assez perti- nente. Il y en a une seconde, bien plus radicale. La construction d’Aumann et Shapley '? reposait sur une hypothése dont exemple du jeu de marché suffit faire sentir Ie caractére : la différentiabilité des préférences, Il est trés facile, en effet, de construire des fonctions d’uti- lité « naturelles « qui ne sont pas lises '. Certes, le carac- tére differentiable des économies que nous étudions n’est rien de plus qu’une hypothése, irréaliste mais commode, {que nous utilisons parce que, sans elle, la vie des mathé- ‘maticiens serait bien pénible, et qui peut se justifier du reste en argumentant que nous savons approximer d’aussi prés que nous le souhaitons toute économie continue par une économie lisse. Toutefois, ces justifica- tions seraient battues en bréche si les concepts de théo- rie des jeux que nous sommes en train de batir devaient s'avérer vides pour des économies qui ne vérifient pas toutes les hypothéses qui nous servent a construire des cas d’école... Or, c’est précisément ce qui se passe dans le cas de Ia valeur de Shapley pour les économies océa- niques UNT. En effet, le mathématicien belge Jean- Francois Mertens a montré, en 1988, que l'on pouvait étendre les constructions ingénieuses d’Aumann et de Shapley au cadre des jeux océaniques non différentiables UNT, ct, dans le contexte particulier des jeux de mar- chés UT (éventuellement non lisses), prouver lexistence et Tunicité d'une « valeur ». Or, Pune de ses propres étu- - La vale 83 diantes, Frangoise Lefevre, a construit, en 1994, un. exemple (robuste) d’économie d’échange non lisse UNT pour laquelle i n’existe pas de valeur de Shapley UNT. Tous les chemins ménent a Rome, disions-nous, enthousiastes, a propos de la » main invisible » ? Peut-étre Sfagit-il, au mieux, d’Holzwege, qui ne laissent aux éco- nomistes soucieux de fonder leur foi dans le + laisser- faire » que le choix entre une valeur (celle d’Harsanyi) qui ne coincide pas toujours avec la « solution du mar- cché + et une autre (celle de Shapley) qui peut rout sim- plement ne pas existe LA DECISION STRATEGIQUE Le mathématicien américain John von Neumann et Péconomiste autrichien Oskar Morgenstern définissent Pobjectif de la théorie des jeux stratégiques de la maniére suivante : ‘Nous souhaitons mettre au jour les principes mathém: tiques complets qui définistent le “comportement rationnel des participants d’une économie sociale, et en déduire les caractérstiques générales un tel comportement. Et, tandis {que les principes pourraient ze tés généraux — ie, validés dans toutes les situations -, nous serons satisfaits 8} nous ppouvons trouver des solutions qui, pour le moment, ne valent {que pour certains cas particuliers eprésemtati |» Ce chapitre expose les rudiments de Is théorie déve- loppée depuis un demi-siécle partir de cet ambitieux Programme. 1. Le dilemme des prisonniers Le plus simple est sans doute de commencer notre étude par un jeu, celui qui a fait couler le plus d’encre depuis que T'on s'intéresse a la théorie des jeux. histoire est la suivante : deux prisonniers croupissent dans deux cellules séparées dans P'attente de leur juge- ment. La police est embarrassée car elle ne dispose pas 86 LA THEORIE DES JEUX 4'eléments suffisants pour conclure & la culpabilité des deux détenus, de sorte qu'un aveu faiiterait beaucoup la tiche des enquéteurs, Seulement, comment inciter nos deux larrons & avouer leur méfait? Le stratagéme diabolique imaginé par l’inspecteur local consise & convoquer chacun des deux prisonniers séparément eta hi proposer le marché suivant : « Nous tedemandons d'avoter ton crime j nous savons bien que tues a priori peu encin 4 coopérer avec nous, mais nous souhaiterions sttirer ton attention sur un point : nous allons également convoquer ton collegue, e ui poser les tmémes questions. Si avoue, et que tu a’avoues pas, i ‘aura dénoneé, nous serons convaincus de a culpabilité, iT aura coopéré avec a police, et toi pas. Tu risques d'en prendre pour... dix ans ferme, et lui, en Vabsence de Charge pesant contre li, sera libéré. A inverse si vous vous dénoncez mutuellement, on saura que c'est vous «qui aver fait le coup, mais la justice saura se montrer compréhensive du fait de votre coopération. Aussi, vous serea condamnés au plus a cing ans. Enfin, si aucun p’ domine faible- ‘ment celle qui consiste fixer p" Pis encore: toutes les stra~ uégies de ce jeu pourtant ws simple sont faiblement dominées. Quel est Vintérét de ce jeu qui fur imaginé par Bertrand en 1883 ? De montrer, via un modéle tes simple, ‘comment Ia ¢ solution concurrentielle (celle ot chaque LA DECISION STRATEGIQUE 105 centreprise tarifie au coat marginal) peut émerger comme unique équilibre de Nash pur d’un jeu a deux joueurs. 5. LYéquilibre corrélé Considérons Je jeu suivant dont chacun des deus joueurs dispose de trois stratégies (oo a2 2a ee 42-24 00 Figure 49 existe un unique équilibre de Nash : chaque joueur joue chacune de ses trois actions possibles avec tne pro- babilité 1/3. Le paiement espéré de chacun d’entre eux est alors 2. Supposons qu’Alice et Bill puissent prendre conseil auprés d’un avocat (ou d’un psychanalyste) avant de jouer ce jeu, lequel leur recommande de jouer cha- ccune des paites de stratégies qui donnent des paiements non nuls avec une probabilité 1/6, Soyons plus précis : leur avocat ne leur recommande qu'une seule paire de stratégies. Mais il utilise Iui-méme un dé avant de prendre sa décision, et tire au sort la paire qu'il recom- ‘mandera. Liintervention de Pavocat new-yorkais peut se représenter par la matrice suivante : TTLETE] Phot eleto Figure 4.10 Une fois que Pavocat a choisi une paire dactions, il convoque tour 4 tour les deux époux, et chacun deux est secrétement informé de Paction qu'il a4 jouer (mais pas de celle de son adversaire). En revanche, chacun des 106 LA THEORIE DES JEUX deux époux est informé de la totalié de la procédure, sait que l'avocat utilise un dé a six faces équilibré pour pro- diguer ses conseils et sait que seules les stratégies indui- sant un paiement strictement positif ont une chance dPétre sélectionnées. Quelle que soit la recommandation de Pavocat, chaque époux aura done tout intérét a la suivre, Si Alice, par exemple, regoit le conseil de jouer la premiére ligne, elle saura que son époux jouera respecti- vement la troisiéme et la quatriéme colonnes avec une probabilité 1/2. Jouer H sera alors effectivement sa meilleure réponse. Or, le paiement espéré du jeu, grace a intervention de Pavocat, est 3. Cela montre que deux joueurs en situation conflictuelle peuvent avoir tout inté- réc a recourie aux services dun médiateur extérieur qui les aide a se coordonner, Dans l'esprit de l’équilibre de Nash, la situation pré- cédente est un équilibre. Aucun des deux joueurs n'a intérét a dévier de la recommandation qui lui est faite par avocat. Un tel équilibre est dit corrélé dans la mesure of intervention de I'avocat a simplement servi aux deux joueurs a se corréler entre eux afin de parvenir un meilleur paiement. Un éguiitre corrlé, c'est donc la donnée d’un mécanisme de corrélation (urie probabilité sur le produit des actions des joueurs) et d'un équilibre de Nash du jeu étendu par ce mécanisme. Remarquez que, contrairement aux apparences, !'équilibre corrélé est un équilibre rigoureusement non coopératif. Aucun engagement n’a été signé par Alice ou Bill. Tous deux font tout a fait le loisir de ne tenir aucun compte des recommandations de leur avocat. A vrai dire, la per- sonne méme de Vavocat dans cette histoire est une hhypostase commode : nos deux joueurs pourraient fort bien construire cux-mémes leur mécanisme de corréla- tion. Il leur suffit d’un dé (ce qui cote moins cher qu'un avocat) ! Remarquez également que Vintrodue- tion de ce mécanisme de corrélation a introduit une nouvelle source d'incertitude : aucune paire de straté- ies mixtes des deux joueurs ne peut générer la loterie 107 cexplicitée dans la matrice 4.10. Pourtant, cette nouvelle incertitude est entiérement extrinséque au sens oii elle maffecte aucunement les régles du jew initial : Ven- semble des actions de chaque joueur, ainsi que les paie~ ments associés, sont inchangés. Bien entendu, les équilibres de Nash sont des cas parti- caliers d’équilibres corrélés : ceux-la mémes oii les joueurs mutilisent aucun mécanisme de corrélation. Mais TTexemple précédent montre que inclusion est stricte en général. Par contre, la consultation d'un avocat peut fort bien étre trés nuisible a notre couple en termes de bien- etre collectit OC aE 2,2 [0,0 Figure 4.11 Dans ce jeu, 'unique paiement d’équilibre de Nash pur est (2, 2) et Pareto-domine au sens large tous les paic~ ments d’équilibres corrélés. Pire : (2, 2) Pareto domine strictement l'équilibre corrélé ot chaque paire d'actions est sélectionnée avec probabilité 1/4. Ce type de phéno- mine n'est pas seulement inquiétant pour la santé des ‘couples qui réglent leurs problémes en consultant des avo- ‘cats, I suggére également que les marchés financiers, par ‘exemple, pourraient souffrir de introduction de méca- nismes de corrélation qui induiraient des équilibres corré- és sous-optimaux, Aprés tout, peut-érre que le role tenu par Pavocat auprés d’Alice et de Bill est exactement celui ‘que jouent certains gourous de Wall Street que l'on inter- roge périodiquement sur l'avenir de la Bourse, et qui sont cchargés d'aider les investisseurs a se coordonner. Leurs « prévisions » ne sont peut-étre pas a prendre davantage au sérieux que 'influence des taches solaires sur le cours du dollar, mais peu importe : si 'équilibre sur lequel tout le monde se coordonne est bien un Equilibre corrélé, alors les anticipations des investisseurs seront autoréalisatrices, ‘comme elles le sont, par définition, pour tout équilibre de 108 LA THEORIE DES JEUX Nash. Pourtant, diront ceux qui espérent encore dans les vertus du marché, ce ne sont que des paroles, qui n’affec- tent pas les « grandeurs réelles » de l'économie, lesquelles sont es seules qui comprent vraiment. Mais ilen va rigou- reusement de méme pour un équilibre corrélé qui, comme je le disais a instant, n'affecte sucunement les régles du jeu (inancier). Et qu’est-ce qu'une bulle spéculative, que sont les eesprits animaux + dont parlait Keynes, sinon pré- cisément une anticipation autoréalisatrice qui n’a rien & voir avec la « réalite» des grandeurs macro-économiques dlites fondamentales ? Dans le cas d’un jeu @ somme nulle, toutefois, rien n'est & craindre : vous pourrez démontrer facilement que le seul paiement d'équilibre corrélé dun jeu a somme nulle est égal la valeur de ce jeu. La raison est que chaque joueur posstde une stratégie (éventuelle- ment mixte) qui lui garantit le paiement associé a la valeur du jeu quoi que fasse son adversaire. Si son paiement espéré lié un équilibre corrélé était infé- rieur a cette valeur, il lui suffirait de ne plus tenir compte des conseils de son avocat et de recourir pru- demment a sa stratégie de maximin. Malheureusement, cette immunité des jeux & somme nulle a légard des taches solaires + n'est méme pas partagée par les jeux presque strictement compétitifs, dont nous avons vu que, bien qu’d somme non nulle, ils relevaient de la méme logique que celle d’un jeu a somme nulle. Ainsi, le jeu suivant est un exemple de jeu presque stricte- ‘ment compétitif dont les paiements d’équilibres corré- lés contiennent strictement les paiements d’équilibre de Nash : a 6 ¢ d al 66 27 1-165] -,i—] Bl 7,2 0.0 | -I,14 | -1,3 cles [14,1 [0.0 0,0 pCi 3.1 0.0 0,0 LADECISION STRATECIOUE 109 Pour voir qu'il s'agit d'un jeu presque complétement compétiif, invite le lecteur a écrire le jeu tordu corres- pondant et & constater que, dans ce jeu fctf auxiliaire, les deux premiéres actions de chaque joueur sont strictement ‘dominées. Dans ces conditions, vous verre facilement que le seul paiement d'équilibre de Nash pur du jeu tordu est (0,0). Pour voir qu'il n'existe pas d’autre paiement ¢’équi- libre de Nash miste, considérerons la matrice suivante, dont la premiére ligne contient la liste de toutes les actions susceptibles d’étre jouges avec une probabilté strictement positive par une stratégic mixte queleonque d’Alice, et dont la seconde ligne contient, pour chaque colonne, la liste des meilleures réponses de Bill correspondant a la stratégie mixte d’Alice appartenant a la méme colonne. ‘AB AC AD BC BD CD ABC ABD ACD BCD ABCD) aid be be dd cd aed abed ed abcd Figure 4.13 uisque le jeu est symétrique, on obtiendrait la méme matrice en inversant les roles ’Alice et de Bill. Cela implique que 'on peut dores et déja éliminer les familles {A.C}, (A, D}, {BC}, (B, Dj, {B, C, Dj et (A, CD} de la liste des stratégies pures candidates a constituer te support d’une stratégie d'équilibre de Nash mite. Le lec- teur ne tardera pas a voir que 'on peut éliminer A et B, lesquelles ne sont jamais les meilleures réponses a une stra~ tégie minte restante dont le support serait {ay 6}, {as bs ch {a,b d} ou {a,b d}. Elles peuvent étre éliminges & leur tour. Pour la méme raison, nous pouvons ignorer {A, B, C}, {A,B, D} et {A, B,C, D}. D’oi le résultat. Considérons, 4 présent, 'équilibre corrélé donne par la matrice de cor- rélation suivante o 0. 0. 0. Figure 4.14 no LATHBORIE DES TEUX Son paiement espéré est 5, et n’est donc pas un paie~ ment d’équilibre de Nash. Ce que montre cet exemple, C'est qu’a moins de considérer le jeu financier comme un jeu @ somme nulle, ceux qui ne croient pas en la possibi- lité de « bulles spéculatives » ont & faire la preuve du fait que les marchés sont immunisés contre tout équilibre corrilé. LETEMPS 1, Les jeux sous forme extensive Les jeux que nous avons considérés au chapitre pré- ‘cédent étaient essentiellement statiques : nous imagi- nions que tous les joueurs y participant choisissaient leurs stratégies indépendamment et simultanément. Or, @ dire vrai, fort peu de situations de la « vie réelle » correspondent a parcille mise en scéne. La construction et étude des jeux sous forme extensive offrent un moyen commode de représenter des inter- actions stratégiques séquentielles. Elles constituent analogue, pour ce type d’interaction, des matrices que nous avions utilisées au chapitre v pour résumer information contenue dans un jeu sous forme stra- régique, La forme extensive d'un jeu est définie par la don- née de cing éléments (I, X, g; f, H). I est ensemble des joueurs, que nous supposerons toujours fini sauf mention contraire. X est arbre du jeu, Il est lui- méme défini au moyen d’un ensemble de neeuds et dune relation d’ordre partielle entre les neuds cor- respondant a écoulement du temps. Un neeud x’ est plus grand » qu’un autre x au sens de cet ordre s'il ne peut étre atteint qu’aprés x, autrement dit si x est un prédécesseur de x’. Dans exemple suivant, x est un prédecesscur de x’, tandis que x” et y ne sont pas com- parables : ne LATHEORIE DES JEUX r ’ Figure 5.1 tant donné un neeud x, lensemble de ses succes- seurs sera toujours suppose fini dans ce livre, mais c"est tune condition qui pourrait évidemment étre levée (au prix de considérations plus techniques de mesurabi- lité). Dans exemple précédent, x est un prédécesseur immédiat de x" dans le sens oW il n’existe pas de necud compris entre l'un et Pautre. Les deux propriétés sui- vantes caractérisent X en tant qu’arbre : 1) X posséde tune unique « racine », c'est-i-dire un unique neeud 0 nadmettant pas de prédécesseur ; 2) tout nozud x dif- férent de la racine admet un, et un seul, prédécesseur immeédiat. La fonction g : X I désigne, pour chaque neud de l'arbre, le joueur chargé de jouer a ce nud. Si le jeu a une fin, cela veut dire qu’ existe des neeuds n’admettant pas de successeur (@ savoir qui ne sont les prédécesseurs immédiats d’aucun autre neud). f est la fonction de paiement du jeu, qui, a chaque noeud ter- minal associe un nombre réel pour chaque joueur. Hest, une partition de X dont la signification est la suivante lorsque le joucur i est appelé a jouer au neeud x, il ne sait pas nécessairement oi il se trouve au sein de arbre X. Liélément de H contenant x est le sous-ensemble des naeuds de X que i ne peut pas distinguer, ic., auxquels il attribue a priori une probabilité positive de se trouver, sachant qu'il est appelé a jouer en x. Nous allons voir dans un instant quel usage tout a fait essentiel doit étre fait de H. Ainsi, le jeu représenté par la forme extensive qui suit se déroule de la maniére suivante, Lrarbre se lit de LeTEMPS 113 hhaut en bas. Alice joue la premiére (@ Ia racine de arbre).Elle peut alors choisir entre deux actions, A et B. C’est alors au tour de Bill qui, quel que soit le choix @’Alice, peut jouer a ou 5, Si Alice a joué A et son époux 6, le paiement de la premiére est 0, celui du second est - 1 Alice Figure 5.2 Qu’est-ce qu'une stratégie dans ce cadre ? Pour Alice, il s‘agit tout simplement du choix de l'une des deux actions qui sont a sa disposition. Pour le Docteur Harford, les choses sont un tout petit peu plus complexes : si Alice joue B, le jeu se déplace de Ta racine vers le neud y. Ici, Bill est implicitement informé du fait qu’il se trouve en y. Autrement dit, élément de la partition H contenant y est réduit au singleton {9}. Du coup, si le jeu avait évolué vers x, Bill aurait également été averti de l’évolution du jeu. Tout se passe donc comme s'il était informé de 'ac- tion choisie par son épouse. On dit, pour aller vite, qu'il peut observer Paction d’Alice, Or, rien ne Poblige a jouer la méme action en fonction du coup précédent d’Alice. Si cette derniére a joue A, il aura intérét a jouer a. En revanche, s'il a observe que le jeu a évolué vers y, il a tout intérét a jouer 6. Une stratigie de notre médecin new-yorkais consiste par conséquent a choisir une action pour toutes les his- toires du jeu qui ont précédé le moment oi il doit jouer. 14 LATHEORIE DES JEUX Sion cherche a écrire le jew précédent sous forme stratégique, on obtient la matrice suivante Bill AaBa__ASBb__AbBa__AaBb Alice AL EO [01 [OT 10 Bio0 [01 | 0,0 | ot Figure 3.3 ‘Manifestement, tout jeu, sous forme extensive, peut s’écrire d'une maniére et d'une seule sous forme straté- gique. La réciproque n’est qu’en partie vraie : tout jeu sous forme stratégique peut s’écrire sous forme exten- sive, mais celle-ci n'est généralement pas unique. Ainsi, pour représenter sous forme extensive le dilemme des prisonniers du chapitre précédent, on pourra adopter arbre suivant : Alice 0 at a 33 Figure 3.4 Les pointillés qui joignent les neeuds x et y signifient ‘que Bill, su moment de jouer, ne sait pas s'il se trouve en x: ‘ou en y, En d'autres termes, Pélément de H contenant x ccontient le couple {x, v}. Le jeu précédent n'est donc pas 4 observation parfaite puisque l'un des protagonistes au ‘moins n’a pas pu observer la totalité du déroulement du jeu avant de jouer Iui-méme. Ici, c'est une maniére com- mode de représenter sous forme séquentielle le caractére simultané des décisions des deux prisonniers. Le lecteur aura aucune difficulté a dessiner d'autres formes exten- sives représentant le méme dilemme des prisonniers. LETEMPS ns Un élément de H se nomme un ensemble d'information. jidemment, tous les neeuds appartenant 4 un méme ensemble d'information ont nécessairement le méme nombre de successeurs, sans quoi le joueur sommé de jouer, une fois cet ensemble d'information atteint, serait en mesure de distinguer les différents neuds de cet ensemble, Un jeu est 4 observation parfaite si tout ensemble d'information y est réduit a un singleton. Un arbre X est dit linéaire si toute partie du jeu corres- pondant ne traverse un ensemble d'information qu'une seule fois, au plus. De tels jeux sont ceux dont les parties ne peuvent pas cycler. Si, de plus, chaque joueur, en chaque ensemble information oi il doit intervenir, est fen mesure de reconstituer Ia totalité de information ‘qu'il a acquise au cours du jeu, alors le jeu est & mémoire parfaite. La plupart des jeux étudiés dans la littérature postédent cette propriété. Leur immense avantage est de vérifier un résultat di a Kuhn, en 1953, et qui facilite considérablement leur étude, Nous avons dit, une stra- tégie de chacun des joueurs participant 4 un jeu sous forme extensive, consiste 4 choisir une action a chacun des ensembles d'information o@ son tour est venu de jouer. Comment allons-nous définir une stratégie mixte dans ce contexte ? Deux possibilités s'offrent & nous ‘nous pouvons adopter un point de vue proche de celui de la forme stratégique associée du jeu sous forme extensive, et définir tout simplement une stratégie mixte comme tune loterie aléatoire sur Vensemble des_stratégies (pures !) d’un joueur. Le point de vue alternatif consiste 4 envisager qu’en chaque ensemble d'information, od il doit intervenir, un joueur choisit une loterie sur I'en- semble des successeurs de chaque neud appartenant audit ensemble d'information, c’est-i-dire sur ensemble des actions qui sont sa disposition en chacun de ces neeuds, Cette stratégie se nomme stratégic de comporte- ment, Il nest pas difficile de voir que, pour tout jeu linéaire, toute stratégie de comportement peut étre obte- ‘nue sous la forme d'une strategie mixte. Le théoréme de ne LA THEORIE DES JEUX Kuhn dit que, pour tout jeu sous forme extensive linéaire 4 mémoire parfaite, la réciproque est vraie : toute strat sie mixte peut étre obtenue comme stratégie de compor- tement. Lintérét de ce résultat réside dans le fait que les stratégies de comportement sont évidemment des objets beaucoup plus simples 4 érudier que les stratégies mixtes. ‘Dans lexemple suivant, léquivalence entre stratégies ‘mixtes et de comportement n’est pas vérifige. Supposons {que Bill, de retour d'une soirée trés arrosée entre anciens ‘combattants de la guerre du Golfe, et roulant sur Pune de ces grandes artéres qui ménent & New York, ne sache plus s'il a déja passé la sortie qui précéde celle qu’il doit prendre pour rentrer chez lui, ou bien s'il agit de la sor- Figure 5.5 En chacun des deux noeuds de Varbre, il a le choix entre sortir (S) ou continuer (C). Liensemble d’infor- mation indique qu'il ne sait pas s'il se trouve en x ou ny. Clairement, le jeu n'est pas linéaire. En stratégies mixtes, Bill choisit entre S et C avant le commence- ment de ce jeu infernal : son paiement espéré est donc égal & la probabilité avec laquelle il choisit S. En straté- gies de comportement, si Bill joue C avec une proba~ bilité p en chaque neeud de ensemble d'information, il induira les issues finales (C, C), (S, C) et S respective- ment avec probabilité p?, p(1 - p) et 1 p, une distribu- tion qu'il lui est impossible de générer a Vaide d’une stratégie mixte, r LETEMPS nT | 2, Les équilibres sous-jeux-parfaits Considérons le jeu sous la forme extensive suivante Figure 5.6 Ce jeu admet deux équilibres de Nash purs : (A, (a,a)) et (B, (a, 8). L'équilibre (A, (a, a)) signifie que le second joueur joue a quoi qu’ll arrive, et posséde une faiblesse : si, d'aventure, le joueur 1 venait a dévier de Ia recom- mandation d'équilibre et a jouer B au lieu de A, alors, tune fois placé devant le fat accompli de cette déviation, le joueur 2 n’aurait pas intérét a suivre la stratégie préconi- sée par l'équilibre (A, (@, a)) puisque 6 lui donne un paiement meilleur que a. On sent, ici, route la force de Phypothése qui caractérise les jeux non coopératifs, et en vertu de laquelle aucun contrat ayant force de loi ne peut tre introduit s'il n’est pas déja explicité par les régles du jeu. Si, au contraire, une quelconque police pouvait contraindre le joueur 2 obéir aux recommandations déquilibre méme si] venait 4 dévier, le joueur | n'aurait pas tort de jouer A a léquilibre. Mais parce qu'il sait ‘qu'une telle police, par hypothése, n’existe pas, le joueur 1 est en mesure danticiper que le joueur 2, évant ration- nel, ne mettra jamais sa menace a exécution. Le seul Equilibre pur auto-performatif de cet exemple est donc (B, (@ #)), celui oW le second joueur joue sa meilleure réponse en chaque neeud de arbre, Un tel équilibre de Nash est dit sous-jeux-parfait. ‘A premiére vue, la perfection en sous-jeux est un réquisit naturel gui permet dobtenir facilement des 118 LATHEORIE DES JEUX: résultats tout a fait intéressants, Ainsi, lorsque le mathé- maticien Zermelo a cherché, en 1912, a étudier le jeu qéchecs, c'est aux équilibres sous-jeux parfaits qu'il a spontanément recouru, Son résultat est le suivant: si’on admet qu'une partie ou se répéte trois fois la méme configuration de I’échiquier est automatiquement décla- sée nulle, alors Pune des trois assertions suivantes est nécessairement vrai : 1) ou bien les Blancs ont une stra- tégie gagnante (une stratégie qui permette de remporter la victoire & coup sir) ; 2) ou bien les Noirs ont une stra- tégie gagnante ; 3) ou bien chaque couleur posséde une stratégic qui lui permet d’assurer Ia partie mule our le wir, il «sufft» de dessiner l'ensemble de Varbre une partie d’échecs, de remarquer que la convention que nous avons adoptée sur les parties it ’€chiquier se retrouve ‘ois fois de suite dans la méme configuration, permet d'éi- ‘miner les parties cycliques, et d’assurer, par conséquent, que Parbre en question est fini, de se placer en chacun des aeuds terminaux de Varbre, puis de « remonter » Varbre jusqu’au premier coup joué par les Blancs. Ine s'agit de rien d'autre que du principe doptimalité de Blackwell. La résolution d'un jeu sous forme extensive, consistant a se placer aux neeuds terminaux de arbre eta le remonter jus- 4u’a sa racine, se nomme I's induction en amont» (back- tward induction). Que les joueurs d’échecs se rassurent: ils ‘ont encore de belles parties devant eux ! En effet, méme si ‘un ordinateur suffsamment puissant devrait étre en mesure dde« résoudre » entirement le jeu ’échecs par induction en. mont, il est peu vraisemblable que nous puissions un jour construire un tel ordinateur, sachant que le nombre de par- ties possbles (et done de nceuds terminaux & prendre en compte) est au moins égal au nombre d’atomes dans Puni- vers. IIn’en demeure pas moins que le concept d’équilibre parfait en sous-jewx a été fortement crtiqué. Un exemple fait bien sentir 'étrangeté de certaines conclusions auxquelles induction en amont nous oblige @ souscrire. Il s'agit du paradoxe de Hangman. Supposez que votre professeur de théorie des jeux, dés la premiére OF cerns ns heure de cours, le premier jour de l'année universitaire, ‘yous annonce son intention de vous infliger une interro- gation » improvisée » au cours de l'année. Si vous étes un ‘peu malin, vous Tui rirez au nez parce que, en réalité, il est incapable de mettre sa menace 4 exécution : vous connaissez naturellement le calendrier universitaire, et, par conséquent, vous connaissez Ia date de votre dernier cours avec edit professeur ; il est évident que ce dernier ne pourra vous infliger son interrogation lors de la der- niére heure de l'année parce qu’alors vous aurez anticipé qu'il ne lui restait qu'une seule séance pour exécuter sa ‘menace, de sorte que Pinterrogation n’aurait plus rien sdimprovisé », Pour la méme raison, interrogation aura pas lieu non plus lors de Vavant-dernier cours. Procédant par induction en amont, vous pouvez en déduire que interrogation n’aura pas lieu davantage lors de la stance antépenultiéme... et finalement, vous en conclurez que votre professeur ne peut pas vous « sur- prendre ». Ne riez pas top vite : votre professeur sait pertinem- ‘ment tout cela ; il laissera sagement s’écouler quelques séances, voyant bien que vous maitrisez parfaitement induction en amont, et puis, un beau jour, vous infligera tune interrogation qui, pour le coup, sera vraiment «improvisée + ! Un autre paradoxe célébre, induit par l'induction en. amont, nous a été fourni par Selten en 1978, et en voici tune version : un roi avait h vassaux fidéles, répartis en ke cités distinctes. En chacune de ces cités, ily avait un seigneur susceptible de faire Ia guerre au vassal, repré sentant de Pautorité royale. Le jeu s'écrit sous forme extensive en 2k étapes. A chaque étape paire j, c'est au tour de 'un des seigneurs de choisir d’attaquer ou non le représentant du roi. Si un seigneur décide d'attaquer, le roi peut donner 'ordre de riposter ou de concéder la place. La « réplique » royale est donnée avant que le sei- gneur suivant n’entre en lice. La structure d’une paire aPétapes est donnée par la forme extensive suivante dans 120 LATHEORIE DES JEUX f laquelle le premier paiement est celui du roi et le second celui du seigneur dont le tour de jouer est venu. k os fique Agressif, Roi Riposte, Soumission 5,1 0,0 2,2 Figure 5.7 (On suppose que le jeu est a observation parfaite et que le paiement global du roi est la somme de ses paiements en chaque étape. Ce jeu admet une multitude d’équi- libres de Nash. En particulier, toute partie du jeu au sein de laquelle, a chaque paire d’étapes, soit le seigneur n’at- {aque pas, sit il ataque et le roi céde, peut étre obtenue comme équilibres de Nash. Il suffit que le roi menace de riposter si le seigneur ose I'attaquer. En revanche, le jeu admet un unique équilibre sous-jeux parfait : chaque sei- gneur attaque, et le roi ne riposte jamais. Si l'on croit & induction en aval, cette issue devrait étre la seule issue «rationnelle » du jeu. Cette conclusion parait pleine de bon sens tant que Ie nombre & de seigneurs est petit. ‘Toutefois, si est urés grand, on imaginerait volontiers le seénario suivant : au débur du jeu, le roi riposte volon- tairement de maniére agressive @ tous les seigneurs qui cont Ja velléité de remettre en cause son pouvoir ; cela lui permet de se btir une réputation et dimpressionner les seigneurs suivants, au point que ceux-ci neseront plus Pattaquer. Cette logique est clairement incompatible avec celle de V'induction en amont. C’est pourtant celle qui fut mise en cuvre par le pouvoir royal absolutiste naissant l’égard de la Fronde, par exemple. Ici, cepen- dant, ce n’est peut-étre pas le critére dinduction en amont qui est en faute, mais plutét la fagon dont nous avons modélisé Vinteraction du roi sur un + grand» Le TEMPS ya nombre de périodes. De méme que nous avons vu, au cchapitre 1, que le meilleur moyen de rendre compte du ccaractére négiigeable de chaque individu dans un jew ‘océanique consistait a postuler Pexistence dune infinité de joueurs, de méme, le meilleur moyen de rendre justice a intuition qui sous-tendait le scénario précédent est sans doute de postuler que le jeu a une durée infinie. 3. Longue durée et coopération ‘Nous avons vu que la théorie des jeux est née, en par- tie, du constat d'échee que symbolise Punique issue en stratégies dominantes du dilemme des prisonniers : le comportement stratégique des joueurs peut induire des {ssues socialement indésrables. I en va tout autrement si Yon prend explicitement en compte la durée infinie d'un jeu. Supposons, en effet, que les joueurs impliqués dans un jew stratégique sont informés du fait qu'il eur faudra jouer la méme partie plusieurs jours de suite. Et ce, un si grand nombre de fois que tout se passe, pour chacun des joueurs, comme sils devaient se rencontrer indéfini- ment. On peut imaginer quis risquent alors de modifier leur comportement : la crainte d’étre punis par leurs adversaires, sls sont jugés trop avares, et Ia perspective de gains futurs, que pourrait induire un comportement tun peu plus altruiste, pourraient incter chaque joueur & agir en un sens qui n'est pas immédiatement favorable & ses intéréts. Dans ces conditions, des issues socialement ‘optimales, qui seraient par ailleurs impossibes & obtenir comme équilibres de Nash du jeu en coup, auraient de nouveau des chances de se réaliser comme équilibres de Nash du jeu infiniment répété. David Hume, dans son Traité de la nature humaine, ne dit pas autre chose « Fapprends a rendre service un autre homme sans lui mani- {ester une queleonque bonté réelle: parce que je prévois qu'l 122 LA THEORIE DES JEUX sme retounera ce service, dans Vantente d'un autre de méme cespéce, et afin de maintenir les mémes rapports de bons offices avec moi-méme ou autrui. En conséquence, apés que je lu ai rendu service et quil ena tiré avantage, lest conduit, ‘préveyant les conséquences de son refus, jouer son réle!,» ‘L’on voit bien que Ie point crucial est, une fois de plus, que Tintérét bien compris de V'individu puisse mener & optimum social. lest frappant de constater, par exemple, que, durant les deux premiers sidcles de notre ére, les tiches aux- quelles s'est livrée 'armée romaine ont été de nature cssenticllement bureaucratique et non militaire. Ainsi, les 350 000 hommes environ que comprait alors armée, dispersés sur les 10 000 kilometres du limes, n’étaient pas occupés, pour l’essentiel, & maintenir ordre, Certes, ‘quelques prétoriens et des frumentarii? procédérent & des cexécutions et, de temps a autre, organisérent des expédi- tions punitives dans certaines zones de brigandage endé- mique. Mais des provinces entiéres, dont la totalité de Vitalie, furent inermes, c'est-i-dire dépourvues de ‘troupes ; et, dans Pensemble, c’est avec une remarquable Economie de moyens que s'est maintenue la pax Romana ‘au cours de deux premiers siécles. Pour que la plus grande partie du monde connu ait pu se soumettre au point qu’il fit devenu inutile de Padministrer manu ‘militar, il faut bien qu'il y ait eu quelque compensation. r, Pintuition dont il était question instant, & pro- pos des formes de coopération que rend possible linter- action stratégique sur la longue durée, fournit une excellente clé de «lecture» de ce phénoméne. D'une part, on Va dit, les veléités de rébellion étaient sévére- ‘ment punies par l'envoi de centurions et Porganisation d’expéditions punitives, de sorte que méme en labsence darmée, la menace de représailles existat bien, D'autre part, surtout, Empire offrait aux populations fraiche- ment conquises a perspective de privileges. Gaulois, Ephésiens, Africains, pérégrins pouvaient espérer devenit LETEMPS 123 un jour citoyens latins, voire romains, chevaliers et, pour- {quoi pes, sénateurs, pourvu qu’ils ussent irréprochables. Bien sir, ce type de considérations ne peut avoir sa place u’a partir du moment od il est devenu clair pour vain- {queurs et vaincus que occupation romaine sera longue. Crest probablement ce type de « contrat implicite — nous payons Pimpét pourvu que vous nous offriez des chances taisonnables d’accéder aux privléges des castes nanties de votre société ~ qui permet d'expliquer la quasi-absence de gardiens de la paix romaine. Nous le savons par ailleurs : utiliser des gardiens pour imposer ordre est rarement une bonne solution ~ car, aprés tout, qui gardera les gardiens ? Crest a cette intuition que Pétude des jeux répétés tente de donner un fondement théorique rigoureux. 4, Les jeux répétés CConsidérons donc un jew en un coup sous forme stra tégique, G, et supposons qu'il est répété un nombre infini, mais dénombrable, de fois. Une partie de G est, & présent, une étape du jeu infiniment repété, noté G_. A Pissue d’une étape, tous les joueurs sont informés ‘des actions pures, adoptées par leurs adversaires, (Nous dis- ccuterons dans un instant du starut particulier des straté- gies mistes.) Une histoire de longueur N du jeu infiniment répété est la donnée de N parties de G, jouées successi- vement, On admet que les joueurs jouissent d'une ‘mémoire parfaite, de sorte que, lorsque leur tour est vernu de jouer pour la (N + 1)éme fois, ils se souviennent des ‘coups joués lors des N parties précédentes. Comment définir,& présent, Ia stratégie dun joueur ? Il s’agit d’une égle de comportement qui lui permet de savoir quelle attitude il Iui faut adopter, 4 chaque étape, en fonction de ce quil sait du passé. Ainsi, les frumentarii, logés aux astra peregrina de Rome, avaient clairement comme consigne de réprimander sévérement toute remise en 124 LA THEORIE DES JEUX cause de Pautorité impériale (en particulier le refus de payer 'impét), tout en laissant aux populations soumises Pillusion dune certaine autonomie. Une stratézie, dis lors, est une application de ensemble des histoires de Iongueur N vers l'ensemble des actions disponibles pour le joueur & 'étape N + 1 — et cela pour tout entier N. A chaque étape, chaque joueur regoit son paiement étape tel quil est défini par les régles de G. Il y a plu- sieurs fagons de comptabiliser le paiement induit par une partie de G..(ce.y par une suite infinie de parties de G) Cette definition est évidemment cruciale parce que c’est elle qui permettra d’écrire éventuellement G_ sous forme stratégique, comme n’importe quel autre jeu, et parce ue c'est cette fonction de paiements d’étape que chaque joueur va s"efforcer de maximiser. ‘Une premiére idée naturelle est d’évaluer le paiement global d'un joueur par la moyenne de ses paiements détape, Néanmoins, il faut s'assurer que cette moyenne converge toujours. Lorsque ce m’est pas le cas, une ‘maniére de contourner la difficulté est de ne retenir que 1a limite inférieure de cette moyenne, c'est-a-dire la plus petite valeur que prend indéfiniment la suite des moyennes de paiements sur les histoires de longueur N, lorsque N tend vers Iinfini. Dans ce cas, cela signifie que le joueur qui nous intéresse est de nature pessimiste + il évalue systématiquement toute suite divergente de la acon qui lui est la plus défavorable. Au contraire, sil est ‘optimiste, il sufft de retenir la limite supérieure ° Le principal intérét de cette méthode de calcul est que Te joueur qui 'adopte se montre extrémement « patient » En effet, puisqu'il ne retient que la moyenne de ses paie- ‘ments sur une durée infinie, ce qui lui arrive au cours Pune période finie n’a aucune importance & ses yeux. Ce point a fait Pobjet de nombreux débats, et mérite que l'on s'y attarde quelque peu, car ces la que Vhypothése de la répétition infinie du jeu monte sa force. Ainsi, si vous répé- tez un nombre arbitrairement grand ~ mais fini - de fois te dilemme des prisonniers, vous constaterez avec déception LETEMPS 125 que Ia dénonciation mutuelle demeure Punigue équiibre stratégique du jeu. La raison en est simple. Suppose que le dilemme des prisonniers soit repeté N fois, et placez- vous a la demiére période : chaque joueur peut dénoncer son petit camarade en toute impunité. Qui viendra Ven blimer ? Certainement pas son compagnon d'infortune, Grant donné que c'est la derniére fois qu'ils se voient. I est clair, par conséquent, que les deux joueurs se dénonceront ‘muuellement a la date N, Par récurrence ascendante,ilen va de méme a la période N- 1, et donc... ala période 1 Pour échapper a ce cul-de-sac, il est done vital que les régles du jeu G_ prévoient une infinite d'étapes. ‘Certains estiment qu'il s'agit a d'une hypothése com- plétement iréaliste Il est vrai que Pemprise de Rome sur Ja Méditerranée ne fut pas éternelle, et que la paix rela- tive des deux premiers siécles contraste fort avec les troubles de Empire tard. Mais le phénoméne que nous essayons de saisir ne dépend pas du caractére effective- ment infini du jeu répété. Tout ce qui nous intéresse est de comprendre l'émergence (si émergence il y a) d'un com- portement + altruiste » dans un monde ol nous avons, postulé que chaque individu maximise ses propres inté- réts cotite que cotte. Pour cela, i n'est pas du tout néces- saire que les joueurs aient réellement une durée de vie infine ; ce qui importe, est que chacun soit persuadé in perto que le jeu durera éternellement et prét, donc, a se ‘montrer infiniment patient. ‘Une méthode alternative d'évaluation du paiement alobal d'une partie de G., consiste i caleuler la moyenne escomptée du flux de ses paiements dape : Boh = A)" ta, oi 2, est le paiement du joueur a la date met 2 € 10.1], son taux d'escompte. Plus 2 est proche de 1, plus le joueur a tendance a déprécier le futur et valoriser le pre sent. Plus 2 est proche de 0, plus, au contraie, il est confiant dans Pavenir et patient. Dans le contexte d'une économie de marchés financiers, le nombre 4 peut aussi sinterpréter en fonction du taux d'interét:il sufi d'ima- 126 LATHEORIE DES JEUX aginer que la suite des paiements du joueur constitue un flux de revenus analogue a celui d'une obligation cou- ponnée, dont le joueur place systématiquement les cou- pons sur un compte en banque rémunéré. C'est dans ce ‘contexte que I'hypothése sous-jacente, d'aprés laquelle tous les joueurs évaluent le furur a Paide du méme taux dTescompte, se juste le plus aisément. A a différence de valuation par la (limite de la) moyenne arithmétique, Ia moyenne escomptée, avec A fixé, ne permet pas de négliger les histoires de durée finie : cette fois, tus les termes de la suite x, comptent. I1n’en demeure pas moins que, comme nous 'avons dit, ‘nous pouvons mesurer le caractéze plus ou moins patient d'un individu, en fonction de 2. En particulier, nous pourrons examiner ce qui se passe lorsque A tend vers 0, Cest-i-dire lorsque les joueurs sont asymptotiquement infiniment patients. ‘Une autre interprétation de 4. permet de rassurer ceux {que laisserait pantois hypothése d’une durée de vie infi- rnie des joueurs : il est clair que l'on peut rarement cexclure le fait que les interactions auxquelles nous parti- cipons puissent se répéter (A y bien regarder d'ailleurs, les relations que nous entretenons avec autrui, et dont Rous avons la certitude qu’elles ne pourront jamais se renouveler, sont rarissimes). Le nombre A(1 = 4)" est alors la probabilité pour que le jeu G se joue une niéme fois, sachant que » - 1 parties ont déja eu liew. Reste, enfin, & prendre en compte les stratégies mixtes. Dans le cas oit certains joueurs utilisent des loteries, leurs paiements d’étape deviennent aléatoires. Se pose alors la question de savoir s'il faut définir le paiement ‘global du jeu, infiniment répété, en prenant dabord la limite (inférieure, supérieure...) et ensuite l'espérance du ajement d’étape, ou le contraire #. Du fait du caractére plus ou moins arbitraire de ces différentes définitions d'un équilibre stratégique dans un jeu infiniment répété, il est préférable — lorsque cela es: possible ~ de se ramenet aux équilbres uniformes, définis de la maniére suivante LeTEMPS 127 Un N-uplet de stratégies de comportement est un équi- libre uniforme sila moyenne arithmétique des espérances de paiements d'étape induits par ces strategies converge, et si, pour tout réel €> O arbitrairement petit, i existe un rang T (éventuellement trés grand) tel que, pour tout n>'T, aucune déviation du joueur i ne peut induire une amélioration de V'espérance de la moyenne de ses paie~ ments, dans le jeu repété» fois, supérieure €. La metho- dologie sous-jacente & ce dernier concept d’équilibre est méme, mutatis mutandis, que celle qui sous-tend, par exemple, les résultats asymptotiques sur le cour de Debreu et Scarf. De méme que la fiction dun continum agents peut-étre considérée comme une + bonne fic- tion «si elle rend correctement compte de ce qui se passe, asymptotiquement, dans une économie comportant un nombre fini, mais arbitrairement grand, agents, de sméme hypothése de la répéttion infin d'un jeu pourra frre tenue pour pertinent si les équilbres que nous pour- rons y exhiber auront la propriété d’étre des limites 4 équilbres, ou d’e-équilibres, de jeux répétés un nombre fini de fois. Cest le cas des équilibres uniformes. En plus du caractére infiniment répété de l'interaction stratégique entre joueurs, trois autres hypothéses cru- ciales pour ce qui va suivre méritent d’étre discutées: Ia premiére est qu'l s'agit du méme jeu que Y'on répéte & chaque étape, Dans la réalité, il est clair qu'l est & peu prés impossible de reproduire la méme situation & Viden- fique. Cette hypothése est donc une maniére de simpli- fier le probléme, afin de nous focaliser sur aspect nouveau et important: la durée, Lorsque le moment sera venu de considérer des jews dynamiques dont Penviron- rement évolue au cours du temps, nous le ferons via étude des jeux stochastiques ‘La deuxieme hypothése forte sous-jacente a ce qui suit est que tous les joueurs connaissent exactement le jew qui est répété a chaque période. Nous léverons cette seconde restriction au chapitre suivant en abordant ce qu'il convient d'appeler les jeux & information incomplete. 128 LA THEORIE DES JEUX La derniére hypothése sur laquelle je voudrais attirer attention du lecteur concerne la structure d'observa- tion : nous supposons, pour I'instant, que tous les joueurs observent exactement toute histoire du jeu @ chaque tape. La encore, il s'agit d'une hypothése trés forte dont ilnous faudra mesurer impact sur les résultats que nous allons obtenir. Nous examinerons ce point a la fin du cchapitre, 4 propos des jeux & observation imparfaite. Intéressons-nous, pour le moment, aux jeux répétés & information compléte et a observation parfaite. 5. Les théorémes « de tout le monde » Dans ce cadre, le premier théoréme que nous rencon- trons n'a été démontr... par personne ! Il est devenu évi- dent & Yensemble de la communauté scientifique au ‘cours des années cinquante, sans que quiconque ait pris. la peine de Mécrire formellement. C'est la raison pour laquelle, & instar autres résultats voisns, il a été rnommé + théoréme de tout le monde » (folk theorem). Ce théoréme dit en substance ceci: toutes les combi- raisons de paiements du jeu en un coup G, qui sont & la fois réalisables et individuellement rationnelles, peuvent dere obtenues comme équilibres uniformes du jeu infini- ment répété G.. La condition de réalisabilité signifi seu- lement que la combinaison de paiements doit se situer dans Penveloppe convexe des paiements réalisables dans le jeu G. Quant la rationalitéindividuelle, elle correspond au fait que chague joueur regoit un paiement au moins gal & celui qu'il peut garantir dans le jeu en un coup G. ‘La preuve du folk theorem est trés simple : fixons une com- binaison linéaire convexe g de paiements réalsables et individuellement ratonnels du jeu G. Pour ¢> 0 sufisam- ‘ment petit il existe une combinaison linéaire & coeficients rationnels qui approxime, a e prés, le nombre ¢ Etsy = 85 sor 6). oi, Pour tout n= 1, & g, sécrit a8. En jouant des Y LeTEMPS 129 cycles de parties de longueur # od chaque paiement a brape g, est repéxé un nombre a, de fois, les joueurs par- viendront & approcher le paiement g aussi prés qu'il le souhaitent. Pour que cette « histoire » du jeu infiniment répaté soit un équilibre de Nash il faut s'assurer qu’au- ccun joueurn’a intérét dévier. Pour cela il suit que les joueurs conviennent d'un plan de représailles si l'un drentre eux Savssit de quitter le chemin d’équilibre pres- crit parla répétition des g,- Dans ce cas, en effet, puisque les coups de chaque joucur sont observés par tous a chaque étape, la moindre déviation sera immédiatement détectée. I suffi alors aux autres joueurs (ceux qui n'ont pas dévié) de jouer une stratégie de minimax contre le joueur déviant. Comme le paiement eétape g, état indi- viduellement rationnel, cette punition en est bien une : si Je joueur i dévie la date, dés la période’ + 1 i regoit son paiement de minimax, et ce jusqu’a la fin des temps. Puisque les histoires de longueur finie ont un poids négli- geable dans la moyenne arithmétique de la suite de ses paiements, le paiement global du joueur i convergera vers son paiement de minimax du jeu G, alors qu'en obéissant au seénario d’équilibre il gurait obtenu le paiement ‘moyen ¢, qui est évidemment preferable a son paiement de minimax. (Si la déviation du joueur i est mixte, il suf- fit d’utiliser la loi des grands nombres pour garantir que le paiement moyen de déviation converge presque sire- ‘ment vers un paiement qui n'est pas supérieur au paie- ment de minimax de i dans le jeu en un coup.) Le message est donc clair : dés lors que tous les joueurs sont persuadés qu'ls se reverront avec une pro- babilité strictement postive, la coopération redevient un équilibre possible (quand bien méme elle n'était pas un équilibre du jew en un coup). Remarquons, toutefbis, quielle n'est pas la seule issue d’équilibre stratégique Diune certaine maniére, eu égard aux préoccupations un ingénieur social qui sefforcerait de favoriser T'émer- gence d'ssues socialement optimales, la répéttion nous fait passer d'un type de probleme symbolisé par le 130 LATHEORIE DES JEUX. dilemme des prisonniers oi la coopération est impossible, un type different de probléme que représente, par exemple, la «chasse au cerf et au lievre + (voir chapitre 1, p. 101) oi la coopération n'est pas la seule issue possible Par ailleurs; le «théoréme de tout le monde » n’est pas vrai, en général, pour les jeux escomptés. Dans l'exemple suivant 5, le jeu comporte trois joueurs. Le joueur 3 n'a qu’une seule stratégic, laquelle n'a donc aucune influence sur les paiements. Le jeu d’étape est donné par Ja matrice de la figure 5.8. Figure 5.8 I s'agit grosso modo dun jeu A somme constante entre les joueurs 1 et 2. Du coup, pour n’importe quelle valeur du taux d’escompre A, 'unique paire de stratégies opti- males des joueurs 1 et 2 est (1/2, 1/2). Le paiement induit est donc (1/2, 1/2, 1/4), ce qui veut dire que le paiement (1/2, 1/2, 1/2), par exemple, ne peut pas étre obtenu comme un équilibre uniforme du jeu escompté. En revanche, si 2. tend vers 0, on récupére bien, asymp- totiquement, analogue d’un folk theorem. Le lecteur s‘interroge sans doute sur la crédibilité de la menace que nous venons d’utiliser afin dinciter les joueurs a suivre le chemin d’équilibre indiqué par la suite des paiements g,. Supposons que le joueur i dévie a la date T. En principe, tous les autres joueurs devraient mettre en place une stratégie punitive de minimax dés la période suivante. Or, cette punition peut se révéler trés préjudiciable aux punisseurs eux-mémes. Dans ces conditions, qu’est-ce qui nous assure que les joueurs ‘mettront bien leur menace a exécution, une fois placés devant le fait accompli de la déviation de Pun des leurs ? Ce probléme n’est pas un détail: c’est celui que ren- contrent les pays du Nord, par exemple, a l'égard du paiement de la dette des pays du Sud. Liintérét bien OD sees a compris des pays créanciers est-il vraiment de mettre definitivement leurs débiteurs a genoux en les obligeant 4 payer une dette exorbitante ? ‘Notons que, si l'on s'en tient a Ia logique de Péqui- libre de Nash, de telles considérations n’ont pas lieu de nous préoccuper : en fait, les joueurs n’auront jamais besoin de mettre leur menace & exécution puisque la puissance de la menace qu’ils exercent les uns sur les autres devrait suffire a dissuader les plus téméraires de risquer d’étre punis. C'est donc en termes d’équilibres sous-jeux-parfaits qu'il faut poser la question précé- dente. Toutefois, il n'est pas difficile de voir que, pourvu que nos joueurs soient suffisamment patients, une ver- sion du folk theorem peut étre facilement obtenue en sous-jeux-parfaits. Il suffit, pour ce faire, de modifier twés légérement les stratégies de punition. Puisque le jew étapes est fini, le gain maximal obtenu par un joueur au cours d'une déviation en un coup est borné. Il suffi donc d'un nombre fini d’étapes pour infliger au déviant tune punition telle que sa déviation ne lui ait pas été pro- fitable a posteriori. Par conséquent, une fois leur devoir accompli, les punisseurs peuvent parfaitement revenir au chemin @iquilibre, comme s'il n'y avait jamais eu de déviation. Le tout s’effectue en un temps fini, donc n’af- fecte pas les paiements globaux des punisseurs. Mettre eur menace a exécution, ou y surscoir, laisse donc ces derniers indifférents. Il s'agit alors bien d'un équilibre sous-jeux-parfait. La conclusion (provisoire) qui s'impose est la sui- vante : la prise en compte du temps permet de réconci- lier partiellement les aspects coopératifs de la théorie des jeux avec sa version non coopérative. Trois bémols sont toutefois a ajouter : Tout d'abord, cette réconciliation n’est que partielle dans la mesure oi les folk theorems permettent non seule- ment d’obtenir des issues Pareto-optimales comme équi- libres de Nash, mais aussi une infinité dissues réalisables ct individuellement rationnelles qui ne sont pas effi- 132 LATHEORIE DES JEUX cientes. Pour que Ia réconciliation soit effective, il fau- drait que seules les issues efficientes émergent comme Equilibres stratégiques d’un jeu infiniment répété. Nous verrons au chapitre XII que introduction de la rationa- litélimitée permet, dans certaines conditions, de « réduire + ensemble des issues d’équilibres de Nash d’un jeu infi- rniment répété aux seules issues efficientes. Ensuite, a quelques exceptions prés qui ont été signa lées, les folk theorems concernent tous des jeux infiniment répétés. Dans de nombreuses situations, nous ne pou- vons guére nous permettre d’attendre + aussi long- temps +, Il nous faut alors concevoir les + régles du jeu » clles-mémes, de sorte que les joueurs soient incités @ jouer des équilibres efficients, méme en I'absence de menace de rétorsion subséquente. C'est le theme de implantation stratégique, qui sera abordé au chapitre x. Enfin, dés lors que Pon introduit de observation ‘imparfaite, les foe sheorems sont beaucoup plus diffciles a obtenir, méme pour des joueurs infiniment patients. Jusqu’a présent, nous avons fait hypothése que l'histoire ddu jeu était connue de tous les joueurs a chaque instant. Dans de nombreuses situations, cette hypothése n’est pas réaliste, L’une des principales difficultés des relations de long terme entre joueurs ayant des intéréts opposés est précisément, en effet, que chacun d’eux peut choisir un certain nombre d’actions 4 Vinsu de autre. Une maniére simple de formaliser cette situation consiste a supposer ue, a T'issue de chaque étape, chaque joueur recoit un signal privé qui le renseigne sur ce qui s’est passé au cours des étapes précédentes. Si ledit signal lui révéle toutes les actions choisies par tous les joueurs, nous sommes de nouveau dans Ie cas précédemment étudié des jeux & observation parfaite. Si le signal ne lui dit rien d'autre que la suite de ses propres actions, cela signifie que le joueur en question n’observe rien : il se souvient seulement de ses propres actions. Deux phénoménes se produisent alors, qui étaient absents des analyses menées sous V'hypothése d'observa- ¥ LE TEMPS 133 tion parfaite : d'une part, la définition d'un plan public se révéle Epineuse. En d'autres termes, définir une norme sociale devient un probléme puisque tout le monde n’est ppas en mesure d’observer suffisamment » ce qui se passe + afin de régler son comportement sur ladite norme. C'est cette dificulté qu’sppréhendent les pays soucieux de modi- fier radicalement leur code de la route : essayez de coor- donner la population d'un pays entier pour que, du jour au Jendemain, tout le monde roule non plus & gauche mais & droite. Le luxe de précautions dont il faudra vous entourer afin d’éviter une hécatombe traduit bien ce que la théorie dds jeux permet de metre formellement en lumiére. ‘Diautre part, dans l"bypothése oi vous seriez parvenu ‘a imposer un plan public connu de tous, observation ‘mparfaite rendrait beaucoup plus difficile la surveillance des joueurs par eux-mémes et la mise en place de puni- tions en cas de déviations. C’est tout le probleme posé par les trafics illégaux : il ne fait aucun doute que trafi- uants, gouvernements et citoyens sont tous conscients du fait que les sociétés auxquelles ils appartiennent ont ‘adopté comme norme publique la prohibition de ces tra- fics, L’ennui est quill est & la fois trés difficile pour les gouvernements de surveiller efficacement les trafiquants cet plus encore pour les citoyens de vérifier que les gou- ‘vernements font effectivement leur travail de repression. 6. Les jeux stochastiques ‘Nous I'avons vu, une restriction importante, implicite dans la modélisation de la longue durée en termes de jeux répétés, est que Vaction d’un joueur a une étape donnée n’a d'influence que sur son paiement a cette tape. Or, beaucoup de situations importantes n’entrent pas dans ce cadre. Ainsi, un consommateur qui s'efforce de gérer sa trésorerie de maniére rationnelle se trouve confronté a un probléme d’optimisation intertemporelle dont les jeux répétés usuels ne peuvent pas rendre 134 LATHEORIE DES JEUX compte + chaque jour, il Jui faut arbitrer emre une pense courante et une épargne susceptible de servir pour une dépense furure. En épargnant quelques dollars, aujourd'hui, Alice diminue bel et bien son paiement a erape puisqu’elle se prive dela derniére chemisete la mode Upper ltée Side, qui lui permeuait d'atrer Pat- tention d'éventuels marins au prochain vernissage du musée du MoMA. Néanmoins, elle s'autorise des paie- rents fururs trés intéressants, dans Patente de Pouver- ture d'un restaurant malas délicieusement décadent. Pour tenir compte de ce type de phénoménes, il convient d'ajouter un ingrédient essentiel & notre deserip- tion d'un jeu dynamique : un espace d’états K et une pro- babilité de uansition P entre le produit des actions erapes et K. Le déroulement Pun jeu stochastigue est alors le suivant. L’éat initial & d'un jeu stochastique est fixé a priori. Supposons qu’ Vétape mn, le jeu soit dans etatk, € K-Les joueurs informés de at, choisssent simultanément une action. Notons a, le N-uplt actions choisies a la date n. Le joueur i regoit alors le paiement d'etape (ay &,), un nouvel état, est chosi suivant la distribution P(> a, f,)5 Puls on passe ’étape suivante. ‘Un joueur exerce tne double influence en cheisissant une action a l'étape m : d'une part sur son peiement a'étape (4, ,) et sur celui de ses adversaires, de Pautre sur le choir de'Tétat&, ., et done sur son paiement (et celui de ses adversaire) & la date suivante, a, &, , )s lequel dépendra de &, , ,. Ay regarder de plus pres, le choix d'un joucur a"Une date exercera méme une influence sur la traié de la suite du jeu, puisque le choix de état k, ,» (et done de hy. yf, . » =) dépendra de 2 «Le dilemme qui se pose @ chague joueur est done slmilsie & celui qui torture Alice : fautil chercher @ ‘aximiser son paiement ’étape au risque d’atterir pro- chainement dans des états b,, , qui pourront se révéler tris défavorables, ou bien esti préférable d'etre patient et de jouer en sorte qu'un Gath,» présageant des jours meilleurs, ait de grandes chances d'éwe sélectionné ? La FF. LETEMPS 135 cigale et la fourm incarnent deux réponses possibles au probléme. Il est clair qu'un comportement unilatéral sera rarement optimal : se comporter perpétuellement en cigale promet d'étre rapidement désastreux ; inverse- ‘ment, jouer les éternelles fourmis n’a pas de sens... il faut bien faire la fete un jour ! La jeunesse de Mai 68 ne s'est pas privée de le rappeler & ses ainés. I existe une classe d’états particuliérement importante pour Pétude de jeux stochastiques, c'est celle des étars ‘absorbants. Un état absorbant est un état dont il est impos- sible de sortir. I joue le rile d'une espéce de « trou noir + au sein du jeu. Ce peut étre, par exemple, la «fallte « du couple Harford, que les frasques «Alice (ou de Bill, @'aileurs...) auraient définitivement ruiné, ou encore Ia mort de Ia cigale. Dans un tout autre contexte, le dilemme existentiel auquel se trouve confronté un piétiste anglo- saxon au XVII siécle ressemble fort, i en croire Max Weber, au probléme d’un joucur participant & un jeu sto- chastique dont le paradis et Venfer seraient les deux états absorbants, et la question qui l'angoisse est bien celle de savoir sila jouissance des biens terrestres ne risque pas de le faire atterrir dans un état absorbant funeste Crest Shapley qui, en 1953, introduit le premier modéle de jeu stochastique (@ somme nulle). Liadjectif| « stochastique » provient du caractére aléatoire de la tran- sition d'un état vers l'autre, Bien entendu, un jeu répeté est un exemple de jeu stochastique possédant un état unique, La version qu’adopte Shapley est implicitement celle d'un jeu escompté, mais ilva de soi que tout ce qui &é dit a propos de la définition du paiement global dun jeu répété vaut cerbarim au sujet d’un jeu stochas- tique. Shapley prouve dans ce cadre existence de 1a valeur et de stratégies optimales stationnaires, c'est-i- dire qui ne dépendent, a chaque date », que de létat pré- sent k, et non de Mhistoire qui précéde 1. C'est Gillette qui, quatre ans plus tard, pose la question de existence de la valeur dans les jeux stochastiques & somme nulle non escomptés, et qui construit un exemple suggestif afin 136 LATHEORIE DES JEUX de montrer que sa question nest pas triviale. Cet exemple est le suivant : Bill G D HCL-F Oo Alice BI O0) 1-1 Figure 5.9 Ce jeu, appelé le Big Match, s'interpréte comme suit T existe trois états possibles, hy A, et hy. Chacun des deux joueurs dispose de deux actions a chaque étape, Het B pour Alice, G et D pour son mari. La matrice qui précéde décrt les paiements d’étape d’Alice en fonction des actions d'étape des deux joueurs. La transition d'un drat a autre s'opére de maniére déterministe. Les étoiles qui surmontent les paiements de la premiére ligne signi- fient que lon entrera, @ V'étape suivante, dans un état absorbant. Le Big Match posséde deux états absorbants k, thy. Tant qu’Alice joue en bas le jeu reste dans état et Ton rejoue le méme jeu’ a T'étape suivante. En revanche, dés qu'elle joue en haut, alors le jeu passe de ze, vers k, ou hy selon ce que joue Bill. Si Bill joue & ghuche, on transite vers ket le paiement de Bill sera per- pétuellement - 1, sinon on passe en fy et leur paiement a tous deux sera nul pour toujours. C'est done Alice qui contréle entrée dans Mun des trous noirs du jeu, mais si Alice choisi d’abandonner k, c'est Bill ui choisit état dans lequel le jeu stationnera jusqu’a Ia fin des temps. Le choix d’Alice est donc déterminant : il s'agit, pour elle, de parir sur ce que fera son époux. Si elle anticipe qu'il jouera a gauche au coup suivant, alors il lui faut oser jouer en haut pour tenter d'obtenir a rente perpétuelle de k,. En revanche, si elle estime que Bill a toutes les chances de jouer & droite, alors elle a intérét a jouer en bas, Si elle se trompe dans son pari, etjoue en haut alors, que Bill joue& droite, elle sere condamnée a un paiement nul, jour aprés jour. LE TEMPS 137 Si le jeu est escompté au taux 2. > 0, la situation n’est ppas trop cauchemardesque pour nos deux époux : Alice posséde une stratégie stationnaire optimale, consistant & jouer a chaque étape chacune de ses actions avec une probabilité M1 +4; de méme, Bill a une stratégie opti- ‘ale stationnaire qui le fait jouer chacune de ses deux actions avec la méme probabilité 1/2. En effer, le lecteur pourra verifier que, quelle que soit la stratégie de Bill, ‘Alice obtient un paiement global au moins égal 4 1/2 et inversement que, quelle que soit la stratégie d’Alice, Bill se garantit un paiement au moins égal a - 1/2. La situation est beaucoup plus delicate si leurs paic- ‘ments ne sont pas escomptés ~ et nous avons vu qu’a plu- sicurs égards, c'est ce modéle-la qui rend le mieux compte une interaction stratégique de long terme dont la durée ne serait pas connue avec précision. La stratégie station- naire précédente de Bill lui garantit de nouveau un paie~ ment moyen espéré au moins égal 4 - 1/2. Quel est le paiement qu’Alice peut, & présent, garantir ? Malheu- reusement pour elle, pour chacune de ses stratégies sta- tionnaires, Bill dispose désormais d'une réponse qui lui assure que le paiement moyen espéré de sa femme tendra vers... 0, Si lice joue 4 chaque étape H avec une proba lite strictement positive, alors il suit Bill de jouer systé- ‘matiquement droite et de se montrer aussi patient que la fourmi de La Fontaine. En effet, Alice finira par jouer en ‘haut en un temps fini avec une probabilité égale a1. Donc, si Bill est assez patient, il est (presque) sir de gagner défi- nitivement 0 dans un laps de temps fini. Si, en revanche, Alice joue H avec une probabilité null, il suffit que son ‘mari joue a gauche & chaque coup. ‘Toutefois, si Alice a fait un peu de théorie des jeux, son sort n'est pas scellé. Elle peut recourir aux travaux de Blackwell et Ferguson pour apprendre jouer une stra- ‘tégie (compliquée...) qui lui permette de garantir un paiement espéré asymptotique supérieur & 1/2 - €, pour out e > 0. Cette stratégie consiste grosso modo & jouer, & chaque étape, la stratégie optimale d’un jeu stochastique 138 LA THEORIE DES JEUX escompté fictif dont le taux d’escompte serait une fonc- tion de la fagon dont Bill a joué dans le passé, Intuitivement, on sent bien que plus Bill a souvent joué A gauche, plus Alice devrait étre a priori encline a donner tune plus grande probabilité 4 action H. Lrennui est que cela, Bill ne le sait que trop bien, et qu’il faut ruser avec lui, Voilé pourquoi la lecture de Blackwell et Ferguson est incontournable ! Jene résiste pas, devant la détresse d’Alice, a l'envie de lui proposer une (maigre) consolation. Blackwell et Ferguson, en 1968, n’ont résolu que le Big Match. La preuve de l’existence de la valeur dans n’importe quel jeu stochastique somme nulle est un morceau de bravoure, qui devra attendre 1981 pour étre obtenue par Mertens et Neyman. Quant a existence d'un équilibre straté- ‘gique dans les jeux stochastiques (finis) 4 somme non nuulle, elle a ét€ conquise en 1999 seulement par un ‘mathématicien frangais, Nicolas Vieille. Que madame Harford se rassure donc : nous savons tous que la vie lui réserve des jeux bien plus complexes 4 résoudre que le Big Maich, et leur résolution est autrement plus cffrayante ! (CHAPITRE VI LINFORMATION INCOMPLETE Comme j'ai déja eu occasion de le souligner, une hypo- thése cruciale se situe a Varrigre-plan de toutes les ana lyses précédentes : chaque joueur connait toutes les données du probleme auquel il est confronté. C'est ce qui se passe, par exemple, dans une partie ’échecs, oi les deux adversaires disposent, a chaque instant, de toute Tinformation relative a la partie quils sont en train de jouer. Il leur sufit de connaitre les régles du jeu et d’ob- server l'échiquier. Tl n'en va plus de méme dans un jeu de cartes, comme le poker. Cette fois, chaque joueur dispose une information privée a laquelle il est e seul & avoir accés : les cartes qu'il tient en main. Cela implique qu'une bonne partie de l'activité d'un joueur de poker ne consiste pas seulement & ticher d’anticiper la stra- tégie mise en ceuvre par ses adversaires pour mieux les contrer, mais tout simplement deviner Tissue de la donne initiale des cartes. Et, bien évidemment, la prin- cipale préoccupation de ses adversaires est de brouiller les pistes qui pourraient le guider, voire de Pinduire en erreur en + bluffant ». I va de soi que, dans la réalité quotidienne, c'est ce dernier type de jeu auguel nous avons affaice. Et c'est cet élément nouveau — le manque d'informations sur les données du probleme auguel nous avons a faire face ~ que s’efforce dincor- porer dans analyse la théorie des jeux a information incomplete. 140 LA THEORIE DES JEUX 1. Le réle de la Nature (Crest John Harsanyi qui, en 1967-1968, a, pour la pre- migre fois, proposé un modéle opératoire desting a prendre explicitement en compte Pincomplétude de V'in- formation dans un jeu stratégique. Son idée parait aujourd'hui si simple qu’elle est universellement adop- tée. Crest la, sans doute, l'une des caractéristiques des «grandes idées + en matiére de modélisation. Elles per- ‘mettent de grandes avancées dans Panalyse, et paraissent 4 posteriori aller de soi, au point que V’on se demande par- fois comment il a été possible que nul n’ait songé plus tot &formuler le probléme a résoudre en ces termes, Il en est ainsi de la loi d’interaction de Newton, en mécanique, qui suppose Vintervention d’une grandeur mystérieuse, appelée une « force », et qui a paru si naturelle a tous les physiciens, pendant des décennies, que ce n’est que récemment, & travers le prisme de la relativité générale, qu'elle 2 fait Vobjet d'une relecture critique. Le forma- lisme de information incomplete, parmi d'autres contri- butions essentielles sur lesquelles j'aurai Poceasion de revenir, a valu le prix Nobel a son auteur, en 1994, Considérons un jeu sous forme stratégique, G, oppo- sant deux joueurs. Le joueur 1 connait parfaitement les paiements résultant de chaque paire de stratégies pos- sibles, tandis que le joueur 2 nourrit quelques doutes au sujet de ces paiements. Chacun des deux joueurs, en revanche; connait la liste des stratégies a Ia disposition des deux protagonistes. Pour simplifier analyse, admet- tons que chaque joueur ait a sa disposition un nombre fini de stratégies. Dans la mesure ob il ne connait pas avec exactitude les paiements du jeu augue! il participe, le joueur 2 posséde des croyances sur ces paiements Celles-ci sont modélisées via un ensemble de fonctions de paiements possibles (supposé fini, lui aussi) et des probabilités attachées a chacune de ces fonctions de paiement. Notons G; le jeu associé & la heme fonction de paiement, et p, la probabilité que le joueur 2 attribue au LLINFORMATION INCOMPLETE 1a fait que le « vrai » jeu auquel il participe soit G,. Chaque jeu G, est décrit par une matrice possédant le méme nombre de colonnes (sans quoi le joueur 2, qui choisit les colonnes, pourrait déduire des stratégies a sa disposition le veritable jeu auquel il participe). Bien sir, le joueur 2 sait que Ie joucur 1, lui, posséde une connaissance com- pléte des donnés du probléme auquel ils sont tous deux confrontés. Cette situation est précisément celle a laquelle 'acteur américain Michael Douglas doit faire face dans le film The Game : ily incarne un homme d'affaires qui, sur les conseils de son frére, accepte de se préter aux manipula- tions ludiques d’une société privée, dont la vocation off cielle est de divertir ses clients. Il se rend alors compte, au fil des rebondissements du seénario, que cette société n'est probablement rien d’autre qu'une association de malfaiteurs qui, sous le couvert d’amuser leurs clients, les dépouille et les fait disparaitre. L’homme d'affaires se trouve dans la position inconfortable de notre joueur 2 il ne sait pas exactement 4 quel «jew» il a affaire. Les divers incidents dont il est la victime sont-ils une char- ‘mante mise en scéne destinée a le sortir de ennui dans lequel Ia gestion de ses affaires Pavait plongé, ou bien de ‘grossiéres tentatives d’assassinat ? Selon Harsanyi, la situation telle que la congoit le joueur 2 peut se représenter par Parbre suivant : ‘Nature r/o Ph Go Gp. Ge Figure 6.1 Dans un premier temps, la Nature tire au hasard le «vrai jeu auquel vont participer nos deux joueurs, puis ceux-ci jouent. Entre le tirage au sort effectué par la ‘Nature et le début de la partie, le joueur I a été averti de 2 LA THEORIE DES JEUX VVissue du tirage au sort, mais pas le joueur 2. Le dé qu'utilise Ia Nature pour choisir le véritable jeu posséde autant de faces quril existe de jeux possibles, et est tru: qué de sorte que la probabilité p, pour que le jeu G, soit désigné par le sort, correspond tres exactement & la pro- babilité que le joueur 2 accorde au fait quill est en train de participer au jeu Gk. Soit, me direz-vous, il s'agit du point de vue du joueur 2, et celui du joueur 1 ? L'idée 'Harsanyi consiste& dire que tou e passe comone sil point de vue du joueur 1 était identique a celui du joueur 2. Pourquoi ? Parce que l'essentiel, pour jouer intelligem- ‘ment, n'est pas tant la donnée (physique, juridique...) du jeu que la fagon dont vos adversaires se le représentent. En d'autres termes, Harsanyi propose de remplacer le jeu G a information incomplete sous forme stratégique par un jeu Ga information complete écrit sous forme ‘extensive, et of un troisiéme joueur ad hoc apparait : la Nature, Est-ce a dire que la dissymétrie entre le joueur 1 Ginformé) et le joucur 2 (non informé) disparait dans le jeu G’ ? Pas du tout : elle est transposée de la definition des régles du jeu (qui sont désormais les mémes pour les deux joueurs, le joueur informé ayant été converti au point de vue du joueur non informé) vers la définition des stratégies dont disposent les deux joucurs. En effet, Je manque d'information dont soufite le joucur 2 va pou- voir s'écrire, dans le jeu G’, comme un manque d’obser- vation, Le joueur 2 ne sat pas dans quel jeu il joue parce qu'il ne peut pas observer les coups de la Nature, tandis ue le joueur 1, lui, les a observés avant d’entrer dans la salle de jeu. Du coup, une stratégie du joueur informé consiste en tne fonction qui, & chaque issue du tirage au sort de la Nature, associe une attitude & adopter dans le cours du jeu, tandis qu'une stratégie du joucur 2 demeure une unique régle de comportement, indépen- dante de la stratégie jouée par la Nature ~ puisque celle- ci n’est pas observée par le joueur 2. Prenons un exemple. Soient les deux jeux a somme null et é information complete suivants : ¥ INFORMATION INCOMPLETE 43 « Alice 8 Alice & Figure 6.2 Dans la mesure oi chacun des deux joueurs peut se garantit un paiement égal & 0, la valeur de chacun de ces jeux est 0. Supposons, a présent, que Bill ne sache pas cexactement lequel de ces deux jeux est le « vrai», mais pense que chacun d’eux a une chance sur deux de I’étre. Alice, au contrair, sait précisément Iequel des deux jeux ‘a choisi par la Nature. Il est évident, a présent, que unique stratégie opti- male d’Alice consiste 4 choisir G (respectivement D) si elle se trouve en a (respectivement 6). Du coup, la stra- tégie adoptée par Bill n'a plus aucune importance : quoi quill joue, son espérance de gain est toujours égale a “1/2. La valeur du jew est done 1/2. 2. Jeux réperds information incomplete Jusqu’a présent, nous avons considéré les inter- actions stratégiques de long terme sous l’angle des jeux 4 information compléte. Il est clair, néanmoins, que le «bon + cadre, pour étudier ce type de situation, est celui de l'information incompléte : une bonne partie des négociations entre partenaires consiste souvent a ‘tester » Padversaire afin de savoir jusqu’oa ’on peut aller. Ce sont ces procédures, notamment, que la théo- 44 LA THEORIE DES JEUX rie des jeux ré detudier. Considérons le probléme suivant : deux Etats voisins ‘ont a se partager un territoire homogéne. On sait que, si leurs préférences sont identiques, alors, pour des raisons de symétrie, la seule solution raisonnable du partage est ‘que chacun d’eux regoive la moitié du terrain (exprimée, par exemple, en fonction de sa surface). On peut conce- voir sans peine que, quelle que soit lidentité de "Etat & gui il incombe d’entamer les négociations, il peut propo- ser a son voisin la moitié du territoire ; celui-ci a tout intérét a accepter son offre, et Iaffaire est conclue. Examinons a présent le cas, beaucoup plus intéressant, dans lequel la situation n’est pas symétrique. C’est celui qureurent a résoudre les délégations diplomatiques de Chine et d’Union soviétique, lors du contentieux de 1969 portant sur le dessin de la frontiére entre ces deux pays. Les premiers accrochages frontaliers ne dataient pas des affrontements sanglants de mars 1969, sur ’Oussouri, mais remontaient a la fin des années cinquante et aux premiéres tentatives soviétiques de + subversion » rappor- tées par Pékin auprés des minorités non chinoises du Sinkiang. Les incidents se comptaient alors par milliers depuis plusieurs années, sur la plus longue frontiére du monde (7 000 kilométres) entre deux géants dont les pré- Paratifs militaires pouvaient laisser craindre un affronte- ment armé de grande envergure. Depuis une décennie ddéja les relations entre les deux pays s'éraient considéra- blement dégradées et Pekin n’ignorait certainement pas combien Moscou avait cu a soufirir de ce contenticux : Jes accusations de « capitulationnisme », puis de « collu- sion impérialiste révisionniste » par lesquelles Pékin sou- lignait chacune des avancées de Moscou dans le sens de Ia politique de coexistence pacifique avec les Etats-Unis, semblaient trouver des échos favorables auprés de Popi rion de gauche occidentale et dans les pays du Tiers- ‘Monde. La » fuite » de certains partis communistes hors de la nébuleuse soviétique, comme celle du Parti alba- és & information incompléte permet Wy LIINFORMATION INCOMPLETE 145 nis, le renforcement des tendances au polycentrisme au sein méme du bloc de lEst, n’étaient certainement pas Gtrangers aux appels a Vindépendance de ce que la ‘Pravda nommait désormais la « clique de Mao +. (r, paradoxalement, du moins en apparence, la Chine ne revendique pas, en 1969, le million et demi de kilo- miétres carrés de territoires que les « traités inggaux » de janvier 1880 avaient attribué a la Russie tsariste en Extréme-Orient et au Kazakhstan. Ce que le gouverne- ment chinois conteste, ce sont 21 000 + petits » kilo- matres carrés dont il accuse Moscou de s'étre emparée en violation des « traités inégaux », et dont la plus grande part se trouve dans la région du Pamir et sur quelque six cents iles des fleuves Amour et Oussouri. En retour, ‘Moscou, qui ne peut que s'interroger sur les raisons d’un tel manque de vigueur dans la négociation ~ est-ce parce qu'un certain Lin Biao vient d’étre désigné par le neu- sme congrés du parti communiste chinois comme le successeur du Grand Timonier ? parce que les essais chi- nois sur la bombe H n’avancent pas ?...~ rejette naturel- Jement la notion méme de + traités inégaux », mais accepte une négociation + technique» sur le tracé des frontiéres. La question que tout le monde se pose est, bien sir: quel partage proposer ? A Yévidence, cela dépendra, désormais, non plus seu- Jement des données structurelies du probléme ~ les pré- ferences des deux Etats pour les territoires qu’ils convoitent, ce qui reléve de la théorie des jeux + coopéra- tifs »-, mais également de l'information dont disposent la Chine et 'URSS et, plus précisément, de l'idée que cha- coun se fait des concessions que l'autre est prét a accepter pour obtenir ce qu’il souhaite. Mais que veut-on au juste ? Cela méme n'est pas clair : la bonne volonté de Mao estelle une feinte ? Un aveu de faiblesse ? Les inguiérantes allusions de la Pravda a « I'arsenal sans cesse croissant » des Chinois sont-elles une menace voilée ? Ltun ou Pautre camp a-t-il des visées plus ambiticuses dont la querelle territoriale n'est que le prétexte ? On le 146 LATHEORIE DES JEUX voit : Ia donnée essentielle du « jew » auquel se livrent les deux géants de I’Asie est le manque crue! d'information auquel chacun est confronté : aucun des deux partis n'est certain de connaitre exactement les paiements de son adversaire. De plus, chacun des deux Etats sait fort bien {que les négociations qu’ils vont entamer s'inscrivent dans Ja longue durée dans la mesure oi, étant voisins, chacun deux sera perpétuellement tenté de renégocier accord augue! ils parviendront. Ce qui se joue en 1969 engage Pavenir des relations diplomatiques entre les deux pays au cours des décennies suivantes et l'avenir de certains territoires pour des siécles peut-étre. On I'a deviné : le ‘bon cadre, pour érudier de tels problémes, est celui des jeux répétés & information incomplete. ‘Quel comportement les deux Etats en présence doi- ventils adopter ? Doivent-ils se comporter comme si la question frontaliére leur était indifférente (ce qui semble @tre Vattitude de la Chine & propos des + traités inégaux o) ? Cette indifférence feinte a-tlle des chances d’étre prise pour argent comptant par le parti adverse ? ‘On a vu limportance des stratégies mixtes pour la réso- lution d’un jeu : les Etats en présence feraientils mieux de régler leur attitude sur le jet d’une piéce de monnaie ? Et, si oui, celle-ci doit-elle étre équilibrée ? Un Etat a- il intérét @ révéler & son adversaire s'il joue en mixte ou en pur ? Le probléme, bien sir, est que sila Chine stefforce de ne jamais révéler ses préférences, elle ne ‘pourra jamais remettre en cause les traités du XIx* siécle. Pékin fait donc face au dilemme suivant : maximiser rapidement ses paiements en cherchant tout prix 4 obtenir la part du territoire qui lintéresse ~ au risque de révéler & Kossyguine que ce dernier détient éventuelle- ‘ment un pouvoir de négociation considérable — , ou mas- quer éternellement ses préférences, au risque de se laigser dicter les conditions du partage par Moscou. ‘Nous allons voir que les réponses apportées par la théo- rie des jeux & ce type de question sont variées =i existe des situations of un joueur a toujours intérét & masquer entié- INFORMATION INCOMPLETE 147 ‘rement son information, d’autres oi il ne pourra jamais en tirer parti, d'autres, enfin, oi il est préférable qu'il réalise un savant dosage dans la facon dont il distille Pinforma- tion a son adversaire. L'enjeu de tout cela ? Eviter que les deux Etats n’en viennent la plus mauvaise des + solu- tions », celle qui consiste a entrer en guerre afin d’imposer par Ia force sa propre vision d'un partage « équitable » ! ‘Crest loccasion de revenir sur un mythe qui a la vie dure, et qui voudrait que la théorie des jeux soit, par excellence, la théorisation cynique des conflits armés. Avec cet exemple, nous aspirons a convainere le lecteur du contraire, Un peu plus de théorie des jeux devrait aider beaucoup de négociateurs & éviter de recourir & la pire des solutions, celle qui, dans le dilemme des prison- niers, conduit 4 la dénonciation mutuelle, et qui, dans le jeu du roi et des seigneurs (voir figure 5.7, p. 120) méne au conflit diplomatique. Par ailleurs, que la paix ne puisse s'obtenir que comme un + équilibre des menaces imuruelles » n'est pas une surprise : «Si vis pacer... ». On connait Ia suite 3. Du bon usage de l'information Nous venons de le dire, ce n’est pas le tout, dans une négociation, de posséder une information privilégiée : ‘encore fautil savoir s'en servir & bon escient. Pour modéliser le fait que les relations diplomatiques entre deux pays posent des problémes qui nécessitent d’étre appréhendés dans la longue durée, supposons que Te jeu G est répété une infinité de fois, et notons G. Te jew ainsi obtenu. Le jeu en un coup G est alors une étape, parmi une infinité d'autres, de G_. Aprés chaque étape, les deux joueurs observent les coups choisis lors de la der- jére tape, tandis que leurs paiements respects sont portés & leur actif (passif, si ces paiements sont négatifs). (On notera que les coups joués constituent la seule infor- mation délivrée aux joueurs aprés une étape, et non leurs 148 LATHEORIE DES JEUX INFORMATION INCOMPLETE 149 aicments. Si le jeu était & information complete, cela ne oserait aucune difficulté puisque chaque joueur pourrait déduire de Pobservation des coups passés le montant de son paiement. Ici, dans la mesure of un joueur (au ‘moins) ignore dans quelle matrice ses paiements sont pui- sés, il ne dispose que d'une estimation subjective de son paiement. Comme dans un jeu répété a information com- pléte, chaque joueur s’efforce de maximiser son paiement ‘moyen, défini par la moyenne de ses paiements d’étapes. I est clair que, dans 6.2, Alice n'a pas intérét & jouer dans le jeu G,, une répétition de sa stratégie optimale du jeu G (+ G sia, D si 6»). En effet, sic’était lla stratégie ‘optimale d’Alice dans G_, alors Bill le saurait, et pourrait done déduire avec certitude de observation des coups de la premitre étape si cest la matrice a ou la matrice 6 qui a été sélectionnée par la Nature. Du coup, on se retrouverait dés la deuxiéme étape du jeu dans un jeu information compléte, o¥ Alice a les moyens ~ on Ia ‘vu - de se garantir un paiement d’étape de 0, Dans ces conditions, Bill aurait les moyens de garantir que la moyenne de ses paiements tende vers 0 lorsque le nombre d’étapes tend vers Vinfini. Or, Alice dispose Tune stratégie qui Tui permet de se garantir un paiement supérieur & 0. Pour cela, il lui suffit d’agir comme si elle niétait pas informée de Pérat de la Nature, Il n'est pas difficile de voir que ce jeu fictif a information incomplete des deux cotés est équivalent a la répétition infinie du jeu 2 information complete suivant : s D HEE] 00 Bl_o0 | $4 Figure 63 ct qu’une stratégie optimale d’Alice dans un tel jeu consiste & choisir G (respectivement D) avec probabilité 1/2. La valeur de ce jeu fictf vaut alors 1/4. Par consé- quent, en appliquant la méme stratégie dans le jeu G_, Cestsidire en ignorant délibérément information qu'elle détient, Alice 'assure un paiement final de 1/4 Ge faisant, elle ne révéle évidemment aucune informa- tion 4 Bill sur Pérat de la Nature comment le pourrait- elle puisqu’elle feint elle-méme de T'ignorer ? ‘Le lecteur ne manquera pas de remarquer que la valeur

Vous aimerez peut-être aussi