Vous êtes sur la page 1sur 5

Fiche de lecture

La thorie des jeux


2002, Bernard Guerrien

Introduction
Chapitre 1) Quest-ce que la thorie des jeux?

Comme toute thorie, elle est forme par un ensemble dhypothses. Elle se distingue des autres thories en sciences sociales par la place quelle accorde aux mathmatiques (je pense mme quelle relve des mathmatiques plus que des sciences sociales). Un jeu comporte une liste de joueurs, un ensemble de choix possibles pour chacun dentre eux et une fonction qui donne leurs gains dans toutes les ventualits possibles. (une hypothse que Bernard Guerrien ne souligne pas, cest donc que les gains peuvent tre quantifis sur une chelle unique. Il ny a pas dinconvnients collatraux ou sil y en a, on peut les compter comme des gains ngatifs que lon soustrait aux gains positifs). Recherche du gain maximum et rationalit : lhypothse fondamentale est que chaque joueur cherche maximiser ses gains. Le gain de chacun dpend autant des dcisions des autres que de sa propre dcision. Il est donc ncessaire quil y ait anticipation de ce que vont faire les autres et cela repose sur des croyances. Une autre hypothse essentielle est que les joueurs disposent dune information complte. Cest--dire que chaque joueur connat tous les dtails du modle et peut se mettre la place du modlisateur. Il sait que les autres savent quil sait, quils savent quil sait quils savent, etc. A-t-elle vocation dire ce qui est, est-elle positive? tant donn les modles extrmement rducteurs de la thorie des jeux, ils ne peuvent prtendre reprsenter le monde tel quil est. Les exemples des manuels sont presque toujours des cas invents par leurs auteurs. De plus la thorie des jeux est totalement statique. Les joueurs ne prennent quune seule dcision, ils prvoient lavance ce quils feront dans telle ou telle ventualit. Cette hypothse est en fait une consquence de celle dinformation complte : il ny a pas lieu denvisager un processus de dcision pour justifier la solution dun jeu. a-t-elle vocation dire ce qui doit tre, est-elle normative? En rgle gnrale il ny a pas doptimum optimorum, une issue maximisatrice sur laquelle un consensus pourrait se faire. Si les intrts des joueurs sont partiellement opposs, alors il ny a pas dissue qui puisse tre recommande lensemble des joueurs (il ny a pas de gagnant-gagnant. Si la thorie des jeux a vocation dire que chacun doit suivre son intrt personnel, alors elle ne dmontre pas que ceci conduit ncessairement au gain maximal. Elle dmontre mme le contraire!). si elle prconise une stratgie en prenant parti pour un joueur, elle cesse alors dtre normative. La thorie des jeux prsente surtout des paradoxes et des dilemmes, autrement dit elle a plus vocation de soulever des problmes que de les rsoudre. Elle soulve dabord celui que des dcisions apparemment rationnelles au niveau individuel peuvent conduire des issues qui ne le sont pas, collectivement. Approche cooprative : consiste rechercher des issues ou ensembles dissues stables, cest-dire telles quil ny a pas possibilit pour certains joueurs de modifier ces issues en formant des coalitions. Elle soulve beaucoup de difficults et a t relativement abandonne partir des annes 1970. Les conomistes accordent maintenant une place privilgie aux approches non coopratives et leur solution de base, lquilibre de Nash.

Chapitre 2)

Thorie des jeux et rationalit

Il existe des situations o le choix semble aller de soi. Ces jeux comportent des stratgies dominantes. Exemple : B b1 b2 b3 A a1 a2 (7,5) (8,4) (3,7) (5,3) (1,8) (2,6)

Si A choisit a2 il est sr de faire un gain suprieur celui quil ferait sil choisissait a1, quoi que fasse B. De mme pour B : il a intrt choisir b3. Cest lexception plutt que la rgle. En gnral il ny a pas de stratgie dominante, mais il peut y avoir des stratgies domines. Un concept de solution propos par la thorie des jeux est llimination itrative des stratgies domines. Il est possible aussi quil ny ait aucune stratgie domine. Le dilemme des prisonniers est un exemple de jeu stratgies dominantes mais dont la solution est sous-optimale : B Je me tais Je dnonce A Je me tais A Je dnonce B (2,-3) (-1,-1) Si les joueurs sont rationnels, ils choisissent la stratgie qui consiste dnoncer lautre, puisquelle est dominante. Cela conduit un rsultat moins bon que ce quils auraient obtenu sils staient tus. (Le problme de la confiance intervient : pour choisir la stratgie de se taire, il faut faire confiance lautre. Les marchs fonctionnent beaucoup sur la confiance, mais il sagit dune attitude non rationnelle, en tout cas pour la thorie des jeux. Pour que la confiance ait un fondement rationnel, il faut faire intervenir les jeux rpts.) Jeux plusieurs coups. Les rgles prcisent un ordre dintervention des joueurs. On peut les reprsenter sous forme darbre. Action et stratgie ne sont plus confondues. Lhypothse dinformation complte implique que chaque joueur tablit ds le dpart une liste dinstructions o il stipule ce quil fait chacun des noeuds de larbre. Cette liste dinstructions est la stratgie du joueur. Bien que ces modles soient souvent qualifis de dynamiques, ils ne le sont pas. Il est possible dailleurs de les reprsenter sous un tableau, ce qui montre quil sagit toujours dune approche statique. Dans le cas du marchandage avec cot de ngociation (diminution du gteau partager chaque tour de ngociation) la thorie des jeux parvient dmontrer que lavantage revient celui qui fait la premire offre, qui prend linitiative, condition quil y ait un nombre illimit de tours de ngociation. Le mille pattes de Rosenthal montre cependant en quoi un comportement rationnel (liminer par itration les stratgies domines) peut conduire des situations absurdes : lun des joueurs arrte ds le premier coup avec un gain de (1,1) alors quau millime coup, les deux joueurs auraient un gain de (998, 1001). Il attire simplement lattention sur le problme de lintrt individuel courte vue. Lexprience montre pourtant quaucun joueur rel narrte au premier coup, une fraction non ngligeable continuant mme jusquau dernier coup. Sont ils rationnels? Ne comprennent-ils pas que la rationnalit aurait d les conduire arrter ds le premier coup? Leur intrt pourtant est bien de continuer la thorie des jeux nexplique absolument pas le comportement des joueurs rels, elle ne le prdit pas; et si elle leur dit ce qui doit tre, on comprend aisment quils ne la suivent pas. (1,1) (-3,2)

Conclusion dtape : il est difficile (voire impossible?) de caractriser un comportement rationnel.

Chapitre 3) Nash

Thorie des jeux et croyances : lquilibre de

Lorsquil ny a pas de stratgies dominantes et quil nest pas possible de rsoudre le jeu par limination itrative des stratgies domines, les anticipations et croyances en ce que vont faire les autres joueurs jouent un rle dterminant. Dans le cas dun jeu qui ne comporte ni stratgies dominantes, ni stratgies domines, il faut introduire un nouveau critre pour trouver une solution rationnelle. Lquilibre de Nash est une solution qui correspond des anticipations correctes des joueurs, leurs croyances sont avres. Elle est autoralisatrice : en choisissant lquilibre de Nash comme solution, chaque joueur agit en pensant que les autres en feront autant. Lappellation quilibre est ambigu car elle laisse penser quil sagit dun daboutissement, dun point de repos atteind au terme dun processus. Il sagit en ralit toujours dun mcanisme statique. Lquilibre de Nash est prsent parfois comme tel que la stratgie de chaque joueur est choisie en prenant comme donne la stratgie des autres. Cela voudrait dire que les joueurs adaptent leur stratgie au fur et mesure des coups, en fonction de ce quon jou les autres. Il nen est rien. (la thorie des jeux revient en fait essayer de dcrire de faon statique des phnomnes dynamiques. Elle essaye dcrire le code de programmes comme si la connaissance de ce code permettait de prvoir ce qui va se passer lors de leur excution. Elle assimile les joueurs des ordinateurs en interaction, le comportement de chacun tant prvisible au vu du code de son programme, condition de savoir par avance comment ragiront les autres ordinateurs. Prvisible? Pas sr. Les effondrements de rseaux IP, par exemple, sont-ils prvisibles au vu du programme des ordinateurs?) pourquoi privilgier lquilibre de Nash? Il peut correspondre un quilibre sous-optimal. B b1 b2 b3 a1 A a2 a3 (2,2) (3,3) (2,1) (1,6) (2,2) (7,5) (4,4) (2,0) (2,7)

Dans cet exemple, le couple {a2, b1} est un quilibre de Nash mais il est sous-optimal. Pourquoi les joueurs le choisiraient-ils? (on pourrait rpondre : parce que, faute de pouvoir choisir une stratgie dominante ou dliminer les stratgies domines, le choix de la stratgie fonde sur un accord des croyances des joueurs est le plus social possible. Ce nest plus la recherche du gain maximal qui guide les joueurs : on sort des hypothses initiales de la thorie des jeux.) les cas o il nexiste aucun, ou plusieurs quilibres de Nash, enlvent tout caractre privilgi cet quilibre. Par exemple le jeu de la poule mouille: B Je passe Je laisse passer Je passe A Je laisse passer (0,1) (-1,-1) Il ny a aucune raison de privilgier les quilibres de Nash. (-2,-2) (1,0)

(si lon considre que cest un jeu. La thorie des jeux nous dit dans ce cas quil vaut mieux avoir une rgle de priorit. Mais alors, le jeu disparat : il ny a plus quune seule issue possible, celui qui est prioritaire passe. L encore, la thorie des jeux dmontre que dans certains cas elle ne nous apprend rien!) Cf. David Kreps.

Chapitre 4)

Les jeux rpts

Les solutions proposes par lquilibre de Nash tant rarement justifies, que ce soit dun point de vue positif ou normatif, vient lide quil suffirait de rpter un jeu pour que les joueurs comprennent quel est le bon choix. Ils ne sont quun cas particulier des jeux plusieurs coups. Il ny a toujours pas danalyse dynamique, les stratgies des joueurs restent des listes dinstructions. Le cas des contrats (cf. Eymard-Duvernay) : cest la stratgie non cooprative qui domine. Si le joueur 1 fait confiance, le joueur B a intrt ne pas honorer la confiance. Une faon de rsoudre ce problme serait de rpter le jeu. Le contrat est : je te fais confiance tant que tu honores ma confiance. Mais il faut alors que le contrat ait une dure infinie, sinon, au dernier coup, la confiance nest pas honore. Et puisquelle ne lest pas au dernier coup, il ne peut pas y avoir confiance au premier coup. Dit autrement : selon la thorie des jeux, un contrat serait ncessairement rompu par trahison du premier qui le peut, et par consquent il ny aurait jamais contrat puisquil y aurait alors risque de se faire trahir. Pas besoin de la thorie des jeux pour arriver cette conclusion si lon postule lgosme des joueurs. Le minimax est le niveau de gain en dessous duquel un joueur ne peut tre contraint par les autres. Cest son niveau de scurit. Cest le plus petit des gains maxima possibles selon chacun des choix possibles par les autres joueurs. Notons que la combinaison des minimax nest pas ncessairement une des issues possible des joueurs, et que les issues qui comportent des minimax ne sont pas a priori des quilibres de Nash. Ils prsentent un intrt quand il ny a pas dquilibre de Nash. Dans le cas du dilemme des prisonniers, la rptition ne fait que laggraver. Plus le nombre de rptitions est grand, plus est grand lcart entre le gain maximal possible des deux joueurs et leur gain sils choisissent lquilibre de Nash (qui est de plus en loccurrence une stratgie dominante). Bref, ils senfoncent rationnellement. Mais il y a changement si le nombre de rptitions nest plus fini, mais infini. Il y a cette fois une infinit dquilibres de Nash. Il ny a alors aucune raison pour que les joueurs se coordonnent sur lun des quilibres. Les jeux volutionnistes sont une variante (adapte ltude de lvolution des espces) dans laquelle il ny a plus de choix : les joueurs sont comme des automates qui utilisent toujours la mme stratgie. Il ny a plus alors dquilibre de Nash, mme si lon parle toujours dquilibre en ce qui concerne lissue prvue par la thorie des jeux. NB : dans les confrontations de stratgies, la relation lemporte sur nest pas forcment transitive (la stratgie A lemporte sur la stratgie B qui lemporte sur la stratgie C qui lemporte sur la stratgie A). Toutes les stratgies peuvent lemporter en face--face contre la stratgie A mais celle ci peut lemporter en confrontation gnralise (cumul des gains).

Chapitre 5)

Jeux information incomplte

Cf. Harsanyi, 1967. A chaque joueur est associ un type, lincertitude porte sur son type effectif. Chaque joueur doit connatre les types possibles. Lincertitude est exogne; pour rester dans le cadre de la thorie des jeux, on introduit un joueur fictif, Nature, dont la seule activit consiste prciser aux autres joueurs leur type. Nature joue le premier coup. Chaque joueur connat son type, mais pas celui des autres, il y a asymtrie dinformation. Chaque joueur dtermine sa stratgie en attribuant une probabilit que les autres joueurs soient de tel ou tel type. Lquilibre de Nash est appl quilibre baysien.

Conclusion
Comment expliquer le succs de la thorie des jeux, alors quon ne sait pas trs bien quoi elle sert, ni sur le plan positif, ni sur le plan normatif? Lexplication est peut-tre quelle oblige rflchir sur la complexit des interactions sociales. En contraignant le modlisateur prciser tous les lments de son modle, elle vite le recours aux chappatoires habituelles qui consistent voquer de mystrieux mcanismes ou des forces et autres mtaphores empruntes la physique.