Vous êtes sur la page 1sur 29

Article

Ngociation collective et thorie des jeux: le rle du temps dans la littrature rcente Edouard Wagneur
L'Actualit conomique, vol. 64, n 1, 1988, p. 68-95.

Pour citer cet article, utiliser l'information suivante :


URI: http://id.erudit.org/iderudit/601437ar DOI: 10.7202/601437ar Note : les rgles d'criture des rfrences bibliographiques peuvent varier selon les diffrents domaines du savoir.

Ce document est protg par la loi sur le droit d'auteur. L'utilisation des services d'rudit (y compris la reproduction) est assujettie sa politique d'utilisation que vous pouvez consulter l'URI http://www.erudit.org/apropos/utilisation.html

rudit est un consortium interuniversitaire sans but lucratif compos de l'Universit de Montral, l'Universit Laval et l'Universit du Qubec
Montral. Il a pour mission la promotion et la valorisation de la recherche. rudit offre des services d'dition numrique de documents scientifiques depuis 1998. Pour communiquer avec les responsables d'rudit : erudit@umontreal.ca

Document tlcharg le 4 July 2013 09:14

L'Actualit conomique. Revue d'analyse conomique, vol. 64, n 1, mars 1988

Ngociation collective et thorie des jeux : le rle du temps dans la littrature rcente
Edouard WAGNEUR Ecole des Hautes tudes Commerciales de Montral *

1. INTRODUCTION

L'objet de ce rapport est de passer en revue quelques dveloppements rcents de la thorie mathmatique des jeux et d'valuer leur pertinence en tant que paradigme pour l'tude du phnomne de la ngociation collective. On peut considrer la ngociation collective selon deux points de vue diffrents, tous les deux conduisant une forme de jeu. Tout d'abord la ngociation collective est une manifestation d'une situation de conflit : le produit d'une activit conomique doit tre partag entre divers intervenants ; chaque intervenant labore une stratgie en vue d'augmenter la part qui lui reviendra. En second lieu la ngociation collective est un moyen particulier de procder une rsolution du conflit ; un arbitre peut tre ventuellement appel indiquer le partage qui semble quitable. Cette double interprtation du phnomne de ngociation collective a son correspondant dans la thorie mathmatique des jeux : les jeux non coopratifs concernant les situations de conflit o les joueurs cherchent tablir un quilibre partir de leurs forces respectives et les jeux coopratifs visant plus particulirement au partage quitable des gains entre les diffrents joueurs, selon leurs rapports respectifs. Un des dveloppements rcents particulirement attrayant de la thorie des jeux est la notion d'quilibre coopratif, qui tablit un lien logique entre ces deux types de situation de jeu. Cette notion d'quilibre ncessite une prise en compte explicite de la structure dynamique du jeu, avec, en particulier, une utilisation de stratgies ayant de la mmoire. Notre recherche a donc consist mettre en vidence le rle du temps dans les modles ludiques de ngociation collective et explorer la porte de ces nouvelles notions d'quilibre coopratif dans ce champ d'analyse.

* Groupe d'tudes et de recherche en analyse des dcisions (GERAD). L'auteur tient remercier particulirement M. Alain Haurie, qui a bien voulu commenter et corriger ce travail au cours des tapes de son laboration et demeure nanmoins seul responsable des erreurs qui pourraient encore subsister. Ce travail a pu tre accompli grce au soutien financier de la fondation Mercure.

CRITIQUES ET EXPERTISES

69

Ce travail se prsente comme suit : Dans la seconde partie nous relevons quelques-unes des difficults lies la modlisation mathmatique des processus entourant la ngociation d'un contrat. La troisime partie est consacre aux principales ides et rsultats fondamentaux de la thorie des jeux : notion de stratgie, quilibre de Cournot-Nash, optimum partien, solution de Nash. Le clbre dilemme du prisonnier est ensuite introduit comme exemple gnrique permettant d'illustrer le passage du jeu simple aux jeux rpts et aux jeux squentiels. Ceci permet de voir aussi comment les notions de stratgie avec mmoire et de ngociation, s'introduisent de manire naturelle. Aprs le rappel de quelques rsultats fondamentaux (en particulier ceux de l'cole de la London School of Economies), nous examinons l'influence sur l'issue du jeu, de l'existence d'alternatives (comme par exemple, pour un travailleur, la possibilit d'exercer un autre emploi moins bien rmunr). Dans la cinquime partie, nous abordons les jeux information imparfaite, o l'approche axiomatique est tendue au cas o les joueurs n'ont pas une connaissance certaine des stratgies de leurs adversaires. Cette incertitude est traduite par un nouveau concept de jeu, celui de jeu bayesien (rpt) et une nouvelle notion d'quilibre, l'quilibre bayesien parfait. Enfin, dans une dernire partie, nous changerons d'approche pour examiner la thorie du point de vue de la ngociation, de la mdiation et de l'arbitrage.
2. NGOCIATION ET MODLISATION MATHMATIQUE

La ngociation d'une convention collective est un processus complexe faisant intervenir un trs grand nombre de paramtres et d'agents. En premire approximation, on peut distinguer quatre types d'agents : la partie patronale la partie syndicale les ngociateurs de chacune de ces parties dont les intrts court ou long terme s'opposent, voire peuvent tre en contradiction avec une solution efficace. Parmi les paramtres importants qui interviennent, on peut mentionner: les objectifs des agents, les solutions antrieures du jeu (conventions collectives prcdentes), les solutions rcentes pour des situations analogues (conventions signes dans des entreprises du mme secteur ou dans des secteurs voisins), la conjoncture conomique (tat et perspective d'volution des principales variables conomiques globales et sectorielles), l'histoire des ngociations prcdentes (attitude des parties, grve, lock-out, menaces, etc.), les rgles du jeu (lgislation).

70

L'ACTUALIT CONOMIQUE

L'tude d'une situation aussi complexe l'aide d'un modle pose deux problmes complmentaires : la modlisation proprement dite (i.e le passage de la ralit une version idalise de cette ralit) et l'interprtation (dmarche inverse). 1. La modlisation Comment modliser les influences respectives des paramtres (dpendance fonctionnelle, c'est--dire comment savoir si tel ou tel paramtre exerce une influence prpondrante ou au contraire, ngligeable en premire approximation, etc.), comment mesurer les valeurs des paramtres (variables de conjoncture ou historique des ngociations prcdentes par exemple) et comment tirer d'un tel modle des rsultats thoriques (ou de simulation exprimentale). 2. L'interprtation Comment interprter les rsultats fournis par le modle, supposer qu'il y en ait (problme d'adquation du modle la ralit). Tel rsultat du modle exprime-t-il convenablement la situation relle, en dpit des simplifications et des paramtres ngligs ? Dans un premier temps, il s'agira d'laborer des modles simples qui devront permettre, partir d'un choix limit de paramtres considrs comme prpondrants : i) ii) iii) de reprsenter les dpendances fonctionnelles entre ces paramtres, d'noncer un certain nombre de proprits du modle, d'interprter ces proprits.

Une tude relativement succincte de la littrature portant sur la thorie des jeux et la ngociation permet de constater une volution vers des modles de plus en plus labors qui rendent de mieux en mieux compte des phnomnes rels associs au processus de ngociation.
3. BREFS RAPPELS SUR LA THORIE DES JEUX

Un jeu est dit sous forme extensive lorsqu'il est reprsent sous la forme d'un arbre de dcision dont les arcs reprsentent les diverses actions possibles. Un jeu o trs peu d'actions sont possibles se laisse aisment reprsenter sous cette forme. Par exemple, si deux joueurs ont le choix entre deux actions (notes 0 et 1), le jeu peut tre reprsent par l'arbre suivant:

Joueur 1

(-2,2)

(0,-3)

(-3,0)

(-1,-1)

CRITIQUES ET EXPERTISES

71

Remarquons que le joueur 2 ne connat pas l'action du joueur 1 lorsqu'il choisit sa propre action. Ceci est reprsent par les ensembles d'informations encadrs en lignes pointilles. Les actions des joueurs ainsi que les gains correspondants peuvent tre reprsents sous forme de la matrice :

1 0 1

0 (-2,-2) (-3,0)

1 (0,-3) (-1,-1)

o le couple (-3,0) par exemple reprsente les gains associs l'action 1 du premier joueur et 0 du second. Le gain du joueur 1 est 3 et celui du joueur 2 est 0. Les actions des joueurs sont conditionnelles l'information dont ils disposent. On appelle stratgie une rgle de dcision permettant un joueur de choisir une action dtermine en fonction de l'information dont il dispose. Un jeu est dit sous forme normale lorsque sont prciss : i) ii) iii) l'ensemble des joueurs, l'ensemble des stratgies de chacun des joueurs, les vecteurs gains associs toutes les stratgies possibles de chacun des joueurs.

Ainsi la matrice ci-dessus fournit la reprsentation sous forme normale du jeu mentionn. la forme normale d'un jeu est associe, pour chaque joueur, sa fonction de gain. C'est une fonction qui, tout choix de stratgie de tous les joueurs, associe le gain obtenu par le joueur en question. Par exemple la fonction de gain du joueur 1 ci-dessus et donne par le premier lment de chaque couple de la matrice: /(0,0) = 2(c'est--dire /(stratgie de 1, stratgie de 2) = - 2 ) , /(0,1) = 0, /(1,0) = - 3 , /(1,1) = - 1 . Cette reprsentation des rsultats du jeu peut aussi bien tre associe des cots qu' des gains. Bien que parfaitement adquate pour l'tude des jeux dont l'issue est directement mesurable (en dollars par exemple), la notion de fonction de gain se prte mal certaines gnralisations essentielles. Par exemple, la valeur qu'un travailleur

72

L'ACTUALIT CONOMIQUE

attribue une pause-caf de 1A heure peut non seulement diffrer de sa valeur montaire (par rapport au salaire horaire) mais encore varier considrablement selon qu'elle peut tre prise vers le dbut, le milieu ou prs de la fin de la priode de travail. Ainsi, la notion de fonction de gain, on substitue celle de prfrences , bien connue des conomistes, que l'on peut reprsenter par une fonction d'utilit. Pour Von Newmann & Morgenstern [1947] une telle fonction d'utilit est une fonction linaire de son argument, dfinie une transformation affine prs. Nous verrons ci-dessous comment ces proprits sont prcises dans les clbres axiomes de Nash. Le choix d'une stratgie par chacun des joueurs dfinit un vecteur de stratgies ou multistratgie. On dit alors qu'une multistratgie est un quilibre de Nash (ou de Cournot-Nash) du jeu sous forme normale lorsque aucun des joueurs n'a avantage modifier sa stratgie s'il est le seul la faire. Par exemple, la multistratgie (0,0) est un quilibre de Nash du jeu considr ci-dessus. Un optimum de Pareto d'un jeu n joueurs est un optimum vectoriel de la fonction vectorielle des utilits de tous les joueurs. C'est un point p0 de l'espace Rn des n utilits des joueurs, tel qu'aucun autre vecteur d'utilits n'a toutes ses composantes suprieures ou gales celles de p 0 , avec ingalit stricte pour une composante au moins. Dans le jeu prcdent, le vecteur de gains ( 1, 1) est un optimum de Pareto. Ce n'est pas un quilibre de Nash, car les stratgies associes ce gain sont ( 1,1 ). Or si le joueur 2 ne modifie pas sa stratgie, le joueur 1 a avantage jouer 0. Le fait que l'quilibre de Nash ne soit pas, en gnral, un optimum de Pareto 1 ouvre la voie la recherche, par voie de ngociations, d'un tel optimum, qui ne pourra tre obtenu que si les joueurs cooprent en acceptant de jouer chacun la stratgie qui correspond cet quilibre coopratif. En gnral, l'quilibre coopratif n'est pas unique, phnomne dont la problmatique de la ngociation est issue. C'est J. Nash [1950] que l'on doit la premire tentative de rgler ce prolme par une approche axiomatique spcifiant un certain nombre de conditions que la solution ngocie devra satisfaire (dont un certain degr d'quit). Avant de prciser cette notion, montrons tout d'abord comment les utilits des joueurs permettent de dfinir un sous-ensemble continu de l'espace | Rn des utilits de n joueurs. Nous supposerons n = 2 pour simplifier et u (resp. v) dsignera l'utilit du joueur 1 (resp. 2). Plaons-nous dans le cas le plus simple o, comme dans le jeu prcdent, le choix de chacun des joueurs est limit deux alternatives : a t , a 2 et introduisons la notion de stratgie mixte.

L'ACTUALIT CONOMIQUE

73

Si l'on convient d'appeler stratgie pure une stratgie pour laquelle le choix des actions S 1 OUa 2 s'effectue de manire exclusive, on peut, par opposition, considrer une stratgie pour laquelle le joueur 1 (resp. le joueur 2) choisit l'action ax avec une probabilit p (resp. q) et l'action a2 avec une probabilit 1 p (resp. 1 q). Ainsi, une stratgie mixte pour le joueur 1 est de la forme: S1(P) = Pa1 + ( l - p ) a 2 . Si l'on dsigne par u(ai9 aj) = u^, 1 < i,j< 2 l'utilit du joueur 1 associe au couple (ah a^) de stratgies pures, on pourra calculer l'utilit espre du joueur 1 associe aux stratgies mixtes s x (p ) = pa x + ( 1 p ) a 2 et s 2 (q ) = qax + (1 q)a2, en utilisant les proprits de linarit de la fonction u. En effet, sous l'hypothse probabiliste, le couple d'actions (ai9 a ) est choisi par les deux joueurs avec une probabilit pq p(\-q) (1 p)q (1-p) ( l - 9 ) d'o: U(Si(P), S2(C)) = u(pq(*i, SL1) + p(l-q)(al9 + (l-p)(l-g)(a2,a2)) a2) + ( l - p ) g ( a 2 , ^ 1 ) sii = j=l s i i = 1,7 = 2 s i i = 2J= 1 s i i = 2,7 = 2

= pgu (a ^ a 1 ) + P ( I - C ) I K a ^ a 2 ) + ( 1 - p ) g u(a 2 ,a 1 ) + ( l - p ) ( l - g ) i i ( a 2 , a 2 ) = pqu u + p(l-q) u l2 + (1-p) qu2l + (\-p)(\-q)u22 L'utilit espre du joueur 2 s'exprime de manire analogue. Il est clair ici que, pour p et q variant entre O et 1, l'ensemble initial des actions possibles {(a j , ax),(al9 a2),(a2, ax), (a2, a 2)} a t prolong au carr de sommets (a h aj), 1 <i,j<2. Aussi, l'application vectorielle u x v a maintenant pour image le carr de sommets (u^, Vy7), 1 <i,j<2. La notion de stratgie mixte permet donc de supposer que, dans le cas d'un jeu n joueurs, les utilits des joueurs dterminent un sous-ensemble convexe, ferm et born de Rn. Pour simplifier l'criture, on crira ( u, v) pour (u(s{, S2), V(S1, S2)) et u* pour u (s*, S 2 ), etc. La solution ngocie de Nash a t introduite pour rsoudre le problme de la ngociation d'un duopole. Bien qu'elle se gnralise facilement au cas d'un jeu n joueurs, nous supposerons encore n = 2 avec les notations prcdentes. On suppose qu'il existe un quilibre de Cournot-Nash et soit (u0, V0) le vecteur d'utilits associ cet quilibre. Pour toute solution ralisable (u, v), le joueur 1 (resp. 2) ralise un gain d'utilit u- U0 (resp. v V0). Voici les axiomes que la solution ngocie (u*, v*) devra satisfaire:

74

L'ACTUALIT CONOMIQUE

Axiome 1 (Invariance affine) Si u' (resp. v') est dpendante de u (resp. de v) par une transformation affine P1 (resp. p2) telle que P1 (u 0 ) = U0, p2 (v0) = (v'Q) alors la solution ngocie (u'*, v'*) vrifie P1(U*) = u'*, p2(v*) = v'*. Axiome 2 (Optimalit partienne) i) u* >; U0, v* >. V0

ii) (u*, v*) est une solution accessible iii) (u*, v*) est un optimum de Pareto de la fonction vectorielle (u, v) Axiome 3 (Indpendante par rapport aux alternatives non pertinentes) Supposons qu'il existe un second jeu ayant mme quilibre de Cournot-Nash que le premier et admettant pour ensemble de solutions au moins toutes les solutions admissibles du premier jeu. Si la solution ngocie du second jeu est admissible pour le premier, elle est ncessairement solution ngocie du premier jeu. Axiome 4 (Symtrie) Si
i) o =

V0

ii) (v, u) est admissible chaque fois que (u, v) l'est, alors u* = v* On montre alors le thorme de Nash. Thorme de Nash Soit (u*, v*) la solution du problme: Max (u u0) ( v - V 0 ), on a: 1. (u*, v*) vrifie les quatre axiomes de solution ngocie 2. (u*, v*) est le seul point vrifiant ces quatre axiomes.

I
y* I

Solution de Nash ensemble des solutions ralisables

V0 U
0

CRITIQUES ET EXPERTISES

75

4. LE DILEMME DU PRISONNIER ET LES JEUX RPTS INFORMATION PARFAITE

4.1 Le dilemme du prisonnier classique Le dilemme du prisonnier est un jeu matriciel trs simple, analogue celui que nous avons prsent ci-dessus. Rappelons-le brivement. Deux suspects sont accuss d'avoir commis un vol. Chacun deux est inform sparment que s'il passe aux aveux, il cope d'une peine de 5 ans ou de 6 mois suivant que son co-accus avoue ou pas. si aucun d'eux n'avoue, leur peine sera de 1 an chacun. Les peines prvues peuvent tre reprsentes par la matrice n'avoue pas Prisonnier 1 avoue (1/2,10) (5,5) n'avoue pas avoue Prisonnier 2 (1,1) (10,1/2)

Du point de vue de la thorie des jeux, il est quivalent d'tudier une matrice de gains (ou d'utilits), que l'on pourra par exemple reprsenter sous la forme n'avoue pas Prisonnier 1 avoue (3,0) (1,1) n'avoue pas avoue Prisonnier 2 (2,2) (0,3)

En l'absence de consultation entre les joueurs et dans le cas de stratgies pures, le seul quilibre de Nash consiste pour chacun des joueurs passer aux aveux. C'est en effet la seule stratgie qu'aucun des prisonniers n'a intrt modifier si l'autre ne modifie pas la sienne. L'issue (1,1) associe cette stratgie n'est optimale pour aucun des joueurs. 4.2 Principales extensions : jeux rpts et jeux squentiels, stratgies avec mmoire Il est clair que si les joueurs pouvaient se concerter, ils conviendraient tous deux de rejeter les accusations portes contre eux pour accder la solution cooprative (2,2). Du point de vue de la thorie, on veut faire apparatre cette solution cooprative comme l'issue naturelle (i.e. un quilibre de Cournot-Nash) d'un jeu dont on aurait sensiblement modifi les rgles. Une faon de procder consiste rpter le jeu ; l'examen par chaque joueur, des issues successives du jeu venant alors se substituer la ngociation. C'est l'approche suivie notamment par Aumann [1978], Brams, Davis et Straffin [1979], Grofman et Pool [1977], Kurz [1978], ainsi que Smale [1980] dont nous prsentons brivement l'essentiel.

76

L'ACTUALIT CONOMIQUE

Oublions la formulation originale du jeu pour n'en conserver que la structure mathmatique reprsente par la matrice d'utilits ci-dessus. Une bonne stratgie consistera, pour chaque joueur, jouer chaque itration en tenant compte des moyennes des issues antrieures. Ainsi, tant que ces moyennes restent voisines l'une de l'autre, chacun choisira, sans consultation avec son partenaire, djouer de manire cooprative (ne pas avouer). Si au contraire la diffrence entre ces moyennes s'largit, le joueur pnalis ralise que son partenaire a opt pour la non-coopration, attitude qu'il choisit son tour, forant ainsi la solution vers l'quilibre de Nash du jeu statique. L'intrt de cette approche rside dans le fait que, sous forme de jeu rpt, le dilemme du prisonnier est un nouveau jeu, que l'on peut voir comme un jeu dynamique. Sous cette forme, le point (2,2) correspond un quilibre de Nash pour une paire de stratgies alliant coopration et non-coopration, suivant le comportement des moyennes des gains. En outre, cet quilibre est une solution de Nash, elle est optimale et globalement stable (quels que soient les comportements initiaux des joueurs, l'itration va conduire cette solution). L'intrt de l'tude d'un jeu rpt est double, ainsi que le montre l'exemple prcdent. D'une part, la notion de stratgie avec mmoire dans un jeu non coopratif (rpt) se substitue (et joue un rle analogue) celle de ngociation dans un jeu coopratif. C'est prcisment pour cette raison que Aumann (1978) parle de ngociation informelle dans le contexte des jeux rpts. D'autre part, la solution ngocie de Nash (optimum de Pareto) du jeu unique devient, dans le jeu rpt, un quilibre de Cournot-Nash de ce jeu. La critique la plus srieuse qu'on a pu faire cette approche rside dans le fait que la mmoire des joueurs est limite l'observation des gains (et non des stratgies) dont on ne mesure que la moyenne sur les parties joues antrieurement. Cette procdure de mmorisation du pass est d'un intrt limit lorsque le jeu est rpt indfiniment. En effet, il devient impossible, a posteriori de distinguer entre une paire de joueurs qui ont tous deux trich un grand nombre (fini) de fois et une paire de joueurs qui ont constamment jou la stratgie cooprative. Cette critique vaut encore pour les autres modes de comptabilisation des gains antrieurs introduits dans Smale (1980). Lorsque la solution du jeu rpt n'est pas unique, il devient essentiel de prciser, d'une part ce que l'on peut considrer comme une issue acceptable du jeu et, d'autre part, les moyens d'assurer son implantation. Par exemple, pour Smale, c'est la stationnarit de l'issue (2,2) du jeu dynamique qui la rend acceptable. Le fait qu'elle soit globalement stable permet d'assurer son implantation. Dans la dmarche suivie par Haurie et Tolwinsky (1984) dans le cadre d'un jeu squentiel1, la notion de menace
1. La notion de jeu squentiel est sensiblement diffrente de celle de jeu rpt, en ce sens que, chaque tape, l'environnement est modifi par l'issue du jeu. Ses analogies avec les jeux rpts sont toutefois suffisantes pour que l'on ne s'tende pas ici sur ce qui l'en distingue.

CRITIQUES ET EXPERTISES

77

est introduite conjointement avec celle de stratgie avec mmoire. Les joueurs jouent chaque partie en fonction, non seulement des gains passs, mais aussi de toutes les dcisions antrieures de chacun d'eux. Les auteurs noncent alors un certain nombre de rgles raisonnables permettant de dfinir une nouvelle solution cooprative telle que, chacun des joueurs faisant face, chaque priode, une menace de reprsailles pour les priodes futures, aucun d'eux n'a intrt dvier de la stratgie correspondant cette solution. Mme si le choix de cette solution peut paratre arbitraire, comme prcdemment, elle apparat comme un quilibre de Cournot-Nash du jeu squentiel. Dans leur analyse des jeux squentiel sur horizon infini, Haurie et Tolwinsky (1985) comptabilisent les gains en en faisant la somme. Les sries obtenues sont alors compares suivant des critres de dominance et de dominance faible. D'o les notions d'quilibre faible et d'quilibre faible parfait (voir ci-dessous pour une dfinition prcise d'quilibre parfait dans un jeu rpt). Les auteurs prcisent alors les conditions (stratgies avec menaces) permettant d'implanter, suivant le cas considr, soit un quilibre faible, soit un quilibre faible parfait. D'un autre point de vue, la ngociation peut tre envisage comme une suite de propositions prendre ou laisser dans un jeu rpt o un joueur A propose un joueur B une certaine portion de tarte. Dans une forme de ce jeu, le joueur B accepte ou refuse et le joueur A reformule une proposition, etc. Dans une autre forme, le refus de B est immdiatement suivi d'une contre-proposition que A peut accepter ou refuser, etc. Dans les deux cas, on peut dcider que le jeu ne s'arrte que s'il y a accord, ou bien que le jeu n'est rpt qu'un nombre dtermin de fois (la tarte n'tant pas distribue en cas de dsaccord final). : L'intrt des joueurs s'entendre le plus rapidement possible est stimul par un certain cot associ l'coulement du temps. Ce cot peut tre reprsent par un facteur d'actualisation b\, i = A,B(0< j< 1).Ainsi 1 = 8 > j > y >... et la mme portion x de la tarte a une valeur actualise b\x d'autant plus petite que la date t de l'accord est loigne. Une stratgie pour chacun des joueurs spcifie sa proposition ou rponse pour chaque valeur de x (0 <_ x < 1) en fonction de l'historique du jeu. Il est assez facile de voir que toute rpartition constitue un quilibre de Nash. Ainsi l'extension de la notion de jeu simple celle de jeu rpt ne permet pas toujours de garantir l'unicit de l'quilibre. Dans une telle situation, deux attitudes sont possibles : 1. Introduire de manire exogne une certaine notion d'quit et dfinir un processus extrieur au jeu susceptible d'imposer aux joueurs le (ou l'un des) point(s) d'quilibre arbitrairement choisi. 2. Dfinir une notion d'quilibre mieux adapte au jeu considr. Remarquons que ces deux attitudes ne sont pas incompatibles. Il est tout fait possible, ainsi que nous le verrons, que mme en restreignant la notion d'quilibre,

78

L'ACTUALIT CONOMIQUE

l'unicit de celui-ci ne soit pas garantie, d'o la ncessit, dans certains cas, de trancher de manire exogne. C'est le but de l'approche axiomatique que de formuler un certain nombre d'axiomes que la solution d'un jeu doit satisfaire, de telle manire que i) les axiomes soient naturels, ii) ils permettent de dgager une solution, iii) cette solution soit unique. La question de savoir si, pour un jeu donn, on opte pour la voie de la mdiation ou la voie axiomatique est toujours plus ou moins subjective. Il arrive frquemment que, aprs que la seule issue apparente ait t de s'orienter dans la voie de la mdiation, des formulations plus fines des axiomes aiguillent les recherches sur la seconde voie. Dans les jeux indfiniment rpts, chaque tape, on fait face au jeu initial rpt, on peut donc dire que c'est un sous-jeu du jeu commenant l'une quelconque des tapes antrieures, en particulier du jeu commenant l'tape 0. On pourra donc distinguer, parmi les stratgies conduisant un quilibre de Nash, celles qui induisent sur tout sous-jeu des stratgies conduisant un quilibre de Nash de ce sous-jeu. Cette distinction permet de dgager une nouvelle notion d'quilibre : on dit qu'un quilibre de jeu rpt est parfait si c'est un quilibre de Nash tel que toute stratgie associe cet quilibre induise sur tout sous-jeu des stratgies conduisant un quilibre de Nash de ce sous-jeu. Dans le modle de Rubinstein [1978] o propositions et contre-propositions alternent on a les rsultats suivants : Il existe une unique partition de la tarte qui peut tre soutenue comme un quilibre parfait. Pour cet quilibre, l'accord est obtenu immdiatement: le joueur A reoit (1 8 B )/(1 - 8 A 8 B ) et le joueur B reoit 8 B (1 - 8 A )/(1 8 A 8 B ). La stratgie du joueur A consiste proposer cette rpartition et celle du joueur B n'accepter une offre que si elle est suprieure ou gale cette rpartition. Examinons cette rpartition : 1 "" ^A ^B 1~"8 A 8 B
1

Si A = 8 B = 8, la part du joueur A devient : ^ et celle du joueur B : - . Par exemple, pour 8 = 1/2, les parts des joueurs A et B sont de 2/3 et 1/3 respectivement. Ainsi, si les deux joueurs ont le mme facteur d'actualisation, le joueur qui met la premire proposition est toujours avantag. On peut expliquer ce rsultat

CRITIQUES ET EXPERTISES

79

par le fait que son partenaire doive attendre au moins une priode avant de pouvoir formuler une contre-proposition. Remarques 1. Si l'on dfinit les fonctions f(x, t) = x 8 A P o u r I e joueur A et g(x, t) = (lx )8# pour le joueur B, ces fonctions dterminent des prfrences intertemporelles pour chacun des deux joueurs. Ainsi, par exemple, le joueur A sera indiffrent entre x (au temps t = 0) et y 8 A (au temps t = 1) si et seulement si x = ybA i.e. y = x I 8 A . Ces prfrences vrifient les six axiomes des prfrences intertemporelles de Rubinstein [1982], qui sont l'adaptation intertemporelle des axiomes de Nash. Les prfrences intertemporelles du joueur i sont reprsentes par une relation {(avec x~2- y si et seulement si x i-y et y ^ j x ainsi que x ^ 1-y si et seulement si x j-y et non y i x) dfinie sur l'ensemble [0,1] x N = SxN, complte, rflexive et transitive sur cet ensemble (o Nest l'ensemble des entiers naturels 0, 1, 2...): al: La. tarte est dsirable : si x < y alors (x, f ) ^1 {y, t). al: Le temps a de la valeur: si x > 0 et ^1 < t2 alors (x, t2) 0S (x, ^ 1 ). a 3 : Continuit : le graphe de ^ i est ferm dans (5 x N)x(S x N). a4: Stationnarit : (x, t) <*; (y, + 1) si et seulement si (x,0) ^1 (y,l) a 5 : Proprit de compensation croissante : si (x,0) ~ ; (x+e(x), 1) alors e est une fonction croissante de x. a6 : Pour tout x e 5, il existe un (J1(X) e S tel que (xj), ((J1(X), 0). 2. La valeur de 8 caractrise le niveau de patience d'un joueur. Plus 8 est petit, plus petite est sa patience (et plus grande son impatience) car y = x/8 est d'autant plus grand que 8 < 1 est petit. D'autant devra donc crotre la portion y de la priode suivante pour qu'elle lui procure la mme satisfaction que la portion x de la priode prsente. Aussi, plus un joueur est impatient, plus sa portion de tarte ( l'quilibre) sera rduite. En effet,
1 ^

F()= -,^ (pour le joueur A) 1 -ooB est une fonction croissante de 8 (8 B fix), donc plus 8 est grand (et le joueur patient) plus grande sa part de la tarte. La mme conclusion peut tre tire de la fonction G(8) = ? ( 1 ~*A) (pourB) avec bA fix. 1 -66A 4.3 L'influence d'une alternative Traditionnellement, on introduit la rgle dite de partage de la diffrence lorsque l'un des joueurs a la possibilit de quitter le jeu (ce qui laisse son

80

L'ACTUALIT CONOMIQUE

opposant avec un gain nul) et d'opter pour une solution alternative (comme, par exemple pour un travailleur, d'accepter un travail mal rmunr dans une autre entreprise ou de s'en remettre l'assurance-chmage) ; d'aprs cette rgle on convient d'ajouter au gain d'quilibre de chacun des joueurs, la moiti de la diffrence entre la valeur des gains d'quilibre en l'absence d'alternative et la valeur de l'alternative. Cette situation est examine dans Sutton [1985] o le modle prcdent est modifi comme suit : le facteur d'escompte 8 est identique pour les deux joueurs. aprs chaque refus d'une proposition, un vnement alatoire survient avec une probabilit p. Si l'vnement a lieu, A et B peuvent quitter le jeu et recevoir sA et sB respectivement. Ce jeu a galement une solution unique, atteinte immdiatement. Il n'est pas utile de rappeler ici quels sont exactement les parts des joueurs. Cependant, pour sA = sB = 0, on retrouve les solutions de Rubinstein mentionnes ci-dessus. De plus, lorsque p = 1 et sA = 0, le joueur B a une option permanente et dans ce cas la part de A est

x = Min

{lT8 1 ^* }
i

et, contrairement la rgle du partage de la diffrence, ceci n'affecte l'issue du jeu que lorsque sB > , ^ (et dans ce cas la rpartition (1 - sB, sB ) prvaut).

Ceci s'interprte de la faon suivante : si l'option de B est suprieure la part qu'il aurait pu attendre en l'absence de celle-ci, il faut que A lui offre au moins la valeur de cette option pour que B accepte de participer au jeu. Remarque Si l'on modifie quelque peu la rgle du jeu en prcisant que, chaque tape, si l'vnement alatoire survient, le jeu s'arrte et les joueurs reoivent respectivement sA et sB (convenablement escompts) la part du joueur A devient : 1 ~ p s B - (1 - p ) 8 + p ( l - p ) S s A l-(l-p)22 Si de plus, propositions et contre-propositions se succdent instantanment, on pose alors A t pour le facteur d'escompte p A r pour la probabilit que l'vnement alatoire survienne dans la priode et l'on obtient, par passage la limite (et en posant w = -pzJTT ) :

CRITIQUES ET EXPERTISES

81

Dans le modle de Rubinstein, x = 1/2 (l'avantage d'ouvrir les ngociations s'estompe, ce qui vient confirmer l'interprtation que nous avons donne plus haut l'existence de cette disymtrie). Dans le modle ci-dessus : x= j +(1-W)Js4+ (l-sA-sB)}

Lorsque w -> 1, x -> 1/2 et on retombe sur la solution instantane de Rubinstein lorsque -p^> 0) Lorsque w -> 0, alors x -> sA + 1/2 (1 sA - sB) et, ainsi que le font remarquer Binmore, Rubinstein et Wolinsky [1984] on tent a retrouver la rgle du partage de la diffrence lorsque, pour deux joueurs extrmement patients (8 assez proche de l'unit) une intervention exogne impose la fin des ngociations. En rsum: 1. S'il n'y a pas d'intervention exogne, la menace de quitter la ngociation n'est pas crdible lorsque les solutions alternatives sont infrieures l'issue naturelle du jeu en l'absence d'alternatives. 2. Si une intervention extrieure peut en tout temps forcer des joueurs extrmement patients rompre les ngociations, l'issue du jeu a tendance se rapprocher de la rgle du partage de la diffrence. Dans les modles prcdents, chacun des joueurs connat le systme de prfrences de l'autre (ou son facteur d'escompte ou les cots encourus). De tels modles sont dits information parfaite. C'est pourquoi, bien que, comme nous venons de le voir, ils apportent un clairage intressant, ils sont encore loin de fournir une description satisfaisante des phnomnes rels associs la ngociation (collective).
5. JEUX RPTS INFORMATION IMPARFAITE

Rcemment, une littrature abondante tmoigne d'un intrt renouvel pour ce problme. Nous nous intresserons plus spcifiquement aux modles de ngociation avec information imparfaite visant produire une thorie rationnelle du conflit dans la ngociation. Dans ces modles, un agent s'identifie comme fort s'il est capable de formuler des propositions (ou des rponses des propositions) qu'il ne serait pas profitable un joueur plus faible de formuler. Afin d'tablir ainsi sa force, le joueur peut devoir se montrer intraitable pendant un certain temps afin d'obtenir un arrangement qui, de son point de vue, est plus satisfaisant qu'un arrangement obtenu plus rapidement par un joueur plus faible ngociant sa place.

82

L'ACTUALIT CONOMIQUE

Les premiers travaux dans cette direction sont dus Fudenberg et Tirole [1983], Sobel et Takahashi [1983] et Crampton [1984]. Une approche analogue, mais plus spcifiquement oriente dans la voie de l'arbitrage (ou l'implantation par un mdiateur) a t suivie, parmi d'autres (et pour ne citer que le plus important), par Myerson [1982,1983,1984a, 1984b, 1986], Nous y reviendrons. La notion d'quilibre parfait ou d'quilibre squentiel est alors remplace par celle d'quilibre Bayesien parfait dont nous rappelons ci-dessous la dfinition, qui prvaut dans les jeux information imparfaite rpts). Les modles proposs ont en commun les caractristiques suivantes : un monopole bilatral est reprsent par un acheteur et un vendeur qui ngocient l'change, d'un bien indivisible, de valeur a pour l'acheteur (0 <. a < 1), de valeur v > 0 pour le vendeur, l'acheteur connat a et v, le vendeur connat v mais ignore a, le vendeur commence la ngociation avec certaines hypothses sur a, chaque priode f, le vendeur annonce son prix p f , t = 1, 2, ... (que l'acheteur accepte ou refuse) et rvise ses hypothses sur a, chaque agent escompte le futur avec un facteur 8 connu de chacun d'eux. Remarquons que si le vendeur connaissait a, il pourrait aisment accaparer tout le surplus a-v. En rgle gnrale, l'absence d'informations est la source d'inefficacit. La notion d'quilibre adapte ce type de jeu est celle d'quilibre bayesien parfait: dans tout sous-jeu aucun des joueurs ne peut accrotre son gain en modifiant sa stratgie, compte tenu des stratgies des autres joueurs et des informations dont il dispose (la dfinition formelle de jeu bayesien n'est pas absolument ncessaire ici et n'interviendra que dans le contexte des travaux de Myerson ci-dessous). Dans Fudenberg et Tirole [1983], les auteurs examinent la situation simplifie deux priodes suivante : a (resp. b) est la valeur que l'acheteur faible (resp. fort) attribue au bien. Au dbut de la ngociation, le vendeur estime ces deux ventualits quiprobables. On suppose v < a (sinon le vendeur propose p = b) Si (b + v)/2 < a, le vendeur fixe son prix p E [a, b]. Ainsi, si p = a il ralise un gain certain a - v et, si p > a, il a une esprance de gain (p v)/2. Cette esprance est maximale pour p = b et vaut alors (b - v)/2. Mais (b v)/2 < a v par hypothse. Il fixera donc p = a. Un tel vendeur est dit faible. Si (b + v)/2 > a, on obtient de manire analogue que p = b maximise son esprance de gain. On a alors affaire un vendeur fort.

CRITIQUES ET EXPERTISES

83

Bien entendu, la distinction entre vendeur faible et fort dpend fortement des hypothses a priori qu'il a sur le type d'acheteur auquel il fait face (ici on a estim comme quiprobables ces deux types d'acheteurs). Dans la seconde priode, les stratgies d'quilibre de l'acheteur sont les mmes que dans la premire priode, il accepte toute offre dont le prix est infrieur ou gal au sien. Pour un tel jeu et avec la notion d'quilibre qui s'y rattache, les auteurs montrent encore l'existence et l'unicit da l'quilibre bayesien parfait. Quelques conclusions de cette tude : 1. L'valuation a priori que le vendeur fait du type d'acheteur auquel il fait face joue un rle sur la stratgie du vendeur. Ainsi, s'il s'attend (avec une forte probabilit) affronter un acheteur faible, il va jouer faible (p0 = a) la premire priode. Si, au contraire, il est peu prs convaincu d'tre en prsence d'un acheteur fort, il va jouer fort (p0 = c = (1 8) b + ha) la premire priode (o c est le prix maximum qu'un acheteur fort est prt payer la premire priode lorsqu'il s'attend ce que le prix de seconde priode soit px = a). 2. L'accord n'intervient pas ncessairement la premire priode, mme dans le cas o c'est toujours possible (l'allongement de la dure de la ngociation introduit un certain degr d'inefficacit). 3. Suivant les cas, il peut arriver que le vendeur obtienne un meilleur gain (escompt) lorsqu'on ajoute une priode. 4. Lorsque le vendeur est fort, il est possible qu'aucun accord n'intervienne. 5. L'impatience d'un acheteur (8 petit) peut tre avantageuse pour lui lorsqu'il fait face un vendeur fort (alors qu'en gnral, comme nous l'avons vu dans le modle de Rubinstein une telle attitude n'est pas profitable celui qui l'adopte). 6. Si l'on symtrise le modle en prcisant que l'acheteur ne connat pas la valeur v du vendeur, celui-ci peut proposer un prix de seconde priode suprieur son offre de premire priode (que l'acheteur a pu refuser, croyant avoir affaire un vendeur faible qui baissera son prix en seconde priode). 7. D'une manire gnrale, il n'existe pas de rgle quant aux effets des variations des paramtres (faible, fort, prfrences intertemporelles ou facteur d'escompte). Il convient, dans chaque cas, d'examiner ces effets dans le cadre du jeu considr. Le modle de Sobel et Takahashi est analogue celui de Fundenberg et Tirole, ceci prs que : - v = 0 , a est une variable continue sur [0,1],

84

L'ACTUALIT CONOMIQUE

Une distribution de probabilit F(a) connue des deux agents reprsente la probabilit que la valeur attribue par l'acheteur soit <. a, l'analyse s'effectue en deux temps: i) On considre un nombre fini T de priodes, ii) On fait T -> oo. Les rsultats de Sobel et Takahashi vont dans le mme sens que ceux de Fudenberg et Tirole. Quelques difficults : 1. Lorsque l'intervalle de temps entre les priodes tend vers 0, le taux de variation du prix tend vers oo ; ainsi, pour tout e > 0 donn la dure des ngociations peut tre rendue infrieure e avec une probabilit 1 e. Cette anomalie n'est pas simplement due au fait que l'un seulement des agents fait des propositions. En effet, elle subsiste lorsque l'on permet aux agents de faire des propositions en alternance. 2. On peut alors se demander si la cause de cette anomalie ne rside pas dans le fait que seul l'un des agents est en situation d'information imparfaite. Ce problme, discut par GuI et Sonnenshein [1985], n'a pas reu de solution pour l'instant. 3. Lorsque les deux joueurs ont une information imparfaite, l'approche axiomatique produit des quilibres multiples. On peut alors tenter de raffiner encore cette approche jusqu' l'obtention d'un quilibre unique ou alors, jugeant que l'adjonction de nouvelles hypothses restreindrait la porte du jeu, tudier et prciser la notion d'arbitrage.
6. NGOCIATION, MDIATION ET ARBITRAGE

6.1 Les bases de la thorie Ainsi que nous l'avons vu ci-dessus, lorsque les deux joueurs ont une information imparfaite, il y a multiplicit des quilibres. La fonction d'un mdiateur (ou d'un mcanisme) externe au jeu sera alors de choisir, dans cet ensemble, une issue du jeu ne dsavantageant pas trop l'un des joueurs. Les travaux de Myerson dj cits, que nous allons tenter de rsumer portent essentiellement sur la caractrisation de tels mcanismes. La notion de point de focalisation, introduite par Schelling (1960) est au centre de ce problme. Un tel point est choisi dans l'ensemble des issues optimales ralisables du jeu. Schelling appelle alors effet de focalisation tout ce qui peut attirer l'attention des joueurs sur une issue particulire du jeu de manire inciter les joueurs implanter ce point pour quilibre. Rappelons brivement les sept catgories de critres susceptibles de dterminer un point de focalisation signals par Meyerson (1984a) avant de nous concentrer

CRITIQUES ET EXPERTISES

85

sur ceux qui concernent plus spcifiquement la thorie de la ngociation : 1. Les facteurs environnementaux (ou les prcdents historiques). 2. Les proprits stratgiques (simplicit, stationnante). 3. La stabilit structurelle (i.e. le point est un point d'accumulation d'quilibres de jeux obtenus par perturbation du jeu considr). 4. L'intervention d'un arbitre extrieur au jeu. 5. Des critres objectifs d'quilibre et d'optimalit (qui pourraient servir de fondement au choix d'un arbitre impartial). 6. L'un des joueurs, appel pour cette raison le principal, peut avoir le pouvoir d'induire un point de focalisation au moyen d'une intervention antrieure au jeu proprement dit. 7. La ngociation entre certains des joueurs (antrieure au jeu). Le critre 7 permet de dfinir la ngociation comme tout processus de communication, antrieur aux actions des joueurs, qui peut influer sur l'issue du jeu par la dtermination d'un point de focalisation. L'objet d'une thorie de la ngociation sera donc de prciser les critres 4, 5 et 7 ci-dessus. En particulier, nous dirons qu'il y a une influence effective si l'quilibre choisi dpend des prfrences de la personne concerne (arbitre, principal ou joueurs-ngociateurs) sur l'ensemble des quilibres, de sorte que les quilibres qu'il prfre seront ceux qui auront la plus forte probabilit d'tre implants. Ainsi, dans le cas de la ngociation effective, il faut s'attendre ce qu'ils choisissent des stratgies conduisant un quilibre optimal dans l'ensemble des quilibres ralisables. En outre, un quilibre de ngociation effective doit aussi procurer chaque joueur participant la ngociation une esprance de gain refltant sa force relative ainsi que son habilet de ngociateur. En rsum, pour Meyerson, l'objectif fondamental de la thorie des jeux coopratifs est de dvelopper une thorie formelle permettant de prdire l'issue des jeux (cooprativement) transforms pour lesquels les critres d'effet de focalisation fonds sur les prfrences, soient effectifs. 6.2 Subtilits et complications dans la slection de Vquilibre Lorsque le principal peut choisir le point de focalisation, il va slectionner celui qui lui procure l'esprance de gain la plus leve, pourvu que son choix s'effectue sans change d'information prive (par opposition information publique, dont le sens sera prcis au sous-paragraphe 6.4 ci-dessous). Sinon, son optimum pourrait s'en trouver modifi, et cesser d'tre un quilibre si son choix dpend de l'information reue. Ceci rvlerait alors indirectement l'information aux autres joueurs. Pour viter ce type de situation, on exige que le choix du principal reflte un compromis indiscernable entre ses prfrences possibles.

86

L'ACTUALIT CONOMIQUE

Une autre difficult peut galement surgir du fait que le principal ne puisse exercer son influence que sur un sous-ensemble de l'ensemble des joueurs (ou des diverses tapes du jeu). La notion de quasi-quilibre principal introduite par Myerson (1982) peut tre utile pour traiter de ce cas. Nous ne considrerons pas ici ce type de situation, qui dpasse le cadre de ce rsum. 6.3 La notion d'quit Intuitivement, l'hypothse d'quit pour un jeu ngoci peut s'noncer comme suit : le rsultat raisonnable de ngociations effectives dans lesquelles tous les joueurs ont les mmes possibilits de participation doit correspondre aux recommandations d'un arbitre impartial ayant la mme information que l'information commune tous les joueurs au cours des ngociations. Cette formulation tablit une certaine quivalence entre les critres 5 et 7 des effets de focalisation. 6.4 Les fondements d'une thorie de la coopration en en vironnement incertain C'est sur le modle de jeu bayesien qu'est construite l'analyse des jeux information imparfaite. Un jeu bayesien n joueurs consiste en la donne, pour chaque joueur i de : l'ensemble T1 des types possibles de ce joueur, l'ensemble S1 de ses stratgies, Une fonction d'utilit de type Morgenstern-Von Neumann U1 dfinie sur l'ensemble produit de toutes les stratgies et de tous les types possibles : S1 x S2X ... x Sn x T 1 x ... x Tn

Une collection de fonctions de probabilits conditionnelles p i ( | ^) dfinies, pour tout V1 E Tj, sur l'ensemble produit des types des autres joueurs : fi = T 1 x ... x T^ 1 x T1+1 x ... x Tn Ces donnes, pour i = 1, ..., I, constituent l'ensemble des informations publiques (i.e. communes tous les joueurs). Remarquons alors que, du point de vue de Vinformation publique, nous avons n fonctions d'utilit dfinies sur S x T= S1X S2X ... x Sn x T1 x T2 x ... x Tn et l'on peut dire que U1 est l'utilit a priori du joueur i (i.e. avant qu'il connaisse ou tienne compte de son type). On en dduira donc les notions d'quilibre et d'optimum a priori. Du point de vue de chaque joueur connaissant son propre type, nous avons n fonction H1 dfinies sur 5 x f. i = 1 ... n

CRITIQUES ET EXPERTISES

87

Nous dirons que Ti1 est l'utilit intrimaire du joueur i. L'optimum (ou l'quilibre) associ la fonction , est appel optimum (resp. quilibre) intrimaire. Enfin, du point de vue d'un agent omniscient extrieur au jeu (ou d'un arbitre auquel les joueurs peuvent se confier sans crainte d'en subir une quelconque pnalisation) nous avons n fonctions d'utilit ^1-dfinies sur S. D'o une troisime notion, celle d'quilibre (et d'optimum) a posteriori (dans le sens o tous les types sont maintenant connus). Les fonction V1 et T T y se dduisent de U1 par restriction, i.e. )= U1] tj U1 = U 1 Ia 1 ,...,^) (fy est fix). (t=(t !,..., Oestfix).

L'analyse d'un jeu bayesien par un arbitre extrieur portera sur la rgle de dcision, ou mcanisme, qui dtermine les stratgies (plutt que sur les stratgies elles-mmes). Un tel mcanisme sera donc une rgle quelconque permettant de dterminer de manire alatoire les stratgies des joueurs en fonction de leur type. De faon plus prcise, un mcanisme est une fonction J U L qui, tout t = (J1, ..., tn) E Tassocie une distribution de probabilit sur S. Ainsi, un arbitre peut esprer influer sur le choix des stratgies de joueurs d'un certain type, mais n'a aucune espce d'influence sur leur type. En l'absence d'information sur le type des joueurs, un tel arbitre ne peut percevoir l'impact de son influence que par la faon dont les joueurs modifient leur choix de stratgie. Nous dirons qu'un mcanisme est compatible avec Vincitation (abrg en CI.) s'il pourrait tre implant par le biais d'un mdiateur central ayant accs directement et confidentiellement chacun des joueurs de faon telle que chacun d'eux soit incit rvler honntement son type et respecter les recommandations du mdiateur lorsque tous les autres joueurs en font autant. Il est noter que les incitations l'honntet (et l'obissance) peuvent tre caractrises mathmatiquement par un certain nombre de contraintes (que nous retrouverons plus loin sous le nom de contraintes d'incitation). tant donn un mcanisme CI. m | et si le i e joueur est de type th pour tout I1f = (E1, ... ^ 1 , ti+l, ... tn) on peut crire, par abus de notation, t = (-, tj) et, |JL (t) tant une distribution de probabilit sur S, Ti ^(t), I1) est bien dfinie. SIp1Cf11 U) dsigne la probabilit que le joueur considr attribue l'vnement: les autres joueurs sont de type th l'utilit associe cet tat vaudra donc :
Pi

(Jt1 I I1) U1(JJL(O, U)

Sommons sur tous les types possibles { s T1 des autres joueurs, on obtient ainsi l'esprance totale du joueur i de type tj associe J U L:
IT(IULK)= S Pi(^ U) If1(IJL(O,?,)

5efJ On en dduit immdiatement une notion d'optimalit (intrimaire) pour les mcanismes CI. Plus prcisment, nous dirons qu'un mcanisme compatible avec

88

L'ACTUALIT CONOMIQUE

l'incitation jx est optimal (ou efficace) au sens intrimaire de Holmstrom et Myerson [1983] si et seulement si il n'existe pas de mcanisme CI. v tel que Uj(v I tj) >. Lf2-(IJiI fi)i=l,..., H, UELT1, avec ingalit stricte dans un cas au moins. Un mcanisme CI. optimal au sens intrimaire peut engendrer des solutions qui ne sont pas optimales a posteriori, car les contraintes d'incitation rgissant ces mcanismes de slection ne sont pas ncessairement videntes ds lors que tous les types sont rvls. Ainsi, lors de la ngociation collective d'un contrat de travail, la contrainte d'incitation associe l'absence de gain qu'un employeur peut attendre de la sous-estimation de sa capacit de payer se traduira par une probabilit positive de grve lorsque l'employeur sous-value sa capacit d'augmenter les salaires de ses employs. Les contraintes d'incitation permettent ainsi d'expliquer pourquoi des systmes sociaux apparemment bien conus peuvent engendrer des rsultats socialement inefficaces. En gnral, l'hypothse d'quit n'implique pas que, dans un jeu information imparfaite, arbitrage et ngociation soient compltement quivalentes. Il faut encore supposer que les joueurs ngocient de manire indiscernable (i.e. sans rien rvler de leur information prive au cours des ngociations). Un joueur pourra ngocier de manire indiscernable dans la mesure o il est capable d'exprimer sa stratgie de ngociation en termes de mcanismes contingents certains types, plutt qu'en termes d'actions ou de stratgies finales. La notion de compromis interpersonnel doit tre encore largie celle de compromis intertype dans les jeux information imparfaite. Par exemple deux mcanismes CI. optimaux au sens intrimaire peuvent se traduire par les mmes gains pour tous les types du joueur 1 alors que l'un favorise le type A, et l'autre le type B du joueur 2. Si l'un de ces mcanismes est la solution (ngocie, arbitre ou choisie par le principal) de ce jeu coopratif, c'est qu'un certain compromis entre les deux types possibles du joueur 2 doit avoir t tabli. De mme que tout compromis interpersonnel doit obir certains critres d'quit, les compromis intertypes doivent vrifier certaines rgles d'indiscernabilit, sinon les autres joueurs pourraient tirer un certain nombre d'informations sur son type de la faon dont un joueur ngocie et les utiliser son dtriment. Ce problme de compromis intertype indiscernable est loin d'tre rsolu. Cependant, il est un cas o sa rsolution est facile. C'est celui o le mcanisme est choisi par un principal qui dispose d'une solution forte au sens de Myerson [1983]. Une telle solution est un mcanisme CI. qui est optimal par rapport tous les types possibles du principal et qui, de plus, prserverait sa qualit de mcanisme CI. si le type du principal tait connu de tous. Une telle solution forte, si elle existe, est essentiellement unique. Bien qu'une thorie gnrale du compromis intertype reste encore faire, Myerson [1985] suggre qu'elle devrait avoir pour caractristique de gnraliser la

CRITIQUES ET EXPERTISES

89

rgle suivant laquelle un principal disposant d'information prive doit prconiser sa solution forte, lorsqu'elle existe. On exigera en outre qu'elle soit optimale au sens intrimaire. 6.5 Solutions ngocies neutres L'laboration de la notion de solution ngocie neutre dans les jeux information imparfaite (cf. Myerson [1983, 1985]) s'effectue de manire analogue celle de solution ngocie de Nash [1950] dans les jeux deux joueurs ( information parfaite). On distingue deux types d'axiomes: les axiomes relis l'optimalit et la symtrie de la solution ngocie, l'axiome d'indpendance des solutions non pertinentes. Ainsi, le concept de solution ngocie neutre de Myerson est une gnralisation de la notion de solution ngocie de Nash et se distingue sensiblement de celle qu'en ont faite Harsanyi et Selten [1972]. Pour Myerson, la notion de solution ngocie neutre doit tre le plus petit concept de solution vrifiant les trois conditions suivantes : 1. S'il existe, pour chacun des deux joueurs, une solution forte attribuant l'autre joueur le gain correspondant l'quilibre non coopratif, telle que la distribution uniforme de ces deux solutions est un mcanisme compatible avec l'incitation qui est efficace au sens intrimaire, alors cette distribution uniforme doit tre la solution ngocie. 2. Si JJL est un mcanisme CL efficace au sens intrimaire dans un jeu T et si pour tout e > 0, il existe un jeu T' tel qu'une solution ngocie de F ne peut garantir tout type t{ de chaque joueur i un gain suprieur U1 (|JL | E1-) + e, o V ne diffre de T qu'en ceci qu'il admet davantage d'actions concertes des joueurs que T, alors jx doit tre une solution ngocie de T. 3. L'ensemble des solutions est invariant pour les transformations non pertinentes (irrelevant) des fonctions d'utilit et de probabilits. L'intrt de cette notion rside d'une part en ce que, pour tout jeu bayesien information imparfaite deux joueurs, l'ensemble des solutions ngocies neutres n'est jamais vide et, d'autre part, que cet ensemble concide avec la solution ngocie de Nash lorsque l'information est parfaite (thormes 1 et 2 de Myerson [1984a]). D'autre part, lorsque les contraintes d'incitation d'un mcanisme CL sont exprimes sous forme mathmatique, elles sont linaires et le problme de l'optimum peut tre crit sous la forme d'un objectif linaire :
2

Max
JUL

^
i=l

^
t^ETi

I1-(^)UiOiU-)

90

L'ACTUALIT CONOMIQUE

On peut alors montrer que, pour tout mcanisme CI. [i, optimal au sens intrimaire, il existe un vecteur \ = ((X1 (I1), I1 G T1)I= 1,2, X1(I1)X)

tel que |x est la solution du problme linaire ci-dessus (sous les contraintes d'incitation). Il est facile, en considrant le problme dual, de dfinir les cots Qt1-(^ | ^) associs aux contraintes d'incitation, o Ct1(^ | ^) reprsente le cot, pour le joueur J de type ti9 de prtendre qu'il est de type ;. La mcanique traditionnelle de l'analyse primal-dual de la programmation linaire permet en outre de caractriser compltement les solutions ngocies neutres (cf. Myerson [1984b]). 6.6 tude d'un exemple Un monopole bilatral form d'un vendeur (v) et d'un acheteur (a) ngocie l'change d'un objet unique est indivisible. Les informations publiques sont .rsumes dans les deux tableaux ci-dessous
V

fort faible

Prix 80 0

Probabilit 3/4 1/4

a fort faible

Prix 20 100

Probabilit 1/4 3/4

l'information prive de chaque agent consiste en la connaissance de son type. Du point de vue de Toptimum a posteriori, la probabilit que l'change ait lieu est de 15/16, car le seul cas o celui-ci est impossible correspond aux valuations respectives de 80 pour le vendeur et de 20 pour l'acheteur, vnement dont la probabilit est de 1/16. On peut toutefois montrer qu'il n'existe aucun mcanisme CI. qui soit optimal dans ce sens. Plus prcisment, quelles que soient les spcifications rgissant le droulement des tractations, la possibilit qu'aucune transaction n'ait lieu, en dpit d'une diffrence de prix favorable, devra ncessairement tre affecte d'une probabilit positive. La contradiction n'est qu'apparente et peut tre lucide de la faon suivante. Nous nous restreindrons au cas de mcanismes symtriques (i.e. vendeur et acheteur sont traits de manire symtrique) car on peut montrer que s'il existe un mcanisme CI. optimal a posteriori, il en existe un de symtrique. Soit (vv, va) le couple de valeurs attribues par le vendeur et par l'acheteur. Pour(v v , va) = (0,100) la symtrie et l'optimalit a posteriori permettent d'infrer que la vente s'effectue au prix de 50. De mme, pour le couple (80, 20) on a la certitude qu'aucune transaction ne peut avoir lieu. Soit alors q la probabilit d'change pour le couple (0, 20) et x le prix convenu dans ce cas. Par symtrie, q (resp. 100 x) est aussi la probabilit (resp. le prix) associe l'change pour le couple (80, 100).

CRITIQUES ET EXPERTISES

91

La condition x < 20 est ncessaire (sinon l'acheteur fort aurait une esprance de gain ngative, o l'esprance de gain d'un joueur est dfinie par la diffrence entre son valuation du prix et l'esprance du prix). D'autre part, un vendeur faible ne sera incit reporter honntement son type que si I 50+ I xq> | ( 1 0 0 - x ) <?, donc si g < ^ L
x)

D'o q < 1, contrairement ce qu'exigerait l'optimalit a posteriori. 75 Les mcanismes vrifiant q = =-=z-r sous tous optimaux au sens intrir ^ 2(75 x) maire. C'est donc ceux-ci que nous considrerons pour la recherche d'une solution arbitre ou ngocie quitable. Les types forts des deux agents prfrent des mcanismes o x est minimum, alors que les types faibles privilgient des mcanismes o x est maximum. On voit donc ici comment la notion de compromis intertype s'impose de manire naturelle dans l'analyse. Dans tous les mcanismes CI. symtriques et optimaux au sens intrimaire, les agents faibles sont indiffrents en ce qui concerne la divulgation de leur type, entre honntet et mensonge. Cependant, chacun d'eux prfrerait mentir s'il savait que l'autre agent est faible. Donc aucun de ces mcanismes ne pourra tre implant sans mdiation dans un processus analogue celui de Rubinstein dcrit plus haut, car le prix final en cas d'accord doit ncessairement reflter les types des agents. Cela signifie que ceux-ci devraient donc rvler (au moins partiellement) leur type au cours du processus. D'o une incitation pour l'un des agents au moins tenter de tirer profit de cette information. On peut donc conclure avec Farrell [1983] que l'intervention d'un mdiateur peut tre essentielle l'implantation de mcanismes socialement dsirables. La mdiation confidentielle est davantage qu'une simple hypothse de simplification technique; c'est un moyen important et pratique de s'assurer que les agents rvlent honntement leurs informations prives ou font des concessions sans modifier l'incitation des autres agents en faire autant. D'aprs le critre d'optimalit a priori, le mcanisme symtrique choisi sera celui qui a le prix x maximum, donc x = 20 (et dans ce cas q = 0,68). Cependant, chacun des agents connat sa propre valuation, donc ce mcanisme ne leur est d'aucune utilit. Le mcanisme symtrique avec x 0 (donc q = 1/2) est la solution ngocie neutre de cet exemple. On voit donc ici que la solution ngocie rsout le compromis intertype en faveur des types forts. Cette conclusion ne devrait pas surprendre car, dans cet exemple, les contraintes d'incitations sont telles qu'un agent faible n'a aucun intrt les violer (i.e. prtendre qu'il est fort) alors qu'en gnral, dans des ngociations, on peut s'attendre ce qu'un joueur faible trouve un certain avantage mentir, ce qui ne sera jamais le cas d'un joueur

92

L'ACTUALIT CONOMIQUE

fort. Il semble donc raisonnable que les agents ngocient ici le mcanisme le plus favorable aux types forts. On peut dire aussi que seuls les types faibles ayant un intrt l'indiscernabilit, ce type de compromis sera rsolu en faveur des types forts. D'un autre point de vue, si des prix ngatifs taient admis, les types forts prfreraient les mcanismes avec x < 0. Mais alors un tel agent devrait ncessairement opter pour la ngociation indiscernable de tels mcanismes, qui fournissent des gains ngatifs leur partenaire. Le rsultat d'une telle ngociation serait alors le compromis indiscernable avec, encore, A = O. 6.7 Le modle dynamique Analysons l'exemple prcdent dans un cadre dynamique ( temps continu) et supposons que les agents accepteront l'change ds que l'un deux admet qu'il est de type faible ; le prix agr sera x (0 <. x < 20) si le vendeur est le premier cder et 100x dans le cas contraire. Supposons encore que les deux agents ont le mme taux d'escompte 8. La possession de l'objet procure au vendeur un flot continu de bnfices dont la valeur actualise est prcisment le prix qu'il attribue l'objet. Ce jeu admet un quilibre symtrique o les agents forts ne concdent jamais et les agents faibles prvoient indpendamment de cder une priode d'esprance ii T ^ ( 1 0 0 - 2 x ) l n 4 1 v , Wv1,^ , , T appartenant a 1 intervalle I 0, ~ I , ou T est calcule a 1 aide de la fonction de distribution cummulative T(T) = MIN { 1 , 4 ( 1 Tx/100 e

~ 2 x ) } . Avec

cette fonction de distribution, si l'un des joueurs est faible et l'autre fort, on trouve 200 Ax T = r^ pour le joueur faible. Ceci donne, pour x = 0 et 8 = 0,1 (en mesurant le temps en annes), T = 53,3 annes. De tels dlais rduisent considrablement la valeur actualise des gains attendus de la transaction. On montre en fait que pour tout x dans l'intervalle [0,20], l'quilibre symtrique de cette ngociation dynamique est domin par le mcanisme symtrique du jeu statique prcdent (pour le mme x). Ainsi on peut en conclure que la possibilit de raliser l'change une date ultrieure incite les agents retarder la date de concessions. On peut dire aussi que l'introduction des aspects dynamiques fait beaucoup plus qu'engendrer des contraintes d'incitation. Elle engendre galement de nouveaux critres d'optimalit qui peuvent influer sur le choix coopratif de l'quilibre ou du mcanisme CI. qui sera implant. Un aspect important de la thorie de la ngociation dynamique consiste en la prise en compte de l'coulement du temps sur l'volution des stratgies des joueurs (et non seulement sur l'issue du jeu).

CRITIQUES ET EXPERTISES

93

Examinant plus spcifiquement cet effet d'apprentissage sur le droulement d'une ngociation d'un contrat de travail, A. Haurie et A.M. Dussaix [1972] tudient le jeu suivant. Des travailleurs en grve ngocient leur part du revenu de l'activit quotidienne y pour les T prochains jours. Si la convention est signe la date U le revenu total y(T1) est rparti, suivant l'accord, entre travailleurs et entrepreneur. Si les prtentions initiales des travailleurs, dQ9 sont rejetes, ceux-ci peuvent rpter leur offre, manifestant ainsi leur refus de prendre en compte le rejet de leur premire offre. On dira qu'il y a apprentissage nul. On suppose que les travailleurs s'entendent sur des conditions minimales (salaire minimum). Les auteurs montrent alors qu'il y a une courbe d'apprentissage maximale joignant la prtention initiale la prtention minimale. Entre les deux extrmes (apprentissage nul et apprentissage maximal), les prtentions des travailleurs vont voluer sur une courbe d'apprentissage d(t). Si T est la date laquelle l'accord est conclu, la prtention correspondante est alors d(i) et les parts respectives des travailleurs et de l'entrepreneur C/(T) (T-T) et (y d(r)) (T-T). Il est clair que cette solution n'est pas optimale puisque les revenus yi sont perdus pour les deux catgories d'agents. Cependant, cet accord est un quilibre de Nash. Ainsi, cette tude vise laborer des instruments (fonction d'apprentissage) permettant de dcrire le fonctionnement rationnel des agents en situation de non optimalit. Par opposition, Rubinstein et l'cole de la London School of Economies auraient rgl le diffrend l'optimum en prenant d0 = J(T), le surplus yi tant acquis aux travailleurs (puisque ce sont eux qui font la premire offre). Myerson aurait fait porter le dbat sur la meilleure faon de ngocier la rpartition de ce surplus. Le fait d'actualiser les parts des agents ne devrait pas modifier fondamentalement ces conclusions (du moins lorsque les agents ont des taux d'actualisation identiques). BIBLIOGRAPHIE
AUMANN,

R., 1978, Workshops on Repeated Games. Institute for Mathematical Studies in the Social Sciences, Standford University.

BiNMORE, K.G., A. RUBINSTEIN, et A. WOLINSKY, 1984, The Nash Bargaing Solution in Economie Modelling, London School of Economies.
BRAMS,

D., M. DAVIS, et P. STRAFFIN, 1979, The Geometry of Arms Race, International Studies Quartely, 23, pp. 567-588.

CRAMPTON,

P.C., 1984, Bargaining with Incomplte Information. An Infinit Horizon Model with Two-Sided Uncertainty , Review of Economie Studies, 51, pp. 579-593. J., 1983, Communication in Games I: Mechanism Design without a Mediator. Discussion Paper. M.I.T.

FARELL,

94
FUDENBERG,

L'ACTUALIT CONOMIQUE

D., et J. TIROLE, 1983, Sequential Bargaining with Incomplte Information: An Infinit Horizon Model with Two-Sided Uncertainty, Review of Economie Studies, 51, pp. 579-593.

GROFMAN,

B. et J. POOL, 1977, How to Make Coopration the Optimizing Strategy in a Two Person Game, Journal of Mathematical Sociology 5, pp. 173-186 F., et H. SONNENSHEIN, 1985, One-Sided Uncertainty Does Not Cause Delay, mimeo. J.C. et SELTEN, R., 1972, A Generalized Nash Bargaining Solution for Two-Person Bargaining Games with in Complte Information, Management Science 10, pp. 80-106. A., et DUSSAIX, A.M., 1972, Un modle dynamique de ngociation sous la forme d'un jeu semi-diffrentiel, R.A.LR.O. 6, vol. 1, pp. 65-86.

GUL,

HARSANYI,

HAURIE,

HAURIE,

A., et B. TOLWINSKI, 1985, Dfinition and Properties of Cooprative Equilibria in a Two-Player Game of Infinit Duration , Journal ofOptimization Theory and Applications, 46, pp. 525-534. B. et MYERSON, R.B., 1983, Efficient and Durable Dcision Rules with Incomplte Information, Econometrica 51, pp. 1799-1819.

HOLMSTROEM,

KURZ, M., 1978, Altruism as an Outcome of Social Interaction, American Economie Review, 68, pp. 216-222.
MYERSON,

R.B., 1982, Optimal Coordination Mechanism in Generalized Principal-Agent Problems, Journal of Mathematical Economies 11, pp. 67-81. , 1983, Mechanism Design by an Informed Principal, Econometrica, 51, pp. 1767-1797. , 1984a, Two Person Bargaining Problems with Incomplte Information, Econometrica, 52, pp. 461-487. , 1984b, Coopration Games with Icomplete Information , International Journal of Game Theory, 13, pp. 69-96. , 1985, Negotiation in Games : a Theoretical Overview, Discussion Paper, 658, Northwestern University. , 1986, Multistage Games with Communication, Econometrica, 54, pp. 323-358.

SCHELLING, SOBEL,

T . C , 1960, The Strategy of Conflict. Harvard University Press.

J. et I. TAKAHASHI, 1983, A Multi-stage Model of Bargaining , Review of Economie Studies, 50, pp. 411-426.

SMALE,

S., 1980, The Prisonner's Dilemma and Dynamical Systems Associated to Non-cooperative Games, Econometrica, 48, pp. 1617-1635.

CRITIQUES ET EXPERTISES

95

RUBINSTEIN,

A., 1982, Perfect Equilibrium in a Bargaining Model, Econometrica, 50, pp. 97-109. J., 1950, The Bargaining Problem, Econometrica 18, pp. 155-162

NASH,

SUTTON,

J., 1985, Non-cooperative Bargaining Theory. An Introduction, London School of Economies.

VON NEUMANN,

J. et MORGENSTERN, O., 1944, Theory ofGames and Economie Behavior, Princeton University Press.

Vous aimerez peut-être aussi