Vous êtes sur la page 1sur 8

quoi sert la thorie des jeux ?

Philippe SOLAL
Comment des individus parviennent-ils rsoudre leurs conflits dintrt ?
Quelles solutions mergent dans un cadre coopratif ? Et dans un contexte noncoopratif ? La science conomique sintresse ces questions grce lapproche dite de
la thorie des jeux, dont lmergence, entre les annes 1920 et les annes 1950, est
retrace par Robert Leonard dans son dernier ouvrage.
Recens : Robert Leonard, Von Neumann, Morgenstern and the Creation of Game Theory.
From Chess to Social Science, 1900-1960. New York, Cambridge University Press, 2010.
La thorie des jeux : origine et dveloppement
En tant que discipline acadmique, la thorie des jeux a pour objectif de formaliser des
situations conflictuelles inhrentes une communaut dindividus en interaction, de discuter
puis de proposer des solutions ces conflits. La conception des solutions est guide par des
critres doptimalit individuelle ou collective, de cohrence temporelle, de justice
distributive Schmatiquement, la thorie des jeux aborde de deux manires la rsolution
formelle dun conflit.
Si les individus ont la possibilit de signer des accords de coopration qui les engagent
de manire irrvocable dans un ensemble dactivits, alors une solution se ramne allouer de
la richesse, imputer des cots, rpartir des honneurs ou du pouvoir entre les signataires.
Linterprtation donne une solution est que la collectivit se charge de ddommager les
individus ayant coopr malgr les conflits dintrt.
Si les individus voluent dans un environnement dans lequel aucune institution nest
en mesure de garantir lexcution dun accord de coopration, laccord prend le statut dune
promesse. Les individus ont donc toute licence, dans le cadre de rgles prexistantes, pour
dployer des stratgies prdatrices, de dfense, de contrle des stratgies des adversaires afin
de maximiser la satisfaction de leur intrt personnel au dtriment de lintrt collectif. Dans
ce contexte, une solution est un ensemble de stratgies, une par individu, qui reprsente une
situation stable, un compromis : chaque individu est satisfait des consquences de sa stratgie
compte tenu des stratgies des autres membres de la communaut ou de lide quil sen fait.
Ces deux faons de rsoudre un conflit dintrt sont lorigine de deux branches de
la thorie des jeux : la branche cooprative et la branche non cooprative. La premire de ces
deux branches met laccent sur les accords de coopration ralisables entre des coalitions
dindividus, sur les consquences de ces accords, et sur les procdures de rpartition des
richesses, des cots, des honneurs ou des pouvoirs entre les membres dune coalition. Les
critres de justice distributive et doptimalit collective sont au centre de la conception de ces

solutions. La branche non cooprative de la thorie des jeux tudie des environnements dans
lesquels les parties dun accord de coopration ne sont pas lies par leur engagement ; aucune
compensation nest garantie en cas de dfection. En consquence, lanalyse met laccent sur la
capacit des individus recueillir de linformation disperse, former des anticipations sur le
comportement des adversaires, et ajuster leurs moyens leurs fins.
En 1944, la publication de louvrage Theory of Games and Economic Behavior par le
mathmaticien John von Neumann (1903-1957) et lconomiste Oskar Morgenstern (19021977) dclenche linstitutionnalisation de la thorie des jeux. Cet acte fondateur a structur la
recherche dune premire gnration de thoriciens des jeux parmi lesquels on retiendra les
noms de Robert Aumann, John Harsanyi, John Nash, Reinhard Selten, Lloyd Shapley, tous
laurats du prix de la Banque de Sude en sciences conomiques en mmoire dAlfred Nobel.
La thorie des jeux a rvolutionn la micro-conomie no-classique tout en impulsant de
nouvelles directions de recherche dans dautres disciplines scientifiques. Par exemple, en
1973 le thoricien de lvolution biologique John Maynard Smith et le gnticien George
Price publient larticle The Logic of Animal Conflit dans la revue Nature. Ces auteurs
considrent une situation de conflit inter-espces au sein de laquelle la slection naturelle
opre lentement un tri entre diffrents comportements. Cette slection est stimule par des
mcanismes dinteractions bilatrales et de reproduction asexue. Une interaction bilatrale
est modlise par un jeu non coopratif. Les individus nont pas le pouvoir de modifier leur
comportement au cours du temps : ils sont programms pour dployer la stratgie hrite de
leur parent. Lutilit obtenue lors dune interaction bilatrale mesure la capacit de cet
individu sadapter lenvironnement.
Ainsi, plus une stratgie dun individu savre efficace lors de diffrentes interactions
bilatrales engages avec chacun de ses opposants, plus ses chances de survie, et donc sa
capacit transmettre cette stratgie la gnration suivante, sont leves. partir de ce
point de vue, une solution est dfinie par une collection de stratgies dont la caractristique
principale est de rsister aux contraintes slectives de lvolution. Prcisment, il est exig,
dune part, que chacune de ces stratgies maximise le succs reproducteur de lindividu qui la
dploie compte tenu de la distribution des stratgies dans la population, dautre part, que cette
stratgie rsiste lintroduction de rares lments mutagnes dans la population. En somme,
la stabilit des comportements inter-espces est lexpression de la rsolution dune situation
conflictuelle dans un environnement stratgique. Cet article est lorigine de la branche
volutionnaire de la thorie des jeux qui a renouvel la recherche en mathmatiques de
lvolution du vivant et a stimul la recherche en sciences sociales sur les phnomnes de
mimtisme, de contagion des comportements, et plus gnralement sur les apprentissages
collectifs.
Le livre de Robert Leonard reconstitue avec brio en treize chapitres ce processus de
formalisation, de prennisation et dacceptation de la thorie des jeux au sein de la
communaut scientifique. Depuis le dbut des annes 1990, lauteur accumule et mobilise
intelligemment une documentation colossale sur ce thme. La spcificit de sa dmarche est
denchsser ce processus dans le contexte politique, social, culturel et scientifique des annes
1920. La dissolution de lAutriche-Hongrie en 1918, la monte en puissance du nationalsocialisme en Allemagne puis dans les pays de lEurope centrale, linfluence de personnalits
scientifiques telles David Hilbert et Karl Menger, la rsistance de lcole autrichienne librale
de Friedrich Hayek, Hans Mayer et Ludwig von Mises, limportance culturelle du jeu
dchecs dans les pays de lEurope centrale, le rle de la RAND Corporation dans
lintgration de la thorie des jeux au programme de dfense nationale sont autant dlments

que lauteur combine pour fournir une explication saisissante de lmergence de la thorie des
jeux. Face la richesse du travail prsent par Robert Lonard, nous insisterons sur deux
aspects. Le premier concerne linteraction entre lcole autrichienne et les mathmatiques. Le
second souligne quelques lignes de force ouvertes par louvrage de John von Neumann et
Oskar Morgenstern.
Lcole autrichienne et la thorie des jeux
Un pan de lhistoire institutionnelle de la thorie des jeux sest droul Vienne de la
fin des annes 1920 jusqu la fin des annes 1930. Cette priode correspond une phase
cruciale du dveloppement de lcole autrichienne jusqu son dclin. Ce courant de pense
prend sa source la fin du XIXe sicle dans les crits de Carl Menger, Professeur
lUniversit de Vienne, et pre du mathmaticien Karl Menger. Pendant les annes 1930,
lcole autrichienne a beaucoup influenc le discours sur les fluctuations conomiques, la
structure institutionnelle de lconomie capitaliste et la philosophie des sciences sociales.
Friedrich Hayek, laurat du prix de la Banque de Sude en sciences conomiques en mmoire
dAlfred Nobel pour ses travaux sur le rle de la monnaie dans les fluctuations conomiques,
est lun de ses principaux reprsentants.
Robert Leonard fait revivre cette priode intellectuelle foisonnante au cours de
laquelle ont merg les premiers travaux de John von Neumann en thorie des jeux, et les
dbats scientifiques entre conomistes autrichiens et mathmaticiens sur les fondements de
lconomique thorique. Nanmoins, le climat politique dltre de cette priode incitera
nombre de personnalits scientifiques migrer en Angleterre, comme ce fut le cas pour
Friedrich Hayek, ou aux tats-Unis, comme ce fut le cas pour John von Neumann, Oskar
Morgenstern, Karl Menger, ou encore Ludwig von Mises.
En 1928, Karl Menger organise le Mathematisch Kolloquium auquel participent
rgulirement le mathmaticien et logicien Kurt Gdel, le mathmaticien, conomiste et
conomtre Abraham Wald, Oskar Morgenstern et John von Neumann. Karl Menger fut, aux
cts de John von Neumann, lun des principaux instigateurs du dveloppement des
mathmatiques dans les sciences sociales. Lcole autrichienne dans son ensemble ayant
toujours refus dintroduire les mathmatiques, et plus spcifiquement le formalisme de
Hilbert, dans le discours scientifique, cest au sein de ce colloque que lapplication des
mathmatiques aux problmatiques des sciences sociales est discute. Karl Menger et Oskar
Morgenstern, tous deux issus du cercle de lcole autrichienne en conomie, partageaient une
mme vision de ltat de lconomie thorique dans les annes 1920 et des problmes majeurs
auxquels elle se devait de fournir une rponse.
Parmi ces problmes, apparaissaient comme fondamentaux ceux lis la prise de
dcision en prsence dincertitude, la formation des anticipations des agents conomiques,
la coordination des dcisions individuelles dans un environnement o linformation
pertinente, subjective, est disperse, aux effets des enchanements des dcisions sur la
structure du capital. Mais contrairement lcole autrichienne qui focalisait ses critiques sur
lcole no-classique, Karl Menger, Oskar Morgenstern et John von Neumann ont apport des
rponses ces problmes en dveloppant un nouveau programme de recherche pour la science
conomique. Selon James Buchanan (2001), laurat du prix de la Banque de Sude en
sciences conomiques en mmoire dAlfred Nobel pour ses travaux en thorie des choix
publics, la thorie des jeux est lune des cinq contributions majeures du sicle dernier en
sciences conomiques. Sensible aux thses de lcole autrichienne, il note cependant que la

perte dinfluence progressive de ce courant de pense est en grande partie due son refus
denvisager les mathmatiques comme moyen dinvestigation des questions conomiques.
Une large partie du livre de Robert Lonard est consacre aux discours de la mthode
en sciences conomiques, en mathmatiques et ses interactions. Outre les changes entre les
mathmaticiens et les conomistes autrichiens, Robert Lonard dtaille la manire dont les
mathmatiques pntrent dans les sciences conomiques. Un point important de cette histoire
est linfluence du programme de David Hilbert sur la pense de Karl Menger et John von
Neumann. Ce programme met en avant le traitement axiomatique de la thorie. En ce qui
concerne les mathmatiques, il sagissait, dune part, de formaliser le raisonnement propre
aux mathmatiques, dautre part, de dmontrer lindpendance et la non contradiction des
axiomes des thories mathmatiques. Lide dapprhender une thorie de manire
axiomatique a fait son chemin en thorie des jeux et en conomie mathmatique grce, tout
dabord, John von Neumann et Karl Menger, puis Lloyd Shapley, John Nash, Kenneth
Arrow et Grard Debreu.
John von Neumann et Oskar Morgenstern
Il est admis que John von Neumann est le principal contributeur des rsultats formels
contenus dans le livre Theory of Games and Economic Behavior. Parmi ces rsultats, trois ont
marqu la discipline : la caractrisation axiomatique de la rgle de dcision de lutilit
espre, le thorme du minmax pour les jeux deux joueurs somme nulle, et la dfinition
de lensemble stable pour les jeux de coalition plus de deux joueurs.
Supposons quun individu soit en mesure de classer des objets dun ensemble X laide dune
relation binaire R. Pour x et y de X, x R y signifie que cet individu prfre lobjet x lobjet y ou que
lobjet x domine lobjet y ; et le symbole non(x R y) signifie que x nest pas prfr y ou de manire
quivalente que x ne domine pas y. On dit quune fonction dutilit u valeurs dans lensemble des
nombres rels reprsente R si pour tout x et y de R on a :
x R y si et seulement si u(x) est suprieur ou gal u(y).
Cela signifie que le classement effectu par R peut tre reprsent par un classement dans lensemble
des nombres rels.
Rgle de dcision de lutilit espre
Supposons que X soit compos dun ensemble fini dobjets et que cet individu doive cette fois-ci
classer des distributions de probabilit p sur X, et non pas les lments de X, tout simplement parce
quil nest pas certain dobtenir les objets de X. Par exemple, considrons deux distributions de
probabilit p et q sur X = {a, b}. On dit que lindividu prfre p q sil prfre obtenir lobjet a avec
la probabilit p(a), donc obtenir lobjet b avec la probabilit complmentaire 1 - p(a), plutt que
dobtenir ces mmes objets avec la probabilit q(a) et 1 - q(a) respectivement. On notera P(X)
lensemble des distributions de probabilit sur X, et R cette relation sur P(X).
Le thorme de lutilit espre de von Neumann et Morgenstern fournit les conditions ncessaires et
suffisantes sous lesquelles il existe une fonction dutilit u sur X dont lesprance mathmatique
reprsente R : pour tout p et q dans P(X),
p R q si et seulement si S_x p(x) u(x) est suprieur ou gal S_x q(x) u(x),
o S reprsente lopration somme . Ces conditions ncessaires et suffisantes portent sur R ; ce
sont les axiomes, jugs intuitifs, que R doit satisfaire afin que la rgle de lutilit espre soit fonde
lors dune prise de dcision en environnement incertain.

Thorme du minmax
Supposons quil existe deux individus dont les intrts sont strictement conflictuels dans le sens o si
le premier individu choisit lobjet x et le second individu choisit lobjet y, alors lutilit du premier
individu est u (x, y) et lutilit du second individu est loppos de cette quantit, cest--dire u(x,
y), de telle sorte que la somme des utilits est nulle. Une telle situation conflictuelle est donc appele
un jeu somme nulle. Considrons le tableau suivant reprsentant les utilits u lorsque lensemble
des objets disponibles, appels actions ou stratgies, pour le premier individu est X = {a, b, c} et que
lensemble des stratgies disponibles pour le second individu est Y = {A, B, C} :
a
b
c

A
2
6
10

B
0
3
1

C
6
5
0

Ce tableau se lit comme suit : si le premier individu choisit laction a et le second individu choisit
laction A, alors lutilit retire par le premier individu est u(a, A) = 2, et lutilit retire par le
second individu est - u(a, A). Etant donn le choix du second individu, lintrt du premier individu
est de slectionner la stratgie, donc une ligne du tableau, qui maximise son utilit. Face un choix
du premier individu, lintrt du second individu est de choisir une stratgie, donc une colonne du
tableau, qui minimise lutilit du premier individu. Comment se comporteront ces deux individus ?
Le premier individu peut anticiper que le second individu choisira toujours la stratgie qui minimise
son utilit u puisque lutilit de ce dernier est - u. Donc, sil envisage de slectionner une quelconque
action w dans {a, b, c}, alors il est convaincu que le second individu choisira une stratgie y dans {A,
B, C} qui minimise u au point w :
u (w, y) = min u (w, z) sur les stratgies z dans Y.
Lintrt du premier individu est donc de chercher le maximum parmi les utilits u (w, y) en
slectionnant laction x dans X de telle sorte que :
u (x, y) = max [min u (w, z) ] = max u (w, y) sur les stratgies w dans X.
Le second individu appliquera un raisonnement similaire : son intrt est de minimiser les utilits u
(x, z) pour tout z dans Y, o :
u (x, z) = max u (w, z) sur les actions w dans X.
Il slectionnera donc une action y dans Y telle que :
u (x, y) = min [ max u (w, z) ] = min u (x, z) sur les actions z dans Y.
Une solution pour un jeu somme nulle est une paire dactions (x, y) telle que x est dans X, y est
dans Y et :
u (x, y) = min [ max u (w, z) ] = max [ min u (w, z) ].
Dans le tableau ci-dessus, la paire (b, B) procure une utilit de u (b, B) = 3 et ralise lgalit cidessus. En effet, si le premier individu dploie la stratgie a, lintrt du second individu est de
choisir B pour minimiser u (a, .) ; sil choisit b, alors le second individu choisira encore B pour
minimiser u (b, .) ; sil choisit c, le second individu choisira C pour minimiser u (c, .). Lobjectif du
premier individu est de slectionner laction qui maximise son utilit :
max {u (a , B), u, (b, B), u(c, C) } = max {0, 3}.

Il choisira donc b, et ainsi :


u (b, B) = max [ min u (w, z) ].
Si le second individu choisit A, lintrt du premier individu est de choisir c pour maximiser u (.,
A) ; sil choisit B, lintrt du premier individu est de choisir b pour maximiser u (., B) ; sil choisit C,
lintrt du premier individu est de choisir a pour maximiser u (., C). Anticipant cela, lobjectif du
second individu est de slectionner la stratgie qui minimise lutilit de son opposant :
min {u (c , B), u, (b, B), u(a, C) } = min {10, 3, 6}.
Il choisira donc B, et ainsi on aboutit :
u (b, B) = min[ max u (w, z) ].
Le thorme du minmax fournit des conditions suffisantes sur les ensembles X, Y et sur la fonction u
afin quun telle paire de stratgies existe. En effet, lexistence dun telle paire nest pas assure dans
chaque jeu somme nulle. Par exemple, on vrifie aisment que le jeu somme nulle reprsent par
le tableau suivant ne possde pas une telle paire de stratgies :
a
b

A
1
-1

B
-1
1

Ensemble stable
Un ensemble stable de X relativement une prfrence R est un sous-ensemble non vide S de X tel
que :
(a) Pour tout x et tout y de S, non(x R y) ;
(b) Pour tout x dans X situ hors de S, il existe y dans S tel que y R x.
La condition (a) est une condition de stabilit interne : deux lments de S ne se dominent pas lun
lautre, ils sont incomparables du point de lindividu qui a pour relation de prfrence R. La condition
(b) est une condition de stabilit externe : tout lment situ hors de S est domin par au moins un
lment de S. En particulier, si lindividu prfre un objet situ hors de S un objet situ dans S, alors
ce premier objet ne sera pas choisi par lindividu puisquil existe ncessairement un autre objet
appartenant S qui lui sera prfr. Les conditions de stabilit (a) et (b) sont les critres qui
permettent de justifier que les lments de S mergent comme des choix crdibles. Notons quil est
possible quun tel ensemble nexiste pas ou bien que plusieurs ensembles stables coexistent.
Lensemble stable a t appliqu en thorie des jeux coopratifs par von Neumann et Morgenstern,
mais il trouve galement des applications en thorie des jeux non coopratifs et dans dautres modles
formels de situations conflictuelles (cf. Greenberg 1990).

Le passage des jeux deux joueurs aux jeux un nombre quelconque de joueurs pose
la question du traitement de laction collective. En effet, ds que la possibilit de former
librement des accords de coopration est offerte des coalitions dindividus, la rpartition du
pouvoir au sein de la population se modifie en fonction de la structure des coalitions au sein
de la population. En dfinissant les jeux de coalition, John von Neumann et Oskar
Morgenstern se sont donns les moyens dtudier laction collective et ont interprt un
ensemble stable comme un ensemble de recommandations acceptables refltant un ordre
social. Cette conception dune solution comme un ensemble de recommandations acceptables
pour une socit a inspir la thorie des situations sociales Joseph Greenberg (1990). Ce

dernier prsente sa thorie comme plus gnrale que la thorie des jeux, unificatrice des
reprsentations et solutions pour les formes coopratives et non coopratives de la thorie des
jeux.
Robert Lonard met parfaitement en scne le moment de cration de louvrage Theory
of Games and Economic Behavior, les changes scientifiques entre John von Neumann et
Oskar Morgenstern, le rle pris par chacun deux dans le processus de cration des concepts
et solutions, ainsi que la rception de louvrage dans le milieu acadmique. Dans le dernier
chapitre de son ouvrage, il met laccent sur le rle de la Rand Corporation dans le processus
dinstitutionnalisation de la thorie des jeux. La Rand Corporation, cre en 1948, est une
institution but non lucratif daide la dcision dans les secteurs de la scurit nationale, du
droit international, de la sant et de lducation. Des ingnieurs, des physiciens, des
conomistes, des psychologues, des mathmaticiens collaborent travers diffrents projets
pour amliorer le bien-tre et la scurit des tats-Unis. La Rand Corporation a
immdiatement peru le potentiel oprationnel de la thorie des jeux pour traiter des situations
conflictuelles. Aux cts de John von Neumann, des mathmaticiens et thoriciens des jeux
tels Richard Bellman, David Blackwell, John Nash, Herbert Scarf, Lloyd Shapley ont
collabor aux projets de cette institution. De mon point de vue, ce dernier chapitre est le
moins russi de louvrage. Robert Leonard ne met pas suffisamment en lumire limpact des
travaux de John Neumann et Oskar Morgenstern sur le dveloppement de la thorie des jeux
dans les annes 1950. Il me semble que les travaux de Lloyd Shapley durant cette priode sont
un bon exemple de continuit des travaux de von Neumann et Morgenstern. En 1953, Lloyd
Shapley a produit deux rsultats majeurs. Il a tout dabord tendu lanalyse des jeux somme
nulle des situations dynamiques et de facto a ouvert la voie ltude des situations
conflictuelles rptes, un thme majeur de la thorie des jeux. Il a ensuite fourni la solution
la plus populaire pour les jeux de coalitions, la valeur de Shapley . Dans ces deux
contributions, les rfrences louvrage Theory of Games and Economic Behavior sont
explicites. On peut mme pousser lanalyse plus avant en notant que la valeur de Shapley
partage plusieurs caractristiques avec les travaux de John von Neumann et Oskar
Morgenstern :
-

La valeur de Shapley est introduite de manire axiomatique, comme la thorie de


lutilit espre.
Alvin Roth (1977), colaurat avec Lloyd Shapley du prix de la Banque de Sude en
sciences conomiques en mmoire dAlfred Nobel, a montr que la valeur de Shapley
peut tre vue comme une fonction dutilit espre de type von Neumann et
Morgenstern.
La valeur de Shapley tient compte du pouvoir de chaque individu dans les coalitions
auxquelles il peut appartenir. Elle peut dailleurs tre mobilise pour mesurer le
pouvoir dun lecteur dans une assemble politique.
Elle satisfait des proprits intuitives de justice distributive.
Elle admet une reprsentation dynamique et marginaliste, deux aspects importants dans
les thses de lcole autrichienne au mme titre que la prise de dcision en
environnement incertain. Prcisment, pour chaque ordre de formation squentielle de
la grande coalition, la valeur de Shapley rmunre chaque individu hauteur de sa
contribution marginale la coalition quil rejoint relativement cet ordre.
La valeur de Shapley est une solution oprationnelle pour des problmes dimputation
de cots, de rpartition de profits, de mesure de pouvoir.

Plus gnralement, ce dernier chapitre ne met pas suffisamment en avant linfluence


des lignes de force ouvertes par louvrage de 1944 sur les travaux des annes 1950 et du dbut
des annes 1960. Malgr le sentiment mitig laiss par ce chapitre, il faut souligner encore
une fois lexcellent travail historique effectu par Robert Leonard. Il sagit dun ouvrage
rfrence sur lhistoire de la thorie des jeux, dont je conseille la lecture sans aucune rserve.
Rfrences
Buchanan J. M. (2001), Game Theory, Mathematics, and Economics, Journal of Economic
Methodology, 8 :27-32.
Greenberg J., The Theory of Social Situations: An Alternative Game-Theoretic Approach, Cambridge
University Press, Cambridge, 1990.
Maynard Smith, J., Price G (1973), The Logic of Animal Conflict, Nature, 246:15-18.
Roth, A. (1997), The Shapley Value as a von Neumann-Morgenstern Econometrica, 45 :657-664.
Shapley L. (1953) A Value for n-Person Games, in Contribution to the Theory of Games vol. II (H.W.
Kuhn and A.W. Tucker eds). Annals of Mathematics Studies 28, Princeton University Press.
Shapley L. (1953) Stochastic Games. Proceedings of the National Academy of Sciences, 39 :10951100.

Publi dans laviedesidees.fr, le 31 dcembre 2014


laviedesidees.fr

Vous aimerez peut-être aussi