Académique Documents
Professionnel Documents
Culture Documents
La thorie
de la dcision
Nouvelle dition
ditions La Dcouverte
9 bis, rue Abel-Hovelacque
75013 Paris
DU MME AUTEUR
Si vous dsirez tre tenu rgulirement inform de nos parutions, il vous suffit
denvoyer vos nom et adresse aux ditions La Dcouverte, 9 bis, rue Abel-
Hovelacque, 75013 Paris. Vous recevrez gratuitement notre bulletin trimestriel
la Dcouverte.
3
rcemment, sur les problmes de gestion, mais aussi sur les
fondements psychologiques de la reprsentation du
comportement.
Un des objectifs principaux du dveloppement de cette
thorie est de trouver un cadre de rfrence pour les thories
conomiques et les modles de gestion des entreprises,
publiques ou prives. Comment dcrire le comportement
dagents conomiques ? Quelle dcision prendre dans le cadre
dune gestion rationnelle des ressources et des moyens de pro-
duction ? Comment investir dans des actifs financiers dont les
rendements sont incertains ? Comment infrer des paramtres
dune distribution de probabilits partir dun chantillon ?
Ces problmes de dcision ont motiv le dveloppement de la
thorie prsente dans cet ouvrage.
Confronts un problme de dcision, nous commenons
par en extraire quelques grandes lignes, simplifiant pour y voir
clair, tout en gardant la facult de revenir sur les simplifica-
tions lorsque nous voyons quelles restreignent notre analyse.
La thorie ne procde pas autrement.
La formalisation dun problme de dcision, cest--dire la
description de ses lments par des valeurs, des fonctions, des
graphes, correspond une simplification qui permet dutiliser
des outils et des rsultats mathmatiques. Nous prsentons aux
chapitres II et III un certain nombre dexemples de problmes de
dcision pour mieux comprendre comment les formaliser.
Cette formalisation faite, la prise de dcision proprement dite
utilisera un ou plusieurs critres. Les plus couramment utiliss
sont prsents au chapitre IV. Historiquement, ces critres ont
t trouvs de manire pragmatique, en statistique et en calcul
conomique notamment. Nombreux sont ceux qui nont tou-
jours pas trouv de thorie qui en justifie lusage. Cest pour-
quoi la thorie de lutilit espre mrite dtre prsente en
dtail (chapitre V) comme le premier exemple achev dune
thorie de la reprsentation du comportement de dcideurs face
au risque. Cette thorie a permis dlaborer des analyses de
laversion pour le risque et des mesures du risque (chapitre VI).
Dautres thories, complmentaires, concurrentes ou plus
gnrales, ont t dveloppes (chapitre VIII). Cest surtout
depuis 1990 quil est possible de mieux voir les liens entre ces
diffrentes thories dont les applications font lobjet de
recherches actives.
4
Ces thories utilisent des rsultats de la thorie des probabi-
lits qui permet de dcrire et de quantifier des expriences ala-
toires. Mais le calcul des probabilits ncessite des donnes qui
sont tires des observations ( la probabilit que le taux de
change du dollar face leuro augmente dans les trois pro-
chains mois sera estime partir des fluctuations de ce taux
observes par le pass). Cest lobjet de la statistique de nous
donner les moyens dextraire de tels paramtres des rsultats
observs. Le chapitre VII est consacr au problme de la dci-
sion statistique qui est la fois un problme de dcision et une
application de la reprsentation de lincertitude par la thorie
des probabilits. Si la statistique fait partie de la mathmatique
au mme titre que la thorie des probabilits, les critres qui y
sont utiliss doivent reposer sur les thories de la reprsenta-
tion du comportement face lincertitude. partir dobserva-
tions de variables considres comme alatoires, le statisticien
infre des valeurs caractristiques (comme la moyenne) des lois
de probabilits qui rgissent ces observations. Par exemple,
partir dun chantillon de votants pris au hasard, on estime le
nombre moyen des intentions de vote pour un candidat. Cette
infrence est une dcision, elle dpend de la mthode et du cri-
tre utiliss par le statisticien, critres que la thorie de la dci-
sion pourra lui permettre de justifier (auprs de ses
commanditaires, notamment).
Ltude des jeux a t le point de dpart de la thorie des
probabilits, donc, en partie, de la statistique, de la thorie de la
dcision individuelle, et, bien sr, de la thorie des jeux. Cette
dernire a connu un essor considrable depuis louvrage de von
Neumann et Morgenstern en 1944, formant ainsi une thorie en
tant que telle ; elle est une branche des mathmatiques appli-
ques. Bien que la thorie de lutilit espre ait t deve-
loppe prcisment pour cela, la reprsentation du
comportement individuel a jou un rle assez restreint en
thorie des jeux jusquaux annes quatre-vingt o ltude de la
rationalit dans les jeux lui a donn une nouvelle place. Nous
ne ferons quvoquer dans la conclusion cette thorie qui peut
pourtant tre considre comme faisant partie de la thorie de
la dcision puisquelle sintresse aux comportements strat-
giques des dcideurs face dautres dcideurs. Lampleur, la
porte et les applications des rsultats de la thorie des jeux
dpassent largement les objectifs de cet ouvrage qui se
consacre laspect individuel des dcisions. Laspect
5
stratgique, parce quil fait prendre en compte par chaque dci-
deur les dcisions des autres, fait appel des notions de solu-
tions de problmes, de conflits, ou des concepts dquilibre, il
ne concerne pas les problmes de dcision individuels propre-
ment dits, ceux qui font lobjet de la thorie aborde ici.
La thorie de la dcision se trouve lintersection de nom-
breuses disciplines : conomie, gestion, psychologie, statis-
tique et mathmatique. Lintrt des mathmaticiens pour la
formalisation de lincertitude et de la solution des jeux a t
dterminant pour lmergence de cette thorie et des outils
quelle utilise. Un aperu de lhistoire de la thorie est trac
dans le premier chapitre. Mais le besoin dune thorie du
comportement rationnel pour les modles de lconomie et de
la gestion a t la raison de son succs et des dveloppements
qui continuent voir le jour. Cette perspective est mise en
valeur dans le premier chapitre et guide la progression des cha-
pitres ultrieurs.
I / Rationalit des choix :
perspectives et origines de la thorie
7
contextes gopolitiques (blocus, guerres) et surtout les compor-
tements des diffrents acteurs conomiques. Cela ne doit pas
ncessairement faire abandonner lapproche quantitative sous
le prtexte que toute quantification serait rductrice et partiel-
lement arbitraire. Un des objets de la thorie de la dcision est
de donner les moyens de construire des descriptions quanti-
fies des problmes, ainsi que des critres, qui permettent dy
apporter des solutions. Bien entendu, le calcul du prix de vente
dun robot mnager, partir des cots de production et dune
estimation de la demande de ce produit, se prte mieux une
tude quantitative que le choix dun nouveau directeur
commercial. Cependant, avec un degr appropri de forma-
lisme, en restant conscient des limites de validit des critres,
en examinant de manire critique les solutions proposes, il est
souvent profitable dutiliser les mthodes dveloppes par la
thorie de la dcision, avant darrter le choix final.
8
Les choix conomiques dans les entreprises, publiques et
prives, ont commenc tre traits de manire systmatique-
ment scientifique dans les annes cinquante. Le calcul cono-
mique sadresse en particulier aux problmes de choix de
facteurs de production en fonction de leurs cots, de choix de
prix de vente dun produit, dvaluation des salaires, etc. 1 Il a
pu voir le jour grce au dveloppement de la thorie cono-
mique qui fournit un cadre appropri la formalisation des pro-
blmes, aux mthodes conomtriques permettant de traiter les
donnes et aux rsultats de la recherche oprationnelle pro-
posant des mthodes mathmatiques de rsolution.
Recherche oprationnelle
9
tions des dcideurs. Lorsque lon veut assurer un bien contre
un risque de destruction, deux lments fondamentaux sont
estimer : la valeur du bien ou son cot de remplacement, dune
part, limportance et la vraisemblance des vnements qui pr-
sentent des risques, dautre part. De mme, pour dcider de la
formation dun portefeuille, les rendements des actifs, mais
aussi les variabilits de ces rendements, doivent tre pris en
compte.
Cest lobjet principal de la thorie de la dcision indivi-
duelle que de proposer un cadre dtude du comportement
rationnel face lincertitude. En distinguant diffrents types
dincertitudes, des thories adaptes sont proposes pour repr-
senter les comportements de dcideurs qui vrifient certaines
conditions. La thorie la plus acheve concerne les situations
o lincertitude porte sur des variables dont la distribution de
probabilit est connue : une compagnie dassurances a estim
que la probabilit de destruction dune automobile durant
lanne venir est de 5 % ; le taux de rendement moyen dun
actif financier est estim 9 % avec une variabilit (mesure
par lcart moyen autour de 9 %) de 15. Ces estimations sont
faites sur la base dobservations des variables passes, ven-
tuellement corriges par des informations concernant le futur.
Cest ce type dincertitude quest gnralement rserv le
terme de situations de risque. La thorie qui a domin les
tudes de risques, depuis son apparition en 1944, est la thorie
de lutilit espre (chapitre V). Elle a permis de dfinir un cer-
tain nombre de mesures du risque qui ont servi tant en thorie
de lassurance quen conomie de lincertain en gnral. Mais
elle prsente de graves limites qui ont conduit chercher
dautres thories dont lmergence date des annes quatre-vingt
et qui nont pas encore trouv toutes les applications que lon
peut en attendre.
Les thories du risque stendent certaines situations o
lincertitude nest pas probabilise et o lestimation des
risques doit garder un caractre subjectif. Cest le cas de pro-
blmes dinvestissement dans une activit mal connue, de
recherche de minerais dans une rgion non prospecte, et,
dune manire gnrale, de paris sur une variable alatoire dont
les ralisations ne peuvent pas tre observes (comme les paris
sportifs, par opposition aux loteries).
Les problmes dassurance font aussi intervenir, au point de
vue individuel, un risque relatif aux comportements des
10
assurs : lassureur prend en compte la frquence des acci-
dents passs, mais il doit aussi prendre en compte le comporte-
ment (les prcautions, les activits) de lassur. Ce dernier peut
fort bien prendre beaucoup moins de prcaution sil est assur
que sil ne ltait pas (ce problme est connu sous le nom de
risque moral ). Il peut aussi prtendre un contrat qui ne
correspond pas au type de risque que son activit lui fait courir
(ce problme est connu sous le nom dantislection 2). Dans
tous les cas, du fait quil y a plusieurs parties dans un contrat,
un lment de lincertitude concernant chacune des parties pro-
vient du comportement des autres.
11
mettant la place de ses opposants, peut chercher trouver une
dcision pour chacun qui soit telle quaucun ne puisse indivi-
duellement mieux faire si les autres ne dvient pas. Ce type de
raisonnement ne peut se faire que sur la base dune description
du jeu qui soit une connaissance commune de tous les joueurs ;
il suppose de plus que chacun des joueurs raisonne de la mme
manire et adopte un comportement rationnel.
La thorie de la dcision regroupe donc un ensemble de
mthodes danalyse et de rsolution de problmes de dcision.
Cet ensemble peut parfois paratre htroclite du fait que les
mthodes dpendent de lenvironnement des problmes traits.
Ce qui en fait UNE thorie, cest que ces diffrentes mthodes
sont construites en utilisant la mathmatique, non seulement
pour son langage et sa logique, mais aussi pour sa construc-
tion : partant dlments de base (les dcisions possibles, les
prfrences), des axiomes sont proposs (sur le comporte-
ment des dcideurs) partir desquels la thorie est construite.
Bien que la thorie de la dcision ait les mmes origines que
la reprsentation de lincertitude, cette dernire a connu une
formalisation plus universelle qui a donn lieu la formation
dune thorie purement mathmatique : la thorie des
probabilits.
12
dans les jeux utilisant des ds ou des cartes, lincertitude porte
aussi sur des numros ou des figures tirs au hasard. Les
loteries, lotos ou jeux de roulette des casinos sont des jeux o
les consquences des choix (paris) des joueurs ne dpendent
que des rsultats du mcanisme utilis, rsultat qui est suppos
ne pas tre manipul.
Ltude des jeux de socit, considrs comme des formali-
sations de situations de dcisions relles, a t le point de
dpart (XVIIe et XVIIIe sicles) de la thorie de la dcision, ainsi
que celui dune formalisation mathmatique de lincertitude,
qui devait devenir la thorie des probabilits. Le vritable
dveloppement de cette thorie mathmatique devait venir, au
XIXe sicle, des recherches en physique, dune part, et de ltude
des statistiques sociales et conomiques, dautre part. La
thorie des probabilits est dsormais une branche de la math-
matique ; la statistique mathmatique en est un dveloppement
dans lequel les techniques statistiques trouvent leurs fonde-
ments. Aussi, autant que faire se peut, la thorie de la dcision,
telle quelle est apparue dans les annes cinquante, se rfre
ces thories en utilisant leur formalisation de lincertitude. Un
petit exemple classique en thorie des probabilits peut aider
comprendre comment cette thorie et son formalisme peuvent
aider prendre des dcisions.
Supposons que vous soyez dans une salle avec un certain
nombre de personnes et quun individu vous aborde et parie
avec vous cent euros quil y a dans cette salle au moins deux
personnes ayant la mme date danniversaire. Une fois sr que
lindividu ne connat pas plus que vous les personnes prsentes,
tiendrez-vous le pari ? Cela dpend, bien sr, du nombre de
personnes dans la salle ; on ne doute pas quil y ait plus de
chance de trouver deux personnes ayant la mme date danni-
versaire parmi cent personnes que parmi cinq. Le calcul des
probabilits permet de calculer prcisment que la probabilit
de trouver deux personnes ayant la mme date danniversaire
est de 0,0027 sil y a deux personnes prsentes ; de 0,11, si le
nombre de personnes est 10 ; de 0,42, sil y a 20 personnes ; de
0,50 (le pari est donc quivalent dans ce cas un jeu de pile
ou face !) si le nombre de personnes est 23 ; de 0,97, sil y a
50 personnes (vous tes quasiment sr de perdre !).
Mais le fait quune thorie mathmatique existe ne signifie
pas que toutes les situations dincertitude puissent sexprimer
13
selon le formalisme probabiliste 3. En outre, pour chaque pro-
blme de dcision, restent les difficults dinterprtation du for-
malisme qui reprsente lincertitude telle quelle est perue par
le dcideur.
Cest en concurrence avec llaboration de thories cono-
miques quont t poss de nombreux problmes dinterprta-
tion de lincertitude dans les problmes de dcision. En
particulier, John Keynes [1921]* a favoris une interprtation
selon laquelle toutes les probabilits sont conditionnelles et
dfinies par des relations ordinales entre les vnements.
Ramsey [1931], puis De Finetti [1930] et Savage [1954], en
critiquant le point de vue frquentiste (les probabilits des v-
nements sont les frquences de leurs apparitions dans une exp-
rience alatoire rpte), ont considr les lois de probabilits
comme des reprsentations des jugements des dcideurs sur la
confiance quils accordent la ralisation des vnements. Une
telle interprtation conduit une notion de probabilits subjec-
tives qui ne sont dfinies que dans le contexte de problmes
de dcisions individuels. Les deux notions, frquentistes et sub-
jectivistes, peuvent cependant tre juxtaposes (Anscombe,
Aumann [1963]) : les probabilits objectives des vne-
ments dune exprience alatoire (loterie) pouvant tre utilises
pour talonner les probabilits subjectives dvnements
dont lapparition ne peut, ou na pas pu, tre observe.
14
appuys la fois et la plupart des recherches en conomie de
lincertain, et la plupart des mthodes daide la dcision.
Comme lindique le titre de louvrage de Luce et Raiffa, il
sagit tout dabord de prsenter les rsultats fondamentaux de
la thorie des jeux alors toute rcente, puisquelle a vu le jour
sous sa forme moderne durant la Seconde Guerre mondiale (ses
concepts de solution des problmes de dcision en situations
de conflit devaient leur importance lactualit militaire). Mais
la thorie des jeux elle-mme requrait une thorie de la repr-
sentation du comportement individuel : cest la thorie de luti-
lit espre propose par von Neumann et Morgenstern [1944].
La notion dutilit espre (chapitre V) avait t propose ds le
XVIIIe sicle par Daniel Bernoulli ; elle navait pas t beaucoup
exploite depuis lors, essentiellement parce que les modles
conomiques se limitaient au cadre de dcisions sans incerti-
tude. Elle ntait cependant pas trangre certains cono-
mistes qui utilisrent la notion de fonction dutilit des
consquences (au lieu de comparer les consquences elles-
mmes) ainsi que la proprit de cette fonction dtre margina-
lement dcroissante : la satisfaction saccrot moins en ajoutant
un euro mille euros, quen ajoutant un euro dix euros.
Paralllement la formalisation de la thorie des jeux, un
certain nombre de techniques mathmatiques (programmation
linaire et, plus gnralement, techniques doptimisation de cri-
tres) ont permis la thorie de la dcision dtre applique
avec succs. Par ailleurs, la statistique, en devenant une thorie
mathmatique qui sappuyait sur la thorie des probabilits,
cherchait faire reposer ses mthodes dinfrence sur une
thorie : la dcision statistique (chapitre VII). Ce furent Wald
[1950], puis Savage [1954] qui firent le lien entre les fonde-
ments de la statistique, des probabilits et des dcisions.
Historiquement, ces thories sont intimement lies. Cest au
XVIIe sicle, puis au XVIIIe sicle que les philosophes-mathma-
ticiens se penchrent sur les problmes poss par les jeux de
hasard. Le chevalier de Mr (1607-1684), philosophe, homme
de lettres et joueur invtr, fut un des premiers poser des
problmes de dcision en termes scientifiques et chercher
les rsoudre dans le cadre simple des jeux de hasard. Un de
ces problmes consistait faire parier contre lapparition dau
moins un six en jetant quatre ds. Le chevalier de Mr russit
calculer que sa probabilit de gagner au jeu prcdent (la pro-
babilit quapparaisse au moins un six) tait lgrement
15
suprieure 1/2, ce qui lui donnait, en y jouant souvent, un
avantage suffisant pour gagner long terme sans que ses parte-
naires ne ralisent que le jeu leur tait dfavorable. Cest sur
le mme principe que sont construits les jeux proposs dans les
casinos qui, tout en laissant aux joueurs une probabilit assez
importante de gagner, assurent, long terme, un revenu certain
la direction.
Le chevalier de Mr se posait des problmes de dcision
dune manire qui exprimait le besoin dune thorie. Ainsi le
problme des partis (on dirait aujourdhui partages) rsolu par
Pascal : on considre un jeu de pile ou face, rpt, deux
joueurs, o le premier joueur avoir gagn N fois (N est un
nombre fix avant que la partie commence) ramasse la totalit
de la mise initiale. Le problme est alors le suivant : supposons
que le jeu soit interrompu et quil manque m parties pour que
le joueur A gagne et n parties pour que le joueur B gagne,
comment rpartir la mise quitablement ?
La solution propose par Pascal suppose que le partage est
quitable si les sommes perues par chacun des joueurs sont
proportionnelles leurs chances de gagner. Ce critre est
l esprance du gain ; il avait t dfini par Huygens dans
son essai, De la logique du jeu de ds, en 1637, avec linterpr-
tation du juste prix auquel un joueur accepterait de cder sa
place dans une partie . Lutilisation de ce critre ncessitait de
savoir calculer les chances ; ce furent les premiers calculs
de probabilits. Problmes de dcision, jeux et calcul des pro-
babilits restrent trs lis au sicle suivant : Montmort, Essai
danalyse sur les jeux de hasard (1708) ; de Moivre, La Doc-
trine des chances (1730) ; Jacques Bernoulli, LArt de la
conjecture (1713), qui trouva la premire loi des grands
nombres, et son neveu Daniel, Expos dune thorie nouvelle
de lvaluation du risque (1738). Daniel Bernoulli peut tre
considr comme le pre de la thorie de la dcision moderne
puisquil fut le premier proposer le critre de l esprance
de lutilit du gain , sur lequel nous reviendrons en dtail au
chapitre V. Mais pour se dvelopper plus avant, lanalyse des
problmes de dcision avait besoin de mathmatiques qui res-
taient dcouvrir. La thorie des probabilits fut dveloppe
par Poisson (qui dcouvrit aussi une loi des grands nombres en
1837 et imposa ce terme), puis par Laplace (Thorie analy-
tique des probabilits, 1812) et Gauss (Thorie de la combi-
naison derreurs de faibles amplitudes, 1821) qui dcouvrirent
16
la fameuse loi de Laplace-Gauss, aussi appele loi normale. Il
fallut tout un sicle pour gnraliser les lois des grands
nombres, et pour cela le dveloppement des thories de lint-
grale (Riemann en 1867, Lebesgue en 1901, pour les plus
connues).
La thorie des probabilits prit sa forme acheve en 1933
(Kolmogorov, pour un fondement analytique, mais von Mises
avait propos un fondement statistique en 1919). Elle continue
de se dvelopper, mais ds cette poque ses applications aux
statistiques (qui devaient aussi former une thorie mathma-
tique), la thorie des jeux et la thorie de la dcision allaient
devenir la norme.
17
Ltude de la plupart des dcisions conomiques ne peut se
traiter sur la seule base du comportement individuel puisque les
interactions entre les agents entrent en jeu. Des agents
rationnels doivent donc tre dcrits en tenant compte du fait
quils sont conscients de ces interactions entre leurs objectifs
et ceux des autres agents. Les dveloppements rcents de la
thorie conomique, la thorie de lorganisation industrielle
notamment, font donc une large place la thorie des jeux dont
lobjet est ltude des interactions des diffrents joueurs. Nous
nen traitons pas ici, faute de place, nous contentant dexposer
les diffrents lments des problmes de dcision qui nous per-
mettront de donner un sens prcis la notion de rationalit
individuelle.
II / Comment formaliser
un problme de dcision
19
comportement rationnel consistera alors choisir une dcision
qui optimise les critres reprsentants le comportement du dci-
deur dans la situation dcrite par le modle.
Dans le chapitre suivant, nous traiterons en dtail dun pro-
blme particulier. Nous nous limitons ici faire apparatre les
diffrents lments qui interviendront dans la thorie. Nous le
faisons travers le problme du choix dinvestissement tel
quil est prsent dans la littrature conomique. Cest un pro-
blme qui est ais formaliser mathmatiquement. En effet,
comme nous allons le voir, les diffrents lments que lon
retrouve dans tous les problmes de dcision dans lincertain y
sont prsents et ils sont dj exprims en termes quantifis. Les
choix portent en effet sur des quantits : les quantits investies
dans diffrents actifs. Les consquences de ces choix sont
quantifies aussi : ce sont des revenus futurs ou des rende-
ments. Cette formalisation naturelle nempche pas que, dans
la pratique, ces choix soient souvent faits sans le support dune
thorie. En revanche, linterprtation de ces choix en termes de
dcisions rationnelles peut servir les justifier face, par
exemple, un conseil dadministration. Dans certains cas de
problmes dinvestissement complexes, ou dans le cadre dune
thorie conomique des choix dinvestissements, le choix
rationnel pourra sappuyer sur loptimisation de critres dfinis
par la thorie de la dcision.
20
cest ce que vous avez pu observer sur les cours de la Bourse
depuis un an, en comparant les cours de trois mois en trois
mois. Les cours des diffrents titres ne varient pas tous autant
ni de la mme manire ; il faudrait prciser cela pour pouvoir
les comparer. En faisant la diffrence du cours dun actif une
certaine date et de son cours trois mois plus tard, vous obtenez
son rendement. En divisant ce rendement par le cours initial,
vous obtenez le taux de rendement trois mois. Vous voyez
ainsi, par exemple, que, pendant les trois derniers mois, les taux
de rendement de tous les titres sont ngatifs ! Si cet tat de
chose devait durer il ne faudrait sans doute pas investir dans
ces titres et placer lintgralit des 100 000 euros en bons. Ce
nest pas ce que vous conseille votre oncle qui ne place que
10 000 euros en bons, 50 000 euros en Alfath, dont le taux de
rendement les trois derniers mois est le plus ngatif, et
20 000 euros en Btard et en Gammage, dont les taux sont dif-
frents, mais moins levs que celui de Deltham dans lequel il
ninvestit pas. Votre oncle nest pas un thoricien de la dci-
sion, mais se flatte davoir du nez. Toutefois, sa dcision,
cest--dire son choix de portefeuille, peut tre explique si
nous nous donnons la peine de formaliser ce quil fait intuiti-
vement. Il ne fonde pas sa dcision sur la seule observation des
taux de rendement sur les trois derniers mois, mais sur les
variations des cours sur une priode bien plus longue. De cette
observation, on peut retenir que le taux de rendement dAlfath
varie irrgulirement autour dune valeur moyenne que vous
pouvez calculer : cest 8 %. Les deux autres titres retenus par
votre oncle ont des taux moyens de 5 % et de 6 % respective-
ment. Mais pourquoi a-t-il cart le titre Deltham de son porte-
feuille alors que son taux moyen est de 7 % et que, pendant la
dernire priode, il tait, 1 %, le plus lev ? Il vous dit
quil na pas confiance, et, en regardant les cours passs, vous
observez que leur variabilit a, en effet, une ampleur qui
dpasse largement celle des autres titres. En revanche, il
semble que la variabilit de Btard et de Gammage soit trs
faible. Afin de vous fixer les ides, vous pouvez calculer les
carts (pris positivement) entre les taux calculs chaque jour et
le taux moyen. Pour rsumer cette srie, vous pouvez en faire
la moyenne. Vous trouvez des nombres positifs, appels carts
positifs moyens, qui sont une mesure de la variabilit. Vous
trouvez 25 pour Deltham, 20 pour Alfath, 10 pour Gammage et
9 pour Btard. Nous pouvons alors imaginer quintuitivement
21
votre oncle a pris une dcision qui sexplique par le raisonne-
ment suivant : Alfath et Deltham peuvent rapporter gros, mais
ils varient beaucoup, donc je ninvestis pas tout dedans car
jaurai besoin de liquidits dans trois mois. Pour assurer un
minimum, je place une partie en bons. Comme on constate
aussi quils varient peu prs dans le mme sens (leurs taux
sont fortement corrls), il vaut mieux tout concentrer sur
Alfath qui a un taux moyen suprieur et une variabilit lgre-
ment moindre. (Remarquons ce point que tout le monde ne
fait pas le mme raisonnement que votre oncle car sinon le
cours de Deltham seffondrerait.) Quant aux deux autres titres,
ils varient si peu quil y a peu de risque de perte, et leurs taux
de rendement sont tout de mme suprieurs ceux des bons :
jen prends aussi.
En rsum, le rendement du portefeuille dans trois mois
dpendra de sa composition : les quantits investies dans
chacun des actifs, cest la dcision quil faut prendre. Il
dpendra aussi des cours dans trois mois ; ceux-ci sont
inconnus et difficilement prvisibles part celui du bon du
Trsor qui est sans risque. Les titres autres que le bon prsen-
tent un risque qui est li leur variabilit. Ce risque peut tre
tudi sur la base de lobservation des cours passs. En rsu-
mant la variabilit par quelques nombres indicatifs, il est pos-
sible de comparer les rendements possibles. Cela ne suffit pas
dterminer totalement la dcision, puisque ces indicateurs
devront tre complts par le montant du capital initial, des
besoins de liquidit finale, et dune attitude personnelle vis-
-vis du risque. Tout le monde prfre le rendement (la cons-
quence de la dcision) le plus lev, mais tous les gens qui ont
accs aux mmes informations (les indicateurs de rendement
moyen et de variabilit, entre autres) ne prennent pas les
mmes dcisions : le classique pre de famille prudent pla-
cera son capital en bons et peut-tre sur Btard et Gammage ;
votre oncle, qui ne craint pas le risque, prfre parier assez gros
sur Alfath.
Cet exemple a introduit les lments qui serviront forma-
liser un problme de dcision. Nous le reprenons sous la forme
plus abstraite que lon trouve dans les manuels de finance.
Un portefeuille est une liste de quantits dactifs dtenus par
un investisseur. Le problme de choix de portefeuille consiste
donc dcider des proportions dun certain capital donn que
linvestisseur allouera chacun des actifs de la liste. Les prix
22
de ces actifs sont supposs connus. De ce fait, la liste des pro-
portions du capital investi dfinit compltement le portefeuille.
Un portefeuille sera dfini par une liste : xa, xb, xg, xd, x0 des
proportions du capital investi dans chacun des cinq actifs 1 dis-
ponibles dans notre exemple. Le choix de portefeuille consiste
donc dcider dun vecteur (une liste de nombres) cinq
composantes (ici). Le premier lment du problme de dci-
sion est donc aisment formalis : lensemble des dcisions
possibles est une partie de lensemble des vecteurs cinq
composantes.
Quelles sont les consquences possibles du choix dun porte-
feuille ? Admettons, pour simplifier, que linvestissement se
fasse sur un horizon fix, date laquelle chacun des actifs pro-
curera un rendement, et soit ri le rendement de lactif appel i.
cette date le portefeuille procurera le rendement :
r = xara + xbrb + xgrg + xdrd + x0 0,4. Ce nombre est la cons-
quence du choix de portefeuille. Cest en fonction des cons-
quences que les dcisions sont prises puisque la comparaison
entre diffrents portefeuilles possibles se fera partir de la
comparaison des rendements quils peuvent procurer. La dfi-
nition de lensemble des consquences possibles et leur forma-
lisation sont gnralement une des tches les plus dlicates de
la formalisation dun problme de dcision. Dans le problme
du choix de portefeuille nous voyons que cela ne prsente pas
de difficult ds que les rendements possibles des actifs sont
bien dfinis.
Si ces rendements taient connus sans incertitude, le pro-
blme de dcision serait extrmement simple rsoudre, les
investisseurs tant supposs prfrer les rendements levs. Le
choix rationnel simpose donc : linvestisseur investira tout son
capital dans lactif de plus haut rendement sil est unique et,
sil y en a plusieurs, indiffremment entre les actifs qui ont le
mme rendement maximal. Mais les rendements sont gnrale-
ment incertains et les consquences du choix dun portefeuille
sont les diffrentes valeurs que peut prendre son rendement.
Rappelons les lments dun problme de dcision que le
problme de choix de portefeuille nous a permis de formaliser.
1. Dont les lettres grecques des indices rappellent les noms des actifs de
lexemple part le dernier !
23
Lensemble des dcisions possibles. Cet ensemble sera
dtermin par les objets de choix possibles, ici les portefeuilles,
cest--dire des vecteurs de cinq nombres. Autant que possible,
il sera reprsent par un ensemble de nombres ou de vecteurs
ayant les proprits mathmatiques ncessaires pour pouvoir
appliquer les rsultats de la thorie du contrle.
24
les autres exemples de problmes de dcision classiques que
nous prsentons prsent.
25
commencer un traitement peut donc tre fatale. Les dcisions
ont donc deux composantes : analyses (oui ou non), type de
traitement (premier, deuxime, aucun).
3. Arbres de dcision
26
ARBRE DE DCISION
27
paris, qui ont servi dabstraction pour ltude des problmes de
dcision, nous permettent de les distinguer par analogie :
le premier type est caractris par des variables engendres
par des mcanismes : il correspond aux paris sur les loteries,
roulettes, cartes, etc. ;
le second par des variables engendres par des expriences
trop complexes pour tre rptes dans des conditions iden-
tiques : il correspond aux paris sur des vnements sportifs tels
que les courses de chevaux, les matches de boxe ou de foot-
ball, sur des vnements sociaux comme des lections, ou sur
des vnements mtorologiques, etc.
Ce qui caractrise le premier type dincertitude est le ct
mcanique de la gnration des variables, qui fait quavant de
sengager sur un pari le dcideur a la possibilit dobserver la
frquence dapparition des vnements qui lui semblent perti-
nents. Ainsi, nous savons par exprience quune pice lance
tombe une fois sur deux sur pile, que las a une chance sur six
dapparatre dans le jet dun d, etc. Nous savons peut-tre
aussi que chaque numro du Loto national a une chance sur
quarante-neuf de sortir, mais en revanche nous navons pas pu
observer la frquence dapparition de la suite 48, 03, 25, 39,
11, 05, 44, que nous voudrions jouer. La probabilit dappari-
tion de cet vnement peut cependant tre calcule grce la
thorie des probabilits qui a t dveloppe pour formaliser
ce type dincertitude. De nombreux parieurs, ne sachant pas
faire ce calcul, se conduisent comme si lincertitude laquelle
ils font face tait du second type. Il en est souvent ainsi dans
lapprciation des rendements futurs des portefeuilles dont
nous avons discut plus haut. Mais quel que soit son type,
lincertitude sera formalise par :
un ensemble de rsultats possibles ;
un ensemble dvnements qui affectent les consquences
des dcisions (les taux sont infrieurs 4 %). Un vnement
est caractris par les rsultats qui le vrifient (si le taux est de
2 %, lvnement prcdent est vrifi) ;
une pondration de ces vnements. Les poids affects
chaque vnement peuvent provenir de la frquence avec
laquelle ils ont t observs. Plus gnralement, ils correspon-
dent une valuation subjective de la vraisemblance de leur
28
apparition. Dans lun comme dans lautre cas, cette pondration
pourra tre formalise par la notion de probabilit 2.
En rsum, aprs avoir procd une description des diff-
rents lments pertinents dun problme de dcision grce des
listes, des diagrammes et des arbres de dcision, on satta-
chera en donner une formulation mathmatique. Les outils
puissants que propose la thorie des probabilits, dont dcou-
lent la thorie statistique et la thorie des sries temporelles,
ont amen les thoriciens de la dcision privilgier la forma-
lisation de lincertitude en des termes qui permettent dutiliser
ces thories mathmatiques.
30
probabilits sont connues du dcideur et rsumes dans le
tableau suivant (dans les termes de la thorie des probabilits,
les nombres indiqus sont des probabilits conditionnelles) :
1. Analyse du problme
31
exploitable). Nous excluons ds labord les dcisions stupides
qui consisteraient exploiter le site bien que le second forage
lait dclar inexploitable ; de mme, si la rponse est G, nous
ne considrons pas la possibilit de ne pas exploiter le site en
fin de compte.
Remarquons quil ny a que deux alas qui affectent les
consquences des dcisions : soit le site est exploitable, G ; soit
il ne lest pas, G ; cette incertitude sera leve par la rponse
du second forage ou par la mise en exploitation. tant donn
les informations de la compagnie concernant les probabilits
doccurrence des rsultats des forages, la probabilit que le site
soit exploitable est facile calculer : cest la probabilit que la
rponse du second forage soit G ; celle-ci dpend de la rponse
du premier forage ; nous avons, en notant p(G), cette
probabilit :
p(G) = p(G et {P ou D ou N}) = p({G et P} ou {G et D} ou
{G et N}).
La probabilit dune runion dvnements disjoints est la
somme des probabilits de ces vnements ; par ailleurs,
chacun de ceux-ci est une intersection et nous savons que la
probabilit de p(G et P) = p(G/P)p(P) [o p(G/P) est la proba-
bilit de lvnement G conditionne par lvnement P,
donne par le tableau], nous avons donc :
p(G) = p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N).
En utilisant les probabilits donnes, nous avons :
1 1 1 1 1 1 9
p(G) = + + = h 0,14.
4 4 8 2 16 4 64
Il est facile de vrifier avec la mme mthode que lon a
bien :
55
p(GG) = = 1 p(G) h 0,86.
64
Ce qui veut dire que la compagnie sait quil y a trs peu de
chances que le gisement soit exploitable. Aussi, exploiter sans
faire de forage pourrait prsenter un grand risque : celui de
perdre 106 units 86 chances contre 100, contre un gain pos-
sible, mais peu probable, de 914 units.
Mais il y a de nombreuses autres dcisions possibles et il
serait prmatur de dcider dexploiter avant de les avoir ana-
lyses. Pour cela, il faut en faire la liste et exprimer la relation
32
entre ces dcisions et les consquences ; nous allons le faire en
construisant un arbre.
Sur cet arbre, nous reprsentons par un carr les dcisions
partielles du dcideur ; de ces carrs partent des artes qui
reprsentent les consquences momentanes de cette dcision.
Au dpart, trois dcisions possibles : abandonner le site (A1),
exploiter sans forage (E1) ou faire le premier forage (F1).
Aprs (A1), larte donne la consquence : 6.
Aprs (E1), les consquences dpendent de lexploitabilit du
site ; nous reprsentons les deux possibilits par des artes par-
tant dun rond, elles correspondent G et G ; nous en indi-
quons les probabilits entre parenthses. Au bout de ces artes,
les consquences sont 914 et 106.
Aprs (F1), trois rsultats alatoires sont possibles : P, D et
N, nous les reprsentons par des artes partant dun rond sur
lesquelles sont indiques les probabilits de ces rsultats. Au
bout de chacune de ces artes, nous reprsentons par un carr
la prise dune nouvelle dcision partielle : abandonner (A2),
exploiter (E2) ou faire le second forage (F2).
Aprs (A 2 ) et (E 2 ), les artes donnent les consquences
finales.
Aprs (F2), les artes conduisent des ronds do partent les
dernires artes correspondant aux rponses finales et leurs
consquences en termes de profits (positifs ou ngatifs).
Le schma nous donne la vision densemble des dcisons
partielles et des informations qui pourront tre obtenues partir
de la dcision de faire le premier forage. Sur ce schma, nous
pouvons lire toutes les dcisions qui incluent F1, ainsi que leurs
consquences. Les chemins sur larbre sont appels des stra-
tgies ; ce sont des suites dartes telles F1, D, A2, ce qui se
lit : Faire le premier forage, et, si la rponse est douteuse,
arrter. Sa consquence est 10. Ou encore, F 1 , D, F 2 :
Faire le premier forage, et, si la rponse est douteuse, faire le
second, puis (nous lavons sous-entendu) exploiter si et seule-
ment si le site est exploitable. Sa consquence est 900 si le
site est exploitable, 20 sinon. Nous trouvons donc une liste
de 14 stratgies possibles et la liste de leurs consquences pour
chaque tat alatoire.
Arrtons-nous un instant sur deux manires denvisager ce
problme. La premire consiste voir les stratgies comme des
dcisions ; elle consiste donc prendre en compte la dyna-
mique du problme. La seconde manire de voir le problme
33
ARBRE DE DCISION DU PROBLME DEXPLOITATION MINIRE
34
consiste le ramener un problme statique, cest--dire un
problme o le temps ne joue pas de rle.
Cet ouvrage se limitera pour lessentiel une prsentation
dune thorie de la dcision dans un cadre statique. En effet,
la dynamique fait intervenir, pour tre convenablement traite,
de nombreuses hypothses dont lexpos dpasserait les possi-
bilits du cadre de cet ouvrage. Nous traiterons cependant ce
problme particulier la fois sous langle statique, et, dans un
second temps, sous langle dynamique afin de faire prendre
conscience des diffrences que ces traitements impliquent.
Avant mme de commencer, distinguons les dcisions qui, dans
le traitement dynamique, sont des stratgies, cest--dire des
suites de dcisions partielles qui dpendent du temps et des
informations, alors que, dans le traitement statique, elles sont
dfinies globalement.
Voici deux exemples de stratgies (dynamiques) :
faire le premier sondage, puis, si le rsultat est positif,
procder lexploitation, sil est douteux, faire le second son-
dage, sil est ngatif, abandonner le site ;
abandonner le site sans faire de sondage.
Voici trois exemples de dcisions globales (statiques) :
faire le premier sondage, puis le second ;
faire le premier sondage, puis abandonner ;
abandonner le site sans faire de sondage (oui, cest aussi
une stratgie puisque, prise ds le dpart, cette dcision ne fait
pas intervenir le temps).
35
Dcisions
A1 E1 F1-A2 F1-E2 F1-F2
Alas
G 6 914 10 910 900
G 6 106 10 110 20
Dcisions
A1 E1 F1-F2
Alas
G 6 914 900
G 6 106 20
36
100x
utilise la fonction u(x) = , o u(x) est appel lutilit
100 + x
de x . Cela veut dire quun gain de 100 est valu 50 alors
quune perte de 100 vaudrait q (une manire dexprimer
quune telle perte est inacceptable). Le critre utilis pour
dcider est alors lutilit espre que nous prsenterons au cha-
100 900
pitre V. Lutilit espre de la dcision F1-F2 est :
100 + 900
100 20
0,14 + 0,86 = 12,6 21,5 = 8,9. Lutilit de A1
100 20
100 6
tant = 6,38, nous voyons quavec ce critre la
100 6
compagnie dcidera de ne rien faire et dabandonner le site.
Nous avons vu que la dcision tait sensible au critre ; elle
peut ltre aussi aux probabilits. Pour sen convaincre, consi-
drons un autre tableau donnant les probabilits de G et G
conditionnes par les rsultats du premier forage :
37
statique, nous ne pouvons pas considrer la possibilit de modi-
fier les dcisions au cours du temps.
38
900 [p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N)] 20
[p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N)]
soit, tout simplement : 900 p(G) 20p(G), qui est le profit
espr de la dcision statique F1-F2 (que nous avons dj cal-
cule : 430,8).
Bien sr ! Cela vient du fait que, puisque dans la seconde
tape nous choisissons toujours la mme dcision, laspect
dynamique du problme disparat.
En utilisant les utilits espres, nous aurions eu le mme
effet. Dans la seconde priode, aprs le rsultat du premier
forage, nous aurions trouv que, dans tous les cas, lutilit
espre de F2 est suprieure et donc que, dans la premire
priode, lutilit espre de F1 est celle de la dcision (globale)
F1-F2 (nous avions trouv : 31,35).
Dans ce cas, les conclusions du traitement dynamique du
problme sont identiques celles du traitement statique du fait
que le dcideur ne prend pas des dcisions qui dpendent de ses
informations en seconde priode.
Laspect dynamique du problme ne disparat pas si les dci-
sions momentanes de la seconde priode diffrent selon le
rsultat du premier forage. Cest ce qui se passe si les proba-
bilits conditionnelles sont celles du second tableau :
si le premier forage est positif, la probabilit davoir un gise-
ment exploitable est si haute quil vaut mieux procder imm-
diatement lexploitation (son profit espr est suprieur) ;
en revanche, dans le cas o le premier forage donne un
rsultat douteux, cest la dcision de faire un second forage qui
doit tre prise ;
enfin, dans le dernier cas, la probabilit davoir un gisement
exploitable est si faible quil vaut mieux abandonner.
La dcision est donc vritablement une stratgie, elle
consiste faire le premier forage, puis, selon les cas, exploiter
sans attendre, faire un second forage ou abandonner le site.
Revenons alors la premire tape. Les consquences de la
dcision F1 sont les suivantes :
cP=910 0,95 110 0,05 = 864,5 5,5 = 859.
(Alors que le profit espr de F 2 ne serait que de :
900 0,95 20 0,05 = 854.)
cD = 900 0,5 20 0,5 = 440.
(Alors que le profit espr de E 2 ne serait que de :
910 0,5 110 0,05 = 400.)
cN = 10.
39
(Alors que le profit espr de F 2 ne serait que de :
900 0,01 20 0,99 = 10,8 et le profit espr de F2 ne
serait que de : 910 0,01 110 0,99 = 99,8.)
Le profit espr de la dcision momentane F1 est alors :
0,25 859 + 0,5 440 0,25 10 = 214,75 + 220 2,5 = 435,25.
Celui de la dcision E 1 est : 914 0,49 106 0,51
= 447,86 54,06 = 393,8.
Ainsi le traitement dynamique du problme conduit le dci-
deur suivre la stratgie qui consiste faire le premier forage,
puis exploiter, faire un second forage ou abandonner, selon
les cas.
Moralit
40
un critre : cest une fonction des consquences dont on
cherche le maximum (ou le minimum si cest un critre qui
dcrot en fonction de ce que le dcideur prfre), nous en
verrons quelques-uns au chapitre IV, les deux que nous avons
utiliss sont les plus connus, ils ne sont pas exempts de
dfauts : le premier (profit espr) ne tient pas compte de lasy-
mtrie entre la perception des gains et des pertes ; le second,
que nous justifierons au chapitre V et que nous utiliserons aux
chapitres VI et VII, ne tient pas compte de la perception subjec-
tive des probabilits (cest--dire de la dformation subjective
des probabilits donnes, nous en parlerons au chapitre VII).
IV / Critres de dcision
42
Pour souligner les difficults que peuvent prsenter ces deux
tapes, prenons lexemple du choix dinvestissements sans
risque. Il sagit dun problme de dcision sans incertitude
puisque les taux de rendement des diffrents actifs sont connus.
Cependant, en cherchant dterminer un ordre sur ces actifs,
linvestisseur se rendra souvent compte que les taux de rende-
ment annoncs ne lui suffisent pas comparer les actifs :
dautres lments comme les facilits de paiement, les dates
dchances qui peuvent influencer la taxation des revenus, la
frquence des versements, etc. font que deux actifs de mmes
taux ne seront pas ncessairement indiffrents pour un investis-
seur donn. Les consquences des investissements pourront
alors tre dfinies par des rendements calculs par des proc-
dures comptables faisant intervenir les diffrentes caractris-
tiques pertinentes : taux, taxes, chanciers Appelons
rendements actualiss ces consquences des investisse-
ments. La dfinition des consquences tant donne (grce aux
comptables), reste les comparer. Ici les rendements actualiss
sordonnent naturellement par valeurs croissantes et cet ordre
est celui des prfrences de la plupart des investisseurs. Une
fois ce rangement des consquences tabli, linvestisseur
pourra sinterroger sur les dcisions qui amneront aux meil-
leures consquences.
Supposons que les investissements possibles portent sur des
actifs dchances diffrentes. Pour dfinir la fonction cons-
quence (qui relie dcisions et consquences), il faudra tablir
une procdure dactualisation qui permette de comparer les ren-
dements. Une fois la fonction consquence bien dfinie, la
structure mme des dcisions rendra leur rangement plus ou
moins ais. Supposons que les dcisions de linvestisseur puis-
sent jouer sur deux variables : la quantit investie et lchance.
Lordre sur les consquences est simple, mais il ne sen dduit
pas immdiatement un ordre sur les dcisions qui permette de
faire un choix. Cela vient de ce que les dcisions ont ici deux
composantes : chance donne, les quantits investies sont
naturellement ranges dans lordre des rendements quelles
procurent ; quantit fixe, les chances sont ranges dans
lordre des taux quelles procurent. Mais le dcideur doit
comparer des dcisions comme : 100 units, chance trois
mois et 10 units, chance dix ans. Pour cela, il devra dfinir
un critre unique sur les deux variables de dcision qui soit
cohrent avec lordre quil a dfini sur les consquences. Ici, le
43
critre simpose, il est nouveau tabli par calcul comptable :
cest le rendement actualis de linvestissement (qui est ici jus-
tement ce que nous avons dfini comme la consquence de
linvestissement). Le dcideur choisira donc un couple quan-
tit-chance qui lui procure le plus haut rendement actualis
possible sous les contraintes (de trsorerie, institutionnelles)
de son problme dinvestissement. Le rendement actualis est
le critre de dcision de ce problme. Dans ce problme, qui
est simple parce que le critre de dcision est aussi la fonction
consquence, il suffit de trouver les meilleures consquences
pour obtenir les meilleures dcisions.
44
dfiniraient alors le critre de choix de lenfant : lenfant
rationnel choisirait une des pices ayant le plus grand diamtre.
Si la couleur et la brillance importent, sans que lune ne pr-
vale sur lautre, il ne sera pas possible de ranger strictement
les pices, ni par consquent de les numroter directement en
suivant le rangement. Il y a une difficult reprsenter par un
critre unique des prfrences qui sont dfinies par un double
critre. De telles prfrences ne permettent pas de dfinir un
ordre grce auquel toutes les alternatives peuvent tre
compares (nous revenons sur ce problme au paragraphe 3).
Lorsque les prfrences portent sur un ensemble fini dobjets
(ou un ensemble dnombrable, cest--dire que lon peut num-
roter tous les objets par des nombres entiers), comme
lensemble des pices de monnaie, un critre nest rien dautre
quune numrotation de ces objets. Ladulte et un enfant qui ne
sintresserait qu la taille, nauront pas la mme numrota-
tion (avec des pices europennes). Nous dirons dun tel critre
quil reprsente les prfrences. Pour que les prfrences
puissent tre reprsentes, il faut que tous les objets soient
comparables. Ceux qui sont indiffrents se verront attribuer la
mme valeur par le critre, un objet strictement prfr un
autre aura une valeur suprieure celle du premier. Cette pro-
prit des prfrences, quelles soient capables de comparer
tous les objets, suffit lexistence dun critre (il nest pas
unique, mais tous amneront aux mmes choix : au lieu de
ranger les pices selon leurs diamtres en millimtres, on peut
les ranger selon leurs surfaces en mtres carrs, ou la racine
carre de celle-ci, etc., sans changer le rangement).
Lorsque lensemble des objets sur lesquels portent les prf-
rences nest pas fini (ni dnombrable), cette proprit nest pas
suffisante pour reprsenter les prfrences par un critre. Par
exemple, si les consquences dinvestissement sont des rende-
ments qui peuvent prendre toutes valeurs relles entre 10 et
+10, et que le critre soit le rendement lui-mme, cela signifie
que les prfrences rangent les rendements selon lordre naturel
des nombres et quelles ont donc les mmes proprits que cet
ordre. Pour pouvoir dfinir un critre qui reprsente des prf-
rences sur de tels ensembles, il faudra quelles vrifient une
proprit de continuit qui donne, lensemble ordonn par les
prfrences, la mme structure que lensemble des nombres
rels auquel on cherche le faire correspondre. Cette proprit
de continuit est fondamentale pour la reprsentation de
45
prfrences sur des ensembles gnraux. Elle est apparue dans
les modles formaliss de lconomie o les prfrences des
agents portent sur des paniers de biens quils peuvent
consommer ou produire (Debreu [1970]).
Choisir la, ou une, meilleure dcision consiste, une fois
le critre dfini, rsoudre un problme doptimisation (de ce
critre) grce aux outils et mthodes de la programmation
mathmatique.
Le problme trait dans ce chapitre consiste donc traduire,
par un critre (ventuellement plusieurs critres) sur les dci-
sions, une relation de prfrences sur leurs consquences.
Mathmatiquement, un critre est une fonction valeur num-
rique, et la reprsentation de prfrences par un critre consiste
trouver une fonction, disons V, telle que si la consquence
de la dcision a est prfre celle de la dcision b ,
alors V(a) 6 V(b). Remarquons que, rciproquement,
V(a) 6 V(b) dfinit une relation entre a et b et par consquent
entre leurs consquences. Cette relation est particulire ; cest
ce que les mathmatiques appellent un prordre.
Prordre
46
tant donn une relation de prfrences sur un ensemble C,
que nous noterons , nous dirons quune fonction V : C r R
reprsente les prfrences si et seulement si, pour tout c et c
de C, c c B V(c) 6 V(c). Autrement dit, la fonction V
affecte, chacune des consquences, des nombres rangs par
ordre croissant respectant lordre des prfrences. La significa-
tion et la construction dune telle fonction sont immdiates
dans le cas o les consquences sont en nombre fini.
Considrons un ensemble C = {a,b,c,d,e} de consquences et
supposons que la relation est prfre est reprsente par
les flches du diagramme suivant (a est prfre b, b est
prfre d, etc.) :
47
C, en affectant une valeur f(e) = k avec k 1 4 = f(a) pour
respecter le fait que a e, nous devrions avoir : e d, puisque
f reprsente les prfrences, ce qui nest pas compatible avec
le diagramme. Nous ne pourrons donc pas trouver de nombre
k pour complter la fonction f sur C, et, par consquent, nous
ne pourrons reprsenter cette relation de prfrences par une
fonction.
Nous avons rencontr la premire condition que doit vri-
fier une relation de prfrence pour pouvoir tre reprsente
par une fonction : toutes les consquences doivent pouvoir tre
compares par la relation ; on dit dans ce cas que le prordre
est total. La thorie de la dcision appelle axiomes ces
conditions ; laxiome 0 sera donc :
A0 : la relation de prfrence est un prordre total.
Les prfrences sur des ensembles finis (ou dnombrables)
qui vrifient cet axiome pourront donc tre reprsentes par
une fonction. Rappelons que toute fonction croissante de cette
fonction les reprsente aussi (quelles soient numrotes 1, 2, 3
ou bien 26, 42, 354, les dcisions sont ranges dans le mme
ordre). Ce rsultat stend de manire vidente aux ensembles
non finis mais dnombrables.
Lorsque lensemble des consquences nest ni fini ni dnom-
brable, par exemple sil sagit de montants pouvant prendre
toutes valeurs comprises entre 0 et 1 000, une condition suppl-
mentaire de continuit devra tre vrifie : il ne faudrait pas
quune suite de consquences, qui sont toutes prfrables une
certaine consquence c, ait pour limite une consquence qui ne
soit pas prfre c (nous en donnerons un exemple en
construisant le critre de lutilit espre au chapitre V, para-
graphe 3). Cette condition est exprime de manire informelle
par laxiome :
A1 : les prfrences sont continues .
En pratique, on numrotera des consquences dnom-
brables selon lordre des prfrences, puis on compltera la
reprsentation en prenant les limites des suites des valeurs des
consquences pour reprsenter les consquences qui ne sont
pas dans lensemble dnombrable. Un contre-exemple de prf-
rences qui ne respectent pas cet axiome est donn dans
lencadr du paragraphe 5.
48
3. Critres classiques de dcisions dans lincertain
49
ltat i (dans lexemple : c1(a) = 10, c2(c) = 15, etc.). Nous sup-
poserons quil y a un nombre fini dtats, soit n, quoique cer-
tains des critres puissent tre dfinis pour un ensemble dtats
plus gnral.
Historiquement, le critre dit de Laplace est sans doute le
premier qui ait t propos (bien avant Laplace et au moins par
Huygens plus dun sicle avant). Il intgre en une seule valeur
les diffrentes consquences possibles (ce sont des cons-
quences numriques) dune dcision dans lincertain : il sagit
de la moyenne arithmtique des gains.
n
1
Critre de Laplace : L(d) = S c (d)
n i=1 i
Dans notre exemple :
1
L(a) = (10 + 20 + 30) = 20
3
1 59
L(b) = (4 + 25 + 30) = ! 20
3 3
1 70
L(c) = (5 + 15 + 50) = 1 20
3 3
Le critre de Laplace range donc les dcisions dans lordre
croissant : c, a, b.
Lide de prendre la moyenne arithmtique, qui correspond
une pondration uniforme, est justifie par une absence
dinformation sur les probabilits des vnements lmentaires
(i = 1 n). Cest aussi cette distribution de probabilit uni-
forme qui fut utilise dans la premire formulation de lutilit
espre propose par Cramer et Bernoulli (nous y reviendrons
au chapitre V). la diffrence du critre de Laplace, ce ne sont
pas directement les consquences numriques dont la moyenne
est calcule, mais une fonction de ceux-ci, comme nous lavons
vu dans lexemple trait au chapitre prcdent. Cette fonction
dforme les consquences afin de traduire lattitude de lagent
vis--vis de la richesse, ou, plus gnralement, de cons-
quences numriques (les taux, dans notre exemple). De plus, ce
critre peut tre dfini pour des consquences qui ne sont pas
numriques, puisque lutilit de la consquence, elle, est num-
rique (utilit dun bien de consommation, par exemple).
50
n
1
Critre de Bernoulli : B(d) = S U[ci(d)])
n i=1
o U tait la fonction logarithme
51
n
Critre de lesprance mathmatique : E(d) = S pi ci(d)
i=1
52
comportement de prudence extrme vis--vis du risque et peut
tre justifi comme un cas limite dutilit espre.
53
S(b) = Max {10 4 ; 25 25 ; 50 30} = 20
S(c) = Max {10 5 ; 25 215 ; 50 50} = 10
Le critre de Savage laisse donc les dcisions a et b indiff-
rentes, alors quil favorise c.
On aura pu apprcier sur cet exemple, extrmement simple
compar aux problmes dinvestissement rels, combien un cri-
tre modifie la dcision finale. Nous lavions dj remarqu
dans le chapitre prcdent o nous avions not aussi la sensi-
bilit des rsultats la spcification des probabilits. Dans les
cas particuliers o ils ont t introduits, chacun de ces critres a
reu des justifications fondes, pour lessentiel, sur lexp-
rience. La thorie de la dcision cherche, pour sa part, fonder
ces justifications sur des conditions (axiomes) sur le comporte-
ment des dcideurs.
La liste, non exhaustive, des critres prcdents permet de
prendre une dcision en rsolvant un simple programme dopti-
misation. Cela vient de ce que la variabilit des consquences
dune dcision est compltement intgre par ces critres.
Dautres approches caractrisent les situations dincertitude par
deux critres, lun reprsentant le rendement, lautre le risque.
moins de se diriger vers des mthodes doptimisation mul-
ticritres sur lesquelles nous reviendrons dans le paragraphe
suivant, il est possible dintgrer lincertitude par des critres
uniques qui agrgent les paramtres caractrisant lincertitude.
Le plus fameux de ceux-ci est sans doute celui qui est implici-
tement dfini par la thorie de slection de portefeuilles (ou,
plus gnralement, dinvestissements) due Markowitz [1970].
La thorie remonte un article du mme auteur paru en 1952.
Le rendement dun portefeuille est caractris par son esp-
rance mathmatique, et le risque quil prsente est formalis
par la variance ou lcart type des rendements alatoires. Les
investisseurs dont laversion pour le risque est caractrise par
leur dsir de minimiser la variance (voir chapitre VI) doivent
donc faire un arbitrage entre les deux critres que sont lesp-
rance : m(d) et lcart type s(d) du rendement dun investisse-
ment d. Cet arbitrage peut tre formalis par une fonction des
deux paramtres U (m, s). Ce critre peut tre justifi par la
thorie de lutilit espre dans le cas o lutilit est une fonc-
tion quadratique des rendements (U(r) = a br2), ou encore
dans le cas o la distribution de ceux-ci est compltement
caractrise par ses deux premiers moments (esprance et
variance, comme cest le cas pour la loi normale). Un tel critre
54
ne tient pas compte des dissymtries de la distribution ni de
valeurs critiques des rendements. Pour pallier ces dfauts, Mar-
kowitz a propos un critre agrgeant lesprance des rende-
ments et un paramtre n(d*) mesurant la variabilit au-del
dun seuil critique d*.
4. Prfrences et critres
55
dcroissant des valeurs. Mais la connaissance de ces deux cri-
tres ne suffit pas comparer toutes les consquences comme
on le voit sur le graphe suivant :
56
prfrence, une reprsentation est facile dfinir : tous les
points dune courbe dindiffrence, on peut affecter le rende-
ment (ou une fonction croissante du rendement) de lintersec-
tion de cette courbe avec laxe horizontal de la date 0. Ainsi la
relation de prfrence est reprsente par un critre unique qui
est cohrent avec les deux critres sur les composantes.
La difficult dfinir la relation de prfrence ou sa repr-
sentation, partir des deux critres sur les composantes, vient
de la multiplicit de possibilits dagrgation de deux critres
en un critre unique. Parmi ces agrgations possibles, cer-
taines vrifieront les prfrences du dcideur, dautres non, et
lutilisation dun critre unique ne peut se faire que sur la base
de lobservation des prfrences du dcideur.
57
utilisant des fonctions non linaires). De telles combinaisons
sont donc, de fait, des agrgations de critres, elles doivent tre
justifies par des thories axiomatiques sur les prfrences. Ces
thories sont beaucoup plus restrictives encore que celles dont
nous poursuivrons la prsentation dans les chapitres suivants
puisquelles les utilisent et les compltent.
Dautres mthodes sattachent bien faire rvler les prf-
rences des dcideurs et les reprsenter par une relation dite
de surclassement qui ne vrifie gnralement pas laxiome
A0 qui requiert que toutes les consquences soient compa-
rables (voir, plus haut, le paragraphe 2). Les prfrences ne
sont souvent, en effet, ni totales ni transitives. Les mthodes de
surclassement (Roy [1985]) font cependant intervenir dans leur
exploitation des pondrations de critres qui permettent de ne
pas se limiter des solutions non domines (une consquence
est domine par une autre si elle est moins bonne pour tous les
critres). La dfinition de ces pondrations ne va sans doute pas
aussi loin que lagrgation de critres utiliss dans les
mthodes multiattributs . Celles-ci posent pour axiome que
les dcideurs cherchent optimiser une fonction agrgeant les
critres. Cette fonction a pour effet de prciser les diffrents
caractres prendre en compte dans le problme de dcision.
Dans la pratique, cette fonction est linaire, cest--dire quen
fait elle pondre les diffrents critres. La linarit dune telle
fonction est assure par des axiomes prcisant une indpen-
dance des diffrents critres, de tels axiomes sont rapprocher
des axiomes dindpendance que nous rencontrerons par la
suite pour assurer la linarit des critres reprsentant les prf-
rences des agents (voir aussi les paragraphes 6 et 7 plus loin).
Sans avoir recours une agrgation de critres, des prci-
sions sur les prfrences du dcideur peuvent amener dfinir
un ordre total sur des consquences partir des critres sur
leurs composantes. Un exemple classique est celui de lordre
lexicographique 1 qui suppose une prdominance de certains
critres sur dautres. Ainsi dans notre exemple sur les couples
date-rendement, un ordre lexicographique pourra tre tabli si
le rendement domine la date : les couples sont dabord rangs
par ordre de rendements croissants, puis parmi les couples de
58
mmes rendements, les dates sont compares. Cela dfinit un
ordre total sur les couples, tous peuvent tre compars : ainsi
D est prfr C puisque son rendement est suprieur, B est
prfr D puisque, rendement gal, D a une date sup-
rieure. Lordre est donc B, D, C, A. Toutefois, il est possible
de dmontrer que cet ordre (qui vrifie laxiome A0) ne peut
pas tre reprsent par une fonction (parce quil ne vrifie pas
laxiome A1).
59
Nombre
23 19 16 2
de votants
En tte A B C C
En second B C B A
En dernier C A A B
Votes 23 17 2 10 8
Premier A B B C C
Second B C A A B
Dernier C A C B A
60
conditions qui semblent indiscutables pour une Constitution
dmocratique, il nest pas possible de trouver une rgle de
choix social (cest--dire une rgle que pourrait suivre un gou-
vernement, par exemple) qui soit cohrente avec les prf-
rences des individus concerns par cette Constitution. Ces
conditions peuvent tre exprimes de la manire suivante : on
considre un ensemble de consquences possibles sur lequel
sont dfinies des relations de prfrences des diffrents indi-
vidus concerns par une Constitution dterminer qui dfinira
une relation de prfrences sociales. Lintrt de ce thorme
vient de ce quil sadresse une population mal dfinie, comme
cest le cas pour un pays, pour laquelle il serait illusoire de
chercher faire une liste exhaustive de tous les habitants.
Uniformit : la Constitution respecte toutes les relations de
prfrences possibles sur lensemble des consquences.
Monotonie : si une consquence, x, est prfre une autre,
y, pour une relation de prfrences sociales et si lon propose
une nouvelle relation de prfrences sociales pour laquelle x
satisfait plus lun des agents et nen dsatisfait aucun autre,
alors x est socialement prfr y dans la nouvelle relation de
prfrences sociales.
Indpendance : deux relations de prfrences sociales qui
procdent au mme rangement des consquences pour tous les
individus dterminent le mme choix social.
Absence de contrainte : la Constitution nest pas contrainte
par une paire de consquences pour laquelle le choix social soit
le mme pour toute relation de prfrences sociales.
Absence de dictateur : la Constitution ne dfinit pas la rela-
tion de prfrences sociales comme tant la relation de prf-
rences (strictes) dun individu (qui serait alors un dictateur).
Thorme dimpossibilit dArrow : il nexiste pas de
Constitution qui vrifie les cinq conditions prcdentes.
Moralit : moins dtre un dictateur (celui qui dicte les
dcisions prendre), un dcideur public ne peut se rfrer la
thorie de la dcision individuelle pour guider ou justifier des
choix dont les consquences sont collectives.
7. Dynamique de dcisions
61
constat que les solutions ne sont pas toujours les mmes.
Lorsque les consquences dun problme de dcision diffrent
dans le temps, la dfinition dune relation de prfrence glo-
bale, intertemporelle donc, peut poser des difficults. Il sagit
encore dans ce cas dagrger, en un seul critre portant sur la
squence des consquences, des critres portant chacun sur les
consquences instantanes. (Dans notre exemple du chapitre III,
nous avons suppos que le critre tait le mme : esprance des
profits ou de leurs utilits, et que le critre global, aussi, tait
le mme. Mais la fonction dutilit du dcideur pourrait fort
bien changer au cours du temps et en fonction de ses informa-
tions, par exemple, le dcideur pourrait tre remplac en
deuxime priode selon les rsultats de sa stratgie.)
Le principe de la programmation dynamique consiste cal-
culer une suite optimale de dcisions partir de sous-suites
optimales. Ainsi, pour une suite de dcisions horizon fini, on
calculera la dcision optimale concernant la dernire priode en
fonction de la dcision de lavant-dernire priode, puis celle-ci
en fonction de la dcision prcdente et ainsi de suite jusqu
la dcision initiale. Ce calcul se fait en optimisant chaque
priode le critre de dcision instantan. Ce critre doit donc
tre connu ds le dpart, et le calcul nest valable en ce sens
que la suite de dcisions ainsi calcule est optimale pour le
dcideur que dans la mesure o les prfrences sur les suites
de dcisions sont reprsentes par un critre qui se dcompose
selon les critres utiliss en chaque priode. Inversement, cela
suppose que le critre global est une agrgation des critres ins-
tantans. Cette dcomposition, ou cette agrgation, suppose
donc une cohrence entre les prfrences sur les consquences
en chaque priode et les prfrences sur les suites de dcisions.
Rciproquement, comme en pratique ce sont les critres instan-
tans qui sont connus plutt que le critre global, le problme
est de savoir quelles conditions doivent vrifier les prfrences
pour quune agrgation (combinaison linaire en particulier)
des critres reprsente bien les prfrences sur les suites de
consquences.
Dans lexemple du chapitre prcdent, nous avions (habile-
ment) vit ces difficults en ne considrant que les profits
la priode finale. Dans la pratique, les gains et les pertes inter-
mdiaires sont grer aussi ; en chaque instant, un profit ra-
lis (positif ou ngatif) ncessite un placement ou un emprunt
62
ou pour le moins une valuation la priode finale (profit
actualis, par exemple).
Conclusion
64
les postulats et qui se trouvent dans des situations de dcision
dans lincertain particulires : ce sont des situations de risque
ou des situations qui sy ramnent, en un sens que nous allons
prciser.
Bien quil sagisse dans les deux cas de jeux de hasard, il est
courant dopposer la situation o se trouve un parieur face
un jeu de roulette celle o il se trouve face une course de
chevaux. La premire est une situation de risque pour laquelle
le formalisme de la thorie des probabilits est parfaitement
adapt, la seconde une situation qui peut sy ramener. Dans un
jeu de roulette, le hasard est engendr par un phnomne phy-
sique, reproductible, qui permet de dfinir la vraisemblance
dun vnement et de la mesurer par une frquence obser-
vable. Dans une course de chevaux, lexprience qui engendre
le hasard nest pas reproductible parce quelle fait intervenir de
trop nombreux facteurs ; de ce fait, la notion de mesure de la
vraisemblance dun vnement reste subjective. Parmi ces fac-
teurs, les plus vidents sont les chevaux, qui, tout dresss et
entrans quils soient, sont sujets dinnombrables variations
biologiques dont dpendent leur condition physique et, par
consquent, leur probabilit de gagner.
En pratique, peu de dcisions sont prises en situation de
risque (probabilits connues). Les dcisions dinvestissement
sur un march boursier, par exemple, font intervenir une incer-
titude sur les cours futurs dont la distribution de probabilits
nest pas connue. Il est communment admis que cette distri-
bution, ou du moins certains de ses paramtres, peuvent tre
dduits des observations des cours passs. En fait, ni les cours
passs ni les cours futurs ne correspondent la rptition dune
exprience alatoire, en ce sens quils ne sont pas obtenus par
la rptition dune exprience reproductible (en partie pour la
raison que, parmi les lments dincertitude de chaque agent,
figurent les dcisions et les anticipations des autres agents
concernant le futur). Cette remarque est facilement transpo-
sable la plupart des dcisions prises par des gestionnaires :
achats dimmeubles, implantations de points de vente, lance-
ments de produits nouveaux, etc., et, plus encore, aux
65
problmes de dcision dont les consquences sont difficiles
dfinir : dcisions politiques, relations sociales, etc.
Toutefois, lorsquune premire approche du problme de
dcision a permis au dcideur de rsumer les informations dont
il dispose sous la forme dune distribution de probabilits sur
les consquences, le problme de dcision se ramne une
situation de risque. Ce que nous entendons par cette expres-
sion, cest que le choix du dcideur se ramne celui dune
distribution de probabilits sur les consquences de sa dcision,
comme cest le cas pour un pari sur un jeu de roulette ou sur
une loterie.
Considrons, dans un jeu de roulette, le choix entre miser
10 euros sur le 12 ou la mme somme sur Pair . Les gains
possibles sont 360 euros pour le premier choix, 20 euros pour
le second, la perte possible tant de 10 euros dans les deux cas ;
les consquences possibles sont donc : 360, 20, 10.
La roulette comportant 37 alvoles, le 12 sort avec une pro-
babilit de 1/37 et Pair avec une probabilit de 18/37 (le 0
ntant pas compt parmi les nombres pairs). Choisir de miser
sur le 12 correspond donc choisir la distribution de probabi-
lit sur les consquences : 1/37 sur 360 ; 0 sur 20 ; 36/37 sur
10. Choisir de miser sur Pair correspond choisir la dis-
tribution de probabilit sur les consquences : 0 sur 360 ; 18/37
sur 20 ; 19/37 sur 10.
Considrons prsent une course de chevaux, et le choix
entre miser 10 euros soit sur le cheval numro 12 (plac 36
contre 1), soit sur le cheval numro 5 (plac 2 contre 1). Les
consquences possibles de ces choix sont encore 360, 20 et
10. Le premier choix aura pour consquence : 360, si le 12
gagne ; 10, sinon, et il ne pourra pas avoir 20 comme
consquence.
Le second choix aura pour consquence : 20, si le 5 gagne ;
10, sinon et il ne pourra pas avoir 360 comme consquence.
Ces choix ne correspondent donc pas des distributions de
probabilits sur les consquences possibles. Cependant, si le
joueur pense que le cheval numro 12 va gagner avec une pro-
babilit de 1/36 (h 1/37), et que le cheval numro 5 va gagner
avec une probabilit de 1/2 (h 18/37), le choix se ramne effec-
tivement une situation extrmement semblable celle o le
joueur se trouvait dans le jeu de roulette. La mesure de la vrai-
semblance des vnements tablie par le parieur prend les
mmes valeurs que les probabilits prcdentes ; aussi, au
66
choix de chaque pari, correspond une distribution de probabi-
lits sur les consquences possibles (compltes par la proba-
bilit zro sur la consquence impossible : 20 sil mise sur le
12, 360 sil mise sur le 5). Ainsi, bien que les deux paris soient
faits dans des situations dincertitudes trs diffrentes, il est
possible, pour certains parieurs, de les ramener toutes deux
des situations de risque.
Formellement, un problme de dcision est dit en situation
de risque si, chaque action choisie, correspond une distribu-
tion de probabilits sur les consquences.
Un problme de dcision en situation de risque pourra alors
tre reprsent par la donne dune fonction, c, qui associe
chaque action, a, de lensemble A des actions possibles et
chaque rsultat, w, de lensemble W des rsultats dune exp-
rience alatoire rgie par une distribution de probabilits
donne, une consquence, c(a,w), de lensemble C des cons-
quences possibles c : AxV r C. A la roulette, W est la liste des
numros de 0 36 et la distribution de probabilit est (en prin-
cipe !) uniforme : 1/37 pour chaque numro.
chaque action, a, (parier sur le 12) correspond la distibu-
tion image (1/37 sur 360 ; 0 sur 20 ; 36/37 sur 10) de la distri-
bution sur W (1/37 sur chaque numro) par la fonction (variable
alatoire) c (a, .) : W r C. Dans notre exemple :
c( parier sur le 12 , w) = 360 si w = 12
10 si w 0 12.
Dans lexemple des paris sur la roulette, la fonction, c, est
dfinie par le rglement du jeu qui fixe les gains en fonction de
la somme mise sur les diffrentes combinaisons de numros
(les actions), et les rsultats dsigns par la roulette (les
rsultats de lexprience alatoire). La distribution de probabi-
lits sur les vnements de cette exprience est dfinie par la
distribution uniforme (1/37 sur chacun des 37 rsultats pos-
sibles). chaque pari correspond une distribution sur les gains
ou les pertes (consquences) ; par exemple, au pari : miser
10 euros sur Pair correspond la probabilit : 18/37 de gagner
2 10 euros et 19/37 de perdre 10 euros.
Dans lexemple des paris sur les courses de chevaux, la fonc-
tion c est aussi dfinie par le rglement du jeu qui fixe les gains
en fonction des montants miss (lorsque les cotations dues aux
paris des autres joueurs sont dj donnes) et du rsultat de la
course. La distribution de probabilits sur ces rsultats et, par
consquent, celle sur les gains ou pertes, sont dfinies par le
67
parieur lui-mme en fonction de ses informations et de son
intuition.
Lorsque les cotations ne sont pas donnes, la distribution sur
les consquences dpend encore dun nouveau facteur : les
actions inconnues des autres joueurs. Cela ne change rien
notre formalisme si ce nest que les rsultats alatoires seront
forms de deux composantes : lune rsultant de la course,
lautre du comportement des autres joueurs.
Une situation de risque est donc caractrise par une distri-
bution connue sur lensemble des alas. Dans certains cas,
cette distribution peut dpendre de la dcision du joueur lui-
mme, son pari changeant les cotations, et, par consquent, les
gains. Le joueur prend, dans ce cas aussi, sa dcision dans une
situation de risque puisque chacun de ses choix dfinit une dis-
tribution sur les consquences. La manire dont cette distribu-
tion est dfinie est certainement plus complexe que dans le cas
simple de paris sur le jeu de roulette, mais ce qui nous importe
ici est que le joueur la considre comme donne, et donc que la
situation se ramne une situation de risque .
Le principe fondamental de la thorie de lutilit espre est
quen situation de risque le comportement du dcideur est
entirement dtermin par ses prfrences sur les distributions
de probabilits sur les consquences de ses actions.
Il est dusage dappeler loteries de telles distributions,
quelles proviennent ou non dune loterie sur les rsultats dune
exprience alatoire. En situation de risque, donc, le comporte-
ment du dcideur est entirement dfini par ses prfrences sur
les loteries (si, la roulette, un joueur prfre la distribution
1/37 sur 360 et 36/37 sur 10 la distribution 1/2 sur 2 et 1/2
sur 0, il misera sur le 12 plutt que sur Pair , par exemple).
Dans une telle situation un dcideur est appel rationnel
si le choix de ses dcisions est cohrent avec ses prfrences
sur les loteries. Ainsi, si laction a correspond la loterie l et
laction a correspond la loterie l, un agent rationnel choisira a
plutt que a, sil prfre l l.
La thorie de lutilit espre est une thorie de la reprsen-
tation des prfrences sur les loteries. Elle permet de dfinir un
critre grce auquel les loteries peuvent tre compares : cest
leur utilit espre. Un dcideur dont les prfrences sur les
loteries vrifient les conditions de la thorie (ses axiomes) dis-
pose alors dun critre qui permet de les comparer. Puisque
chacune de ses dcisions est associe une loterie, le mme
68
critre lui permettra de ranger ses dcisions, sil est
rationnel .
Revenons sur le problme de dcision trait au chapitre III,
p. 30 : nous avions compar la dcision prise en utilisant le cri-
tre du profit espr et celle obtenue partir de lesprance
dune fonction dutilit particulire. La distribution de probabi-
lits tait connue : nous tions bien en situation de risque. Le
dcideur et nous, qui nous mettions sa place, avons calcul
les probabilits des diffrents profits selon les dcisions prises.
L, nous avons saut une tape : nous avons dclar que le
dcideur rangeait ces profits alatoires (ces loteries dans notre
terminologie actuelle) en utilisant le critre du profit espr
(ou, en nous ravisant, celui de lutilit du profit espr), do se
dduisait une dcision optimale. Ltape saute consiste justi-
fier le critre employ ; ce chapitre nous donne des moyens de
le faire.
Dans une situation de risque ou une situation qui sy ramne,
cest--dire qui ramne le choix dune action celui dune
loterie sur les consquences des dcisions, un dcideur dont les
prfrences sur les loteries vrifient les axiomes de la thorie
de lutilit espre sera rationnel sil choisit une action qui
maximise lesprance de lutilit de la loterie sur les cons-
quences qui correspond cette action.
La thorie de lutilit espre, comme les autres thories de
reprsentation du comportement, consiste tablir des normes
sur les prfrences qui permettent de construire des critres de
choix. Un comportement rationnel sera alors celui dun dci-
deur qui reconnat ces normes et qui prend ses dcisions selon
le critre quelles ont permis de dfinir.
69
La richesse structurelle de lensemble des loteries a permis
dexprimer une autre proprit de la reprsentation des prf-
rences : cest celle que nous appellerons linarit ; elle pro-
vient de la structure algbrique de lensemble des loteries.
Cette proprit, mathmatique, traduit une intuition ancienne
qui consiste considrer quune loterie dont les lots sont mon-
taires est quivalente une somme de monnaie obtenue sans
incertitude : cette somme correspond au prix maximal quun
joueur est prt payer pour jouer cette loterie. Ce prix,
lintuition premire veut que ce soit celui du lot moyen, cest-
-dire la moyenne arithmtique des lots pondrs par leurs pro-
babilits dtre gagns (le critre de Laplace, ou, plus
gnralement, celui de lesprance mathmatique du gain).
Mathmatiquement, le calcul du lot moyen correspond bien
une proprit de linarit puisque cest une somme pondre
(une combinaison linaire).
Mais le paradoxe de Saint-Ptersbourg, prsent au
XVIIIe sicle, met en vidence la contradiction de lintuition pre-
mire avec le comportement dun joueur : aucun joueur ne ris-
querait toute sa fortune dans un jeu, mme si le gain espr est
infiniment grand. Miseriez-vous toute votre fortune dans le jeu
suivant ?
On jette une pice de monnaie jusqu ce que face appa-
raisse. Si face apparat pour la premire fois au nime jet, vous
gagnez 2n euros (moins la somme mise) : par exemple, si vous
aviez mis 10 i et si face apparaissait la premire fois, vous
1
perdriez 10 2 = 8 i (avec probabilit ), mais, si face nappa-
2
1 1
raissait qu la septime fois (avec probabilit 7 = ), vous
2 256
gagneriez 256 10 = 246 i. Le gain espr de ce jeu est infini ;
1
en effet la probabilit que face apparaisse au nime jet est n et
2
le gain espr (mise exclue) est donc :
1 1 1
2 + 2 22 + + n 2n + = 1 + 1 + + 1 + qui
2 2 2
est infini !
Lhypothse suggre par Cramer Bernoulli pour rsoudre
ce paradoxe est que, si vous ntes prt miser quune somme
finie, disons 100 euros, pour jouer ce jeu, cest que cette
somme ne correspond pas au gain espr mais lesprance
70
dune fonction de ce gain. Cest cette fonction qui traduit une
certaine forme de votre aversion pour le risque (risque de
perdre toute votre fortune pour ne gagner que deux euros),
parce que cest une fonction qui crot de moins en moins vite
avec le gain (en particulier la fonction logarithme a cette pro-
prit). Ainsi, si U est cette fonction :
q
S 1n U(2n) = 100.
n=1 2
71
lindiffrence est une relation dquivalence (voir encadr
Prordre , p. 46) et que les classes dquivalence sont
ordonnes par les prfrences. Ainsi, si les loteries taient en
nombre fini, on pourrait les ranger selon lordre croissant des
prfrences, il suffirait alors de les numroter pour avoir une
reprsentation des prfrences. La fonction V reprsentant
les prfrences associerait un indice chaque loterie. Tou-
tefois, lensemble des loteries sur un ensemble de cons-
quences est gnralement un ensemble beaucoup plus grand
quun ensemble fini 1 et un axiome complmentaire est ncs-
saire pour reprsenter un ordre sur cet ensemble. Il sagit dun
axiome de continuit qui donne aussi une proprit de conti-
nuit la fonction V. Laxiome exprimant la proprit de conti-
nuit des prfrences sur les loteries sera facile comprendre
sur un cas particulier o il y a trois consquences a = 10,
b = 1 et c = 10 : supposons que vous prfriez la loterie qui
donne b avec certitude toutes les suivantes :
b avec probabilit 1/2, a avec probabilit 1/4, c avec proba-
bilit 1/4 ;
b avec probabilit 1/3, a avec probabilit 1/3, c avec proba-
bilit 1/3 ;
b avec probabilit 1/4, a avec probabilit 3/8, c avec proba-
bilit 3/8 ;
b avec probabilit 1/5, a avec probabilit 2/5, c avec proba-
bilit 2/5 ;
;
b avec probabilit 1/n, a et c avec probabilits 1/2(1 1/n) ;
etc.
Lorsque n est grand (n = 100 pour fixer les ides), la loterie
qui donne b avec probabilit 1/n est quasi quivalente (elle a
pour limite) celle qui donne b avec probabilit 0 et a et c avec
probabilit 1/2 chacun. Laxiome de continuit implique que
vous devez alors prfrer la consquence b (qui est identique
obtenir b = 1 avec certitude) la loterie qui donne a = 10 et
c = 10 avec probabilit 1/2 chacun.
72
Cet axiome peut tre exprim ainsi :
A1 : pour toute loterie l, si toutes les loteries dune suite ln de
loteries sont prfres l et si cette suite admet une limite lo,
alors cette limite est prfre l.
73
une loterie (rsultat alatoire) dont les lots sont les dcisions
momentanes. Dans le cas o la seconde dcision consiste
procder au second forage, le lot correspondant de la premire
loterie est une nouvelle loterie. Prenons-en un autre exemple :
si l et l sont deux loteries et si on tire pile ou face laquelle
des deux on joue, on obtient une nouvelle loterie. On peut noter
1/2 l + 1/2 l cette nouvelle loterie. Par exemple :
Soit l et l les loteries dfinies par :
Il sera admis (il sagit en fait dun axiome) que cette loterie est
identique :
74
Laxiome dindpendance semble tout aussi naturel que
le prcdent sur de nombreux exemples, comme le suivant :
supposons que vous prfriez le lot a (ce peut tre un billet de
loterie, mais aussi une voiture ou bien un voyage en Tha-
lande) au lot b (une bicyclette), si vous prfrez la loterie l de
lexemple prcdent la loterie l, vous devez aussi prfrer la
loterie l1 obtenue partir de l en remplaant le lot 10 par le lot
a, la loterie l1 obtenue partir de l en remplaant le lot 10
par le lot b. Cela semble assez naturel ; pourtant, le paradoxe
dAllais, que nous exposerons au chapitre VIII, montre que cette
exigence a des implications qui ne sont pas toujours vrifies
par les dcideurs.
Laxiome dindpendance qui donne la reprsentation une
proprit de linarit est le suivant : A2 : tant donn deux
loteries l et l telles que l est prfre l, et un nombre t
compris entre 0 et 1, pour toute troisime loterie l, la loterie
compose tl + (1 t)l doit tre prfre tl + (1 t)l.
Avec ce dernier axiome, on dmontre quil est possible
dcrire V comme lesprance mathmatique de lutilit U (voir
par exemple Kast [1991], chapitre 4). Considrons une loterie,
soit l, qui donne la consquence c la probabilit p, la cons-
quence c, la probabilit p et la consquence c la probabi-
lit p, avec p + p + p = l, de sorte que toutes les autres
consquences ont pour probabilit 0. Alors, si les prfrences
reprsentes par la fonction V vrifient les trois axiomes, on
peut crire : V(l) = pU(c) + pU(c) + pU(c).
Ainsi, dans lexemple prcdent, si on suppose que
U(10) = 10, U(0) = 5, U( 5) = 2 et U( 10) = 0, on peut
calculer :
V(l) = 1/4 x 10 + 3/4 x 2 = 4
V(l) = 1/3 x 10 + 1/3 x 5 + 1/3 x 0 = 5
do on dduit :
V(1/2 l + 1/2 l) = 1/2 V(l) + 1/2 V(l) = 1/2 x 5 + 1/2 x 4 = 9/2
La fonction U, de mme que la fonction V, nest pas unique.
En effet, les deux premiers axiomes impliquent que de telles
fonctions existent, mais il est clair que toutes fonctions crois-
santes de ces fonctions reprsentent aussi bien les prfrences.
Le troisime axiome limite ces possibilits puisquon dmontre
que seules les fonctions affines de U, cest--dire les fonctions
de la forme aU + b, o a est un nombre positif et b un nombre
quelconque, reprsentent aussi de telles prfrences. (Les
nombres a et b sont dtermins par lattribution arbitraire de
75
valeurs deux consquences, les valeurs 10 et 0 aux cons-
quences 10 et 10 dans notre exemple.)
De ce fait, au lieu de la simple utilit ordinale que don-
nent les deux premiers axiomes, le troisime permet de dfinir
ce quil est convenu dappeler une utilit cardinale, cest--
dire une utilit qui permet de mesurer les diffrences entre les
prfrences.
Cest cette proprit de cardinalit qui donne la thorie de
lutilit espre sa potentialit dans ltude des problmes de
dcision en situation de risque, puisquelle permet de mesurer
laversion pour le risque que rvle le dcideur, dont on a pu
dterminer la fonction dutilit.
76
Dans le cas de situation de risque, chaque dcision corres-
pondait une distribution de probabilit sur les consquences
( la roulette, choisir de miser sur le 12 correspond choisir la
distribution de probabilit sur les consquences : 1/37 sur 360 ;
0 sur 20 ; 36/37 sur 10). Dans la situation dincertitude que
nous considrons ici, chaque dcision ne correspond plus qu
une relation entre les vnements et les consquences (miser
10 euros sur le cheval numro 12, plac 36 contre 1, a pour
consquences : 360 si le 12 gagne, 10 sinon et il ne pourra
pas avoir 20 comme consquence). Cette relation est dfinie
par la fonction consquence c : AxW r C, et, une action
a V A correspond la fonction c(a, .) : W r C. Une telle rela-
tion (fonction de W dans C) est appele un acte par Savage.
Dfinir un critre sur les dcisions est quivalent en dfinir
un sur les actes et, par consquent, le dcideur doit avoir des
prfrences sur ces actes.
Examinons sur un exemple la signification des actes . Un
investisseur doit faire une srie de placements pour lesquels il
russit faire passer les ordres ou non, selon son attention aux
opportunits du march ( et la disponibilit tlphonique de
son agent de change). Sa dcision porte sur leffort quil
fournit, quant aux tats alatoires, ils sont lis une multitude
de facteurs impondrables que nous rsumons par :
il russit faire passer les ordres : que nous appellerons
oui ;
il ne russit pas : que nous appellerons non .
Nous allons considrer les deux actes suivants :
acte 1 : obtenir un portefeuille final intressant si oui et,
si non , faire un investissement risqu qui rapporte :
1
Mi 100,00 ou Mi 0,00 avec une probabilit (connue) de ;
2
acte 2 : recevoir Mi 100,00 si oui et recevoir Mi 0,00
si non (ce qui revient, pour le dcideur, parier Mi 100,00
quil russira faire passer ses ordres).
Si le premier acte est prfr au second, par exemple, et
quon peut dfinir une valeur pour chacun de ces actes qui se
dcompose comme des esprances dutilit, on pourra tirer cer-
taines conclusions. Par exemple, si lutilit du gain est iden-
tique au gain lui-mme et si lesprance de la valeur du
1 1
portefeuille final est R, on aura (puisque 100 + 0 = 50) :
2 2
77
valeur de lacte 1 : proba (oui) R + proba (non) 50 ;
valeur de lacte 2 : proba (oui) 100 + proba (non) 0.
Dans ces expressions, la probabilit de russir ou non est
rvle par la prfrence de lagent et la valeur de lacte, et non
linverse. Ainsi, si lacte 1 est prfr lacte 2, on peut en
dduire que :
proba (oui) R + proba (non) 50 1
proba (oui) 100 + proba (non) 0,
soit :
100 R
proba (non) 1 proba (oui) .
50
Cest--dire que le dcideur pense quil est peu probable
quil russisse.
Les axiomes de Savage permettent la fois de dfinir une
fonction dutilit sur les consquences et une distribution de
probabilit (subjective) sur les alas. Pour cela, un ensemble
des vnements pertinents qui permette de dfinir une distribu-
tion de probabilit doit tre pris en considration ; nous lappel-
lerons e. Cet ensemble doit tre une tribu (cest--dire que W
et n doivent tre dans e ainsi que toute runion dnombrable
dvnements et que le complmentaire de tout vnement).
Nous appellerons A lensemble des actes, cet ensemble sur
lequel la relation de prfrence est dfinie doit aussi tre
assez complet, cest--dire quil doit contenir :
les actes dits en escalier , cest--dire ceux qui sont
constants sur des vnements qui forment une partition de W,
comme lacte f suivant :
y Ei = W et Gi Gj EiYEj = n et Gi GwVEi f(w) = ci.
(Les actes constants sont des cas particuliers des actes en
escalier puisquils associent une mme consquence tous les
alas ; nous les assimilerons cette consquence et la relation
de prfrence sur les consquences est une restriction de celle
sur les actes.)
Les greffes formes de la combinaison de deux actes
partir dun vnement : si a et b sont deux actes et E est un
vnement, lacte g dfini par g(w) = a(w) si w V E et g(w) =
b(w) si w c E, doit aussi appartenir A.
Le premier axiome de Savage prcise ces conditions et la
proprit de la relation de prfrence que nous avions dj ren-
contre dans le prcdent axiome A0 : elle doit permettre de
comparer tous les actes.
78
Le second axiome est appel axiome dindpendance comme
notre prcdent axiome A2 qui en est un cas particulier dans
les situations de risques. Cet axiome ou axiome de la chose
sre exprime que les prfrences entre deux actes ne dpen-
dent pas des vnements sur lesquels ils sont identiques. Il
permet de dfinir une nouvelle relation de prfrence, appele
prfrence conditionnelle, dfinie relativement chaque
vnement.
Soit E un vnement et a et b deux actes, nous dirons que a
est prfr b conditionnellement E, ce que nous noterons
a Eb, si et seulement si pour tout couple dacte a et b tels
que :
a concide avec a sur E,
b concide avec b sur E,
et a concide avec b sur le complmentaire de E,
alors a b.
Il est facile de voir que les prfrences conditionnelles
constituent aussi des prordres totaux ; ces prordres doivent
tre cohrents avec la relation de prfrence sur les cons-
quences, cest ce que prcise le troisime axiome.
Deux autres axiomes prcisent la relation entre les prf-
rences sur les actes et sur les consquences.
Enfin, la thorie de Savage ncessite deux axiomes tech-
niques assurant aux probabilits subjectives, qui seront dfinies
par la reprsentation des prfrences, dtre bien des distribu-
tions de probabilit.
De ces sept axiomes, il est possible de dduire le thorme
de Savage qui, en substance, prouve que des dcideurs respec-
tant ces axiomes se comportent comme sils maximisaient une
utilit espre calcule par rapport une distribution de proba-
bilit subjective (personnelle). Le thorme peut sexprimer
ainsi :
Thorme : Si les prfrences sur les actes dfinis sur un
espace probabilisable (W, e) vrifient les sept axiomes de
Savage, il existe une distribution de probabilit unique P sur
(W, e) et une fonction dutilit de von Neumann-Morgenstern
U sur les consquences telles que les prfrences sur les actes
soient reprsentes par une fonction W dfinie comme lesp-
rance mathmatique de lutilit par rapport la distibution
subjective P.
Nous verrons au chapitre VII une version du mme thorme
fonde sur une axiomatique diffrente, mieux adapte, notre
79
sens, au problme de la dcision statistique qui est un problme
de dcision dans une situation dincertitude particulire : incer-
titude sur un paramtre dfinissant la distribution de probabilit
qui rgit un phnomne alatoire.
80
prsent ses applications directes la mesure de laversion
pour le risque au chapitre VI.
Toutefois, insistons sur le fait que, fonde sur des axiomes,
elle ne peut prtendre sappliquer tout dcideur. Si le compor-
tement dun dcideur viole certains axiomes, le critre de luti-
lit espre ne reprsentera pas ses prfrences, nous verrons
dautres thories qui peuvent alors tre invoques, au
chapitre VIII.
VI / Le risque
82
1. Aversion pour le risque, quivalent certain
83
Dune manire gnrale, si nous notons EC(l) lquivalent
certain dune loterie l, et V(l) son utilit espre, nous avons :
U [EC(l)] = V(l).
La notion dquivalent certain permet de comparer des
loteries et, dune manire plus gnrale, des situations de
risque. Elle permet aussi de dterminer lattitude face au risque
dun agent dont la fonction dutilit est connue. Rciproque-
ment, en observant lattitude face au risque dun agent et ses
quivalents certains, il devient possible de caractriser sa fonc-
tion dutilit.
Prenons lexemple dune compagnie dassurances, une
mutuelle en situation de monopole rgional, pour liminer les
problmes de concurrence et de profits qui ne nous concernent
pas ici. Supposons que cette compagnie est mme de financer
les remboursements de sinistres dincendie annuels sur les
primes verses par les assurs. Elle peut alors calculer cette
prime en fonction de la valeur assure et de la probabilit
dincendie de manire quitable : si votre maison vaut
1 000 000 deuros, et la probabilit quelle soit dtruite par le
feu est 0,001, la prime propose pour une assurance totale sera
de 1 000 euros. En effet, si la compagnie a suffisamment
dassurs, elle ne fera pas face des risques de pertes (le mon-
tant des primes compensant les remboursements de sinistres) et
se conduira donc comme sil ny avait pas de risque : elle
est indiffrente au risque dincendie. Elle calcule alors la
prime en faisant la moyenne des gains et des pertes :
1 000 000 0,001 + 0 0,999 = 1 000.
Nous dirons quun agent est indiffrent au risque lorsquil
est indiffrent entre une loterie et le gain moyen que lui procure
cette loterie, autrement dit sil est prt payer le gain moyen
pour un billet de cette loterie. Lquivalent certain dune loterie
pour un tel agent est donc son gain moyen. Prenons une loterie
de la forme :
revenu a avec une probabilit p ;
revenu b avec une probabilit 1 p.
Nous avons donc : EC = p a + (1 p) b, soit :
p U(a) + (1 p) U(b) = U(EC) = U(p a + (1 p) b).
Lutilit espre de la loterie est lutilit du revenu moyen ;
de ce fait, son quivalent certain est gal son revenu moyen
la [fonction dutilit U est inversible, on a donc EC = p a
+ (1 p) b]. La formule prcdente caractrise une fonction U
84
dont le graphe est une droite [la fonction U est ncessairement
de la forme : U(x) = ax + b].
Lindiffrence au risque est donc caractrise par une fonc-
tion dutilit linaire (affine, en fait) : son graphe est une droite
(figure 1 ci-dessous). Pour une telle fonction, lutilit marginale
est constante : le gain dutilit obtenu en ajoutant 1 euro une
richesse de 1 000 euros est identique celui obtenu en ajoutant
1 euro un niveau de richesse de 10 euros.
85
Une telle relation, qui dfinit la propension au risque, carac-
trise une fonction dutilit convexe (figure 2). Pour une telle
fonction, lutilit marginale est croissante : le gain dutilit
obtenu en ajoutant 1 euro une richesse de 1 000 euros est
suprieur celui obtenu en ajoutant 1 euro un niveau de
richesse de 10 euros.
86
logarithme en est un exemple. Pour une telle fonction, lutilit
marginale est dcroissante : le gain dutilit obtenu en ajoutant
1 euro une richesse de 1 000 euros est infrieur celui obtenu
en ajoutant 1 euro un niveau de richesse de 10 euros.
87
o s2 est la variance de la distribution et U et U les deux
premires drives de la fonction dutilit U par rapport la
richesse x. La fonction dutilit est croissante, donc U(x) 1 0,
et si lagent a de laversion pour le risque, la fonction dutilit
est concave, donc U(x) ! 0.
Lindice absolu daversion pour le risque au voisinage dun
niveau x de richesse est alors :
U(x)
r(x) = .
U(x)
Le thorme de Pratt permet de dire quun agent qui a un
indice absolu daversion pour le risque au niveau x gal r(x) a
davantage daversion pour le risque quun agent qui a un indice
r(x), si r(x) ! r(x). Si le premier agent a une fonction dutilit
logarithmique U(x) = ln(x), son indice daversion pour le risque
1
au niveau de richesse 100 est : 100 = 0,01. Un
10 000
100x
autre agent qui aurait une utilit dfinie par U(x) =
100 + x
1
aurait un indice daversion pour le risque de 4 = 0,005.
800
Le second agent prsente donc moins daversion pour le risque
que le premier, il sera prt accepter plus de risque dans ses
dcisions et payer moins cher des contrats dassurance pour le
mme risque.
3. Mesures du risque
88
suivante. Une distribution l est plus risque quune distribution
l de mme moyenne, si la premire est obtenue par une trans-
formation alatoire de la seconde. Par exemple, une distribution
sur des revenus :
89
rgulire, comme la fonction G. Une distribution P, dont la
fonction de rpartition est F, domine stochastiquement une dis-
tribution P dont la fonction de rpartition est G [dfinie par :
G(x) = Q(] q, x])] si pour tout nombre rel x, F(x) ^ G(x).
Une notion de dominance plus faible est la dominance sto-
chastique dordre 2 ; au lieu de comparer les courbes des fonc-
tions de rpartition, on compare les surfaces quelles dlimitent
avec laxe horizontal.
LA FONCTION DE RPARTITION F
DOMINE STOCHASTIQUEMENT LA FONCTION G
90
En effet, si la fonction dutilit est quadratique : U(x) = ax
bx2, lutilit espre, E[U(x)] = aE[x] bE[x2] = aE[x] +
bE2[x] bVar[x] sera, maximale si E[x] est maximale et Var[x]
est minimale.
Toutefois, la variance est une mesure du risque insatisfai-
sante, comme le montre lexemple suivant reprsentant les dis-
tributions de deux portefeuilles :
Conclusion
91
analyses plus fines et mieux adaptes un problme de dci-
sion individuel, il est ncessaire de mettre en jeu une reprsen-
tation du comportement du dcideur. Le critre de lutilit
espre est une reprsentation des prfrences de dcideurs en
situation de risque. Dans la mesure o un dcideur adhre aux
axiomes de la thorie de lutilit espre, la forme de sa fonc-
tion dutilit permet de caractriser son aversion, et, locale-
ment, son degr daversion pour le risque. Grce ces
caractrisations, il sera possible de rpondre des questions du
type :
Dois-je accepter de souscrire un contrat dassurance pour
la prime propose ?
Quelles proportions des actifs disponibles sur le march
financier dois-je inclure dans mon portefeuille ?
Est-il valable dentreprendre une tude plus approfondie de
la situation afin de prciser la distribution de probabilits sur
les consquences de ma dcision ? (Quelle est la valeur de
linformation que je pourrai recueillir ?)
Quelle stratgie adopter face un adversaire dont je peux
mesurer laversion (ou la propension) au risque au vu de ses
dcisions passes ?
Etc.
Pour des agents dont le comportement viole certains des
axiomes, nous devons chercher lappui de thories alternatives
celle de lutilit espre ; nous en proposons au chapitre VIII.
Dans tous les cas, nous aurons besoin destimer les paramtres
qui prcisent les distributions de probabilits ; cest lobjet de
la dcision statistique que nous abordons au chapitre suivant.
VII / Dcisions statistiques
93
statisticiens classiques par le fait quils accordent de
limportance des informations qui ne sont pas de nature sta-
tistique et quils font, de ce fait, intervenir des probabilits
subjectives.
Bien que les mthodes statistiques puissent tre utilises
des fins purement informationnelles dans un premier temps, les
sondages, lanalyse de donnes, les estimations de pourcen-
tages et dautres paramtres de distribution de probabilits sont
employs par des dcideurs : planificateurs gouvernementaux,
responsables du marketing, thrapeutes, etc. Tout problme de
dcision qui ne se pose pas, au dpart, dans une situation de
risque en contient en fait deux : un problme de dcision statis-
tique dont la solution sera la caractrisation de la distribution
de probabilits qui sera utilise pour rsoudre le problme de
dcision proprement dit.
Nous analyserons, dans un premier temps, le problme de la
dcision dans une situation dincertitude particulire que nous
qualifierons de statistique . Dans un second temps, nous
reviendrons sur les problmes de dcisions statistiques, comme
ils sont prsents dans les ouvrages de statistique mathma-
tique, cest--dire considrs isolment dun problme plus
gnral de dcision.
1. Le problme de dcision
en situation dincertitude statistique
94
une loi (approximativement) normale de variance 1 et de
moyenne inconnue q. Si q tait connu, nous serions en situa-
tion de risque et nous dciderions du prix en maximisant luti-
lit espre de notre profit. Cela nous donnerait, pour chaque
valeur de q, un prix P*(q). Les prix, P(d) et P*(q), sont opti-
maux selon nos prfrences dans le certain ou dans le risque, ils
sont nos meilleures rponses ce que notre service statistique
pourrait nous dire :
faites comme si d = 3,4. Nous proposerions alors le produit
au prix P(3,4), avec le risque que la vraie valeur de d soit 3,5,
par exemple ;
faites comme si la distribution de d tait une loi normale
de moyenne 4,1. Nous proposerions alors le produit au prix
P*(4,1), avec le risque que la vraie valeur du paramtre soit 4,
par exemple.
Nous traiterons de la manire dont notre service statistique
dcide de nous proposer une valeur pour q au paragraphe sui-
vant ; nous nous concentrons ici sur le problme de dcision
en situation dincertitude sur q, incertitude que nous qualifions
de statistique . En effet, lincertitude sur la distribution de
la variable alatoire, cest--dire lincertitude sur la fiabilit de
notre service statistique, ne nous autorise pas ncessairement
utiliser le critre dfini en situation de risque (utilit espre
du profit) qui, lui-mme, est diffrent de celui que nous utili-
serions sans incertitude (le profit). Les deux risques (risque de
nous tromper en utilisant la rponse du service statistique) ne
sont pas de mme nature : ils correspondent deux niveaux
dincertitude diffrents. Lincertitude statistique peut tre
comprise comme un niveau dincertitude suprieur celui des
situations de risque. La hirarchie des niveaux dincertitude
que nous suggrons aurait pour niveau zro la situation extrme
o il ny a pas dincertitude (d est connu ou considr comme
tel). Le niveau dincertitude suprieur serait celui que nous
avons dcrit prcdemment comme une situation de risque :
lorsque les consquences dpendent de variables alatoires
dont les distributions sont connues, les dcideurs devront tre
en mesure de comparer des distributions sur les consquences.
En effet, dans ces situations, chaque dcision correspond une
distribution induite sur les consquences (les profits dans notre
exemple). Cest pour ces situations de risque que la thorie de
lutilit espre a t dveloppe. Cette thorie intgre les pr-
frences et lincertitude en un critre unique : lesprance (par
95
rapport la distribution de probabilit connue) de lutilit (sur
les consquences).
Le niveau dincertitude statistique est celui o la distribution
sur les alas nest pas (ou mal) connue. Toutefois, le dcideur
considre quil y en a une et quelle pourrait tre dfinie par
un paramtre (ce paramtre peut tre un vecteur ou une fonc-
tion ; dans notre exemple, cest la moyenne, q, dune distribu-
tion normale). Dans ce cas, lincertitude du dcideur porte la
fois sur les alas, rgis par une loi normale, et sur le para-
mtre quest la moyenne de cette loi. Cest en ce sens que ces
situations peuvent tre considres comme prsentant plus
dincertitude que celles o la distribution est connue. Dans de
telles situations, la distribution sur les alas nest pas connue,
mais elle est suppose exister. Pour formaliser le fait que la dis-
tribution nest pas connue, il est dusage de dire quelle appar-
tient un ensemble de distributions possibles, ensemble index
par des paramtres parmi lesquels le problme de dcision sta-
tistique consiste dterminer le vrai . Si on note q le para-
mtre et Q lensemble des paramtres possibles, on notera
P = (Pq)qVQ la famille des probabilits qui peuvent rgir les
alas. Lorsque P est la famille des lois normales, comme
celles-ci sont compltement caractrises par les paramtres
que sont leur moyenne, m, et leur variance, v, nous aurons
Q = {(m,v) / m V R, v V R + } 2.
Nous pouvons prsent aborder le problme de dcision en
situation dincertitude statistique. Si le paramtre tait connu,
cest--dire si la distribution P sur lensemble W des alas tait
connue, nous serions dans une situation de risque. Dans ce cas,
chaque dcision correspondrait une distribution sur
lensemble C des consquences induite par la fonction c :
AxW r C, qui chaque action choisie et chaque rsultat ala-
toire associe une consquence. Au choix de laction a corres-
pond la distribution que nous pouvons noter Pa sur lensemble
C des consquences.
Dans une situation dincertitude statistique, la distribution Pq
nest pas connue puisque le paramtre q ne lest pas. Dans de
2. Lusage veut que les indices q ne soient appels paramtres que dans le
cas o Q est un ensemble de vecteurs de dimension finie ; on parle dans ce cas de
statistique paramtrique, de statistique non paramtrique dans les cas plus gn-
raux. Pour simplifier lexpos, nous appellerons Q lensemble des paramtres
dans tous les cas ; cest lui qui, avec lensemble des rsultats de lexprience ala-
toire (not W), caractrise lincertitude statistique.
96
telles situations, au choix dune dcision correspond une fonc-
tion qui, chaque paramtre, associe une distribution sur les
consquences.
Considrons un problme dinvestissement dont les rende-
ments sont alatoires et peuvent prendre toutes valeurs selon
une loi normale dont la moyenne est q % de la quantit investie
et la variance est connue, disons 1. chaque valeur de q cor-
respondront une distribution sur les rendements et, donc, une
distribution sur les consquences des investissements. Dans le
cas gnral, au choix dune action a correspond une fonction
qui, chaque valeur de q, associe la distribution Pq. Lagent
a
97
dagrgation des utilits par une distribution. Elle lutilise dj
au niveau des actes. En ajoutant deux axiomes ceux de la
thorie de lutilit espre, lexistence dun critre qui repr-
sente les prfrences peut tre dmontre. Ce critre fait inter-
venir une distribution de probabilits sur les paramtres. Ces
paramtres sont donc traits comme sils taient alatoires et
la distribution que rvle le critre (cest--dire, en fait, le
comportement du dcideur) est interprte comme une distribu-
tion subjective. Si le paramtre q tait connu, le critre serait
lesprance (par rapport la distribution Pq) de lutilit des
consquences (lindex de Bernoulli). Lorsque le paramtre q
est inconnu, une distribution sur les paramtres, disons n, est
rvle par le dcideur et le critre est alors lesprance (par
rapport n) de lindex de Bernoulli.
Par exemple, pour un problme dinvestissement dont les
rendements suivent une loi normale de variance 1 et de
moyenne q fois la quantit investie, disons x, lutilit espre
serait : V(x/q) = @ U(x) f(x/qx)dx, o f(x/qx) est la densit de
la loi normale de moyenne qx. Supposons que le dcideur se
comporte comme si q ne pouvait prendre que deux valeurs
10 % et 5 % avec les probabilits 1/4 et 3/4, son critre serait
alors : W(x) = 1/4V(x/10 %) + 3/4V(x/5 %).
Lincertitude sur les paramtres est intgre par la somme
pondre des index de Bernoulli, qui, eux-mmes, intgrent
lincertitude sur les rendements pour chaque valeur des
paramtres.
Les problmes de dcisions statistiques sont des cas particu-
liers de problmes de dcision en situation dincertitude statis-
tique. Pour les statisticiens, la dcision prendre consiste
dterminer le ou les paramtres. La consquence de la dci-
sion est gnralement considre comme un cart entre la
vraie valeur (inconnue) du paramtre et celle qui est dter-
mine par linfrence (la dcision) statistique. Cet cart, ou
perte, est gnralement dtermin par des considrations de
commodits de calcul et de proprits mathmatiques. Un
comportement rationnel voudrait cependant quil corresponde
lutilit espre du commanditaire de ltude statistique.
98
2. Infrence statistique
99
celui qui consiste tirer au hasard des individus de la popula-
tion pour former lchantillon. Ainsi, si le paramtre estimer
est la proportion de mles dans une population de mouches
nes dans un certain environnement, un chantillon de cent
mouches peut tre prlev et la proportion de mles dans cet
chantillon est la proportion empirique. Si la population tait de
cent mouches, ce serait la vraie proportion. Si la popula-
tion est trs grande (considre comme infinie), cette propor-
tion empirique nest pas la vraie proportion, mais la loi des
grands nombres prouve quelle sen approche lorsque la taille
de lchantillon crot. En pratique, un chantillon de cent
mouches donnera une trs bonne approximation de la vraie pro-
portion ; un chantillon de dix mouches sera gnralement peu
fiable.
Un chantillon est donc une liste dobservations de variables
alatoires. Une dcision statistique consiste choisir une fonc-
tion de ces observations. Dans les exemples prcdents, cette
fonction tait la proportion empirique. partir dune liste de
cours boursiers, la dcision consistera gnralement calculer
le cours empirique moyen et la variance empirique de ces cours
qui sont fonction des rsultats de lchantillon. Les rsultats de
la statistique mathmatique montrent que certaines de ces fonc-
tions ont de bonnes proprits et prcisent la fiabilit des dci-
sions statistiques quelles permettent de prendre en fonction de
la taille de lchantillon. Ainsi, la proportion empirique et la
moyenne empirique sont de bons estimateurs des para-
mtres correspondants de la vraie distribution. En revanche,
la variance empirique nest pas un bon estimateur de la
variance parce quelle prsente un biais. La question qui se
pose est donc : comment choisir un bon estimateur de la
variance, cest--dire une fonction des observations qui per-
mette destimer la variance de la manire la plus satisfaisante
possible ?
La thorie de la dcision nous a montr que, pour rpondre
cette question, il fallait une dfinition des consquences de
la dcision et de leurs utilits. En statistique, lutilit des cons-
quences est appele la perte . Cest, au contraire de ce que
nous avons fait jusquici, une valeur minimiser. En pratique,
la perte est gnralement dfinie par le carr de la diffrence
entre la valeur estime du paramtre et sa vraie valeur, si le
paramtre est un nombre (sil sagit dun vecteur de para-
mtres, cest le carr de la distance qui dfinit la perte).
100
Ainsi, si au vu de lchantillon X, la dcision d(X) est prise,
la perte sera (d(X) q)2 si q est la vraie valeur du paramtre.
Comme lchantillon est alatoire, cest, en accord avec la
thorie de lutilit espre, lesprance mathmatique de la
perte quil faudra minimiser. Si q est la vraie valeur du para-
mtre, la distribution qui rgit les observations sera Pq, et
lesprance mathmatique de la perte sera cacule par rapport
Pq.
Prenons lexemple simple dune proportion inconnue de
mles dans une population de mouches ; q est cette propor-
tion. partir de lchantillon X de taille n, si la dcision
consiste prendre la proportion empirique et si le nombre de
mles de lechantillon est m(X), la dcision sera
d(X) = m(X)/n. La perte sera donc : L(d/q) = [d(X) q]2 =
[m(X)/n q]2. La vraie valeur de la proportion tant q, la pro-
babilit que le nombre de mles dans lchantillon soit m(X)
est donne par la distribution binmiale de paramtres n et q.
Lesprance de la perte sera calcule par rapport cette distri-
bution : R(d/q) = EB(n, q) [L(d/q]). Lesprance de la perte est
appele le risque (risque de prendre la dcision d, si q est la
vraie valeur du paramtre) ; comme la perte, il dpend de q, et
cest une fonction quil faut minimiser.
partir de ces remarques gnrales, les problmes de dci-
sions statistiques sont traits de manires diffrentes selon la
thorie dite classique et la thorie baysienne .
La statistique classique propose un certain nombre de cri-
tres permettant de ranger les dcisions sur la base de consid-
rations pragmatiques et des (bonnes) proprits mathmatiques
des estimations obtenues. Elle doit son label de classique
ce que, conformment aux mthodes statistiques du sicle der-
nier, elle cherche ne fonder ses conclusions que sur la seule
base des rsultats observs.
La statistique baysienne se fonde sur la thorie de la dci-
sion en situation dincertitude statistique pour dfinir un critre.
En statistique classique, lespace des paramtres nest pas
considr comme un ensemble probabilisable, les classiques
rejetant la notion de probabilits subjectives (ou personnelles,
ou ordinales, ou a priori). Le critre le plus connu en statistique
classique permet de prendre une dcision partir des fonc-
tions de risque, cest le critre MiniMax (ou critre de Wald,
voir chapitre IV) : choisir une dcision qui minimise le risque
maximal. Les statisticiens classiques utilisant ce critre
101
chercheront donc la valeur de q pour laquelle le risque R(d/q)
est maximal mettons que ce soit un certain q et ils choi-
siront la dcision d qui minimise R(d/q).
En statistique baysienne, lespace des paramtres est consi-
dr comme probabilisable, la distribution qui sera dfinie
dessus est introduite par le critre reprsentant les prfrences
du dcideur sur les actes, comme nous lavons vu au para-
graphe prcdent. Le critre est alors le risque baysien, cest-
-dire lesprance du risque par rapport une distribution
subjective sur les paramtres. En pratique, cette distribution
sera choisie a priori (elle est, de ce fait, souvent appele distri-
bution a priori) sur la base dinformations non statistiques (et,
disons-le sans ambages, parmi des distributions qui facilitent
les calculs !). Les statisticiens baysiens choisiront donc la
dcision qui minimise lesprance du risque par rapport la
distribution a priori : En[R(d/q)] o n est la distribution a
priori. En interprtant la perte ( minimiser) comme loppos
dune utilit ( maximiser), on reconnat bien l lexpression du
critre dfini par la thorie de la dcision en situation dincerti-
tude statistique.
Conclusion
102
ncessairement le mme que celui quil aurait face un jeu de
roulette, par exemple. Pour bien faire, il faudrait que le statis-
ticien prenne en compte lutilit du dcideur face lincerti-
tude statistique, en lintgrant au critre quil utilise pour
estimer les paramtres. Le type de problmes poss par cette
interaction ncessaire entre le statisticien et le dcideur qui en
utilise les rsultats est connu sous le nom de risque destima-
tion (voir notamment Bawa V., Brown J. et Klein D. [1979]) ;
nous ne le mentionnons ici que dans le but dattirer lattention
sur les prcautions prendre en traitant un problme de dci-
sion en situation dincertitude statistique comme sil se posait
en situation de risque.
VIII / Gnralisation des critres
et des thories
104
Saint-Ptersbourg. La construction de la thorie de la dcision
par gnralisations successives de thories qui rsolvent les
paradoxes poss par les anciennes sest naturellement pour-
suivie. Le terme paradoxe doit cependant tre entendu ici
dans le sens dune opinion qui contredit une opinion reue
(dfinition du dictionnaire Robert) et stend donc toutes les
observations de comportements qui contrediraient celui que
recommanderait une thorie normative. Il est donc important de
signaler, dfaut de les exposer, que, depuis la prsentation du
paradoxe dAllais, de nombreuses recherches se sont attaches
construire des exprimentations mettant en vidence les
comportements de dcideurs. Ces expriences, menes la fois
par des psychologues, des conomistes et des statisticiens, ont
donn des directions suivre par les thoriciens de la dcision
afin de trouver des axiomatiques mieux adaptes aux compor-
tements observs et permettant la construction dautres critres
de dcision.
Savage a gnralis la thorie de lutilit espre au cas de
lincertitude non probabilise. Bien quil ait t un ardent
dfenseur de sa thorie, il nous fournit dans son ouvrage
(Savage [1954], p. 102) la justification des trente ans de
recherches qui ont permis de proposer des thories expliquant
les paradoxes que nous exposons ci-dessous : Si, aprs une
dlibration approfondie, quiconque maintient des prfrences
qui soient en conflit avec le principe de la chose sre 1, il doit
abandonner ou modifier ce principe : car ce type de contradic-
tion semble intolrable dans une thorie normative.
1. Les paradoxes
Le paradoxe dAllais
Un exemple simple de comportement en contradiction avec
la maximisation dune utilit espre est celui dun dcideur, le
lecteur peut-tre, qui prfre A B et Y X, o :
A est un billet de loterie donnant droit 15 000 euros avec
probabilit 0,09 ou 0 euro avec probabilit 0,91 ;
B est un billet de loterie donnant droit 10 000 euros avec
probabilit 0,1 ou 0 euro avec probabilit 0,9.
105
Le paradoxe dAllais tait fond V(X) = U(1 000 000)
lorigine sur un exemple un peu moins V(Y) = 0,01U(0) + 0,1U (50 000 000)
simple que celui que nous avons pr- + 0,89U(1 000 000)
sent : lincertitude est engendre par V(A) = 0,01U(1 000 000) +
le tirage au hasard dune boule qui est 0,1U(1 000 000) + 0,89U(0)
dans une urne contenant 100 boules V(B) = 0,01U(0) + 0,1U(50 000 000)
numrotes. On distingue les trois + 0,89U(0)
vnements : le numro de la boule Du fait que la fonction dutilit peut
tire est 0, est compris entre 1 et 10, tre normalise (si U reprsente les
est compris entre 11 et 99. prfrences, aU + b les reprsente
X donne droit 1 000 000 de aussi), posons U(0) = 0 et
francs 1 dans tous les cas ; U(50 000 000) = 1.
Y donne droit 0 franc dans le Si A est prfr B, on doit avoir :
premier cas, 50 000 000 de francs V(A) 1 V(B) soit 0,11U(1 000 000)
dans le deuxime, et 1 000 000 de 1 0,1, ce qui implique U(1 000 000) 1
francs dans le troisime ; 1/11.
A donne droit 1 000 000 de Or, puisque Y est prfr X,
francs dans le premier cas, 1 000 000 on doit aussi avoir : V(Y) 1 V(X),
de francs dans le deuxime, et 0 franc soit 0,1 + 0,89U(1 000 000) 1
dans le troisime ; U(1 000 000), ce qui implique :
B donne droit 0 franc dans le 0,11U(1 000 000) ! 0,1, soit
premier cas, 50 000 000 de francs U(1 000 000) ! 1/11, do la
dans le deuxime, et 0 franc dans le contradiction.
troisime.
Or, le calcul de lutilit espre de
chacun de ces actes donne pour toute 1. La monnaie franaise tait
fonction dutilit U : alors le franc.
106
probabilit 0,9 : cest tl + (1 t)l, o l = Y,t = 0,1 et l = 0
avec certitude. En vertu de laxiome dindpendance, ce billet
de loterie doit tre prfr tl + (1 t)l o l = X, cest-
-dire quil doit tre prfr au billet de loterie qui donne droit
au billet X avec probabilit 0,1 et 0 avec probabilit 0,9. Or,
le premier billet donne droit 10 000 euros avec probabilit 0,1
ou 0 euro avec probabilit 0,9 : il est quivalent au billet B.
Le second billet donne droit 15 000 euros avec probabilit
0,09 ou 0 euro avec probabilit 0,91 : il est quivalent au
billet A qui tait pourtant prfr B.
Ce paradoxe a conduit certains chercheurs essayer daffaiblir
laxiome dindpendance et chercher une thorie plus gn-
rale que celle de lutilit espre.
Le paradoxe dEllsberg
107
probabilits sont : P(Rouge) = 1/3, elle est connue et donc
objective ; P(Blanche) et P(Noire) qui ne sont pas connues de
manire objective. On sait seulement quelles ne peuvent tre
1/2 car la somme des trois ne serait pas 1 ; elles sont comprises
entre 0 et 2/3.
Lordre de prfrence implique :
puisque E est prfr F, comme lutilit espre de E
est 100 P(Rouge) et que celle de F est 100 P(Blanche), on
doit avoir : P(Rouge) 6 P(Blanche) ;
puisque H est prfre G, comme lutilit espre de H
est 100 P(Blanche) + 100 P(Noire) et que celle de G est
100 P(Rouge) + 100 P(Noire), on doit avoir : P(Blanche) +
P(Noire) 6 P(Rouge) + P(Noire).
Mais cela implique que P(Blanche) 6 P(Noire), ce qui
contredit le fait que E soit prfre F !
Par ce paradoxe, cest le principe de la chose sre
appliqu une situation dincertitude (et non plus seulement de
risque) qui est remis en cause. La mesure de la vraisemblance
des vnements par une probabilit (cest--dire une mesure
additive au sens o la probabilit de la runion de deux
ensembles disjoints est la somme de leurs probabilits) nest
sans doute pas celle qui est adapte des situations comme
celle de lexemple. Les recherches rcentes ont donc port sur
la gnralisation de la thorie de Savage en pondrant autre-
ment que par des probabilits les vnements pertinents dans
un problme de dcision.
2. Les gnralisations
108
contexte de dcision dans le risque, alors que, dans la thorie
de lutilit espre, elle nest quun cas particulier de lutilit
dune loterie (lutilit de von Neumann-Morgenstern est un cas
particulier de lindex de Bernoulli). Une seconde hypothse pour
dfinir ce critre est que lutilit dune loterie est une fonction
linaire de lutilit des consquences. Lindex de Bernoulli a
aussi cette proprit, mais elle dcoule des axiomes. Le critre
que proposait Allais, sans justification axiomatique sur le
comportement, est dfini ainsi : si l est une loterie qui met les
probabilits p1, , pn sur les consquences x1, , xn ranges par
ordre de prfrences dcroissantes, son utilit est : V(l) = U(x1) +
q(p2 + p3 + pn) [U(x2) U(x1)] + + q(pn) [U(xn) U(xn1)].
Dans ce critre, ce sont les accroissements dutilit entre les
consquences qui sont pondres par une fonction (note q
dans la formule) des probabilits cumules. Lutilit des cons-
quences U est dtermine indpendamment de tout choix dans
lincertain et ne peut donc tre considre comme reprsentant
le comportement de lagent vis--vis du risque. En revanche,
laversion pour le risque est caractrise par les coefficients
q(p) qui sont fonction des probabilits. Avec ce critre, Allais
peut expliquer le comportement dagents qui taient en contra-
diction avec celui de lutilit espre.
Il a cependant fallu prs de trente ans de recherches 3 pour
justifier ce critre et les ides quil suggre, par une thorie
axiomatique du comportement. Pendant cette priode, de nom-
breuses tudes exprimentales, tant en psychologie quen co-
nomie et en thorie de la dcision, ont permis de mieux cerner
certains aspects du comportement des dcideurs. Parmi les l-
ments notables, nous pouvons retenir la tendance surestimer
les petites probabilits : le seul fait que la probabilit dune
consquence ne soit pas nulle fait que le dcideur tient compte
de cette consquence, mme si cette probabilit est infinitsi-
male (gagner au Loto !). Une telle tendance ne peut tre prise
en compte par une thorie qui ne fait intervenir que les proba-
bilits sans tenir compte de dformations que les dcideurs
peuvent leur faire subir.
La violation systmatique de certains axiomes, comme le
montrent les paradoxes dAllais ou dEllsberg, a t mise en
lumire par des expriences qui ont permis de chercher des
109
affaiblissements pertinents de ces axiomes. Le critre dAllais
a pu tre justifi axiomatiquement en remplaant laxiome
dindpendance par un axiome plus faible. Bien entendu, V
nest alors plus une fonction linaire des probabilits (ce nest
plus une esprance mathmatique) : la formule prcdente fait
intervenir une dformation des probabilits (par la fonction q).
Les thories axiomatiques justifiant le critre prcdent ou des
critres semblables (en ce sens que ce ne sont pas des utilits
espres, mais une formule faisant intervenir des dformations
des probabilits) sont apparues simultanment depuis 1979 ;
elles sont nombreuses et ce nest pas notre propos den rendre
compte ici autrement que par des rfrences bibliographiques
ncessairement trs incompltes :
les premiers reprendre les ides dAllais furent Kah-
neman et Tversky [1979], qui proposrent un critre de dci-
sion dans le risque dans lequel les consquences sont values
par une utilit et les probabilits sont dformes par une fonc-
tion. Leur critre a la faiblesse de ne pas respecter la domi-
nance stochastique ;
traitant de situations de risque, Quiggin [1982] semble
avoir propos la premire axiomatique de ce quil a appel
thorie de lutilit anticipe qui justifie un critre gnrali-
sant celui dAllais. Dautres thories dAllais [1985] et de
Yaari [1987], notamment, dveloppent des reprsentations du
comportement en situations de risque sous la forme dune fonc-
tion non linaire des probabilits ;
dans le mme esprit, le comportement en situation dincer-
titude peut tre reprsent par une fonction qui nest pas
linaire (si laxiome dindpendance et laxiome de la chose
sre de Savage ne sont pas vrifis). En prenant dautres
affaiblissements des axiomes, la valeur dun acte sera exprime
par une fonctionnelle dfinie par une mesure subjective qui
nest pas une probabilit, mais une mesure non additive seule-
ment 4. Ce sont notamment les thories de Schmeidler [1989],
de Gilboa et Schmeidler [1990] et de Wakker [1989].
Sans entrer dans les dtails, mais pour avoir une vue
densemble des diffrentes thories et de leurs rapports, le
tableau suivant peut tre tabli :
110
Esprance subjective r Esprance subjective r Intgration subjective
du gain de lutilit non linaire de lutilit
F F F
Esprance du gain r Esprance de lutilit r Intgration non
linaire de lutilit
Conclusion
111
Cependant, et grce cela, de nombreuses applications la
thorie conomique de lincertain ont pu tre dveloppes dans
des domaines o la validit de cette thorie est reconnue :
thorie de linformation, de lassurance, des marchs finan-
ciers, notamment. Pour traiter des paradoxes qui surgissent et
des situations o les axiomes de la thorie sont gnralement
viols par les dcideurs, il aura fallu dvelopper les gnralisa-
tions que nous avons prsentes dans ce chapitre. leur tour,
ces thories devront tre gnralises ou cder la place des
thories alternatives lorsque leurs applications auront t dve-
loppes et auront montr les limites de leurs pouvoirs expli-
catifs et prdictifs.
Conclusion gnrale
113
lanalyse des problmes de dcision. En ltat actuel, elle sert
de rfrence la reprsentation du comportement dagents co-
nomiques qui sont cohrents avec ses hypothses, ce qui a
permis des avances importantes dans la comprhension de
phnomnes conomiques. Les choix industriels, les choix
dinvestissements, lvaluation de contrats dassurance et de
titres financiers sont des exemples des applications de cette
thorie. Les problmes dorganisation industrielle ont pris une
place prpondrante dans les sciences conomiques depuis les
annes quatre-vingt, cela grce au renouveau de lintrt port
la thorie des jeux. Nous lui consacrons quelques lignes.
Ltude de ces jeux a intress des mathmaticiens et des
philosophes comme Pascal, Bernoulli ou Borel. Von Neumann
et Morgenstern ont poursuivi cette dmarche et ils posrent les
fondements de la thorie qui peut sappliquer des problmes
de dcision en situations de conflit plus gnrales que celles
des jeux de socit. Un jeu y est dfini par lensemble des
joueurs, les choix qui leur sont possibles et les consquences de
ces choix : gains ou pertes, gnralement exprims en termes
de paiements (positifs ou ngatifs). Afin de dvelopper lana-
lyse des jeux, il tait ncessaire de formaliser les manires de
faire un choix individuel. Cest lobjet de la thorie de la repr-
sentation du comportement individuel de von Neumann et Mor-
genstern, la thorie de lutilit espre que nous avons vue au
chapitre V. Les concepts de solution dun jeu sont fonds sur
lhypothse que les gains des joueurs sont des valeurs quils
cherchent maximiser et que ce sont donc, en fait, les utilits
des consquences de leurs dcisions ou les utilits espres de
leurs stratgies.
La thorie des jeux distingue les jeux non coopratifs, dans
lesquels aucune collusion nest possible entre les joueurs (on
dit encore jeux purement comptitifs ou concurrentiels), des
jeux coopratifs o, au contraire, certaines formes de coopra-
tion sont possibles.
La solution un problme de dcision dans un jeu non coo-
pratif est donne par une notion dquilibre. Un quilibre de
Nash (du nom de celui qui la tudi le premier et en a
dmontr un thorme dexistence [1951]) est une liste des
gains des joueurs (cest--dire une case du tableau de la forme
normale du jeu) qui correspond une liste de stratgies pour
chaque joueur telles quaucun changement unilatral de
114
stratgie par lun des joueurs ne lui permettrait daugmenter
son gain.
Une solution non cooprative nest pas ncessairement satis-
faisante. Deux entreprises en concurrence peuvent adopter cha-
cune soit une stratgie agressive se traduisant par le
dclenchement de manuvres de conqute du march, soit une
stratgie prservant le statu quo ou cherchant lamliorer
pour les deux parties.
Le choix du lieu dimplantation dun point de vente par des
entreprises concurrentes est un autre exemple o labsence de
coopration peut se traduire par des consquences dsastreuses
pour tous les concurrents.
Le rachat de parts du capital dune socit, lenjeu tant le
contrle de la socit, est un exemple o labsence de
consensus entre les acheteurs peut les amener acheter trs
cher des parts dont le nombre restera insuffisant.
Ces exemples peuvent tre traduits sous une forme voisine
de celle du classique dilemme du prisonnier : deux malfaiteurs
ont t arrts pour une faute bnigne et ils sont souponns,
juste titre mais sans preuve, dtre les auteurs dun crime grave.
Le juge essaie de les faire avouer tous deux pour les condamner
cinq ans chacun, faute de quoi il les condamnera un an
chacun pour la faute bnigne. Mais il leur propose individuel-
lement de relaxer celui qui tmoignerait contre lautre, ce der-
nier copant alors de vingt ans. La forme normale de ce jeu
est reprsente par le tableau suivant :
II
Ne parle pas Parle
I
Ne parle pas 1, 1 20, 0
Parle 0, 20 5, 5
115
parle) ce qui correspond un rsultat qui est moins bon pour
chacun des deux joueurs que la solution (ne parle pas, ne parle
pas).
Un autre exemple classique argumentant contre lquilibre
de Nash comme concept de solution pour les jeux o la coop-
ration est possible est celui de la bataille des sexes : Lui
prfre aller au match, Elle au ballet, mais tous deux prf-
rent par-dessus tout sortir ensemble. La forme normale du jeu,
o les gains sont des utilits, peut tre reprsente de la
manire suivante :
Elle
Match Ballet
Lui
Match 2, 1 0, 0
Ballet 0, 0 1, 2
116
toutefois avoir recours cette thorie pour les dcisions collec-
tives si celles-ci sont prises par un seul individu dlgu,
quelquun qui dicte les dcisions prendre. La thorie de
la dcision individuelle peut aussi tre invoque lorsque, une
organisation ayant par le pass pris de nombreuses dcisions,
il est possible dtablir sur la base de ces donnes les para-
mtres dfinissant un critre. Ce critre ne prtend pas repr-
senter des prfrences collectives, mais il est tel que les
dcisions prises par le pass loptimisent. Dans la mesure o
lorganisation continuera de fonctionner selon les mmes prin-
cipes, un problme de dcision pourra tre analys dans le
cadre de LA thorie de la dcision.
Repres bibliographiques
118
BERNOULLI D., Specimen Theo- KEYNES J.M., A Treatise on Pro-
riae Novae de Mensura bability, Mc Millan, Londres,
Sortis , Commentarii acade- 1921.
miae scientiarum imperialis LUCE R. et RAIFFA H., Games and
petropolitanae, 5, 1738. Decisions, Wiley and Sons,
D ABONI , M ONTESANO et L INES , New York, 1957.
Recent Developments in the MARKOWITZ H., Portfolio Selec-
Foundations of Utility and tion of Investments, Cowles
Risk Theory, Reidel, 1986. Foundation, Yale University
DEBREU G., Representation of a Press, 1970.
Preference Ordering by a MUNIER B., Risk, Decision and
Numerical Function , in Deci- Rationality, Reidel, 1988.
sion Processes, Thrall, Comb, PRATT J., Risk Aversion in the
Davis eds, Wiley, New York, Small and in the Large ,
1970. Econometrica, 32, 1964,
D E F INETTI B., Fondamenti p. 122-136.
logici del raggionamento pro- QUIGGIN J., A Theory of Antici-
babilistico , Bolettino dell- pated Utility , Journal of
unione matematica italiana, Economic Behavior and Orga-
n 9, dcembre 1930. Voir nization, 3, n 4, 1982,
aussi : Teoria delle probabi- p. 323-343.
R AIFFA R., Decision Analysis,
lita. Sintesi introduttiva con
1970 ; trad. : Analyse de la
appendice critica, Einaudi,
dcision, Dunod, Paris, 1973.
Torino, 1970.
RAMSEY F.P., Truth and Proba-
ELLSBERG D., Risk, Ambiguity bility , 1926, in The Founda-
and the Savage Axioms , tions of Mathematics and
Quaterly Journal of Eco- Other Logical Essays, dit par
nomics, vol. 75, 1961, p. 643, R.B. BRAITHWAITE, New York,
669. Humanities Press, 1931, 1950.
G ILBOA I. et S CHMEIDLER D., ROY B., Mthodologie multicri-
Additive Representations of tre daide la dcision, Eco-
Non-Additive Measures and nomica, Paris, 1985.
the Choquet Integral , mimo, SAVAGE L.J., The Foundations of
Department of Economics, Statistics, J. Wiley and Sons,
Ohio State University, 1990. New York, 1954.
K AHNEMAN D. et T VERSKY A., S CHMEIDLER D., Subjective
Prospect Theory : an Ana- Probability and Expected Uti-
lysis of Decision Under Risk , lity Without Additivity ,
Econometrica, 47, n 2, 1979, Econometrica, 57, 1989,
p. 263-291. p. 571-587.
KEENEY R. et RAIFFA H., Deci- VINCKE Ph., LAide multicritre
sions with Multiple Objec- la dcision, Ellipses, Paris,
tives : Preferences and Value 1989.
Trade-Offs, J. Wiley and Sons, VON NEUMANN J. et MORGEN-
New York, 1976. STERN O., Theory of Games
119
and Economic Behavior, Prin- Foundation of Decision
ceton University Press, 1944. Analysis, Kluwer Academic
W ALD A., Statistical Decision Publishers, Dordrecht, 1989.
Functions, Wiley and Sons, Y AARI M.E., Dual Theory of
New York, 1950. Choice Under Uncertainty ,
WAKKER P, Additives Represen- Econometrica, 55, n 1, 1987,
tations of Preferences, a New p. 95-115.
Table
Introduction ................................................................... 3
121
5. Aides multicritres la dcision ........................... 57
6. Agrgation des critres de diffrents dcideurs .... 59
7. Dynamique de dcisions ........................................ 61
Conclusion .................................................................. 63
VI / Le risque ............................................................... 82
1. Aversion pour le risque, quivalent certain .......... 83
2. Indices daversion pour le risque .......................... 87
3. Mesures du risque .................................................. 88
Conclusion .................................................................. 91