Vous êtes sur la page 1sur 487

MATHÉMATIQUES DE

L’ASSURANCE NON-VIE
Tome I: Principes Fondamentaux de
Théorie du Risque

Michel Denuit & Arthur Charpentier

31 mars 2004
ii
Préface

L’aversion au risque, la “risquophobie”, est aujourd’hui érigée en


vertu comme en témoigne les débats autour du principe de précaution.
Norme abstraite au contenu mal défini, il a vocation à intégrer le
préambule de notre Constitution au risque de produire des effets
dont on ne mesure pas encore l’ampleur.
Dans ce contexte d’incertitude, il est particulièrement réconfortant
de revenir aux sources, aux fondamentaux, c’est-à-dire aux mathématiques
et de rappeler que le risque naı̂t de l’aléa et s’appréhende grâce aux
développements les plus avancés du calcul des probabilités.
C’est ce que rappelle justement l’ouvrage de Michel Denuit et Ar-
thur Charpentier “Mathématiques de l’assurance non-vie”, dont le
lecteur appréciera la présentation rigoureuse, claire et pédagogique
des outils modernes d’analyse de risque.
L’assureur que je suis a été particulièrement sensible à l’introduc-
tion à la théorie des copules qui permet de modéliser la dépendance
entre les différents risques auxquels sont confrontés les gestionnaires
au sein de nos entreprises. Car c’est une évidence, lorsque les catas-
trophes surviennent les sinistres ne sont pas indépendants.
Cet ouvrage constituera, j’en suis sûr, une référence incontour-
nable pour les actuaires. Mais au-delà du secteur restreint de l’assu-
rance, compte tenu de la place de plus en plus importante occupée
par l’idée de “risque” dans nos sociétés, l’enseignement du calcul
des probabilités dans nos formations supérieures d’ingénieurs, nos
écoles de commerce et de gestion - et même en sciences politiques ! -,
gagnerait à aborder des problèmes concrets de gestion du risque em-
pruntée à l’actuariat. Cet ouvrage, en proposant les outils théoriques
adéquats, leur en offre la possibilité.

iii
iv

Les futurs responsables et décideurs seraient ainsi mieux à même


d’intégrer dans leur démarche le fait que le risque, bien quantifié et
apprécié, constitue aussi, sinon davantage, une opportunité d’inno-
vation, une source de création de richesse, donc de progrès pour nos
sociétés.

Claude Bébéar, 31 mars 2003.


Liminaires

RISQUE [risk] -1663, 1578. Italien risco, bas latin risicus ou


riscus. —— 1 . Danger éventuel plus ou moins prévisible, danger,
hasard, péril. —— 2 . Eventualité d’un évènement futur, incertain
ou d’un terme indéterminé, ne dépendant pas exclusivement de la
volonté des parties et pouvant causer la perte d’un objet, ou tout
autre dommage. En matière d’assurance le terme désigne souvent
l’événement contre la survenance duquel on s’assure. —— 3 . “Le
risque est le hasard d’encourir un mal, avec espérance, si nous
échappons, d’obtenir un bien” (Condillac, in Foulqui é,
Dictionnaire langue philos.)

Ojectifs et contexte
Cet ouvrage traite des mathématiques du risque, au sens où l’en-
tendent Hans Bühlmann dans Mathematical Methods in Risk Theory
(paru en 1970) ou Hans Gerber dans An Introduction to Mathemati-
cal Risk Theory (paru en 1979). Afin d’éviter toute confusion avec les
mathématiques financières, nous l’avons intitulé “Mathématiques de
l’assurance non-vie”. Ces mathématiques correspondent à ce que les
anglo-saxons appellent aussi mathématiques actuarielles (actuarial
mathematics).
A partir de nos notes de cours remises en forme, nous avons
souhaité proposer aux étudiants en sciences actuarielles (mais aussi,
plus généralement, en mathématiques appliquées), un ouvrage présentant
les outils mathématiques utilisés en assurance non-vie, sans pour au-
tant avoir la prétention d’être un traité exhaustif des techniques ac-
tuarielles, loin s’en faut! L’ouvrage vise plutôt à fournir une méthode
moderne d’analyse et de gestion des risques. Conçu comme support
des cours d’assurances dommages (à l’Ecole Nationale de la Statis-
tique et de l’Administration Economique, et à l’Institut des Sciences
Actuarielles de Louvain-la-Neuve), il semble tout indiqué pour ser-

v
vi

vir de base à des enseignements semblables dans d’autres institu-


tions. Ainsi, de larges parties de cet ouvrage ont été utilisées dans
le cadre d’enseignements à l’Université Paris 9 Dauphine, à l’Insti-
tut de Science Financière et d’Assurance (ISFA) de l’Université de
Lyon 1, à l’Institut National d’Economie et de Statistique Appliquée
(INSEA) de Rabat, à l’Ecole Nationale Supérieure de Statistique et
d’Economie Appliquée (ENSEA) d’Abidjan, à l’Université de Varso-
vie et à l’Université de Bucarest. En outre, l’exposé a été conçu pour
permettre une lecture par des étudiants, chercheurs ou enseignants
en mathématiques qui désireraient s’initier aux sciences actuarielles.
L’ouvrage se veut accessible aux différents types de lecteurs. La plu-
part des notions techniques sont ainsi brièvement rappelées, si bien
qu’un lecteur peut aborder l’ouvrage avec un minimum de connais-
sances en mathématiques et en théorie des probabilités.
Jules Dubourdieu notait en 1958 dans la préface de sa Théorie
Mathématique des Assurances, que
“l’enseignement de l’actuariat apparaı̂t ainsi comme figé
dans une terminologie, sinon dans des méthodes dépassées,
et il n’est pas surprenant, dans ces conditions, que les ap-
plications aux problèmes de l’assurance apparaissent à la
plupart des probabilistes comme peu instructives, et peu
dignes de retenir l’attention du mathématicien”.
Pour faire une comparaison, si les mathématiques financières ont su
franchir ce cap, il faut noter que les mathématiques de l’assurance
n’ont pas tellement évolué depuis cette déclaration. Pour continuer
le parallèle, si les marchés financiers se sont mis à manipuler des
concepts mathématiques de plus en plus évolués, les mathématiques
du risque ont souvent inspiré du scepticisme au sein des compagnies
d’assurance. L’assurance non-vie a souvent reposé sur du bon sens,
et sur une perception quelque peu subjective du risque. Mais comme
le notait Borel au sujet des compagnies d’assurance,
“nous partons ainsi d’une base pratique assez solide pour
que nous ayons dans la théorie la confiance qui est nécessaire
pour ne pas avoir à tenir compte du scepticisme qui peut
toujours être opposé à toute tentative d’explication ra-
tionnelle”.
De la même façon, nous pensons que la théorie mathématique de
l’assurance n’est pas seulement une application séduisante du cal-
cul des probabilités: nous sommes persuadés qu’elle peut contribuer
à promouvoir le développement de méthodes plus rationelles dans
la gestion des risques. Et les difficultés qui vont nécessairement de
vii

pair font que l’actuaire “doit unir à une solide formation théorique
l’esprit critique et la prudence qu’exige toute activité qui ne se can-
tonne pas sur le plan de la spéculation pure et qui entend dominer
les faits.” C’est pour cela que nous pensons que cet ouvrage est
également destiné aux professionnels du risque.
L’ouvrage traite surtout les risques de masse, c’est-à-dire la cou-
verture d’un grand nombre de risques semblables au moyen de contrats
dont les conditions sont standardisées. L’exposé se focalise donc sur
de grands portefeuilles d’assurance; ceci permettra de faire appel
aux résultats asymptotiques du calcul des probabilités, comme la
loi des grands nombres et le théorème central-limite.
L’ouvrage se concentre sur les assurances de choses et les assu-
rances de responsabilité. Dans le premier cas, l’assureur s’engage à
indemniser l’assuré des dommages subis par ses biens (assurance in-
cendie, vol, dommages matériels aux véhicules, ...). Dans le second
cas, l’assureur s’engage à indemniser à la place de l’assuré les tiers
victimes de dommages matériels ou corporels dont l’assuré est res-
ponsable (assurance de responsabilité civile automobile, familiale,
...).

“But the age of chivalry is gone;


that of sophisters, economists, and calculators has succeeded [...] ”
Edmond Burke, Reflections on the Revolution in France (1791).

Tome 1 - Principes fondamentaux de théorie


du risque
Le premier tome entend jeter les bases théoriques nécessaires à
la compréhension et à la résolution des problèmes qui se posent en
assurance non-vie. Il est consacré aux principes fondamentaux de la
théorie mathématique du risque, théorie dans laquelle les sciences
actuarielles sont profondément ancrées.

Le premier chapitre introduira les concepts de base de l’assu-


rance non-vie, de manière relativement informelle. Avant d’enta-
mer l’étude des techniques assurantielles proprement dites, il nous a
en effet paru essentiel de fournir au lecteur une introduction aux
notions qui seront utilisées abondamment dans la suite de l’ou-
vrage. Cette introduction s’avèrera particulièrement utile aux non-
actuaires, qui pourront ainsi mieux appréhender le cadre économique
dans lequel se placent les développements des chapitres suivants.
viii

Historiquement, les mathématiques actuarielles sont nées avec


les tables de mortalité, et le calcul de rentes actualisées, c’est-à-
dire une conception déterministe du risque. Toutefois, la plupart
des éléments utilisés dans l’approche moderne des mathématiques
de l’assurance reposent sur les outils développés dans la branche de
théorie des probabilités : la survenance d’un sinistre est un évènement
aléatoire, ainsi que, bien souvent, son coût. Comme le notait Du-
bourdieu,
“il serait vain de chercher à aborder et à traiter ces
problèmes [de “théorie du risque”] d’une manière tant
soit peu approfondie, sans faire appel aux méthodes mo-
dernes de la théorie des probabilités”.
Le deuxième chapitre introduit la modélisation probabiliste du risque,
qui sera utilisée dans toute la suite de l’ouvrage. La taille de ce cha-
pitre peut paraı̂tre impressionnante au premier regard. Toutefois,
ceci permettra aux chapitres suivant d’être considéralement allégés,
puisque la plupart des résultats de théorie du risque peuvent être
vus comme des applications de résultats probabilistes. Le second
chapitre introduira les outils probabilistes utilisés en modélisation
des risques, de façon abordable pour un public d’économistes, et
intéressant, on l’espère, pour les mathématiciens. Les modèles clas-
siques pour le nombre et le coût (individuel) des sinistres y seront
présentés.

Le troisième chapitre sera entièrement consacré au concept de la


prime pure : il s’agira de légitimer, sous certaines conditions, l’usage
de l’espérance mathématique pour calculer le prix du risque. Le
principe de mutualisation des risques repose, d’un point de vue
mathématique, sur l’utilisation de la loi des grands nombres. On
suppose alors généralement que les risques sont assez nombreux et
assez homogènes pour être “justifiables de la loi mathématiques des
probabilités” selon l’Encyclopedia Universalis.
“Cela explique que certains risques catastrophiques soient
actuellement inassurables. Mais le champ des risques as-
surables s’élargit sans cesse grâce aux études des théoriciens...”
Nous insisterons toutefois (lourdement peut-être) sur les situations
où le calcul de la prime pure au moyen de l’espérance mathématique
n’est pas pertinent. Nous verrons également qu’une tarification basée
uniquement sur la prime pure conduit à une ruine certaine (quel que
soit le niveau des fonds propres dont la compagnie dispose).

Cette approche à l’aide de la prime pure permet d’obtenir un


ix

équilibre économique en moyenne. Ce qui signifie que pour des


risques analogues et indépendants, et pour un portefeuille suffisam-
ment grand, la loi des grands nombres peut s’appliquer. Le qua-
trième chapitre montrera comment, et pourquoi l’actuaire ne se
contente pas de la prime pure mais lui ajoute un chargement de
sécurité. Cette composante peut être particulièrement importante,
en particulier si le risque est susceptible de subir, d’une année à
l’autre des fluctuations importantes, ou si le risque est insuffisam-
ment connu.

Dans les années 80, sur les marchés financiers, l’hypothèse de


risques gaussiens s’est avérée insuffisante pour mesurer correctement
les risques: comment comparer du risque de faillite à du risque de
variation de taux de change, en utilisant comme seul indicateur la
volatilité (l’écart-type)? La mesure de risque retenue a été la Value-
at-Risk (ou VaR), correspondant à un quantile de la distribution de
perte. Il s’agit alors, à probabilité donnée, du pire cas probable. Nous
verrons dans le cinquième chapitre ce qu’est une mesure de risque,
et quelles propriétés souhaitables elle doit vérifier. Nous évoquerons
plus particulièrement deux mesures de risque utilisées en assurance
non-vie: la Value-at-Risk, ainsi que la Tail VaR (espérance au-delà de
la VaR). Nous présenterons également une classe relativement vaste
de mesures de risque, définies à l’aide d’opérateurs de distorsion.
Enfin, nous nous servirons de ces mesures de risque pour comparer
les risques en présence.

Dans les contrats d’assurance-vie, historiquement centre de prédilection


des actuaires, le risque était individuel. En assurance non-vie, sous
l’impulsion de l’école scandinave (Filip Lundberg dès 1909 puis Ha-
rald Cramér en 1926), les actuaires se sont intéressés à l’approche
du risque du point de vue de la compagnie d’assurance : le modèle
collectif était né. Le sixième chapitre sera ainsi consacré au modèle
collectif. Comme le notait Hans Gerber dans l’introduction de An
Introduction to Mathematical Risk Theory, l’obtention de la loi de
probabilité de la charge totale des sinistres a toujours été l’objet
d’un chapitre central dans les ouvrages de théorie du risque. Nous
étudierons en particulier dans cette partie les méthodes numériques
permettant d’obtenir la loi de la somme cumulée de sinistre (notam-
ment à l’aide du célèbre algorithme de Panjer).

Le septième chapitre sera centré sur l’équilibre à long terme des


résultats de la compagnie, correspondant à la notion mathématique
x

de probabilité de ruine. Le lien entre processus stochastiques et


théorie du risque a été établi au début du vingtième siècle par Filip
Lundberg et Harald Cramér. Ce problème de la ruine d’une com-
pagnie d’assurance a toutefois été relancé en 1963, suite à l’inter-
vention de Bruno de Finetti au colloque ASTIN à Trieste, sur “La
théorie des plus grandes valeurs et son application aux problèmes
de l’assurance”. Nous mettrons l’accent dans cette partie sur les
équations exactes (équations intégro-différentielles ou relations à
l’aide de transformées de Laplace, par exemple), en présentant quelques
cas particuliers permettant d’obtenir des formules explicites pour la
probabilité de ruine (en particulier dans le cas poissonien, lorsque les
coûts individuels suivent une loi exponentielle négative), mais aussi
des approximations ou des majorations de la probabilité de ruine.
En retenant l’approche de Seal, nous étudierons de façon générale
la probabilité de ruine à horizon donné (parfois infini), en fonction
du montant de réserves initiales.

Le huitième et dernier chapitre du premier tome abordera le cas


des risques multiples. En effet, en gestion des risques, une des notions
fondamentales est celle d’agrégation des risques : un portefeuille de
compagnie d’assurance non-vie comporte ainsi des contrats automo-
bile, habitation, incendie, etc. Par facilité, on suppose généralement
tous ces risques indépendants, y compris quand une compagnie com-
mence à proposer des contrats (dits multi-branches) couvrant l’en-
semble des risques pour un même client. Comme le rappelait d’ailleurs
Hans Bühlmann 1 en 1963,
“the independence hypothesis is so common to be made
that many authors forget to mention it”.
Mais les tempêtes de 1999 par exemple ont montré clairement que
lorsque des catastrophes surviennent, plusieurs garanties sont touchées
en même temps: les risques ne sont pas indépendants. Une fois cette
constatation faite, il convient de proposer des modèles permettant de
prendre en compte cette non-indépendance entre les risques. Après
des rappels sur les vecteurs aléatoires, nous évoquerons la notion de
dépendance positive, de relation d’ordre entre vecteurs aléatoires,
ainsi que la notion de mesure de dépendance. La section suivante
abordera alors la notion fondamentale de fonction copule, permet-
tant de séparer un vecteur de risques, en un comportement marginal
d’une part, et une structure de dépendance d’autre part. Mais si
1. On notera d’ailleurs l’apport de Hans Bühlmann sur ce sujet (en parti-
culier sur l’étude des variables échangeables) dans Austauschbare stochastische
Variabeln und ihre Grenzwertsatze (1960).
xi

cette notion est particulièrement utile pour les lois continues, nous
verrons que son intérêt est très limité pour les lois discrètes. Enfin,
nous aborderons le problème fondamental de l’étude d’une somme
de variables non-indépendantes.

Tome 2 - Tarification et provisionnement


Le second tome initiera le lecteur à différentes techniques abon-
damment utilisées en matière de tarification et de provisionnement
en assurance non-vie.

Le neuvième chapitre sera consacré à la tarification a priori des


contrats d’assurance. Nous verrons pourquoi l’actuaire désire seg-
menter le portefeuille et comment il peut s’y prendre. Nous concen-
trerons notre propos sur les modèles de régression de type GLM et
nous verrons que cette approche permet en général une analyse fine
de la sinistralité observée pour un portefeuille.

Les deux chapitres suivants seront axés sur la tarification a pos-


teriori des contrats. En assurance automobile par exemple, un cer-
tain nombre de variables exogènes permettent d’obtenir une tarifi-
cation a priori, en tenant compte du sexe, de l’age, du type d’uti-
lisation du véhicule. L’approche proposée dans ce dixième chapitre
permet d’affiner l’évaluation a priori du risque en tenant compte du
passé sinistre de l’assuré. Ce chapitre proposera l’approche par la
théorie de la crédibilité. Notons que la notion même de crédibilité est
étroitement liée à la perception que l’on peut avoir du risque (comme
le note Savage (1954), la “personalistic view of probability”): les in-
dividus accordent une crédibilité différente à la réalisation de tel ou
tel état de la nature. Savage parle de degré de conviction. Cette
notion est étroitement liée à celle introduite par Thomas Bayes en
1763. Mais si ce concept a trouvé son nom au milieu du vingtième
siècle, dès 1910, les employés de General Motors qui étaient assurés
contre les accidents du travail, bénéficiaient d’une prime calculée sur
ce principe, formalisé en 1914 par Mowbray et repris en 1918 par
Withney:
“the problem of experience rating arises out the necessity
[...] of striking a balance between class-experience on the
one hand and risk-experience on the other ”.
Notons qu’avant de s’imposer avec la contribution de Hans Bühl-
mann en 1967, cette approche utilisant la règle de Bayes fut forte-
xii

ment critiquée 2 .

Le onzième chapitre, dans la continuité du précédent, présentera


les modèles permettant d’allouer des surprimes (d’infliger un malus)
si l’assuré a des sinistres, et des récompenses pour les assurés n’ayant
pas eu de sinistre (via l’octroi d’un bonus) à l’aide de systèmes
bonus-malus. La théorie du bonus (ou “une méthode pour calculer
une ristourne adéquate pour années sans sinistres” pour reprendre le
titre d’un article de Bichsel) a été introduite par Maurice Fréchet dès
1938 dans son ouvrage intitulé “Recherches théoriques modernes sur
le calcul des probabilités”. En particulier, il a émis l’idée d’utiliser les
chaı̂nes de Markov (idée que nous développerons en détails dans ce
chapitre). Ces modèles existent dans la plupart des pays développés,
sous le nom de no-claim bonus, ou système bonus-malus (en Suède
dès 1952, en Belgique en 1971, en France en 1976 - obligatoire depuis
1991, au Québec en 1978, etc.).

Le douzième chapitre abordera l’étude micro-économique de l’as-


surance. La théorie microéconomique de l’assurance est née au milieu
des années soixante de la rencontre entre un actuaire, Karl Borch,
et un économiste (futur Prix Nobel), Kenneth Arrow. Karl Borch
voulait fournir un fondement théorique satisfaisant aux pratiques
des assureurs. Kenneth Arrow cherchait un champ d’application à
l’économie de l’incertain, théorie économique qu’il avait contribué à
faire naı̂tre. Depuis Arrow et Borch, le rapprochement entre l’actua-
riat et la théorie microéconomique n’a cessé d’être fructueux, tant
et si bien que la théorie de l’utilité est devenue aujourd’hui un des
piliers méthodologiques des sciences actuarielles.
La théorie de la décision en environnement incertain permet de
prendre en compte, de façon relativement simple, la variété des com-
portement des agents économiques face au risque. On peut ainsi don-
ner un sens précis aux concepts de prime de risque, d’aversion pour
le risque et modéliser le choix des investisseurs. La théorie de l’utilité
vise essentiellement à rationaliser les choix des agents économiques
confrontés à des situations risquées.

Le treizième chapitre présente les méthodes stochastiques de


provisionnement, et plus particulièrement des provisions pour si-
nistres à payer. Cette notion de claims reserving, dans la terminolo-
gie anglo-saxonne, est d’ailleurs fondamentale en actuariat non-vie.
2. On retiendra la critique de Fischer, en 1919, reprise par Bailey en 1950, qui
reprochait à Withney (et à Bayes) de supposer que toutes les valeurs possibles
étaient équiprobables (“assumption of equal distribution of ignorance”).
xiii

Cette prise en compte de la dimension temporelle dans la gestion des


sinistres est difficile et technique : pour une période de couverture
donnée, les sinistres (éventuels) peuvent être déclarés relativement
tardivement, avec en plus parfois des temps d’expertise ou de trac-
tation, avant d’arriver à un coût final, plus ou moins éloigné des
estimations initiales. Compte tenu de cette dynamique temporelle
observée dans le passé, le but est alors d’estimer au mieux la charge
totale de sinistres pour une année de survenance donnée, afin d’al-
louer le montant de réserves adéquat. La méthode la plus simple
est celle dite de chain-ladder, qui sera présentée dans un premier
temps, ainsi que des variantes déterministes. En retenant le précepte
de William Feller, “the naive appproach may be the most sophistica-
ted one”, nous allons voir dans ce chapitre comment cette méthode
(correspondant finalement à une règle de trois), couramment uti-
lisée par les compagnies d’assurance peut être légitimée par une
approche stochastique. Nous verrons d’ailleurs comment améliorer
ce modèle souvent trop simpliste, en présentant plusieurs modèles,
datant des vingt dernières années. Nous montrerons enfin comment
unifier toutes ces approches à l’aide des modèles linéaires généralisés
(GLM). Plusieurs autres approches seront également évoquées (uti-
lisation du bootstrap, des filtres de type Kalman...).

Le quatorzième chapitre présentera quelques outils théoriques


permettant de modéliser et de quantifier les risques extrêmes. La
tarification a priori ne traite en effet que les sinistres “standards”
et ce chapitre montrera comment gérer les sinistres graves. Nous
évoquerons ainsi les principaux résultats de la théorie des valeurs
extrêmes, comme la loi du sinistre maximum (théorème dit de Fisher-
Tippett), ou l’étude proprement dite de la queue (distribution au-
delà d’un seuil). Nous évoquerons également deux problèmes plus
complexes : le cas où les observations ne sont plus indépendantes, et
la notion d’extrême dans un cadre multivarié (la notion d’extrême
étant liée à une notion d’ordre, le problème se complexifie pour des
risques multiples puisqu’il n’y a plus une unique façon d’ordonner
les sinistres). Cette étude des extrêmes est étroitement liée à la no-
tion de réassurance, que nous n’aborderons pas dans le détail dans
cet ouvrage.

Le quinzième chapitre présente un certain nombre de méthodes


numériques, avec des applications en assurance non-vie (même si
les méthodes peuvent largement être utilisées pour traiter d’autres
problématiques). Les premières sections de ce chapitre seront orientées
xiv

vers les méthodes numériques (et non pas stochastiques, contraire-


ment aux sections suivantes), et plus particulièrement vers la trans-
formée de Fourier rapide (Fast Fourier Transform), ou plus généralement
les méthodes d’ondelettes (ou wavelets). Ces méthodes permettent
par exemple d’approcher les lois de Poisson composées. Toutes les
sections suivantes sont basées sur des méthodes stochastiques de si-
mulation. Il existe tant de méthodes (également appelées méthodes
de Monte Carlo) qu’écrire un unique chapitre sur le sujet est forcément
réducteur. L’objectif est donc de présenter, de façon introductive,
et claire, les notions les plus utilisées, sans nécessairement présenter
les méthodes les plus modernes. La notion centrale est celle de la
vitesse de convergence : il s’agit d’obtenir, avec un minimum de
calculs, ou un minimum de temps, le résultat le plus proche pos-
sible de la réalité. C’est pour cela que nous insisterons dans ce cha-
pitre sur les méthodes de réduction de variance de l’estimateur, tout
en présentant également les méthodes dites de quasi Monte Carlo
(liant les méthodes déterministes et les méthodes stochastiques de
simulation). Nous évoquerons aussi brièvement la notion de Monte
Carlo par chaı̂nes de Markov (ou MCMC), de simulation de vecteurs
aléatoires, ou de processus stochastiques. Différentes applications en
sciences actuarielles viendront illustrer les méthodes présentées.

Enfin, le seizième et dernier chapitre traitera des limites de l’as-


surabilité, et donc du cadre d’application des méthodes décrites dans
les Tomes 1 et 2.

Remerciements
Avant de conclure cette préface, nos plus sincères remerciements
vont à nos collègues, qui ont accepté de porter un regard critique et
constructif sur ce texte, à différents stades de son évolution. Nous
voudrions ainsi remercier Anne-Cécile Goderniaux, Hélène Guérin,
Alkis Tsimaratos et Jean-François Walhin. Nous souhaitons également
exprimer notre gratitude envers le professeur Christian Gouriéroux
pour ses nombreux commentaires et suggestions, qui ont permis de
corriger et d’améliorer sensiblement le texte, mais aussi pour avoir
accepté de nous publier dans cette prestigieuse collection.

Les nombreux étudiants à qui les auteurs ont eu le grand plai-


sir d’inculquer les sciences actuarielles, ont largement contribué à
améliorer la présentation de l’exposé. Nous tenons ici à nous excu-
1

ser de nous être servis d’eux comme autant de cobayes involontaires.


Notre gratitude leur est acquise.

Merci également aux demandes insistantes d’un certain nombre


de professionnels de l’assurance souhaitant que leur soient exposées
de façon claire des méthodes récentes afin de traiter des risques de
plus en plus complexes. Sans eux, cet ouvrage n’aurait probablement
jamais vu le jour. Qu’ils en soient remerciés.

Enfin, last but not least, nous tenons à remercier nos employeurs
respectifs, pour le cadre de travail agréable et les moyens qu’ils
mettent à notre disposition, afin de développer un travail scienti-
fique de qualité.
2
Chapitre 1

Le risque et sa couverture
contractuelle

1.1 Le risque
1.1.1 Vous avez dit risque?
L’immense majorité des activités humaines comporte des risques,
ce qui fait d’ailleurs tout le piment de l’existence. Si vous avez prévu
un barbecue en famille un dimanche d’été, vous risquez d’essuyer une
averse. Si vous avez réservé un billet d’avion pour partir en vacances
sur une ı̂le paradisiaque, votre vol risque d’être annulé. Si vous invi-
tez une jolie femme (ou un bel homme, c’est selon) à dı̂ner, vous ris-
quez de voir votre invitation déclinée poliment. Si les trois exemples
ci-dessus n’occasionneront au plus qu’un dimanche gâché, une at-
tente supplémentaire avant de fouler les plages de sable blanc ou
une (grosse?) déception, beaucoup de risques auxquels nous sommes
confrontés au quotidien peuvent avoir des conséquences dramatiques
(la mort d’un proche, un accident de la circulation, un incendie, ...).
En plus du chagrin et de la souffrance occasionnés à la vic-
time et à sa famille, ces événements néfastes, que nous appellerons
désormais risques, ont souvent des conséquences économiques sus-
ceptibles d’être évaluées objectivement (en recourant aux services
d’un spécialiste, par exemple). Ainsi, à supposer que votre maison
parte en fumée, un expert peut déterminer combien il en coûtera
pour la reconstruire, et partant le préjudice que vous avez subi.
Le risque naı̂t donc de l’aléa: il y a risque dès lors que l’individu
n’est pas en mesure de prévoir avec certitude l’état futur de son
patrimoine. En pratique, on se sert souvent du terme “risque” pour
désigner à la fois la cause du risque, l’objet du risque ou encore les

3
4 Chapitre 1. Le risque et sa couverture contractuelle

conséquences du sinistre. Ainsi, le risque d’incendie est la raison de


l’assurance et un risque incendie représente à la fois le bâtiment qui
pourrait être la proie des flammes et la dépense à laquelle s’expose
la compagnie qui accorderait sa garantie au propriétaire. Parfois, le
terme péril est utilisé pour désigner la cause du risque; on parle ainsi
du péril incendie. Techniquement, on confond donc souvent risque
et prestation de l’assureur.
S’agissant de conséquences économiques exprimables en termes
monétaires, celles-ci peuvent être prises en charge par un orga-
nisme tiers, mutuelle ou société commerciale. Au fil des siècles se
sont ainsi développés des mécanismes de transfert des conséquences
économiques des risques qui pèsent sur les individus. Un secteur
d’activités a vu le jour: l’assurance.

1.1.2 La raison de l’assurance: la risquophobie


Tous les agents économiques (les particuliers comme les entre-
prises) sont soumis à des aléas (incendie, accident, décès, maladie,
faillite, chômage, . . . ), dont les conséquences financières pourraient
menacer leur patrimoine. Dans certains cas, leurs fortunes person-
nelles (ou fonds propres) ne suffiraient même pas à y faire face. Cer-
tains agents économiques ont conscience de ces risques et cherchent
à s’en préserver en les transférant, en tout ou en partie, à d’autres
agents. Cette crainte spontanée de l’aléa est appelée aversion au
risque, ou risquophobie. Elle est la raison même de l’assurance.
Grosso modo, toute décision d’un agent risquophobe fera inter-
venir deux considérations: le rendement et le risque. A rendement
comparable, c’est toujours la solution la moins risquée qui aura sa
préférence. Il n’acceptera de courir un risque élevé que si, en com-
pensation, ce choix lui procure un bénéfice suffisant. Bien entendu,
le comportement d’aversion au risque dépend de nombreux critères:
un agent risquophobe peut très bien acheter un billet de loterie dans
la mesure où la perte financière (le prix du billet) est insignifiante
et où le plaisir procuré par la participation au tirage le compense
largement.
Il est à noter que certains agents pourraient avoir un comporte-
ment plus insouciant, considérant que les événements dommageables
sont si peu probables (tels qu’ils les perçoivent tout au moins 1 )

1. Il est intéressant de distinguer la vision du risque par l’assuré, souvent sub-


jective et polluée par son degré d’aversion au danger, et la vision plus objective
du risque que peut avoir l’assureur. Nous ne ferons pas cette distinction dans le
suite de cet ouvrage, et supposerons que les deux parties ont une connaissance
1.1. Le risque 5

qu’il n’est pas nécessaire de s’en protéger. Des tiers concernés par
leur situation financière, comme un organisme prêteur par exemple,
pourraient néanmoins exiger d’eux des garanties de solvabilité, les
obligeant à transférer tout ou partie des risques auxquels ils sont
soumis. L’Etat peut également estimer que les troubles sociaux qui
résulteraient de l’insolvabilité de certains citoyens seraient à ce point
dommageables pour la collectivité qu’il convient d’instaurer une
obligation de garantie. L’exemple le plus connu est certainement
l’obligation imposée aux automobilistes d’être assurés en responsa-
bilité civile. Ainsi, les dommages qu’ils pourraient occasionner aux
autres usagers de la route sont pris en charge par un organisme
solvable.

1.1.3 Méthodes de gestion du risque


La risquophobie, combinant recherche de sécurité et crainte de
l’aléa, semble être une caractéristique largement partagée par les
êtres humains. Il existe dès lors de nombreux systèmes de gestion
du risque, qui ont varié selon les époques et les régions. On distingue
principalement les mécanismes suivants de gestion des risques:

Précaution et auto-assurance

C’est bien évidemment la manière la plus évidente de réduire


le risque: il “suffit” d’être prudent. Très succinctement, les agents
adopteront des attitudes visant à diminuer les risques qu’ils courent.
Cela explique par exemple la diminution de la consommation des
ménages et l’augmentation corollaire du volume de l’épargne en
période de récession économique.
Parmi les techniques applicables à la gestion individuelle, il y
en a une qui est caractéristique de la risquophobie: la diversifica-
tion. Un agent risquophobe préférera toujours porter plusieurs petits
risques indépendants qu’un risque unique très important. Il s’agit de
la transcription technique du dicton populaire selon lequel “il ne faut
pas mettre tous ses oeufs dans le même panier”.

Mutualisation des risques

Beaucoup de périls (accidents, vols, maladies, etc.) menacent un


grand nombre d’individus, mais ne touchent finalement qu’un petit

exacte du risque transféré.


6 Chapitre 1. Le risque et sa couverture contractuelle

nombre d’entre eux. On dit dans ce cas que les risques sont suffisam-
ment dispersés. De plus, il y a souvent une certaine indépendance
entre ces risques: le fait que mon voisin cause un accident de la route
ne modifie en général pas le risque que j’en cause un de mon côté.
Ceci différencie donc sensiblement les risques en question des ca-
tastrophes naturelles, qui affectent simultanément un grand nombre
d’individus.
Ces deux propriétés (dispersion et indépendance) sont à la base
d’une technique fondamentale de gestion des risques: la mutuali-
sation. Celle-ci consiste à regrouper un grand nombre de risques
indépendants au sein d’une structure commune. Nous verrons en
détail dans les chapitres suivants que, pour reprendre l’expression
de Maurice Allais, Prix Nobel d’Economie, le risque est “globale-
ment éliminable” dans ces conditions: il est important au niveau
individuel, mais se dissout au niveau collectif.
La mutualisation opère souvent comme un substitut à l’auto-
assurance: plus l’individu est couvert de façon externe, moins il lui
sera nécessaire de privilégier la prudence dans ses choix. La gestion
collective du risque réduit donc les contraintes au niveau individuel
et permet aux agents de profiter d’opportunités intéressantes sans
être paralysés par des impératifs de risque minimal. L’absence de
couverture pour certains risques freinerait l’innovation.
Le danger que comporte une garantie trop poussée est que la cou-
verture externe n’incite plus à la prudence, décourageant la prévention
et accroissant finalement le risque global. C’est le phénomène de
l’aléa moral, que nous évoquerons dans la suite.

Partage des risques


La mutualisation réduit considérablement les risques individuels,
pour autant que ceux-ci soient de petite taille, nombreux et suffi-
samment indépendants. Tous les aléas ne satisfont cependant pas
à ces conditions, loin s’en faut. Certains risques sont, par essence,
d’importance majeure (pensez à la couverture des risques indus-
triels). D’autres, même s’ils se traduisent par des dommages indivi-
duels modérés, affectent un grand nombre d’individus, rendant illu-
soire toute idée de compensation des aléas individuels par la gestion
collective (pensez aux catastrophes naturelles, telles qu’inondation,
tremblement de terre, tornade, etc.).
Face à de tels risques, c’est dans la division (et non plus dans
l’agrégation) que se trouve la solution. L’idée est de répartir la
charge des sinistres entre un grand nombre d’agents, de façon à ce
1.1. Le risque 7

que chacun ne supporte qu’une faible part du risque initial. La cou-


verture des gros risques (catastrophes diverses, lancement de satel-
lites, complexes industriels, etc.) s’effectue par des “pools” rassem-
blant plusieurs assureurs, eux-mêmes couverts par des réassureurs.
Une forme extrême de répartition consiste à répartir les risques
sur quelques dizaines de millions d’agents, les contribuables. Les
Etats peuvent ainsi couvrir des risques importants.
Une autre forme récente de partage de risques consiste à les ti-
triser et à les céder sur les marchés financiers. L’assurance des catas-
trophes naturelles peut par exemple emprunter ce type de véhicule
(cat-bonds).

Transfert de risques entre agents

Il est souvent possible de transférer le risque entre agents, de


façon mutuellement avantageuse. Outre le transfert organisé dans
le contrat d’assurance passé entre un individu et une compagnie,
de nombreux autres contrats comportent également une dimension
de transfert de risque. Le contrat de travail par exemple précise
sous quelles conditions l’aléa que subit l’employeur (chute des com-
mandes, par exemple) peut être répercuté sur les employés (baisse de
salaire, chômage économique, etc.). Les instruments financiers four-
nissent également d’excellents exemples de tels transferts, comme
nous le verrons plus loin.
Remarque 1.1.1. Avant de poursuivre, il est bon de noter que les
principes détaillés ci-dessus ne sont nullement exclusifs mais bien
complémentaires. Ainsi, une société d’assurance recourt à la fois à
- l’auto-assurance par la diversification de son portefeuille et la
constitution de provisions techniques importantes
- la mutualisation en couvrant un grand nombre de risques in-
dividuels
- le partage en transférant une partie de ses risques aux réassureurs.
Ceci lui permet d’avoir une risquophobie faible et donc d’accepter
les risques que les individus désirent lui transférer.

1.1.4 Véhicules de gestion des risques


Les différents principes de gestion des risques évoqués ci-dessus
ont été mis en oeuvre au travers de très nombreuses institutions plus
ou moins spécifiques, au nombre desquelles on retrouve
8 Chapitre 1. Le risque et sa couverture contractuelle

La famille
Les formes les plus anciennes de partage de risque ont eu pour
cadre la famille, nucléaire ou élargie. A l’heure actuelle, la famille
permet encore une gestion du risque efficace dans bien des cas.
Ce n’est que récemment que la couverture de certains risques
(chômage, maladie, vieillesse, etc.) a été organisée par les Etats des
pays industrialisés. A l’heure actuelle, ces risques sont d’ailleurs en-
core du ressort quasi-exclusif de la cellule familiale dans la plupart
des pays en développement.

Les marchés financiers


Les marchés financiers constituent un mécanisme simple, mais
robuste et souvent très efficace, de partage de risque. Il s’agit avant
tout d’un lieu de rencontre entre agents subissant des risques différents,
avec des aversions différentes vis-à-vis de ces risques. Leur objet est
de permettre le transfert de risque mutuellement avantageux. Pour
s’en convaincre, prenons un exemple simple: un entrepreneur eu-
ropéen conclut un important contrat avec un homologue américain.
Le paiement s’effectuera à la livraison, dans 6 mois, disons, pour un
montant spécifié lors de la commande, en dollars US. Si la monnaie
américaine dévalue entretemps, l’entrepreneur européen aura perdu
une bonne partie de son bénéfice. Pour couvrir ce risque, il peut, sur
le marché à terme du dollar, conclure un contrat de vente, par le-
quel il s’engage à échanger à cette date ses dollars contre une somme
fixe en euros. Il annihile ainsi tout le risque, puisqu’il connaı̂t dès à
présent le bénéfice qu’il réalisera. On peut bien entendu s’interroger
quant à la faisabilité de l’opération: la contrepartie pourrait tout
simplement être un exportateur américain devant être payé en eu-
ros, ou tout autre agent économique assumant un risque de hausse
du dollar.

Les compagnies d’assurance


Classiquement, le risque pour le grand public reste du ressort
des compagnies d’assurances. Ces compagnies peuvent prendre la
forme de sociétés commerciales ou de mutuelles. Ces deux formes
partagent bon nombre de caractéristiques mais se distinguent par
les traits fondamentaux suivants:
- les cotisations (appellation des primes pour les sociétés mu-
tuelles) sont variables pour les mutuelles, qui pourront procéder
à un rappel en cas de sinistralité particulièrement défavorable
1.1. Le risque 9

ou, au contraire, reverser une part des sommes perçues en cas


de sinistralité avantageuse. La société commerciale travaille
quant à elle avec des primes fixes.
- la mutuelle est la propriété commune de ses assurés, appelés
mutualistes, et n’a donc pas d’actionnariat à rémunérer (au
contraire de la société commerciale). Ceci peut expliquer pour-
quoi les mutuelles sont souvent mues par des considérations
plus sociales.
Les mécanismes de gestion des risques par les compagnies d’assu-
rance sont largement décrits dans la suite de cet ouvrage.

L’Etat
Au sein de l’Union européenne, l’assureur le plus important reste
l’Etat, soit directement soit via des organismes spécialisés (relevant
par exemple de la sécurité sociale). C’est l’Etat qui couvre les risques
les plus fondamentaux, comme la maladie, la vieillesse et le chômage,
le secteur privé ne jouant qu’un rôle de complément. Dans une large
part, la logique prévalant à la gestion de ces régimes publics est la
solidarité et la redistribution des revenus.

La suite de cet ouvrage est consacrée aux mécanismes de gestion


des risques par mutualisation par des sociétés d’assurance.

1.1.5 Risques pris en charge par les assureurs


Responsabilité
Sur une bonne partie du globe prévaut le système de la responsa-
bilité. Très succinctement, si un individu commet une faute et qu’un
tiers subit de ce fait un dommage, il voit sa responsabilité engagée
et doit alors réparer le préjudice encouru par le tiers lésé. Le régime
de la responsabilité requiert donc que trois conditions soient simul-
tanément remplies: une faute, un préjudice et un lien causal entre
la faute et le préjudice. Ce système paraı̂t socialement désirable:
il entend en effet garantir que chacun se comporte prudemment,
évitant de causer un préjudice à son prochain, de peur de voir sa
responsabilité engagée.
Dans les assurances de responsabilité, l’assureur s’engage à in-
demniser à la place de l’assuré le tiers lésé par sa faute. Il protège
ainsi le patrimoine de l’assuré contre une action en responsabilité
10 Chapitre 1. Le risque et sa couverture contractuelle

intentée contre lui par ce tiers. En plus de l’indemnisation propre-


ment dite, l’assureur assiste son assuré, en organisant sa défense
devant les cours et tribunaux, par exemple.
Dans une société où prévaut le système de responsabilité, l’as-
surance est ainsi devenue la compagne invisible de chacun au quoti-
dien, discrète mais omniprésente. L’avion décolle, donc il est assuré.
Le malade est opéré, donc le chirurgien et l’hôpital sont assurés.
L’automobiliste prend la route, donc lui et les autres conducteurs
sont assurés.

Biens matériels
En plus de sa responsabilité, l’assuré peut également couvrir ses
biens contre des périls les menaçant. Il peut ainsi assurer son véhicule
contre le vol, son domicile contre l’incendie, ses bagages contre leur
perte, etc. On parle souvent dans ce cas d’assurances dommages, car
elles servent à indemniser le préjudice résultant d’une atteinte aux
biens de l’assuré, et donc de réparer le dommage qui en résulte.
L’assurance dommages a profondément transformé notre rela-
tion au malheur et à l’adversité. Dans le passé, la destruction de
la maison familiale par les flammes était synonyme de catastrophe
pour le paysan et sa famille. De nos jours, le pater familias est certes
ennuyé, voire peiné de constater la destruction de l’immeuble qui a
abrité sa famille durant de longues années, mais il est libéré de toute
crainte économique, sachant que l’assureur parera aux conséquences
matérielles de la tragédie. L’assurance permet ainsi à l’homme mo-
derne de se concentrer sur les aspects humains des risques qu’il court,
en transférant aux assureurs le soin d’en réparer les conséquences
économiques.

Personnes
Enfin, l’assuré peut couvrir un capital humain: sa santé et celle
de ses proches. Dans ce cas, l’assureur s’engage à intervenir financièrement
dans les frais d’hospitalisation, les honoraires des médecins, les dépenses
de médicament, etc. L’assureur peut également s’engager à garan-
tir un revenu de remplacement à l’assuré au cas ou celui-ci se voit
privé de travail. Il peut couvrir les dépenses relatives à l’aide d’une
tierce personne si l’assuré n’est plus en mesure d’effectuer lui-même
les actes de la vie quotidienne (assurance dépendance). Il s’agit des
assurances de personnes que nous n’aborderons pas dans le cadre de
cet ouvrage, pas plus que nous n’aborderons les assurances sur la
1.1. Le risque 11

vie.
Afin de se faire une idée de l’importance relative des différentes
branches, le Tableau 1.1 reprend les prestations versées et dotations
aux provisions pour sinistres en assurance de bien et responsabilité.

2002 proportion
Automobile 13,8 48,8%
Dommage aux biens
Particulier 3,7 13,1%
Professionels 3,8 13,4%
Transports 1,0 3,5%
Responsabilité Civile Générale 2,1 7,4%
Construction 1,5 5,3%
Catastrophes Naturelles 0,8 2,8%
Divers 1,6 5,7%
Total 28,3 100,0%

Tab. 1.1 – Prestations versées et dotations aux provisions pour si-


nistres en assurance de bien et responsabilité (source: L’assurance
Française en 2002), en milliards d’euros.

Risques inassurables
La couverture de certains risques est exclue. Il en va ainsi du
risque de se voir appliquer une sanction pénale pécuniaire qui ne peut
pas être couvert par une assurance, sans quoi la peine se trouverait
privée de l’effet dissuasif qu’on attend d’elle. Il en est de même pour
l’assurance sur la vie d’enfants en bas âge, une prestation en cas
de décès de jeunes enfants pouvant donner lieu à des spéculations
de parents indignes ou de personnes sans scrupules qui, par défaut
de soins, provoqueraient le décès de l’enfant en vue de percevoir le
capital assuré.

1.1.6 Gestion des risques par l’assureur


Transfert des risques
L’opération d’assurance a pour effet le transfert de tout ou partie
des conséquences financières du risque pesant sur l’assuré vers une
société d’assurance, dans des conditions et circonstances précisées
dans un contrat. Les dépenses prises en charge par la société peuvent
correspondre soit à des indemnités à verser à des tiers, au titre de
12 Chapitre 1. Le risque et sa couverture contractuelle

la responsabilité (civile, professionnelle, ou autre) de l’assuré, soit à


la réparation des dommages subis par ce dernier.
On présente bien souvent l’assurance comme une opération per-
mettant de substituer un montant déterministe (la prime d’assu-
rance) à une perte financière aléatoire (le préjudice que subira l’as-
suré, ou un tiers lésé par lui). En réalité, la situation est bien plus
complexe. En effet, pour des raisons que nous détaillerons dans la
suite, l’assureur n’accorde le plus souvent qu’une garantie partielle:
il limite son intervention par des clauses de franchise, de plafond
d’indemnisation, de découvert obligatoire, etc. L’assurance permet
donc à l’assuré de réduire fortement l’impact du risque sur son pa-
trimoine, mais pas de l’éliminer totalement. En pratique, l’opération
d’assurance consiste à substituer à un risque initial un autre, plus
avantageux pour l’assuré, moyennant le paiement d’une prime.
L’assuré supporte également le risque de défaut de l’assureur:
si la société qui a accordé sa garantie à l’assuré fait faillite, elle ne
sera plus en mesure d’indemniser les préjudices subis. Afin de limiter
au maximum le risque de défaut, les Etats ont institué un contrôle
des entreprises d’assurance. On ne s’improvise donc pas assureur!
Ne peuvent exercer cette activité que des entreprises spécialisées
présentant des garanties suffisantes et ayant obtenu l’agrément de
la part des autorités. Ceci distingue clairement l’opération d’assu-
rance d’un pari entre deux individus ou d’une spéculation financière
occasionnelle.

Compensation des risques


Il est légitime de s’interroger sur la faisabilité de l’opération d’as-
surance: comment l’assureur est-il en mesure de gérer les risques qu’il
souscrit? La compensation des risques, à la base des techniques ac-
tuarielles classiques, consiste à indemniser les sinistres au moyen
de l’ensemble des primes encaissées relativement à un même risque.
Ceci peut aisément se comprendre intuitivement. Si la compagnie
n’émettait qu’un seul contrat (couvrant l’incendie par exemple), elle
réaliserait un bénéfice modeste avec une probabilité élevée (si l’in-
cendie ne ravage pas le bien assuré), mais s’exposerait à une perte
considérable si un sinistre survenait. Dans ce cas de figure, la situa-
tion de la compagnie est identique à celle de l’assuré. Par contre,
si la compagnie souscrit de nombreux contrats couvrant des im-
meubles semblables contre l’incendie, et si un sinistre affectant l’un
des contrats n’a aucune influence sur les autres risques en porte-
feuille, on sent bien intuitivement que la compagnie devrait pouvoir
1.1. Le risque 13

compenser les risques, c’est-à-dire dédommager les sinistres touchant


un petit nombre de polices à l’aide des primes relatives à l’ensemble
des contrats. L’assureur procède donc par compensation: en grou-
pant un grand nombre de risques semblables ne s’influençant pas
mutuellement au sein de son portefeuille, il sera en mesure d’utili-
ser les primes relatives aux contrats pour dédommager les sinistres
frappant les assurés malchanceux. Ce principe de gestion des risques
par leur mise en commun est parfaitement résumé dans la devise de
Lloyd’s: “The contributions of the many to the misfortunes of the
few” 2 .
Les cataclysmes naturels, tels les tremblements de terre, sont des
risques qui ne sont pas suffisamment dispersés et qui échappent au
principe de la compensation. Traditionnellement, les risques catas-
trophiques étaient exclus de l’assurance, mais actuellement, l’assu-
rabilité de tels risques est de plus en plus admise. La coassurance
et la réassurance permettent notamment de couvrir les risques ca-
tastrophiques, en assurant une dispersion des risques à plus grande
échelle. La titrisation des risques (qui permet aux compagnies d’as-
surances de faire appel au marché financier pour la couverture des
risques qu’elles ont souscrits) et, plus généralement, les techniques
dites d’Alternative Risk Transfer devraient à cet égard permettre
d’importants progrès, en faisant reculer les frontières de l’assurabi-
lité.

Le calcul des probabilités


S’agissant d’événements incertains, l’assurance est la fille du cal-
cul des probabilités et n’a pu vraiment se développer que lorsque
les outils mathématiques furent disponibles. La notion de proba-
bilité sourd dès l’Antiquité. Mais il fallut attendre que le Cheva-
lier de Méré soumette à Blaise Pascal le problème de la répartition
des mises entre deux joueurs en cours de partie pour que l’on as-
siste à l’émergence de la théorie de la décision en univers incertain.
Pour que naisse l’assurance telle que nous l’entendons aujourd’hui,
il aura fallu que se développent les bases scientifiques de la gestion
des risques par les compagnies d’assurance, qui devinrent la science
2. Pour ceux des lecteurs qui ne seraient pas familiers avec cet acteur mythique
du secteur de l’assurance, l’histoire commence en 1687, dans la taverne tenue
par Edward Lloyd à Tower Street, Londres. Cet établissement, fréquenté par
des armateurs, des gens de mer et des négociants, devint peu à peu une sorte
de bourse aux assurances qui finit par devenir le centre mondial de l’assurance
des navires et des cargaisons. Une charte royale de 1720 consacra le succès de
l’entreprise en reconnaissant le Lloyd’s comme une corporation d’assurance.
14 Chapitre 1. Le risque et sa couverture contractuelle

actuarielle. Les bases de cette dernière sont contenues dans le pre-


mier traité d’actuariat, oeuvre de Richard Price, au milieu du 18ème
siècle.

1.1.7 Risques assurantiels et risques financiers

Point commun: le risque

Le contrat d’assurance n’est pas le seul à offrir des compensa-


tions conditionnelles à certains événements. De nombreux instru-
ments financiers comportent également une dimension de transfert
de risque. En émettant des actions pour financer ses investissements,
le propriétaire d’une entreprise transfère effectivement une part de
ses risques au prorata de la mise de fonds des nouveaux actionnaires.
Le détenteur d’une action peut à son tour se prémunir contre une
baisse du cours de celle-ci en acquérant une option de vente (titre
lui conférant le droit de vendre l’action à un prix déterminé et à un
instant fixé).

La différence: la manière de gérer le risque

Il y a cependant une différence essentielle entre risques assu-


rantiels et financiers. Afin de s’en convaincre, prenons l’exemple de
l’option de vente, qui confère à son détenteur le droit de vendre
le titre à un prix déterminé (quel qu’en soit le cours effectif sur
le marché). L’émetteur de l’option de vente ne pourra pas réduire
son risque en vendant plus de titres. Au contraire, si le cours de
l’action chute, l’émetteur s’expose à d’autant plus de pertes qu’il a
vendu d’options. En d’autres termes, tous les “sinistres” ont lieu si-
multanément pour l’émetteur de l’option, puisque toutes les actions
d’une société évoluent de la même manière.
Alors que la compagnie d’assurances gère ses risques par compen-
sation après agrégation au sein de grands portefeuilles, le financier
travaille par réplication (pour autant que le marché le permette).
Le principe de réplication consiste à constituer un portefeuille d’ac-
tifs dont la valeur sera à tout instant identique à celle de l’instru-
ment financier considéré. Cette stratégie est difficilement imaginable
pour l’assureur: aucun portefeuille financier classique ne pourrait
répliquer le coût d’un sinistre automobile, par exemple.
1.1. Le risque 15

Tendance à l’intégration

On observe actuellement une tendance à l’unification des ap-


proches des financiers et des actuaires. Il s’agit sans doute là de
la révolution de l’actuariat du troisième millénaire. Ceci s’explique
essentiellement par deux tendances lourdes observées dans les pays
industrialisés:
1. tout d’abord l’intégration des compagnies d’assurance et des
banques dans des holdings fournissant des services financiers,
et l’émergence de produits d’assurance dont le volet épargne
est très important, parfois liés à des fonds d’investissement.
2. ensuite les risques de dommages ont changé de nature. On est
ainsi passé du monde des accidents à celui des catastrophes
(naturelles, technologiques, environnementales, terroristes, . . . )
qui se prêtent moins bien au principe de compensation et
épuisent les capacités des réassureurs, obligeant par là les as-
sureurs à se tourner vers les marchés financiers.

Titrisation des risques assurantiels

Les catastrophes sont des risques dont la probabilité de surve-


nance est très faible mais dont les conséquences financières sont très
importantes. Les tremblements de terre qui secouent la Californie
en sont une illustration parfaite. Une nouvelle forme de transfert de
risque est apparue pour permettre la couverture de tels événements,
n’empruntant plus le véhicule traditionnel de la société d’assurance:
il s’agit de la technique de la titrisation du risque sur les marchés
financiers. Ainsi, des obligations indexées sur la survenance d’une
catastrophe naturelle ont été émises sur le marché américain (cat-
bonds). Ces obligations sont caractérisées par le fait que leurs cou-
pons et/ou leur principal peuvent disparaı̂tre si une catastrophe
naturelle d’une certaine ampleur survient. Un rendement élevé est
prévu afin d’indemniser le prêteur de l’éventuelle perte des flux liés
à son prêt. Le prêteur joue donc le rôle d’une société d’assurance:
il assure l’emprunteur contre le dommage causé par la survenance
d’une catastrophe naturelle.
L’intérêt des marchés financiers pour ce type d’instruments se
justifie par leur faible corrélation, voire leur dépendance négative
avec les rendements procurés par les autres titres disponibles (ac-
tions, obligations, etc.).
16 Chapitre 1. Le risque et sa couverture contractuelle

1.2 Alea iacta est...

1.2.1 Insolvabilité de l’assureur

Supposons à présent que l’assureur a franchi le Rubicon: il a


souscrit une série de contrats d’assurance. Il s’agit à présent de les
gérer au mieux. Les engagements de l’assureur vis-à-vis de ses clients
sont incertains et conditionnels car ils dépendent de la survenance
aléatoire des sinistres. Dès lors, la société d’assurance, en accumulant
les risques qu’elle a souscrits, court elle-même un danger d’insolva-
bilité.
Afin d’éviter tout risque de faillite dont les conséquences sociales
seraient fâcheuses (pour le tiers victime d’un accident comme pour
l’assuré lui-même), la plupart des Etats ont mis en place des orga-
nismes contrôlant l’activité des sociétés d’assurance opérant sur leur
territoire. L’exercice de l’activité d’assurance est ainsi subordonné
à l’obtention préalable d’une autorisation administrative délivrée
par les pouvoirs publics (appelée agrément). Un organisme institué
par l’Etat vérifie que les entreprises d’assurance restent en mesure
d’honorer les engagements qu’elles ont pris envers les assurés. Ces
vérifications portent notamment sur l’appréciation du caractère suf-
fisant des provisions techniques (évaluation comptable des engage-
ments envers les assurés), de la qualité des actifs (placements) qui les
représentent et enfin de l’existence d’une marge de solvabilité per-
mettant de faire face à d’éventuelles pertes futures. L’agrément peut
être retiré dès lors que l’évolution probable de la situation financière
future de l’entreprise ferait craindre un mauvais déroulement des ga-
ranties délivrées.

1.2.2 Cadences de réglement

Si beaucoup de sinistres bénins peuvent être réglés en quelques


mois, les sinistres plus graves nécessitent souvent des délais de règlement
beaucoup plus longs. Songeons par exemple à un accident de la route
ayant entraı̂né des lésions corporelles: il faudra attendre que l’état
de la victime se soit stabilisé avant de pouvoir évaluer le préjudice
qu’elle a subi. Les assurances de responsabilité sont réputées à ca-
dence de règlement longue, les assurances de choses donnant sou-
vent lieu à des règlements plus rapides. En assurance automobile,
les sinistres sont payés en moyenne deux à trois ans après leur surve-
1.2. Alea iacta est... 17

nance 3 . Pour avoir une idée de la longueur des délais, on peut citer
l’exemple de l’indemnisation des victimes de la pollution provoquée
par le naufrage de l’Amoco Cadiz survenu en 1978, pour lequel le
jugement final est intervenu en 1992!
Les cadences de règlement parfois très longues dans certaines
branches d’assurance de responsabilité obligent bien souvent à dis-
tinguer l’exercice de survenance d’un sinistre, année où le sinistre
a eu lieu, de l’exercice de déclaration du sinistre, année où l’as-
suré a signalé l’existence du sinistre à l’assureur, et de l’exercice
de règlement du sinistre, année où le sinistre a été définitivement
réglé par l’assureur. Les exercices séparant l’exercice de survenance
et l’exercice de règlement sont appelés exercices de développement.

1.2.3 Nécessité du provisionnement


Les sociétés d’assurance évoluent dans un cadre concurrentiel.
Par conséquent, les portefeuilles des compagnies sont ouverts: cer-
tains assurés quittent la compagnie en résiliant leur police tandis
que de nouvelles affaires font leur entrée. Du fait des résiliations,
l’assureur ne peut donc pas compter sur des primes futures pour ho-
norer ses engagements actuels. Il fonctionne donc en capitalisation:
les primes encaissées au cours d’un exercice donné doivent permettre
de payer les sinistres survenus au cours du même exercice. Le régime
prévalant à l’heure actuelle est en effet celui de l’exercice de surve-
nance: c’est à l’assureur qui couvrait le risque au moment de la
survenance du sinistre qu’il incombe d’en supporter le coût, même
si l’assuré a entretemps changé de compagnie.
Comme l’exercice de paiement des sinistres peut différer de quelques
années de celui de l’encaissement des primes, cela oblige les compa-
gnies à constituer des réserves ou provisions techniques à l’aide des
primes relatives à un exercice, afin de régler les sinistres survenus au
cours de cet exercice une fois que leurs montants seront connus. A
tout instant, l’assureur doit disposer de provisions suffisantes pour
lui permettre, à supposer que la souscription s’arrête à cet instant,
d’indemniser intégralement les sinistres ayant affecté ou devant af-
fecter les contrats souscrits jusqu’alors, frais de gestion inclus. Nous
reviendrons dans le Tome II sur les modèles actuariels permettant
d’évaluer le montant à réserver chaque année.
3. Pour avoir une idée assez précise de la cadence de règlement moyenne des
sinistres d’une branche, il suffit de faire le rapport entre le montant total des pro-
visions constituées par les compagnies opérant sur un marché et l’encaissement
annuel total de ces assureurs.
18 Chapitre 1. Le risque et sa couverture contractuelle

Le fonctionnement en capitalisation pure est l’une des différences


existant entre les assureurs privés et les organismes relevant de
la Sécurité Sociale. Ces derniers peuvent en effet fonctionner en
répartition, c’est-à-dire utiliser les primes encaissées dans l’année,
voire dans le mois, pour régler les sinistres devant être être payés
durant la même période, même si ces sinistres se rapportent à des
périodes de garantie antérieures. La pérennité de ces systèmes est
garantie par l’affiliation obligatoire de la population.

1.2.4 Inversion du cycle de production


Principe
La charge financière occasionnée par une police du portefeuille
est inconnue au début de la période d’assurance, alors que la prime
a déjà été réclamée. La prime elle-même est déterminée sur base
de statistiques historiques et rien ne garantit qu’elle soit appropriée
aux affaires auxquelles elle est appliquée. Il subsiste donc une réelle
incertitude quant à l’adéquation de la prime au risque que la police
représente.
Cette simple constatation amène quelques commentaires. Dans
l’industrie, lorsqu’un nouveau produit est mis sur le marché, on
connaı̂t avec précision le montant consacré à sa mise au point et,
partant, son prix de revient. Par contre, le chiffre d’affaire de l’en-
treprise est a priori inconnu, car il dépend de la capacité de celle-ci
à vendre ses produits. Au contraire, lorsque l’assureur fixe la prime,
il ne connaı̂t pas le montant des sinistres ni les frais de gestion occa-
sionnés par ceux-ci. Sa situation est donc toute différente des autres
industries, puisque l’assureur connaı̂t a priori son chiffre d’affaire
(le volume des primes encaissées), mais pas le prix de revient des
produits qu’il commercialise (i.e. ses charges futures).
Il s’agit du principe de l’inversion du cycle de production. Il faut
parfois de longues années avant que la compagnie ne soit en mesure
d’évaluer exactement le profit engendré par un produit d’assurance
du fait des cadences de règlement très lentes des sinistres dans cer-
taines branches. Ce principe fondamental est à la base de la plupart
des techniques actuarielles.

Piège de l’annualité
Le versement a priori des primes ne doit pas faire oublier aux
assureurs le “piège de l’annualité”. Il s’agit de la tentation de faire
du chiffre et le report sur les exercices ultérieurs de la sinistralité (en
1.2. Alea iacta est... 19

sous-évaluant les provisions techniques à constituer). Dans certains


cas, un chiffre d’affaires important peut masquer une faillite virtuelle
dès lors que les primes ont été sous-estimées. L’émission de chaque
police est alors synonyme d’une perte future.

1.2.5 Le passif: reflet de l’activité de l’assureur


Le passif d’une société d’assurances
Le passif regroupe sept rubriques majeures:

1. capitaux propres;
2. passifs subordonnés: cette rubrique concerne des droits at-
tachés à des dettes, représentés ou non par des titres qui, en
cas de liquidation ou de faillite, ne doivent s’exercer qu’après
ceux des autres créanciers;
3. provisions techniques: il s’agit de provisions afférentes à l’ac-
tivité d’assurance inscrites en brut de réassurance;
4. provisions pour risques et charges;
5. dettes pour dépôts en espèces reçus des cessionnaires;
6. autres dettes: il s’agit notamment des autres dettes financières
(titres de créance négociable émis par l’entreprise, emprunt
pour fonds d’établissement), et des comptes de tiers (person-
nel, état, organismes sociaux, créanciers divers);
7. comptes de régularisation: il s’agit des produits à répartir sur
plusieurs exercices (l’amortissement des différences sur prix de
remboursement des obligations par exemple).

L’actif d’une société d’assurances


L’actif regroupe également sept rubriques majeures:

1. capital souscrit non appelé;


2. actifs incorporels: frais d’établissement et valeur d’acquisition
du fonds commercial;
3. placements: tous les placements, qu’il s’agisse des terrains et
constructions, des placements dans les entreprises liées ou avec
lien de participation, des autres placements (financiers) et des
créances pour espèces déposées chez les cédantes;
4. part des réassureurs dans les provisions techniques: il s’agit de
la part des provisions techniques à charge des réassureurs;
5. créances;
20 Chapitre 1. Le risque et sa couverture contractuelle

6. autres actifs: il s’agit des actifs corporels d’exploitation, des


avoirs dans les banques et des actions propres;
7. comptes de régularisation: il s’agit des charges à répartir sur
plusieurs exercices, des intérêts et loyers acquis et non échus,
les frais d’acquisition reportés.

Impact de l’inversion du cycle de production sur le bilan


des compagnies d’assurance
Le principe de l’inversion du cycle de production a un impact
important sur le bilan d’une société d’assurances. Le bilan montre
que les primes sont encaissées avant que les prestations correspon-
dantes ne soient payées. Il explique comment les engagements envers
les assurés (matérialisés par les provisions techniques) sont couverts
par les placements effectués par l’assureur.
La comptabilité des entreprises d’assurances fonctionne sur base
de droits constatés: elle doit enregistrer dès leur naissance les en-
gagements donnés, voire anticiper la déclaration tardive de sinistres
survenus au cours de l’exercice. On enregistre le coût total d’un
sinistre dans l’exercice de survenance, même si ce coût total n’est
qu’estimé et le sinistre réglé sur plusieurs exercices ultérieurs.
Dans la plupart des entreprises, l’essentiel de l’activité se re-
trouve dans l’actif du bilan, dans les stocks, les bâtiments d’usine,
les brevets, ... On peut donc lire le bilan de gauche à droite: le bilan
montre comment l’actif a été financé par le passif. Dans une société
d’assurance, au contraire, l’activité conduit à un passif représentant
les engagements contractés par la compagnie envers les assurés. L’ac-
tivité de la société s’illustre surtout dans son passif et le bilan se lit
de droite à gauche: il montre comment le passif a été placé.

Provisions techniques
En échange des primes perçues, l’assureur inscrit au passif de son
bilan un engagement, une dette. Les provisions techniques figurant
au passif du bilan représentent les engagements de la compagnie por-
teuse du risque vis-à-vis des assurés ou des tiers lésés. On distingue
notamment
1. la provision pour prime non acquise (PPNA) calculée pro rata
temporis, reprenant la part des primes émises se rapportant à
l’exercice comptable suivant. Cette provision naı̂t du fait que la
plupart des contrats d’assurance non-vie prévoient une durée
de garantie d’un an, et la prime est payée d’avance. Chaque
1.2. Alea iacta est... 21

prime est donc répartie entre les exercices comptables au cours


desquels elle donne droit à couverture. Un assuré qui s’acquitte
de sa prime annuelle le 1er mars donnera lieu au report de
2/12 du montant de la prime sur l’exercice suivant, sous la
forme d’une PPNA. Seule la quote-part des primes afférente à
l’exercice en cours apparaı̂t dans les primes acquises.
2. le provision pour risque en cours (PREC) qui a pour objet
de pallier une éventuelle insuffisance des tarifs. Il s’agit ici de
se prémunir contre un risque de modèle: si le modèle retenu
par l’actuaire s’avère erronné, ou s’il apparaı̂t que des risques
inconnus lors de la tarification, tombent sous le coup de la
garantie, l’assureur s’expose à des pertes systématiques, qu’il
reflète dans son bilan sous la forme d’une PREC.
3. la provision pour sinistres à payer (PSAP) qui concerne les si-
nistres déjà survenus à la date d’inventaire mais qui ne sont pas
encore réglés. Deux types de PSAP doivent être distinguées:
celles qui concernent des garanties en cours pour lesquelles
les sinistres ne sont pas encoré révélés, et la provision corres-
pondant à des sinistres survenus, mais non encore payés. On
distingue ainsi
(a) les sinistres réglés mais non encore payés: le montant du
sinistre est déterminé, mais le paiement correspondant
n’est pas encore (totalement) effectué;
(b) les sinistres non encore réglés:
i. soit le sinistre est déclaré et il reste à en évaluer le
montant final;
ii. soit il est survenu mais pas encore déclaré et il faut
estimer le nombre et le coût de tels sinistres (déclarés
tardifs ou IBNR pour l’anglais “Incurred But Not Re-
ported”). Le cas typique d’un sinistre IBNR est l’in-
cendie touchant un hôtel abritant de joyeux fêtards
le soir de la Saint-Sylvestre. S’il survient avant les
douze coups de minuit, ce sinistre doit être imputé à
l’année qui s’achève, même s’il ne sera déclaré qu’au
début de l’année suivante.
La nature aléatoire des engagements de l’assureur et les cadences
de règlement parfois très longues rendent les évaluations comptables
difficiles: s’il est aisé d’enregistrer un paiement effectué, il est beau-
coup plus ardu de prévoir des paiements futurs dont les montants
sont aléatoires. Dans certains cas, l’évaluation des provisions tient
plus de l’art que de la science exacte. Bien évidemment, ces provi-
22 Chapitre 1. Le risque et sa couverture contractuelle

sions pourront être par la suite réévaluées à la hausse ou à la baisse


pour tenir compte d’informations complémentaires. Les paiements
effectués seront imputés aux provisions constituées à cet effet.

1.2.6 Primes émises, primes acquises


On peut représenter de manière simplifiée le compte d’exploita-
tion d’une branche d’assurance pour l’année t comme suit:
Recettes Charges
Primes émises Réserve de primes
durant l’année t au 31/12 de l’année t

Réserve de primes Réserve de sinistres


au 1/1 de l’année t au 31/12 de l’année t

Réserve pour sinistres Sinistres payés


au 1/1 de l’année t au cours de l’année t

Intérêts Commissions et autres


charges d’exploitation
Expliquons brièvement ce tableau. Les primes encaissées au cours
de l’année t ne peuvent pas être entièrement comptabilisées en re-
cettes. En effet, une prime annuelle versée le premier mai de l’année
t servira également à couvrir le risque assuré durant les mois de
janvier à avril de l’année t + 1. La compagnie porte donc en réserve
les primes encaissées se rapportant à l’exercice suivant. En général,
la répartition du montant des primes se fait pro rata temporis. Ceci
amène à définir les primes acquises pour l’année t comme suit:

primes acquises de l’année t


= primes émises durant l’année t
+réserve de prime au 1/1 de l’année t
−réserve de prime au 31/12 de l’année t.

En général, les primes émises au cours d’un exercice ne coı̈ncident


pas avec les primes acquises (ce ne serait le cas que si l’encaissement
restait constant au cours du temps, ce qui est peu probable).
Pour les sinistres survenus au cours de l’année t, mais non encore
clôturés fin décembre, la compagnie porte en charge pour l’année t la
valeur estimée des dépenses futures relatives à ces sinistres; il s’agit
de la réserve pour sinistre à régler au 31 décembre de l’année t. En
1.2. Alea iacta est... 23

recette, on retrouve également la réserve pour sinistres à régler de


l’année précédente. On a donc

sinistres acquis pour l’année t


= sinistres payés durant l’année t
+réserve pour sinistres à régler du 31/12 de l’année t
−réserve pour sinistre à régler du 1/1 de l’année t.

Pour le reste, les charges d’exploitation sont les frais généraux


relatifs à la branche d’assurances considérée et les intérêts sont ceux
produits par les réserves et les primes. Le solde du compte d’exploi-
tation donnera le bénéfice (ou la perte) d’exploitation.
Afin d’avoir une idée de l’importance relative des différents postes,
les résultats en 2001 des compagnies d’assurance non-vie françaises
sont repris au Tableau 1.2.

Ressources
Primes, cotisations 47,4
Dotations au provisions de cotisations -0,7
Produits de placements alloués 4,5
Autres produits techniques 0,5
Charges
Charges de sinistres 35,3
Charges de provisions techniques 3,7
Frais d’acquisition et d’administration 9,8
Autres charges techniques 1,6
Résultat technique avant reassurance 1,3
Part des réassureurs dans les charges 9,1
Cotisations cédées aux réassureurs 9,0
Résultat technique après reassurance 1,4
Produits de placements 1,3
Autres éléments non-techniques -0,7
Résultat net comptable 2,0

Tab. 1.2 – Résultats (en milliards d’euros) des compagnies d’assu-


rance non-vie françaises en 2001.

1.2.7 Les assureurs, investisseurs institutionnels


Depuis la seconde guerre mondiale, la hausse du niveau de vie,
l’accroissement de la valeur des biens assurés traditionnels (immeubles,
24 Chapitre 1. Le risque et sa couverture contractuelle

automobiles, etc.) et, plus encore, l’augmentation du prix de la vie


humaine (obtenu en actualisant la moyenne des revenus perdus en
cas d’invalidité permanente ou de décès) ont largement contribué
à l’essor du marché de l’assurance. Dans le même temps, les Etats
ont rendu obligatoires de nombreux contrats d’assurance couvrant
la responsabilité de certaines catégories de la population (automo-
bilistes, par exemple). Ceci explique pourquoi l’assurance pèse de
plus en plus lourd dans l’économie.
Le mécanisme de capitalisation auquel sont soumises les compa-
gnies d’assurance explique pourquoi celles-ci sont des investisseurs
institutionnels: les montants importants mis en réserve en prévision
du règlement futur des sinistres survenus lors de chaque exercice
sont placés selon différentes formules (prêts octroyés à des parti-
culiers ou des entreprises, obligations, actions, immobilier, ...). La
gestion financière est donc au coeur du métier de l’assureur.
Il s’agit pour l’assureur de placer au mieux les sommes colos-
sales constituées par les provisions techniques, tout en respectant
des impératifs de prudence. Les placements de l’assureur sont en
effet le gage que celui-ci sera à même de tenir ses promesses. C’est
pourquoi ils sont soumis à des règles prudentielles strictes. De plus,
les pouvoirs publics imposent souvent que les placements des com-
pagnies d’assurance s’effectuent dans le sens de l’intérêt général et
du développement économique (tout en répondant aux impératifs
de prudence).

1.2.8 Gestion actif-passif


La gestion dynamique de l’actif et du passif a également contribué
à rapprocher l’actuariat et la finance. Les actifs accumulés pour faire
face aux sinistres futurs sont d’un tel poids que leur gestion et leur
rendement deviennent un élément essentiel dans la formation des
résultats des compagnies d’assurance. Ainsi, il n’est pas rare qu’un
déficit technique (i.e. des primes ne suffisant pas à dédommager les
sinistres) soit épongé par des rendements financiers suffisants.
Un aspect stratégique de la gestion des compagnies d’assurance
non-vie consiste à placer adéquatement les provisions techniques
tout en respectant les prescrits légaux et réglementaires. Ces provi-
sions servant à dédommager les sinistres, il faut donc que les place-
ments qui les représentent arrivent à échéance lorsque les indemnités
doivent être versées. Cette gestion dynamique de l’actif et du passif
de la compagnie par des techniques ALM (pour l’anglais Asset and
Liability Management) permet de maximiser les rendements finan-
1.3. Le contrat d’assurance 25

ciers générés par les provisions techniques, et de diminuer d’autant


les primes. Très succinctement, les techniques ALM tendent à faire
correspondre les maturités de l’actif et du passif. La stratégie consis-
tant à conserver liquide la totalité des primes encaissées étant loin
d’être optimale, il s’agit donc de sélectionner des placements dont
les échéances permettront de faire face aux obligations futures. No-
tez que les sinistres les plus coûteux nécessitant en général des délais
importants de règlement, les assureurs non-vie font également des
placements à long terme.

1.3 Le contrat d’assurance


1.3.1 Les origines: le contrat d’assurance maritime
Depuis la nuit des temps, les hommes parcourent les mers du
globe. La navigation était périlleuse aux origines, ce qui explique
pourquoi l’assurance est née de la mer. Les premiers contrats d’as-
surance ont été retrouvés dans les archives des grands ports de Ca-
talogne et d’Italie: Barcelone, Gênes et Venise. Les racines de l’as-
surance plongent donc dans le commerce maritime, ce qui explique
pourquoi cette branche d’assurance a eu une influence considérable
sur le développement du secteur.
L’assurance maritime ne fut vraiment pratiquée qu’à partir du
14ème siècle. Auparavant, d’autres formules étaient utilisées pour se
protéger contre les dangers de la navigation. Ainsi, les Grecs et les
Romains pratiquaient-ils le contrat à la grosse aventure. Il s’agissait
d’un emprunt, gagé sur un lot de marchandises destinées à être
expédiées au loin. Si les marchandises n’arrivaient pas à destination,
le prêteur perdait tout droit au remboursement de la somme prêtée.
Par contre, en cas de retour à bon port du navire, le prêteur était
remboursé de son avance majorée d’importants intérêts. Lors d’un
transport par mer de marchandises, le marchand atténuait ainsi les
risques du voyage en se faisant prêter tout ou partie de la valeur
de la cargaison. Il s’agissait donc d’une opération financière aux
termes de laquelle le prêteur “aventurait” son argent au-delà des
mers. L’emprunteur payait un intérêt élevé (dit intérêt de grosse)
compensant l’insécurité permanente des voyages en mer (il s’agit du
prix du risque), mais cet intérêt n’était versé, et le capital rendu,
qu’en cas de bonne arrivée du navire.
Si on analyse de plus près le contrat à la grosse aventure, on
constate qu’il s’agit en réalité d’une opération de crédit, compor-
tant pour le prêteur un risque spécial de perte totale de la somme
26 Chapitre 1. Le risque et sa couverture contractuelle

prêtée. A la différence de la prime, l’intérêt stipulé n’était pas en


rapport avec les chances de réalisation du risque (il n’est donc pas
proportionné au risque). Néanmoins, il se dégage du contrat à la
grosse aventure une formule consciente de protection et de transfert
contre les risques de la navigation.
L’intérêt souvent fort élevé fixé arbitrairement par le prêteur
en tenant compte du bénéfice important escompté par le marchand
encourut les foudres du droit canon. En 1234, à la suite de l’inter-
diction du pape Grégoire IX prohibant l’usure et tout prêt à gros
intérêt subordonné à des transferts par mer ou par terre, le recours
au contrat à la grosse aventure a été pratiquement supprimé. La
forme de pari qu’avait pris le contrat à la grosse aventure a pu jus-
tifier l’ordonnance papale de 1234. En effet, il était devenu possible
en de nombreux endroits de recevoir de l’argent sur la seule chance
qu’avait un navire déterminé d’arriver à bon port. Dans ce cas, le
prêt était remboursé, augmenté de confortables intérêts. Dans le cas
contraire, tout était perdu pour le prêteur. Il s’agissait en fait d’un
vulgaire pari.
En vue de soustraire le contrat à la grosse aventure à l’interdic-
tion papale, les intellectuels de l’époque s’employèrent à l’analyser
et à le décomposer. Ils proposèrent de distinguer dans le contrat à
la grosse aventure deux conventions distinctes:
1. l’une consistant en un prêt, en vertu de laquelle le donneur
remettait une somme
2. l’autre dite susceptio periculi par laquelle le donneur moyen-
nant une somme convenue prenait sur lui les risques suscep-
tibles d’atteindre la somme prêtée.
Ils eurent ainsi l’habileté d’ôter du contrat à la grosse aventure la
partie prêt pour ne conserver que la convention relative aux périls
de la navigation. Le contrat d’assurance maritime était né!

1.3.2 La naissance de l’assurance terrestre: le grand


incendie de Londres
Les villes moyen-âgeuses étaient formées de bâtiments faits de
bois (mis à part quelques édifices importants, comme l’église, le don-
jon ou des maisons de pierre abritant les notables). Faute de place,
les rues étaient étroites et les maisons, bâties côte à côte et compor-
tant souvent deux à trois étages, constituaient une proie rêvée pour
les flammes.
L’assurance incendie naı̂t en Grande-Bretagne, après le grand
incendie de Londres en 1666. Le 2 septembre de cette année-là,
1.3. Le contrat d’assurance 27

vers une heure du matin, le feu qui avait débuté dans une bou-
langerie s’étendit avec une telle rapidité qu’il fallut 7 jours pour le
maı̂triser. La population de Londres fut obligée de quitter la ville
par les routes et par le fleuve. Quelque 13 000 maisons et 90 églises
(dont la Cathédrale Saint-Paul) furent totalement détruites.
Frappé par ce désastre national, le gouvernement anglais favorisa
la création des compagnies d’assurance contre l’incendie. Celles-ci
organisèrent leurs propres corps de secours en leur donnant comme
instruction, en cas d’incendie, d’intervenir en priorité en faveur des
immeubles dont les propriétaires étaient assurés chez elles (ils étaient
reconnaissables aux fire marks, plaques métalliques apposées sur la
façade et mentionnant le nom de la société qui couvrait le bâtiment).

1.3.3 De la solidarité informelle à l’assurance


La solidarité consiste en la prise en charge par une collecti-
vité des sinistres subis par certains de ses membres. La pérennité
d’une telle organisation exige un groupe social cohérent, où s’ap-
plique la réciprocité: en aidant les sinistrés d’aujourd’hui, chacun
sait qu’il pourra compter lui-même dans l’avenir, le cas échéant, sur
une contribution semblable des autres.
L’assurance est la digne héritière de la solidarité informelle consti-
tuant le ciment de tous les groupes sociaux. Les formes primitives
de transfert de risque se distinguent par deux traits:
1. les bénéficiaires des garanties ont un lien social entre eux, ce
qui rend inutile le formalisme contractuel;
2. il n’y a pas versement préalable d’une prime pour financer la
réparation des sinistres, mais la solidarité se manifeste par le
versement a posteriori d’une somme réparant le préjudice dû
au sinistre.
Ces systèmes informels ont prouvé leur efficacité en fonctionnant
durant plusieurs siècles. Néanmoins, avec le développement des ac-
tivités humaines (industrie et commerce) et la création des cités, le
besoin d’un système plus élaboré s’accompagnant d’un plus grand
formalisme s’est fait sentir. Suite à l’urbanisation rapide, les com-
munautés d’autrefois se sont disloquées. Dès lors, il est devenu im-
pensable de faire uniquement appel à la solidarité pour contrer les
mauvais coups du sort. La solidarité de jadis a naturellement fait
place à l’assurance mutuelle, puis à l’assurance commerciale: la mise
en commun des risques est organisée par des sociétés et la commu-
nauté d’autrefois fait place à un ensemble d’assurés qui n’ont plus
de liens sociaux particuliers entre eux.
28 Chapitre 1. Le risque et sa couverture contractuelle

1.3.4 Contrat et police


Le contrat d’assurance est un accord passé entre une compa-
gnie d’assurance et un souscripteur ou preneur d’assurance fixant à
l’avance et pour une période déterminée des échanges financiers en
fonction d’un ensemble bien défini d’événements aléatoires.
La police (du latin polliceor signifiant promesse) est l’écrit qui
constate la formation d’un contrat d’assurance. La police d’assu-
rance comprend des conditions générales non personnalisées et des
conditions particulières qui précisent notamment la date de prise
d’effet du contrat, la durée de la garantie, les caractéristiques du
risque assuré, le montant des versements à effectuer par le souscrip-
teur, et le mode de détermination des prestations de l’assureur.
Remarquons que le contrat d’assurance a comme caractéristique
que tous les engagements des parties ne sont pas fixés dans la po-
lice. En ce qui concerne l’assuré, seul le mode de calcul de la prime
peut être décrit dans le contrat (qui peut prévoir un mécanisme
de type bonus-malus, par exemple). La prestation de l’assureur est
évidemment inconnue en début de période, mais la police doit prévoir
les modalités de sa détermination. C’est en ce sens que le contrat
d’assurance est un contrat aléatoire.

1.3.5 Assuré, preneur d’assurance et bénéficiaire


L’assuré se confond très souvent avec le preneur d’assurance, re-
devable des primes, mais il peut être distinct. Il s’agit précisément
soit de celui qui est propriétaire des biens assurés dans une assurance
de choses, soit de celui dont la responsabilité est couverte dans une
assurance de responsabilité, soit enfin de la personne dont le sort
futur engendre le risque (en assurance sur la vie ou en assurance ac-
cidents). Enfin, le contrat d’assurance peut être stipulé pour autrui.
Le bénéficiaire est une personne pouvant prétendre aux garanties
offertes par l’assureur du fait de la police souscrite par le preneur
d’assurance. Dorénavant, nous ne parlerons que d’assuré, ce terme
désignant la personne dont le sort engendre le risque.

1.3.6 Et la technique dans tout ça?


Comme le fait remarquer Borch (1990), un risque peut être cou-
vert même si aucune statistique n’est disponible à son sujet, voire
même si aucune analyse théorique ne semble s’y appliquer, comme
en témoigne l’anecdote suivante. En 1971, la distillerie de whisky
Cutty Sark offrit une récompense d’un million de livres sterling à
1.3. Le contrat d’assurance 29

celui qui capturerait Nessie, le célèbre monstre supposé hanter les


eaux du Loch Ness en Ecosse. Apparemment, les dirigeants de l’en-
treprise eurent en bons pères de famille (un tantinet crédules cepen-
dant) quelques frayeurs à l’idée de devoir débourser une telle somme.
Ils contactèrent alors les célèbres Lloyd’s de Londres. Comme tou-
jours, les Lloyd’s acceptèrent de couvrir le risque de devoir verser
la récompense promise, contre une prime de 2 500 livres sterling.
Une police en bonne et due forme fut même établie, stipulant que
le risque ne serait couvert que si le monstre était capturé vivant
entre le premier janvier 1971 et le 30 avril 1972, pour autant que
la taille de celui-ci excède 20 pieds de long (environ sept mètres)
et que les conservateurs du Natural History Museum de Londres y
reconnaissent Nessie. Les Lloyd’s n’omirent pas de préciser, comme
de coutume en assurance maritime, que le monstre deviendrait leur
propriété s’ils versaient la récompense (ce qui rendait le contrat sans
risque pour eux, du fait des revenus considérables générés par l’ex-
hibition d’un hypothétique monstre tel que Nessie).
Dans un autre domaine, des contrats d’assurance atypiques sont
épisodiquement utilisés par le monde du spectacle, qui espère pro-
fiter de l’effet d’annonce qu’ils causeront dans le public. Ainsi, un
célèbre théâtre londonien programmant un vaudeville à l’occasion
des fêtes de fin d’année souscrivit (toujours auprès des Lloyd’s) une
police couvrant le risque de décès d’un spectateur suite à un fou-rire.
Plus sérieusement, les satellites envoyés dans l’espace sont cou-
verts contre toute une série de risques alors que les statistiques si-
nistres sont quasiment inexistantes dans le domaine. Il est clair que
l’avis des experts joue à cet égard un rôle tout à fait prépondérant.
Les principes décrits dans cet ouvrage ont une portée relative-
ment générale et s’adaptent aux polices plus exotiques (domaine de
prédilection des Lloyd’s), où l’actuaire n’a souvent à sa disposition
que son bon sens et l’avis plus ou moins éclairé d’experts.

1.3.7 Prestations des parties


Assuré

Les sommes versées par le preneur d’assurance (ou souscripteur)


pour avoir droit à la garantie de l’assureur sont appelées primes (ou
parfois cotisations). Ce terme, consacré par la législation, correspond
à l’anglais “premium”, qui en rappelle le paiement anticipatif: le
preneur s’acquitte de la prime au début du contrat pour avoir droit
à la couverture de l’assureur une fois le sinistre survenu pendant la
30 Chapitre 1. Le risque et sa couverture contractuelle

période de garantie.
On attend également du preneur qu’il prenne toutes les précautions
raisonnables pour éviter la survenance de sinistres, et une fois le si-
nistre survenu, qu’il prenne toutes les mesures nécessaires pour en
atténuer les conséquences.

Assureur

La prestation de l’assureur a pour objet principalement une


somme d’argent, mais elle peut aussi consister en un service à four-
nir. La prestation monétaire n’appelle pas de commentaires parti-
culiers. En assurance dommages ou responsabilité, on partira d’une
évaluation des dommages subis lors du sinistre ou des réclamations
des tiers ayant subi un préjudice, après une phase contradictoire qui
se terminera par une transaction à l’amiable ou l’intervention d’un
jugement. Le règlement final de l’assureur (le montant du sinistre)
sera égal à l’estimation dont il est question ci-dessus, éventuellement
diminuée par application d’une limite supérieure de garantie ou par
défalcation d’une franchise.
De plus en plus souvent, les compagnies proposent aux assurés
des conditions de règlement des sinistres avantageuses (notamment,
le règlement direct par la compagnie des frais aux réparateurs)
pour autant que l’assuré se conforme à leurs instructions. Typique-
ment, l’assuré est tenu choisir un réparateur au sein d’un réseau
agréé par la compagnie. Ceci permet aux assureurs de maı̂triser les
coûts de réparation en s’attachant les services d’artisans honnêtes
et consciencieux.
Lorsque la prestation ne consiste pas en une somme d’argent,
l’assureur peut promettre des services personnels. Dans les assu-
rances de responsabilité, il se réserve la direction du procès contre le
tiers lésé. Dans les assurances de frais de justice, l’assureur promet à
l’assuré de l’assister de ses conseils dans des cas déterminés. Dans les
contrats d’assistance, l’assureur peut organiser le déplacement d’un
membre de la famille pour lui permettre de se rendre au chevet de
l’assuré. La plupart des assurances automobiles prévoient désormais
la mise à disposition d’un véhicule de remplacement, si le véhicule
couvert devait se trouver immobilisé suite à un sinistre tombant sous
la garantie.
1.3. Le contrat d’assurance 31

Réparation indemnitaire ou forfait


Lorsque la réparation consiste en une somme d’argent, on dis-
tingue habituellement entre réparation indemnitaire et réparation
forfaitaire: lorsqu’un sinistre survient, l’assureur, suivant le cas, verse
1. une indemnité dont le montant répare le préjudice subi par
l’assuré ou le tiers lésé (qui ne peuvent en aucun cas tirer pro-
fit du sinistre survenu). En cas de réparation indemnitaire,
le montant versé par l’assureur est donc inconnu a priori. La
plupart des polices prévoient en outre le mode d’évaluation du
dommage. En assurance de choses, on distingue ainsi l’indem-
nisation en valeur à neuf, en valeur d’usage, etc.
2. un forfait dont le montant est prévu au contrat. L’étendue
du sinistre et le préjudice subi par l’assuré n’entrent pas en
ligne de compte pour la fixation du montant versé. En cas
de réparation forfaitaire, il n’y a donc aucun aléa concernant
la dépense de l’assureur en cas de sinistre. Il en est ainsi de
certaines polices couvrant la perte ou le vol des bagages, ou
de l’assurance couvrant la perte de revenus de l’assuré, par
exemple.
Certaines formes d’assurance comprennent à la fois un volet for-
faitaire et un autre indemnitaire. Il en est ainsi par exemple des
assurances soins de santé couvrant les frais d’hôpital, les achats de
médicaments, etc. (volet indemnitaire) et prévoyant un forfait par
jour d’hospitalisation.

Limitation de l’intervention de l’assureur


Le plus souvent, le risque supporté par l’assuré n’est que par-
tiellement pris en charge par l’assureur, même en cas de réparation
indemnitaire. Il est en effet fréquent que l’assureur stipule dans la
police des clauses de franchise, de découvert obligatoire, de limite
de garantie (plafond d’intervention), etc.
La franchise et le découvert obligatoire, consistent à laisser à
charge de l’assuré une partie du dommage. Le but poursuivi est la
bonne gestion financière de la mutualité: on élimine de la garantie
les sinistres de faible importance afin de diminuer les frais généraux.
De plus, on incite l’assuré à faire preuve de vigilance en vue d’éviter
la survenance des sinistres.
La plupart du temps, la compagnie prévoiera un montant maxi-
mum d’intervention (sauf lorsque la loi le lui interdit), par sinistre
ou par période. La partie des sinistres excédant cette limite sera à
32 Chapitre 1. Le risque et sa couverture contractuelle

charge de l’assuré.
Enfin, dans les assurances où le comportement de l’assuré peut
influencer le montant des sinistres, il est parfois utile de prévoir un
découvert obligatoire exprimé comme un pourcentage de l’indemnité
versée par la compagnie.

Somme assurée
La somme assurée revêt une importance considérable dans les
calculs de l’actuaire. En aucun cas, les indemnités payées par la
compagnie en exécution du contrat ne peuvent dépasser la somme
assurée. Il s’agit soit de la valeur attribuée au bien assuré, soit du
montant à concurrence duquel l’assuré entend préserver son patri-
moine contre une action en responsabilité. En vertu du principe
indemnitaire, la prestation de l’assureur est fonction de la somme
assurée et du préjudice subi par l’assuré ou par le bénéficiaire de
l’assurance consécutivement à la réalisation du risque.

Règle proportionnelle
La prime doit être proportionnée au risque et à la somme assurée,
non seulement lors de la conclusion du contrat, mais pendant toute
la durée de celui-ci. La législation fait de nombreuses applications
de ce principe, parmi lesquelles figure la règle proportionnelle.
Si la prime a été calculée sur base d’une valeur inférieure à la
valeur réelle du bien assuré, l’indemnité doit, en cas de sinistre, être
réduite dans la proportion existant entre la valeur assurée et la va-
leur assurable (c’est la célèbre règle proportionnelle). Ainsi, si v d est
la valeur déclarée du bien et vr sa valeur réelle, il y a sous-assurance
lorsque vd < vr . Cette sous-assurance n’est le plus souvent détectée
qu’à l’occasion de la survenance d’un sinistre (car une vérification
systématique des déclarations des assurés à la souscription de la
police serait trop coûteuse). Dans ce cas, si x est le montant du
sinistre, l’indemnité est réduite à x × v d /vr en application de la
règle proportionnelle. Cette règle met donc l’assureur à l’abri d’une
sous-tarification résultant de fausses déclarations de l’assuré.
Dans le but de protéger les consommateurs, les compagnies pro-
posent divers mécanismes afin d’éviter l’application de la règle pro-
portionnelle. Ainsi, en assurance incendie, la plupart d’entre elles
remettent un formulaire d’évaluation de la valeur du bien au can-
didat preneur. Si celui-ci le complète de bonne foi, la prime sera
déterminée sur base de la valeur déduite des réponses aux différentes
1.4. Notes bibliographiques 33

questions (telles que nombre de chambres, matériaux de construc-


tion, etc.) et la compagnie ne pourra pas faire jouer la clause de
la règle proportionnelle même si elle découvre après sinistre que la
valeur du bien a été sous-évaluée.
Il est à noter qu’il existe une exception importante à la règle
proportionnelle: l’assurance au premier risque. Dans cette formule,
l’assureur s’oblige à couvrir la partie du dommage n’excédant pas
un seuil déterminé, quelle que soit la valeur du bien. Rares sont
cependant les assureurs à offrir encore ce type de couverture.

1.4 Notes bibliographiques


Ce chapitre est basé essentiellement sur Chiappori (1997), Eeck-
houdt & Gollier (1992), Lambert (1996) et Tosetti et al.
(2000). Parmi les références plus culturelles et historiques sur le
risque et l’assurance, les lecteurs pourront consulter Bernstein
(1998) et Ewald (1996).
L’ouvrage de Gallix (1985) contient de nombreuses reproduc-
tions de polices anciennes, qui valent le coup d’oeil. D’autre part,
Haberman (1996) ainsi que les 10 tomes de Haberman & Sibett
(1995) fourmillent de détails sur les origines de la profession.
34 Chapitre 1. Le risque et sa couverture contractuelle
Chapitre 2

Modélisation actuarielle
des risques

2.1 Introduction

S’agissant de réparer les conséquences du hasard, l’activité d’as-


surance ne peut s’appréhender que grâce au calcul des probabilités.
Celui-ci puise ses fondements dans la correspondance qu’ont entrete-
nue Blaise Pascal et le Chevalier de Méré, avant d’être formalisé au
détour de la seconde guerre mondiale par l’Ecole russe (Kolmogorov
en tête).

Le calcul des probabilités vise essentiellement à fournir une méthode


scientifique permettant de quantifier la vraisemblance de l’occur-
rence de certains événements. Dans ce cadre, la notion de variable
aléatoire fait naturellement son apparition. Celle-ci représentera pour
l’actuaire tantôt le coût du sinistre, tantôt le nombre de ceux-ci. Les
variables aléatoires, et les fonctions de répartition associées décrivant
leur comportement stochastique, fournissent les outils essentiels de
la modélisation des transferts des risques entre assurés et assureur.
Ce chapitre vise à préciser quelques points de terminologie et à rap-
peler les principaux concepts du calcul des probabilités qui seront
utilisés dans la suite de l’ouvrage.

35
36 Chapitre 2. Modélisation actuarielle des risques

2.2 Description probabiliste du risque


2.2.1 Evénements
Définition
Une notion fondamentale pour la suite sera celle d’événement
aléatoire. Il s’agit d’événements dont on ne peut prédire avec certi-
tude s’ils se réaliseront ou pas. C’est à ce genre d’événements que
sont subordonnées les prestations de l’assureur. Clairement,
1. les événements considérés dépendent de la définition des ga-
ranties promises par l’assureur.
2. la description des événements doit être exhaustive, mais sans
double emploi.

Evénements élémentaires
Définissons les événements élémentaires e 1 ,e2 ,e3 , . . . comme étant
ceux satisfaisant aux deux propriétés suivantes:
1. deux événements élémentaires distincts e i et ej , j 6= i, sont
incompatibles, c’est-à-dire qu’ils ne peuvent se réaliser simul-
tanément.
2. La réunion E = {e1 ,e2 , . . .} de tous les événements élémentaires
e1 ,e2 , . . . correspond à la certitude, c’est-à-dire à l’événement
qui se réalise toujours.
Associons à présent à chaque événement l’ensemble des résultats
élémentaires qui conduisent à sa réalisation. Tout événement E
peut ainsi s’exprimer comme la réunion d’événements élémentaires
ei1 , . . . ,eik , c’est-à-dire que E se réalise lorsque soit e i1 , soit ei2 , . . . ,
soit eik se réalise. Ceci se notera dorénavant E = {e i1 , . . . ,eik }.

Formalisme ensembliste
Ayant identifié chaque événement à un sous-ensemble de E, le
formalisme ensembliste jouera donc un rôle important dans la suite.
C’est pourquoi, étant donnés deux événements E et F , nous note-
rons dorénavant
E (qui se lit “non E”) l’événement qui se réalise lorsque E ne se
réalise pas (E est encore appelé complémentaire de E);
E ∩ F (qui se lit “E et F ”) l’événement qui se réalise lorsque E et
F se réalisent simultanément;
E ∪ F (qui se lit “E ou F ”) l’événement qui se réalise lorsque E ou
F se réalise;
2.2. Description probabiliste du risque 37

E r F (qui se lit “E moins F ”) l’événement qui se réalise lorsque


E se réalise, mais pas F (on a donc E r F = E ∩ F );
∅ (qui se lit “événement impossible”) l’événement qui ne se réalise
jamais.

Propriétés satisfaites par l’ensemble des événements


Notons A l’ensemble des événements qui conditionnent le risque
(c’est-à-dire ceux nécessaires pour déterminer les prestations de l’as-
sureur). Ainsi, A est une collection de sous-ensembles de E, collection
à laquelle nous imposons de satisfaire les trois conditions suivantes
(qui font de A ce que les probabilistes appellent une sigma-algèbre
ou tribu):
(i) l’événement impossible ∅ ∈ A et l’événement certain E ∈ A
(ii) si E1 ,E2 , . . . ∈ A alors ∪i≥1 Ei ∈ A
(iii) si E ∈ A alors E ∈ A.
Quels que soient les événements E et F dans A, on peut vérifier que
les conditions imposées ci-dessus garantissent que E ∩ F et E r F
appartiennent également à A. Plus généralement, quelle que soit la
suite d’événements E1 ,E2 , . . . dans A, ∩i≥1 Ei s’y trouve également.
Les trois conditions imposées ci-dessus (i.e. la structure de sigma-
algèbre) garantissent en fait la cohérence du raisonnement, autori-
sant à parler d’événements qui se produisent lorsque plusieurs se pro-
duisent simultanément (intersection) ou lorsqu’au moins l’un d’entre
eux se produit (union).

2.2.2 Calcul des probabilités et absence d’opportunité


d’arbitrage
La notion de probabilité
Combien de fois n’entend-on pas dans la vie courante des phrases
du type “il va probablement pleuvoir demain”, “l’avion se posera
sans doute avec 20 minutes de retard” ou “il y a de fortes chances
pour qu’il soit en mesure d’assister à cette conférence”. Chacune de
ces phrases fait intervenir la notion de probabilité, même s’il peut
paraı̂tre de prime abord difficile de quantifier ces idées.
Il y a différentes manières d’appréhender le concept de proba-
bilité. Dans la vision fréquentiste, la probabilité apparaı̂t comme
valeur limite des fréquences relatives d’apparition de l’événement.
Le principe est relativement simple. Il suppose qu’on soit auto-
risé à répéter un grand nombre de fois et sous des conditions ri-
38 Chapitre 2. Modélisation actuarielle des risques

goureusement identiques une expérience au cours de laquelle un


certain événement peut se produire ou non. Le rapport entre le
nombre de fois où l’événement s’est produit et le nombre total de
répétitions est appelé fréquence relative d’apparition de l’événement.
Cette fréquence relative tend à se stabiliser au fur et à mesure des
répétitions, et la valeur limite est la probabilité de l’événement.
Le défaut de l’approche décrite ci-dessus est bien évidemment
son applicabilité réduite. De nombreux événements ne peuvent être
répétés ou n’ont pas encore été répétés suffisamment souvent que
pour pouvoir en dégager une probabilité. On peut alors penser à
définir des probabilités subjectives: il s’agit d’opinions d’experts
quant à la vraisemblance de tel ou tel événement.
Même si la notion de probabilité et leur détermination pose
problème, une fois que celles-ci sont données, le calcul des probabi-
lités permet de les utiliser dans le cadre de la gestion des risques par
une compagnie d’assurances. Ainsi, lors du premier vol de la fusée
Ariane, des ingénieurs avaient calculé sur base du dossier technique
une probabilité de réussite du tir, qui a été utilisée pour fixer la
prime d’assurance. L’histoire raconte que le risque d’échec avait été
largement surestimé à l’époque.

Risque et incertitude
L’économiste Frank Knight a introduit dans son ouvrage intitulé
“Risk, Uncertainty and Profit”, paru en 1921, une distinction fon-
damentale entre les notions de risque et d’incertitude. On parle de
risque lorsque la loi qui gouverne le phénomène d’intérêt est connue,
mais que le résultat n’en demeure pas moins aléatoire. Cela sup-
pose donc que la probabilité associée aux différents événements est
connue. Ainsi, le jet d’un dé équilibré entraı̂ne un risque pour l’indi-
vidu qui aurait parié 1 000e sur le six, mais aucune incertitude (car
il est en mesure d’évaluer la probabilité de tous les événements liés
au jet de ce dé). Au contraire, il y a incertitude lorsque, de plus, ces
probabilités sont au moins partiellement inconnues. Si le parieur est
confronté au jet d’un dé truqué, et qu’il ne connaı̂t pas la chance
d’apparition des différentes faces, il est en situation d’incertitude.

Probabilité et prime d’assurance


Dorénavant, nous supposons qu’il y a risque, mais pas incerti-
tude. A chaque événement E de A on souhaite associer un nombre,
noté Pr[E] et appelé probabilité de E. Ce nombre mesure le degré
2.2. Description probabiliste du risque 39

de vraisemblance qu’on accorde a priori à la réalisation de E: il est


non-négatif, et est d’autant plus grand que l’événement est jugé vrai-
semblable. Le triplet (E,A, Pr) est appelé espace probabilisé alors
que le couple (E,A) est appelé espace probabilisable en théorie des
probabilités.
Si on s’inspire de la définition de Blaise Pascal, la probabilité
Pr[E] associée à l’événement E peut s’envisager comme la prime
à payer pour recevoir 1e en cas de réalisation de E pourvu que
le marché de l’assurance réponde à un minimum de rationnalité
(à savoir qu’il est impossible de faire du profit sans prendre de
risque). Ainsi, si E =“il pleut sur Paris le 15 octobre”, Pr[E] est
la somme à payer pour recevoir 1e si, le 15 octobre, la pluie tombe
sur la capitale française (ce qui peut s’avérer utile pour l’organisa-
teur d’un événement en plein air à cette date). De manière évidente,
si l’assuré ne veut plus recevoir 1e mais ce en cas de réalisation de
l’événement E, il lui suffit de payer une prime c Pr[E]; Pr[·] s’appa-
rente donc à un taux de prime.
Clairement, la probabilité de tout événement est inférieure à 1.
En effet, aucun assuré rationnel ne serait prêt à payer une prime
supérieure à l’éventuelle indemnité versée par l’assureur. Ainsi, quel
que soit E ∈ A, Pr[E] ≤ 1. On cherche donc à attribuer à toute
éventualité une probabilité, nombre compris entre 0 et 1, d’autant
plus faible que la survenance de l’événement est rare.
Nous supposerons dorénavant le marché de l’assurance complet,
c’est-à-dire qu’il est possible d’acheter ou de vendre une police ga-
rantissant le versement d’1e en cas de réalisation de n’importe quel
événement aléatoire.

Absence d’opportunité d’arbitrage


Il est bon d’insister ici sur le fait que les primes dont il est
question transcendent les compagnies opérant sur un marché: elles
existent dans l’absolu. En effet, la sinistralité d’un assuré ne dépend
pas de la compagnie qui le couvre (dans l’hypothèse où les compa-
gnies offrent le même niveau de couverture): un immeuble n’a pas
plus de risque de partir en fumée, s’il est couvert par une compa-
gnie plutôt que par une autre. Tous les raisonnements qui suivent
reposent sur les hypothèses désormais classiques d’absence de taxes
et de coûts de transaction, et d’accès au capital sous des conditions
identiques pour tous les acteurs du marché.
Comme les financiers en ont l’habitude, on appelle opportunité
d’arbitrage la possibilité de faire du profit sans risque. L’idée est
40 Chapitre 2. Modélisation actuarielle des risques

la suivante: si le système de prime Pr[·] adopté par les acteurs du


marché ne satisfait pas à un minimum de rationnalité, il devient
possible pour certains acteurs de réaliser des opérations générant
un bénéfice certain, sans mise initiale. Une telle situation, même si
elle n’est pas formellement exclue en pratique, ne pourrait en tout
cas perdurer sur un marché sain. Grâce à ce principe simple, nous
allons établir une série de propriétés auxquelles doivent satisfaire les
probabilités.

Propriété d’additivité pour événements incompatibles


Si E et F sont deux événements incompatibles (i.e. qui ne peuvent
survenir simultanément, ce qui se notera désormais E ∩ F = ∅)
pour lesquels on a défini deux probabilités Pr[E] et Pr[F ], i.e. on a
déterminé les sommes à payer pour recevoir 1e en cas de survenance
de ces événements, alors

Pr[E ∪ F ] = Pr[E] + Pr[F ]. (2.1)

Montrons qu’il ne peut en être autrement. Pour ce faire, voyons ce


qu’il adviendrait si Pr[E ∪ F ] > Pr[E] + Pr[F ]. Dans ce cas, l’as-
sureur émet une police garantissant le versement de 1e en cas de
réalisation de E ou de F . Avec la prime Pr[E ∪ F ] encaissée, il sous-
crit deux polices (auprès d’un concurrent), la première garantissant
le versement d’1e si E se réalise et la seconde le même versement si
F se réalise. Cela lui coûte Pr[E]+Pr[F ] et ne nécessite aucune mise
initiale. En fin de période, trois situations peuvent se présenter:
seul E s’est réalisé: l’assureur touche 1e à titre d’indemnité et doit
payer 1e en éxécution de la police qu’il a émise. Son profit
s’élève donc à

Pr[E ∪ F ] − Pr[E] − Pr[F ] > 0.

seul F s’est réalisé: dans ce cas également, son profit s’élève à

Pr[E ∪ F ] − Pr[E] − Pr[F ] > 0.

ni E, ni F ne se réalisent: l’assureur ne touche rien et ne verse rien.


Son profit s’élève à

Pr[E ∪ F ] − Pr[E] − Pr[F ] > 0.

Dans tous les cas, l’assureur réalise un profit positif, pour une mise
initiale nulle, ce qui contredit l’hypothèse d’absence d’opportunité
d’arbitrage.
2.2. Description probabiliste du risque 41

Le raisonnement s’adapte facilement au cas où Pr[E ∪ F ] <


Pr[E]+Pr[F ]. Il suffit en effet d’émettre deux polices, l’une prévoyant
le versement d’1e si E se réalise, et l’autre le même versement en cas
de survenance de F . L’assureur encaisse alors Pr[E] + Pr[F ], somme
avec laquelle il souscrit une police lui procurant 1e si E ou F se
réalise (il lui en coûte Pr[E ∪ F ]). Cette stratégie ne nécessite au-
cune mise initiale, puisque par hypothèse Pr[E ∪F ] < Pr[E]+Pr[F ].
Dans les trois cas de figure envisagés ci-dessus, on vérifie que son
profit s’élève à Pr[E] + Pr[F ] − Pr[E ∪ F ] > 0, ce qui contredit
l’hypothèse d’absence d’opportunité d’arbitrage.
Plus généralement, considérant une suite d’événements E 1 ,E2 ,E3 , . . .
deux à deux incompatibles (i.e. quels que soient i et j, E i et Ej ne
peuvent se réaliser simultanément ⇔ E i ∩ Ej = ∅ pour tout i 6= j)
on a: X
Pr [∪k≥1 Ek ] = Pr[Ek ]. (2.2)
k≥1
Cette propriété dite de sigma-additivité est plus forte que la condi-
tion d’additivité (2.1). En particulier, ceci nous permet de calculer la
probabilité de tout événement E = {e i1 , . . . ,eik } en fonction des pro-
babilités des événements élémentaires e i1 , . . . ,eik qui le composent
puisque (2.2) garantit que
Pr[E] = Pr[{ei1 }] + . . . + Pr[{eik }].
Il suffit donc de définir la probabilité de chaque événement élémentaire
pour en déduire la probabilité de tout événement E.

Croissance des primes avec le risque


La condition d’additivité (2.1) garantit également la croissance
des primes avec la vraisemblance des événements assurés. Précisément,
considérons deux événements E et F . Si la réalisation de E entraı̂ne
la réalisation de F (i.e. si E a plus de chance de se produire que F ),
on doit raisonnablement avoir Pr[E] ≤ Pr[F ]. En effet, l’assureur
ayant plus de chance de devoir verser l’indemnité de 1e , il réclamera
une prime de montant plus élevé. Nous noterons dorénavant E ⊆ F
lorsque la réalisation de F implique celle de E. Dans ce cas,
F = (F ∩ E) ∪ (F ∩ E) = E ∪ (F \ E)
qui exprime le fait que F se réalise si soit E, soit F \ E se réalise.
On a donc exprimé F comme la réunion de deux événements incom-
patibles. La relation (2.1) nous permet alors d’écrire
Pr[F ] = Pr[E] + Pr[F \ E] ≥ Pr[E].
42 Chapitre 2. Modélisation actuarielle des risques

de sorte qu’il sera alors toujours plus onéreux de s’assurer contre la


réalisation de F , i.e.

E ⊆ F ⇒ Pr[E] ≤ Pr[F ].

Propriété d’équité

Si E et F sont deux événements complémentaires (i.e. F = E)


alors
Pr[E] + Pr[F ] = 1.

En effet, ayant souscrit une police prévoyant le versement d’1e si E


se réalise et une autre le même versement si E ne se réalise pas, on
est certain de toucher 1e quoi qu’il arrive. Il serait donc inéquitable
que pour cette opération certaine on ait payé plus ou moins d’1e .
Formellement, comme E ∩ F = ∅, Pr[E ∪ F ] = Pr[E] + Pr[F ], on
obtient le résultat annoncé en remarquant que Pr[E ∪ F ] = Pr[E] =
1. Ainsi, quel que soit l’événement E, Pr[E] = 1 − Pr[E].
Comme E = ∅, on déduit de la propriété d’équité qu’il ne coûte
rien de souscrire une couverture d’assurance contre un événement
qui ne se réalise jamais, i.e. Pr[∅] = 0. Notez que cette propriété
est parfois violée par les tarifs appliqués par les assureurs. C’est le
cas notamment lorsque l’Etat impose une certaine dose de solidarité
entre assurés. Ainsi, le législateur a institué dans certains pays l’obli-
gation pour les assureurs de couvrir les inondations dans le cadre
des polices incendie. Outre l’aspect discutable d’une telle mesure (le
plus souvent justifiée par des considérations budgétaires), un assuré
occupant un appartement au 44ème étage d’un gratte-ciel contri-
buera à la réparation des dommages dus aux inondations frappant
un autre assuré dont l’immeuble est situé en zone inondable.

Propriété de sous-additivité

Quels que soient les événements E et F , nous avons

Pr[E ∪ F ] ≤ Pr[E] + Pr[F ].

En effet, si on acceptait Pr[E ∪ F ] > Pr[E] + Pr[F ], on créerait


une opportunité d’arbitrage (c’est-à-dire une possibilité de s’enrichir
sans risque), qui ne peut subsister sur un marché sain (le lecteur est
invité à construire une stratégie permettant l’enrichissement sans
risque dans un tel cas).
2.2. Description probabiliste du risque 43

En itérant ce résultat, on obtient facilement que quels que soient


les événements aléatoires E1 ,E2 , . . . ,En , l’inégalité
n
X
Pr[E1 ∪ E2 ∪ . . . ∪ En ] ≤ Pr[Ei ]
i=1

est toujours satisfaite.

Egalité de Poincaré
Conclure deux polices, l’une sur E∪F et l’autre sur E∩F conduit
toujours au même flux financier que la conclusion de deux polices,
l’une sur E et l’autre sur F . Les primes doivent alors être égales, i.e.
Pr[E ∪ F ] + Pr[E ∩ F ] = Pr[E] + Pr[F ]. (2.3)
Notons que la relation (2.3) s’écrit encore
Pr[E ∪ F ] = Pr[E] + Pr[F ] − Pr[E ∩ F ].
Cette dernière relation est connue comme l’égalité de Poincaré.

2.2.3 Probabilité conditionnelle


Souvent, l’assureur est amené à revoir le montant de sa prime
lorsqu’il dispose d’information supplémentaire. Ayant à notre dis-
position de l’information, matérialisée par la connaissance qu’un
événement F s’est produit, comment réévaluer en conséquence la
probabilité qu’un événement E se réalise? Cette réévaluation est
appelée probabilité conditionnelle de E sachant F , notée Pr[E|F ].
Notons tout d’abord que comme F s’est réalisé, il est naturel d’avoir
Pr[F ] > 0. Sous cette condition, on peut définir la probabilité condi-
tionnelle comme
Pr[E ∩ F ]
Pr[E|F ] = pour autant que Pr[F ] > 0. (2.4)
Pr[F ]
Il est important de bien comprendre la signification de la for-
mule (2.4), qui est somme toute fort intuitive. Dès que l’on sait
que l’événement F s’est produit, seuls les événements inclus dans F
conservent une chance de se réaliser. En effet, quel que soit l’événement
E, E ∩ F devient impossible (et par conséquent Pr[E ∩ F |F ] = 0) et
seul E ∩ F conserve une chance de se produire. Ainsi, sachant que F
s’est réalisé, seule la réalisation simultanée de E et F est possible,
ce qui explique le numérateur. De plus, F devient un événement
certain de sorte qu’il faut “renormaliser” les probabilités de façon à
ce que Pr[F |F ] = 1, ce qui justifie la division par Pr[F ].
44 Chapitre 2. Modélisation actuarielle des risques

2.2.4 Evénements indépendants


Bien entendu, certaines informations n’amènent pas l’assureur à
réévaluer le montant de sa prime. On parle dans ce cas d’indépendance.
Ceci se traduit comme suit: les événements E et F sont indépendants
lorsque la prime réclamée pour le versement d’1e si E se réalise est
la même que l’on sache ou non si F s’est réalisé, i.e.

Pr[E|F ] = Pr[E|F ] ⇔ Pr[E|F ] = Pr[E].

Notez qu’en vertu de (2.4) ceci est encore équivalent à

Pr[F |E] = Pr[F ],

ou encore à
Pr[E ∩ F ] = Pr[E] Pr[F ].

C’est cette dernière condition qui est le plus souvent retenue pour
définir l’indépendance de deux événements (car elle présente l’avan-
tage de s’étendre aux événements impossibles et d’être symétrique
en E et F ).
Etendons à présent le concept d’indépendance à plus de deux
événements. De manière générale, ayant des événéments E 1 ,E2 , . . . ,En ,
ceux-ci seront dits indépendants lorsque
Y
Pr [∩i∈I Ei ] = Pr[Ei ]
i∈I

quel que soit le sous-ensemble I de {1, . . . ,n}.

2.2.5 Règle de multiplication (de Bayes)


On déduit facilement de (2.4) que

Pr[E ∩ F ] = Pr[E|F ] Pr[F ].

Cette identité permet parfois un calcul aisé de Pr[E ∩ F ]. Cette


règle s’étend à toute collection E 1 , . . . ,En d’événements tels que
Pr[E1 ∩ E2 ∩ . . . ∩ En ] > 0 comme suit:

Pr[E1 ∩ E2 ∩ . . . ∩ En ] = Pr[E1 ] Pr[E2 |E1 ] . . . Pr[En |E1 ∩ . . . ∩ En−1 ].


2.2. Description probabiliste du risque 45

2.2.6 Evénements conditionnellement indépendants


Deux événements E et F sont indépendants conditionnellement
à un troisième événement G si

Pr[E ∩ F |G] = Pr[E|G] Pr[F |G].

Ceci est encore équivalent à exiger que

Pr[F |E ∩ G] = Pr[F |G],

puisque

Pr[F |E ∩ G] Pr[E ∩ G]
Pr[E ∩ F |G] =
Pr[G]
= Pr[F |E ∩ G] Pr[E|G].

2.2.7 Théorème des probabilités totales


Ayant deux événements E et F tels que 0 < Pr[F ] < 1, on voit
facilement que

Pr[E] = Pr[E ∩ F ] + Pr[E ∩ F ]


= Pr[E|F ] Pr[F ] + Pr[E|F ] Pr[F ]

ce qui permet de déduire Pr[E] de Pr[E|F ] et de Pr[E|F ].


Exemple 2.2.1. Notons E l’événement “l’assuré cause au moins
un sinistre sur l’année” et F l’événement “l’assuré est une femme”.
Si 10% des femmes et 15% des hommes causent au moins un sinistre
sur l’année, quelle est la proportion de polices causant au moins un
sinistre sur l’année dans un portefeuille comportant 2/3 d’hommes
et 1/3 de femmes? Cette proportion vaut

Pr[E] = Pr[E|F ] Pr[F ] + Pr[E|F ] Pr[F ]


1 2
= 0.1 × + 0.15 × = 0.133.
3 3

Une extension naturelle de ce résultat est connue sous le nom de


théorème des probabilités totales et décrite ci-après. Considérons un
système exhaustif d’événements {F 1 ,F2 , . . .}; un tel système est tel
que deux quelconques des Fi ne peuvent se réaliser simultanément
(i.e. Fi ∩ Fj = ∅ si i 6= j) et tel qu’ils recouvrent tous les cas de
46 Chapitre 2. Modélisation actuarielle des risques

figure (i.e. Pr[∪i≥1 Fi ] = 1 avec Pr[Fi ] > 0 pour tout i). Alors, quel
que soit l’événement E,
h i
Pr[E] = Pr E ∩ (∪i≥1 Fi )
h i
= Pr ∪i≥1 (E ∩ Fi )
X
= Pr[E ∩ Fi ]
i≥1
X
= Pr[E|Fi ] Pr[Fi ].
i≥1

2.2.8 Théorème de Bayes


Un des résultats les plus intéressants faisant intervenir les pro-
babilités conditionnelles est sans nul doute le théorème de Bayes.
Etant donné un système exhaustif d’événements {F 1 ,F2 , . . .}, et E
un événement quelconque de probabilité positive, la formule

Pr[E|Fi ] Pr[Fi ]
Pr[Fi |E] =
Pr[E]
Pr[E|Fi ] Pr[Fi ]
= P , i = 1,2, . . . ,
j≥1 Pr[E|Fj ] Pr[Fj ]

est valable, où le dénominateur est obtenu à l’aide de la formule des


probabilités totales.
Exemple 2.2.2 (Détection de la fraude). Afin de détecter la
fraude, beaucoup d’assureurs recourent à des programmes informa-
tiques spécialement conçus à cet effet. Considérons une compagnie
d’assurance qui soumet les dossiers sinistre de ses assurés à un tel
outil. S’il y a effectivement fraude, le programme la détecte dans
99% des cas. Cependant, l’expérience montre que l’outil informa-
tique range parmi les fraudes 2% des dossiers en règle. Des extrapo-
lations au niveau du marché donnent à penser que 1% des dossiers
sinistre donnent effectivement lieu à une fraude. Quelle est la proba-
bilité qu’un dossier rangé parmi les fraudes par le programme infor-
matique ait effectivement donné lieu à cette pratique condamnable?
Afin d’évaluer cette probabilité, définissons les événements

E = “l’outil informatique décèle une fraude”


F1 = “il y a fraude” = F 2 .
2.3. Variables aléatoires 47

Dans ce cas, Pr[F1 ] = 0.01, Pr[E|F1 ] = 0.99, Pr[E|F2 ] = 0.02. La


probabilité cherchée vaut
Pr[E|F1 ] Pr[F1 ]
Pr[F1 |E] =
Pr[E|F1 ] Pr[F1 ] + Pr[E|F2 ] Pr[F2 ]
0.99 × 0.01 1
= = .
0.99 × 0.01 + 0.02 × 0.99 3
Notez que cette valeur est assez faible. C’est pourquoi les compagnies
soumettent les dossiers à un examen plus approfondi par un inspec-
teur avant de se risquer à incriminer l’assuré. Notez que seule une
petite partie des dossiers sont inspectés puisque
Pr[E] = 0.99 × 0.01 + 0.02 × 0.99 = 2.97%.
Cette dernière valeur permet aussi de comprendre intuitivement pour-
quoi un test qui semble fiable (puisqu’il détecte la fraude dans 99%
des cas lorsqu’elle est présente) se trompe en réalité deux fois sur
trois: en moyenne, le test annoncera une fraude dans 297 cas sur
1000 alors qu’il n’y aura en fait effectivement fraude que dans en
moyenne 100 cas, d’où une erreur de l’ordre de deux tiers.
Le nombre de fraudes qui échappent à l’assureur (en supposant
que l’inspection minutieuse du dossier par un employé détecte toute
malversation de la part de l’assuré) est évaluée à
Pr[E|F1 ] Pr[F1 ]
Pr[F1 |E] =
Pr[E|F1 ] Pr[F1 ] + Pr[E|F2 ] Pr[F2 ]
0.01 × 0.01
= = 0.01%.
0.01 × 0.01 + 0.98 × 0.99
Dans le cadre du théorème de Bayes, on parle souvent de proba-
bilité a priori et de probabilité a posteriori. Les probabilités Pr[F 1 ], Pr[F2 ], . . .
sont dites a priori, car calculées sans la moindre information. Au
contraire, Pr[Fi |E] est une probabilité a posteriori, résultant de la
révision de la probabilité Pr[Fi ] sur base de l’information que E s’est
produit. Ainsi, dans l’exemple ci-dessus il y a a priori une chance
sur cent pour que le sinistre ait donné lieu à une fraude. A posterioi,
c’est-à-dire sachant que le test informatique a décelé une fraude,
cette probabilité passe à une chance sur trois.

2.3 Variables aléatoires


2.3.1 Définition
Une variable aléatoire associe un nombre à chacun des événements
élémentaires. Il s’agit donc d’une fonction de E dans IR à laquelle on
48 Chapitre 2. Modélisation actuarielle des risques

impose certaines conditions. Dorénavant, nous noterons les variables


aléatoires par des lettres capitales: X, Y , . . . et leurs réalisations par
les lettres minuscules correspondantes: x, y, . . .
Formellement, une variable aléatoire est définie par rapport à
un espace probabilisé (E,A, Pr) même si nous verrons dans la suite
que l’actuaire peut le plus souvent faire l’économie de la définition
précise de cet espace.
Définition 2.3.1. Une variable aléatoire X est une fonction définie
sur l’ensemble E des événements élémentaires et à valeurs dans IR:
X : E → IR; e 7→ x = X(e)
à laquelle on impose une condition technique (appelée condition de
mesurabilité): quel que soit le réel x, on veut que
{X ≤ x} ≡ {e ∈ E|X(e) ≤ x} ∈ A
i.e. {X ≤ x} doit être un événement.
La condition de mesurabilité garantit qu’il soit possible de sous-
crire une police prévoyant le versement d’1e si l’événement “X est
inférieure ou égale à x” se produit.
Les exemples sont multiples, du plus élémentaire où X décrit
la face montrée par une pièce de monnaie une fois retombée (X
vaut alors 0 si on obtient pile et 1 si on obtient face), au cas plus
compliqué où X est le nombre de blessés suite à un tremblement
de terre dans la région de San Francisco ou le temps séparant deux
tempêtes frappant le nord de Paris. Par extension, nous permettrons
également à X d’être constante.
Exemple 2.3.2. Afin de bien comprendre la signification concrète
de la construction mathématique, prenons un exemple simple. Considérons
une assurance couvrant le vol ou la perte des bagages lors d’un
déplacement déterminé. Ce type de produit est souvent proposé par
les agences de voyage à leurs clients. Afin d’éviter d’interminables
querelles lors de la fixation du préjudice subi par le voyageur, l’as-
sureur verse un forfait de 250e si les bagages viennent à être perdus
ou volés au cours du voyage (ceci permet également de limiter le
risque de fraude). Les seules éventualités à prévoir sont: soit le vol
ou la perte des bagages lors du déplacement couvert (auquel cas l’as-
sureur verse le forfait de 250e ), soit l’absence d’un tel événement
(auquel cas l’assureur ne doit effectuer aucune prestation).
Les deux événements élémentaires suivants peuvent se produire:
e1 = “les bagages ne sont ni volés ni perdus lors du voyage”
e2 = “les bagages sont perdus ou volés lors du voyage.”
2.3. Variables aléatoires 49


Ainsi, E = {e1 ,e2 } et A = ∅,{e1 },{e2 },E .
Notez que la définition de E est aussi concise que possible. Ainsi,
on ne s’intéressera pas aux circonstances précises entourant la perte
ou le vol des bagages, puisqu’elles n’influencent pas la prestation de
l’assureur.
La charge financière X de l’assureur, inconnue à la conclusion
de la police, vaut donc

0e , si e = e1 ,
X(e) =
250e , si e = e2 .

Cette fonction est bien une variable aléatoire puisque



 ∅, si x < 0,
{X ≤ x} = e , si 0 ≤ x < 250e ,
 1
E, si x ≥ 250e ,

fait bien partie de A quelle que soit la valeur de x.


Souvent, X(e) représente la dépense totale de l’assureur relative-
ment à une police du portefeuille au cours d’une période déterminée
lorsque e décrit la réalité observée. Il s’agit de la variable d’intérêt
pour l’assureur quel que soit le type de prestations promises par
lui. En effet, même si la prestation revêt différentes formes du point
de vue de l’assuré, elle représente toujours un coût financier pour
l’assureur. Ceci est d’autant plus vrai que les prestations en nature
sont le plus souvent confiées à une société tierce, afin de mieux en
maı̂triser les coûts. Ainsi, le volet assistance compris dans la plupart
des polices automobiles est sous-traité à un spécialiste de ce genre
de couverture. Certains assureurs vont même jusqu’à sous-traiter la
gestion des sinistres à des sociétés spécialisées dans ce domaine.

2.3.2 Fonction de répartition


On sent bien que pour beaucoup de polices l’énumération des
éléments de E s’avèrera fastidieuse et difficile: ceci est dû au grand
nombre de situations pouvant conduire à un sinistre et à l’incerti-
tude entourant les conséquences financières de celui-ci. En pratique,
la définition de E n’est pas nécessaire aux calculs actuariels et il
suffit de connaı̂tre la fonction de répartition de X pour être en me-
sure d’évaluer les quantités dont l’actuaire a besoin pour gérer le
portefeuille.
Supposons que la variable aléatoire X représente le montant des
indemnités que la compagnie devra verser. Afin de gérer ce risque,
50 Chapitre 2. Modélisation actuarielle des risques

l’actuaire dispose d’informations à propos des sinistres antérieurs


causés par des polices du même type. Ceci lui permet d’obtenir une
fonction FX : IR → [0,1], appelée fonction de répartition, donnant
pour chaque seuil x ∈ IR, la probabilité (i.e. la “chance”) que X soit
inférieure ou égale à x.
Définition 2.3.3. La fonction de répartition F X associée à la va-
riable aléatoire X est définie comme
h i
FX (x) = Pr {e ∈ E|X(e) ≤ x} (2.5)
≡ Pr[X ≤ x], x ∈ IR.

Notez que la condition de mesurabilité imposée dans la Définition


2.3.1 revêt ici toute son importance, en garantissant que l’événement
“X est inférieure ou égale à x” est bien un événement dont on peut
mesurer la probabilité. On peut voir F X (x) comme la prime à payer
pour recevoir 1e si l’événement {X ≤ x} se réalise.
Exemple 2.3.4. La fonction de répartition de la variable aléatoire
X définie à l’Exemple 2.3.2 vaut

 Pr[∅] = 0, si x < 0,
FX (x) = Pr[e1 ], si 0 ≤ x < 250e ,

Pr[E] = 1, si x ≥ 250e .

Toutes les fonctions de répartition partagent une série de pro-


priétés communes, que nous énumérons ci-après.
Propriété 2.3.5. Toute fonction de répartition F X envoie la droite
réelle IR sur l’intervalle unité [0,1] et
- est non-décroissante;
- est continue à droite, i.e. l’identité

lim FX (x + ∆x) = FX (x)


∆x→0+

est valable quel que soit x ∈ IR;


- satisfait
lim FX (x) = 0 et lim FX (x) = 1.
x→−∞ x→+∞

Toute fonction remplissant les conditions ci-dessus est la fonction


de répartition d’une certaine variable aléatoire X.
Puisque FX est non-décroissante, la limite

FX (x−) = lim FX (x − ∆x) = sup FX (z) = Pr[X < x]


∆x→0+ z<x
2.3. Variables aléatoires 51

est bien définie. La fonction x 7→ FX (x−) est non-décroissante et


continue à gauche.
Remarque 2.3.6. Supposons que X représente le coût d’un si-
nistre. La connaissance de FX ne signifie nullement que l’actuaire
dispose du montant du sinistre. La donnée de F X fournit pourtant
à l’actuaire une connaissance complète du comportement stochas-
tique de la variable aléatoire X. En effet, quel que soit le niveau x,
il sait combien il faut payer pour souscrire une police prévoyant le
paiement d’1e lorsque l’événement {X ≤ x} se réalise (i.e. lorsque
le montant du sinistre est inférieur ou égal au seuil x). Grâce aux
polices élémentaires couvrant les événements {X ≤ x}, l’actuaire
est en mesure de construire et de tarifer n’importe quel produit plus
complexe.
Il est possible d’effectuer tous les calculs actuariels à l’aide de F X ,
sans définir explicitement l’ensemble E des événements élémentaires
et A des événements conditionnant le risque. Ceci facilite grande-
ment les développements actuariels

2.3.3 Support d’une variable aléatoire


L’ensemble de toutes les valeurs possibles pour une variable
aléatoire est appelé son support. Cette notion est précisément définie
comme suit.
Définition 2.3.7. Le support d’une variable aléatoire X de fonction
de répartition FX est l’ensemble de tous les points x ∈ IR où F X est
strictement croissante, i.e.

support(X) = {x ∈ IR|FX (x) > FX (x − ) pour tout  > 0}.

2.3.4 Fonction de queue


En plus de la fonction de répartition, nous utiliserons souvent
son complémentaire, appelé fonction de queue en actuariat non-vie
(en biostatistique et en assurance vie, cette même fonction est ap-
pelée fonction de survie lorsque X représente la durée de vie d’un
individu). Notée F X , celle-ci est définie comme suit.
Définition 2.3.8. Etant donnée une variable aléatoire X, la fonc-
tion de queue associée vaut

F X (x) = 1 − FX (x) = Pr[X > x], x ∈ IR;

F X (x) represente donc la probabilité que X prenne une valeur supérieure


à x.
52 Chapitre 2. Modélisation actuarielle des risques

On peut voir F X (x) comme la prime à payer pour recevoir


une somme de 1e si X excède x. Clairement, F X est décroissante
puisque l’événement X > x est plus probable que X > x 0 lorsque
x < x0 , i.e. {X > x0 } ⊆ {X > x}.
Lorsque le support de la fonction de répartition F du montant
de sinistre est IR+ , on mesure généralement le risque associé à telle
ou telle fonction de répartition par l’épaisseur des queues de dis-
tribution (c’est-à-dire par la masse de probabilité répartie sur les
régions (c, + ∞), pour de grandes valeurs de c). Ainsi, on parlera de
queue épaisse (ou lourde) lorsque F X ne tend que lentement vers 0
lorsque x → +∞. Nous reviendrons aux queues de distribution dans
le Tome II.

2.3.5 Egalité en loi


Souvent les actuaires sont davantage intéressés par la fonction de
répartition d’une variable aléatoire que par cette variable aléatoire
elle-même. Il est essentiel ici de bien saisir la nuance entre ces
deux êtres mathématiques. La variable aléatoire S peut par exemple
représenter le montant total de sinistre généré par monsieur Untel
durant l’année qui vient. D’autre part, supposons que T représente
le montant de sinistre généré par monsieur Unautre. Si ces deux in-
dividus sont indiscernables pour l’assureur, cela signifie que F S (t) =
FT (t) quel que soit t ∈ IR, ce qui se notera dorénavant F S ≡ FT . La
compagnie leur appliquera alors le même tarif. Bien évidemment, il
n’y aucune raison pour que les réalisations de S et T obtenues en fin
de période soient identiques. Ainsi, le fait pour S et T de posséder
la même fonction de répartition ne signifie pas que S = T .
Pour l’actuaire qui ne connaı̂t ni monsieur Untel, ni monsieur
Unautre, il n’y a d’intérêt que dans la fonction de répartition com-
mune de S et T . Dorénavant, nous écrirons S = loi T pour exprimer
le fait que FS ≡ FT . Ceci signifie donc que S et T ont même loi (ou
sont identiquement distribuées).

2.3.6 Quantiles et inverses généralisés


Versions continues à gauche ou à droite d’une fonction mo-
notone

Soit une fonction monotone g. Une telle fonction ne peut présenter


qu’un nombre fini ou infini dénombrable de discontinuités.
Définition 2.3.9. La version continue à gauche g − de g et la ver-
2.3. Variables aléatoires 53

sion continue à droite g+ de g sont définies comme suit:

g− (x) = lim g(x − ∆x) et g+ (x) = lim g(x + ∆x).


∆x→0+ ∆x→0+

On vérifie facilement que g− est effectivement continue à gauche


tandis que g+ est continue à droite. De plus,

g est continue à gauche en x ⇔ g− (x) = g(x)

et
g est continue à droite en x ⇔ g+ (x) = g(x).

Inverse généralisé d’une fonction non-décroissante


Il y a essentiellement deux inverses possibles pour une fonction
non-décroissante, introduits dans la définition suivante.
Définition 2.3.10. Etant donnée une fonction non-décroissante g,
les inverses g −1 et g −1• de g sont définis comme suit:

g −1 (y) = inf {x ∈ IR | y ≤ g(x)}


= sup {x ∈ IR | y > g(x)}
−1•
g (y) = inf {x ∈ IR | y < g(x)}
= sup {x ∈ IR | y ≥ g(x)} ,

avec la convention inf ∅ = +∞ et sup ∅ = −∞.


On peut vérifier que g −1 et g −1• sont toutes deux non-décroissantes,
et que g −1 est continue à gauche alors que g −1• est continue à droite.
Le résultat suivant nous sera très utile par la suite.
Propriété 2.3.11. Soit g non-décroissante. Quels que soient les
nombres réels x et y, les inégalités suivantes sont vérifiées:
(i) g −1 (y) ≤ x ⇔ y ≤ g+ (x),
(ii) x ≤ g −1• (y) ⇔ g− (x) ≤ y.

Démonstration. Nous n’établissons que (i); le raisonnement menant


à (ii) étant similaire. L’implication

g −1 (y) ≤ x ⇒ y ≤ g+ (x)

est établie lorsque la contraposée

y > g+ (x) ⇒ x < g −1 (y)

est prouvée. Supposons que y > g+ (x). Alors il existe un  > 0


tel que y > g(x + ). Si nous revenons à la définition de g −1 (y) en
54 Chapitre 2. Modélisation actuarielle des risques

terme de supremum, nous trouvons x+ ≤ g −1 (y), qui implique que


x < g −1 (y). A présent, établissons la partie “⇐” de (i). Si y ≤ g + (x)
alors nous pouvons écrire y ≤ g(x + ) pour tout  > 0. A partir de
la définition de g −1 (y) en terme d’infimum, nous sommes en mesure
de conclure que g −1 (y) ≤ x +  pour tout  > 0. En passant à la
limite pour  ↓ 0, nous obtenons g −1 (y) ≤ x.

Inverse généralisé d’une fonction non-croissante


Intéressons-nous à présent aux fonctions non-croissantes. Afin
d’éviter toute ambiguité, nous supposerons dans la suite que g n’est
pas constante.
Définition 2.3.12. Soit une fonction non-croissante (et non-constante)
g. Les inverses g −1 et g −1• de g sont définis comme suit:

g −1 (y) = inf {x | g(x) ≤ y}


= sup {x | y < g(x)} ,
−1•
g (y) = inf {x | g(x) < y}
= sup {x | y ≤ g(x)} ,

avec la convention inf ∅ = +∞ et sup ∅ = −∞.


On peut facilement vérifier que g −1 et g −1• sont toutes deux
non-croissantes, que g −1 est continue à droite tandis que g −1• est
continue à gauche. De plus, g −1 (y) = g −1• (y) si, et seulement si,
g −1 est continue en y.
Le résultat suivant est donné sans démonstration, cette dernière
étant en tout point similaire à celle de la Propriété 2.3.11.
Propriété 2.3.13. Soit g non-croissante (et non-constante). Quels
que soient les nombres réels x et y, les équivalences suivantes sont
valables:
(i) g −1 (y) ≤ x ⇔ y ≥ g+ (x),
(ii) x ≤ g −1• (y) ⇔ g− (x) ≥ y.

Fonctions quantiles
Une notion largement utilisée dans la suite est celle de quantile.
Il s’agit d’un seuil qui ne sera dépassé (par la charge des sinistres,
par exemple) que dans une proportion fixée de cas. La fonction qui
fait correspondre ce seuil à la proportion en question est appelée
fonction quantile et définie comme suit (en accord avec la Définition
2.3.10).
2.3. Variables aléatoires 55

Définition 2.3.14. Le quantile d’ordre p de la variable aléatoire X,


noté qp , est défini comme suit:

qp = FX−1 (p) = inf{x ∈ IR|FX (x) ≥ p}, p ∈ [0,1].

La fonction FX−1 ainsi définie est appelée fonction quantile associée


à la fonction de répartition FX .
Certains quantiles ont des noms particuliers (en fonction des
valeurs de p). Ainsi, lorsque p = 12 parle-t-on de médiane, lorsque
p = 14 de premier quartile, lorsque p = 34 de troisième quartile,
k k
lorsquer p = 10 de kème décile, k = 1, . . . ,9, et lorsque p = 100 de
kème percentile, k = 1, . . . ,99.
Bien que la fonction quantile soit conventionnellement définie
conformément à la Définition 2.3.14, on aura également recours à
l’inverse
FX−1• (p) = inf{x ∈ IR|FX (x) > p}.
Les résultats de la Propriété 2.3.11 peuvent bien évidemment
être appliqués à des fonctions de répartition. De (i) on tire alors

FX−1 (p) ≤ x ⇔ p ≤ FX (x). (2.6)

De la même manière, (ii) fournit

x ≤ FX−1• (p) ⇔ FX (x−) = Pr [X < x] ≤ p. (2.7)

Clairement

FX−1• (0) = inf{x ∈ IR|FX (x) > 0}

est la valeur minimum prise par X (éventuellement égale à −∞,


mais le plus souvent égale à 0 dans notre cadre de travail) et

FX−1 (1) = sup{x ∈ IR|FX (x) < 1}

est la valeur maximum prise par X, qui peut être égale à +∞. Le
support de X est donc inclus dans l’intervalle [F X−1• (0),FX−1 (1)].
Remarque 2.3.15. On appelle parfois F X−1 (1) le Sinistre Maxi-
mum Possible (SMP). Clairement, quelle que soit la police d’assu-
rance, le SMP est fini. Néanmoins, le choix de ce SMP est parfois
difficile, notamment pour les branches où l’assureur octroie une ga-
rantie illimitée. C’est pourquoi on prend souvent SMP= +∞ dans
les branches où le SMP est très élevé et difficilement évaluable, afin
d’être certain de ne pas sous-évaluer les engagements de l’assureur.
Ceci amène l’actuaire à utiliser des lois dont le support est IR + pour
modéliser le coût des sinistres.
56 Chapitre 2. Modélisation actuarielle des risques

Propriétés des fonctions quantiles

Remarquons que FX−1 est non-décroissante. En effet, considérons


p1 ≥ p2 ∈ [0,1]. L’inclusion

{x ∈ IR|FX (x) ≥ p2 } ⊆ {x ∈ IR|FX (x) ≥ p1 }

garantit que FX−1 (p1 ) ≥ FX−1 (p2 ).


Remarquons pour terminer que l’identité F X−1 (FX (x)) = x est
en général fausse, sauf si FX−1 est continue en FX (x). Ceci signifie
que l’identité FX−1 (FX (x)) = x est vérifiée pour toutes les valeurs
de x qui ne correspondent pas à un palier de F X . Par contre, il est
toujours vrai que FX (FX−1 (p)) = p.

Inverse de la fonction de queue

On peut facilement définir l’inverse de la fonction de queue à par-


tir de la Définition 2.3.12, s’agissant d’une fonction non-croissante.
On voit facilement que les inverses de la fonction de répartition F X
et de la fonction de queue correspondante F X sont liés par les rela-
tions
−1 −1•
FX−1 (p) = F X (1 − p) et FX−1• (p) = F X (1 − p), (2.8)

quel que soit p ∈ [0,1].

2.4 Variables aléatoires de comptage


2.4.1 Notion
Comme leur nom l’indique, ces variables comptent un nombre
d’événements, par exemple le nombre de sinistres survenus au cours
d’une période. Dorénavant, nous noterons les variables de comptage
par des lettres capitales du milieu de l’alphabet: I, J, K, L, N , M ,
. . . Leur support est donc (contenu dans) IN = {0,1,2, . . .}.
Une variable aléatoire de comptage N est caractérisée par la
suite des probabilités {pk , k ∈ IN} associée aux différents entiers, i.e.
pk = Pr[N = k]. La fonction de répartition de N est “en escalier”,
les sauts d’amplitude pk se produisant aux entiers k, i.e.

bxc
X
FN (x) = Pr[N ≤ x] = pk , x ∈ IR,
k=0
2.4. Variables aléatoires de comptage 57

où bxc désigne la partie entière du réel x. Clairement, F N (x) = 0 si


x < 0.
Remarque 2.4.1. Plus généralement, on parle de variable discrète
lorsque celle-ci prend ses valeurs dans un ensemble {a 0 ,a1 ,a2 , . . .},
qui est fini ou peut être mis en bijection avec IN. Les résultats à
propos des variables de comptage s’étendent facilement au cas discret
en substituant ak à l’entier k.
Parmi les variables de comptage, nous utiliserons surtout celles
dont les lois de probabilité sont présentées dans les paragraphes sui-
vants. Plusieurs d’entre elles sont associées à ce que les probabilistes
appellent un schéma de Bernoulli ou un treillis binomial. Il s’agit de
répéter un certain nombre de fois une expérience aléatoire et d’obser-
ver à chaque reprise la réalisation éventuelle d’un événement spécifié.
Cette expérience doit être reproduite sous des conditions identiques
et les résultats antérieurs ne peuvent influencer la réalisation ultérieure
éventuelle de l’événement d’intérêt.

2.4.2 Variable uniforme discrète


Une variable aléatoire N est dite de loi uniforme discrète sur
{0,1, . . . ,n}, ce qui se notera désormais N ∼ DUni(n), lorsque
1
Pr[N = k] = pour k = 0,1, . . . ,n.
n+1
Les masses de probabilité accordées aux entiers 0,1, . . . ,n sont donc
toutes identiques, d’où le qualificatif uniforme: aucune valeur du sup-
port {0,1, . . . ,n} n’est plus probable que les autres. Clairement, la
fonction de répartition associée à cette variable aléatoire est donnée
par 
 0, si x < 0,
bxc+1
FN (x) = , si 0 ≤ x < n,
 n+1
1, si x ≥ n.
Il s’agit donc d’une fonction dont le graphe effectue des sauts d’am-
1
plitude n+1 à chaque entier 0,1, . . . ,n.

2.4.3 Variables de Bernoulli


Une variable aléatoire N est dite de Bernoulli de paramètre 0 <
q < 1, ou dite obéir à cette loi, ce qui se notera dorénavant N ∼
Ber(q), lorsque

Pr[N = 1] = q = 1 − Pr[N = 0].


58 Chapitre 2. Modélisation actuarielle des risques

Une variable de Bernoulli indique si l’événement d’intérêt s’est réalisé


lors d’une répétition de l’expérience dans un schéma de Bernoulli (un
tel schéma suppose qu’une expérience aléatoire soit réalisée et qu’on
s’intéresse à la réalisation d’un événement donné à cette occasion).
Exemple 2.4.2. En sciences actuarielles, on associe classiquement
la loi de Bernoulli à l’indicatrice d’un événement aléatoire. L’in-
dicatrice vaut 1 lorsque l’événement est réalisé (et indique donc la
réalisation de cet événement). De tels événements sont “la police a
produit au moins un sinistre au cours de la période de référence” ou
“l’assuré est décédé dans l’année”, par exemple.

2.4.4 Variable binomiale


Une variable aléatoire N est dite Binomiale d’exposant m et de
paramètre q, m ∈ IN et 0 < q < 1, ou dite obéir à cette loi, ce qui se
notera dorénavant N ∼ Bin(m,q), lorsque N prend ses valeurs dans
{0,1, . . . ,m} et
 
m
Pr[N = k] = q k (1 − q)m−k , k = 0,1, . . . ,m,
k

où la notation (:) désigne le coefficient binomial de Newton (parfois


encore noté Cmk ), défini par

 
m m!
= .
k k!(m − k)!

Par extension, nous noterons parfois Bin(m,q) une variable aléatoire


obéissant à cette loi.
Remarque 2.4.3. Notez que lorsque m = 1, on a pour k ∈ {0,1},

k 1−k q, si k = 1,
Pr[N = k] = q (1 − q) =
1 − q, si k = 0,

et on retrouve la loi de Bernoulli, qui apparaı̂t ainsi comme un cas


particulier de la Binomiale, i.e. Bin(1,q) = Ber(q).
La loi binomiale est classiquement associée au nombre de succès
dans un schéma de Bernoulli: si une expérience aléatoire est répétée
m fois indépendamment et sous des conditions identiques, le nombre
de répétitions au cours desquelles un certain événement E se réalise
est de loi Bin(m, Pr[E]). En effet, en posant q = Pr[E], un coup
d’oeil à la forme de la probabilité binomiale suffit à nous convaincre
que l’interprétation ci-dessus est correcte: q k garantit que E s’est
2.4. Variables aléatoires de comptage 59

réalisé à k reprises, (1 − q)m−k assure que E ne s’est pas réalisé


plus souvent (les m − k autres répétitions n’ayant pas donné lieu
à la réalisation de E) tandis que le coefficient binomial exprime
que l’ordre dans lequel les réalisations se sont produites est sans
importance (puisque nous ne nous intéressons qu’au nombre de fois
où E s’est réalisé).
Exemple 2.4.4. La loi binomiale se prête bien à la modélisation
du nombre de sinistres touchant le portefeuille dans les formes d’as-
surance pour lesquelles au plus un sinistre par période est possible
pour chaque police (comme l’assurance sur la vie, l’assurance annu-
lation ou l’assurance rapatriement conclue pour un voyage spécifié,
par exemple). Si q est la probabilité qu’une des m polices du porte-
feuille donne lieu à un sinistre, et si ces m polices sont identiques et
ne s’influencent pas mutuellement, le nombre N de polices sinistrées
est de loi Bin(m,q).

2.4.5 Variable géométrique


La variable de comptage N est dite géométrique de paramètre
q, 0 < q < 1, ou dite obéir à cette loi, ce qui se notera dorénavant
N ∼ Geo(q) lorsque

Pr[N = k] = q(1 − q)k , k ∈ IN.

Si on considère un schéma binomial et qu’on parle de succès lors-


qu’un événement E se réalise lors d’une des répétitions de l’expérience
aléatoire (et d’échec dans le cas contraire), la loi Geo(q) peut se
voir comme celle du nombre d’échecs précédant le premier succès.
Lorsque N = k il aura donc fallu k + 1 répétitions de l’expérience
pour obtenir un premier succès.
Exemple 2.4.5. Considérons un inspecteur de la compagnie qui
contrôle des dossiers sinistres en vue de déceler d’éventuelles fraudes.
Si q désigne la proportion de dossiers où il y a eu fraude, la pro-
babilité qu’il en contrôle k avant de tomber sur un premier dossier
ayant donné lieu à une fraude est q(1 − q) k .

2.4.6 Variable binomiale négative


Une variable aléatoire N est dite de loi binomiale négative de
paramètres α et q, α > 0 et 0 < q < 1, ou est dite obéir à cette loi,
ce qui se notera dorénavant N ∼ N Bin(α,q), lorsque N prend ses
60 Chapitre 2. Modélisation actuarielle des risques

valeurs dans IN et
 
α+k−1
Pr[N = k] = q α (1 − q)k , k ∈ IN.
k
Lorsque α est entier, Pr[N = k] fait appel au coefficient binomial
classique. Néanmoins, cette définition doit être étendue au cas où
α n’est pas entier. Cette extension fait appel à la fonction gamma,
notée Γ(·), et définie par
Z
Γ(t) = xt−1 exp(−x)dx, t ∈ IR+ .
x∈IR+

Une simple intégration par parties montre que l’égalité


Γ(t) = (t − 1)Γ(t − 1)
est valable quel que soit t > 1. Il s’agit donc d’une interpolation de
la fonction factorielle, puisque
Γ(n + 1) = n! pour n ∈ IN.
Le coefficient binomial généralisé intervenant dans la probabilité
associée à la loi N Bin(α,q) doit donc se comprendre comme suit:
 
α+k−1 Γ(α + k) Γ(α + k)
= = .
k Γ(k + 1)Γ(α) k!Γ(α)
Lorsque α est entier, la loi N Bin(α,q) est encore appelée loi
de Pascal. Cette loi possède une interprétation claire dans le cadre
d’un schéma binomial. Comme ci-dessus, supposons qu’on s’intéresse
à la réalisation éventuelle d’un événement E et qu’on qualifie de
succès une telle réalisation (avec q = Pr[E]). Lorsque α est entier, la
variable N Bin(α,q) est simplement le nombre d’échecs nécessaires à
l’obtention de α succès. En effet, la forme de la probabilité binomiale
négative indique qu’au total on a obtenu α succès (facteur q α ) et k
échecs (facteur (1 − q)k ), tandis que le coefficient binomial traduit le
fait que l’ordre d’apparition de ces succès n’importe pas, sauf pour
le dernier résultat, qui doit être un succès (on peut donc placer
librement les k échecs parmi les α + k − 1 réalisations successives de
l’expérience aléatoire).
Exemple 2.4.6. Revenons un instant à notre inspecteur qui décide
de contrôler des dossiers sinistres jusqu’à ce qu’il découvre α fraudes.
Sachant que la proportion de dossiers ayant donné lieu à une fraude
est q, Pr[N = k] est la probabilité que l’inspecteur ait dû contrôler k
dossiers en règle avant d’avoir découvert les α dossiers frauduleux.
Au total, notre homme aura donc vérifié k + α dossiers.
2.4. Variables aléatoires de comptage 61

Remarque 2.4.7. En particulier, lorsque α = 1, on retrouve la loi


géométrique, i.e. N Bin(1,q) = Geo(q).

2.4.7 Variable de Poisson


La loi de Poisson fut obtenue comme limite de la loi binomiale
par Poisson dès 1837. Parmi les premières applications empiriques
de cette loi de probabilité, on relèvera l’étude de Bortkiewicz en
1898, qui utilisa la loi de Poisson pour modéliser le nombre annuel
de soldats tués par des ruades de chevaux dans l’armée prussienne.
Aussi appelée loi des événements rares, la loi de Poisson fut dès
l’origine associée à des comptages d’accidents ou de pannes.
La loi de Poisson fut introduite comme une approximation de
la loi binomiale lorsque m était très grand et q très petit. En effet,
λ
considérons une variable aléatoire N m ∼ Bin(m, m ). Nous avons
 m
λ
Pr[Nm = 0] = 1− → exp(−λ), si m → +∞.
m

De plus

m−k λ
Pr[Nm = k + 1] λ
= k+1 m
λ
→ , si m → +∞
Pr[Nm = k] 1− m k+1

de sorte que
λk
lim Pr[Nm = k] = exp(−λ) .
m→+∞ k!
La probabilité apparaissant dans le membre de droite de cette dernière
équation est celle définissant la loi de Poisson. Plus précisément,
lorsque
λk
Pr[N = k] = exp(−λ) , k ∈ IN,
k!
la variable de comptage N est dite de loi de Poisson de paramètre
λ, ce qui se notera désormais N ∼ Poi(λ). Par extension, nous
désignerons également par Poi(λ) une variable aléatoire obéissant
à cette loi. La loi de Poisson peut donc se voir comme celle du
nombre de succès dans un schéma de Bernoulli, lorsque le nombre
de répétitions est très grand (m → +∞) et la probabilité de succès
négligeable (q → 0) de manière que mq → λ > 0.
62 Chapitre 2. Modélisation actuarielle des risques

2.5 Variables aléatoires continues


2.5.1 Notion
Dans le cadre de cet ouvrage, une variable aléatoire X est dite
continue lorsque sa fonction de répartition F X admet la représentation
Z
FX (x) = fX (y)dy, x ∈ IR, (2.9)
y≤x

pour une fonction intégrable fX : IR → IR+ appelée la densité de


probabilité de X. Une variable aléatoire continue admet donc une
fonction de répartition FX continue.
La fonction fX intervenant dans la représentation (2.9) possède
une signification concrète: si nous traçons le graphe de f X , l’aire
de la surface délimitée dans le plan par le graphe de f X , l’axe des
abscisses et les verticales en a and b (a < b) est la probabilité que
X prenne une valeur dans l’intervalle (a,b], i.e.
Z b
Pr[a < X ≤ b] = FX (b) − FX (a) = fX (x)dx.
x=a

La Figure 2.1 illustre la signification de la densité de probabilité.


En faisant tendre la longueur b − a de l’intervalle vers 0, on voit
clairement que

lim Pr[a < X ≤ b] = Pr[X = a] = 0


b→a

quel que soit le réel a; une variable aléatoire continue ne possède


donc pas de points massiques (qui sont l’apanage des variables discrètes).
On déduit facilement des caractéristiques que doivent posséder
toutes les fonctions de répartition que la densité f X : IR → IR+ doit
satisfaire la condition
Z
fX (y)dy = 1.
y∈IR

Clairement, (2.9) garantit que

d
fX (x) = FX (x)
dx
FX (x + ∆x) − FX (x)
= lim
∆x→0 ∆x
Pr[x < X ≤ x + ∆x]
= lim ,
∆x→0 ∆x
2.5. Variables aléatoires continues 63

fX

FX(b) - FX(a)=P[a < X < b]

a b x

Fig. 2.1 – Graphe de la fonction de densité f X correspondant à une


variable continue X.

de sorte que l’approximation


Pr[x < X ≤ x + ∆x] ≈ fX (x)∆x
est valable pour autant que ∆x soit suffisamment petit. Ainsi, bien
que fX (x) ne soit pas une probabilité (rien ne garantit d’ailleurs que
fX (x) ≤ 1), les zones où fX prend des valeurs très élevées corres-
pondent donc aux réalisations probables de X alors que les zones
où fX prend de petites valeurs correspondent aux réalisations peu
probables de X. Si fX = 0 sur un intervalle I, la variable X ne peut
alors prendre aucune valeur dans I (de telles zones correspondent à
un plateau pour le graphe de FX ).
Remarque 2.5.1. Il est bon de garder à l’esprit que les variables
aléatoires continues ne sont que des approximations permettant des
calculs aisés. En effet, les montants de sinistres s’expriment en eu-
ros, voire en cents d’euro, mais une valeur de 123.547324e n’aurait
que très peu d’intérêt (car on ne pourrait effectivement payer que
123.55e ). Dans la réalité, toutes les variables aléatoires faisant le
quotidien de l’actuaire sont donc discrètes. Celles modélisant le coût
k
des sinistres prennent tant de valeurs possibles (en l’occurrence 100 ,
k ∈ IN) qu’il est plus commode de considérer que toutes les valeurs
réelles positives sont possibles. Ceci amène donc à la notion de loi
continue et de densité de probabilité exposée plus haut.
64 Chapitre 2. Modélisation actuarielle des risques

Dans la suite de cet ouvrage, nous utiliserons les lois continues


suivantes.

2.5.2 Variable uniforme continue


La loi uniforme (continue) est apparue très tôt en statistique
pour modéliser le fruit du pur hasard, ou des phénomènes au sujet
desquels aucune information n’était disponible. Les premières traces
de la loi uniforme remontent à Bayes en 1763 et Laplace en 1872.
Une variable aléatoire X est dite de loi uniforme sur l’intervalle
[0,1] ou dite obéir à cette loi, ce qui se notera dorénavant X ∼
Uni(0,1), lorsque X prend ses valeurs dans cet intervalle et admet
la fonction de répartition

 0, si x < 0,
FX (x) = x, si 0 ≤ x < 1,

1, si x ≥ 1.

La densité de probabilité correspondante est constamment égale à


1 sur l’intervalle unité, et nulle ailleurs, i.e.

1, si 0 ≤ x ≤ 1,
fX (x) =
0, sinon.

La loi uniforme joue un rôle particulier en théorie des probabi-


lités, en raison du résultat suivant.
Proposition 2.5.2. (i) Si la fonction de répartition F X de X est
continue alors FX (X) ∼ Uni[0,1].
(ii) Soit U ∼ Uni[0,1] et soit X une variable aléatoire quelconque.
La variable aléatoire FX−1 (U ) a même loi que X.

Démonstration. (i) Quel que soit t dans (0,1), on a par (2.6)

Pr[FX (X) ≥ t] = Pr[X ≥ FX−1 (t)]



= 1 − FX FX−1 (t) = 1 − t,

ce qui montre que FX (X) est bien de loi Uni[0,1].


(ii) Quel que soit x ∈ IR, on a par (2.6)

Pr[FX−1 (U ) ≤ x] = Pr[FX (x) ≥ U ] = FX (x),

ce qui achève la preuve.


2.5. Variables aléatoires continues 65

Remarque 2.5.3. Le point (ii) de la Proposition 2.5.2 est central


en simulation. Cette approche, que nous détaillerons dans le Tome
II, consiste à recréer le hasard au moyen d’un ordinateur et permet
de résoudre des problèmes pour lesquels une solution analytique est
hors de portée. Ce principe est simple à mettre en oeuvre: si l’ordi-
nateur est en mesure de générer une suite de nombres u 1 ,u2 , . . . que
rien ne permet de distinguer d’une suite de réalisations de variables
aléatoires Uni[0,1], cette suite peut aisément être transformée en
réalisations de variables aléatoires de fonction de répartition F X en
leur appliquant la transformation F X−1 .
Plus généralement, on parlera de loi uniforme sur l’intervalle [a,b]
comme de celle dont la densité de probabilité est constante sur cette
intervalle et nulle en dehors. Plus précisément, une variable aléatoire
est dite de loi uniforme sur l’intervalle [a,b], ou dite obéir à cette loi,
ce qui se notera dorénavant X ∼ Uni[a,b], lorsque le support de X
est l’intervalle en question et la densité de X est donnée par
 1
fX (x) = b−a , si a ≤ x ≤ b,
0, sinon.
Ayant une variable aléatoire U ∼ Uni[0,1], on voit facilement que
X −a
=loi U ⇔ X =loi a + (b − a)U.
b−a

2.5.3 Variable Bêta


Tout comme la loi uniforme, la loi Bêta admet pour support un
intervalle, mais n’assigne pas à chaque intervalle contenu dans le
support une masse de probabilité proportionnelle à la longueur de
celui-ci. Plus précisément, une variable aléatoire X est dite de loi
Bêta de paramètres α > 0 et β > 0, ce qui se notera désormais
X ∼ Bet(α,β), lorsque X prend ses valeurs dans l’intervalle [0,1] et
admet la densité
(
Γ(α+β) α−1
Γ(α)Γ(β) x (1 − x)β−1 , si 0 ≤ x ≤ 1,
fX (x) =
0, sinon.
On peut aisément construire à partir de X une variable aléatoire
Z qui prend ses valeurs dans l’intervalle [a,b] grâce à la formule
Z = a + (b − a)X. Il est facile de vérifier que la densité de Z est
donnée par
(
Γ(α+β) α−1 (b − z)β−1 , si a ≤ z ≤ b,
Γ(α)Γ(β)(b−a) α+β−1 (z − a)
fZ (x) =
0, sinon.
66 Chapitre 2. Modélisation actuarielle des risques

On peut voir à la Figure 2.2 le graphe des densités de probabilité


associées aux lois Bet(α,β), pour différentes valeurs des paramètres.
On constate que la densité peut prendre des allures très différentes
en fonction des valeurs des paramètres.
4

alpha=beta=3
alpha=beta=0.5
alpha=9, beta=2
3
densite

2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Fig. 2.2 – Densités de probabilité associées à la loi Bêta pour différentes


valeurs des paramètres α et β.

2.5.4 Variable normale


La loi normale standard est obtenue à partir du raisonnement
suivant (raccrochant la loi normale à la théorie des erreurs d’ob-
servation). Il s’agit de définir une densité de probabilité exprimant
que la variable aléatoire correspondante prend de petites valeurs
aux alentours de 0, symétriquement distribuées par rapport à l’ori-
gine, et que de grandes valeurs sont d’autant moins probables qu’on
s’écarte de l’origine. On en arrive rapidement à postuler une densité
proportionnelle à exp(−x2 ) qu’il s’agit ensuite de standardiser afin
que l’intégrale sur IR donne 1.
2.5. Variables aléatoires continues 67

La loi normale est sans conteste une des plus connues (sinon
la plus connue) de la statistique. Elle fit très tôt son apparition
en tant qu’approximation de la loi binomiale. Au début du 19ème
siècle, son rôle central en théorie fut mis en évidence par Laplace et
Gauss. En astronomie, comme dans beaucoup d’autres branches de
sciences exactes, elle joue un rôle fondamental dans la modélisation
des erreurs de mesure et d’observation.
Une variable aléatoire X est dite de loi Normale de paramètres
µ ∈ IR et σ > 0, ou dite obéir à cette loi, ce qui se notera dorénavant
X ∼ N or(µ,σ 2 ), lorsque X prend ses valeurs dans IR et admet la
fonction de répartition
 
x−µ
x 7→ Pr[X ≤ x] = Φ ,
σ
où Φ(·) est la fonction de répartition associée à la loi N or(0,1)
donnée par
Z x
1
Φ(x) = √ exp(−y 2 /2)dy, x ∈ IR.
2π y=−∞
On voit facilement que si X ∼ N or(µ,σ 2 ) et si Z ∼ N or(0,1)
alors X =loi µ + σZ. Ceci explique le rôle central joué par la loi
N or(0,1) et sa fonction de répartition Φ(·), appelée loi normale stan-
dard, ou encore loi normale centrée réduite.
Nous noterons parfois N or(µ,σ 2 ) une variable aléatoire obéissant
à cette loi. La densité de probabilité associée à Φ est notée φ et vaut
d 1 x2
Φ(x) = φ(x) = √ exp(− ).
dx 2π 2
On peut voir à la Figure 2.3 le graphe des densités de probabilité
associées aux lois N or(10,1), N or(10,2) et N or(10,3). Les densités
sont clairement symétriques par rapport à µ =10 et le paramètre
σ 2 contrôle la dispersion des valeurs possibles autour de µ: au plus
σ 2 augmente, au plus des valeurs grandes ou petites par rapport à
µ deviennent probables. De manière générale, la densité φ de la loi
N or(0,1) est unimodale (maximum en µ). Elle possède deux points
d’inflexion, en µ ± σ.
Remarque 2.5.4. Depuis quelques décennies les limitations de la
statistique gaussienne classique ont été mises en évidence et la symétrie
de la loi normale a été sévèrement critiquée dans de nombreuses dis-
ciplines, dont les sciences actuarielles. Il n’en reste pas moins que
la plupart des résultats asymptotiques de la statistique reposent sur
la loi normale, ce qui donne toute son importance à cet outil.
68 Chapitre 2. Modélisation actuarielle des risques
0.4

sigma=1
sigma=2
sigma=3
0.3
densite

0.2
0.1
0.0

0 5 10 15 20

Fig. 2.3 – Densités de probabilité associées à la loi normale pour µ = 10


et différentes valeurs de σ 2 .

2.5.5 Variable log-normale


Comme on l’a vu plus haut, la loi normale du fait de sa symétrie
et de la masse de probabilité qu’elle accorde aux valeurs négatives,
n’est pas le candidat idéal pour modéliser le coût des sinistres.
Une solution simple qu’on pourrait apporter au problème serait
de transformer la variable à modéliser afin qu’elle convienne mieux
aux besoins de l’actuaire. Assez naturellement, on peut imaginer
utiliser une transformation exponentielle, ce qui mène à la loi log-
normale. Plus précisément, si Y ∼ N or(µ,σ 2 ) et que nous définissons
X = exp Y , il vient pour x > 0,

Pr[X ≤ x] = Pr[exp Y ≤ x]
= Pr[Y ≤ ln x]
 
ln x − µ
= Φ .
σ
2.5. Variables aléatoires continues 69

Ceci nous conduit naturellement à la définition suivante. Une


variable aléatoire X est dite de loi Log-Normale de paramètres µ ∈
IR et σ 2 > 0, ce qui se notera dorénavant X ∼ LN or(µ,σ 2 ), lorsque
X prend ses valeurs dans IR+ et admet la fonction de répartition
(  
Φ ln(x)−µ
σ , si x > 0,
FX (x) =
0, sinon.
La loi log-normale remonte à Galton qui dès 1879 la fit apparaı̂tre
comme la loi limite d’un produit de variables aléatoires positives.
Elle fut par la suite largement utilisée, en économie et en finance.
La densité de probabilité de X est donnée par
   2 
 √ 1 1 ln(x)−µ
exp − 2 σ , si x > 0,
fX (x) = xσ 2π

0, sinon.
La fonction quantile vaut

FX−1 (p) = exp µ + σΦ−1 (p) .

On peut voir à la Figure 2.4 la densité de probabilité associée à


la loi LN or(µ,σ 2 ) pour µ = 0 et σ = 0.5, 1 et 1.5. La densité de
probabilité est unimodale et le mode correspond à exp(µ − σ 2 ).

2.5.6 Variable aléatoire exponentielle négative


Une variable aléatoire X est dite de loi exponentielle négative 1
de paramètre θ > 0, ou dite obéir à cette loi, ce qui se notera
dorénavant X ∼ Exp(θ), lorsque X prend ses valeurs dans R + et
admet la densité de probabilité

θ exp(−θx), si x > 0,
fX (x) =
0, sinon.
La fonction de répartition associée à la loi Exp(θ) est donnée par

1 − exp(−θx), si x > 0,
FX (x) =
0, sinon.
La fonction quantile vaut
1
FX−1 (p) = − ln(1 − p).
θ
1. L’appellation “exponentielle négative” est utilisée afin d’éviter tout risque
de confusion avec la famille exponentielle, monument de la statistique moderne,
que nous étudierons dans le Tome II.
70 Chapitre 2. Modélisation actuarielle des risques
0.8

sigma=0.5
sigma=1
sigma=1.5
0.6
densite

0.4
0.2
0.0

0 2 4 6 8 10

Fig. 2.4 – Densités de probabilité associées à la loi lognormale pour µ = 0


et différentes valeurs de σ 2 .

Par extension, nous noterons parfois Exp(θ) une variable aléatoire


obéissant à cette loi. Il s’agit très certainement de la loi de proba-
bilité fétiche en sciences actuarielles. Elle jouit de nombreuses pro-
priétés mathématiques intéressantes, ce qui explique l’engouement
des actuaires à son égard. Il faut cependant garder à l’esprit qu’elle
traduit des montants de sinistres relativement peu dangereux pour
la compagnie, ayant une queue de distribution peu épaisse, puisque
F X (x) = exp(−θx) présente une décroissance exponentielle sur IR + .
On peut voir à la Figure 2.5 la densité de probabilité associée à
la loi Exp(θ) pour différentes valeurs de θ. La densité de probabilité
est unimodale et le mode est en 0.

2.5.7 Variable Gamma


La loi Gamma a été obtenue par Laplace dès 1836. Bienaymé en
mit en évidence un cas particuler (la loi khi-carrée, ou du khi-deux)
2.5. Variables aléatoires continues 71
1.0
0.8

theta=0.2
theta=0.5
theta=1
theta=2
0.6
densite

0.4
0.2
0.0

0 5 10 15

Fig. 2.5 – Densités de probabilité associées à la loi exponentielle pour


différentes valeurs du paramètre θ.

en 1838 en relation avec la loi multinomiale. Une variable aléatoire


X est dite de loi Gamma de paramètres α > 0 et τ > 0, ou dite
obéir à cette loi, ce qui se notera dorénavant X ∼ Gam(α,τ ), lorsque
X admet la densité de probabilité
( α−1 α
x τ exp(−xτ )
Γ(α) , si x ≥ 0,
fX (x) =
0, sinon.

Parfois, nous désignerons par Gam(α,τ ) une variable aléatoire obéissant


à cette loi.
La fonction de queue s’écrit
F X (x) = 1 − Γ(α,τ x),
où Γ(·,·) est la fonction Gamma incomplète, définie par
Z ξ
1
Γ(t,ξ) = xt−1 exp(−x)dx, ξ,t ∈ IR+ .
Γ(t) x=0
72 Chapitre 2. Modélisation actuarielle des risques

On peut voir à la Figure 2.6 le graphe de f X pour différentes


valeurs de α et τ . Le mode est en (α − 1)/τ lorsque α ≥ 1, et en 0
sinon. De plus,

lim fX (x) = +∞, lorsque α < 1,


x→0

et
lim fX (x) = 0, lorsque α = 1.
x→0

On parle de loi gamma standard lorsque τ = 1; dans ce cas,

xα−1 exp(−x)
fX (x) = , x ∈ IR+ .
Γ(α)

Si X est de loi gamma de paramètres α et τ , alors τ X est de loi


gamma standard de paramètre α.
Remarque 2.5.5. Un cas particulier intéressant de la loi Gamma
est la loi khi-carrée (ou khi-deux) à n degrés de liberté. Il s’agit en
fait de la loi gamma de paramètres α = n/2 et τ = 1/2.
Remarque 2.5.6. Lorsque α = 1, on retrouve la loi exponentielle
négative, i.e. Gam(1,τ ) = Exp(τ ).
Remarque 2.5.7. Lorsque α est un entier positif, on parle parfois
de loi d’Erlang. La fonction de répartition est alors donnée par
α−1
X (xτ )j
FX (x) = 1 − exp(−xτ ) , x ≥ 0.
j!
j=0

2.5.8 Variable de Pareto


Cette loi tient son nom d’un professeur d’économie, Vilfredo Pa-
reto, d’origine italienne qui l’introduisit dès 1897 pour modéliser
la répartition des revenus dans une population. On peut l’obtenir
en transformant une variable aléatoire de loi exponentielle négative.
Puisque la loi exponentielle négative modélise des sinistres peu dan-
gereux pour la compagnie, on pourrait considérer que le montant de
sinistre X a même loi que exp(Y ), où Y ∼ Exp(α). Dès lors,

Pr[X ≤ x] = Pr[exp(Y ) ≤ x]
= Pr[Y ≤ ln x]

0, si x ∈]0,1],
=
1 − x−α , si x > 1.
2.5. Variables aléatoires continues 73

0.5

alpha=0.5
alpha=1
0.4

alpha=1.5
alpha=2
0.3
densite

0.2
0.1
0.0

0 2 4 6 8 10 12 14

x
0.5

alpha=0.5
alpha=1
0.4

alpha=1.5
alpha=2
0.3
densite

0.2
0.1
0.0

0 2 4 6 8

x
1.0

alpha=0.5
alpha=1
0.8

alpha=1.5
alpha=2
0.6
densite

0.4
0.2
0.0

0 1 2 3 4

Fig. 2.6 – Densités de probabilité associées à la loi gamma de paramètres


τ = 1/4 (au-dessus), 1/2 (au milieu) et 1 (en-dessous) pour différentes
valeurs du paramètre α.
74 Chapitre 2. Modélisation actuarielle des risques

Ce modèle traduit une situation beaucoup moins favorable pour


l’assureur, puisque la fonction de queue décroı̂t polynomialement
(et plus exponentiellement) vers 0. Pour obtenir la loi de Pareto, il
suffit de considérer la loi de la variable aléatoire

X = θ{exp(Y ) − 1}, où Y ∼ Exp(α),


laquelle admet pour fonction de survie

Pr[X > x] = Pr[Y > ln(1 + (x/θ))]


 x −α
= 1+
 θ
α
θ
= .
x+θ
Ainsi, une variable aléatoire X est dite de loi de Pareto de pa-
ramètres α > 0 et θ > 0, ce qui se notera dorénavant X ∼ Par(α,θ),
lorsque X admet la fonction de répartition
(  α
θ
1 − x+θ , si x ≥ 0,
FX (x) =
0, sinon.
La loi de Pareto ainsi définie est parfois appelée loi de Lomax (ou Pa-
reto de type II). Dorénavant, nous désignerons parfois par Par(α,θ)
une variable aléatoire obéissant à cette loi. La fonction quantile vaut

FX−1 (p) = θ (1 − p)−1/α − 1 .

La loi de Pareto passe pour être l’une des plus dangereuses


pour l’assureur (puisque la probabilité que le montant de sinistre
dépasse x décroı̂t polynomialement avec le montant x, alors que la
décroissance est exponentielle avec les autres modèles introduits plus
haut). Ceci explique son usage fréquent en réassurance. La densité
de probabilité associée à la loi de Pareto est donnée par
(
αθ α
(x+θ) α+1 , si x ≥ 0,
fX (x) =
0, sinon,

où α > 0, θ > 0; fX est clairement unimodale (le mode unique est
en 0). Voyez la Figure 2.7 pour un graphique de f α,θ et différentes
valeurs des paramètres.
Remarque 2.5.8. Nous rencontrerons dans le Tome II une ver-
sion un peu différente de la loi de Pareto, appelée loi de Pareto
généralisée, et apparaissant naturellement dans l’étude du compor-
tement du maximum de n variables aléatoires, lorsque n → +∞.
2.6. Vecteur aléatoire 75
1.0

alpha=1
0.8

alpha=2
alpha=3
0.6
densite

0.4
0.2
0.0

0 2 4 6 8 10

Fig. 2.7 – Densités de probabilité associées à la loi de Pareto pour θ = 1


et différentes valeurs du paramètre α.

2.6 Vecteur aléatoire

2.6.1 Définition

Un vecteur aléatoire X est le fruit de la réunion de n variables


aléatoires X1 , X2 , . . ., Xn définies sur le même espace probabilisé
(E,A, Pr). Dans la suite, nous considérerons toujours X comme un
vecteur colonne:
 
X1
 X2 
 
X= ..  = (X1 ,X2 , . . . ,Xn )t ,
 . 
Xn

où l’exposant “t” indique la transposition.


76 Chapitre 2. Modélisation actuarielle des risques

2.6.2 Fonction de répartition


Définition générale
Tout comme pour les variables aléatoires, le comportement sto-
chastique d’un vecteur X est entièrement décrit par sa fonction de
répartition jointe FX , définie comme suit.
Définition 2.6.1. La fonction de répartition F X associée au vec-
teur aléatoire X est définie comme suit:
 
FX (x) = Pr {e ∈ E|X1 (e) ≤ x1 ,X2 (e) ≤ x2 , . . . ,Xn (e) ≤ xn }
= Pr[X1 ≤ x1 ,X2 ≤ x2 , . . . ,Xn ≤ xn ], x ∈ IRn .

A la lumière de cette définition, F X (x) est donc la probabilité


que, simultanément, chacune des composantes X i du vecteur X soit
inférieure au niveau xi correspondant. Il s’agit donc de la prime à
payer pour recevoir un versement d’1e si les variables X 1 , . . . ,Xn
sont simultanément inférieures aux seuils x 1 , . . . ,xn .
Dorénavant, nous utiliserons souvent des notations vectorielles.
Ainsi, l’événement {X ≤ x} est équivalent à l’événement {X 1 ≤
x1 , . . . ,Xn ≤ xn }.

En dimension 2
Nous avons vu à la Propriété 2.3.5 à quelles conditions devait
répondre une fonction de répartition univariée. Ce résultat peut se
généraliser en dimension 2 de la facon suivante.
Propriété 2.6.2. FX est la fonction de répartition d’un couple X
si, et seulement si, FX
- est non-décroissante
- est continue à droite
- satisfait

lim FX (x1 ,t) = 0, quel que soit x1 ∈ IR,


t→−∞
lim FX (t,x2 ) = 0, quel que soit x2 ∈ IR,
t→−∞
lim FX (x1 ,x2 ) = 1,
x1 ,x2 →+∞

de même que

FX (x1 + δ,x2 + ) − FX (x1 + δ,x2 )


−FX (x1 ,x2 + ) + FX (x1 ,x2 ) ≥ 0 (2.10)

quel que soit x ∈ IR2 et , δ > 0.


2.6. Vecteur aléatoire 77

Remarque 2.6.3. La condition (2.10) est encore équivalente, dans


le cas où FX est deux fois dérivable, à

∂2
FX (x) ≥ 0.
∂x1 ∂x2

De façon générale, (2.10) garantit que la probabilité que X


prenne une valeur dans le rectangle de sommets (x 1 ,x2 ), (x1 + δ,x2 ),
(x1 ,x2 + ) et (x1 + δ,x2 + ) est toujours positive. Nous retrouve-
rons dans la suite de cet ouvrage le même type de contrainte que
l’inégalité (2.10) sous le nom de supermodularité.

Dimension quelconque
Etudions à présent les propriétés que doit posséder toute fonction
de répartition en dimension quelconque. Il s’agit d’une généralisation
immédiate de la Propriété 2.6.2, sauf pour la condition (2.10) qui
devient un peu plus compliquée.
Propriété 2.6.4. FX est la fonction de répartition d’un vecteur
aléatoire X de dimension n si, et seulement si, F X
- est non-décroissante;
- est continue à droite;
- satisfait

lim FX (x1 ,x2 , . . . ,xn ) = 0, pour j = 1,2, . . . ,n,


xj →−∞
lim FX (x1 ,x2 , . . . ,xn ) = 1,
x1 ,x2 ,...,xn →+∞

et, quels que soient (α1 ,α2 , . . . ,αn ),(β1 ,β2 , . . . ,βn ) ∈ IRn , avec
αi ≤ βi pour i = 1,2, . . . ,n, en définissant:

∆αi ,βi FX (x) = FX (x1 , . . . ,xi−1 ,βi ,xi+1 , . . . ,xn )


−FX (x1 , . . . ,xi−1 ,αi ,xi+1 , . . . ,xn ),

l’inégalité

∆α1 ,β1 ∆α2 ,β2 . . . ∆αn ,βn FX (x) ≥ 0.

Remarque 2.6.5. Comme en dimension 2, l’inégalité dans la Pro-


priété 2.6.4 garantit que:

Pr[α ≤ X ≤ β] ≥ 0 pour tout α ≤ β ∈ IR n .


78 Chapitre 2. Modélisation actuarielle des risques

Lorsque FX est suffisamment régulière, l’inégalité dans la Propriété


2.6.4 est encore équivalente à
∂n
FX (x) = fX (x) ≥ 0 sur IRn ,
∂x1 ∂x2 . . . ∂xn
où fX est la densité de probabilité jointe du vecteur X. On a alors
Z x1 Z xn
FX (x) = ... fX (y)dy1 . . . dyn .
−∞ −∞

Fonctions de répartition marginales


Le comportement de chacune des composantes X j est décrit par
la fonction de répartition FXj correspondante. Les fonctions FX1 ,
FX2 , . . ., FXn sont appelées fonctions de répartition marginales. Clai-
rement,
lim FX (x) = FXj (xj ).
xi →+∞ pour tout i6=j

Support du vecteur X
Le support SX du vecteur aléatoire X est défini comme le sous-
ensemble de IRn contenant les points x où FX est strictement crois-
sante. SX est inclus dans l’hyper-rectangle
h i h i h i
FX−1•
1
(0),F −1
X 1
(1) × F −1•
X 2
(0),F −1
X 2
(1) × . . . F −1•
X n
(0),F −1
X n
(1)

où FXi , i = 1,2, . . . ,n, sont les marginales de F X .

2.6.3 Indépendance
Souvent, l’actuaire sera confronté à plusieurs variables aléatoires
X1 ,X2 ,X3 , . . . (représentant par exemple la dépense de l’assureur
pour différentes polices du portefeuille). Il est important alors de
savoir si la valeur prise par une de ces variables pourrait influencer
celles prises par les autres.
Exemple 2.6.6. Si on songe à l’assurance des bâtiments contre les
tremblements de terre, et si X1 et X2 représentent deux risques de
mêmes caractéristiques situés dans une même zone géographique,
on serait tenté d’affirmer que si X1 prend une grande valeur (ce
qui signifie que le premier bâtiment a subi d’importants dégâts du
fait du séisme), X2 devrait également prendre une valeur élevée.
Inversément, une petite valeur de X 1 pourrait indiquer que X2 a
toutes les chances d’être également assez faible (puisqu’une petite
2.6. Vecteur aléatoire 79

valeur de X1 rend plus probable un séisme de faible magnitude). On


parle de dépendance positive entre les risques X 1 et X2 dans une
telle situation.
Une autre situation classique correspond à la situation où la
valeur de X1 n’a aucune influence sur celle de X2 .
Exemple 2.6.7. On peut par exemple penser à deux risques incen-
die situés dans des régions différentes. On voit mal comment les
conséquences de l’incendie touchant l’un des immeubles pourraient
renseigner sur un hypothétique sinistre affectant l’autre.
Intuitivement, les variables aléatoires X 1 ,X2 , . . . ,Xn sont mu-
tuellement indépendantes si la valeur de l’une quelconque d’entre
elles n’influence pas les autres.
Définition 2.6.8. Formellement, les variables aléatoires X 1 , . . . ,Xn
sont indépendantes lorsque

Pr[Xi ≤ xi pour i ∈ I|Xj ≤ xj pour j ∈ J ]


= Pr[Xi ≤ xi pour i ∈ I] (2.11)

quels que soient les réels xi et xj , et les sous-ensembles I et J


disjoints de {1, . . . ,n}.
Ceci traduit l’idée que le fait de savoir que les X j , j ∈ J , sont
petites (comprenez par là inférieures aux seuils x j ) n’apprend rien
quant à la probabilité que les Xi , i ∈ I, soient également petites
(i.e. inférieures aux seuils xi ). Plus généralement, (2.11) garantit que
la survenance de tout événement faisant intervenir les X j , j ∈ J ,
n’influence en rien la probabilité qu’un événement faisant intervenir
les Xi , i ∈ I, se produise.
La seule manière pour que l’égalité (2.11) soit satisfaite est que la
fonction de répartition jointe du vecteur X se factorise en le produit
de ses marginales.
Propriété 2.6.9. Les variables aléatoires X 1 ,X2 , . . . ,Xn sont indépendantes
si, et seulement si, la factorisation
n
Y
FX (x) = FXi (xi ) est valable pour tout x ∈ IR n .
i=1

La vérification de l’indépendance peut également se faire en re-


courant aux densités de probabilité.
Propriété 2.6.10. (i) Si les Xi sont continues, les variables aléatoires
X1 , . . . ,Xn sont indépendantes si, et seulement si, leur densité
80 Chapitre 2. Modélisation actuarielle des risques

de probabilité jointe se factorise, i.e.


n
Y
fX (x) = fXi (xi ).
i=1

(ii) Si les Xi sont des variables de comptage, il en va de même des


probabilités jointes, i.e.
n
Y
Pr[X1 = k1 , . . . ,Xn = kn ] = Pr[Xi = ki ].
i=1

2.6.4 Vecteur normal


Une variable aléatoire de loi N or(µ,σ 2 ) admet une densité qui
peut se mettre sous la forme
 
1 1 2
fX (x) = √ exp − Q1 (x; µ,σ ) , x ∈ IR,
σ 2π 2
avec
1
Q1 (x; µ,σ 2 ) = (x − µ)2 = (x − µ)(σ 2 )−1 (x − µ)
σ2

où µ ∈ IR and σ 2 > 0. Tentons à présent d’étendre cette définition


au cas bivarié. Donnons-nous un couple de nombres réels
 
µ1
µ=
µ2

et une matrice  
σ12 σ12
Σ=
σ12 σ22

telle que σi2 > 0, i = 1,2, |σ12 | < σ1 σ2 . Nous notons dorénavant |Σ|
le déterminant de la matrice Σ. Un couple aléatoire X = (X 1 ,X2 )
est dit de loi normale, ce qui se notera désormais X ∼ N or(µ,Σ),
s’il admet une densité de la forme
 
1 1
fX (x) = exp − Q2 (x; µ,Σ) , x ∈ IR2
2π|Σ|1/2 2

où
Q2 (x; µ,Σ) = (x − µ)t Σ−1 (x − µ)
2.6. Vecteur aléatoire 81

On peut voir à la Figure 2.8 différents graphiques de la densité


de probabilité bivariée associée à la loi normale pour µ = (0,0) t ,
σ12 = σ22 = 1 et différentes valeurs de σ12 .
Remarque 2.6.11. Dans certains cas, la matrice Σ n’est pas inver-
sible et nous devons alors aménager la définition de la loi N or(µ,Σ)
(puisque l’inversion dans Q2 n’est plus admise). Plus précisément,
X est dit de loi normale singulière (singulière car la matrice Σ est
singulière, i.e. non inversible) s’il existe des nombres réels σ 1 , σ2 ,
µ1 et µ2 tels que X =loi (σ1 Z + µ1 ,σ2 Z + µ2 ), où Z ∼ N or(0,1).
Les définitions données ci-dessus s’étendent très facilement à
n’importe quelle dimension (en substituant un vecteur de dimen-
sion n au couple µ et une matrice carrée n × n symétrique définie
positive à la matrice 2 × 2 Σ, et en divisant le tout par (2π) n/2 ).
La propriété suivante indique que le paramètre σ 12 est celui
contrôlant la dépendance éventuelle entre X 1 et X2 .
Propriété 2.6.12. Lorsque σ12 = 0, les composantes de X ∼
N or(µ,Σ) sont indépendantes.

Démonstration. Lorsque σ12 = 0, Q2 vaut


 2 
t 1 σ2 0
Q2 (x; µ,Σ) = (x − µ) 2 2 (x − µ)
σ1 σ2 0 σ12
1 1
= 2 (x1 − µ1 )2 + 2 (x2 − µ2 )2 .
σ1 σ2

Dès lors, la densité jointe


 
1 1 2
fX (x) = √ exp − Q1 (x1 ; µ1 ,σ1 )
σ1 2π 2
 
1 1 2
× √ exp − Q1 (x2 ; µ2 ,σ2 )
σ2 2π 2

se factorise en le produit des densités associées à X 1 et à X2 .

Remarque 2.6.13. La définition généralement retenue pour la loi


gaussienne multivariée est la suivante. Un vecteur X = P(X 1 , . . . ,Xn )
n
est dit gaussien lorsque toute combinaison linéaire j=1 αj Xj de
ses composantes est de loi normale univariée (avec la convention de
N or(µ,0) désigne une masse de probabilité unitaire placée en µ). En
particulier, chaque composante X1 , . . . ,Xn est de loi normale.
Remarque 2.6.14. Notez qu’il ne suffit pas pour qu’un vecteur
soit gaussien que ses marginales soient normales. En effet, si on
82 Chapitre 2. Modélisation actuarielle des risques

0.2
0.2

5
5

0.1
0.1

pdf
0.1
pdf
0.1

5
5

0.0
0.0

0
0

2 2

1 1
2 2

0 1 0 1
x_ x_
2 2 0
0 -1
-1
x_1 x_1
-1 -1
-2 -2
-2 -2
0.2
0.2

5
5

0.1
0.1

pdf
0.1
pdf
0.1

5
5

0.0
0.0

0
0

2 2

1 1
2 2

0 1 0 1
x_ x_
2 2 0
0 -1
-1
x_1 x_1
-1 -1
-2 -2
-2 -2
0.4
0.4

0.3
0.3

pdf
0.2
pdf
0.2

0.1
0.1

0
0

2
2
1
1 2
2
0 1
0 1 x_
x_ 2 0
2 0 -1
-1
x_1
x_1 -1
-1
-2
-2 -2
-2

Fig. 2.8 – Densité associée à la loi normale bivariée de paramètres


µ = (0,0)t , σ12 = σ22 = 1 et différentes valeurs de σ12
2.6. Vecteur aléatoire 83

considère le couple (X1 ,X2 ) tel que X1 ∼ N or(0,1) et



X1 , si |X1 | ≤ 1,
X2 =
−X1 , sinon,

on a X2 ∼ N or(0,1), mais (X1 ,X2 ) n’est pas un vecteur gaussien


puisque la droite x1 = −x2 se voit attribuer une masse de probabilité

0 < Pr[X1 + X2 = 0] < 1,

ce qui fait que X1 + X2 ne peut pas être de loi normale.


La loi N or(µ,Σ) peut être obtenue à partir de la loi normale
standard (ou centrée-réduite) N or(0,Id) (i.e. la loi d’un vecteur dont
les composantes sont indépendantes et de même loi N or(0,1)) à
l’aide du résultat suivant.
Propriété 2.6.15. Soient X ∼ N or(µ,Σ) et Z ∼ N or(0,Id). En
définissant la matrice T telle que T t T = Σ, on a X =loi µ + T t Z.

2.6.5 Vecteurs elliptiques


Définition
Les lois elliptiques ont été introduites par Kelker en 1970. Les
lois sphériques sont des généralisations de la loi N or (0,Id) et les
lois elliptiques des généralisations de la loi N or (µ,Σ).
Définition 2.6.16. Un vecteur aléatoire X de IR n est dit de loi
elliptique de générateur g et de paramètres µ et Σ, ce qui se notera
désormais X ∼ Ell(g,µ,Σ) lorsqu’il admet la densité
 
cn 1 t −1
fX (x) = g (x − µ) Σ (x − µ) , (2.12)
|Σ|1/2 2

où la constante de normalisation cn est donnée par


Z
Γ (n/2) ∞ n/2−1
cn = t g (t) dt.
(2π)n/2 0
Remarque 2.6.17. En prenant pour g la fonction exponentielle,
on voit qu’on retrouve la loi normale multivariée N or(µ,Σ).

Comportement marginal
Les marginales des lois elliptiques sont elles-mêmes elliptiques,
i.e.

X ∼ Ell(g,µ,Σ) ⇒ Xk ∼ Ell(g,µk ,σk2 ) pour k = 1, . . . ,n.


84 Chapitre 2. Modélisation actuarielle des risques

De plus, quelle que soit la matrice B et le vecteur b,


X ∼ Ell(g,µ,Σ) ⇒ b + BX ∼ Ell(g,b + Bµ,BΣB t ).

Loi de Student multivariée


La loi de Student multivariée est obtenue avec comme générateur,
en dimension n,  
t −p
g (t) = 1 + ,
kp
où le paramètre p est supérieur à n/2, et k p est une constante de
normalisation. La Figure 2.9 décrit les fonctions g pour différentes
valeurs de p.

p = 0,75
p = 1,00
0.5 p = 2,50
p = 5,00
Gaussien
0.4

0.3

0.2

0.1

0.0

-4 -2 0 2 4

Fig. 2.9 – Générateur g de la loi de Student multivariée.

La densité de X est alors donnée par


" #−p
cn (x − µ)t Σ (x − µ)
fX (x) = 1/2
1+ pour x ∈ IRn .
|Σ| Γ (p − n/2)

La Figure 2.10 décrit l’allure de la densité associée à la loi de Student


bivariée.
On peut également obtenir la loi de Student multivariée à l’aide
de la construction suivante, en termes de variables aléatoires.
Propriété 2.6.18. Soit Z ∼ N or (0,Id) et S de loi khi-carrée à
m degrés de liberté, mutuellement indépendantes. Le vecteur Y =

mZ/S obéit à la loi de Student multivariée, à m degrés de liberté.
Ceci peut se généraliser en considérant Y ∗ = µ+T t Y , où T t T = Σ.
2.6. Vecteur aléatoire 85

3.0

2.5

2.0

1.5

1.0

0.5

0.0
0.2
-0.5 0.2
0.1
0.1
-1.0 0.1
1 0.1
0.
-1.5 0.0

-2.0 0.0

-2.5

-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0

3.0

2.5

2.0

1.5

1.0

0.5

0.0
0.2
-0.5
0.2
0.2
-1.0
0.1
0.1
-1.5
0.1
0.1
-2.0
0.0

-2.5 0.0

-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Fig. 2.10 – Densité de la loi de Student bivariée pour p = 1.5 (au-


dessus) et p = 0.75 (en-dessous)
86 Chapitre 2. Modélisation actuarielle des risques

Loi de Cauchy multivariée


La loi de Cauchy multivariée admet la densité

Γ ((n + 1) /2)  −(n+1)/2


fX (x) = 1+(x − µ)t Σ (x − µ) pour x ∈ IRn .
π (n+1)/2 |Σ|1/2

Loi logistique multivariée


La loi logistique multivariée admet le générateur

exp(−t)
g (t) = 2 .
1 + exp(−t)

La densité s’écrit alors



cn exp − 12 (x − µ)t Σ−1 (x − µ) n
fX (x) =  2 pour x ∈ IR .
|Σ|1/2 1 + exp − 12 (x − µ)t Σ−1 (x − µ)

Loi de puissance exponentielle multivariée


La loi de puissance exponentielle multivariée admet le générateur

g (t) = exp (−rts ) ,

où r et s sont des paramètres strictement positifs. La densité est


alors donnée par
cn  r s 
t −1
fX (x) = 1/2
exp − (x − µ) Σ (x − µ) pour x ∈ IRn ,
|Σ| 2

où la constante de normalisation c n vaut ici

sΓ (n/2)
cn = n/2
r n/(2s) ,
(2π) Γ (n/ (2s))

avec le cas particulier du vecteur Gaussien quand s = r = 1, et√le


cas particulier de la loi de Laplace dans le cas où s = 1/2 et r = 2.

2.6.6 Vecteur multinomial


Définition
La loi multinomiale peut se voir comme celle d’un vecteur N
de composantes de loi binomiale, mais dépendantes. Ayant des pro-
babilités p1 ,p2 , . . . ,pn telles que p1 + . . . + pn = 1, N est de loi
2.7. Lois conditionnelles 87

multinomiale d’exposant m et de paramètres p 1 , . . . ,pm , ce qui se


notera désormais N ∼ Mult(m,p1 , . . . ,pn ), lorsque

m!
Pr[N1 = k1 , . . . ,Nn = kn ] = pk11 pk22 . . . pknn ,
k1 !k2 ! . . . kn !

pour les entiers k1 , . . . ,kn tels que k1 + . . . + kn = m.

Lois marginales
Lorsque m = 2, on voit que Mult(m,p1 ,p2 ) est la loi du couple
(N,m − N ) où N ∼ Bin(m,p1 ). De manière générale, chaque com-
posante Ni d’un vecteur (N1 , . . . ,Nn ) de loi Mult(m,p1 , . . . ,pn ) est
de loi Bin(m,pi ). Les composantes de ce vecteurs sont fortement
dépendantes car liées par la relation

N1 + . . . + Nn = m.

2.7 Lois conditionnelles


2.7.1 Le cas des variables de comptage
Commmençons par le cas simple et considérons le couple de va-
riables aléatoires de comptage (N 1 ,N2 ). La loi du couple (N1 ,N2 ) est
décrite par les probabilités jointes Pr[N 1 = n1 ,N2 = n2 ], n1 ,n2 ∈ IN.
Les lois marginales de N1 et de N2 s’obtiennent en sommant par
rapport aux valeurs possibles de l’autre composante du couple, i.e.
X
Pr[N1 = n1 ] = Pr[N1 = n1 ,N2 = j], n1 ∈ IN,
j∈IN

et X
Pr[N2 = n2 ] = Pr[N1 = j,N2 = n2 ], n2 ∈ IN.
j∈IN

Comme l’événement {N1 = n1 } se voit attribuer une masse de


probabilité positive (lorsque n1 appartient au support de N1 ), la
loi conditionnelle de N2 sachant N1 = n1 , n1 ∈ IN, est simplement
donnée par

Pr[N1 = n1 ,N2 = n2 ]
Pr[N2 = n2 |N1 = n1 ] = , n2 ∈ IN,
Pr[N1 = n1 ]

en vertu de la définition (2.4) de la probabilité conditionnelle.


88 Chapitre 2. Modélisation actuarielle des risques

2.7.2 Le cas des variables continues


Ayant un couple (X1 ,X2 ) de variables aléatoires continues, il est
plus difficile de définir Pr[X1 ≤ x1 |X2 = x2 ] car Pr[X2 = x2 ] = 0
et la définition élémentaire (2.4) ne trouve donc pas à s’appliquer.
Afin de définir la loi conditionnelle de X 1 sachant X2 = x2 , on
peut procéder par passage à la limite comme décrit ci-après. Tout
d’abord, quels que soient x1 , x2 ∈ IR et h > 0,
R x2 +h R x1
ξ =x ξ =−∞ fX (ξ1 ,ξ2 )dξ1 dξ2
Pr[X1 ≤ x1 |x2 ≤ X2 ≤ x2 + h] = 2 2 R x12 +h .
ξ2 =x2 f X 2 (ξ 2 )dξ 2

En divisant numérateur et dénominateur par h puis en faisant tendre


h → 0, on voit que le membre de droite tend vers
R x1
ξ =−∞ fX (ξ1 ,x2 )dξ1
F1|2 (x1 |x2 ) = 1 ≡ Pr[X1 ≤ x1 |X2 = x2 ].
fX2 (x2 )
On peut vérifier qu’à x2 fixé, F1|2 (·|x2 ) est une fonction de répartition
possédant la densité
fX (x1 ,x2 )
f1|2 (x1 |x2 ) = . (2.13)
f2 (x2 )
On appelle f1|2 (·|x2 ) la densité de X1 conditionnellement à X2 = x2 ,
et F1|2 (·|x2 ) la fonction de répartition de X1 conditionnellement à
X2 = x 2 .
Exemple 2.7.1. Considérons X ∼ N or(µ,Σ) et notons r = σσ112 σ2 .
2 2 2
Comme |Σ| = σ1 σ2 (1 − r ), l’inverse de Σ existe si, et seulement
si, |r| < 1. Un calcul direct donne dans ce dernier cas
 
−1 1 σ22 −rσ1 σ2
Σ = 2 2 .
σ1 σ2 (1 − r 2 ) −rσ1 σ2 σ12
Pour |r| < 1, nous pouvons donc écrire

1 1
fX (x) = √ exp − ×
2πσ1 σ2 1 − r 2 2(1 − r 2 )
       
x1 − µ 1 2 x1 − µ 1 x2 − µ 2 x2 − µ 2 2
− 2r + .
σ1 σ1 σ2 σ2
A partir de l’identité
      
x1 − µ 1 2 x1 − µ 1 x2 − µ 2 x2 − µ 2 2
− 2r +
σ1 σ1 σ2 σ2
 2  
x2 − µ 2 x1 − µ 1 x2 − µ 2 2
= (1 − r 2 ) + −r ,
σ2 σ1 σ2
2.7. Lois conditionnelles 89

on obtient fX (x) = f2 (x2 )f1|2 (x1 |x2 ) avec


 
1 1
f2 (x2 ) = √ exp − 2 (x2 − µ2 )2
σ2 2π 2σ
et

1 1
f1|2 (x1 |x2 ) = √ √ exp − 2 ×
2πσ1 1 − r 2 2σ1 (1 − r 2 )
 2 
σ1
x1 − (µ1 + r (x2 − µ2 )) .
σ2

Lorsque |r| < 1, la loi conditionnelle de X 1 sachant X2 = x2 est


donc  
σ1 2 2
N or µ1 + r (x2 − µ2 ),σ1 (1 − r ) .
σ2

2.7.3 Le cas mixte: une variable de comptage et une


autre continue
Nous considérons ici le couple aléatoire (X,N ) où la variable X
est continue et N est une variable de comptage. On peut imaginer
par exemple que X représente le coût des sinistres et N leur nombre.
La densité de probabilité jointe de (X,N ) est définie par

Pr[x < X ≤ x + ∆x,N = n]


f (x,n) = lim .
∆x→0 ∆x
Nous avons bien entendu
XZ
f (x,n)dx = 1.
+
n∈IN x∈IR

Les lois marginales de X et de N sont respectivement décrites par


la densité de X X
f1 (x) = f (x,n)
n∈IN

et la loi de probabilité de N
Z
f2 (n) = f (x,n)dx.
x∈IR+

Les lois conditionnelles sont alors décrites par la densité de X sa-


chant N = n
f (x,n)
f1|2 (x|n) =
f2 (n)
90 Chapitre 2. Modélisation actuarielle des risques

et par la loi de probabilité de N sachant X = x

f (x,n)
f2|1 (n|x) = .
f1 (x)

Exemple 2.7.2 (Mélange de Poisson). Supposons que la loi


jointe du couple (X,N ) soit décrite par

xn
f (x,n) = exp(−x) g(x), x ∈ IR+ , n ∈ IN.
n!
Clairement, les marginales sont données par
X
f1 (x) = f (x,n) = g(x)
n∈IN

pour X et par
Z
f2 (n) = f (x,n)dx = E[exp(−X)X n /n!]
x∈IR+

pour N . La densité conditionnelle de N sachant X = x est

xn
f2|1 (n|x) = exp(−x)
n!

de sorte que conditionnellement à X = x, N ∼ Poi(x). La densité


conditionnelle de X sachant N = n s’écrit quant à elle

exp(−x)xn g(x)
f1|2 (x|n) = R n
.
ξ∈IR+ exp(−ξ)ξ g(ξ)dξ

2.7.4 Indépendance conditionnelle


On étudiera également par la suite le cas de variables condition-
nellement indépendantes,
Définition 2.7.3. Soit un vecteur aléatoire Θ. Les variables X 1
et X2 sont indépendantes conditionnellement à Θ si la condition
suivante est satisfaite:

Pr[X1 ≤ x1 ,X2 ≤ x2 |Θ = θ] = Pr[X1 ≤ x1 |Θ = θ] Pr[X2 ≤ x2 |Θ = θ].

Exemple 2.7.4. Supposons qu’il existe une variable aléatoire Θ


telle que conditionnellement à Θ = θ, les variables aléatoires N 1 et
2.8. Lois composées 91

N2 sont indépendantes et de lois respectives Poi(λ 1 θ) et Poi(λ2 θ).


Nous avons alors

Pr[N1 = n1 ,N2 = n2 ]
Z
= Pr[N1 = n1 ,N2 = n2 |Θ = θ]fΘ (θ)dθ
θ∈IR+
Z
= Pr[N1 = n1 |Θ = θ] Pr[N2 = n2 |Θ = θ]fΘ (θ)dθ
θ∈IR+
Z
(λ1 θ)n1 (λ2 θ)n2
= exp(−λ1 θ − λ2 θ) fΘ (θ)dθ.
θ∈IR+ n1 !n2 !

Si Θ ∼ Gam(a,a), on obtient
Z
λn1 aa
Pr[N1 = n] = θ a+n−1 exp(−θ(a + λ1 ))dθ
n!Γ(a) θ∈IR+
λn1 aa
= (a + λ1 )−a−n Γ(a + n)
n!Γ(a)
 n  a
Γ(a + n) λ1 a
=
n!Γ(a) a + λ1 a + λ1

de sorte que N1 ∼ N Bin(a,a/(a+λ1 )). De même, N2 ∼ N Bin(a,a/(a+


λ2 )). La loi du couple N est appelée loi Binomiale Négative bivariée.

2.8 Lois composées


2.8.1 Définition
Ces modèles probabilistes “composent” une loi de comptage (pour
le nombre des sinistres) avec une loi continue (pour leurs coûts res-
pectifs) afin de décrire le coût total qu’un assuré, une classe d’assurés
ou un portefeuille génère pour l’assureur. Si N désigne le nombre des
sinistres survenus durant une certaine période et X i , i = 1,2, . . ., les
montants de ceux-ci, la charge financière totale S de la compagnie
pour la période considérée s’écrit alors comme suit:

N
X
S= Xi (2.14)
i=1

avec la convention que S = 0 lorsque N = 0. Les variables aléatoires


Xi , i = 1,2, . . . sont supposées indépendantes et identiquement dis-
tribuées, et N est supposée indépendante des X i .
92 Chapitre 2. Modélisation actuarielle des risques

2.8.2 Produit de convolution


Ayant des variables aléatoires indépendantes, il est souvent intéressant
pour l’actuaire de considérer leur somme. Ainsi, étant données deux
variables aléatoires de comptage indépendantes N 1 et N2 , la somme
N1 + N2 admet la fonction de répartition
k
X
Pr[N1 + N2 ≤ k] = Pr[N1 ≤ k − j] Pr[N2 = j],
j=0

qui donne encore


k
X
Pr[N1 + N2 = k] = Pr[N1 = k − j] Pr[N2 = j].
j=0

Exemple 2.8.1 (Convolution de lois de Poisson). Supposons


N1 ∼ Poi(λ1 ) et N2 ∼ Poi(λ2 ), indépendantes. Dans ce cas,
k
X λ1k−j λj
Pr[N1 + N2 = k] = exp(−λ1 ) exp(−λ2 ) 2
(k − j)! j!
j=0
k  
1 X k
= exp(−λ1 − λ2 ) λ1k−j λj2
k! j
j=0
| {z }
=(λ1 +λ2 )k

Ainsi, N1 + N2 ∼ Poi(λ1 + λ2 ). On dit encore que la loi de Poisson


est stable par convolution.
L’exemple ci-dessus nous permet de rapprocher les lois multino-
miale et de Poisson.
Exemple 2.8.2. Soient les variables aléatoires indépendantes N 1 ∼
Poi(λ1 ), . . . ,Nn ∼ Poi(λn ). Conditionnellement à N1 + . . . + Nn =
m,
(N1 , . . . ,Nn ) ∼ Mult(m,λ1 /λ• , . . . ,λn /λ• )
P
où λ• = j λj .
Quels que soient les entiers k1 , . . . ,kn , l’égalité
Pr[N1 = k1 , . . . ,Nn = kn |N1 + . . . + Nn = k1 + . . . + kn ]
kj
Qn j λ
j=1 exp(−λj ) kj !
=  P  Pn λ Pnj=1 kj
n ( j=1 j )
exp − j=1 λj P
( nj=1 kj )!
prouve le résultat annoncé.
2.8. Lois composées 93

L’exemple suivant traite d’une forme de loi de Poisson bivariée.


Exemple 2.8.3. Considérons le couple aléatoire (N 1 ,N2 ) où

N1 = L1 + M et N2 = L2 + M ;

M représente un “choc commun” affectant simultanément N 1 et N2 .


Les variables aléatoires L1 , L2 et M sont supposées être indépendantes
de loi L1 ∼ Poi(λ1 ), L2 ∼ Poi(λ2 ) et M ∼ Poi(µ). Les lois margi-
nales du couple (N1 ,N2 ) sont clairement Poi(λ1 + µ) et Poi(λ2 + µ),
respectivement.
La loi jointe de (N1 ,N2 ) s’obtient comme suit

Pr[N1 = n1 ,N2 = n2 ]
+∞
X
= Pr[N1 = n1 ,N2 = n2 |M = k] Pr[M = k]
k=0
min{n1 ,n2 }
X
= Pr[L1 = n1 − k] Pr[L2 = n2 − k] Pr[M = k]
k=0
min{n1 ,n2 }
X µk λn1 1 −k λn2 2 −k
= exp(−λ1 − λ2 − µ) .
k! (n1 − k)! (n2 − k)!
k=0

On peut alors calculer la loi conditionnelle de N 2 sachant N1 = n1 :

Pr[N2 = n2 |N1 = n1 ]
min{n1 ,n2 }
Xµk λn1 1 −k λn2 2 −k
= exp(−λ1 − λ2 − µ)
k! (n1 − k)! (n2 − k)!
k=0
 
(λ1 + µ)n1 −1
× exp(−λ1 − µ)
n1 !
min{n1 ,n2 }  
X n1 µk λn1 1 −k λn2 2 −k
= exp(−λ2 ) .
k (n2 − k)!(λ1 + µ)n1
k=0

La Figure 2.11 décrit les probabilités conditionnelles n 2 7→ Pr[N2 =


n2 |N1 = n1 ] pour différentes valeurs de n1 , de même que la proba-
bilité marginale n2 7→ Pr[N2 = n2 ] (en trait plein). On constate que
lorsque n1 augmente, les courbes ont tendance à se déplacer vers
la droite, accordant ainsi des masses de probabilité plus élevées aux
grandes valeurs.
94 Chapitre 2. Modélisation actuarielle des risques
0.20

P[N_2=n_2]
n_1=0
P[N_2=n_2|N_1=n_1]

n_1=10
0.15

n_1=20
0.10
0.05
0.0

0 10 20 30 40 50

n_2

Fig. 2.11 – Loi de probabilité de N2 conditionnellement à {N1 = n1 }


pour n1 = 0,10,20, λ1 = λ2 = 10, µ = 5.

De manière générale, le produit de convolution (dorénavant noté


“?”) de fonctions de répartition fournit la fonction de répartition
d’une somme de variables aléatoires indépendantes admettant ces
fonctions de répartition.
Définition 2.8.4. Etant données deux fonctions de répartition F 1
et F2 , le produit de convolution F1 ? F2 est défini comme suit:
Z
F1 ? F2 (x) = F1 (x − y)dF2 (y), x ∈ IR.
y∈IR

Dans le cadre de cet ouvrage, les fonctions de répartition considérées


auront le plus souvent un support contenu dans IR + . Dans ce cas,
le produit de convolution F1 ? F2 est encore donné par
Z x
F1 ? F2 (x) = F1 (x − y)dF2 (y), x ≥ 0.
y=0

Si on note X1 et X2 des variables aléatoires indépendantes de


fonction de répartition F1 et F2 , on a clairement que

F1 ? F2 (x) = Pr[X1 + X2 ≤ x].


2.8. Lois composées 95

Si F1 et F2 admettent les densités de probabilité f 1 et f2 , la


densité de X1 + X2 , notée f1 ? f2 , est donnée par
Z
d
f1 ? f2 (x) = F1 ? F2 (x) = f1 (x − y)f2 (y)dy, x ∈ IR.
dx y∈IR

Lorsque les supports de F1 et de F2 sont contenus dans IR+ , ceci se


réécrit encore
Z x
d
f1 ? f2 (x) = F1 ? F2 (x) = f1 (x − y)f2 (y)dy, x ≥ 0.
dx y=0

Exemple 2.8.5 (Convolution de lois Gamma). Considérons


X1 ∼ Gam(α1 ,τ ) et X2 ∼ Gam(α2 ,τ ), mutuellement indépendantes.
La densité de la somme X1 + X2 est donnée par
Z x
1
(x − y)α1 −1 τ α1 +α2 y α2 −1 exp(−xτ )dy
Γ(α1 )Γ(α2 ) 0
xα1 +α2 −1
= exp(−xτ )τ α1 +α2 .
Γ(α1 + α2 )
Nous constatons que X1 + X2 ∼ Gam(α1 + α2 ,τ ), de sorte que la
famille des lois Gamma est stable par convolution.
Nous reviendrons au Chapitre 8 sur le problème de la détermination
de la fonction de répartition d’une somme X 1 + X2 de variables
aléatoires dépendantes.

2.8.3 Fonction de répartition associée à une loi com-


posée
Si on note FX la fonction de répartition commune des X i , la
fonction de répartition FS de S définie en (2.14) est alors donnée
par
"N #
X
FS (s) = Pr Xi ≤ s
i=1
+∞
" N
#
X X
= Pr Xi ≤ s,N = k
k=0 i=1
+∞
" k #
X X
= Pr Xi ≤ s Pr[N = k]
k=0 i=1
+∞
X ?(k)
= Pr[N = k]FX (s), s ∈ IR+ ,
k=0
96 Chapitre 2. Modélisation actuarielle des risques

?(k)
où la suite {FX , k ∈ IN} des puissances de convolution de F X
satisfait le schéma de récurrence
?(k) ?(k−1)
FX (x) = FX ? FX (x)
Z x
?(k−1)
= FX (x − y)dFX (y), x ∈ IR+ , k = 1,2, . . . ,
y=0

?(1)
partant de FX = FX et avec la convention

?(0) 0, si x < 0,
FX (x) =
1, sinon.

Exemple 2.8.6 (Loi binomiale composée). Si N ∼ Bin(n,q)


alors on parle de loi binomiale composée, ce qui se note S ∼ CBin(n,q,F X ).
Dans ce cas,
Xn  
n ?(k)
FS (s) = q k (1 − q)n−k FX (s).
k
k=0

Exemple 2.8.7 (Loi de Poisson composée). Si N ∼ Poi(λ), on


parle de loi de Poisson composée, et nous noterons S ∼ CPoi(λ,F X ).
Dans ce cas,
+∞
X λk ?(k)
FS (s) = exp(−λ) FX (s).
k!
k=0

2.9 Transformations des risques et clauses conven-


tionnelles relatives aux dommages
2.9.1 Concept
Du fait de la garantie partielle octroyée par l’assureur, l’assu-
rance revient en pratique à substituer à une variable aléatoire S
représentant la perte financière qui menace le patrimoine de l’assuré
une variable aléatoire g(S), jugée plus avantageuse par ce dernier.
Le contrat d’assurance n’élimine donc pas le risque du patrimoine
de l’assuré, mais le transforme pour le rendre acceptable.
Le but de cette section est d’examiner l’impact des clauses stan-
dards limitant l’intervention de l’assureur.

2.9.2 Le découvert obligatoire


Lorsqu’un découvert obligatoire est prévu dans les conditions
générales, l’assureur laisse en toute hypothèse une partie du montant
2.9. Transformations des risques et clauses
conventionnelles relatives aux dommages 97

des sinistres à charge de l’assuré. Le découvert obligatoire est une


notion doctrinale qui n’est pas utilisée dans les textes réglementaires
(lesquels ne parlent que de franchise, ce dernier terme recouvrant en
réalité une autre clause conventionnelle relative aux dommages, dont
il sera question plus loin).
Lorsqu’une police prévoit un découvert obligatoire d’un montant
δ et que le montant du sinistre est X, le montant Y de l’indemnité
versée par l’assureur vaut

0, si X ≤ δ,
Y =
X − δ, si X > δ.

Notez que le découvert obligatoire affecte


(i) le nombre des sinistres, puisque les sinistres de montant inférieur
à celui du découvert obligatoire ne sont pas déclarés à l’assu-
reur;
(ii) le montant des sinistres, puisque les sinistres de montant supérieur
à celui du découvert obligatoire seront rabotés de ce dernier.
La fonction de répartition de Y s’obtient comme suit: il y a une
probabilité positive pour que Y soit nulle, donnée par

Pr[Y = 0] = Pr[X ≤ δ] = FX (δ).

Ensuite, pour y > 0,

FY (y) = Pr[Y ≤ y] = Pr[X ≤ δ + y] = FX (δ + y).

La fonction de répartition de Z vaut pour z > 0

FZ (z) = Pr[Z ≤ z|Y > 0] = Pr[Y ≤ z|Y > 0]


Pr[0 < Y ≤ z] Pr[δ < X ≤ z + δ]
= =
Pr[Y > 0] 1 − FX (δ)
FX (z + δ) − FX (δ)
=
1 − FX (δ)
c’est-à-dire
(
0, si z ≤ 0,
FZ (z) = FX (z+δ)−FX (δ)
1−FX (δ) , si z > 0.

2.9.3 La franchise
Lorsqu’une franchise est prévue dans les conditions générales,
l’assureur couvre l’intégralité du dommage s’il excède le montant de
98 Chapitre 2. Modélisation actuarielle des risques

la franchise. Par contre, les sinistres dont le montant est inférieur à


la franchise ne donnent droit à aucune indemnisation. La franchise
influence donc le nombre des sinistres indemnisés (et donc déclarés à
la compagnie), mais n’affecte pas le montant des sinistres dépassant
le montant de la franchise.
Formellement, la franchise donne droit au remboursement intégral
pour autant que le montant X du sinistre dépasse un montant
spécifié κ. Dans ce cas, le montant Y de l’indemnité à laquelle peut
prétendre l’assuré qui a subi un préjudice de montant X est donnée
par 
0, si X ≤ κ,
Y =
X, si X > κ.
Dès lors,
Pr[Y = 0] = Pr[X ≤ κ] = FX (κ).
Ensuite, pour y > 0,

FX (κ), si y ≤ κ
FY (y) =
FX (y), si y > κ.
Le paiement effectif Z de la compagnie admet la fonction de répartition
Pr[0 < Y ≤ z]
FZ (z) = Pr[Y ≤ z|Y > 0] =
Pr[Y > 0]
(
0, si z ≤ κ,
= FX (z)−FX (κ)
1−FX (κ) , si z > κ.

La plupart du temps, les statistiques disponibles concernent les paie-


ments Z et pas les coûts effectifs des sinistres X. En effet, les com-
pagnies enregistrent les montants payés en exécution des contrats,
et ne gardent souvent pas la trace du coût réel des sinistres.

2.9.4 Plafond d’indemnisation


Beaucoup de polices prévoient une limite supérieure pour le mon-
tant de l’indemnité que l’assureur pourrait être amené à verser en
exécution du contrat. Si on note ω le plafond d’indemnisation, la
somme Y que recevra l’assuré suite à un préjudice de montant X
sera 
X, si X ≤ ω,
Y = min{X,ω} =
ω, si X > ω.
Dès lors, la fonction de répartition F Y de Y s’exprime comme suit:

FX (y), si y < ω,
FY (y) =
1, si y ≥ ω.
2.9. Transformations des risques et clauses
conventionnelles relatives aux dommages 99

On voit donc apparaı̂tre un point massique en ω où se concentrent


tous les sinistres de montant supérieur au plafond d’indemnisation
ω.

2.9.5 Conséquence technique: la censure

Les clauses conventionnelles examinées ci-dessus ont des conséquences


importantes pour l’actuaire. En effet, seul le montant X du préjudice
subi par l’assuré lui importe, alors qu’il ne dispose bien souvent que
des montants Z versés par l’assureur à titre d’indemnité. La connais-
sance des montants payés par une compagnie d’assurance qui a in-
troduit des clauses limitant son intervention dans les conditions de
ses polices n’est pas équivalente à la connaissance des montants de
sinistre eux-mêmes. Il s’agit d’un phénomène de censure dont l’ac-
tuaire devra tenir compte lorsqu’une modification des conditions
générales des polices est à l’étude.

2.9.6 Loi de Poisson et clauses relatives aux dom-


mages

La loi de Poisson possède la propriété suivante, qui rend son


usage très aisé lorsque la police prévoit une franchise ou un découvert
obligatoire.

Proposition 2.9.1. Soit N ∼ Poi(λ) le nombre de sinistres tou-


chant une compagnie d’assurance durant une période de référence.
Supposons que ces sinistres se répartissent en m catégories, avec
les probabilités q1 ,q2 , . . . ,qm , respectivement (selon un schéma mul-
tinomial), et que Ni désigne le nombre de sinistres de type i, i =
1,2, . . . ,m. Les variables aléatoires N 1 ,N2 , . . . ,Nm sont des variables
aléatoires indépendantes, de loi de Poisson de paramètres respectifs
λq1 , λq2 , . . ., λqm .

Démonstration. Remarquons tout d’abord que conditionnellement


100 Chapitre 2. Modélisation actuarielle des risques

à N = n, Ni ∼ Bin(n,qi ). Ceci nous permet d’écrire


+∞
X
Pr[Ni = k] = Pr[Ni = k|N = n] Pr[N = n]
n=k
+∞ 
X 
n λn
= qik (1 − qi )n−k exp(−λ)
k n!
n=k
+∞
(λqi )k X 1
= exp(−λ) (1 − qi )n−k λn−k
k! (n − k)!
n=k
| {z }
=exp(λ(1−qi ))

(λqi )k
= exp(−λqi ) ,
k!
ce qui montre bien que Ni ∼ Poi(λqi ). Pour montrer l’indépendance
des Ni , il suffit d’écrire

Pr[N1 = k1 , . . . ,Nm = km ] = Pr[N1 = k1 , . . . ,Nm = km |N = k1 + . . . + km ]


λk1 +...+km
exp(−λ)
(k1 + . . . + km )!
(k1 + . . . + km )!
= (q1 )k1 . . . (qm )km
k1 ! . . . k m !
λk1 +...+km
exp(−λ)
(k1 + . . . + km )!
Ym
(λqj )kj
= exp(−λqj ) .
kj !
j=1

Exemple 2.9.2. Supposons qu’une compagnie d’assurance commer-


cialise des polices prévoyant une franchise (ou un découvert obliga-
toire) de montant κ. Apparaissent ainsi deux types de sinistres: ceux
dont le montant est inférieur à κ (et qui ne sont donc pas déclarés
à l’assureur) et ceux dont le montant est supérieur à κ (et qui sont
déclarés et indemnisés par l’assureur). Si N ∼ Poi(λ) est le nombre
de sinistres relatif à une police, et s’il y a indépendance entre le
nombre et le coût des sinistres, eux-mêmes indépendants et de même
loi, le nombre Nκ de sinistres déclarés par police est toujours de loi
de Poisson, de moyenne λq où q est la probabilité que le montant
d’un sinistre dépasse κ.
Remarque 2.9.3. Dans le cas, souvent rencontré en pratique (éventuellement
après discrétisation) où les montants des sinistres X 1 ,X2 ,X3 , . . . ne
2.9. Transformations des risques et clauses
conventionnelles relatives aux dommages 101

prennent qu’un nombre fini de valeurs distinctes {v 1 ,v2 , . . . ,vp } di-


sons, la Propriété 2.9.1 fournit la représentation suivante de S ∼
CPoi(λ,F ):
S = v 1 N1 + v 2 N2 + . . . + v p Np ,

où les variables aléatoires N1 ,N2 , . . . ,Np sont indépendantes et de


lois de Poisson de paramètres respectifs λ Pr[X = v 1 ],λ Pr[X =
v2 ], . . . ,λ Pr[X = vp ].

2.9.7 Effets pervers des clauses conventionnelles rela-


tives au dommage

Pour terminer, notons que les clauses conventionnelles examinées


dans cette section ont parfois une influence sur les montants des si-
nistres déclarés aux compagnies, voire sur la déclaration des sinistres
elle-même. Ainsi, lorsqu’une police prévoit un découvert obligatoire
de montant δ, ceci aura pour effet de diminuer les déclarations
de sinistre dont le montant n’est que légèrement supérieur à δ;
l’assuré préfère souvent y mettre de sa poche plutôt que de ne
récupérer que quelques euros au prix de tracasseries administratives
et de subir éventuellement une majoration des primes futures (lors-
qu’un mécanisme de type bonus-malus est prévu dans les conditions
générales). D’autre part, lorsqu’une franchise est prévue, le mon-
tant déclaré du sinistre est parfois “gonflé”, de manière à dépasser
le montant de la franchise et à ouvrir ainsi le droit à l’indemnisation.
Dès lors, il n’est pas rare d’observer une concentration anormale de
montants de sinistre légèrement supérieurs au montant de la fran-
chise.
De plus, les franchises et découverts obligatoires sont difficile-
ment applicables dans les assurances de responsabilité. Ainsi en RC
automobile, l’assureur du conducteur responsable devra indemniser
entièrement la victime pour son préjudice (la clause de franchise
n’étant pas opposable au tiers lésé), et devra ensuite récupérer la
franchise ou le découvert obligatoire auprès de son assuré. Le recou-
vrement de cette somme étant souvent fort compliqué, les assureurs
de responsabilité n’ont que rarement recours à ce type de clause.
Les franchises et découverts obligatoires sont par contre très
appréciés lorsque l’assureur peut les déduire de l’indemnité qu’il
verse à l’assuré (comme en assurance dégâts matériels aux véhicules
ou en assurance incendie, par exemple).
102 Chapitre 2. Modélisation actuarielle des risques

2.10 Exercices
Exercice 2.10.1 (Lois de Pareto et log-exponentielle). Si X ∼
Par(α,θ), montrez que
 
X
ln 1 + ∼ Exp(α).
θ

Exercice 2.10.2 (Loi logistique bivariée). La loi logistique uni-


variée admet pour fonction de répartition
1
FX (x) =
1 + exp(−x)

pour x ∈ IR, et vérifie fX (x) = FX (x) (1 − FX (x)). Une version


bivariée de cette loi introduite par Gumbel admet pour fonction de
répartition jointe
1
FX (x1 ,x2 ) = pour x ∈ IR2 .
1 + exp(−x1 ) + exp(−x2 )
Montrez que
(i) la probabilité que X1 et X2 soient de signe opposé vaut 1/3.
(ii) la densité conditionelle de X1 sachant X2 = x2 vaut
2
2 exp(−x1 ) 1 − exp(−x2 )
f1|2 (x1 |x2 ) = 3 .
1 + exp(−x1 ) + exp(−x2 )

Exercice 2.10.3 (Convolution de lois uniformes). Soient U 1 ,U2 , . . .


une suite de variables aléatoires indépendantes de loi Uni(0,1).
1. Quelle est la fonction de répartition de X 1 + X2 ?
2. Montrez que
n−1  
1 X n
Pr[X1 +. . .+Xn ≤ x] = (−1)k (x−k)n+ , 0 ≤ x ≤ n,
n! k
k=0

où (x − k)+ = 0 si x < k et x − k sinon.


3. Déduisez du point 2 que la densité de probabilité de X 1 + . . . +
Xn est donnée pour x ∈ [0,n] par
j
X  
1 k n
(−1) (x − k)n−1
(n − 1)! k
k=0

pour j ≤ x ≤ j + 1 et j = 0,1, . . . ,n − 1.
2.10. Exercices 103

(n) 1 Pn
4. Déduisez du point 3 que la densité de X = n i=1 Xi est
donnée pour 0 ≤ x ≤ 1 par
[xn]   
nn X k n k n−1
(−1) x− .
(n − 1)! k n
k=0

Exercice 2.10.4 (Distance en variation totale). Une manière


d’évaluer la similarité entre les lois de probabilité de deux variables
aléatoires de comptage M et N consiste à calculer la distance qui les
sépare. De nombreuses définitions de distances entre lois de proba-
bilité existent, parmi lesquelles la distance en variation totale, notée
dT V , définie par
+∞
X
dT V (M,N ) = | Pr[M = k] − Pr[N = k]|.
k=0

Soient I ∼ Ber(q) et N ∼ Poi(λ) avec λ ≤ q. Montrez que

dT V (N,I) = 2{q − λ exp(−λ)}

et que cette distance est minimale pour λ = q.


Exercice 2.10.5 (Découvert obligatoire proportionnel). Un
découvert obligatoire proportionnel laisse en toute hypothèse une
portion de 100α% du montant de sinistre à charge de l’assuré, 0 ≤
α ≤ 1. Ce type de clause est souvent utilisé lorsque le comporte-
ment de l’assuré peut influencer le montant total du sinistre. Il en
est ainsi par exemple en assurance hospitalisation: certaines compa-
gnies laissent 20% du total des frais médicaux à charge de l’assuré,
afin de l’encourager à réduire ses séjours à l’hôpital au strict mini-
mum. Quelle est la fonction de répartition du montant payé par la
compagnie en exécution d’un tel contrat?
Exercice 2.10.6. On suppose que les coûts de sinistre C 1 ,C2 , . . .
sont indépendants de loi Exp(α) et on pose S n = C1 + ... + Cn .
(i) Montrez que les fonctions de répartition de S n et de Sn+1 sont
liées par

FSn +1 (x)
Z +∞
= FSn (x − t) dF (t)
0
 
Z +∞ n−1
X [α (x − t)]j
= 1 − exp (−α (x − t)) α exp (−αt) dt
0 j!
j=0
104 Chapitre 2. Modélisation actuarielle des risques

(ii) Déduisez-en que


n−1
X [αx]j
FSn (x) = 1 − exp (−αx) .
j!
j=0

(iii) En notant p (j) =P Pr[N > j], montrez que la fonction de


répartition de S = Nk=1 Ck s’écrit


X [αx]j
FS (x) = 1 − exp (−αx) p (j) .
j!
j=0

Exercice 2.10.7 (Loi exponentielle bivariée de Marshall &


Olkin). Considérons les variables aléatoires indépendantes Y 1 , Y2
et Z. Notons H1 et H2 les fonctions de répartition de Y1 et Y2 , et
supposons Z ∼ Exp(θ). Définissons à présent

X1 = min{Y1 ,Z},
X2 = min{Y2 ,Z}.

(i) Montrez que les fonctions de répartition de X 1 et de X2 sont


données par

FXj (xj ) = 1 − exp(−θxj )H j (xj ),

pour j = 1,2.
(ii) Montrez que la fonction de répartition jointe de X est donnée
par

FX (x) = FX1 (x1 ) + FX2 (x2 ) − 1


+ exp(θ max{x1 ,x2 })F X1 (x1 )F X2 (x2 ).(2.15)

Exercice 2.10.8 (Loi de Pareto bivariée). Supposons que condi-


tionnellement à Θ, les variables aléatoires X 1 et X2 sont indépendantes
et de loi Exp(θ). Si Θ ∼ Gam(α,λ), montrez que

FX (x) = FX1 (x1 ) + FX2 (x2 ) − 1


n −1/α −1/α o−α
+ F X1 (x1 ) F X2 (x2 ) −1 .(2.16)

2.11 Notes bibliographiques


Parmi les références (en français) sur les calculs de probabilité, le
lecteur pourra consulter Foata & Fuchs (1998, 2002). En anglais,
2.11. Notes bibliographiques 105

les deux tomes de Feller (1950) constituent encore et toujours des


ouvrages de premier choix sur le calcul des probabilités. L’ouvrage
de Chow & Teicher (1997) offre une introduction technique de
qualité au sujet.
Pour plus de détails à propos des modèles paramétriques présentés
dans ce chapitre, le lecteur pourra consulter Johnson, Kotz &
Kemp (1992) pour les modèles de comptage univariés, et Johnson,
Kotz & Balakrishnan (1996b) pour les modèles de comptage
multivariés. Pour les modèles continus, le lecteur pourra se référer
à Johnson, Kotz & Balakrishnan (1996c) pour les lois uni-
variées, et à Johnson, Kotz & Balakrishnan (1996a) pour les
lois continues multivariées. Pour une présentation plus actuarielle
de ces modèles paramétriques, voyez Klugman, Panjer & Will-
mot (1998). Au nombre des ouvrages classiques consacrés aux lois
multivariées, épinglons Mardia (1970), Hutchinson & Lai (1991)
et Joe (1997).
106 Chapitre 2. Modélisation actuarielle des risques
Chapitre 3

La prime pure

3.1 Introduction
La prime pure est le prix du risque: il s’agit du montant dont
doit disposer l’assureur pour dédommager (en moyenne) les assurés
suite aux sinistres survenus, sans excédent, ni déficit. La totalité
des primes pures relatives au portefeuille doit donc mettre l’assu-
reur en mesure de remplir ses obligations de garantie. Si l’assu-
reur désire se réserver des bénéfices (par exemple pour rémunérer
son actionnariat ou augmenter ses fonds propres), ceux-ci seront ra-
joutés ultérieurement. On s’attend donc à ce que la prime pure soit
entièrement consommée pour dédommager les sinistres qui touchent
les assurés: la totalité de l’encaissement pur sera donc retournée aux
assurés sous forme d’indemnité.
La prime pure est calculée en prenant en considération différents
éléments: probabilité de survenance ou fréquence des sinistres, étendue
des préjudices, somme assurée, etc. Dans cet ouvrage, nous nous
concentrons sur des produits d’assurance dont les risques sont à
court terme et à fort aléa. Ceci nous conduit à ne pas modéliser
explicitement les produits financiers, simplification qui ne prête pas
à conséquence. Ceci contraste singulièrement avec l’actuariat à long
terme et à faible aléa qui caractérise les produits d’assurance sur
la vie. Dans ce cas, la modélisation explicite des produits financiers
est essentielle. En assurance non-vie, le fait de négliger les produits
financiers fournit à l’actuaire une marge de sécurité implicite.
Le concept central justifiant l’existence d’un marché de l’as-
surance est celui de l’aversion pour le risque, ou “risquophobie”.
Il s’agit de l’attitude naturelle des agents économiques à éviter le
risque, et à se protéger des conséquences négatives des événements

107
108 Chapitre 3. La prime pure

imprévisibles. Bien entendu, tous ne partagent pas ce sentiment, et


ceux qui le partagent ne l’ont pas tous avec la même ampleur.
La formalisation du concept de risquophobie est assez difficile,
en raison de la diversité des comportements humains. Le concept
de prime pure qui sera développé dans ce chapitre permet cepen-
dant d’objectiver l’aversion au risque: un agent économique sera
désormais réputé riscophobe lorsqu’il transfère tous ses risques à
un assureur qui lui réclame la prime pure. Comme nous le verrons
dans le chapitre suivant, l’assureur est obligé de réclamer à l’assuré
une prime (parfois largement) supérieure à la prime pure, ce qui
expliquera un transfert partiel des risques, même par des individus
risquophobes.
Remarque 3.1.1. Un agent économique est donc réputé risquo-
phobe lorsqu’ayant à choisir entre un flux financier aléatoire et un
flux déterministe de même moyenne, il préférera toujours ce der-
nier. Ainsi, un tel décideur préférera toujours recevoir 1e au gain
résultant d’un jeu de pile ou face où il gagnerait 2e si pile est
obtenu, et rien sinon. Cette formalisation de l’aversion au risque
présente certes l’avantage de l’objectivité et de la simplicité, mais
manque malheureusement cruellement de subtilité. En effet, de nom-
breux agents économiques rationnels (c’est-à-dire ayant une percep-
tion correcte des risques auxquels ils sont soumis et se protégeant
en conséquence) achètent des billets de loterie (c’est-à-dire rem-
placent un montant déterministe, le prix du billet de loterie, par un
gain aléatoire en moyenne inférieur). Ainsi, certains de nos lecteurs
pourraient accepter de jouer à pile ou face comme décrit plus haut,
même s’ils sont convaincus de l’utilité des contrats d’assurance. Il
n’est donc pas rare qu’un individu ne présente de l’aversion pour
le risque qu’au-delà d’un certain seuil financier, et se permette oc-
casionnellement en-deçà un comportement non rationnel. Si, dans
l’exemple ci-dessus, on met en jeu 1 000 000e , la plupart des lec-
teurs préféreront sans doute conserver ce million plutôt que le ris-
quer à pile ou face.

3.2 La prime pure et l’espérance mathématique


3.2.1 Espérance mathématique
Espérance dans le cas discret
A chaque variable aléatoire, on associe une caractéristique im-
portante, appelée moyenne, ou valeur espérée. Il s’agit d’une formali-
3.2. La prime pure et l’espérance mathématique 109

sation probabiliste du concept bien connu de moyenne arithmétique


(version empirique). Pour une variable de comptage N , l’espérance
est définie par X
E[N ] = j Pr[N = j]. (3.1)
j∈IN
Il s’agit donc d’une moyenne des valeurs j possibles pour N , pondérée
par la probabilité que la variable N prenne ces valeurs.
Exemple 3.2.1 (Moyenne de la loi Binomiale). Lorsque N ∼
Bin(m,q), nous avons
m
X m!
E[N ] = q k (1 − q)m−k
(k − 1)!(m − k)!
k=1
m
X
= mq Pr[Bin(m − 1,q) = k − 1] = mq.
k=1
Exemple 3.2.2 (Moyenne de la loi de Poisson). Lorsque N ∼
Poi(λ), nous avons
+∞
X λk
E[N ] = k exp(−λ)
k!
k=1
+∞ k+1
X λ
= exp(−λ) = λ.
k!
k=0

Espérance dans le cas continu


Si X est continue et admet fX comme densité de probabilité, la
moyenne est définie par
Z
E[X] = xfX (x)dx, (3.2)
x∈IR
qui peut se voir comme un analogue continu de la formule (3.1) rete-
nue dans le cas discret. S’agissant d’une intégrale, on voit clairement
que quels que soient les réels a et b,
E[aX + b] = aE[X] + b;
on dit que l’espérance mathématique est un opérateur linéaire.
Exemple 3.2.3 (Moyenne de la loi normale). Considérons Z ∼
N or(0,1). La moyenne de Z est alors donnée par
Z +∞
1
E[Z] = √ x exp(−x2 /2)dx
2π −∞
1 h i+∞
= √ exp(−x2 /2) = 0.
2π −∞
110 Chapitre 3. La prime pure

Passons à présent à X ∼ N or(µ,σ 2 ). Come X =loi µ + σZ, nous


pouvons écrire
E[X] = E[µ + σZ] = µ
de sorte que le premier paramètre de la loi normale est sa moyenne.
Exemple 3.2.4 (Moyenne de la loi Gamma). Lorsque X ∼
Gam(α,τ ), la moyenne vaut
Z +∞
1
E[X] = xα τ α exp(−xτ )dx
Γ(α) 0
Γ(α + 1) α
= = .
τ Γ(α) τ

Espérance et intégrale de Lebesgue Stieltjes


Afin d’unifier (3.1) et (3.2), mais aussi pour pouvoir traiter des
variables qui ne sont ni discrètes ni continues, nous utiliserons le
formalisme de Lebesgue-Stieltjes. Ce formalisme permet d’unifier et
de généraliser les expressions (3.1) et (3.2) données plus haut en
Z
E[X] = xdFX (x) (3.3)
x∈IR

où dFX est la différentielle de la fonction de répartition F X . Nous


donnons ci-après le cas le plus courant pour l’actuaire (sans aborder
le traitement général de cet outil mathématique).
Comme la fonction de répartition F X de X est bornée et non-
décroissante, elle ne peut avoir au plus qu’un nombre fini ou infini
dénombrable de points de discontinuité. Notons {d 1 ,d2 , . . .} l’en-
semble de ces points et définissons
(d)
X
FX (t) = {FX (dn ) − FX (dn −)}
dn ≤t
X
= Pr[X = dn ]
dn ≤t

et
(c) (d)
FX (t) = FX (t) − FX (t)

les composantes discrète et continue de F X . Le plus souvent en


(c)
sciences actuarielles, FX peut se représenter comme
Z
(c) (c)
FX (t) = fX (x)dx,
x≤t
3.2. La prime pure et l’espérance mathématique 111

de sorte que la moyenne de X est définie comme suit (en appliquant


(d) (c)
un raisonnement semblable à (3.1) pour F X et à (3.2) pour FX ):
Z
E[X] = xdFX (x)
x∈IR
X
= dn {FX (dn ) − FX (dn −)}
n≥1
Z
(c)
+ xfX (x)dx. (3.4)
x∈IR

On voit ainsi que les points massiques d 1 ,d2 , . . . contribuent à E[X]


par l’intermédiaire de la première somme, alors que le reste de la
droite réelle contribue à E[X] par l’intermédiaire de la deuxième
somme. La différentielle dFX qui vaut dans l’exemple ci-dessus
(
FX (dn ) − FX (dn −), si x = dn ,
dFX (x) = (c)
fX (x), sinon,

peut donc s’interprèter comme la chance que l’événement {X = x}


se produise (notez que dFX (x) n’est une probabilité que lorsque
x = dn , auquel cas elle vaut Pr[X = dn ]).
Exemple 3.2.5. Considérons la variable aléatoire

0, avec la probabilité p,
S=
Z, avec la probabilité 1 − p,

où Z ∼ Gam(α,τ ). Ce type de construction est largement utilisé


en assurance non-vie. Ainsi, S représente le coût total des sinistres
occasionnés par une police du portefeuille, alors que Z désigne le
coût des sinistres, lorsqu’il y en a eu.
On peut décomposer la fonction de répartition F S de S en une
composante discrète

(d) 0, si s < 0,
FS (s) =
p, si s ≥ 0,

(c)
et une composante continue FS valant 1 − p fois la fonction de
répartition associée à la la loi Gam(α,τ ). L’espérance de S vaut
alors en vertu de (3.4)
α α
E[S] = 0 × p + (1 − p) × = (1 − p) .
τ τ
112 Chapitre 3. La prime pure

R
Réclamer une prime pure de montant xdFX (x) devrait (en
moyenne) mettre l’assureur en mesure de dédommager le montant
des sinistres, sans excédent, ni déficit. En effet, on pondère chaque
montant possible de sinistre x par sa “chance” dF X (x), avant de
“sommer” sur toutes ces valeurs (l’intégrale peut se voir comme une
somme sur une infinité non dénombrable de termes). Ceci revient
à souscrire une série de polices d’assurance garantissant chacune le
paiement de xe lorsque l’événement {X = x} se réalise.
Il s’agit donc d’une définition raisonnable de la prime pure. Nous
reviendrons plus longuement dans la suite de ce chapitre sur les liens
entre espérance mathématique et prime pure.
Remarque 3.2.6. Il est bon à ce stade d’insister sur le fait que
l’espérance mathématique peut très bien être infinie. En effet, considérons
pour s’en convaincre X ∼ Par(α,θ). Nous avons alors si α > 1,
Z +∞
αθ α
E[X] = x dx
x=0 (x + θ)α+1
 +∞ Z +∞
xθ α θα θ
= − α
+ α
dx = .
(x + θ) x=0 x=0 (x + θ) α−1

Par contre, si α < 1, E[X] = +∞.

Linéarité de l’espérance
S’agissant de sommes ou d’intégrales, l’espérance mathématique
est linéaire, c’est-à-dire que quelles que soient les variables aléatoires
X1 et X2 , et les constantes réelles c0 , c1 et c2 , l’égalité

E[c0 + c1 X1 + c2 X2 ] = c0 + c1 E[X1 ] + c2 E[X2 ]

est toujours valable.

Représentations alternatives de l’espérance mathématique


L’espérance mathématique définie plus haut selon la formule
(3.3) peut se calculer de bien d’autres manières. Nous en détaillons
ici quelques expressions alternatives.
Propriété 3.2.7. Soit X une variable aléatoire positive, continue,
de fonction de répartition FX . L’espérance mathématique de X peut
se mettre sous la forme
Z
E[X] = F X (x)dx.
x∈IR+
3.2. La prime pure et l’espérance mathématique 113

Démonstration. Pour se convaincre de la véracité du résultat, il suf-


fit d’écrire
Z Z +∞ Z t
E[X] = tdFX (t) = dxdFX (t)
t∈IR+ t=0 x=0
Z +∞ Z +∞ Z
= dFX (t)dx = F X (x)dx.
x=0 t=x x∈IR+

Ainsi, l’espérance mathématique d’une variable aléatoire dont le


support est borné inférieurement peut s’exprimer comme l’intégrale
de la fonction de queue. On sent dès lors bien que c’est la vitesse
de décroissance vers 0 de la fonction de queue qui rend l’espérance
infinie, et donc le risque inassurable.
Exemple 3.2.8 (Moyenne de la loi exponentielle négative).
Lorsque X ∼ Exp(θ), la Propriété 3.2.7 donne
Z +∞
1
E[X] = exp(−θx)dx = .
x=0 θ

Passons à présent à des variables de comptage et établissons un


résultat semblable à celui de la Propriété 3.2.7.
Propriété 3.2.9. Soit N une variable aléatoire de comptage. L’espérance
mathématique de N peut se mettre sous la forme
+∞
X
E[N ] = Pr[N > k]
k=0

Démonstration. Comme la variable aléatoire N est à valeurs dans


IN, on a

E[N ] = Pr[N = 1] + 2 Pr[N = 2] + 3 Pr[N = 3] + . . .


= Pr[N = 1] + Pr[N = 2] + Pr[N = 3] + . . .
Pr[N = 2] + Pr[N = 3] + . . .
Pr[N = 3] + . . .
= Pr[N ≥ 1] + Pr[N ≥ 2] + Pr[N ≥ 3] + . . .
+∞
X +∞
X
= Pr[N ≥ k] = Pr[N > k].
k=1 k=0
114 Chapitre 3. La prime pure

Exemple 3.2.10 (Moyenne de la loi uniforme discrète). Lorsque


N ∼ DUni(n), on a
n−1
X n−k n
E[N ] = = .
n+1 2
k=0

Moyennes des lois usuelles


Les moyennes associées aux lois usuelles sont reprises au Tableau
3.1.

Loi de probabilité Espérance Loi de probabilité Espérance


n
DUni(n) 2 N or(µ,σ 2 ) µ
2
Ber(q) q LN or(µ,σ 2 ) exp(µ + σ2 )
Bin(m,q) mq Exp(θ) 1/θ
1−q α
Geo(q) q Gam(α,τ ) τ
α(1−q) θ
N Bin(α,q) q Par(α,θ) α−1 si α > 1
α
Poi(λ) λ Bet(α,β) α+β
a+b
Uni(a,b) 2

Tab. 3.1 – Espérance mathématique des lois de probabilité usuelles.

Moyenne des lois composées


PN
Considérons S de la forme (2.14), i.e. S = i=1 Xi avec Xi ,
i = 1,2, . . . indépendantes et de même loi, indépendantes de N . Nous
voudrions connaı̂tre la charge moyenne des sinistres sur l’année.
Celle-ci est donnée par la propriété suivante.
Propriété 3.2.11. Pour S de la forme (2.14), E[S] = E[N ]E[X 1 ].

Démonstration. Il suffit d’écrire


+∞
" k
#
X X
E[S] = Pr[N = k]E Xi
k=1 i=1
+∞
!
X
= Pr[N = k]k E[X1 ] = E[N ]E[X1 ].
k=1

Cette formule classique se lit

charge totale moyenne des sinistres = nombre moyen x coût moyen.


3.2. La prime pure et l’espérance mathématique 115

Elle ne doit pas faire oublier les conditions sous lesquelles elle est
valable, à savoir l’indépendance entre les coûts et les nombres des
sinistres, et l’indépendance et l’identique distribution des coûts.
Exemple 3.2.12 (Moyenne des lois binomiale et de Poisson
composées). En se rapportant au Tableau 3.1, on voit facilement
que si N ∼ Bin(m,q) alors E[S] = mqE[X 1 ] et si N ∼ Poi(λ) alors
E[S] = λE[X1 ].

Espérance d’une fonction


Ayant une variable aléatoire X et une fonction g : IR → IR
continue ou monotone (ces conditions garantissant que g(X) est
toujours une variable aléatoire), on peut s’intéresser à la nouvelle
variable aléatoire g(X) et parler de l’espérance de cette variable,
notée E[g(X)]. Cette dernière est donnée par
Z
E[g(X)] = g(x)dFX (x)
x∈IR
X Z
(c)
= g(dn ){FX (dn ) − FX (dn −)} + g(x)fX (x)dx
n≥1 x∈IR

dans les notations de (3.4).

Espérance de produits et produits d’espérance


Ayant un vecteur aléatoire X et une fonction g : IR n → IR,
on peut considérer la variable aléatoire g(X). On peut alors définir
l’espérance mathématique de cette variable comme
Z
E[g(X)] = g(x)dFX (x),
x∈IRn

où la différentielle se définit de manière analogue au cas unidimen-


sionnel.
Propriété 3.2.13. Si X1 ,X2 , . . . ,Xn sont indépendantes alors quelles
que soient les fonctions g1 ,g2 , . . . ,gn : IR → IR,
"n # n
Y Y
E gi (Xi ) = E[gi (Xi )].
i=1 i=1

Démonstration. Si X1 ,X2 , . . . ,Xn sont des variables aléatoires indépendantes,


alors
Yn
dFX (x) = dFXi (xi )
i=1
116 Chapitre 3. La prime pure

et on voit facilement que

E[g1 (X1 )g2 (X2 ) . . . gn (Xn )] = E[g1 (X1 )]E[g2 (X2 )] . . . E[gn (Xn )]

comme annnoncé.

L’espérance du produit coı̈ncide donc avec le produit des espérances


lorsque les variables aléatoires sont indépendantes.

3.2.2 Probabilités et espérances d’indicatrices


Considérons la fonction indicatrice de la demi-droite (−∞,t],
donnée par 
1, si x ≤ t,
g(x) = I[x ≤ t] =
0, sinon.
La variable aléatoire

1, si X ≤ t,
I[X ≤ t] =
0, sinon,

indique donc si X prend une valeur inférieure ou égale à t (on l’ap-


pelle indicatrice de l’événement {X ≤ t}). Clairement, I[X ≤ t] ∼
Ber(FX (t)), de sorte qu’en vertu du Tableau 3.1,
 
E I[X ≤ t] = FX (t).

L’espérance d’une variable indicatrice coı̈ncide donc avec la proba-


bilité de réalisation de l’événement associé. Ceci illustre les liens
étroits que nouent espérance mathématique et probabilité (et ex-
plique pourquoi certains ouvrages présentent toute la théorie des
probabilités à partir de l’espérance mathématique).

3.2.3 Détermination de la prime pure


Notons S la charge totale des sinistres relative à une police
déterminée au cours d’une période d’assurance. Pour être précis, S
représente ici le risque effectivement transféré à l’assureur, après ap-
plication des clauses conventionnelles relatives aux dommages (fran-
chise, découvert obligatoire ou plafond), et ne coı̈ncide donc peut-
être pas avec le préjudice que subit le patrimoine de l’assuré. Clas-
siquement, le rôle de l’assurance est de substituer une constante c
(la prime d’assurance) à la variable aléatoire S. Une manière raison-
nable de déterminer c serait de choisir la constante “la plus proche”
3.2. La prime pure et l’espérance mathématique 117

de la variable aléatoire S. La distance utilisée pour mesurer la proxi-


mité entre S et c doit tenir compte du fait que c doit mettre l’assu-
reur en mesure de dédommager les sinistres, sans excédent, ni déficit.
Ainsi, la distance doit pénaliser aussi bien les cas où c est inférieure
à S que ceux où c est supérieure à S. Une distance pénalisant toute
sur- ou sous-évaluation de la prime est l’écart quadratique moyen

d2 (S,c) = E[(S − c)2 ].

Maintenant que nous nous sommes donnés une mesure d 2 de


proximité, tentons de trouver la constante c la plus proche de S,
c’est-à-dire la valeur de c qui minimise d 2 (S,c). Dans ce but, écrivons

E[(S − c)2 ] = E[(S − E[S] + E[S] − c)2 ]


= E[(S − E[S])2 ] + 2(E[S] − c) E[S − E[S]] +(E[S] − c)2
| {z }
=0
2
= (E[S] − c) + constante par rapport à c

d’où l’on déduit que la valeur de c minimisant E[(S −c) 2 ] n’est autre
que E[S]. Ainsi, E[S] est la constante la plus proche de S (au sens
de la distance d2 que nous avons introduite plus haut). Si on désire
substituer une constante à S, un choix naturel est donc E[S].

3.2.4 Ecart quadratique moyen, un must?


La distance d2 utilisée ci-dessus n’est bien entendu pas la seule
possible, loin s’en faut. Tout distance s’exprimant comme E[g(S −c)]
où g est non-négative, convexe, symétrique et telle que g(0) = 0 est
un candidat valable. En effet, ces caractéristiques garantissent que
la prime pure obtenue en minimisant cette distance sera “la plus
proche de” S. Ainsi, on pourrait fort bien considérer l’écart moyen
absolu
d1 (S,c) = E[|S − c|].
Calculons dans ce cas la constante c minimisant d 1 (S,c). Pour ce
faire, écrivons
Z Z
d1 (S,c) = (c − s)dFS (s) + (s − c)dFS (s)
s≤c s>c

puis intégrons par parties pour obtenir


Z Z
d1 (S,c) = FS (s)ds + F S (s)ds.
s≤c s>c
118 Chapitre 3. La prime pure

En annulant la dérivée première de d 1 (S,c) par rapport à c, nous


obtenons
1
FS (c) − F S (c) = 0 ⇔ FS (c) = ,
2
d’où l’on tire que la constante minimisant d 1 (S,c) est la médiane
q1/2 .
Tarifer sur base de la médiane revient à réclamer à chaque assuré
une somme telle que les montants déboursés par la compagnie pour
la moitié d’entre eux soient inférieurs à celle-ci, alors que les mon-
tants déboursés pour l’autre moitié seront supérieurs à celle-ci. Si la
loi du montant de sinistre est symétrique, moyenne et médiane sont
confondues. Dans le domaine de l’assurance, la règle est cependant
l’asymétrie et la médiane se situe toujours bien avant la moyenne.
Expliquons pourquoi la médiane n’est souvent pas un bon candi-
dat pour calculer la prime. Prenons l’assurance automobile. Chaque
année, environ 90% des assurés ne causent aucun accident et n’oc-
casionnent donc aucune dépense à la compagnie. Par conséquent,
q1/2 = 0. On conçoit cependant mal que l’assureur offre gratuite-
ment sa couverture.

3.3 Variance
3.3.1 Définition
La variance mesure la dispersion des valeurs possibles pour une
variable aléatoire autour de la moyenne. Elle est définie comme suit.
Définition 3.3.1. La variance de la variable aléatoire X, notée
V[X], est le second moment de cette variable centrée, i.e.

V[X] = E[(X − E[X])2 ].

Il s’agit donc d’une moyenne des écarts x−E[X] entre la réalisation


x de X et sa valeur espérée E[X], élevés au carré. On peut encore
exprimer la variance de X sous la forme
 
V[X] = E X 2 − 2E[X]X + {E[X]}2
= E[X 2 ] − {E[X]}2 .

Ainsi, la variance de X est l’espérance du carré de cette variable,


dont on retranche le carré de l’espérance.
3.3. Variance 119

Dans la suite, nous utiliserons beaucoup l’écart-type des va-


riables aléatoires en présence, dont nous rappelons la définition ci-
après.
Définition 3.3.2. On appelle écart-type la racine carrée positive de
la variance.

3.3.2 Interprétation actuarielle


Notez que la variance jouit d’une interprétation claire en terme
de la distance d2 introduite plus haut pour déterminer la prime pure
relative à un risque S, puisque d2 (S,E[S]) = V[S]. La variance prend
donc ici toute son importance car elle mesure la distance séparant
les dépenses aléatoires S de l’assureur de la prime pure E[S] qu’il
réclamera à l’assuré. Il s’agit donc d’une mesure du risque que prend
l’assureur en remplaçant S par E[S] (au sens de la distance d 2 ).

3.3.3 Quelques exemples


L’importance de la variance en probabilité et en statistique pro-
vient également du rôle particulier que joue celle-ci pour la loi nor-
male.
Exemple 3.3.3 (Variance associée à la loi Normale centrée
et réduite). Partons de Z ∼ N or(0,1). Comme E[Z] = 0,
Z +∞
1
V[Z] = E[Z 2 ] = √ x2 exp(−x2 /2)dx
2π −∞

qui donne en intégrant par parties

1 h i+∞
V[Z] = − √ x exp(−x2 /2)
2π −∞
Z +∞
1
+√ exp(−x2 /2)dx = 1.
2π −∞

Exemple 3.3.4 (Variance associée à la loi de Poisson). Lorsque


N ∼ Poi(λ),

+∞
X
2 λk
E[N ] = k 2 exp(−λ)
k!
k=1
+∞
X λk+1
= exp(−λ) (k + 1) = λ + λ2 ,
k!
k=0
120 Chapitre 3. La prime pure

de sorte que
V[N ] = E[N 2 ] − λ2 = λ.
En revenant à l’Exemple 3.2.2, on constate donc que la loi de Pois-
son se distingue par le fait que
E[N ] = V[N ] = λ,
traduisant ainsi une équidispersion et réduisant de fait son domaine
d’application, la moyenne et la variance échantillon étant souvent
fort différentes.
Remarque 3.3.5. Toutes les variables aléatoires ne possèdent pas
de variance finie. Il peut arriver qu’une variable possède une moyenne
finie (ce qui veut dire que le risque est assurable pour un actuaire),
mais une variance infinie, traduisant par là un très grand danger
pour l’assureur. C’est par exemple le cas des lois de Pareto dont
l’indice de queue est compris entre 1 et 2. En effet, considérons
X ∼ Par(α,θ) et α > 2. On a alors
Z +∞
2 αθ α
E[X ] = x2 dx
x=0 (x + θ)α+1
 2 α +∞ Z +∞
x θ θα
= − + 2x dx
(x + θ)α x=0 x=0 (x + θ)α
 +∞
2xθ α
=
(x + θ)α−1 (−α + 1) x=0
Z +∞
θα
+ 2 dx
x=0 (α − 1)(x + θ)α−1
2θ 2
= .
(α − 1)(α − 2)
Si α < 2 alors E[X 2 ] = +∞. Dès lors, si 2 > α > 1,
θ
E[X] = < +∞ et V[X] = +∞.
α−1

3.3.4 Propriétés
Invariance par translation
Notez que
V[S] = V[S + c]
quelle que soit la constante réelle c. Ceci traduit l’idée intuitive
que l’ajout d’une constante réelle c à un risque X ne rend pas la
situation de l’assureur plus dangereuse. Il lui suffit de réclamer une
prime E[S] + c au lieu de E[S].
3.3. Variance 121

Changement d’unité
Quelle que soit la constante c, on voit facilement que

V[cS] = c2 V[S],

de sorte que la variance est affectée par un changement d’unité de


mesure (par exemple, le passage de l’euro au millier d’euros). C’est
pour cette raison qu’on introduit le coefficient de variation (voir plus
bas).
Exemple 3.3.6 (Variance associée à la loi Normale). Pour
X ∼ N or(µ,σ 2 ), nous savons que X =loi µ + σZ où Z ∼ N or(0,1),
de sorte qu’en vertu de l’Exemple 3.3.3,

V[X] = V[µ + σZ] = σ 2 .

Le second paramètre de la loi normale est donc sa variance.

Additivité pour risques indépendants


Le résultat suivant nous indique comment se décompose la va-
riance d’une somme de variables aléatoires indépendantes.
Propriété 3.3.7 (Variance d’une somme de variables indépendantes).
Si les variables aléatoires X1 ,X2 , . . . ,Xn sont indépendantes alors
" n # n
X X
V Xi = V[Xi ].
i=1 i=1

Démonstration. Il suffit d’écrire


" n #  !2 
X X n
V Xi = E (Xi − E[Xi ]) 
i=1 i=1
 ! n 
n
X X
= E (Xi − E[Xi ])  (Xj − E[Xj ])
i=1 j=1
X  n
   X  2 
= E Xi − E[Xi ] E Xj − E[Xj ] + E Xi − E[Xi ]
i6=j i=1
n
X
= V[Xi ].
i=1
122 Chapitre 3. La prime pure

Ainsi, la variance d’une somme de variables aléatoires indépendantes


vaut la somme des variance de chacune d’entre elles.
Exemple 3.3.8 (Variance associée à la loi Binomiale). Lorsque
N ∼ Bin(m,q), N =loi N1 + . . . + Nm où les Ni sont indépendantes
de loi Ber(q). La Propriété 3.3.7 donne alors

m
X
V[N ] = V[Nk ] = mq(1 − q).
k=1

La loi binomiale présente donc une sous-dispersion des données,


puisque V[N ] < E[N ] = mq.

3.3.5 Variance des lois usuelles

Les variances associées aux lois usuelles sont reprises au Tableau


3.2. Si on retient la variance comme critère de risque, ce tableau nous
permet d’aprécier l’influence des paramètres sur le danger associé au
nombre ou au coût des sinistres.

Lois de comptage
Loi de probabilité Variance
n2 +n
DUni(n) 12
Ber(q) q(1 − q)
Bin(m,q) mq(1 − q)
1−q
Geo(q) q2
α(1−q)
N Bin(α,q) q2
Poi(λ) λ
Lois continues
Loi de probabilité Variance
N or(µ,σ 2 ) σ2
LN or(µ,σ 2 ) exp(2µ + σ 2 )(exp(σ 2 ) − 1)
1
Exp(θ) θ2
α
Gam(α,τ ) τ2
αθ 2
Par(α,θ) (α−2)(α−1)2
si α > 2
αβ
Bet(α,β) (α+β+1)(α+β)2
(b−a)2
Uni(a,b) 12

Tab. 3.2 – Variances des lois de probabilité usuelles.


3.3. Variance 123

3.3.6 Variance des lois composées


Intéressons-nous à présent à la variance des lois composées. Le
résultat suivant indique comment se décompose la variance d’une
variable de loi composée, en fonction de la variance du nombre de
termes et de celle de chacun de ceux-ci.
PN
Propriété 3.3.9. Si S est de la forme (2.14), i.e. S = i=1 Xi
avec Xi , i = 1,2, . . ., indépendantes et identiquement distribuées, et
indépendantes de N , sa variance vaut

V[S] = E[N ]V[X1 ] + V[N ]E2 [X1 ].

Démonstration. Ceci provient de


 
XN X N
E[S 2 ] = E  Xi Xj 
i=1 j=1
" #  
N
X XN
= E Xi2 + E Xi Xj 
i=1 i6=j
2 
= E[N ]E[X12 ] + E[X1 ] E[N 2 ] − E[N ] ,

qui donne bien le résultat annoncé après regroupement des termes.

On peut interpréter cette décomposition de la variance comme


PE[N ]
suit. Le premier terme peut s’envisager comme V[ i=1 Xi ] en sup-
posant l’espace d’un instant E[N ] entière. Il s’agit donc de la part
de la variance de S attribuable exclusivement à la variabilité des
coûts des sinistres X1 ,X2 , . . .. Le second terme intervenant
PN dans la
décomposition de la variance de S peut se voir comme V[ i=1 E[Xi ]],
c’est-à-dire comme la part de la variabilité de S due à la variabilité
du nombre des sinistres, les coûts de ceux-ci étant fixés à leur valeur
moyenne.
Exemple 3.3.10. Quelques cas particuliers intéressants se déduisent
simplement des Tableaux 3.1 et 3.2. Si N ∼ Bin(m,q), alors
 2 
V[S] = mq E[X12 ] − q E[X1 ] .

Si N ∼ Poi(λ), alors

V[S] = λV[X1 ] + λE2 [X1 ] = λE[X12 ].


124 Chapitre 3. La prime pure

3.3.7 Coefficient de variation et mutualisation des risques


Le coefficient de variation est défini comme le rapport de l’écart-
type à la moyenne, à savoir
p
V[X]
CV [X] = .
E[X]
Le coefficient de variation a le grand avantage d’être un nombre sans
dimension, ce qui facilite les comparaisons (en excluant par exemple
les effets des différentes unités monétaires). Il peut se voir comme
une normalisation de l’écart-type.
Le coefficient de variation joue un rôle particulièrement impor-
tant en sciences actuarielles. En effet, il peut se voir comme l’écart-
type du ratio “sinistres sur primes (pures)”, traditionnellement noté
S/P.

3.4 Assurance et Bienaymé-Tchebycheff


3.4.1 Inégalité de Markov
Nous présentons ici une des inégalités les plus célèbres du calcul
des probabilités.
Propriété 3.4.1 (Inégalité de Markov). Soit X une variable
aléatoire quelconque, une fonction g : IR → IR + et une constante
a > 0. Nous avons alors
E[g(X)]
Pr[g(X) > a] < .
a
Démonstration. L’inégalité
g(X) > aI[g(X) > a],
donne en passant à l’espérance
E[g(X)] > a Pr[g(X) > a],
qui fournit le résultat annoncé.

3.4.2 Inégalité de Bienaymé-Tchebycheff


L’inégalité de Bienaymé-Tchebycheff contrôle l’écart entre une
variable aléatoire et sa moyenne. Elle s’obtient comme une simple
conséquence de l’inégalité de Markov.
Propriété 3.4.2 (Inégalité de Bienaymé-Tchebycheff ). Etant
donnée une variable aléatoire X possédant une moyenne µ et une
3.4. Assurance et Bienaymé-Tchebycheff 125

variance σ 2 < +∞, on a


  σ2
Pr |X − µ| >  < 2

quel que soit  > 0.
Démonstration. Il suffit d’appliquer l’inégalité de Markov à g(x) =
(x − µ)2 et a = 2 .

3.4.3 Interprétation actuarielle de l’inégalité de Bie-


naymé-Tchebycheff
Nous avons vu plus haut que la variance (et donc l’écart-type)
mesure la distance entre la charge financière S de l’assureur et la
prime pure correspondante µ = E[S]. On peut donc se demander ce
qu’on peut affirmer à propos de l’écart entre S et sa moyenne grâce à
la connaissance de la variance. L’inégalité de Bienaymé-Tchebycheff
nous apprend que
h i 1 h i 1
Pr |S − µ| ≤ tσ > 1 − 2 ⇔ Pr |S − µ| > tσ < 2 (3.5)
t t
quel que soit t > 0.
Les inégalités (3.5) n’ont bien entendu d’intérêt que si t > 1.
Elles signifient qu’une variable aléatoire S dont la variance est fi-
nie ne peut “pas trop” s’éloigner de sa moyenne µ et revêtent une
importance considérable pour l’actuaire (en interprétant S comme
un montant de sinistre, et µ comme la prime pure correspondante).
Ainsi, la probabilité que le montant S des sinistres s’écarte de la
prime pure µ de t = 10 fois l’écart-type σ est toujours inférieure à
1/t2 = 1%.

3.4.4 Caractère conservatif de l’inégalité de Bienaymé-


Tchebycheff
Avant de poursuivre, il est bon de noter que l’inégalité de Bie-
naymé-Tchebycheff est valable en toute généralité, si bien que la
borne supérieure ainsi obtenue est souvent très (voire trop) pru-
dente. A titre illustratif, nous avons représenté à la Figure 3.1 la
fonction
1/t2
t 7→  √ , (3.6)
Pr |Gam(1/2,1/2) − 1| > t 2
c’est-à-dire le rapport entre la borne supérieure fournie par l’inégalité
de Bienaymé-Tchebycheff et la probabilité qu’une variable aléatoire
126 Chapitre 3. La prime pure

Gamma
12

Log-Normale
Pareto
10
Rapport

8
6

1 2 3 4 5 6

Fig. 3.1 – Evolution des rapports (3.6), (3.7) et (3.8).

de loi Gamma de moyenne 1 et de variance 2 s’écarte de sa moyenne


de plus de t fois l’écart-type. On constate clairement que la borne
supérieure 1/t2 est loin au-dessus de la valeur exacte dans ce cas.
La Figure 3.1 propose également des résultats similaires pour la loi
log-normale de même moyenne et variance, à savoir la fonction

1/t2
t 7→  √ , (3.7)
Pr |LN or(µ,σ 2 ) − 1| > t 2

où
ln 3
µ=− et σ 2 = ln 3,
2

ainsi que pour la loi de Pareto de même deux premiers moments,


i.e.
1/t2
t 7→  √ , (3.8)
Pr |Par(α,θ) − 1| > t 2

où
α = 4 et θ = 3.

Il est clair que la borne supérieure fournie par (3.5) est très
prudente.
3.5. Assurance et loi des grands nombres 127

3.5 Assurance et loi des grands nombres


3.5.1 Convergence en probabilité
La loi des grands nombres fournit une justification pertinente du
mode de calcul de la prime pure associée à S. Afin de s’en convaincre,
nous aurons besoin d’un concept de convergence pour une suite de
variables aléatoires.
Définition 3.5.1. La suite {Tn , n ∈ IN} converge en probabilité
vers la variable aléatoire T , ce qui se notera désormais
Tn →proba T,
lorsque  
Pr |Tn − T | >  → 0 lorsque n → +∞
quel que soit  > 0.
Ceci exprime le fait qu’au fur et à mesure que n croı̂t, la proba-
bilité que Tn s’écarte de sa limite T de plus de  tend vers 0; T n se
rapproche d’autant plus de sa limite T que n est grand.

3.5.2 Convergence de la charge moyenne de sinistre


par police vers la prime pure
Loi des grands nombres
Supposons que l’assureur émet un grand nombre de polices iden-
tiques, et désignons par Si , i = 1,2, . . . ,n, le débours total de l’assu-
reur en relation avec la police numéro i au cours d’une période de
référence (généralement un an).
Propriété 3.5.2. Soient µ et σ 2 la moyenne et la variance com-
(n)
mune des Si . Notons S la charge moyenne de sinistre par police,
i.e.
n
(n) 1X
S = Si .
n
i=1
Pour autant que les variables aléatoires S i soient indépendantes,
identiquement distribuées et de variance finie, la loi des grands nombres
assure que
(n)
S →proba µ lorsque n tend vers l’infini.
Démonstration. En effet, l’inégalité (3.5) garantit que
h i
(n)
h i V S σ2
(n)
Pr S − µ| >  ≤ = → 0 si n → +∞. (3.9)
2 n2
128 Chapitre 3. La prime pure

Nous venons donc d’établir que la charge moyenne de sinistre


par police converge vers la prime pure. En réclamant un montant µ
à chaque assuré, la compagnie devrait donc disposer d’une somme
suffisante pour dédommager les sinistres survenus, sans bénéfice et
sans déficit.

Hypothèses sous jacentes

Il est intéressant d’examiner avec précaution les hypothèses qui


sous-tendent (3.9), ceci afin de déceler les situations où le recours
à l’espérance mathématique pour calculer la prime pure n’est pas
pertinent:
(i) Tout d’abord il s’agit d’un résultat asymptotique (“n tend
vers l’infini”). En pratique, la taille du portefeuille doit être
considérable pour que la loi des grands nombres trouve à s’ap-
pliquer.
(ii) Ensuite, les variables aléatoires S i sont supposées indépendantes.
L’assurance des catastrophes naturelles, telles les inondations
ou les tremblements de terre, qui affectent vraisemblablement
tous les risques situés dans une même zone géographique, sort
donc du domaine d’application de la loi des grands nombres.
(iii) Enfin, les variables aléatoires S i sont supposées identiquement
distribuées. Les risques groupés en vue de l’assurance doivent
donc être homogènes, c’est-à-dire de nature semblable. On dis-
tingue
(a) l’homogénéité de nature: chaque risque doit, suivant sa
nature, être rangé dans une catégorie particulière. On ne
peut grouper ensemble en vue d’un calcul statistique le
risque “incendie” et le risque “responsabilité”. A l’intérieur
de chaque catégorie, il faut faire des sous-classifications
correspondant aux caractéristiques d’un même risque. En
matière d’incendie, on distingue les risques simples et les
risques industriels. En matière de responsabilité, on dis-
tingue les risques locatifs, la responsabilité familiale, etc.
(b) l’homogénéité d’objet: les risques doivent avoir pour objet
des personnes ou des choses semblables. Dans l’assurance
sur la vie, les individus doivent être classés suivant leur
âge, leur sexe, leur état de santé. Dans l’assurance acci-
dent, il y a lieu de tenir compte de la profession exercée
3.5. Assurance et loi des grands nombres 129

par l’intéressé (l’actuaire est un meilleur risque que le


peintre en bâtiment).
(c) l’homogénéité de valeur: les risques doivent être groupés
selon leur valeur. Tous les risques ne doivent pas présenter
la même importance, mais il ne faut pas qu’il y ait entre
eux une trop grande disproportion de valeur.
Si les risques ne sont pas suffisamment nombreux, semblables et
indépendants, la loi des grands nombres ne trouve pas à s’appliquer
et la compensation des risques ne sera pas possible. Dans une telle
situation, l’assureur peut alors songer à se réassurer, c’est-à-dire
céder une partie des risques qu’il a souscrits auprès d’une autre
compagnie.
Remarque 3.5.3. Il est possible que, pour une garantie donnée, les
polices en portefeuille permettent la compensation (les hypothèses de
la loi des grands nombres étant satisfaites), mais que ce ne soit pas
le cas pour une autre garantie. Considérons par exemple un assureur
couvrant contre l’incendie un grand nombre d’immeubles semblables
situés dans la même ville, non contigus. Le principe de compensa-
tion s’appliquera vraisemblablement fort bien, les trois hypothèses de
la loi des grands nombres étant satisfaites. Par contre, ces mêmes
immeubles ne constituent plus des risques indépendants pour la ga-
rantie tremblement de terre ou inondation, obligeant l’assureur à
recourir au marché de la réassurance.

Primes unitaires et probabilités


Nous sommes à présent en mesure de justifier l’interprétation de
la probabilité d’un événement comme la prime pure relative à une
police prévoyant le versement d’une somme de 1e si l’événement en
question survient. En effet, la prestation de l’assureur peut alors se
représenter par la variable aléatoire

1, si E se produit,
S = I[E] =
0, sinon.
Clairement,
  S ∼ Ber(Pr[E]) et la prime pure associée est alors
E I[E] = Pr[E].

3.5.3 Le cas de la réparation forfaitaire


Un sinistre au plus par période
Supposons que l’assureur couvre n individus. En cas de sinistre,
la compagnie est obligée de verser un montant forfaitaire s. Chaque
130 Chapitre 3. La prime pure

police donne lieu à au plus un sinistre. La variable aléatoire S i


représentant le remboursement de la compagnie à l’individu i est
donnée par

0, avec une probabilité 1 − q,
Si = (3.10)
s, avec une probabilité q.

Si les Si sont indépendantes, alors


(n)
S →proba E[S1 ] = qs.
(n)
L’écart entre S et la prime pure qs est majoré en utilisant l’inégalité
de Bienaymé-Tchebycheff par
h i 1
(n)
Pr |S − qs| >  ≤ 2 s2 q(1 − q).
n

Nombre aléatoire de sinistres par période


Si la police peut générer plus d’un sinistre par période, et que la
survenance d’un de ces sinistres oblige l’assureur à verser le forfait
s, la dépense de la compagnie s’écrit S i = sNi où Ni est le nombre
de sinistres déclarés par la police i.
Dans ce cas,
n
(n) (n) (n) 1X (n)
S = sN où N = Ni et S →proba sE[N1 ].
n
i=1

(n)
L’écart entre S et la prime pure est contrôlé par
h i 1
(n)
Pr |S − sE[N1 ]| >  ≤ 2 s2 V[N1 ].
n

3.5.4 Le cas de la réparation indemnitaire


Sans prise en compte du nombre des sinistres
Supposons à présent qu’il y a une probabilité q que S i > 0, et
notons Zi le montant des sinistres lorsque Si > 0, i.e.

0, avec une probabilité 1 − q,
Si = (3.11)
Zi , avec une probabilité q,

où Z1 ,Z2 , . . . sont des variables aléatoires positives, indépendantes


et de même loi. Dans ce cas, la prime pure sera E[S i ] = qE[Zi ] = qµ.
3.6. Fonctions caractéristiques 131

Représentons Si comme Ji Zi où Ji = I[Si > 0]. Cette fois, l’écart


(n)
entre S et la prime pure qµ est majorée en vertu de l’inégalité de
Bienaymé-Tchebycheff par
h i 1
(n)
Pr |S − qµ| >  ≤ V[S1 ]
n2
1 2 2

= qσ + µ q(1 − q) ,
n2
où σ 2 = V[Z1 ].
Remarque 3.5.4. Dans certains cas, il peut s’avérer utile pour
l’actuaire de faire apparaı̂tre explicitement le nombre de sinistres
causés par l’assuré. Dans ce cas, il recourt à la modélisation
Ni
X
Si = Cik .
k=1

La prime pure vaut alors

E[Si ] = E[Ni ]E[Ci1 ].

3.6 Fonctions caractéristiques


3.6.1 Fonction génératrice des probabilités
Définition
La fonction génératrice des probabilités est un outil bien com-
mode pour obtenir un série de résultats précieux pour l’actuaire,
mais ne possédant pas d’interpétation intuitive. Elle est définie comme
suit.
Définition 3.6.1. La fonction génératrice des probabilités d’une va-
riable aléatoire N à valeurs dans IN, notée ϕ N , est définie comme
X
ϕN (z) = E[z N ] = Pr[N = j]z j , 0 ≤ z ≤ 1.
j∈IN

Cette fonction caractérise le loi de probabilité de N . En effet, les


dérivées successives de ϕN évaluées en z = 0 donnent les probabilités
Pr[N = k] à un facteur près, i.e.

Pr[N = 0] = ϕN (0)

dk
k! Pr[N = k] = k
ϕN (z) , k ≥ 1.
dz z=0
132 Chapitre 3. La prime pure

Les dérivées successives de ϕN évaluées en z = 1 donnent quant à


elles les moments factoriels, à savoir

d
ϕN (z) = E[N ]
dz z=1

dk
ϕ (z) = E[N (N − 1) . . . (N − k + 1)], k ≥ 1.
dz k
N
z=1

Notez que, bien évidemment, ϕN (1) = 1.


Les fonctions génératrices des probabilités associées aux lois de
probabilité discrètes usuelles sont reprises au Tableau 3.3.

Loi de probabilité ϕN (t) = E[tN ]


1 tn+1 −1
DUni(n) n+1 t−1
Ber(q) (1 − q + qt)
Bin(m,q) (1 − q + qt)m
q
Geo(q) 1−(1−q)t
 α
q
N Bin(α,q) 1−(1−q)t
Poi(λ) exp(λ(t − 1))

Tab. 3.3 – Fonction génératrice des probabilités des lois discrètes


usuelles.

Fonction génératrice des probabilités et produit de convo-


lution
L’intérêt principal de la fonction génératrice des probabilités
réside dans la manipulation aisée des convoluées. Si on désire trou-
ver la fonction génératrice des probabilités d’une somme de va-
riables de comptage indépendantes, il suffit de multiplier les fonc-
tions génératrices des probabilités de chacun des termes, en vertu
du résultat suivant.
Propriété
Pn 3.6.2. La fonction génératrice des probabilités de N • =
N
i=1 i , où les Ni sont indépendantes, est donnée par le produit
des fonctions génératrices ϕNi de chacun des termes.
Démonstration. Il suffit d’écrire
" #
h Pn i n
Y
ϕN• (z) = E z i=1 Ni =E z Ni

i=1
n
Y n
Y
= E[z Ni ] = ϕNi (z), z ∈ [0,1].
i=1 i=1
3.6. Fonctions caractéristiques 133

En particulier, si N1 , . . . ,Nn sont indépendantes et identique-


ment distribuées, on a
ϕN• (z) = {ϕN1 (z)}n .
Exemple 3.6.3 (Convolution de lois binomiales de même pa-
ramètre). Ayant deux variables aléatoires N 1 et N2 indépendantes
de lois respectives Bin(m1 ,q) et Bin(m2 ,q), la fonction génératrice
des probabilités de la somme N1 + N2 vaut
m +m
ϕN1 +N2 (z) = ϕN1 (z)ϕN2 (z) = 1 + q(z − 1) 1 2
de sorte que N1 + N2 ∼ Bin(m1 + m2 ,q). La loi de Bernoulli fournit
donc la base de la famille binomiale puisque toute variable aléatoire
N de loi Bin(m,q) peut se représenter comme
m
X
N= Ni ,
i=1

où les Ni sont indépendantes et obéissent à la loi Ber(q).


Exemple 3.6.4 (Convolution de lois de Poisson). Soient N 1 ,N2 , . . . ,Nn
des variables aléatoires indépendantes Pnde loi de Poisson de paramètres
respectifs λP
1 ,λ2 , . . . ,λn . Alors N = i=1 Ni est de loi de Poisson de
paramètre ni=1 λi . La fonction génératrice des probabilités de N est
le produit des fonctions génératrices des probabilités des N i :
n n
!
Y X
ϕN (z) = exp(λi (z − 1)) = exp (z − 1) λi ,
i=1 i=1

ce qui fait de N une variable aléatoire de loi de Poisson de paramètre


P n
i=1 λi .

3.6.2 Transformée de Laplace


Définition
Pas plus que la fonction génératrice des probabilités, la trans-
formée de Laplace ne jouit d’une interprétation intuitive. Il s’agit
à nouveau d’un outil bien commode pour obtenir des résultats de
théorie du risque. Cette fonction caractérise la loi de X et est définie
comme suit.
Définition 3.6.5. La tranformée de Laplace d’une variable aléatoire
X, notée LX , est donnée par
LX (t) = E[exp(−tX)], t ≥ 0.
134 Chapitre 3. La prime pure

Le plus souvent, la transformée de Laplace est utilisée pour des


variables aléatoires non-négatives. Ceci garantit son existence et en
fait un outil bien commode permettant de résoudre de nombreux
problèmes de probabilité appliquée.
Les moments de X sont aisément obtenus en dérivant L X et en
évaluant les dérivées en 0; en effet,

k d
k
k
E[X ] = (−1) k
LX (t) , k ∈ IN.
dt t=0

Le Tableau 3.4 reprend les transformées de Laplace associées aux


lois usuelles.
Loi de probabilité LX (t) = E[exp(−tX)]
exp(−at)−exp(−bt)
Uni(a,b) (b−a)t
Bet(α,β) pas de forme explicite
N or(µ,σ 2 ) exp(−µt + 12 σ 2 t2 )
−1
Exp(θ) 1 + θt
−α
Gam(α,τ ) 1 + τt
LN or(µ,σ 2 ) pas de forme explicite
Par(α,θ) pas de forme explicite

Tab. 3.4 – Transformées de Laplace des lois de probabilités continues


usuelles.

Théorème de Bernstein
Le théorème de Bernstein fournit une condition nécessaire et
suffisante pour qu’une fonction soit la transformée de Laplace d’une
loi de probabilité. Pour ce faire, rappelons qu’une fonction g : IR + →
IR est complètement monotone si elle possède des dérivées g (k) de
tous ordres telles que
(−1)k g (k) (t) ≥ 0 pour tout t > 0.
Proposition 3.6.6 (Théorème de Bernstein). Une fonction g
est la transformée de Laplace d’une variable aléatoire positive si, et
seulement si, elle est complètement monotone et telle que g(0) = 1.

Transformée de Laplace et produit de convolution


La tranformée de Laplace joue un rôle important dans l’analyse
des produits de convolution, comme le montre le résultat suivant.
Propriété 3.6.7. Etant données des variables aléatoires X 1 ,X2 , . . . ,Xn
3.6. Fonctions caractéristiques 135

P
non-négatives et indépendantes, notant leur somme S = ni=1 Xi ,
la transformée de Laplace LS de S est donnée par le produit des
transformées de Laplace LXi de chacun des termes.

Démonstration. Il suffit d’écrire


" n
!#
X
LS (t) = E exp −t Xi
i=1
" n
#
Y
= E exp (−tXi )
i=1
n
Y
= LXi (t), t ≥ 0.
i=1

On obtient donc très facilement la transformée de Laplace de la


somme des Xi sous l’hypothèse d’indépendance, alors que la fonction
de répartition correspondante est souvent très difficile à obtenir.
Exemple 3.6.8 (Convolution de lois gamma). L’expression de
la tranformée de Laplace de la loi Gam(α,τ ) donnée au Tableau
3.4 laisse apparaı̂tre une propriété fondamentale de la loi gamma:
sa stabilité par convolution. En effet, si X 1 et X2 sont des va-
riables aléatoires indépendantes de lois respectives Gam(α 1 ,τ ) et
Gam(α2 ,τ ), alors X1 + X2 est de loi Gam(α1 + α2 ,τ ).
Pour s’en convaincre, il suffit en effet de remarquer que la trans-
formée de Laplace de X1 + X2 vaut
 −α1    
t t −α2 t −α1 −α2
1+ 1+ = 1+
τ τ τ

qui correspond effectivement à la loi Gam(α 1 + α2 ,τ ).

Transformée de Laplace des lois composées


La propriété suivante nous sera très utile, notamment dans le
Chapitre 6 pour approximer les lois composées correspondant aux
variables aléatoires de forme composée (2.14).
Propriété
PN3.6.9. La tranformée de Laplace de S définie en (2.14),
i.e. S = i=1 Xi avec Xi , i = 1,2, . . ., indépendantes et identique-
ment distribuées, et indépendantes de N , est donnée pour t > 0 par
LS (t) = ϕN (LX1 (t)).
136 Chapitre 3. La prime pure

Démonstration. Il suffit d’écrire


" N
!#
X
LS (t) = E exp −t Xi
i=1
+∞
" k
!#
X X
= Pr[N = k]E exp −t Xi
k=0 i=1
+∞
X
= Pr[N = k]{LX1 (t)}k = ϕN (LX1 (t)).
k=0

Exemple 3.6.10. Comme ϕN (z) = exp{λ(z − 1)} lorsque N ∼


Poi(λ), la tranformée de Laplace de S ∼ CPoi(λ,F X ) est

LS (t) = exp{λ(LX (t) − 1)}, t ∈ IR+ .

Stabilité de la loi de Poisson composée par convolution


Les transformées de Laplace sont bien utiles pour obtenir des
résultats faisant intervenir des produits de convolution, comme la
propriété suivante.
Propriété 3.6.11. Considérons des variables aléatoires indépendantes
S1 ∼ CPoi(λ1 ,F1 ), . . . , Sn ∼ CPoi(λn ,Fn ). Alors
n
X
S= Sj ∼ CPoi(λ• ,F• ),
j=1

où
n
X n
1 X
λ• = λj et F• (x) = λj Fj (x), x ∈ IR.
λ•
j=1 j=1

Démonstration. Il suffit d’écrire


n
Y n
Y
LS (t) = LSj (t) = exp{λj (Lj (t) − 1)},
j=1 j=1

où Lj est la transformée de Laplace de la loi correspondant à la


fonction de répartition Fj . Le résultat s’obtient alors simplement en
remarquant que

Ls (t) = exp{λ• (L• (t) − 1)},


3.6. Fonctions caractéristiques 137

où la transformée de Laplace


n
1 X
L• (t) = λj Lj (t)
λ•
j=1

correspond à la fonction de répartition F • .

Le cas des risques à variance infinie


Nous avons vu à la Propriété 3.5.2 que la loi des grands nombres
garantissait (sous certaines hypothèses) la convergence de la charge
moyenne des sinistres vers la prime pure. Le raisonnement s’ap-
puyant sur (3.9) suppose néanmoins que les S i sont de variance
finie. Le résultat reste cependant correct si les S i ont une variance
infinie (ce qui est parfois le cas lorsque l’actuaire est confronté à des
montants de sinistre particulièrement élevés, lorsqu’il recourt à la
loi de Pareto).
Propriété 3.6.12. Soient S1 ,S2 , . . . ,Sn des variables aléatoires non-
négatives, indépendantes et de même loi, de moyenne finie. Alors
(n)
S →proba µ lorsque n → +∞.

Démonstration. Notons LS la transformée de Laplace commune des


Si . La transformée de Laplace de la somme S 1 + S2 + . . . + Sn est
(n)
LnS et celle de S est
  n
t
LS (n) (t) = LS .
n
Or, un développement de Taylor limité donne

LS (t) = 1 − µt + o(t),

où o(t) désigne une fonction telle que


o(t)
lim = 0,
t→0 t

i.e. une fonction tendant plus vite vers 0 que l’identité (o(t) est donc
négligeable pour de petites valeurs de t). Par conséquent, lorsque
n → +∞
  n
t
lim L (n) (t) = lim LS
n→+∞ S n→+∞ n
 
µt n
= lim 1− = exp(−tµ).
n→+∞ n
138 Chapitre 3. La prime pure

Comme exp(−tµ) est la transformée de Laplace associée à la constante


(n)
µ, on retrouve bien la convergence de S vers µ.
Ainsi, la couverture des risques dont la variance est infinie reste
possible. On sent cependant bien intuitivement qu’il s’agira d’un
commerce hasardeux: il s’agit en effet de risques dont la dispersion
autour de la prime pure est infinie!

3.6.3 Fonction génératrice des moments


Définition
La fonction génératrice des moments complète l’arsenal de l’ac-
tuaire. Elle apparaı̂t naturellement dans la théorie de la ruine et
permet de classer les lois de probabilité selon le danger qui leur est
associé. Contrairement à la transformée de Laplace, elle n’est pas
toujours définie pour des variables aléatoires non-négatives.
Définition 3.6.13. Etant donnée une variable aléatoire X, sa fonc-
tion génératrice des moments MX est définie comme
MX (t) = E[exp(tX)], t ≥ 0.
On voit donc que la différence entre transformée de Laplace et
fonction génératrice des moments est essentiellement formelle (−t
est remplacé par t, en fait). En sciences actuarielles, il est de coutume
de distinguer ces deux outils.

Loi log-normale
Les moments de la loi log-normale s’obtiennent facilement à par-
tir de la fonction génératrice des moments de la loi normale, comme
le montre l’exemple ci-après.
Exemple 3.6.14 (Moments de la loi log-normale). Lorsque
X ∼ LN or(µ,σ 2 ), X a même loi que exp(Y ) où Y ∼ N or(µ,σ 2 ).
Dès lors,
E[X] = E[exp(Y )] = MY (1) = exp(µ + σ 2 /2),
et
E[X 2 ] = MY (2) = E[exp(2Y )] = exp(2µ + 2σ 2 ),
d’où l’on tire
V[X] = exp(2µ + 2σ 2 ) − exp(2µ + σ 2 )
= exp(2µ) exp(σ 2 )(exp(σ 2 ) − 1).
Les deux paramètres µ et σ 2 influencent donc la variabilité de X.
3.6. Fonctions caractéristiques 139

Une décroissance exponentielle de la fonction de queue ne ga-


rantit cependant pas la finitude de la fonction génératrice des mo-
ments. L’exemple de la loi log-normale est édifiant à cet égard. Tous
les moments associés à cette loi existent et sont finis. Précisément,
si X ∼ LN or(µ,σ 2 ) alors, en généralisant l’Exemple 3.6.14:

1
E[X k ] = exp(kµ + k 2 σ 2 ), k = 1,2, . . .
2
Cependant, MX (t) est constamment infinie, quelle que soit la valeur
de t. A fortiori, la loi de Pareto Par(α,θ) (pour laquelle les moments
d’ordre k > α sont infinis) ne possède pas de fonction génératrice
des moments.

Lois de Cramér
Outre son usage dans certains développements mathématiques,
la fonction génératrice des moments est un outil bien commode
pour apprécier le niveau de danger traduit par une loi utilisée pour
modéliser le coût des sinistres. En effet, contrairement à la trans-
formée de Laplace, la fonction génératrice des moments n’est pas
forcément finie. Les lois pour lesquelles M X est constamment infi-
nie traduisent un niveau de danger élevé pour l’assureur. Les lois
LogNormale et de Pareto font partie de cette catégorie.
Au contraire, les lois de Cramér sont celles dont la fonction
génératrice des moments est finie pour au moins une valeur posi-
tive de son argument. De telles lois traduisent un degré de risque
faible ou modéré pour l’assureur.
Définition 3.6.15. La variable aléatoire X admet une loi de Cramér
s’il existe h > 0 tel que MX (t) existe et est finie pour t < h.
On obtient alors en développant l’exponentielle en série de Tay-
lor:
+∞ k
X t
MX (t) = 1 + E[X k ] pour t < h.
k!
k=1

Le Tableau 3.5 reprend les fonctions génératrices des moments


des lois usuelles.

Fonction génératrice des moments et produit de convolu-


tion
Tout comme la tranformée de Laplace, l’intérêt premier de la
fonction génératrice des moments réside dans l’étude des sommes
140 Chapitre 3. La prime pure

Loi de probabilité MX (t) = E[exp(tX)]


exp(bt)−exp(at)
Uni(a,b) (b−a)t
Bet(α,β) pas de forme explicite
N or(µ,σ 2 ) exp(µt + 12 σ 2 t2 )
−1
Exp(θ) 1 − θt si t < θ

t −α
Gam(λ,α) 1− τ si t < τ

Tab. 3.5 – Fonctions génératrices des moments des lois de probabi-


lités continues usuelles.

de variables aléatoires. En effet la somme de variables aléatoires


indépendantes revient à faire le produit des fonctions génératrices
des moments.
Propriété 3.6.16. Etant données des variables aléatoires X
P1 ,X 2 , . . . ,Xn
n
non-négatives et indépendantes, et notant leur somme S = i=1 Xi ,
la fonction génératrice des moments M S de S est donnée par le pro-
duit des fonctions génératrices des moments M Xi de chacun des
termes.

Démonstration. Il suffit d’écrire vaut


" n
!#
X
MS (t) = E exp t Xi
i=1
" n
#
Y
= E exp(tXi )
i=1
n
Y
= MXi (t).
i=1

Exemple 3.6.17 (Convolution de lois normales). Si X ∼ N or(µ,σ 2 ),


1
MX (t) = exp(µt + t2 σ 2 ).
2
Ceci nous permet d’affirmer qu’étant données des variables aléatoires
indépendantes
Pn Xi ∼ N or(µi ,σi2 ), toute combinaison linéaire T =
i=1 αi Xi est toujours de loi normale. En effet, la fonction génératrice
de T est donnée par
n n n
!
Y X t2 X 2 2
E[exp(αi tXi )] = exp αi µi + αi σi
2
i=1 i=1 i=1
3.6. Fonctions caractéristiques 141

de sorte que
n n n
!
X X X
αi Xi ∼ N or αi µi , α2i σi2 .
i=1 i=1 i=1

Borne de Chernoff
Cette borne très utile est valable pour les lois de Cramér.
Propriété 3.6.18. Soit X une variable aléatoire possédant une
fonction génératrice des moments finie et notons

Ψ(t) = ln MX (t).

On a alors

F X (x) ≤ exp(−h(x)) où h(x) = sup{tx − Ψ(t)}.


t≥0

Démonstration. L’inégalité de Markov rappelée à la Propriété 3.4.1


donne

F X (x) = Pr[exp(tX) > exp(tx)]


MX (t)
≤ = exp(−(tx − Ψ(t))).
exp(tx)
Comme le raisonnement ci-dessus s’applique quel que soit t > 0,
nous en déduisons que l’existence d’une fonction génératrice des mo-
ments garantit le résultat annoncé.
Une variable aléatoire possédant une fonction génératrice des
moments admet donc nécessairement une fonction de queue décroissant
exponentiellement vers 0.

3.6.4 Taux de hasard


Définition
Une quantité intéressante est le taux de hasard (encore appelé
taux instantané de mortalité en assurance sur la vie), et défini
comme suit.
Définition 3.6.19. Soit X une variable aléatoire positive possédant
une densité de probabilité fX . Le taux de hasard associé à X, noté
rX , est donné par
d fX (x)
rX (x) = − ln F (x) = , x ∈ IR+ . (3.12)
dx F X (x)
142 Chapitre 3. La prime pure

Interpétation
Afin de bien comprendre la signification du taux de hasard, il
est utile de se référer à la représentation suivante de r X .
Propriété 3.6.20. Le taux de hasard s’obtient par le passage à la
limite suivant:
Pr[x < X ≤ x + ∆x|X > x]
rX (x) = lim .
∆x→0 ∆x
Démonstration. En effet,
Pr[x < X ≤ x + ∆x]
Pr[x < X ≤ x + ∆x|X > x] =
Pr[X > x]
Pr[X > x] − Pr[X > x + ∆x]
= ,
Pr[X > x]
d’où
Pr[x < X ≤ x + ∆x|X > x]
lim
∆x→0 ∆x
1 Pr[X > x] − Pr[X > x + ∆x]
= lim
Pr[X > x] ∆x→0 ∆x
1 d
= − Pr[X > x] = rX (x).
Pr[X > x] dx

En d’autres termes, rX (x)∆x peut s’interpréter comme la pro-


babilité que le montant de sinistre soit approximativement égal à x
alors qu’il est au moins égal à x. Formellement, le taux de hasard
d’un risque X permet quant à lui d’approximer la “probabilité” que
X soit égal à x, sachant que X excède x, i.e.
rX (x)∆x ≈ Pr[x < X ≤ x + ∆x|X > x].
Remarque 3.6.21. Il est intéressant de comparer cette interprétation
avec celle dont jouit la fonction de densité. Nous avons vu au cha-
pitre précédent que la fonction de densité f X d’un risque X évaluée
en x peut s’interpréter comme la “probabilité” que X soit “égal” à
x, puisque
Pr[x < X ≤ x + ∆x]
fX (x) = lim ,
∆x→0 ∆x
de sorte que l’approximation
fX (x)∆x ≈ Pr[x < X ≤ x + ∆x]
est valable pour ∆x suffisamment petit.
3.6. Fonctions caractéristiques 143

Lien avec la fonction de queue


Le résultat suivant montre qu’il est possible d’exprimer la fonc-
tion de queue de x en fonction du taux de hasard r X .
Propriété 3.6.22. La fonction de queue d’une variable aléatoire
positive X s’exprime comme suit en fonction du taux de hasard as-
socié rX :  Z 
x
F (x) = exp − rX (ξ)dξ , x ≥ 0. (3.13)
ξ=0

Démonstration. Il suffit de résoudre l’équation différentielle (3.12)


avec la condition initiale F (0) = 1.

La Propriété 3.6.22 montre que le taux de hasard r X caractérise


la loi de probabilité de X.

3.6.5 Primes stop-loss


Définition
Un traité de réassurance stop-loss (ou excédent de perte) consiste
à faire prendre en charge par le réassureur la partie de la charge
totale S des sinistres qui dépasse une certaine somme d. La portion
réassurée, notée S R , est donc définie par

R 0, si S ≤ d,
S = (S − d)+ =
S − d, si S > d.

Notez que cet échange de risque entre assureur et réassureur est


semblable à la clause de découvert obligatoire imposée aux assurés
par une compagnie, clause que nous avons examinée en détail dans
la Section 2.9.2.
La prime pure que la cédante devra verser au réassureur pour
un tel contrat, appelée prime stop-loss, est donnée par

E[S R ] = E[(S − d)+ ].

Ceci mène à la définition suivante.


Définition 3.6.23. Etant donné un risque X, la prime stop-loss
pour une rétention t ≥ 0 est définie par

πX (t) = E[(X − t)+ ].

La fonction πX est encore appelée la transformée stop-loss de la


variable aléatoire X.
144 Chapitre 3. La prime pure

Remarque 3.6.24. Même si formellement rien ne distingue la


prime stop-loss E[(X −t)+ ] du prix d’une option d’achat sur un actif
dont la valeur à l’instant d’exercice est X et t désigne le prix d’exer-
cice, il s’agit néanmoins de deux êtres mathématiques fort différents.
En effet, la prime stop-loss est calculée à l’aide de la loi de pro-
babilité physique, ou historique, alors que dans le cas de l’option
d’achat, on effectuera au préalable un changement de mesure, pas-
sant à la loi de probabilité neutre au risque (ce qui permet d’éviter
toute opportunité d’arbitrage).
Outre le fait que les marchés d’assurance sont incomplets, ce qui
invalide bon nombre de résultats provenant de la théorie financière
classique, l’actuaire travaille avec la mesure de probabilité historique
alors que le financier passe à la mesure de probabilité neutre au
risque.

Propriétés
Si on intègre par parties, on obtient facilement le résultat suivant.
Propriété 3.6.25. La transformée stop-loss peut s’exprimer comme
suit à partir de la fonction de queue:
Z +∞
πX (t) = F X (x)dx. (3.14)
x=t

La représentation (3.14) permet encore d’obtenir les caractéristiques


suivantes de la transformée stop-loss π X .
Propriété 3.6.26. Supposons E[X] < +∞. La transformée stop-
loss πX possède les propriétés suivantes:
(i) elle est décroissante et convexe.
(ii) limt→+∞ πX (t) = 0 et limt→−∞ {πX (t) + t} = E[X].

Démonstration. (i) se déduit immédiatement de la représentation


(3.14). Quant à (ii), la première limite s’obtient à partir de (3.14)
tandis que la seconde provient de

lim {πX (t) + t} = lim E[max{X,t}] = E[X].


t→−∞ t→−∞

La propriété suivante est également fort intéressante. Elle in-


dique qu’une fonction satisfaisant les conditions (i)-(ii) de la Pro-
priété 3.6.26 est la transformée stop-loss associée à un risque X.
3.6. Fonctions caractéristiques 145

Propriété 3.6.27. Si la fonction g satisfait (i)-(ii) dans la Pro-


priété 3.6.26, il existe un risque X tel que g = π X . La fonction de
répartition de X est donnée par
0
FX (t) = 1 + g+ (t),
0 est la dérivée à droite de g.
où g+
0 existe
Démonstration. Si g est convexe alors la dérivée à droite g +
et est non-décroissante et continue à droite. De plus,
0
lim g(t) = 0 ⇒ lim g+ (t) = 0
t→+∞ t→+∞

et limt→−∞ {g(t) + t} ne peut exister que si lim t→−∞ g+ 0 (t) = −1.


0
Dès lors, 1 + g+ est une fonction de répartition, F X disons. Il suffit
de prendre X = FX−1 (U ) pour conclure.
Remarque 3.6.28. La Propriété 3.6.27 nous apprend également
que la transformée stop-loss πX caractérise la loi de probabilité de
X.

Excédent moyen de sinistre


Une autre quantité fort intéressante dans l’analyse des lois de si-
nistre, et très semblable à la prime stop-loss, est l’excédent moyen de
sinistre (encore appelé durée de vie moyenne restante en assurance
sur la vie), défini comme suit.
Définition 3.6.29. Etant donné un risque X, l’excédent moyen de
sinistre eX est défini par
eX (x) = E[X − x|X > x]
R +∞
ξ=x (ξ − x)dFX (ξ)
= , x ≥ 0.
F X (x)
Il s’agit du montant moyen de sinistre lorsqu’un découvert obli-
gatoire de montant x est prévu par la compagnie. Une loi pour
laquelle eX ne tend que lentement vers 0 est moins avantageuse
pour l’assureur qu’une autre pour laquelle la convergence vers 0 est
rapide.
Les excédents moyens de sinistre pour les lois continues usuelles
sont repris au Tableau 3.6 (de même que leur comportement asymp-
totique lorsque x → +∞). Si on repart de (3.14), on constate faci-
lement que
πX (t) = eX (t)F X (t),
de sorte que les primes stop-loss associées aux lois de probabilité
usuelle se déduisent facilement du Tableau 3.6.
146 Chapitre 3. La prime pure

Loi de probabilité Excédent moyen Equivalent


de sinistre asymptotique
eX (x) (x → +∞)
1
Exp(θ) θ

α 1−Γ(α+1,τ x) 1
Gam(α,τ ) τ 1−Γ(α,τ x) −x τ

 
ln(x)−µ−σ 2
Φ σ
σ2
LN or(µ,σ 2 ) exp(µ + 2 )

ln(x)−µ
 −x σ 2 lnxx
Φ σ

θ+x
Par(α,θ) α−1
avec α > 1

Tab. 3.6 – Excédents moyens de sinistre pour les lois de probabilités


continues usuelles.

3.7 Hétérogénéité du portefeuille et mélanges


de lois de probabilité
3.7.1 Contexte
Jusqu’ici, nous avons supposé que les risques en portefeuille
étaient indépendants et identiquement distribués. Dans la plupart
des assurances vendues au grand public, la dépendance entre risques
assurés n’est pas un problème majeur. En assurance RC automo-
bile, RC familiale ou vol, elle est la plupart du temps négligeable.
En assurance incendie, elle peut être aisément maı̂trisée grâce à une
politique de souscription adéquate ou un programme de réassurance
approprié. Dans certains cas cependant, l’actuaire doit examiner soi-
gneusement les conséquences de la dépendance; on peut par exemple
citer le volet “tremblement de terre” ou “inondation” de l’assu-
rance incendie. L’hypothèse d’identique distribution est cependant
beaucoup moins évidente. On sent bien en effet que certaines ca-
ractéristiques des risques influencent la probabilité de survenance
d’un sinistre ou l’étendue de ses conséquences.
Une des grandes caractéristiques de l’assurance réside dans le
fait que tous les individus ne sont pas égaux devant le risque: cer-
tains ont une propension à provoquer des sinistres largement plus
élevés ou plus fréquents que d’autres. Lorsque ces assurés se re-
trouvent mélangés dans le portefeuille de la compagnie, il en résulte
une certaine hétérogénéité: des individus à faible niveau de risque en
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 147

côtoient d’autres dont le niveau de risque est plus élevé. L’assureur


peut remédier partiellement à ce problème en partitionant le porte-
feuilles en classes de risque plus homogènes. Comme nous le verrons
dans le Tome II, il utilisera pour ce faire les caractéristiques obser-
vables des assurés influençant significativement le risque. Même s’il
éclate le portefeuille en sous-classes, ces dernières n’en demeurent
pas moins souvent très hétérogènes. Cette hétérogénéité des risques
couverts par l’assureur est rendue par les modèles de mélange que
nous étudions dans cette section.

3.7.2 Un exemple simple...


Un portefeuille avec deux types de risques

Reprenons l’Exemple 2.3.2 et supposons que le risque de perte


ou de vol des bagages varie en fonction du lieu de destination du
voyageur. Pour les pays du groupe A, disons, l’assureur devra verser
l’indemnité forfaitaire de 250e dans 10% des cas, en moyenne, tandis
que pour les pays du groupe B, le forfait sera versé dans 20% des
cas. Ainsi, pour les voyageurs à destination d’un pays du groupe A,
la dépense de l’assureur est représenté par la variable aléatoire

0, avec la probabilité 0.9,
SA =
250e , avec la probabilité 0.1

tandis que pour un voyageur à destination d’un pays du groupe B,


la dépense passe à

0, avec la probabilité 0.8,
SB =
250e , avec la probabilité 0.2.

Primes pures

L’assureur devrait donc réclamer une prime pure égale à E[S A ] =


25e pour un voyageur en partance pour un pays du groupe A,
contre E[SB ] = 50e pour un autre à destination d’un pays du
groupe B. Supposons que 50% des voyages se fassent vers des pays
du groupe A, et 50% vers des pays du groupe B. Dans le portefeuille
se côtoient donc 50% des assurés qui occasionnent une dépense de
même loi que SA , l’autre moitié occasionant une dépense de même
loi que SB . Ce portefeuille est donc hétérogène, mélangeant deux
types de risques.
148 Chapitre 3. La prime pure

Encaissement pur global


L’encaissement global de la compagnie pour ce portefeuille est
de
nA E[SA ] + nB E[SB ] = 75nA ,
où nA représente le nombre de polices couvrant des voyageurs à
destination d’un pays du groupe A, et n B = nA celui des polices
couvrant un voyageur à destination d’un pays du groupe B.

Portefeuille homogène associé


Au niveau de la prime pure, rien ne distingue ce portefeuille d’un
portefeuille homogène au sein duquel les charges de sinistre relatives
à chacune des polices seraient de la forme

0, avec la probabilité 0.85,
SAB =
250e , avec la probabilité 0.15.

En effet, l’encaissement pur total de ce portefeuille homogène vaut

(nA + nB )37.5 = 75nA .

Considérer le portefeuille homogène revient à renoncer à différencier


les assurés en fonction de leur lieu de destination, et donc du risque
qu’ils représentent 1 . Si on reconnaı̂t l’hétérogénéité du portefeuille,
on réclame 25e ou 50e selon la destination, alors que gommer cette
différence revient à appliquer une prime uniforme de 37.5e à tous
les assurés du portefeuille.

Conséquences de l’hétérogénéité du portefeuille


Cet exemple simple nous permet d’introduire plusieurs concepts
fondamentaux:
1. lorsqu’une prime uniforme est réclamée aux assurés d’un por-
tefeuille hétérogène, une certaine solidarité apparaı̂t. En ef-
fet, la prime de 37.5e payée par un assuré dont la destina-
tion est un pays du groupe A peut se décomposer en une
1. Nous insistons sur le fait qu’il n’y a pas une pratique correcte et une autre
incorrecte. L’actuaire décide du modèle en fonction du degré de solidarité qu’il
désire induire dans le portefeuille. Son but n’est pas de retenir d’office le modèle
collant le mieux à la réalité. Décréter les Si indépendantes et identiquement
distribuées alors que ce n’est pas le cas revient à induire le niveau maximal
de solidarité dans le portefeuille, ce qui n’est pas nécessairement une mauvaise
chose.
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 149

somme de 25e qui est le prix de son risque et un supplément


de 12.5e qui servira à diminuer artificiellement la prime des
voyageurs à destination d’un pays du groupe B. Les 25e sont
payés en vertu de la mutualisation du risque: ils serviront à
dédommager les sinistres touchant des assurés au profil iden-
tique (i.e. voyageant dans un pays du groupe A). Par contre,
les 12.5e reflètent la solidarité que l’assureur a induite au ni-
veau du portefeuille en uniformisant le montant de la prime.
2. lorsqu’une prime uniforme est réclamée aux assurés d’un por-
tefeuille hétérogène, la solidarité ainsi induite fait dépendre
les résultats de l’assureur de la structure du portefeuille. En
effet, imaginons que les assurés voyageant à destination d’un
pays du groupe A aient une bonne connaissance de leur risque,
remarquent qu’ils sont sur-tarifés et décident de ne plus se cou-
vrir, jugeant le produit trop onéreux. L’assureur n’aurait alors
plus en portefeuille que des assurés dont la destination est un
pays du groupe B. Son encaissement pur s’élèverait à n B 37.5e
et ne suffirait donc pas à compenser une perte attendue de
nB 50e . La prime collective de 37.5e est donc fonction de la
composition du portefeuille (ici du fait que 50% des voyages
se font à destination d’un pays du groupe A). La tarification
n’est donc correcte que si la composition du portefeuille de-
meure identique.
3. L’assureur peut difficilement maintenir un tarif uniforme sur
un marché ou des concurrents différencient les risques et ap-
pliquent un tarif équilibré au sein de chaque classe de risques
ainsi définie. Dans notre exemple, supposons qu’une compa-
gnie C1 , seule sur le marché, réclame 37.5e à chaque assuré.
Une nouvelle compagnie C2 fait son entrée et différencie le
montant des primes selon le pays de destination. Les assurés à
destination d’un pays du groupe A devraient tous quitter C 1
pour C2 . Les résultats de C2 seront équilibrés, mais ceux de
C1 se détérioreront rapidement, les assurés à destination d’un
pays du Groupe A n’étant plus là pour subsidier le rabais oc-
troyé aux assurés voyageant à destination d’un pays du groupe
B. La compagnie C1 n’aura d’autre alternative que de relever
son tarif uniformément à 50e (si elle parvient à surmonter la
perte de nB 12.5e qu’elle subira la première année où les as-
surés en partance pour un pays du groupe A la quitteront).
Ainsi le marché, c’est-à-dire les compagnies C 1 et C2 , aura re-
connu la différence de risque en fonction du lieu de destination
150 Chapitre 3. La prime pure

soit explicitement (comme C2 qui propose un tarif différencié),


soit implicitement (comme C1 dont la structure tarifaire est
telle qu’elle s’adresse seulement à un segment du marché).
Mentionnons tout de même que la réalité est plus subtile. Les
acteurs du marché ne se différencient pas que par les tarifs
qu’ils pratiquent, mais aussi par les services et l’étendue des
garanties qu’ils proposent, par le public auquel ils s’adressent,
etc. De plus, les assurés ne se résoudront à quitter leur assureur
que si la réduction de prime qu’ils obtiendront de la sorte est
suffisamment conséquente (que pour justifier les démarches à
effectuer). Le choix de l’assureur peut également être guidé
par des considérations idéologiques, s’agissant par exemple de
mutuelles.

Lien avec les modèles de mélange


La variable aléatoire S qui représente les coûts des sinistres
générés par une police du portefeuille mélangeant deux types de
risques peut encore se modéliser comme un mélange de deux lois
de Bernoulli (au facteur 250 près), i.e. conditionnellement à Q = q,
S ∼ 250Ber(q) et

0.1, avec la probabilité 12 ,
Q=
0.2, avec la probabilité 12 .
Les modèles de mélange fournissent donc l’outil approprié pour trai-
ter l’hétérogénéité des portefeuilles d’assurance.
De façon générale, on rend compte de l’hétérogénéité en intro-
duisant un effet aléatoire Θ représentant le niveau de risque inconnu
de l’assuré. On obtient ainsi un modèle de mélange, défini comme
suit.
Définition 3.7.1. Supposons que conditionnellement à {Θ = θ},
la loi de la variable aléatoire X soit décrite par la fonction de
répartition F (·|θ), i.e.
Pr[X ≤ x|Θ = θ] = F (x|θ), x ∈ IR.
Si Θ est inconnu, alors la fonction de répartition de X vaut
h i Z
E Pr[X ≤ x|Θ] = F (x|θ)dFΘ (θ),
θ∈IR

soit une moyenne pondérée des fonctions de répartition condition-


nelles F (·|θ) avec des poids déterminés par la fonction de répartition
FΘ de Θ.
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 151

3.7.3 Mélanges de Poisson


Contexte
Empiriquement, les actuaires ont constaté que, bien que la loi
de Poisson rende théoriquement bien compte du nombre de sinistres
causés par chaque assuré, elle modélise mal le nombre de sinistres
touchant une police du portefeuille. Ceci est principalement dû à
l’hétérogénéité des portefeuilles d’assurance. Si on prend l’exemple
de la RC automobile, chaque assuré a un mode de conduite propre,
des habitudes de déplacement bien à lui, et conduit dans un environ-
nement dépendant de ses activités sociales et professionnelles. Dès
lors, les nombres de sinistres causés par les assurés du portefeuille
varieront plus que ne peut le rendre le modèle de Poisson: en effet, à
la variabilité naturelle du nombre des sinistres associée au modèle de
Poisson s’ajoute une variabilité due à l’hétérogénéité du portefeuille.
Considérer que le nombre N de sinistres causés par un assuré
du portefeuille suit la loi Poi(λ) revient à postuler implicitement
que le portefeuille est homogène: tous les assurés ont un profil de
risque semblable (résumé dans la fréquence annuelle de sinistre λ).
En pratique, ce cas de figure est clairement peu probable: les assurés
ne sont pas tous égaux devant le risque comme nous l’avons expliqué
plus haut. L’idée est de refléter cette hétérogénéité du portefeuille
en considérant que le nombre moyen de sinistres peut varier d’un
assuré à l’autre: il devient ainsi une variable aléatoire λΘ, où Θ
caractérise les oscillations autour du nombre moyen de sinistre λ
(avec E[Θ] = 1).

Définition
Ceci nous amène à considérer des mélanges de lois de Poisson.
Une loi mélange traduit le fait que la population qui nous intéresse
résulte du mélange d’individus différents.
Définition 3.7.2. La variable aléatoire de comptage N est de loi
de Poisson mélange de moyenne λ et de niveau de risque relatif Θ
lorsque
 
(λΘ)k
Pr[N = k] = E exp(−λΘ)
k!
Z +∞
(λθ)k
= exp(−λθ) dFΘ (θ), k ∈ IN, (3.15)
θ=0 k!
où FΘ est la fonction de répartition de Θ, supposé satisfaire la
contrainte E[Θ] = 1. Dorénavant, nous noterons MPoi(λ,F Θ ) ou
152 Chapitre 3. La prime pure

par abus de notation simplement MPoi(λ,Θ), la loi de Poisson


mélange de moyenne λ et dont le niveau de risque relatif est décrit
par FΘ ; par extension, nous noterons de la même façon toute va-
riable aléatoire de loi (3.15).
Techniquement, nous désirons pouvoir travailler avec le couple
aléatoire (N,Θ); pour ce faire, nous définissons sa loi de probabilité
jointe à partir de
Z t
(λθ)n
Pr[Θ ≤ t,N = n] = exp(−λθ) dFΘ (θ),
θ=0 n!
pour t ∈ IR+ et n ∈ IN.
Exemple 3.7.3. Le modèle le plus simple répondant à ces caractéristiques
est connu sous le nom de modèle “bons risques – mauvais risques”.
Il revient à considérer que le portefeuille est constitué de deux types
de risques: les bons, pour lesquels le nombre de sinistres obéit à la loi
Poi(λθ1 ), et les mauvais, pour lesquels le nombre de sinistres obéit
à la loi Poi(λθ2 ), avec θ2 > 1 > θ1 . Si la proportion de bons risques
est %, l’hypothèse ci-dessus revient à

θ1 , avec une probabilité %,
Θ=
θ2 , avec une probabilité 1 − %,
où les paramètres θ1 , θ2 et % sont contraints par
E[Θ] = %θ1 + (1 − %)θ2 = 1.
La probabilité qu’une police (dont on ne sait pas s’il s’agit d’un bon
ou d’un mauvais risque) donne lieu à k sinistres durant la période
de référence est alors de
(λθ1 )k (λθ2 )k
Pr[N = k] = % exp(−λθ1 ) + (1 − %) exp(−λθ2 ) ,
k! k!
en vertu de (3.15)
L’exemple ci-dessus illustre bien le lien entre le mélange et l’hétérogénéité
du portefeuille. Bien entendu, ne diviser les assurés qu’en deux
catégories comme dans l’exemple ci-dessus peut s’avérer simpliste
et la multiplication des catégories mène immanquablement à une
surparamétrisation du modèle, qui heurte le principe de parcimo-
nie. Dès lors, on considère souvent que le profil de risque évolue
continûment dans le portefeuille (i.e., si on range les assurés du pire
au meilleur, on obtient un continuum); Θ devient alors une variable
aléatoire continue, de densité de probabilité f Θ et
Z +∞
(λθ)k
Pr[N = k] = exp(−λθ) fΘ (θ)dθ, k ∈ IN. (3.16)
θ=0 k!
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 153

Remarque 3.7.4. Sur le plan des principes, l’assureur confronté à


un nombre de sinistres de loi MPoi(λ,Θ) plutôt que Poi(λ) couvre
en fait un double aléa. Il assure en effet l’incertitude quant à la
qualité du risque (représentée par la fréquence de sinistre inconnue
λΘ) de même que celle entourant le nombre de sinistres lui-même
(aléa poissonnien).

Moments
Soit N une variable aléatoire de loi MPoi(λ,Θ). La moyenne de
N est donnée par
Z +∞ X +∞
!
(λθ)k
E[N ] = k exp(−λθ) dFΘ (θ)
θ=0 k!
k=0
Z +∞
= λ θdFΘ (θ) = λ.
θ=0

En ce qui concerne la variance, il vient


Z +∞ X +∞
!
(λθ) k
V[N ] = k 2 exp(−λθ) dFΘ (θ) − λ2
θ=0 k!
k=0
Z +∞
= (λθ + λ2 θ 2 )dFΘ (θ) − λ2
θ=0
= λ + λ2 V[Θ].

Comme
V[N ] = E[N ] + λ2 V[Θ] > E[N ]
pour autant que Θ ne soit pas constant. Tout mélange de Poisson
implique donc une surdispersion des données.

Fonction de queue
La fonction de queue de N ∼ MPoi(λ,Θ) peut encore se mettre
sous la forme
Z +∞
X (λθ)k
Pr[N > n] = exp(−λθ) dFΘ (θ)
θ∈IR+ k=n+1 k!
Z +∞ 
X 
λ(λθ)k−1 λ(λθ)k
= exp(−λθ) − exp(−λθ) F Θ (θ)dθ
θ∈IR+ k=n+1 (k − 1)! k!
Z
(λθ)n
= λ exp(−λθ) F Θ (θ)dθ.
θ∈IR+ n!
154 Chapitre 3. La prime pure

Fonction génératrice des probabilités


La fonction génératrice des probabilités de N ∼ MPoi(λ,Θ) et
la tranformée de Laplace de Θ sont liées par la formule
Z +∞
ϕN (z) = exp(λθ(z − 1))fΘ (θ)dθ = LΘ (λ(1 − z)). (3.17)
θ=0

Exemple 3.7.5 (Loi binomiale négative). Si nous considérons


que Θ ∼ Gam(a,a), on obtient à partir de (3.17) et du Tableau 3.4
 −α
λ(1 − z)
ϕN (z) = 1+ ,
α

qui est en vertu du Tableau 3.3 la fonction génératrice des probabi-


lités associée à la loi N Bin(α,α/(α + λ)).

Identifiabilité
Les mélanges de Poisson sont identifiables, i.e. si N 1 ∼ MPoi(λ,Θ1 )
et N2 ∼ MPoi(λ,Θ2 ) alors

N1 =loi N2 ⇒ Θ1 =loi Θ2 .

Ainsi, dans le cadre de l’étude des mélanges de Poisson peut-on se


réduire à étudier les lois mélangeantes. Ceci provient du raisonne-
ment suivant, auquel nous donnons une portée générale.
Bien souvent lorsque N ∼ MPoi(λ,Θ), une espérance faisant
intervenir N peut se transformer en une espérance faisant intervenir
Θ, et inversément, i.e. ayant une fonction g, il est possible d’obtenir
une fonction g ∗ telle que l’identitié

E[g(Θ)] = E[g ∗ (N )]

soit vérifiée. Ceci est par exemple le cas lorsque toutes les dérivées
g (1) ,g (2) ,g (3) , . . . de g existent et sont positives. Dans ce cas,
Z +∞ (k)
X Z
g (0)
E[g(Θ)] = g(θ)dFΘ (θ) = θ k dFΘ (θ).
θ∈IR+ k! θ∈IR+
k=0

L’identité
+∞
X exp(−λθ)(λθ)`
(λθ)k =
(` − k)!
`=k
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 155

nous permet d’écrire


+∞ (k)
X +∞
g (0) X `! Pr[N = `]
E[g(Θ)] =
λk k! (` − k)!
k=0 `=k
(
+∞ X̀   (k) )
X ` g (0)
= Pr[N = `]
k λk
`=0 k=0

= E[g (N )]

en définissant la fonction g ∗ comme


X̀  `  g (k) (0)

g (`) = , ` ∈ IN.
k λk
k=0

Si nous prenons g(θ) = exp(tθ), la fonction g ∗ associée vaut

X̀  `  tk  
t `
g ∗ (`) = = 1 + .
k λk λ
k=0

Ainsi, en revenant au problème d’identifiabilité mentionné au début


de cette section, on a
 
∗ t
N1 =loi N2 ⇒ E[g (N1 )] = ϕN1 1 +
λ
 
t
= ϕ N2 1 + = E[g ∗ (N2 )]
λ
⇒ MΘ1 (t) = E[g(Θ1 )] = E[g(Θ2 )] = MΘ2 (t)
⇒ Θ1 =loi Θ2 .

3.7.4 Théorème de Shaked


Les mélanges de Poisson jouissent d’une propriété très impor-
tante établie par Shaked (1980) et connue comme le “Shaked’s
Two Crossings Theorem”.
Propriété 3.7.6. Si N ∼ MPoi(λ,Θ) alors il existe deux valeurs
entières 0 ≤ k0 < k1 telle que
λk
Pr[N = k] ≥ exp(−λ) pour k = 0,1, . . . ,k0 ,
k!
λk
Pr[N = k] ≤ exp(−λ) pour k = k0 + 1, . . . ,k1 ,
k!
λk
Pr[N = k] ≥ exp(−λ) pour k ≥ k1 + 1.
k!
156 Chapitre 3. La prime pure

Démonstration. Commençons par remarquer que le nombre de chan-


gements de signe de la séquence des
λk
Pr[N = k] − exp(−λ) , k ∈ IN,
k!
est le même que celui de la séquence des c(k), k ∈ IN, où
Pr[N = k]
c(k) = k −1
exp(−λ) λk!
Z  k
ξ
= exp(λ − ξ) dξ − 1.
ξ∈IR + λ
La fonction c(·) étant convexe, elle ne peut présenter plus de deux
changements de signe sur IN. Clairement, c(·) doit avoir au moins un
changement de signe. Montrons à présent que c(·) ne peut présenter
un seul changement de signe. En effet, dans ce dernier cas, nous
devrions avoir E[N ] < λ ou λ < E[N ], ce qui contredit E[N ] = λ.
Ce résultat indique que la superposition d’une erreur Θ à la
moyenne λ augmente la masse de probabilité accordée à 0: il y aura
donc plus de polices ne causant pas de sinistres dans le modèle de
Poisson mélange que dans le modèle de Poisson de même moyenne.
De plus, on constate que la masse de probabilité accordée aux grandes
valeurs (i.e. celles excédant k1 + 1) sera plus élevée dans le modèle
de Poisson mélange que dans le modèle de loi de Poisson de même
moyenne.

3.7.5 Lois de Poisson mélange composées


Définition
Si N ∼ MPoi(λ,Θ), on parle pour S de forme (2.14) de loi de
Poisson mélange composée, ce qui se notera S ∼ CMPoi(λ,F Θ ,F )
ou par abus de notation simplement S ∼ CMPoi(λ,Θ,F ).

Variance
Définissons l’indice de risque r2 comme
E[X12 ]
r2 = .
{E[X1 ]}2
Clairement, r2 ≥ 1 puisque
V[X1 ]
r2 − 1 =
{E[X1 ]}2
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 157

et r2 = 1 ⇔ X1 = constante. La variance de S ∼ CMPoi(λ,Θ,F )


est alors donnée par

V[S] = λE[X12 ] + λ2 {E[X1 ]}2 V[Θ]


r 
2
= {λE[X1 ]}2 + V[Θ] .
λ
De plus, le coefficient de variation de S est donné par
p r
V[S] r2
CV [S] = = + V[Θ].
E[S] λ
Comme r
r2
CV [Poi(λ)] = ,
λ
on constate que lorsque λ est élevé, CV [S] est dominé par le com-
portement de la loi mélangeante (traduit par V[Θ]).
On peut encore décomposer la variance de S comme suit pour
identifier les sources de la variabilité de la charge financière de l’as-
sureur:

V[S] = {E[X1 ]}2 V[Poi(λ)] + λV[X1 ] + λ2 {E[X1 ]}2 V[Θ]


≡ V1 + V2 + V3 .

Donnons une signification à chacun des trois termes intervenant dans


cette décomposition:
1. le premier terme V1 peut se voir comme V[Poi(λ)E[X1 ]], c’est-
à-dire comme la variance de la dépense de l’assureur si les
sinistres étaient constamment égaux à leur moyenne et si le
nombre de ceux-ci étaient de loi de Poisson.
2. le deuxième terme V2 peut se voir comme la contribution des
montants des sinistres X1 ,X2 , . . . à la variabilité totale V[S],
puisqu’il s’agit en fait de
" λ #
X
V Xi ,
i=1

en omettant le fait que λ pourrait ne pas être entier.


3. le troisième et dernier terme V3 peut être considéré comme la
variabilité supplémentaire induite par la loi mélangeante.
Pour de petites valeurs de λ, c’est la variabilité des sinistres qui
prévaut, tandis que pour de grandes valeurs de λ, c’est l’effet de la
mélangeante qui domine.
158 Chapitre 3. La prime pure

Comportement asymptotique du rapport sinistre/prime dans


un modèle de Poisson mélange composé
Supposons le portefeuille hétérogène et le nombre de sinistre
N ∼ MPoi(λ,Θ). La charge totale S des sinistres générés par ce
portefeuille est alors de loi CMPoi(λ,Θ,F ). La variance du ratio
“sinistres sur primes” (noté S/P) en encaissement pur vaut dans ce
cas
 
S 1
V = V[S]
E[S] λ2 (E[X1 ])2
λE[X12 ] + λ2 (E[X1 ])2 V[Θ]
=
λ2 (E[X1 ])2
→ V[Θ] si λ → +∞. (3.18)
Ainsi, le danger pour de grands portefeuilles provient essentiellement
de la loi mélangeante, c’est-à-dire de l’hétérogénéité du portefeuille.
Lorsqu’il n’y a pas d’hétérogénéité (i.e. V[Θ] = 0 et Θ = 1),
c’est-à-dire S ∼ CPoi(λ,F ), on a
 
S
V → 0 si λ → +∞,
E[S]
de sorte que la variance du ratio S/P tend vers 0 pour de grands por-
tefeuilles homogènes. Dès lors, l’inégalité de Bienaymé-Tchebycheff
nous permet d’affirmer que
S
→proba 1, lorsque λ → +∞.
E[S]
Ceci traduit la diminution du risque par agrégation, puisque le
résultat de l’assureur est d’autant plus stable que le portefeuille
est grand (i.e. que λ augmente).
En examinant la limite (3.18), on constate que S/E[S] reste
aléatoire même dans un grand portefeuille lorsque S ∼ CMPoi(λ,Θ,F ):
la limite précitée suggère que S/E[S] se comporte comme Θ lorsque
λ → +∞. C’est précisément ce que nous allons mettre en évidence
dans cette section.
Pour ce faire, nous aurons besoin de la convergence en loi, différant
de la convergence en probabilité qui a été utilisée dans la loi des
grands nombres (Propriété 3.5.2).
Définition 3.7.7. Une suite de variables aléatoires {T n , n = 1,2, . . .}
converge en loi vers la variable aléatoire T , ce qui se notera désormais
Tn →loi T , lorsque
Pr[Tn ≤ t] → FT (t), lorsque n → +∞,
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 159

en tout point t où FT est continue.


Les deux concepts de convergence utilisés jusqu’ici, à savoir → proba
et →loi , ne sont pas équivalents. En fait, la convergence en probabi-
lité est plus forte que la convergence en loi: quelle que soit la suite
{Tn , n = 1,2, . . .},

Tn →proba T ⇒ Tn →loi T.

Nous sommes à présent en mesure de démontrer le résultat sui-


vant.
Propriété 3.7.8. Si S ∼ CMPoi(λ,Θ,F ) alors

S
→loi Θ, lorsque λ → +∞.
E[S]

Démonstration. Pour s’en convaincre, écrivons


" 2 # " " 2 ##
S S
E −Θ = E E − Θ Θ
E[S] E[S]
" "  2 ##
S S
= E E −E Θ Θ
E[S] E[S]
  
S
= E V Θ .
E[S]

Or,
 
S 1
V Θ = θ = V[S|Θ = θ]
E[S] E2 [S]
1
= λθE[X12 ],
{λE[X1 ]}2

de sorte que
    
S E[X12 ]
E V Θ = E Θ
E[S] λ{E[X1 ]}2
E[X12 ]
= → 0, lorsque λ → +∞.
λ{E[X1 ]}2

Nous en déduisons finalement que


" 2 #
S
E −Θ → 0, lorsque λ → +∞.
E[S]
160 Chapitre 3. La prime pure

L’inégalité de Markov garantit que



  S
S E E[S] − Θ

Pr
− Θ >  ≤
E[S] 
v "
u  2 #
1utE S
≤ −Θ
 E[S]
→ 0, lorsque λ → +∞.

Ainsi,
S
→proba Θ, lorsque λ → +∞
E[S]
S
⇒ →loi Θ, lorsque λ → +∞.
E[S]

La loi limite du ratio S/P n’est donc pas la loi normale, mais
bien la loi mélangeante décrivant l’hétérogénéité du risque fréquence:
même pour de très grands portefeuilles, S/E[S] reste bel et bien
aléatoire et d’autant plus dispersé que l’hétérogénéité du porte-
feuille, mesurée par V[Θ], sera élevée.

3.7.6 Mélanges d’exponentielles


Définition
Les mélanges exponentiels constituent une classe très souple de
lois de probabilité. Adopter un mélange exponentiel pour décrire le
montant des sinistres revient à considérer que les sinistres sont de
loi exponentielle négative, mais que leur moyenne est variable.
Définition 3.7.9. La variable aléatoire continue X est de loi mélange
d’exponentielles lorsqu’elle admet la fonction de répartition
Z
Pr[X ≤ x] = {1 − exp(−θx)} dFΘ (θ), (3.19)
θ∈IR+

x ∈ IR+ . Dorénavant, nous désignerons par MExp(F Θ ) ou simple-


ment par MExp(Θ) la loi dont la fonction de répartition est donnée
par (3.19).
La famille des mélanges d’exponentielles reflète des niveaux de
danger très différents pour l’assureur. Si Θ = θ on retrouve simple-
ment la loi exponentielle négative Exp(θ). Par contre, si Θ est de
3.7. Hétérogénéité du portefeuille et mélanges de lois
de probabilité 161

loi Gamma, on passe à la loi de Pareto, comme le montre l’exemple


suivant.
Exemple 3.7.10 (Loi de Pareto vue comme un mélange
d’exponentielles). Lorsque X ∼ MExp(Θ) et Θ ∼ Gam(α,τ ),
le mélange exponentiel correspond à la loi de Pareto. En effet, la
fonction de survie du mélange exponentiel est alors donnée par
Z
τα
Pr[X > x] = exp (−θ(x + τ )) θ α−1 dθ
Γ(α) θ∈IR+
 α Z
1 τ
= exp(−ξ)ξ α−1 dξ
Γ(α) x + τ ξ∈IR +
 α
τ
= ,
x+τ
ce qui est bien le fonction de survie associée au modèle Par(α,τ ).

Fonction de queue
Examinons à présent la fonction de queue associée à un mélange
exponentiel: on voit facilement que si X ∼ MExp(Θ) alors
Z
Pr[X > x] = exp(−θx)dFΘ (θ) = LΘ (x), x ∈ IR+ . (3.20)
θ∈IR+
Ainsi, la fonction de queue d’un mélange exponentiel apparaı̂t comme
la tranformée de Laplace de Θ. Ceci nous amène au résultat suivant.
Proposition 3.7.11. Une loi de probabilité est un mélange expo-
nentiel si, et seulement si, la fonction de queue associée est complètement
monotone.
Démonstration. Nous avons vu plus haut que si X ∼ MExp(Θ), les
dérivées de la fonction de queue (3.20) peuvent s’écrire
Z  k 
dk d
Pr[X > x] = exp(−θx) dFΘ (θ)
dxk θ∈IR+ dxk
Z
= (−1)k θ k exp(−θx)dFΘ (θ),
θ∈IR+
qui apparaı̂t bien comme une fonction complètement monotone.
Pour obtenir la réciproque, il suffit d’invoquer la Proposition 3.6.6.

La Proposition 3.7.11 a notamment pour conséquence que la den-


sité de probabilité associée à un modèle exponentiel est décroissante,
et présente donc un unique mode en 0. Ceci peut sembler restrictif
et explique pourquoi le modèle est souvent utilisé pour décrire le
montant des sinistres excédant une limite fixée.
162 Chapitre 3. La prime pure

Identifiabilité des mélanges exponentiels


Notez que l’unicité de la tranformée de Laplace garantit que si
X ∼ MExp(Θ1 ) et Y ∼ MExp(Θ2 )

X =loi Y ⇒ Θ1 =loi Θ2 ,

rendant ainsi le modèle identifiable; ceci permet d’étudier les mélanges


exponentiels par le biais de leur mélangeante.

Propriétés
Les mélanges exponentiels jouissent de bon nombre de propriétés
intéressantes. Afin d’établir celles-ci, rappelons les résultats suivants
à propos des fonctions complètement monotones (voyez Feller
(1950) pour plus de détails).
Lemme 3.7.12. Soient les fonctions g 1 et g2 : (0, + ∞) → [0, + ∞).
(i) Si g1 et g2 sont complètement monotones, leur produit g 1 g2 l’est
également.
(ii) Si g1 est complètement monotone et si g2 admet une dérivée
première complètement monotone alors g 1 ◦g2 est complètement
monotone. En particulier, exp(−g2 ) est complètement mono-
tone.
Propriété 3.7.13. Soient X1 ∼ MExp(Θ1 ) et X2 ∼ MExp(Θ2 ),
indépendantes. Alors,

Z = min{X1 ,X2 } ∼ MExp(Θ3 ) où Θ3 =loi Θ1 + Θ2 .

Démonstration. Clairement,

Pr[Z > t] = Pr[X1 > t] Pr[X2 > t];

la fonction de queue de Z apparaı̂t donc comme le produit de deux


fonctions complètement monotones et, en vertu du Lemme 3.7.12(i),
est aussi complètement monotone. La Proposition 3.7.11 nous per-
met alors d’affirmer que la loi de Z est effectivement un mélange
d’exponentielles. De plus,

Pr[Z > t] = LΘ3 (t)


= Pr[X1 > t] Pr[X2 > t] = LΘ1 (t)LΘ2 (t),

permet de conclure.
3.8. La prime pure en univers segmenté 163

Exemple 3.7.14. Considérons la famille de lois de probabilité dont


le taux de hasard est de la forme
α
rX (x) = θ + , x ∈ IR+ .
λ+x
Ce dernier apparaı̂t donc comme la somme du taux de hasard associé
à la loi exponentielle négative Exp(θ) et de celui associé à la loi de
Pareto Par(α,λ). Comme le taux de hasard de la variable aléatoire
Z = min{X1 ,X2 } est la somme des taux de hasard associés aux
variables aléatoires X1 et X2 , cette famille de loi peut donc se voir
comme celles du minimum entre X1 ∼ Exp(θ) et X2 ∼ Par(α,λ). En
vertu de la Propriété 3.7.13(i), cette famille est un mélange exponen-
tiel dont la loi mélangeante est la loi Gamma translatée. Ce modèle
peut être utilisé lorsque l’estimation des paramètres du modèle de
Pareto donne α < 2 (ce qui rend la variance infinie); le modèle de
Pareto peut être jugé trop sévère et on peut lui préférer le modèle
ci-dessus.

3.8 La prime pure en univers segmenté


3.8.1 Les techniques de segmentation
Définition de la segmentation
Les portefeuilles d’assurance sont le plus souvent hétérogènes.
C’est pourquoi depuis fort longtemps, la prime réclamée aux assurés
varie en fonction de caractéristiques propres à ceux-ci ainsi qu’en
fonction de leur sinistralité observée. On parle alors de segmentation.
Ce terme est actuellement considéré comme faisant partie du jargon
professionnel et peut être défini comme suit.
Définition 3.8.1. On qualifie de segmentation toute technique que
l’assureur utilise pour différencier la prime, et éventuellement aussi
la couverture, en fonction d’un certain nombre de caractéristiques
spécifiques du risque à assurer, et ce afin de parvenir à une meilleure
concordance entre les coûts qu’une personne déterminée met à charge
de la collectivité des preneurs d’assurance et la prime que cette per-
sonne doit payer pour la couverture offerte. Dans certains cas, cela
peut impliquer que l’assureur refuse le risque à assurer.
Cette définition de la segmentation se rapporte aux assurances
privées. Il existe en effet d’autres formes de segmentation qui, comme
dans les assurances sociales, n’ont pas de lien direct avec les pres-
tations assurées mais visent plutôt à répartir la charge des primes
164 Chapitre 3. La prime pure

entre les preneurs d’assurance en utilisant des facteurs qui n’ont fon-
damentalement rien à voir avec le risque à assurer (comme le niveau
de rémunération, par exemple).

Techniques de segmentation
La segmentation ne se limite donc pas à la différenciation tari-
faire, bien connue de tous, mais comporte aussi la sélection du risque
à laquelle procède l’assureur lors de la conclusion du contrat (accep-
tation) ou en cours du contrat (sélection ultérieure). Les différentes
étapes de la segmentation peuvent donc se représenter comme suit:

Acceptation du risque

Tarification a priori
Imposition de franchises
ou de découverts obligatoires
Transformation du risque à assurer

Tarification a posteriori
Résiliation

En assurance automobile, on a typiquement une politique d’ac-


ceptation fixée par la compagnie, soit qu’elle se concentre sur cer-
tains segments du marché (les fonctionnaires par exemple), soit
qu’elle désire éviter certains profils. La compagnie peut assortir l’ac-
ceptation d’un risque de certaines transformation de celui-ci (en
imposant à l’assuré de suivre des cours de conduite défensive par
exemple), voire imposer certaines limitations de couverture, telles
que franchises ou découverts obligatoires. Elle fixe alors un mon-
tant de prime a priori, dépendant des caractéristiques de l’assuré.
Elle peut également imposer certains mécanismes de personnalisa-
tion a posteriori, parfois spécifiques à certaines catégories d’assurés
(par exemple, soumettre les jeunes conducteurs à des corrections a
posteriori plus sévères).

Hétérogénéité résiduelle
Par rapport au grand nombre de facteurs de risque existants,
seul un nombre réduit de ces facteurs peuvent dès lors être utilisés.
3.8. La prime pure en univers segmenté 165

Sur base de ces facteurs, on procède à une première forme de seg-


mentation. L’ensemble hétérogène initial des risques est divisé en
groupes plus ou moins homogènes. C’est l’objet des techniques de
tarification a priori, qui seront présentées dans le Tome II. Etant
donné que, lors de cette division, il n’est fait usage que d’un nombre
limité de facteurs de risque, des différences individuelles subsisteront
au sein de chaque groupe de risques.
Eu égard à l’hétérogénéité encore présente au sein d’un groupe
de risques, la différence dans les statistiques de sinistres des assurés
au sein d’une classe tarifaire ne doit pas seulement être attribuée au
hasard mais doit être considérée dans une certaine mesure comme
un reflet de l’influence des facteurs de risque qui n’ont pas été pris
en considération a priori.

Tarification d’expérience
La prise en considération de l’historique des sinistres donne lieu à
une deuxième forme de segmentation qui peut s’exprimer de différentes
manières:
1. en appliquant une tarification a posteriori au moyen d’un système
de type bonus-malus ou “d’experience-rating”;
2. en accordant des ristournes de prime en fonction de la sinis-
tralité observée;
3. en imposant une franchise variable qui croı̂t avec le nombre de
sinistres;
4. en utilisant la statistique des sinistres comme critère de sélection
ultérieure.
Nous reviendrons plus longuement sur ces questions dans le Tome
II.
Nous remarquons enfin que la personnalisation a posteriori consti-
tue une correction des manquements de la personnalisation a priori
et que, par conséquent, la mesure dans laquelle la statistique si-
nistres intervient, doit dépendre du degré de précision tarifaire qui
a été appliqué a priori.

Solidarité et segmentation
Nous avons vu que la méthode de calcul de la prime pure par
l’espérance mathématique reposait sur trois hypothèses: des risques
sembables, nombreux et suffisamment dispersés. En pratique, les
risques couverts par une compagnie d’assurance sont loin d’être sem-
blables. Songeons par exemple au risque RC automobile. On sent
166 Chapitre 3. La prime pure

bien qu’un jeune conducteur possédant une Porsche décapotable


rouge et habitant en grande agglomération est un risque très différent
du fonctionnaire retraité vivant en rase campagne. L’assureur doit
donc décider s’il souhaite différencier les primes que devront payer
ces deux individus. Dans l’affirmative, il en personnalisera le mon-
tant et évitera donc que les assurés dont le niveau de risque est le
plus bas subventionnent leurs semblables dont le niveau de risque
est plus élevé.
L’assureur pourrait donc désirer limiter la solidarité entre les
différentes catégories d’assurés et réclamer à chacun d’eux le prix
de leur couverture. Ce faisant, l’assureur groupera les risques sem-
blables en classes de risque au sein desquelles les assurés sont indis-
cernables du point de vue de l’information détenue par la compagnie.
Ce faisant, il réduira bien entendu les effectifs des classes. Donc, en
voulant mieux satisfaire une des hypothèses de la loi des grands
nombres, on en vient à s’écarter d’une autre.
Techniquement, l’actuaire travaillera conditionnellement aux ca-
ractéristiques des assurés. Il se demandera ainsi quelle est la fréquence
de sinistres de l’assuré sachant que celui-ci est âgé de 26 ans et
qu’il habite une grande agglomération. Lorsque l’effectif de certaines
classes de risque (i.e. l’ensemble des assurés présentant les même ca-
ractéristiques) est trop faible, l’actuaire aura recours à des modèles
de régression pour établir les tarifs. Les lois conditionnelles et leurs
moments seront donc fort importants dans ce cadre.

3.8.2 L’espérance conditionnelle

Définition pour des variables de comptage

Le cas discret ne pose aucun problème. Etant donné un couple


(N1 ,N2 ) de variables aléatoires de comptage, l’espérance condition-
nelle de N2 sachant N1 = n1 est donnée par

X
E[N2 |N1 = n1 ] = n2 Pr[N2 = n2 |N1 = n1 ].
n2 ∈IN

Exemple 3.8.2 (Suite de l’Exemple 2.8.3). Caclulons l’espérance


3.8. La prime pure en univers segmenté 167

conditionnelle de N2 sachant N1 = n1 :

E[N2 |N1 = n1 ]
X
= E[N2 |N1 = n1 ,M = k] Pr[M = k|N1 = n1 ]
k∈IN
Xn1
Pr[N1 = n1 |M = k] Pr[M = k]
= E[N2 |M = k]
Pr[N1 = n1 ]
k=0
n1 
X 
n1 λn1 −k µk µ
= (k + λ2 ) 1 = n1 + λ2 .
k (λ1 + µ)n1 λ1 + µ
k=0

Cette dernière évolue donc linéairement en n 1 .

Définition pour des variables aléatoires continues


Passons à présent à un couple (X1 ,X2 ) de variables aléatoires
continues de densité fX . Si nous voulons définir E[X1 |X2 = x2 ],
nous utiliserons la densité conditionnelle obtenue en (2.13) et nous
poserons
Z
E[X1 |X2 = x2 ] = x1 fX1 (x1 |x2 )dx1 .
x1 ∈IR

Définition dans le cas mixte


Ayant un couple mixte (X,N ) où X est à valeurs dans IR et N
dans IN, il vient
Z
E[X|N = n] = xf1|2 (x|n)dx
x∈IR+

et X
E[N |X = x] = nf2|1 (n|x).
n∈IN

Exemple 3.8.3. Si N ∼ MPoi(λ,Θ), la fonction de répartition de


Θ sachant que N = n, notée FΘ (·|n),

Pr[Θ ≤ t,N = n]
FΘ (t|n) =
Pr[N = n]
Rt (λθ)n
θ=0 exp(−λθ) n! dFΘ (θ)
= R (λθ)n
θ∈IR+ exp(−λθ) n! dFΘ (θ)
Rt
exp(−λθ)θ ndFΘ (θ)
= R θ=0 .
n
θ∈IR+ exp(−λθ)θ dFΘ (θ)
168 Chapitre 3. La prime pure

On peut alors en calculer l’espérance:


Z
E[Θ|N = n] = θdFΘ (θ|n)
θ∈IR+

qui donne finalement


Rt
exp(−λθ)θ n+1 dFΘ (θ)
E[Θ|N = n] = Rθ=0 n
.
θ∈IR+ exp(−λθ)θ dFΘ (θ)

Remarque 3.8.4. Parfois, on parle de l’espérance conditionnelle


de la variable aléatoire X sachant qu’un événement E s’est produit,
ce qui se notera E[X|E]. Il s’agit en fait de la moyenne associée à
la fonction de répartition

FX (x|E) = Pr[X ≤ x|E], x ∈ IR.

Propriétés de l’espérance conditionnelle


On vérifie aisément que l’espérance conditionnelle possède les
propriétés suivantes: quelles que soient les variables aléatoires X 1 ,
X2 et X3 , et la constante réelle c,
(i) E[c|X1 = x1 ] = c quel que soit x1 ∈ IR.
(ii) E[X1 + X2 |X3 = x3 ] = E[X1 |X3 = x3 ] + E[X2 |X3 = x3 ] quel
que soit x3 ∈ IR.
(iii) E[cX1 |X2 = x2 ] = cE[X1 |X2 = x2 ], quel que soit x2 ∈ IR.
(iv) quelle que soit la fonction g, E[g(X 1 ,X2 )|X2 = x2 ] = E[g(X1 ,x2 )|X2 =
x2 ] quel que soit x2 ∈ IR.
(v) si X1 et X2 sont indépendantes alors E[X1 |X2 = x2 ] = E[X1 ].

Espérance conditionnelle vue comme une variable aléatoire


A moins que X1 et X2 ne soient indépendantes, la loi de X 1
sachant X2 = x2 dépend de x2 . En particulier, E[X1 |X2 = x2 ] est
une fonction de x2 , i.e.

E[X1 |X2 = x2 ] = h∗ (x2 ).

On pourrait ainsi s’intéresser à la variable aléatoire

h∗ (X2 ) = E[X1 |X2 ].

Propriété 3.8.5. La variable aléatoire E[X 1 |X2 ] a même moyenne


que X1 : h i
E E[X1 |X2 ] = E[X1 ].
3.8. La prime pure en univers segmenté 169

Démonstration. Lorsque X1 et X2 sont continues, cette égalité s’établit


comme suit:
h i Z
E E[X1 |X2 ] = E[X1 |X2 = x2 ]f2 (x2 )dx2
x2 ∈IR
Z Z 
= x1 f1|2 (x1 |x2 )dx1 f2 (x2 )dx2
Zx2 ∈IR Z x1 ∈IR
= x1 fX (x1 ,x2 )dx1 dx2
x2 ∈IR x1 ∈IR
Z
= x1 f1 (x1 )dx1 = E[X1 ].
x1 ∈IR

Le raisonnement est similaire dans les cas discret et mixte.

Caractéristique de l’espérance conditionnelle


Epinglons à présent une caractéristique remarquable de l’espérance
conditionnelle, qui peut être prise comme définition générale de ce
concept.
Propriété 3.8.6. Quelle que soit la fonction h : IR → IR, nous
avons h  i
E h(X2 ) X1 − E[X1 |X2 ] = 0.

Démonstration. La Propriété 3.8.5 nous permet d’écrire


h  i
E h(X2 ) X1 − E[X1 |X2 ]
h h  ii
= E E h(X2 ) X1 − E[X1 |X2 ] X2
h h ii
= E h(X2 )E X1 − E[X1 |X2 ] X2 = 0,

ce qui achève la vérification du résultat annoncé.

On peut voir X1 −E[X1 |X2 ] comme un résidu (c’est-à-dire comme


la partie de X1 que ne parvient pas à expliquer X2 ). La Propriété
3.8.6 traduit alors l’orthogonalité entre tout prédicteur h(X 2 ) et le
résidu X − E[X1 |X2 ], relation d’orthogonalité signifiant que X 2 ne
peut plus rien expliquer de ce résidu. Ceci garantit que E[X 1 |X2 ]
est le meilleur prédicteur de X1 au sens des moindres carrés, comme
l’indique le résultat suivant.
Propriété 3.8.7. La variable aléatoire h ∗ (X2 ) = E[X1 |X2 ] est celle
minimisant E[(X1 − h(X2 ))2 ] sur toutes les fonctions h.
170 Chapitre 3. La prime pure

Démonstration. Ecrivons

E[(X1 − h(X2 ))2 ] = E[(X1 − E[X1 |X2 ] + E[X1 |X2 ] − h(X2 ))2 ]
= E[(X1 − E[X1 |X2 ])2 ] +E[(E[X1 |X2 ] − h(X2 )2 ]
| {z }
indépendant de h
+2 E[(X1 − E[X1 |X2 ])(E[X1 |X2 ] − h(X2 ))]
| {z }
=0 par définition de l’espérance conditionnelle

sera minimum lorsque h(X2 ) = E[X1 |X2 ].


Il n’y a bien entendu aucune raison de se limiter à une seule
variable conditionnante, et on peut considérer un vecteur X de di-
mension n et définir E[X1 |X2 , . . . ,Xn ].
Définition 3.8.8. Considérons un vecteur aléatoire X de dimen-
sion n. L’espérance conditionelle E[X 1 |X2 , . . . ,Xn ] de X1 sachant
X2 , . . . ,Xn est la variable aléatoire h∗ (X2 , . . . ,Xn ) telle que l’égalité
 
E h(X2 , . . . ,Xn ){X1 − h∗ (X2 , . . . ,Xn )} = 0, (3.21)

est vérifiée pour toute fonction h : IR n−1 → IR.


Les variables (ou vecteurs) aléatoires apparaissant derrière la
barre conditionnante | sont supposées être groupées en un seul vec-
teur. On peut alors aisément généraliser la Propriété 3.8.9 comme
suit.
Propriété 3.8.9. La variable aléatoire h ∗ (X2 , . . . ,Xn ) = E[X1 |X2 , . . . ,Xn ]
est la fonction de X2 , . . . ,Xn minimisant E[(X1 − h(X2 , . . . ,Xn ))2 ]
sur toute les fonctions h : IR n−1 → IR.

Variance conditionnelle
Ayant un couple (X1 ,X2 ), on définit la variance de X1 sachant
que l’événement {X2 = x2 } est réalisé comme
h 2  i
V[X1 |X2 = x2 ] = E X1 − E[X1 |X2 = x2 ] X2 = x2 .

Ainsi peut-on définir la fonction v(x 2 ) = V[X1 |X2 = x2 ] et s’intéresser


à la variable aléatoire

v(X2 ) = V[X1 |X2 ].

Propriété 3.8.10 (Décomposition de la variance). Quelles que


soient les variables aléatoires X 1 et X2 ,
h i h i
V[X1 ] = E V[X1 |X2 ] + V E[X1 |X2 ] .
3.8. La prime pure en univers segmenté 171

Démonstration. En suivant le raisonnement qui a mené à l’optima-


lité de l’espérance conditionnelle au sens des moindres carrés dans
la Propriété 3.8.7, on obtient

E[(X1 − E[X2 ])2 ] = E[(X1 − E[X1 |X2 ])2 ] + E[(E[X1 |X2 ] − E[X2 ])2 ]
   
= E V[X1 |X2 ] + E (E[X1 |X2 ] − E[X2 ])2 ,

ce qui achève la vérification.

Tout comme pour l’espérance conditionnelle, nous pouvons condi-


tionner par rapport à plusieurs variables aléatoires (donc par rapport
à un vecteur aléatoire), et définir
h 2  i
V[X1 |X2 , . . . ,Xn ] = E X1 − E[X1 |X2 , . . . ,Xn ] X2 , . . . ,Xn .

Une adaptation évidente du raisonnement tenu dans la preuve de la


Propriété 3.8.10 montre que la décomposition
h i h i
V[X1 ] = E V[X1 |X2 , . . . ,Xn ] + V E[X1 |X2 , . . . ,Xn ]

est valable.

3.8.3 Personnalisation des primes


Principe
L’actuaire peut décider de personnaliser le montant des primes.
Pour ce faire, il utilisera les caractéristiques des assurés qu’il connaı̂t,
résumées dans un vecteur X, disons. Au nombre de celles-ci, on
comptera par exemple l’âge, le sexe, le domicile, l’état-civil, la pro-
fession, . . . , de l’assuré, ainsi que des caractéristiques du bien assuré
(valeur, . . . ), le type de contrat (franchise, durée, . . . ), ou encore le
passé sinistres. La prime sera alors une fonction g(X) de ces ca-
ractéristiques.
En début de période, l’assureur déterminera donc le montant
de la prime à l’aide des caractéristiques du risque qu’il juge per-
tinentes (et qu’il a intégrées dans son tarif). On pourrait fort bien
imaginer que pour des raisons commerciales, l’assureur décide volon-
tairement de ne pas tenir compte de certains facteurs déterminants.
Ceci engendre alors des subsidiations croisées entre catégories d’as-
surés, que l’actuaire doit être à même de mesurer. Dans ce cas, il
est également utile de conserver une trace de la prime “exacte” dont
l’assuré aurait dû s’acquitter s’il n’y avait pas eu de simplification
172 Chapitre 3. La prime pure

commerciale (c’est là l’objet du tarif technique, qui peut être fort
différent du tarif commercial).
Sur le plan des principes, il est intéressant de remarquer que
lorsque l’assureur tient compte compte des caractéristiques X pour
déterminer le montant de la prime pure, les primes futures dont l’as-
suré devra s’acquitter deviennent aléatoires. Si l’assuré déménage,
devient père de famille ou change de voiture, la prime qu’il paiera
à un assureur ayant intégré le domicile, le nombre d’enfants ou le
type de véhicule dans son tarif s’en trouvera modifiée. Il s’agit donc
d’une situation radicalement différente du cas classique où la prime
est constante.

Détermination de la prime pure en univers segmenté

Afin de déterminer quelle fonction g utiliser, nous choisirons celle


fournissant la meilleure approximation de la charge financière S de
l’assureur relatif à un assuré particulier, i.e. g doit minimiser

d2 (S,g(X)) = E[(S − g(X))2 ].

La Propriété 3.8.9 nous apprend que cette fonction est précisément


l’espérance conditionnelle de S sachant X. Ainsi, lorsque l’actuaire
décide de personnaliser le montant des primes, la prime pure n’est
plus l’espérance E[S] mais bien l’espérance conditionnelle E[S|X].
Intuitivement, cela revient à ne plus réclamer à chaque assuré la
charge moyenne de sinistre par police, mais à calculer ces moyennes
au niveau de chaque classe de risque (au sein desquelles les assurés
sont identiques sur base des critères de segmentation retenus par
la compagnie) et à les répercuter sur les assurés de cette classe.
En pratique, les choses sont cependant loin d’être aussi simples, car
certaines classes pouraient s’avérer fort peu peuplées. Or il n’est pas
possible d’estimer avec suffisamment de précision la charge moyenne
de sinistre de l’assureur relativement à une classe qui ne compte que
quelques polices. En poussant le raisonnement à l’extrême, si une
classe ne contient qu’un seul assuré qui n’a causé aucun sinistre au
cours de l’année, on conçoit mal que l’assureur le dispense de payer
sa prime l’année suivante. Il s’agit donc de construire en pratique
des modèles de régression, lesquels permettent de pallier le faible
effectif de certaines classes de risque. Les fréquences et les coûts
des sinistres des différentes catégories d’assurés en portefeuille sont
liées par des paramètres communs, qui seront estimés sur base des
observations relatives au portefeuille.
3.8. La prime pure en univers segmenté 173

Interaction entre les variables tarifaires

On entend souvent parler de l’impact marginal d’une variable ta-


rifaire, en dépit des interactions que celle-ci peut avoir avec d’autres
facteurs de risque. Si une compagnie remarque que la sinistralité
est particulièrement mauvaise dans une certaine région, doit-elle
conclure que cette région est dangereuse et relever le tarif des auto-
mobilistes qui y habitent? Pas nécessairement, en fait: le supplément
de sinistralité peut être dû à un facteur totalement différent (par
exemple, le peu d’expérience des conducteurs qui y habitent). Il
est même possible que cette région soit en fait moins risquée que les
autres, toutes autres choses étant égales. Ceci montre bien que l’effet
de chaque variable doit être apprécié indépendamment, c’est-à-dire
correction faite de l’impact de toutes les autres.

Dépendances vraie et apparente

Considérons la variable aléatoire I qui vaut 1 lorsque l’assuré


a déclaré au moins un sinistre au cours de la période considérée,
et 0 sinon. On parle de dépendance apparente entre I et une va-
riable tarifaire lorsque la probabilité d’avoir au moins un sinistre
dépend d’une variable corrélée avec cette variable tarifaire (qu’elle
soit cachée, comme l’agressivité au volant par exemple, ou obser-
vable, comme l’âge de l’assuré, si la structure d’âges diffère selon
cette 3ème variable). Dans ce dernier cas de figure, la dépendance
entre la variable tarifaire et le fait d’avoir ou pas des sinistres dis-
paraı̂trait si on tenait compte de la troisième variable. Pour s’en
convaincre, considérons le petit exemple suivant.
Exemple 3.8.11. Supposons que le fait de vivre en ville ou à la
campagne n’influence nullement le fait de causer au moins un si-
nistre, au contraire de l’expérience de conduite. Plus précisément,
supposons que les conducteurs novices ont trois fois plus de chances
de causer au moins un sinistre que leurs homologues plus expérimentés,
quel que soit leur lieu de résidence, i.e.

Pr[I = 1|novice, rural] = Pr[I = 1|novice, citadin]


= Pr[I = 1|novice]
= 0.15,
Pr[I = 1|expérimenté, rural] = Pr[I = 1|expérimenté, citadin]
= Pr[I = 1|expérimenté]
= 0.05.
174 Chapitre 3. La prime pure

Dans le portefeuille se côtoient 50% de novices et 50% d’expérimentés,


mais ceux-ci ne se répartissent pas également entre ville et cam-
pagne, i.e.

Pr[novice|citadin] = 1 − Pr[expérimenté|citadin] = 0.9,

et
Pr[novice|rural] = 1 − Pr[expérimenté|rural] = 0.1.

Ainsi y a-t-il beaucoup plus de jeunes conducteurs en ville qu’à la


campagne, où le public est plus âgé. Ceci aura la conséquence sui-
vante: quand nous effectuerons le test khi-carré pour déceler une
éventuelle association entre la zone où réside le preneur d’assu-
rance et le fait de causer ou non des sinistres, on aboutira vrai-
semblablement au rejet de l’hypothèse d’indépendance en raison de
l’influence de l’expérience de conduite sur les deux variables. Pour
s’en convaincre, calculons

Pr[I = 1|citadin] = Pr[I = 1|novice, citadin] Pr[novice|citadin]


+ Pr[I = 1|expérimenté, citadin] Pr[expérimenté|citadin]
= 0.14,

alors que

Pr[I = 1|rural] = Pr[I = 1|novice, rural] Pr[novice|rural]


+ Pr[I = 1|expérimenté, rural] Pr[expérimenté|rural]
= 0.06.

3.8.4 Segmentation, mutualisation et solidarité


Le plus souvent, la segmentation oppose les inconditionnels de
la mutualisation aux tenants de la solidarité. La différenciation tari-
faire fine, rendue possible par l’évolution technologique, peut déboucher
sur un accroissement des inégalités et une déstabilisation du corps
social. Segmentation et mutualisation ne sont cependant aucune-
ment antinomiques. La mutualisation consiste à mettre des risques
en commun. En l’absence de segmentation, ces risques seront portés
par des individus dont le profil est différent alors qu’après segmen-
tation, la mise en commun se fera entre individus égaux devant le
risque.
3.8. La prime pure en univers segmenté 175

Mutualisation des risques


Considérons la situation théorique dans laquelle l’assureur dis-
pose d’une information complète concernant tous les facteurs de
risque et, sur base de celle-ci, réclame à chaque assuré une prime
qui concorde parfaitement avec le coût moyen estimé des sinistres
que celui-ci met à charge de la collectivité. Ceci est la forme la plus
poussée de différenciation tarifaire.
Les primes qui sont payées par l’ensemble des assurés, seront
utilisées pour indemniser ceux qui ont un sinistre. Puisque, par hy-
pothèse, tous les facteurs de risque sont pris en compte dans le calcul
de la prime, personne ne sera systématiquement avantagé. On parle
de mutualisation des risques: les assurés étant rigoureusement iden-
tiques, les transferts de primes entre assurés visent à réparer les
conséquences du hasard.

Solidarité
L’assureur est bien entendu incapable d’inclure l’effet de tous les
facteurs influençant le risque dans le calcul de la prime. En pratique,
des différences individuelles subsisteront entre la prime qu’un assuré
doit payer et le coût estimé des sinistres qu’il provoquera.
Ceci donne lieu à des transferts entre assurés qui paient trop de
prime et d’autres qui contribuent trop peu. Une partie de la prime
payée par les assurés dont le niveau de risque est bas sera utilisée
pour dédommager les sinistres causés par les assurés de niveau de
risque plus élevé. La prime payée par ces assurés ne sert donc plus
exclusivement à dédommager les sinistres qui touchent des assurés
qui lui sont semblables mais aussi à diminuer artificiellement le mon-
tant de la prime payée par d’autres assurés dont le niveau de risque
est plus élevé.
On parle alors de solidarité: un tarif non ou insuffisamment
différencié induit des transferts de primes au sein des portefeuilles
et rendent le résultat de l’assureur dépendant de la structure du
portefeuille.

Limites à la segmentation
La question que soulève la segmentation concerne avant tout la
façon dont les primes doivent être réparties entre les assurés. Faut-
il imposer un effort uniforme, indépendant du risque que chacun
représente? Ou au contraire la contribution doit-elle être fonction
de ce risque? Faut-il faire intervenir d’autres éléments de distinction
176 Chapitre 3. La prime pure

(revenus, richesses personnelles, etc.)? On sent bien qu’on touche ici


à l’aspect social du marché de l’assurance: les assureurs vendent de
la sécurité et ne peuvent donc être assimilés à tout autre producteur
de biens. La réponse à ces questions dépendra du type de couverture
et de choix sociétaux.
Il semble évident qu’une intervention de l’Etat est souhaitable
dans certains cas. Lorsqu’il s’agit d’imposer certaines limites à la
segmentation, on opère souvent une double distinction, selon le type
d’assurance et selon la nature du facteur de risque.
En ce qui concerne le type de couverture, on peut faire une dis-
tinction entre assurances obligatoires ou non. Si la loi instaure l’obli-
gation de conclure une assurance déterminée (RC automobile, par
exemple), il est logique que le pouvoir politique examine dans quelle
mesure cette obligation peut être respectée dans la pratique. Ceci
signifie que tout candidat-preneur d’assurance doit avoir la garantie
de pouvoir contracter une assurance, et ce à un prix abordable.
La question de savoir s’il est opportun d’imposer des limita-
tions à la segmentation dans le domaine des assurances non obliga-
toires, est beaucoup plus délicate et il doit y être répondu de façon
nuancée. Certaines de ces assurances (RC vie privée, assurance in-
cendie, assurance solde restant dû, ...) couvrent des risques impor-
tants pour l’assuré, sa famille ou des tiers. Elles sont considérées
comme nécessaires par la plupart des consommateurs et sont dès
lors largement répandues. Un accès aisé à ces assurances est donc
certainement souhaitable. Pour garantir cette accessibilité, il faut un
certain contrôle de la part des autorités. Tout le monde s’accorde
cependant à ce que peu ou pas de limitations ne soient imposées
lorsque ces assurances volontaires revêtent un aspect de pur confort
(assurance vol, assurance voyages, dégâts matériels aux véhicules,
...).
En ce qui concerne la nature du facteur de risque, on distingue
les facteurs de risque que le consommateur peut influencer par son
libre choix ou comportement (tabagisme, consommation d’alcool
ou de drogue, pratique de sports dangereux, ...) de ceux qui ne
concordent pas ou dans une moindre mesure avec le libre choix de
l’assuré (sexe, âge, profil génétique, aptitude héréditaire, différences
régionales dans la jurisprudence, ...).
Concernant les facteurs de risque qui appartiennent à la première
catégorie, il y a un consensus sur le fait que ceux-ci peuvent être
intégralement utilisés comme critère de segmentation. Dans ces cas,
rien ne justifie qu’un preneur doive payer pour une autre personne
qui, volontairement, adopte un comportement à risque. Par contre,
3.8. La prime pure en univers segmenté 177

la différenciation des primes sur base des facteurs sur lesquels l’as-
suré n’a aucune prise ne fait pas l’unanimité.

3.8.5 Formalisation du concept de segmentation


Transfert de risques en univers non segmenté

Tentons à présent de formaliser le problème de la segmenta-


tion. Considérons un assuré soumis à un risque S, prélevé au ha-
sard au sein d’un portefeuille d’assurance. Supposons que toutes les
caractéristiques de l’assuré influençant le risque soient reprises dans
un vecteur aléatoire Ω = (Ω1 ,Ω2 , . . .). La notation “oméga” rappelle
que le vecteur du même nom contient toute l’information à propos
de l’assuré, qu’elle soit observable ou non par l’assureur.
On peut imaginer que l’assureur ne tienne compte en aucune
manière des caractéristiques Ω de l’assuré, et lui réclame donc une
prime pure de montant E[S], la même que celle qu’il réclame à tous
les assurés du portefeuille. Dans ce cas, la situation est telle que
présentée au Tableau 3.7.

Assurés Assureur
Dépense E[S] S − E[S]
Dépense moyenne E[S] 0
Variance 0 V[S]

Tab. 3.7 – Situation des assurés et de l’assureur en l’absence de


segmentation.

L’assureur prend donc l’entièreté de la variance des sinistres V[S]


à sa charge, que celle-ci soit due à l’hétérogénéité du portefeuille, ou
à la variabilité intrinsèque des montants des sinistres.

Transfert de risque en information complète

A l’autre extrême, supposons que l’assureur incorpore toute l’in-


formation Ω dans la tarification. On serait alors dans la situation
décrite au Tableau 3.8.
Contrairement au cas précédent, la prime payée par un assuré
prélevé au hasard dans le portefeuille est à présent une variable
aléatoire: E[S|Ω] dépend des caractéristiques Ω de cet assuré. Comme
la variable aléatoire S −E[S|Ω] est centrée, le risque assumé par l’as-
sureur la variance du résultat financier de l’opération d’assurance,
178 Chapitre 3. La prime pure

Assurés Assureur
Dépense E[S|Ω] S − E[S|Ω]
Dépense moyenne h E[S] i h 0 i
Variance V E[S|Ω] V S − E[S|Ω]

Tab. 3.8 – Situation des assurés et de l’assureur dans le cas où la


segmentation est opérée sur base de Ω.

i.e.
h i h 2 i
V S − E[S|Ω] = E S − E[S|Ω]
h h 2 ii

= E E S − E[S|Ω] Ω
h i
= E V[S|Ω] .

On assiste dans ce cas à un partage de la variance totale de S (c’est-


à-dire du risque) entre les assurés et l’assureur, matérialisé par la
formule h i h i
V[S] = E V[S|Ω] + V E[S|Ω] .
| {z } | {z }
→assureur →assurés

Ainsi, lorsque toutes les variables pertinentes Ω ont été prises en


compte, l’intervention de l’assureur se limite à la part des sinistres
due exclusivement au hasard; en effet, V[S|Ω] représente les fluctua-
tions de S dues au seul hasard. Dans cette situation idéale, l’assureur
mutualise le risque et il n’y a donc aucune solidarité induite entre
les assurés du portefeuille: chacun paie en fonction de son propre
risque.

Transfert des risques en information partielle


Bien entendu, la situation décrite au paragraphe précédent est
purement théorique puisque parmi les variables explicatives Ω nom-
breuses sont celles qui ne peuvent pas être observées par l’assureur.
En assurance automobile par exemple, l’assureur ne peut pas ob-
server la vitesse à laquelle roule l’assuré, son agressivité au volant,
ni le nombre de kilomètres qu’il parcourt chaque année 2 . Dès lors,
2. Cette dernière variable mesurant l’exposition au risque est prise en compte
de manière indirecte par l’usage du véhicule – privé/professionel – par exemple.
Nous reviendrons en détail sur ces questions dans le Tome II.
3.8. La prime pure en univers segmenté 179

l’assureur ne peut utiliser qu’un sous-ensemble X des variables ex-


plicatives contenues dans Ω, i.e. X ⊂ Ω. La situation est alors
semblable à celle décrite au Tableau 3.9.
Assuré Assureur
Dépense E[S|X] S − E[S|X]
Dépense moyenne h E[S] i h 0 i
Variance V E[S|X] E V[S|X]

Tab. 3.9 – Situation de l’assuré et de l’assureur dans le cas où la


segmentation est opérée sur base de X ⊂ Ω.

Il est intéressant de constater que


h i h h ii h h ii

E V[S|X] = E E V[S|Ω] X + E V E[S|Ω] X
h i n h io

= E V[S|Ω] + E V E[S|Ω] X . (3.22)
| {z } | {z }
mutualisation solidarité

On peut interpréter cette décomposition du risque pris en charge


par la compagnie comme suit: l’assureur, lorsque tous les facteurs
de risque ne sont pas pris en compte, intervient pour réparer les
conséquences fâcheuses du hasard (premier terme de (3.22) tradui-
sant la mutualisation du risque), mais doit aussi prendre en charge
les variations de la prime pure exacte E[S|Ω] qui ne sont pas ex-
pliquées par les facteurs de risque X intégrés au tarif (second terme
de (3.22), traduisant la solidarité induite par une personnalisation
imparfaite du montant de la prime). En d’autres mots, en plus de
contrer les mauvais coups du sort, l’assureur doit également suppor-
ter la variabilité des sinistres due aux caractéristiques des assurés,
non prises en compte par le tarif.
Dans une tarification segmentée en fonction de X ⊂ Ω, le par-
tage de la variance de S s’effectue comme suit:
h i h i
V[S] = E V[S|X] + V E[S|X]
h i h h ii

= E V[S|Ω] + E V E[S|Ω] X
| {z } | {z }
mutualisation solidarité
| {z }
→assureur
h i
+ V E[S|X] .
| {z }
→assurés
180 Chapitre 3. La prime pure

Complémentarité entre tarifications a priori et a posteriori


Toute l’idée qui sous-tend la tarification d’expérience (qui sera
traitée en détail dans le Tome II) est que l’historique des sinistres
révèle les caractéristiques non observables des assurés. Plus précisément,
si on note S ← les informations concernant la sinistralité passée
des assurés disponibles pour l’assureur, l’information contenue dans
(X,S ← ) devient comparable à Ω, tant et si bien que E[S|X,S ← ]
devrait converger vers E[S|Ω] (dans un sens à préciser).

3.8.6 Inconvénients résultant d’une segmentation poussée


Une spirale de segmentation toujours croissante
Si, contrairement à la concurrence, une compagnie d’assurance
néglige un critère de segmentation significatif, celle-ci (pour au-
tant que le marché soit efficient) ne sera plus alimentée que par
des risques réputés mauvais par rapport à ce critère alors que les
bons risques (selon ce critère) iront à la concurrence. Ce processus
d’antisélection en défaveur de l’assureur qui segmente moins sera
encore amplifié par les avis des intermédiaires et des associations de
consommateurs.
Il en résulte que les assureurs doivent plus ou moins s’aligner
les uns sur les autres dans leur politique de segmentation. Comme
il y aura toujours un assureur qui, pour des raisons commerciales,
voudra segmenter davantage que ses concurrents, le risque de tomber
dans une spirale de segmentation toujours plus poussée est bien réel.

Inassurabilité
Certains assurés pourraient se trouver dans l’incapacité d’acquérir
une couverture d’assurance si les tarifs qui leur sont proposés sont
trop élevés. Ainsi, il ne semble socialement pas souhaitable de faire
payer à certaines catégories de jeunes conducteurs des primes de
montant trop élevé pour leur assurance RC automobile, même si cela
peut se défendre sur le plan technique. L’application d’une politique
de segmentation poussée augmenterait inévitablement le nombre de
conducteurs non assurés. Un problème similaire pourrait également
se poser pour d’autres classes de risques, comme les conducteurs
plus âgés.
Le problème de l’exclusion de certains risques ne peut être résolu
qu’en imposant une certaine solidarité entre les différentes catégories
de preneurs. Pour trouver une solution à ce problème, l’Etat instaure
3.8. La prime pure en univers segmenté 181

souvent une obligation d’acceptation collective pour la communauté


des assureurs: les mauvais risques qui ne peuvent pas être placés
sur le marché normal pourraient ainsi être assurés via un pool qui
impliquerait tous les assureurs pratiquant cette branche.

Frais de fonctionnement plus élevés


Pour pouvoir différencier les tarifs selon une méthode technique-
ment fondée, il est nécessaire que l’assureur tienne à jour des fichiers
comportant un très grand nombre de données, tout en respectant
les limites imposées par la législation protégeant la vie privée. Le
traitement de toutes ces informations requiert un surcroı̂t de travail
et peut donc entraı̂ner une hausse des frais de gestion.
Indirectement, la segmentation a pour effet que l’assuré changera
plus vite de compagnie et contribue donc aussi à l’augmentation des
frais.

3.8.7 Segmentation et asymétrie de l’information


Notions
La théorie des contrats, et en particulier celle des contrats d’as-
surance, a atteint un haut degré de sophistication. En particulier, on
peut trouver dans la littérature des études fouillées portant sur l’an-
tisélection et le risque moral, ainsi que des mécanismes permettant
d’éliminer ces effets indésirables.
La littérature sur les marchés en information incomplète, dont
celui de l’assurance est une illustration parfaite, distingue habituel-
lement deux catégories de phénomènes:
1. ceux qui sont liés à l’inobservabilité d’une caractéristique in-
altérable du bien ou du service échangé, que l’on qualifie d’an-
tisélection (“adverse selection”, en anglais);
2. ceux qui proviennent de l’inobservabilité d’une action entre-
prise par l’un des deux partenaires de l’échange, que l’on classe
sous la rubrique de “moral hazard”, traduit en français par
risque moral (ou aléa moral).
Pour une étude complète, le lecteur pourra se référer utilement à
Salanié (1996).
Ces phénomènes justifient bon nombre de pratiques courantes
des assureurs. Ainsi, les procédures de classification a priori sont
souvent vues comme un moyen de diminuer les effets d’antisélection,
alors que la mise à jour du montant des primes (par le mécanisme
182 Chapitre 3. La prime pure

du bonus-malus, par exemple) devrait éliminer une partie du risque


moral.

Définition de l’antisélection
Une caractéristique des assurances privées réside dans la liberté
de contracter des deux parties concernées, preneur d’assurance et
assureur. Le candidat-preneur est libre de déterminer lui-même si,
quand, chez qui et comment il va s’assurer. Il choisira donc le contrat
d’assurance qu’il considère le plus attrayant. En outre, il dispose
d’un avantage certain en matière d’information par rapport à un
assureur qui segmente peu. Le candidat connaı̂t en effet sa propre
situation de manière très précise tandis que l’assureur concerné n’a
aucune connaissance de certains facteurs d’aggravation du risque
qui seraient présents. Cette information asymétrique mène à l’an-
tisélection émanant des preneurs d’assurance.

Le bonheur dans l’ignorance


Il s’agit ici de bien saisir le fait que le problème réside dans la
connaissance qu’a l’assuré de son profil de risque. Au contraire, si
l’ignorance est symétrique, c’est-à-dire si ni l’assuré, ni l’assureur
n’ont connaissance de facteurs influençant le niveau de risque, l’as-
sureur couvrira le péril sur base du risque moyen collectif.
Poussons un peu plus loin le raisonnement et montrons que
lorsque les contractants n’ont pas connaissance d’informations de na-
ture à influencer le niveau de risque, ils concluent en fait un contrat
d’assurances multi-garanties.
Exemple 3.8.12. Supposons que 5% de la population soit prédisposée
à une maladie M. Plus précisément, en cas de prédisposition, la pro-
babilité de développer la maladie M est de 95%, alors qu’elle n’est
que de 10% en l’absence de prédisposition. Cette prédisposition peut
être détectée à l’aide d’un test génétique, mais cet usage est interdit
à l’assureur, et trop onéreux pour l’assuré. Le coût du traitement de
la maladie M est de 100 000e . La prime pure pour une couverture
contre cette maladie est de

(0.5 × 0.95 + 0.95 × 0.1) × 100 000e .

En examinant cet exemple de plus près, on voit que la tarifi-


cation uniforme couvre en fait deux risques distincts: tout d’abord
celui d’être prédisposé à la maladie M et ensuite celui de développer
cette maladie. On constate aussi que c’est le seul moyen de couvrir
3.8. La prime pure en univers segmenté 183

le risque à des conditions acceptables pour les individus prédisposés


(qui devraient s’ils étaient identifiables s’acquitter d’une prime pure
de 95%×100 000e =95 000e , soit quasiment le prix du traite-
ment).
L’ignorance symétrique a donc un aspect particulièrement avan-
tageux en élargissant au maximum les possibilités d’assurance. C’est
d’ailleurs la portée du paradoxe de Hirschleifer, en vertu duquel une
information plus large n’est pas toujours souhaitable. L’incertitude a
en effet un avantage énorme en ce qu’elle permet l’assurance. Ainsi,
la généralisation des tests génétiques rendrait la couverture de cer-
taines populations à risque impossible, alors que l’ignorance de la
prédisposition de l’assuré à certaines maladies rend l’assurance pos-
sible.

Autosélection
Bien que la menace que fait peser l’antisélection sur l’activité
d’assurance soit bel et bien réelle, des solutions existent. Ainsi, pour
une couverture décès suffit-il d’exclure la pratique de sports dan-
gereux et d’imposer des conditions de couverture et d’acceptation
stricte pour juguler l’antisélection.
Une autre solution habituelle consiste à inciter les risques ag-
gravés à se signaler. Ainsi, pour l’assurance dégâts matériels aux
véhicules suffit-il souvent de proposer différents niveaux de fran-
chise pour que les assurés dangereux préfèrent les franchises basses,
au contraire des bons conducteurs qui n’hésiteront pas à opter pour
des franchises élevées.

Risque Moral
Le fait d’être assuré influence le comportement en matière de
risque. La prise en charge des risques par l’assureur peut en effet
diluer les responsabilités individuelles et décourager la prévention,
entraı̂nant une augmentation du risque total. Ainsi quelqu’un qui
a souscrit une assurance vol peut être enclin à prendre moins de
précautions. Quelqu’un qui est couvert pour les soins de santé sera
plus enclin à se faire hospitaliser pour subir un traitement qui n’est
pas strictement nécessaire ou plus onéreux. A côté du risque normal
assuré, naı̂t un risque supplémentaire qui est appelé “risque moral”
ou “moral hazard”.
La segmentation peut atténuer ce phénomène:
1. Une couverture partielle du risque par l’application de découverts
184 Chapitre 3. La prime pure

obligatoires, de franchises ou de paiements plafonnés a un effet


sur l’assuré qui tentera alors de limiter la fréquence et/ou le
coût des sinistres.
2. Une sélection ultérieure et une tarification a posteriori peuvent
pousser l’assuré à avoir un comportement plus prudent.
Il y a de nombreux contextes où les activités d’auto-protection
des assurés influent notablement sur les coûts des sinistres supportés
par l’assureur. L’idéal pour ce dernier serait d’inclure dans les condi-
tions générales des polices des dispositions incitant les assurés à
prendre toutes les mesures pour prévenir les sinistres. Ainsi, l’as-
suré victime d’un vol à son domicile doit-il faire la preuve qu’il y a
bien eu effraction (et donc qu’il n’a pas été négligent en laissant la
porte ouverte), sous peine de déchéance du droit à la garantie. Le
plus souvent les activités d’auto-protection ne sont cependant pas
observables par l’assureur.

Distinction entre risque moral et antisélection

La distinction entre le risque moral et l’antisélection peut être


ramenée à un problème de causalité. Avec le risque moral, les ac-
tions non observables des individus qui affectent la sinistralité sont
des conséquences des formes des contrats (ces actions non obser-
vables sont induites par le degré de couverture offert par la police,
augmentant lorsque la protection diminue). Par exemple, une police
d’assurance peut être la cause d’une augmentation de la sinistra-
lité parce qu’elle réduit les incitations à la prudence. Ainsi, suite à
un changement exogène d’un contrat d’assurance (par exemple, une
modification des conditions de couverture), on peut tester son effet
en se limitant aux assurés déjà présents dans le portefeuille et isoler
un effet de risque moral.
Avec l’antisélection pure, la nature des différents risques est
antérieure à la souscription des polices; les choix des degrés de cou-
verture sont les conséquences des différents risques présents. Il existe
donc une forme de causalité inverse entre les deux problèmes d’in-
formation.
La distinction entre les deux phénomènes peut donc se résumer
à la formule consacrée:

People buying more insurance become more risky


versus
Risky people buy more insurance.
3.9. Exercices 185

3.9 Exercices
Exercice 3.9.1. Etablissez les identités suivantes:
Z 1
E[X] = FX−1 (p)dp
p=0
Z 1
E[(X − t)+ ] = FX−1 (p)dp − tF X (t).
p=FX (t)

Exercice 3.9.2. Afin de déterminer la prime pure, nous pourrions


imaginer une distance pénalisant différemment la sous-tarification
et la sur-tarification, du type

d∗ (S,c) = αE[(S − c)+ ] + βE[(c − S)+ ].

Pour α = β on retrouve à un facteur près l’écart moyen absolu d 1


et la minimisation de d∗ (S,c) fournit donc la médiane. Si α 6= β
montrez que la minimisation de d∗ (S,c) mène au quantile d’ordre
α/(α + β).
Exercice 3.9.3. Montrez que

E[X] = E[1/rX (X)].

Exercice 3.9.4 (Lois IFR et DFR). Lorsque r X est décroissant


(resp. croissant), on dit que F est DFR (resp. IFR), pour l’anglais
Decreasing Failure Rate (resp. Increasing Failure Rate). Clairement,
une distribution de sinistre DFR est moins avantageuse pour l’as-
sureur qu’une IFR. Montrez que:
1. la fonction de répartition F de X est IFR (resp. DFR) si, et
seulement si, l’inégalité

Pr[X − t1 > x|X > t1 ] ≥ (resp. ≤) Pr[X − t2 > x|X > t2 ],

est satisfaite pour tout x ∈ IR + , quels que soient 0 ≤ t1 ≤ t2 .


2. la fonction de répartition F de X est IFR (resp. DFR) si, et
seulement si,
F (x + y)
y 7→
F (y)
est non-décroissante (resp. non-croissante) quel que soit x,
c’est-à-dire si, et seulement si, y 7→ F (y) est log-convexe (resp.
log-concave).
Exercice 3.9.5 (DFR et mélanges d’exponentielles). Montrez
que les mélanges d’exponentielles sont tous DFR.
186 Chapitre 3. La prime pure

Exercice 3.9.6 (Excédent moyen de sinistre et fonction de


queue). Supposons que eX (0) = E[X] < +∞. Montrez alors que
 Z x 
eX (0) 1
F X (x) = exp − dξ .
eX (x) ξ=0 eX (ξ)

Exercice 3.9.7 (Lois IMRL et DMRL). Lorsque e X est crois-


sante (resp. décroissante), on dit que F X est IMRL (resp. DMRL),
pour l’anglais Increasing Mean Residual Lifetime (resp. Decreasing
Mean Residual Lifetime). Prouvez les implications suivantes:
(i) F IFR ⇒ F DMRL;
(ii) F DFR ⇒ F IMRL.
Exercice 3.9.8. Montrez qu’une loi de probabilité dont le taux de
hasard rX est complètement monotone est un mélange d’exponen-
tielles.
Exercice 3.9.9 (Prime stop-loss et variance). Montrez que
quels que soient les risques X et Y de même moyenne µ,
Z +∞
1
{πX (t) − πY (t)}dt = {V[X] − V[Y ]}. (3.23)
t=0 2
Exercice 3.9.10. Soient les coûts de sinistres X 0 ,X1 ,X2 , . . ., sup-
posés positifs, continus, indépendants, de même fonction de répartition
F , et non bornés (i.e. F (x) < 1 pour tout x). On cherche à savoir
quand aura lieu le prochain sinistre ayant au moins le même coût
que X0 , ainsi que le montant de ce sinistre: soit N le premier entier
tel que Xn > X0 et posons alors Y = XN .
1
1. Montrez que Pr[N = n] = n(n+1) .
2. Déduisez-en que E[N ] = +∞ et interprétez ce résultat.
3. Montrez que
Pr[Y < x] = F (x) + F (x) ln F (x).
Exercice 3.9.11. Une grande compagnie couvre le risque RC au-
tomobile. Deux facteurs influencent la charge des sinistres: la puis-
sance du véhicule (faible-élevée) et l’expérience du conducteur (débutant-
expérimenté). On suppose que la population assurée est répartie
uniformément entre ces catégories (250,000 assurés dans chaque
catégorie). Les charges moyennes des sinistres en fonction des pro-
fils de risque sont données au tableau ci-dessous:
Expérimenté Débutant Tous conducteurs
Faible 100 e 1,500 e 800 e
Elevée 900 e 2,500 e 1,700 e
Tous véhicules 500 e 2,000 e 1,250 e
3.10. Notes bibliographiques 187

1. Supposons que seules deux compagnies, C 1 et C2 disons, opèrent


sur le marché et que l’assurance est obligatoire. C 1 décide de
ne pas différencier le montant des primes (et réclame 1250e à
tous les assurés). La seconde compagnie C 2 différencie les primes
sur base de la puissance du véhicule. Si l’information est par-
faite et que les assurés optent systématiquement pour la com-
pagnie dont le tarif est le plus avantageux (ceci signifiant entre
autres que l’étendue des couvertures offertes par C 1 et C2 est
rigoureusement identique), donnez les résultats moyens de C 1
et de C2 . Comment devrait réagir C1 ?
2. Supposons désormais que C1 et C2 appliquent un tarif seg-
menté selon la puissance du véhicule. Si une nouvelle compa-
gnie C3 fait son entrée sur le marché en utilisant l’expérience
du conducteur pour différencier les assurés (sans tenir compte
de la puissance du véhicule). Quels seront les résultats des trois
compagnies? Que se passera-t-il à terme sur le marché?

3.10 Notes bibliographiques


Les bases de l’assurance non-vie présentée dans ce chapitre pro-
viennent essentiellement de Beard, Pentik äinen, & Pesonen
(1984), Borch (1990), Bühlmann (1970), Daykin, Pentikäinen,
& Pesonen (1994), Gerber (1979), Kaas, Goovaerts, Dhaene
& Denuit (2001), Petauton (2000), Seal (1969), Straub (1988),
Sundt (1984) et Tosetti et al. (2000). On pourra également
consulter Booth, Chadburn, Cooper, & James (1999) pour
avoir un aperçu de la pratique de l’assurance.
Les mélanges de Poisson sont présentés très clairement dans
Grandell (1997).
La formalisation du concept de segmentation proposée à la Sec-
tion 3.8.5 est inspirée de De Wit & Van Heeghen (1984).
188 Chapitre 3. La prime pure
Chapitre 4

De la prime pure à la
prime nette

4.1 Introduction
A ce stade de l’exposé, nous sommes en mesure de calculer le
prix du risque, appelé prime pure. Bien entendu, la somme payée
par l’assuré pour bénéficier de la couverture de l’assureur excède lar-
gement la prime pure. Cette somme, appelée prime commerciale ou
prime des tarifs, est obtenue en grevant la prime pure de différents
chargements. On ajoute tout d’abord à la prime pure un charge-
ment de sécurité. Ce dernier est supposé absorber les écarts entre
la sinistralité et l’encaissement pur de la compagnie. Ces écarts
inévitables sont notamment causés par le fait que les hypothèses
à la base du calcul de la prime pure (i.e. les conditions de validité
de la loi des grands nombres) ne sont qu’approximativement satis-
faites en pratique. L’assureur incorpore ensuite divers chargements
couvrant notamment ses frais généraux et le bénéfice qu’il entend
éventuellement distribuer à ses actionnaires, sans oublier les taxes
et autres prélèvements légaux.
Ce chapitre est consacré au calcul de la prime nette (ou prime
chargée, pour l’anglais loaded premium), composée de la prime pure
et d’un chargement de sécurité mettant la compagnie à l’abri de la
ruine. Bien entendu, la compagnie court toujours un risque d’insol-
vabilité. L’actuaire jouera sur la hauteur du chargement de sécurité
et sur la marge de solvabilité apportée par les actionnaires afin de
réduire ce risque à un niveau acceptable. Les raisonnements tenus
dans ce chapitre font pour la plupart appel à des résultats asymp-
totiques (théorème central-limite en tête) ou à des approximations

189
190 Chapitre 4. De la prime pure à la prime nette

basées sur quelques moments. Nous verrons dans la suite de cet ou-
vrage comment calculer ce chargement de manière plus précise, au
prix de calculs parfois plus lourds.

4.2 Assurance et théorème central-limite


4.2.1 Théorème central-limite
Le théorème central-limite (qui se décline en fait sous de nom-
breuses formes, de sorte qu’il vaudrait mieux parler de résultats
de type central-limite, selon les hypothèses retenues) explique l’im-
portance fondamentale de la loi normale en statistique. Sous des
conditions assez générales, une somme de variables aléatoires centrée
et réduite adopte un comportement gaussien lorsque le nombre de
termes est suffisamment grand. Un résultat de ce type lorsque cha-
cun des termes est de loi Ber(q) avait déjà été obtenu par Bernoulli
et de Moivre dès le 18ème siècle. Il fallut cependant attendre le
début du 20ème siècle pour que ce résultat soit obtenu de manière
générale par Levy et Lindeberg.
Nous énonçons ici la version classique du théorème central-limite 1 .
Théorème
Pn 4.2.1 (Théorème de Levy-Lindeberg). Notons S (n) =
i=1 Si la somme de variables aléatoires S 1 ,S2 , . . . ,Sn indépendantes
et identiquement distribuées, de moyenne µ et de variance σ 2 <
+∞. Nous avons alors

S (n) − nµ
√ →loi N or(0,1),

où →loi désigne la convergence en loi, laquelle garantit


" #
S (n) − nµ
Pr √ ≤ x → Φ(x), quel que soit x lorsque n → +∞.

Démonstration. Ecrivons la tranformée de Laplace L Tn de la va-


riable aléatoire
S (n) − nµ
Tn = √ ,

1. Afin de faire apparaı̂tre explicitement le nombre n de termes apparaissant


dans la somme, nous utiliserons la notation S (n) ; par la suite, nous utiliserons
souvent S s’il n’y a pas de confusion possible.
4.2. Assurance et théorème central-limite 191

qui n’est autre que S (n) centrée et réduite:


" n
!#
t X Xi − µ
LTn (t) = E exp − √
n σ
i=1
   n
t X1 − µ
= E exp − √ ·
n σ
 2
 2 n
t t
= 1+ +o .
2n n
On voit ainsi que
 n
t2
lim LTn (t) = lim 1+ = exp(t2 /2),
n→+∞ n→+∞ 2n
et donc la transformée de Laplace de T n converge vers celle de la loi
normale centrée-réduite. Ceci garantit que

lim Pr[Tn ≤ t] = Φ(t),


n→+∞

et achève la démonstration.
Lorsque les conditions du théorème de Levy-Lindeberg sont rem-
plies, nous écrirons dorénavant T n ≈loi N or(0,1) ou S (n) ≈loi N or(nµ,nσ 2 ),
pour exprimer le fait que Tn est approximativement de loi normale
centrée-réduite ou que S (n) est approximativement normale. De ce
fait, pour n suffisamment grand, l’approximation
   
t − nµ t − nµ
Pr[S (n) ≤ t] = Pr Tn ≤ √ ≈Φ √ ,
nσ nσ
donne une bonne idée de la probabilité que la sinistralité agrégée S n
des n polices soit inférieure au seuil t.

4.2.2 Qualité de l’approximation basée sur le théorème


central-limite
On peut légitimement s’interroger quant au seuil n au-delà du-
quel l’approximation de la loi de S (n) par la loi normale est de qualité
satisfaisante. Ceci peut s’appréhender grâce au résultat suivant, que
nous admettrons sans démonstration.
Théorème 4.2.2 (Inégalité de Berry-Esséen). Sous les condi-
tions du Théorème 4.2.1, l’inégalité
" #
S (n) − nµ E[|S1 − µ|3 ]

sup Pr √ ≤ x − Φ(x) ≤ c 3 √
x nσ σ n(1 + |x|)3
192 Chapitre 4. De la prime pure à la prime nette

est valable quel que soit x ∈ IR. En particulier,


" #
S (n) − nµ E[|S1 − µ|3 ]

sup Pr √ ≤ x − Φ(x) ≤ c √ ,
x nσ σ3 n

où c est une constante (évaluée à 0.7975).

4.2.3 Théorème central-limite et loi des grands nombres

Il est intéressant de confronter les deux résultats asymptotiques


vus jusqu’ici, à savoir la loi des grands nombres et le théorème
(n)
central-limite. La première nous apprend que S n tend vers µ lorsque
n → +∞. Le second complète cette information en décrivant le com-
portement de ce rapport lorsque le nombre de termes est suffisam-
(n) 2 (n) 2
ment grand, i.e. S n ≈loi N or(µ, σn ). La variance de S n vaut σn et
tend bien vers 0 lorsque n → +∞.
Nous étudierons dans le Tome II le comportement asymptotique
de Mn = max1≤i≤n Si lorsque n → +∞. Dans beaucoup de situa-
(n)
tions pratiques, l’actuaire est autant intéressé par M n que par S n .

4.2.4 Théorème central-limite pour la loi de Poisson


composée

Montrons que S ∼ CPoi(λ,FX ) est approximativement de loi


normale lorsque le nombre moyen de sinistres λ est suffisamment
grand.
Propriété 4.2.3. Si S ∼ CPoi(λ,FX ) alors

S − E[S]
p →loi N or(0,1) lorsque λ → +∞.
V[S]

Démonstration. Supposons λ entier et notons N 1 ,N2 , . . . ,Nλ des va-


loi Poi(1).
riables aléatoires indépendantes de P P i On voit facilement
P Ni
que S ∼ CPoi(λ,FX ) a même loi que λi=1 N j=1 Xij , où les j=1 Xij
sont indépendants et de même loi CPoi(1,F X ). On peut dès lors
appliquer le théorème central-limite à leur somme S et obtenir le
résultat annoncé.
4.2. Assurance et théorème central-limite 193

4.2.5 Approximation de la fonction de queue dans le


cas de la réparation forfaitaire
Considérons des coûts de sinistres S i de la forme (3.10). Notons
que le coût total S relatif au portefeuille, satisfait à l’approximation
n
X p 
S= Si = sBin(n,q) ≈loi N or nqs,s nq(1 − q)
i=1

lorsque n est suffisamment grand, en vertu du théorème central-


limite. Ceci permet d’approximer la probabilité que S excède un
niveau t comme suit:
!
t/s − nq
Pr[S > t] ≈ Φ p .
nq(1 − q)

4.2.6 Approximation de la fonction de queue dans le


cas de la réparation indemnitaire
Passons à présent à des coûts de sinistres S i de la forme (3.11).
Dans ce cas,
√ p 
S ≈loi N or nqµ,σ nq + µ nq(1 − q) ,

de sorte que l’approximation


!
t − nqµ
Pr[S > t] ≈ Φ p
nqσ 2 + nµ2 q(1 − q)

devrait être de bonne qualité pour n suffisamment grand.

4.2.7 Prime pure vue comme prix minimum du risque


Montrons à présent que la prime pure constitue en tout état de
cause un seuil minimum en-deçà duquel l’assureur ne peut raisonna-
blement s’aventurer sous peine de ne plus être en mesure d’honorer
ses obligations. Notons Si le coût des sinistres relatifs à la police i;
supposons les coûts Si indépendants et identiquement distribués de
moyenne µ. Si p < µ est le montant de la prime réclamée par la
compagnie, on a
" n #
X
lim Pr Si > np = 1. (4.1)
n→+∞
i=1
194 Chapitre 4. De la prime pure à la prime nette

La probabilité dont on prend la limite dans le membre de gauche de


(4.1) est appelée probabilité de ruine
P ou probabilité de déficit. En
effet, si le coût total des sinistres ni=1 Si dépasse l’encaissement np,
il y a déficit technique. On peut établir l’égalité (4.1) en invoquant
le théorème central limite. En effet, nous pouvons écrire

" n
#
X
lim Pr Si > np
n→+∞
i=1
 Pn √ 
− nµ S n(p − µ)
= lim Pr √i
i=1
>
n→+∞ nσ σ
√ 
n(p − µ)
= lim Φ = 1.
n→+∞ σ

Ainsi, en vertu de (4.1), à mesure que la taille du portefeuille aug-


mente, la probabilité de déficit tend vers 1 lorsque p < µ. Par contre,
si p > µ, le raisonnement menant à (4.1) nous apprend que

" n
#
X
lim Pr Si > np = 0, (4.2)
n→+∞
i=1

ce qui tend à garantir la solvabilité de la compagnie lorsque la taille


n de son portefeuille augmente.

4.2.8 Sensibilité des résultats à une éventuelle dépendance

L’hypothèse d’indépendance est essentielle aux résultats ci-dessus.


Pour s’en convaincre, supposons que S i = Ti + V , où les Ti sont
indépendants et de même loi, et indépendants de V , cette dernière
étant supposée de loi normale. Il y a donc un choc gaussien V qui
se superpose à tous les Ti ; V peut représenter les conséquences d’un
événement catastrophique (inondation ou tremblement de terre) af-
fectant toutes les polices en portefeuille. Notons µ T , µV , σT2 et σV2
les moyennes et variances des Ti et de V , respectivement. Si l’assu-
reur réclame une prime de montant p, la probabilité de déficit vaut
4.2. Assurance et théorème central-limite 195

alors
" n
#
X
Pr Si > np
i=1
 
Pn
Ti + nV − n(µT + µV ) n(p − µT − µV ) 
= Pr  q i=1
> q
nσT2 + n2 σV2 nσT2 + n2 σV2
 
n(p − µ T − µ )
V 
≈ Φ q .
nσT + n σV2
2 2

Ainsi, lorsque le portefeuille grandit,


" n #  
X p − µ T − µV
lim Pr Si > np = Φ > 0.
n→+∞ σV
i=1

Il n’y a donc pas disparition complète du risque asymptotiquement.


Nous reviendrons plus longuement au Chapitre 8 sur la dépendance
entre risques assurés et ses conséquences dans le cadre de la gestion
du risque.

4.2.9 Les lois stables


Une hypothèse cruciale sous-tendant le théorème central-limite
est que la variance des variables aléatoires qu’on somme doit être
finie. Nous avons vu plus haut que la loi des grands nombres res-
tait valable même si la variance devenait infinie. Dans le cas du
théorème central-limite, les lois stables font leur apparition lorsque
(n)
les variances deviennent infinies: il s’agit des lois limites pour S n
lorsque n → +∞. C’est pourquoi nous expliquons brièvement ce
concept à ce stade de l’exposé.
Définition 4.2.4. On dit qu’une variable aléatoire X est de loi
stable si, pour tout entier positif n il existe n variables aléatoires
indépendantes et de même loi que X, X 1 ,X2 ,...,Xn disons, et des
constantes αn > 0 et βn telles que

Sn = X1 + ... + Xn =loi αn X + βn .

Remarque 4.2.5. Notons que si X a une loi stable alors X est


indéfiniment divisible, c’est-à-dire que X peut s’écrire comme somme
de n variables indépendantes et de même loi. En effet, pour tout
196 Chapitre 4. De la prime pure à la prime nette

n > 0, X suit la même loi que

Sn − β n X1 + ... + Xn − βn
=
αn αn
n 
X 
Xk βn
= −
αn αn
k=1
n
X
= Yk ,
k=1

où Yk = (Xk − βn )/αn sont des variables aléatoire indépendantes et


de même loi.
Exemple 4.2.6. Si X ∼ Poi(λ) alors X n’est pas stable. En effet,
soient X et Y deux variables indépendantes et de même loi Poi(λ).
Si la loi de Poisson était stable alors il existerait α > 0 et β telles
que
X + Y =loi αX + β.
En particulier, ces deux lois devraient avoir la même espérance et
même variance, ce qui entraı̂nerait

2λ = αλ + β

pour l’égalité des espérances, et

2λ = α2 λ
√ √ 
pour l’égalité des variances. D’où α = 2 et β = 2 − 2 λ. Mais
dans ce cas, X + Y prend √ des valeurs√ entières,
 alors
que αX + β
prend des valeurs dans 2n + 2 − 2 λ,n ∈ IN . On obtient une
contradiction : la loi de Poisson n’est pas stable.
De façon plus générale, on peut montrer que toute loi stable
est nécessairement continue. L’exemple suivant montre que la loi
normale est stable.

Exemple 4.2.7. Si X ∼ N or µ,σ 2 alors X est stable. Soient 
X1 ,...,Xn n variables indépendantes et de même loi N or µ,σ 2 .
Alors X1 + ... + Xn ∼ N or nµ,nσ 2 qui suit  la même loi que
√ √
Y = nX + (n − n) µ où X ∼ N or µ,σ 2 : la loi normale est
stable.
Bien que stable, la loi normale est très particulière, en ce sens
qu’elle est la seule loi stable dont la variance est finie. Ceci explique
mieux l’importance du théorème central-limite, qui montre que la
4.3. Probabilité de ruine sur une période 197

loi normale est la seule limite possible quand les variances sont fi-
nies. Dans le cas de variances infinies, les lois stables font alors leur
apparition.
Propriété 4.2.8. La seule loi stable de variance finie (non nulle)
est la loi normale.

Démonstration. Soient X1 ,...,Xn n variables indépendantes, de même


loi stable d’espérance µ et de variance σ 2 . Alors il existe αn > 0 et
βn telles que
X1 + ... + Xn =loi αn X1 + βn .

En écrivant l’égalité entre les espérances et les variances, on obtient



nµ = αn µ + βn
nσ 2 = α2n σ 2
√ √
d’où αn = n et βn = (n − n) µ. Donc, pour tout n, nous avons

X1 + ...Xn − (n − n) µ
√ =loi X1 .
n

En posant Y = X1 − µ de façon à centrer X1 , on obtient

X1 + ... + Xn − nµ
√ =loi Y.
n

Mais d’après le théorème central limite, on sait que

X1 + ... + Xn − nµ 
√ →loi N or 0,σ 2 quand n → ∞.
n
 
Donc Y ∼ N or 0,σ 2 et donc X1 ∼ N or µ,σ 2 .

Nous reviendrons sur les lois stables dans le Tome II, notamment
dans le cadre des processus de Levy.

4.3 Probabilité de ruine sur une période


Cette section introduit le concept de solvabilité à l’aide d’un
premier modèle, simpliste, de ruine sur une période. Une approche
plus réaliste sera développée dans le Chapitre 7.
198 Chapitre 4. De la prime pure à la prime nette

4.3.1 Définition
La probabilité de ruine est un indicateur de risque apprécié par
les actuaires. Il s’agit de la probabilité que la charge totale des si-
nistres sur une période excède l’encaissement correspondant, aug-
menté le cas échéant du montant κ de capital dont dispose la com-
pagnie. Plus précisément,
" n #
X
probabilité de ruine = Pr Si > np + κ .
i=1

L’assureur dispose en général de deux paramètres, le montant


de la prime p et celui du capital κ, pour ramener la probabilité de
ruine à un niveau  jugé acceptable (souvent  = 1%, ou 0.1%). La
probabilité de ruine s’évalue soit exactement en calculant la loi de
P n
i=1 Si , soit de manière approchée en approximant cette loi sur base
du théorème central-limite, par exemple (ou sur base d’autres
P tech-
niques faisant le plus souvent appel à quelques moments de ni=1 Si ).

4.3.2 Approximation basée sur le théorème central-


limite
L’approximation de la probabilité de ruine basée sur le théorème
central-limite donne
" n #  
X n(p − µ) + κ
Pr Si > np + κ ≈ Φ √ .

i=1

En première approximation, la probabilité de ruine diminue donc


en fonction de la différence p − µ entre le montant p de la prime
réclamée aux assurés et la prime pure µ, de même qu’en fonction
du capital κ et de la taille du portefeuille. Par contre la probabilité
de déficit augmente avec la variance des coûts des sinistres, laquelle
apparaı̂t comme un indicateur de risque.

4.3.3 Le cas de la réparation forfaitaire


Considérons les montants de sinistre (3.10) et supposons que la
compagnie réclame à ses assurés un montant égal à la prime pure,
mais dispose d’un capital κ. Elle ne pourra honorer ses engagements
que si
X n
Si ≤ nqs + κ.
i=1
4.3. Probabilité de ruine sur une période 199

Sous les conditions de la loi des grands nombres, le théorème central-


limite permet d’évaluer la probabilité de ruine pour n grand à
" n #
X
Pr Si > nqs + κ
i=1
"P #
n
i=1 Si − nqs κ
= Pr p > p
s nq(1 − q) s nq(1 − q)
!
κ
≈ Φ p √ .
q(1 − q)s n

Si la compagnie veut que la probabilité de ruine ne dépasse pas


un seuil  fixé à l’avance, elle doit posséder en vertu de l’approxima-
tion ci-dessus un capital au moins égal à
p √
κ = q(1 − q)s nΦ−1 (1 − ). (4.3)

Dans notre modèle simpliste, l’encaissement de la compagnie est


directement proportionnel au nombre n de ses clients (il vaut nqs).
On constate que le montant minimum de capital κ  croı̂t moins
vite que n (et donc que l’encaissement), autrement dit que l’activité
d’assurance procure des rendements croissants. En accord avec ce
type de résultats, les autorités de contrôle imposent aux compagnies
une marge de solvabilité dont le montant croı̂t moins vite que celui
des engagements.
Supposons que la compagnie se satisfasse de  = 1% et détermine
le montant de capital κ selon la formule (4.3) basée sur le théorème
central-limite. Examinons l’évolution de la probabilité de ruine en
fonction du nombre de polices en portefeuille, i.e. le comportement
de la fonction
" n #
X p
n 7→ Pr Si > nqs + nq(1 − q)sΦ−1 (0.99)
i=1
h p i
= Pr Bin(n,q) > nq + nq(1 − q)Φ−1 (0.99) . (4.4)

Notez que
1. la probabilité de deficit annuel ne dépend pas du montant de
l’indemnité forfaitaire s;
2. la valeur asymptotique de cette probabilité est  =1%.
Commençons par observer ce qui se passe pour n = 1,2, . . . ,100.
On peut voir à la Figure 4.1 l’évolution de la probabilité de ruine
200 Chapitre 4. De la prime pure à la prime nette

pour q = 0.1 et q = 0.01. On constate que l’ajout de nouvelles polices


au portefeuille n’entraı̂ne pas nécessairement une diminution de la
probabilitép de déficit annuel. Ceci est dû au fait que la partie entière
−1
de nq + nq(1 − q)Φ (0.01) est constante par morceaux lorsque
n augmente, alors que la fonction n 7→ Pr[Bin(n,q) > t] est bien
évidemment croissante. Ainsi, plus q diminue, plus l’assureur doit
souscrire un lot important de nouvelles polices pour faire décroı̂tre
sa probabilité de déficit.
Ceci peut se comprendre intuitivement comme suit. L’assureur
doit souscrire plusieurs polices avant que les primes payées par
chacune d’elles suffisent à dédommager un sinistre de montant s.
Tant que le surcroı̂t de prime ne suffit pas à couvrir un sinistre
supplémentaire, la probabilité de déficit croı̂t lorsqu’une nouvelle
police est ajoutée au portefeuille.
Considérons à présent de plus grandes valeurs de n. La Figure 4.2
décrit l’évolution de la probabilité de ruine en fonction de la taille
n du portefeuille lorsque n varie de 1 à 100 000. On voit à nouveau
le même type de phénomène, à savoir que l’assureur doit souscrire
des lots de nouvelles polices pour faire diminuer sa probabilité de
déficit annuel, laquelle augmente entre deux lots. On voit également
clairement que la valeur asymptotique de 1% est sytématiquement
dépassée, d’autant plus fortement que n est faible.

4.3.4 Le cas de la réparation indemnitaire


Passons à présent au cas où les montants annuels des sinistres
sont eux-mêmes aléatoires; c’est le cas de la réparation indemnitaire.
Considérons des montants de sinistre S i de la forme (3.11). Dans ce
cas
X n XN
Si =loi Zk où N ∼ Bin(n,q).
i=1 k=1

Insistons sur le fait que l’indice i dans le membre de gauche désigne


la ième police du portefeuille et l’indice k dans le membre de droite
le kème sinistre qui touche le portefeuille (sans référence à la police
qui l’a généré). De même, n dans le membre de gauche représente
le nombre de polices du portefeuille alors que N dans le membre
de droite représente le nombre (aléatoire) de sinistres touchant le
portefeuille. Ceci préfigure les modélisations individuelle et collec-
tive des portefeuilles d’assurance, sur lesquelles nous reviendrons en
détail dans le Chapitre 6.
Si la compagnie réclame aux assurés un montant égal à la prime
4.3. Probabilité de ruine sur une période 201
0.10
0.08
Proba. de deficit

0.06
0.04
0.02

0 20 40 60 80 100

Nombre de polices
0.12
0.10
0.08
Proba. de deficit

0.06
0.04
0.02

0 20 40 60 80 100

Nombre de polices

Fig. 4.1 – Evolution de la probabilité de ruine (4.4) en fonction du nombre


de polices n en portefeuille avec q = 0.1 (au-dessus) et q = 0.01 (en-
dessous).
202 Chapitre 4. De la prime pure à la prime nette
0.020
0.018
Proba. de deficit

0.016
0.014
0.012
0.010

0 20000 40000 60000 80000 100000

Nombre de polices
0.020
0.018
Proba. de deficit

0.016
0.014
0.012
0.010

0 20000 40000 60000 80000 100000

Nombre de polices

Fig. 4.2 – Evolution de la probabilité de ruine en fonction du nombre de


polices n en portefeuille avec q = 0.1 (au-dessus) et q = 0.01 (en-dessous).
4.4. Chargement de sécurité 203

pure et veut limiter son risque de déficit à un niveau , elle doit


disposer sur base de l’approximation du théorème central-limite d’un
capital
p √
κ ≈ V[S1 ] nΦ−1 (1 − )
q  2 √ −1
= qV[Z1 ] + q(1 − q) E[Z1 ] nΦ (1 − ). (4.5)
On peut voir à la Figure 4.3 l’évolution de la probabilité de
ruine en fonction du nombre de polices en portefeuille lorsque Z 1 ∼
Gam(1,1) (donc E[Z1 ] = V[Z1 ] = 1),  = 1%, q = 0.01 et le capi-
tal a été calculé sur base de l’approximation normale (4.5). Il est
intéressant de noter que la croissance de cette probabilité pour de
petites valeurs de n, avant une décroissance régulière. Il apparaı̂t
donc une taille minimum de portefeuille au-delà de laquelle la pro-
babilité de ruine décroı̂t avec le nombre n de polices. Ce seuil doit
être atteint pour que l’assureur diminue son risque de ruine en sous-
crivant de nouvelles polices.

4.4 Chargement de sécurité


4.4.1 Notion
En pratique, l’assureur ne se contente pas de la prime pure mais
lui ajoute un chargement de sécurité, supposé corriger les écarts
entre la réalité observée et l’approximation induite par la loi des
grands nombres. On désigne par les termes “prime nette” la prime
pure à laquelle on a ajouté le chargement de sécurité. La hauteur
du chargement de sécurité dépend du principe de calcul de prime
retenu par la compagnie.
Classiquement, ce chargement de sécurité est exprimé sous la
forme d’un pourcentage de la prime pure, de sorte que
pnette = (1 + ρ)ppure ,
où ρ est appelé le taux de chargement de sécurité. Notez que cette
pratique se justifie essentiellement par sa commodité, et n’est pas
sans poser question (notamment en raison des distorsions qu’elle
induit en univers segmenté).

4.4.2 Détermination du chargement de sécurité sur


base du théorème central-limite
La hauteur du chargement de sécurité est souvent choisie en
limitant la probabilité de ruine à un seuil  jugé acceptable pour
204 Chapitre 4. De la prime pure à la prime nette
0.04
0.03
Proba. de deficit

0.02
0.01

0 20 40 60 80 100

Nombre de polices
0.04
0.03
Proba. de deficit

0.02
0.01

0 2000 4000 6000 8000 10000

Nombre de polices

Fig. 4.3 – Evolution de la probabilité de ruine en fonction du nombre de


polices n en portefeuille pour des risques de la forme (3.11) avec a = τ = 1,
q = 0.01,  = 1%.
4.4. Chargement de sécurité 205

l’assureur, i.e. de telle sorte que l’inégalité


" n #
X
Pr Si > (1 + ρ)nµ + κ ≤ 
i=1

soit satisfaite. Il vient alors par le théorème central-limite


" n #  
X ρnµ + κ
Pr Si > (1 + ρ)nµ + κ ≈ Φ √ ,
σ n
i=1

ou encore √
Φ−1 (1 − )σ n − κ
ρ= .

On constate que le chargement de sécurité ρ croı̂t lorsque diminue
le seuil  limitant la probabilité de déficit choisi par la compagnie.
Le chargement de sécurité croı̂t également avec la variance des coûts
des sinistres, mais décroı̂t lorsqu’augmente le capital κ dont la com-
pagnie dispose.
Enfin, le taux de chargement ρ décroı̂t avec la taille n du por-
tefeuille. Plus le nombre de polices croı̂t, plus l’assureur doit im-
mobiliser des ressources pour réduire la probabilité de déficit à ,
mais la part relative de chacun des assurés à la constitution de ces
ressources décroı̂t.

4.4.3 De l’absolue nécessité du chargement de sécurité


L’assureur qui souscrit une nouvelle affaire voit la variance de
son résultat augmenter puisque
" n
#
X
V np + κ − Si = nσ 2
i=1
≤ (n + 1)σ 2
" n+1
#
X
= V (n + 1)p + κ − Si ,
i=1

lorsque les risques sont indépendants. Si on retient la variance comme


critère de décision, l’assureur n’a donc pas intérêt à souscrire de nou-
velles affaires. Même si le coût moyen par police devient de moins en
(n) 2
moins variable lorsque la taille du portefeuille croı̂t (cf. V[S ] = σn
sous les conditions de la loi des grands nombres), le résultat global
de la compagnie n’en devient pas moins de plus en plus variable.
206 Chapitre 4. De la prime pure à la prime nette

Supposons que Si = µ+Zi , où les Zi sont des variables aléatoires


indépendantes et identiquement distribuées, de loi N or(0,σ 2 ). Si
p = µ, on voit que la probabilité de ruine
" n #  
X κ
Pr Si > nµ + κ = Φ √
σ n
i=1

croı̂t avec n et tend vers 0.5. Cet exemple simple montre bien que la
probabilité de déficit annuel ne décroı̂t pas toujours avec la taille n
du portefeuille. Elle ne décroı̂t lorsque n augmente dans l’exemple
ci-dessus que si l’assureur a ajouté un chargement de sécurité (i.e.
si p > µ). En effet, la probabilité de déficit vaut alors
" n #  
X n(p − µ) + κ
Pr Si > np + κ = Φ √ ,
σ n
i=1

qui tend vers 0 lorsque n → +∞ si p > µ. Ce qui permet à l’assureur


de fonctionner est donc l’accumulation des chargements de sécurité,
qui permet d’absorber les écarts de sinistralité.

4.4.4 Principe de calcul des primes


Définition
Un principe de calcul de prime est une fonctionnelle H faisant
correspondre une prime nette à (la fonction de répartition d’) un
risque S. Il s’agit donc d’une règle adoptée par la compagnie d’assu-
rances pour déterminer le chargement de sécurité (donné par H[S] −
E[S]) et, partant, fixer le prix du risque.
Remarque 4.4.1. Les principes de calcul des primes nouent des
liens très étroits avec les mesures de risque, qui seront étudiées dans
le chapitre suivant.

Propriétés désirables des principes de calcul de primes


Généralement, on retient une série de propriétés importantes
auxquelles doivent satisfaire les principes de calcul de prime. Détaillons
quelques-unes de celles-ci pour mémoire:
P1: quels que soient les risques S et T , l’inégalité
H[S + T ] ≤ H[S] + H[T ]
doit être satisfaite. Cette exigence garantit que l’assuré n’a
pas intérêt à morceler le risque. Au contraire, sa prime sera
diminuée s’il le place en entier auprès de la même compagnie.
4.4. Chargement de sécurité 207

P2: quels que soient les risques S et T , l’inégalité

H[S] ≤ H[S + T ]

doit être satisfaite. Ceci revient à garantir qu’une police of-


frant davantage de protection qu’une autre doit s’accompagner
d’une prime plus élevée.
P3: quel que soit le risque S tel qu’il existe une constante M pour
laquelle Pr[S ≤ M ] = 1, l’inégalité

H[S] ≤ M

doit être satisfaite. Cette condition est très naturelle: aucun


assuré rationnel ne sera prêt à payer une prime de montant
supérieur au préjudice maximal qu’il pourrait subir.

Exemples de principes de calcul de primes


Nous détaillons ci-dessous quelques principes classiques de calcul
des primes.
Définition 4.4.2 (Principe de l’espérance mathématique).
En vertu de ce principe,

H[S] = (1 + ρ)E[S], ρ > 0.

Le principe de l’espérance mathématique est le plus simple qui


soit: la prime nette ne dépend que d’une caractéristique numérique
associée au risque, sa moyenne, tandis que le chargement de sécurité
est proportionnel à la moyenne. Bien évidemment, deux risques S
et T de même moyenne peuvent néanmoins représenter des dangers
très différents pour la compagnie d’assurance.
Les propriétés P1 et P2 sont trivialement vérifiées. Par contre, P3
n’est pas nécessairement vérifiée, comme l’indique l’exemple suivant.
Considérons un risque constant S = M ; on a alors

H[S] = (1 + ρ)M > M.

Définition 4.4.3 (Principe de l’écart-type). En vertu de ce


principe, p
H[S] = E[S] + θ V[S], θ > 0.
Le chargement de sécurité est donc dans ce cas proportionnel
à l’écart-type du risque, et prend donc en compte la variabilité de
celui-ci. Ce principe satisfait P1 puisque l’inégalité
p p p
V[S + T ] ≤ V[S] + V[T ] (4.6)
208 Chapitre 4. De la prime pure à la prime nette

est toujours vérifiée. Grâce à (4.6), il vient


p
H[S + T ] = E[S + T ] + θ V[S + T ]
p
= E[S] + E[T ] + θ V[S + T ]
np p o
≤ E[S] + E[T ] + θ V[S] + V[T ]
= H[S] + H[T ].

Par contre, P2 n’est pas satisfaite. Pour s’en convaincre, considérons


un risque Sp tel que

0, avec la probabilité 1 − p,
Sp = (4.7)
M, avec la probabilité p.
Dans ce cas, les deux premiers moments de S p sont donnés par

E[Sp ] = M p et V[Sp ] = M 2 p(1 − p).

Dès lors, la prime réclamée pour la couverture de S p vaut


p
H[Sp ] = M h(p) où h(p) = p + θ p(1 − p).

Intéressons-nous de plus près à la fonction h(·). Par dérivation, il


vient
d θ(1 − 2p)
h(p) = 1 + p ,
dp 2 p(1 − p)
et on voit facilement que
d
lim h(p) = −∞.
p→1 dp
Comme h est continue à gauche en 1 et comme S 1 = M , il doit
exister une valeur p0 < 1 pour laquelle H[Sp0 ] > H[S1 ] = M . Comme
M − Sp0 ≥ 0,

H[Sp0 ] > H[S1 ] = H[Sp0 + (M − Sp0 )],

et P2 ne peut être satisfaite. De la même manière, P3 n’est pas


satisfaite non plus puisque H[Sp0 ] > M .
Remarque 4.4.4 (Fixation de θ pour le principe de l’écart-type).
Considérons un portefeuille de n polices, dont les charges de sinistres
sont S1 ,S2 , . . . ,Sn , supposées indépendantes et de même loi. Afin de
fixer la hauteur du chargement de sécurité θ, on peut exiger que
l’inégalité " n #
X Xn
Pr Si > H[Si ] + κ ≤ 
i=1 i=1
4.5. Coefficient de sécurité 209

soit satisfaite, laquelle garantit que la compagnie ne sera en déficit


qu’avec une probabilité  très faible. Il vient alors par le théorème
central-limite
" n n
#
X X
Pr Si > H[Si ] + κ
i=1 i=1
Pn p !
i=1 V[Si ] κ
≈ 1 − Φ ρ pPn + pPn ,
i=1 V[Si ] i=1 V[Si ]

d’où l’on tire


p Pn √
z V [ i=1 Si ] − κ z σ n − κ
θ= Pn p = .
i=1 V[Si ] nσ

Commentaires
Comme nous le voyons, les principes de calcul de prime courants
présentent des inconvénients théoriques. Néanmoins, cela ne remet
pas en question leur intérêt pratique, et ce pour deux raisons: tout
d’abord, les contre-exemples construits ci-dessus sont relativement
artificiels et ensuite, les compagnies ne sont jamais obligées de cou-
vrir les risques qui s’offrent à elles. Ceci peut être important pour P1,
par exemple. On pourrait ainsi imaginer que la compagnie utilisant
un principe H ne satisfaisant pas P1 refuse de couvrir séparément les
risques S et T pour lesquels H[S +T ] > H[S]+H[T ]. Si la compagnie
adopte une telle stratégie, il n’est plus nécessaire de se limiter à des
principes satisfaisant P1.

4.5 Coefficient de sécurité


4.5.1 Résultat technique de la compagnie
Supposons que l’assureur utilise le principe de l’espérance mathématique
et notons ρ le taux de chargement de sécurité. Si nous sommes
en présence de n risques indépendants et identiquement distribués
S1 ,S2 , . . . ,Sn , de moyenne µ, le résultat technique R de la compagnie
s’écrit
Xn
R = (1 + ρ)nµ − Si ;
i=1
R est bien évidemment une variable aléatoire. On souhaite avoir
Pr[R > 0] aussi élevée que possible, tout en limitant Pr[R < −κ] à
un seuil fixé , où κ est le montant des fonds propres dont dispose
l’assureur. Les quantités κ et  sont choisies par l’assureur.
210 Chapitre 4. De la prime pure à la prime nette

4.5.2 Conséquences de l’inégalité de Bienaymé-Tchebycheff


La moyenne de R vaut
E[R] = (1 + ρ)nµ − nµ = ρnµ,
soit la somme des chargements de sécurité. En notant σ 2 la variance
commune des Si , la variance de R vaut
V[R] = nσ 2 ,
en vertu de l’indépendance des Si .
Définissons à présent le coefficient de sécurité.
Définition 4.5.1. Le coefficient de sécurité, noté β, est défini par
κ + ρnµ
β= √ .
σ n
Ainsi défini, le coefficient de sécurité apparaı̂t comme le rap-
port entre, d’une part, le résultat technique moyen de l’assureur
E[R] = ρnµ augmenté du capital κ affecté à la branche d’assurance
et, d’autre part, l’écart-type du résultat R de l’assureur. Il s’agit
donc du rapport entre la sécurité de l’assureur (au numérateur) et
le risque (au dénominateur).
Il vient ensuite
h √ i
Pr |R − ρnµ| ≤ tσ n
h √ √ i
= Pr ρnµ − tσ n ≤ R ≤ ρnµ + tσ n
1
> 1− .
t2
Si on choisit t tel que

κ = tσ n − ρnµ ⇔ t = β
on a alors h i 1
Pr R < −κ ou R > κ + 2ρnµ ≤ 2 .
β
On voit que
n o 1
max Pr[R < −κ], Pr[R > κ + 2ρnµ] ≤ 2 ,
β
de sorte que 1/β 2 majore bien la probabilité de réalisation de l’événement
défavorable {R < −κ} et de l’événement trop favorable {R >
κ + 2ρnµ}: ceci illustre bien la nécessaire stabilité des résultats de
l’assureur qui ne peuvent pas tomber sous un seuil −κ, sous peine de
faillite, mais ne peuvent pas non plus être trop élevés, la prime pure
devant mettre l’assureur en mesure de dédommager les sinistres,
sans excédent, ni déficit.
4.5. Coefficient de sécurité 211

4.5.3 Détermination du coefficient de sécurité


Afin d’être sûr de pouvoir honorer ses engagements, l’assureur
ajoute un chargement de sécurité à la prime pure, et prévoit une
marge de solvabilité suffisante pour faire face à certains exercices
déficitaires. Notons que la probabilité de ruine se réécrit
 
" #
n
X  Pn S − nµ κ + ρnµ 
 i 
Pr Si − (1 + ρ)nµ > κ = Pr  i=1 √ > √ ,
 σ n σ n 
i=1 | {z }

de sorte qu’en vertu du théorème central-limite, la probabilité de


ruine vaut approximativement
" n
#
X
Pr Si − (1 + ρ)nµ > κ ≈ Φ(β).
i=1

En pratique, on considère souvent que β = 4 est suffisant car Φ(4) =


0.999968 qui correspond à une probabilité de déficit de l’ordre de
Φ(4) = 3.2 × 10−5 . Ceci nous donne

4σ n − κ
ρ= .

4.5.4 Détermination du chargement de sécurité sur


base de l’inégalité de Bienaymé-Tchebycheff
L’inégalité de Bienaymé-Tchebycheff donne
h √ √ i 1
Pr ρnµ − tσ n ≤ R ≤ ρnµ + tσ n > 1 − 2 .
t

Choisissons à nouveau t = β, qui donne


h i 1
Pr R < −κ ou R > κ + 2ρnµ ≤ 2 .
β

Si

1/β 2 ≤  ⇔ β ≥ 1/ ,

on aura bien Pr[R < −κ] ≤ . La condition β ≥ 1/  permet de
fixer ρ.
212 Chapitre 4. De la prime pure à la prime nette

4.6 Prise en compte de l’asymétrie: l’approxi-


mation Normal-Power (NP)
Nous allons aborder dans cette partie certaines approximations,
utilisées en particulier en réassurance. L’approximation dite NP
(pour l’anglais Normal Power), permet d’améliorer l’approximation
gaussienne en tenant compte du coefficient d’asymétrie (correspon-
dant au moment d’ordre 3). L’approximation d’Edgeworth permet
de prendre en compte, de la même façon, des moments d’ordre
plus élevé (en particulier la kurtosis, coefficient d’aplatissement de
queue). Ces approximations ont été étudiées dans les années 1930,
sous l’impulsion de Haldane, Wilson ou Hilferty (suite aux travaux
d’Edgeworth au début du siècle), et utilisée en assurance par Seal
et Pentikäinen dès 1977. D’autres méthodes numériques d’approxi-
mation (méthodes de simulations ou méthodes de transformation
rapide de Fourier en particulier) seront abordées dans le Tome 2.

4.6.1 Le coefficient d’asymétrie


Définition
Le coefficient d’asymétrie (ou skewness) s’obtient en rapportant
le troisième moment centré au cube de l’écart-type (afin d’avoir un
nombre sans dimension).
Définition 4.6.1. Etant donnée une variable aléatoire X de moyenne
µ et de variance σ 2 , le coefficient d’asymétrie, noté γ[X], est défini
par

E[(X − µ)3 ] E[X 3 ] − 3E[X]E[X 2 ] + 2{E[X]}3


γ[X] = = .
σ3 σ3
Si la densité de probabilité de X est symétrique par rapport à
la moyenne, alors γ[X] = 0. Une valeur positive de γ[X] indique
une loi accordant une masse de probabilité plus importante aux
“petites” valeurs. Au contraire, une valeur négative de γ[X] indique
une loi dont une masse de probabilité importante est concentrée sur
les “grandes” valeurs.
Les coefficients d’asymétrie associés aux lois continues sont repris
au Tableau 4.1.
Le but de cette section, assez technique et pouvant sans problème
être passée en première lecture de l’ouvrage, est de fournir des
approximations alternatives à celle basée sur le théorème central-
limite. Après avoir brièvement présenté le développement d’Edge-
4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 213

Loi de probabilité Coefficient d’asymétrie


Uni(a,b) 0
2αβ(β−α)
Bet(α,β) 
αβ
3/2
(α+β)3 (α+β+1)(α+β+2)
(α+β)2 (α+β+1)
N or(µ,σ 2 ) 0
Exp(θ) 2
Gam(α,τ ) √2
α
LN or(µ,σ 2 ) pas de √
forme explicite
2(α+1) √α−2
Par(α,θ) (α−3) α
si α > 3

Tab. 4.1 – Coefficients d’asymétrie des lois de probabilités continues


usuelles.

worth d’une fonction de répartition, nous passerons à deux approxi-


mations classiques en théorie du risque: l’approximation d’Esscher
et l’approximation Normal-Power (ou NP).

4.6.2 Développement d’Edgeworth


Soit S le montant des sinistres relatif à une police du portefeuille,
de fonction de répartition FS . Définissons
S − E[S]
Z= p ,
V[S]
le montant de sinistre centré-réduit. Clairement, la fonction de répartition
FZ de Z et la fonction de répartition FS de S sont liées par la rela-
tion  p 
FZ (x) = FS E[S] + x V[S] , x ∈ IR.

Notez que E[Z] = 0, E[Z 2 ] = 1 et E[Z 3 ] = γ[S]. Soit MZ (t) =


E[exp(tZ)] la fonction génératrice des moments de Z, et posons

Mf(t) = exp(−t2 /2)MZ (t).

f en P+∞ ak tk , il vient
Par développement de Taylor de M k=0
+∞
X
MZ (t) = ak tk exp(t2 /2). (4.8)
k=0

A présent, prouvons le résultat suivant.


Lemme 4.6.2. L’identité
Z +∞
k 2 k
t exp(t /2) = (−1) exp(tz)φ(k) (z)dz,
z=−∞
214 Chapitre 4. De la prime pure à la prime nette

est vérifiée quel que soit t ∈ IR et k ∈ IN, où φ (k) désigne la dérivée
kème de la densité de probabilité φ associée à la loi N or(0,1).
Démonstration. Prouvons le résultat pour k = 0:
Z +∞
exp(tz)φ(z)dz
z=−∞
Z +∞
1
= √ exp(t2 /2) exp(−(z − t)2 /2)dz
2π z=−∞
= exp(t2 /2).

Procédons à présent par récurrence. Supposons le résultat acquis


pour k = n. Il vient alors
Z +∞
exp(tz)(−1)n+1 φ(n+1) (z)dz
z=−∞
h i+∞
= (−1)n+1 exp(tz)φ(n) (z)
z=−∞
Z +∞ 
(n)
− t exp(tz)φ (z)dz
z=−∞
Z +∞
n
= (−1) t exp(tz)φ(n) (z)dz
z=−∞
k+1 2
= t exp(t /2),

ce qui achève la démonstration.


Grâce au Lemme 4.6.2, (4.8) devient
+∞
X Z +∞
MZ (t) = ak exp(tz)(−1)k φ(k) (z)dz
k=0 z=−∞
Z ( +∞ )
+∞ X
= exp(tz) ak (−1)k φ(k) (z) dz.
z=−∞ k=0

Dès lors, MZ est la fonction


P génératrice des moments d’une loi
de probabilité de densité +∞ a
k=0 k (−1) k φ(k) (x). Comme la fonction

génératrice des moments est unique, on en déduit que


+∞
X
FZ (z) = (−1)k ak Φ(k) (z). (4.9)
k=0

La formule (4.9) est connue sous le nom de développement d’Ed-


geworth de FZ . Insistons sur le fait que (4.9) a été obtenue d’une
4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 215

manière très informelle. Nous ne nous sommes en effet guère préoccupés


des problèmes de convergence (en fait, la série (4.9) diverge dans
bien des cas). L’approximation d’Edgeworth consiste à limiter la
série (4.9) à un nombre fini de termes, ν disons, i.e. à utiliser l’ap-
proximation

FZ (z) ≈ (−1)k ak Φ(k) (z).
k=0
Par définition,
1 f(k)
ak = M (0), k = 0,1,2, . . . ,
k!
de sorte que
a0 = 1,
a1 = 0,
a2 = 0,
E[Z 3 ]
a3 = ,
6
E[Z 4 ] − 3
a4 = ,
24
a5 = 0,
(E[Z 3 ])2
a6 = .
72
Ainsi, pour ν = 6, l’approximation d’Edgeworth se réduit à
E[Z 3 ] (3) E[Z 4 ] − 3 (4)
FZ (z) ≈ Φ(z) − Φ (z) + Φ (z)
6 24
(E[Z 3 ])2 (6)
+ Φ (z). (4.10)
72
Souvent, on n’utilise que les deux premiers termes de (4.10), ce qui
fournit
! !
x − E[S] γ[S] (3) x − E[S]
FS (x) ≈ Φ p − Φ p . (4.11)
V[S] 6 V[S]
Comme
1
Φ(1) (z) = √ exp(−z 2 /2),

−1
Φ(2) (z) = √ z exp(−z 2 /2),

1  
Φ(3) (z) = √ − exp(−z 2 /2) + z 2 exp(−z 2 /2)

= (z − 1)Φ(1) (z),
2
216 Chapitre 4. De la prime pure à la prime nette

l’approximation (4.11) se réécrit encore


!  !2  !
x − E[S] γ[S]  x − E[S] x − E[S]
FS (x) ≈ Φ p − p − 1 φ p .
V[S] 6 V[S] V[S]
(4.12)
Remarque 4.6.3. Il est intéressant de faire les commentaires sui-
vants:
1. dès qu’on utilise plus d’un terme dans l’approximation d’Edge-
worth, on peut obtenir une valeur négative pour certaines va-
leurs de z. L’approximation fournie en (4.10) ou (4.11) n’est
donc pas une fonction de répartition.
2. l’approximation fournie par (4.10) est généralement bonne lorsque
z est proche de 0. Cependant, l’erreur croı̂t assez vite à mesure
que |z| augmente. En d’autres mots, l’approximation d’Edge-
worth (4.12) passe pour bonne aux alentours de la moyenne,
mais se détériore significativement dans les queues de distri-
bution. Un moyen ingénieux pour éviter cet inconvénient est
de recourir à la tranformée d’Esscher, présentée plus loin.
3. comme la série d’Edgeworth diverge souvent, la qualité de l’ap-
proximation n’est pas forcément améliorée par l’ajout d’un
terme supplémentaire.

4.6.3 Approximation d’Esscher


Transformée d’Esscher
La transformée d’Esscher est définie pour les lois possédant une
fonction génératrice des moments (encore appleées lois de Cramér
en théorie du risque). Il s’agit de remplacer la loi initiale par une
autre, plus dangereuse pour l’assureur. Utilisée de concert avec l’ap-
proximation d’Edgeworth, la technique d’Esscher permet souvent
d’obtenir des approximations précises.
Définition 4.6.4. Soit S une variable aléatoire réelle de fonction
de répartition FS et de fonction génératrice des moments M S . A
chaque h ∈ IR, on associe une variable aléatoire S h de fonction de
répartition Fh définie par
Z t
1
Fh (t) = exp(hξ)dFS (ξ). (4.13)
MS (h) ξ=−∞

La fonction de répartition Fh est appelée transformée d’Esscher de


FS de paramètre h.
4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 217

Propriété 4.6.5. On voit facilement que la fonction génératrice des


moments Mh associée à la fonction de répartition F h est donnée par
Mh (t) = E[exp(tSh )]
Z
1 
= exp (h + t)s dFS (s)
MS (h) s∈IR
MS (t + h)
= .
MS (h)
Exemple 4.6.6. Considérons N ∼ Poi(λ) et intéressons-nous à
la loi de Nh . Pour ce faire, calculons-en la fonction génératrice des
moments, donnée en vertu de la Propriété 4.6.5 par
E[exp((t + h)N )]
Mh (t) =
E[exp(hN )]
ϕN (exp(t + h))
=
ϕN (exp(h))
 
exp λ(exp(t + h) − 1)
=  
exp λ(exp(h) − 1)
 
= exp λ exp(h)(exp(t) − 1)

où l’on reconnaı̂t la fonction génératrice des moments associée à la


loi de Poisson de moyenne λ exp(h). Dès lors N h ∼ Poi(λ exp(h)).

Transformée d’Esscher et prime pure


La transformation d’Esscher n’affecte pas le support de S: ainsi,
S et Sh prennent leurs valeurs dans le même ensemble. Cependant,
les valeurs de Sh sont d’autant plus vers la droite que h est élevé,
comme le montre le résultat suivant (nous reviendrons sur cet aspect
dans le Chapitre 5).
Propriété 4.6.7. E[Sh ] est une fonction croissante de h.
Démonstration. En effet,
MS0 (h)
E[Sh ] = Mh0 (0) =
MS (h)
d’où l’on tire
d MS00 (h)MS (h) − {MS0 (h)}2
E[Sh ] =
dh {MS (h)}2
= Mh00 (0) − {Mh0 (0)}2 = V[Sh ] > 0.
218 Chapitre 4. De la prime pure à la prime nette

Approximation d’Esscher
Montrons à présent l’intérêt de la transfomation d’Esscher pour
l’actuaire. Supposons être intéressé par F S (x) = Pr[S ≤ x] pour
une certaine valeur de x. L’idée maı̂tresse de la méthode d’Esscher
consiste à choisir h tel que

MS0 (h)
E[Sh ] = =x
MS (h)

et ensuite d’appliquer l’approximation d’Edgeworth (4.11) à S h plutôt


qu’à S. Il vient ainsi

E[(Sh − x)3 ] (3)


fh (y)dy ≈ φ(z)dz − φ (z)dz, (4.14)
6{V[Sh ]}3/2

où
y−x
z=p .
V[Sh ]
En revenant à (4.13), on voit que

fS (y) = MS (h)fh (y) exp(−hy),

qui donne par intégration


Z +∞
F S (x) = MS (h) exp(−hy)fh (y)dy, (4.15)
y=x

et Z x
FS (x) = MS (h) exp(−hy)fh (y)dy. (4.16)
y=−∞

La question est maintenant de savoir s’il est préférable d’insérer


l’approximation (4.14) dans (4.15) ou dans (4.16) afin d’obtenir l’ap-
proximation de FS (x) souhaitée. La réponse à cette question dépend
du signe de h:
(i) si h > 0 (i.e. x > E[S]), il est préférable d’utiliser (4.15);
(ii) si h < 0 (i.e. x < E[S]), (4.16) devrait donner de meilleurs
résultats.
Examinons plus en détails le cas h > 0 (le plus intéressant pour
l’actuaire qui s’intéresse plutôt aux grandes valeurs de x). Tant que
y est dans le voisinage de x = E[Sh ], l’approximation d’Edgeworth
(4.14) devrait être de bonne qualité. Pour de grandes valeurs de y,
on s’attend à ce que (4.14) soit peu précise mais comme elle est
multipliée par exp(−hy) dans (4.15), ceci ne devrait pas prêter à
4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 219

conséquence. On obtient donc l’approximation d’Esscher pour x >


E[S] donnée par
 
E[(Sh − x)3 ]
F S (x) ≈ MS (h) exp(−hx) E0 (u) − E3 (u) ,
6{V[Sh ]}3/2
p
où u = h V[Sh ] et où les fonctions
Z
Ek (u) = exp(−uz)φ(k) (z)dz, k ∈ IN,
z∈IR+

sont appelées fonctions d’Esscher. Puisque

exp(−uz)φ(z) = exp(u2 /2){1 − Φ(u)},

on obtient en intégrant par parties

Ek (u) = −φ(k−1) (0) + uEk−1 (u),

pour k ≥ 1, ce qui fournit

1
E1 (u) = − √ + uE0 (u),

u
E2 (u) = uE1 (u) = − √ + u2 E0 (u),

1 1 − u2
E3 (u) = √ + uE2 (u) = √ + u3 E0 (u).
2π 2π

Clairement, E0 (u) est la transformée de Laplace de la loi N or(0,1)


évaluée en u, laquelle est donnée au Tableau 3.4.

Approximation d’Esscher des lois de Poisson composées

Appliquons à présent les techniques présentées ci-dessus à la loi


de Poisson composée. Ceci fournit une alternative aux algorithmes
de type Panjer qui seront présentés au Chapitre 6. Pour commen-
cer, il s’agit d’obtenir la transformée d’Esscher de la loi de Poisson
composée.
Propriété 4.6.8. Si S ∼ CPoi(λ,G) alors S h ∼ CPoi(λMG (h),Gh ),
où MG est la fonction génératrice des moments associée aux mon-
tants des sinistres.
220 Chapitre 4. De la prime pure à la prime nette

Démonstration. Il suffit d’écrire la fonction génératrice des moments


de Sh . La Propriété 4.6.5 donne

E[exp((t + h)S)]
Mh (t) =
E[exp(hS)]
 
exp λ(MG (t + h) − 1)
=  
exp λ(MG (h) − 1)
  
MG (t + h)
= exp λMG (h) −1
MG (h)

où l’on reconnaı̂t la fonction génératrice des moments associée à la


loi CPoi(λMG (h),Gh ).

Appliquons la technique décrite plus haut à S ∼ CPoi(λ,G), dans


les notations introduites plus haut. Comme S h est de loi de Poisson
composée, avec λMG (h) pour nombre moyen de sinistres et M G (t +
h)/MG (h) comme fonction génératrice des moments des montants
de ceux-ci, la valeur de h à utiliser est solution de l’équation

MG0 (h)
E[Sh ] = λMG (h) = λMG0 (h) = x.
MG (h)

De plus, il vient

V[Sh ] = λMG00 (h) et E[(Sh − x)3 ] = λMG000 (h).

L’approximation d’Esscher pour x > E[S] donne alors


( )
MG000 (h)
F S (x) ≈ exp{λ(MG (h)−1)−hx} E0 (u) − √ E3 (u)
6 λ{MG00 (h)}3/2
p
où u = h λMG00 (h).

4.6.4 Approximation NP
Formule NP
Du fait de l’applicabilité limitée du développement d’Edgeworth
(qui ne donne une approximation raisonnable qu’aux alentours de la
moyenne), les actuaires ont proposé la méthode NP. Cette méthode
est une alternative à l’utilisation de concert des approximations
d’Edgeworth et d’Esscher décrites ci-dessus.
4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 221

Partons de l’approximation (4.10) limitée aux deux premiers


termes:
E[Z 3 ] (3)
FZ (z) ≈ Φ(z) − Φ (z).
6
L’approximation ci-dessus revient en fait à

E[Z 3 ] 2
FZ (z) ≈ Φ(z) − (z − 1)Φ(1) (z).
6
A présent, en utilisant un développement limité de Taylor, il vient

FZ (z + ∆z) ≈ FZ (z) + fZ (z)∆z


E[Z 3 ] 2
≈ Φ(z) − (z − 1)Φ(1) (z) + Φ(1) (z)∆z,
6
ce qui donne finalement la formule
 
E[Z 3 ] 2
FZ (z + ∆z) ≈ Φ(z) − (z − 1) − ∆z Φ(1) (z).
6

En prenant ∆z = E[Z 3 ](z 2 − 1)/6, le coefficient de Φ(1) (z) s’annule


et seul subsiste
 
E[Z 3 ] 2
FZ z + (z − 1) ≈ Φ(z);
6
cette dernière relation est connue sous le nom d’approximation NP
(pour l’anglais “Normal Power”).
Remarque 4.6.9. Notez que lorsque E[Z 3 ] = 0, l’approximation
NP revient à supposer S de loi normale.
Supposons E[Z 3 ] 6= 0 et cherchons une approximation pour F Z (y).
Il vient
FZ (y) ≈ Φ(z)
où z satisfait
E[Z 3 ] 2
z+ (z − 1) = y
6
d’où s
9 6 3
z= +1+ y− ,
3
(E[Z ]) 2 E[Z ]
3 E[Z 3 ]
pour autant que le terme sous la racine soit non-négatif. L’approxi-
mation de FS suit immédiatement en substituant
x − E[S]
y= p ,
V[S]
222 Chapitre 4. De la prime pure à la prime nette

ce qui donne
s !
−3 9 6(x − E[S])
FS (x) ≈ Φ + 2
+1+ p ,
γ[S] (γ[S]) γ[S] V[S]
qui est valable pour
p
x > E[S] + V[S],

et assez précise tant que 0 ≤ γ[S] ≤ 2; la qualité de l’approximation


décroı̂t à mesure que γS augmente.

Approximation NP des quantiles


L’approximation NP permet également d’approcher les quantiles
de S. Si zα désigne le 100(1 − α)ème quantile de la loi normale
centrée-réduite, on a

1 − α = Φ(zα )
 
E[Z 3 ] 2
≈ F Z zα + (zα − 1)
6
  
p E[Z 3 ] 2
= FS E[S] + V[S] zα + (zα − 1)
6
  
p γ[S] 2
= FS E[S] + V[S] zα + (zα − 1) ,
6

ce qui fournit l’approximation suivante pour le quantile q 1−α de S


 
p γ[S] 2
q1−α ≈ E[S] + V[S] zα + (zα − 1) . (4.17)
6
Exemple 4.6.10 (Calcul de la marge de solvabilité). L’ap-
proximation NP peut être utilisée pour avoir une idée du montant
minimum des provisions techniques des branches d’assurance non-
vie. Soit S le montant total de sinistres relatifs aux polices que la
compagnie a souscrites. Les autorités de contrôle exigent que le mon-
tant des provisions techniques soit tel que la solvabilité de la com-
pagnie est garantie avec une probabilité 1 − : le montant κ  des
provisions doit être tel que

Pr[S > κ ] ≤ .

En d’autres termes, κ doit être au moins égal à κmin avec

Pr[S > κmin ] = .


4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 223

L’approximation NP permet d’évaluer κ min à


 
p γ[S] 2
κmin ≈ E[S] + V[S] z + (z − 1) .
6
Exemple 4.6.11 (Quantiles des lois de Poisson PN composées).
L’approximation NP est souvent utilisée avec S = i=1 Xi ∼ CPoi(λ,FX ).
Dans ce cas,
E[S] = λE[X1 ], V[S] = λE[X12 ],
et  3
E S − E[S] = λE[X13 ],
de sorte que le quantile q1−α de S est approché par
q
1 E[X13 ]
q1−α ≈ λE[X1 ] + zα λE[X12 ] + (zα2 − 1) .
6 E[X12 ]
Cette dernière approximation passe pour être de bonne qualité pour
autant que
h 3 i
E S − E[S] E[X13 ]
γ[S] = = √ ≤ 2.
(V[S])3/2 λ(E[X12 ])3/2

Approximation NP des primes stop-loss


Commençons par établir l’expression des primes stop-loss as-
 ce faire, considérons Y ∼ N or (0,1),
sociées à la loi normale. Pour
et X = σY + µ ∼ N or µ,σ 2 . Alors,
   
E (X − d)+ = E (σY + µ − d)+
  
d−µ
= σE Y − .
σ +

On peut alors calculer la prime stop-loss dans le cas gaussien centré


réduit et en déduire le résultat dans le cas général. La prime stop-loss
associée à Y vaut alors
Z
 
E (Y − d)+ = (y − d)+ φ (y) dy
y∈IR
Z +∞
= (y − d) φ (y) dy
d
Z +∞ Z +∞
= yφ (y) dy − d φ (y) dy
d d
= φ (d) − dΦ (d) ,
224 Chapitre 4. De la prime pure à la prime nette

puisque φ0 (t) = tφ (t). La prime stop-loss pour X s’obtient alors à


partir de
   
d−µ d−µ
E[(X − d)+ ] = σφ − (d − µ) Φ .
σ σ

Posons à présent

γ[X] 2 
a (s) = s + s −1 ,
6
et s
3 9 6
b (t) = − + +1+ t.
γ[X] γ[X]2 γ[X]
Il est aisé de noter que ces fonctions sont inverses l’une de l’autre,
c’est-à-dire vérifient

a (b (t)) = t et b (a (u)) = u,

et que ces fonctions sont monotones, croissantes, telles que

a (s) ≥ t ⇔ b (t) ≤ s.

Soit Z une variable aléatoire centrée et réduite, i.e. µ Z = 0,


σZ = 1. L’approximation N P appliquée à Z est

Pr[Z ≤ a (z)] = Pr[b (Z) ≤ z] ≈ Φ (z) ,

d’où, en terme de fonction de queue,

Pr[Z > a (z)] = Pr[b (Z) > z] ≈ Φ (z) .

Soit Y ∼ N or(0,1), et posons



∗ a (Y ) , si Y ≥ 1,
Y = a (max {Y,1}) =
1, sinon,

alors

Pr[Y ∗ > a (z)] = Pr[Y > z] ≈ 1 − Φ (z) , si z ≥ 1,

et donc, finalement, compte tenu du fait que l’approximation N P


revient à dire que Z peut être approximée par a (Y ) où Y est une
variable gaussienne (dès lors que Y ≥ 1), i.e.

Pr[Z ≤ s] ≈ Pr[Y ∗ ≤ s].


4.6. Prise en compte de l’asymétrie: l’approximation
Normal-Power (NP) 225

On obtient alors

Pr[Z > s] ≈ Pr[Y ∗ > s] ≈ 1 − Φ (b (s)) , pour tout s ≥ 1.

La prime stop-loss associée à Z s’écrit alors


Z ∞
E[(Z − d)+ ] = Pr[Z > s]ds
d
Z ∞
≈ Pr[Y ∗ > s]ds
d
= E[(Y ∗ − d)+ ]
Z
= (a (max {y,1}) − 1)+ φ (y) dy
IR
Z +∞
= (a (y) − d) φ (y) dy
b(d)
Z +∞  

γ[Z] 2
= y+ y − 1 − d φ (y) dy
b(d) 6
Z +∞ Z +∞
γ[Z] 2 
= y − 1 φ (y) dy + yφ (y) dy
b(d) 6 b(d)
Z +∞
−d φ (y) dy,
b(d)

d’où finalement
γ[Z] 
E[(Z − d)+ ] ≈ b (d) φ (b (d)) + φ (b (d)) − d 1 − Φ (b (d)) .
6
La prime stop-loss pour la variable X ∼ N or(µ,σ 2 ) est alors
donnée par,
    
γ[X] d − µX d − µX
E[(X − d)+ ] ≈ σX b φ b
6 σX σX
  
d − µX
+σX φ b
σX
   
d − µX
− (d − µX ) 1 − Φ b .
σX

Détermination du chargement de sécurité sur base de l’ap-


proximation NP
On peut aussi avoir recours à l’approximation NP pour fixer le
taux de chargement de sécurité ρ apparaissant dans le principe de
226 Chapitre 4. De la prime pure à la prime nette

l’espérance mathématique. Plus précisément, on tire de l’approxi-


mation (4.17) que
" n #
X
Pr Si > (1 + ρ)nµ + κ = 
i=1
 
√ γ[S] 2
⇒ (1 + ρ)nµ + κ ≈ nµ + nσ z + (z − 1)
6
d’où l’on tire une approximation de ρ valant
√  
nσ z + γ[S]
6 (z 2 − 1) − κ

ρ≈ .

4.6.5 En guise de conclusion à propos des approxima-


tions d’Esscher et NP
Même si les implications pratiques des formules d’Esscher et NP
sont sans doute à présent moins nombreuses que dans le passé (no-
tamment en raison de l’avènement des méthodes numériques, si-
mulation en tête, largement répandues de nos jours, et qui seront
étudiées en détail dans le Tome 2), ces approximations n’en de-
meurent pas moins fort utiles pour les raisons suivantes:
1. ces approximations sont aisées à calculer et permettent rapide-
ment de se faire une idée à propos de la solution du problème
considéré.
2. les techniques sous-tendant l’approximation d’Esscher permettent
bien souvent d’améliorer les méthodes de simulation.
3. l’approximation NP peut être incorporée dans des programmes
de simulation des résultats de l’ensemble de la compagnie
(voire du groupe) dans le cadre d’analyses de type DFA (pour
Dynamic Financial Analysis) afin de rendre compte de la si-
nistralité.

4.7 La prime commerciale


Le transfert de risque des assurés vers la compagnie ne peut hélas
se faire sans coût. A la prime nette viennent s’ajouter la quote-part
des frais généraux de l’entreprise d’assurances plus le bénéfice que
l’assureur entend se réserver; le total donne la prime commerciale
ou prime des tarifs dont l’assuré doit s’acquitter pour bénéficier de
la couverture proposée par l’assureur. La prime commerciale permet
4.7. La prime commerciale 227

donc à la fois à l’assureur de faire face à son engagement de régler


les sinistres, mais également de compenser ses coûts de gestion et
de réaliser des bénéfices.
Les frais généraux de l’entreprise comprennent les frais d’acqui-
sition du contrat (rémunération des intermédiaires), les frais d’en-
caissement des primes, les frais de gestion (loyers, rémunération du
personnel, frais d’expertise et de procès, etc.) et, enfin, les impôts.
Certains frais sont indispensables au bon fonctionnement de l’as-
surance. Par exemple, une réduction des efforts d’expertise conduit
soit à une augmentation de la fraude, soit à une perte de qualité
dans la concordance entre coûts des sinistres et indemnités. Dans
les deux cas, les assurés sont perdants.
Enfin, le mécanisme de fixation de la prime commerciale fait
également intervenir des considérations de marketing. Il n’y a aucune
raison de proposer le produit à un prix moins élevé que celui que
le consommateur est prêt à payer. A l’inverse, la société pourrait
fort bien décider de réduire fortement ses marges bénéficiaires dans
une niche du marché où elle entend s’imposer. On sent bien qu’on
quitte ici la sphère technique pour entrer dans le jardin des délices
commerciaux, où les auteurs se garderont bien d’entraı̂ner leurs chers
lecteurs.
Concrètement, la prime commerciale p com s’obtient donc à partir
de

pcom = pnette + frais généraux + commissions


+bénéfices escomptés + impôts.

Afin d’avoir une idée de l’importance relative des différentes com-


posantes de la prime commerciale, on peut se référer au Tableau
4.2.
Très souvent en pratique, tous ces chargements sont calculés pro-
portionnellement à la prime nette. Ces chargements proportionnels
sont pourtant très discutables dans certains cas. On voit mal pour-
quoi un courtier ou un agent devrait être mieux rémunéré s’il apporte
une affaire dangereuse (car correspondant à une prime nette élevée),
pourquoi les risques agravés (les jeunes conducteurs, par exemple)
devraient davantage contribuer au bénéfice ou aux frais généraux
que les autres.
228 Chapitre 4. De la prime pure à la prime nette

Primes 100 Indemnités aux assurés 72


Produits Financiers 4 dommages tous risques 23
dommages corporels 15
dommages matériels 11
vols 6
bris de glace 6
divers 11
Frais 31
frais généraux 17
frais de personnel 14

Tab. 4.2 – Composantes de la prime pure en assurance automobile


(source: MMA - 2004).

4.8 Exercices
Exercice 4.8.1. Le montant de sinistre causé par une police du
portefeuille est de la forme

0 avec la probabilité 0.9
S=
X avec la probabilité 0.1
où  3/2
1
Pr[X > x] = , x > 0.
x+1
1. Calculez la prime pure pour cette police.
2. Calculez le montant de la prime nette de façon à ce que la
probabilité que le montant de sinistre S dépasse ce montant
soit au plus de 1%.
Exercice 4.8.2. Un assureur a un portefeuille de n polices dont les
coûts annuels des sinistres S1 , . . . ,Sn sont indépendants et identique-
ment distribués, de moyenne 200 et d’écart-type 2000. L’assureur
dispose d’un capital κ et tarifie sur base du principe de l’espérance
mathématique, de taux %.
1. Que vaut le coefficient de sécurité β lorsque κ = 100000,
% = 5% et n = 5000? Comment jugez-vous la situation de
l’assureur?
2. On veut avoir β ≥ 4. Pour ce faire,
(a) quel doit être le capital κ pour % = 5% et n = 5000?
(b) quel doit être le taux de chargement % pour κ = 100000
et n = 5000?
4.8. Exercices 229

(c) quel est le nombre minimal de contrats à avoir en porte-


feuille pour κ = 100000 et % = 5%?
3. A la lumière de la question précédente, que conseillez-vous à
l’assureur pour atteindre β ≥ 4?
Exercice 4.8.3. La charge totale P S des sinistres relatifs à un por-
tefeuille d’assurances vaut S = N i=1 Xi où N ∼ Poi(λ), où les Xi
sont indépendants et de même loi Exp(θ). Les X i et N sont en outre
supposés indépendants.
1. Calculez la prime pure relative au portefeuille.
2. Fixez la hauteur du chargement de sécurité afin que la proba-
bilité de ruine soit de maximum  si l’assureur dispose d’un
capital κ
(a) sur base du théorème central-limite
(b) sur base de l’approximation NP.
Exercice 4.8.4. Soit un portefeuille comprenant 10 000 polices dont
la charge annuelle totale S des sinistres admet les moyenne, variance
et coefficient d’asymétrie suivants:
E[S] = 10 000, V[S] = 1 000 000 et γ[S] = 2.
1. Calculez la probabilité que S excède 15 000
(a) à l’aide du théorème central-limite;
(b) à l’aide de l’approximation Normal-Power.
Commentez les deux réponses que vous avez obtenues.
2. Calculez le seuil que S ne dépassera qu’avec une probabilité de
0.1% (i.e. le quantile d’ordre 0.999 de S)
(a) à l’aide du théorème central-limite;
(b) à l’aide de l’approximation Normal-Power.
Commentez les deux réponses que vous avez obtenues. (Rappel:
le quantile d’ordre 0.999 de la loi normale centrée-réduite vaut
3.09)
Exercice 4.8.5. On considère un groupe de risques dans lequel on
peut distinguer deux classes (notées 1 et 2). Le montant annuel des
dépenses de chaque classe est noté X 1 et X2 respectivement. En
outre, pour la classe i (i = 1 ou 2), le taux de chargement technique,
l’espérance mathématique de la dépense annuelle et l’écart-type de
la dépense annuelle sont notés respectivement % i , mi et si
Classe 1 Classe 2
%i 0.04 0.06
mi 800 900
si 200 300
230 Chapitre 4. De la prime pure à la prime nette

Pour l’ensemble du groupe, le montant du capital affecté au risque


est κ = 800. Par ailleurs on suppose que les variables aléatoires X 1
et X2 sont indépendantes.
(a) Calculez le bénéfice annuel Bi de la classe i, ainsi que le
bénéfice annuel B de l’ensemble du groupe. En déduire l’espérance
mathématique et la variance de ces variables aléatoires.
(b) Calculez le coefficient de sécurité global β ainsi que sa valeur
numérique.
(c) En supposant que la loi de X = X1 + X2 peut être approchée
par une loi normale, calculer la probabilité de déficit annuel
pour ce groupe.
(d) En supposant que les données précédentes ne sont pas mo-
difiées et que les résultats annuels successifs sont indépendants,
calculer la probabilité pour que le groupe considéré ne subisse
pas de déficit pendant 3 années consécutives.
Exercice 4.8.6. (i) Montrez que quelle que soit la variable aléatoire
positive S de moyenne µ et de variance σ 2 ,
 2
 1
x−µ 2
si x > µ + σµ
F S (x) ≤ 1+ ( σ )
 µ si µ < x < µ + σ2 .
x µ

(ii) En appliquant
P ces inégalités à la charge totale des sinistres
S = ni=1 Si , montrez que l’inégalité
" n #
X 1
Pr Si > κ + (1 + ρ)nµ ≤
1 + β2
i=1

est valable pour autant que


σ2 σ (n)
κ + (1 + ρ)nµ > nµ + ⇔β> √ ⇔ β > CV [S ].
µ nµ

4.9 Notes bibliographiques


Les lecteurs pourront utilement se référer aux ouvrages men-
tionnés à la fin du chapitre précédent pour plus de détails, à sa-
voir Beard, Pentikäinen, & Pesonen (1984), Borch (1990),
Bühlmann (1970), Daykin, Pentikäinen, & Pesonen (1994),
Gerber (1979), Petauton (2000), Seal (1969), Straub (1988),
Sundt (1984) et Tosetti et al. (2000).
Les principes de calcul de primes constituent à présent une branche
à part entière des mathématiques actuarielles. Il n’entre pas dans les
4.9. Notes bibliographiques 231

objectifs de ce chapitre d’épuiser le sujet, loin s’en faut. Le lecteur


se référera utilement à Goovaerts et al. (1984, 1990) pour de
plus amples détails. Néanmoins, il est bon de signaler que malgré
tous les développements mathématiques (parfois fort raffinés), les
principes de calcul de prime utilisés en pratique se limitent souvent
à ceux présentés succinctement dans la Section 4.4.4.
232 Chapitre 4. De la prime pure à la prime nette
Chapitre 5

Mesure et comparaison
des risques

5.1 Introduction
5.1.1 Mesurer le risque: une tâche essentielle de l’ac-
tuaire
La mesure du risque est très certainement une des tâches les plus
courantes de l’actuaire. C’est d’ailleurs là l’essence même de la pro-
fession. Au nombre des mesures de risque figurent bien évidemment
les primes: le montant de la prime devant en toute circonstance
être proportionné au risque, celle-ci reflète donc le danger associé
au risque transféré à l’assureur. D’autres mesures de risque tentent
d’évaluer la hauteur du capital économique. Il s’agit du capital dont
doit disposer la compagnie pour être en mesure de dédommager les
sinistres. Nous avons déjà vu au Chapitre 4 que ce capital pou-
vait être déterminé en limitant la probabilité de ruine de l’assu-
reur à un niveau suffisamment faible. Il s’agit de l’approche basée
sur la Value-at-Risk, que nous détaillerons plus loin. Nous verrons
que cette manière de faire n’est pas exempte de critique. En ef-
fet, elle ne prend pas en compte l’importance du déficit quand la
ruine survient. Afin de remédier à ce problème, nous nous tournerons
vers l’espérance de queue ou Tail Value-at-Risk. Celle-ci consiste à
déterminer le capital de manière à surmonter en moyenne les pires
exercices.
Remarque 5.1.1. Classiquement, la mesure du risque a été basée
sur la variance (qui mesure la dispersion autour de la prime pure
pour l’actuaire). Un grand classique est bien entendu l’approche

233
234 Chapitre 5. Mesure et comparaison des risques

moyenne-variance sous-tendant les premiers modèles financiers (comme


le MEDAF ou CAPM). Dans ce chapitre, nous ne considérerons ce-
pendant pas la variance comme mesure du risque. Ceci s’explique
par la définition que nous avons retenue plus haut, à savoir le capi-
tal qui, superposé au risque en début de période, rend sa couverture
acceptable.
Bien entendu, la variance et l’écart-type interviennent dans des
principes de calcul de prime, lesquels sont également des mesures de
risque au sens où nous l’entendons dans ce chapitre.

5.1.2 Comparer les risques: une autre spécialité de


l’actuaire
De tout temps, les actuaires ont également été préoccupés par la
comparaison des risques. Pour ce faire, ils se sont souvent basés sur
des mesures scalaires du danger inhérent à un risque X, jugeant un
risque plus avantageux qu’un autre si la valeur prise par cette mesure
sur ce risque est la plus faible. Bien entendu, résumer tout le com-
portement d’un risque dans une seule mesure scalaire, fût-elle bien
choisie, mène le plus souvent à des comparaisons très sommaires.
C’est pourquoi, les actuaires ont ressenti le besoin de recourir à des
méthodes de comparaison plus élaborées, inspirées pour les unes de
la théorie de l’utilité espérée des économistes (que nous présenterons
dans le Tome II) et pour les autres de l’usage simultané de plusieurs
mesures de risque.

5.1.3 Mesurer puis comparer les risques, deux tâches


voisines
Ce chapitre sera divisé en deux grandes parties. Dans la première,
nous présenterons les mesures de risque. Il s’agira de mesures appréhendant
le capital nécessaire pour couvrir les risques. La seconde partie du
chapitre sera consacrée à la comparaison des risques au moyen des
mesures de risque que nous aurons définies. Plutôt que de baser la
comparaions sur une seule mesure (ce qui présente l’avantage de
générer un ordre total, mais le désavantage de manquer de subti-
lité), nous considérerons simultanément plusieurs mesures de risque,
ce qui autorisera une comparaison très fine des variables aléatoires
en présence.
Les risques auxquels l’actuaire est confronté présentant la plu-
part du temps une masse de probabilité importante à l’origine (égale
à la probabilité que la police organisant le transfert du risque ne
5.2. Mesures de risque 235

donne lieu à aucun sinistre), nous devons accorder un soin particu-


lier au cas où les fonctions de répartition en présence ne sont pas
continues. Cette masse de probabilité en zéro complique fortement
les développements techniques et invalide bon nombre de résultats
propres au cas où les fonctions de répartition en présence sont conti-
nues.

5.2 Mesures de risque


5.2.1 Définition
Commençons par définir précisément ce qu’on entend par mesure
de risque dans ce chapitre.
Définition 5.2.1. Une mesure de risque est une fonctionnelle %
faisant correspondre à un risque X un nombre positif noté %[X],
éventuellement infini.
L’idée est que % quantifie le niveau de danger inhérent au risque
X: de grandes valeurs de %[X] indiqueront que X est “dangereux”
(dans un sens à préciser).
Dorénavant, nous considérons %[X] comme le montant de capital
dont la compagnie doit disposer pour faire face à une perte financière
de montant X. Plus précisément, pour autant que % soit normalisée,
i.e.
%[0] = 0,
%[X] est le montant minimum qui, additionné à la perte X en début
de période rend la couverture de X “acceptable”. La compagnie
devra donc disposer du montant %[X], constitué pour partie par les
primes payées par l’assuré, et pour le reste par l’apport en capital
des actionnaires.

5.2.2 Cohérence
Il est généralement admis qu’une mesure de risque doit vérifier
certaines conditions pour être utile dans les applications. Ceci mène
à la notion de mesure de risque cohérente, selon la terminologie de
Artzner, Delbaen, Eber & Heath (1999).
Définition 5.2.2. Une mesure de risque est dite cohérente lors-
qu’elle satisfait les quatre axiomes suivants:
Axiome 1 (invariance par translation): %[X +c] = %[X]+c pour tout
risque X et toute constante c. L’invariance par translation
garantit que  
% X − %[X] = 0.
236 Chapitre 5. Mesure et comparaison des risques

De plus, quelle que soit la constante c, nous devrions avoir

%[c] = c.

Axiome 2 (sous-additivité): %[X + Y ] ≤ %[X] + %[Y ] quelles que


soient les risques X et Y . La sous-additivité traduit la réduction
de risque par diversification. L’effet de diversification est alors
mesuré par
%[X] + %[Y ] − %[X + Y ] ≥ 0,

qui représente l’économie de capital réalisée en couvrant si-


multanément les risques X et Y . On parle d’additivité lorsqu’il
y a égalité, i.e. %[X + Y ] = %[X] + %[Y ] quelles que soient les
risques X et Y . Dans ce cas, l’effet de diversification est nul.
Axiome 3 (homogénéité): %[cX] = c%[X] pour tout risque X et toute
constante positive c. On associe souvent l’homogénéité à une
certaine invariance par rapport aux unités monétaires (si on
mesure la perte financière en millions d’euros plutôt qu’en mil-
liers, le risque n’est pas modifié et le capital subit la même
transformation). L’homogénéité peut également être vue comme
un cas limite de la sous-additivité, lorsqu’il n’y a aucune di-
versification possible. En effet, si nous supposons que c est un
entier positif, la propriété d’homogénéité assure que

%[cX] = %[X {z. . . + X}]


| +X +
c termes
= %[X] + %[X] + . . . + %[X] = c%[X].

Axiome 4 (monotonicité): Pr[X ≤ Y ] = 1 ⇒ %[X] ≤ %[Y ] quels


que soient les risques X et Y . Cette propriété exprime le fait
qu’il faut plus de capital lorsque la perte financière devient plus
sévère. Elle est donc très naturelle.
Remarque 5.2.3. Dans le cadre de la théorie du risque, les mesures
de risque doivent également contenir un chargement de sécurité,
c’est-à-dire qu’elles doivent satisfaire l’inégalité

%[X] ≥ E[X]

pour tout risque X. Le capital minimal doit excéder la perte atten-


due, sans quoi la ruine devient certaine (sous les conditions de la
loi des grands nombres).
5.2. Mesures de risque 237

5.2.3 Value-at-Risk
Définition
Au cours de la dernière décennie, les quantiles ont été largement
utilisés en gestion des risques, sous l’appellation désormais consacrée
de Value-at-Risk. Le recours à cette mesure de risque a été institu-
tionalisé par les autorités de contrôle du secteur bancaire dans les
traités de Bâle successifs.
Définition 5.2.4. Etant donné un risque X et un niveau de pro-
babilité α ∈ (0,1), la VaR correspondante, notée VaR[X; α], est le
quantile d’ordre α de X. Formellement,

VaR[X; α] = FX−1 (α).

La VaR est invariante par translation et homogène


Le fait que la VaR jouisse de ces deux propriétés est une conséquence
directe des résultats suivants, garantissant que la VaR d’une fonc-
tion g du risque X s’obtient en tranformant la VaR de X par la
même fonction.
Lemme 5.2.5. Pour tout p ∈ (0,1),
(i) si g est un fonction strictement croissante et continue à gauche,
−1

Fg(X) (p) = g FX−1 (p) .

(ii) si g est un fonction strictement décroissante, continue à droite,


et si FX est bijective,
−1

Fg(X) (p) = g FX−1 (1 − p) .

Démonstration. Nous ne démontrons que (i); le raisonnement me-


nant à (ii) est analogue. Si g est strictement croissante et continue
à gauche, alors, pour tout 0 < p < 1,
−1
Fg(X) (p) ≤ x ⇔ p ≤ Fg(X) (x) .

Puisque g est continue à gauche,

g (z) ≤ x ⇔ z ≤ sup {y ∈ IR|g (y) ≤ x} ,

pour tout x,z. Ainsi

p ≤ Fg(X) (x) ⇔ p ≤ FX (sup {y ∈ IR|g (y) ≤ x}) .


238 Chapitre 5. Mesure et comparaison des risques

Si sup {y ∈ IR|g (y) ≤ x} est fini, on obtient l’équivalence sou-


haitée, puisque
−1

p ≤ FX (sup {y ∈ IR|g (y) ≤ x}) ⇔ Fg(X) (p) ≤ g FX−1 (p) ,

en utilisant le fait que p ≤ FX (z) est équivalent à FX−1 (z) ≤ z.


Si sup {y ∈ IR|g (y) ≤ x} est infini, l’équivalence ci-dessus ne peut
être utilisée, mais le résultat reste valable. En effet, si sup {y ∈ IR|g (y) ≤ x} =
+∞, l’équivalence devient

p ≤ 1 ⇔ FX−1 (p) ≤ +∞.

La stricte croissante de g et la continuité à droite permet d’obtenir



FX−1 (p) ≤ sup {y ∈ IR|g (y) ≤ x} ⇔ g FX−1 (p) ≤ x,

et en combinant toutes les inégalités, on peut écrire


−1

Fg(X) (p) ≤ x ⇔ g FX−1 (p) , ≤ x
−1

pour tout x, ce qui implique Fg(X) (p) = g FX−1 (p) pour tout p.

Traduit en termes de VaR, le Lemme 5.2.5(i) nous fournit le


résultat suivant, qui montre que la VaR est stable par transformation
croissante non-linéaire.
Propriété 5.2.6. Quels que soient le niveau de probabilité α ∈ (0,1)
et la fonction croissante et continue g, nous avons que

VaR[g(X); α] = g(VaR[X; α]).

En prenant g(x) = x + c et g(x) = cx, on déduit immédiatement


de cette dernière propriété que la VaR est invariante par translation
et homogène.

La VaR n’est pas sous-additive


L’exemple suivant illustre le fait que la VaR d’une somme peut
excéder la somme des VaR associées à chacun des termes. Dès lors,
l’effet de diversification n’est pas toujours positif avec la VaR, de
sorte que cette mesure de risque ne favorise pas systématiquement
la diversification.
Exemple 5.2.7. Considérons les risques indépendants X ∼ Par(1,1)
et Y ∼ Par(1,1), i.e.
1
Pr[X > t] = Pr[Y > t] = , t > 0.
1+t
5.2. Mesures de risque 239

Nous avons alors


1
VaR[X; α] = VaR[Y ; α] = − 1.
1−α
De plus, on peut vérifier que

2 ln(1 + t)
Pr[X + Y ≤ t] = 1 − +2 , t > 0.
2+t (2 + t)2

Puisque
 
  (1 − α)2 1+α
Pr X + Y ≤ 2VaR[X; α] = α − ln <α
2 1−α

l’inégalité

VaR[X; α] + VaR[Y ; α] < VaR[X + Y ; α]

est vraie quel que soit α, de sorte que la VaR ne peut pas être sous-
additive dans ce cas.

La VaR est monotone


Clairement, si Pr[X ≤ Y ] = 1 alors l’inégalité

FX (x) ≥ FY (x) est vérifiée pour tout x.

De ce fait, l’inégalité VaR[X; α] ≤ VaR[Y ; α] est satisfaite quel que


soit le niveau de probabilité α.

5.2.4 Tail-VaR et mesures apparentées


Définition
La VaR au niveau α renseigne à propos du niveau de perte qui
ne sera dépassé que dans 1 − α% des cas au plus. Elle ne donne
par contre aucune information à propos de ce qui se passe lorsque
la VaR est dépassée. Au contraire, la Tail-VaR donne une idée de
ce qui se passe lorsque la VaR au même niveau est dépassée. Cette
notion est formellement définie ci-dessous.
Définition 5.2.8. La Tail Value-at-Risk au niveau α, notée TVaR[X; α]
est définie par
Z 1
1
TVaR[X; α] = VaR[X; ξ] dξ.
1−α α
240 Chapitre 5. Mesure et comparaison des risques

A la lumière de cette définition, la Tail-VaR apparaı̂t comme la


moyenne des VaR de niveau supérieur à α.
Remarque 5.2.9. Il est intéressant de noter qu’il existe une fonc-
tion de répartition FeX , appelée transformée de Hardy-Littlewood de
FX , telle que
FeX−1 (α) = TVaR[X; α].
e une variable aléatoire de fonction de répartition FeX ,
Si on note X
on a donc
TVaR[X; α] = VaR[X; e α].

La Tail-VaR d’un risque X est donc la VaR de la transformée de


Hardy-Littlewood de X.

La TVaR contient un chargement de sécurité


Clairement, TVaR[X; 0] = E[X]. De plus, on voit facilement que
 Z α 
1
TVaR[X; α] = E[X] − VaR[X; ξ] dξ . (5.1)
1−α 0

Il découle facilement de (5.1) que la Tail Value-at-Risk est une fonc-


tion non-décroissante du niveau α. En effet
d TVaR[X; α] VaR[X; α]
TVaR[X; α] = − .
dα 1−α 1−α

Comme α 7→ VaR[X; α] est une fonction non-décroissante,


Z 1
1
TVaR[X; α] = VaR[X; ξ] dξ ≥ VaR[X; α],
1−α α | {z }
≥VaR[X;α]

d
ce qui garantit dα TVaR[X; α] ≥ 0, et

TVaR[X; α] ≥ TVaR[X; 0] = E[X].

Ainsi, la Tail-VaR contient toujours un chargement de sécurité.

Quelques mesures de risque apparentées à TVaR


Ce paragraphe est consacré à quelques mesures de risque in-
timement liées à la TVaR, comme la Conditional Tail Expecta-
tion (CTE), la Conditional-VaR et l’Expected Shortfall (nous avons
5.2. Mesures de risque 241

gardé la terminologie anglaise en raison de son caractère désormais


universel).
Définition 5.2.10. La Conditional Tail Expectation au niveau de
probabilité α, notée CTE[X; α], représente la perte attendue sachant
que la VaR au niveau α est dépassée, i.e.
h i

CTE[X; α] = E X X > VaR[X; α] .

Il s’agit donc de la transcription mathématique du concept in-


tuitif de “perte moyenne dans les pires 1 − α% des cas”.
Définition 5.2.11. La Conditional-VaR au niveau de probabilité α,
notée CVaR[X; α], est la valeur moyenne des pertes qui excèdent la
VaR, i.e. il s’agit de l’excédent moyen de sinistre au-delà de la VaR
ou encore
h i

CVaR[X; α] = E X − VaR[X; α] X > VaR[X; α]

= eX VaR[X; α]
= CTE[X; α] − VaR[X; α].

Définition 5.2.12. L’Expected shortfall au niveau de probabilité α,


notée ES[X; α], n’est autre que la prime stop-loss dont la rétention
est fixée à VaR[X; α]:
 
ES[X; α] = E (X − VaR[X; α])+ = πX (VaR[X; α]).

Le résultat suivant explicite les liens existant entre ces différentes


mesures de risque.
Propriété 5.2.13. Quel que soit le niveau de probabilité α ∈ (0,1),
les identités suivantes sont vérifiées:

1
TVaR[X; α] = VaR[X; α] + ES[X; α], (5.2)
1−α
1
CTE[X; α] = VaR[X; α] + ES[X; α]. (5.3)
F X (VaR[X; α])

Démonstration. L’expression (5.2) provient de


Z 1
ES[X; α] = (VaR[X; ξ] − VaR[X; α]) + dξ
0
Z 1
= VaR[X; ξ] dξ − VaR[X; α](1 − α).
α
242 Chapitre 5. Mesure et comparaison des risques

L’expression (5.3) se déduit de


h i

ES[X; α] = E X − VaR[X; α] X > VaR[X; α] F X (VaR[X; α]) .
(5.4)

La Propriété 5.2.13 nous permet d’établir le résultat suivant, qui


fournit l’interprétation usuelle de la TVaR.
Proposition 5.2.14. La CTE et la TVaR coı̈ncident pour des risques
dont la fonction de répartition est continue, i.e.

CTE[X; α] = TVaR[X; α], α ∈ (0,1) . (5.5)

Démonstration. Il suffit de noter que si F X est continue alors


 
FX VaR[X; α] = α et F X VaR[X; α] = 1 − α

de sorte que (5.2)-(5.3) donnent le résultat annoncé.

La TVaR est cohérente pour des risques continus


La TVaR est invariante par translation et homogène. En effet,
comme la VaR est invariante par translation,
Z 1
1
TVaR[X + c; α] = VaR[X + c; ξ] dξ
1−α α
Z 1
1 
= VaR[X; ξ] + c dξ
1−α α
= TVaR[X; α] + c.

De la même manière, l’homogénéité de la VaR garantit l’homogénéité


de la TVaR.
Il ne nous reste donc plus qu’à établir la monotonicité et la sous-
additivité de cette mesure de risque afin de prouver sa cohérence.
Ces propriétés s’obtiennent grâce au résultat suivant.
Propriété 5.2.15. Soient le risque X et le niveau de perte x tels que
F X (x) > 0. Quel que soit l’événement aléatoire E tel que Pr[E] =
F X (x), l’inégalité suivante est vérifiée:

E[X|E] ≤ E[X|X > x].

Démonstration. Pour établir le résultat annoncé, il suffit de remar-


quer que
Pr[X > x|E] Pr[E]
Pr[E|X > x] = = Pr[X > x|E].
Pr[X > x]
5.2. Mesures de risque 243

Dès lors, écrivons


E[X|X > x] = x + E[X − x|X > x,E] Pr[E|X > x]
+E[X − x|X > x,E] Pr[E|X > x]
≥ x + E[X − x|X > x,E] Pr[E|X > x]
= x + E[X − x|X > x,E] Pr[X > x|E]
≥ x + E[X − x|X > x,E] Pr[X > x|E]
+E[X − x|X ≤ x,E] Pr[X ≤ x|E]
= E[X|E]
ce qui achève la preuve.
Ce résultat est relativement intuitif. En effet, E[X|E] représente
le montant moyen de perte lorsqu’on sait que l’événement E est
réalisé. La Propriété 5.2.15 nous apprend que la pire information
qui soit est que X soit grande, entendez X > x.
La Propriété 5.2.15 permet d’affirmer que la TVaR est sous-
additive lorsque les risques sont continus. En effet, dans ce cas, la
TVaR et la CTE coı̈ncident et
 
TVaR[X + Y ; α] = E X X + Y > VaR[X + Y ; α]
 
+E Y X + Y > VaR[X + Y ; α]
 
≤ E X X > VaR[X; α]
 
+E Y Y > VaR[Y ; α]
= TVaR[X; α] + TVaR[Y ; α].
De la même manière, la TVaR est monotone, puisque lorsque Pr[X ≤
Y]=1
 
TVaR[Y ; α] = E Y Y > VaR[Y ; α]
 
≥ E Y X > VaR[X; α]
 
≥ E X X > VaR[X; α]
= TVaR[X; α].
Nous insistons ici sur le fait que TVaR n’est cohérente que pour
les risques continus (et coı̈ncide alors avec la CTE).

5.2.5 Mesure de risque d’Esscher


Définition
La mesure de risque d’Esscher consiste à prendre la prime pure
de la transformée d’Esscher du risque initial, ce qui se formalise
244 Chapitre 5. Mesure et comparaison des risques

comme suit.
Définition 5.2.16. La mesure de risque d’Esscher de paramètre
h > 0 du risque X, notée Es[X; h], est donnée par

E[X exp(hX)] d
Es[X; h] = = ln MX (h).
MX (h) dh

Remarque 5.2.17. En fait, Es[X; h] n’est autre que la valeur at-


tendue de la transformée d’Esscher X h de X, dont la fonction de
répartition est donnée par (4.13), i.e.
Z
Es[X; h] = E[Xh ] = ξdFX,h (ξ).
ξ∈IR+

On remplace donc le risque initial X par un risque moins favorable


Xh avant de calculer la prime pure.

La mesure de risque d’Esscher contient un chargement de


sécurité
La mesure de risque d’Esscher est croissante ne le paramètre h,
comme le montre le résultat suivant.
Propriété 5.2.18. Es[X; h] est une fonction croissante de h.

Démonstration. Le résultat annoncé découle directement de


Z Z 2
d 2
E[Xh ] = x dFX,h (ξ) − xdFX,h (ξ)
dh ξ∈IR+ ξ∈IR+
= V[Xh ] ≥ 0. (5.6)

Cette dernière propriété garantit que quel que soit h > 0,

Es[X; h] ≥ Es[X; 0] = E[X],

de sorte que la mesure de risque d’Esscher contient un chargement


de sécurité.

Non-cohérence de la mesure de risque d’Esscher


La mesure de risque d’Esscher n’est pas homogène (sauf dans
le cas trivial h = 0). Elle est invariante par translation mais pas
monotone, comme le montre le résultat suivant.
5.2. Mesures de risque 245

Exemple 5.2.19. Considérons les risques X et Y définis par

1
Pr[X = 0,Y = 0] = ,
3
1
Pr[X = 0,Y = 3] = ,
3
1
Pr[X = 6,Y = 6] = .
3
Dans ce cas, Pr[X ≤ Y ] = 1, mais

Es[X; 1/2] = 5.4567 > Es[Y ; 1/2] = 5.2395.

5.2.6 Mesures de risque de Wang


Définition
Ces mesures de risque exploitent la représentation de l’espérance
mathématique établie à la Propriété 3.2.7. L’idée est alors de trans-
former la fonction de queue afin de générer un chargement de sécurité.
Nous appellerons désormais fonction de distorsion toute fonction
non-décroissante g : [0, 1] → [0, 1] telle que g(0) = 0 et g(1) = 1.
Définition 5.2.20. La mesure de risque de Wang associée à la
fonction de distorsion g, notée ρg [.], est définie par
Z ∞ 
ρg [X] = g F X (x) dx. (5.7)
0

Remarque 5.2.21. A la lumière de cette définition, on peut faire


les commentaires suivants:
(i) La fonction de distorsion g(q) = q correspond à l’espérance
mathématique E [X].
(ii) Clairement, si g(q) ≥ q quel que soit q ∈ [0,1], on a alors
ρg [X] ≥ E [X], de sorte que les mesures de risques de Wang
associée à de telles fonctions de distorsion contiennent un
chargement de sécurité.
(iii) De plus, il est intéressant de remarquer que lorsque g 1 (q) ≤
g2 (q) quel que soit q ∈ [0,1] nous avons alors ρ g1 [X] ≤ ρg2 [X].

Mesures de risque de Wang et VaR


R F (x) 
En substituant 0 X dg(α) à g F X (x) dans (5.7) et en per-
mutant les intégrales, on obtient le résultat suivant.
246 Chapitre 5. Mesure et comparaison des risques

Propriété 5.2.22. Quel que soit le risque X, la mesure de risque


de Wang associée à la fonction de distorsion g peut s’écrire
Z 1
ρg [X] = VaR[X; 1 − α] dg(α). (5.8)
0

Ainsi, les mesures de risque de Wang sont des mélanges de VaR.


En particulier, si nous considérons la fonction de distorsion g :
[0,1] → [0,1] définie par

gα (x) = I[x ≥ 1 − α]

pour une valeur α ∈ [0,1) fixée, il vient alors par (5.8)

ρgα [X] = VaR[X; α]

qui montre que la VaR au niveau de probabilité α est une mesure


de Wang particulière correspondant à une fonction de distorsion
passant de 0 à 1 en 1 − α.
Remarque 5.2.23. Dans ce cas, gα est une fonction de répartition,
correspondant à la constante 1 − α.

Mesure de risque de Wang et TVaR

De la même manière, en repartant de (5.8) avec la fonction de


distorsion  
x
gα (x) = min ,1 ,
1−α
pour α ∈ [0,1] fixé on obtient
Z 1−α
1
ρgα [X] = VaR[X; 1 − ξ]dξ = TVaR[X; α].
1−α 0

Remarque 5.2.24. Dans ce cas également, g α est une fonction de


répartition, correspondant à la loi Uni(0,1 − α).

L’ES n’est pas une mesure de risque de Wang

Supposons par l’absurde que ES[X; α] puisse effectivement être


représentée sous la forme d’une mesure de risque de Wang, associée
à une fonction de distorsion gα , i.e. ES[X; α] = ρgα [X] quel que soit
5.2. Mesures de risque 247

le risque X. Prenons X ∼ Uni(0,1). Dans ce cas,


Z 1
ES[X; α] = (1 − x)dx
α
1
= (1 − α)2
2
Z 1
= ρgα [X] = gα (1 − x)dx. (5.9)
0

Considérons à présent Y ∼ Ber(q) pour 0 < q ≤ 1 − α. On obtient


facilement
ES[Y ; α] = q = ρgα [Y ] = gα (q)
qui implique gα (q) = q for 0 < q ≤ 1 − α. En insérant cela dans
(5.9) on obtient
Z α Z 1
1 2
(1 − α) = gα (1 − x)dx + (1 − x)dx
2 0 α
1
≥ (1 − α)2 + α(1 − α),
2
ce qui nous mène à une contradiction puisque 0 < α < 1.

La CTE n’est pas une mesure de risque de Wang


Nous pouvons formellement établir par l’absurde que la CTE
n’est pas une mesure de risque de Wang. Il suffit en fait de procéder
comme pour l’ES. Par l’absurde, supposons qu’il existe une fonction
de distorsion gα telle que CTE[X; α] = ρgα [X] quel que soit le risque
X. Pour X ∼ Uni(0,1) il vient à partir de (5.3)
Z 1
1
CTE[X; α] = α + (1 − α) = gα (1 − x) dx,
2 0

qui donne après simplification


Z 1
1
gα (x) dx = (1 + α). (5.10)
0 2
En passant à Y ∼ Ber(q) et invoquant à nouveau (5.3), on obtient
CTE[Y ; α] = 1 quels que soient q et α. Dès lors,

gα (q) = ρgα [Y ] = CTE[Y ; α] = 1

d’où l’on tire gα (·) ≡ 1 sur (0,1], ce qui contredit l’équation (5.10)
et achève de prouver que la CTE n’est pas une mesure de risque de
Wang.
248 Chapitre 5. Mesure et comparaison des risques

Mesure de risque Dual-power


En prenant
g(x) = 1 − (1 − x)ξ , ξ ≥ 1,
nous obtenons
Z
ρg [X] = (1 − {FX (x)}ξ )dx.
x≥0

Si ξ est entier, ρg [X] peut être interprétée comme la valeur attendue


du maximum Mξ = max{X1 , . . . ,Xξ } d’un ensemble de ξ variables
aléatoires indépendantes et de même loi que X. En effet, la fonction
de queue de Mξ est donnée par

Pr[Mξ > x] = 1 − Pr[X1 ≤ x, . . . ,Xξ ≤ x] = 1 − {FX (x)}ξ ,

de sorte que ρg [X] = E[Mξ ].

Mesure de risque PH
Considérons la fonction de distorsion

g(x) = x1/ξ , ξ ≥ 1.

La mesure de risque PH est donnée par


Z
PHξ [X] = ρg [X] = {F X (x)}1/ξ dx.
x≥0

Notez que pour ξ = 1, PH1 [X] = E[X].

Comparaison des principales fonctions de distorsion


Les courbes de la Figure 5.1 montrent la forme des principales
fonctions de distorsion, parmi lesquelles,
VaR g (x) = I[x ≥ p]
Tail-VaR g (x) = min {x/p,1}
PH g (x) = xp
Dual Power g (x) = 1 − (1 − x)1/p
Gini g (x) = (1 + p) x − px2
Transformation exponentielle g (x) = (1 − p x ) / (1 − p)
où p est une constante comprise entre 0 et 1.
Remarque 5.2.25. Nous reviendrons plus longuement dans le Tome
2 sur les différentes fonctions de distorsion en micro-économie de
l’assurance.
5.2. Mesures de risque 249

VaR - 80% Puissance (dual) - 0,4


VaR - 95% Puissance (dual) - 0,8
TVaR - 75% Gini - 0,4
1.0 1.0
TVaR - 90% Gini - 0,8
Hasard proportionnel - 0,3 Exponentiel - 0,4
Hasard proportionnel - 0,8 Exponentiel - 0,8

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0.0
0.0

0.0 0.2 0.4 0.6 0.8 1.0


0.0 0.2 0.4 0.6 0.8 1.0

Fig. 5.1 – Principales fonctions de distorsion

Propriétés des mesures de risque de Wang

Les principales propriétés des mesures de risque de Wang sont


résumées dans le résultat suivant.
Propriété 5.2.26. (i) Les mesures de risque de Wang sont ho-
mogènes.
(ii) Les mesures de risque de Wang sont invariantes par transla-
tion.
(iii) Les mesures de risque de Wang sont monotones.

Démonstration. En travailant à partir de la Propriété 5.2.22, et en


tenant compte du fait que la VaR est invariante par translation, on
obtient
Z 1
ρg [X + c] = VaR[X + c; 1 − α] dg(α)
0
Z 1 
= VaR[X; 1 − α] + c dg(α)
0

= ρg [X] + c g(1) − g(0) = ρg [X].

Ceci établit (i). De la même manière, on déduit l’homogénéité et la


monotonie des mesures de Wang des propriétés correspondantes de
la VaR.
250 Chapitre 5. Mesure et comparaison des risques

Concavité de la fonction de distorsion


Si la fonction de distorsion g est concave, la fonction x 7→ g(F X (x))
est continue à droite et est donc la fonction de queue d’une certaine
variable aléatoire. En pareille situation ρ g [X] est effectivement une
espérance mathématique (non pas de X mais d’une variable Y dont
la fonction de queue vaut F Y (y) = g(F X (y))).
Propriété 5.2.27. Lorsque la fonction de distorsion est concave,
la mesure de risque correspondante est sous-additive.
Corollaire 5.2.28. En combinant les Propriétés 5.2.26 et 5.2.27,
on constate que les mesures de risque de Wang correspondant à des
fonctions de distorsion concaves sont cohérentes.

Nouvelle caractérisation de la TVaR


Le résultat suivant montre que la TVaR est la plus petite mesure
de risque de Wang associée à une fonction de distorsion concave et
excédant la VaR de même niveau de probabilité. En d’autres termes,
la TVaR est la plus petite mesure de risque cohérente excédant la
VaR.
Propriété 5.2.29. Quel que soit le niveau de probabilité 0 < α < 1
et le risque X, nous avons
n o

TVaR[X; α] = min ρg [X] g est concave et ρg [X] ≥ VaR[X; α] .
(5.11)

Démonstration. La TVaR est la mesure de risque


 de Wang associée à
x
la fonction de distorsion concave min 1−α , 1 . De plus, TVaR[X; α] ≥
VaR[X; α]. Ceci implique que
n o

TVaR[X; α] ≥ inf ρg [X] g est concave et ρg [X] ≥ VaR[X; α] .

Afin d’établir l’inégalité contraire, considérons une fonction de dis-


torsion concave g telle que

ρg [Y ] ≥ VaR[Y ; α],

soit valable quelle que soit le risque Y . En prenant alors q tel


que 1 − α < q < 1, et Yq ∼ Ber(q), il est facile de vérifier que
VaR[Yq ; α] = 1, et aussi ρg [Yq ] = g(q). Comme g(x) ≤ 1, nous voyons
que la condition ρg [Yq ] ≥ VaR[Yq ; α] peut se réécrire g(q) = 1. Cette
condition doit être satisfaite pour tout q tel que 1 − α < q < 1. Ceci
5.3. Comparaison uniforme des VaR: l’ordre  VaR 251

signifie que g vaut 1 sur l’intervalle (1 − α, 1]. Comme g est concave,


ceci entraı̂ne
 
x
g(x) ≥ min ,1 , 0 < x < 1,
1−α

d’où l’on tire


ρg [X] ≥ TVaR[X; α].
Cette dernière inégalité est satisfaite quelle que soit la fonction de
distorsion concave g telle que ρg [X] ≥ VaR[X; α]. Ceci implique
n o

TVaR[X; α] ≤ inf ρg [X] g est concave et ρg [X] ≥ VaR[X; α]
(5.12)
et achève la démonstration.

5.3 Comparaison uniforme des VaR: l’ordre


VaR
5.3.1 Définition
Nous avons étudié en détail les propriétés de la VaR. Ayant
deux risques X et Y , on peut naturellement songer à les comparer
au moyen de la VaR correspondant à un niveau α 1 , i.e. considérer
X comme moins risqué que Y si VaR[X; α 1 ] ≤ VaR[X; α1 ]. Sou-
vent cependant, le choix du niveau de probabilité ne s’impose pas
immédiatement, et rien n’interdit d’avoir simultanément VaR[X; α 1 ] ≤
VaR[X; α1 ] et VaR[X; α2 ] ≥ VaR[X; α2 ] pour deux niveaux de pro-
babilité α1 et α2 . Dans un tel cas de figure, lequel des risques X et
Y est le moins dangereux?
Afin d’éviter ces difficultés, on adoptera désormais la définition
suivante, qui suggère de comparer les risques X et Y en exigeant
que les VaR relatives à ces risques soient ordonnées quel que soit le
choix du niveau de probabilité.
Définition 5.3.1. Etant donnés deux risques X et Y , X sera considéré
moins dangereux que Y sur base de la comparaison des VaR, ce qui
se notera désormais X VaR Y , lorsque

VaR[X; α] ≤ VaR[Y ; α] pour tout α ∈ (0,1).

La relation VaR que nous venons de définir constitue un ordre


partiel sur l’ensemble des lois de probabilité (on vérifie aisément
qu’elle est réflexive, antisymétrique et transitive). Elle n’est par
252 Chapitre 5. Mesure et comparaison des risques

contre pas antisymétrique en ce qui concerne les variables aléatoires.


En effet, X VaR Y et Y VaR X n’entraı̂nent pas X = Y mais
seulement X =loi Y .
La relation VaR a été étudiée depuis fort longtemps en probabi-
lité et en statistique (nous renvoyons le lecteur par exemple à Leh-
mann (1955)). Elle est mieux connue dans ces milieux sous le nom
d’ordre stochastique, ou d’ordre en distribution. Les économistes
et les actuaires en ont également fait un usage important, sous le
nom de dominance stochastique du premier ordre. D’autres nota-
tions usuelles pour VaR sont st , 1 ou F SD .

5.3.2 Conditions équivalentes


Nous établissons ci-dessous plusieurs conditions équivalentes pour
avoir VaR entre deux risques X et Y . La première d’entre elles nous
apprend qu’il est équivalent de comparer les VaR ou les fonctions
de répartition (ces dernières étant les réciproques des VaR).
Propriété 5.3.2. Etant données deux variables aléatoires X et Y ,

X VaR Y ⇔ FX (t) ≥ FY (t) pour tout t ∈ IR,


⇔ F X (t) ≤ F Y (t) pour tout t ∈ IR.

En interprétant F X (t) comme la probabilité que X prenne une


“grande” valeur (i.e. une valeur supérieure à t), cette dernière pro-
priété nous montre que X VaR Y signifie que X est “plus petite”
que Y , puisque la probabilité que X prenne de grandes valeurs est
toujours inférieure à celle que Y prenne de grandes valeurs.
Remarque 5.3.3 (Insensibilité de  VaR à la variance). La
relation VaR ne permet pas d’affirmer quoi que ce soit à propos des
variances des variables aléatoires qui sont comparées. En effet, si
nous prenons X ∼ Ber(p) et Y = 1, nous avons X  VaR Y bien que

V[X] = p(1 − p) > V[Y ] = 0.

Ceci montre bien que VaR s’attache à comparer la grandeur des


risques, et pas leur variabilité.
L’inégalité stochastique X VaR Y permet de déduire bon nombre
d’inégalités intéressantes, comme en témoigne le résultat suivant.
Propriété 5.3.4. Etant données deux variables aléatoires X et Y ,

X VaR Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction croissante g,

pour autant que les espérances existent.


5.3. Comparaison uniforme des VaR: l’ordre  VaR 253

Démonstration. Il suffit de se rappeler que si U ∼ Uni(0,1) alors


X =loi VaR[X; U ] en vertu de la Propriété 2.5.2. Fort de ce résultat,
nous disposons de la représentation suivante, valable quelle que soit
la fonction g:
h Z 1
i 
E[g(X)] = E g VaR[X; U ] = g VaR[X; u] du.
0
Le résultat annoncé s’obtient alors simplement en écrivant
Z 1

E[g(X)] = g VaR[X; u] du
0
Z 1

≤ g VaR[Y ; u] du = E[g(Y )].
0

En plus des deux résultats obtenus ci-dessus, montrons à présent


que l’on peut se limiter à des fonctions g régulières dans la Propriété
5.3.4.
Propriété 5.3.5. Etant données deux variables aléatoires X et Y ,
X VaR Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction g telle que g 0 ≥ 0,
pour autant que les espérances existent.
Démonstration. L’implication “⇒” est évidente. Pour prouver la
réciproque, remarquons que
 
x−t
I[x > t] = lim Φ .
σ→0 σ

Or la fonction x 7→ −Φ t−xσ est croissante. Dès lors, on a en parti-
culier      
t−Y t−X
−E Φ ≤ −E Φ
σ σ
d’où l’on tire
  
X −t
Pr[X > N or(t,σ)] = E Φ
σ
  
Y −t
≤ E Φ
σ
= Pr[Y > N or(t,σ)]
quel que soit σ > 0. Cette même inégalité subsiste après passage
à la limite pour σ → 0, ce qui donne Pr[X > t] ≤ Pr[Y > t].
Comme le raisonnement est valable quel que soit t, ceci achève la
démonstration.
254 Chapitre 5. Mesure et comparaison des risques

Conditions suffisantes

La Propriété 5.3.2 nous apprend que X  VaR Y lorsque les fonc-


tions de queue de X et de Y se dominent mutuellement. Le résultat
suivant fournit une condition suffisante pour que cela ait lieu. Il suf-
fit en fait que les densités de probabilité ne se croisent qu’une seule
fois.
Propriété 5.3.6. Quels que soient les risques X et Y , si f X (t) ≥
fY (t) pour t < c et fX (t) ≤ fY (t) pour t > c alors X VaR Y .

Démonstration. Il suffit de remarquer que si x < c,


Z x Z x
FX (x) = fX (t)dt ≥ fY (t)dt = FY (x)
0 0

et si x > c
Z +∞ Z +∞
F X (x) = fX (t)dt ≥ fY (t)dt = F Y (x).
x x

Nous avons donc X VaR Y sous les conditions énoncées plus haut,
ce qui achève la démonstration.

5.3.3 Propriétés
Stabilité de VaR par rapport aux clauses conventionnelles
relatives aux dommages

Les développements de ce paragraphe sont basés sur le résultat


suivant.
Propriété 5.3.7. Quelles que soient les variables aléatoires X et
Y,
X VaR Y ⇒ t(X) VaR t(Y )

quelle que soit la fonction t non-décroissante.

Démonstration. Le résultat se déduit immédiatement de la consta-


tation suivante: quelle que soit la fonction non-décroissante g, la
fonction x 7→ g(t(x)) est non-décroissante lorsque t est non-décroissante.
5.3. Comparaison uniforme des VaR: l’ordre  VaR 255

La Propriété 5.3.7 garantit entre autres que, lorsque X  VaR Y ,

(X − δ)+ VaR (Y − δ)+ pour tout découvert


obligatoire δ ∈ IR,
αX VaR αY pour tout α > 0,
XI[X > κ] VaR Y I[Y > κ] pour toute franchise κ ∈ IR,
min{X,ω} VaR min{Y,ω} pour tout plafond ω ∈ IR.

Ceci revient à dire qu’une comparaison au sens  VaR n’est pas


altérée par l’introduction d’une clause conventionnelle relative aux
dommages (qu’il s’agisse d’un découvert obligatoire, d’une franchise
ou d’un plafond d’intervention) dans les conditions de la police.

Stabilité de VaR en présence d’incertitude


Quels que soient les risques X et Y et le vecteur aléatoire Θ, si
X VaR Y lorsque Θ = θ, alors l’inégalité stochastique reste valable
lorsque Θ est inconnu. En effet, comme

Pr[X ≤ x|Θ = θ] ≥ Pr[Y ≤ x|Θ = θ] pour tout θ et x,

on en déduit facilement que


Z
Pr[X ≤ x] = Pr[X ≤ x|Θ = θ]dFΘ (θ)

≥ Pr[Y ≤ x|Θ = θ]dFΘ (θ) = Pr[Y ≤ x],


θ

ce qui prouve le résultat annoncé.

5.3.4 Taux de hasard et mesure de risque PH


Définition et conditions équivalentes
Nous pourrions nous intéresser à la comparaison des risques sa-
chant qu’ils excèdent un certain niveau t. Ainsi, on pourrait exiger
que
[X|X > t] VaR [Y |Y > t]
quel que soit le niveau t. L’exemple suivant montre que cela n’est
pas forcément vrai lorsque X VaR Y .
Exemple 5.3.8. Montrons que

X VaR Y ; [X|X > t] VaR [Y |Y > t] pour tout t.


256 Chapitre 5. Mesure et comparaison des risques

Considérons par exemple le cas où X ∼ Uni(0,3) et Y possède la


densité
1 1 1
fY (x) = I]0,1] (x) + I]1,2] (x) + I]2,3[ (x) .
6 2 3
Alors X VaR Y , mais [X|X > 1] ∼ Uni(1,3) et [Y |Y > 1] possède
la densité
3 2
fY∗ (x) = I]1,2] (x) + I]2,3[ (x)
5 5
de telle sorte que

[Y |Y > 1] VaR [X|X > 1].

On peut prouver le résultat suivant.


Propriété 5.3.9. Etant donnés deux risques X et Y , [X|X >
t] VaR [Y |Y > t] quel que soit t ∈ IR si, et seulement si

F Y (t)
⇔ t 7→ est non-décroissante
F X (t)
⇔ F X (u)F Y (v) ≥ F X (v)F Y (u) quels que soient u ≤ v.

On peut rapprocher cette comparaison des taux de hasard, comme


le montre le résultat suivant.
Propriété 5.3.10. Etant donnés deux risques X et Y , [X|X >
t] VaR [Y |Y > t] quel que soit t ∈ IR si, et seulement si r X (t) ≥
rY (t) quel que soit t.

Démonstration. Le rapport F Y /F X est non-décroissant si, et seule-


ment si, ln F Y /F X l’est également. Ceci revient encore à imposer
que ln F Y − ln F X soit non-décroissant, ce qui revient à r X − rY > 0
puisqu’en vertu de la Propriété 3.6.22

dn o
ln F Y (t) − ln F X (t) = rX (t) − rY (t).
dt

Remarque 5.3.11. La méthode de comparaison de lois de probabi-


lité dont il est question dans les Propriétés 5.3.9-5.3.10 est souvent
appelée l’ordre du taux de hasard (hazard rate order) et notée  hr ).
5.3. Comparaison uniforme des VaR: l’ordre  VaR 257

Taux de hasard et mesure de risque PH


Supposons qu’on déflate le taux de hasard d’un facteur ξ, i.e.
que l’on passe d’un taux rX à un taux rX ∗ donné par
rX (t)
rX ∗ (t) = ≤ rX (t), pour ξ ≥ 1,
ξ
nous obtenons grâce à la Propriété 3.6.22 une fonction de queue
 Z t 
rX (s)
F X ∗ (t) = exp − ds = {F X (t)}1/ξ .
0 ξ
Dès lors, P H[X; ξ] = E[X ∗ ]. Le mesure de risque PH consiste donc
à remplacer le risque initial X par un risque transformé X ∗ dont le
taux de hasard a été déflaté, et à calculer ensuite l’espérance associée
à X ∗ . Nous avons
[X|X > t] VaR [X ∗ |X ∗ > t] quel que soit t > 0.

5.3.5 Rapport de vraisemblance et principe d’Esscher


Définition
Nous pourrions encore songer à imposer
[X|a ≤ X ≤ a + h] VaR [Y |a ≤ Y ≤ a + h]
quel que soit le niveau a et l’accroissement h > 0. Ceci correspond à
la situation d’un réassureur qui aurait à couvrir la tranche (a,a + h]
d’un risque X, i.e. qui s’exposerait à une perte de

 0 si X < a
X(a,a+h] = X − a si a ≤ X < a + h

h si a + h ≤ X,
où a est la rétention et h la portée.
On peut établir le résultat suivant.
Proposition 5.3.12. Considérons les variables aléatoires X et Y ,
toutes deux continues ou discrètes, possédant les fonctions de densité
fX et fY . Si
fX (t)
décroı̂t sur l’union des supports de X et de Y (5.13)
fY (t)
(en prenant par convention a/0 égal à +∞ lorsque a > 0), ou, de
manière équivalente, si
fX (u)fY (v) ≥ fX (v)fY (u) pour tout u ≤ v. (5.14)
258 Chapitre 5. Mesure et comparaison des risques

Alors, [X|a ≤ X ≤ a + h] VaR [Y |a ≤ Y ≤ a + h] quel que soit le


niveau a et l’accroissement h > 0

Démonstration. Considérons a < b. L’inégalité stochastique [X|a ≤


X ≤ b] VaR [Y |a ≤ Y ≤ b] garantit que

Pr[u ≤ X ≤ b] Pr[u ≤ Y ≤ b]
≤ lorsque u ∈ [a,b].
Pr[a ≤ X ≤ b] Pr[a ≤ Y ≤ b]

Il suit alors
Pr[a ≤ X < u] Pr[a ≤ Y < u]
≥ lorsque u ∈ [a,b].
Pr[u ≤ X ≤ b] Pr[u ≤ Y ≤ b]

C’est-à-dire
Pr[a ≤ X < u] Pr[u ≤ X ≤ b]
≥ lorsque u ∈ [a,b].
Pr[a ≤ Y < u] Pr[u ≤ Y ≤ b]

En particulier, pour u < b ≤ v,

Pr[u ≤ X < b] Pr[b ≤ X ≤ v]


≥ .
Pr[u ≤ Y < b] Pr[b ≤ Y ≤ v]

Dès lors, lorsque X et Y sont continues,

Pr[a ≤ X < u] Pr[b ≤ X ≤ v]


≥ lorsque a < u ≤ b ≤ v.
Pr[a ≤ Y < u] Pr[b ≤ Y ≤ v]

Si nous passons à la limite pour a → u et b → v nous obtenons


(5.14). La preuve dans le cas discret est similaire.

Les conditions (5.13) et (5.14), apparemment techniques et peu


intuitives, sont généralement faciles à établir dans les modèles pa-
ramétriques.
Remarque 5.3.13. La méthode de comparaison de lois de probabi-
lité dont il est question dans la Proposition 5.3.12 est encore appelée
ordre du rapport de vraisemblance, et notée  lr .

Lien avec la transformée d’Esscher


Notons Xh la transformée d’Esscher de X. Le rapport des den-
sités de probabilités associées à X et X h est proportionnel à exp(−hx),
qui est clairement décroissant en x. Ceci indique que

[X|a ≤ X ≤ b] VaR [Xh |a ≤ Xh ≤ b],


5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 259

quels que soient a < b.


Le résultat suivant montre sous quelles conditions les mesures de
risque d’Esscher relatives à deux risques X et Y sont uniformément
ordonnées.
Propriété 5.3.14. Si [X|a ≤ X ≤ b]  VaR [Y |a ≤ Y ≤ b] quels que
soient a < b alors Es[X; h] ≤ Es[Y ; h] pour tout h > 0.
Démonstration. Nous savons en vertu de la Proposition 5.3.12 que
l’inégalité
fX (u)fY (v) ≥ fX (v)fY (u)
est satisfaite pour tout u ≤ v. En multipliant les deux membres de
cette inégalité par
exp(hu) exp(hv)
MX (h) MY (h)
on obtient la même inégalité pour les fonctions de densité de X h et
Yh , d’où on tire que [Xh |a ≤ Xh ≤ b] VaR [Yh |a ≤ Yh ≤ b], ce qui
donne le résultat annoncé.

5.4 Comparaison uniforme des TVaR: les ordres


TVaR et TVaR,=
5.4.1 Definition
Nous introduisons ici une nouvelle méthode de comparaison des
risques, basée sur les Tail-VaR.
Définition 5.4.1. Quelles que soient les variables aléatoires X et Y
de moyenne finie, X sera considéré moins dangereux que Y sur base
de la comparaison des TVaR, ce qui se notera dorénavant X  TVaR
Y , lorsque

TVaR[X; α] ≤ TVaR[Y ; α] pour tout α ∈ [0,1].

La restriction à des risques de moyenne finie garantit l’exis-


tence des TVaR, et donc la correction de la définition de  TVaR .
Dorénavant, nous ne comparons donc que des risques dont la prime
pure est finie (il est bon de noter que de nombreux résultats que
nous établirons dans la suite de cette section dépendent de cette
hypothèse). Cette restriction distingue également  VaR et TVaR :
en effet, VaR est définie quelles que soient les variables en présence,
ce qui n’est pas le cas pour TVaR .
La relation TVaR est très ancienne (elle est la digne héritière de
la relation dite de majorization entre vecteurs numériques, étudiée
260 Chapitre 5. Mesure et comparaison des risques

dans les années 1930). Les actuaires l’appellent encore ordre stop-
loss (noté sl ), notion intimement liée à la dominance stochastique
du deuxième ordre des économistes (souvent notée  2 ou SSD ).
La relation TVaR est mieux connue des probabilistes sous le nom
d’ordre convexe croissant (noté  icx ).
Nous utiliserons encore la relation notée  TVaR,= , qui restreint
TVaR aux couples de variables aléatoires de même moyenne.
Définition 5.4.2. Quelles que soient les variables aléatoires X et
Y,

E[X] = E[Y ],
X TVaR,= Y ⇔
X TVaR Y,

TVaR[X; 0] = TVaR[Y ; 0],

TVaR[X; α] ≤ TVaR[Y ; α] pour tout α ∈ (0,1).
La relation TVaR,= est connue sous le nom d’ordre convexe
parmi les probabilistes (noté cx ). Elle est intimement liée à d’autres
relations, comme l’ordre de Lorenz.
Remarque 5.4.3. Notez que VaR ne permettait pas de comparer
des variables aléatoires de même moyenne. En effet,

X VaR Y
⇒ X =loi Y.
E[X] = E[Y ]
Afin de prouver ce résultat, il suffit d’examiner l’identité
Z +∞
E[Y ] − E[X] = {Pr[Y > x] − Pr[X > x]} dx = 0,
x=0 | {z }
≥0 pour tout x

qui entraı̂ne Pr[Y > x] = Pr[X > x] pour tout x et achève la


vérification.

5.4.2 Conditions équivalentes


Tail-VaR et primes stop-loss
Les relations TVaR et TVaR,= introduites ci-dessus peuvent
encore être interprétées en termes de primes stop-loss, comme le
montrent les résultats suivants.
Proposition 5.4.4. Soient deux variables aléatoires X et Y de
même moyenne finie. Alors, chacune des deux inégalités suivantes
est équivalente à E[(X − t)+ ] ≤ E[(Y − t)+ ] pour tout t ∈ IR:
Z p Z p
FX−1 (u) du ≥ FY−1 (u) du pour tout p ∈ [0,1]; (5.15)
0 0
5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 261

et
Z 1 Z 1
FX−1 (u) du ≤ FY−1 (u) du pour tout p ∈ [0,1]. (5.16)
p p

Démonstration. De l’égalité des moyennes et du fait que


Z 1 Z 1
E[X] = FX−1 (u) du et E[Y ] = FY−1 (u) du
0 0

on déduit que pour tout p ∈ [0,1], les inégalités (5.15) et (5.16) sont
équivalentes. Ainsi, il suffit de montrer que E[(X −t) + ] ≤ E[(Y −t)+ ]
pour tout t ∈ IR si, et seulement si, (5.15) est satisfaite.
Nous démontrons le résultat pour des fonctions de répartition
continues qui se croisent à un nombre fini de reprises; le raisonne-
ment est similaire dans le cas général, mais techniquement beau-
coup plus lourd. De l’égalité des moyennes, on déduit que F X et FY
doivent se croiser au moins une fois. Que les primes stop-loss soient
uniformément ordonnées ou que (5.15) soit vérifiée, F X doit être
inférieure à FY avant ce premier croisement et, de la même manière,
FX doit dominer FY après le dernier croisement.

p
6
1
FX
FY

p2
FX

p1 FY
FY

p0 FX

FY
FX
-y
y0 y1 y2

Fig. 5.2 – Graphe des fonctions de répartition F X et FY


262 Chapitre 5. Mesure et comparaison des risques

Notons (y0 ,p0 ), (y1 ,p1 ), et (y2 ,p2 ) trois points de croisement
consécutifs tels que représentés à la Figure 5.2. Il est bon de gar-
der à l’esprit que (y0 ,p0 ) peut être (−∞,0) (avec la convention
0 · (−∞) ≡ 0), et que (y2 ,p2 ) peut être (∞,1) (avec la convention
0 · ∞ ≡ 0). L’hypothèse de continuité garantit que

pi = FX (yi ) = FY (yi ), i = 0,1,2.

Supposons que E[(X −t)+ ] ≤ E[(Y −t)+ ] pour tout t ∈ IR. Alors,
Z ∞ Z ∞
F X (x) dx ≤ F Y (x) dx. (5.17)
y2 y2

Donc
Z 1 Z ∞
FX−1 (u) du = y2 (1 − p2 ) + F X (x) dx
p2 y
Z 2∞
≤ y2 (1 − p2 ) + F Y (x) dx par (5.17) (5.18)
y2
Z 1
= FY−1 (u) du.
p2

A présent, nous avons pour u ∈ [p1 ,p2 ] que FX−1 (u) − FY−1 (u) ≤ 0.
R1
Ainsi, p (FX−1 (u) − FY−1 (u)) du est croissante en p ∈ [p1 ,p2 ]. De ce
fait, nous déduisons de (5.18) que
Z 1 Z 1
FX−1 (u) du ≤ FY−1 (u) du pour p ∈ [p1 ,p2 ]. (5.19)
p p

De l’inégalité des primes stop-loss, nous déduisons également


Z y0 Z y0
FX (x) dx ≤ FY (x) dx. (5.20)
−∞ −∞

De ce fait,
Z p0 Z y0
−1
FX (u) du = y0 p0 − FX (x) dx
0 −∞
Z y0
≥ y 0 p0 − FY (x) dx par (5.20) (5.21)
−∞
Z p0
= FY−1 (u) du.
0
5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 263

Comme
R p pour u ∈ [p0 ,p1 ] nous avons FX−1 (u) − FY−1 (u) ≥ 0, il vient
que 0 (FX−1 (u)−FY−1 (u)) du est croissante en p ∈ [p0 ,p1 ]. L’équation
(5.21) donne alors
Z p Z p
−1
FX (u) du ≥ FY−1 (u) du pour p ∈ [p0 ,p1 ]. (5.22)
0 0

Nous voyons donc grâce à (5.19) et (5.22) que pour chaque p ∈ [0,1]
l’une des relations (5.15) ou (5.16) doit être vérifiée.
Réciproquement, supposons à présent que (5.15) (ou de manière
équivalente (5.16)) est vraie. Alors,
Z 1 Z 1
−1
FX (u) du ≤ FY−1 (u) du. (5.23)
p2 p2

De même,
Z ∞ Z 1
F X (x) dx = FX−1 (u) du − y2 (1 − p2 )
y2 p2
Z 1
≤ FY−1 (u) du − y2 (1 − p2 ) par (5.23) (5.24)
p
Z 2∞
= F Y (x) dx.
y2
R∞
Pour x ∈ [y1 ,y2 ] nous avons F X (x)−F Y (x) ≤ 0. De ce fait, y (F X (x)−
F Y (x)) dx est croissant en y ∈ [y1 ,y2 ]. Dès lors, nous déduisons de
(5.24) que
Z ∞ Z ∞
F X (x) dx ≤ F Y (x) dx pour y ∈ [y1 ,y2 ]. (5.25)
y y

On déduit encore de (5.15) que


Z p0 Z p0
−1
FX (u) du ≥ FY−1 (u) du. (5.26)
0 0

Donc,
Z y0 Z p0
FX (x) dx = y0 p0 − FX−1 (u) du
−∞
Z 0 p0
≤ y 0 p0 − FY−1 (u) du par (5.26) (5.27)
0
Z y0
= FY (x) dx.
−∞
264 Chapitre 5. Mesure et comparaison des risques

Ry
Pour x ∈ [y0 ,y1 ] nous avons FX (x)−FY (x) ≤ 0, et donc −∞ (FX (x)−
FY (x)) dx est décroissant en y ∈ [y0 ,y1 ]. On déduit alors de (5.27)
que
Z y Z y
FX (x) dx ≤ FY (x) dx pour y ∈ [y0 ,y1 ]. (5.28)
−∞ −∞

Nous pouvons alors conclure car nous voyons à partir de (5.25) et


(5.28) que les primes stop-loss doivent être uniformément ordonnées.

Corollaire 5.4.5. Soient X et Y deux risques de même moyenne


µ finie. Alors,
X TVaR,= Y ⇔ E[(X − t)+ ] ≤ E[(Y − t)+ ] pour tout t ∈ IR.
On peut montrer qu’un résultat du même type vaut pour  TVaR ,
à savoir
X TVaR Y ⇔ E[(X − t)+ ] ≤ E[(Y − t)+ ] pour tout t ∈ IR.
Nous savons à présent que les relations  TVaR,= et TVaR peuvent
s’interpréter à l’aide des primes de réassurance relatives à un traité
stop-loss. Une comparaison au sens  TVaR ou TVaR,= revient à
comporer les primes stop-loss de différentes rétentions. On s’en re-
met donc aux réassureurs lorsqu’il s’agit de choisir entre deux risques
X et Y : ceux-ci sont interrogés quant à leur tarif stop-loss pur et la
préférence va au risque dont les primes de réassurance sont toujours
plus avantageuses, à moyenne constante.

Tail-VaR et fonctions convexes


Tout comme VaR était liée aux fonctions croissantes, les rela-
tions TVaR,= et TVaR sont liées aux fonctions convexes et convexes
croissantes, comme le montrent les résultats suivants.
Propriété 5.4.6. Etant données deux variables aléatoires X et Y
de moyennes finies, on a
(i)
X TVaR,= Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction convexe g,
pour autant que les espérances existent.
(ii)
X TVaR,= Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction g telle que g 00 ≥ 0,
pour autant que les espérances existent.
5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 265

Démonstration. Prouvons (i). L’implication “⇒” est évidente puisque


la fonction x 7→ (x − t)+ est convexe quel que soit t ∈ IR + . Si on
veut prouver “⇐”, on procède comme suit. Toute fonction convexe
g est la limite uniforme d’une suite {g n , n = 1,2, . . .} de fonctions
convexes définies par
n
X
(n) (n) (n) (n)
gn (x) = α1 + α2 x + βj (x − tj )+ ,
j=0
(n) (n) (n) (n) (n)
où α1 ,α2 ∈ IR, βj ≥ 0 pour j = 0,1, . . . ,n et 0 < t0 < t1 <
(n)
... < tn . Dès lors, comme l’inégalité
n
X
(n) (n) (n) (n)
E[gn (X)] = α1 + α2 E[X] + βj E[(X − tj )+ ]
j=0
Xn
(n) (n) (n) (n)
≤ α1 + α2 E[X] + βj E[(Y − tj )+ ] = E[gn (Y )]
j=0

est satisfaite quel que soit n, il vient E[g(X)] ≤ E[g(Y )] en passant


à la limite, ce qui achève la démonstration de (i). La preuve de (ii)
est semblable à celle de la Propriété 5.3.5.
En procédant de manière analogue, on peut encore établir le
résultat suivant.
Propriété 5.4.7. Etant données deux variables aléatoires X et Y
de moyennes finies, on a
(i)
X TVaR Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction convexe croissante g,
pour autant que les espérances existent.
(ii)
X TVaR Y ⇔ E[g(X)] ≤ E[g(Y )] pour toute fonction g telle que g 0 ≥ 0 et g” ≥ 0,
pour autant que les espérances existent.
Remarque 5.4.8 (Variablité). Grossièrement parlant, les fonc-
tions convexes sont celles qui prennent leurs valeurs les plus élevées
dans des régions de la forme ] − ∞,a[∪]b, + ∞[, avec a < b. Pour
cette raison, si X TVaR,= Y ou X TVaR Y , Y prend plus souvent
des valeurs “extrêmes” que X, c’est-à-dire que Y est plus “variable”
que X. Ceci peut encore se justifier par le fait que si X  TVaR,= Y ,
alors nécessairement
V[X] ≤ V[Y ];
ceci provient du fait que la fonction x 7→ g(x) = x 2 est convexe.
266 Chapitre 5. Mesure et comparaison des risques

Caractérisation de Strassen
La caractérisation suivante a été obtenue par Strassen en 1965.
Elle montre que les Tail-Var sont diminuées par passage à l’espérance
conditionnelle.
Caractérisation 5.4.9. Etant donnés deux risques X et Y , X  TVaR,=
Y si, et seulement si, on peut trouver deux variables aléatoires X e
e e
et Y (définies sur le même espace probabilisé) telles que X =loi X,
Ye =loi Y et E[Ye |X]
e = X.e

Démonstration. La construction des variables X e et Ye (i.e. la preuve


de la nécessité de la condition de Strassen) est difficile; nous ren-
voyons le lecteur intéressé à Müller & Stoyan (2002) pour une
démonstration intéressante. La suffisance est quant à elle facile à
e et Ye existent alors quelle
établir. En effet, si de telles variables X
que soit la fonction convexe g,
h  i
E[g(X)] = E[g(X)] e = E g E[Ye |X]e
h i
≤ E E[g(Ye )|X] e = E[g(Ye )] = E[g(Y )]

en vertu de l’inégalité de Jensen.

Corollaire 5.4.10. En particulier, la superposition d’un aléa supplémentaire


centré  à un risque X rend la situation plus risquée (car plus va-
riable, en fait). Formellement, quel que soit le risque X et la variable
aléatoire  indépendante de X telle que E[] = 0,

X TVaR,= X + .

5.4.3 Condition suffisante


Nous donnons ici des conditions suffisantes pour  TVaR,= et
TVaR , basées sur le nombre de croisement des fonctions de répartition.
Propriété 5.4.11. Soient X et Y deux variables aléatoires telles
que E[X] = E[Y ]. S’il existe une constante c telle que

FY (x) ≥ FX (x) pour tout x < c,

et
FY (x) ≤ FX (x) pour tout x > c,
alors X TVaR,= Y .
5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 267

1.0
Fonction de repartition de X
Fonction de repartition de Y

0.8

0.6

0.4

0.2

0.0

0 1 2 3 4 5 6

Fig. 5.3 – Deux fonctions de répartition F X et FY satisfaisant les


conditions de la Propriété 5.4.12

Démonstration. Pour t > c, on a


Z +∞
E[(X − t)+ ] = Pr[X > x]dx
x=t
Z +∞
≤ Pr[Y > x]dx
x=t
= E[(Y − t)+ ].

Pour t ≤ c, il suffit de remarquer que


Z t
E[(X − t)+ ] = E[X] − Pr[X > x]dx
x=0
Z t
= E[X] − Pr[Y > x]dx,
x=0

d’où le résultat puisque E[X] = E[Y ].


De la même manière, on peut prouver le résultat suivant.
Propriété 5.4.12. Soient X et Y deux variables aléatoires telles
que E[X] ≤ E[Y ]. S’il existe une constante c telle que

FY (x) ≥ FX (x) pour tout x < c,

et
FY (x) ≤ FX (x) pour tout x > c,
alors X TVaR Y .
268 Chapitre 5. Mesure et comparaison des risques

5.4.4 Propriétés
Loi des grands nombres revisitée
Nous réexaminons ici la loi des grands nombres. Plus précisément,
nous montrons qu’il y a en fait une décroissance au sens de  TVaR,=
des moyennes arithmétiques lorsque n augmente.
Propriété 5.4.13. Soient les risques X 1 ,X2 ,X3 , . . . indépendants
et identiquement distribués, de même moyenne finie. Nous notons
n
(n) 1X
X = Xi .
n
i=1

Nous avons alors


(n+1) (n)
X TVaR,= X .

Démonstration. Il suffit de remarquer que


 (n)  (n)
E Xi X =X

quel que soit i = 1, . . . ,n. Dès lors,


 (n−1) (n)  (n)
E X X =X ,

ce qui donne le résultat grâce à la Caractérisation 5.4.9.

Il est intéressant de mentionner que cela donne une interprétation


intéressante de la loi des grands nombres. En effet, la convergence de
(n)
X vers E[X1 ] s’accompagne d’une réduction monotone du risque
(tel que mesuré par la Tail-VaR). De plus, quel que soit n,
(n)
E[X1 ] TVaR,= X .

Ce résultat illustre également la diminution de la variabilité


résultant de la mise en commun d’un nombre croissant de risques
identiques. Le résultat de la compagnie sera d’autant plus stable que
le nombre de risques en portefeuille est grand.

De l’intérêt de la standardisation des polices


On constate sur le marché que les conditions des polices sont
standardisées. Bien que les situations personnelles des assurés soient
toutes différentes, l’assureur refuse d’en tenir compte et organise
le transfert des risques sous des conditions semblables pour tous
les assurés. Il ne personnalise que certains traits du risque dans
5.4. Comparaison uniforme des TVaR: les ordres
TVaR et TVaR,= 269

les conditions particulières. On pourrait légitimement s’interroger


quant à la pertinence de cette pratique: au-delà du gain résultant
de la simplification de la gestion administrative du portefeuille, est-il
toujours pertinent de traiter identiquement les assurés? Le résultat
suivant apporte une réponse à cette question.
Propriété 5.4.14. Soient les risques X 1 ,X2 ,X3 , . . . indépendants et
identiquement distribués. Quelles que soient les fonctions g 1 ,g2 ,g3 , . . .,
n
X n
X n
1X
g(Xi ) TVaR,= gi (Xi ) où g(x) = gi (x).
n
i=1 i=1 i=1

Démonstration. Soit π = {π(1),π(2), . . . ,π(n)} une permutation aléatoire


de {1,2, . . . ,n}, indépendante des X i . Notons P l’ensemble de telles
permutations. Alors,
" n #
X

E gπ(i) (Xi ) X1 ,X2 , . . . ,Xn

i=1
1 X
= {gξ1 (X1 ) + gξ2 (X2 ) + . . . + gξn (Xn )}
n!
{ξ1 ,...,ξn }∈P
n
X
= ḡ(Xi ),
i=1

de sorte que
" n #
n
X X

E gπ(i) (Xi ) ḡ(Xi )

i=1 i=1
" " n # n #
X X

= E E gπ(i) (Xi ) X1 ,X2 , . . . ,Xn ḡ(Xi )

i=1 i=1
n
X
= ḡ(Xi ).
i=1

La caractérisation de Strassen nous permet alors d’affirmer que


n
X n
X
ḡ(Xi ) TVaR,= gπ(i) (Xi ). (5.29)
i=1 i=1
Pn
Le résultat se déduit finalement de (5.29) puisque
P i=1 gπ(i) (Xi ) et
n
i=1 gi (Xi ) sont identiquement distribuées.
270 Chapitre 5. Mesure et comparaison des risques

Ce résultat explique pourquoi les contrats d’assurance sont stan-


dardisés (outre les facilités de gestion que cela procure, bien en-
tendu). En effet, si l’actuaire a à gérer n risques identiques donnant
lieu à des coûts annuels X1 ,X2 , . . . ,Xn , il a toujours intérêt à appli-
quer à ces risques un traitement identique.
Exemple 5.4.15. Si on suppose par exemple que l’assureur décide
de laisser un pourcentage du montant des sinistres à l’assuré, ce
pourcentage doit être identique pour tous les assurés d’une même
catégorie. En effet, si l’assureur laisse α i % des sinistres à charge de
l’assuré numéro i, sa situation sera toujours moins bonne que celle
de l’assureur qui laisserait α% des sinistres à charge de chacun des
assurés, avec
n
1X
α= αi
n
i=1

puisque
n
X n
X
αXi TVaR,= αi Xi .
i=1 i=1

Afin d’augmenter la stabilité des résultats de la compagnie, l’ac-


tuaire aura donc toujours intérêt à appliquer le même traitement à
toutes les polices identiques de son portefeuille.

Stabilité des préférences


Quels que soient les risques X et Y , tels que X  TVaR Y , il en va
de même de f (X) par rapport à f (Y ) pour toute fonction convexe
croissante f , i.e. f (X) TVaR f (Y ). Notez que TVaR est donc moins
stable que VaR (pour lesquel il suffisait que f soit croissante).

Convergence
La relation TVaR n’est pas stable par passage à la limite au
sens de la convergence en loi, contrairement à  VaR . En effet, soit
Xn la masse de Dirac en 1 pour tout n ∈ IN, et considérons Y n
telle que Pr[Yn = 0] = (n − 1) /n et Pr[Yn = n] = 1/n. Alors Xn
converge vers X, masse de Dirac en 1 et Y n converge vers Y , masse
de Dirac en 0, de telle sorte que Y TVaR X. Cependant, pour tout
n, Xn TVaR Yn (rappelons que la convergence en loi n’implique pas,
par exemple, la convergence des moments: E[Y n ] = 1 et E[Y ] = 0).
En revanche, en rajoutant des hypothèses supplémentaires, il est
possible d’obtenir convergence.
5.5. Forme optimale de transfert de risque 271

Théorème de séparation
Le théorème de séparation permet de “séparer” des risques X et
y tels que X TVaR Y .
Proposition 5.4.16. Soient deux risques X et Y . Alors X  TVaR
Y si, et seulement si, il existe une variable aléatoire Z telle que
X VaR Z TVaR,= Y .

Démonstration. Définissons le risque

Xb = max{X,b}.

Clairement, Pr[X ≤ Xb ] = 1 et donc X VaR Xb . Choisissons b de


manière à ce que E[Xb ] = E[Y ]. On voit alors facilement que si t ≥ b
ou si t < b
E[(Xb − t)+ ] ≤ E[(Y − t)+ ].
Nous avons donc construit un risque Z = X b satisfaisant les condi-
tions énoncées.

L’inégalité stochastique X TVaR Y signifie donc que X est à la


fois “plus petite” et “moins variable” que Y .

5.5 Forme optimale de transfert de risque


5.5.1 Le problème
Dès 1971, Arrow a montré que lorsque l’assureur inclut un char-
gement de sécurité dans les primes (en recourant au principe de
l’espérance mathématique), la police prévoyant un découvert obli-
gatoire est optimale pour tout décideur risquophobe, parmi les po-
lices de même coût. Au-delà du découvert obligatoire, chaque euro
de perte est compensé par un euro d’indemnité. L’assuré peut donc
borner sa perte nette au découvert obligatoire. Il en résulte que les
petites pertes ne sont pas indemnisées, alors que les pertes impor-
tantes sont bien couvertes, au contraire d’un système de couverture
proportionnel. Le découvert obligatoire apparaı̂t intuitivement bien
comme le meilleur compromis entre le désir de limitation du coût
de l’assurance et le désir de réduction du risque. Cette section est
consacrée à la comparaison entre différents types de polices. Nous
verrons que sous des conditions assez générales, les garanties as-
sociées à diverses formes d’assurance peuvent être comparées au
sens de TVaR,= . Pour ce faire, nous devons tout d’abord modéliser
la couverture associée à une police.
272 Chapitre 5. Mesure et comparaison des risques

5.5.2 Fonctions indemnitaires admissibles


Considérons un assuré confronté à un risque X de fonction de
répartition FX . Un contrat d’assurance peut être représenté par une
fonction I telle que I(x) représente le montant de l’indemnité perçue
par l’assuré si un sinistre de montant x survient; une telle fonction
est appelée fonction indemnitaire. Il est naturel de supposer I non-
décroissante et satisfaisant

0 ≤ I(x) ≤ x pour tout x ∈ IR+ .

Supposons que l’assuré ait à choisir, étant donnée une prime π


et un risque X, entre différentes polices décrites par une fonction I
appartenant à la classe
n
+
I = I : IR → IR 0 ≤ I(x) ≤ x, 0 ≤ I 0 ≤ 1,
+

I non-décroissante et convexe,
o
E[I(X)] = π/(1 + θ) .

La convexité de I apparaı̂t comme une contrainte naturelle. En effet,


il est normal que les paiements les plus importants de l’assureur
correspondent aux sinistres les plus graves.
Dans cette section, nous allons comparer différentes formes d’as-
surance. Plus particulièrement, nous allons rechercher les conditions
sous lesquelles les risques demeurant dans le patrimoine de l’assuré
sont comparables au sens TVaR,= . Pour ce faire, nous aurons be-
soin de la Propriété 5.4.12, qui fournit une condition suffisante bien
commode pour établir TVaR,= .

5.5.3 Ordonnancement des contrats


Montrons à présent que si les fonctions indemnitaires relatives à
deux polices ne se croisent qu’une seule fois, le risque associé à l’une
sera jugé inférieur à l’autre.
Propriété 5.5.1. Quels que soient I 1 et I2 dans I, si I1 et I2 sont
telles que 
I1 (x) ≤ I2 (x), pour x < c,
I1 (x) ≥ I2 (x), pour x > c,
alors X − I1 (X) TVaR,= X − I2 (X).

Démonstration. Montrons que les fonctions de répartition de X −


I1 (X) et X − I2 (X) n’ont qu’un seul point d’intersection, ce qui
5.5. Forme optimale de transfert de risque 273

suffit à prouver le résultat annoncé grâce à la Propriété 5.4.12. Pour


x > c, nous avons

Pr[X − I1 (X) ≤ x − I1 (x)] = Pr[X − I2 (X) ≤ x − I2 (x)]


≤ Pr[X − I2 (X) ≤ x − I1 (x)].

De la même façon, pour x > c,

Pr[X − I1 (X) ≤ x − I1 (x)] = Pr[X − I2 (X) ≤ x − I2 (x)]


≥ Pr[X − I2 (X) ≤ x − I1 (x)].

Dès lors, il existe un nombre t∗ défini par l’équation

t∗ = c − I1 (c)

tel que

Pr[X − I1 (X) ≤ t] ≤ Pr[X − I2 (X) ≤ t], pour t ≤ t∗ ,
Pr[X − I1 (X) ≤ t] ≥ Pr[X − I2 (X) ≤ t], pour t > t∗ ,

ce qui permet de conclure, en vertu de la Propriété 5.4.12.

5.5.4 Optimalité du contrat stop-loss


Si on considère la police prévoyant un découvert obligatoire de
montant δ, i.e. Iδ (x) = (x − δ)+ , où δ est tel que

π
E[(X − δ)+ ] = ,
1+θ

on voit facilement que Iδ ∈ I et est telle qu’il existe c pour lequel


on a

Iδ (x) ≤ I(x), pour x < c,
Iδ (x) ≥ I(x), pour x > c,

pour tout I ∈ I. Dès lors, la Propriété 5.5.1 donne

X − (X − δ)+ TVaR,= X − I(X) pour tout I ∈ I.

La police prévoyant un découvert obligatoire sera donc toujours op-


timale au sens de TVaR,= .
274 Chapitre 5. Mesure et comparaison des risques

5.6 Information incomplète


5.6.1 Contexte
Dans bien des situations pratiques, l’information dont dispose
l’actuaire est très limitée. Il est donc essentiel de mettre au point des
formules permettant d’utiliser cette information partielle de façon
optimale et prudente. Ceci se fait en construisant les risques les
moins et les plus avantageux compatibles avec la situation à laquelle
l’actuaire est confronté. Nous détaillons ci-dessous une méthode
d’approximation en accord avec TVaR,= .

5.6.2 Moyenne et support connus


Lorsque la moyenne et le support d’un risque X sont connus, il
est possible de construire deux risques X − et X+ de même moyenne
que X, tels que le premier est jugé plus avantageux que X au sens
TVaR,= , et le second moins avantageux au sens  TVaR,= . C’est
l’objet du résultat suivant.
Propriété 5.6.1. Supposons être confronté à un risque X tel que
E[X] = µ et Pr[a ≤ X ≤ b] = 1. Dans ce cas, en définissant X − = µ
et X+ par
(
a, avec la probabilité b−µ
b−a ,
X+ = µ−a
b, avec la probabilité b−a ,
on a
X− TVaR,= X TVaR,= X+ .

Démonstration. Il est en effet facile de vérifier que E[X + ] = µ et


que les fonctions de répartition de X et de X + se croisent une seule
fois, celle de X dominant celle de X+ après l’unique croisement. De
même, les fonctions de répartition associées à X − et à X se croisent
une seule fois, celle de X− dominant celle de X après l’unique croi-
sement. Le résultat se déduit alors de la Propriété 5.4.12.

Remarque 5.6.2. On peut ainsi obtenir en particulier une borne


supérieure pour la variance de X, à savoir

b−µ µ−a
V[X] ≤ V[X+ ] = a2 + b2 − µ2 .
b−a b−a

Notez que V[X] ≥ V[X− ] = 0, résultat attendu.


5.6. Information incomplète 275

5.6.3 Application au calcul d’une prime stop-loss sur


données groupées
Donnons un exemple d’application. Supposons que nous dispo-
sions de l’information résumée au Tableau 5.1 à propos de la fonction
de répartition du risque X 1 . On peut y lire la proportion de montant
dans chaque intervalle ainsi que le coût moyen de ceux-ci.

Montants Coût moyen Proportion


inférieurs à 1 000e 560 30%
1 000 - 2 000 e 1 200 50%
2 000 - 10 000 e 3 200 15%
supérieurs à 10 000 e 11 200 5%

Tab. 5.1 – Description des montants de sinistres.

Supposons que nous voulions calculer E[(X − t) + ] pour une cer-


taine valeur de t. Tout d’abord, la dernière tranche est ouverte (il
s’agit des sinistres de plus de 10 000e ). Pour la fermer, il faut
disposer d’une borne supérieure pour le coût d’un sinistre. Celle-ci
peut être fixée contractuellement (plafond d’intervention de l’assu-
reur, ou valeur assurée dans le cas de l’assurance de choses) ou doit
être déterminée par l’actuaire dans le cas d’une couverture illimitée
(comme cela se pratique encore parfois pour les dommages corporels
aux tiers dans les assurances de responsabilité). Dans ce dernier cas,
on parle de perte maximum probable (PMP) et nous verrons dans
le Tome II comment la déterminer. Supposons ici que la PMP vaut
20 000e .
On peut bien entendu supposer que les montants des sinistres
sont distribués uniformément dans chaque intervalle, mais ceci re-
vient à négliger l’information des coûts moyens dans la tranche. On
procèdera donc de la manière suivante:

E[(X − t)+ ]
= E[(X − t)+ |0 < X ≤ 1000] Pr[X ≤ 1000]
+E[(X − t)+ |1000 < X ≤ 2000] Pr[1000 < X ≤ 2000]
+E[(X − t)+ |2000 < X ≤ 10000] Pr[2000 < X ≤ 10000]
+E[(X − t)+ |10000 < X ≤ PMP] Pr[10000 < X ≤ PMP].

1. Dans bien des cas, les données dont dispose l’actuaire sont groupées et
présentées dans un tableau semblable à celui-là. Bien entendu, il est toujours
préférable de travailler avec les observations individuelles lorsqu’elles sont dis-
ponibles.
276 Chapitre 5. Mesure et comparaison des risques

A présent, on borne chacun des termes E[(X − t) + |a < X ≤ b]


à l’aide du maximum X+ basé sur le support (a,b) et la moyenne
renseignée au Tableau 5.1; il vient
 
560 800
E[(X − t)+ ] ≤ (1000 − t)+ 0.3 + 0.5
1000 1000
 
200 6800
+(2000 − t)+ 0.5 + 0.15
1000 8000
 
1200 PMP − 11200
+(10000 − t)+ 0.15 + 0.05
8000 PMP − 10000
1200
+(PMP − t)+ 0.05.
PMP − 10000

De la même manière, on peut obtenir la borne inférieure suivante sur


E[(X − t)+ ] en concentrant toute la masse de probabilité de chaque
tranche en sa moyenne:

E[(X − t)+ ] ≥ 0.3(560 − t)+ + 0.5(1200 − t)+


+0.15(3200 − t)+ + 0.05(11200 − t)+ .

Notez que cette borne inférieure ne nécessite pas la connaissance de


la PMP.

5.7 Exercices
Exercice 5.7.1. Soit X ∼ Gam(α,τ ). Montrez que pour 0 < p 1 ≤
p2 < 1,
(i) la différence VaR[X; p2 ] − VaR[X; p1 ] est croissante en α.
(ii) le ratio V aR[X; p2 ]/VaR[X; p1 ] est décroissant en α.
(iii) la différence V aR[X; p2 ] − VaR[X; p1 ] est décroissante en τ .
Exercice 5.7.2 (Mesure de risque Normal Transform). Pour
0 < q < 1, définissons la fonction de distorsion
 
gq (x) = Φ Φ−1 (q) + Φ−1 (x) , 0 < x < 1, (5.30)

appelée “Normal Transform” de niveau q. La mesure de risque de


Wang associée à de telles fonctions de distorsion est appelée mesure
de risque Normal Transform, notée par N T q [X]. Montrez que

X ∼ N or(µ,σ 2 ) ⇒ N Tq [X] = VaR[X; q].


5.7. Exercices 277

Exercice 5.7.3 (Mesures de risque dans le cas des lois ellip-


tiques). Le cas elliptique est un cas relativement particulier, puis-
qu’un grand nombre de résultats généralement faux deviennent cor-
rects.
Sous-additivité de la VaR: Montrez que si (X,Y ) admet une loi el-
liptique, alors

VaR[X + Y ; α] ≤ V aR[X; α] + VaR[Y ; α],

et elle est ainsi une mesure cohérente.


CTE de risques elliptiques univariés: Soit X une variable aléatoire
de loi elliptique de générateur g, et de paramètres µ et σ, dont
la densité est donnée par (2.12), i.e.
  !
c 1 x−µ 2
fX (x) = g , (5.31)
σ 2 σ

où c est la constante de normalisation. Notons G le générateur


cumulé, i.e Z x
G (x) = g (t) dt.
0
Montrez alors que

CTE[X; α] = µ + λα (µ,σ)σ 2

où  
2
1 G [(VaR[X; α] − µ) /σ] /2
λα (µ,σ) = .
σ F X (VaR[X; α])

Cas gaussien: Si X ∼ N or µ,σ 2 , montrez que
1. le générateur cumulé est

G (t) = c 1 − e−t ,

avec c = 1/ 2π.
2. La CTE est donnée par

21 φ Φ−1 (α)
CTE[X; α] = µ + λα σ où λα = .
σ 1−α

Exercice 5.7.4 (Principaux modèles paramétriques). Pour la


plupart des modèles paramétriques utilisés en sciences actuarielles,
278 Chapitre 5. Mesure et comparaison des risques

lorsqu’on augmente (ou diminue) la valeur d’un paramètre, la si-


tuation devient plus (ou moins) risquée qu’auparavant au sens de
VaR . Prouvez les résultats suivants:

Gam(α,τ ) VaR Gam(α0 ,τ ), pour α ≤ α0 ,


Gam(α,τ 0 ) VaR Gam(α,τ ), pour τ ≤ τ 0 ,
Par(α,θ) VaR Par(α,θ 0 ), pour θ ≤ θ 0 ,
Par(α0 ,θ) VaR Par(α,θ), pour α ≤ α0 ,
N or(µ,σ) VaR N or(µ0 ,σ), pour µ ≤ µ0 ,
LN or(µ,σ) VaR LN or(µ0 ,σ), pour µ ≤ µ0 .

Exercice 5.7.5 (Comparaison des risques en cas de réparation


forfaitaire). Considérons un portefeuille de polices d’assurance don-
nant lieu à une indemnité forfaitaire de montant s avec la proba-
bilité q. Le coût des sinistres Si relatifs à la police i s’écrit comme
en (3.10). Comparons ce portefeuille avec un portefeuille similaire
différant du premier par le montant du forfait et la probabilité de
sinistre, i.e. le remboursement de la compagnie à l’individu i est
donné par

e 0, avec une probabilité 1 − qe,
Si =
se, avec une probabilité qe.
Montrez que
(i) q = qe ⇒ Si VaR Sei lorsque s ≤ se.
(ii) lorsque s = se et q ≤ qe, alors Si VaR Sei .
Exercice 5.7.6 (Comparaison des risques en cas de réparation
indemnitaire). Passons à présent à une réparation indemnitaire,
i.e. le coûts des sinistres Si relatifs à la police i est de la forme
(3.11). Supposons qu’une compagnie doive faire face à des coûts par
police de

e 0, avec une probabilité 1 − qe,
Si =
Zei , avec une probabilité qe,
Montrez que
(i) Zi =loi Zei ⇒ Si VaR Sei lorsque q ≤ qe.
(ii) lorsque q = qe et Zi VaR Zei , alors Si VaR Sei .
Exercice 5.7.7. Lorsque [X|a ≤ X ≤ b]  VaR [Y |a ≤ Y ≤ b] quels
que soient a < b ∈ IR, montrez que

α 7→ FY (VaR[X; α]) est convexe. (5.32)


5.7. Exercices 279

Exercice 5.7.8. Considérons le risque


 1
m − h, avec la probabilité 2,
Sh = 1
m + h, avec la probabilité 2.

Montrez que
(i) la variance de Sh est une fonction croissante de h.
(ii) Sh TVaR,= Sh0 lorsque h ≤ h0 .
Exercice 5.7.9. Montrez que

X TVaR,= Y
⇒ X =loi Y.
V[X] = V[Y ]

Exercice 5.7.10. Soient deux risques X et Y tels que E[X] = E[Y ].


Montrez que

X TVaR,= Y ⇔ E|X − a| ≤ E|Y − a| quel que soit a ∈ R.


(5.33)
Exercice 5.7.11. Soient un risque X et E ∼ Exp(1/E[X]). Montrez
que les affirmations suivantes sont équivalentes:
(i) X TVaR,= E
(ii) rX est non-décroissant (i.e. X est IFR)
(iii) F X est log-concave.
D’autre part, montrez que les affirmations suivantes sont également
équivalentes:
(i) E TVaR,= X
(ii) rX est non-croissant (i.e. X est DFR)
(iii) F X est log-convexe.
Exercice 5.7.12. Quel que soit le risque X de moyenne µ, de va-
riance σ 2 et de support inclus à (a,b), montrez que
(i) X− TVaR,= X où
(
σ2 b−µ
µ− b−µ , avec la probabilité b ,
X− = 2
σ +µ 2 b−µ
µ , avec la probabilité 1 − b .

(ii) X TVaR,= X+ où la fonction de répartition de X + est donnée


par 
 2σ2 2 , si 0 ≤ x ≤ µ+σ2 ,
µ +σ 2µ
F+ (x) = 2
 12 + 12 √ x−µ2 2 , si x > µ+σ 2µ .
(x−µ) +σ
280 Chapitre 5. Mesure et comparaison des risques

Exercice 5.7.13. Montrez que Exp(E[1/Θ])  TVaR,= MExp(Θ).


Déduisez-en que le coefficient de variation de tout mélange expo-
nentiel excède 1.
Exercice 5.7.14 (Ordre de la transformée de Laplace). La
variable aléatoire positive Y domine X pour la relation d’ordre de
la transformée de Laplace (noté X ≺ LT Y ) si, et seulement si,
LX (t) ≥ LY (t) pour tout t > 0.
Soit Et ∼ Exp(t) indépendante de X et Y . Montrez que X ≺ LT
Y si et seulement si Pr[X > Et ] ≥ Pr[Y > Et ] pour tout t ≥ 0.

5.8 Notes bibliographiques


Les mesures de risques cohérentes dont les applications en sciences
actuarielles ont été soulignées par Artzner (2000) sont présentées
en détails dans Denuit, Dhaene, Goovaerts, Kaas & Vyncke
(2004). Voyez aussi Tasche (2002). Les mesures de risque de Wang
sont étudiées notamment dans Wang (1996) et Wang & Young
(1998).
Ce chapitre fait la part belle aux ordres stochastiques. D’un point
de vue général, on désigne par ordre stochastique toute méthode de
comparaison de lois de probabilité (de variables aléatoires, de vec-
teurs aléatoires, de processus stochastiques, etc.), c’est-à-dire toute
relation binaire définie sur un ensemble de lois de probabilité. Parmi
les ordres stochastiques entre variables aléatoires réelles, on dis-
tingue les relations que l’on peut définir par référence à une classe de
fonctions mesurables. Ces ordres, encore appelés ordres intégraux,
possèdent souvent une interpétation naturelle dans le cadre de la
théorie de l’utilité espérée: il en est ainsi de l’ordre en distribu-
tion, des ordres convexe et concave, des ordres convexe croissant et
concave croissant, de l’ordre exponentiel, pour ne citer qu’eux.
Le lecteur intéressé par les ordres stochastiques trouvera dans
Shaked & Shanthikumar (1994) une présentation générale, as-
sortie de nombreuses applications dans des domaines variés. On
pourra également consulter Szekli (1995) pour une analyse pro-
babiliste avancées, et Levy (1992) pour un aperçu des applications
en économie. Les applications des ordres stochastiques en assurance
sont décrites dans Goovaerts et al. (1990), ainsi que dans Kaas
et al. (1994) et Gouriéroux (1999). Pour une approche plus
théorique, voyez également Müller & Stoyan (2002)
Chapitre 6

Calcul de la marge de
solvabilité et de primes
stop-loss dans le modèle
collectif

6.1 Introduction
6.1.1 Les différents niveaux de travail
Certains calculs sont effectués par l’actuaire au niveau du por-
tefeuille, et pas au niveau des polices le constituant. Il en est ainsi
par exemple lors de la détermination de la marge de solvabilité, du
calcul de la probabilité de ruine ou de l’évaluation des primes stop-
loss. Dans ce chapitre, nous décrivons comment modéliser la charge
totale de sinistre touchant un portefeuille au cours d’une période
déterminée. Il s’agit donc d’une approche statique. Nous verrons
dans le chapitre suivant comment intégrer l’aspect dynamique de
l’évolution du résultat de l’assureur.

6.1.2 Le modèle individuel


Le modèle individuel se place au niveau de chaque police. Les
coûts totaux des sinistres causés par les n polices du portefeuille sont
notés S1 ,S2 , . . . ,Sn . Ces variables sont supposées indépendantes, mais
pas identiquement distribuées. Ceci permet de tenir compte de l’hétérogénéité
du portefeuille et d’une éventuelle segmentation a priori effectuée
par l’assureur, comme cela sera abordé dans le Tome II. Dorénavant,

281
Chapitre 6. Calcul de la marge de solvabilité et de
282 primes stop-loss dans le modèle collectif

nous noterons Fi la fonction de répartition de Si , i.e.

Fi (x) = Pr[Si ≤ x], x ∈ IR.

La charge de sinistre Si causée par la police numéro i est représentée


par 
0, si la police i ne cause aucun sinistre,
Si =
Yi , sinon.
La variable Yi représente le coût total des sinistres relatifs à la police
i lorsque cette police a donné lieu à au moins un sinistre, i.e.

Pr[Yi ≤ x] = Pr[Si ≤ x|Si > 0].

On définit l’indicatrice Ii qui vaut 1 lorsque la police i cause au


moins un sinistre, i.e.

0, si la police i ne cause aucun sinistre,
Ii =
1, sinon.

On a alors clairement

Pr[Ii = 0] = Pr[Si = 0] et Pr[Ii = 1] = Pr[Si > 0].

6.1.3 La charge totale des sinistres dans le modèle in-


dividuel
La charge totale de sinistre du portefeuille, notée S ind vaut alors
n
X
S ind = Si .
i=1

Nous notons Gind la fonction de répartition de S ind . La connaissance


de la fonction de répartition Gind permet de nombreuses applica-
tions. En effet,
1. Gind permet de calculer les probabilités de ruine annuelles,
facteur important permettant de mesurer le risque inhérent à
un portefeuille d’assurance déterminé. Si on désigne par p le
montant total de prime sur la période et par κ le capital dont
dispose la compagnie en début de période, la probabilité de
ruine anuelle vaut

Pr[S ind > p + κ] = 1 − Gind (κ + p).


6.1. Introduction 283

2. Inversément, si une probabilité de ruine  est fixée par les


autorités de contrôle, on peut en déduire le capital dont doit
disposer la compagnie pour satisfaire à cette obligation:

κ = VaR[S ind ; 1 − ] − p = (Gind )−1 (1 − ) − p.

3. Gind permet de calculer les primes relatives à des traités de


réassurance globaux (théoriquement optimaux). Pour de tels
traités, les obligations du réassureur sont déterminées en fonc-
tion de S ind . Par exemple, la prime d’un traité stop-loss de
rétention t couvrant le portefeuille est donnée par
Z +∞
E[(S ind − t)+ ] = (x − t)dGind (x)
x=t
Z +∞
= {1 − Gind (x)}dx, t ∈ IR+ .
x=t

4. Gind permet de fixer le taux de chargement de sécurité ρ


lorsque l’assureur recourt au principe de l’espérance mathématique
pour calculer la prime nette et désire limiter la probabilité de
ruine à . Pour ce faire, on part de la condition

Pr[S ind > (1 + ρ)E[S ind ] + κ] ≤ 

qui donne
VaR[S ind ; 1 − ] − κ
ρ= − 1.
E[S ind ]

6.1.4 Difficulté des calculs dans le modèle individuel


Sous l’hypothèse d’indépendance, la fonction de répartition G ind
de S ind est donnée par

Gind (x) = F1 ?F2 ? . . . ?Fn (x).

Malheureusement, le nombre n de polices est en général très grand,


ce qui rend impossible le calcul direct de G ind (chacun des pro-
duits de convolution nécessitant une intégration numérique). Afin
de contourner le problème lié au calcul de G ind , les actuaires ont
suggéré d’approximer le modèle individuel par un équivalent collec-
tif, dans lequel les calculs sont (sous certaines conditions) plus aisés
à effectuer.
Chapitre 6. Calcul de la marge de solvabilité et de
284 primes stop-loss dans le modèle collectif

6.1.5 Le modèle collectif

Le modèle collectif de théorie du risque ne distingue plus les


polices composant le portefeuille mais voit ce dernier comme un
ensemble soumis à une série de chocs causés par l’occurrence des
sinistres. Le modèle individuel se place au niveau de la police et
distingue la charge des sinistres
Pn Si générée par la police i dans
la charge totale S ind = i=1 Si relative au portefeuille. Contrai-
rement au modèle individuel, le modèle collectif ne distingue plus
les polices composant le portefeuille mais voit ce dernier comme
un tout, comme un collectif de risques. Les coûts des sinistres tou-
chant le collectif de risques sont modélisés par des variables posi-
tives, indépendantes et de même loi. L’identique distribution des
coûts dans le modèle collectif s’explique par le fait que l’actuaire
renonce à savoir quelle police a causé le sinistre, et gomme donc les
différences de sinistralité existant entre les assurés du portefeuille.
Dans la vision collective, N désigne le nombre des sinistres sur-
venus durant une certaine période et X i , i = 1,2, . . ., les montants
de ceux-ci. La charge totale des sinistres S coll pour la compagnie
s’écrit alors
N
X
S coll = Xi (6.1)
i=1

avec la convention que S coll = 0 lorsque N = 0. Les variables


aléatoires Xi , i = 1,2, . . . sont supposées indépendantes et identi-
quement distribuées, et N est supposée indépendante des X i . La loi
de S coll est donc composée. Très souvent, N sera supposé de loi de
Poisson, de sorte que S coll ∼ CP oi(λ,F ) où F désigne la fonction
de répartition commune des Xi .
Remarque 6.1.1. Le modèle individuel est équivalent au modèle
collectif lorsque l’actuaire représente la charge annuelle des sinistres
pour la police i comme
Ni
X
Si = Cik (6.2)
k=1

où Ni est de loi de Poisson de paramètre λ i (Ni représente le nombre


de sinistres touchant la police i durant la période considérée) et
{Cik , k = 1,2, . . .} est une suite de variables aléatoires indépendantes
et de même fonction de répartition F i , représentant le montant Pn de
chacun de ces sinistres. La charge totale de sinistres S = i=1 Si
6.2. Approximation du modèle individuel par un
équivalent collectif 285

Pn
de ce portefeuille est de loi CPoi(λ,F ) avec λ = i=1 λi et

n
1X
F (x) = λi Fi (x), x ∈ IR
λ
i=1

en vertu de la Propriété 3.6.11.


Lorsque la représentation (6.2) est justifiée, la modélisation col-
lective est une conséquence directe obtenue par convolution. Ce n’est
pas le cas dès lors que Ni n’est plus de loi de Poisson (de loi Poisson-
mélange, par exemple) ou lorsque l’actuaire ne dispose plus du nombre
des sinistres. Dans ce cas, on suivra la méthode décrite ci-dessous.
L’approche collective a été initiée voilà un siècle par Lundberg
et de Finetti, respectivement sous les noms de théorie collective du
risque et théorie des fonds de risques. Ces derniers ont posé les fon-
dations de la version moderne de la théorie du risque, en introduisant
le processus des sinistres, permettant ainsi de modéliser la charge
des sinistres en faisant abstraction des risques individuels afin de
ne considérer que le seul “risque collectif” (en formulant quelques
hypothèses a priori). Ce modèle servira de base dans une grande
partie du second tome.

6.2 Approximation du modèle individuel par


un équivalent collectif
6.2.1 Formalisation du modèle individuel
Plusieurs modélisations individuelles sont envisageables. Nous
présentons ici des notations standards qui seront utilisées pour décrire
tous les modèles individuels. Soit un portefeuille comptant n polices.
On considère ce portefeuille sur une période et on définit:
- Si , i = 1,2, . . . ,n, le montant total de sinistre produit par la
ième police au cours de cette période;
- qi , i = 1,2, . . . ,n, la probabilité que la police i produise au
moins un sinistre durant la période de référence, q i = Pr[Si >
0];
- pi = 1 − qi , i = 1,2, . . . ,n, la probabilité que la police ne
produise aucun sinistre durant la période de référence, p i =
Pr[Si = 0];
- Fi (x) = Pr[Si ≤ x] est la fonction de répartition de S i , satis-
faisant Fi (0) = pi < 1;
Chapitre 6. Calcul de la marge de solvabilité et de
286 primes stop-loss dans le modèle collectif

- S ind est la chargePtotale des sinistres dans le modèle individuel,


à savoir S ind = ni=1 Si ;
- Gind (x) = Pr[S ind ≤ x] est la fonction de répartition de S ind ;
- Bi (x) = Pr[Si ≤ x|Si > 0], Bi (0) = 0, est la fonction de
répartition de la charge des sinistres relative à la police i sa-
chant que la police i a produit au moins un sinistre.
Dans les notations ci-dessus, on a que

Fi (x) = pi + qi Bi (x), x ≥ 0.

Dès lors,

Fi (x) − pi Fi (x) − Fi (0)


Bi (x) = = , x ≥ 0.
qi 1 − Fi (0)

On suppose que les sinistres affectant une police n’ont aucune


influence sur les sinistres affectant les autres polices du portefeuille;
ainsi, les variables aléatoires S1 ,S2 , . . . ,Sn sont indépendantes. Cette
hypothèse peut être considérée comme raisonnable dans certains
cas, par exemple pour l’assurance automobile, mais peut s’avérer
discutable dans d’autres. On ne suppose pas ici que les variables
aléatoires Si sont identiquement distribuées; le portefeuille ne doit
donc pas nécessairement être homogène.

6.2.2 Représentation de la charge totale des sinistres


dans le modèle individuel
Soit Yi est une variable aléatoire de fonction de répartition B i .
Comme expliqué dans l’introduction, l’actuaire représente souvent
Si comme le produit Ii Yi où Ii est l’indicatrice de l’événement “la
police i génère au moins un sinistre pendant l’année” et Y i désigne
le montant total des sinistres relatifs à la police i (sachant qu’il y a
au moins eu un sinistre).
Il est intéressant de noter que quel que soit le modèle retenu
par l’actuaire, la représentation S i = Ii Yi est valable, comme en
témoignent les deux exemples suivants.
Exemple 6.2.1. En assurance de responsabilité (RC automobile,
disons), on peut décomposer la charge des sinistres relatifs à la police
i comme
XKi
Si = Cik + Ji Li
k=1
6.2. Approximation du modèle individuel par un
équivalent collectif 287

où
Ki représente le nombre de sinistres “standards” causés par la police
i et les Cik > 0 les coûts de ceux-ci (le qualificatif “standard”
recouvre en RC automobile les majorité des sinistres de faible
gravité, le plus souvent exclusivement matériel, dont le coût
moyen est de l’ordre du millier d’euros);
Ji indique si la police i a donné lieu à au moins un sinistre “grave”
et Li > 0 représente le coût des sinistres graves, lorsqu’il y en
a eu (par opposition aux sinistres standards, les graves com-
portent le plus souvent des dégâts corporels et un coût moyen
de l’ordre de la dizaine de milliers d’euros mais peuvent at-
teindre des sommes considérables, dépassant le million d’eu-
ros).
En définissant

1, si Ki ≥ 1 ou Ji = 1,
Ii =
0, si Ki = Ji = 0,

et  P Ki
 k=1 Cik , si Ki ≥ 1 et Ji = 0,
Yi = Ji Li , si Ki = 0 et Ji = 1,
 P Ki
k=1 Cik + Ji Li , si Ki ≥ 1 et Ji = 1,

on voit que Si = Ii Yi .
Exemple 6.2.2. En assurance dégâts matériels aux véhicules, l’as-
sureur exprime souvent le coût des sinistres comme une fraction
de la valeur du véhicule couvert par la police (coût relatif). Plus
précisément, si vi désigne la valeur du véhicule couvert par la police
i, la charge des sinistres relatifs à cette police s’écrit

Ki
X
Si = Rik vi ,
k=1

où Ki représente le nombre de sinistres relatifs à la police i et R ik


les coûts relatifs de ceux-ci, avec

Rik = (1 − Jik )Pik + Jik ,

où

1, si le kème sinistre conduit à la perte totale du véhicule,
Jik =
0, sinon,
Chapitre 6. Calcul de la marge de solvabilité et de
288 primes stop-loss dans le modèle collectif

et Pik ∼ Bet(ai ,bi ) est le coût du kème sinistre, exprimé en pourcen-


tage de la valeur vi du véhicule, lorsque le sinistre n’est que partiel.
Dans ce cas, en posant

1, si Ki ≥ 1,
Ii =
0, si Ki = 0,

et
Ki
X
Yi = Rik vi si Ki ≥ 1
k=1

on voit que Si = Ii Yi .

6.2.3 Justification de l’approximation du modèle in-


dividuel par le modèle collectif
Afin de faciliter le calcul de la fonction de répartition de la charge
totale des sinistres touchant le portefeuille, on approxime le modèle
individuel par un modèle collectif. L’idée d’approximer la loi de S ind
par une loi de Poisson composée provient du développement suivant.
La transformée de Laplace de S ind est donnée par
n
Y h   i
LS ind (t) = E E exp − tIi Yi Ii
i=1
Yn
= {pi + qi LYi (t)}
i=1
Yn
= {1 + qi (LYi (t) − 1)} .
i=1

Dès lors, en passant au logarithme,


n
X
ln LS ind (t) = ln {1 + qi (LYi (t) − 1)}
i=1
n X
X +∞
(−1)k+1
= {qi (LYi (t) − 1)}k
k
i=1 k=1

grâce au développement de Taylor de la fonction x 7→ ln(1 + x) à


savoir

X (−1)k+1 k
ln(1 + x) = x
k
k=1
6.2. Approximation du modèle individuel par un
équivalent collectif 289

Une approximation grossière consiste à ne retenir que le terme en


k = 1 dans le développement de ln LS ind (t), pour obtenir
n
X
ln LS ind (t) ≈ qi (LYi (t) − 1)
i=1
n
! P 
X n
q L (t)
= qi P n i Yi
i=1
−1
i=1 i=1 qi
= q• (LX (t) − 1), (6.3)
où l’on a posé
n
X n
1 X
q• = qi et LX (t) = qi LYi (t). (6.4)
q•
i=1 i=1

Comme (6.3) est le logarithme de la transformée de Laplace associée


à une loi de Poisson composée, on est en droit d’étudier l’approxi-
mation du modèle individuel par un modèle collectif du type (6.1)
où N est de loi de Poisson de paramètre q • défini par (6.4) et les Xi
sont indépendantes et de loi décrite par la transformée de Laplace
LX donnée en (6.4).

6.2.4 Passage du modèle individuel au modèle collec-


tif
Après nous être convaincus de la pertinence de l’approxima-
tion collective du modèle individuel, expliquons à présent comment
se réalise le passage du modèle individuel au modèle collectif en
théorie du risque. Le raisonnement basé sur la transformée de La-
place suggère de substituer à Si la variable aléatoire Sei ∼ CPoi(qi ,Bi ).
Afin d’assurer plus de flexibilité lors du passage du modèle indivi-
duel au modèle collectif (ce qui s’avèrera bien utile, comme nous
le verrons dans la suite de ce chapitre), nous laissons libre le choix
du nombre moyen de sinistre. Dès lors, pour chaque police, nous
approximons Si par Sei donnée par
Ni
X
Sei = Yi;k ∼ CPoi(λi ,Bi ).
k=1

Le paramètre λi est laissé au choix de l’actuaire (qui peut bien


entendu opter pour λi = qi mais aussi pour d’autres valeurs). La
charge totale du portefeuille, S coll , est alors donnée par
n
X Ni
n X
X
S coll = S̃i = Yi;k ∼ CPoi(λ,F ),
i=1 i=1 k=1
Chapitre 6. Calcul de la marge de solvabilité et de
290 primes stop-loss dans le modèle collectif

où
n
X n
1X
λ= λi et F (x) = λi Bi (x),
λ
i=1 i=1
en vertu de la Propriété 3.6.11.

6.2.5 Choix des paramètres du modèle collectif


Le choix le plus naturel pour λi est λi = qi ; cf. (6.3). Dans
ce cas, le nombre moyen de polices produisant des sinistres dans
le modèle individuel est égal au nombre moyen de sinistre dans le
modèle collectif, puisque
n
X
qi = λ.
i=1

De plus, le passage du modèle individuel au modèle collectif ne mo-


difie pas la charge moyenne des sinistres puisque
n
X
ind
E[S ] = E[Si ]
i=1
Xn
= qi E[Yi ]
i=1
Xn
= E[S̃i ] = E[S coll ]
i=1

Par contre, le modèle collectif surestime la variance de la charge


totale des sinistres, rendant la situation moins favorable pour la
compagnie. Ceci provient de
n
X
V[S ind ] = V[Si ]
i=1
n n
X    o
= E V[Si |Ii ] + V E[Si |Ii ]
i=1
Xn
= {qi V[Yi ] + qi (1 − qi )(E[Yi ])2 }
i=1
Xn
= {qi E[Yi2 ] − qi2 (E[Yi ])2 }
i=1
n
X n
X
≤ qi E[Yi2 ] = V[Sei ] = V[S coll ].
i=1 i=1
6.2. Approximation du modèle individuel par un
équivalent collectif 291

La variance étant traditionnellement considérée comme un paramètre


de risque, le passage au modèle collectif rencontre un impératif de
prudence.
D’autres choix ont également été proposés. Ainsi, il n’est pas
rare d’utiliser

λi = − ln pi ⇔ exp(−λi ) = pi
⇔ Pr[Ni = 0] = Pr[Si = 0],i = 1,2, . . . ,n.

On identifie donc les probabilités pour que la police i ne produise


aucun sinistre dans les modèles individuels et collectifs. Au niveau
du portefeuille, on a

Pr[S coll = 0] = Pr[N = 0]


= exp(−λ)
n
!
X
= exp − λi
i=1
n
Y
= exp(−λi )
i=1
n
Y
= pi = Pr[S ind = 0].
i=1

on a donc l’égalité des probabilités de n’observer aucun sinistre


également au niveau du portefeuille.

6.2.6 Bornes sur l’erreur d’approximation: fonction de


répartition
Tentons de borner l’erreur commise en approximant G ind par
Gcoll .Pour ce faire, nous avons besoin des deux lemmes suivants.
Lemme 6.2.3. Soient trois fonctions de répartition H 1 , H2 et H3
telles que H1 (0−) = H2 (0−) = H3 (0−) = 0. Soient deux constantes
a et b telles que la double inégalité

a ≤ H1 (x) − H2 (x) ≤ b

est vérifiée pour tout x ∈ IR + , alors la double inégalité

a ≤ H1 ?H3 (x) − H2 ?H3 (x) ≤ b

est également satisfaite pour tout x ∈ IR + .


Chapitre 6. Calcul de la marge de solvabilité et de
292 primes stop-loss dans le modèle collectif

Démonstration. On part de
Z x
H1 ?H3 (x) − H2 ?H3 (x) = {H1 (x − y) − H2 (x − y)} dH3 (y).
y=0

Or, comme a ≤ H1 (x − y) − H2 (x − y) ≤ b quels que soient x et y,


et comme H3 est une fonction de répartition, on déduit facilement
que la double inégalité
Z +∞
a≤ {H1 (x − y) − H2 (x − y)} dH3 (y) ≤ b
y=0

doit être satisfaite, ce qui achève la preuve.


Lemme 6.2.4. Soient les fonctions de répartition H 1 ,H2 , . . . ,Hn
e 1 ,H
et H e 2 , . . . ,H
e n telles que Hi (0−) = H e i (0−) = 0. Soient des
constantes a1 ,a2 , . . . ,an et b1 ,b2 , . . . ,bn telles que les inégalités
e i (x) ≤ bi , i = 1,2, . . . ,n,
ai ≤ Hi (x) − H

sont satisfaites quel que soit x ∈ IR + , alors la double inégalité


n
X n
X
e 1 ?H
ai ≤ H1 ?H2 ? . . . ?Hn (x) − H e 2 ? . . . ?H
e n (x) ≤ bi
i=1 i=1

est également valable pour tout x ∈ IR + .


Démonstration. Il suffit de raisonner par récurrence à partir du
Lemme 6.2.3. Supposons le résultat acquis pour n − 1, i.e.
n−1
X n−1
X
e 1 ?H
ai ≤ H1 ?H2 ? . . . ?Hn−1 (x) − H e 2 ? . . . ?H
e n−1 (x) ≤ bi .
i=1 i=1

On déduit du Lemme 6.2.3 les deux inégalités


n−1
X n−1
X
e 1 ?H
ai ≤ H1 ?H2 ? . . . ?Hn (x) − H e 2 ? . . . ?H
e n−1 ?Hn (x) ≤ bi
i=1 i=1

et
e 1 ?H
an ≤ H e 2 ? . . . ?H
e n−1 ?Hn (x) − H
e 1 ?H
e 2 ? . . . ?H
e n (x) ≤ bn

qu’il suffit de sommer pour obtenir le résultat souhaité.


Corollaire 6.2.5. On déduit immédiatement du Lemme 6.2.4 la
stabilité de VaR par convolution (en prenant ai = 0 pour tout i).
Nous reviendrons plus loin en détail sur ce résultat.
6.2. Approximation du modèle individuel par un
équivalent collectif 293

Grâce au Lemme 6.2.4, nous allons pouvoir établir le résultat


suivant, qui fournit des bornes pour l’erreur commise en passant du
modèle individuel au modèle collectif.
Proposition 6.2.6. Quel que soit x ∈ IR + , les inégalités
n
X n o
min 0,pi − exp(−λi ) ≤ Gind (x) − Gcoll (x)
i=1

et
n 
X 
Gind (x) − Gcoll (x) ≤ pi − exp(−λi ) + max{qi − λi exp(−λi ),0}
i=1

sont satisfaites.
Démonstration. Grâce au Lemme 6.2.4, il suffit de prouver le résultat
ci-dessus pour une seule police, c’est-à-dire de borner

Fi (x) − F̃i (x) = Pr[Si ≤ x] − Pr[Sei ≤ x],

puisque

Gind = F1 ?F2 ? . . . ?Fn et Gcoll = Fe1 ?Fe2 ? . . . ?Fen .

On doit donc démontrer deux inégalités pour x ≥ 0, à savoir


+∞ k
X λ i ?(k)
min{0,pi − exp(−λi )} ≤ pi + qi Bi (x) − exp(−λi ) Bi (x)
k!
k=0
(6.5)
et
+∞ k
X λ i ?(k)
pi + qi Bi (x) − exp(−λi ) Bi (x)
k!
k=0
≤ pi − exp(−λi ) + max{qi − λi exp(−λi ),0}. (6.6)
Commençons par (6.6): quel que soit x ∈ IR + , il vient
+∞ k
X λ i ?(k)
pi + qi Bi (x) − exp(−λi ) Bi (x)
k!
k=0
+∞ k
X λ i ?(k)
= pi + qi Bi (x) − exp(−λi ) − λi exp(−λi )Bi (x) − exp(−λi ) Bi (x)
k!
k=2

≤ pi − exp(−λi ) + qi − λi exp(−λi ) Bi (x)

≤ pi − exp(−λi ) + max{0,qi − λi exp(−λi )},


Chapitre 6. Calcul de la marge de solvabilité et de
294 primes stop-loss dans le modèle collectif

ce qui est bien le résultat annoncé. Passons à présent à (6.5): comme


l’inégalité
?(k)
Bi (x) ≤ Bi (x)
est vérifiée quel que soit le réel non-négatif x et l’entier positif k, il
vient
+∞ k
X λ i ?(k)
pi − exp(−λi ) + qi Bi (x) − exp(−λi ) Bi (x)
k!
k=1
+∞
!
X λk
i
≥ pi − exp(−λi ) + qi − exp(−λi ) Bi (x)
k!
k=1

= pi − exp(−λi ) + qi − 1 + exp(−λi ) Bi (x)

≥ pi − exp(−λi ) + min{0, exp(−λi ) − pi }


= min{0,pi − exp(−λi )},

ce qui achève la démonstration.

Commentons les résultats de la Proposition 6.2.6. Tout d’abord,


si
pi ≥ exp(−λi ) ⇔ λi ≥ − ln pi pour tout i,
c’est-à-dire si la probabilité que la police i ne produise aucun sinistre
est plus petite dans le modèle collectif que dans le modèle individuel,
on voit que

Gind (x) ≥ Gcoll (x) pour tout x ∈ IR+ ,

ce qui illustre bien le caractère prudent de l’approximation de G ind


par Gcoll pour la compagnie, puisque

λi ≥ − ln pi pour tout i ⇒ S ind VaR S coll .

Le choix λi = − ln pi est donc celui à opérer lorsqu’il s’agit de calcu-


ler une marge de solvabilité ou une probabilité de ruine. En effet, en
notant κ le niveau des fonds propres de l’assureur et p l’encaissement
net, nous avons

Pr[ruine dans le modèle individuel]


= Pr[S ind > κ + p]
≤ Pr[S coll > κ + p]
= Pr[ruine dans le modèle collectif].
6.2. Approximation du modèle individuel par un
équivalent collectif 295

De même, si on veut déterminer le niveau de fonds propres garan-


tissant que la ruine ne surviendra qu’avec une probabilité , on a

κind
 = VaR[S ind ; 1 − ] − p ≤ κcoll
 = VaR[S coll ; 1 − ] − p.

Examinons ce que deviennent les bornes de la Proposition 6.2.6


pour le choix usuel λi = qi . Comme

exp(−λi ) > 1 − λi = 1 − qi = pi ,

la borne inférieure donne


+∞
X (−qi )k qi2
pi − exp(−λi ) = pi − >− .
k! 2
k=0

Ainsi,
n
1X 2
Gind (x) − Gcoll (x) ≥ − qi .
2
i=1

Passons à la borne supérieure. Comme

qi > qi exp(−qi ) = λi exp(−λi ),

la borne supérieure donne

λ2i
pi − exp(−λi ) + qi − λi exp(−λi ) = 1 − (1 + λi ) exp(−λi ) < ,
2

de sorte que
n
1X 2
|Gind (x) − Gcoll (x)| ≤ qi (6.7)
2
i=1

est vérifiée quel que soit x ∈ IR+ . L’erreur commise en passant


du modèle individuel au modèle collectif avec λ i = qi est toujours
Pn
comprise entre ± 12 qi2 .
i=1
Lorsque λi = − ln pi , on peut vérifier que l’on obtient

n
1X
0 ≤ Gind (x) − Gcoll (x) ≤ (ln pi )2
2
i=1
Chapitre 6. Calcul de la marge de solvabilité et de
296 primes stop-loss dans le modèle collectif

j qj Pr[Yj = 1] Pr[Yj = 2] Pr[Yj = 3] Pr[Yj = 4] E[Yj ] E[Yj2 ]


1 0.10 0.10 0.20 0.30 0.40 3.0 10.0
2 0.20 0.20 0.30 0.50 0 2.3 5.9
3 0.30 0 0 0.50 0.50 3.5 12.5

Tab. 6.1 – Caractéristiques des polices du portefeuille.

j Pr[Sj = 0] Pr[Sj = 1] Pr[Sj = 2] Pr[Sj = 3] Pr[Sj = 4]


1 0.90 0.01 0.02 0.03 0.04
2 0.80 0.04 0.06 0.10 0
3 0.70 0 0 0.15 0.15

Tab. 6.2 – Caractéristiques des polices du portefeuille (suite).

6.2.7 Etude numérique de la qualité de l’approxima-


tion collective des fonctions de répartition

Examinons la qualité des bornes de la Proposition 6.2.6. Pour


ce faire, considérons l’exemple simplifié suivant. Un portefeuille est
constitué de 3 polices, donnant lieu à des sinistres de montants res-
pectifs S1 , S2 et S3 durant la période de référence. Les caractéritiques
de ces polices sont résumées aux Tableaux 6.1 et 6.2.
Le cacul exact de la loi de probabilité de S ind = S1 + S2 + S3
peut être fait itérativement, pour obtenir les résultats du Tableau
6.3.
Approximons à présent le modèle individuel par un modèle col-
lectif, en faisant le choix usuel λi = qi . On a alors

λ = 0.10 + 0.20 + 0.30 = 0.60,

et la loi de probabilité des montants de sinistre X 1 ,X2 , . . . est obte-


nue comme suit:

3 3
1X 1X
Pr[X1 = j] = λi Pr[Yi = j] = Pr[Si = j]
λ λ
i=1 i=1
 1 5

 (0.01 + 0.04 + 0) = 60 , si j = 1,
 0.6
1 8
0.6 (0.02 + 0.06 + 0) = 60 , si j = 2,
= 1
 0.6
 (0.03 + 0.10 + 0.15) = 2860 , si j = 3,
 1 19
0.6 (0.04 + 0 + 0.15) = 60 , si j = 4.
6.2. Approximation du modèle individuel par un
équivalent collectif 297

La loi de S coll est fournie au Tableau 6.3. On voit que

max |Gcoll (j) − Gind (j)| = Gcoll (0) − Gind (0)


j

= Pr[S coll = 0] − Pr[S ind = 0]


= exp(−0.6) − 0.9 × 0.8 × 0.7
= 0.0448116;

la borne supérieure fournie par (6.7) est quant à elle de


1 
0.102 + 0.202 + 0.302 = 0.7,
2
soit beaucoup plus que la valeur observée.
Remarque 6.2.7. Le Tableau 6.3 suggère également que S ind TVaR,=
S coll , puisque la différence Gcoll − Gind est d’abord positive puis
négative. Nous verrons plus loin dans ce chapitre que ce résultat
a une portée relativement générale.

j Pr[S ind = j] Gind (j) Pr[S coll = j] Gcoll (j) Gcoll (j) − Gind (j)
0 0.50400 0.50400 0.5488116 0.5488116 0.0448116
1 0.03080 0.53480 0.0274406 0.5762522 0.0414522
2 0.04928 0.58408 0.0445909 0.6208432 0.0367632
3 0.18878 0.77286 0.1558739 0.7767171 0.0038571
4 0.13938 0.91224 0.1137688 0.8904859 -0.0217541
5 0.02094 0.93318 0.0177879 0.9082738 -0.0249062
6 0.03165 0.96483 0.0306526 0.9389264 -0.0259036
7 0.02542 0.99205 0.0312012 0.9701276 -0.0201224
8 0.00612 0.99637 0.0134838 0.9836115 -0.0127585
9 0.00162 0.99799 0.0049926 0.9886041 -0.0093859
10 0.00141 0.99940 0.0051912 0.9937953 -0.0056047
11 0.00060 1 0.0032816 0.9970769 -0.0029231
12 0 1 0.0012863 0.9983632 -0.0016368

Tab. 6.3 – Loi de probabilité de S ind et de S coll .

6.2.8 Bornes sur l’erreur d’approximation: primes stop-


loss
Tentons à présent de borner l’erreur commise sur les primes stop-
loss lors du passage du modèle individuel ou modèle collectif. Il s’agit
tout d’abord de prouver les deux lemmes techniques qui suivent,
Chapitre 6. Calcul de la marge de solvabilité et de
298 primes stop-loss dans le modèle collectif

lesquels peuvent être considérés comme les analogues des Lemmes


6.2.3 et 6.2.4
Lemme 6.2.8. Soient les risques X1 , X2 et X3 , indépendants,
de fonctions de répartition respectives H 1 , H2 et H3 , telles que
H1 (0−) = H2 (0−) = H3 (0−) = 0. Si

a ≤ E[(X2 − t)+ ] − E[(X1 − t)+ ] ≤ b

quel que soit t, alors

a ≤ E[(X2 + X3 − t)+ ] − E[(X1 + X3 − t)+ ] ≤ b

Démonstration. Le résultat s’obtient simplement en conditionnant


par rapport à la valeur de X3 , i.e.

E[(X2 + X3 − t)+ ] − E[(X1 + X3 − t)+ ]


Z n o
= E[(X2 − (t − x3 ))+ ] − E[(X1 − (t − x3 ))+ ] dH3 (x3 ).
x3 ≥0

Il suffit alors de remarquer que l’intégrand est partout compris entre


a et b pour pouvoir conclure.

Lemme 6.2.9. Soient les risques indépendants {X 1 ,X2 , . . . ,Xn } et


{Y1 ,Y2 , . . . ,Yn }. Si

ai ≤ E[(Yi − t)+ ] − E[(Xi − t)+ ] ≤ bi

quel que soit t, alors l’inégalité


 !   ! 
Xn X n n
X n
X
ai ≤ E  Yi − t  − E  Xi − t  ≤ bi
i=1 i=1 + i=1 + i=1

est satisfaite quel que soit t.

Démonstration. Le résultat se déduit du Lemme 6.2.8 par une simple


récurrence.

Nous avons également besoin du résultat suivant.


Lemme 6.2.10. Soient deux risques indépendants X et Y . Quel
que soit t ∈ IR+ ,
     
E (X − t)+ + E (Y − t)+ ≤ E (X + Y − t)+
 
≤ E (X − t)+ + E[Y ]
6.2. Approximation du modèle individuel par un
équivalent collectif 299

Démonstration. Le résultat s’obtient en remarquant que, quels que


soient les réels positifs x,y et t, les inégalités

max{0,x − t} + max{0,y − t} ≤ max{x + y − t,0}


≤ max{x − t,0} + y

sont toujours satisfaites. Dès lors,


h i
Pr max{0,X − t} + max{0,Y − t} ≤ max{X + Y − t,0} = 1
h i
Pr max{X + Y − t,0} ≤ max{X − t,0} + Y = 1,

ce qui donne le résultat annoncé.


En itérant ce dernier résultat, on peut obtenir le lemme suivant.
Lemme 6.2.11. Soient X1 ,X2 , . . . ,Xn des risques indépendants et
identiquement distribués. Quel que soit t ∈ IR + , on a
 ! 
Xn
 
nE (X1 − t) + ≤ E Xi − t 
i=1 +
 
≤ E (X1 − t)+ + (n − 1)E[X1 ].

Nous sommes à présent en mesure d’énoncer le résultat suivant,


qui permet de borner l’erreur commise sur les primes stop-loss lors
du passage du modèle individuel au modèle collectif.
Proposition 6.2.12. Quel que soit t ∈ IR + , on a alors
n
X  
E[Yi ] 1 − λi − exp(−λi ) + min{0, exp(−λi ) − pi }
i=1
≤ E[(S ind − t)+ ] − E[(S coll − t)+ ]
Xn
≤ E[Yi ] max{qi − λi ,0}.
i=1

Démonstration. Grâce au Lemme 6.2.9, il suffit de prouver le résultat


pour une seule police. Nous voulons donc montrer que les inégalités
 
E[Yi ] 1 − λi − exp(−λi ) + min{exp(−λi ) − pi ,0}
≤ E[(Si − t)+ ] − E[(S̃i − t)+ ] ≤ E[Yi ] max{qi − λi ,0}

sont satisfaites pour i = 1,2, . . . ,n. Or, les primes stop-loss relatives
à Si et à S̃i s’écrivent

E[(Si − t)+ ] = qi E[(Yi − t)+ ]


Chapitre 6. Calcul de la marge de solvabilité et de
300 primes stop-loss dans le modèle collectif

et   

X k k
X
λi 
E[(S̃i − t)+ ] = exp(−λi ) E Yi;j − t  .
k!
k=1 j=1
+

Si on applique le Lemme 6.2.11, il vient alors


  

X k Xk
λi 
qi E[(Yi − t)+ ] − exp(−λi ) E Yi;j − t 
k!
k=0 j=1
+
+∞
X λki
≤ qi E[(Yi − t)+ ] − exp(−λi ) kE[(Yi − t)+ ]
k!
k=0
= (qi − λi )E[(Yi − t)+ ] ≤ max{qi − λi ,0}E[Yi ],

ce qui est bien la borne supérieure annoncée.


La borne inférieure s’obtient comme suit: toujours grâce au Lemme
6.2.11,
  
X∞ k
λki X
qi E[(Yi − t)+ ] − exp(−λi ) E Yi;j − t 
k!
k=0 j=1
+

λki  
+∞
X
≥ qi E[(Yi − t)+ ] − E[(Yi − t)+ ] + (k − 1)E[Yi ]
exp(−λi )
k!
k=1
+∞
!
X λki
= E[(Yi − t)+ ] qi − exp(−λi )
k!
k=0

X λki  
−E[Yi ] (k − 1) exp(−λi )+ exp(−λi ) E[(Yi − t)+ ] − E[Yi ]
k!
k=0
  
= qi − 1 + exp(−λi ) E[(Yi − t)+ ] − λi − 1 + exp(−λi ) E[Yi ]
 
≥ min{0, exp(−λi ) − pi } − (λi − 1 + exp(−λi )) E[Yi ],

ce qui achève la démonstration.

Examinons ce que deviennent les bornes obtenues ci-dessus pour


les choix usuels des λi . Tout d’abord, si λi = qi , on a

exp(−qi ) > 1 − qi = pi ,

et  
qi 2 −qi 2
1 − qi − exp(−qi ) > 1 − qi − 1 − qi + =
2 2
6.2. Approximation du modèle individuel par un
équivalent collectif 301

d’où l’on tire

1
n 
n  
− E[Yi ]qi2 ≤ E[Yi ] pi − exp(−qi )
2
i=1 i=1
≤ E[(S ind − t)+ ] − E[(S coll − t)+ ] ≤ 0.

En pratique, les qi sont faibles (de l’ordre de 10−3 souvent), de sorte


que la borne inférieure est de l’ordre de 10 −6 fois le montant moyen
d’un sinistre, multiplié par le nombre de polices. Notez que

E[(S ind − t)+ ] ≤ E[(S coll − t)+ ] quel que soit t ≥ 0,

dès que λi ≥ qi . Dès lors,

λi ≥ qi ⇒ S ind TVaR S coll .

Le choix λi = qi s’impose donc lorsque l’actuaire veut évaluer des


primes stop-loss, des Tail-VaR, ou plus généralement une quantitié
pouvant s’écrire comme l’espérance d’une fonction convexe crois-
sante de la charge totale des sinistres.
En prenant λi = − ln pi , on obtient

1 
n n
− E[Yi ](ln pi ) ≤
2
E[Yi ](qi + ln pi )
2
i=1 i=1
≤ E[(S ind − t)+ ] − E[(S coll − t)+ ] ≤ 0.

Remarque 6.2.13. Notez que le choix λi = − ln pi conduit également


à E[(S ind −t)+ ] ≤ E[(S coll −t)+ ]. Néanmoins, si on note S coll(1) l’ap-
proximation collective de S ind obtenue pour λi = qi et S coll(2) celle
obtenue pour λi = − ln pi , on peut vérifier que

E[(S ind − t)+ ] ≤ E[(S coll(1) − t)+ ] ≤ E[(S coll(2) − t)+ ].

L’approximation collective de S ind obtenue pour λi = qi est donc


plus précise que celle obtenue pour λ i = − ln pi lorsqu’il s’agit de
calculer des primes stop-loss. Insistons encore une fois sur le fait
que l’approximation collective de S ind obtenue pour λi = qi n’est
quant à elle pas prudente pour calculer une probabilité de ruine ou
un quantile.
Chapitre 6. Calcul de la marge de solvabilité et de
302 primes stop-loss dans le modèle collectif

6.3 Discrétisation des coûts des sinistres dans


le modèle collectif
6.3.1 Nécessité de la discrétisation
Le calcul de la fonction de répartition de S coll ou des primes stop-
loss y associées ne peut en général s’effectuer qu’après discrétisation
des montants des sinistres. En effet, le calcul de la fonction de
répartition Gcoll suppose le calcul de produits de convolution F (k)
pour des valeurs élevées de k, ce qui peut également poser des
problèmes numériques (sauf dans le cas où F est stable par convo-
lution, comme la loi Gamma, par exemple).
Bien entendu, la méthode de discrétisation retenue doit générer
un chargement de sécurité implicite: la quantité calculée après discrétisation
doit toujours être au moins égale à celle associée au modèle collec-
tif initial. La méthode de discrétisation à utiliser dépend donc de
ce qu’on veut évaluer: prime stop-loss ou Tail-VaR, probabilité de
ruine, VaR ou marge de solvabilité, par exemple.

6.3.2 Discrétisation en accord avec la VaR


Comme annoncé plus haut, les calculs s’effectueront à l’aide d’al-
gorithmes itératifs exigeant la discrétisation préalable des montants
des sinistres X1 ,X2 , . . . touchant le portefeuille. Afin de ne pas sous-
évaluer la probabilité de ruine ou la VaR, nous remplacerons les X i
par les variables Xi∆ à valeurs dans {k∆, k ∈ IN} pour un certain
pas de discrétisation ∆, avec

Xi∆ = k∆ si (k − 1)∆ < Xi ≤ k∆. (6.8)

Notez au passage que les Xi∆ sont strictement positifs.


Au niveau des fonctions de répartition, la discrétisation (6.8) fait
passer de F pour les Xi à F ∆ pour les Xi∆ , où

F ∆ (x) = Pr[X ≤ k∆]


= F (k∆), pour k∆ ≤ x < (k + 1)∆, (6.9)
F (k∆) = F (k∆), pour k ∈ IN.

La Figure 6.1 montre les graphes de F et F ∆ . Clairement,

F ∆ (x) ≤ F (x) pour tout x ∈ IR

de sorte que
Xi∆ VaR Xi quel que soit i.
6.3. Discrétisation des coûts des sinistres dans le
modèle collectif 303

F∆

∆ 2∆ 3∆ 4∆

Fig. 6.1 – Fonction de répartition F et F∆ obtenue à partir de (6.8).

Définissons la charge totale des sinistres après discrétisation comme


N
coll
S∆ = Xi∆ .
i=1

Montrons que la méthode de discrétisation que nous avons choisie


coll est plus élevée que la charge de sinistre initiale S coll .
garantit S∆
Pour ce faire, commençons par établir les deux résultats suivants.
Lemme 6.3.1. Considérons des risques indépendants Z 1 , Z2 et Z3 ,
de fonction de répartition respectives H 1 , H2 et H3 . Alors,

Z1 VaR Z2 ⇒ Z1 + Z3 VaR Z2 + Z3 . (6.10)

Démonstration. Quel que soit t ∈ IR,


 t
Pr[Z1 + Z3 ≤ t] = Pr[Z1 ≤ t − z]dH3 (z)
z=0
 t
≥ Pr[Z2 ≤ t − z]dH3 (z)
z=0
= Pr[Z2 + Z3 ≤ t],

ce qui achève la vérification.

Propriété 6.3.2. Lorsque la discrétisation se fait comme décrit en


(6.9),
n n
Xi VaR Xi∆ .
i=1 i=1
Chapitre 6. Calcul de la marge de solvabilité et de
304 primes stop-loss dans le modèle collectif

Démonstration. Procédons par récurrence. Le résultat est évidemment


correct pour n = 1. Supposons à présent le résultat acquis pour n,
et montrons qu’il est toujours valable pour n + 1. En appliquant
(6.10) à Z1 = X1 + X2 + . . . + Xn , Z2 = X1∆ + X2∆ + . . . + Xn∆ et
Z3 = Xn+1 , il vient par l’hypothèse de récurrence que

X1 +X2 +. . .+Xn +Xn+1 VaR X1∆ +X2∆ +. . .+Xn∆ +Xn+1 . (6.11)


∆ et Z = X ∆ + X ∆ +
En appliquant (6.10) à Z1 = Xn+1 , Z2 = Xn+1 3 1 2
. . . + Xn∆ , il vient

X1∆ + X2∆ + . . . + Xn∆ + Xn+1 VaR X1∆ + X2∆ + . . . + Xn∆ + Xn+1



.
(6.12)
Il suffit alors de combiner (6.11) et (6.12) pour obtenir le résultat
désiré.

Nous sommes à présent en mesure de montrer que la discrétisation


proposée plus haut est effectivement prudente (au sens  VaR ).
Propriété 6.3.3. Lorsque la discrétisation se fait comme décrit en
(6.9), S coll VaR S∆
coll .

Démonstration. La Propriété 6.3.2 nous permet d’écrire


 n 

+∞ 
coll
G (t) = Pr Xi ≤ t Pr[N = n]
n=0 i=1
 n 

+∞ 
≥ Pr Xi∆ ≤ t Pr[N = n] = Gcoll
∆ (t),
n=0 i=1

d’où l’on tire le résultat annoncé.

Remarque 6.3.4. Notez que cette première méthode de discrétisation


ne respecte pas l’encaissement pur relatif au portefeuille puisque
E[S coll ] < E[S∆
coll ].

6.3.3 Discrétisation en accord avec la TVaR


Nous allons à présent proposer une méthode de discrétisation ga-
rantissant que la prime pure restera inchangée, i.e. E[S coll ] = E[S∆
coll ]

(ce que ne garantit pas la discrétisation (6.9)). Par contre, les TVaR
et les primes stop-loss qui seront obtenues dans le modèle discrétisé
seront au moins aussi élevées que celle du modèle collectif initial
(mais les VaR après discrétisation ne seront pas systématiquement
plus élevées que dans le modèle collectif initial).
6.3. Discrétisation des coûts des sinistres dans le
modèle collectif 305

Fixons un pas de discrétisation ∆ > 0. La méthode de discrétisation


dont il est question ici procède en dispersant la masse de probabi-
lité de l’intervalle (i∆,(i + 1)∆] aux extrémités de celui-ci, tout en
conservant la moyenne (cette méthode est appelée discrétisation par
dispersion de masse). Plus précisément, nous invoquons la Propriété
5.6.1 pour obtenir la discrétisation qui conduira à une surestimation
des primes stop-loss. Définissons, pour i = 0,1,2, . . .,

1 (i+1)∆
+
fi = {F (x) − F (i∆)}dx
∆ x=i∆

1 (i+1)∆
= {(i + 1)∆ − x} dF (x)
∆ x=i∆

où l’équivalence entre les deux expressions de f i+ s’obtient moyen-


nant une intégration par parties. En effet,


1  (i+1)∆  (i+1)∆
fi+ = {(i + 1)∆ − x}F (x) + F (x)dx
∆ x=i∆ x=i∆
  (i+1)∆

1
= −∆F (i∆) + F (x)dx
∆ x=i∆

1 (i+1)∆
= {F (x) − F (i∆)}dx
∆ x=i∆
comme annoncé. De la même manière, toujours pour i = 0,1,2, . . .,
définissons

− 1 (i+1)∆
fi+1 = {x − i∆} dF (x)
∆ x=i∆

1 (i+1)∆
= {F ((i + 1)∆) − F (x)}dx.
∆ x=i∆
La deuxième méthode de discrétisation consistera à concentrer la
masse de probabilité de l’intervalle ]i∆,(i + 1)∆] en ses extrémités

i∆ (qui reçoit fi+ ) et (i + 1)∆ (qui reçoit fi+1 ).
La loi de probabilité des Xi à valeurs dans {0,∆,2∆, . . .} est

définie par

Pr[X1∆ = 0] = f0 = F (0) + f0+


Pr[X1∆ = i∆] = fi = fi− + fi+ pour i ≥ 1. (6.13)

Les fonctions de répartition F et F∆ obtenue tel que décrit ci-dessus


sont représentées à la Figure 6.2.
Chapitre 6. Calcul de la marge de solvabilité et de
306 primes stop-loss dans le modèle collectif

F∆

∆ 2∆ 3∆ 4∆

Fig. 6.2 – Fonction de répartition F et F∆ obtenue à partir de


(6.13).

On peut prouver le résultat suivant.


Proposition 6.3.5. Lorsque la discrétisation est faite comme décrit
en (6.13), X1∆ TVaR,= X1 .

Démonstration. Commençons par montrer que X 1∆ et X1 ont même


moyenne. Pour ce faire, notons que pour k∆ ≤ x < (k + 1)∆,


k  (k+1)∆
1

F (x) = Pr[X1∆ ≤ x] = fi = F (y)dy.
∆ y=k∆
i=0

Dès lors,

 +∞

E[X1∆ ] = F (x)dx
0
+∞ 
 (k+1)∆
= F (x)dx
k=0 k∆
 +∞
= F (x)dx = E[X1 ].
0

Nous devons à présent montrer que le passage de X 1 à X1∆ augmente


6.3. Discrétisation des coûts des sinistres dans le
modèle collectif 307

les primes stop-loss. Pour ce faire, écrivons


E[(X − t)+ ]

+∞
= E[(X − t)+ |j∆ < X ≤ (j + 1)∆] Pr[j∆ < X ≤ (j + 1)∆]
j=0
+∞
 (j + 1)∆ − E[X|j∆ < X ≤ (j + 1)∆]
≤ (j∆ − t)+

j=0

E[X|j∆ < X ≤ (j + 1)∆] − j∆
+ ((j + 1)∆ − t)+ Pr[j∆ < X ≤ (j + 1)∆]

où la majoration découle de la Propriété 5.6.1. Or,
E[X|j∆ < X ≤ (j + 1)∆]
 (j+1)∆
= xd Pr[X ≤ x|j∆ < X ≤ (j + 1)∆]
j∆
 (j+1)∆
= − x Pr[X > x|j∆ < X ≤ (j + 1)∆]
j∆
 (j+1)∆
+ Pr[X > x|j∆ < X ≤ (j + 1)∆]dx
j∆
 (j+1)∆
Pr[x < X ≤ (j + 1)∆]
= j∆ + dx
j∆ Pr[j∆ < X ≤ (j + 1)∆]
de sorte que
(j + 1)∆ − E[X|j∆ < X ≤ (j + 1)∆]
 (j+1)∆ 
F (j + 1)∆ − F (x)
= ∆−   dx
j∆ F (j + 1)∆ − F j∆
 (j+1)∆
1 
=   F (x) − F (j∆) dx.
F (j + 1)∆ − F j∆ j∆
De la même façon,
E[X|j∆ < X ≤ (j + 1)∆] − j∆
 (j+1)∆
1 
=   F ((j + 1)∆) − F (x) dx.
F (j + 1)∆ − F j∆ j∆
On obtient alors finalement

+∞
 + 

E[(X1 − t)+ ] ≤ fj (j∆ − t)+ + fj+1 ((j + 1)∆) − t)+
j=0

+∞
= fj (j∆ − t)+ = E[(X1∆ − t)+ ]
j=0
Chapitre 6. Calcul de la marge de solvabilité et de
308 primes stop-loss dans le modèle collectif

ce qui achève la preuve.


En procédant comme pour la première méthode de discrétisation,
nous allons à présent montrer que cette seconde méthode de discrétisation
conduit à une charge de sinistres plus élevée dans le modèle collectif
discrétisé.
Lemme 6.3.6. Considérons trois risques indépendants Z 1 , Z2 et
Z3 , de même moyenne et de fonction de répartition respective H 1 ,
H2 et H3 . Nous avons alors
Z1 TVaR,= Z2 ⇒ Z1 + Z3 TVaR,= Z2 + Z3 .
Démonstration. Le résultat se déduit immédiatement de l’inégalité

  
E[(Z1 + Z3 − t)+ ] = E Z1 − (t − z) + dH3 (z)
z≥0
  
≤ E Z2 − (t − z) + dH3 (z)
z≥0
= E[(Z2 + Z3 − t)+ ].

En procédant par récurrence à partir de ce lemme (le raisonne-


ment utilise le même argument que celui tenu dans la démonstration
de la Propriété 6.3.2), on obtient aisément la propriété suivante.
Propriété 6.3.7. Si la discrétisation est effectuée conformément à
(6.13),
n n
Xi TVaR,= Xi∆ .
i=1 i=1
On déduit de la Propriété 6.3.7 que la charge totale des sinistres
coll
S∆ dans le modèle collectif discrétisé est plus sévère que la charge
de sinistre S coll avant discrétisation (au sens TVaR,= ).
Propriété 6.3.8. Si la discrétisation est effectuée conformément à
(6.13), S coll TVaR,= S∆ coll .

Démonstration. Il suffit de conditionner par rapport au nombre N


de sinistres qui frappent le portefeuille, i.e.
  
   
+∞  n
E S coll − t = E Xi − t  Pr[N = n]
+
n=0 i=1 +
  

+∞ 
n
≤ E Xi∆ − t  Pr[N = n]
n=0 i=1 +

= E (S∆
coll
− t)+ ,
6.4. Calcul dans le modèle collectif discrétisé:
Algorithme de Panjer 309

ce qui achève la vérification.

6.4 Calcul dans le modèle collectif discrétisé:


Algorithme de Panjer
6.4.1 De la difficulté d’une approche directe
Notations

Dorénavant, nous posons pour simplifier les calculs ∆ = 1, et


nous omettons l’exposant ∆. Nous considérons donc que les mon-
tants de sinistre X1 ,X2 ,X3 , . . . qui touchent le portefeuille en vision
collective sont des variables aléatoires indépendantes et de même
loi, à valeurs dans IN. Notons f i = Pr[X1 = i], i ∈ IN, et supposons
dans un premier temps f0 = 0.

Produit de convolution discret

Nous définissons le produit de convolution discret comme


 

k
= Pr  Xj = i .
(k)
fi
j=1

(k)
Clairement, fi = 0 si i ≤ k − 1 (car tous les sinistres valent au
(k)
moins 1). Comme les Xi sont positifs, les fi satisfont au schéma
de récurrence
(k)
 (k−1)
i−k+1
fi = fi−j fj si i ≥ k. (6.14)
j=1

Loi de S coll

Bien entendu, S coll est également à valeurs entières. Nous notons


dorénavant

pk = Pr[N = k], k ∈ IN, et gi = Pr[S coll = i], i ∈ IN.

Dès lors,

i
(k)
gi = pk f i , i ∈ IN. (6.15)
k=0
Chapitre 6. Calcul de la marge de solvabilité et de
310 primes stop-loss dans le modèle collectif

Ceci permet de calculer Gcoll , donnée par


x

G coll
(x) = gj , x ∈ IR+ .
j=0

L’approche directe que nous venons de présenter nécessite beaucoup


d’opérations, ce qui peut poser quelques difficultés en pratique, par-
ticulièrement pour les portefeuilles de grande taille. La formule de
récurrence de Panjer permet un calcul plus rapide des g j .

6.4.2 Famille de Panjer


L’algorithme de Panjer s’applique à des lois de probabilité {p j , j ∈
IN} sur IN satisfaisant la relation de récurrence
 
b
pk = a + pk−1 , k = 1,2, . . . , (6.16)
k
pour certaines constantes réelles a et b.
La classe des lois de probabilité sur IN satisfaisant la relation
de récurrence (6.16) est appelée famille de Panjer en sciences ac-
tuarielles. Elle ne compte que trois membres, comme l’indique la
Proposition 6.4.1.
Proposition 6.4.1. Les seules lois de probabilité satisfaisant la re-
lation de récurrence (6.16) sont
(i) la loi de Poisson, obtenue pour a = 0 et b > 0;
(ii) la loi binomiale négative, obtenue pour 0 < a < 1 et a + b > 0;
(iii) la loi binomiale, obtenue pour a < 0 et b = −a(m + 1), pour un
certain entier positif m.
Démonstration. Réglons tout d’abord le cas a = 0. On déduit faci-
lement de (6.16) que

bk
pk = p 0 , k = 1,2, . . . ;
k!
on doit avoir b ≥ 0 afin que pk ≥ 0 pour tout k. Comme la somme
des probabilités pk doit valoir 1, il vient

+∞
pk = p0 exp(b) = 1 ⇒ p0 = exp(−b).
k=0

Dans ce cas,
bk
pk = exp(−b) , k ∈ IN,
k!
6.4. Calcul dans le modèle collectif discrétisé:
Algorithme de Panjer 311

et on a bien le résultat annoncé en (i). Supposons à présent a = 0.


En appliquant à plusieurs reprises (6.16), il vient
 
a b
pk = k+
pk−1
k a
  
a2 b b
= k+ k−1+ pk−2
k(k − 1) a a
= ...
    
ak b b b
= k+ k−1+ ... 1 + p0 ,
k! a a a

ce qui peut encore se réécrire, en posant ζ = ba −1 + 1,

ak
pk = p0 (ζ + k − 1)(ζ + k − 2) . . . (ζ + 1)ζ , k ∈ IN.
k!

Comme la formule


+∞
zk
c(c + 1) . . . (c + k − 1) = (1 − z)−c
k!
k=0

est valable pour |z| < 1 et c ∈ IR (pour la vérifier, développer


z → (1 − z)−c en série de MacLaurin), il vient


+∞
pk = p0 (1 − a)−ζ = 1 ⇒ p0 = (1 − a)ζ ,
k=0

d’où l’on tire


 
ζ +k−1
pk = ak (1 − a)ζ , k ∈ IN.
k

Pour 0 < a < 1, pk ≥ 0 si, et seulement si,

ζ ≥ 0 ⇔ b ≥ −a.

On retrouve dans ce cas la loi binomiale négative. Pour a < 0,


pk ≥ 0 si, et seulement si, b = −a(m + 1) pour un certain entier m.
Ceci entraı̂ne ζ ∈ IN et conduit à la loi binomiale. Enfin, notez que
a ≥ 1 est impossible car on aurait alors p k > 1 pour k suffisamment
grand.
Chapitre 6. Calcul de la marge de solvabilité et de
312 primes stop-loss dans le modèle collectif

6.4.3 Algorithme de Panjer pour coûts de sinistres po-


sitifs
Le schéma de calcul itératif proposé par Panjer est décrit dans
la Proposition 6.4.3. Pur l’obtenir, nous aurons besoin lemme tech-
nique suivant.
Lemme 6.4.2. La relation

n
j
(n) (n−1)
fj = ifi fj−i ,
j
i=1

est valable pour j ≥ n.

Démonstration. La démonstration consiste à égaler deux expres-


sions pour le coût moyen du premier sinistre connaissant la somme
des n premiers. Plus précisément, nous avons quel que soit j ≥ n
  n   n  n 
  
 1  j
E X1  Xk = j = E Xk  Xk = j = .
 n  n
k=1 k=1 k=1

(k)
D’autre part, si fj > 0,
  n    n 
 
j 
 
E X1  Xk = j = i Pr X1 = i  Xk = j
 
k=1 i=1 k=1
j n
i=1 i Pr [X1 =n
i et k=2 Xk = j − i]
=
Pr [ k=1 Xk = j]
j (n−1)
i=1 ifi fj−i
= (n)
.
fj

Ceci conduit à la relation annoncée.

Proposition 6.4.3. Si la loi de probabilité de N fait partie de la


famille de Panjer et si f0 = 0, les gi s’obtiennent par récurrence à
l’aide de la relation
j 
 
b
gj = a+i fi gj−i (6.17)
j
i=1

en partant de g0 = p0 .
6.4. Calcul dans le modèle collectif discrétisé:
Algorithme de Panjer 313

Démonstration. Comme tous les montants de sinistres sont stric-


tement positifs, on a clairement Pr[S coll = 0] = Pr[N = 0] = p0 .
Considérons à présent j ≥ 1. Le Lemme 6.4.2 nous permet alors
d’écrire
+∞ 
 
b (n)
gj = a+ pn−1 fj
n=1
n

+∞ 
j
(n−1)

+∞
b 
j
(n−1)
= apn−1 fi fj−i + pn−1 ifi fj−i
j
n=1 i=1 n=1 i=1
j   
+∞
b (n−1)
= a+i fi pn−1 fj−i
j
i=1 n=1
j  
b
= a+i fi gj−i ,
j
i=1

ce qui achève la preuve.

Remarque 6.4.4 (Temps de calcul). Examinons à présent le


temps de calcul nécessaire pour obtenir g j , j = 1,2, . . . ,m, selon le
schéma (6.15) et le schéma (6.17). Si on ne compte que les multi-
(k)
plications, l’évaluation des f i à k fixé pour i = 1,2, . . . ,m requiert

m(m + 1)
1 + 2 + ... + m =
2
opérations. Ceci doit être réalisé pour k = 1,2, . . . ,m. Ainsi, l’ap-
proche directe nécessite un nombre d’opérations de l’ordre de m 3 .
Par contre, si on adopte (6.17), le nombre d’opérations est de l’ordre
de j pour chaque gj , d’où un total de l’ordre de m2 opérations. Dans
beaucoup de cas pratiques, m est de l’ordre du millier, ce qui permet
à (6.17) de réduire d’un facteur 1 000 le temps de calcul par rapport
à (6.15).
Corollaire 6.4.5 (Le cas de la loi de Poisson composée). Dans
le cas où N suit la loi de Poisson de moyenne λ (a = 0 et b = λ),
il vient
exp(−λ) si i = 0
gi = λ i
i j=1 jfj gi−j si i ≥ 1.

Remarque 6.4.6 (Initialisation de la récurrence de Panjer


dans le cas Poisson composé). En pratique, pour des porte-
feuilles de taille moyenne à élevée, λ est souvent si grand que g 0
est considéré comme nul par la machine, entraı̂nant la nullité de
Chapitre 6. Calcul de la marge de solvabilité et de
314 primes stop-loss dans le modèle collectif

tous les gi , en vertu de la relation de récurrence de Panjer. Afin de


remédier à cet inconvénient, on posera g0 = 1 avant de calculer les
gi pour i = 1,2, . . . à partir de la relation de Panjer. On s’arrêtera
avant que la machine ne juge un des gi infini, et on renormalisera
les résultats à partir de
gi = exp(−λ + ln gi ), i = 0,1,2, . . .
avant de poursuivre le calcul des gi par l’algorithme de Panjer.
Remarque 6.4.7 (Preuve alternative de l’algorithme de Pan-
jer dans le cas Poisson composé). On peut encore démontrer la
récursion de Panjer comme suit dans le cas Poisson composé, en re-
courant aux fonctions génératrices des probabilités (après discrétisation,
la charge totale des sinistres est à valeurs dans IN, au facteur ∆
près). Partons de

d  +∞
ϕS (z) = kz k−1 gk . (6.18)
dz
k=1

D’autre part, nous savons que



+∞
λn
ϕS (z) = exp(−λ) {ϕX (z)}n = exp(λ(ϕX (z) − 1))
n!
n=0

et dès lors
 
d d
ϕS (z) = λ ϕX (z) ϕS (z)
dz dz

+∞ 
+∞
k
= λ z gk xz x−1 fx
k=0 x=1

+∞ +∞
= λxz x+k−1 gk fx
x=1 k=0

+∞ 
+∞
= λxz y−1 gy−x fx
x=1 y=x

+∞  y
= λxz y−1 gy−x fx (6.19)
y=1 x=1

où l’on a posé y = x + k puis permuté les sommes. En identifiant


les coefficients des différentes puissances de z dans (6.18) et (6.19)
on trouve
k
kgk = λxfx gk−x
x=1
6.4. Calcul dans le modèle collectif discrétisé:
Algorithme de Panjer 315

soit la formule de Panjer.

6.4.4 Algorithme de Panjer pour coûts de sinistre non-


négatifs
Jusqu’ici, nous avons supposé que f 0 = 0. Nous allons à présent
adapter l’algorithme de Panjer au cas où f 0 > 0 (ce qui peut résulter
notamment de la méthode de discrétisation par dispersion de masse).
Proposition 6.4.8. Si la loi de probabilité de N fait partie de la
famille de Panjer et si f0 > 0, les gj s’obtiennent par récurrence à
partir de la relation

j 
 
1 i
gj = a+b fi gj−i (6.20)
1 − af0 j
i=1

partant de g0 = ϕN (f0 ).

Démonstration. Comme

(k)
f0 = (f0 )k , k ∈ IN,

on voit facilement que


+∞
g0 = pk (f0 )k = ϕN (f0 ).
k=0

Une adaptation évidente de la preuve de la Proposition 6.4.3 mène


pour j > 0 à


+∞ 
j 
+∞
(n−1) b j
(n−1)
gj = apn−1 fi fj−i + pn−1 ifi fj−i
n=1 n=1
j
i=0 i=1

+∞ j   
+∞
(n−1) b (n−1)
= af0 pn−1 fj + a+i fi pn−1 fj−i
n=1
j n=1
i=1
j  
b
= af0 gj + a+i fi gj−i ,
j
i=1

ce qui donne finalement le résultat annoncé.


Chapitre 6. Calcul de la marge de solvabilité et de
316 primes stop-loss dans le modèle collectif

6.4.5 Evaluation des probabilités de ruine sur une période


On voit clairement que

i
coll
Pr[S∆ > i∆] = 1 − gj , i ∈ IN, où gj = Pr[S∆
coll
= j∆].
j=0

On peut calculer ces quantités récursivement en adoptant le schéma


suivant:

coll 1, si i = −1,
Pr[S∆ > i∆] = coll > (i − 1)∆] − g , si
Pr[S∆ i i ∈ IN.
La probabilité de déficit cherchée Pr[S coll > (1 + ρ)nµ + κ] est
approximée par Pr[S∆ coll > (1+ρ)nµ+κ], toujours supérieure lorsque

la discrétisation est opérée en accord (6.9). Si on note


 
∗ (1 + ρ)nµ + κ
k =

la probabilité de déficit cherchée vaut


k

coll
Pr[S∆ > k ∆] = 1 − gj .
j=0

6.4.6 Evaluation de la VaR et de la marge de solvabi-


lité
Au contraire des chargements de sécurité incorporés aux primes
payées par les assurés, la marge de solvabilité est constituée à l’aide
de capital apporté par les actionnaires. Il s’agit donc de la déterminer
aussi précisément que possible, car la marge devra être rétribuée à
un taux élevé.
La marge de solvabilité se définit souvent comme
κ = VaR[S coll ; 1 − ] − (1 + ρ)E[S coll ].
La détermination de κ se fait sur base des montants de sinistres
discrétisés, i.e.
coll
κ∆ = VaR[S∆ ; 1 − ] − (1 + ρ)E[S∆
coll
].
Pour autant qu’on ait recours à la discrétisation (6.9), en accord avec
VaR , nous sommes sûrs que κ ≤ κ∆ . Pour obtenir VaR[S∆ coll ; 1 − ],

il suffira de repérer l’indice k tel que



k−1 
k
gj < 1 −  ≤ gj
j=1 j=1
6.5. Evaluation des primes stop-loss 317

qui fournit alors


κ∆ = k − (1 + ρ)nµ.

Remarque 6.4.9. Nous présenterons dans le Tome II d’autres méthodes


numériques permettant d’obtenir la loi de la charge totale des si-
nistres dans le modèle collectif, comme l’algorithme de la trans-
formée de Fourier rapide, par exemple.

6.5 Evaluation des primes stop-loss


6.5.1 Schéma itératif de calcul des primes stop-loss
Nous supposons dans cette section que le nombre annuel N de
sinistres suit une loi de Poisson. La méthode est la suivante:

1. on discrétise par dispersion de masse (i.e. comme décrit en


(6.13)) les montants de sinistre X1 ,X2 ,X3 , . . . de fonction de
répartition F en choisissant un pas ∆; ceci donne les montants
de sinistre X1∆ ,X2∆ ,X3∆ , . . ..

N
2. On calcule les gi = Pr[S∆ coll = i∆] où S coll =
∆ Xk∆ grâce
k=1
à l’algorithme de Panjer; on a ainsi la fonction de répartition
Gcoll coll
∆ de S∆ donnée par


k
Gcoll
∆ (x) = gi pour x ∈ [k∆,(k + 1)∆[.
i=0

3. partant de


E[S∆
coll
] = λ∆ i fi ,
i=1

on calcule les primes stop-loss par récurrence au moyen de la


relation
 

k
E[(S∆
coll
− (k + 1)∆)+ ] = E[(S∆
coll
− k∆)+ ] − ∆ 1 − gi .
i=0

Pour une franchise t quelconque (pas nécessairement un multiple


du pas de discrétisation ∆), on obtient alors en considérant k∆ ≤
Chapitre 6. Calcul de la marge de solvabilité et de
318 primes stop-loss dans le modèle collectif

t < (k + 1)∆
 ∞  
E[(S∆
coll
− t)+ ] = 1 − Gcoll
∆ (x) dx
x=t
 +∞   t  
= 1 − G∆ (x) dx −
coll
1 − Gcoll
∆ (x) dx
x=k∆
x=k∆ 
= E[(S∆ − k∆)+ ] − (t − k∆) 1 − Gcoll
∆ (k∆) .

Il suffit dès lors de calculer les primes stop-loss pour des franchises
multiples du pas de discrétisation pour pouvoir en déduire les primes
stop-loss pour une franchise quelconque.

6.5.2 Erreur due à la discrétisation


A présent, tentons de borner l’erreur commise en substituant
E[(S∆coll − t) ] à E[(S coll − t) ]. Pour ce faire, nous avons besoin de
+ +
la quantité suivante :
!
ε∆ = sup F ((j + 1)∆) − F (j∆)
j∈IN

qui n’est autre que la plus grande masse de probabilité accordée à


un intervalle du type ]j∆,(j + 1)∆].
Proposition 6.5.1. Quel que soit t ≥ 0, on a
∆ ∆
0 ≤ E[(S∆
coll
− t)+ ] − E[(S coll − t)+ ] ≤ λ ε∆ ≤ λ .
4 4
Démonstration. La première de ces inégalités est une conséquence
directe de la Proposition 6.3.5. La dernière est évidente puisque
ε∆ ≤ 1. Reste donc à prouver la seconde. Nous savons que quel que
soit t ≥ 0

E[(X1∆ − t)+ ] − E[(X1 − t)+ ]


 ∞ 
= F (x) − F ∆ (x) dx
x=t
∞    ∞  
= 1 − F (x) dx −

1 − F (x) dx
x=0 x=0
 t  
+ F ∆ (x) − F (x) dx
x=0
 t  
= E[X1∆ ] − E[X1 ] + F ∆ (x) − F (x) dx ≥ 0.(6.21)
" #$ % x=0
=0 par construction
6.5. Evaluation des primes stop-loss 319

De plus, en raison de la méthode de discrétisation utilisée, nous


avons
 (j+1)∆
F ∆ (x)dx = ∆F ∆ (j∆)
x=j∆
 (j+1)∆
= ∆(F (j∆) + fj+ ) = F (x)dx. (6.22)
x=j∆

Ceci nous permet d’affirmer que pour j∆ ≤ t < (j + 1)∆,

0 ≤ E[(X1∆ − t)+ ] − E[(X1 − t)+ ]


j−1  (k+1)∆ 
   t  
= F ∆ (x) − F (x) dx + F ∆ (x) − F (x) dx
k=0 x=k∆ x=j∆
 t  
= ∆
F (x) − F (x) dx. (6.23)
x=j∆

En particulier, nous remarquons au passage que

E[(X1∆ − j∆)+ ] = E[(X1 − j∆)+ ]

quel que soit l’entier j. En combinant (6.21) et (6.23), il vient pour


j∆ ≤ t < (j + 1)∆
 t    t  
F (x) − F (x) dx =

F ∆ (x) − F (x) dx.
x=0 x=j∆

Définissons
 !

ξ = inf x ∈]j∆,(j + 1)∆]  F ∆ (x) ≤ F (x) .

On a alors
 ξ    (j+1)∆  
F∆ (x) − F (x) dx = F (x) − F∆ (x) dx
x=j∆ x=ξ

grâce à (6.22). La fonction


 t  
t → F ∆ (x) − F (x) dx
x=j∆

croı̂t depuis j∆ jusque ξ, pour décroı̂tre ensuite de ξ à (j + 1)∆. De


plus, elle s’anulle en j∆ et en (j + 1)∆. On en déduit alors que
 t    ξ  
F (x) − F (x) dx ≤

F ∆ (x) − F (x) dx.
x=j∆ x=j∆
Chapitre 6. Calcul de la marge de solvabilité et de
320 primes stop-loss dans le modèle collectif

Comme
 ξ    (j+1)∆  
F (x) − F (x) dx =

F (x) − F ∆ (x) dx
x=j∆ x=ξ
 (j+1)∆
1
= | F ∆ (x) − F (x)|dx
2 x=j∆

on en déduit
 t  
F ∆ (x) − F (x) dx
x=j∆
 ξ  
≤ F ∆ (x) − F (x) dx
x=j∆
&
ξ    (j+1)∆  
= F (x) − F (x) dx
∆ F (x) − F ∆ (x) dx
x=j∆ x=ξ
'  

≤ fj+ (ξ − j∆)fj+1 (j + 1)∆ − ξ

En remarquant que
 

fj+ + fj+1 = F (j + 1)∆ − F (j∆)

et comme l’inégalité uv ≤ 14 (u + v)2 est vérifiée quels que soient les


réels u et v, on a
'   '  2 1
− 1
fj (ξ − j∆)fj+1 (j + 1)∆ − ξ
+
≤ F ((j + 1)∆) − F (j∆) ∆2
4 4
∆ε∆
≤ .
4
Nous savons donc à présent que
∆ε∆
0 ≤ E[(X1∆ − t)+ ] − E[(X1 − t)+ ] ≤
4
Or,
E[(S∆
coll
− t)+ ] − E[(S coll − t)+ ]
     
∞ k  k 
k
λ  
= exp(−λ) E Xj∆ − t  − E  Xj − t
k!
k=0 j=1 j=1
+

 λk ∆ε∆ 1
≤ exp(−λ) k = λ∆ε∆ ,
k! 4 4
k=0

comme annoncé.
6.6. Exercices 321

6.6 Exercices
Exercice 6.6.1. Considérons le modèle collectif suivant:
 la charge
totale S coll des sinistres du portefeuille vaut S coll = N i=1 Xi où N
est de loi de Poisson de moyenne λ et où les montants correspon-
dants X1 ,X2 , . . . sont indépendants de loi Exp(θ).
Afin de calculer la prime stop-loss E[(S coll − t)+ ] grâce à l’algo-
rithme de Panjer, il est nécessaire de discrétiser les X i . Déterminez
le pas de discrétisation ∆ afin de limiter l’erreur correspondante à
10% de la prime pure E[S].
Exercice 6.6.2. Considérons un portefeuille constitué de trois risques
générant des charges annuelles de sinistre de montant S 1 , S2 et S3 ,
dont les lois de probabilité sont reprises au Tableau 6.4.
Décrivez l’approximation collective S coll de S ind = S1 + S2 + S3
en vue de calculer des primes stop-loss E[(S ind − t)+ ].

j k=0 k=1 k=2


1 0.4 0.3 0.3
2 0.6 0.1 0.3
3 0.4 0.4 0.2

Tab. 6.4 –
.]Valeurs de Pr[Sj = k].

6.7 Notes bibliographiques


Les modèles individuels et collectifs sont étudiés dans la plupart
des livres consacrés à la théorie du risque. Mentionnons, en plus des
ouvrages déjà cités précédemment, Bowers et al. (1997). Nous
nous sommes également largement basés sur les travaux de De Pril
& Dhaene (1992) et de Reinhard (1994).
Chapitre 6. Calcul de la marge de solvabilité et de
322 primes stop-loss dans le modèle collectif
Chapitre 7

Equilibre à long terme des


résultats de la compagnie

7.1 Introduction
Dans ce chapitre, nous nous intéressons à l’équilibre des opérations
de l’assureur sur plusieurs années. Nous considérons le portefeuille
comme un collectif de risques et nous envisageons les sinistres comme
autant de chocs affectant le portefeuille. L’événement d’intérêt est la
ruine de l’assureur. Bien entendu, le terme ne doit pas être considéré
ici au pied de la lettre: en réalité, l’assureur ne tombera sans doute
pas en faillite mais n’en demeureura pas moins en mauvaise posture
financière. La probabilité de ruine telle qu’elle est définie et intro-
duite plus loin doit plutôt s’envisager comme une mesure de risque,
voire comme une manière de déterminer certains paramètres comme
le taux de chargement de sécurité ou le degré requis de réassurance,
par exemple.
Il convient d’insister sur le caractère extrêmement simplifié du
modèle présenté ici. La probabilité de ruine permet de juger de la
pertinence de la tarification de l’assureur et du niveau de fonds
propre, au vu de la sinistralité. La philosophie des modèles de base de
théorie du risque est conservée dans les modèles plus élaborés visant
à tester la stratégie adoptée par la compagnie, lesquels incluent l’ef-
fet de l’inflation, une évolution dans la sinistralité, un taux de prime
adapté à l’évolution des sinistres, la distribution de dividendes, etc.
Dans de tels modèles, l’obtention de solutions analytiques est bien
évidemment sans espoir, et l’actuaire recourt à la simulation (qui
sera examinée en détail dans le Tome II).
Le problème de la ruine de l’assureur constitue le sujet central

323
Chapitre 7. Equilibre à long terme des résultats de la
324 compagnie

de la théorie du risque. Les premiers développements théoriques re-


montent au début du 20ème siècle et sont dus à des actuaires scandi-
naves désormais célèbres, comme Harald Cramér et Filip Lundberg.
Leurs travaux ont contribué à jeter les bases de la théorie des proces-
sus stochastiques. Par la suite, tous les grands noms de l’actuariat
moderne, comme Hans Bühlmann, Hans Gerber, ... ont étudié en
détail le problème de la ruine, permettant d’aboutir à une théorie
élégante aidant à mieux appréhender le quotidien de l’assureur.

7.2 Modèle discret de de Finetti


7.2.1 Description du modèle
Dans les chapitres précédents, nous nous sommes intéressés au
résultat technique R de l’assureur sur un exercice. Bien entendu,
cette vision des choses est quelque peu réductrice car la compagnie
poursuivra ses activités au-delà de l’exercice en question. Nous allons
ici suivre l’évolution du résultat technique dans le temps. Pour ce
faire, nous noterons Rk le résultat de la compagnie à l’instant k,
partant d’un capital initial R0 = κ.
Afin de modéliser l’évolution des résultats de la compagnie, nous
posons les hypothèses suivantes:
1. les produits financiers sont négligés;
2. les conditions de couverture et la sinistralité n’évoluent pas
dans le temps;
3. la part de marché de la compagnie reste inchangée;
4. il n’y a pas d’inflation.
Notons Sk la charge de sinistre relative à l’exercice k et p l’en-
caissement net de cet exercice (à savoir la prime pure E[S k ] majorée
du chargement de sécurité ρE[Sk ]). Nous avons donc

p > E[Sk ].

Nous supposons les Sk indépendantes et identiquement distribuées.


L’évolution du résultat de la compagnie satisfait alors aux relations
de récurrence

R0 = κ, R1 = κ + p − S1 et Rk = Rk−1 + p − Sk pour k ≥ 2.

Notons
∆k = Rk − Rk−1 = p − Sk
7.2. Modèle discret de de Finetti 325

la variation du résultat de la compagnie au cours de l’année k. Les


∆k sont indépendantes et identiquement distribuées, en moyenne
positive (du fait du chargement de sécurité). Même si E[∆ k ] > 0
(ce qui garantit que le résultat de la compagnie tendra asymptoti-
quement vers l’infini), il y a néanmoins un réel risque d’insolvabilité
pour la compagnie puisque Pr[∆k < 0] > 0 entraı̂ne Pr[Rk < 0] > 0.

7.2.2 Probabilité de ruine


Nous notons ψ (d) (κ,j) la probabilité que l’un quelconque des j
premiers exercices se soit révélé déficitaire 1 , i.e.
ψ (d) (κ,j) = Pr[∃k ∈ {1, . . . ,j} tel que Rk ≤ 0|R0 = κ].
Par convention, nous posons ψ (d) (κ,j) = 1 lorsque κ < 0 et ψ (d) (κ,0) =
0 si κ > 0. La fonction ψ (d) (κ,j) est décroissante en κ et croissante
en j, bornée supérieurement par
ψ (d) (κ) = lim ψ (d) (κ,j) = Pr[∃k tel que Rk ≤ 0|R0 = κ].
j→+∞

En raison du caractère simplifié du modèle, la probabilité de


ruine dont il est question ci-dessus ne doit pas s’envisager comme
une mesure du danger réel d’insolvabilité de la compagnie. L’ac-
tuaire testera plutôt l’efficacité de la stratégie qu’il envisage (à sa-
voir la combinaison du taux de prime et des fonds propres): si son
choix s’avère dangereux dans le modèle simplifié de de Finetti (car
la probabilité de ruine y est trop élevée), il sera très certainement
téméraire de l’utiliser en pratique. A ce titre, la probabilité de ruine
doit plutôt être considérée comme une mesure de risque.

7.2.3 Théorème de de Finetti


Plutôt que de calculer la probabilité de ruine ψ (d) (κ,j), l’actuaire
peut recourir au théorème de de Finetti, lequel fournit une majora-
tion de la probabilité de ruine lorsque la sinistralité n’est pas trop
dangereuse, i.e. lorsque la fonction génératrice des moments de S k
n’est pas constamment infinie (ce qui exclut donc le cas où S k se-
rait de loi logNormale, ou a fortiori de loi de Pareto, par exemple).
L’indice de risque γ de de Finetti est alors défini comme la solution
positive de l’équation
L∆ (t) = E[exp(−t∆k )] = 1 ⇔ MS (t) = E[exp(tSk )] = exp(tp).
1. L’exposant “(d)” rappelle qu’il s’agit de la probabilité de ruine dans le
modèle discret de de Finetti, par opposition à la probabilité de ruine dans le
modèle continu présenté plus loin, notée simplement ψ.
Chapitre 7. Equilibre à long terme des résultats de la
326 compagnie

Théorème 7.2.1 (Théorème de de Finetti). Dans le modèle à


temps discret décrit ci-dessus, les inégalités

ψ (d) (κ,j) ≤ ψ (d) (κ) ≤ exp(−γκ)

sont satisfaites.

Démonstration. Il suffit d’établir ψ (d) (κ,j) ≤ exp(−γκ), l’inégalité


pour ψ (d) (κ) s’obtenant par passage à la limite. Nous allons tra-
vailler par récurrence. Le résultat est valable pour j = 0 (avec les
conventions établies plus haut). Supposons-le acquis pour j − 1 et
établissons-le pour j. Clairement,

ψ (d) (κ,j) = Pr[ruine à l’issue du premier exercice]


+ Pr[solvable à l’issue du premier exercice
et ruiné à l’issue d’un des j − 1 suivants]
 κ+p
= Pr[S1 > κ + p] + ψ (d) (κ + p − s1 ,j − 1)dFS1 (s1 )
0
 +∞
= ψ (d) (κ + p − s1 ,j − 1)dFS1 (s1 )
0

puisque ψ (d) (κ+ p − s1 ,j − 1) = 1 lorsque κ+ p − s1 < 0. L’hypothèse


de récurrence garantit que l’inégalité

ψ (d) (κ + p − s1 ,j − 1) ≤ exp − γ(κ + p − s1 )

est vérifiée, ce qui permet d’écrire


 +∞

ψ (κ,j) ≤
(d)
exp − γ(κ + p − s1 ) dFS1 (s1 )
0
= exp(−γκ)L∆ (κ) = exp(−γκ)

par définition de γ, ce qui achève la démonstration.

La probabilité de ruine décroı̂t donc exponentiellement avec le


capital détenu à l’origine par l’assureur, si la sinistralité n’est pas
trop sévère (entendez par là, si le montant annuel des sinistres
possède une fonction génératrice des moments).

7.2.4 Application à la détermination du taux de char-


gement de sécurité
La compagnie ne peut pas se permettre de modifier chaque année
le taux de chargement et le niveau des fonds propres. Il est donc
7.2. Modèle discret de de Finetti 327

pertinent de fixer ρ et κ de manière à garantir que la probabilité de


ruine à long terme soit suffisamment petite, plutôt que d’imposer la
même condition sur la probabilité de ruine annuelle. Précisément, si
on explicite ∆k comme


n 
n
∆k = p − S k = (1 + ρi )E[Ski ] − Ski
i=1 i=1

où Ski représente la charge de sinistre générée par la police i au


cours de l’exercice k et (1 + ρi )E[Ski ] la prime nette relative à cette
police. On suppose les variables aléatoire S ki indépendantes pour
différentes valeurs de i et de k, et les S ki identiquement distribuées
à i fixé.
L’indice de risque satisfait l’équation

,
n
 
1= E exp − γ (1 + ρi )E[Ski ] − Ski ) .
i=1

une condition suffisante pour que ce produit soit égal à 1 est que
chacun des facteurs le composant vaille 1, i.e.

Mi (γ) = E[exp(γSik )] = exp γ(1 + ρi )E[Ski ]

d’où l’on tire


ln Mi (γ)
ρi = − 1.
γE[Sik ]
Si l’actuaire désire limiter la probabilité de ruine à , il peut exiger

ln 
exp(−γκ) =  ⇔ γ = −
κ
d’où l’on tire 
ln Mi − lnκ
ρi = −κ − 1.
E[Sik ] ln 
 ik
Exemple 7.2.2. Si Sik = N j=1 Xikj ∼ CPoi(λi ,F ), on a alors

MX − lnκ − 1
ρi = −κ −1
µ ln 

où µ = E[Xikj ]. On constate que ρi ne dépend pas de la fréquence de


sinistre λi propre à la police i. Dans ce cas, le taux de chargement
de sécurité est uniforme dans le portefeuille.
Chapitre 7. Equilibre à long terme des résultats de la
328 compagnie

7.3 Modèle continu de Poisson composé


7.3.1 Processus de Poisson homogène
Définition

Le processus de Poisson est un modèle mathématique qui représente


la succession des réalisations d’un type d’événements au cours du
temps, lorsque ces événements interviennent “au hasard”. Nous uti-
liserons ce modèle pour décrire les instants d’occurrence de sinistres
frappant un portefeuille d’assurances.
Soient 0 < T1 < T2 < . . . les instants où se produisent les si-
nistres, tels que
 
Pr lim Tn = +∞ = 1.
n→+∞

Posons T0 = 0. La suite des instants d’occurrence T = {T n , n =


1,2, . . .} forme un processus ponctuel, auquel on peut associer le
processus de comptage N = {Nt , t ∈ IR+ }, où Nt désigne le nombre
de sinistres touchant le portefeuille dans l’intervalle de temps [0,t],
N0 = 0. On dit que N est le processus de comptage associé au
processus ponctuel T . La fonction aléatoire t → N t est donc nulle
en 0, non-décroissante, continue à droite, à valeurs dans IN et avec
des sauts d’amplitude 1. Les processus N et T sont liés par les
relations suivantes:

Nt = sup{n ∈ IN|Tn ≤ t}
Tn = inf{t ∈ IR+ |Nt = n}
Nt = n ⇔ Tn ≤ t < Tn+1
Nt ≥ n ⇔ T n ≤ t
s < Tn ≤ t ⇔ N s < n ≤ N t .

Cette dualité entre N et T provient du faut que la description


d’un flux d’événements aléatoires peut se faire de deux manières
différentes:
1. soit on considère le nombre Nt d’événements se produisant
dans l’intervalle de temps [0,t] et on cherche à déterminer
la loi de probabilité de cette variable aléatoire discrète. Les
trajectoires du processus de comptage N sont des fonctions
en escaliers non-décroissantes. Notez que N t+∆t − Nt est le
nombre aléatoire d’événements se produisant dans l’intervalle
de temps ]t,t + ∆t] (t exclus et t + ∆t inclus).
7.3. Modèle continu de Poisson composé 329

2. soit on considère la suite des instants T i où se produisent


les événements et qui forment le processus ponctuel T . De
manière équivalente, on peut encore considérer les intervalles
de temps Wi qui séparent les instants d’apparition de deux
événements successifs, i.e.

Wi = Ti − Ti−1 , i = 1,2, . . .

On a alors
Ti = W1 + W2 + . . . + Wi .
Nous sommes à présent en mesure de définir précisément ce qu’on
entend par processus de Poisson.
Définition 7.3.1. Soit un processus de comptage N satisfaisant aux
hypothèses suivantes:
H1 quels que soient les instants 0 ≤ t 1 < t2 < . . . < tk , les variables
aléatoires Nt2 − Nt1 , Nt3 − Nt2 , . . ., Ntk − Ntk−1 sont mutuel-
lement indépendantes. En d’autres termes, les nombres d’ac-
cidents causés par l’assuré durant ]t 1 ,t2 ], ]t2 ,t3 ], . . ., ]tk−1 ,tk ]
ne s’influencent pas mutuellement.
H2 quels que soient les instants 0 ≤ t 1 < t2 et la constante positive
h, Nt2 +h −Nt1 +h a même loi que Nt2 −Nt1 . En d’autres termes,
le nombre d’accidents causés par un assuré sur une période de
temps ne dépend que de la longueur de celle-ci.
H3 quelle que soit la constante ∆t > 0,

 o(∆t) si k ≥ 2,
Pr[N∆t = k] = λ∆t + o(∆t) si k = 1,

1 − λ∆t + o(∆t) si k = 0,
où o(.) est une fonction tendant plus vite vers 0 que l’identité,
i.e. telle que limt→0 o(t)/t = 0. En d’autres termes, la probabi-
lité que l’assuré cause deux sinistres ou plus durant un inter-
valle de temps de longueur ∆t est négligeable lorsque ∆t est
suffisamment petit. Le nombre de sinistres causés dans tout
intervalle ]t,t + ∆t] suit donc approximativement une loi de
Bernoulli de paramètre λ∆t, pour autant que ∆t ≈ 0.
Sous ces conditions, on dit que le processus N est un processus de
Poisson.

Processus et loi de Poisson


Comme son nom l’indique, le processus de Poisson défini plus
haut est intimement lié à la loi du même nom. Afin de s’en convaincre,
Chapitre 7. Equilibre à long terme des résultats de la
330 compagnie

prouvons le résultat suivant


Proposition 7.3.2. Un processus de comptage N satisfaisant H1,
H2 et H3 vérifie Nt ∼ Poi(λt).

Démonstration. Définissons les fonctions p k (t) = Pr[Nt = k], t ∈


IR+ et k ∈ IN . Le résultat annoncé s’obtient facilement pour k = 0.
En effet, partant de

p0 (t + ∆t) = Pr[Nt = 0 et Nt+∆t − Nt = 0]


= Pr[Nt = 0] Pr[Nt+∆t − Nt = 0]
= p0 (t)p0 (∆t)
= p0 (t)(1 − λ∆t + o(∆t)),

on tire
p0 (t + ∆t) − p0 (t) o(∆t)
= −λp0 (t) + p0 (t).
∆t ∆t
En passant à la limite pour ∆t → 0, il vient donc
d
p0 (t) = −λp0 (t).
dt
En imposant la condition initiale p 0 (0) = 1, l’équation différentielle
ci-dessus donne
p0 (t) = exp(−λt),
ce qui coı̈ncide bien avec le résultat annoncé.
Pour k ≥ 1, le théorème des probabilités totales donne

pk (t + ∆t) = Pr[Nt+∆t = k]
= Pr[Nt+∆t = k|Nt = k] Pr[Nt = k]
+ Pr[Nt+∆t = k|Nt = k − 1] Pr[Nt = k − 1]

k
+ Pr[Nt+∆t = k|Nt = k − j] Pr[Nt = k − j]
j=2
= Pr[Nt+∆t − Nt = 0] Pr[Nt = k]
+ Pr[Nt+∆t − Nt = 1] Pr[Nt = k − 1]

k
+ Pr[Nt+∆t − Nt = j] Pr[Nt = k − j]
j=2


k
= p0 (∆t)pk (t) + p1 (∆t)pk−1 (t) + pj (∆t)pk−j (t)
j=2
= (1 − λ∆t)pk (t) + λ∆tpk−1 (t) + o(∆t),
7.3. Modèle continu de Poisson composé 331

où la dernière égalité vient de H3, l’avant dernière de H2 et l’antépénultième


de H1. Il vient alors
pk (t + ∆t) − pk (t) o(∆t)
= λ(pk−1 (t) − pk (t)) + p0 (t).
∆t ∆t
En passant à la limite pour ∆t → 0, on obtient

d
pk (t) = λ(pk−1 (t) − pk (t)), k ≥ 1.
dt
Le sytème formé par ces équations porte le nom de système de Kol-
mogorov. En multipliant la kème équation de Kolmogorov par z k et
en sommant sur k, on obtient
+∞ 
  
+∞ 
+∞
d
pk (t) z k = λz pk (t)z k − λ pk (t)z k . (7.1)
dt
k=0 k=0 k=0

Soit ϕt la fonction génératrice des probabilités associée à la loi de


probabilité {p0 (t),p1 (t),p2 (t), . . .}, i.e.


+∞
ϕt (z) = pk (t)z k = E[z Nt ], 0 ≤ z ≤ 1.
k=0

L’équation (7.1) peut alors se réécrire


ϕt (z) = λ(z − 1)ϕt (z). (7.2)
∂t
Grâce à la condition au bord ϕ0 (z) = 1, (7.2) admet pour solution

ϕt (z) = exp(λt(z − 1)),

où l’on reconnaı̂t la fonction génératrice des probabilités associée à


la loi de Poisson de moyenne λt. L’unicité de la fonction génératrice
des probabilités permet alors de conclure que N t est de loi de Poisson
de moyenne λt, soit le résultat annoncé.

Loi des instants de survenance des sinistres


Intéressons-nous tout d’abord aux intervalles de temps séparant
deux sinistres successifs. La longueur de ces intervalles est notée
Wn = Tn − Tn−1 , n = 1,2, . . ..
Propriété 7.3.3. Les variables aléatoires W 1 ,W2 , . . . sont indépendantes
et de loi Exp(λ).
Chapitre 7. Equilibre à long terme des résultats de la
332 compagnie

Démonstration. Clairement,

Pr[W1 > t] = Pr[T1 > t] = Pr[Nt = 0] = exp(−λt)

de sorte que W1 ∼ Exp(λ). Considérons à présent W 1 et W2 . Pour


s1 < t1 < s2 < t2 , on a

Pr[s1 < T1 < t1 ,s2 < T2 < t2 ]


= Pr[Ns1 = 0,Nt1 − Ns1 = 1,Ns2 − Nt1 = 0,Nt2 − Ns2 ≥ 1]
= exp(−λs1 )λ(t1 − s1 ) exp(−λ(t1 − s1 )) exp(−λ(s2 − t1 ))

1 − exp(−λ(t2 − s2 ))

= λ(t1 − s1 ) exp(−λs2 − exp(−λt2 )
 t1  t2
= λ2 exp(−λy2 )dy1 dy2 .
y1 =s1 y2 =s2

Dès lors, la densité de probabilité jointe de T 1 et T2 est

λ2 exp(−λy2 )I[0 < y1 < y2 ].

Comme T1 = W1 et T2 = W1 + W2 , on en déduit la densité jointe de


la paire (W1 ,W2 ) par changement de variable y1 = u1 et y2 = u1 +u2 ,
ce qui donne

λ2 exp(−λ(u1 + u2 ))I[u1 > 0,u2 > 0],

ce qui montre que W1 et W2 sont indépendantes de loi Exp(λ). Le


cas général se traite de manière similaire.
Corollaire 7.3.4. Ayant obtenu la loi des W n , il est alors facile
d’en déduire la loi des Tn , puisque Tn = W1 + . . . + Wn . Ainsi,
Tn ∼ Gam(n,λ), et a une densité de la forme
(λt)n−1
λ exp(−λt) I[t ≥ 0].
(n − 1)!
On parle aussi de loi d’Erlang pour Tn .

Propriété de Markov
Le processus de Poisson est sans mémoire, en ce sens que la
connaissance de son comportement antérieur à un instant donné ne
modifie en rien la prévision de son évolution ultérieure. Il s’agit de
la propriété de Markov, qui garantit que quels que soient les instants
0 < t1 < . . . < tn et les entiers 0 ≤ k1 ≤ . . . ≤ kn ,

Pr[Ntn = kn |Ntn−1 = kn−1 , . . . ,Nt1 = k1 ] = Pr[Ntn = kn |Ntn−1 = kn−1 ].


7.3. Modèle continu de Poisson composé 333

Cette idée est encore formalisée dans le résultat suivant.


Propriété 7.3.5. Soit N un processus de Poisson. Pour un instant
s > 0 fixé, définissons le processus N (s) comme
(s)
Nt = Nt+s − Ns , t ∈ IR+ .

Ce processus peut se voir comme une remise du temps à 0 en s,


et un oubli de ce qui s’est produit pour N entre les instants 0 et
s. Le nouveau processus N (s) est un processus de Poisson de même
intensité que N .

Démonstration. Montrons que les trois conditions de la définition


des processus de Poisson sont satisfaites: les accroissements du pro-
cessus N (s)
(s) (s)
Ntk − Ntk−1 = Ntk +s − Ns − (Ntk−1 +s − Ns ) = Ntk +s − Ntk−1 +s

correspondent à des accroissements du processus initial N et sont


donc indépendants et stationnaires. Il en va de même pour la loi
du nombre de sinistres dans un intervalle de temps de longeur ∆t.
Enfin, N (s) est indépendant de {Nt , t ∈ [0,s]}.

Temps d’arrêt et propriété de Markov forte


On peut aussi montrer que les propriétés enoncées ci-dessus res-
tent valables si l’instant constant s est remplacé par un instant
aléatoire, pour autant qu’il s’agisse d’un temps d’arrêt pour le pro-
cessus N . Un temps d’arrêt τ modélise un instant aléatoire qui
dépend du processus de façon non anticipante: en ayant observé
le processus jusqu’à l’instant t, on sait donc si donc si l’événément
{τ ≤ t} s’est produit ou pas. Le temps d’arrêt ne dépend que du
passé du processus, jamais de son futur.
Propriété 7.3.6. Si τ est un temps d’arrêt pour le processus N et
si on définit le processus N (τ ) comme
(τ )
Nt = Nt+τ − Nτ , t ∈ IR+ ,

alors
(i) Le nouveau processus N (τ ) est un processus de Poisson de
même intensité que N .
(ii) N (τ ) est indépendant de {Nt , t ∈ [0,τ ]}.
On pourrait ainsi considérer par exemple le temps d’arrêt T k =
inf{t ∈ IR+ |Nt ≥ k}.
Chapitre 7. Equilibre à long terme des résultats de la
334 compagnie

Processus de Poisson non-homogène


Le processus de Poisson homogène n’est qu’un modèle parmi
d’autres permettant de rendre compte de la survenance des sinistres
au cours du temps. Ainsi, si λ (·) une fonction positive sur IR + , on
peut alors généraliser la notion de processus de Poisson de la façon
suivante.
 
Définition 7.3.7. Le processus N = Nt , t ∈ IR+ est un proces-
sus de Poisson non-homogène d’intensité λ (·) si
1. N0 = 0,
2. N est un processus à accroissements indépendants,
3. quel que soit l’instant t, Nt est de loi de Poisson de moyenne

Λ (t) = λ (s) ds.
[0,t]

Pour s < t, Nt − Ns suit une loi de Poisson de moyenne Λ (t) −


Λ (s).
Exemple 7.3.8 (Processus de Weibull, ou power law pro-
cess). Il s’agit du processus de Poisson d’intensité
 β
β  · β−1 t
λ (·) = , soit Λ (t) = .
α α α
Il est bon de noter que, moyennant un changement d’unité de
temps, le problème de la ruine étudié dans le cas d’un processus de
Poisson non-homogène se ramène à celui dans le cas d’un processus
de Poisson homogène.

7.3.2 Evolution du résultat de la compagnie


Considérons une compagnie d’assurances. Celle-ci affecte en t =
0 un capital κ au portefeuille afin de garantir sa solvabilité. Les
primes sont perçues continûment par la compagnie, au taux constant
c > 0. En contrepartie des primes perçues, la compagnie doit dédommager
des sinistres qui surviennent aléatoirement au cours du temps à des
instants T1 ,T2 ,T3 , . . . qui forment un processus de Poisson d’inten-
sité λ > 0. Les montants de ces sinistres X 1 ,X2 ,X3 , . . . sont des
variables aléatoires positives, indépendantes et de même fonction de
répartition F . La charge totale des sinistres pour la compagnie sur
la période [0,t] est alors donné par

Nt
St = Xk , si Nt ≥ 1,
k=1
7.3. Modèle continu de Poisson composé 335

et St = 0, sinon; le processus {St , t ∈ IR+ } est appelé processus de


Poisson composé d’intensité λ. Clairement, S t ∼ CPoi(λt,F ).
On s’intéresse à l’évolution du résultat de la compagnie d’assu-
rance au cours du temps. Le résultat R t de la compagnie à l’instant
t est donné par
Rt = κ + ct − St , t ∈ IR+ ;

on s’intéresse au processus {Rt , t ∈ IR+ }. Une trajectoire typique


de ce processus est représentée à la Figure 7.1.

Rt

X1
X2
X3

T0=0 T1 T2 T3 t

Fig. 7.1 – Une trajectoire typique du résultat de la compagnie


{Rt , t ∈ IR+ }.

Remarque 7.3.9. Dans certains cas, il peut être utile d’autoriser


F (0) > 0, i.e. d’admettre des sinistres de montant nul. On se ramène
alors à des coûts de sinistre positifs en remplaçant λ par λF (0).

7.3.3 La probabilité de ruine sur horizon infini


Soit T l’instant de ruine de la compagnie d’assurances, i.e.

T = inf{t ≥ 0|Rt < 0}


= inf{t ≥ 0|St > κ + ct}.

Voyez la Figure 7.2. Par convention T = +∞ si R t ≥ 0 pour tout


t ≥ 0.
Définition 7.3.10. La probabilité de ruine sur horizon infini, notée
Chapitre 7. Equilibre à long terme des résultats de la
336 compagnie

ψ(.), est définie comme suit:

ψ(κ) = Pr[T < ∞|R0 = κ]


 

= Pr inf Rs < 0R0 = κ .
s≥0

Remarque 7.3.11. On peut encore définir

M = sup{St − ct}
t≥0

et représenter la probabilité de ruine sur horizon infini comme

ψ(κ) = Pr[M > κ].

La quantité ψ(κ) est importante en théorie du risque car elle


mesure le risque que la compagnie ne puisse plus faire face à ses
obligations envers les assurés. Si ψ(κ) est trop élevée, la compagnie
risque fort un jour de ne plus pouvoir dédommager les sinistres. Pour
diminuer ψ(κ), la compagnie peut :

– soit augmenter ses fonds propres de départ, i.e. augmenter κ;


– soit réclamer une prime plus élevée, i.e. augmenter c; et donc
augmenter son chargement de sécurité.

Enfin, la compagnie pourrait entreprendre une campagne de sensi-


bilisation auprès de ses assurés afin que ceux-ci adoptent un com-
portement réduisant le risque de sinistre. Ceci pourrait avoir pour
effet de diminuer λ et/ou µ. Comme mesure de la dernière chance, la
compagnie pourrait modifier les conditions de ses polices, de manière
à exclure certains sinistres. Dans ce chapitre, nous examinerons ce
qui se passe à moyen ou à long terme si la compagnie applique une
stratégie décrite par le triplet (c,λ,F ), à κ fixé. Ceci permettra de
vérifier que le taux de prime a été déterminé de façon prudente.

7.3.4 Lien avec le modèle discret de de Finetti


Clairement, la ruine ne peut survenir qu’à l’occasion de la sur-
venance d’un sinistre. Dès lors,

ψ(κ) = Pr[RTi < 0 pour un certain i|R0 = κ]


= Pr[STi − cTi > κ pour un certain i|R0 = κ]
 
i 

= Pr  ∆j > κ pour un certain iR0 = κ
j=1
7.3. Modèle continu de Poisson composé 337

Rt

T1 T2 T3=T t

Fig. 7.2 – L’instant de ruine T du processus {R t , t ∈ IR+ }.

où les variables aléatoires ∆1 ,∆2 , . . . définies par

∆j = Xj − c(Tj − Tj−1 )

sont indépendantes et identiquement distribuées. Ceci permet de


faire le lien avec la théorie des promenades aléatoires et avec le
modèle discret de de Finetti.

7.3.5 Nécessité d’un chargement de sécurité pour éviter


une ruine certaine
On note µ = E[Xk ] le coût moyen des sinistres, supposé fini. De
plus, on fait l’hypothèse d’un chargement de sécurité positif, c’est-
à-dire que l’inégalité
c > λµ

est supposée satisfaite. Ainsi, le taux de prime c est supposé supérieur


à la charge moyenne λµ des sinistres par unité de temps (prime
“pure” par unité de temps). On appelle c − λµ > 0 le chargement
de sécurité.
Nous montrons dans le résultat suivant que l’équilibre à long
terme des opérations de l’assureur est impossible s’il n’inclut pas un
chargement de sécurité dans le taux de prime c.
Proposition 7.3.12. Si c > λµ, alors ψ(κ) < 1 quel que soit κ ≥ 0.
Si c ≤ λµ, alors ψ(κ) = 1 quel que soit κ ≥ 0.
Chapitre 7. Equilibre à long terme des résultats de la
338 compagnie

Démonstration. Nous avons


 
St − ct
Pr lim = λµ − c = 1.
t→+∞ t

En effet, en supposant t entier, on voit facilement que S t a même loi


que Z1 + Z2 + . . . Zt où les Zt sont indépendants de loi CPoi(1,F ).
La loi forte des grands nombres assure alors que
 
St
Pr lim = λµ = 1.
t→+∞ t

Ainsi, lorsque c < λµ, St −ct diverge vers +∞ d’où Pr[M = +∞] = 1
et ψ(κ) = 1 quel que soit κ. Au contraire, si c > λµ, S t − ct diverge
vers −∞ et Pr[M < +∞] = 1, ce qui garantit ψ(κ) < 1.

7.3.6 Détermination de la probabilité de ruine sur ho-


rizon infini: Formule de Pollaczeck-Khinchine-
Beekman
Nous allons à présent obtenir une formule explicite pour la pro-
babilité de ruine. Définissons la probabilité de non-ruine comme

ψ(κ) = 1 − ψ(κ), κ ≥ 0.

Rappelons que F désigne la fonction de répartition commune des


montants de sinistre Xk .
Théorème 7.3.13. La probabilité de ruine ψ est donnée par
 
∞  n  
λµ λµ
ψ(κ) = 1− 1 − F̃ ∗(n) (u)
c c
n=0

où  x
F (y)
F̃ (x) = dy, x > 0.
y=0 µ

Démonstration. En conditionnant par rapport à l’instant T 1 de sur-


venance du premier sinistre ainsi que par rapport à son montant X 1 ,
il vient
 ∞  κ+ct
ψ(κ) = λ exp(−λt) ψ(κ + ct − y)dF (y)dt
t=0 y=0
  
+∞
z−κ z
dz
= λ exp −λ ψ(z − y)dF (y)
z=κ c y=0 c
7.3. Modèle continu de Poisson composé 339

où la dernière expression est obtenue en posant z = κ + ct.


On voit donc que ψ apparaı̂t comme une fonction continue et

dérivable; la dérivée ψ de ψ est donnée par

 λ κ
ψ (κ) = − ψ(κ − y)dF (y)
c y=0
   z
λ +∞ λ z−κ
+ exp −λ ψ(z − y)dF (y)dz.
c z=κ c c y=0

Grâce à la formule classique


 ξ2 (u)

f (z,u)dz
∂u z=ξ1 (u)
 ξ2 (u)  
 ∂
= ξ2 (u)f (ξ2 (u),u) − ξ1 (u)f (ξ1 (u),u) + f (z,u) dz
z=ξ1 (u) ∂u
on obtient l’équation intégro-différentielle suivante pour ψ:

 λ λ κ
ψ (κ) = ψ(κ) − ψ(κ − y)dF (y).
c c y=0
En intégrant les deux membres de cette équation entre 0 et t, il vient
   κ
λ t λ t
ψ(t) − ψ(0) = ψ(κ)dκ − ψ(κ − y)dF (y)dκ
c κ=0 c κ=0 y=0
En permutant les intégrales, on peut écrire
   t
λ t λ t
ψ(t) − ψ(0) = ψ(κ)dκ − ψ(κ − y)dκ dF (y).
c κ=0 c y=0 κ=y
Une intégration par parties mène à
ψ(t) − ψ(0)
   t 
λ t λ t t
= ψ(κ)dκ − F (y) ψ(κ − y)dκ + ψ(t − y)F (y)dy
c κ=0 c κ=y 0 y=0
 
λ t λ t
= ψ(κ)dκ − ψ(t − y)F (y)dy.
c κ=0 c y=0

Enfin, il vient
 t  t
λ
ψ(t) = ψ(0) + ψ(κ)dκ − ψ(t − y)F (y)dy
c κ=0 y=0
 t  t
λ
= ψ(0) + ψ(t − y)dy − ψ(t − y)F (y)dy
c y=0 y=0
 t
λ
= ψ(0) + (1 − F (y))ψ(t − y)dy.
c y=0
Chapitre 7. Equilibre à long terme des résultats de la
340 compagnie

Clairement ψ(κ) → 1 lorsque κ → +∞ d’où



λ ∞   λµ
1 = ψ(0) + 1 − F (y) dy = 1 +