Vous êtes sur la page 1sur 394

Modlisation des distributions

de sinistres avec R

Modlisation des distributions


de sinistres avec R

Vincent Goulet
Professeur titulaire | cole dactuariat | Universit Laval

Notes de cours | Code R | Exercices dition 2013

2013 Vincent Goulet

Cette cration est mise disposition selon le contrat Paternit-Partage lidentique


2.5 Canada de Creative Commons. En vertu de ce contrat, vous tes libre de :

x partager reproduire, distribuer et communiquer luvre ;


x remixer adapter luvre ;
x utiliser cette uvre des fins commerciales.
Selon les conditions suivantes :
Attribution Vous devez attribuer luvre de la manire indique par
lauteur de luvre ou le titulaire des droits (mais pas dune manire qui
suggrerait quils vous soutiennent ou approuvent votre utilisation de
luvre).
Partage lidentique Si vous modifiez, transformez ou adaptez cette
uvre, vous navez le droit de distribuer votre cration que sous une
licence identique ou similaire celle-ci.
Code source
Le code source LATEX et R de ce document est disponible ladresse https://svn.
fsg.ulaval.ca/svn-pub/vgoulet/documents/distributions_sinistres/ ou en
communiquant directement avec lauteur.
Couverture
Tornade de catgorie F5 lapproche de la ville de Elie, Manitoba, le 22 juin 2007.
Crdit photo : Justin1569 via Wikimedia Commons
Infographie : Marie-Pier Lalibert, Vronique Tardif

Introduction
Ce document traite de modlisation statistique des montants de sinistres en
assurance de dommages. Il sagit de mes notes du cours Mathmatiques actuarielles
IARD I offert lcole dactuariat de lUniversit Laval auxquelles jai intgr du
code informatique ainsi que le recueil dexercices de Cossette et collab. (2009).
Les notes et les exercices de cet ouvrage ont atteint un niveau de maturit
enviable. Si cest le cas, cest parce que jai eu le privilge de btir sur du matriel
de grande qualit dvelopp au fil des ans par les professeurs Hlne Cossette,
Franois Dufresne, Jos Garrido, Michel Jacques et Jacques Rioux, ainsi que par le
charg de cours Mathieu Pigeon alors quil tudiait la matrise en actuariat au
milieu des annes 2000.
La matire est divise en sept chapitres. Le premier est un chapitre de rappels des notions de base en analyse, en probabilit et en statistique. Le chapitre 2
traite des fondements de la modlisation en assurance de dommages, en particulier le traitement mathmatique des franchises, limite suprieure et coassurance,
ainsi que de leffet de linflation sur la frquence et la svrit des sinistres. Les
aspects plus statistiques apparaissent au chapitre 3 avec la modlisation non paramtrique. Le chapitre 4 tudie les principales distributions utilises en assurance
de dommages et la cration de nouvelles distributions partir des lois usuelles.
Les chapitres 5 et 6 portent quant eux sur lestimation paramtrique et les tests
dadquation des modles. Enfin, le chapitre 7 propose une brve incursion dans la
modlisation des distributions de frquence des sinistres.
Les termes anglais ordinary deductible et franchise deductible utiliss dans les
textes de rfrence usuels en actuariat ont pos quelques soucis de traduction. Pour
le premier, jutilise lexpression franchise forfaitaire recommande par Bguin
(1990). Pour le second terme, beaucoup moins rpandu, jai opt pour lexpression
franchise atteinte suggre, entre autres, dans Charbonnier (2004).
La prsentation fait une large place aux considrations numriques auxquelles
tout actuaire praticien se retrouvera rapidement confront. Parce que jestime quil
sagit du meilleur outil aujourdhui disponible pour faire lanalyse, le traitement et la
modlisation de donnes de sinistres, les exemples et illustrations sont entirement
v

vi

Introduction
raliss dans lenvironnement statistique R (R Development Core Team, 2013). Aux
fonctionnalits de base du systme R pour nos fins sajoutent celles du package
actuar (Dutang et collab., 2008). Dailleurs, plusieurs fonctions du package ont t
dveloppes lorigine spcifiquement pour ce matriel.
Ltude du document implique quelques allers-retours entre le texte et les
sections de code informatique prsentes la fin de certains chapitre. Les sauts
vers ces sections sont clairement indiqus dans le texte par des mentions mises en
vidence par le symbole .
Chaque chapitre comporte des exercices. Les rponses de ceux-ci se trouvent
la fin de chacun des chapitres, alors que les solutions compltes sont regroupes
lannexe E. En consultation lectronique, le numro dun exercice est un hyperlien
vers sa solution, et vice versa.
On trouvera galement la fin de chaque chapitre (sauf le premier) une liste
non exhaustive dexercices proposs dans Klugman et collab. (2012a). Des solutions
de ces exercices sont offertes dans Klugman et collab. (2012b).
Lannexe A prsente la paramtrisation des lois de probabilit continues et
discrtes utilise dans les exercices. Linformation qui sy trouve est en plusieurs
points similaire celle des annexes A et B de Klugman et collab. (2008, 2012a),
mais la paramtrisation des lois est dans certains cas diffrente. Le lecteur est donc
fortement invit la consulter.
Lannexe B explique comment configurer R pour faciliter linstallation et ladministration de packages externes. Enfin, les annexes C et D offrent des tables de
quantiles des lois normale et khi carr.
Je remercie davance les lecteurs qui voudront bien me faire part de toute erreur
ou omission dans les notes, les exercices ou leurs solutions.
Vincent Goulet
Qubec, septembre 2013

Table des matires


Introduction
1

Rappels danalyse, de probabilit et de statistique


1.1 Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Dveloppement en sries . . . . . . . . . . . . . . . . . . . .
1.3 Variable alatoire . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Densits conjointes, marginales et conditionnelles . . . .
1.5 Concepts de convergence . . . . . . . . . . . . . . . . . . .
1.6 Transformation de variables alatoires . . . . . . . . . . . .
1.7 chantillon alatoire . . . . . . . . . . . . . . . . . . . . . .
1.8 Quantiles et statistiques dordre . . . . . . . . . . . . . . . .
1.9 Estimation : introduction et proprits . . . . . . . . . . . .
1.10 Estimation : mthodes . . . . . . . . . . . . . . . . . . . . .
1.11 Proprits de lestimateur du maximum de vraisemblance
1.12 Estimation par intervalles, ou intervalles de confiance . .
1.13 Tests dhypothses . . . . . . . . . . . . . . . . . . . . . . . .
1.14 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modlisation en assurance IARD
2.1 Processus de modlisation . . . . . . . . . . . .
2.2 Donnes . . . . . . . . . . . . . . . . . . . . . .
2.3 Importation de donnes dans R . . . . . . . . .
2.4 Variables alatoires pour donnes incompltes
2.5 Franchises . . . . . . . . . . . . . . . . . . . . .
2.6 Esprance limite . . . . . . . . . . . . . . . . .
2.7 Esprance rsiduelle . . . . . . . . . . . . . . .
2.8 Rapport dlimination de perte . . . . . . . . .
2.9 Limite suprieure . . . . . . . . . . . . . . . . .
2.10 Coassurance . . . . . . . . . . . . . . . . . . . .
vii

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

1
2
6
9
16
17
19
29
33
35
40
42
43
45
49

.
.
.
.
.
.
.
.
.
.

55
56
56
60
62
63
68
73
74
76
80

viii

Table des matires


2.11
2.12
2.13
2.14
3

Inflation . . . . . . . . . . . . . . . . . . . .
Franchise, limite, coassurance et inflation
Code informatique . . . . . . . . . . . . .
Exercices . . . . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

81
87
87
90

Modlisation non paramtrique


3.1 Statistiques descriptives . . . . . . . . . . . . . . . . .
3.2 Fonctions de rpartition et de probabilit empiriques
3.3 Estimateurs de la fonction de survie . . . . . . . . . .
3.4 Estimateur par noyaux . . . . . . . . . . . . . . . . . .
3.5 Statistiques descriptives empiriques . . . . . . . . . .
3.6 Code informatique . . . . . . . . . . . . . . . . . . . .
3.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

97
98
100
111
125
128
133
141

.
.
.
.
.
.
.

149
149
153
155
156
167
167
173

.
.
.
.
.
.
.
.

181
182
184
185
191
203
212
216
222

.
.
.
.
.

233
233
238
247
248
250

Modles paramtriques potentiels


4.1 Famille gamma . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Famille bta . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Familles et paramtres dchelle . . . . . . . . . . . . . . . .
4.4 Cration de distributions partir de distributions connues .
4.5 Fonctions R pour les lois de probabilit . . . . . . . . . . . .
4.6 Valeurs extrmes . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Modlisation paramtrique
5.1 Mthode des moments . . . . . . . . . . . . . . . . . . . . .
5.2 Mthode des quantiles . . . . . . . . . . . . . . . . . . . . .
5.3 Mthode du maximum de vraisemblance . . . . . . . . . .
5.4 Maximisation numrique de la fonction de vraisemblance
5.5 Estimation par intervalle . . . . . . . . . . . . . . . . . . . .
5.6 Estimation par distance minimale . . . . . . . . . . . . . .
5.7 Code informatique . . . . . . . . . . . . . . . . . . . . . . .
5.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tests dadquation
6.1 Tests graphiques . .
6.2 Tests statistiques . .
6.3 Choix dun modle
6.4 Code informatique
6.5 Exercices . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

Table des matires

ix

Modles de frquence
7.1 Fonction gnratrice des probabilits
7.2 Principales distributions discrtes . .
7.3 Estimation et tests . . . . . . . . . . . .
7.4 Familles (a, b, 0) et (a, b, 1) . . . . . . .
7.5 Exercices . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

255
255
256
261
263
264

A Paramtrisation des lois de probabilit


A.1 Famille bta transforme . . . . . . . . . . .
A.2 Famille gamma transforme . . . . . . . . .
A.3 Autres distributions continues . . . . . . . .
A.4 Distributions discrtes de la famille (a, b, 0)

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

269
270
273
276
278

.
.
.
.
.

.
.
.
.
.

B Installation de packages dans R

281

C Table de quantiles de la loi normale

283

D Table de quantiles de la loi khi carr

285

Solutions des exercices


Chapitre 1 . . . . . . . .
Chapitre 2 . . . . . . . .
Chapitre 3 . . . . . . . .
Chapitre 4 . . . . . . . .
Chapitre 5 . . . . . . . .
Chapitre 6 . . . . . . . .
Chapitre 7 . . . . . . . .

Bibliographie

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

287
287
300
313
333
345
364
371
379

1 Rappels danalyse, de probabilit


et de statistique

Objectifs du chapitre
x Calculer la limite dune fonction.
x Calculer le dveloppement en srie de Taylor dune fonction et son intervalle de
convergence.

x Dfinir et calculer les principales quantits lies une variable alatoire (densit,

x
x
x
x
x
x

fonction de rpartition, esprance, densits conjointe et marginale, fonctions gnratrices des moments et des probabilits).
Dterminer la loi de la transformation dune variable alatoire.
Dfinir, calculer et dterminer la distribution des principales quantits lies un
chantillon alatoire (moyenne, variance, statistiques dordre).
Dfinir les principales caractristiques dun estimateur (biais, efficacit, convergence, exhaustivit).
Dfinir, calculer et tablir les caractristiques des estimateurs ponctuels des moments et du maximum de vraisemblance.
Dfinir et dterminer un intervalle de confiance pour une quantit.
tablir un test dhypothses pour une quantit donne. Dfinir et calculer les principales quantits lies au test (hypothses nulle et alternative, erreur de type I, erreur
de type II, niveau de confiance, valeur p).

Le but de ce chapitre est de revoir certaines notions danalyse, de probabilit et


de statistique importantes pour la suite. Il est possible que certaines de ces notions
soient moins familires au lecteur que dautres. Nous reviendrons en temps et lieu
sur les lments les plus complexes.
Pour de plus amples dtails, consulter Hogg et collab. (2005), Klugman et collab.
(2012a, chapitres 2, 3 et 10), Klugman et collab. (2008, chapitres 2, 3 et 12), Klugman
et collab. (2004, chapitre 2) ou tout autre bon livre de statistique mathmatique.
1

Rappels danalyse, de probabilit et de statistique

1.1

Limites

Cette section rappelle simplement deux rsultats importants en analyse mathmatique.

1.1.1

Thorme du sandwich

Parfois, lorsquil nest pas possible de calculer directement la limite dune


fonction f (x), on peut la calculer indirectement en utilisant le thorme dit du
sandwich .
Thorme 1.1. Soient f (x), g (x) et h(x) des fonctions et la relation g (x) f (x)
h(x) valide pour tout x dans un intervalle ouvert contenant le point c, sauf peut-tre
au point x = c lui-mme. Si
lim g (x) = lim h(x) = L,

xc

xc

alors
lim f (x) = L.

xc

Dmonstration. On commence par traiter le cas o la limite est approche par la


droite. Soit
lim+ g (x) = lim+ h(x) = L.
xc

xc

Alors, pour tout > 0, il existe > 0 tel que pour tout x, lingalit c < x < c +
implique
L < g (x) < L +
et
L < h(x) < L + .
Ces deux ingalits, combines g (x) f (x) h(x), donnent
L < g (x) f (x) h(x) < L +
L < f (x) < L +
< f (x) L < .
On peut donc en conclure que, pour tout x, lingalit c < x < c + implique
| f (x) L| < .

1.1. Limites

Comme on peut prendre aussi prs de 0 quon le dsire, on peut en conclure que
lim f (x) = L.

xc +

Les cas o la limite est approche par la gauche et par les deux cts se traitent de
la mme faon.
Exemple 1.1. Soit la relation
1

x2
x sin(x)
<
<1
6
2 2 cos(x)

pour toutes les valeurs de x proches de 0. On souhaite valuer


lim

x sin(x)

x0 2 2 cos(x)

Or, par le thorme prcdent, limx0 1 = 1,


lim 1

x0

et donc

x2
=1
6

x sin(x)
= 1.
x0 2 2 cos(x)
lim

La figure 1.1 prsente le graphique de la fonction et des deux bornes.

1.1.2

Rgle de lHpital

La rgle de lHpital permet de raliser des calculs de limites lorsque des formes
0
indtermines (
, 0 , 0 , etc.) sont rencontres.
Thorme 1.2. Soit f (x) et g (x) deux fonctions diffrentiables sur un intervalle
ouvert I , sauf ventuellement en un point x = c. On suppose que, sur I , on a
g (x) 6= 0 pour x 6= c. Si, dans ces conditions, limxc f (x) = limxc g (x) = 0, ou encore
l i m xc f (x) = et limxc g (x) = , alors la limite de
f (x)
g (x)
peut tre calcule laide de la rgle
lim

xc

si la dernire limite existe.

f (x)
f 0 (x)
= lim 0
g (x) xc g (x)

Rappels danalyse, de probabilit et de statistique

0.85
0.65

0.75

f(x)

0.95

F IG . 1.1: Fonction f (x) = x sin(x)/(22 cos(x)) (trait plein) et les bornes y = 1x 2 /6


et y = 1 (traits briss)

Exemple 1.2. Considrer


2x 2 5x + 2
.
x2
x2 4
lim

En utilisant la procdure habituelle, on obtient la forme indtermine 00 . On voit


par contre la figure 1.2 que la limite semble exister en ce point. En utilisant la
rgle de lHpital, on obtient
4x 5
2x 2 5x + 2
= lim
2
x2
x2
x 4
2x
3
= .
4
lim

0.5

0.0

f(x)

0.5

1.0

1.1. Limites

0.0

0.5

1.0

1.5

2.0

2.5

3.0

F IG . 1.2: Fonction f (x) = (2x 2 5x + 2)/(x 2 4) autour du point x = 2

Exemple 1.3. La limite


lim x ln(x)

x0+

rsulte en une indtermination 0 . On voit par contre la figure 1.3 que la


limite droite semble exister en ce point. Il suffit de procder comme suit :
ln(x)
1/x
1/x
= lim+
x0 1/x 2
= lim+ x

lim x ln(x) = lim+

x0+

x0

x0

= 0.

Rappels danalyse, de probabilit et de statistique

0.5
0.0

f(x)

1.0

0.0

0.5

1.0

1.5

2.0

F IG . 1.3: Fonction f (x) = x ln(x) autour du point x = 0

1.2

Dveloppement en sries

On appelle srie de puissances une srie de la forme

a n (x c)n = a 0 + a 1 (x c) + a 2 (x c)2 + . . .

n=0

o x est une variable et o les a i et c sont des constantes. Le but de cette section est
dexprimer certaines fonctions sous la forme de sries de puissances. Ces dernires
sont utilises, entre autres, par les calculatrices pour valuer des fonctions trigonomtriques. Elles peuvent galement tre utilises pour calculer numriquement
certaines intgrales dfinies difficiles valuer autrement.

1.2. Dveloppement en sries

1.2.1

Srie de Taylor

Soit une fonction f (x) que lon souhaite dvelopper autour du point x = c. La
fonction f (x) doit tre diffrentiable indfiniment en x = c. On pose alors
f (x) = a 0 + a 1 (x c) + a 2 (x c)2 + a 3 (x c)3 + . . .
On calcule ensuite les drives :
f 0 (x) = a 1 + 2a 2 (x c) + 3a 3 (x c)2 + 4a 4 (x c)3 + . . .
f 00 (x) = 2a 2 + 6a 3 (x c) + 12a 4 (x c)2 + . . .
f 000 (x) = 6a 3 + 24a 4 (x c) + . . . ,
f 00 (c)

f 000 (c)

do on trouve que a 0 = f (c), a 1 = f 0 (c), a 2 = 2! , a 3 = 3! , et ainsi de suite. La


formule gnrale pour la srie, ou le dveloppement, de Taylor est alors
f (x) =

f (n) (c)
X
(x c)n .
n!
n=0

Exemple 1.4. On calcule le dveloppement en srie de Taylor de la fonction ln(x)


autour du point x = 1. On a f (x) = ln(x), f (1) = 0, f 0 (x) = 1/x, f 0 (1) = 1, f 00 (x) =
1/x 2 , f 00 (1) = 1, f 000 (x) = 2/x 3 , f 000 (1) = 2, f (4) (x) = 6/x 4 , f (4) (1) = 6, et ainsi
de suite. On obtient donc, pour c = 1,
(x 1)2 2(x 1)3 6(x 1)4
+

+...
2
6
24

X
(x 1)n
(1)n+1
=
.
n
n=1

ln(x) = (x 1)

Il est noter que lorsque c = 0, le dveloppement de Taylor porte parfois le nom


de dveloppement de Maclaurin.

1.2.2

Intervalle de convergence

Lorsque que lon attribue la variable x dune srie une valeur numrique, il
devient alors possible de dterminer si la srie diverge ou converge. On appelle
intervalle de convergence dune srie de puissances lensemble des valeurs de x
pour lesquelles la srie converge.
Pour dterminer cet intervalle, on value

u n+1
|u n+1 |
= |H |
lim
= lim
n |u n |
n u n
et on utilise comme critre

Rappels danalyse, de probabilit et de statistique

x si |H | < 1, la srie converge ;


x si |H | > 1, la srie diverge ; et
x si |H | = 1, on ne peut rien conclure.
Exemple 1.5. Soit la srie entire

xn = 1 + x + x2 + x3 + x4 + . . .

n=0

On a

u n+1
|u n+1 |

lim
= lim
n |u n |
n u n
n+1
x

= lim n
n x

= lim |x|
n

= |x|.
Il faut vrifier pour x = 1 et x = 1. On a
11+11+...
qui diverge et
1+1+1+1+...
qui diverge galement. Lintervalle de convergence est donc (1, 1).
On conclut cette section avec trois thormes (prsents sans dmonstration)
concernant les dveloppements en sries de puissances.
Thorme 1.3. Une srie de puissances est une fonction continue lintrieur de son
intervalle de convergence.
Thorme 1.4. Une srie de puissance peut tre drive terme par terme lintrieur
de son intervalle de convergence.
Thorme 1.5. Un srie de puissances peut tre intgre terme par terme lintrieur
de son intervalle de convergence.
Exemple 1.6. On a vu que lintervalle de convergence de la srie
f (x) = 1 + x + x 2 + x 3 + x 4 + . . .

1.3. Variable alatoire

Exprience

Variable alatoire

Lancer de deux ds
Lancer de 25 pices de monnaie
crasement dun avion

Somme des faces suprieures


Nombre de faces
Montant des dgts au sol

TAB. 1.1: Exemples de variables alatoires

est (1, 1). On a alors, lintrieur de cet intervalle que


Z 1/2
g (x) =
f (x) d x
0
Z 1/2
Z 1/2
Z 1/2
Z
2
=
1dx +
x dx +
x dx +
0

1/2
0

x3 d x + . . .

x2 x3
+
+ . . . |1/2
0
2
3
1 1 1
+....
= + +
2 8 24

=x+

1.3

Variable alatoire

Soit X , une variable alatoire. Il sagit dune fonction qui, chaque lment
de lespace fondamental dune exprience alatoire, associe un nombre rel. Le
tableau 1.1 prsente quelques exemples de variables alatoires.

1.3.1

Fonction de rpartition

Soit F (x), la fonction de rpartition de la variable alatoire X . Il sagit de la


probabilit que X soit plus petite ou gale une valeur donne, cest--dire
F (x) = Pr[X x].
De manire formelle, la fonction F (x) est une fonction de rpartition si et
seulement si les trois conditions suivantes sont respectes :
1. F (x) est non-dcroissante ;
2. F (x) est continue par la droite, cest--dire que pour tout point x 0 , la valeur
limite de F (x) lorsque x sapproche de x 0 par la droite est F (x 0 ) ;
3. limx F (x) = 0 et limx F (x) = 1.
La figure 1.4 prsente un exemple de fonction de rpartition.

Rappels danalyse, de probabilit et de statistique

0.0

0.2

0.4

F(x)

0.6

0.8

1.0

10

F IG . 1.4: Fonction de rpartition

1.3.2

Fonction de survie

Soit S(x), la fonction de survie de la variable alatoire X . Il sagit de la probabilit


que X soit plus grande quune valeur donne, cest--dire
S(x) = 1 F (x) = Pr[X > x].
La fonction de survie doit satisfaire les trois conditions suivantes :
1. S(x) est non-croissante ;
2. S(x) est continue par la droite ;
3. limx S(x) = 1 et limx S(x) = 0.
De manire gnrale, la fonction de survie est le complment lunit de la
fonction de rpartition. La figure 1.5 prsente un exemple de fonction de survie.

11

0.0

0.2

0.4

S(x)

0.6

0.8

1.0

1.3. Variable alatoire

F IG . 1.5: Fonction de survie

1.3.3

Densit et fonction de probabilit

Soit f (x), la fonction de densit de probabilit (f.d.p.) de la variable alatoire


continue X . De manire formelle, f (x) est une densit de probabilit si et seulement
si elle satisfait les deux conditions suivantes :
1. f (x) 0 pour toutes les valeurs de X appartenant ;
R
2. f (x) d x = 1.
Pour les variables alatoires discrtes, on dfinit plutt Pr[X = x], la fonction de
masse de probabilit (f.m.p.). La f.m.p. doit satisfaire les deux conditions suivantes :
1. Pr[X = x] 0 pour toutes les valeurs de X appartenant ; et
P
2. Pr[X = x] = 1.
Dans le cas continu, la fonction de densit est la drive de la fonction de rpartition.
La figure 1.6 prsente un exemple de fonction de densit de probabilit.

Rappels danalyse, de probabilit et de statistique

0.4
0.0

0.2

f(x)

0.6

12

F IG . 1.6: Fonction de densit de probabilit

1.3.4

Taux dincidence

Le taux dincidence (hazard rate en anglais) h(x) (ou (x)) dune variable alatoire X est dfini comme le ratio de la densit et de la fonction de survie, cest--dire
f (x)
S(x)
S 0 (x)
=
S(x)
d
=
ln S(x).
dx

h(x) =

Le taux dincidence porte aussi parfois le nom de force de mortalit et est alors
gnralement not (x).
La fonction de survie peut tre retrouve partir du taux dincidence :
S(x) = e

Rx
0

h(y) d y

1.3. Variable alatoire

13

Dautre part, le taux dincidence cumul de la variable alatoire X est dfinit


comme
Z x
H (x) =
h(t ) d t

= ln S(x).

1.3.5

Esprance et moments

Lesprance dune variable alatoire est une mesure de sa tendance centrale.


Pour une variable alatoire continue, on a
Z
g (x) f (x) d x,
E [g (X )] =

et pour une variable alatoire discrte


E [g (X )] =

g (x)Pr[X = x].

x=

Cette dernire expression peut tre vue comme une moyenne pondre des valeurs
de g (x). Si E [|g (X )|] = , on dit que E [g (X )] nexiste pas.
Le thorme suivant nonce quelques proprits importantes de loprateur
esprance.
Thorme 1.6. Soit X une variable alatoire, a, b et c des constantes et g 1 (x) et g 2 (x)
deux fonctions quelconques. On a alors les proprits suivantes :
i)

E [] est un oprateur linaire :


E [ag 1 (X ) + bg 2 (X ) + c] = aE [g 1 (X )] + bE [g 2 (X )] + c.

ii)

Si g 1 (x) 0 pour tout x, alors E [g 1 (X )] 0.

iii)

Si g 1 (x) g 2 (x) pour tout x, alors E [g 1 (X )] E [g 2 (X )].

iv)

Si a g 1 (x) b pour tout x, alors a E [g 1 (X )] b.

On nomme, lorsquil existe, moment dordre k de la variable alatoire X lesprance de cette dernire leve la puissance k. On a
0k = E [X k ]
Z
=
x k f (x) d x

14

Rappels danalyse, de probabilit et de statistique


ou
0k =

x k Pr[X = x].

x=

Le moment dordre 1 est la moyenne de la variable alatoire. On note souvent


simplement 01 = = E [X ].
De mme, on nomme, lorsquil existe, moment central dordre k de la variable
alatoire lesprance de la diffrence entre cette dernire et la moyenne, leve
la puissance k. Il sagit donc dune mesure de la dispersion de X autour de son
esprance. On a
k = E [(X E [X ])k ]
Z
= (x )k f (x) d x

ou
=

(x )k Pr[X = x].

Le moment central dordre 2 est la variance : 2 = E [(X )2 ] = Var[X ]. Si X est


une variable alatoire dont la variance est finie et a et b sont des constantes, alors
Var[a X + b] = a 2 Var[X ]
Les moments et moments centraux sont relis entre eux. Par exemple,
2 = E [(X )2 ]
= E [X 2 ] 2E [X ] + 2
= 02 2 .
On nomme coefficient de variation dune variable alatoire X le rapport de la
racine carre du moment central dordre 2 sur le moment dordre 1 :
p
1/2
Var[X ] 2
CV(X ) =
=
.
E [X ]

On nomme coefficient dasymtrie (skewness) la mesure


1 (X ) =

E [(X )3 ]
Var[X ]3/2

3
3/2
2

1.3. Variable alatoire

15

Si la distribution dune variable alatoire est symtrique autour de sa moyenne,


alors tous les moments centraux impairs sont nuls et, a fortiori, 1 = 0. En assurance
IARD, on travaille trs majoritairement avec des distributions dont le coefficient
dasymtrie est positif, cest--dire dont la queue droite est plus lourde que la queue
gauche.
Le coefficient daplatissement, ou coefficient dexcs (kurtosis), est une mesure
de lpaisseur des queues dune distribution. Le coefficient est dfinit ainsi :

2 (X ) =

E [(X )4 ] 4
= 2.
Var[X ]2
2

La valeur de rfrence est la loi normale, dont le coefficient daplatissement vaut 3.


Si le coefficient dune distribution est suprieur 3, les queues de celle-ci sont plus
lourde que la loi normale.
Remarque. Certains ouvrages dfinissent plutt le coefficient daplatissement de
faon attribuer un coefficient nul la loi normale : 2 (X ) = 4 /22 3.

1.3.6

Fonction gnratrice des moments

Pour une variable alatoire X , la fonction gnratrice des moments est donne
par
M X (t ) = E [e t X ]
lorsque lesprance existe (ce qui nest pas le cas pour de nombreuses distributions.
La fonction porte ce nom parce que sa k e drive value en 0 est gale au k e
moment de la variable alatoire. En effet,

M X(k) (t ) =

dk

E [e t X ]
d"t k
#
dk tX
e
=E
dtk
= E [X k e t X ],

do M X(k) (0) = E [X k ].

16

Rappels danalyse, de probabilit et de statistique

1.3.7

Fonction gnratrice des probabilits

La fonction gnratrice des probabilits dune variable alatoire X discrte est


dfinie ainsi :
P X (t ) = E [t X ]

X
=
t x Pr[X = x]
x=0

= Pr[X = 0] + Pr[X = 1]t + Pr[X = 2]t 2 + . . .


En comparant cette dernire identit au dveloppement de Taylor de la fonction P ,
on observe que
Pr[X = k]
,
P X(k) (0) =
k!
do le nom de la fonction.
Thorme 1.7. Si deux variables alatoires X et Y ont la mme fonction gnratrice
des probabilits, alors elles ont la mme loi.
Exemple 1.7. La fonction gnratrice des probabilits dune variable alatoire X
obissant une distribution de Poisson de paramtre est
P X (t ) = E [t X ]

X
x
=
e t x
x!
x=0
(t )x
X
= e
x=0 x!
= e e t
= e (t 1) .

1.4

Densits conjointes, marginales et conditionnelles

Soient X et Y deux variables alatoires. Leur densit conjointe est note f X Y (x, y)
dans le cas continu et Pr[X = x, Y = y] dans le cas discret.
Dans le cas continu, les densits marginales sont
Z

f X (x) =

f (x, y) d y

1.5. Concepts de convergence

17

et

f Y (y) =

f (x, y) d x.

Les densits conditionnelles sont


f X |Y (x|y) =

f X Y (x, y)
f Y (y)

f Y |X (y|x) =

f X Y (x, y)
.
f X (x)

et

La rgle de Bayes permet dexprimer la densit de X |Y en fonction de celle de Y |X :


f X |Y (x|y) =

f Y |X (y|x) f X (x)
f Y (y)

Enfin, la loi des probabilits totales permet de calculer une densit marginale
partir dune distribution conditionnelle :
Z
f X (x) =
f X |Y (x|y) f Y (y) d y.

Les quations ci-dessus sont similaires dans le cas discret.


Dfinition 1.1 (Loi normale multivarie). Soit X 1 , . . . , X n des variables alatoires
obissant des lois normales avec i = E [X i ] et i j = Cov(X i , X j ). On note x =
{x 1 , . . . , x n }, = {1 , . . . , n } et = [i j ]nn . Le vecteur alatoire X = {X 1 , . . . , X n } a
une densit normale multivarie si, et seulement si,
f X 1 ,...,X n (x 1 , . . . , x n ) =

1.5

e (x)
0

(2)n/2 ||1/2

(x)/2

Concepts de convergence

La notion de convergence en thorie des probabilits sapparente celle de


convergence dune srie de puissance. Cependant, il y plusieurs faons de dfinir
la convergence dune suite de variables alatoires. Nous en prsentons trois dans
les sous-sections suivantes. Mais, tout dabord, rappelons un rsultat important
pour la poursuite de la discussion.
Thorme 1.8 (Ingalit de Chebychev). Soit X une variable alatoire et g (x) une
fonction non-ngative. Alors, pour tout r > 0, on a
Pr[g (X ) r ]

E [g (X )]
.
r

18

Rappels danalyse, de probabilit et de statistique


Dmonstration. On a

E [g (X )] =

g (x) f X (x) d x.

Comme g (x) est une fonction non-ngative, on obtient


Z
g (x) f X (x) d x
E [g (X )]
{x:g (x)r }
Z
f X (x) d x
r
{x:g (x)r }

= r Pr[g (X ) r ],
do
Pr[g (X ) r ]

1.5.1

E [g (X )]
.
r

Convergence en probabilit

Ce type de convergence est le plus faible et il est gnralement facile vrifier.


Une suite de variables alatoires X 1 , X 2 , . . . converge en probabilit vers une variable
alatoire X si, pour tout > 0,
lim Pr[|X n X | ] = 0

ou, de manire quivalente,


lim Pr[|X n X | < ] = 1.

Il faut donc qu partir dun certain point dans la suite, la probabilit que la distance
entre les deux variables alatoires soit aussi proche de 0 quon le dsire soit de 1.
Il est noter quil nest pas ncessaire que les variables alatoires X 1 , X 2 , . . .
soient indpendantes et/ou identiquement distribues.

1.5.2

Convergence presque certaine

Ce type de convergence est plus fort que la convergence en probabilit (cest-dire que la convergence presque certaine implique la convergence en probabilit,
mais que linverse nest pas ncessairement vrai). Une suite de variables alatoires
X 1 , X 2 , . . . converge presque certainement vers une variable alatoire X si, pour tout
> 0, on a
h
i
Pr lim |X n X | < = 1.
n

1.6. Transformation de variables alatoires


Thorme 1.9. Soit X 1 , X 2 , . . . une suite de variables alatoires indpendantes et
identiquement distribues avec E [X i ] = et Var[X i ] < . On dfinit
X n =

n
1X
Xi .
n i =1

On a alors, pour tout > 0,


h
i
Pr lim | X n | < = 1.
n

Ce rsultat sera moins utilis dans la suite.

1.5.3

Convergence en distribution

La convergence en distribution est la plus faible des trois types de convergence


prsents dans cette section. Une suite de variables alatoires X 1 , X 2 , . . . converge
en distribution vers une variable alatoire X si
lim F X n (x) = F X (x)

pour tous les points o F X (x) est continue.

1.6

Transformation de variables alatoires

Cette section porte sur les transformations de variables alatoires, soit des
fonctions dune ou plusieurs variables alatoires. En termes mathmatiques, tant
donn la distribution conjointe des variables alatoires X 1 , . . . , X n , on cherche
dterminer la fonction de probabilit ou de densit de la variable alatoire Y =
u(X 1 , . . . , X n ).
Voici quelques exemples de transformations frquemment rencontres :
Y = X2
X E [X ]
Y = p
Var[X ]
X1 + + Xn
Y =
n
Y = F X (X ).
Il existe trois techniques principales pour dterminer la distribution de la transformation Y :
1. la technique de la fonction de rpartition ;
2. la technique du changement de variable ;
3. la technique de la fonction gnratrice des moments.

19

20

Rappels danalyse, de probabilit et de statistique

1.6.1

Technique de la fonction de rpartition

Cest la technique la plus simple, mais pas toujours la plus facile demploi. En
effet, la fonction de rpartition de certaines lois de probabilit est complique,
voire nexiste pas sous forme explicite (penser ici aux lois normale et gamma, par
exemple).
Lide consiste simplement calculer la fonction de rpartition de la transformation avec
F Y (y) = Pr[Y y]
= Pr[u(X 1 , . . . , X n ) y],
puis calculer la densit (ou la fonction de probabilit) par diffrenciation :
f Y (y) = F Y0 (y).
Il importe de noter que le domaine de dfinition de la transformation nest pas
ncessairement le mme que celui de ou des variables alatoires de dpart.
Exemple 1.8. Soit
f X (x) =

(
6x(1 x), 0 < x < 1

0,

ailleurs,

cest--dire X Bta(2, 2). On dtermine la densit de Y = X 3 . On a


F Y (y) = Pr[X 3 y]
= Pr[X y 1/3 ]
= F X (y 1/3 )
Z y 1/3
=
6x(1 x) d x
0

= 3y 2/3 2y,

0 < y < 1,

et donc
f Y (y) = F Y0 (y)
(
2y 1/3 2,
=
0,

0<y <1
ailleurs.

1.6. Transformation de variables alatoires

21

Exemple 1.9. Soit X une variable alatoire continue quelconque avec fonction de
rpartition F X (x) et Y = aX + b, o a et b sont des constantes relles. On a
F Y (y) = Pr[a X + b y]

y b
= FX
a
et, par consquent,

1
y b
f Y (y) = f X
.
a
a

La transformation Y = X + b reprsente une translation de X , vers la droite si


b > 0 et vers la gauche si b < 0. En assurance, b pourra tre interprt comme une
franchise.
La transformation Y = aX nest quand elle quun changement dchelle par
exemple un changement dunit montaire. Si a > 1 on a une dilatation, alors que
le cas o 0 < a < 1 est une contraction.
Exemple 1.10. Soit X une variable alatoire continue quelconque avec densit
f X (x). On cherche la densit de Y = |X |. Premirement, il convient de remarquer
que Y est dfinie au plus sur les rels positifs, mme si X est dfinie sur tout laxe
des rels. Par la technique de la fonction de rpartition,
F Y (y) = Pr[|X | y]
= Pr[y < X < y]
= F X (y) F X (y)
et
(

f Y (y) =

f X (y) + f X (y),

y >0

0,

ailleurs.

Par exemple, soit X N (0, 1), cest--dire


f X (x) = (x)
1 2
1
= p e 2 x .
2
La densit de Y = |X | est alors
f Y (y) = (y) + (y)
= 2(y)
1 2
2
= p e 2 y ,
2

y > 0.

22

Rappels danalyse, de probabilit et de statistique

Exemple 1.11. Soit Y = X 1 + X 2 , o X 1 et X 2 sont deux variables alatoires indpendantes chacune distribue uniformment sur lintervalle (0, 1). On a donc
f X 1 X 2 (x 1 , x 2 ) = f X 1 (x 1 ) = f X 2 (x 2 ) = 1,

0 < x 1 < 1, 0 < x 2 < 1.

Le domaine de dfinition de Y sera lintervalle (0, 2). Le domaine dintgration


tant un carr, il faut distinguer quatre cas.
1. Si y 0, on a clairement F Y (y) = 0.
2. Si 0 < y < 1, on a
y Z yx 2

F Y (y) =
=

d x1 d x2

1 2
y .
2

3. Si 1 < y < 2, alors


1

F Y (y) = (y 1)(1) +

yx 2

d x1 d x2

y1 0

1
= 1 (2 y)2 .
2
4. Enfin, si y 2, clairement F Y (y) = 1.
Par consquent, on a

F Y (y) =

0,

1 y 2,

y 0
0<y 1

1,

1
2
2 (2 y) ,

1<y <2
y >2

et

f Y (y) =

0,

y,

2 y,

0,

y 0
0<y 1
1<y <2
y > 2.

1.6. Transformation de variables alatoires

1.6.2

23

Technique du changement de variable

Cette technique est troitement lie au changement de variable en intgration.


Il convient toutefois de faire une distinction entre les cas discret et continu.
Cas discret
On considre la transformation Y = u(X ). Dans le cas discret, il suffit gnralement de faire la substitution :
Pr[Y = y] = Pr[u(X ) = y]
= Pr[X = u 1 (y)].
Les probabilits ne changent donc pas, elles ne sont quaffectes dautres valeurs.
Exemple 1.12. Soit la variable alatoire X avec fonction de probabilit

16 ,

4,

16
6
Pr[X = x] = 16
,

16 ,

1
16 ,

x =0
x =1
x =2
x =3
x = 4.

On cherche la fonction de probabilit de Y = (X 2)2 . Les valeurs possibles de Y


sont y = 0, 1 et 4. On a
Pr[Y = y] = Pr[(X 2)2 = y]
p
= Pr[X = y + 2]
et donc
Pr[Y = 0] = Pr[X = 2] =

6
16

10
16
2
Pr[Y = 1] = Pr[X = 0] + Pr[X = 4] = .
16
Pr[Y = 1] = Pr[X = 1] + Pr[X = 3] =

24

Rappels danalyse, de probabilit et de statistique

Cas continu
Le cas continu est beaucoup plus dlicat. On considre toujours la transformation Y = u(X ) avec les hypothses suivantes :

x la fonction u() est diffrentiable ;


x la fonction u() est soit croissante, soit dcroissante sur tout le domaine de f X (x).
Ainsi, linverse u 1 () = w() de la fonction u existe et est diffrentiable.
Thorme 1.10. Soit f X (x) la fonction de densit de probabilit en x dune variable
alatoire X et y = u(x) une fonction satisfaisant les hypothses ci-dessus. Alors la
densit de la variable alatoire Y = u(X ) est
f Y (y) = f X (u 1 (y)) |(u 1 (y))0 |
= f X (w(y)) |w 0 (y)|,
o w(y) = u 1 (y) et en supposant u 0 (x) 6= 0.
Dmonstration. On considre le cas o u est une fonction croissante. Alors
Pr[a < Y < b] = Pr[u 1 (a) < X < u 1 (b)]
Z w(b)
=
f X (x) d x
w(a)

puis, avec le changement de variable y = u(x) x = w(y) et donc d x = w 0 (y) d y


Z b
Pr[a < Y < b] =
f X (w(y)) w 0 (y) d y,
a

do f Y (y) = f X (w(y)) w (y). Si u est dcroissante, alors


f Y (y) = f X (w(y)) w 0 (y)
= f X (w(y)) |w 0 (y)|
car w 0 (y) < 0.
Exemple 1.13. Soit Y = 2 ln(X ) o X U (0, 1). En premier lieu, il importe de
spcifier quau domaine (0, 1) de la variable alatoire X correspond le domaine
(0, ) pour la transformation Y . On a u(x) = 2 ln(x), do w(y) = u 1 (y) = e y/2
et w 0 (y) = 21 e y/2 . Par le thorme 1.10, on obtient

y/2 1 y/2
f Y (y) = f X (e
) e

2
1
= e y/2
2
1/2 11 y/2
=
y e
,
y > 0,
(1)

1.6. Transformation de variables alatoires


soit Y Gamma(1, 12 ) 2 (2).
Exemple 1.14. Soit la variable alatoire X avec fonction de rpartition F X (x) en
x. Considrer la transformation Y = F X (X ). On remarque tout dabord que peu
importe le domaine de la variable alatoire X , le domaine de la transformation sera
(0, 1). On a u(x) = F X (x) et w(y) = F X1 (y), do
1
u 0 (w(y))
1
=
f X (F 1 (y))
1
=
.
f X (x)

w 0 (y) =

Par consquent,

f Y (y) = f X (F (y))
f X (x)

= f X (x)
f X (x)
1

= 1,

0 < y < 1,

soit Y U (0, 1). Ce rsultat est particulirement utile en simulation.


Exemple 1.15. On cherche la distribution de Y = Z 2 , o Z N (0, 1). La variable
alatoire Z tant dfinie sur R, la transformation y = z 2 nest pas bijective. Le truc
consiste ici dabord dfinir la transformation X = |Z |, de sorte que X soit dfinie
sur les rels positifs seulement. De lexemple 1.10, on sait que
1 2
2
f X (x) = p e 2 y .
2

Par la suite, on dfinit Y = X 2 = |Z |2 = Z 2 , une transformation bijective de X dont


p
le domaine de dfinition est R+ . On a alors u(x) = x 2 pour x > 0, soit w(y) = y et
w 0 (y) = 21 z 1/2 , do

p y 1/2
f Y (y) = f X ( y)
2
1
= p e y/2
2
( 12 )1/2 1/2 y/2
=
y e
, y > 0,
( 21 )
soit Y 2 (1).

25

26

Rappels danalyse, de probabilit et de statistique

1.6.3

Technique du changement de variable --- deux variables et


plus

Il sagit simplement ici de gnraliser les concepts tudis la section prcdente des transformations impliquant plusieurs variables alatoires.
Lide reste la mme sinon quil faut sassurer que la transformation compte
autant de nouvelles variables que danciennes. Ainsi, si lon part de la distribution
conjointe de deux variables alatoires X 1 et X 2 , il faudra trouver la distribution
conjointe de deux nouvelles variables alatoires Y1 = u 1 (X 1 , X 2 ) et Y2 = u 2 (X 1 , X 2 ).
Plus souvent quautrement, seule la distribution de la variable Y1 est dintrt.
Il suffit alors de dfinir Y2 comme une variable muette (dummy), par exemple
Y2 = X 2 .
Cas discret
Si la transformation Y1 = u 1 (X 1 , X 2 ) et Y2 = u 2 (X 1 , X 2 ) est bijective, alors simplement
Pr[Y1 = y 1 , Y2 = y 2 ] = Pr[u 1 (X 1 , X 2 ] = y 1 , u 2 (X 1 , X 2 ) = y 2 )
= Pr[X 1 = w 1 (y 1 , y 2 ], X 2 = w 2 (y 1 , y 2 )),
o
w 1 (y 1 , y 2 ) = u 11 (x 1 , x 2 )
w 2 (y 1 , y 2 ) = u 21 (x 1 , x 2 ).
Les fonctions de probabilit marginales sont alors obtenues en sommant :

Pr[Y1 = y 1 ] =
Pr[Y2 = y 2 ] =

Pr[Y1 = y 1 , Y2 = y 2 ]

y 2 =

Pr[Y1 = y 1 , Y2 = y 2 ].

y 1 =

Exemple 1.16. Trouver la distribution de Y = X 1 + X 2 si X 1 Poisson(1 ), X 2


Poisson(2 ) et X 1 et X 2 sont indpendantes. Cet exemple requiert lutilisation
dune variable muette. On dfinit Y2 = X 2 . On a
Y1 = X 1 + X 2
Y2 = X 2

X 1 = Y1 Y2
X 2 = Y2 .

1.6. Transformation de variables alatoires

27

Le domaine de Y1 est donc 0, 1, 2, . . . , alors que celui de Y2 est 0, 1, . . . , Y1 . Ainsi,


Pr[Y1 = y 1 , Y2 = y 2 ] = Pr[X 1 + X 2 = y 1 , X 2 = y 2 ]
= Pr[X 1 = y 1 y 2 , X 2 = y 2 ]
= Pr[X 1 = y 1 y 2 ]Pr[X 2 = y 2 ]
y y 2 1

11

22 e 2

(y 1 y 2 )!

y2!

et donc
y y 2

Pr[Y1 = y 1 ] =

y1 1
X
1
y 2 =0

22 e (1 +2 )

(y 1 y 2 )! y 2 !

(1 +2 )

y1!

y1
X

y1!
y y y
11 2 22
(y

y
)!
y
!
1
2
2
y 2 =0
!
y
1
X y 1 y 1 y 2 y 2
1
2
y 2 =0 y 2

e (1 +2 )
y1!

e (1 +2 )
(1 + 2 ) y 1 ,
y1!

soit Y Poisson(1 + 2 ).
Cas continu
On gnralise le thorme 1.10 afin de trouver la distribution conjointe (et
ventuellement les distributions marginales) de Y1 = u 1 (X 1 , X 2 ) et Y2 = u 2 (X 1 , X 2 ).
On suppose que

x toutes les premires drives partielles de u 1 et u 2 existent sur le domaine de X 1


et X 2 ;

x la transformation est bijective.


Ces hypothses garantissent que les fonctions inverses w 1 = u 11 et w 2 = u 21
existent.
Thorme 1.11. Soit f X 1 X 2 (x 1 , x 2 ) la fonction de densit de probabilit conjointe
en (x 1 , x 2 ) des variables alatoires X 1 et X 2 et y 1 = u 1 (x 1 , x 2 ), y 2 = u 2 (x 1 , x 2 ) des
fonctions satisfaisant les hypothses ci-dessus. Alors la densit conjointe des variables
alatoires Y1 = u 1 (X 1 , X 2 ) et Y2 = u 2 (X 1 , X 2 ) est
f Y1 Y2 (y 1 , y 2 ) = f X 1 X 2 (w 1 (y 1 , y 2 ), w 2 (y 1 , y 2 )) |J |,

28

Rappels danalyse, de probabilit et de statistique


o

x 1

y 2

x 2
y

x 1

y
1
J =
x 2

y
1

est appel le Jacobien de la transformation.


Exemple 1.17. Soit deux variables alatoires indpendantes X 1 Gamma(, 1) et
X 2 Gamma(, 1), ainsi que les variables alatoires Y1 = X 1 + X 2 et Y2 = X 1 /(X 1 +
X 2 ). Tout dabord, on a
f X 1 X 2 (x 1 , x 2 ) =

1
1
x 1 x 2 e x1 x2 ,
()() 1

x 1 > 0, x 2 > 0.

De plus,
Y1 = X 1 + X 2
X1
Y2 =
X1 + X2

X 1 = Y1 Y2
X 2 = Y1 (1 Y2 )

et donc
x 1
= y1
y 2
x 2
= y 1 ,
y 2

x 1
= y2
y 1
x 2
= 1 y2
y 1
do le Jacobien de la transformation est

y2
J =
1 y

y 1
= y 1 .
y 1

Le domaine de Y1 est R+ alors que celui de Y2 est limit lintervalle (0, 1). Par
le thorme 1.11,
f Y1 Y2 (y 1 , y 2 ) = f X 1 X 2 (y 1 y 2 , y 1 (1 y 2 )) |y 1 |
1
=
y 1 (y 1 y 2 )1 (y 1 (1 y 2 ))1 e y 1 y 2 y 1 (1y 2 )
()()
1
+1 1
=
y1
y 2 (1 y 2 )1 e y 1
()()
= g (y 1 ) h(y 2 )

1.7. chantillon alatoire

29

o g () et h() sont des fonctions quelconques. Ainsi, Y1 et Y2 sont des variables


alatoires indpendantes. De plus,
1

f Y1 (y 1 ) =

f Y1 Y2 (y 1 , y 2 ) d y 2
Z 1
1
+1 y 1
= y1
e
y 21 (1 y 2 )1 d y 2
0 ()()
1
+1 y 1
=
y
e ,
y1 > 0
( + ) 1
0

et
f Y2 (y 1 , y 2 ) =

f Y1 Y2 (y 1 , y 2 )

f Y1 (y 1 , y 2 )
( + ) 1
=
y
(1 y 2 )1 ,
()() 2

0 < y 2 < 1.

On a donc Y1 = X 1 + X 2 Gamma( + , 1) et Y2 = X 1 /(X 1 + X 2 ) Bta(, ).

1.6.4

Technique de la fonction gnratrice des moments

Cette technique savre tout spcialement puissante pour dterminer la distribution (marginale) dune combinaison linaire de variables alatoires indpendantes. La technique repose sur le thorme suivant.
Thorme 1.12. Soit X 1 , . . . , X n des variables alatoires indpendantes et Y = X 1 +
+ X n . Alors
n
Y
M Y (t ) =
M X i (t ).
i =1

Il est laiss en exercice de refaire les exemples 1.16 et 1.17 (distribution de Y1


seulement) laide de la technique de la fonction gnratrice des moments.

1.7

chantillon alatoire

Dans cette section, nous dfinissons plusieurs termes importants en infrence


statistique, dont

x statistique ;
x chantillon alatoire.

30

Rappels danalyse, de probabilit et de statistique


Nous tudierons galement la distribution de deux fonctions de variables alatoires
importantes, soit la moyenne et la variance de lchantillon (ou empiriques ; sample
mean et sample variance).
Considrer la mise en contexte suivante : on aimerait dterminer si une pice
de monnaie est quilibre (pile et face quiprobables) ou non. On dfinit donc
dabord une variable alatoire
X : rsultat du lancer dune pice de monnaie (1 pour pile, 0 pour
face).

x On sait que X Bernoulli(p), mais il y a incertitude sur la valeur de p.


x On dcide de lancer la pice 100 fois. On dfinit alors
X i : rsultat du lancer i = 1, . . . , 100
et X i Bernoulli(p).

x On lance la pice 100 fois. Les valeurs x 1 , . . . , x 100 forment un chantillon alatoire
dune population Bernoulli.

x On dfinit la fonction de variables alatoires (et donc variable alatoire ellemme)


Y =

X 1 + + X 100
100

dans lespoir que la probabilit que Y soit prs de p,


Pr[p < Y < p + ],
soit grande. Y est une statistique.

x On calcule la valeur de la statistique pour notre chantillon


y=

x 1 + + x 100
.
100

x On essaie dinfrer quelque chose partir de ce rsultat, par exemple que p = y.

1.7.1

Quelques dfinitions

Dfinition 1.2 (Statistique). Une statistique est une fonction dune ou plusieurs
variables alatoires qui ne dpend pas de paramtres inconnus.
Remarques.

1.7. chantillon alatoire

31

1. Par exemple,
Y =

1
(X 1 + + X n )
n

est une statistique, mais


Y =

ne lest pas si et sont inconnus.


2. Puisque toute fonction de variables alatoires est une variable alatoire :

x une statistique est une variable alatoire ;


x une statistique a une distribution.
3. Si une statistique ne doit pas tre dfinie en fonction de paramtres inconnus,
sa distribution peut, elle, dpendre de paramtres inconnus.
Dfinition 1.3 (chantillon alatoire). Soit X 1 , . . . , X n des variables alatoires mutuellement indpendantes et identiquement distribues (i.i.d.) avec fonction de
rpartition F (). Alors ces variables alatoires forment un chantillon alatoire de
la distribution F ().
Il importe de remarquer, ici, quon a un chantillon alatoire si, et seulement si,
les variables alatoires sont indpendantes et identiquement distribues.
Dfinition 1.4 (Moyenne et variance de lchantillon). Soit X 1 , . . . , X n un chantillon alatoire. Alors
X =

n
1X
Xi
n i =1

est la moyenne de lchantillon et


S2 =

n
1X
(X i X )2
n i =1

est la variance de lchantillon.


Remarques.
1. La moyenne et la variance de lchantillon peuvent tre dfinies pour tout type
dchantillon, pas seulement pour un chantillon alatoire.
2. La variance de lchantillon est parfois dfinie ainsi :
S2 =

n
1 X
(X i X )2 .
n 1 i =1

Nous verrons plus loin la diffrence entre ces deux dfinitions.

32

Rappels danalyse, de probabilit et de statistique


3. Il importe de distinguer les variables alatoires fonctions dun chantillon alatoire X et S 2 de
n
1X
x =
xi
n i =1
et
s2 =

n
1X
2,
(x i x)
n i =1

des ralisations de ces deux variables alatoires obtenues partir dune ralisation de lchantillon alatoire.

1.7.2

Distribution de la moyenne de lchantillon

Soit X 1 , . . . , X n un chantillon alatoire dune population avec moyenne et


variance 2 . Il est alors simple de dmontrer que
E [ X ] =
Var[ X ] =

2
.
n

Puisque Var[ X ] 0 quand n , la distribution de X est de plus en plus


concentre autour de sa moyenne quand n augmente. En fait, le thorme suivant
tablit que X converge en probabilit (sous-section 1.5.1) vers .
Thorme 1.13 (Loi (faible) des grands nombres). Soit X 1 , . . . , X n un chantillon
alatoire dune population avec moyenne et variance 2 . Alors
lim Pr[ < X < + ] = 1.

Le rsultat suivant est un des plus importants de la thorie des probabilits. Il


tablit la convergence en distribution (sous-section 1.5.3) de la distribution de X
vers celle dune loi normale.
Thorme 1.14 (Thorme central limite). Soit X 1 , . . . , X n un chantillon alatoire
dune population avec moyenne et variance 2 . Alors la distribution de
X
p
/ n
(X 1 + + X n ) n
=
p
n

Z=

tend vers une loi normale centre rduite lorsque n , cest--dire


n

Pr[Z z] (z).

1.8. Quantiles et statistiques dordre


Remarques.
n
1. Le Thorme central limite (TCL) naffirme pas que X N (0, 1) puisque
n
Var[ X ] 0.

2. En revanche, le TCL affirme que lorsque n , il est raisonnable de faire


lapproximation X N (, 2 /n) ou encore, de manire quivalente, X 1 + +
X n N (n, n2 ).
3. Lapproximation est gnralement bonne ds que n 30 et ce, peu importe la
distribution de X .

1.7.3

Distribution de la variance de lchantillon

On rappelle, sans le dmontrer, un rsultat sur la distribution de la variance


dun chantillon tir dune loi normale.
Thorme 1.15. Soit X et S 2 la moyenne et la variance, respectivement, dun chantillon de taille n tir dune population normale de moyenne et variance 2 . Alors,
i)

X N (, 2 /n)

ii)

nS 2 /2 2 (n 1)

iii)

X et S 2 sont indpendantes.

1.8

Quantiles et statistiques dordre

Le 100p e quantile dune distribution F () est la valeur de x tel que


lim F (x h) p F (x).

h0

Pour une distribution continue, cela se rsume au point x tel que F (x) = p.

x Quand p = 0,01, 0,02, . . . , 0,99, 1, on parle de centile (1er, 2e, . . ., 100e).


x Quand p = 0,25, 0,50, 0,75, 1, on parle de quartile (1er, 2e, 3e, 4e).
x Le 50e centile, ou 2e quartile est aussi appel la mdiane de la distribution F .
Les quantiles sont les valeurs thoriques. Au niveau de lchantillon, on a les
statistiques dordre. Soit X 1 , . . . , X n un chantillon alatoire. Alors les statistiques
dordre de lchantillon sont X (1) X (2) X (n) , soit les valeurs de X 1 , . . . , X n
classes en ordre croissant.

33

34

Rappels danalyse, de probabilit et de statistique

1.8.1

Distribution du maximum

On cherche la distribution de X (n) = max(X 1 , . . . , X n ). Or,


F X (n) (x) = Pr[X (n) x]
= Pr[X 1 x, . . . , X n x]
= (F X (x))n
do
f X (n) (x) = n(F (x))n1 f (x).

1.8.2

Distribution du minimum

De mme, on trouve que la distribution de X (1) = min(X 1 , . . . , X n ) est


f X (1) (x) = n(1 F (x))n1 f (x).

1.8.3

Distribution de la k e statistique dordre

Trouver la distribution explicite dune statistique dordre est en gnral un


problme ardu. Le thorme ci-dessous ne peut par exemple servir que pour des
distributions trs simples comme luniforme ou lexponentielle ou pour de
trs petits chantillons.
Thorme 1.16. Soit X 1 , . . . , X n un chantillon alatoire dune fonction de densit
de probabilit f (x) avec fonction de rpartition correspondante F (x), et soit X (1)
X (2) X (n) les statistiques dordre de cet chantillon. Alors,
f X (1) ,...,X (n) (x 1 , . . . , x n ) = n! f (x 1 ) f (x n ),
f X (k) ,X (r ) (x, y) =

x1 xn

n!
(F (x))k1
(k 1)!(r k 1)!(n r )!
(F (y) F (x))r k1 (1 F (y))nr f (x) f (y),

f X (k) (x) =

1.8.4

xy

n!
(F (x))k1 (1 F (y))nk f (x)
(k 1)!(n k)!

Fonctions R lies aux statistiques dordre

Il existe dans R plusieurs fonctions permettant de travailler avec les statistiques


dordre dun chantillon : summary, quantile, max, min, median, range, diff, sort,
order et rank.

1.9. Estimation : introduction et proprits

1.9

Estimation : introduction et proprits

Nous abordons maintenant linfrence statistique proprement parler. Les


problmes dinfrence statistique se divisent en deux grandes classes :
1. Estimation : dterminer la valeur dun ou plusieurs paramtres dune distribution. On distingue :
a) lestimation ponctuelle, o lon cherche une valeur pour un paramtre ;
b) lestimation par intervalle, o lon cherche des limites lintrieur desquelles
se trouve un paramtre.
2. Tests dhypothses : dterminer si lon accepte ou rejette une valeur ou un
ensemble de valeurs dun paramtre.
En estimation ponctuelle, on utilise une statistique comme estimateur dun
paramtre de la distribution de la population. De manire gnrale, on considre
la variable alatoire X avec fonction de densit de probabilit f X (x; ), o est le
paramtre inconnu de la distribution. Lestimation de suit les tapes suivantes :
1. On dfinit X 1 , . . . , X n , un chantillon alatoire de f (x; ).
= T (X 1 , . . . , X n ) une fonction T () de X 1 , . . . , X n comme estimateur
2. On dfinit
de .
3. Une fois lexprience effectue, on a les observations x 1 , . . . , x n .
4. La valeur de lestimation est = t (x 1 , . . . , x n ).
Ainsi, un estimateur est une statistique. Par consquent
est la variable alatoire et sa ralisation) ;
x cest une variable alatoire (

x on peut tudier la distribution et autre proprits statistiques dun estimateur.


Les proprits tudies dans ce document sont :

x biais : en moyenne, lestimateur tombe-t-il sur la vraie valeur du paramtre ?


x efficacit : les valeurs de lestimateur sont-elles concentres autour de la moyenne ?
x convergence : la probabilit est-elle forte destimer le paramtre correctement ?
x exhaustivit ; lestimateur extrait-il toute linformation pour la dfinition et des
exdisponible de lchantillon ?

1.9.1

Biais

= T (X 1 , . . . , X n ) est un estimateur sans biais dun paramtre


Une statistique
si, et seulement si,
= .
E []

35

36

Rappels danalyse, de probabilit et de statistique


Lorsquun estimateur est biais, le biais est dfini comme
.
b() = E []
De plus, on dit quun estimateur est asymptotiquement sans biais si
lim b() = 0.

Enfin, lerreur quadratique moyenne (MSE) dun estimateur est dfinie comme
= E [
)2 ] = b()2 + Var[].

MSE()
Exemple 1.18. Soit X 1 , . . . , X n un chantillon alatoire issu dune loi exponentielle
translate avec fonction de densit de probabilit
f (x; ) = e (x) ,

x > .

On cherche un estimateur sans biais pour . Essayons dabord avec X . Pour faciliter
les calculs, dfinissons toutefois dabord la variable alatoire X = + Y , o Y
Exponentielle(1). Ainsi,
E [X ] = + E [Y ]
= +1
et par consquent
E [ X ] = E [X ] = + 1.
La moyenne de lchantillon est donc un estimateur biais de . Par contre, X 1
est un estimateur sans biais.
Intuitivement, X (1) = min(X 1 , . . . , X n ) devrait aussi constituer un estimateur
raisonnable de . Or, par le rsultat de la sous-section 1.8.2, on a f Y(1) (y) = ne n y et
donc Y(1) Exponentielle(n) E [Y(1) ] = n 1 . Par consquent,
E [X (1) ] = + E [Y(1) ]
1
= + .
n
Le minimum est donc un estimateur biais, mais asymptotiquement sans biais du
paramtre dune loi exponentielle translate.

1.9. Estimation : introduction et proprits


Exemple 1.19. Puisque
nS 2
2 (n 1)
2
on a que

nS 2
= n 1
2

et donc
E [S 2 ] =

n 1 2
,
n

do S 2 est un estimateur biais de 2 . Le biais est 2 /n, donc S 2 tend sous


estimer la variance de la population. Puisque ce biais tend vers zro quand n ,
S 2 est asymptotiquement sans biais pour 2 .
En revanche,
n
S2
n 1
n
1 X
(X i X )2
=
n 1 i =1

S2 =

est un estimateur sans biais de 2 .


La proprit dabsence de biais est souvent une sorte de condition minimale rencontrer au moment de choisir un estimateur. Il faut toutefois demeurer
conscient des limitations suivantes :
1. La proprit dabsence de biais est gnralement perdue lors dune transfor est un estimateur sans biais de , il ny a pas de
mation, cest--dire que si

garantie que g () sera sans biais pour g (). Par exemple, S2 est sans biais pour
2 , mais S est biais pour .
2. Comme on a pu le voir en partie lexemple 1.18, il existe une multitude destimateurs sans biais dun paramtre . Quel estimateur choisir alors ?
3. Il peut exister un meilleur estimateur biais, cest--dire un estimateur qui, bien
que biais, a une plus petite variance.

37

38

Rappels danalyse, de probabilit et de statistique

1.9.2

Efficacit

1 et 2 dun paramtre , on prfrera gnralement


Entre deux estimateurs
lestimateur ayant la plus faible variance. Le thorme suivant donne une borne
infrieure pour la variance dun estimateur sans biais.
Thorme 1.17 (Borne, ou ingalit, de RaoCramr). Soit X 1 , . . . , X n un chantillon alatoire dune distribution f (x; ) dont le domaine de dfinition ne dpend
un estimateur sans biais de . Alors,
pas de , et soit

Var[]

1
2 i .
h
ln f (X )
nE

de est dit efficace


Dfinition 1.5 (Estimateur efficace). Un estimateur sans biais
si, et seulement si, sa variance atteint la borne de RaoCramr.
est
Dfinition 1.6 (Efficacit et efficacit relative). Lefficacit dun estimateur
le ratio entre la borne de RaoCramr et la variance de lestimateur. On dfinit
1 et
2 par
galement lefficacit relative de deux estimateurs
1]
Var[
.
2]
Var[
Remarques.
1. Lorsque la variance dun estimateur atteint la borne de RaoCramr, on dit
quil sagit dun estimateur sans biais variance (uniformment) minimale
(ENBAVUM, BLUE en anglais).
2. Le dnominateur de la borne de Rao-Cramr,
I () = nE

h
2 i
ln f (X )

est appel linformation (de Fisher) de lchantillon.


3. Selon la forme de f (x; ), il est souvent plus simple de calculer la borne de
RaoCramr avec
1

Var[]
h 2
i.
nE
ln f (X )
2

1.9. Estimation : introduction et proprits

1.9.3

39

Convergence

La convergence est une proprit asymptotique assurant que la probabilit est


estime correctement.
grande que
= T (X 1 , . . . , X n ) est un
Dfinition 1.7 (Estimateur convergent). La statistique
estimateur convergent (consistent) de si, et seulement si,
| < ] = 1
lim Pr[|

pour tout > 0.


Remarque. La manire la plus simple de prouver la convergence dun estimateur
est sans biais pour et que
est la suivante : si
= 0,
lim Var[]

est convergent. En effet, E []


= et donc
alors par lingalit de Chebyshev,
| ]
Pr[|

Var[]
,
2

= 0 limn Pr[|
| ] = 0.
do limn Var[]

1.9.4

Exhaustivit

On peut omettre cette section lors dune premire lecture. Son contenu est plac ici titre de
rfrence.

= T (X 1 , . . . , X n ) est un estimateur exhaustif (sufficient) de


Une statistique
si elle rsume toute linformation ncessaire lestimation de contenue dans
lchantillon alatoire X 1 , . . . , X n .
Dfinition 1.8 (Statistique exhaustive). Soit X 1 , . . . , X n un chantillon alatoire
dune distribution f (x; ). Soit Y = T (X 1 , . . . , X n ) une statistique dont la fonction
de densit de probabilit est g (y; ). Alors Y est une statistique exhaustive pour
si, et seulement si,
f (x 1 , . . . , x n ; )
= h(x 1 , . . . , x n )
g (t (x 1 , . . . , x n ); )
ne dpend pas de .
La dfinition 1.8 signifie quune fois la valeur de la statistique connue, la distribution de X 1 , . . . , X n ne dpend plus de et donc quil ne subsiste dans lchantillon
plus aucune information sur .
La proprit dexhaustivit est habituellement dmontre avec le thorme de
factorisation.

40

Rappels danalyse, de probabilit et de statistique


Thorme 1.18 (Thorme de factorisation). Soit X 1 , . . . , X n un chantillon alatoire dune distribution f (x; ). Soit Y = T (X 1 , . . . , X n ) une statistique dont la fonction de densit de probabilit est g (y; ). Alors Y est une statistique exhaustive pour
si, et seulement si, on peut trouver deux fonctions non ngatives u et v tel que
f (x 1 , . . . , x n ; ) = u(t (x 1 , . . . , x n ); )v(x 1 , . . . , x n ).
Exemple 1.20. Soit X Bta(, 1), cest--dire
f (x; ) =

( + 1) 1
x
()

= x 1 ,
On dmontre que

Qn

i =1 X i

0 < x < 1, > 0.

est une statistique exhaustive pour . En effet, on a

f (x 1 , . . . , x n ; ) =

n
Y

x 1

i =1
n

= (x 1 x 2 x n )1
= n (x 1 x 2 x n )

1
x1 x2 xn

= u(y; ) v(x 1 , . . . , x n ),
o y = i =1 x i , u(y; ) = n y et v(x 1 , . . . , x n ) = (x 1 x 2 x n )1 . Par le thorme de
Q
factorisation, Y = ni=1 X i est donc une statistique exhaustive pour .
Qn

1.10

Estimation : mthodes

On se tourne maintenant vers ltude de mthodes pour dvelopper des estimateurs du ou des paramtres dune distribution.

1.10.1

Mthode des moments

La mthode des moments est la plus simple et intuitive technique destimation


et parfois la seule vraiment disponible.
Lide est trs simple : galer les moments de la population (moments thoriques) aux moments empiriques. Le k e moment empirique dun chantillon
x 1 , . . . , x n est
n
1X
mk =
xk .
n i =1 i
Si la distribution de la population compte r paramtres estimer, on rsout
donc le systme r quations
m k = E [X k ],

k = 1, . . . , r.

1.10. Estimation : mthodes

1.10.2

41

Mthode du maximum de vraisemblance

La trs puissante et populaire mthode du maximum de vraisemblance a t


propose par R. A. Fisher. Les estimateurs du maximum de vraisemblance (EMV)
jouissent de plusieurs belles proprits :

x exhaustifs (lorsquils existent) ;


x asymptotiquement sans biais et variance minimale.
Lide consiste ici choisir les paramtres de la distribution de faon maximiser la probabilit dobserver lchantillon donn.
Dfinition 1.9 (Fonction de vraisemblance). Si x 1 , . . . , x n sont les observations dun
chantillon alatoire X 1 , . . . , X n issu dune distribution f (x; ), alors la fonction de
vraisemblance de lchantillon est
L() = f (x 1 , . . . , x n ; )
n
Y
=
f (x i ; )
i =1

pour des valeurs de sur le domaine adquat.


Lestimateur du maximum de vraisemblance maximise donc L() ou, de manire quivalente, la log-vraisemblance
l () = ln L().
Exemple 1.21. Soit la loi exponentielle de densit
f (x) = e x ,

x > 0.

La fonction de vraisemblance dun chantillon alatoire tir de cette loi est


L() =

n
Y

e xi

i =1

= n e

Pn

i =1 x i

et la fonction de log-vraisemblance est


l () = n ln

n
X
i =1

do
n
n X
d
l () =
xi .
d
i =1

xi ,

42

Rappels danalyse, de probabilit et de statistique


En galant la drive zro et en rsolvant pour , on trouve
n
= Pn

i =1 x i

1
.
x

Par consquent, lEMV du paramtre est


=

1
.
X

On remarque que :
P
= X Gamma(n, n), do
1. Puisque ni=1 X i Gamma(n, ), alors
n
n
=

n 1 n 1
n 2 2
=
Var[]
.
(n 1)2 (n 2)
=
E []

Par consquent,
est asymptotiquement sans biais ;
x
= 0, donc
est convergent.
x limn Var[]
En fait, pour tous les cas intressants lEMV est un estimateur convergent.
2. Il est facile de vrifier que la borne de RaoCramr est 2 /n. Par consquent
=
Efficacit()

n3
(n 1)2 (n 2)

et donc, par une application de la rgle de lHpital,


= 1,
lim Efficacit()

do lEMV est asymptotiquement lENBAVUM de .

1.11

Proprits de lestimateur du maximum de


vraisemblance

En plus dtre convergent et asymptotiquement sans biais, lEMV possde


plusieurs belles proprits qui en font un choix populaire pour lestimation de
paramtres.

1.12. Estimation par intervalles, ou intervalles de confiance

1.11.1

Invariance

est lEMV du paramtre , alors g ()


est lEMV de g (), o g est une
Si
fonction quelconque. Cette proprit fait par exemple en sorte que lEMV de lcart
type est simplement la racine carre de lEMV de la variance.

1.11.2

Exhaustivit

Soit X 1 , . . . , X n un chantillon alatoire dune fonction de densit de probabilit


f (x; ). Sil existe

x une statistique exhaustive T (X 1 , . . . , X n ) pour


pour ,
x un estimateur du maximum de vraisemblance unique
est une fonction de la statistique exhaustive T (X 1 , . . . , X n ).
alors

1.11.3

Efficacit

Sous des hypothses de rgularit, on a


N (, I ()1 )

quand n . Par consquent, lEMV est asymptotiquement sans biais et efficace.


De plus, si un estimateur efficace existe pour , alors cet estimateur est lEMV.

1.12

Estimation par intervalles, ou intervalles de


confiance

Un estimateur ponctuel dun paramtre ne nous donne pas toute linformation


sur un paramtre. Par exemple :

x quelle est la taille de lchantillon sur lequel est base lestimation ?


x quelle est lerreur possible dans lestimation ?
Avec la rponse la premire question, lestimation par intervalles permet de
rpondre la seconde.
Lexemple classique dune estimation par intervalle ou dun intervalle de
confiance est le rsultat dun sondage :
Le parti Untel recueille 42 % des intentions de vote pour la prochaine
lection. On a interrog pour ce sondage 1011 personnes ; la marge
derreur est de 3 %, 19 fois sur 20.

43

44

Rappels danalyse, de probabilit et de statistique


En termes mathmatiques (peu rigoureux), cette phrase dit que, si reprsente le
niveau dappui du parti Untel au soir de llection,
Pr[0,39 < < 0.45] = 0,95,
avec n = 1011 et = 0,42.
De manire gnrale, un intervalle de confiance a la forme suivante :
Pr[T1 (X 1 , . . . , X n ) < < T2 (X 1 , . . . , X n )] = 1 ,
o T1 (X 1 , . . . , X n ) et T2 (X 1 , . . . , X n ) sont des statistiques et 1 est le niveau de
confiance de lintervalle. La chose importante remarquer ici est que ce sont les
bornes de lintervalles qui sont les variables alatoires dans lexpression ci-dessus.
La construction dun intervalle de confiance nest en gnral pas trs complique :

x choisir une statistique selon le paramtre estimer ( X pour la moyenne, S 2 pour


la variance) ;

x si la distribution de la statistique est symtrique autour de , construire un


intervalle symtrique ;

x sinon, essayer de minimiser la longueur de lintervalle (pas toujours fait en


pratique, ou lon opte plutt pour la simplicit de calcul) ;

x si n est grand, utiliser le Thorme central limite.


Exemple 1.22. Lors de ltude dun groupe tmoin atteint dune maladie grave, on
a observ que 136 des 400 personnes faisant partie du groupe sont dcdes au
cours de lanne suivant le diagnostic de la maladie. En supposant la probabilit de
dcs sur un horizon dun an identique dune personne lautre, on cherche un
intervalle de confiance 95 % pour la taux de morbidit dans ce groupe, cest--dire
pour le paramtre dune loi Binomiale(n, ). Posons donc X Binomiale(n, ),
o X reprsente alors le nombre de personnes dcdant dans lanne.
Lorsque n est petit, il est relativement compliqu (il nexiste pas de solution
explicite) de trouver un intervalle de confiance de niveau 1 pour . Pour n grand,
cependant, on peut utiliser le Thorme central limite : quand n ,
X N (n, n(1 )).
Par consquent,

X n

Pr z /2 < p
< z /2 = 1
n(1 )

1.13. Tests dhypothses

45

ou, de manire quivalente,

Pr

X
z /2
n

(1 )
X
< < + z /2
n
n

(1 )
= 1 .
n

Afin de pouvoir obtenir simplement des valeurs numriques pour les bornes
infrieure et suprieure de lintervalle de confiance pour , on remplace ce paramtre dans les racines carres par son estimateur du maximum de vraisemblance,
= X /n. Un intervalle de confiance approximatif de niveau 1 est donc

z /2

(1
+ z /2
,
n

(1
,.
n

Dans cet exemple o n = 400 est grand, on peut utiliser lapproximation cidessus. On a donc 1 = 0,95 z 0,025 = 1,96 et x = 136, do
s

0,34 1,96

(0,34)(0,66)
< < 0,34 + 1,96
400

(0,34)(0,66)
400

m
0,294 < < 0,386
avec approximativement une probabilit de 95 %. Exprim autrement, la probabilit de dcs est de 0,34 0,046, 19 fois sur 20.

1.13

Tests dhypothses

Reprenons le contexte de lexemple 1.22, savoir que 136 des 400 personnes
atteintes dune maladie grave dcdent dans lanne suivant le diagnostic de la
maladie, soit une proportion de = 0,34. Un nouveau mdicament que lon espre
efficace contre la maladie est dcouvert. Afin dvaluer si le mdicament est efficace ou non, celui-ci est administr aux nouveaux cas de la maladie. On voudra
par la suite comparer la nouvelle proportion de dcs avec celle observe avant
lutilisation du mdicament.
En termes plus mathmatiques, on voudra tester si < 0,34 chez les gens ayant
pris le nouveau mdicament. On formule donc deux hypothses statistiques :
H0 : = 0,34 (le mdicament est inefficace)
H1 : < 0,34 (le mdicament est efficace).

46

Rappels danalyse, de probabilit et de statistique


Lhypothse H0 est appele lhypothse nulle, alors que H1 est lhypothse alternative. Lhypothse H0 est dite simple parce quelle spcifie entirement la distribution, alors que H1 est compose puisquelle ne spcifie quune partie de la
distribution. En gnral H0 est simple et H1 est compose, comme cest le cas ici,
mais toutes les combinaisons sont possibles.
Le but principal dun test dhypothse consiste dfinir un ensemble de rgles
pour dcider si lon doit accepter ou rejeter H0 .
Remarque. Formellement, on naccepte pas lhypothse nulle H0 . On dit plutt
qutant donn les observations recueillies, on ne la rejette pas.
Il est dcid que si la proportion de dcs dans lanne suivant le diagnostic de
la maladie et la prise du nouveau mdicament est de 0,30 ou moins, le mdicament
sera jug efficace. On a ainsi dfini une rgion critique. Si la valeur de la statistique
calcule partir dun chantillon tombe dans la rgion critique, on rejette H0 .
Cette rgle a des consquences. Si 0,30, on dclarera le mdicament efficace
(rejet de H0 ), mais ce pourrait tre tort. On appelle erreur de type I le fait de
rejeter H0 quand elle est vraie. La probabilit de faire une telle erreur est le seuil de
signification dun test :
= Pr[faire une erreur de type I]
= Pr[rejeter H0 alors quelle est vraie].
Comme dans la thorie des intervalles de confiance, 1 reprsente le niveau de
confiance du test. Dans lexemple sous tude,
0,30; = 0,34],
= Pr[
= X /n et X est le nombre de dcs. Si n est grand, alors approximativement
o

(1 )
N ,

.
n
Ainsi, pour n = 400,

0,3 0,34
Pr Z p
= 0,046,
(0,34)(0.66)/400

o Z N (0, 1).
Inversement, si > 0,30 on ne rejettera pas H0 . Le mdicament sera jug inefficace, alors quil peut ltre. Le fait de ne pas rejeter lhypothse H0 alors quelle est
fausse est appel une erreur de type II. Cette probabilit est note :
= Pr[faire une erreur de type II]
= Pr[ne pas rejeter H0 alors quelle est fausse].

1.13. Tests dhypothses

47

Puisque lhypothse alternative est composite dans cet exemple, la probabilit de


faire une erreur de type II est une fonction de :
() = Pr

X
> 0,30; , < 0,34 .
n

En suivant la mme procdure que ci-dessus, on trouve par exemple (0,20) 0,


(0,30) = 0,5 et (0,33) = 0,90.
On constate donc quavec la rgion critique choisie ( 0,30), la probabilit de
dclarer le mdicament efficace alors quil ne lest pas nest que de = 4,6 %. Par
contre, si le mdicament rduit la proportion de dcs seulement entre 0,30 et 0,34,
on voit que la probabilit de le dclarer inefficace alors quil lest est trs grande.
Cest l une caractristique des erreurs de type I et II : si on diminue la probabilit
de lune, on augmente la probabilit de lautre. La seule faon de diminuer les deux
probabilits simultanment consiste augmenter la taille de lchantillon.
un seuil de signification = 0,046 correspond une rgion critique < 0,30.
Supposons que lon observe = 0,28. Quel seuil de signification correspond cette
valeur, si n = 400 ? On a

0,28 0,34
0,28; = 0,34] Pr Z p
Pr[
(0,34)(0,66)/400
= 0,0057.
Cette valeur est appele la valeur p du test, et elle reprsente le seuil de signification
maximal auquel on peut rejeter H0 tant donn la valeur de la statistique obtenue
avec un chantillon. Autrement dit, tant donn = 0,28, on serait prt rejeter H0
avec un niveau de confiance dau moins 99,43 %.
La valeur p doit-elle tre grande ou petite ? Cela dpend si lon souhaite ou non
rejeter lhypothse nulle ! Par exemple, si
H0 : ajustement dun modle des donnes est bon
H1 : ajustement nest pas bon,
alors on cherchera avoir une valeur p trs grande, de faon ne pas rejeter H0 .
Par contre, dans une situation o
H0 : droite de rgression nexplique pas les donnes
H1 : droite de rgression explique les donnes,
on souhaitera habituellement rejeter H0 , alors la valeur p devrait tre petite pour
une statistique donne.

48

Rappels danalyse, de probabilit et de statistique


Remarque. Il est plus facile de se rappeler de la signification de la valeur p ainsi :
1 p est le niveau de confiance avec lequel on peut rejeter lhypothse nulle H0 .
Un test dhypothse compte toujours quatre grandes tapes :
1. Formuler H0 et H1 et fixer le seuil de signification (habituellement 0,10, 0,05
ou 0,01).
2. partir de la distribution de la statistique de test approprie (en gnral celle
utilise pour construire un intervalle de confiance), dterminer la rgion critique
C de niveau .
3. Calculer la valeur de la statistique de test pour lchantillon alatoire disponible.
4. Vrifier si la valeur de la statistique de test tombe dans la rgion critique. Si oui,
rejeter H0 . Sinon, ne pas rejeter H0 .
Un intervalle de confiance est en fait un ensemble de tests. Il est donc tout fait
quivalent de faire un test dhypothse et de construire un intervalle de confiance
pour ensuite vrifier si la valeur cible se trouve lintrieur de lintervalle ou non.

1.14. Exercices

1.14

49

Exercices

1.1 On a lingalit
1 x 2 1 cos(x) 1
<

<
2 24
x2
2
vraie pour toutes valeurs de x prs de 0. Calculer
lim

x0

1 cos(x)
x2

et faire le graphique de la fonction et des deux bornes pour 2 x 2.


1.2 Calculer
lim

x0 ln(x + 1)

1.3 Calculer limx0 (1 + x)1/x .


1.4 a) Dterminer laquelle des expressions, x ou ln(x), tend la plus rapidement
vers linfini lorsque x tend vers linfini.
b) Rpter la partie a) avec x et e x .
1.5 Il faut parfois largir lensemble des nombres rels celui des nombres complexes. Un nombre complexe z se prsente souvent sous la forme dune somme
z = a + bi
o a et b sont des nombres rels et i est un nombre imaginaire particulier tel
que
i 2 = 1.
De l, il dcoule que
i 3 = (i 2 )(i )
= (1)(i )
= i
4

i = (i 2 )(i 2 )
= (1)(1)
=1
5

i =i
i 6 = 1

50

Rappels danalyse, de probabilit et de statistique


et ainsi de suite. partir du dveloppement connu de e x ,
ex = 1 + x +

x2 x3 x4
+
+
+...,
2!
3!
4!

dmontrer lidentit dEuler e i = 1 en suivant les tapes suivantes.


a) Dvelopper autour de c = 0 la fonction f (x) = cos(x).
b) Dvelopper autour de c = 0 la fonction f (x) = sin(x).
c) Dvelopper, en remplaant x par i x la fonction f (x) = e i x .
d) Dmontrer lidentit e i x = cos(x) + i sin(x).
e) Dmontrer lidentit e i = 1.
1.6 Soit la fonction
F (x) =

1
1 + e x

< x < .

Dmontrer quil sagit dune fonction de rpartition.


1.7 Soit X , une variable alatoire continue avec fonction de densit f (x) et fonction de rpartition F (x). On choisit une valeur quelconque x 0 et on dfinit la
fonction
( f (x)
,
x x0
g (x) = 1F (x0 )
0,
x < x0 .
On suppose que F (x 0 ) < 1. Dmontrer que g (x) est une densit de probabilit.
1.8 Soit X , une variable alatoire avec une distribution de Pareto(, ) :
f (x) =

,
(x + )+1

x > 0, > 0, > 0.

Calculer la fonction de survie S(x) = 1 F (x) et en faire le graphique pour = 2


et = 3 000.
1.9 Soit X , une variable alatoire avec une distribution Binomiale(n, p), cest-dire que
!
n x
Pr[X = x] =
p (1 p)nx , x = 0, 1, . . . .
x
Dterminer la distribution de la variable alatoire Y = n X .
1.10 Soit X N (, 2 ). La variable alatoire Y = e X est distribue selon la loi
log-normale.

1.14. Exercices

51

a) Exprimer la fonction de densit de probabilit et la fonction de rpartition


de Y en fonction de celles de X .
b) Calculer Var[Y ].
1.11 La distribution de Cauchy a comme fonction de densit de probabilit
f (x) =

1 1
,
1 + x2

< x < .

Dmontrer que lesprance de cette distribution nexiste pas, cest--dire que


E [|X |] = .
1.12 Soit X , une variable alatoire avec densit Poisson() et soit g (x), une fonction
telle que < E [g (X )] < et < g (1) < . Dmontrer que E [g (X )] =
E [X g (X 1)].
1.13 Soient X et Y , deux variables alatoires continues. On dfinit
M = max(X , Y )
m = min(X , Y ).
Dmontrer que E [M ] = E [X ] + E [Y ] E [m].
1.14 Soit X , une variable alatoire avec densit
f X (x) = 7e 7x ,

0 < x < ,

et soit Y = 4X + 3. Calculer la densit de Y en utilisant la technique de la


fonction de rpartition.
1.15 Soit X , une variable alatoire avec densit
f X (x) = x 2 /9,

0 < x < 3.

Trouver la fonction de densit de probabilit de Y = X 3 .


1.16 Soit X , une variable alatoire avec distribution N (0, 2 ). Trouver la distribution de Y = X 2 .
1.17 Pour une densit quelconque, dmontrer que si la densit est symtrique par
rapport un point a, alors le coefficient dasymtrie est 0.
1.18 Soit X , une variable alatoire avec densit
f (x) = e x ,
Calculer son coefficient dasymtrie.

x > 0.

52

Rappels danalyse, de probabilit et de statistique


1.19 Soit X , une variable alatoire avec densit
1
f (x) = ,
2

1 < x < 1.

Calculer son coefficient daplatissement et commenter.


1.20 Dterminer la fonction gnratrice des moments de la densit
f (x) =

2x
,
c2

0 < x < c.

1.21 Soit X 1 et X 2 les moyennes de deux chantillons alatoires indpendants de


taille n dune population avec variance 2 , trouver une valeur de n telle que
h
i
0,99.
Pr | X 1 X 2 | <
5
1.22 Soit X la moyenne dun chantillon de taille 100 issu dune loi 2 (50).
a) Trouver la distribution exacte de X .
b) Calculer laide dun logiciel statistique la valeur exacte de Pr[49 < X < 51].
c) Calculer une valeur approximative de la probabilit en b).
un estimateur de la variance dune loi de Pareto(3, 1 000). Sachant que
1.23 Soit ,
= 749 500 et que Var[]
= 750, trouver le biais et lerreur quadratique
E []

moyenne de .
1.24 Soit X 1 , . . . , X n , un chantillon alatoire dune population avec moyenne et
variance 2 .
P
a) Dmontrer que lestimateur T (X ) = ni=1 a i X i est un estimateur sans biais
P
de si ni=1 a i = 1.
b) On nomme les estimateurs de la forme en a) des estimateurs sans biais
linaires. Parmi ceux-ci, trouver celui avec la plus petite variance.
1.25 Soit X 1 , . . . , X n un chantillon alatoire dune distribution avec moyenne et
P
variance 2 . Dmontrer que n 1 ni=1 (X i )2 est un estimateur sans biais de
2 .
1.26 Soit X , une observation dune population dont la densit est
|x|

f (x; ) =
(1 )1|x| , x = 1, 0, 1; 0 1.
2
Soit lestimateur
T (X ) =

(
2,

0,

x =1
ailleurs.

Dmontrer que T (X ) est un estimateur sans biais pour .

1.14. Exercices

53

1.27 Soit X Binomiale(n, p). Dmontrer que

X
X
1
n
n
n

est un estimateur biais de la variance de X . Calculer le biais de lestimateur


ci-dessus.
1.28 Calculer lefficacit de X comme estimateur du paramtre dune distribution de Poisson.
1.29 Deux experts tentent dvaluer le montant des dommages causs par un
ouragan. La variable alatoire X reprsente lvaluation du premier expert et
la variable alatoire Y reprsente lvaluation faite par le second expert. On
suppose que les deux experts travaillent de faon indpendante. Les donnes
suivantes sont connues : E [X ] = 0,8z, E [Y ] = z, Var[X ] = z 2 , et Var[Y ] = 1,5z 2 ,
o z reprsente le vrai montant des dommages. On considre une classe
destimateurs pour z de la forme
Z = X + Y .
Dterminer les valeurs de et qui feront de X lestimateur sans biais
variance uniformment minimale de z.
1.30 Soit
f (x; ) =

1 (1)/
x
,

0 < x < 1, > 0.

a) Identifier cette distribution.


b) Dmontrer que lestimateur du maximum de vraisemblance de est
n
1X
=
ln X i .
n i =1

c) Dmontrer que est un estimateur sans biais de .

Rponses
1.1

1
2

1.2 1
1.3 e

54

Rappels danalyse, de probabilit et de statistique


1.4 a) x plus rapide que ln(x) b) e x plus rapide que x
x
1.8 S(x) = x+
1.9 Binomiale(n, 1 p)
1.10 a) F Y (x) = F X (ln x), f Y (x) = x 1 f X (ln x) b) e 2+ (e 1)
2

1.14 f Y (y) = 74 e 4 (y3) ,

y >3

1
27 , 0 < y < 27
Gamma( 12 , 12 2 )

1.15 f Y (y) =
1.16

1.18 2
1.19 9/5
1.20 2(ct )2 (ct 2t c e t c + 1)
1.21 332
1.22 a) Gamma(2 500, 50) b) 0,682722 c) 0,6826
1.23 Biais : 500 ; MSE : 250 750
1.24 a) X
1.28 1
1.29 = 0,6122, = 0,5102.
1.30 a) Bta(1/, 1)

2 Modlisation en assurance IARD


Objectifs du chapitre
x Distinguer les donnes de sinistres individuelles des donnes groupes et choisir
quel type utiliser selon le contexte.

x Connatre les dfinitions et leffet sur les donnes de sinistres des modifications

x
x
x
x
x

de couverture suivantes : franchise forfaitaire, franchise atteinte, limite de police,


coassurance, inflation.
Dfinir les variables alatoires du montant pay par sinistre et du montant pay
par paiement en prsence dune ou plusieurs des modifications de couvertures
ci-dessus.
Calculer des quantits lies aux variables alatoires pour donnes modifies : densit, quantiles, moments, moments limits, esprance rsiduelle.
Mesurer leffet de lintroduction dune modification de contrat pour lassureur
laide du rapport dlimination de perte.
valuer leffet de linflation sur la frquence et la svrit des sinistres.
Crer, modifier et indicer des donnes individuelles et des donnes groupes avec
R.
Crer et utiliser des fonctions R pour calculer la fonction de densit ou la fonction
de rpartition dune variable alatoire pour donnes modifies.

Ce document traite de modlisation en assurance IARD, avec une emphase


sur la modlisation des montants de sinistres. Il convient donc de dbuter par une
courte discussion du processus de modlisation lui-mme.
Nous baserons notre modlisation sur des donnes historiques de sinistres.
Ces donnes peuvent se prsenter sous diffrentes formes. De plus, les donnes
en assurance IARD ont ceci de particulier que les polices comportent souvent
une franchise, une limite ou une clause de coassurance. Les montants de sinistres
sont galement soumis linflation. Ce chapitre prsente donc les dfinitions
mathmatiques de ces modifications aux contrats dassurance et il tudie leur effet
sur les oprations de lassureur.
55

56

Modlisation en assurance IARD

2.1

Processus de modlisation

Un modle est une description plus ou moins simplifie dune ralit. Le modles actuariels peuvent tre de plusieurs types :

x cots des rparation aprs incendie dune maison ;


x frquence des accidents automobiles ;
x dcs de personnes dans une population ;
x cots pour la couverture pour mdicament ; ou
x garantie de rendement dun fonds, etc.
Le modle permet de prvoir les cots futurs dun systme dassurance et de mesurer le risque relatif ces prvisions. En ralisant la modlisation, il faut toutefois
trouver un certain quilibre entre simplicit et vraisemblance du modle.
Le processus de modlisation compte les tapes suivantes :
1. trouver un modle (sous forme paramtrique ou non) dcrivant bien les donnes disponibles ;
2. calibrer le modle, par exemple en estimant ses paramtres ;
3. valider le modle, par exemple en mesurant lajustement laide de tests statistiques ;
4. au besoin, rpter les tapes ci-dessus pour un ou plusieurs modles alternatifs ;
5. choisir un modle selon un ou des critres dtermins ;
6. adapter le modle pour utilisation future, pour tenir compte de linflation, par
exemple.

2.2

Donnes

Les donnes en assurance dommages se prsentent principalement sous deux


formes :
Individuelles Le montant individuel de chaque sinistre est connu :
{141, 16, 46, 40, 351}.
Cest videmment la forme la plus rpandue, surtout maintenant que lespace
de stockage des donnes nest plus tellement un facteur limitatif ;
Groupes Les montants de sinistres individuels sont inconnus. On ne dispose que
dun sommaire du nombre de sinistres par intervalle. Un jeu de donnes
groupes rvle gnralement quil y a eu n j sinistres dans lintervalle de
cots (c j 1 , c j ], j = 1, . . . , r (avec possiblement c r = ). Par exemple :

2.2. Donnes

57

Intervalle

Nombre dobservations

(0, 25]
(25, 50]
(50, 100]
(100, 150]
(150, 250]
(250, 500]

30
31
57
42
65
84

Les donnes groupes contiennent moins dinformation que les donnes


individuelles, mais elles sont plus compactes entreposer. Elles sont aujourdhui peu utilises en pratique pour le stockage, mais leur tude demeure
pertinente du fait que plusieurs procdures statistiques requirent un regroupement des donnes individuelles (pensons seulement lhistogramme).
De plus, les contrats dassurance IARD comportent souvent diffrentes modalits visant rduire la charge financire de lassureur. Par exemple :

x une franchise qui limine les petites rclamations et permet dviter une frquence trop leve de sinistres entranant beaucoup de frais administratifs ;

x une limite suprieure qui permet lassureur de connatre le montant maximal


quil va payer ;

x une coassurance qui responsabilise lassur.


De ce fait, les montants rels des sinistres diffrent parfois des montants enregistrs dans les bases de donnes de lassureur. Lassureur doit donc travailler avec
des donnes incompltes. On entend par donnes incompltes le fait que lon ne
connat pas la valeur exacte de tous les sinistres survenus ainsi que leur nombre. Il
existe principalement deux types de donnes incompltes :
Tronques Les observations sous (troncature par le bas) ou au-dessus (troncature
par le haut) dun certain seuil sont compltement exclues de lensemble des
donnes. Le cas le plus frquent en assurance est la troncature par le bas
cause par une franchise ;
Censures Lexistence dobservations sous (censure par le bas) ou au-dessus (censure par le haut) dun certain seuil est connue, mais par leurs valeurs exactes.
Le cas le plus frquent en assurance est la censure par le haut cause par une
limite de police.
Soit X la variable alatoire du montant rel des sinistres et Y celle du montant
enregistr dans les bases de donnes de lassureur. En modlisant des donnes
incompltes, lactuaire a deux choix :

58

Modlisation en assurance IARD


1. ajuster un modle la variable alatoire Y . Peu utile, surtout si les conditions
du contrat changent ;
2. utiliser les donnes de Y pour extrapoler la distribution de X . Plus utile et
raisonnable si la franchise est relativement faible ou la limite leve.
Une description mathmatique plus dtaille des diffrentes modifications
possibles aux contrats sera faite plus loin, mais on prsente un premier exemple
illustrant limportance de tenir compte des modalits des contrats dans la modlisation des sinistres.
Exemple 2.1. Un assureur a enregistr les dix montants de sinistres suivants :
{130, 200, 260, 310, 450, 500, 520, 700, 700, 700}.
Lactuaire souhaite modliser les montants laide dune variable alatoire X ayant
comme distribution une loi exponentielle de paramtre , cest--dire avec fonction
de densit de probabilit
f X (x) = e x , x > 0.
Une technique destimation paramtrique comme la mthode des moments ou la
mthode du maximum de vraisemblance (mthodes qui seront prsentes dans
un chapitre ultrieur) conduit au rsultat
1
1
= =
.
x 447
Il faut maintenant tenter de vrifier de faon simple si le modle semble convenir aux donnes. On va donc comparer la distribution ajuste, une distribution
exponentielle de moyenne 447, avec une reprsentation intuitive de la densit des
donnes, lhistogramme. La figure 2.1 prsente le rsultat. La distribution ajuste ne
correspond pas trs bien lhistogramme des donnes. Dune part, la distribution
exponentielle est dfinie sur [0, ) alors que ltendue des donnes empiriques est
> range(x)
[1] 130 700

Dautre part, lchantillon ne semble pas provenir de la loi ajuste. Comparer


cet effet lhistogramme de la figure 2.1 ceux de la figure 2.2, crs partir dchantillons alatoire de taille 10 tirs dune distribution exponentielle de moyenne 447.
Malgr la petite taille des chantillons, la ressemblance est minime.
Enfin, la prsence dans lchantillon de trois donnes de mme valeur, 700,
suggre la prsence dune limite au contrat. En effet, la probabilit dobtenir, pour
le modle considr, dix valeurs infrieures ou gales 700 est
(F X (700))10 = (1 e 700/447 )10 = 0,0960.

2.2. Donnes

59

0.0000

0.0010

Density

0.0020

0.0030

Histogram of x

200

400

600

800

1000

F IG . 2.1: Comparaison entre lhistogramme des donnes et la densit ajuste

500

1000

1500
y

2000

2500

Density

0.0000

0.0010

0.0012
0.0008

Density

0.0000

0.0004

0.0008
0.0004
0.0000

Density

Histogram of y
0.0020

Histogram of y

0.0012

Histogram of y

500

1000
y

1500

2000

200

400

600

800

1000

F IG . 2.2: Histogrammes de trois chantillons tirs dune loi exponentielle de


moyenne 447

60

Modlisation en assurance IARD


On a donc un modle qui prsente une probabilit de moins de 10 % quun cas
aussi extrme que lchantillon se prsente.
On va maintenant rpter la modlisation des donnes, mais en tenant compte
cette fois de la toute vraisemblable limite de 700 $ au contrat. Pour ce faire, il ne
faut plus considrer les montants prsents plus haut comme tant les montants
rels des sinistres, mais comme tant les montants que lassureur a pays. Soit Y la
variable alatoire du montant pay par lassureur. Il sagit dune variable alatoire
censure par le haut. Dans le cas dune limite suprieure de 700, on a
(

Y =

X,

X 700

700,

X > 700.

Nous verrons plus loin que la fonction de densit de probabilit de la variable


alatoire Y est

0 y < 700

f X (y),
f Y (y) = 1 F X (700), y = 700

0,
y > 700.

,
0 y < 700

e
=

1 e 700 ,

0,

y = 700

y > 700.

Lestimation par la mthode du maximum de vraisemblance du paramtre


de cette dernire densit donne
=

1
.
637,51

Selon le modle, la proportion de donnes qui atteignent la limite est donc


= 1 e 700/637,51 = 0,3335,
f Y (700; )
soit une valeur prs de celle observe. Si lon considre maintenant uniquement les
donnes sous la limite, on obtient lhistogramme et la densit ajuste la figure 2.3.
Le modle semble dj mieux reprsenter les donnes.

2.3

Importation de donnes dans R

Les donnes sont rarement entres directement au clavier dans R. Pour les
importer dune source externe, on utilisera prfrablement la fonction scan. Dans

2.3. Importation de donnes dans R

61

0.0000 0.0005 0.0010 0.0015 0.0020 0.0025

Density

Histogram of x[x < 700]

100

200

300

400

500

600

700

x[x < 700]

F IG . 2.3: Comparaison entre lhistogramme des donnes sous la limite et la densit


censure ajuste

son utilisation la plus simple, celle-ci lit un fichier texte dans lequel se trouvent les
donnes, une par ligne ou spares par des blancs, en omettant les lignes dbutant
par le caractre spcifi dans largument comment.char. Le rsultat est plac dans
un vecteur.
Par exemple, pour importer les donnes du fichier donnees.txt reprsent la
figure 2.4, on fera simplement 1 :
> x <- scan("donnees.txt", comment.char = "#")
> x
[1] 141

16

46

40 351

Les fonctions de type read.table ou read.csv permettent dimporter des


jeux de donnes plus complexes comptant plusieurs variables. Cependant, il faut
1. Si le fichier ne se trouve pas dans le dossier de travail, il faut prciser le chemin daccs complet.

62

Modlisation en assurance IARD

# Les lignes dbutant par # sont des commentaires. Les donnes


# peuvent se trouver la suite l'une de l'autre ou sur des
# lignes diffrentes.
141
16
46
40
351

F IG . 2.4: Exemple de fichier de donnes importer dans R avec scan()

noter que ces fonctions retournent un data frame. Lindicage et le traitement des
data frames tant plus lent que celui des vecteurs simples, il est recommand de
transformer ses donnes dans ce dernier format, si possible.
Pour plus dinformations sur limportation de donnes dans R, consulter le
manuel R Data Import/Export, distribu avec R et disponible dans le site CRAN.

2.4

Consulter le code informatique de la section 2.13 pour des illustrations de la cration, de limportation et du traitement des donnes
individuelles et groupes avec R.

Variables alatoires pour donnes incompltes

La modlisation de donnes incompltes ncessite lintroduction des variables


alatoires suivantes :

x X : la variable alatoire du montant rel dun sinistre.


x Y P : la variable alatoire du montant pay par paiement par lassureur. Sil ny
pas de paiement pour un sinistre, la variable alatoire nest pas dfinie (aucune
donne napparat dans les bases de lassureur). Normalement, cette variable
alatoire est strictement positive.

x Y S : la variable alatoire du montant pay par sinistre par lassureur. Sil ny pas
de paiement pour un sinistre, la variable alatoire prend une valeur de 0. Elle est
donc dfinie mme si aucun paiement nest effectu.
Exemple 2.2. Soit un portefeuille de polices dassurance habitation des franchises
de 1 000 $. Ces polices gnrent les montants de sinistres suivants au cours dune

2.5. Franchises

63

Variable alatoire
X
YP
YS

Valeurs
750

900

1 200
200
200

5 000
4 000
4 000

10 000
9 000
9 000

TAB. 2.1: Dfinitions des variables alatoires dans lexemple 2.2

priode : 1 200, 5 000, 750, 10 000, 900. Le tableau 2.1 prsente les valeurs des
variables alatoires X , YP et YS .

2.5

Franchises

On distingue deux principales sortes de franchises dans les contrats dassurance


IARD :
1. Franchise forfaitaire (ou absolue, ordinaire, dduire ; ordinary deductible) :
lorsquun sinistre dpasse la franchise, lassureur ne paie que lexcdent de
celle-ci ;
2. Franchise atteinte (franchise deductible en anglais) : lorsquun sinistre dpasse
la franchise, lassureur paie le sinistre en entier.
On note le montant de la franchise par d .

2.5.1

Franchise forfaitaire

La variable du montant pay par paiement est une troncature par le bas et une
translation de la variable alatoire du montant du sinistre, conditionnellement ce
que ce sinistre dpasse la franchise. On a donc
n
Y P = X d, X > d
ou, pour faire ressortir plus clairement la nature conditionnelle de la variable
alatoire Y P :
Y P = X d |X > d .
Par consquent,
F Y P (x) = Pr[Y P x]
= Pr[X d x|X > d ]

Modlisation en assurance IARD

0.00

0.20
0.10
0.00

0.10

fX(x)

fYP(x)

0.20

0.30

0.30

64

10

10

(a) sans franchise

(b) avec franchise

F IG . 2.5: Densit de la distribution du montant pay par paiement sans et avec


franchise forfaitaire. La portion en gras est celle qui est commune aux deux courbes.

Pr[d < X x + d ]
Pr[X > d ]

0,
x <0
= F X (x + d ) F X (d )

, x 0
1 F X (d )
=

et, en drivant,

0,
x <0
f Y P (x) = f X (x + d )

, x 0.
1 F X (d )

La figure 2.5 montre leffet dune franchise forfaitaire sur la densit de Y P . On


voit que suite lintroduction de la franchise : 1) une partie de la densit (celle
sous la franchise) est supprime ; 2) la densit est translate vers la gauche ; 3) les
valeurs de la densit sont augmentes dun facteur (1F X (d ))1 afin que laire sous
la courbe soit toujours gale 1.
La variable alatoire du montant pay par sinistre a ceci de diffrent quelle
est dfinie lorsque quun sinistre natteint pas la franchise : lassureur sait quun
sinistre est survenu, mais il ne paie rien. La dfinition de la variable alatoire est

2.5. Franchises

65

donc
S

Y =

(
0,

X d,

X d
X >d

ou, de manire quivalente,


Y S = max(X d , 0).
La distribution de Y S est mixte, cest--dire quelle est continue pour Y S > 0 et
quelle a une masse de probabilit gale Pr[X d ] en 0. En effet,
F Y S (x) = Pr[Y S x]
(
Pr[X d ],
x =0
=
Pr[X x + d ], x > 0
(
F X (d ),
x =0
=
F X (x + d ), x > 0
et
f Y S (x) =

(
F X (d ),

x =0

f X (x + d ), x > 0.

La figure 2.6 montre leffet dune franchise forfaitaire sur la densit de Y S . Cette
fois, suite lintroduction de la franchise : 1) laire sous la densit dorigine entre 0
et la franchise est maintenant entirement concentre en 0 ; 2) la densit au-dessus
de la franchise est translate vers la gauche ; 3) les valeurs de la densit ne sont pas
autrement modifies puisque laire totale sous la densit est toujours gale 1.
Remarque. On a la relation suivante entre les variables alatoires du montant pay
par sinistre et du montant pay par paiement :
Y P = Y S |Y S > 0.

2.5.2

Franchise atteinte

Les variables alatoires Y P et Y S sont essentiellement les mmes avec une


franchise atteinte, lexception de la translation qui disparat puisque lassureur
paie la totalit des sinistres qui dpassent la franchise. On a donc
Y P = X |X > d ,

0.20
0.10

0.00

0.00

0.10

fX(x)

fYS(x)

0.20

0.30

Modlisation en assurance IARD

0.30

66

10

10

(a) sans franchise

(b) avec franchise

F IG . 2.6: Densit de la distribution du montant pay par sinistre sans et avec


franchise forfaitaire
do

0,
x <d
F Y P (x) = F X (x) F X (d )

, x d
1 F X (d )

et
f Y P (x) =

0,

x <d
f X (x)

, x d.
1 F X (d )

La figure 2.7 montre leffet dune franchise forfaitaire sur la densit de Y P .


De mme, la dfinition de la variable alatoire Y S est maintenant
(
0, X d
S
Y =
X , X > d.
Il y a toujours une masse 0, mais la densit est nulle sur (0, d ). En effet, Lassureur
peut payer un montant de 0, mais jamais un montant entre 0 et le montant de la
franchise. Ainsi,
(
F X (d ), x = 0
F Y S (x) =
F X (x), x > d

67

0.00

0.20
0.10
0.00

0.10

fX(x)

fYP(x)

0.20

0.30

0.30

2.5. Franchises

10

10

(a) sans franchise

(b) avec franchise

F IG . 2.7: Densit de la distribution du montant pay par paiement sans et avec


franchise atteinte

et
f Y S (x) =

(
F X (d ), x = 0

f X (x),

x > d.

On a donc la relation
Y P = Y S |Y S > d .
La figure 2.8 montre leffet dune franchise forfaitaire sur la densit de Y S .
La figure 2.9 runit pour fins de comparaison les densits de Y P et Y S pour les
deux types de franchise.

2.5.3

Fonction coverage

La fonction coverage du package actuar permet dobtenir facilement les fonctions de rpartition et fonctions de densit sous diverses combinaisons de modifications de couverture. On donne en argument la fonction

x f X () (si ncessaire) ;
x F X () (si ncessaire) ;
x la franchise d ;

0.20
0.10

0.00

0.00

0.10

fX(x)

fYS(x)

0.20

0.30

Modlisation en assurance IARD

0.30

68

10

10

(a) sans franchise

(b) avec franchise

F IG . 2.8: Densit de la distribution du montant pay par sinistre sans et avec


franchise atteinte

x le type de franchise (franchise = FALSE ou franchise = TRUE) ;


x la variable alatoire modifie souhaite (per.loss = FALSE ou per.loss = TRUE)
et la fonction retourne une nouvelle fonction pour calculer f Y P (x) ou f Y S (x) en tout
x.
La fonction permet aussi dajouter les modifications suivantes : limite suprieure, coassurance, inflation.

2.6

Pour des exemples dutilisation de la fonction coverage, consulter le


code informatique de la section 2.13.

Esprance limite

Soit X la variable alatoire du montant dun sinistre. On dfinit X u, la variable


alatoire du montant limit u :
X u = min(X , u)
(
X, X <u
=
u, X u.

69

fYS(x)

0.00

0.00

0.10

0.10

fYP(x)

0.20

0.20

0.30

0.30

2.6. Esprance limite

10

10

(b) Y S , franchise forfaitaire

fYS(x)

0.00

0.00

0.10

0.10

fYP(x)

0.20

0.20

0.30

0.30

(a) Y P , franchise forfaitaire

(c) Y P , franchise atteinte

10

10

(d) Y S , franchise atteinte

F IG . 2.9: Densits des variables alatoires Y P et Y S selon le type de franchise

70

Modlisation en assurance IARD


Lesprance de X u est lesprance limite de X (limited expected value, LEV) :
E [X u] E [X ; u].
Par dfinition de la variable alatoire, on a
u

E [X ; u] =
=

Z0 u
0

x f (x) d x + u

f (x) d x
u

x f (x) d x + u(1 F (u)).

De plus,
uZ x

E [X ; u] =

Z0 u Z0 u

f (x) d y d x + u(1 F (u))


f (x) d x d y + u(1 F (u))

(F (u) F (y)) d y + u(1 F (u))


Z u
Z u
= uF (u)
F (x) d x +
d x uF (u)
0
0
Z u
(1 F (x)) d x.
=
=

Remarque. Ce rsultat vaut aussi lorsque u , cest--dire

E [X ] =

(1 F (x)) d x,

condition que X > 0.


Exemple 2.3. Lesprance limite u de la distribution de Pareto avec fonction de
rpartition


F (x) = 1
, x >0
+x
et fonction de densit
f (x) =

,
( + x)+1

x >0

2.6. Esprance limite

71

est, si 6= 1,
u

E [X ; u] =

(1 F (x)) d x

Z u

dx
=
+x
0
0

1
=

1 x +
u

=
1
.
1
u +
0

Exemple 2.4. Soit Y N (, 2 ). La distribution de la variable alatoire X = e Y est


appele log-normale de paramtres et 2 . On a
F X (x) = Pr[e Y x]
= Pr[Y ln x]

ln x
,
=

o () est la fonction de rpartition dune N (0, 1), et

1
ln x

n 1 ln x 2 o
1 1
=p
exp
.
2

2 x

f X (x) =

On a donc
x

E [X ; x] =
=

Z0 x
0

x f (y) d y + x(1 F (x))

ln y
d y + x(1 F (x)).

Or, avec le changement de variable z = ln y,


Z x
Z ln x
z
x f (y) d y =
ez
dz

Z ln x
n 1 z 2 o
1
dz
=p
e z exp
2

2
Z ln x
n z 2 2z + 2 22 z o
1
=p
exp
dz
22
2

72

Modlisation en assurance IARD


puis, en compltant le carr dans lexposant,
n (z 2 )2 22 24 o
exp
dz
22

Z ln x
n 22 + 4 o
n 1 z 2 2 o
1
=p
exp
exp
dz
22
2

Z ln x
2
z 2
dz
= e + /2

ln x 2
+2 /2
.
=e

Z
0

ln x

x f (y) d y = p
2

Ainsi, on obtient
E [X ; x] = e

+2 /2

ln x 2
ln x

+x 1
,

x > 0.

Exemple 2.5. Soit Y S le montant pay par sinistre pour une franchise forfaitaire
de d . Puisque
(
F X (d ),
y =0
f Y S (y) =
f X (y + d ), y > 0,
on a
Z
y f X (y + d ) d y
E [Y S ] = 0 F X (d ) +
0
Z
=
(x d ) f X (x) d x
Zd
=
x f X (y) d x d (1 F X (d ))
Z

x f X (x) d x

x f X (x) d x d (1 F X (d ))

= E [X ] E [X ; d ].
On peut aussi astucieusement procder ainsi : on a
S

Y =

(
0,

X d,

X d
X >d

2.7. Esprance rsiduelle

73

ou, de manire quivalente,


(
S

Y =

X X,

X d

X d,

X >d

= X (X d ),
do E [Y S ] = E [X ] E [X ; d ].
Il est laiss en exercice de vrifier que
E [Y p ] =

2.7

E [X ] E [X ; d ]
.
1 F X (d )

Esprance rsiduelle

Lesprance rsiduelle reprsente lexcdent moyen des valeurs dune variable


alatoire suprieures x. En termes de dure de vie, lesprance rsiduelle est
appele esprance de vie future dun individu dge x. Mathmatiquement, on a
e(x) = E [X x|X > x]
Z
=
(y x) f X |X >x (y) d y
x
Z
1
(y x) f X (y) d y.
=
1 F X (x) x
Or, tel que vu lexemple 2.5 :
Z
(y x) f X (y) d y = E [X ] E [X ; x],
x

do
e(x) =

E [X ] E [X ; x]
.
1 F X (x)

Toujours de lexemple 2.5, on a donc que, pour une franchise forfaitaire d ,


E [Y P ] = e(d )
et
E [Y S ] = (1 F X (d ))e(d ).
Pour une franchise atteinte, on remplace simplement e(d ) par e(d ) + d dans les
expressions ci-dessus.

74

Modlisation en assurance IARD

2.8

Rapport dlimination de perte

Le rapport dlimination de perte (loss elimination ratio, LER) est une mesure de
lefficacit pour lassureur de lintroduction ou de laugmentation dune franchise
(et, par extension, de toute autre modification apporte un contrat).
Le LER est le rapport entre la diminution des cots esprs suite une modification apporte au contrat et les cots esprs sans celle-ci :
LER =

E [diminution des cots]


E [cots sans modification]

ou, de manire quivalente,


LER = 1

E [cots aprs modification]


.
E [cots sans modification]

Exemple 2.6. Soit X la variable alatoire du montant des sinistres et Y la variable


alatoire du montant des sinistres suite lintroduction dune franchise de d . On
sait que E [Y ] = E [X ]E [X ; d ]. Le rapport dlimination de perte li lintroduction
de la franchise est donc
E [X ] E [Y ]
E [X ]
E [X ] (E [X ] E [X ; d ])
=
E [X ]
E [X ; d ]
=
.
E [X ]

LER =

Exemple 2.7. Les sinistres suivants sont survenus pour un contrat dassurance :
{5, 10, 15, 20}.
Si lassureur introduit une franchise de 10 dans le contrat, il conomisera les montants suivants sur chacun des sinistres ci-dessus :
{5, 10, 10, 10}.
Son rapport dlimination de perte sera donc
5 + 10 + 10 + 10
5 + 10 + 15 + 20
= 0,70.

LER =

2.8. Rapport dlimination de perte

75

De manire quivalente, les cots de lassureur avec la franchise seront de


{0, 0, 5, 10},
do
5 + 10
5 + 10 + 15 + 20
= 0,70.

LER = 1

Exemple 2.8. Soit X Exponentielle(0,001), de sorte que E [X ] = 1 000. On a une


franchise de d = 500. Si lassureur souhaite doubler son rapport dlimination de
perte, combien doit-il augmenter sa franchise ?
Le LER pour une franchise de d est
LER =

E [X ; d ]
.
E [X ]

Or, si X Exponentielle(), alors


d

E [X ; d ] =

(1 F (x)) d x

e x d x

1 e u
=
.

Avec = 0,001 et d = 500, on a donc


LER =

1 000(1 e 0,5 )
= 0,3935.
1 000

Pour doubler ce rapport, on doit trouver la valeur de d tel que


1 000(1 e d /1 000 )
= 0,7870.
1 000
En rsolvant, on trouve d = 1 546.

76

Modlisation en assurance IARD

2.9

Limite suprieure

En introduisant une limite suprieure dans un contrat dassurance, un assureur


place un maximum sur le montant quil paiera pour un sinistre unique. Comme
les variables alatoires du montant pay par paiement (Y P ) et du montant pay
par sinistre (Y S ) sont quivalentes dans ce contexte, on notera simplement Y le
montant pay par lassureur.
Lintroduction dune limite est une censure par le haut de la variable alatoire
du montant dun sinistre, X . Soit u la limite suprieure. Alors on a
Y = min(X , u)
(
X, X u
=
u, X > u,
do
F Y (x) =

(
Pr[X x], 0 x < u

1,
x u,
(
F X (x), 0 x < u
1,

x u,

et

f Y (x) =

f X (x),

0x <u

1 F X (u), x = u

0,
x > u.

La figure 2.10 montre la fonction de rpartition et la fonction de densit dune


variable alatoire limite.
Remarques.
1. La limite est un concept dual de la franchise forfaitaire : leffet de la franchise
sur la variable alatoire du montant pay par lassureur est celui dune limite
sur la variable alatoire du montant reu par lassur.
2. Il nexiste pas, en pratique, de limite analogue la franchise atteinte : qui achterait un contrat qui ne paie rien si un sinistre dpasse la limite ?
Les contrats dassurance comportent souvent la fois une franchise forfaitaire d
et une limite suprieure u. Il importe alors de prciser dans quel ordre sappliquent
les quantits. En gnral, la limite sapplique avant la franchise :

77

0.20
fY(x)

0.6

0.10

0.4
0.2

FY(x)

0.8

1.0

0.30

2.9. Limite suprieure

0.0

0.00

10

10

(a) fonction de rpartition

(b) fonction de densit

F IG . 2.10: Fonction de rpartition et fonction de densit de probabilit de la distribution du montant pay par lassureur avec une limite suprieure

x le sinistre maximal couvert est u ;


x le montant payable maximal est u d .

La variable alatoire du montant pay par paiement, Y P , est dfinie comme

Y P = min(X , u) d |X > d
(
X d, d < X u
=
u d , X > u.

On dit que la variable alatoire Y P est gale la variable alatoire X tronque vers
le bas d , translate gauche et censure par le haut u. La fonction de rpartition

78

Modlisation en assurance IARD


est
F Y p (x) = Pr[min(X , u) x + d |X > d ]
Pr[d < min(X , u) x + d ]
Pr[X > d ]

F
(x
+
d ) F X (d )
X

, 0 x < u d

1 F X (d )
=

1 F X (d )

,
x u d
1 F X (d )

F X (x + d ) F X (d ) , 0 x < u d
1 F X (d )
=

1,
x u d.
=

En drivant, on obtient la densit

0,

f X (x + d )

1 F X (d )
f Y P (x) =

1 F X (u)

1 F X (d )

0,

x <0
0 x < u d
x = u d
x > u d.

La figure 2.11 montre leffet combin dune franchise forfaitaire et dune limite
sur la fonction de rpartition de Y P .
La variable alatoire du montant pay par sinistre, Y S , est
Y S = max(min(X , u) d , 0)

X d

0,
=

X d, d < X u

u d , X > u.

On a donc

F Y S (x) =

F X (d ),

x =0

F X (x + d ), 0 < x < u d

1,
x u d,

0.8
0.6
0.0

0.2

0.4

FYP(x)

0.6
0.4
0.0

0.2

FX(x)

0.8

1.0

79

1.0

2.9. Limite suprieure

10

10

(a) sans franchise ni limite

(b) avec franchise et limite

F IG . 2.11: Fonction de rpartition de la distribution du montant pay par paiement


sans et avec franchise forfaitaire et limite

et

F X (d ),

f (x + d ),
X
f Y S (x) =

1 F X (u),

0,

x =0
0 < x < u d
x = u d
x > u d.

La figure 2.12 montre leffet combin dune franchise forfaitaire et dune limite
sur la fonction de rpartition de Y S .
Exemple 2.9. Soient X la variable alatoire reprsentant le montant des sinistres,
u = 100, une limite suprieure ajout au contrat et Y , la variable alatoire reprsentant le montant pay par lassureur. On a donc
Y = min(X , 100).
Calculer le rapport dlimination de perte si les sinistres suivants sont survenus :
{50, 100, 150, 200}.

0.8
0.6
0.0

0.2

0.4

FYS(x)

0.6
0.4
0.0

0.2

FX(x)

0.8

1.0

Modlisation en assurance IARD

1.0

80

10

10

(a) sans franchise ni limite

(b) avec franchise et limite

F IG . 2.12: Fonction de rpartition de la distribution du montant pay par sinistre


sans et avec franchise forfaitaire et limite

On a
0 + 0 + 50 + 100
50 + 100 + 150 + 200
50 + 100 + 150 + 200 50 + 100 + 100 + 100
=

50 + 100 + 150 + 200 50 + 100 + 150 + 200

LER =

50+100+150+200
4
50+100+150+200
4

50+100+100+100
4
50+100+150+200
4

E [X ; 100]
E [X ]
= 0,30.

= 1

Lajout dune limite suprieure de 100 au contrat permet donc lassureur dliminer 30 % de la charge financire lie ce contrat.

2.10

Coassurance

Une coassurance reprsente la proportion du montant dun sinistre qui sera


assum par lassureur :
Y = X ,

0 1,

0.2
0.0

0.1

fY(x)

0.2
0.0

0.1

fX(x)

0.3

81

0.3

2.11. Inflation

10

10

(a) sans coassurance

(b) avec coassurance

F IG . 2.13: Densit de la distribution du montant pay sans et avec coasurance

do
f Y (x) =

x
1
fX
.

Leffet de la coassurance est une contraction de la distribution de X . La figure 2.13


montre cet effet sur la densit de Y .
De manire gnrale, la coassurance est applique en dernier. Combine avec
une franchise forfaitaire et une limite, on a donc
Y P = (min(X , u) d )|X > d
(
(X d ), d < X u
=
(u d ), X > u.

2.11

Inflation

Les modles pour les montants de sinistres sont construits partir dobservations survenues un certain nombre dannes dans le pass. En gnral, il est
ncessaire dajuster les modles obtenus afin de les amener au niveau actuel de
lexprience de pertes. De plus, on peut tre intress faire une projection du
modle afin de reflter les sinistres anticips dans une priode future.

fZ(x)

0.002
0.000

0.001

fX(x)

200

400

600

800

0.000 0.001 0.002 0.003

Modlisation en assurance IARD

0.003

82

200

400

600

800

(a) sans inflation

(b) avec inflation

F IG . 2.14: Densit de la distribution du montant pay sans et avec inflation

2.11.1

Effet de linflation

Soit X , la variable alatoire reprsentant le montant dun sinistre. On cherche


la distribution de
Z = (1 + r )X ,
o r 0 est le taux dinflation pour la priode dintrt. (La mthode pour dterminer r nest pas tudie ici.) La variable alatoire Z est une dilatation de X . Par
analogie avec le cas de la coassurance, on a
F Z (x) = Pr[Z x]
h
x i
= Pr X
x 1 + r
= FX
1+r
et
f Z (x) =

x
1
fX
.
1+r
1+r

La figure 2.14 montre leffet de linflation sur la densit de Z .


Exemple 2.10. On modlise le montant des sinistres par une distribution de Pareto
de paramtres = 2 et = 100. Si le taux dinflation est de 5 % par anne pendant

2.11. Inflation

83

trois ans, trouver la probabilit que, dans trois ans, le montant dun sinistre soit
infrieur ou gal 500 $.
On a X Pareto(2, 100) et Z = (1,05)3 X = 1,157625X . Il est laiss en exercice de
vrifier que Z Pareto(2, 115,7625). Par consquent,

Pr[Z 500] = 1

115,7625
500 + 115,7625

= 0,9647.
On pourrait aussi procder sans trouver la distribution de Z :

500
Pr[Z 500] = Pr X
1,157625

2
100
= 1
100 + 431,9188

= 0,9647.
On peut vrifier le rsultat ci-dessus avec R et actuar :
> F <- coverage(cdf = ppareto, inflation = 1.05^3 - 1)
> F(500, 2, 100)
[1] 0.9646565

Exemple 2.11. Un assureur modlise le montant dun sinistre par une Pareto de
paramtres = 2 et = k. Le contrat comporte une franchise de 2k. Calculer le
rapport dlimination de perte avant et aprs une inflation de 100 %.
Avant linflation, on a
LER =

E [X ; 2k]
E [X ]

21
k
k
1

21
2k+k

2k
2k + k
2
= .
3

k
21

84

Modlisation en assurance IARD


Posons Z = 2X comme tant la variable alatoire du montant dun sinistre aprs
inflation. On a Z Pareto(2, 2k) et donc
E [Z ; 2k]
E [Z ]
2k
=
2k + 2k
1
= .
2

LER =

2.11.2

Effet de levier pour une franchise

Linflation augmente les cots des sinistres. Si les contrats comportent une
franchise et que celle-ci demeure inchange, alors leffet de linflation est amplifi :

x la frquence des sinistres augmente puisque certains sinistres qui ne dpassaient


pas la franchise vont maintenant la dpasser ;

x cest la portion des sinistres en excdent de la franchise qui augmente.


Pour illustrer le second point, considrer le cas suivant : le remboursement pour
un sinistre de 600 avec une franchise de 500 est 100 ; aprs 10 % dinflation il est
maintenant de 160, une augmentation de 60 %.
Afin de tenir compte la fois de la frquence des sinistres et de leur svrit,
nous allons dmontrer que la prime pure aprs inflation est suprieure la seule
prime pure ajuste pour linflation.
Soit un contrat comportant une franchise de d qui demeure fixe dune anne
lautre. Par contre, les sinistres subissent leffet dun taux dinflation r . Pour le volet
svrit des sinistres, le montant pay par paiement par lassureur passe de
Y P = X d |X > d

V P = Z d |Z > d ,
o Z = (1 + r )X . On a donc
V P = (1 + r )X d |X >

d
1+r

On souhaite calculer E [V P ], le cot moyen des sinistres aprs inflation. On sait


que
E [Y S ] = E [X ] E [X ; d ]

2.11. Inflation

85

et
E [Y p ] =

E [X ] E [X ; d ]
.
1 F X (d )

Or, en dfinissant dabord


V S = max(Z d , 0)
= Z min(Z , d )
= (1 + r )X min((1 + r )X , d )
d
)
= (1 + r )X (1 + r ) min(X , 1+r
d
= (1 + r )(X min(X , 1+r
))

on trouve immdiatement que


d
E [V S ] = (1 + r )(E [X ] E [X ; 1+r
])

et, par analogie,


P

E [V ] =

d
])
(1 + r )(E [X ] E [X ; 1+r
d
1 F X ( 1+r
)

Tournons-nous maintenant vers le volet frquence des sinistres. Soit p, lesprance de la frquence des sinistres. On a alors que p(1 F X (d )) est lesprance
de la frquence des paiements (la frquence des sinistres pour lesquels lassureur
effectue un paiement). Aprs inflation, lesprance de la frquence des paiements
devient
d
p(1 F Z (d )) = p(1 F X ( 1+r
)).
Par consquent, si la prime pure avant inflation est
= p(1 F X (d ))E [Y P ]

E [X ] E [X ; d ]
= p(1 F X (d ))
1 F X (d )
= p(E [X ] E [X ; d ]),
elle devient, aprs linflation,
= p(1 F Z (d ))E [V P ]
d
= p(1 F X ( 1+r
))

d
(1 + r )(E [X ] E [X ; 1+r
])
d
1 F X ( 1+r
)

d
= p(1 + r )(E [X ] E [X ; 1+r
]).

86

Modlisation en assurance IARD


Or, puisque, pour r > 0,
d
E [X ; 1+r
] E [X ; d ],

on a que
(1 + r )p(E [X ] E [X ; d ])
et donc
(1 + r ).
En rsum, si un contrat dassurance comporte une franchise et que celle-ci
demeure inchange alors que les sinistres subissent une certaine inflation, la prime
pure subit une augmentation suprieure au taux dinflation. Cest leffet de levier
de linflation.
On remarquera en terminant que si le montant de la franchise d est ajust pour
devenir (1 + r )d , la prime pure subit une augmentation gale linflation.

2.11.3

Effet de levier pour une limite suprieure

Limposition dune limite suprieure dans un contrat dassurance protge lassureur contre les effets de linflation. En effet, si la limite demeure constante alors
que le cot des sinistres augmente, le rsultat net quivaut abaisser la limite.
Intuitivement, leffet de levier de linflation pour une limite suprieure sera lavantage de lassureur. Il ne reste qu tablir que la baisse des cots sera suprieure
linflation.
Clairement, la frquence des sinistres nest pas affecte par linflation dans un
contrat ne comportant quune limite suprieure u. Par contre, le montant pay par
paiement par lassureur passe de
Y = min(X , d )

V = min(Z , u)
= min((1 + r )X , u)
u
= (1 + r ) min(X , 1+r
).

Par consquent,
u
E [V ] = (1 + r )E [X ; 1+r
]

(1 + r )E [X ; u],

2.12. Franchise, limite, coassurance et inflation

87

do
E [V ] (1 + r )E [Y ].
Une limite suprieure a donc un effet modrateur sur la hausse de la prime
pure lorsque les sinistres augmentent avec linflation. Par contre, si le montant de
la limite u est ajust pour devenir (1 + r )u, la prime pure subit une augmentation
gale linflation.

2.12

Franchise, limite, coassurance et inflation

On traite ici du cas gnral o un contrat prsente une franchise forfaitaire d ,


une limite suprieure u, une coassurance et un taux dinflation r . La variable
alatoire du montant pay par sinistre est alors
Y S = max(min((1 + r )X , u) d , 0)

X < 1+r

0,
=

((1 + r )X d ),

(u d ),

d
1+r

X <
u
1+r

u
1+r

et celle du montant pay par paiement est


d
Y P = [min((1 + r )X , u) d ]|X > 1+r
(
d
u
((1 + r )X d ), 1+r
X < 1+r
=
u
(u d ),
X 1+r
.

Consulter la vignette "coverage" du package actuar pour les expressions et les


graphiques des fonctions de rpartition et des fonctions de densit de probabilit
des variables alatoires du montant pay par paiement et du montant pay par
sinistre, avec une franchise forfaitaire et une franchise atteindre, ainsi quune
limite.

2.13

Code informatique

###
### DONNES INDIVIDUELLES ET GROUPES
###
## Le vecteur simple (ou atomique) cr avec la fonction 'c' est encore

88

Modlisation en assurance IARD

## le meilleur mode de stockage des donnes individuelles:


x <- c(30, 70, 130, 200, 260, 310, 450, 500, 520, 700, 830, 1070)
## Pour illustrer la procdure d'importation de donnes individuelles
## avec 'scan', on cre un fichier de donnes partir de l'objet 'x'
## ci-dessus, puis on lit ces donnes avec 'scan' et on les stocke
## dans un nouvel objet.
write(x, "donnees.dat", ncol = 1) # cration du fichier
(y <- scan("donnees.dat"))
# importation dans y
unlink("donnees.dat")
# nettoyage: suppression du fichier
## Pour tronquer (par le bas) les donnes, il suffit de slectionner
## les observations au-dessus d'un certain seuil. Pour censurer (par
## le haut), on remplace les donnes au-dessus d'un seuil par ce
## seuil. La manire la plus simple de procder est l'aide de la
## fonction 'pmin'.
x[x > 100]
# troncature par le bas 100
pmin(x, 700)
# censure par le haut 700
pmin(x[x > 100], 700)
# les deux modifications
## Le traitement informatique des donnes groupes ncessite une
## mthode de stockage standard puisqu'il existe plusieurs diffrentes
## manires de les reprsenter dans un ordinateur: utiliser une
## matrice ou une liste, apparier les valeurs de n_j avec les c_{j
## - 1} ou avec les c_j, omettre ou non la valeur de c_0, etc. Le
## package actuar fournit des outils pour stocker, manipuler et
## rsumer les donnes groupes. Avec des fonctions d'extraction, de
## remplacement et de sommaire spcifiques, la manipulation des
## donnes groupes se rvle aussi simple que celle des donnes
## individuelles.
library(actuar)
# charger le package
##
##
##
##
##
##
(x

Cration d'un objet contenant des donnes groupes. On fournit deux


vecteurs: les bornes des classes et les frquences dans chaque
classe. Les classes sont supposes contigus. Puisqu'il faut
fournir la borne infrieure de la premire classe, le premier
vecteur compte un lment de plus que le second. Les tiquettes des
colonnes ("Classe" et "Frequence", ci-dessous) sont arbitraires.
<- grouped.data(Classe = c(10, 12, 14, 18, 23),
Frequence = c(3:1, 1)))

## Exemples de manipulations possibles avec de tels objets.


xx <- x
# copie de travail
xx[, 1]
# bornes des classes
xx[, 2]
# frquences

2.13. Code informatique

xx[c(1, 2), 2] <- c(4, 1); xx


xx[1, 1] <- c(9, 13); xx

89

# changement de frquences
# changement de bornes

###
### FONCTION 'coverage'
###
## La fonction provient du package actuar. Il faut le charger en
## mmoire si ce n'tait pas fait prcdemment.
library(actuar)
## La fonction 'coverage' retourne une fonction pour calculer la f.r.
## ou la f.d.p. de la variable alatoire du montant pay par paiement
## ou pay par sinistre modifie par une franchise (ordinaire ou
## atteindre), une limite, de la coassurance ou l'inflation.
##
## On examine les quatre combinaisons possibles de variables
## alatoires et de franchise. On suppose que la variable alatoire X
## a une distribution gamma. Le montant de la franchise est d = 1.
##
## 1. Montant par paiement et franchise ordinaire (cas par dfaut)
f <- coverage(dgamma, pgamma, deductible = 1) # cration de l'objet
mode(f)
# c'est une fonction
f
# code de la fonction
f(0, 3)
# calcul en x = 0
f(5, 3)
# calcul en x = 5
dgamma(5 + 1, 3)/pgamma(1, 3, lower = FALSE) # idem
curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale
curve(f(x, 3), from = 0.1, col = "blue", add = TRUE)
# modifie
## 2. Montant par sinistre et franchise ordinaire
f <- coverage(dgamma, pgamma, deductible = 1, per.loss =
f(0, 3)
pgamma(1, 3)
curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3))
curve(f(x, 3), from = 0.1, col = "blue", add = TRUE)
points(0, f(0, 3), pch = 16, col = "blue")

TRUE)
# masse 0
# idem
# originale
# modifie
# masse 0

## 3. Montant par paiement et franchise atteindre


f <- coverage(dgamma, pgamma, deductible = 1, franchise = TRUE)
f(0, 3)
# x = 0
f(0.5, 3)
# 0 < x < 1
f(1, 3)
# x = 1
f(5, 3)
# x > 1
dgamma(5, 3)/pgamma(1, 3, lower = FALSE)
# idem

90

Modlisation en assurance IARD

curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale


curve(f(x, 3), from = 1.1, col = "blue", add = TRUE)
# modifie
curve(f(x, 3), from = 0, to = 1, col = "blue", add = TRUE) # 0 < x < 1
## 4. Montant par sinistre et franchise atteindre
f <- coverage(dgamma, pgamma, deductible = 1,
per.loss = TRUE, franchise = TRUE)
f(0, 3)
# masse 0
pgamma(1, 3)
# idem
f(0.5, 3)
# 0 < x < 1
f(1, 3)
# x = 1
f(5, 3)
# x > 1
curve(dgamma(x, 3), from = 0, to = 10, ylim = c(0, 0.3)) # originale
curve(f(x, 3), from = 1.1, col = "blue", add = TRUE)
# modifie
points(0, f(0, 3), pch = 16, col = "blue")
# masse 0
curve(f(x, 3), from = 0.1, to = 1, col = "blue", add = TRUE) # 0 < x < 1
## La vignette (fichier PDF) contient les formules gnrales pour
## toutes les modifications possibles.
vignette("coverage")

2.14

Exercices

2.1 Les montants suivants reprsentent les cots associs aux rparations automobiles de 12 contrats :
{579, 110, 842, 213, 98, 445, 1 332, 162, 131, 276, 312, 482}.
Les contrats prsentent une franchise forfaitaire de 250 $. Calculer le rapport
dlimination de perte (LER) de lassureur.
2.2 Les montants suivants reprsentent les cots associs des accidents automobiles pour huit contrats :
{86 000, 123 000, 423 000, 43 000, 213 000, 28 000, 52 000, 178 000}.
Les contrats prsentent une limite suprieure de 100 000 $. Calculer le rapport
dlimination de perte de lassureur.
2.3 Pour un portefeuille dont le montant dun sinistre obit une loi exponentielle
de paramtre 0,02, trouver le rapport dlimination de perte dcoulant de
lintroduction des limites de couvertures suivantes.
a) Une franchise atteinte de 10.
b) Une franchise forfaitaire de 10.

2.14. Exercices

91

2.4 On suppose que le montant dun sinistre obit une distribution gamma de
paramtres = 4 et = 0,1. Un assureur a sign un trait avec un rassureur o
ce dernier sengage payer lexcdent de 100 sur chacun des sinistres. Trouver
le rapport dlimination de perte de lassureur.
2.5 Dans un groupe dassurs, les sinistres suivants sont survenus :
{20, 50, 80, 80, 80, 85, 90, 110, 150, 240, 360, 400}.
Trouver le rapport dlimination de perte de lassureur si celui-ci a instaur
une franchise forfaitaire de 70 et sil limite ses paiements 200.
2.6 Soit X , la variable alatoire reprsentant le montant dun sinistre. On sait que
E [X ] = 2 000, que E [X ; 30 000] = 1 640,79 et que le rapport dlimination de
perte de lassureur pour un contrat avec une franchise forfaitaire de 100 est de
0,0465. Trouver le rapport dlimination de perte de lassureur pour un contrat
avec une franchise forfaitaire de 100 et une limite suprieure de 30 000.
2.7 Soit X , une variable alatoire reprsentant le montant dun sinistre tel que
f X (x) = e 2x +

e x
,
2

x > 0.

a) Trouver E [X ; d ].
b) Soit N , une variable alatoire reprsentant la frquence des sinistres. Calculer la prime pure (frquence moyenne multiplie par la svrit moyenne)
pour une franchise de d = 0,25 et une frquence moyenne de un sinistre
tous les 10 ans.
c) Si on observe un taux dinflation de 5 %, que devient la prime pure ?
2.8 On suppose que le montant dun sinistre obit une loi Pareto de paramtres
= 1,5 et = 2 500.
a) Calculer le montant moyen des sinistres pay par un assureur pour un
contrat de rassurance avec une rtention de 50 000.
b) Trouver le rapport dlimination de perte pour le rassureur si la rtention
est de 100 000.
2.9 Soit Y P la variable alatoire du montant pay par paiement pour un contrat
dassurance avec une franchise forfaitaire de d et X est la variable alatoire du
montant dun sinistre. Dmontrer que
E [Y P ] =

E [X ] E [X ; d ]
,
1 F X (d )

o E [X ; d ] = E [min(X , d )] est lesprance limite de X d . Interprter le rsultat.

92

Modlisation en assurance IARD


2.10 Un assureur dcide de modliser X , la variable alatoire du montant dun
sinistre, par une distribution Weibull de paramtres = 3 et = 1/15. Tracer (idalement de manire informatique, laide du package actuar) les
graphiques des variables alatoires suivantes.
a) La variable alatoire du montant pay par sinistre pour un contrat avec
une franchise forfaitaire de 10.
b) La variable alatoire du montant pay par paiement pour une franchise
atteinte de 10 et une limite suprieure de 40.
c) La variable alatoire du montant du sinistre avec une coassurance de 80 %.

2.14. Exercices

93

2.11 Un assureur dispose des informations suivantes :

x le montant dun sinistre pour lanne 1990 obit une loi Pareto de paramtres = 1,5 et = 1 500 ;

x un taux dinflation de 5 % par anne a t observ entre 1990 et 1992 et de


6 % par anne entre 1992 et 1995 ; et

x une franchise de 500 est introduite en 1995.


a) Calculer le rapport dlimination de perte pour lassureur en 1995.
b) Lassureur paie un sinistre en 1995. Dterminer la probabilit quil paie
plus de 2 000 $
c) Dterminer la charge espre par sinistre de lassureur sil avait dcid en
1995 de ne pas payer plus de 3 500 $ par sinistre (en plus de la franchise de
500 $).
2.12 Le tableau ci-dessous prsente, sous forme groupe, les montants pays par
sinistre pour des sinistres en assurance habitation couverts par des contrats
ayant une limite suprieure de 300 000 $.
Montant pay

Nombre

Montant moyen

0 2 500
2 500 7 500
7 500 12 500
12 500 17 500
17 500 22 500
22 500 32 500
32 500 47 500
47 500 67 500
67 500 87 500
87 500 125 000
125 000 225 000
225 000 300 000
300 000

41
48
24
18
15
14
16
12
6
11
5
4
3

1 389
4 661
9 991
15 482
20 232
26 616
40 278
56 414
74 985
106 851
184 735
264 025
300 000

Pour modliser les donnes, on utilise une distribution log-normale de paramtres et 2 . laide dune technique destimation quelconque, on trouve
= 1,596.
que = 9,356 et
a) Estimer le montant pay espr.
b) Estimer le pourcentage de changement dans le montant pay par paiement espr si lon observe une inflation de 10 % des sinistres.

94

Modlisation en assurance IARD


c) Estimer le pourcentage de rduction dans le montant pay espr si lon
dcide dajouter une franchise de 1 000 $ au contrat de base (on ne tient
plus compte de linflation).
2.13 Soit X , la variable alatoire reprsentant le montant dun sinistre en responsabilit professionnelle pour un mdecin. On suppose que la compagnie
dassurance achte un trait de rassurance de rtention par rclamation,
cest--dire que le rassureur paie lexcdent des pertes au-dessus de pour
chaque rclamation. Si lon suppose que X a une distribution de Pareto(, ),
dmontrer que la distribution du montant pay par paiement du rassureur
a une distribution de Pareto de paramtres et + .
2.14 On suppose que le montant dun sinistre obit une loi exponentielle de
paramtre 3, cest--dire que
f (x) = 33x ,

x > 0.

On introduit une franchise forfaitaire de 0,2. Lorsque lassureur effectue un


paiement, quelle est la probabilit quil soit de plus de 0,50 ?
2.15 Une compagnie dcide dacheter deux contrats dassurance pour lanne
venir. Le montant moyen des sinistres pour une anne est de 11 100 $. La
police A a une franchise forfaitaire de 5 000 $ et ne prsente pas de limite,
alors que la police B a une limite de 5 000 $ et ne prsente pas de franchise.
Pour la police A, lesprance de la variable alatoire du montant pay par
sinistre, Y S , est de 6 500 $ et lesprance de la variable alatoire du montant
pay par paiement, Y P , est de 10 000 $. Sachant quun sinistre dun montant
plus petit ou gal 5 000 $ sest produit, calculer lesprance de la variable
alatoire du montant pay par paiement pour le contrat B.
2.16 Un assureur utilise une distribution binomiale ngative de paramtres r = 3 et
= 1/6 pour modliser la frquence des sinistres par anne et une distribution
de Weibull de paramtres = 0,3 et = 1/1 000 pour modliser la svrit
des sinistres. Il dcide galement dappliquer une franchise forfaitaire de 200.
Dterminer le nombre espr de paiements que fera lassureur par anne.
2.17 Pour un contrat comportant une franchise forfaitaire de d , une limite suprieure de u et une coassurance de , la variable alatoire du montant pay
par sinistre, Y S , est donne partir de la variable alatoire du montant dun
sinistre, X , par

X <d

0,
S
Y = (X d ), d X < u

(u d ), X u.

2.14. Exercices
a) Dmontrer que E [Y S ] = (E [X ; u] E [X ; d ]).
b) Trouver Var[Y S ].
c) Trouver lexpression gnrale de lesprance du montant pay par sinistre
la suite dune inflation de 100r %.
2.18 Soient Y S , la variable alatoire du montant pay par sinistre, X , la variable
alatoire du montant dun sinistre, d une franchise forfaitaire et u, une limite
suprieure. Dmontrer la relation E [Y S ] = E [X ; u] E [X ; d ] laide dintgrales, et non par une dfinition astucieuse de la variable alatoire Y S .
2.19 Le ratio de perte (loss ratio) R est dfini comme tant le montant total des
sinistres pays pendant lanne, S, divis par le montant total des primes
reues pendant lanne, . Une compagnie dassurance souhaite bien entendu conserver ce ratio sous un certain niveau pour ne pas tre en difficult
financire. Pour ce faire, elle offre un bonus B ses agents la fin de lanne
si le ratio de perte pour lanne est infrieur 75 %. Le montant du bonus est
calcul comme suit :

0,75 R
.
B = max 0,
3
Calculer le montant espr du bonus si = 600 000 et que la distribution de
la variable alatoire S est une Pareto avec paramtres = 3 et = 700 000.
2.20 Soit X , une variable alatoire reprsentant le montant dun sinistre. Un assureur souhaite connatre les paiements sa charge pour un contrat dassurance
incluant une franchise dcroissante (disappearing deductible). Dans ce type
de contrat, lassur assume en entier tout sinistre infrieur d et lassureur
assume en entier tout sinistre suprieur d . Entre d et d , le paiement
effectu par lassureur est une fonction linaire du montant dun sinistre.
a) Dfinir la variable alatoire Y P reprsentant le montant pay par paiement
pour un contrat avec une franchise dcroissante.
b) Trouver lexpression gnrale en termes de E [X ], E [X ; x] et F X (x) du montant pay par paiement espr.

Exercices proposs dans Loss Models, 4e d.


3.5, 3.7, 3.8, 3.9, 3.11, 3.15, 8.1 8.2, 8.3, 8.5 8.7 8.8 8.11, 8.12, 8.14, 8.16, 8.17, 8.18,
8.19, 8.23, 8.24, 8.25, 8.26, 8.27. 8.28

95

96

Modlisation en assurance IARD

Rponses
2.1 0,4946
2.2 0,4686
2.3 a) 0,0175 b) 0,1813
2.4 0,0034
2.5 0,567
2.6 0,226
2.7 a) (3 e 2d 2e d )/4 b) 0,0541 c) 0,0576
2.8 a) 1 091,09 b) 0,8438
2.11 a) 0,1069 b) 0,4107 c) 1 255,23
2.12 a) 33 962 b) +8,04 % c) 2,87 %
2.14 0,22
2.15 3 857
2.16 8,0925
2.17 a) 2 (E [X 2 ; u 2 ] E [X 2 ; d 2 ] 2d E [X ; u] + 2d E [X ; d ]) 2 (E [X ; u] E [X ; d ])2
b) (1 + r )(E [X ; u/(1 + r )] E [X ; d /(1 + r )])
2.19 76 559,55
2.20 a) (E [X ] + d /(d d )E [X ; d ] d /(d d )E [X ; d ])/(1 F X (d ))

3 Modlisation non paramtrique


Objectifs du chapitre
x Dfinir les statistiques descriptives les plus usuelles dun chantillon de montants de

x
x
x
x
x
x
x
x

sinistres : moments et moments centraux, esprance rsiduelle, esprance limite,


quantiles.
Dfinir et calculer la fonction de rpartition empirique et la fonction de masse de
probabilit empirique pour des donnes individuelles.
Dfinir et calculer la fonction de rpartition empirique, logive et lhistogramme
pour des donnes groupes.
Dfinir et calculer les estimateurs de Nelsonalen et de KaplanMeier de la fonction de survie partir dun chantillon de donnes tronques et censures.
Calculer la variance de lestimateur de KaplanMeier en un point et construire un
intervalle de confiance pour la fonction de survie.
Dfinir et calculer un estimateur par noyaux de la fonction de densit ou de la
fonction de rpartition sous-jacente dun chantillon de donnes.
Calculer les statistiques descriptives empiriques partir dune estimation de la
fonction de rpartition.
Dterminer un intervalle de confiance pour un quantile.
Calculer les quantits nonces ci-dessus avec R et crer des graphiques des estimateurs de la fonction de densit, de la fonction de rpartition et de lesprance
limite.

Dans ce chapitre, on dveloppe directement partir des donnes des estimateurs de la fonction de rpartition, de la fonction de densit et de certaines quantits lies dune variable alatoire sans faire dhypothse quant la distribution
complte de cette variable alatoire. Cest lapproche non paramtrique.
Cette approche a comme avantages dtre flexible et de bien prendre en compte
la disparit des donnes. De plus, elle peut tre trs prcise lorsque le nombre de
donnes est grand. Par contre, elle est souvent moins efficace quune approche
paramtrique et linfrence statistique qui en rsulte est plus complique.
97

98

Modlisation non paramtrique

3.1

Statistiques descriptives

Les statistiques ci-dessous dcrivent rapidement la distribution dune variable


alatoire. Elles sont habituellement estimes partir dun chantillon de la variable
alatoire, souvent de manire non paramtrique.
La plupart de ces lments ont dj t prsents la section 1.3.

3.1.1

Moments

Lorsquil existe, on nomme moment dordre k de la variable alatoire X lesprance de cette dernire leve la puissance k :
0k = E [X k ]
Z
x k d F (x).
=
0

En particulier, le premier moment est E [X ] = = 01 .

3.1.2

Moments centraux

On nomme, lorsquil existe, moment central dordre k de la variable alatoire X


lesprance de la diffrence entre cette dernire et la moyenne, leve la puissance
k. Il sagit donc dune mesure de la dispersion de X autour de son esprance. On a
k = E [(X E [X ])k ]
Z
=
(x )k d F (x).
0

En particulier, on dfinit les quantits suivantes :

x variance :
2 = Var[X ]
= 2
= 02 2 ;

x coefficient de variation :
p
Var[X ]
CV(X ) =
E [X ]

= ;

3.1. Statistiques descriptives

99

x coefficient dasymtrie (skewness) :


1 (X ) =

E [(X )3 ]

Var[X ]3/2
3
= 3;

x coefficient daplatissement ou coefficient dexcs (kurtosis) :


E [(X )4 ]
Var[X ]2
4
= 4.

2 (X ) =

3.1.3

Esprances rsiduelle et limite

Lesprance rsiduelle est utile pour mesurer lpaisseur relative des queues des
distributions. Nous avons tabli son lien avec lesprance limite la section 2.7,
soit :
e(x) = E [X x|X > x]
Z
1
=
(y x)d F (y)
1 F (x) x
E [X ] E [X ; x]
=
.
1 F (x)
Lesprance limite est la moyenne des valeurs censures x dune variable
alatoire.
Plus intressante pour dcrire des donnes, lesprance rsiduelle reprsente
quant elle lexcdent moyen des valeurs dune variable alatoire au-dessus de
x. Ainsi, plus cette esprance est grande (pour un mme x), plus la queue de la
distribution est lourde. Voir la figure 3.1, inspire de Hogg et Klugman (1984), pour
une comparaison de la fonction desprance rsiduelle pour quelques lois usuelles.
Nous verrons plus loin comment estimer les esprances limite et rsiduelle
partir des donnes. On pourra ensuite utiliser ces estimations pour identifier
des modles potentiels pour les donnes. Par exemple, si lesprance rsiduelle
empirique crot plus ou moins linairement, on favorisera la loi de Pareto comme
modle.

3.1.4

Quantiles

La dfinition robuste de quantile est la suivante : p est le 100p e quantile


dune distribution F () si, et seulement si,
lim F (p h) p F (p ).

h0

Modlisation non paramtrique

Pa
r

et
o

1500

100

1000

1),
ll ( <
Weibu ormale
logn

e(x)

Gamma
(

> 1)

500

Exponentielle

1)

Weibull (
>

500

1000

1500

F IG . 3.1: Esprance rsiduelle pour quelques lois usuelles

Ainsi, tout nombre pour lequel la fonction de rpartition vaut au moins p est le
100p e quantile de la distribution. Pour une distribution continue, cela se rsume
au point p tel que F (p ) = p. Par contre, le quantile nest pas unique pour les fonctions de rpartition non strictement croissantes, comme les fonctions en escalier
des variables alatoires discrtes.
Par exemple, pour la fonction de rpartition reprsente la figure 3.2, on a
3 0,6 < 4.

3.2

Fonctions de rpartition et de probabilit


empiriques

La premire tape dun processus de modlisation consiste souvent tracer


des graphiques tels que ceux prsents la figure 3.3 permettant de dterminer globalement la distribution des donnes. Les fonctions sous-jacentes ces graphiques

1.0

3.2. Fonctions de rpartition et de probabilit empiriques

0.6
0.4

0.2

F(x)

0.8

0.0

F IG . 3.2: Exemple de fonction de rpartition en escalier pour laquelle les quantiles


ne sont pas uniques

constituent en fait des estimateurs de la fonction de rpartition et de la fonction de


densit de probabilit.
partir de ce point et jusquau chapitre 7 o lon tudiera la modlisation de la
frquence des sinistres, on pose que X reprsente la variable alatoire (continue)
du montant dun sinistre avec fonction de rpartition F (x). Lassureur dispose
dobservations X 1 , . . . , X n (sous forme individuelle ou groupe). Par convention, on
suppose que X 1 , . . . , X n forme un chantillon alatoire de la variable alatoire X .

3.2.1

Donnes individuelles

Pour construire la fonction de rpartition empirique, F n (x), et la fonction de


masse de probabilit empirique, f n (x), on attribue chacune des donnes un
poids de 1/n. Si lon dfinit I A comme une fonction indicatrice valant 1 lorsque la
condition A est vraie, et 0 sinon, alors on a
F n (x) =

#X j x
n

n
1 X
I {X x}
n j =1 j

n
1 X
I {X =x} .
n j =1 j

et, par diffrentiation,


f n (x) =

#X j = x
n

101

102

Modlisation non paramtrique

Histogram of dental
0.004

1.0

ecdf(dental)

0.003

0.6

Density

0.4

0.001

Fn(x)

0.2

0.0

0.000

0.002

0.8

500

1000

1500

500

1000

1500

2000

dental

F IG . 3.3: Exemple de fonction de rpartition empirique (gauche) et dhistogramme


(droite) de donnes individuelles

Tel que mentionn ci-dessus, ces fonctions sont des estimateurs de la fonction de
rpartition et de la fonction de densit de probabilit, dans lordre, cest--dire que
nous considrerons que
F (x) = F n (x)
f(x) = f n (x).
On peut dmontrer quelques proprits de lestimateur F n de la fonction de
rpartition. Soit
(
1, X j x
B j = I {X j x} =
0, sinon
et
Y =

n
X

Bj

j =1

= nF n (x).
On a Pr[B j = 1] = F (x) et B j Bernoulli(F (x)), do
Y = nF n (x) Binomiale(n, F (x)).

3.2. Fonctions de rpartition et de probabilit empiriques


Ainsi
E [Y ]
n
nF (x)
=
n
= F (x)

E [F n (x)] =

et
Var[Y ]
n2
nF (x)(1 F (x))
=
n2
F (x)(1 F (x))
=
.
n

Var[F n (x)] =

Par consquent,

x Fn est un estimateur sans biais de F ;


x puisque limn Var[Fn (x)] = 0, Fn est un estimateur convergent de F .
Exemple 3.1. De 1990 1999, un assureur a enregistr les donnes concernant la
frquence des vols commis dans un centre commercial de la rgion de Qubec :
{0, 0, 0, 0, 0, 1, 1, 1, 1, 3}.
La fonction de rpartition empirique est

0,
x <0

5/10, 0 x < 1
F 10 (x) =

9/10, 1 x < 3

1,
x 3.

et la fonction de masse de probabilit empirique est

5/10, x = 0

4/10, x = 1
f 10 (x) =

1/10, x = 3

0,
ailleurs.

Les graphiques de ces fonctions sont prsents la figure 3.4.

103

104

Modlisation non paramtrique

1.0

ecdf(x)

fn(x)

0.6
0.4

0.0

0.2

Fn(x)

0.8

(a) fonction de rpartition

0.0

0.5

1.0

1.5

2.0

2.5

3.0

(b) fonction de probabilit

F IG . 3.4: Fonctions de rpartition et de masse de probabilit empiriques pour les


donnes de lexemple 3.1

3.2.2

La distribution de base de R contient toutes les fonctions ncessaires


pour crer et manipuler des fonctions de rpartition et de probabilit empiriques pour des donnes individuelles. Consulter le code
informatique de la section 3.6 pour des illustrations.

Donnes groupes

De manire gnrale, les donnes groupes se prsentent sous la forme dun


tableau donnant le nombre de sinistres n j se trouvant dans lintervalle de montants
(c j 1 , c j ], j = 1, . . . , r ; voir le tableau 3.1.
Remarques.
1. Les classes sont fermes droite et ouvertes gauche plus ou moins arbitrairement. Cest la convention que nous utiliserons.
2. La dernire classe peut ne pas tre ferme, cest--dire que c r = . Cela complique toutefois certaines procdures numriques et il est souvent ncessaire de
fermer la dernire classe arbitrairement.
P
3. Dans la notation, on pose n = rj =1 n j .

3.2. Fonctions de rpartition et de probabilit empiriques

Classe

Frquence

(c 0 , c 1 ]
(c 1 , c 2 ]
..
.
(c j 1 , c j ]
..
.
(c r 1 , c r ]

n1
n2
..
.
nj
..
.
nr

TAB. 3.1: Reprsentation gnrale dun ensemble de donnes groupes

On a donc
F n (c 0 ) = 0
F n (c j ) =

j
1X
ni ,
n i =1

j = 1, . . . , r.

Il est toutefois un peu ennuyeux de garder la fonction de rpartition empirique


constante lintrieur des classes. On va donc supposer que les observations sont
rparties uniformment lintrieur de chaque classe. Il en rsulte un estimateur
lisse de la fonction de rpartition o les valeurs connues sont relies par des segments de droite. Ce rsultat est appel une ogive ; voir une illustration la figure 3.5.
La pente dun segment de droite est
F n (c k ) F n (c k1 )
c k c k1
et lquation dun segment est

cj x
x c j 1
F n (c j 1 ) +
F n (c j )
Fn (x) =
c j c j 1
c j c j 1
F n (c j ) F n (c j 1 )
= F n (c j 1 ) +
(x c j 1 )
c j c j 1
pour c j 1 x c j .
Par consquent, logive Fn (x) est dfinie ainsi :

Fn (x) =

0,

(c j x)F n (c j 1 ) + (x c j 1 )F n (c j )

1,

c j c j 1

x c0
, c j 1 < x c j
x > cr .

105

106

Modlisation non paramtrique

1.0

ogive(gdental)

0.6

0.8

F(x)

0.4

0.2

0.0

1000

2000

3000

4000

F IG . 3.5: Exemple dogive

Le calcul de logive requiert donc que c r < .


Logive peut aussi servir comme estimateur lisse de la fonction de rpartition
de donnes individuelles. Il faut alors regrouper les donnes dans des classes
arbitraires. Attention, toutefois, de ne pas choisir des donnes comme limites de
classes, sinon logive sur-estimera la fonction de rpartition, tel quillustr la
figure 3.6.
La drive dune ogive est un histogramme :

f(x) =

0,

F n (c j ) F n (c j 1 )

0,

c j c j 1

x c0
=

nj
n(c j c j 1 )

, c j 1 < x c j
x > cr .

3.2. Fonctions de rpartition et de probabilit empiriques

107

1.0

ecdf(dental)

0.8

0.6

Fn(x)

0.4

0.2

0.0

500

1000

1500

F IG . 3.6: Illustration dune ogive sur-estimant la fonction de rpartition

Soit
Y =

n
X

I {X i c j 1 }

i =1

= nF n (c j 1 )
Binomiale(n, F X (c j 1 ))
et
Z=

n
X

I {c j 1 <X i c j }

i =1

= n(F n (c j 1 ) F n (c j ))
Binomiale(n, F X (c j 1 ) F n (c j )).

108

Modlisation non paramtrique


On a donc
Fn (x) =

Y (c j c j 1 ) + Z (x c j 1 )
n(c j c j 1 )

do
E [Fn (x)] =

F (c j 1 )(c j c j 1 ) + (F (c j ) F (c j 1 ))(x c j 1 )
(c j c j 1 )

6= F (x).
Ainsi, Fn (x) est un estimateur biais de F (x).
Pour lhistogramme, on a
fn (x) =

Z
,
n(c j c j 1 )

do
E [ fn (x)] =

F (c j ) F (c j 1 )
c j c j 1

6= f (x)
et f(x) est un estimateur biais de f (x).
De plus, on a

x c j 1 2 Var[Z ]
Var[Y ]
+
n2
c j c j 1
n2

x c j 1 Cov(Y , Z )
,
+2
c j c j 1
n2

Var[Fn (x)] =

o
Var[Y ] = nF (c j 1 )(1 F (c j 1 )),
Var[Z ] = n(F (c j ) F (c j 1 ))(1 F (c j ) + F (c j 1 ))
et
Cov(Y , Z ) = nF (c j 1 )(F (c j ) F (c j 1 )).
Pour lhistogramme, on a
Var[ f(x)] =

(F (c j ) F (c j 1 ))(1 F (c j ) + F (c j 1 ))
n(c j c j 1 )2

3.2. Fonctions de rpartition et de probabilit empiriques


Exemple 3.2. Soit les donnes individuelles suivantes :
{11, 13, 11, 11, 17, 19, 13}.
La fonction de rpartition empique et la fonction de masse de probabilit empirique
sont :

0,

3/7,
F 7 (x) = 5/7,

6/7,

1,

3/7,

2/7,
f 7 (x) = 1/7,

1/7,

0,

x < 11
11 x < 13
13 x < 17
17 x < 19
x 19
x = 11
x = 11
x = 17
x = 19
ailleurs.

Voir la figure 3.7 (a) pour le graphique conjoint de F 7 (x) et f 7 (x).


Si lon groupe les donnes dans les classes (10, 12], (12, 14], (14, 18] et (18, 23],
on obtient le jeu de donnes suivant :
Classe

Frquence

(10, 12]
(12, 14]
(14, 18]
(18, 23]

3
2
1
1

Lquation de logive est donc

0,

14 (x 10),

1 (x 9),
F7 (x) = 71
(x + 6),

28

35 (x + 12),

1,

x 10
10 < x 12
12 < x 14
14 < x 18
18 < x 23
x > 23

109

110

Modlisation non paramtrique

Histogram of xg
1.0

1.0

ecdf(x)

0.8

0.8

0.6
0.2
0.0

0.4

Density

0.6
0.4
0.2

0.0

Fn(x)

10

12

14

16

18

20

10

12

14

16

18

20

22

xg

(a) donnes individuelles

(b) donnes groupes

F IG . 3.7: Fonctions de rpartition et de masse de probabilit empiriques, ogive et


histogramme pour les donnes de lexemple 3.2

alors que celle de lhistogramme est

0, x 10

14 , 10 < x 12

1 , 12 < x 14
f7 (x) = 71

28 , 14 < x 18

35 , 18 < x 23

0, x > 23.

Les graphiques de logive et de lhistogramme se trouvent la figure 3.7 (b).

Complter lexemple en excutant le code informatique de la section 3.6 correspondant ce segment de matire.

3.3. Estimateurs de la fonction de survie

3.3

Estimateurs de la fonction de survie

Les estimateurs de cette section sont principalement utiliss dans le domaine


de lanalyse de survie. Cest pourquoi on sintresse plus particulirement lestimation de la fonction de survie de la variable alatoire X , note S(x) = 1 F (x), o
F est la fonction de rpartition.
Il est utile dadopter la terminologie de lanalyse de survie afin de prsenter les
estimateurs de manire simple et intuitive. Ainsi, dans ce domaine, on interprte
les observations x 1 , . . . , x n dune variable alatoire X comme les dures de vie de
sujets (des personnes, des machines, des composants, des logiciels, peu importe)
dun groupe tmoin. Une donne est tronque gauche lorsque lon sait quelle
na pu tre observe une valeur infrieure son point de troncature, soit ds
lors quun sujet joint le groupe tmoin un ge suprieur 0. Elle peut aussi tre
censure droite lorsque le sujet quitte le groupe tmoin avant la fin de ltude ou
sil survit au-del de la dure de ltude.
Par exemple, considrons une tude sur un nouveau traitement contre le cancer. Un patient joint le groupe tmoin lge de 42 ans, puis, pour des raisons
personnelles, quitte ltude aprs 5 ans. Lobservation pour ce patient est une dure
censure de 47 tronque ( gauche) 42. Pour un autre patient dcd durant
ltude 72 ans aprs 8 ans de traitements exprimentaux, lobservation est une
dure de 72 (non censure) tronque 64.
Le parallle entre les dures de vie et les montants de sinistres en assurance
IARD est assez facile faire. La principale diffrence rside dans le fait que les
points de troncature et de censure peuvent varier par sujet en analyse de survie,
alors que cest moins souvent le cas des franchises et des limites en assurance.

3.3.1

Dfinition du groupe risque

Les estimateurs non paramtriques de la fonction de survie sont bass sur le


nombre de sujets faisant toujours partie du groupe tmoin diffrents moments
dans le temps.
Soit x 1 , . . . , x n un chantillon alatoire de la variable alatoire X et y 1 < < y k
les k (k n) valeurs uniques et tries de lchantillon. Soit galement
sj =

n
X

I {xi =y j } ,

i =1

P
le nombre de fois que la donne y j apparat dans lchantillon. On a donc kj=1 s j =
n. La variable s j reprsente le nombre de dcs la dure y j . Enfin, on dfinit r j
comme le nombre de sujets dans le groupe tmoin juste avant les s j dcs la

111

112

Modlisation non paramtrique

yj

sj

rj

1
2
3
4
5
6

0,8
2,9
3,1
4,0
4,1
4,8

1
2
1
2
1
1

8
7
5
4
2
1

TAB. 3.2: Valeurs de y j , s j et r j , j = 1, . . . , 6, pour les donnes de lexemple 3.3

dure y j . Dans le cas de donnes non tronques ni censures, on a


rj =

n
X

I {xi y j }

i =1

k
X

si .

i=j

On nomme galement r j le groupe risque lobservation y j .


Si la donne j est censure ( droite) u j , on la note u j . Avec des donnes
censures, on a donc
rj =

n
X

I {xi y j } +

i =1

k
X

n
X

I {ui y j }

i =1

si +

i=j

n
X

I {ui y j } .

i =1

La possibilit de troncature complique un peu le calcul du groupe risque


puisque, pour chaque dure (observation) y j , il faut compter le nombre de sujets se trouvant dans le groupe tmoin ce moment et qui sont toujours en vie. En
dautres termes, il faut exclure du calcul tous les sujets dont lge dentre dans le
groupe (le point de troncature) est suprieur y j . Nous donnerons la dfinition
mathmatique du groupe risque dans ce cas la sous-section 3.3.3.
Exemple 3.3. Soit les huit donnes
{0,8, 2,9, 2,9, 3,1, 4,0, 4,0, 4,1, 4,8}.
On a six donnes diffrentes. Le tableau 3.2 donne les valeurs de y j , s j et r j , j =
1, . . . , 6.

3.3. Estimateurs de la fonction de survie


Remarque. Avec la notation ci-dessus, la fonction de rpartition empirique est

0,
x < y1

rj
F n (x) = 1 , y j 1 x < y j , j = 2, . . . , k

1,
x > yk .

3.3.2

Estimateur de Nelson-alen

Lestimateur de Nelsonalen est une alternative la fonction de rpartition


empirique comme estimateur de la fonction de survie dans le cas de donnes
compltes. On peut aussi lutiliser avec des donnes censures droite.
De la section 1.3, on connait le taux dincidence
f (x)
S(x)
S 0 (x)
=
S(x)
d
=
ln S(x),
dx

h(x) =

o S(x) = 1 F (x) est la fonction de survie de la variable alatoire X . On dfinit de


plus le taux dincidence cumul H (x)
Z x
H (x) =
h(y) d y

= ln S(x).
La fonction de taux dincidence cumul est donc troitement lie la fonction de
survie S(x). Lestimateur de Nelson-alen exploite ce lien pour estimer la fonction
de survie.
Lestimateur de Nelsonalen du taux dincidence cumul est

0,
x < y1

jX
1

si

, y j 1 x < y j , j = 2, . . . , k
H (x) = i =1 r i

k s
X

, x yk .

i =1 r i
Par la suite, un estimateur de la fonction de survie est
= e H (x) .
S(x)

113

114

Modlisation non paramtrique


Pour la fonction de rpartition, on a videmment

F (x) = 1 e H (x) .

Remarque. On observe que


s i /n
si
=
r i r i /n
s i /n
=
1 (1 r i /n)
f n (y i )
,
=
1 F n (y i 1 )
do une formule alternative de lestimateur de Nelsonalen du taux dincidence
cumul est

H (x) =

0,

j 1

x < y1

f n (y i )
, y j 1 x < y j , j = 2, . . . , k
1

F n (y i 1 )
i =1

k
X

f n (y i )

, x yk ,

i =1 1 F n (y i 1 )

o y 0 < y 1 est un nombre quelconque tel que F n (y 0 ) = 0. La fonction R de la


figure 3.8 (voir aussi le code informatique de la section 3.6) utilise cette dernire
formule pour construire une fonction pour calculer H (x) en tout x.

Exemple 3.4. partir des donnes de lexemple 3.3, lestimation de Nelsonalen


de la fonction de taux dincidence cumul est

0,

8 = 0,125,

0,125 + 7 = 0,411,
H (x) = 0,411 + 15 = 0,611,

0,411 + 24 = 1,111,

1,111 + 12 = 1,611,

1,611 + 11 = 2,611,

0 x < 0,8
0,8 x < 2,9
2,9 x < 3,1
3,1 x < 4,0
4,0 x < 4,1
4,1 x < 4,8
x 4,8

3.3. Estimateurs de la fonction de survie

naalen <- function(x)


{
Fn <- ecdf(x)
y <- knots(Fn)
fn <- diff(c(0, Fn(y)))
res <- approxfun(y,
cumsum(fn / c(1, head(1 - Fn(y), -1))),
yleft = 0, f = 0, rule = 2,
method = "constant")
class(res) <- c("stepfun", class(res))
res
}

F IG . 3.8: Fonction R qui retourne une fonction pour calculer lestimateur de Nelson
alen H (x) en tout x

et lestimation de la fonction de survie est


= e H (x)
S(x)

0,

0,8825,

0,6632,
= 0,5430,

0,3293,

0,1997,

0,0735,

0 x < 0,8
0,8 x < 2,9
2,9 x < 3,1
3,1 x < 4,0
4,0 x < 4,1
4,1 x < 4,8
x 4,8.

Ces deux fonctions sont traces la figure 3.9.


On peut faire un grand nombre de calculs en analyse de survie, dont celui
de lestimateur de Nelsonalen, dans R avec les fonctions du package survival
(Therneau, 2013). (Ce package est distribu avec R.)

115

Modlisation non paramtrique

0.6
0.2

0.4

^
S(x)

1.5
1.0

0.0

0.0

0.5

^
H(x)

2.0

0.8

2.5

1.0

116

(a) taux dincidence cumul

(b) fonction de survie

F IG . 3.9: Estimations de Nelsonalen de la fonction de taux dincidence cumul et


de la fonction de survie pour les donnes de lexemple 3.4

Voir le code informatique de la section 3.6 pour une introduction au


calcul de lestimateur de Nelsonalen avec les fonctions du package
survival.

Klugman et collab. (2012a, p. 233) justifient succinctement que, sous des hypothses raisonnables, H (x) est un estimateur sans biais de H (x) et que
d H (y j )]
Var[

3.3.3

j
X
si
2
i =1 r i

Estimateur de Kaplan-Meier

Lestimateur de KaplanMeier aussi communment appel estimateur produitlimite est principalement utilis comme estimateur de la fonction de survie en
prsence de donnes tronques et censures.
Lide, assez simple au demeurant, derrire lestimateur de KaplanMeier est la
suivante. Sil y a r 1 sujets dans le groupe tmoin juste avant la dure y 1 et que s 1

3.3. Estimateurs de la fonction de survie

117

dcs (ou dparts) surviennent y 1 , alors la probabilit (empirique) de survivre


plus de y 1 est
r 1 s1
s1
= 1 .
r1
r1
De mme, la probabilit (toujours empirique) de survivre aussi plus de y 2 est

r 1 s1 r 2 s2
,
r1
r2
et ainsi de suite jusqu y k . On obtient alors un estimateur de la fonction de survie.
la notation introduite la sous-section 3.3.1, on ajoute d j , le point de troncature de la donne j , ou lge dentre dans le groupe tmoin du sujet j . Ainsi, pour
des donnes tronques et censures, le groupe risque y j est
r j = # sujets sortis du groupe ou aprs y j
# sujets non encore entrs dans le groupe y j
n
n
n
X
X
X
=
I {xi y j } +
I {ui y j }
I {di y j }
i =1

i =1

i =1

ou, de manire quivalente


r j = # sujets dans le groupe entrs avant y j
# sujets sortis du groupe avant y j
n
n
n
X
X
X
=
I {di <y j }
I {xi <y j }
I {ui <y j } .
i =1

i =1

i =1

Lestimateur de KaplanMeier de la fonction de survie dune variable alatoire


est

S n (t ) =

1,

Y j 1 r i s i
i =1

i =1

0 t < y1

,
y j 1 t < y j , j = 2, . . . , k
ri
r i si
ou 0, t y k .
ri

Il convient de discuter de la valeur de S n (t ) pour t y k . Si s k = r k (toutes les


personnes dcdent lge y k ), alors il est raisonnable de poser S n (y k ) = 0. Par
contre, sil y a des donnes censures dans lchantillon (survivants au-del de la
priode dobservation), alors il est plus raisonnable de poser
S n (t ) =

k r s
Y
i
i
r
i
i =1

118

Modlisation non paramtrique


pour t y k . Afin de faire dcrotre exponentiellement la fonction de survie vers 0, il
est aussi suggr dutiliser
S n (t ) =

Y
k r s t /w
i
i
,
r
i
i =1

o w = max(x 1 , . . . , x n , u 1 , . . . , u n ), pour t y k .
Remarque. Si les donnes de lchantillon ne sont ni tronqus, ni censures, alors
r 1 = n et r j = r j 1 s j 1 . Lestimateur de KaplanMeier est alors identique la
fonction de survie empirique 1 F n (t ).
Klugman et collab. (2012a, p. 229231) dmontrent que
E [S n (y j )] =

S(y j )
S(y 1 )

et donc que lestimateur est sans biais y j . On dmontre galement que


"
#

j
S(y j )2 Y
S(y j 1 ) S(y j )
Var[S n (y j )] =
1+
1 .
S(y 1 )2 i =1
r j S(y j )

Or, cette formule est complexe et difficile utiliser. On peut lui prfrer lapproximation

S(y j )2 X
S(y i 1 ) S(y i )
Var S n (y j )
.
S(y 1 )2 i =1
r i S(y i )
Ceci dit, cette formule nest pas dun plus grand secours en pratique puisque
la fonction de survie est inconnue. On utilisera donc plutt lapproximation de
Greenwood
j
X
si
d n (y j )] = S n (y j )2
Var[S
.
i =1 r i (r i s i )
Exemple 3.5. On rutilise les donnes de lexemple 3.3, mais en ajoutant comme
information que les donnes j = 1, 3, 8 sont censures. Autrement dit, on a les
donnes
{0,8+ , 2,9, 2,9+ , 3,1+ , 4,0, 4,0, 4,1, 4,8+ },
o un signe + en indice indique une donne censure. Aucune donne nest tronque, donc d j = 0 pour tout j . Lchantillon contient un total de huit donnes, soit
quatre observations x 2 = 2,9, x 5 = x 6 = 4,0, x 7 = 4,1 et quatre donnes censures
u 1 = 0,8, u 3 = 2,9, u 4 = 3,1, u 8 = 4,8. Le tableau 3.3 prsente les calculs des groupes
risque, soit les valeurs des quantits y j , s j et r j . On a

3.3. Estimateurs de la fonction de survie

119

yj

sj

rj

1
2
3

2,9
4,0
4,1

1
2
1

4+40 = 7
3+10 = 4
1+10 = 2

TAB. 3.3: Calculs des groupes risque pour les donnes de lexemple 3.5

1,

71 = 6 ,
7
S 8 (t ) = 67 42
3

7 4 = 7 ,

3 21
3
= 14
,
7
2

0 t < 2,9
2,9 t < 4,0
4,0 t < 4,1
t 4,1.

La figure 3.10 prsente lestimateur de la fonction de survie obtenu ci-dessus.


Exemple 3.6. On peut calculer lestimateur de KaplanMeier dans R avec la fonction survfit du package survival. Dans cet exemple, on reproduit simplement les
rsultats des exemples 12.1 et 12.2 de Klugman et collab. (2012a).

Consulter le code informatique de la section 3.6 pour les calculs.

Exemple 3.7. On a les donnes de survie suivantes, prsentes sous forme dintervalles (d j , x j ] ou (d j , u j ], les donnes censures tant identifies par un signe + en
indice :
(0, 0,1]

(0, 0,5]

(0, 0,8]

(0, 0,8+ ]

(0, 1,8]

(0, 1,8]

(0, 2,1]

(0, 2,5]

(0, 2,8]

(0, 2,9+ ]

(0, 2,9+ ]

(0, 3,9]

(0, 4,0+ ]

(0, 4,0]

(0, 4,1]

(0, 4,8+ ]

(0, 4,8]

(0, 4,8]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0, 5,1]

(0,3, 5,1]

(0,7, 5,1]

(1,0, 4,1+ ]

(1,8, 3,1+ ]

(2,1, 3,9]

(2,9, 5,1]

(2,9, 4,8]

(3,2, 4,0+ ]

(3,4, 5,1]

(3,9, 5,1]

On a un total de 12 observations. Le tableau 3.4 prsente les valeurs de y j , s j


et r j pour j = 1, . . . , 12. Lestimateur de KaplanMeier de la fonction de survie est

Modlisation non paramtrique

0.0

0.2

0.4

S8(t)

0.6

0.8

1.0

120

F IG . 3.10: Estimateur de KaplanMeier de la fonction de survie pour les donnes de


lexemple 3.5

donc :

1,

29

30 = 0,967,

0,967( 29

30 ) = 0,934,

29

0,934( 30
) = 0,903,

27

0,903( 29 ) = 0,841,

0,841( 27 ) = 0,811,

28

27
S 40 (t ) = 0,811( 28
) = 0,782,

26

0,782( 27 ) = 0,753,

25

0,753( 27
) = 0,697,

25

0,697( 26 ) = 0,670,

22

0,670( 23
) = 0,641,

20

0,641( 21 ) = 0,550,

0,550( 0 ) = 0,
17

0 t < 0,1
0,1 t < 0,5
0,5 t < 0,8
0,8 t < 1,8
1,8 t < 2,1
2,1 t < 2,5
2,5 t < 2,8
2,8 t < 3,9
3,9 t < 4,0
4,0 t < 4,1
4,1 t < 4,8
4,8 t < 5,1
t 5,1.

3.3. Estimateurs de la fonction de survie

121

yj

sj

rj

1
2
3
4
5
6
7
8
9
10
11
12

0,1
0,5
0,8
1,8
2,1
2,5
2,8
3,9
4,0
4,1
4,8
5,1

1
1
1
2
1
1
1
2
1
1
3
17

30
31 1 = 30
32 2 = 30
33 4 = 29
34 6 = 28
35 7 = 28
35 8 = 27
39 12 = 27
40 14 = 26
40 17 = 23
40 19 = 21
40 23 = 17

TAB. 3.4: Calculs des groupes risque pour les donnes de lexemple 3.7

Cet estimateur est reprsent la figure 3.11


On souhaite estimer la valeur de
2 q3

S(3) S(5)
.
S(3)

Une estimation naturelle est


2 q3

S 40 (3) S 40 (5)
S 40 (3)
0,753 0,550
=
0,753
= 0,270.
=

La variance de lestimateur 2 q3 est toutefois complique calculer puisque lon


a des variables alatoires au numrateur et au dnominateur de son expression. La
solution usuelle et raisonnable ce problme consiste calculer la variance
conditionnellement la valeur de la probabilit de survie au temps 3, de sorte que
S(3) devient une constante. Ainsi,
Var[2 q3 |S 40 (3) = 0,753] =

Var[S 40 (5)]
.
(0,753)2

On utilise lapproximation de Greenwood pour Var[S 40 (5)]. Seulement, on considre maintenant la survie jusquau temps 3 comme accomplie. De plus, 5 nest pas

Modlisation non paramtrique

0.0

0.2

0.4

S40(t)

0.6

0.8

1.0

122

F IG . 3.11: Estimateur de KaplanMeier de la fonction de survie pour les donnes de


lexemple 3.7

une observation, comme la formule de Greenwood le suppose. Par convention, on


se reporte la plus grande observation infrieure ou gale 5 pour le calcul. Par
consquent, seuls les termes s i et r i correspondant aux dures 3 t 5 entrent
dans le calcul de la variance. On obtient donc
11
S 40 (5) 2 X
si
0,753 i =8 r i (r i s i )

0,550 2
2
1
1
3
=
+
+
+
0,753
27(25) 26(25) 23(22) 22(19)

d 2 q3 |S 40 (3) = 0,753] =
Var[

= 0,00728.
(Cet exemple est lexercice 12.16 de Klugman et collab. (2012a) avec une lgre
modification des donnes pour clarifier le contexte.)

3.3. Estimateurs de la fonction de survie

3.3.4

123

Estimation pour de grands chantillons

Lestimateur de KaplanMeier requiert plusieurs tris et dcomptes des donnes.


Pour les trs gros chantillons, cela peut rsulter en un temps de calcul prohibitif. Il
est alors possible de faire lapproximation prsente sommairement ici. On trouvera
de plus amples dtails dans Klugman et collab. (2012a, section 12.4).
On dtermine dabord des intervalles dont les bornes sont c 0 < c 1 , < c k .
Soit d j , j = 0, . . . , k 1, le nombre dobservations tronques une valeur dans
lintervalle [c j , c j +1 ), u j , le nombre dobservations censures une valeur dans
lintervalle (c j , c j +1 ] et x j , le nombre de donnes non-censures dont la valeur se
trouve dans lintervalle (c j , c j +1 ]. Avec les classes appropries, toutes les donnes
de lchantillon seront tronques, dune part, et censures ou non censure, dautre
part. On a donc
k1
k1
X
X
n=
dj =
(u j + x j ),
j =0

j =0

o n est la taille de lchantillon.


Pour pouvoir calculer simplement lestimateur, on suppose que toutes les
donnes non-censures dans un intervalle ont la mme valeur, disons c j , De plus,
on suppose que cette valeur est telle que tous les points de troncature compris dans
cet intervalle sont infrieurs c j et que tous les points de censure sont suprieurs
c j . Le groupe risque de lintervalle j = 0, . . . , k 1 est alors
(
d0 ,
r j = Pj

i =0

j =0
di

P j 1
i =0

(u i + x i ),

j = 1, . . . , k.

Lorsque les points de troncature et de censure se trouvent lintrieur des intervalles plutt quaux bornes, on utilise parfois plutt
rj =

(
(d 0 u 0 )/2,

(d j u j )/2 +

j =0
P j 1
i =0

(d i u i x i ),

j = 1, . . . , k.

Enfin, on calcule lestimateur de la fonction de survie en c 0 , c 1 , . . . , c k avec

j =0
1,
j ) = Y j 1 r j x j
S(c

, j = 1, . . . , k.
i =0
rj
Exemple 3.8. On a observ 19 sinistres, dont six avaient une franchise de 250, six
une franchise de 500 et sept une franchise de 1 000. De plus, trois sinistres, de
montants 1 000, 2 750 et 5 500, ont atteint la limite de la police dassurance. Pour les

124

Modlisation non paramtrique

(c j , c j +1 )

dj

xj

uj

rj

0
1
2
3
4
5

(250, 500)
(500, 1 000)
(1 000, 2 750)
(2 750, 5 500)
(5 500, 6 000)
(6 000, 10 000)

6
6
7
0
0
0

1
2
4
7
1
1

0
1
1
1
0
0

6
6 + 6 1 = 11
11 + 7 3 = 15
15 + 0 5 = 10
10 + 0 8 = 2
2+01 = 1

TAB. 3.5: Calculs des groupes-risque pour les donnes de lexemple 3.8

16 autres sinistres, un se trouve dans lintervalle (250, 500), deux dans (500, 1 000),
quatre dans (1 000, 2 750), sept dans (2 750, 5 500), un dans (5 500, 6 000) et un dans
(6 000, 10 000). On veut estimer la probabilit de payer plus de 5 500 pour un contrat
avec une franchise de 500.
Puisquun paiement de 5 500 correspond un sinistre de 6 000, on cherche
Pr[X > 6 000|X > 500] =

S(6 000)
.
S(500)

On estime la fonction de survie avec la mthode de KaplanMeier pour grands


chantillons. Le tableau 3.5 prsente les calculs des groupes risque pour ces donnes. On a donc

S(250)
=1
5

S(500)
= = 0,833
6

9

= 0,682
S(1 000) = (0,833)
11

11
750) = (0,682)
S(2
= 0,500
15

3
500) = (0,500)
S(5
= 0,150
10

1
000) = (0,150)
S(6
= 0,075
2

0

S(10
000) = (0,075)
= 0.
1
Ainsi, une estimation de la probabilit recherche est
000) 0,075
S(6
=
= 0,090.

0,833
S(500)

3.4. Estimateur par noyaux

125

(Cet exemple est lexercice 12.35 de Klugman et collab. (2012a), lui-mme


inspir du problme 26 de lexamen C de mai 2007.)

3.4

Estimateur par noyaux

Les techniques destimation de la fonction de rpartition tudies jusqu maintenant rsultent en des fonctions discrtes (exception faite de logive, bien sr).
Cela peut tre vu comme un problme lorsque la variable alatoire sous-jacente
est continue et que le nombre de donnes est faible. La technique destimation
par noyaux permet destimer la fonction de rpartition (ou la fonction de densit)
par une fonction lisse et continue. De plus, elle est flexible, dune criture mathmatique relativement simple et conviviale et elle permet une meilleure prise en
compte de la contribution des observations situes dans le voisinage dun point x.
Un estimateur liss par noyaux est obtenu en remplaant chaque donne de
lchantillon par une variable alatoire continue et en attribuant un poids de 1/n
chacune de ces variables alatoires. Celles-ci doivent tre identiques un changement dchelle ou de position prs (fonction de la donne associe). La distribution
continue utilise pour chaque variable alatoire est appele le noyau. Ultimement,
cest comme si une donne tire de cet estimateur tait dabord tire de la densit
empirique, puis ensuite dune densit centre la valeur obtenue.
Formellement, lide est dattribuer chacune des donnes une distribution
dont la moyenne sera la donne (ce nest pas obligatoire, mais cela permet la distribution lisse et la distribution empirique davoir la mme moyenne) plutt que
son poids 1/n. Comme dans les sections prcdentes, y 1 < < y k , reprsentent
les k (k n) donnes uniques et tries de lchantillon x 1 , . . . , x n . Soit k y (x) une
fonction de densit de probabilit de moyenne y (le noyau) et K y (x) la fonction de
rpartition correspondante. Les estimateurs par noyaux sont de la forme
f(x) =

s
X

f n (y j )k y j (x)

j =1

et
F (x) =

s
X

f n (y j )K y j (x).

j =1

Ainsi, f(x) est un mlange discret des noyaux k y 1 (x), . . . , k y k (x). La figure 3.12 fournit
un exemple.
Les noyaux les plus courants sont les suivants.

Modlisation non paramtrique

0.10
0.00

0.05

Density

0.15

126

10

12

F IG . 3.12: Six noyaux gaussiens (traits briss) et leur somme (trait plein)

1. Noyau uniforme Le noyau la donne y est une distribution uniforme sur un


intervalle de largeur 2b autour de y :

0,
x < y b

1
k y (x) =
, y b x y +b
2b

0,
x > y + b,

0,
x < y b

x y +b
K y (x) =
, y b x y +b

2b

1,
x > y + b.

2. Noyau triangulaire Le noyau la donne y est une distribution triangulaire sur

3.4. Estimateur par noyaux

127

un intervalle de largeur 2b autour de y :

0,
x < y b

y
+
b

, y b x y
2
k y (x) = y bx + b

, y x y +b

b2

0,
x > y + b,

0,
x < y b

(x y + b) , y b x y
K y (x) =
2b 2

(yx+b)2

, y x y +b

2b 2

1,
x > y + b.
3. Noyau gamma Le noyau la donne y est une distribution gamma de paramtre
de forme et de moyenne y :
k y (x) =

(/y) x 1 e x/y
,
()

x > 0.

Une petite valeur de reprsente une distribution tendue, et vice versa.


4. Noyau dEpanechnikov Le noyau la donne y est :

x < y b
0,


x y 2
3
k y (x) =
1
, y b x y +b
4b
b

0,
x > y + b.
5. Noyau normal, ou gaussien Le noyau la donne y est une distribution normale
de moyenne y et de variance b 2 :
x y
k y (x) =
, < x <
x b

y
, < x < ,
K y (x) =
b
o () et () sont, dans lordre, la fonction de densit de probabilit et la
fonction de rpartition de la distribution N (0, 1).
Dans tous les cas sauf le noyau gamma, la valeur b reprsente la largeur de
bande de lestimateur par noyaux. Silverman (1986) suggre dutiliser, du moins
dans un premier temps,
R/1,34)
0,9 min(,
,
b=
1/5
n

128

Modlisation non paramtrique


est lcart type estim et R = 0.75 0,25 est lespace inter-quartile estim.
o
Cest la valeur utilise par dfaut dans la fonction density de R (Venables et Ripley,
2002, section 5.6).
Exemple 3.9. La fonction density de R permet de calculer lestimateur par noyaux
pour tous les noyaux prsents ci-dessus, sauf le noyau gamma.

3.5

Voir le code informatique de la section 3.6 pour des exemples dutilisation et la comparaison de divers noyaux avec lhistogramme pour
un jeu de donnes.

Statistiques descriptives empiriques

Pour estimer les statistiques descriptives de la section 3.1, il suffit de remplacer


la fonction de rpartition thorique F (x) par un estimateur : F n (x), Fn (x), F (x), etc.
En gnral, on utilise la fonction de rpartition empirique ou logive.

3.5.1

Moments

Pour un ensemble de donnes individuelles, on a


Z
0k =
x k d F n (x)
0

n
X
i =1

x kj f n (x j )

n
1X
xk .
n i =1 j

En particulier,
= x
2 = 02 2

n
1 X
=
x 2 x 2
n j =1 j
Pn
2
j =1 (x j x)
=
= s2.
n

3.5. Statistiques descriptives empiriques

129

Pour un ensemble de donnes groupes, on a plutt


Z
0
k =
x k d Fn (x)
0
r Z cj
X
=
x k fn (x) d x
j =1 c j 1

Ce calcul est compliqu de manire gnrale. Par contre, on a


Z cj
Z cj
nj
x dx
x fn (x) d x =
n(c j c j 1 ) c j 1
c j 1
=
=

n j (c 2j c 2j 1 )
2n(c j c j 1 )
n j (c j + c j 1 )
2n

do
=

n n c +c
X
j
j 1
j
j =1

Pour les moments centraux, on a


Z
k d F n (x)
(x )
k =
0

n
1X
k
(x j )
=
n i =1

et
0k =

3.5.2

r Z
X

cj

j =1 c j 1

k fn (x) d x
(x j )

Esprance limite

On a, pour des donnes individuelles,


Z u
E [X ; u] =
x d F n (x) + u(1 F n (u))
0

1 X
=
x j + u(1 F n (u))
n x j <u
=

n
1 X
min(x j , u).
n j =1

130

Modlisation non paramtrique


Encore ici, le calcul pour les donnes groupes est plus compliqu, surtout
lorsque la limite se trouve lintrieur dune classe. Ainsi, pour c j 1 < u c j ,

E [X ; u] =
=
.=

x d Fn (x) + u(1 Fn (u))

0
r Z ci
X

i =1 c i 1
jX
1 Z c i
i =1 c i 1
Z cj

+u

min(x, u) fn (x) d x
x fn (x) d x +
fn (x) d x + u

u
c j 1

x fn (x) d x

r Z
X

ci

i = j +1 c i 1

fn (x) d x

2
2
n i c i + c i 1 n j u c j 1
+
2
n 2(c j c j 1 )
i =1 n

r
X
n j u(c j u)
ni
+
+u
n c j c j 1
i = j +1 n

jX
1
n i c i + c i 1 n j c j 1 + u u c j 1
=
+
2
n
2
c j c j 1
i =1 n

r
X ni
cj u
nj
+u
.
+u
n c j c j 1
i = j +1 n

jX
1

Exemple 3.10. Les classes [0, 100), [100, 200) et [200, 500) contiennent respectivement 5, 10, et 2 donnes. Pour estimer E [X ; 120], on spare la classe [100, 200) en
deux classes : [100, 120) et [120, 200). Les donnes sont rparties proportionnellement entre les deux classes. On obtient alors

10 120 100
5
(50) +
(100)
17
17 200 100

10 200 120
2
+
(120) + (120)
17 200 100
17
1 670
=
.
17

E [X ; 120] =

3.5. Statistiques descriptives empiriques

3.5.3

Esprance rsiduelle

Pour les donnes individuelles, on a


Z
1
(y x)d F n (y)
1 F n (x) x
X
1
(x j x)
=
n(1 F n (x)) x j >x
X
1
=P
(x j x).
x j >x 1 x j >x

=
e(x)

De manire gnrale, on peut aussi utiliser


=
e(x)

3.5.4

E [X ; x]
.
1 F n (x)

Quantiles

Les quantiles empiriques sont obtenus directement de F n (x) ou Fn (x). Puisque


logive est continue, on a que le 100p e quantile de donnes groupes est la valeur
p (unique) telle que
Fn ( p ) = p.
La fonction de rpartition empirique de donnes individuelles nest pas continue. Le quantile empirique nest donc pas unique. En gnral, on calcule un estimateur lisse du quantile. Il ny a toutefois pas de dfinition universelle du quantile
lisse. La version retenue dans Klugman et collab. (2012a, section 13.1) est une
interpolation linaire entre la b(n + 1)pce et la d(n + 1)pee statistique dordre :
p = (1 h)x ( j ) + hx ( j +1)
avec
j = b(n + 1)pc
h = (n + 1)p j.
Exemple 3.11. Soit lchantillon alatoire x 1 , . . . , x 10 . On recherche le 30e centile
(p = 0,3). On veut donc approximativement 3 donnes sous le centile et 7 au-dessus.
Puisque lon ne peut choisir x (3,3) , on prend
0,3 = 0,7x (3) + 0,3x (4) .

131

132

Modlisation non paramtrique


Remarques.
1. La dfinition de p limite
1
n
p
.
n +1
n +1
2. Par dfaut, R utilise plutt
j = b1 + (n 1)pc
h = 1 + (n 1)p j ,
de sorte que toute valeur de 0 p 1 est admissible (avec x (n+1) x (n) ).

3.5.5

Consulter le code informatique de la section 3.6 pour des illustrations


des diffrentes fonctions disponibles dans R et dans actuar pour
calculer les statistiques descriptives empiriques.

Intervalle de confiance pour un quantile

Soit X 1 , . . . , X n un chantillon alatoire dune variable X , X (1) < < X (n) les
statistiques dordre cet chantillon et
N=

n
X

I {X j p }

j =1

le nombre de donnes infrieures ou gales au quantile p .


Puisque Pr[X p ] = F X (p ) = p, on a que
N Binomiale(n, p).
Or,
Pr[N = i ] = Pr[X (i )i p < X (i +1) ]
!
n i
=
p (1 p)ni .
i
Ainsi, (X (i ) , X (i +1) ) est un intervalle de confiance 100(1 ) % pour p , o
!
n i
1 =
p (1 p)ni .
i

3.6. Code informatique

133

En gnral, (X (i ) , X ( j ) ) est un intervalle de confiance pour p de niveau 1, o


1 = Pr[X (i ) p < X ( j ) ]
= Pr[N = i N = j 1]
= Pr[i N < j ]
!
jX
1
n k
=
p (1 p)nk .
k=i k
En dautres termes, si lon trouve des valeurs i et j tel que Pr[i N < j ] = Pr[i
N j 1] = 1 , alors (X (i ) , X ( j ) ) est un intervalle de confiance pour p de niveau
1 .
Pour les grands chantillons, on utilise lapproximation normale avec correction
pour la continuit, cest--dire que si np > 0,5 et np(1 p) > 0,5, alors

1
1
Pr[N = i ] Pr i W < i +
,
2
2

o W N (np, np(1 p)). Par consquent,

1
1
.
Pr[Yi p < Y j ] Pr i W < j 1 +
2
2

3.6

Code informatique

###
### FONCTIONS DE RPARTITION ET DE PROBABILIT EMPIRIQUES
###
## DONNES INDIVIDUELLES
## On va travailler avec les donnes "dental" fournies dans la
## premire dition de Loss Models. Il s'agit de 10 montants de
## rclamation en assurance dentaire avec une franchise de 50. Ces
## donnes sont distribues avec actuar.
data(dental, package = "actuar") # charger les donnes
dental
# les donnes
##
##
##
##
##

Fonction de rpartition empirique. La fonction 'ecdf' de R retourne


une fonction pour calculer la fonction de rpartition empirique en
un point quelconque. Les fonctions gnriques 'summary', 'knots' et
'plot' comportent des mthodes pour les objets de classe "ecdf". La
rubrique d'aide de 'ecdf' contient plusieurs exemples.

134

Modlisation non paramtrique

(Fn <- ecdf(dental))


summary(Fn)
knots(Fn)
Fn(knots(Fn))
Fn(c(20, 150, 1000))

#
#
#
#
#

dfinition de la f.r. empirique


sommaire (peu utile)
les noeuds de la fonction
valuation aux noeuds
valuation en d'autres points

## Graphiques de la fonction de rpartition empirique, du plus simple


## des plus labors.
plot(Fn)
plot(Fn, verticals = TRUE)
plot(Fn, verticals = TRUE, do.points = FALSE)
plot(Fn, verticals = TRUE,
col.h = "blue", col.p = "red", col.v = "bisque",
pch = 20)
abline(v = knots(Fn), lty = 2, col = "gray90")
abline(h = Fn(knots(Fn)), lty = 2, col = "gray90")
plot(Fn, col.h = "blue", col.p = "red", pch = 18)
segments(knots(Fn), 0, knots(Fn), Fn(knots(Fn)), col = "gray90")
## Fonction de probabilit empirique: utiliser la fonction 'table'
## pour dterminer la frquence de chaque valeur dans l'chantillon.
table(dental)
(fn <- table(dental)/length(dental))
plot(dental, fn, type = "h")
## On peut aussi calculer et tracer un histogramme pour des donnes
## individuelles avec la fonction 'hist'. Spcifier l'option 'prob =
## TRUE' pour graduer l'axe des ordonnes en probabilits plutt qu'en
## frquences. Les classes sont dtermines automatiquement, mais
## peuvent tre changes avec l'option 'breaks'.
hist(dental)
# histogramme par dfaut
hist(dental, plot = FALSE)$counts # frquence par classe
hist(dental, plot = FALSE)$density # frq. relative par classe
hist(dental,
breaks = c(0, 25, 100, 500, 1000, 2000)) # autres classes
## DONNES GROUPES
## On va utiliser les donnes "grouped dental" de Loss Models qui sont
## distribues avec actuar.
library(actuar)
# charger le package
data(gdental)
# charger les donnes
gdental
# les donnes

3.6. Code informatique

## La fonction 'ogive' de actuar est l'analogue de 'ecdf' pour les


## donnes groupes.
(Gn <- ogive(gdental))
# dfinition
summary(Gn)
# sommaire
knots(Gn)
# les bornes
Gn(knots(Gn))
# valuation aux bornes
Gn(c(20, 150, 1000))
# valuation en d'autres points
plot(Gn)
# graphique
## Pour l'histogramme de donnes groupes, le package dfinit une
## mthode de 'hist' pour les objets de classe 'grouped.data'.
hist(gdental)
# aussi simple que cela
###
### ESTIMATEURS DE LA FONCTION DE SURVIE
###
## ESTIMATEUR DE NELSON-AALEN
## Dfinition d'une fonction 'naalen' et d'une mthode de 'plot'.
## L'objet retourn par 'naalen' hrite de la classe 'stepfun', ce qui
## fournit automatiquement des mthodes de 'print', 'summary' et
## 'knots', entre autres.
naalen <- function(x)
{
Fn <- ecdf(x)
y <- knots(Fn)
fn <- diff(c(0, Fn(y)))
res <- approxfun(y, cumsum(fn / c(1, head(1 - Fn(y), -1))),
yleft = 0, f = 0, rule = 2,
method = "constant")
class(res) <- c("naalen", "stepfun", class(res))
attr(res, "call") <- sys.call()
res
}
## Mthode de 'plot' pour faire le graphique. Voir ?plotmath pour les
## annotations mathmatiques qu'il est possible de faire sur des
## graphiques.
plot.naalen <- function (x, ..., ylab = expression(paste(hat(H), "(x)")),
verticals = FALSE)
plot.stepfun(x, ..., ylab = ylab, verticals = verticals)

135

136

Modlisation non paramtrique

## On peut aussi calculer l'estimateur de Nelson-Aalen dans R avec les


## fonctions 'Surv' et 'survfit' du package d'analyse de survie
## survival. Celui-ci est distribu avec R.
library(survival)
## La fonction d'estimation de la fonction de survie est 'survfit'. Le
## premier argument de la fonction est une formule dont le ct gauche
## est un objet de classe 'Surv' contenant les donnes et cr avec la
## fonction du mme nom. Dans notre contexte, le ct droit de la
## formule est simplement 1.
##
## Pour des donnes compltes, comme c'est le cas dans cet exemple, il
## suffit de passer le vecteur des observations 'Surv'.
x <- c(0.8, 2.9, 2.9, 3.1, 4.0, 4.0, 4.1, 4.8) # donnes brutes
Surv(x)
# donnes "de survie"
## On calcule ensuite l'estimateur de la fonction de survie par la
## mthode de Nelson-Aalen avec la fonction 'survfit'. Pour ce faire,
## il faut spcifier le type d'estimation "fleming-harrington".
fit <- survfit(Surv(x) ~ 1, type = "fl") # ajustement du modle
summary(fit)
# fonction de survie estime
plot(fit)
# graphique de S(x) estime
plot(fit, fun = "cumhaz")
# graphique de H(x) estime
## ESTIMATEUR DE KAPLAN-MEIER
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##

On peut calculer l'estimateur de Kaplan--Meier dans R avec les


fonctions 'Surv' et 'survfit' du package survival. Nous l'avons
charg en mmoire prcdemment.
La fonction d'estimation de la fonction de survie est 'survfit'.
Cependant, elle requiert des donnes sous forme d'objet de type
'Surv', cr avec la fonction du mme nom.
Pour nos besoins, il suffit de connatre les trois premiers
arguments de 'Surv'. Il s'agit, dans l'ordre, de:
time: vecteur des points de troncature d_j (j = 1, ..., n) si
les donnes sont tronques et censures, ou valeur de
l'argument 'time2' si les donnes ne sont que censures;
time2: vecteur des observations x_j et des donnes censures
u_j (j = 1, ..., n);
event: vecteur indiquant si la donne j (j = 1, ..., n) est une
observation x_j (1, "dcs") ou une donne censure u_i
(0, "vivant").

3.6. Code informatique

137

##
## On dfinit un objet contenant les donnes D2 de Loss Models.
d <- c(rep(0, 30), 0.3, 0.7, 1.0, 1.8, 2.1, 2.9, 2.9, 3.2, 3.4, 3.9)
x <- c(0.1, 0.5, 0.8, 0.8, 1.8, 1.8, 2.1, 2.5, 2.8, 2.9, 2.9, 3.9,
4.0, 4.0, 4.1, 4.8, 4.8, 4.8, rep(5.0, 12), 5.0, 5.0, 4.1,
3.1, 3.9, 5.0, 4.8, 4.0, 5.0, 5.0)
e <- rep(0, 40); e[c(4, 10, 11, 13, 16, 33, 34, 38)] <- 1
Surv(d, x, e)
# objet contenant les donnes
## On peut ensuite passer ces donnes
## Par dfaut, la fonction ajuste les
## Kaplan-Meier.
(fit <- survfit(Surv(d, x, e) ~ 1)) #
(sfit <- summary(fit))
#
plot(fit)
#

'survfit' sans autre argument.


donnes avec l'estimateur de
ajustement du modle
fonction de survie estime
graphique de S_n(t)

## L'objet 'sfit' dfini ci-dessus est une liste comportant, entre


## autres, les lments suivants:
##
##
surv: valeurs de S_n(y_j), j = 1, ..., k;
##
time: valeurs de y_j;
##
n.risk: valeurs de r_j;
##
n.event: valeurs de s_j;
##
std.err: approximations de Greenwood de Var[S_n(y_j)].
##
## On va comparer les valeurs de l'lment 'std.err' avec le calcul
## fait partir de la formule prsente la section 3.3.3.
## [Remarque: la fonction 'with' ci-dessous permet de faire des
## calculs " l'intrieur" d'une liste ou d'un data frame,
## c'est--dire en utilisant directement les noms des lments de la
## liste.]
sfit$std.err^2
# valeurs obtenues avec 'survfit'
with(sfit,
# calcul manuel
surv^2 * cumsum(n.event/(n.risk * (n.risk - n.event))))
## Il est laiss en exercice de reproduire les rsultats de l'exemple
## 3.5 avec 'survfit'.
###
### ESTIMATION PAR NOYAUX
###
## On va comparer l'histogramme et divers estimateurs par noyaux du
## jeu de donnes suivant.
x <- c(10, 25, 40, 50, 100, 205, 208, 250, 768, 1045, 1067,

138

Modlisation non paramtrique

1104, 1590, 1780, 1967, 1987, 2000, 2000, 2560, 2789,


5067, 5896, 5890, 6980, 7000)
## Histogramme. On le sauvegarde dans un objet 'h' pour pouvoir le
## rutiliser plusieurs fois.
h <- hist(x, breaks = c(0, 500, 1500, 2500, 3000, 6000, 7000))
## La fonction 'density' de R calcule l'estimateur par noyaux d'un jeu
## de donnes. La fonction supporte tous les noyaux prsents dans la
## section 3.4 sauf le noyau gamma, ainsi que quelques autres. Outre
## un vecteur de donnes, la fonction a deux arguments principaux:
##
##
bw: la largeur de bande;
##
kernel: le type de noyau utiliser ("gaussian", "epanechnikov",
##
"rectangular", "triangular", ...).
##
## La paramtrisation des noyaux dans R est lgrement diffrente de
## celle des notes: l'cart type du noyau est toujours gal la
## largeur de bande. L'argument 'bw' ne correspond donc pas tout
## fait notre paramtre b, sauf dans le cas du noyau gaussien. La
## largeur de bande par dfaut est calcule par la fonction 'bw.nrd0'.
bw.nrd0(x)
# largeur de bande par dfaut
R <- diff(quantile(x, c(0.25, 0.75)))
# espace interquartile
0.9 * min(sd(x), R/1.34)/length(x)^0.2 # vrification
(fg <- density(x, kernel = "gaussian")) # noyau gaussien
plot(fg)
# graphique
##
##
##
##
##
op

Sparation du priphrique graphique en quatre parties (deux lignes


et deux colonnes) pour accueillir autant de graphiques. La fonction
'par' sert rgler les multiples paramtres graphiques. La fonction
retourne les paramtres prcdents, que l'on sauvegarde pour les
rtablir plus tard.
<- par(mfrow = c(2, 2))

## Comparaison de plusieurs noyaux


## dfaut.
plot(h); lines(density(x, kernel =
plot(h); lines(density(x, kernel =
plot(h); lines(density(x, kernel =
plot(h); lines(density(x, kernel =

avec la largeur de bande par


"r"),
"t"),
"e"),
"g"),

col
col
col
col

=
=
=
=

"red")
"red")
"red")
"red")

#
#
#
#

uniforme
triangulaire
Epanechnikov
gaussien

## Plus que le type de noyau, c'est surtout la largeur de bande qui a


## un impact sur l'estimateur. Plus la bande est large et plus
## l'estimateur est lisse puisque les noyaux se chevauchent davantage.
plot(density(x, kernel = "r", adjust = 0.25)) # 25 % du dfaut

3.6. Code informatique

139

plot(density(x, kernel = "r", adjust = 0.50)) # 50 % du dfaut


plot(density(x, kernel = "r", adjust = 1.25)) # 125 % du dfaut
plot(density(x, kernel = "r", adjust = 1.50)) # 150 % du dfaut
## Mme exercice, mais
plot(density(x, kernel
plot(density(x, kernel
plot(density(x, kernel
plot(density(x, kernel

avec le noyau
= "e", adjust
= "e", adjust
= "e", adjust
= "e", adjust

d'Epanechnikov.
= 0.25)) # 25 % du dfaut
= 0.50)) # 50 % du dfaut
= 1.25)) # 125 % du dfaut
= 1.50)) # 150 % du dfaut

## Rtablir les anciens paramtres graphiques.


par(op)
###
### STATISTIQUES DESCRIPTIVES EMPIRIQUES
###
## On va illustrer avec les donnes 'dental' et 'gdental' les
## diffrentes fonctions disponibles dans R et dans actuar pour
## calculer les statistiques descriptives empiriques.
library(actuar)
data(dental)
data(gdental)
## SOMMAIRE DE DONNES INDIVIDUELLES
## La fonction 'summary' fournit rapidement et simplement les minimum,
## maximum, mdiane, 2e et 3e quartiles ainsi que la moyenne de
## donnes individuelles.
summary(dental)
## MOMENTS
## On a des fonctions pour accder aux moments empiriques les plus
## usuels.
mean(dental)
# moyenne
var(dental)
# variance (sans biais)
sd(dental)
# cart type
## actuar fournit galement une mthode de 'mean' pour les donnes
## groupes.
mean(gdental)
## Plus gnralement, la fonction 'emm' de actuar permet de calculer
## n'importe quel moment (non centr) et ce, pour des donnes

140

Modlisation non paramtrique

## individuelles ou groupes.
(mu <- emm(dental))
emm(dental, 2) - emm(dental)^2
emm(dental - mu, 3)/sd(dental)^3
emm(gdental, 2) - emm(gdental)^2

#
#
#
#

moyenne
variance (biaise)
asymtrie
variance donnes groupes

## ESPRANCE LIMITE
## actuar fournit la fonction 'elev' pour calculer la fonction
## d'esprance limite empirique en n'importe quelle limite (donnes
## individuelles et groupes). Le fonctionnement est similaire
## 'ecdf' et 'ogive'.
(lev <- elev(dental))
# dfinition
lev(knots(lev))
# calcul en chacun des points
lev(1200)
# calcul en un point quelconque
mean(pmin(dental, 1200))
# vrification
plot(lev)
# graphique
## Pour illustrer avec des donnes groupes, on vrifie le rsultat de
## l'exemple 3.10.
x <- grouped.data(cj = c(0, 100, 200, 500), nj = c(5, 10, 2))
elev(x)(120)
# = 1670/17
## QUANTILES
## La fonction 'quantile' de R calcule les quantiles empiriques pour
## des donnes individuelles selon l'un de sept (!) algorithmes
## diffrents. Sans autre argument, la fonction retourne les quartiles
## de l'chantillon selon l'algorithme 7 prsent dans les remarques
## de la section 3.5.4. Notre algorithme est le numro 6.
quantile(dental)
# utilisation simple
quantile(dental, c(0.45, 0.80)) # autres quantiles
y <- sort(dental)
# statistiques d'ordre
0.3 * y[3] + 0.7 * y[4]
# algorithme de R
quantile(dental, 0.30)
# vrification
0.7 * y[3] + 0.3 * y[4]
# notre algorithme
quantile(dental, 0.3, type = 6) # numro 6
## Pour des donnes groupes, la mthode de 'quantile' dfinie par
## actuar retourne simplement l'inverse de l'ogive.
quantile(gdental)
# utilisation simple
quantile(gdental, c(0.45, 0.80)) # autres quantiles
ogive(gdental)(quantile(gdental)) # inverse de l'ogive

3.7. Exercices

3.7

141

Exercices

3.1 Un assureur prsente les cots (en millions de $) crs par les crasements de
mtorites :
{3, 5, 5, 6, 8, 8, 8, 8, 9, 10, 10, 11, 11, 11, 16, 21, 23, 26, 29, 36}.
a) Faire des graphiques de la fonction de rpartition empirique et de la fonction de masse de probabilit empirique du cot des crasements.
b) partir des bornes c 0 = 2, c 1 = 7, c 2 = 12, c 3 = 22 et c 4 = 38, crire lquation
de logive.
c) En utilisant les mmes bornes quen b), crire lquation de lhistogramme.
3.2 Le tableau ci-dessous prsente les sinistres enregistrs par un assureur.
Classe

Nombre de sinistres

(0, 50]
(50, 150]
(150, 250]
(250, 500]
(500, 1 000]
(1 000, )

36
x
y
84
80
0

Total

Soit Fn () logive correspondant ces donnes. Sachant que Fn (90) = 0,21 et


Fn (210) = 0,51, dterminer la valeur de x.
3.3 Pour 500 sinistres, un assureur a enregistr la distribution prsente au tableau
ci-dessous.
Classe

Nombre de sinistres

(0, 500]
(500, 1 000]
(1 000, 2 000]
(2 000, 5 000]
(5 000, 10 000]
(10 000, 25 000]
(25 000, )

200
110
x
y

Soit Fn () logive correspondant ces donnes. Sachant que F500 (1 500) = 0,689
et F500 (3 500) = 0,839, calculer la valeur de y.

142

Modlisation non paramtrique


3.4 Au cours de la dernire anne, la compagnie dassurance Big Company a
rembours les sinistres prsents dans le tableau ci-dessous.
Classe

Nombre de sinistres

0 1 000
1 000 3 000
3 000 5 000
5 000 10 000
10 000 25 000
25 000 50 000
50 000 100 000
100 000 et plus

16
22
25
18
10
5
3
1

Tracer logive de ces donnes et calculer, la main et avec R, la probabilit que


le montant dune rclamation soit compris entre 2 000 $ et 6 000 $. Expliquer le
traitement rserv la dernire classe.
3.5 Un assureur a enregistr les montants de sinistres suivants au cours de la
dernire anne :
{80, 153, 162, 267, 410}.
Soit F (x) lestimateur avec noyaux uniformes de bande 50 de la fonction de
rpartition et soit F 5 (x) la fonction de rpartition empirique. Calculer |F 5 (150)
F (150)|.
3.6 Un assureur estime la densit des donnes {150, 210, 240, 300} laide dun
estimateur avec noyaux triangulaires de largeur de bande 50.
a) Calculer la moyenne de f(x).
b) Tracer le graphique de f(x).
3.7 Un chantillon est compos des valeurs {5, 7, 4, 5, 9, 8, 3, 5, 4, 10}. valuer au
point 6,2 un estimateur de la densit avec
a) noyaux uniformes et largeur de bande 0,5.
b) noyaux uniformes et largeur de bande 1.
c) noyaux uniformes et largeur de bande 2.
d) noyaux uniformes et largeur de bande 3.
e) noyaux triangulaires et largeur de bande 0,5.
f) noyaux triangulaires et largeur de bande 1.
g) noyaux triangulaires et largeur de bande 2.

3.7. Exercices

143

3.8 Pour lchantillon {2, 4, 6, 8, 10}, on construit un estimateur liss de la densit


de probabilit avec noyaux triangulaires. Quelle est la plus petite largeur de
bande qui assure que f(5) = 0,01 ?
3.9 Un assureur a enregistr les montants suivants (en 1 000 000 $) lis des catastrophes naturelles :
{2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5,
6, 6, 6, 6, 8, 8, 9, 15, 17, 22, 23, 24, 24, 25, 27, 32, 43}.
a) Tracer le graphique de la fonction de rpartition empirique F 40 .
b) En utilisant les bornes c 0 = 1,5, c 1 = 2,5, c 2 = 6,5, c 3 = 29,5, et c 4 = 49,5,
tracer logive des donnes sur le mme graphique que pour la sous-question
prcdente. Lajustement semble-t-il bon ? Dtailler. Le choix des bornes
semble-il correct ?
c) Tracer lhistogramme des donnes en utilisant les mmes classes quen b).
d) Calculer la moyenne et lcart type empiriques.
3.10 Un assureur a enregistr les montants de sinistres suivants (en millions) :
{1, 2, 2, 4, 6, 6, 6, 8, 8, 10}.
Construire un intervalle de confiance de niveau 0,95 pour F (4).
3.11 Le tableau ci-dessous prsente les sinistres censurs droite enregistrs par
un assureur pendant lanne 2002.
Montant
500
800
1 200
1 700

Nombre de sinistres

Groupe-risque

3
10
11
2

52
40
19
6

Calculer lestimateur de F (1 200) bas sur lestimateur de Nelsonalen Hn (1 200).


3.12 Le tableau ci-dessous prsente les sinistres enregistrs par un assureur pendant lanne 2006.
Montant
1 000
3 400
4 500
7 500
15 000
17 500

Nombre de sinistres

Groupe-risque

1
1
1
1
1
1

20
19
18
17
16
15

144

Modlisation non paramtrique


a) Dterminer lestimateur de Nelson-alen, Hn (x), pour les six valeurs du
tableau.
b) On va maintenant tenter dappliquer la mthode destimation par noyaux
au taux dincidence. Pour une fonction de densit, lestimateur par noyaux
est
s
X
f(x) =
f n (y j )k j (x),
j =1

que lon peut aussi crire sous la forme


x yj
s
1X
f(x) =
f n (y j )k j
b j =1
b

en dfinissant k j sur lintervalle [1, 1]. Par analogie, pour le taux dincidence, on va utiliser
x yj
s
1X

h n (y j )k j
h(x)
=
,
b j =1
b

en estimant h n (y j ) par Hn (y j ). En utilisant un noyau uniforme, cest-dire


(
1/2, 1 x 1
k(x) =
0,
ailleurs

et une largeur de bande de 6 000, calculer h(10


000).
3.13 Un assureur a enregistr les 30 rclamations suivantes : deux rclamations
de 2 000 $, six rclamations de 4 000 $, 12 rclamations de 6 000 $ et 10 rclamations de 8 000 $. Donner la valeur de lestimateur empirique du coefficient
dasymtrie et son interprtation.
3.14 Le tableau ci-dessous prsente les rclamations enregistres par un petit
assureur automobile pendant une anne.
Montant enregistr

Frquence

100
200
300
400
500

1
4
10
4
1

3.7. Exercices

145

Calculer les estimateurs empiriques du coefficient dasymtrie et du coefficient daplatissement.


3.15 Soit lchantillon suivant
{12, 16, 20, 23, 26, 28, 30, 32, 33, 35, 36, 38, 39, 40, 41, 43, 45, 47, 50, 57}.
a) Calculer lestimateur liss du soixantime centile.
b) Calculer lestimateur liss du troisime quartile.
3.16 On a les donnes groupes prsentes dans le tableau ci-dessous. En supposant que les donnes sont distribues uniformment sur chacun des intervalles, calculer une estimation empirique de E [min(X , 320)].
Classe

Nombre de donnes

(0, 50]
(50, 100]
(100, 200]
(200, 500]

20
34
22
24

3.17 On dispose dun chantillon de cinq donnes dune distribution continue.


partir de cet chantillon, un intervalle de confiance non paramtrique pour
la mdiane est construit, dont les bornes sont les 2e et 4e statistiques dordre
de lchantillon. Quel est le niveau de confiance de cet intervalle ?
3.18 On dispose dun chantillon de taille 500 dune distribution continue. partir
de cet chantillon, un intervalle de confiance non paramtrique pour la
mdiane est construit, dont les bornes sont les statistiques dordre X (240) et
X (260) de lchantillon. Quel est le niveau de confiance de cet intervalle ?
3.19 Un assureur a enregistr les montants de sinistres suivants (en milliers) :
{1, 1, 1, 2, 2, 3, 5, 6, 9, 10, 12, 15, 15, 20, 30, 32, 33, 33, 35, 40}.
Dterminer le niveau de confiance de lintervalle [10, 20) pour 0,55 .
3.20 Soit Y Gamma(, ) et X = e Y . On a
f Y (y) =

1 y
y
e
,
()

a) Dterminer la distribution de X .

y > 0.

146

Modlisation non paramtrique


b) Soit = 1 et lestimateur
=

X
X 1

valuer empiriquement le biais de cet estimateur de la faon suivante :


1. Choisir une valeur de plus grande que 1 (la solution est construite
avec = 5).
(j)

(j)

2. Simuler des observations x 1 , . . . , x n de la variable X dont la distribution a t dtermine en a).


3. Rpter les tapes 2 et 3 pour j = 1, 2, . . . , r .
4. Calculer le biais moyen
5. Estimer le biais comme suit :
r
1X
b () =
( j ) .
r j =1

Faire cette estimation pour


i) n = 10 et r = 1 000 ;
ii) n = 1 000 et r = 100 ; et
iii) n = 1 000 et r = 1 000.
Discuter de limpact du nombre dobservations dans lchantillon et du
nombre de rptitions dans la simulation.
c) En utilisant les estimateurs de la partie b) ii), tracer la fonction de rparti
tion empirique de .
d) En utilisant les estimateurs de la partie c) et les classes calcules automatiquement par la fonction hist, tracer lhistogramme et logive de la

distribution de .
e) Calculer les 45e et 70e quantiles lisss des donnes de la partie c).

Exercices proposs dans Loss Models, 4e d.


11.2, 11.3, 11.4, 11.6, 11.7, 11.8, 11.9, 11.10, 12.2, 12.3, 12.6, 12.7, 12.8, 12.11, 12.12,
12.14, 12.18, 12.19, 12.22, 12.25, 12.28, 12.29, 12.31, 12.34, 12.35, 3.1, 3.2, 3.4, 3.13,
3.14, 3.16, 13.9, 13.10

3.7. Exercices

147

Rponses
3.1 a)

F20 (x) =

0,

(x 2)/25,

(x 5)/10,

x 2
2<x 7

7 < x 12

(x + 58)/100, 12 < x 22

(x + 42)/80, 22 < x 38

1,
x > 38

b)

f20 (x) =

0,

1/25,

1/10,

x 2
2<x 7
7 < x 12

1/100, 12 < x 22

1/80, 22 < x 38

0,
x > 38.

3.2 120
3.3 81
3.4 0,396
3.5 0,17
3.6 a) 225
3.7 a) 0 b) 0,05 c) 0,125 d) 0,1333 e) 0 f) 0,02 g) 0,095
3.8 1,0264
3.9 a) 9,225 et 10,2369
3.10 (0,0964, 0,7036)
3.11 0,5880
3.12 a) 0,05, 0,1026, 0,1582, 0,2170, 0,2795, 0,3462 b) 0,00001449
3.13 0,559
3.14 1 = 0, 2 = 3,125
3.15 a) 38,6 b) 42,5

148

Modlisation non paramtrique


3.16 134,54
3.17 0,625
3.18 0,6287
3.19 0,6208
3.20 a) Log-gamma(, )

4 Modles paramtriques
potentiels
Objectifs du chapitre
x Dfinir et connatre les principales caractristiques (densit, fonction de rpartition,

x
x
x

moments, esprance limite) des lois gamma et bta la base des familles de
distributions du mme nom.
Dterminer la distribution dune fonction dune ou plusieurs variables alatoires et
en calculer les principales caractristiques.
Dmontrer leffet dun changement de paramtre sur une distribution de svrit.
Appliquer les techniques suivantes pour crer de nouvelles distributions : multiplication par une constante, lvation une puissance, exponentielle et logarithme,
mlanges continus et discrets, raccordement.
Caractriser les modles de montants de sinistres en fonction de leurs valeurs
extrmes.

Dans ce chapitre, nous allons dvelopper des modles qui pourront tre utiliss
pour reprsenter les montants des sinistres. Les modles paramtriques potentiels
devront permettre de reprsenter une variable alatoire qui est toujours positive,
qui peut prendre des valeurs sur lintervalle (0, ) et qui est continue. De plus, il
faudra trouver des faons de caractriser les valeurs extrmes.

4.1

Famille gamma

Les distributions de la famille gamma sont parmi les plus utilises en actuariat.
On rappelle ici quelques rsultats importants leur propos.
La distribution gamma est continue et dfinie sur lintervalle (0, ), ce qui
en fait un choix intressant pour la modlisation des montants de sinistres en
149

150

Modles paramtriques potentiels


assurance IARD. Soit X Gamma(, ). Dans cet ouvrage, nous utilisons la paramtrisation suivante :
1 x
x
e
,
()

f X (x) =

x > 0,

o
() =

t 1 e t d t

est la fonction gamma. De plus,


x

F X (x) =

1 y
y
e
d y.
()

Or, en posant u = y dans cette intgrale, on obtient


Z x
1
F X (x) =
u 1 e u d u
() 0
= (; x),

o
1
(; x) =
()

t 1 e t d t ,

> 0, x > 0

est la fonction gamma incomplte.


On rencontre galement frquemment la paramtrisation alternative o =
1/, cest--dire avec fonction de densit de probabilit
f X (x) =

1
()

x 1 e x/ ,

x > 0.

Lorsque = 1, la distribution est appele une exponentielle. Lorsque = r /2 et


= 1/2, la distribution est appele une khi carr avec r degrs de libert. Le mode
de la distribution est en x = 0 si 1 et en x > 0 si > 1. Voir la figure 4.1 pour une
illustration de chaque cas. Enfin, une distribution gamma avec paramtre entier
est galement nomme Erlang.
Les deux rsultats suivants permettent dvaluer la fonction de densit de
probabilit et la fonction de rpartition, en particulier lorsque le paramtre est
un entier.
Thorme 4.1. Soit () la fonction gamma. Alors
( + 1) = ().

151

0.2

0.4

fX(x)

1.0
0.0

0.0

0.5

fX(x)

1.5

0.6

2.0

4.1. Famille gamma

(a) 1

(b) > 1

F IG . 4.1: Densits gamma pour diffrentes valeurs du paramtre

Dmonstration. En intgrant par parties, on obtient


Z
t (+1)1 e t d t
( + 1) =
0
Z

t
= t (e )|0 +
t 1 e t d t
0

= 0 + ()
= ().

Thorme 4.2. Soit (; x) la fonction gamma incomplte. Si est un entier, alors


(; x) = 1

1
X
j =0

x j e x
.
j!

Dmonstration. On dmontre le rsultat par induction (Klugman et collab., 2012a,


annexe A) ou encore en intgrant
Z x
1
t 1 e t d t
() 0
par parties 1 reprises.

152

Modles paramtriques potentiels


Du thorme prcdent, on a que si le paramtre est un entier, alors

F X (x) = 1

1
X (x) j e x
j =0

j!

Exemple 4.1. Soit X Gamma(4, 2). Alors


3 5j
X
j =0 j !

25 125
5
= 1e
1+5+
+
2
6

F X (2,5) = 1 e 5

= 0,7349741.
On peut vrifier ce rsultat avec R :
> pgamma(2.5, 4, 2)
[1] 0.7349741

Le moment dordre k de la distribution gamma est


Z

E [X ] =
x +k1 e x d x
() 0
Z
( + k) +k
=
x +k1 e x d x
() +k
0 ( + k)
( + k)
=
()k
k

pour k > . Si k Z (entier positif ou ngatif ), ce rsultat se rduit

( + 1) ( + k 1)

,
k 1

k =0
E [X k ] = 1,

|k|

, k 1, |k| < .

( 1)( 2) ( |k|)

4.2. Famille bta

153

De plus, lesprance limite est


Z x
1
E [X ; x] =
(y)+11 e y d y + x(1 F X (x))
() 0
Z x
1
=
u e u d u + x(1 F X (x))
() 0
( + 1)
=
( + 1; x) + x(1 F X (x))
()

= ( + 1; x) + x(1 (; x)).

4.2

Famille bta

La distribution bta est continue et dfinie sur un intervalle fini. Elle est donc
rarement utilise pour la modlisation des montants de sinistres. Par contre, elle
joue un rle important dans la cration de nouvelles distributions, comme nous
le verrons plus loin. Lorsque son domaine est restreint lintervalle (0, 1), elle est
souvent utilise comme modle pour une probabilit.
On dbute la prsentation avec une version de la distribution bta trois
paramtres, o le troisime paramtre est la borne suprieure du support de la
distribution. Ainsi, soit X Bta(, , ) une variable alatoire avec fonction de
densit de probabilit
( + ) 1 x 1
x 1
1
()()

1
1 x
1
x 1
, 0 < x < ,
=
1
(, )

f (x) =

o
(a, b) =
=

Z
0

t a1 (1 t )b1 d t

(a)(b)
(a + b)

est la fonction bta. La fonction de rpartition est


F (x) = (, ; x/),
o
(a, b; x) =

1
(a, b)

Z
0

t a1 (1 t )b1 d t ,

a > 0, b > 0, 0 < x < 1

Modles paramtriques potentiels

1.5
0.0

0.95

0.5

1.0

fX(x)

1.15
1.05

fX(x)

1.25

154

0.0

0.2

0.4

0.6

0.8

1.0

0.0

0.2

0.4

0.6

0.8

1.0

(a) = < 1

(b) > > 1

F IG . 4.2: Densits bta pour diffrentes valeurs des paramtres et

est la fonction bta incomplte rgularise.


La version la plus usuelle de la loi bta a = 1. Lorsque = = 1, la distribution
est appele une uniforme.
Ds que < 1 ou < 1, la fonction de densit de probabilit est concave vers
le haut. Lorsque les deux paramtres sont strictement suprieurs 1, la fonction
est plutt concave vers le bas. Enfin, la distribution est symtrique lorsque = ,
asymtrique gauche (1 (X ) < 0) lorsque > et asymtrique droite (1 (X ) > 0)
lorsque > . Voir la figure 4.2 pour des illustrations.
Le moment dordre k est
( + )
E [X ] =
()()
k

x k x 1
x 1
1
dx

Z
0

( + )
()()

u +k1 (1 u)1 d u

k ( + )( + k)
=
()( + + k)
pour k > . Si k Z+ (entier positif ), ce rsultat se rduit
E [X k ] =

k ( + 1) ( + k 1)
.
( + )( + + 1) ( + + k 1)

4.3. Familles et paramtres dchelle


Lesprance limite est, quant elle,
Z
( + ) x/ +11
u
(1 u)1 d u + x(1 F X (x))
()() 0
( + )( + 1)
(, ; x/) + x(1 F X (x))
=
()( + + 1)

=
( + 1, ; x/) + x(1 (, ; x/)).
+

E [X ; x] =

4.3

Familles et paramtres dchelle

La notion de paramtre dchelle dune distribution a dj t aborde ici et l


de manire informelle. On donne ici une dfinition formelle.
Dfinition 4.1 (Famille dchelle). Une famille de distributions est une famille
dchelle si pour toute variable alatoire X membre de cette famille, Y = c X est
aussi membre de la famille.
Dfinition 4.2 (Paramtre dchelle). Une famille dchelle possde un paramtre
dchelle si pour toute variable alatoire X membre de cette famille et Y = c X , les
paramtres de Y sont identiques ceux de X , lexception du paramtre dchelle,
qui est gal c fois le paramtre dchelle de X .
Klugman et collab. (2012a), dans leur lannexe A, ont choisi une paramtrisation
des lois de probabilit telle que est toujours un paramtre dchelle. Nous ne
suivons pas cette convention en tout temps, en grande partie par habitude, mais
aussi en partie afin davoir la mme paramtrisation que les fonctions de lois de
probabilit de R.
Exemple 4.2. Soit X Gamma(, ) et Y = c X . On a alors
F Y (x) = Pr[Y x]
= Pr[c X x]
= Pr[X x/c]
= F X (x/c)
= (; x/c),
do Y Gamma(, /c). La famille gamma est donc une famille dchelle. Par
contre, nest pas un paramtre dchelle. Cest plutt = 1/ qui est un paramtre
dchelle pour la famille gamma.

155

156

Modles paramtriques potentiels


Exemple 4.3. La famille bta est une famille dchelle et, de ses trois paramtres,
est un paramtre dchelle. En effet, si X Bta(, , ) et Y = c X , alors
F Y (x) = F X (x/c)
= (, ; x/(c)),
do Y Bta(, , c).
Exemple 4.4. Soit X Pareto(, ) et Y = c X . Alors
F Y (x) = F X (x/c)

= 1
+ x/c

c
= 1
,
c + x
do Y Pareto(, c). Le paramtre constitue donc un paramtre dchelle de
la distribution de Pareto.

4.4

Cration de distributions partir de distributions


connues

Lide ici est de crer de nouvelles distributions par diverses transformations


de distributions connues, en particulier les lois gamma et bta.

4.4.1

Multiplication par une constante

La multiplication par une constante quivaut essentiellement un changement


dchelle. En gnral, cest une transformation qui est combine avec une autre
plus complexe.
Soit X , une variable alatoire avec densit f X (x) et Y = c X , c > 0. On a alors
F Y (y) = Pr[Y y]
h
yi
= Pr X
c
= F X (y/c)
et
f Y (y) =

1
f X (y/c).
c

Exemple 4.5. Il est simple de vrifier que si X Exponentielle(1), alors Y = X /


Exponentielle().

4.4. Cration de distributions partir de distributions connues

4.4.2

lvation une puissance

Soit X , une variable alatoire strictement positive (F X (0) = 0) et Y = X 1/ . Si


> 0, alors
F Y (y) = F X (y )
f Y (x) = y 1 f x (y ).
Si < 0, alors on a
F Y (y) = 1 F X (y )
f Y (y) = y 1 f X (y ).
On utilise gnralement la terminologie suivante :

x > 0 : la distribution de Y est la distribution de X transforme ;


x = 1 : la distribution de Y est la distribution de X inverse ;
x < 0 : la distribution de Y est la distribution de X transforme inverse.
Exemple 4.6. Soit X Exponentielle(1) et
Y =

X 1/
,

> 0,

soit une transformation suivie dun changement dchelle. Alors


F Y (y) = F X ((y) )

= 1 e (y) ,
et

f Y (y) = y 1 e (y) ,
do Y Weibull(, ). Attention : la Weibull est parfois paramtre de telle sorte
que

f (x) = y 1 e y ,
ce qui correspond plutt la transformation Y = (X /)1/ .
Si < 0, on a
F Y (y) = 1 F X ((y) )
= e (y)
= e (y)

157

158

Modles paramtriques potentiels


avec = . On a alors Y Weibull inverse( , ).
Enfin, si = 1, on a

1
F Y (y) = 1 F X
y
= e 1/(y) ,
soit Y Exponentielle inverse().
Exemple 4.7. La famille gamma transforme est une extension de la famille gamma
obtenue par transformation dune variable alatoire gamma. Soit X Gamma(, 1)
et
X 1/
.
Y =

Si > 0, alors
F Y (y) = (; (y) )
et
f Y (y) =

y 1 e (y) ,
()

et lon dit que Y Gamma transforme(, , ). Lorsque 1, le mode de la


distribution est en y = 0. Lorsque > 1, le mode de la densit est alors en y > 0
(voir la figure 4.3).
Outre la gamma transforme elle-mme, les principaux membres de la famille
gamma transforme sont :
1. Weibull(, ) lorsque = 1 ;
2. Gamma(, ) lorsque = 1 ;
3. Exponentielle() lorsque = = 1.
Les relations entre les membres de la famille sont illustres la figure 4.4.
Si < 0 dans la transformation ci-dessus et = , alors on obtient

F Y (y) = 1 (; (y) )
et

f Y (y) =

e (y)
,

y +1 ()

qui sont les fonctions de rpartition et de densit de probabilit de la distribution


Gamma transforme inverse de paramtres , et . Le mode de cette distribution
est toujours strictement positif. Les membres de cette famille sont les distributions
inverses de celles de la figure 4.4.

f(x)

0.2

0.4

0.6

0.8
0.6
0.4

0.0

0.2
0.0

f(x)

159

0.8

1.0

4.4. Cration de distributions partir de distributions connues

(a) = 1

(b) > 1

F IG . 4.3: Fonction de densit de probabilit de la loi gamma transforme

Gamma transforme

Gamma

,

  , , H

HH = 1
= 1 
HH


H



j
H

Weibull

,




H
H
HH
=1




 =1
 



H
H
j
H


Exponentielle

F IG . 4.4: Relations entre les membres de la famille gamma transforme

160

Modles paramtriques potentiels


Exemple 4.8. On peut largir la famille bta par le biais dune transformation. Soit
X Bta(, ) et

X 1/
Y =
.
1 X
Par la technique du changement de variable, on obtient
f Y (y) =

( + )
(y/)
,
()() y(1 + (y/) )+

y > 0,

do
( + )
F Y (y) =
()()

Z
0

(x/)
d x.
y(1 + (x/) )+

Or, avec le changement de variable u = v/(1+ v), v = (x/) (de sorte que 0 < u < 1),
on obtient
Z
( + ) u 1
F Y (y) =
u (1 u)1 d u
()() 0
= (, ; u).
La distribution de la variable alatoire Y est une bta transforme de paramtres
, , et . La famille bta transforme compte plusieurs membres dont, entre
autres :
1. Burr(, , ) lorsque = 1 ;
2. Pareto gnralise(, , ) lorsque = 1 ;
3. Pareto(, ) lorsque = = 1.
Ces relations sont illustres la figure 4.5.
De lexemple 1.17, si X 1 Gamma(, 1), X 2 Gamma(, 1) et X 1 et X 2 sont
indpendantes, alors Z = X 1 /(X 1 + X 2 ) Bta(, ). Puisque
Z
X1
=
,
1 Z
X2
on peut aussi dfinir la bta transforme comme la distribution de
1/
X1
Y =
.
X2

Remarque. La distribution inverse gaussienne nest pas linverse dune normale.


Le terme inverse provient plutt de la relation entre les fonctions gnratrices
des cumulants des deux lois.

4.4. Cration de distributions partir de distributions connues




Pareto gnralise


H
=
HH
1
H

? 


HH
H

Log-logistique

, ,

Burr inverse

HH
H= 1
HH

, ,

Burr

, ,



H  Paralogistique inverse
HH =
,

=1
H1 
HH
6
=
H
?


j
H

, , ,

 ,
= 6




1
=
 







Paralogistique

Bta transforme

=1

H
j
H
?

,

Pareto

161

HH
j


Pareto inverse

 ,




F IG . 4.5: Relations entre les membres de la famille bta transforme

4.4.3

Exponentielle (et logarithme)

Soit X , une variable alatoire strictement positive (F X (0) = 0) et Y = e X . On a


alors
F Y (y) = F X (ln y)
et
f Y (y) =

1
f X (ln y),
y

y > 0.

La distribution ainsi cre est dite log-loi, dans la mesure o la distribution de


ln Y est loi.
Remarque. Si la fonction gnratrice des moments de X existe, il est alors simple
de calculer les moments de Y puisque E [Y k ] = E [e k X ] = M X (k).
Exemple 4.9. Soit X Gamma(, ) et Y = e X . Premirement, puisque X est dfinie sur [0, ), le domaine de Y est [1, ). On a
f Y (y) =

(ln y)1
y +1 ()

y >1

F (x) = (; ln x).
On dit que Y Log-gamma(, ). Pour modliser des montants de sinistre, on
utilise normalement Y 1.

162

Modles paramtriques potentiels

4.4.4

Mlanges de distributions

Un mlange de distributions (mixture of models) est le rsultat du calcul de la


distribution marginale dune distribution dont un (ou plusieurs) des paramtres
est considr comme une variable alatoire.
Soit X | = une variable alatoire avec fonction de densit (ou de masse) de
probabilit f (x|) et une variable alatoire avec fonction de densit (ou de masse)
de probabilit u(). Alors, par la loi des probabilits totales,
Z

f X (x) =

f (x|)u() d

est la densit marginale de X .


Exemple 4.10. Soit X | = Exponentielle() et Gamma(, ). On a alors
Z

1 e e x d
() 0
Z

=
+11 e (x+) d
() 0
Z
( + 1)
(x + )+1 +11 (x+)
=

e
d
+1
() (x + )
( + 1)
0

=
,
(x + )+1

f X (x) =

do X Pareto(, ).
Remarques.
1. Lorsque est une variable alatoire continue, on parle de mlange continu.
2. Un autre mlange (continu) bien connu est le suivant : si
X | = Poisson()
Gamma(, )
alors X Binomiale ngative(, /( + 1)).
3. On a les relations
E [X ] = E [E [X |]]
Var[X ] = E [Var[X |]] + Var[E [X |]].

4.4. Cration de distributions partir de distributions connues


Considrons le cas particulier suivant : Bernouilli(p), la variable alatoire
X | = 1 a comme densit f 1 (x) et la variable alatoire X | = 0 a comme densit
f 2 (x). Alors
f X (x) =

1
X

f (x|)p (1 p)1

=0

= p f 1 (x) + (1 p) f 2 (x).
Ce mlange est appel un mlange discret.
De manire gnrale, la fonction de densit dun mlange discret de n densits
est
n
X
f X (x) =
p i f i (x),
i =1

o p 1 , . . . , p n [0, 1] et

Pn

i =1 p i

= 1. On remarque que
F X (x) =

n
X

p i F i (x)

i =1

et
E [X k ] =

n
X
i =1

p i E [X ik ].

Pn

Remarque. La densit f X (x) = i =1 p i f X i (x) nest pas la densit de la variable


P
alatoire X = ni=1 p i X i . Il sagit de deux concepts entirement diffrents. Dans le
premier, la probabilit associe une valeur de X est un mlange des probabilits
associes cette mme valeur par les densits f 1 , . . . , f n . En revanche, la relation
P
X = ni=1 p i X i signifie que les valeurs possibles de X sont un mlange des valeurs
possibles de X 1 , . . . , X n .
Exemple 4.11. Les mlanges discrets sont trs souvent utiliss pour crer de nouvelles distributions aux caractristiques particulires que lon ne retrouve pas chez
les distributions dusage courant.
Par exemple, la figure 4.6 montre quun mlange de deux distributions lognormales peut rsulter en une fonction de densit de probabilit bimodale, mais
ayant nanmoins une queue similaire celle dune log-normale.
la figure 4.7, on a cr une distribution en mlangeant une loi de Poisson
avec une distribution binomiale ngative avec un paramtre r < 1. Il en rsulte une
distribution similaire la Poisson, mais avec une queue sensiblement plus lourde :
le maximum effectif (le 99,999e quantile pour tre plus prcis) de la distribution est
ainsi pass de 10 dans le cas de la Poisson pure, prs de 58 dans le mlange.

163

164

Modles paramtriques potentiels

0.010
0.000

f(x)

0.020

Lognormale( = 3,575, = 0,637)

50

100

150

200

250

0.010
0.000

f(x)

Lognormale( = 4,555, = 0,265)

50

100

150

200

250

200

250

0.006
0.000

f(x)

0.012

Mlange

50

100

150
x

F IG . 4.6: Fonctions de densit de probabilit de deux log-normales et de leur mlange

4.4. Cration de distributions partir de distributions connues

165

0.10
0.00

f(x)

0.20

Poisson(2)

10

15

20

0.15
0.00

f(x)

0.30

Binomiale ngative(0,3, 0,035)

10

15

20

15

20

0.10
0.00

f(x)

0.20

Mlange

10
x

F IG . 4.7: Fonctions de probabilit dune Poisson, dune binomiale ngative et de


leur mlange

166

Modles paramtriques potentiels

4.4.5

Raccordement de distributions

Dans un mlange la densit en un point x provient en partie de chacune des


distributions du mlange. Dans un raccordement de distributions (spliced distributions, ou splicing), la densit en x provient de lune ou lautre des distributions
selon la valeur de x.
Soit f i , i = 1, . . . , n, une fonction de densit sur lintervalle (c i 1 , c i ). Ainsi
Z

ci
c i 1

f i (x) d x = 1

et on suppose que les intervalles (c i 1 , c i ) sont disjoints. La fonction de densit


de probabilit de la variable alatoire X rsultat du raccordement des n densits
f 1 , . . . , f n est

p 1 f 1 (x), c 0 < x < c 1

p 2 f 2 (x), c 1 < x < c 2


f X (x) = .
..

..

p n f n (x), c n1 < x < c n ,


P
o p i [0, 1] et ni=1 p i = 1.
En pratique, il peut tre difficile de trouver des distributions dont le support est
fini et limit un intervalle (c i 1 , c i ). Ainsi, de manire plus gnrale, si g i (x) est
une densit de probabilit sur un intervalle plus grand que (c i 1 , c i ) et G i (x) est la
fonction de rpartition correspondante, alors on dfinit
g i (x)
, c i 1 < x < c i
f i (x) = G i (c i ) G(c i 1 )

0,
ailleurs.

Ainsi, la fonction f i demeure une fonction de densit sur (c i 1 , c i ).


Remarques.
1. On peut considrer les points de raccordement connus ou encore comme des
paramtres estimer. Dans ce dernier cas, il faut veiller ne pas ajouter un
nombre excessif de paramtres au modle.
2. Il ny a aucune garantie que la densit rsultant dun raccordement est continue.
Pour y arriver, on doit avoir
p i f i (c i ) = p i +1 f i +1 (c i )
pour i = 1, . . . , n 1.

4.5. Fonctions R pour les lois de probabilit


Exemple 4.12. Soit X une variable alatoire dont la densit est le raccordement
dune densit Gamma(2, 0,1) sur lintervalle (0, 20) et dune densit Gamma(16, 0,4)
sur lintervalle (30, 50) avec p 1 = 0,6 et p 2 = 0,4. On a donc
g 1 (x) = 0,01xe 0,1x ,

x >0

16

g 2 (x) =

0,4
x 15 e 0,4x ,
(16)

x >0

et

g 1 (x)

,
0 < x < 20
0,6
G 1 (20)
f X (x) =
g 2 (x)

, 30 x 50.
0,4
G 2 (50) G 2 (30)

La figure 4.8 prsente la densit de cette distribution.

4.5

Fonctions R pour les lois de probabilit

Le systme R comporte des fonctions pour calculer les fonctions de densit,


de rpartition et de quantile de plusieurs lois de probabilit, de mme que des
fonctions pour gnrer des nombres alatoires de ces lois. Pour une racine foo, les
fonctions R sont nommes, dans lordre, dfoo, pfoo, qfoo et rfoo.
Le package actuar fournit les fonctions d, p, q et r pour toutes les lois de probabilit de lannexe A de Klugman et collab. (2012a) qui ne se trouvent pas dj
dans R, lexception de linverse gaussienne et de la log-t mais avec en plus la
log-gamma (Hogg et Klugman, 1984).
Le tableau 4.1 dresse la liste des lois de probabilit supportes par R et actuar
et qui sont couramment utilises pour la modlisation des montants de sinistres.
On trouvera lannexe A les fonctions de densit et de rpartition de ces lois, ainsi
que le nom des arguments des fonctions R correspondant leurs paramtres.
En plus des fonctions d, p, q et r, actuar ajoute des fonctions m, lev et mgf pour
calculer, dans lordre, les moments thoriques, les moments limits et la fonction
gnratrice des moments, lorsquelle existe. Ces nouvelles fonctions sont dfinies
pour toutes les lois du tableau 4.1 en plus des suivantes : bta, khi carr, normale
(sauf lev), uniforme et linverse gaussienne du package SuppDists (Wheeler, 2013).

4.6

Valeurs extrmes

La caractrisation des distributions par leur comportement dans les valeurs


extrmes est tout spcialement important en sciences actuarielles du fait de lincidence financire des trs grands sinistres.

167

168

Modles paramtriques potentiels

0.02
0.00

g1(x)

Gamma(2, 0.1)

10

20

30

40

50

40

50

40

50

0.02
0.00

g2(x)

0.04

Gamma(16, 0.4)

10

20

30
x

0.02
0.00

f(x)

Raccordement

10

20

30
x

F IG . 4.8: Fonction de densit de probabilit de deux lois gamma et leur raccordement

4.6. Valeurs extrmes

169

Famille

Loi

Racine (alias)

Bta transforme

Bta transforme
Burr
Log-logistique
Paralogistique
Pareto gnralise
Pareto
Burr inverse
Pareto inverse
Paralogistique inverse

trbeta (pearson6)

Gamma transforme
Gamma transforme inverse
Gamma*
Gamma inverse
Weibull*
Weibull inverse
Exponentielle*
Exponentielle inverse

trgamma

Log-normale*
Log-gamma
Pareto translate
Bta gnralise

lnorm

Gamma transforme

Autre

burr
llogis
paralogis
genpareto
pareto (pareto2)
invburr
invpareto
invparalogis

invtrgamma
gamma
invgamma
weibull
invweibull (lgompertz)
exp
invexp

lgamma
pareto1
genbeta

TAB. 4.1: Lois de probabilit pertinentes pour la modlisation de montants de


sinistres supportes par R et actuar. Les lois identifies par un astrisque (*) sont
incluses dans le systme R de base.

Cette section prsente diverses manires de classer les lois de probabilit selon
le poids de leur queue.

4.6.1

Moments

On a
k

E [X ] =

x k f (x) d x.

Si E [X k ] < pour toutes les valeurs de k, alors cest que f (x) dcrot linfini plus
rapidement que x k ne crot. Par contre, si E [X k ] = pour k k 0 , alors f (x) dcrot

170

Modles paramtriques potentiels


plus vite que x k ne crot pour k k 0 , mais dcrot moins vite que x k ne crot pour
k > k0 .
Si tous les moments existent, on dit alors que la distribution a une queue
lgre (gamma transforme, gamma, exponentielle, Weibull, bta transforme avec
k < , bta, log-normale). Par contre, si les moments suprieurs nexistent pas, la
distribution a alors une queue lourde ou paisse (gamma inverse, bta transforme
avec k ).
Cette mthode donne une indication de lpaisseur de la queue, mais elle nest
pas toujours prcise.

4.6.2

Comparaison des fonctions de survie

Lide est que si S(x) est grand pour x grand, on est en prsence dune queue
paisse. Puisque, par dfinition,
lim S X (x) = 0,

il sagit dun concept relatif. Il faut donc comparer les taux de dcroissance des
fonctions de survie de deux distributions. On value
lim

S 1 (x)

x S 2 (x)

= lim

f 1 (x)

x f 2 (x)

Si le rsultat est une constante c, les deux distributions ont des queues comparables.
Si le rsultat est 0, la queue de f 1 est plus lgre. Si le rsultat est , la queue de f 2
est plus lgre.
Exemple 4.13. Soit f 1 la fonction de densit de probabilit dune loi Gamma(, )
et f 2 celle dune loi Pareto(, ). En liminant les termes qui ne dpendent pas de x,
on a
lim

x 1 e x
f 1 (x)
= lim
f 2 (x) x (x + )1
= lim e (+1) ln(x+)+(1) ln xx .
x

Or, puisque x plus rapidement que ln x,


lim

f 1 (x)

x f 2 (x)

= 0.

La distribution de Pareto a donc la queue la plus lourde.

4.6. Valeurs extrmes

4.6.3

171

Taux dincidence

Il est galement possible dutiliser le taux dincidence pour comparer les queues
des distributions. On a
f (x)
h(x) =
S(x)
F 0 (x)
=
S(x)
F (x + t ) F (x)
= lim
t 0
t S(x)
Pr[x < X x + t |X > x]
= lim
.
t 0
t
Ainsi, on peut interprter h(x)t comme la probabilit davoir un incident (sinistre,
dcs) x sachant que lon a survcu jusqu x. Donc, si le taux dincidence est
petit, la probabilit davoir un incident est faible ou, inversement, la probabilit de
survivre est grande. On a donc une queue lourde.
De manire gnrale, si h(x) est dcroissant (DFR), on est en prsence dune
distribution avec queue lourde. Si h(x) est croissant (IFR), on est en prsence dune
distribution avec queue lgre.
De plus, puisque
h(x) =

d
ln S(x)
dx

et
S(x) = e

Rx
0

h(y) d y

x 0,

il y a bijection entre le taux dincidence et la distribution. Par consquent, si h 1 (x) <


h 2 (x) pour tout x, alors
S 1 (x) > S 2 (x)
et la queue de la distribution f 1 est plus lourde que celle de f 2 .
Si S(x) est difficile valuer, on peut tirer profit du fait que
S(x)
1
=
h(x) f (x)
R
f (t ) d t
= x
f (x)
Z
f (x + y)
=
d y.
f (x)
0
Donc, si f (x + y)/ f (x) est croissant en x pour tout y, le taux dincidence h(x) est
dcroissant et f a une queue lourde.

172

Modles paramtriques potentiels


Exemple 4.14. Soit
f (x) =

1 x
x
e
,
()

x 0

la fonction de densit de probabilit dune loi Gamma(, ). On na pas de formule


explicite pour la fonction de survie. En revanche,
f (x + y) (x + y)1 e (x+y)
=
f (x)
x 1 e x

y 1 y
= 1+
e
.
x
Cette dernire fonction est croissante en x si < 1 et dcroissante en x si > 1.
Ainsi, la distribution gamma est IFR (queue lgre) si > 1 et DFR (queue lourde)
si < 1. Si = 1 (distribution exponentielle), le taux dincidence est constant.

4.6.4

Esprance rsiduelle

De la sous-section 3.1.3, on sait que lesprance rsiduelle est


e(x) = E [X x|X > x]
=

E [X ] E [X ; x]
.
1 F X (x)

Or, puisque
x

E [X ; x] =
=

Z0 x

(1 F (y)) d y
S(y) d y,

on peut aussi exprimer lesprance rsiduelle sous la forme


R
S(y) d y
e(x) = x
.
S(x)
De plus, par une application de la rgle de lHpital,
R
S(y) d y
lim e(x) = lim x
x
x
S(x)
S(x)
= lim
x f (x)
1
= lim
.
x h(x)

4.7. Exercices

173

Si la fonction desprance rsiduelle, e(x), est croissante, on dit que f est IMRL
et quelle possde une queue paisse. Dans le cas contraire, f est dite DMRL et elle
possde une queue lgre.
En rsum, f est la fonction de densit de probabilit dune loi avec queue
paisse si

x h(x) est dcroissant en x (DFR) ;


x f X (x + y)/ f X (x) est croissant en x ;
x S(x + y)/S(x) est croissant en x ; et
x e(x) est croissante en x (IMRL).
Exemple 4.15. Soit X Exponentielle(), cest--dire que S(x) = e x . On a
R

e(x) =
=

e y d y
e x

1
,

une constante.
Exemple 4.16. Soit X Pareto(, ), cest--dire que

S(x) =
+x

On a
R

e(x) =

( + y) d y

( + x)
( + x)+1
=
( 1)( + x)
+x
=
,
1

do la Pareto est IMRL.

4.7

Exercices

4.1 Soit X , une variable alatoire avec densit Pareto(, ) reprsentant le montant
dun sinistre et c > 0, une constante. Dmontrer que la distribution de Y = c X
est une distribution Pareto(, c).

174

Modles paramtriques potentiels


4.2 Soit X , une variable alatoire avec fonction de densit
f (x) =

1 |x/|
e
,
2

< x < .

Trouver la fonction de rpartition de Y = e X .


4.3 Il existe une relation intressante entre les fonctions de rpartition des lois
gamma et Poisson. Soit X , une variable alatoire avec densit Gamma(, ) et
un entier. Dmontrer que
Pr[X x] = Pr[Y ],
o Y Poisson(x/). Utiliser la paramtrisation de la loi gamma o le second
paramtre est un paramtre dchelle.
4.4 Soit X , une variable alatoire avec densit de Pareto gnralise(, , ). Dmontrer que la distribution de
Y =

X
X +

est une distribution bta et identifier les paramtres de cette loi.


4.5 Soit X , une variable alatoire telle que X Pareto(, 1). Trouver la fonction de
rpartition de la variable alatoire
Y = 5X 1/4
et identifier cette distribution ainsi que ses paramtres.
4.6 Soit X , une variable alatoire avec densit Gamma(, ).
a) Trouver la fonction de densit de Y = e X .
b) Trouver E [Y ] et Var[Y ].
c) Est-ce que tous les moments existent ?
4.7 Soit X , une variable alatoire et i (0 i 1), le taux dinflation pour lanne
2006. Pour chacune des lois ci-dessous, trouver la distribution de Y = (1 + i )X :
a) X Pareto(, ).
b) X Burr(, , ).
c) X Log-gamma(, ).
4.8 Soit X , une variable alatoire avec densit Pareto(, ). Trouver la fonction de
densit de
Y = X 1/ , > 0.

4.7. Exercices

175

4.9 Un assureur modlise des donnes laide de la variable alatoire X qui a une
distribution de Pareto de paramtres et . On pose
Y = ln(1 + X /).
Dterminer la distribution de Y .
4.10 Un assureur automobile a dans sa base de donnes les montants des sinistres
de 2004. Il estime que les sinistres obissaient alors une loi Burr( = 0,5, =
2, = 3). Pour sen servir le premier janvier 2007, il se doit de les mettre jour
selon les considrations suivantes :

x 2005 : inflation de 4 % ;
x 2006 : inflation de 4,5 % ; et
x nouvelles taxes de 16 %.
Quelle est la probabilit davoir un sinistre suprieur 4 en 2007 ?
4.11 Soit X , la variable alatoire reprsentant le montant dun sinistre (en millions)
pour lanne 2006. Sa fonction de densit de probabilit est
f (x) = 3x 4 ,

x 1.

On observe quune inflation de 10 % affecte uniformment tous les sinistres


de 2006 2007.
a) Trouver la fonction de rpartition du montant des sinistres en 2007.
b) Trouver la probabilit que le montant dun sinistre en 2007 soit suprieur
2 200 000 $.
4.12 Pour un assur dun certain groupe, le nombre de sinistres suit une loi Binomiale(10, ).
Sachant que, dans ce groupe, le paramtre est tir dune distribution uniforme sur lintervalle (0, 1), trouver la probabilit quun assur pris au hasard
ait plus de six sinistres au cours dune priode.
4.13 Soit X , une variable alatoire telle que la distribution conditionnelle de X
tant donn le paramtre = est une distribution Gamma(, ), o obit
une loi gamma de paramtres et . Trouver la distribution de X .
4.14 On suppose que X a une distribution conditionnelle gomtrique telle que
Pr[X = x| = ] = (1 )x1 ,

x = 1, 2, . . .

et est une ralisation de la variable alatoire de loi Bta(, ). Dmontrer


que la fonction de masse de probabilit de X est
Pr[X = x] =

( + )( + 1)( + x 1)
.
()()( + + x)

176

Modles paramtriques potentiels


4.15 On suppose que X a une distribution conditionnelle de Weibull(, 1/ ) telle
que

f (x| = ) = x 1 e x , x > 0.
Aussi, on suppose que Gamma(, ). Dmontrer que la distribution marginale de X est une Burr(, , 1/ ).
4.16 On suppose que le montant dun sinistre pour un groupe dassurs a une
distribution Burr(5, 1, ). Si est une ralisation de la variable alatoire
pour ce groupe dassurs et que lon suppose que Gamma(10, 2), trouver
lesprance et la variance du montant dun sinistre pour un assur pris au
hasard.
4.17 Soit le taux dchec suivant pour le montant dun sinistre pour une valeur
donne de ,
3
,
(x|) =
x +
o x est la ralisation de la variable alatoire X reprsentant le montant dun
sinistre et est la ralisation de la variable alatoire o Gamma(10, 0,01).
Trouver lesprance et la variance du montant dun sinistre pris au hasard.
4.18 Comparer les queues des lois Gamma(, ) et Log-normale(, 2 ).
4.19 Soit X , une variable alatoire reprsentant le montant dun sinistre et lesprance de vie rsiduelle suivante
e(x) = 2 000 + 2x.
Pour un contrat dassurance comportant une limite suprieure de 10 000,
trouver le ratio dlimination de perte (LER) de lassureur.
4.20 Le tableau ci-dessous prsente lesprance de vie rsiduelle pour certaines
valeurs de x.
x

e(x)

0
4
9
14

4
7
10,75
14,5

a) quelle distribution peut-on associer ces donnes et quelles sont les


valeurs de ses paramtres ?
b) Trouver E [X ; 10].

4.7. Exercices

177

4.21 On construit une distribution raccorde sur les sous-intervalles (0, 2), (2, 8)
et (8, 16) avec les poids respectifs 0,5, 0,20 et 0,30. Dans chacun des sousintervalles, on utilise une distribution gamma, de moyenne gale au point
milieu du sous-intervalle et de variance gale 1. crire la densit de probabilit obtenue sur (0, 16). La rponse sera en fonction de la gamma incomplte.
4.22 On construit un modle raccord avec une distribution uniforme sur lintervalle (0, 10) et une loi de Pareto de paramtres = 3 et = 100 sur le reste des
valeurs positives. Quels poids doivent tre accords aux distributions pour
que la densit obtenue soit continue ?
4.23 a) Comparer les queues dune distribution Weibull(, ) et dune distribution
Weibull inverse(, ) en utilisant les critres suivants :
i) lexistence des moments ; et
ii) la comparaison des fonctions de survie.
b) En utilisant une distribution Weibull et une distribution Weibull inverse
dont les moyennes et variances sont gales, comparer graphiquement les
queues des distributions.
4.24 Soit Y , une variable alatoire telle que
f Y (y) =

S X (y)
E [X ]

pour une variable alatoire X quelconque. On dit quune telle distribution est
quilibre. Dmontrer que
M Y (t ) =

M X (t ) 1
t E [X ]

lorsque M X (t ) existe. Astuce 1 : intgrer par parties. Astuce 2 : lexistence de


M X (t ) signifie que lintgrale
Z
M X (t ) =
e t x f X (x) d x
0

converge.
4.25 Un assureur modlise ses sinistres par une variable alatoire X avec densit
f (x) = (1 + 2x 2 )e 2x ,
a) Calculer la fonction de survie S X (x).
b) Calculer le taux dincidence h(x).

x 0.

178

Modles paramtriques potentiels


c) Calculer la fonction desprance rsiduelle e(x).
d) Calculer limx h(x).
e) Calculer limx e(x).
f) Dmontrer que e(x) est une fonction strictement dcroissante, mais que
h(x) nest pas une fonction strictement croissante.

Exercices proposs dans Loss Models, 4e d.


5.1, 5.3, 5.4, 5.5, 5.7, 5.9, 5.13, 5.17, 5.18, 5.19, 5.20, 5.21, 5.22, 5.23, 3.25, 3.26, 3.27

Rponses
4.2 F Y (y) = 12 e ln(y)/ I {0<y<1} + (1 12 e ln(y)/ )I {y1}
4.4 Bta(, )
4.5 Burr inverse(, 4, 5)
4.6 a) Log-gamma(, ) b) E [Y ] = (/( 1)) , Var[Y ] = (/( 2)) (( 1))2
c) Non
4.7 a) Pareto(, (1 + i )) b) Burr(, , (1 + i )) c) f Y (y) = (1 + i ) (ln(y) ln(1 +
i ))1 y 1 /()
4.8 Burr(, , 1/ )
4.9 Exponentielle()
4.10 0,6870
4.11 a) F (x) = 1 1,331x 3 , x 1,1 b) 0,125
4.12 4/11
4.13 X Pareto gnralise(, , )
4.16 5/4 et 145/48
4.17 500, 850 000
4.18 La queues de la distribution log-normale est plus lourde que celle de la distribution gamma.
4.19 0,30
4.20 a) Pareto(7/3, 16/3) b) 3,0215

4.7. Exercices

179

4.21

f X (x) =

0,5e x

(1; 2)

0<x 2

0,2
525 x 251 e 5x
,
2<x 8

(25)

(25; 40) (25; 10)


144 1441 12x

12 x
e
0,3

, 8 < x 16
(144; 192) (144; 96)
(144)

4.22 3/14
4.25 a) (1 + x + x 2 )e 2x
b) 2 (1 + 2x)/(1 + x + x 2 )
c) (1 + x + 0,5x 2 )/(1 + x + x 2 )

5 Modlisation paramtrique

Objectifs du chapitre
x Estimer les paramtres dune distribution du montant des sinistres partir de
donnes individuelles ou groupes, modifies ou non, en utilisant lune ou lautre
des mthodes suivantes : la mthode des moments, la mthode des quantiles, la
mthode du maximum de vraisemblance, la mthode de la distance minimale.
x Estimer la variance de lestimateur du maximum de vraisemblance et sen servir
pour dterminer et calculer un intervalle de confiance pour des paramtres dune
distribution.
x Pour les cas requrant une optimisation numrique, calculer les divers estimateurs
ci-dessus avec R.

Lapproche paramtrique consiste choisir un modle connu pour le phnomne sous tude. Ce modle comportera habituellement des paramtres quil
faudra dterminer dune manire ou une autre. En gnral, on optera pour une
technique ayant un certain degr dobjectivit et se basant sur des observations du
phnomne.
En termes plus statistiques, on cherche estimer le vecteur de paramtres
= (1 , . . . , p )0 dune fonction de densit de probabilit ou fonction de masse de
probabilit f (x; ) partir dun chantillon alatoire X 1 , . . . , X n de la population.
Un estimateur ponctuel de est une fonction = T (X 1 , . . . , X n ) de lchantillon.
Toute statistique est un estimateur ponctuel.
De plus, on se rappelle quun estimateur, T (X 1 , . . . , X n ), est une fonction de
lchantillon (une variable alatoire), alors quune estimation, T (x 1 , . . . , x n ), est une
ralisation dun estimateur (un nombre) obtenue en considrant un chantillon en
particulier.
On classe les techniques destimation tudies dans ce chapitre en deux grandes
classes :
181

182

Modlisation paramtrique
1. techniques bases sur la reproduction de certaines caractristiques des donnes
par les mmes caractristiques du modle (moments, quantiles, etc.) ;
2. techniques bases sur loptimisation dun critre objectif (vraisemblance, distance).
Une autre technique destimation qui repose sur des principes forts diffrents
est lestimation bayesienne. Celle-ci nest toutefois pas aborde dans cet ouvrage
puisquil est davantage pertinent den discuter lors de ltude de la thorie de la
crdibilit. Pour les intresss, Klugman et collab. (2012a, chapitre 15) traitent
brivement du sujet.

5.1

Mthode des moments

La mthode des moments est probablement la plus ancienne mthode utilise


pour faire de lestimation ponctuelle (Karl Pearson, fin 1800). Cest une mthode
destimation simple et intuitive, mais les estimateurs obtenus possdent gnralement peu de belles proprits.
On suppose que lon dispose dun chantillon alatoire X 1 , . . . , X n dune population distribue selon une fonction de rpartition F (x; ).
Pour dterminer les estimateurs des moments des paramtres 1 , . . . , p , on
impose que les p premiers moments thoriques soient identiques aux p premiers
moments empiriques. On doit donc rsoudre
E [X k ] = 0k =

n
1X
X k,
n i =1 i

k = 1, . . . , p,

Lorsquil y a deux paramtres estimer (p = 2), on doit donc rsoudre


E [X ] = X
E [X 2 ] = 02
ou, de manire quivalente,
E [X ] = X
2
Var[X ] =
avec, comme au chapitre 3,
2 = 02 X 2

n
1X
(X i X )2 .
=
n i =1

5.1. Mthode des moments

183

Il ny a aucune garantie que la solution au systme dquations soit unique ou


mme quelle nexiste.
Bien quils ne runissent peu de proprits doptimalit souhaitables pour des
estimateurs ponctuels, les estimateurs des moments demeurent populaires, si ce
nest qu titre de points de dpart pour dautres mthodes.
On remarquera que pour les lois inverse, il vaut souvent mieux utiliser les
moments ngatifs (k = 1, 2, . . . ).
Il ny a pas de mise en uvre proprement parler de la mthode des moments
dans R. La fonction emm prsente dans le code informatique du chapitre 3 peut
toutefois servir calculer les valeurs des moments empiriques 0k pour k = 1, . . . , p.
Exemple 5.1. Soit X 1 , . . . , X n un chantillon alatoire. Dterminer les estimateurs
des moments des paramtres des lois suivantes :
a) Exponentielle(). On pose simplement
E [X ] =

1
= 01 = X ,

do = X 1 .
b) Gamma(, ). On pose

= X

Var[X ] = 2

1
2,
=
=

E [X ] =

do
=
=

X 2
2

X
2

c) Pareto(, ). On a

= X
1
2
Var[X ] =
( 1)2 ( 2)

2
2.
=
=
1
2
E [X ] =

184

Modlisation paramtrique
En rsolvant pour et , on obtient
=
=

5.2

2
2
2 X 2

2 + X 2 )
X (
2 X 2

Mthode des quantiles

La mthode des quantiles (percentile matching) est similaire la mthode des


moments, sauf que lon gale cette fois les quantiles thoriques et empiriques. Soit
g 1 , . . . , g p des quantiles quelconques. Les estimateurs des paramtres 1 , . . . , p sont
alors la solution de
g i = g i , i = 1, . . . , p
ou, de manire quivalente,
F ( g i ) = g i ,

i = 1, . . . , p.

Ci-dessus, g est le 100g e quantile empirique liss prsent la section 3.5.


Exemple 5.2. On a les donnes
{5, 6, 8, 9, 10, 12, 15}
et lon souhaite estimer le paramtre dune distribution exponentielle en prservant
le 80e quantile liss. On a n = 7, g = 0,8, (n + 1)g = 6,4 et donc
0,8 = 0,6X (6) + 0,4X (7)
= (0,6)(12) + (0,4)(15)
= 13,2.
Lestimateur du paramtre de lexponentielle est tel que
F (13,2) = 1 e 13,2 = 0,8,
do
= 0,1219.
titre de comparaison, lestimateur de la mthode des moments est
1
= = 0,1077.
x

5.3. Mthode du maximum de vraisemblance

5.3

Mthode du maximum de vraisemblance

Lestimation laide des mthodes des moments et des quantiles est souvent
facile raliser, mais les estimateurs ainsi obtenus nont pas souvent de bonnes
proprits, la principale raison tant que ces techniques nutilisent quune petite
partie de linformation contenue dans lchantillon pour raliser lestimation. La
mthode du maximum de vraisemblance permet dutiliser une plus grande partie
de linformation contenue dans lchantillon. Ceci est particulirement important
lorsquune population a une queue paisse.

5.3.1

Donnes individuelles

Soit X 1 , . . . , X n un chantillon alatoire dune distribution avec fonction de


rpartition F (x; ), o est un vecteur de paramtres de longueur p.
De manire plus ou moins rigoureuse mathmatiquement, nous dirons que la
fonction de vraisemblance L(; x 1 , . . . , x n ) L() reprsente la probabilit dobserver lchantillon x 1 , . . . , x n . En fait, si F est discrte, on a bel et bien
L() = Pr[X 1 = x 1 , . . . , X n = x n ]
n
Y
=
Pr[X i = x i ]
=

i =1
n
Y
i =1

(F (x i ; ) F (x i ; )).

Si F est continue, Pr[X i = x i ] = 0 et f (x i ; ) nest pas une probabilit. Nanmoins, on peut trouver un intervalle (a i , b i ] tel que a i < x i b i , do
L() =

n
Y
i =1

(F (b i ; ) F (a i ; )).

Or, si i = b i a i est petit, alors


F (b i ; ) F (a i ; ) f (x i ; )i
et donc
L() =

n
Y

f (x i ; )i

i =1
n
Y

i =1

f (x i ; ).

185

186

Modlisation paramtrique
Lestimateur du maximum de vraisemblance (EMV) de est la valeur qui
maximise la fonction de vraisemblance L() sur son domaine de dfinition.
De plus, maximise L() si, et seulement si, maximise la fonction de logvraisemblance l () = ln L().
On dfinit les fonctions de score
S j () =

ln L(),
j

j = 1, . . . , p.

La maximisation de L() se rsume donc rsoudre les quations normales


S j () = 0,

j = 1, . . . , p.

En gnral, ces quations ne sont pas linaires. La rsolution du systme dquations ncessite donc des mthodes numriques de type NewtonRaphson. Nous
verrons comment cela peut se faire avec R la section 5.4.
Exemple 5.3. Soit X 1 , . . . , X n un chantillon alatoire tir dune distribution exponentielle de paramtre . La fonction de vraisemblance du paramtre est
donc
L() =

n
Y

e xi

i =1
P
n ni=1 x i

= e

do
l () = n ln

n
X

xi

i =1

et donc
S() =

n
n X

xi .
i =1

En rsolvant S() = 0, on obtient que


n
= Pn

i =1 X i

1
.
X

5.3. Mthode du maximum de vraisemblance

187

Exemple 5.4. Soit X 1 , . . . , X n un chantillon alatoire tir dune distribution Lognormale(, 2 ), cest--dire que
n 1 ln x 2 o
1
f (x) = p
exp
,
2

22 x

x > 0.

Pour trouver les estimateurs du maximum de vraisemblance de et 2 , on pose


dabord

!1
n 1X
n
n ln x 2 o
Y
i
2
2 n/2
L(, ) = (2 )
xi
exp
2

i =1
i =1
ou, de manire quivalente,
l (,) =

n
n
X
n
1 X
ln x i 2 (ln x i )2 .
ln(22 )
2
2 1
i =1

Ainsi,
n
1 X
(ln x i )
2 1
n
n
1 X
S 2 (,2 ) = 2 + 4 (ln x i ).
2
2 1

S 1 (,2 ) =

De S 1 (, 2 ) = S 2 (, 2 ) = 0, on trouve
n
1X
ln x i
n 1
n
1X
2 =
2.
(ln x i )

n 1

Exemple 5.5. Soit X 1 , . . . , X n un chantillon alatoire tir dune distribution inverse


gaussienne de paramtres et , cest--dire que
s

f (x) =

n (x )2 o

exp

,
2x 3
22 x

x > 0.

Pour trouver les estimateurs du maximum de vraisemblance de et , on pose

L(,) =

n/2 n
Y
1

n
n (x )2 o
X

i
x i3/2 exp 2
2
xi
i =1

188

Modlisation paramtrique
ou encore
l (,) = ln L(, )

n
n (x )2
3X
X
n

ln x i 2
.
= ln
2
2
2 i =1
2 i =1
xi
On a donc
S 1 (,) =
=

l (,)

n (x )2
X
i
3 i =1

xi

n
X

1
x
n

i
2
1

et

l (,)

n (x )2
n
1 X
i
=
2
.
2 2 i =1
xi

S 2 (,) =

Or, puisque
n (x )2
n
X
X
i
= n x 2 n + 2
x i1 ,
x
i
i =1
i =1

la solution de lquation S 1 (, ) = 0 donne = X . Par la suite, la solution de S 2 (, )


donne
n
= Pn
1
1
i =1 x i n x
n
= Pn
.
1
1
i =1 (x i x )

Exemple 5.6. Un assureur a enregistr les montants pays suivants :


{6, 11, 15, 18, 20, 20, 20, 20}.
Le contrat prvoyait une limite de 20 par contrat. Trouver lestimateur du maximum
de vraisemblance de pour une distribution Exponentielle.
On a
L() = f (6) f (11) f (15) f (18)(1 F (20))4
= 4 e 50 (e 20 )4
= 4 e 130

5.3. Mthode du maximum de vraisemblance

189

et
l () = 4 ln() 130,
do
l 0 () =

4
130.

On trouve donc = 4/130.


Exemple 5.7. Un rassureur souhaite faire la modlisation du montant pay en
vertu dun contrat de rassurance avec une franchise (ordinaire) de d et une limite
de u. Lassureur lui transmet les montants de sinistres X 1 , X 2 , . . . , X n .
Si X est la variable alatoire du montant dun sinistre, la variable Y du montant
pay par le rassureur est

Y =

0,

X <d

X d

u d

d X <u
X u

= max(min(X , u) d , 0).
On a donc
f Y (x) =

F X (d ),

x =0

f X (x + d ), 0 x < u

1 F (u), x = u d .
X

On suppose que r donnes sont nulles, que s se trouvent dans lintervalle


(0, u d ) et que t sont gales u d , o r + s + t = n. Pour simplifier la notation, on
suppose que les donnes sont tries en ordre croissant.
La fonction de vraisemblance est
L() =

n
Y

f Y (x i )

i =1

= (F X (d ))

s
Y
i =1

f X (x r +i + d ) (1 F X (u))t .

190

Modlisation paramtrique

5.3.2

Donnes groupes

Dans le cas de donnes groupes, o n j reprsente le nombre de donnes dans


la classe (c j 1 , c j ], j = 1, . . . , r , la probabilit quune donne tombe dans lintervalle
(c j 1 , c j ] est F (c j ) F (c j 1 ). La fonction de vraisemblance est donc
L() =

r
Y

[F (c j ) F (c j 1 )]n j ,

j =1

alors que la fonction de log-vraisemblance est


l () =

r
X

n j ln[F (c j ) F (c j 1 )].

j =1

5.3.3

Proprits de lestimateur du maximum de vraisemblance

Une premire proprit importante et trs utile de lestimateur du maximum


de vraisemblance est celle dinvariance : pour toute fonction bijective g , si est
est lEMV de g (), soit
lEMV de , alors g ()

g
() = g ().
p
2.
Par exemple, lEMV de est
Soit X 1 , . . . , X n un chantillon alatoire dune distribution avec fonction de
densit de probabilit f (x; ) (on suppose p = 1 pour le moment afin de simplifier
la prsentation). Soit aussi
n = T (X 1 , . . . , X n ),
un estimateur sans biais quelconque de . Sous des conditions gnralement
satisfaites mais souvent difficiles tablir 1 , on a que
Var[n ]

1
,
I ()

I () = nE
ln f (X ; )

= nE
ln f (X ; )
2

= information de Fisher.
1. Voir le thorme 13.5 de Klugman et collab. (2012a) pour les conditions exactes.

5.4. Maximisation numrique de la fonction de vraisemblance


La valeur I 1 () est la borne de RaoCramr. Lorsque
Var[n ] =

1
,
I ()

on dit de lestimateur n quil est efficace.


Remarque. Lorsque les variables alatoires X 1 , . . . , X n sont identiquement distribues, on a les expressions quivalentes suivantes pour linformation :

l (; X 1 , . . . , X n )

l (; X 1 , . . . , X n ) .
= E
2

I () = E

Si n est lestimateur du maximum de vraisemblance de , alors on peut dmontrer que


n
E [n ]
n 1
Var[n ]
,
I ()

do lEMV est asymptotiquement sans biais et efficace. De plus, on a que, asymptotiquement toujours,
n N (, I 1 ()).
Lorsque p > 1, les rsultats demeurent les mmes, sauf que la distribution est
une normale multivarie :
n N (, I 1 ()),
o I () est la matrice dinformation p p dont llment en position (r, s), r, s =
1, . . . , p, est

I ()r s = nE

5.4

2
2
ln f (X ; ) = E
ln l (; X 1 , . . . , X n ) .
r s
r s

Maximisation numrique de la fonction de


vraisemblance

Contrairement ce que les exemples de la section prcdente pourraient laisser


croire, on ne peut toujours trouver explicitement le maximum de la fonction de
vraisemblance.

191

192

Modlisation paramtrique
Exemple 5.8. Soit X 1 , . . . , X n un chantillon alatoire dune loi gamma avec fonction de densit de probabilit
f (x; , ) =

1 x
x
e
,
()

x > 0, > 0, > 0.

On cherche les estimateurs du maximum de vraisemblance des paramtres et .


La fonction de log-vraisemblance est, ici,
l (, ) =
=

n
X
i =1
n
X

ln f (x i ; , )
( ln ln () + ( 1) ln x i x i )

i =1

= n ln n ln () + ( 1)

n
X

ln x i

i =1

n
X

xi .

i =1

Les EMV sont obtenus en rsolvant le systme dquations


n
0 () X

l (, ) = n ln n
+
ln x i = 0

() i =1
n

n X
l (, ) =

x i = 0.
S 2 (, ) =

i =1

S 1 (, ) =

Ce systme dquations na pas de solution explicite.


Remarques.
1. La valeur numrique de la fonction gamma (x) peut tre obtenue dans R avec
gamma().
2. La fonction

d
0 (x)
ln (x) =
dx
(x)
est appele fonction digamma. Sa valeur numrique est obtenue dans R avec
digamma(). Dans le mme ordre dide, la fonction
(x) =

1 (x) =

d
d2
(x) =
ln (x)
dx
d x2

est la fonction trigamma et on lvalue dans R avec trigamma().


Lorsquil nexiste pas de solution explicite au problme de maximisation de
la fonction vraisemblance, il faut sen remettre des mthodes numriques. Une
faon de faire consiste trouver la solution de l 0 () = 0 laide de lalgorithme de
NewtonRaphson. Il faut utiliser la version multivarie de lalgorithme si est un
vecteur de deux paramtres ou plus.

5.4. Maximisation numrique de la fonction de vraisemblance

5.4.1

Mthode de Newton-Raphson multivarie

La mthode de NewtonRaphson multivarie est similaire la mthode univarie, sauf quelle fait appel des notions simples de calcul matriciel.
On considre le systme n quations non linaires et n inconnues
f 1 (x 1 , . . . , x n ) = 0
f 2 (x 1 , . . . , x n ) = 0
..
.
f n (x 1 , . . . , x n ) = 0.
Soit x = (x 1 , . . . , x n ). On peut alors crire, de manire plus compacte,
f 1 (x) = 0
f 2 (x) = 0
..
.
f n (x) = 0
ou encore f (x) = 0, avec

f 1 (x)
.
f (x) = ..
f n (x)

= ( f 1 (x), . . . , f n (x))0 .
De plus, soit
f 1 (x) f 1 (x)
x 1
x 2

f 2 (x) f 2 (x)

x 2
J (x) = x 1
.
..
..
.

f n (x) f n (x)
x 1
x 2

f i (x)
=
.
x j nn

...
...

...

f 1 (x)
x n

f 2 (x)

x n

..
.

f n (x)
x n

Alors la solution du systme dquations f (x) = 0 est obtenu par convergence de la


suite
x k = x k1 J (x k1 )1 f (x k1 ), k = 1, 2, . . . ,

193

194

Modlisation paramtrique
o x 0 = (x 10 , . . . , x n0 ) est un vecteur de valeurs de dpart.
On peut utiliser comme critre darrt de la procdure itrative
kx k x k1 k = kJ (x k1 )1 f (x k1 )k < ,
o
kxk = max |x i |.
1i n

Dans le contexte de la mthode du maximum de vraisemblance, les fonctions


f 1 (x), . . . , f n (x) ci-dessus correspondent aux fonctions de score S 1 (), . . . , S p (). De
plus, on peut souvent acclrer la convergence de lalgorithme en remplaant le
Jacobien

J () =
S i ()
j
pp
par la matrice dinformation
I () = E [J ()]

2
= E
l () .
i j

5.4.2

Maximisation numrique avec R

Virtuellement tous les logiciels mathmatiques ou statistiques modernes proposent des outils doptimisation de fonctions linaires ou non et de sommes
de carrs. Ceci rend la programmation de lalgorithme de NewtonRaphson inutile
dans la grande majorit des cas. Le Solveur dExcel est un tel outil. Le chapitre 7 de
Goulet (2012) prsente les fonctions doptimisation disponibles dans R. Plusieurs
des exemples de ce chapitre portent dailleurs sur lvaluation numrique destimateurs du maximum de vraisemblance. La principale fonction doptimisation de R
est optim.
Exemple 5.9. On simule un chantillon de taille 100 dune loi gamma de paramtres = 5 et = 2, puis on estime ensuite les paramtres de la distribution par
le maximum de vraisemblance laide de la fonction optim de R. La fonction
minimiser est
n
X
l (, ) = ln f (x i ; , ).
i =1

Les principaux arguments de optim() sont :

x par, un vecteur contenant les valeurs initiales des paramtres ; et


x fn, la fonction minimiser.

5.4. Maximisation numrique de la fonction de vraisemblance


Le premier argument de fn doit tre le vecteur des paramtres. On peut passer des
valeurs fn (les donnes, par exemple) par le biais de largument ... de optim().
Pour cet exemple, on a donc
> x <- rgamma(100, 5, 2)
> f <- function(p, x) -sum(dgamma(x, p[1], p[2], log = TRUE))
> optim(c(1, 1), f, x = x)
$par
[1] 5.106083 2.042060
$value
[1] 145.1755
$counts
function gradient
73

NA

$convergence
[1] 0
$message
NULL

(Largument log = TRUE de la fonction dgamma permet de calculer plus prcisment


le logarithme de la densit.)

La section 5.7 contient le code informatique pour rpter lexemple


ci-dessus.

La fonction fitdistr du package MASS (Venables et Ripley, 2002) offre une


interface simplifie de optim() faite spcifiquement pour la maximisation dune
fonction de vraisemblance. Autrement dit, la fonction estime les paramtres dune
loi de probabilit univarie par la mthode du maximum de vraisemblance. Elle
est trs simple utiliser pour les distributions les plus courantes. En effet, les distributions suivantes sont reconnues simplement par leur nom : bta, binomiale
ngative, Cauchy, exponentielle, F, gamma, khi carr, log-normale, logistique, normale, t (Student), uniforme et Weibull. Pour toute autre loi de probabilit, il suffit

195

196

Modlisation paramtrique
de fournir la fonction de densit (ou de masse) de probabilit en argument
fitdistr().
Exemple 5.10. On rpte lestimation des paramtres de la loi gamma pour lchantillon alatoire simul lexemple 5.9. La distribution gamma tant reconnue par
fitdistr(), il suffit den spcifier le nom :
> fitdistr(x, "gamma")
shape
5.1044237

rate
2.0414616

(0.6995568) (0.2940095)

Les valeurs entre parenthses sont les carts types estims des estimateurs.

La section 5.7 contient le code informatique pour rpter lexemple


ci-dessus.

Exemple 5.11. Soit


> set.seed(2)
> x <- rpareto(100, 5, 4000)

un chantillon alatoire de taille 100 dune loi de Pareto avec paramtres = 5


et = 4000. On veut estimer les paramtres par la mthode du maximum de
vraisemblance partir de cet chantillon.
Les quations rsoudre pour trouver les estimateurs du maximum de vraisemblance de et sont
n
X
n
+ n ln
ln(x i + ) = 0

i =1
n
X
n
( + 1) (x i + )1 = 0.

i =1

(5.1)
(5.2)

Ce systme dquations na pas de solution explicite. On aura donc recours loptimisation numrique avec la fonction fitdistr.
Les estimateurs des moments de et seront utiliss comme valeurs de dpart
dans fitdistr(). De lannexe A de Klugman et collab. (2008, 2012a), on sait que

5.4. Maximisation numrique de la fonction de vraisemblance


les estimateurs des moments sont
=

2(m 2 m 12 )

m 2 2m 12
m2 m1
=
,
m 2 2m 12

o m k = n 1

Pn

k
i =1 X i . Pour lchantillon simul ci-dessus, on obtient

> m <- emm(x, c(1, 2))


> (alpha.mme <- 2 * (m[2] - m[1]^2)/(m[2] - 2 * m[1]^2))
[1] 7.15714
> (lambda.mme <- (prod(m))/(m[2] - 2 * m[1]^2))
[1] 6256.726

Le rsultat de fitdistr() est donc :


> fitdistr(x, dpareto,
+

start = list(shape = alpha.mme,

scale = lambda.mme))
shape
7.170763

scale
6256.725402

21.931933) (21840.466242)

Lorsque lon tente destimer des paramtres strictement positifs comme ceux
dune Pareto, il nest pas rare dtre confront des soucis de convergence lorsque
la fonction doptimisation sgare dans les valeurs ngatives. On peut pallier ce
problme avec le truc suivant : plutt que destimer les paramtres eux-mmes, on
estime leurs logarithmes. Ceux-ci demeurent alors valides sur tout laxe des rels.
Cest lAstuce Ripley explique la section 11.6 de Goulet (2013).
Bien que pas ncessaire pour lchantillon simul ci-dessus, on illustre cette
approche en dfinissant dabord une nouvelle fonction de densit paramtre en
fonction de ln et ln :
> f <- function(x, lshape, lscale)
+

dpareto(x, exp(lshape), exp(lscale))

Le rsultat de fitdistr() avec cette fonction est


> (fit <- fitdistr(x, f,
+
+

start = list(lshape = log(alpha.mme),


lscale = log(lambda.mme))))

197

198

Modlisation paramtrique

lshape
1.8165661

lscale
8.5646370

(0.7320815) (0.8431280)

Les valeurs obtenues ci-dessus sont les logarithmes des paramtres. Les estimations
de et elles-mmes sont :
> exp(unname(fit$estimate))
[1]

6.150701 5242.936212

(La fonction unname enlve les noms dun objet qui, sils taient encore prsents,
porteraient ici confusion.)
Il peut arriver que lestimation des paramtres ne se passe pas aussi bien que cidessus. Dans un tel cas, on peut essayer dutiliser linformation dont nous disposons
sur les drives partielles (5.1) et (5.2) pour trouver les estimations du maximum de
vraisemblance. Dune part, on peut passer ces drives (le gradient de la fonction
minimiser) directement optim() par le biais de largument gr ; consulter la
rubrique daide pour de plus amples informations. Dautre part, si lon isole dans
(5.2), on obtient ici
P
1
ni=1 (x i + )
=
P
1
n ni=1 (x i + )
et lquation (5.1) devient alors
n
X
n
= 0,
+ n ln
ln(x i + )

i =1

o est remplac par la fonction de ci-dessus. Le problme de maximisation


sest transform en un problme de recherche de racine que lon peut rsoudre
numriquement laide de la fonction uniroot.
On dfinit dabord la fonction dont on cherche la racine :
> g <- function(b, x)
+ {
+

n <- length(x)

x <- x + b

u <- b * sum(1/x)
n * (n - u)/u + n * log(b) - sum(log(x))

+
+ }

On trouve ensuite la racine avec uniroot() sur lintervalle (0, max(x 1 , . . . , x n )) :

5.4. Maximisation numrique de la fonction de vraisemblance

> (lambda <- uniroot(g, lower = 1E-10, upper = max(x), x = x)$root)


[1] 5242.957
> (alpha <- 1/(-1 + length(x)/(lambda * sum(1/(x + lambda)))))
[1] 6.150723

La section 5.7 contient le code informatique pour rpter lexemple


ci-dessus.

Exemple 5.12. Supposons que dans un chantillon de taille n, m valeurs sont


censures une valeur u. On souhaite ajuster une loi Burr de paramtres , et
ces donnes par la mthode du maximum de vraisemblance. On a
f (x) =

x 1
,
(1 + (x/) )+1

x >0

et
F (x) = 1

1
,
(1 + (x/) )

x > 0.

Pour simplifier la notation, on suppose que les donnes x 1 , . . . , x nm sont celles qui
ne sont pas censures.
On cherche donc estimer les paramtres de la loi de la variable alatoire
X Burr(, , ) partir dobservations de la variable alatoire Y = min(X , u) dont
la fonction de densit de probabilit est
(

g (x) =

f (x),

y <u

1 F (u), x u.

La fonction de vraisemblance est donc

L(, , ) =

nm
Y
i =1

x i

(1 + (x i /) )+1

1
(1 + (u/) )

199

200

Modlisation paramtrique
et la fonction de log-vraisemblance est
l (, , ) = (n m)(ln ln )
nm
X
ln x i
+ ( 1)
( + 1)

i =1
nm
X

ln(1 + (x i /) )

i =1

m ln(1 + (u/) ).
Ainsi,
n m
m ln(1 + (x i /) )

m
X

ln(1 + (u/) ),

S 1 (, , ) =

i =1
nm
X
n m
ln x i
S 2 (, , ) =
(n m) ln +

i =1
nm
X (x i /) ln(x i /)
( + 1)
1 + (x i /)
i =1

(u/) ln(u/)
1 + (u/)

et
S 3 (, , ) =
+

X (x i /)
(n m) ( + 1) nm
+

i =1 1 + (x i /)

m (u/)
.
1 + (u/)

Pour trouver les estimations des paramtres , et , il faut rsoudre le systme trois quations et trois inconnues avec la mthode de NewtonRaphson
multivarie. On peut galement minimiser numriquement la fonction de logvraisemblance ngative avec les fonctions optim ou fitdistr. Dans ce cas, la
fonction coverage permet dobtenir facilement la densit g (x) ci-dessus :
> g <- coverage(dburr, pburr, limit = u)

Exemple 5.13. Un assureur a enregistr les donnes suivantes provenant de contrats


comportant une franchise de 75 et une limite de 800 :

5.4. Maximisation numrique de la fonction de vraisemblance


280,48
199,15
725
25,30
229,94
142,98
725
90,84
107,23
372,72

460,26
45,56
48,60
588,26
240,00
350,30
253,15
725
93,39
52,36

60,41
118,10
204,77
27,90
389,96
41,68
452,59
2,39
725
111,30

725,00
493,15
710,67
197,68
725
260,80
14,80
160,67
42,20
40,30

340,34
239,10
8,75
281,80
100,45
369,10
327,20
86,55
138,50
70,50

166,08
241,55
225,37
370,60
564,15
134,54
119,42
55,43
191,94
81,01

201
485,60
218,60
123,80
371,34
29,40
312,08
68,25
369,39
266,05
725

On souhaite ajuster une distribution de Pareto ces donnes par la mthode


du maximum de vraisemblance. En supposant que les donnes ci-dessus sont
stockes dans le vecteur x, une combinaison des fonctions coverage et fitdistr
nous fournit des estimations de et :

> f <- coverage(dpareto, ppareto, deductible = 75, limit = 800)


> fitdistr(x, f, start = list(shape = 1, scale = 1), method = "N")
shape
11.72099
(

scale
3125.70221

15.65693) (4526.98265)

Ici, on a spcifi la mthode doptimation utiliser (NelderMead) parce que celle


utilise par dfaut par fitdistr() ne converge pas. Consulter laide de optim()
pour plus de dtails sur les diverses mthodes doptimisation disponibles.

La section 5.7 contient le code informatique pour rpter lexemple


ci-dessus.

Exemple 5.14. On souhaite ajuster, par la mthode du maximum de vraisemblance,


des distributions exponentielle et gamma aux donnes groupes suivantes rcoltes
par un assureur :

202

Modlisation paramtrique

Classe

Nombre de donnes

(0, 1]
(1, 2]
(2, 4]
(4, 8]
(8, 12]
(12, 16]
(16, 20]
(20, ]

4
3
3
4
2
0
1
3

Sans mthode numrique, il est difficilement envisageable de maximiser les


fonctions de log-vraisemblance
l () =

r
X

n j ln(F (c j ; ) F (c j 1 ; )).

j =1

Puisque la fonction fitdistr ne supporte pas les donnes groupes, on va utiliser


les fonctions doptimisation directement. En premier lieu, on dfinit les donnes :
> x <- grouped.data(cj = c(0, 1, 2, 4, 8, 12, 16, 20, Inf),
+

nj = c(4, 3, 3, 4, 2, 0, 1, 3))

Pour la distribution exponentielle, qui ne compte quun seul paramtre, il


est prfrable, pour des raisons de stabilit, de minimiser la log-vraisemblance
ngative avec optimize(). On obtient :
> ll <- function(p, x)
+

-drop(crossprod(x[, 2], log(diff(pexp(x[, 1], p)))))

> optimize(ll, lower = 0, upper = 2, x = x)


$minimum
[1] 0.1248713
$objective
[1] 40.66936

Pour la distribution gamma, on utilise optim() :


> ll <- function(p, x)
+

-drop(crossprod(x[, 2], log(diff(pgamma(x[, 1], p[1], p[2])))))

> optim(c(1, 1), ll, x = x)

5.5. Estimation par intervalle

203

$par
[1] 0.58211645 0.06674133
$value
[1] 39.26542
$counts
function gradient
79

NA

$convergence
[1] 0
$message
NULL

5.5

La section 5.7 contient le code informatique pour rpter lexemple


ci-dessus.

Estimation par intervalle

Un estimateur par intervalle dun paramtre (scalaire pour le moment) est un


couple de statistiques (L,U ) telles que
Pr[L < < U ] = 1 .
(Note : L et U sont les variables alatoires, ci-dessus.)
Un estimateur par intervalle peut tre vu comme une mesure de la prcision

dun estimateur ponctuel .


En gnral, toutefois, les estimateurs par intervalle sont difficiles calculer. On
a une solution relativement simple pour les estimateurs du maximum de vraisemblance puisque lon connait leur distribution asymptotique.

5.5.1

Estimateur du maximum de vraisemblance univari

De la sous-section 5.3.3, on sait que, lorsque n ,

N (, Var[]),

204

Modlisation paramtrique
avec
=
Var[]

1
.
I ()

Par consquent, pour de grands chantillons,

Prz /2 < q
< z /2 = 1 ,

Var[]
o z est le 100(1 )e centile dune N (0, 1). On peut rcrire cette expression sous
la forme

q
q

Pr z /2 Var[] < < + z /2 Var[] = 1 ,


do

q
q

z /2 Var[], + z /2 Var[]

est un estimateur par intervalle de .


De manire quivalente, on peut dire que
z /2

Var[]

et donc que lintervalle ci-dessus est un intervalle de confiance de niveau 1 pour


.
dpend de ou est carrment
Plus souvent quautrement, la variance Var[]
inconnue parce que trop difficile calculer. On doit alors utiliser une approximation.
On considre deux possibilits.
1. Linformation I () est connue, mais dpend de dune manire complique.
ce qui donne une estimation
Dans un tel cas, on remplace par son estimation ,
de la variance :
= 1 .
d ]
Var[

I ()
En principe, un intervalle de confiance pour est alors
t /2,n1

d ].
Var[

En pratique, dans la mesure o n doit dj tre grand, on utilise simplement


z /2

d ].
Var[

5.5. Estimation par intervalle

205

2. Linformation est inconnue, par exemple si lesprance est trop complique.


Dans un tel cas, on remplace lesprance par une moyenne empirique : cest
linformation observe. On a alors
=
d ]
Var[

I()

avec
2
n
X

ln f (x i ; )

=
i =1

2
n
X

ln
f
(x
;
)
=

i
2

=
i =1

=
I()

ou, de manire quivalente,


2

l (; x i , . . . , x n )

= 2 l (; x i , . . . , x n )

=
I()

Exemple 5.15. Soit X 1 , . . . , X n un chantillon alatoire dune distribution Weibull


de paramtre de forme connu. On cherche un estimateur par intervalle du paramtre dchelle . On a

f (x) = x 1 e (x/)

ln f (x) = ln ln + ( 1) ln x

et

x
ln f (x) = +


2
( + 1) x
ln f (x) = 2
.
2

Par consquent,

l ()

n
X
=
ln f (x i )
i =1
Pn

i =1 x i
= n
.

S() =

206

Modlisation paramtrique
En posant S() = 0, on obtient
=

1/
i =1 x i

Pn

De plus, en ralisant que (X /) Exponentielle(1), on a


n2
2
2
=
Var[]
n2
I () =

et
=
d ]
Var[

2
.
n2

Un intervalle de confiance de niveau 1 pour est donc


1/
i =1 x i

Pn

z /2 p .
n

Pour les donnes dental, = 2 et 1 = 0,95, on obtient

2 930 683 1/2

=
= 541,36
10
p
q
= 2 930 683 = 85,5962,
d ]
Var[
20
do (373,59, 709,13). On obtient les mmes rsultats avec fitdistr :
> fitdistr(dental, "weibull", shape = 2)
scale
541.31341
( 85.57799)

En pratique, il nest pas rare que lon souhaite estimer non pas pour , mais pour
une fonction h() de . Par la proprit dinvariance de lestimateur du maximum
de vraisemblance, on sait que

= h(),
h()
mais quen est-il dun intervalle de confiance pour cette estimation ? En gnral, il
peut tre trs complique. Pour
sagit dun calcul difficile car la distribution de h()

5.5. Estimation par intervalle

207

simplifier le travail, il existe une mthode, la mthode delta, qui est valide pour n
grand.
En ngligeant les termes de degr deux et plus dans le dveloppement de Taylor
autour de , on a
de h()
h() + h 0 ()( ).
h()
Ainsi, puisque est asymptotiquement sans biais,
= h()

E [h()]
et
= [h 0 ()]2 Var[].

Var[h()]
On a donc, lorsque n ,

N h(), [h 0 ()]2 Var[]


,
h()

do un intervalle de confiance (ou estimateur par intervalle) de h() est


q
1,96 [h 0 ()]2 Var[].

h()
Exemple 5.16. Trouver un intervalle de confiance approximatif de niveau 1
pour la probabilit quune observation dune distribution exponentielle dpasse
700 partir des donnes dental.
On cherche un estimateur par intervalle pour
h() = Pr[X > 700] = e 700 .
On sait que
1
=
X
=
Var[]

2
.
n

Par la mthode delta, on a


(700e 700 )2 2
n
490 0002 e 1 400
=
n

=
Var[h()]

208

Modlisation paramtrique
et

=
d )]
Var[h(

490 000e 1 400/ X


.
n X 2

Pour les donnes dental, on a


x = 335,5
= e 700/335,5 = 0,124
h()
=
d )]
Var[h(

490 000e 1 400/335,5


= 0,006707.
10(335,5)2

p
Un intervalle de confiance 95 % pour Pr[X > 700] est donc 0,124 1,96 0,006707
ou 0,124 0,161.

5.5.2

Estimateur du maximum de vraisemblance multivari

Les ides restent essentiellement les mmes lorsque plusieurs paramtres sont
estims simultanment par la mthode du maximum de vraisemblance. On sait
que, toujours asymptotiquement,
Normale multivarie(, I 1 ()).
Si lon considre une fonction h(1 , . . . , p ) h(), la mthode delta dit que
Normale multivarie(h(), h T I 1 ()h),
h()
o
h = h()

h()
1

..

=
.
.

h()
p
Un intervalle de confiance de niveau 1 pour h() est donc
z /2
h()

p
h T I 1 ()h.

5.5. Estimation par intervalle

209

Exemple 5.17. Trouver un estimateur par intervalle 95 % de la moyenne dune


distribution log-normale, soit de
h(, 2 ) = e +

/2

On a dj obtenu lexemple 5.4


n
1X
ln x i
n 1
n
1X
2.
2 =
(ln x i )

n 1

Lestimateur (ponctuel) du maximum de vraisemblance de h(, 2 ) est donc



2 ) = e +
h(,

/2

De plus,
2
1
ln f (X ; , 2 ) = 2
2

2
1
(ln X )2
2
ln
f
(X
;
,

)
=

(2 )2
24
6
2
ln X

ln f (X ; , 2 ) =
,
2

4
do, en ralisant que ln X N (, 2 ),
n
2
I (, 2 ) =
0

0
n
24

n
I 1 (, 2 ) =

et

Enfin,
"

h=

2
h(, )

h(, 2 )
2

=e

0
.
24
n

+2 /2


1
1
2

210

Modlisation paramtrique
On a donc que, lorsque n ,

2 )] = e +
E [h(,

/2


2 )] = h T I 1 (, 2 )h
Var[h(,
2

4
2+2
=e
,
+
n
2n
do un estimateur par intervalle avec un niveau de confiance approximatif de 95 %
de la moyenne du log-normale est
s

e +

/2

1,96e +

/2

2
4

+
.
n
2n

Exemple 5.18. Soit X 1 , . . . , X n un chantillon alatoire tir dune distribution Pareto inverse de paramtres et . On cherche un intervalle de confiance pour
lestimateur du maximum de vraisemblance du mode de cette distribution. Tout
dabord, on a
x 1
f (x; t , ) =
(x + )+1
et le mode est
m=

( 1)
.
2

Par la proprit dinvariance de lestimateur du maximum de vraisemblance, on


aura
1)
(
=
m
.
2
Il faut toutefois trouver les estimateurs de et de .
On a
l (, ) =

n
X

ln f (x i ; , )

i =1

= n ln + n ln + ( 1)

n
X
i =1

( + 1)

n
X
i =1

ln(x i + )

ln x i

5.5. Estimation par intervalle

211

et
n
n
X
n X
ln(x i + )
ln x i
+
i =1
i =1
n
X
n
1
S 2 (, ) = ( + 1)

i =1 x i +

S 1 (, ) =

En posant ces deux quations gales 0, on peut trouver que


n
= Pn
,
i =1 (ln(x i + ) ln x i )

mais il ny a pas de formule explicite pour .


Afin de dterminer la matrice dinformation, on calcule
2
l (, ) =
2
2
l (, ) =
2

n
S 1 (, ) = 2

n
X

1
n
S 2 (, ) = 2 + ( + 1)
2

(x
+
i )
i =1

n
X
2
1

l (, ) =
S 1 (, ) =
.

x
i =1 i +

Pour la suite, on aura besoin du rsultat suivant :


Z
x 1
1
dx
E [(X + )k ] =
+1
k
0 (x + ) (x + )
Z
x 1
dx
=
+k+1
0 (x + )
Z

( + k)x
=
x k
dx
+k 0
(x + )+k+1

E [X k ],
=
+k
o X Pareto inverse( + k, ). Ainsi, en supposant que > 2, on obtient
1 ()(2)
1
E [(X + ) ] =
+1
( + 1)
1
=
( + 1)
et
2 ()(3)
E [(X + ) ] =
+2
( + 2)
2
= 2
.
( + 1)( + 2)
2

212

Modlisation paramtrique
Par consquent,

2
n
E
l (, ; X 1 , . . . , X n ) = 2
2

2
n

l (, ; X 1 , . . . , X n ) = 2
E
2
( + 2)
2

n
E
l (, ; X 1 , . . . , X n ) =

( + 1)

et la matrice dinformation est donc

n
2
I (, ) =
n
( + 1)

n
( + 1)
.
n
2 ( + 2)

Enfin, en posant h(, ) = ( 1)/2, on a

h=

h(, ) =

h(, )

1
.
2 1

Un intervalle de confiance approximatif de niveau 1 pour le mode de la distribution Pareto inverse est donc

q
1
h,

)
z /2 h T I 1 (,

2
o

5.6

h=
.
2 1

Pour un exemple dvaluation numrique de lintervalle de confiance


partir de donnes, voir le code informatique de la section 5.7.

Estimation par distance minimale

Lestimation par distance minimale est une autre technique destimation paramtrique base sur un critre optimiser. Lide, ici, consiste choisir les paramtres dune distribution de manire minimiser une certaine distance entre la
fonction de rpartition thorique F (x; ) et la fonction de rpartition empirique

5.6. Estimation par distance minimale


F n (x). Cette technique est populaire auprs des actuaires, notamment parce quelle
est particulirement bien adapte aux donnes groupes.
En rgle gnrale, la minimisation de distance est une procdure numrique.
Pour ce faire, le package actuar fournit la fonction mde, dont linterface et le fonctionnement est trs similaire fitdistr. Elle permet dajuster des modles des
donnes par la mthode de distance minimale selon lune des trois mesures de
distance prsentes ci-dessous.

5.6.1

Distance de Cramr-von Mises

Soit y 1 < y 2 < < y k des points arbitraires et w 1 , . . . , w k des nombres positifs
arbitraires qui serviront de poids. La forme gnrale de la statistique (ou distance)
de Cramrvon Mises est
d () =

k
X

w j [F (y j , ) F n (y j )]2 .

j =1

Les poids permettent de donner plus dimportance certains points par rapport
dautres. En gnral, on choisit des poids gaux, soit w 1 = = w k = 1. Si lon
souhaite donner plus de poids aux donnes dans les queues de la distribution, un
choix populaire est
n
wj =
.
F (y j )(1 F (y j ))
La figure 5.1 reprsente cette fonction pour une distribution gamma.
Pour des donnes individuelles, on prend y j = x j , j = 1, . . . , n. Lestimateur de
Cramr-von Mises de est donc la valeur qui minimise
d () =

n
X

w j [F (x j , ) F n (x j )]2 .

j =1

Pour des donnes groupes, on minimise la distance aux bornes des classes,
cest--dire que y j = c j , j = 1, . . . , r . On a alors
d () =

r
X

w j [F (c j , ) F n (c j )]2 .

j =1

Exemple 5.19. Soit les donnes


{1, 3, 7, 11, 22, 23, 44, 51}.
On souhaite ajuster une distribution exponentielle ces donnes en minimisant la
distance de Cramr-von Mises avec des poids de 1. Puisque
F (x) = 1 e x

213

500000

1000000 1500000

Modlisation paramtrique

wj

214

0.0

0.5

1.0

1.5

2.0

2.5

3.0

yj

F IG . 5.1: Fonction de poids donnant plus dimportance aux donnes dans les
queues

et

0,

1/8,

2/8,

3/8,
F 8 (x) = 4/8,

5/8,

6/8,

7/8,

1,

x <1
x =1
x =3
x =7
x = 11 ,
x = 22
x = 23
x = 44
x 51

on a que la distance minimiser est

7
d () =
e
8

6
+ e 3
8

+ + (e 51 )2 .

On voit immdiatement la ncessit de faire appel des procdures numriques.

5.6. Estimation par distance minimale

5.6.2

215

Distance du khi carr modifi

Cette distance est base sur une statistique utilise dans les tests dadquation
des modles. Elle ne semploie que pour les donnes groupes (ou aprs avoir
group des donnes individuelles). Lestimateur est obtenu en minimisant
d () =

r
X

w j [n(F (c j ; ) F (c j 1 ; )) n j ]2 ,

j =1

Pr

o n =
Soit

j =1 n j

et, en gnral, w j = 1/n j .


E j () = n(F (c j ; ) F (c j 1 ; ).

Cette quantit reprsente le nombre espr de donnes dans lintervalle (c j 1 , c j ].


Sous sa forme la plus usuelle, la statistique du khi carr modifi est donc
d () =

r (E () n )2
X
j
j
j =1

nj

On voit ainsi plus clairement que les paramtres sont choisis de manire minimiser lcart entre le nombre observ de donnes dans chacune des classes de
lchantillon et le nombre de donnes selon le modle thorique.
Dans la mesure o le terme n j se retrouve au dnominateur, il nest pas possible
davoir des classes vides. Si le cas se prsente, il faut regrouper de manire arbitraire
certaines classes de faon avoir au moins une donne dans chacune des classes.

5.6.3

Distance de svrit moyenne par couche

Cette technique est particulirement indique dans un contexte de rassurance,


o lon souhaite que le modle rflte le plus fidlement possible les cots par
tranche dassurance indiqus par les donnes. Cest aussi une technique applicable
uniquement des donnes groupes.
Lestimateur de svrit moyenne par couche minimal (layer average severity,
LAS) de est la valeur qui minimise la distance
d () =

r
X

w j [LAS(c j 1 , c j ; ) LASn (c j 1 , c j )]2 ,

j =1

o
LAS(c j 1 , c j ; ) = E [min(X , c j ); ] E [min(X , c j 1 ); ]
LASn (c j 1 , c j ) = E [X ; c j ] E [X ; c j 1 ]

216

Modlisation paramtrique
et w 1 , . . . , w r sont des poids arbitraires. Il sagit donc dune comparaison entre les
sinistres moyens par classe entre le modle thorique et le modle empirique.

5.7

Le code informatique de la section 5.7 correspondant cette section


fournit des exemples dutilisation de la fonction mde de actuar pour
valuer numriquement des estimateurs par distance minimale.

Code informatique

###
### ESTIMATION PAR LA MTHODE DU MAXIMUM DE VRAISEMBLANCE
###
## EXEMPLE 5.9
##
## Estimation du maximum de vraisemblance pour les paramtre d'une
## distribution gamma avec 'optim'. Aux fins de l'valuation
## numrique, on simule un chantillon alatoire d'une loi gamma.
x <- rgamma(100, 5, 2)
## On minimise la fonction de log-vraisemblance ngative directement
## avec la fonction 'optim'.
##
## Les principaux arguments de 'optim' sont:
##
## par: un vecteur contenant les valeurs initiales des paramtres;
##
fn: fonction minimiser. Le premier argument de fn doit tre
##
le vecteur des paramtres.
##
## On peut passer des valeurs 'fn' (les donnes, par exemple) par le
## biais de l'argument '...' de 'optim'.
##
## Note: l'argument 'log = TRUE' de 'dgamma' permet de calculer plus
## prcisment le logarithme de la densit.
f <- function(p, x) -sum(dgamma(x, p[1], p[2], log = TRUE))
optim(c(1, 1), f, x = x)
##
##
##
##
##

EXEMPLE 5.10
Estimation du maximum de vraisemblance pour les paramtre d'une
distribution gamma avec 'fitdistr'. La fonction se trouve dans le
package MASS.

5.7. Code informatique

library(MASS)
## La distribution gamma tant reconnue par 'fitdistr', il suffit d'en
## spcifier le nom en argument. La fonction prparera la fonction de
## log-vraisemblance et choisira des valeurs de dpart appropries.
fitdistr(x, "gamma")
## EXEMPLE 5.11
##
## On estime les paramtres d'une loi Pareto par la mthode du maximum
## de vraisemblance pour l'chantillon simul ci-dessous avec la
## fonction 'rapreto' du package actuar.
library(actuar)
# charger le package
set.seed(2)
# toujours le mme chantillon
x <- rpareto(100, 5, 4000)
## Les estimateurs des moments de $\alpha$ et $\lambda$ seront
## utiliss comme valeurs de dpart dans 'fitdistr'.
m <- emm(x, c(1, 2))
# deux premiers moments
(alpha.mme <- 2 * (m[2] - m[1]^2)/(m[2] - 2 * m[1]^2))
(lambda.mme <- (prod(m))/(m[2] - 2 * m[1]^2))
## Estimation avec 'fitdistr'. Pas de problme de convergence ici.
fitdistr(x, dpareto,
start = list(shape = alpha.mme,
scale = lambda.mme))
## Lorsque la fonction d'optimisation s'gare dans les valeurs
## ngatives des paramtres, on peut utiliser le truc suivant: plutt
## que d'estimer les paramtres eux-mmes, on estime leurs
## logarithmes. Ceux-ci demeurent alors valides sur tout l'axe des
## rels.
f <- function(x, lshape, lscale)
dpareto(x, exp(lshape), exp(lscale))
(fit <- fitdistr(x, f,
start = list(lshape = log(alpha.mme),
lscale = log(lambda.mme))))
## Les valeurs obtenues ci-dessus sont les logarithmes des paramtres.
exp(unname(fit$estimate))
## Dans le cas prsent, on peut rduire le problme de maximisation en
## deux dimensions un problme de recherche de racine en une seule
## dimension. On dfinit d'abord la fonction dont on cherche la racine.
g <- function(b, x)

217

218

Modlisation paramtrique

{
n
x
u
n

<- length(x)
<- x + b
<- b * sum(1/x)
* (n - u)/u + n * log(b) - sum(log(x))

}
## On trouve ensuite la racine avec la fonction 'uniroot' sur
## l'intervalle (0, max(x)).
(lambda <- uniroot(g, lower = 1E-10, upper = max(x), x = x)$root)
(alpha <- 1/(-1 + length(x)/(lambda * sum(1/(x + lambda)))))
## EXEMPLE 5.13
##
## On a des donnes de contrats d'assurance comportant une franchise
## de 75 et une limite de 800.
x <- c(280.48, 460.26, 60.41, 725.00, 340.34, 166.08, 485.60,
199.15, 45.56, 118.11, 493.15, 239.14, 241.55, 218.62,
725.00, 48.61, 204.77, 710.67, 8.75, 225.37, 123.82,
25.31, 588.26, 27.90, 197.68, 281.83, 370.61, 371.34, 229.94,
240.12, 389.96, 725.00, 100.45, 564.15, 29.40, 40.30,
142.98, 350.30, 41.68, 260.81, 369.12, 134.54, 312.08,
725.00, 253.15, 70.50, 452.59, 14.82, 327.22, 119.42,
81.01, 68.25, 90.84, 725.00, 2.39, 160.67, 86.55,
55.43, 369.39, 107.23, 93.39, 725.00, 725.00, 42.20,
138.52, 191.94, 266.05, 372.72, 52.36, 111.30)
## On utilise 'coverage' pour obtenir la densit des donnes
## modifies.
f <- coverage(dpareto, ppareto, deductible = 75, limit = 800)
## On utilise la fonction obtenue ci-dessus dans 'fitdistr' comme
## n'importe quelle autre fonction de densit.
fitdistr(x, f, start = list(shape = 1, scale = 1), method = "N")
## EXEMPLE 5.14
##
## On a des donnes groupes.
(x <- grouped.data(cj = c(0, 1, 2, 4, 8, 12, 16, 20, Inf),
nj = c(4, 3, 3, 4, 2, 0, 1, 3)))
##
##
##
##

Sans mthode numrique, il est difficilement envisageable de


maximiser la fonction de log-vraisemblance de donnes groupes.
Puisque 'fitdistr' ne supporte pas les donnes groupes, on va
utiliser les fonctions d'optimisation directement.

5.7. Code informatique

##
##
##
##
ll

Pour la distribution exponentielle, qui ne compte qu'un seul


paramtre, il est prfrable, pour des raisons de stabilit, de
minimiser la log-vraisemblance ngative avec 'optimize'.
<- function(p, x)
-drop(crossprod(x[, 2], log(diff(pexp(x[, 1], p)))))
optimize(ll, lower = 0, upper = 2, x = x)
## Pour la distribution gamma, on utilise 'optim'.
ll <- function(p, x)
-drop(crossprod(x[, 2], log(diff(pgamma(x[, 1], p[1], p[2])))))
optim(c(1, 1), ll, x = x)
## EXEMPLE 5.18
##
## On va estimer le mode d'une loi de Pareto inverse. Tout d'abord, on
## se donne un chantillon alatoire.
x <- c(90.82003234, 231.758342, 173.4952009, 54.7016874, 54.38717678,
66.55649132, 64.70525857, 32.11372382, 35.88995236, 26.64007571,
8.280677022, 83.11710111, 29.28489668, 111.4226552, 333.1536616,
15.12569074, 20.51796335, 1528.253204, 3949.025475, 157.9228822,
589.2324663, 19.36586191, 240.2328439, 933.7527217, 17.30204671,
74.09253268, 415.8841427, 105.1575175, 107.0157345, 26.10984817,
122.0857254, 5741.30212, 103.0847097, 45.98989544, 72.65399999,
164.0558806, 22.70259283, 134.9358282, 46.27191635, 21.16168539,
197.7311518, 370.8642329, 24.64028934, 158.6333192, 265.8701389,
36.57753616, 93.74525458, 78.60172397, 414.4440064, 27.38132725,
19.06459196, 674.4456707, 35.19132876, 142.709182, 133.6359018,
36.93977257, 776.530798, 16.76115168, 156.5600435, 611.6450772,
39.40947269, 63.68927339, 7.940722739, 369.4104142, 80.48188255,
16.0094895, 42.00656883, 40.99255559, 476.4875828, 49.38945828,
6.619740386, 23.99096566, 82.07584813, 115.3190035, 52.15234121,
92.26137298, 74.27839338, 48.19953415, 862.6692288, 25.62765813,
32.54815008, 101.2846802, 156.8140847, 17.51911039, 25.5251894,
48.68906566, 29.34124106, 34.95065775, 26.81550197, 66.34696211,
1815.299926, 19.67448744, 13.45007344, 44.73622845, 31.62093256,
30.81908273, 148.7958437, 20.07293494, 609.9016668, 27.14996816)
##
##
##
##
##
##
##

Pour fins de comparaison, nous allons calculer les EMV des


paramtres de forme et d'chelle d'abord en utilisant la formule
explicite obtenue dans l'exemple, puis par minimisation numrique
de la fonction de log-vraisemblance ngative.
Dans le premier cas, on doit d'abord calculer l'estimateur du
paramtre d'chelle numriquement. Pour ce faire, on dfinit la

219

220

Modlisation paramtrique

## fonction dont on doit trouver la racine. Nous avons choisi, ici, la


## seconde fonction de score.
f <- function(scale, x)
{
n <- length(x)
xps <- x + scale
shape <- n/sum(log(xps) - log(x))
n/scale - (shape + 1) * sum(1/xps)
}
## On trouve ensuite la racine de cette fonction avec 'uniroot', ce
## qui donne l'EMV du paramtre d'chelle. Puis, on calcule l'EMV du
## paramtre de forme partir de la formule obtenue dans l'exemple.
(hscale <- uniroot(f, lower = 2, upper = 4, x = x)$root) # EMV de scale
(hshape <- length(x)/sum(log(x + hscale) - log(x)))
# EMV de shape
## Puisque nous avons obtenu la formule explicite de la matrice
## d'information, on peut calculer son estimation avec les estimateurs
## ci-dessus.
n <- length(x)
matrix(c(n/hshape^2,
rep(n/(hscale * (hshape + 1)), 2),
n * hshape/(hscale^2 * (hshape + 2))),
nrow = 2)
## On se tourne maintenant vers l'approche entirement numrique.
fit <- fitdistr(x, dinvpareto, start = list(shape = 1, scale = 1))
fit$estimate
# estimateurs
solve(fit$vcov)
# information observe
## Comparaisons de l'histogramme des donnes et de la distribution
## ajuste: tout d'abord pour toute l'tendue des donnes, puis
## seulement pour le coeur de la distribution.
br <- c(0, 25, 50, 100, 250, 500, 1000, 2000, 4000, 6000)
hist(x, breaks = br)
curve(dinvpareto(x, fit$estimate[1], fit$estimate[2]), from = 0.1,
add = TRUE, col = "blue", lwd = 2)
hist(x, breaks = br, xlim = c(0, 1000))
curve(dinvpareto(x, fit$estimate[1], fit$estimate[2]), from = 0.1,
add = TRUE, col = "blue", lwd = 2)
## Nous avons obtenu essentiellement les mmes rsultats par
## l'approche entirement numrique. Nous utiliserons donc les valeurs
## de l'objet 'fit' dans la suite.

5.7. Code informatique

##
## Le calcul d'un l'intervalle de confiance 95
## quelques lignes de programmation.
(m <- fit$estimate[2] * (fit$estimate[1] - 1)/2)
h <- c(fit$estimate[2], fit$estimate[1] - 1)/2
s <- sqrt(drop(crossprod(h, fit$vcov)) %*% h)
c(m - 1.96 * s, m + 1.96 *s)

221

% pour le mode exige


#
#
#
#

mode estim
gradient estim
cart-type estim
intervalle

###
### ESTIMATION PAR DISTANCE MINIMALE
###
## L'interface de la fonction 'mde' de actuar est trs similaire
## celle de 'fitdistr'. Outre les donne, la fonction requiert en
## argument:
##
## - la mesure de distance utiliser ("CvM", "chi-square" ou "LAS");
## - une fonction pour calculer la fonction de rpartition thorique
##
ou l'esprance limite thorique;
## - des valeurs de dpart;
## - des poids, le cas chant.
##
## On va ajuster par la mthode de la distance minimale une
## distribution exponentielle aux donnes groupes d'assurance
## dentaire.
gdental
## La moyenne des donnes nous donnera une ide de la valeur de dpart
## fournir la fonction de minimisation de distance.
mean(gdental)
## Estimateur de la distance de Cramr-von Mises. On peut utiliser des
## donnes individuelles ou des donnes groupes avec cette distance.
## On fournit 'mde' la fonction de rpartition thorique; 'mde' se
## chargera de construire l'ogive et la fonction de distance
## minimiser, puis d'appler 'optim' pour effectuer la minimisation
## numrique.
mde(gdental, pexp, start = list(rate = 1/200), measure = "CvM")
## Pour viter l'avertissement lors d'une optimisation sur un seul
## paramtre, on peut utiliser la mthode de type quasi-Newton "BFGS".
mde(gdental, pexp, start = list(rate = 1/200),
measure = "CvM", method = "BFGS")
## Estimateur de la distance du khi carr modifi.

222

Modlisation paramtrique

mde(gdental, pexp, start = list(rate = 1/200), measure = "chi-square")


## Estimateur de la distance de la svrit moyenne par couche.
mde(gdental, levexp, start = list(rate = 1/200), measure = "LAS")
## La minimisation ne russit pas toujours aussi bien que ci-dessus.
## En fait, les techniques de distance minimale sont plutt instables
## numriquement. Par exemple, si l'on essaie plutt d'ajuster une loi
## de Pareto aux donnes, l'optimisation ne converge pas.
mde(gdental, ppareto, start = list(shape = 3, scale = 600),
measure = "CvM")
## Tout comme pour le maximum de vraisemblance, travailler avec le
## logarithme des paramtres peut aider.
f <- function(x, lshape, lscale) ppareto(x, exp(lshape), exp(lscale))
(p <- mde(gdental, f, measure = "CvM",
start = list(lshape = log(3), lscale = log(600))))
exp(p$estimate)
## Superposition de l'histogramme des donnes et de la distribution de
## Pareto ajuste.
hist(gdental)
curve(dpareto(x, exp(p$estimate[1]), exp(p$estimate[2])), from = 0.1,
add = TRUE, col = "blue", lwd = 2)

5.8

Exercices

5.1 Soit X , une variable alatoire reprsentant le montant dun sinistre. On suppose
X | = Exponentielle()
Gamma(, ).
Les sinistres suivants ont t observs :
{1, 10, 200, 1 000, 5 000}.
Estimer et par la mthode des moments.
5.2 On dispose dun chantillon alatoire avec deux donnes infrieures 2 000
et quatre donnes entre 2 000 et 5 000. Les donnes suprieures 5 000 nont
pas t enregistres. crire la fonction de vraisemblance pour un modle de loi
exponentielle.

5.8. Exercices

223

5.3 Un assureur automobile a enregistr les montants de sinistres suivants :


{1 000, 850, 750, 1 100, 1 250, 900}.
Il souhaite utiliser une distribution Gamma(, 1/) pour les reprsenter. Estimer les paramtres de cette distribution laide de la mthode des moments.
5.4 Un actuaire dispose dun chantillon alatoire tir dune distribution loglogistique. Dans cet chantillon, 80 % des donnes sont suprieures 100
et 20 % des donnes sont suprieures 400. Calculer les estimateurs des paramtres de la distribution laide de la mthode des quantiles.
5.5 Soit x 1 , . . . , x n un chantillon alatoire dune population dont la fonction de
rpartition est
F X (x) = x p ,

0 < x < 1.

Dterminer lestimateur de p par la mthode des moments.


5.6 Pendant une anne, un assureur a enregistr les montants de sinistres suivants :
{500, 1 000, 1 500, 2 500, 4 500}.
Il dcide de modliser ces donnes par une loi Log-normale(, ). En utilisant
la mthode des moments, estimer les paramtres et . Calculer ensuite la
probabilit davoir un sinistre suprieur 4 500.
5.7 Soit X , une variable alatoire avec densit
f (x) = 2 xe

12 ( x )2

x > 0, > 0.

p
Lesprance de cette variable alatoire est donne par 2/2. On a observ
les cinq valeurs suivantes :
{4,9, 1,8, 3,4, 6,9, 4,0}.
Dterminer lestimateur de laide de la mthode des moments.
5.8 On suppose que la distribution du montant des sinistres obit une loi Weibull(, )
de paramtres inconnus.
a) Sachant que 50 % des sinistres sont suprieurs 1 000 $ et que 75 % des
sinistres sont suprieurs 500 $, estimer et par la mthode des quantiles.
b) partir des estimations obtenues en a), estimer le 80e centile.

224

Modlisation paramtrique
5.9 Soit X , la variable alatoire reprsentant le montant dun sinistre. On suppose que le montant dun sinistre pour un fix obit une distribution
Exponentielle() et que est une ralisation de la variable alatoire , o
Gamma(, ). la suite dune exprience, on observe que 0,1 % des sinistres sont suprieurs 450 et que 87,5 % des sinistres sont infrieurs 50.
Trouver lquation, uniquement fonction de , que lon doit rsoudre pour
estimer et qui, aprs avoir t rsolue, permet destimer le paramtre .
5.10 Pour des contrats en assurance automobile avec les modalits suivantes, on a
observ pour lanne 1999 :

x un rapport dlimination de perte de 0,56 avec une franchise forfaitaire de


d = 200 ;

x un rapport dlimination de perte de 0,32 avec une franchise atteinte de


d = 200 ;

x un rapport dlimination de perte de 0,79 avec une franchise forfaitaire de


d = 500 ;

x un rapport dlimination de perte de 0,52 avec une franchise atteinte de


d = 500.
On a aussi observ que le montant moyen dun sinistre est de 200 $. Si on
suppose une loi de Weibull(, ) pour modliser le montant dun sinistre,
estimer les paramtres et par la mthode des quantiles.
5.11 Un assureur a dtermin que 20 % des sinistres de son portefeuille sont
suprieurs 50 $ et que 10 % des sinistres sont suprieurs 55 $. Daprs ces
donnes, estimer A et B ( laide de la mthode des quantiles) pour

1 , a <x <b
f X (x) = b a

0,
ailleurs.
5.12 On a enregistr n essais indpendants X 1 , . . . , X n de la variable alatoire X
Bernoulli(p). Trouver lestimateur du maximum de vraisemblance pour p.
5.13 Soit X 1 , . . . , X n , un chantillon alatoire provenant dune loi normale de paramtres et 2 inconnus.
a) Trouver les estimateurs du maximum de vraisemblance de et 2 .
2 ont approximativement une distribution normale
b) Dmontrer que et
conjointe avec moyennes et 2 et variances 2 /n et 24 /n.

2 ) de
c) Trouver lapproximation de la distribution de lestimateur h(,
c
h(, 2 ) = Pr[X c] =
.

5.8. Exercices

225

5.14 Soit X , une variable alatoire reprsentant les montants de sinistres dont on
possde un chantillon de taille n. La fonction de densit de probabilit de X
est
2
f (x) = 2xe x , x > 0.
Dterminer lestimateur du maximum de vraisemblance de .
5.15 Un assureur possde un chantillon alatoire x 1 , . . . , x n et il souhaite modliser la variable alatoire sous-jacente laide de la fonction
F (x) = x p ,

0 < x < 1.

a) Dterminer lestimateur du maximum de vraisemblance de p.


b) Quelle est la variance asymptotique de lestimateur du maximum de vraisemblance de p ?
c) partir de la rponse obtenue en b), dterminer un intervalle de confiance
de niveau 95 % pour p.
d) Dterminer lestimateur du maximum de vraisemblance de E [X ].
e) partir de la rponse obtenue en d), dterminer un intervalle de confiance
de niveau 95 % pour E [X ].
5.16 La variable alatoire X a la densit suivante :
f (x) = ( + x)1 ,

x > 0.

On sait que = 1 000. partir de lchantillon


{43, 145, 233, 396, 777},
dterminer lestimation du maximum de vraisemblance de .
5.17 Quatre observations sont faites dune variable alatoire dont la densit est
2

f (x) = 2xe x ,

x > 0.

La seule information dont on dispose est quune des quatre observations est
infrieure 2. Calculer une estimation du maximum de vraisemblance de .
5.18 Un chantillon de taille 40 a t tir dune population dont la densit est
f (x) = (2)1/2 e x

/(2)

< x < .

partir de cet chantillon, on dtermine une estimation du maximum de


vraisemblance de : = 2. Dterminer une approximation de lerreur qua
dratique de .

226

Modlisation paramtrique
5.19 On suppose que X obit une distribution log-gamma :
f (x) =

2 ln(x)
x +1

x > 1.

a) Trouver lestimateur des moments de .


b) Trouver lestimateur du maximum de vraisemblance de .
5.20 Soit lchantillon suivant provenant dune distribution Gamma(5, ) :
{2, 20, 5, 4, 19}.
a) Trouver lestimateur du maximum de vraisemblance de et en calculer la
valeur.
b) Trouver la variance de si = 5 .
8

5.21 Le tableau ci-dessous prsente les sinistres pays en 1999. On pose lhypothse que la svrit dun sinistre est distribue selon une loi de Pareto de
paramtres et 1. Dterminer lquation finale permettant de trouver lestimateur du maximum de vraisemblance de .
Montant

Nombre de sinistres

(0, 2]
(2, 5]
(5, 11]
(11, )

2
0
1
1

5.22 Le tableau ci-dessous prsente les sinistres pays par un assureur. On pose
que la distribution de X est une exponentielle de paramtre inconnu. Quel
est lestimateur du maximum de vraisemblance de ?
Montant

Nombre de sinistres

(0, 1]
(1, 2]
(2, )

1
0
1

5.23 Soit X 1 , . . . , X n un chantillon alatoire provenant dune loi Weibull de densit


2

f (x) = 2xe x ,

x > 0.

On estime P k = Pr[X k] par la mthode du maximum de vraisemblance.

5.8. Exercices

227

a) Dterminer Pk .
b) Dterminer la variance de lestimateur trouv en a).
c) Si X 1 = X 2 = 10 et X 3 = 15, calculer Pr[P10 21 ].
5.24 Sachant quun chantillon alatoire X 1 , . . . , X 50 provenant dune distribution
de Pareto(, ) a conduit aux estimations = 1,5 et = 1 500 par la mthode
du maximum de vraisemblance, estimer les variances des estimateurs et
ainsi que leur covariance.
5.25 On suppose que le montant dun sinistre obit une loi de Pareto(, ). Pendant une anne, on observe 50 sinistres. laide des montants des 50 sinistres,
= 40. Si la covariance entre les es = 24 et Var[]
on obtient = 2, = 4, Var[]

timateurs et est 10, trouver un intervalle de confiance de niveau = 0,15


pour Pr[X > 10].
5.26 Soit X la variable alatoire reprsentant le montant dun sinistre. On observe
les sinistres suivants en assurance automobile :
{25, 88, 33, 62, 44, 75, 47, 53}.
On suppose que X Exponentielle().
a) Estimer la variance de la distribution de lestimateur du maximum de
vraisemblance de E [X ; 50].
b) Estimer la variance de la distribution de lestimateur du maximum de
vraisemblance de 0,95 .
5.27 Soit X , une variable alatoire indiquant si une exprience est un succs (1)
ou un chec (0) et dont la distribution est une loi de Bernoulli de paramtre
. On sait que la distribution a priori du paramtre est une loi U (0, 1). On a
observ un succs en trois essais.
a) Calculer lestimateur bayesien si la fonction de perte choisie est lerreur
quadratique.
b) Trouver lestimation bayesienne de la probabilit que se retrouve entre
0,2 et 0,4.
5.28 On suppose que X | = obit une loi de Poisson() et que la distribution a
priori de est une loi Gamma(, ). Pour un chantillon de taille n, trouver
lestimateur bayesien si la fonction de perte choisie est lerreur quadratique.
5.29 On suppose que X |A = Pareto(, 1) et que la distribution a priori de A est
une Exponentielle(3).
a) Trouver la distribution a posteriori de A.

228

Modlisation paramtrique
b) Calculer partir de lchantillon {2, 1, 2, 3, 3, 4} si la fonction de perte
choisie est lerreur quadratique.
5.30 On suppose que X |B = Exponentielle() et que la distribution a priori de
B est une Gamma(2, 3). On a lchantillon alatoire suivant :
{6, 11, 8, 13, 9}
a) Calculer lestimateur bayesien du paramtre si la fonction de perte est
lerreur quadratique.
b) Rpter la partie a) avec la fonction de perte valeur absolue de lerreur. On
fournit les valeurs
(7; 4,734) = 0,2

(7; 5,411) = 0,3

(7; 6,670) = 0,5

(7; 7,343) = 0,6.

(7; 6,039) = 0,4

5.31 Au cours dune session, les tudiants en actuariat font des devoirs informatiques. En faisant ces devoirs, il leur arrive de rester bloqus. Le nombre
de fois o un tudiant reste bloqu dans un devoir suit une distribution
Binomiale(3, ), o lon suppose que est uniformment distribu sur lintervalle (0,25, 0,75). Deux tudiants sont rests bloqus chacun deux fois pendant
un certain devoir.
a) Trouver lestimateur bayesien de avec une fonction de perte quadratique.
b) Dterminer la probabilit a posteriori que se retrouve dans lintervalle
(0,6, 0,7).
5.32 Pour des contrats dassurance comportant une rtention de 1,5 millions, 40
catastrophes ont t dclares au rassureur. Le rassureur suppose que les
montants de sinistres obissent une loi de Pareto(, ). Soit Y la variable
alatoire reprsentant un montant de sinistre dclar au rassureur (en millions). laide des montants qui lui ont t dclars, le rassureur a estim les
paramtres et par la mthode du maximum de vraisemblance. Il a obtenu
= 5,084 et = 28,998.
a) Trouver, par la mthode du maximum de vraisemblance, lestimation de
Pr[Y > 29,5].
est
)
b) Si la matrice variance-covariance de (,

23,92
167,07
,
167,07 1 199,32

estimer la variance de lestimateur de Pr[Y > 29,5] utilis en a).

5.8. Exercices

229

5.33 Soit X la variable alatoire reprsentant le montant dun sinistre. On suppose


X Exponentielle(). Pour des contrats dassurance comportant une franchise forfaitaire de 100 $ et une limite suprieure de 3 000 $, les montants de
sinistres suivants ont t pays par lassureur :
{100, 200, 250, 425, 515, 630, 1 000, 1 500, 2 900, 2 900}.
Estimer le montant espr dun sinistre par la mthode du maximum de
vraisemblance.
5.34 Un assureur signe un trait de rassurance excess-of-loss de plein 150, cest-dire que lassureur ne paie que les 150 premiers dollars de chaque sinistre et
le rassureur se charge de lexcdent. Cet assureur veut calculer combien lui
coterait la hausse du plein 200, mais il ignore la distribution du cot des
sinistres. Lassureur a pay les montants suivants :
{10, 70, 100, 105, 110, 150, 150, 150}
et il suppose que le cot des sinistres est distribu comme suit :

f (x) =

(
e x , x > 0

0,

ailleurs.

Quel est lestimateur du maximum de vraisemblance de en supposant que


les trois montants de 150 de lchantillon proviennent dun montant pay
suprieur 150 $ ?
5.35 On dispose dun chantillon tir dune loi exponentielle prsentant deux
observations entre 0 et 2, quatre observations entre 2 et 5 et trois observations entre 5 et 8. Estimer le paramtre de la loi par la mthode de Cramr
von Mises avec poids unitaires.

Exercices proposs dans Loss Models, 4e d.


13.1, 13.2, 13.3, 13.4, 13.6, 13.8, 13.11, 13.12, 13.15, 13.20, 13.22, 13.23, 13.24, 13.25,
13.26, 13.29, 13.33, 13.37, 13.38, 13.39, 13.40, 13.46, 13.47, 13.48, 13.51, 13.52, 13.53,
13.57, 13.58, 13.59, 13.60, 13.62, 13.64, 13.65, 13.66, 13.68, 13.70, 13.71, 13.72, 13.73,
13.75

230

Modlisation paramtrique

Rponses
5.1 = 3,45, = 3 048,87
5.2 L() = [(1 e 2 000 )2 (e 2 000 e 5 000 )4 ]/(1 e 5 000 )6
5.3 = 34,83, = 27,99
5.4 = 2, = 200

5.5 x/(1
x)
= 0,6368 et 0,056
5.6 = 7,40,
5.7 3,3511
5.8 a) = 1,2687, = 0,000747 b) 1 947
5.9 ( + 450)0,3010 = 0,3010 ( + 50)
5.10 = 0,48, = 0,01,
5.11 a = 10, b = 60
5.12 p = X
2 = S 2 b) h(,

2 ) N (h(, 2 ),V ), V = 2 ((c )/
)(1/n

5.13 a) = X ,
+ (c
2
2
/(2n
))
)
P
5.14 n/ ni=1 x i2
p
P
+ p)
+ p)
+
e) p/(1
1,96p(1
5.15 a) n/ ni=1 ln x i b) p 2 /n c) p 1,96p/ n d) p/(1
p
2
/ n
p)
5.16 3,8629
5.17

4
1
4 ln 3

5.18 0,20
p
p
P
5.19 a) X /( X 1) b) 2n/ ni=1 ln(X i )
5.20 a) 1/2 b) 1/64
5.21 L() = (1 (1/3) )2 ((1/6) (1/12) )(1/12)
5.22 ln(1,5)
P
2
2
5.23 a) 1 e k , = n/ ni=1 X i2 b) k 4 2 e 2k /n c) 0,4875

= 656 250, Cov(


= 393,75
d ]
d ]
d ,
= 0,28133, Var[
)
5.24 Var[
5.25 (0, 0,7653)
5.26 a) 20,68 b) 3 196

5.8. Exercices
5.27 a) 0,4 b) 0,3432
P
5.28 ( + ni=1 X i )/( + n)

P
5.29 a) Gamma n + 1, 3 + ni=1 ln(1 + x i ) b) 0,68
5.30 a) 0,14 b) 0,1334
5.31 a) 0,5668 b) 0,3055
5.32 a) 0,0365 b) 0,00057
5.33 1 302,50
5.34 0,0059
5.35 0,2286

231

6 Tests dadquation
Objectifs du chapitre
x valuer ladquation dun modle de svrit des sinistres aux donnes laide
de divers tests graphiques (comparaison des distributions empirique et thorique,
graphique quantile-quantile) et statistiques (KolmogorovSmirnov, khi carr, ratio
des vraisemblances).
x Calculer la valeur du critre bayesien de Schwarz et du critre dinformation de
Akaike.
x Choisir le modle le plus appropri partir des rsultats des tests et critres cidessus.

Lobjectif ultime dune modlisation est gnralement de dterminer un modle


pour les donnes. Ce chapitre prsente des mthodes permettant dvaluer des
modles et de les comparer entre eux.
Par dfinition, un modle est toujours une approximation de la ralit. Le but
est donc de dterminer si un modle est assez bon pour permettre de rsoudre le
problme pos, ou sil doit tre rejet.

6.1

Tests graphiques

Lide ici est de comparer graphiquement une caractristique du modle postul avec la caractristique empirique correspondante.

6.1.1

Comparaison des fonctions thoriques et empiriques

La manire sans doute la plus simple et intuitive de juger de la qualit dun


modle consiste comparer les fonctions de rpartition thorique et empirique,
ou encore lhistogramme et la fonction de densit du modle. Un modle sera
considr comme bon si la fonction thorique suit relativement bien la fonction
233

234

Tests dadquation
empirique. videmment, il sagit ici dun critre trs subjectif qui permet seulement
une classification plutt grossire en bons, acceptables et mauvais modles.
Exemple 6.1. Soit lchantillon
{30, 38, 34, 29, 35, 34, 29, 39, 20, 37,
21, 27, 37, 18, 37, 34, 17, 28, 38, 32}.
On ajuste des distributions gamma et log-normale ces donnes par la mthode
du maximum de vraisemblance :
> x <- c(30, 38, 34, 29, 35, 34, 29, 39, 20, 37,
+

21, 27, 37, 18, 37, 34, 17, 28, 38, 32)

> (fit.g <- fitdistr(x, "gamma")$estimate)


shape

rate

17.2322211

0.5613102

> (fit.ln <- fitdistr(x, "lognormal")$estimate)


meanlog

sdlog

3.394966 0.252984

La figure 6.1 prsente une comparaison entre la fonction de rpartition empirique


et les fonctions de rpartition thoriques des deux modles. La figure 6.2 reprend
la mme ide avec lhistogramme et les fonctions de densit. Les deux modles
prsentent un ajustement passable aux donnes. Toutefois, la lumire de ces deux
graphiques, il nest pas clair quun des deux modles est meilleur que lautre.

6.1.2

On trouvera le code R pour crer les graphiques des figures 6.1 et 6.2
la section 6.4.

Graphique quantile-quantile

Le graphique quantilequantile, mieux connu sous son vocable anglais Q-Q


plot, est une comparaison visuelle des quantiles empiriques et des quantiles thoriques dun modle. Dans un graphique des premiers en fonction des seconds, un
alignement des points signifiera que lajustement du modle est bon. Le graphique
quantilequantile est plus communment utilis pour vrifier si des quantits sont
distribues selon une loi normale, mais on peut facilement gnraliser lide
toute autre loi de probabilit.

6.1. Tests graphiques

235

1.0

ecdf(x)

0.8

Fn(x)

0.6

0.4

0.2

0.0

15

20

25

30

35

40

F IG . 6.1: Comparaison entre la fonction de rpartition empirique des donnes de


lexemple 6.1 et la fonction de rpartition ajuste dune loi gamma (trait plein) et
dune loi log-normale (trait bris)

Pour les quantiles empiriques, on utilise les statistiques dordre de lchantillon,


soit les donnes
y1 y2 yn
tries en ordre croissant. Quant aux quantiles thoriques, il faut choisir des probabilits adquates o valuer la fonction de quantile thorique. Dans la littrature,
on recommande dvaluer en des points
j a
,
n + 1 2a
pour j = 1, . . . , n et o a est une valeur quelconque dans lintervalle [0, 1]. Les points
du graphique quantilequantile sont donc

j +a
1
yj ,F
, j = 1, . . . , n,
n + 1 2a

236

Tests dadquation

0.04
0.00

0.02

Density

0.06

Histogram of x

10

20

30

40

F IG . 6.2: Comparaison entre lhistogramme des donnes de lexemple 6.1 et la


densit ajuste dune loi gamma (trait plein) et dune loi log-normale (trait bris)

o F 1 est linverse de la fonction de rpartition du modle postul.


Dans R, la fonction ppoints permet de calculer les points o lon valuera la
fonction F 1 . La valeur par dfaut de a est 1/2 lorsque n > 10 et 3/8 sinon.
Tel que mentionn prcdemment, une droite 45 degrs indiquera une correspondance parfaite entre les quantiles empiriques et thoriques. Plus le graphique
quantilequantile sloigne de cette droite et moins le modle est bon.
Exemple 6.2. Soit lchantillon
{10, 12, 13, 15, 18, 20, 22, 23, 29}.
On ajuste des distributions exponentielle et log-normale ces donnes par la
mthode du maximum de vraisemblance :

6.1. Tests graphiques

237

25

20

15

Sample Quantiles

10

10

15

20

25

Theoretical Quantiles

F IG . 6.3: Graphique quantilequantile des donnes de lexemple 6.2 pour des


modles log-normale (cercles pleins) et exponentielle (cercles vides)

> x <- c(10, 12, 13, 15, 18, 20, 22, 23, 29)
> (fit.e <- fitdistr(x, "exponential")$estimate)
rate
0.05555556
> (fit.ln <- fitdistr(x, "lognormal")$estimate)
meanlog

sdlog

2.837825 0.327125

La figure 6.3 prsente le graphique quantilequantile combin des deux modles.


On constate que la distribution log-normale fournit un meilleur ajustement pour ce
petit chantillon. Le graphique de la figure 6.4 confirme dailleurs cette conclusion.

238

Tests dadquation

0.06
0.00

0.02

0.04

Density

0.08

0.10

Histogram of x

10

15

20

25

30

F IG . 6.4: Comparaison de lhistogramme des donnes de lexemple 6.2 et la densit


ajuste dune loi log-normale (trait plein) et dune loi exponentielle (trait bris)

6.2

On trouvera le code R pour crer les graphiques des figures 6.3 et 6.4
la section 6.4.

Tests statistiques

On se rappelera de la section 1.13 que le but dun test statistique consiste


vrifier si lon doit ou non rejeter une hypothse nulle H0 en faveur dune hypothse alternative H1 . Pour ce faire, on choisit une statistique T (X 1 , . . . , X n ) dun
chantillon alatoire X 1 , . . . , X n dont la distribution est connue (au moins approximativement ou asymptotiquement) sous H0 . partir de cette distribution, on peut

6.2. Tests statistiques

239

dterminer une rgion critique C ; lorsque la valeur T (x 1 , . . . , x n ) de la statisque


tombe dans cette rgion critique pour un chantillon donn, lhypothse H0 est
rejete. On note
= Pr[T (X 1 , . . . , X n ) C ; H0 ],
le seuil de signification du test (ou 1 le niveau de confiance du test).
Une manire plus utile de rendre compte des rsultats dun test est par le biais
de sa valeur p. Celle-ci reprsente le seuil de signification maximal auquel on peut
rejeter H0 tant donn la valeur de la statistique obtenue avec un chantillon. Par
exemple, si la rgion critique est C = {x 1 , . . . , x n ; T (x 1 , . . . , x n ) > c}, alors la valeur p
est la probabilit
p = Pr[T (X 1 , . . . , X n ) > T (x 1 , . . . , x n ); H0 ].
La faon la plus simple de se rappeler de la signification de la valeur p est la
suivante : 1 p est le niveau de confiance avec lequel on peut rejeter lhypothse
nulle H0 .
Dans notre contexte, on a un chantillon alatoire X 1 , . . . , X n provenant dune
distribution (inconnue) avec fonction de rpartition F et lon cherche dterminer
ou non. On cherche donc une statistique
si cette distribution est F 0 F 0 (x; )
T (X 1 , . . . , X n ) permettant de tester les hypothses
H0 : F = F 0
H1 : F 6= F 0 .
Pour raliser ce test, un point de dpart naturel est de choisir la fonction T
comme tant une certaine mesure de distance d entre les donnes et le modle,
cest--dire entre F n et F 0 . Ainsi, T (X 1 , . . . , X n ) = d (F n , F 0 ) 0 et les petites valeurs
de d devraient privilgier H0 . En dautres termes, puisque lon souhaite ne pas
rejeter H0 (le modle obtenu est adquat), on favorisera les grandes valeurs p dans
les tests. On ne rejette pas H0 si p > .

6.2.1

Test de Kolmogorov-Smirnov

La statistique de KolmogorovSmirnov, D n , est directement construite partir


de la notion de distance de KolmogorovSmirnov entre deux fonctions de rpartition. Cette distance est dfinie comme la plus grande diffrence entre les deux
fonctions. La statistique est donc
D n = max|F n (x) F 0 (x)|.
x

Tests dadquation

0.8

240

0.7

Fn(x) F0(x)

0.6

0.4

0.5

Fn(x)

Fn(x) F0(x)

0.6

0.8

1.0

1.2

1.4

1.6

F IG . 6.5: Calcul de la statistique de KolmogorovSmirnov

Comme la fonction de rpartition empirique, F n , est une fonction en escalier, il


faut valuer les diffrences avant et aprs chacun des sauts. En pratique, on a donc
D n = max (|F n (x j ) F 0 (x j )|, |F n (x j ) F 0 (x j )|),
1 j n

o x j reprsente un point juste la gauche de x j . La figure 6.5 illustre cette ide.


On rejette lhypothse H0 (et donc le modle) lorsque la valeur de la statistique
excde la valeur critique c. Celle-ci est donne dans le tableau 6.1 pour divers seuils
de signification.
Remarque. Les valeurs critiques du tableau 6.1 sont valides pour les chantillons
de taille suprieure 15 et dans la mesure o la loi F 0 est entirement dtermine,
cest--dire que ses paramtres nont pas t estims partir de donnes. Dans le
cas contraire, les valeurs critiques sont plus petites.

6.2. Tests statistiques

241

0,20
0,10
0,05
0,02
0,01

p
1,073/ n
p
1,223/ n
p
1,358/ n
p
1,518/ n
p
1,629/ n

TAB. 6.1: Valeurs critiques pour la statistique de KolmogorovSmirnov

On peut construire un intervalle de confiance de niveau 1 pour F partir


de la statististique de KolmogorovSmirnov. En effet, on a que
Pr[D n c] = Pr[max|F n (x) F 0 (x)| c] = 1 ,
x

do, pour tout x,


1 = Pr[|F n (x) F (x)| c]
= Pr[c F n (x) F (x) c]
= Pr[F n (x) c F (x) F n (x) + c].
Dans R, la fonction ks.test permet, pour un chantillon donn, de calculer la
valeur de la statistique et la valeur p du test. Pour un petit chantillon, n < 100, il
est possible dobtenir la valeur p exacte et la valeur p de la distribution limite, alors
que pour un grand chantillon, uniquement la valeur p asymptotique est donne.
Exemple 6.3. Un assureur souhaite modliser les donnes suivantes :
{2, 5, 7, 10, 11, 12, 18}
par une distribution exponentielle de paramtre = 0,108. On vrifie ladquation
de ce modle avec la statistique de KolmogorovSmirnov (malgr le petit chantillon) pour un seuil de signification de 20 %.
La fonction de rpartition du modle est
F 0 (x) = 1 e 0,108x ,

x > 0,

242

Tests dadquation

xj

|F n (x j ) F 0 (x j )|

|F n (x j ) F 0 (x j )|

2
5
7
10
11
12
18

0,0514
0,1315
0,1019
0,0890
0,0191
0,1308
0,1431

0,1943
0,2744
0,2447
0,2318
0,1237
0,0121
0,0003

TAB. 6.2: Diffrences entre les fonctions de rpartition thorique et empirique

alors que la fonction de rpartition empirique est

0,

1/7,

2/7,

3/7,
F 7 (x) =

4/7,

5/7,

6/7,

1,

x <2
x 2
x 5
x 7
x 10
x 11
x 12
x 18.

Le tableau 6.2 prsente les diffrences entre les fonctions de rpartition. La valeur de
la statistique D 7 est la plus grande diffrence de ce tableau. On a donc D 7 = 0,2744.
p
La valeur critique du test est c = 1,073/ 7 = 0,4056 > 0,2744. On ne rejette donc
pas le modle.
Ce rsultat est confirm par les valeurs p asymptotique et exacte telles que
calcules par la fonction ks.test :
> x <- c(2, 5, 7, 10, 11, 12, 18)
> ks.test(x, pexp, rate = 0.108, exact = TRUE)
One-sample Kolmogorov-Smirnov test
data:

D = 0.2744, p-value = 0.5752


alternative hypothesis: two-sided
> ks.test(x, pexp, rate = 0.108, exact = FALSE)

243

1.0

6.2. Tests statistiques

0.8

0.6

Fn(x)

0.4

0.2

0.0

10

15

20

F IG . 6.6: Fonctions de rpartition empirique et thorique et bornes de lintervalle


de confiance

One-sample Kolmogorov-Smirnov test


data:

D = 0.2744, p-value = 0.6677


alternative hypothesis: two-sided

La figure 6.6 prsente une comparaison entre la fonction de rpartition empirique et la fonction de rpartition thorique. Les lignes pointilles indiquent
les bornes de lintervalle de confiance calcul avec la statistique de Kolmogorov
Smirnov. On constate visuellement que lhypothse nulle nest pas rejete puisque
la fonction de rpartition empirique se trouve lintrieur des bornes plus de
80 %.

244

Tests dadquation

6.2.2

Test du khi carr de Pearson

Le test du khi carr est valide uniquement pour des donnes groupes ; on
regroupera donc arbitrairement les donnes individuelles. Soit n j le nombre de
P
donnes dans la classe (c j 1 , c j ], j = 1, . . . , r et rj =1 n j = n. La statistique est
Q=

r (E n )2
X
j
j
j =1

Ej

o
F (c j 1 ; )).

E j = n(F (c j ; )
Asymptotiquement, la statistique Q obit une loi 2 (r p 1), o p est le
nombre de paramtres estims. On rejette donc H0 si, et seulement si, la valeur de
la statistique est suprieure au 100(1 )e quantile dune telle loi.
On considre gnralement que ce test est valide si le nombre espr de donnes dans chacune des classes est suprieur 5. Si ce nest pas le cas, il faut regrouper des classes.
Exemple 6.4. Supposons que lon a les donnes groupes suivantes :
Intervalle

Frquence

(0 5]
(5 20]
(20 )

60
25
15

Si lon ajuste une loi de Pareto(1, 10) ces donnes, on a


F X (x) = 1

x
10
=
10 + x 10 + x

et
E 1 = 100(F (5) F (0)) = 33,33
E 2 = 100(F (20) F (5)) = 33,33
E 3 = 100(1 F (20)) = 33,33,
do la statistique du khi carr est
(60 33,33)2 (25 33,33)2 (15 33,33)2
+
+
33,33
33,33
33,33
= 33,50.

Q=

6.2. Tests statistiques

6.2.3

245

Test du ratio des vraisemblances

Le test du ratio des vraisemblances (likelihood ratio test ; LRT) est un test statistique bas sur la fonction de vraisemblance permettant de vrifier si un paramtre
dune distribution appartient ou non un sous-espace 0 de lespace des valeurs
possibles des paramtres. La forme gnrale du test est la suivante :
H0 : 0
H1 : c0 ,
o c0 est le complment de 0 . La statistique du test est

sup0 L(; X 1 , . . . , X n )
T = 2 ln
,
sup L(; X 1 , . . . , X n )
Q
o L(; X 1 , . . . , X n ) = ni=1 f (X i ; ) est la fonction de vraisemblance de lchantillon
X 1 , . . . , X n . Par les proprits des logarithmes, on peut aussi crire la statistique
ainsi :
"
#
T = 2 sup l (; X 1 , . . . , X n ) sup l (; X 1 , . . . , X n ) ,
0

avec l (; X 1 , . . . , X n ) = ln L(; X 1 , . . . , X n ), la fonction de log-vraisemblance.


On peut dmontrer que la statistique T a une distribution 2 (1). On rejette
donc lhypothse H0 avec un niveau de confiance 1 lorsque T > 2 (1).
Exemple 6.5. Soit X 1 , . . . , X n un chantillon alatoire dune distribution exponentielle avec fonction de densit de probabilit f (x; ) = e x pour x > 0. Lespace
des valeurs possibles du paramtre est = R+ . Supposons que lon veut tester
H0 : = 0
H1 : 6= 0 ,
o 0 est une valeur quelconque. Dans ce cas, le sous-espace 0 est {0 }.
La fonction de vraisemblance est
n
Y

L(; X 1 , . . . , X n ) L() =
e X i = n e n X .
i =1

Or, on sait (voir lexemple 5.3) que cette fonction trouve son maximum dans R+
lorsque = X 1 . La statistique du test LRT est donc, ici,

L(0 )
T = 2 ln
L( X 1 )

!
n0 e 0 n X
= 2 ln
X n e n
= 2n(ln 0 + ln X )n 2n + 20 n X .

246

Tests dadquation
Le 95e centile dune distribution 2 avec un degr de libert est 3,8415. On rejetterait
donc lhypothse H0 si T > 3,8415 pour un chantillon et une valeur de 0 donns.
Exemple 6.6. On a un chantillon alatoire de 20 valeurs dune distribution de Pareto de paramtre = 2 et inconnu. Lestimateur du maximum de vraisemblance
P
P20
de est 7,0. On sait galement que 20
i =1 ln(x i + 7,0) = 49,01 et i =1 ln(x i + 3,1) =
39,30. On souhaite tester
H0 : = 3,1
H1 : 6= 3,1.
On vrifie aisment que la fonction de log-vraisemblance est
l () = n ln + n ln ( + 1)

n
X

ln(x i + )

i =1

= 20 ln 2 + 40 ln 3

20
X

ln(x i + ).

i =1

Le maximum de cette fonction sur = R+ est atteint lestimateur du maximum


de vraisemblance, = 7,0. Or, l (7,0) = 55,33. Sur le sous-espace 0 = {3,1}, le
maximum est videmment atteint 3,1 et L(3,1) = 58,78.
La valeur de la statistique du test du ratio des vraisemblances est donc T =
2(58,78 + 55,33) = 6,90. Puisque 6,90 > 20,05 (1) = 3,8415, on rejette lhypothse
H0 . La valeur p du test est Pr[T > 6,90] = 0,0086, ce qui correspond un niveau de
confiance de 99,14 % dans le rejet de H0 .
On peut interprter la statistique du test LRT comme le rapport entre le maximum de la fonction de vraisemblance sur un sous-espace restreint (0 ) et le maximum de cette mme fonction sur tout lespace des valeurs possibles des paramtres
lestimateur du
(). Or, on sait que ce dernier maximum est atteint lorsque = ,

maximum de vraisemblance. Si lon note 0 lestimateur du maximum de vraisemblance sur le sous-espace restreint 0 , la statistique du test peut scrire plus
simplement ainsi :

!
L(0 ; X 1 , . . . , X n )
T = 2 ln
X1, . . . , Xn )
L(;
X 1 , . . . , X n )].
= 2[l (0 ; X 1 , . . . , X n ) l (;
Dans notre contexte, il nest pas trs intressant de tester si un paramtre est
gal ou non une certaine valeur. Nous sommes davantage intresss comparer lajustement de deux distributions. Le test du ratio des vraisemblances nous

6.3. Choix dun modle

247

permet de faire cette comparaison, mais dans la mesure o une distribution est
un cas spcial de lautre. En effet, la maximisation de la fonction de vraisemblance
sur un sous-espace restreint sapparente alors fixer la valeur dun ou plusieurs
paramtres de la distribution gnrale. La distribution de la statistique est toujours
une 2 , mais le nombre de degrs de libert est gal la diffrence entre le nombre
de paramtres libres sous H1 et le nombre de paramtres libres sous H0 .
Exemple 6.7. La distribution de Pareto est un cas spcial de la distribution de
Pareto gnralise lorsque = 1. Ainsi, le test H0 : les donnes proviennent dune
distribution de Pareto(, ) versus H1 : les donnes proviennent dune distribution de Pareto gnralise(, , ) se ramne essentiellement au test du ratio des
vraisemblances
H0 : = 1
H1 : 6= 1,
avec l (, , ; X 1 , . . . , X n ) la fonction de log-vraisemblance de la distribution Pareto
gnralise. Soit 0 et 0 les estimateurs du maximum de vraisemblance des paramtres de la distribution de Pareto et soit 1 , 1 et 1 , ceux des paramtres de la
distribution de Pareto gnralise. La statistique du test ci-dessus est alors
T = 2[l ( 0 , 1, 0 ; X 1 , . . . , X n ) l ( 1 , 1 , 1 ; X 1 , . . . , X n )].
Sa distribution est une 2 avec 3 2 = 1 degr de libert.

6.3

Choix dun modle

Lire la section 16.5 de Klugman et collab. (2012a) ou Klugman et collab. (2008).

6.3.1

Critre bayesien de Schwarz

Classer des modles par la valeur de leur fonction de log-vraisemblance a leffet


pernicieux de favoriser les modles avec un plus grand nombre de paramtres,
ce qui entre en violation avec le principe de parsimonie. Le critre bayesien de
Schwarz (SBC) propose donc de classer les modles selon leurs fonctions de logvraisemblance rduites dune quantit (p/2) ln n, o p est le nombre de paramtres
du modles et n est la taille de lchantillon. On a donc
SBC = l
o l est la fonction de log-vraisemblance.

p
ln n,
2

248

Tests dadquation

6.3.2

Critre dinformation de Akaike

La statistique AIC (An Information Criterion) de Akaike (1974) est similaire au


critre bayesien de Schwarz et vise les mmes buts. On a
AIC = l + 2p
et on favorise la plus petite statistique.

6.4

Code informatique

###
### TESTS GRAPHIQUES
###
## EXEMPLE 6.1
##
## Comparaison des courbes
## un petit chantillon de
x <- c(30, 38, 34, 29, 35,
21, 27, 37, 18, 37,

empiriques et thoriques d'un modle pour


donnes.
34, 29, 39, 20, 37,
34, 17, 28, 38, 32)

## Le package MASS est ncessaire pour le calcul des EMV.


library(MASS)
## On ajuste des lois gamma et log-normale ces donnes par la
## mthode du maximum de vraisemblance.
(fit.g <- fitdistr(x, "gamma")$estimate)
(fit.ln <- fitdistr(x, "lognormal")$estimate)
## Comparaison entre la fonction de rpartition empirique et les
## fonctions de rpartition thoriques des deux modles. La faon la
## plus simple de tracer ces dernires est gnralement avec la
## fonction 'curve'.
plot(ecdf(x))
curve(pgamma(x, fit.g[1], fit.g[2]), add = TRUE,
lwd = 2, col = "darkblue")
curve(plnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,
lwd = 2, col = "darkred")
## Mme ide avec l'histogramme et les fonctions de densit. Si les
## classes sont gales dans l'histogramme, ne pas oublier d'ajouter
## l'option 'prob = TRUE' dans l'appel de 'hist'.
hist(x, breaks = c(0, 20, 25, 28, 30, 32, 34, 37, 40))

6.4. Code informatique

curve(dgamma(x, fit.g[1], fit.g[2]), add = TRUE,


lwd = 2, col = "darkblue")
curve(dlnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,
lwd = 2, col = "darkred")

## EXEMPLE 6.2
##
## On ajuste des distributions exponentielle et log-normale un petit
## chantillon par la mthode du maximum de vraisemblance et on
## compare leur ajustement avec des graphiques quantile-quantile.
x <- c(10, 12, 13, 15, 18, 20, 22, 23, 29)
(fit.e <- fitdistr(x, "exponential")$estimate)
(fit.ln <- fitdistr(x, "lognormal")$estimate)
## La fonction 'ppoints' calcule les points o l'on valuera la
## fonction de quantile thorique. Par dfaut, a = 3/8 si le nombre de
## donnes est infrieur ou gal 10 (comme c'est le cas ici) et a =
## 1/2 sinon. On peut fixer la valeur de a nous-mmes.
(y <- ppoints(length(x)))
# avec 'ppoints'
(seq_along(x) - 3/8)/(length(x) + 0.25) # idem
## La fonction 'qqnorm' trace un graphique quantile-quantile pour des
## donnes normales. De manire plus gnrale, 'qqplot' trace un
## graphique quantile-quantile entre deux jeux de donnes. Pour nos
## besoins, il suffit de lui fournir les donnes et les quantiles
## thoriques.
##
## On commence avec le graphique de la log-normale.
qqplot(qlnorm(y, fit.ln[1], fit.ln[2]), x,
pch = 16, col = "darkblue",
xlab = "Theoretical Quantiles",
ylab = "Sample Quantiles")
## Pour ajouter le graphique de l'exponentielle au graphique existant,
## on doit utiliser la fonction 'points' et renverser l'ordre des
## arguments.
points(qexp(y, fit.e), x, pch = 16, col = "darkred")
## Enfin, ajout de la droite y = x.
abline(0, 1)
## L'ajustement de la log-normale est bien meilleur, comme en fait foi
## la comparaison des densits avec l'histogramme.
hist(x, breaks = c(10, 12, 18, 25, 30))

249

250

Tests dadquation

curve(dlnorm(x, fit.ln[1], fit.ln[2]), add = TRUE,


lwd = 2, col = "darkblue")
curve(dexp(x, fit.e), add = TRUE,
lwd = 2, col = "darkred")

6.5

Exercices

6.1 On suppose que la variable alatoire reprsentant le montant dun sinistre a


une distribution de Pareto avec paramtres = 2 et = 1 000. Un chantillon
de taille 10 prsente trois donnes entre 0 et 250, deux donnes entre 250 et 500,
trois donnes entre 500 et 1 000 et deux donnes suprieures 1 000. Appliquer
le test du khi carr un seuil de signification de 10 % mme si les nombres de
sinistres attendus dans chaque classe ne sont pas suprieurs cinq.
6.2 Le tableau ci-dessous prsente un chantillon de 1 000 donnes groupes.
Intervalle

Nombre de donnes

(0, 3]
(3, 7,5]
(7,5, 15]
(15, 40]
(40, )

180
180
235
255
150

Une loi de Pareto a t ajuste ces donnes et les estimateurs obtenus sont
= 3,5 et = 50. Quel est le seuil de signification le plus lev (parmi 5 %,
2,5 %, 1 % et 0,5 %) auquel on ne rejette pas ce modle avec le test du khi carr ?
6.3 On dispose de lchantillon alatoire {0,1, 0,4, 0,8, 0,8, 0,9} et on veut y ajuster
la distribution avec fonction de densit de probabilit
f (x) =

1 + 2x
,
2

0 x 1.

Calculer la statistique de KolmogorovSmirnov et raliser un test avec un seuil


de signification de 5 %.
6.4 La compagnie dassurance Great Company a obtenu les montants de sinistres
suivants :
{1, 1, 2, 2, 2, 2, 3, 3, 4, 8}.
a) Trouver la distribution empirique.
b) Si le montant dun sinistre obit une loi de Pareto(2, 2), calculer la distance
de Cramrvon Mises avec poids unitaires.

6.5. Exercices

251

c) Un comptiteur sujet aux mmes sinistres, Greater Company, a perdu toutes


les donnes sur ses sinistres. Dans un lan de sollicitude, Great Company
lui fournit ses donnes, mais sous la forme restreinte ci-dessous.
Montants des sinistres

Nombre de sinistres

(0, 2]
(0, 4]
(0, 8]

6
9
10

Calculer la distance de Cramrvon Mises avec poids unitaires.


6.5 Soit la distribution avec fonction de densit de probabilit
x
,
2

f (x) =

0 x 2,

et soit lchantillon tir de cette densit {0,5, 1, 1,25, 1,5}. Calculer la statistique
de KolmogorovSmirnov.
6.6 On veut tester si
(

f X (x) =

x
50 ,

0 < x < 10

0,

ailleurs

est un bon modle pour les donnes suivantes :


{1, 4, 6, 9, 8, 7, 9,5}.
Utiliser la statistique de KolmogorovSmirnov avec un seuil de signification de
p
5 %. (Utiliser la valeur critique c = 1,36/ n mme si n < 15.)
6.7 En supposant que les donnes du tableau ci-dessous sont associes une loi
de Pareto(1, 8), calculer la statistique de Pearson.
Intervalle
(0, 5]
(5, 20]
(20, )

Frquence
10
5
5

6.8 On a observ les sinistres suivants en assurance habitation :


{125, 550, 550, 700}.
On hsite entre les distributions Gamma(3, 0,01) et Gamma(3,5, 0,01) pour modliser le montant dun sinistre. Utiliser la statistique de KolmogorovSmirnov

252

Tests dadquation
pour guider le choix de la distribution. Voici quelques valeurs de la Gamma
incomplte : (3,5; 1,25) = 0,0729, (3,5; 5,51) = 0,8614, (3,5; 7) = 0,9488. De
plus, pour entier, on a
(; x) = 1

1
X

x j e x
.
j!

j =0

6.9 On a observ les sinistres du tableau ci-dessous en assurance mdicaments. Dterminer, laide de la statistique de Pearson, si lhypothse dune distribution
avec taux dchec constant
(x) = 0,01,

x >0

est approprie un niveau de confiance de 95 %.


Montants des sinistres

Nombre de sinistres

[0, 25)
[25, 40)
[40, 60)
[60, 80)
[80, )

10
5
10
5
20

6.10 On dtient les informations du tableau ci-dessous sur lexprience de sinistres


dun portefeuille dassurance.
Montants de sinistres
[0, 25)
[25, 50)
[50, 100)
[100, 200)
[200, )

Frquence
10
12
12
11
5

On hsite entre une loi de Pareto(1,5, 50) et une loi de Weibull(0,01, 1) pour la
distribution du montant dun sinistre.
a) Quel modle privilgier si on utilise la distance de Cramrvon Mises avec
poids unitaires pour guider le choix ?
b) Si la statistique de Pearson avait t utilise au lieu de la distance de
Cramrvon Mises, lhypothse de la loi Pareto(1,5, 50) aurait-elle t rejete un niveau de confiance = 0,05 ?

6.5. Exercices

253

c) Si lon obtient une distance de Cramrvon Mises de 0,01 lorsque lon


suppose X Log-normale( = 65, 2 = 5 500), est-ce que, selon cette statistique, le choix de cette distribution est meilleur que le choix de la distribution de Pareto(1,5, 50) ?
6.11 Au dpart dune course de chevaux, il y a habituellement huit positions de dpart et la position numro 1 est la plus proche de la palissade. On souponne
quun cheval a plus de chances de gagner quand il porte un numro faible,
cest--dire lorsquil est plus proche de la palissade intrieure. Le tableau
ci-dessous prsente les rsultats pour 144 courses.
Numro

Gains

29

19

18

25

17

10

15

11

a) Poser les hypothses tester (hypothse nulle et hypothse alternative).


b) La comparaison de la distribution observe la distribution thorique
seffectue par un test de KolmogorovSmirnov. Que peut-on en conclure ?
6.12 partir dun chantillon contenant 100 donnes, un assureur obtient les
rsultats prsents dans le tableau ci-dessous pour cinq modles postuls.
Dterminer le meilleur modle selon le critre bayesien de Schwarz.
Modle
Pareto gnralise
Burr
Pareto
Log-normale
Exponentielle inverse

Nombre de paramtres

Log-vraisemblance

3
3
2
2
1

219,1
219,2
221,2
221,4
224,4

Exercices proposs dans Loss Models, 4e d.


16.1, 16.2, 16.3, 16.4, 16.5, 16.8, 16.9, 16.11, 16.12, 16.15, 16.16

Rponses
6.1 Q = 0,7740
6.2 0,5 %

254

Tests dadquation
6.3 D = 0,32
6.4 a) 0,3478 b) 0,0242
6.5 0,4375
6.6 D = 0,1329
6.7 1,1667
6.8 Gamma(3,5, 0,01)
6.9 Q = 1,8179
6.10 a) Weibull b) oui c) oui
6.11 a) D = 0,132
6.12 Pareto

7 Modles de frquence
Objectifs du chapitre
x Dfinir et connatre les principales caractristiques (fonction de masse de probabilit, fonction de rpartition, moments) des modles de frquence les plus usuels en
actuariat : loi de Poisson, loi binomiale ngative, loi gomtrique, loi binomiale.
x Estimer les paramtres des lois mentionnes ci-dessus et choisir quel modle utiliser
dans un contexte donn.
x Dfinir les familles de lois de probabilit discrtes (a, b, 0) et (a, b, 1) et en identifier
les principaux membres.

Le but de ce chapitre est de prsenter diffrents modles pour la frquence


des sinistres. Les distributions candidates doivent tre des distributions discrtes
dfinies sur les valeurs 0, 1, 2, . . .
Soit N , la variable alatoire qui reprsente le nombre de sinistres pendant une
priode fixe. On a que N N et on pose
p k = Pr[N = k],

7.1

k = 0, 1, 2, . . .

Fonction gnratrice des probabilits

La fonction gnratrice des probabilits dune distribution discrte est


P N (t ) = E [t N ] =

pk t k .

k=0

On a, par exemple,
P N (e t ) = E [e t N ] = M N (t )
255

256

Modles de frquence
et
P N (1) = E [1N ] = 1.
Comme son nom lindique, la fonction gnratrice des probabilits permet de
gnrer les probabilits dune variable alatoire. En effet, la drive dordre k de la
fonction gnratrice des probabilits est
(k)
PN
(z) =

j!
z j k p j
(
j

k)!
j =k

et donc
(k)
PN
(0) = k!p k ,

do
pk =

1 (k)
P (0).
k! N

De plus, on a
(k)
PN
(1) = E [(N )(N 1) (N k + 1)]

et donc
(1)
E [N ] = P N
(1)
(2)
(1)
(1)
Var[N ] = P N
(1) + P N
(1) (P N
(1))2 .

7.2

Principales distributions discrtes

On prsente dans cette section les principales caractristiques des lois de probabilit les plus souvent utilises pour le dnombrement des sinistres en assurance.
Lannexe A reprend bon nombre des rsultats ci-dessous dans une forme plus
compacte.

7.2.1

Loi de Poisson

La fonction de masse de probabilit de la loi de Poisson de paramtre , parfois


appel le paramtre dintensit, est
pk =

k e
,
k!

k = 0, 1, . . . ,

7.2. Principales distributions discrtes

257

avec > 0. De plus,


Pr[N k] =

k
X

pj

j =0

k j e
X
j!
j =0

= 1 (k + 1; ),
o () est la fonction gamma incomplte.
La fonction gnratrice des moments est
M N (t ) = e (e

1)

et la fonction gnratrice des probabilits est


P N (t ) = e (t 1) ,

> 0.

La distribution de Poisson a la proprit davoir une esprance gale sa variance :


E [N ] = Var[N ] = .
Le thorme suivant tablit que la somme de variables alatoires Poisson indpendantes est aussi Poisson.
Thorme 7.1. Soit {Ni }i =1,...,k une suite de variables alatoires indpendantes telles
que Ni Poisson(i ) et soit N = N1 + + Nk . Alors,
N Poisson(1 + + k ).
Dmonstration. En utilisant la fonction gnratrice des probabilits, on a
P N (z) = E [z N ]
= E [z N1 ++Nk ]
= E [z N1 . . . z Nk ]
= E [z N1 ] . . . E [z Nk ]
=

k
Y

P Ni (z)
i =1
(z1)(1 ++k )

=e
do N Poisson(1 + . . . + k ).

258

Modles de frquence
De manire similaire, le thorme suivant tablit que la distribution de Poisson
est infiniment divisible.
Thorme 7.2. Si on dcompose lensemble des sinistres en m catgories possibles
P
de probabilits respectives q 1 , . . . , q m ( m
i =1 q i = 1) et si Ni est le nombre de sinistres
dans la catgorie i , alors si N Poisson(), les variables alatoires N1 , . . . , Nm sont
indpendantes et telles que Ni Poisson(q i ), i = 1, . . . , m.
Dmonstration. On trouve dabord la distribution des variables alatoires Ni , i =
1, . . . , m. Pour N = n fix, on a Ni |N = n Binomiale(n, q i ). Ainsi, la distribution
conjointe est
N1 , . . . , Nm |N = n Multinomiale(n, q 1 , . . . , q m ).
On a alors
Pr[Ni = n i ] =

Pr[Ni = n i |N = n]Pr[N = n]

n=n i

n=n i

!
n
n ni
nn i e
q (1 q i )
ni i
n!

ni

e q i
ni !

X
n=n i

n i

1
(1 q i )nni n
(n n i )!

nn i (1 q )nn i
X
i
(n

n
i )!
n=n i

(q i ) e
ni !

[(1 q )] j
(q i )ni e X
i
ni !
j
!
j =0

(q i )ni e (1qi )
e
ni !

(q i )ni e qi
,
ni !

do Ni Poisson(q i ).
De plus,
Pr[N1 = n 1 , . . . , Nm = n m ] = Pr[N1 = n 1 , . . . , Nm = n m |N = n]Pr[N = n]

n
n!
nm e
n1
q qm
=
n ! nm ! 1
n!
1
!
!
n 1 q 1
(q 1 ) e
(q m )nm ! e p m
=

.
n1 !
nm !

7.2. Principales distributions discrtes

259

Ainsi, la distribution conjointe est le produit des distributions marginales et, par
consquent, les variables alatoires N1 , . . . , Nm sont stochastiquement indpendantes.
Exemple 7.1. Soit un portefeuille dassurance automobile pour lequel la frquence
des sinistres a une distribution de Poisson de moyenne 1 000. On value que 65 %
des accidents sont causs par des jeunes conducteurs et que 35 % des accidents
sont causs par les conducteurs plus ags. (Il faut noter, ici, que cela ne signifie pas
que le portefeuille contient 65 % de jeunes conducteurs et 35 % de conducteurs
plus vieux.)
Par le thorme prcdent, on a donc les modles suivants pour la distributions des sinistres du portefeuille global (N ), des jeunes conducteurs (N J ) et des
conducteurs plus ags (NV ) :
N Poisson(1 000)
N J Poisson(650)
NV Poisson(350).

7.2.2

Binomiale ngative

La fonction de masse de probabilit de la loi binomiale ngative avec paramtres r > 0 et 0 1 est
Pr[N = k] =

(r + k)
r (1 )k ,
(k + 1)(r )

k = 0, 1, . . .

Si le paramtre de forme r est entier, alors la binomiale ngative sinterprte comme


la distribution du nombre dchecs avant dobtenir r succs dans une srie dexpriences de Bernoulli avec probabilit de succs . On a alors

!
k +r 1
(r + k)
=
.
(k + 1)(r )
r 1

La queue de la distribution binomiale ngative est passablement lourde lorsque


r < 1.
La distribution a galement la proprit souvent souhaitable davoir une variance suprieure son esprance. En effet,
E [N ] =

r (1 ) r (1 )

= Var[N ] ,

260

Modles de frquence
avec galit dans le cas peu intressant o = 1.
La distribution binomiale ngative cultive des liens troits avec la distribution
gamma. En effet, la premire est lanalogue discret de la seconde (voir la distribution gomtrique, plus bas). De plus, la binomiale ngative rsulte dun mlange
(continu) entre une distribution de Poisson et la gamma.

7.2.3

Gomtrique

La distribution gomtrique est un cas spcial de la binomiale ngative avec


r = 1. On a donc
Pr[N = k] = (1 )k , k = 0, 1, . . .
Elle sinterprte comme la distribution du nombre dchecs avant le premier succs
dans une suite dexpriences de Bernoulli.
La distribution gomtrique est lanalogue discret de la distribution exponentielle. En effet, soit X une variable alatoire distribue selon une loi exponentielle de
moyenne 1/. Le support de la variable alatoire [X ] (o [ ] reprsente la fonction
partie entire) est lensemble des nombres naturels. De plus,
Pr[[X ] = x] = Pr[x X < x + 1]
Z x+1
=
e y d y
x

= F X (x + 1) F X (x)
= e x e (x+1)
= e x (1 e )
= (1 )x ,
avec = 1 e . Ainsi, la partie entire dune loi exponentielle est une loi gomtrique. On peut en dduire le lien semblable entre les lois gamma et binomiale
ngative.

7.2.4

Binomiale

La binomiale de paramtres n = 0, 1, . . . et 0 1 est la distribution du


nombre de succs parmi n expriences de Bernoulli. La fonction de masse de
probabilit est
!
n k
Pr[N = k] =
(1 )nk , k = 0, 1, . . . , n.
k
La loi binomiale convient rarement pour la distribution du nombre de sinistres
dans un portefeuille puisque son support est fini. De plus, elle tend rapidement vers

7.3. Estimation et tests

261

une normale lorsque n augmente. Enfin, on note que son esprance est suprieure
sa variance. En effet,
E [N ] = n > n(1 ) = Var[N ].

7.3

Estimation et tests

Lestimation des paramtres des lois discrtes nest pas trs diffrent de celle des
lois continues. On utile principalement les mthodes des moments et du maximum
de vraisemblance. ce propos, pour les lois discrtes, la fonction de vraisemblance
reprsente rellement la probabilit dobserver un chantillon donn.
Pour lestimation, on dispose dun chantillon de la variable alatoire N qui
peut tre soit le nombre de sinistres dun portefeuille pour plusieurs priodes, soit
les nombres de sinistres de plusieurs portefeuilles sur une priode. On pose que n
est la taille de lchantillon. Il faut faire attention, car n ne reprsente pas le nombre
total de sinistres.
Soit n k le nombre de fois o la valeur k apparat. On a donc

n=

nk

k=0

P
et le nombre total de sinistres est
kn k .
k=0
On notera que pour la distribution binomiale, le paramtre n est gnralement
considr connu. Il est donc rare quil fasse lobjet dune procdure destimation.
Quant ladquation entre des modles de frquence et les donnes, elle est
gnralement mesure avec le test du khi carr de Pearson. En effet, celui-ci se
prte tout naturellement lexercice puisquil compare des frquences observes
et modlises. De plus, le test de Kolmogorov-Smirnov nest valide que pour des
distributions continues.

Exemple 7.2. Un assureur a enregistr les 30 catastrophes les plus coteuses de


1970 1995 compiles dans le tableau 7.1. Les annes absentes du tableau sont des
annes o aucune catastrophe ne fut enregistre. On souhaite ajuster une distribution de Poisson ces donnes par la mthode du maximum de vraisemblance.
Tout dabord, la fonction de vraisemblance est
L() =

Y
k=0

pk k

!
k e n k
Y
=
k!
k=0

262

Modles de frquence

Anne

Frquence

Anne

Frquence

Anne

Frquence

1970
1973
1974
1976
1979

1
1
2
1
1

1980
1983
1988
1989
1990

1
2
2
3
3

1991
1992
1993
1994
1995

3
2
3
1
4

TAB. 7.1: Frquence des catastrophes les plus coteuses, 19701995

alors que la fonction de log-vraisemblance est


l () =
=

n k ln(p k )

k=0

n k (k ln() ln(k!) ) .

k=0

En drivant lune ou lautre de ces fonctions, on obtient aisment lestimateur du


maximum de vraisemblance du paramtre :

1 X
=
kn k .
n k=0

Ici, on a n = 26 observations (les annes de 1970 1995, inclusivement) rparties ainsi : n 0 = 11, n 1 = 6, n 2 = 4, n 3 = 4, n 4 = 1 et n k = 0 pour tout k 5. Par
consquent,
30
= .
26
Notre modle pour la frquence annuelle des catastrophes coteuses est donc
N Poisson(30/26).
Pour vrifier ladquation entre ce modle et les donnes, on utilise le test du
khi carr. On rappelle que pour que ce test soit valide, la frquence de chaque
classe devrait tre suprieure 5. Pour ce faire, nous regroupons les valeurs 2, 3 et
4.
Soit

k e
pk =
k!
la probabilit dobserver la valeur k selon le modle et n pk la frquence espre de
cette valeur dans un chantillon de taille n. Le tableau 7.2 prsente les rsultats des
calculs ncessaires pour effectuer le test du khi carr. On a alors

7.4. Familles (a, b, 0) et (a, b, 1)

263

pk

n pk

nk

0
1
2+

0,3154
0,3639
0,3297

8,20
9,46
8,34

11
6
9

TAB. 7.2: Quantits ncessaires pour le test du khi carr de lexemple 7.2

Loi
Poisson
Binomiale
Binomiale Ngative
Gomtrique

p0

0
/(1 )
1
1

(n + 1)/(1 )
(r 1)(1 )
0

e
(1 )n
r

TAB. 7.3: Paramtres des membres de la famille (a, b, 0)

(11 8,20)2 (6 9,46)2 (9 8,34)2


+
+
8,20
9,46
8,34
= 2,2738.

Q=

La statistique du test a une distribution khi carr avec 3 1 1 = 1 degr de libert.


Le 95e centile dune loi 2 (1) tant 3,8415, on ne rejette pas le modle.

7.4

Familles (a, b, 0) et (a, b, 1)

Soit N une variable alatoire discrte avec une distribution quelconque et,
comme prcdemment, Pr[N = k] = p k . On dit que la distribution de N est membre
de la famille (ou classe) (a, b, 0) sil est possible de trouver deux constantes a et b
telles que
pk
b
= a + , k = 1, 2, 3, . . . ,
p k1
k
avec
p0 = 1

pk .

k=1

On peut dmontrer que les seuls membres de cette famille sont les distributions
binomiale, binomiale ngative, gomtrique et de Poisson. Le tableau 7.3 prsente
les valeurs des paramtres a, b et p 0 pour ces lois.

264

Modles de frquence
On peut rcrire la relation liant les probabilits successives des membres de la
famille (a, b, 0) sous la forme
k

pk
= ak + b,
p k1

k = 1, 2, . . .

On remarque que la partie de droite de cette galit est lquation dune droite de
pente a et dordonne lorigine b. Or, du tableau 7.3, cette pente est nulle pour
une distribution de Poisson, ngative pour une distribution binomiale et positive
pour une distribution binomiale ngative. Cela suggre une procdure graphique
pour choisir quelle distribution devrait tre utilise pour modliser la frquence : il
sagit de dterminer la pente dun graphique de
k

pk
nk
=k
pk1
n k1

en fonction de k.
Un peu plus gnralement, on dit que la distribution de N est membre de la
famille (ou classe) (a, b, 1) sil est possible de trouver deux constantes a et b telles
que
pk
b
= a + , k = 2, 3, . . .
p k1
k
On remarque que la relation rcursive dbute cette fois k = 2 plutt qu k = 1. La
valeur de p 0 est donc quelconque.
Les rapports entre les probabilits successives des membres de cette famille
sont les mmes que ceux des membres de la famille (a, b, 0). Le comportement des
distributions est donc similaire. En revanche, la probabilit zro diffre et permet
une plus grande flexibilit. Si p 0 = 0, on dit que la distribution est zro tronque.
Il peut tre trs utile dans certaines applications de pouvoir exclure la possibilit
de ne pas avoir de sinistres. Lorsque p 0 > 0 (et que la probabilit est diffrente de la
valeur correspondante du tableau 7.3), on dit que la distribution est modifie
zro.
Les sections 6.5 et 6.6 de Klugman et collab. (2012a) offrent plus de dtails sur
les familles (a, b, 0) et (a, b, 1) ainsi que des exemples utiles pour mieux comprendre
le mcanisme de rcursivit.

7.5

Exercices

7.1 Un assureur dcide de modliser la frquence des sinistres par une distribution
N Binomiale(m, ) dont le paramtre m est connu.
a) Dmontrer que lestimateur du maximum de vraisemblance de est sans
biais.

7.5. Exercices

265

b) Dterminer directement la variance de cet estimateur.


c) Dterminer la variance de cet estimateur en calculant linformation de
Fisher.
d) Dterminer un intervalle de confiance approximatif de niveau 1 pour la
paramtre .
7.2 Un portefeuille de la compagnie Great Big Company comptant 10 000 risques a
produit les frquences de sinistres prsentes dans le tableau ci-dessous.
Frquence

Nombre de risques

0
1
2
3
4+

9 048
905
45
2
0

a) Dterminer lestimateur du maximum de vraisemblance du paramtre


dune loi de Poisson ainsi quun intervalle de confiance de niveau 95 % pour
ce paramtre.
b) Soit une distribution gomtrique de paramtre = (1 )/, cest--dire
que
Pr[N = k] =

k
( + 1)k+1

k = 0, 1, . . .

Dterminer lestimateur du maximum de vraisemblance du paramtre


ainsi quun intervalle de confiance de niveau 95 % pour ce paramtre.
c) Dterminer les estimateurs de la mthode des moments des paramtres
dune distribution binomiale ngative avec fonction de masse de probabilit

!
k +r 1
k
Pr[N = k] =
,
r 1 ( + 1)k+r

k = 0, 1, . . .

d) Rpter la partie c) pour les estimateurs du maximum de vraisemblance en


utilisant une procdure numrique.
7.3 Un assureur offre un contrat couvrant les accidents automobiles causs par
des hommes et par des femmes. Linformation pour 1 000 polices est prsente
dans le tableau ci-dessous.

266

Modles de frquence

Frquence

Hommes

Femmes

0
1
2
3
4
5+

901
92
5
1
1
0

947
50
2
1
0
0

a) Dterminer lestimateur du maximum de vraisemblance du paramtre


dune loi de Poisson pour la variable N1 , le nombre de sinistres causs
par des hommes, et la variable N2 , le nombre de sinistres causs par des
femmes.
b) En supposant que N1 et N2 sont des variables indpendantes, dterminer
un modle pour N = N1 + N2 .
7.4 Le tableau ci-dessous prsente des donnes de frquence annuelle daccidents
pour un portefeuille dassurance automobile.
Frquence

Nombre de risques

0
1
2
3
4
5
6
7+

861
121
13
3
1
0
1
0

a) Ajuster une distribution Binomiale(7, ) ces donnes en estimant le paramtre par la mthode du maximum de vraisemblance.
b) Ajuster plutt une distribution binomiale ngative aux donnes par la mthode des moments. Utiliser la paramtrisation de lexercice 7.2 c)).
c) Rpter la partie b) en estimant plutt par la mthode du maximum de
vraisemblance.
7.5 Dmontrer que la distribution Binomiale ngative(r, ( + 1)1 ) est le rsultat
du mlange continu de distributions de Poisson suivant
N | = Poisson()
Gamma(r, ).

7.5. Exercices

267

7.6 Un assureur modlise la frquence des sinistres par une distribution Binomiale
ngative(3, 1/6). La svrit des sinistres est modlise par une distribution
Exponentielle(0,01). Si une franchise de 20 $ est ajoute au contrat, calculer
E [N ], lesprance de la frquence modifie.
7.7 Un portefeuille dassurance compte 1 000 contrats. Le tableau ci-dessous rsume linformation connue propos de la frquence des sinistres.
Nombre de sinistres

Nombre de contrats

0
1
2
3
4
5
6
7+

100
267
311
208
87
23
4
0

Parmi les distributions binomiale, Poisson, binomiale ngative, normale et


gamma, laquelle semble la plus approprie pour modliser ces donnes ?
7.8 Un assureur enregistre tous les jours dune anne (365 jours) le nombre de rclamations quil reoit. Les donnes recueillies sont prsentes dans le tableau
ci-dessous. Lassureur utilise une distribution de Poisson de moyenne 0,6 pour
modliser la variable alatoire du nombre quotidien de sinistres. Dterminer
la statistique de Pearson.
Nombre de sinistres

Nombre de jours

0
1
2
3
4
5

209
111
33
7
3
2

Exercices proposs dans Loss Models, 4e d.


6.1, 6.2, 6.3, 13.18, 13.19, 14.1, 14.2, 14.3, 14.6, 14.7, 14.8

268

Modles de frquence

Rponses
q
)/(mn)

7.1 a) (1 )/(nm) b) (1 )/(nm) c) z /2 (1


p
p
7.2 a) 0,1001 1,96 0,1001/10 000 b) 0,1001 1,96 0,1001(1,1001)/10 000 c) r =
55,67, = 0,0018 d) r = 52,73, = 0,1001

7.3 a) 1 = 0,109 et 2 = 0,057 b) N Poisson(0,166)


7.4 a) 0,0237 b) r = 0,4715, = 0,3521 c) r = 0,6561, = 0,166
7.6 12,28
7.7 Binomiale
7.8 2,85

A Paramtrisation des lois


de probabilit
Cette annexe prcise la paramtrisation des lois de probabilit continues et
discrtes utilise dans les noncs des exercices. Dans certains cas, elle est diffrente de celle prsente dans les annexes A et B de Klugman et collab. (2012a). En
particulier, nous utilisons toutes les distributions de la famille gamma transforme
avec un paramtre de taux () plutt quun paramtre dchelle (). De plus, lordre
des paramtres est diffrent.
En plus de la fonction de densit de probabilit et de la fonction de rpartition,
lannexe fournit les lments suivants pour chaque loi : la racine foo des fonctions
dfoo, pfoo, qfoo, rfoo, mfoo et levfoo telles que dfinies dans R et actuar ; les
noms des arguments de ces fonctions correspondant chacun des paramtres
de la loi ; le k e moment (ainsi que lesprance et la variance pour les cas les plus
usuels) ; lesprance limite (lois continues seulement) ; la fonction gnratrice des
moments M (t ), lorsquelle existe ; la fonction gnratrice des probabilits P (z) (lois
discrtes seulement).
Dans les formules ci-dessous,
Z x
1
(; x) =
t 1 e t d t , > 0, x > 0
() 0
avec
() =

t 1 e t d t

est la fonction gamma incomplte, alors que


(a, b; x) =

1
(a, b)

Z
0

avec
(a, b) =

t a1 (1 t )b1 d t ,

Z
0

a > 0, b > 0, 0 < x < 1

t a1 (1 t )b1 d t =
269

(a)(b)
(a + b)

270

Paramtrisation des lois de probabilit


est la fonction bta incomplte rgularise.
Sauf avis contraire, les paramtres sont strictement positifs et les fonctions sont
dfinies pour x > 0.

A.1
A.1.1

Famille bta transforme


Bta transforme (, , , )

Racine : trbeta, pearson6


Paramtres : shape1 (), shape2 (), shape3 (), rate ( = 1/), scale ()
f (x) =

u (1 u)
,
x(, )

u=

v
,
1+v

v=

F (x) = (, ; u)
k ( + k/)( k/)
, < k <
()()
( + 1/)( 1/)
E [X ; x] =
( + 1/, 1/; u) + x(1 F (x))
()()
E [X k ] =

A.1.2

Burr (, , )

Racine : burr
Paramtres : shape1 (), shape2 (), rate ( = 1/), scale ()
u (1 u)
,
x
F (x) = 1 u
f (x) =

u=

1
,
1+v

v=

k (1 + k/)( k/)
, < k <
()
(1 + 1/)( 1/)
(1 + 1/, 1/; u) + xu
E [X ; x] =
()
E [X k ] =

A.1.3

Burr inverse (, , )

Racine : invburr
Paramtres : shape1 (), shape2 (), rate ( = 1/), scale ()
u (1 u)
,
x
F (x) = u
f (x) =

u=

v
,
1+v

v=

A.1. Famille bta transforme

271

k ( + k/)(1 k/)
, < k <
()
( + 1/)(1 1/)
E [X ; x] =
( + 1/, 1 1/; u) + x(1 u )
()
E [X k ] =

A.1.4

Pareto gnralise (, , )

Racine : genpareto
Paramtres : shape1 (), shape2 (), rate ( = 1/), scale ()
f (x) =

u (1 u)
,
x(, )

u=

v
,
1+v

v=

F (x) = (, ; u)
k ( + k)( k)
, < k <
()()

E [X ] =
, >1
1
2 ( + 1)
Var[X ] =
, >2
( 1)2 ( 2)

E [X ; x] =
( + 1, 1; u) + x(1 F (x))
1
E [X k ] =

A.1.5

Pareto (, )

Racine : pareto, pareto2


Paramtres : shape (), scale ()
u (1 u)
,
x
F (x) = 1 u
f (x) =

u=

1
,
1+v

v=

k (k + 1)( k)
, 1 < k <
()

E [X ] =
, >1
1
2
Var[X ] =
, >2
( 1)2 ( 2)

1
, 6= 1

1
x +
E [X ; x] =

ln
,
=1
x +
E [X k ] =

272

Paramtrisation des lois de probabilit

A.1.6

Pareto inverse (, )

Racine : invpareto
Paramtres : shape (), scale ()
u (1 u)
,
x
F (x) = u

u=

f (x) =

v
,
1+v

v=

k ( + k)(1 k)
, < k < 1
()
Z u
y
E [X ; x] = k
d y + x(1 u )
0 1 y
E [X k ] =

A.1.7

Log-logistique (, )

Racine : llogis
Paramtres : shape (), rate ( = 1/), scale ()
u(1 u)
,
x
F (x) = u
f (x) =

u=

v
,
1+v

E [X k ] = k (1 + k/)(1 k/),

v=

< k <

E [X ; x] = (1 + 1/)(1 1/)(1 + 1/, 1 1/; u) + x(1 u)

A.1.8

Paralogistique (, )

Racine : paralogis
Paramtres : shape (), rate ( = 1/), scale ()
2 u (1 u)
,
x
F (x) = 1 u
f (x) =

u=

1
,
1+v

v=

k (1 + k/)( k/)
, 2 < k < 2
()
(1 + 1/)( 1/)
E [X ; x] =
(1 + 1/, 1/; u) + xu
()
E [X k ] =

A.1.9

Paralogistique inverse (, )

Racine : invparalogis
Paramtres : shape (), rate ( = 1/), scale ()

A.2. Famille gamma transforme


2 u (1 u)
,
x
F (x) = u
f (x) =

273

u=

v
,
1+v

v=

k ( + k/)(1 k/)
, 2 < k <
()
( + 1/)(1 1/)
E [X ; x] =
( + 1/, 1 1/; u) + x(1 u )
()
E [X k ] =

A.2
A.2.1

Famille gamma transforme


Gamma transforme (, , )

Racine : trgamma
Paramtres : shape1 (), shape2 (), rate (), scale ( = 1/)
u e u
,
x()
F (x) = (; u)
f (x) =

E [X k ] =

u = (x)

( + k/)

, k >
k ()
( + 1/)
E [X ; x] =
( + 1/; u) + x(1 (; u))
()

A.2.2

Gamma transforme inverse (, , )

Racine : invtrgamma
Paramtres : shape1 (), shape2 (), rate (), scale ( = 1/)
u e u
,
x()
F (x) = 1 (; u)
f (x) =

E [X k ] =

u = (x)

( k/)

, k <
k ()
( 1/)
E [X ; x] =
(1 ( 1/; u)) + x(; u)
()

A.2.3

Gamma (, )

Racine : gamma
Paramtres : shape (), rate (), scale ( = 1/)

274

Paramtrisation des lois de probabilit


u e u
,
x()
F (x) = (; u)
f (x) =

E [X k ] =

u = x

( + k)

, k >
k ()

E [X ] =

Var[X ] = 2

( + 1)
E [X ; x] =
( + 1; u) + x(1 (; u))
()

M (t ) =
t

A.2.4

Gamma inverse (, )

Racine : invgamma
Paramtres : shape (), rate (), scale ( = 1/)
u e u
,
u = (x)1
x()
F (x) = 1 (; u)
f (x) =

E [X k ] =

( k)

, k <
k ()
( 1)
E [X ; x] =
(1 ( + 1; u)) + x(; u)
()

A.2.5

Weibull (, )

Racine : weibull
Paramtres : shape (), scale ( = 1/)
ue u
,
x
F (x) = 1 e u
f (x) =

E [X k ] =

(1 + k/)

u = (x)

, k >
k
(1 + 1/)
E [X ; x] =
(1 + 1/; u) + xe u

A.2. Famille gamma transforme

A.2.6

275

Weibull inverse (, )

Racine : invweibull, lgompertz


Paramtres : shape (), rate (), scale ( = 1/)
ue u
,
x
F (x) = e u

u = (x)

f (x) =

E [X k ] =

(1 k/)

, k <
k
(1 1/)
E [X ; x] =
(1 (1 1/; u)) + x(1 e u )

A.2.7

Exponentielle ()

Racine : exp
Paramtre : rate ()
ue u
,
x
F (x) = 1 e u

u = x

f (x) =

E [X k ] =

(k + 1)
k

k > 1

1
Var[X ] = 2

1 e u
E [X ; x] =

M (t ) =
t
E [X ] =

A.2.8

Exponentielle inverse ()

Racine : invexp
Paramtres : rate (), scale ( = 1/)
ue u
,
x
F (x) = e u

u = (x)1

f (x) =

E [X k ] =

(1 k)
k

k <1

276

Paramtrisation des lois de probabilit

A.3
A.3.1

Autres distributions continues


Normale (, 2 )

Racine : norm
Paramtres : mean ( < < ), sd ()
n 1 x 2 o
1
f (x) = p
, < x <
exp
2

2
Z x
x
2
1
F (x) =
e y d y
, (x) = p

E [X ] =
Var[X ] = 2
M (t ) = e t +

2 2

A.3.2

t /2

Log-normale (, 2 )

Racine : lnorm
Paramtres : meanlog (), sdlog ()
n 1 ln x 2 o
1
f (x) = p
exp
2

2 x

ln x
F (x) =

E [X k ] = e k+k
E [X ] = e +

2 /2

/2

Var[X ] = e 2+ (e 1)
2

A.3.3

Log-gamma (, )

Racine : lgamma
Paramtres : shapelog (), ratelog ()

f (x) =

(ln x)1

x +1 ()
F (x) = (; ln x),

x >1
x >1

A.3. Autres distributions continues

277


E [X ] =
k


E [X ] =
1


2
Var[X ] =

2
1

E [X ; x] =
(; ( 1) ln x) + x(1 (; ln x))
1
k

A.3.4

Pareto translate (, )

Racine : pareto1
Paramtres : shape (), min ()

,
x >
x +1

F (x) = 1
,
x >
x
f (x) =

k
, k <
k

E [X ; x] =

1 ( 1)x 1
E [X k ] =

Cette loi est galement appele Pareto un paramtre. Seul est considr comme
un vritable paramtre de la distribution. Le paramtre est la borne infrieure du
support de la distribution et est en gnral considr connu.

A.3.5

Bta gnralise (, , , )

Racine : genbeta
Paramtres : shape1 (), shape2 (), shape3 (), rate ( = 1/), scale ()
f (x) =

u (1 u)1
,
x(, )

u=

0<x <

F (x) = (, ; u)
k ( + )( + k/)
, k >
()( + + k/)
( + )( + 1/)
E [X ; x] =
( + 1/, ; u) + x(1 (, ; u))
()( + + 1/)
E [X k ] =

278

Paramtrisation des lois de probabilit

A.3.6

Bta (, )

Racine : beta
Paramtres : shape1 (), shape2 ()
f (x) =

( + ) 1
x
(1 x)1 ,
()()

0<x <1

F (x) = (, ; x)
( + )( + k)
, k >
()( + + k)

E [X ] =
+

Var[X ] =
2
( + ) ( + + 1)
( + )( + 1)
( + 1, ; u) + x(1 (, ; x))
E [X ; x] =
()( + + 1)
E [X k ] =

A.4
A.4.1

Distributions discrtes de la famille (a, b, 0)


Binomiale (n, )

Racine : binom
Paramtres : size (n), prob ()
!
n x
Pr[X = x] =
(1 )nx ,
x

n entier, 0 < < 1, x = 0, 1, . . . , n

E [X ] = n
Var[X ] = n(1 )
M (t ) = (1 + e t )n
P (z) = (1 (z 1))n

A.4.2

Binomiale ngative (r, )

Racine : nbinom
Paramtres : size (r ), prob (), mu ( = r (1 )/)

!
x +r 1 r
Pr[X = x] =
(1 )x ,
r 1

0 < < 1, x = 0, 1, . . .

A.4. Distributions discrtes de la famille (a, b, 0)


r (1 )

r (1 )
Var[X ] =
2
r

M (t ) =
1 (1 )e t
E [X ] =

P (z) = (1 (1 )z)r

A.4.3

Gomtrique ()

Racine : nbinom
Paramtre : prob ()
Pr[X = x] = (1 )x ,

0 < < 1, x = 0, 1, . . .

1
Var[X ] = 2

E [X ] =

1 (1 )e t
P (z) = (1 (1 )z)1

M (t ) =

A.4.4

Poisson ()

Racine : pois
Paramtre : lambda ()
x e
,
x!
E [X ] =

Pr[X = x] =

Var[X ] =
M (t ) = e (e

1)

P (z) = e (z1)

x = 0, 1, . . .

279

B Installation de packages dans R


Plusieurs exercices de ce recueil requirent lutilisation du package actuar
(Dutang et collab., 2008). Le package doit tre install depuis le site Comprehensive
R Archive Network (CRAN ; http://cran.r-project.org). Cette annexe explique
comment configurer R pour faciliter linstallation et ladministration de packages
externes.
Les instructions ci-dessous sont centres autour de la cration dune bibliothque personnelle o seront installs les packages R tlchargs de CRAN. Il
est fortement recommand de crer une telle bibliothque. Cela permet dviter
dventuels problmes daccs en criture dans la bibliothque principale et de
conserver les packages intacts lors des mises jour de R. Nous montrons galement
comment spcifier le site miroir de CRAN pour viter davoir le rpter chaque
installation de package.
1. Identifier le dossier de dpart de lutilisateur. En cas dincertitude, examiner la
valeur de la variable denvironnement HOME 1 , depuis R avec la commande
> Sys.getenv("HOME")

ou, pour les utilisateurs de Emacs, directement depuis lditeur avec


M-x getenv RET HOME RET

Nous rfrerons ce dossier par le symbole ~.


2. Crer un dossier qui servira de bibliothque de packages personnelle. Dans la
suite, nous utiliserons ~/R/library.
3. Dans un fichier nomm ~/.Renviron (donc situ dans le dossier de dpart),
enregistrer la ligne approprie ci-dessous :
R_LIBS_USER="~/R/library
1. Pour les utilisateurs de GNU Emacs sous Windows, la variable est cre par lassistant dinstallation de Emacs lorsquelle nexiste pas dj.

281

282

Installation de packages dans R


Au besoin, remplacer le chemin ~/R/library par celui du dossier cr ltape
prcdente. Utiliser la barre oblique avant (/) dans le chemin pour sparer les
dossiers.
4. Dans un fichier nomm ~/.Rprofile, enregistrer loption suivante :
options(repos = "http://cran.ca.r-project.org")

Si dsir, remplacer la valeur de loption repos par lURL dun autre site miroir
de CRAN.
Les utilisateurs de GNU Emacs voudront ajouter une autre option. Le code
entrer dans le fichier ~/.Rprofile sera plutt
options(repos = "http://cran.ca.r-project.org",
menu.graphics = FALSE)

Consulter la rubriques daide de Startup pour les dtails sur la syntaxe et lemplacement des fichiers de configuration, celles de library et .libPaths pour la gestion
des bibliothques et celle de options pour les diffrentes options reconnues par R.
Aprs un redmarrage de R, la bibliothque personnelle aura prsance sur la
bibliothque principale et il ne sera plus ncessaire de prciser le site miroir de
CRAN lors de linstallation de packages. Ainsi, la simple commande
> install.packages("actuar")

tlchargera le package actuar depuis de le miroir canadien de CRAN et linstallera


dans le dossier ~/R/library. Pour charger le package en mmoire, on fera
> library("actuar")

On peut arriver au mme rsultat sans utiliser les fichiers de configuration


.Renviron et .Rprofile. Il faut cependant recourir aux arguments lib et repos

de la fonction install.packages et largument lib.loc de la fonction library.


Consulter les rubriques daide de ces deux fonctions pour de plus amples informations.

C Table de quantiles
de la loi normale
x

2
1
p e y /2 d y
2
(x) = 1 (x)

Pr[X x] = (x) =

(x)

(x)

(x)

0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
1,05

0,500
0,520
0,540
0,560
0,579
0,599
0,618
0,637
0,655
0,674
0,691
0,709
0,726
0,742
0,758
0,773
0,788
0,802
0,816
0,829
0,841
0,853

1,10
1,15
1,20
1,25
1,282
1,30
1,35
1,40
1,45
1,50
1,55
1,60
1,645
1,65
1,70
1,75
1,80
1,85
1,90
1,95
1,96
2,00

0,864
0,875
0,885
0,894
0,900
0,903
0,911
0,919
0,926
0,933
0,939
0,945
0,950
0,951
0,955
0,960
0,964
0,968
0,971
0,974
0,975
0,977

2,05
2,10
2,15
2,20
2,25
2,30
2,326
2,35
2,40
2,45
2,50
2,55
2,576
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
3,00

0,980
0,982
0,984
0,986
0,988
0,989
0,990
0,991
0,992
0,993
0,994
0,995
0,995
0,995
0,996
0,997
0,997
0,997
0,998
0,998
0,998
0,999

283

D Table de quantiles
de la loi khi carr
x

Pr[X x] =

1
(r /2)2r /2

y r /21 e r /2 d x

Pr[X x]
r

0,01

0,025

0,05

0,95

0,975

0,99

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

0,000
0,020
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633

0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907

0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117

3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144

5,024
7,378
9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852

6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191

suite page suivante

285

286

Table de quantiles de la loi khi carr

Pr[X x]
r

0,01

0,025

0,05

0,95

0,975

0,99

20
21
22
23
24
25
26
27
28
29
30

8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,953

9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791

10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493

31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773

34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,195
44,461
45,722
46,979

37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892

Solutions des exercices


Plusieurs solutions faisant appel R utilisent des fonctions des packages actuar
(Dutang et collab., 2008) et MASS (Venables et Ripley, 2002). On suppose donc que
les packages ont t chargs en mmoire avec
> library("actuar")
> library("MASS")

Chapitre 1
1.1 On a
lim

x0 2

1
2

et
1 x2 1

= .
x0 2
24 2
lim

En utilisant le thorme sandwich, on obtient donc directement


1 cos(x) 1
= .
x0
x2
2
lim

La figure E.1 prsente le graphique de la fonction et des deux bornes, ainsi que
le code R pour crer ce graphique.
1.2 Il suffit dappliquer la rgle de lHpital :
lim

x0 ln(x + 1)

= lim

d x/d x

x0 d ln(x + 1)/d x

1
x0 1/(x + 1)
= 1.
= lim

287

288

Solutions des exercices

> f <- function(x) (1 - cos(x))/(x^2)


> g <- function(x) 0.5 - x^2/24
> curve(f, from = -2, to = 2, lwd = 2)
> curve(g, add = TRUE, lty = 2)

0.35

0.40

f(x)

0.45

0.50

> abline(h = 0.5, lty = 2)

F IG . E.1: Fonction f (x) = (1 cos(x))/x 2 (trait plein) et les bornes y = 12 x 2 /24 et


y = 12 (traits briss)

Solutions des exercices

289

1.3 Il faut faire quelques modifications avant de pouvoir utiliser la rgle de lHpital. On passe dabord la forme logarithmique
y = (1 + x)1/x
ln(y) = ln(1 + x)1/x
=

ln(1 + x)
,
x

pour ensuite calculer la limite laide de la rgle de lHpital


d ln(1 + x)/d x
d x/d x
ln(1 + x)
= lim
x0
x
1/(1 + x)
= lim
x0
1
=1

lim ln(y) = lim

x0

x0

et enfin revenir la forme exponentielle


lim y = lim (1 + x)1/x

x0

x0
1

=e

= e.
1.4 a) On utilise la rgle de lHpital pour valuer
lim

x ln(x)

d x/d x

= lim

x d ln(x)/d x

= lim

x 1/x

= lim x
x

= .
Il est donc possible de conclure que le numrateur tend plus rapidement
vers linfini que le dnominateur, cest--dire que x tend plus rapidement
vers linfini que ln(x).
b) De manire similaire,
lim

x e x

= lim

d x/d x

x d e x /d x

= lim

x e x

= 0,

290

Solutions des exercices


do e x tend plus rapidement vers linfini que x.
1.5 a) On a f (x) = cos(x), f (0) = 1, f 0 (x) = sin(x), f 0 (0) = 0, f 00 (x) = cos(x),
f 00 (0) = 1, f 000 (x) = sin(x), f 000 (0) = 0, et ainsi de suite. On obtient donc
cos(x) = 1

x2 x4
+
...
2!
4!

b) On a f (x) = sin(x), f (0) = 0, f 0 (x) = cos(x), f 0 (0) = 1, f 00 (x) = sin(x),


f 00 (0) = 0, f 000 (x) = cos(x), f 000 (0) = 1, et ainsi de suite. On obtient donc
sin(x) = x

x3 x5
+
...
3!
5!

c) On obtient
i 2x2 i 3x3 i 4x4 i 5x5
+
+
+
+...
2!
3!
4!
5!
x2
x3 x4
x5
= 1+ix
i
+
+i
....
2!
3!
4!
5!

ei x = 1 + i x +

En regroupant les termes, on obtient

x3 x5
x2 x4
+
... +i x
+
...
ei x = 1
2!
4!
3!
5!

d) Des rsultats obtenus en a), b) et c), on a directement


e i x = cos(x) + i sin(x).
e) En posant x = dans le rsultat en d), on obtient
e i = cos() + i sin()
= 1 + i (0)
= 1.
1.6 Il faut dmontrer que la fonction F (x) est non dcroissante, que sa limite
droite est 1, que sa limite gauche est 0 et quelle est continue ( droite).
Clairement, on a limx F (x) = 0, et limx F (x) = 1. De plus,
F 0 (x) =

e x
> 0,
(1 + e x )2

qui implique que la fonction est non dcroissante.

Solutions des exercices

291

1.7 La fonction g (x) est clairement positive. Il faut dmontrer que lintgrale sur la
totalit du domaine de cette fonction est 1 :
Z
Z
f (x)
g (x) d x =
dx
x0
x 0 1 F (x 0 )
R
x f (x) d x
= 0
1 F (x 0 )
1 F (x 0 )
=
1 F (x 0 )
= 1.
1.8 On a
S(x) = Pr[X > x]
Z

dt
=
+1
x (t + )

=
.
x +
La figure E.2 prsente le graphique de cette fonction.
1.9 On a que Y = n X si, et seulement si, X = n Y . Ainsi,
Pr[Y = y] = Pr[X = n y]

!
n
=
p ny (1 p)n(ny)
ny
!
n
=
(1 p) y p ny , y = 0, 1, . . . ,
y
do Y Binomiale(n, 1 p).
1.10 a) On a Y = e X o X N (, 2 ). Par consquent,
F Y (x) = Pr[Y x]
= Pr[e X x]
= Pr[X ln x]
= F X (ln x)
et
f Y (x) = F Y0 (x)
1
= f X (ln x).
x

292

Solutions des exercices

> library(actuar)

0.6
0.2

0.4

S(x)

0.8

1.0

> curve(ppareto(x, shape = 2, scale = 3000, lower.tail = FALSE), from = 0, to = 5000, y

1000

2000

3000

4000

5000

F IG . E.2: Fonction de survie dune distribution Pareto(2, 3 000)

b) La fonction gnratrice des moments de X est M X (t ) = e t +

2 2

Var[Y ] = E [Y 2 ] E [Y ]2
= E [e 2X ] E [e X ]2
= M X (2) M X2 (1)
2

= e 2+2 e 2+

= e 2+ (e 1).
2

t /2

. On a

Solutions des exercices

293

1.11 On a

|x| 1
dx
2
1 + x
Z
Z 0
x 1
x 1
dx +
dx
=
2
2
0 1+x
1 + x
Z
2
x
=
dx
0 1 + x2
Z
2 a x
dx
= lim
a 0 1 + x 2
= lim ln(1 + a 2 )
Z

E [|X |] =

= .

1.12 On utilise la dfinition de lesprance :

E [g (X )] =

g (x)

x=0

e x
x!

(x + 1)g (x)

e x+1
.
(x + 1)!

e x+1
g (x)
=
x!
x=0

X
x=0

x +1
x +1

Il faut maintenant faire un glissement dindice et ajouter un terme pour


obtenir

X
e x
E g (X ) =
xg (x 1)
x!
x=1

X
x=0

xg (x 1)

e x
x!

= E [X g (X 1)].

1.13 Il suffit de remarquer que M + m = X + Y . Le rsultat dcoule ensuite directement par linarit de lesprance : E [M ] + E [m] = E [X ] + E [Y ].

294

Solutions des exercices


1.14 On utilise la technique de la fonction de rpartition :
F Y (y) = Pr[Y y]
= Pr[4X + 3 y]

y 3
= Pr X
4

y 3
= FX
4
= 1e

y3
4

La densit est alors


f Y (y) = F Y0 (y) =

7 7 (y3)
e 4
,
4

y > 3.

1.15 On utilise la technique de la fonction de rpartition :


F Y (y) = Pr[Y y]

= Pr X 3 y
h
i
1
= Pr X y 3
Z 1
1 y3 2
=
x dx
9 0
y
= .
27

On trouve donc que


f Y (y) = F Y0 (y) =

1
,
27

0 y 27.

1.16 Selon lnonc, X N (0,2 ) et Y = X 2 . Il faut voir que Y = X 2 nest pas une
transformation bijective ( une valeur de Y correspond plus dune valeur de
X ). On pose W = |X | et on trouve la densit de W laide de la technique de
la fonction de rpartition :
FW (w) = Pr[|X | w]
= Pr[w X w]
= F X (w) F X (w)

Solutions des exercices

295

et donc
f W (w) = f X (w) + f X (w)
2
2
2
= p e x /(2 ) .
2
On pose maintenant Y = W 2 = |X |2 = X 2 et on trouve la densit de Y par la
technique du changement de variable :

d 1/2
f Y (y) = f W (y 1/2 )
y
dy

1
= f W (y 1/2 ) p
2 y

2
1
y/(22 )
= p e
p
2 y
2
=

(22 )1/2
( 21 )

y 1/2 e y/(2

p
puisque ( 12 ). On a donc que Y Gamma( 12 , 12 2 ). De manire quivalente, on peut aussi poser X = Z , o Z N (0, 1), et utiliser le rsultat connu
que Z 2 2 (1) Gamma( 12 , 12 ).
1.17 Si X est une variable alatoire dont la distribution est symtrique autour du
point a, alors E [X ] = a. On a donc
3 = E [(X a)3 ]
Z
(x a)3 f (x) d x
=

Z a
Z
=
(x a)3 f (x) d x +

(x a)3 f (x) d x.

En faisant le changement de variable y = x a, on obtient


3 =
=

y 3 f (y + a) d y +
3

y 3 f (y + a) d y

y f (y + a) d y +

Z
0

y 3 f (y + a) d y

= 0,
puisque f (y + a) = f (y + a) par symtrie autour du point a. Par consquent,
1 = 3 /3/2
2 = 0.

296

Solutions des exercices


1.18 La distribution de la variable alatoire X est en fait une Exponentielle(1). Par
consquent, E [X ] = Var[X ] = 1 et
3 = E [(X 1)3 ]
Z
(x 1)3 e x d x
=
Z0
=
(x 3 3x 2 + 3x 1)e x d x
0

= (4) 3(3) + 3(2) (1)


= 3! 3! + 3 1
=2
en reconnaissant des lois gamma. Ainsi, on obtient 1 = 3 /3/2
2 = 2.
1.19 On trouve que 2 = 1/3, 4 = 1/5 et donc 2 = 4 /22 = 9/5. Comme 2 < 3, la
distribution a des queues moins lourdes que la distribution normale.
1.20 Par dfinition,
M X (t ) = E [e t X ]
Z c
2x t x
=
e dx
2
0 c
2
= 2 2 (c t e ct e ct + 1).
c t
1.21 Par le thorme central limite, on sait que X 1 N (, 2 /n) et X 2 N (, 2 /n).
Comme les deux variables alatoires sont indpendantes, X 1 X 2 N (0, 22 /n).
Ainsi,

h
/5
/5
i
X 1 X 2
Pr | X 1 X 2 | <
= Pr
< p
< p
p
5
/ n/2 / n/2 / n/2
r
r
1 n
1 n
= Pr
<Z <
,
5 2
5 2
p
p
o Z N (0, 1). On doit donc trouver une valeur de n tel que Pr[Z n/(5p 2)]
p
0,005. On trouve dans une table de quantiles de la loi normale que n/(5 2) =
2,576, et donc que n 332.
1.22 a) On a X i Gamma(25, 12 ). Or, une somme de n lois gamma indpendantes
P
de paramtres i et est une loi gamma de paramtres ni=1 i et . Par
P
consquent, ni=1 X i Gamma(2 500, 12 ) et X Gamma(2 500, 50).
b) On obtient avec R

Solutions des exercices

297

> diff(pgamma(c(49, 51), 2500, 50))


[1] 0.6827218

c) Pour obtenir une approximation de la probabilit en b), on peut utiliser


le Thorme central limite. On a que E [ X ] = 2 500/50 = 50 et Var[ X ] =
2 500502 = 1. Par consquent,
Pr[49 < X < 51] = Pr

49 50 X 50 51 50
<
<
1
1
1

Pr[1 < Z < 1]


= (1) (1)
= 2(1) 1
= 0,6826,
o Z N (0, 1).
1.23 Par dfinition, le biais est

b () = E []

= 749 500

2(1 000)2
1 000 2

(2)(1)
2

= 500.
Lerreur quadratique moyenne est
= Var[]
+ b ()2
MSE()

= 750 + (500)2
= 250 750.
1.24 a) Par linarit de lesprance,
"

n
X

ai X i =

i =1

n
X
i =1
n
X

a i E [X i ]
ai

i =1
n
X

i =1

= .

ai

298

Solutions des exercices


b) tant donn que les variables sont indpendantes, on a
"

Var

n
X

ai X i =

n
X
i =1

i =1

= 2

a i2 Var[X i ]
n
X

i =1

Il faut donc minimiser

Pn

2
i =1 a i

n
X
i =1

a i2

a i2 .

sous la contrainte

Pn

i =1 a i

= 1. Or,

1
1 2
=
ai
+
n
n
i =1

2
n
X
1
1
=
ai
+ ,
n
n
i =1
n
X

P
tant donn que le produit crois vaut 0. Ainsi, lexpression ni=1 a i2 est
minimise en choisissant a i = 1/n pour tout i . Par consquent,

X =

n 1
X
Xi
i =1 n

possde la plus petite variance parmi tous les estimateurs sans biais linaires.
1.25 On a
#
n
n
1X
1X
2
(X i ) =
E [(X i )2 ]
E
n i =1
n i =1
"

n
1X
2
n i =1

= 2 .
1.26 En utilisant la dfinition de lesprance, on obtient
1

E [T (X )] = 0 + 0 + (2)
= .
2

1.27 Soit Var[X ] = et

X
X

=n
1
.
n
n

Solutions des exercices

299

On a
2

= E [X ] E [X ]
E []
n
np(1 p) + (np)2
= np
n
= np p(1 p) np 2
= np(1 p) p(1 p)
= p(1 p).
Par consquent, est un estimateur de avec un biais de p(1 p).
1.28 On sait que
Var[ X ] =

Var[X ]
= .
n
n

De plus,

X 2
ln f (X ; )
=E

1
= 2 Var[X ]

1
= .

La borne de RaoCramr est donc


= Var X .
n

Comme la variance de lestimateur est gale la borne de RaoCramr, son


efficacit vaut 1 et de X est un estimateur sans biais variance minimale du
paramtre dune loi de Poisson.
1.29 Dabord, on cherche un estimateur sans biais :
E [ Z ] = E [X ] + E [Y ]
= 0,8z + z
= z,
do = 1 0,8. Ensuite, on cherche un estimateur avec une variance minimale :
Var[ Z ] = 2 Var[X ] + 2 Var[Y ]
= 2 z 2 + 2 (1,5)z 2
= (2 + 1,5(1 0,8)2 )z 2 .

300

Solutions des exercices


Cette dernire expression est minimise lorsque 2 + 1,5(1 0,8)2 est minimis, cest--dire, lorsque = 0,6122. On trouve ensuite que = 0,5102.
1.30 a) On a
f (x; ) =

1 1/1
x
(1 x)11 ,

0 < x < 1, > 0,

soit une distribution bta de paramtres = 1/ et = 1.


b) On a ln f (x i ; ) = ( 1 1) ln x i ln et, donc,
`() =

n
X
1
1
ln x i n ln .

i =1

Par consquent,
d
`() =
d

Pn

i =1 ln x i
2

P
et = n 1 ni=1 ln x i .

c) On a
n Z 1 1
1X

E [] =
(ln x i )x i1/1 d x i
n i =1 0

Z 1
n
1X
1/
1
1/1
=
x ln x|0
xi
d xi
n i =1
0
n
1X
=
()
n i =1

= .

Chapitre 2
2.1 La franchise permet lassureur dconomiser au plus 250 $ par contrat. Lassureur conomise donc, pour les 12 contrats de son portefeuille,
250, 110, 250, 213, 98, 250, 250, 162, 131, 250, 250, 250,
pour un total de 2 464 $. Le montant total des sinistres sans la franchise est de
4 982 $. Le rapport dlimination de perte est donc
LER =

2 464
= 0,4946.
4 982

Solutions des exercices

301

2.2 La limite permet lassureur dconomiser lexcdent de 100 000 $ par contrat.
Lassureur conomise donc, pour les huit contrats de son portefeuille,
0, 23 000, 323 000, 0, 113 000, 0, 0, 78 000,
pour un total de 537 000 $. Le montant total des sinistres sans la limite est de
1 146 000 $. Le rapport dlimination de perte est donc
LER =

537 000
= 0,4686.
1 146 000

2.3 a) Soit X Exponentielle(0,02) la variable alatoire du montant dun sinistre


et soit Y , la variable alatoire du montant conomis par lassureur. On
dfinit
(
X , X 10
Y =
0, X > 10.
Le rapport dlimination de perte est
LER =
=

E [Y ]
E [X ]
R 10
0 x f X (x) d x

50
0,87616
=
50
= 0,0175.
b) Avec une franchise forfaitaire, on a plutt
(
X , X 10
Y =
10, X > 10.
Le rapport dlimination de perte est
LER =
=

E [Y ]
E [X ]
R 10
R
0 x f X (x) d x + 10 10 f X (x) d x

E [X ; 10]
=
E [X ]
9,0634
=
50
= 0,1813.

E [X ]

302

Solutions des exercices


Il est normal que ce ratio soit suprieur celui en a) puisque lassureur
ne rembourse que la partie du montant du sinistre excdent la franchise
forfaitaire, et non le montant au complet.
2.4 Soit X Gamma(4, 0,1), la variable alatoire du montant dun sinistre et soit Y ,
la variable alatoire du montant conomis par lassureur. On dfinit
Y =

(
0,

X 100

X 100,

X > 100.

Le rapport dlimination de perte est


LER =
=

E [Y ]
E [X ]
R
100 (x 100) f X (x) d x
E [X ]

0,138
=
40
= 0,0034.
Il est galement possible de rcrire la variable alatoire comme tant
(

Y =

X X,

X 100

X 100,

X > 100.

Il est alors ais de calculer le rapport dlimination de perte comme suit :


E [Y ]
E [X ]
E [X ] E [X ; 100]
=
E [X ]
E [X ] (40)(5; 10) (100)(1 (4; 10))
.
=
40

LER =

Comme la valeur de est entire, on peut utiliser


(; y) = 1

1
X
j =0

y j e y
j!

pour obtenir
LER =

40 39,862
= 0,0034.
40

Solutions des exercices

303

2.5 Il est dit dans la question que lassureur limite ses paiements 200, la limite est donc de 270. En introduisant dabord la limite, lassureur conomise,
respectivement,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 90, 130,
pour un total de 220. En introduisant ensuite la franchise, lassureur conomise
en plus, respectivement,
20, 50, 70, 70, 70, 70, 70, 70, 70, 70, 70, 70,
pour un total de 770. Le montant total des sinistres sans la limite et la franchise
est de 1 745. Le rapport dlimination de perte est donc
LER =

770 + 220
= 0,567.
1 745

2.6 On trouve dabord


R 100

LERd =100 =

x f X (x) d x +

100 100 f X (x) d x

E [X ]

E [X ; 100]
E [X ]
E [X ; 100]
=
2 000
= 0,0465

do lon trouve que E [X ; 100] = 93. Soit Y , la variable alatoire du montant


pargn par lassureur. On dfinit

X 100

X ,
Y =

100,
100 < X 30 000

X 30 000 + 100, X > 30 000,

ou, de manire quivalente,


Y = X min(X , 30 000) + min(X , 100)

X 100

X X + X ,
=

Ainsi,
LER =

X X + 100,
100 < X 30 000

X 30 000 + 100, X > 30 000.


E [X ] E [X ; 30 000] + E [X ; 100]
= 0,226.
E [X ]

304

Solutions des exercices


2.7 a) Il faut voir que la densit donne peut scrire comme une combinaison
linaire de deux distributions exponentielles :
f X (x) = e 2x +

e x
2

1
1
= (2e 2x ) + e x .
2
2
Lesprance limite est donc, en utilisant les formules pour lesprance
limite dune exponentielle,


1 1
1
2d
E [X ; d ] =
(1 e
)+
(1)(1 e d )
2 2
2

1 e 2d 1 e d
+
.
4
2

b) Il faut dabord valuer la svrit moyenne. Soit Y , la variable alatoire du


montant pay par lassureur, on a
(

Y =

0,

X 0,25

X 0,25, X > 0,25,

ou encore
Y = max(X 0,25, 0)
= X min(X , 0,25)
(
X X,
X 0,25
=
X 0,25, X > 0,25.
partir de cette reprsentation, il est facile de voir que
E [Y ] = E [X ] E [X ; 0,25]

1 1
3 e 0,5 2e 0,25
=
+
4 2
4
= 0,541.
Lesprance de la svrit est de un sinistre tous les dix ans, donc de 0,1.
Ainsi, la prime pure est
= (0,541)(0,1) = 0,0541.

Solutions des exercices

305

c) Soit Z = 1,05X , la variable alatoire du montant de sinistre aprs inflation.


On a
F Z (x) = F X (x/1,05)
1
1
= (1 e (2/1,05)x ) + (1 e 1/1,05x ).
2
2
Le calcul de lesprance de la svrit est donc
E [Y ] = E [Z ] E [Z ; 0,25]
= 0,7875 0,2107
= 0,576.
La prime pure est alors
= (0,576)(0,1) = 0,0576.
2.8 a) Pour le rassureur, il sagit dune franchise de 50 000. Soit Y , la variable
alatoire du montant pay par le rassureur. On a
Y =

(
0,

X 50 000,

X 50 000
X > 50 000,

ou encore
Y = max(X 50 000, 0)
= X min(X , 50 000)
(
X X,
X 50 000
=
X 50 000, X > 50 000
partir de cette reprsentation, il est facile de voir que
E [Y ] = E [X ] E [X ; 50 000]
= 1 091,09.
b) Soit Y la variable alatoire du montant conomis par le rassureur. On
dfinit
(
X,
X 100 000

Y =
100 000, X > 100 000.

306

Solutions des exercices


On trouve alors que
E [Y ] = E [X ; 100 000]
= 4 219,13.
De plus, on a

1
2 500
=
1,5 1
= 5 000.

E [X ] =

Le rapport dlimination de perte est donc


LER =

4 219,13
= 0,8438.
5 000

2.9 On sait que Y P = X d |X > d et que


f Y P (x) =

f X (x + d )
,
1 F X (d )

x > 0.

On a donc
E [Y P ] =
=
=
=
=

Z
1
x f X (x + d ) d x
1 F X (d ) 0
Z
1
(y d ) f X (y) d y
1 F X (d ) d

Z
1
y f X (y) d y d (1 F (d ))
1 F X (d ) d
Z

Z d
1
y f X (y) d y
y f X (y) d y d (1 F (d ))
1 F X (d ) 0
0
E [X ] E [X ; d ]
1 F X (d )

par dfinition de lesprance limite. Le numrateur reprsente le montant


moyen des sinistres au-dessus de la franchise d , alors que la prsence du
dnominateur sinterprte comme la slection des seuls sinistres dpassant la
franchise.
2.10 Pour chaque cas, la fonction coverage du package actuar retourne une fonction pour calculer ou tracer la densit modifie. Voir la figure E.3 pour les
graphique demands. On a superpos, sur chaque graphique, la densit de la
distribution sans la modification la densit modifie. Le code R pour crer
ces graphiques est le suivant :

307

0.00 0.02 0.04 0.06 0.08 0.10

Solutions des exercices

0.00

0.00

0.04

0.10

0.08

0.20

10

20

30

40

50

(a) Franchise forfaitaire de 10

10

20

30

40

50

(b) Franchise atteinte de 10 et


limite de 40

10

20

30

40

50

(c) Coassurance de 80 %

F IG . E.3: Graphiques de lexercice 2.10. Le trait pais reprsente la variable alatoire


modifie et le trait mince la variable alatoire de base.

a) > f <- coverage(dweibull, pweibull, deductible = 10, per.loss = TRUE)


> curve(dweibull(x, 3, 15), from = 0, to = 50,
+

ylim = c(0, f(0, 3, 15)))

> curve(f(x, 3, 15), from = 0.01, add = TRUE, lwd = 3)


> points(0, f(0, 3, 15), pch = 16, lwd = 3)

b) > f <- coverage(dweibull, pweibull, deductible = 10, limit = 40,


+

franchise = TRUE)

> curve(f(x, 3, 15), from = 10.01, to = 39.99, xlim = c(0, 50),


+

lwd = 3)

> points(40, f(40, 3, 15), pch = 16, lwd = 3)


> curve(dweibull(x, 3, 15), add = TRUE, lty = 2)

c) > f <- coverage(dweibull, pweibull, coins = 0.8)


> curve(f(x, 3, 15), from = 0, to = 50)
> curve(dweibull(x, 3, 15), add = TRUE, lty = 2)

2.11 a) On a X Pareto(1,5, 1 500). En 1995, la variable alatoire est, aprs inflation,


X 1995 = (1,05)2 (1,06)3 X 1990
= (1,3131)X 1990 ,
et donc X 1995 Pareto(1,5, 1 5001,3131). Lesprance limite est E [X 1995 ; 500] =
421,3. Lesprance du montant dun sinistre en 1995 est donc, avant la franchise,
1 969,65
E [X 1995 ] =
= 3 939,3
1,5 1

308

Solutions des exercices


et aprs la franchise

E [X 1995
] = E [X 1995 ] E [X 1995 ; 500]

= 3 939,3 421,3
= 3 518.
Enfin, le rapport dlimination de perte est
LER =

3 939,3 3 518
= 0,1069.
3 939,3

b) Soit N , la variable alatoire reprsentant le nombre de paiements. On


cherche,
Pr(X 1995 500 > 2 000|N = 1)
= Pr(X 1995 500 > 2 000|X 1995 > 500)
Pr(X 1995 500 > 2 000, X 1995 > 500)
Pr(X 1995 > 500)
Pr(X 1995 500 > 2 000)
=
Pr(X 1995 > 500)

= 0,4107.
c) La nouvelle variable alatoire est

0,

Y =

X 1995 500

X 1995 500, 500 < X 1995 4 000

4 000 500, X
1995 > 4 000,

ou encore,
Y = max(min(X 1995 , 4 000) 500, 0)
= min(X 1995 , 4 000) min(X 1995 , 500)

X 1995 X 1995 , X 1995 500

X 1995 500,

4 000 500,

500 < X 1995 4 000


X 1995 > 4 000,

do
E [Y ] = E [X 1995 ; 4 000] E [X 1995 ; 500]
= 1 255,23.

Solutions des exercices

309

2.12 a) On veut calculer


E [X ; u] = e

+2 /2

ln(u) 2
ln(u)

+u 1

avec u = 300 000, = 9,356 et = 1,596. On obtient


E [X ; 300 000] = (41 340,92)(0,671413) + (300 000)(1 0,9793)
= 33 962.
b) Soit Y , le montant pay par sinistre aprs inflation. On a
d
E [Y ] = (1 + r )E X ;
1+r

= (1,1)E [X ; 272 727,272]


= (1,1)(33 356)
= 36 692.
Puisque 36 692/33 962 = 1,0804, cela reprsente une augmentation des
cots de 8,04 %.
c) Soit Y la variable alatoire du montant pay par sinistre suite lintroduction dune franchise de 1 000 $. On a
E [Y ] = E [X ; 300 000] E [X ; 1 000]
= 33 962 973,92
= 32 988,38.
Puisque 32 988,38/33 962 = 0,9713, lintroduction de la franchise entrane
une baisse des cots de 2,87 % par rapport la situation en a).
2.13 Soit Y P la variable alatoire du montant pay par paiement par le rassureur.
On a Y P = X |X > , donc
f X (x + )
1 F X ()
/(x + + )+1
=
/( + )
( + )
=
, x > 0,
(x + ( + ))+1

f Y P (x) =

do Y P Pareto(, + ).

310

Solutions des exercices


2.14 Soit X la variable alatoire du montant dun sinistre et Y P = X d |X > d , la
variable alatoire du montant pay par paiement avec une franchise forfaitaire d . Or, la distribution exponentielle tant sans mmoire, on a, de manire
gnrale,
Pr[Y P > x] =
=

Pr[X > x + d ]
Pr[X > d ]
(x+d )
e

e d
=e
,
x

do Y P Exponentielle(). Ici, on a donc Pr[Y P > 0,5] = e 3(0,5) = 0,22.


2.15 On a
E A [Y S ] = E [X ] E [X ; 5 000]
= 11 100 E [X ; 5 000]
= 6 500,
do E [X ; 5 000] = 4 600. De mme,
E [X ] E [X ; 5 000]
1 F (5 000)
6 500
=
1 F (5 000)
= 10 000,

E A [Y P ] =

do F (5 000) = 0,35. Enfin, on cherche


E B [Y P |X 5 000] = E [X |X 5 000]
R 5 000
x f (x) d x
= 0
F (5 000)
E [X ; 5 000] (5 000)(1 F (5 000))
=
F (5 000)
= 3 857.
2.16 Lesprance de la frquence annuelle des sinistres est r (1 )/ = 15. Pour
quil y ait un paiement, le montant du sinistre doit tre suprieur la franchise.
Or
0,3
Pr[X > 200] = e (200/1 000) = 0,5395.
Ainsi, 53,95 % des sinistres occasionneront un paiement, do le nombre
espr de paiements par annes est (15)(0,5395) = 8,0925.

Solutions des exercices

311

2.17 a) Le rsultat dcoule directement de la redfinition de la variable alatoire


Y S comme suit :
Y S = max(min(X , u) d , 0)
= (min(X , u) min(X , d ))

X X , X < d
= X d,

u d ,

d X <u
X u.

b) Pour calculer le second moment de la variable alatoire Y S , on crit


dabord

X d

0,
(Y S )2 =

2 (X 2 2d X + d 2 ), d < X < u

2 (u 2 2ud + d 2 ), X u

2
2
2

(X X 2d X + 2d X ), X d
2 (X 2 d 2 2d X + 2d d ),

2 (u 2 d 2 2d u + 2d d ),

d <X <u
X u.

On a alors
E [(Y S )2 ] = 2 (E [X 2 ; u 2 ] E [X 2 ; d 2 ] 2d E [X ; u] + 2d E [X ; d ]).
La variance est donc
Var[Y S ] = E [(Y S )2 ] E [Y S ]2
= 2 (E [X 2 ; u 2 ] E [X 2 ; d 2 ] 2d E [X ; u] + 2d E [X ; d ])
2 (E [X ; u] E [X ; d ])2 .
c) Suite une inflation de 100r %, la dfinition de la variable alatoire Y S
quivalente celle utilise en a) est

d
u
min X ,
Y S = (1 + r ) min X ,
1+r
1+r

X < d /(1 + r )

X X ,
= (1 + r ) X d /(1 + r ),
d /(1 + r ) X < u/(1 + r )

u/(1 + r ) d /(1 + r ), X u/(1 + r ).

On obtient donc directement


h

u i
d
E [Y S ] = (1 + r ) E X ;
E X;
.
1+r
1+r

312

Solutions des exercices


2.18 On remarquera que la relation est un cas spcial du rsultat de lexercice 2.17
avec = 1 et r = 0. On a

X <d

0,
YS=

X d, d X < u

u d , X u.

Par consquent,
E [Y S ] = (0)Pr[X < d ] +

y f Y S (y) d y + (u d )(1 F X (u))

ud

ud

y f Y S (y) d y + (u d )(1 F X (u)).

En faisant le changement de variable x = y + d dans lintgrale, on obtient


Z u
E [Y S ] =
(x d ) f X (x) d x + (u d )(1 F X (u))
Z

d
u
0

(x d ) f X (x) d x

(x d ) f X (x) d x

+ (u d )(1 F X (u))
Z u
Z
=
x f X (x) d x d F X (u)
0

d
0

x f X (x) d x + d F X (d )

+ (u d )(1 F X (u))
Z
Z u
x f X (x) d x + u(1 F X (u))
=
0

d
0

x f X (x) d x d (1 F X (d ))

= E [X ; u] E [X ; d ].
2.19 Lorsquil y a bonus, son montant est

0,75 S/600 000


450 000 S
600 000
=
.
3
3
Il y aura donc un bonus si L < 450 000. On a donc

1
450 000 S
B = max 0,
= 150 000 min(S, 450 000),
3
3
do
1
E [S; 450 000]
3
1
= 150 000 (220 321,36)
3
= 76 559,55.

E [B ] = 150 000

Solutions des exercices

313

2.20 a) Lorsquun sinistre de montant d < x d survient, lassureur rembourse


un montant d (x d )/(d d ). On a donc

d
(X d ), d < X d
P
Y = d d

X,
X > d .
b) Pour pouvoir valuer lesprance, il est plus facile de rcrire la variable
sous la forme

d
d
P

Y =X+
min(X , d )
min(X , d ) X > d
d d
d d


d
d

X +
X
d, d < X d

d d
d d
=

d
d

d
d , X > d .
X +
d d
d d
Par la dfinition de lesprance limite ou en utilisant le rsultat de lexercice 2.9,
on obtient directement
E [Y P ] =

E [X ] + d E [X ; d ]/(d d ) d E [X ; d ]/(d d )
.
1 F X (d )

Chapitre 3
3.1 a) On peut calculer puis tracer la fonction de rpartition empirique aisment
avec la fonction ecdf de R ; voir la figure E.4. Quant la fonction de masse
de probabilit empirique, la faon la plus simple de la calculer est partir
de la fonction table ; voir la figure E.5.
b) Il faut dabord dterminer le nombre de donnes dans chacune des classes.
On a n 1 = 4, n 2 = 10, n 3 = 2 et n 4 = 4. Lquation de logive est alors

0,
x 2

(x 2)/25,
2<x 7

(x 5)/10,
7 < x 12
F20 (x) =

(x + 58)/100, 12 < x 22

(x + 42)/80, 22 < x 38

1,
x > 38
Les fonctions grouped.data et ogive de actuar permettent, dans lordre,
de dfinir un objet de donnes groupes et de calculer son ogive ; voir la
figure E.6.

314

Solutions des exercices

> x <- c(3, 5, 5, 6, 8, 8, 8, 8, 9, 10, 10,


+

11, 11, 11, 16, 21, 23, 26, 29, 36)

> Fn <- ecdf(x)


> plot(Fn)

1.0

ecdf(x)

0.8

0.6

Fn(x)

0.4

0.2

0.0

10

20

30

40

F IG . E.4: Fonction de rpartition empirique des donnes de lexercice 3.1

Solutions des exercices

315

> table(x)
x
3

9 10 11 16 21 23 26 29 36

> fn <- table(x)/length(x)

fn

> plot(unique(x), fn, type = "h", lwd = 4)

10

15

20

25

30

35

unique(x)

F IG . E.5: Fonction de masse de probabilit empirique des donnes de lexercice 3.1

316

Solutions des exercices

> xg <- grouped.data(Group = c(2, 7, 12, 22, 38),


+

Frequency = c(4, 10, 2, 4))

> Gn <- ogive(xg)


> plot(Gn)

1.0

ogive(xg)

0.8

0.0

0.2

0.4

F(x)

0.6

10

15

20

25

30

35

F IG . E.6: Ogive des donnes groupes de lexercice 3.1

Solutions des exercices

317

> hist(x)

4
0

Frequency

Histogram of x

10

20

30

40

F IG . E.7: Histogramme des donnes groupes de lexercice 3.1

c) Lquation de lhistogramme est, en drivant logive obtenue en b),

0,

1/25,

1/10,
f20 (x) =
1/100,

1/80,

0,

x 2
2<x 7
7 < x 12
12 < x 22
22 < x 38
x > 38.

Le package actuar dfinit une mthode de la fonction hist pour les donnes groupes ; voir la figure E.7.

318

Solutions des exercices


3.2 partir de linformation du tableau et de la dfinition de logive, on a
36 0,40x
+
n
n
36 x 0,60y
0,51 =
+ +
n n
n
n = 200 + x + y.
0,21 =

En rsolvant, on obtient x = 120.


3.3 En utilisant les informations du tableau et la dfinition de logive, on obtient
0,689 = (0,5)F500 (1 000) + (0,5)F500 (2 000)

200 + 110 310 + x


+
,
= (0,5)
500
500
do lon trouve que x = 69 et
0,839 = (0,5)F500 (2 000) + (0,5)F500 (5 000)

310 + 69 379 + y
,
= (0,5)
+
500
500
do lon trouve que y = 81.
3.4 Les donnes sont entres dans R avec
> (x <- grouped.data(Group = 1000 * c(0, 1, 3, 5, 10, 25, 50, 100, Inf),
+
Frequency = c(16, 22, 25, 18, 10, 5, 3, 1)))
Group Frequency
1

(0,

1000]

16

(1000,

3000]

22

(3000,

5000]

25

(5000, 10000]

18

(10000, 25000]

10

(25000, 50000]

7 (50000, 100000]

8 (100000,

Inf]

Pour calculer logive de ces donnes, la borne infinie de la dernire classe doit
tre remplace par une valeur trs grande par rapport aux autres bornes. Il
ne faut pas que cette valeur soit trop grande si on veut avoir un graphique
intressant. Il ne faut pas supprimer la dernire classe. La figure E.8 prsente
les ogives avec 200 000 et 2 000 000 comme dernire borne. On cherche
Pr[2 000 X 6 000] = F 100 (6 000) F 100 (2 000).
Or,

Solutions des exercices

319

> x[8, 1] <- c(100000, 200000)

> x[8, 1] <- c(100000, 2000000)

> Gn <- ogive(x)

> Gn <- ogive(x)

> plot(Gn)

> plot(Gn)

1.0

0.0

0.4

0.2

0.4

F(x)

50000

150000
x

(a) c r = 200 000

0.8

0.2

0.6

0.0

F(x)

0.8

ogive(x)

0.6

1.0

ogive(x)

500000

1500000
x

(b) c r = 2 000 000

F IG . E.8: Ogive des donnes de lexercice 3.4 avec diffrentes dernires bornes

> Gn <- ogive(x)


> Gn(c(2000, 6000))
[1] 0.270 0.666

do Pr[2 000 X 6 000] = 0,396.


3.5 Comme seulement une donne est plus petite ou gale 150, la fonction
de rpartition empirique est F 5 (150) = 1/5 = 0,20. Pour lestimateur liss, on
regarde la contribution de chacune des donnes au point 150, t j (150) :

x le noyau autour de 80 va de 30 130, la donne 80 contribue donc 100 % ;


x le noyau autour de 153 va de 103 203, la donne 153 contribue donc
(150 103) % = 47 % ;

x le noyau autour de 162 va de 112 212, la donne 162 contribue donc


(150 112) % = 38 % ;

x les deux autres donnes ne contribuent pas.

Density

0.010
0.000

Density

100

200

300

0.000 0.002 0.004 0.006

Solutions des exercices

0.020

320

400

100

N = 1 Bandwidth = 20

150

200

250

300

350

N = 4 Bandwidth = 20

(a) Noyaux individuels

(b) Somme pondre

F IG . E.9: Estimation par noyaux triangulaires et largeur de bande de 50 des donnes


de lexercice 3.6

Lestimateur liss est donc


F (150) =

5
X

f 5 (y j )t j (150)

j =1

= (0,20)(1) + (0,20)(0,47) + (0,20)(0,38) + 0 + 0


= 0,37.
Ainsi, |F 5 (150) F (150)| = |0,20 0,37| = 0,17.
3.6 a) tant donn que la distribution est symtrique, la moyenne sera le point
central, cest--dire
150 +

300 150
= 225.
2

b) La figure E.9(a) prsente les quatre noyaux (quatre densits) sur le mme
graphique et la figure E.9(b) prsente leur somme pondre, cest--dire
f(x).
3.7 La figure E.10 prsente la distribution empirique des donnes.
a) On voit que pour une largeur de bande de 0,5, aucune donne ne va contribuer la densit au point 6,2.

321

fn

Solutions des exercices

10

unique(x)

F IG . E.10: Distribution empirique des donnes de lexercice 3.7

b) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer la


densit au point 6,2 :
0,1
f(6,2) =
= 0,05.
(2)(1)
c) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contribuer la densit au point 6,2 :
0,3
0,1
0,1
f(6,2) =
+
+
= 0,125.
(2)(2) (2)(2) (2)(2)
d) Pour une largeur de bande de 3, il y a cinq valeurs, 4, 5, 7, 8 et 9 qui vont
contribuer la densit au point 6,2 :
0,2
0,3
0,1
0,1
0,1
f(6,2) =
+
+
+
+
= 0,13333.
(2)(3) (2)(3) (2)(3) (2)(3) (2)(3)

322

Solutions des exercices


e) On voit que pour une largeur de bande de 0,5, aucune donne ne va contribuer la densit au point 6,2.
f) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer la
densit au point 6,2 :

1
6,2 7 + 1

f (6,2) =
= 0,02.
10
(1)2
g) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contribuer la densit au point 6,2 :

1
6,2 7 + 2
1
6,2 8 + 2
f(6,2) =
+
10
(2)2
10
(2)2

3
6,2 + 5 + 2
+
10
(2)2
= 0,095.
3.8 On utilise lquation dun estimateur avec noyaux triangulaires :

1/5
1/5

f (5) =
(5 (6 a)) +
(5 (4 + a))
a2
a2
= 0,01.
En simplifiant, on trouve 0,05a 2 2a + 2 = 0 et, en choisissant la bonne racine,
a = 1,0263.
3.9 On entre les donnes individuelles de lexercice dans R avec
> x <- c(2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3,
+

4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 8, 8, 9, 15,

17, 22, 23, 24, 24, 25, 27, 32, 43)

et les donnes sous forme groupe avec


> xg <- grouped.data(Group = c(1.5, 2.5, 6.5, 29.5, 49.5),
+

Frequency = c(12, 15, 11, 2))

a) La figure E.11 prsente la fonction de rpartition empirique des donnes,


obtenue laide de la fonction ecdf.
b) La figure figure E.11 prsente galement logive des donnes, obtenue avec
la fonction ogive du package actuar. On voit que logive et la fonction de
rpartition empirique correspondent gnralement bien. Autour du point
x = 22, lajustement pourrait tre un peu meilleur, par exemple en ajoutant

Solutions des exercices

323

> Fn <- ecdf(x)


> Gn <- ogive(xg)
> plot(Fn, pch = 16)
> lines(knots(Gn), Gn(knots(Gn)), type = "o",
+

pch = 21, bg = "white", lty = 2)

1.0

ecdf(x)

0.8

0.6

Fn(x)

0.4

0.0

0.2

10

20

30

40

F IG . E.11: Fonction de rpartition empirique (lignes et points pleins) et ogive (lignes


brises et points vides) des donnes de lexercice 3.9

324

Solutions des exercices


> hist(xg)

0.15
0.00

0.05

0.10

Density

0.20

0.25

0.30

Histogram of xg

10

20

30

40

50

xg

F IG . E.12: Histogramme des donnes de lexercice 3.9

une classe. Pour les deux bornes extrmes, 0 aurait peut-tre t un peu
plus intuitif comme choix de borne infrieure que 1,5. La borne suprieure
est logique, car suprieure la valeur maximale de lchantillon, mais est
totalement arbitraire sinon (on aurait pu choisir, par exemple, 50).
c) La figure E.12 prsente lhistogramme des donnes cr partir de lobjet
de donnes groupes.
d) On a simplement
> mean(x)
[1] 9.225
> sd(x)
[1] 10.23691

Solutions des exercices

325

3.10 Tout dabord, on a F 10 (4) = 0,40, E [F 10 (4)] = F (4), et Var[F 10 (4)] = F (4)(1
F (4))/10. En utilisant le Thorme central limite, on peut poser que

F 10 (4) E [F 10 (4)]
Pr 1,96 p
1,96 0,95,
Var[F 10 (4)]

soit
#
p
10(F 10 (4) F (4))
1,96 0,95.
Pr 1,96 p
F (4)(1 F (4))
"

En estimant le dnominateur par


F (4), on trouve

p
p
F 10 (4)(1 F 10 (4)) = 0,24 puis en isolant

F
(4)(1

F
(4))
10
10

F (4) F 10 (4) 1,96


10
!

r
0,24
0,4 (1,96)
10
s

(0,0964, 0,7036).
3.11 En utilisant lquation de lestimateur de Nelsonalen, on obtient
3 10 11
+
+
52 40 19
= 0,8866.

Hn (1 200) =

On trouve maintenant la valeur de la fonction de survie value au point


1 200,
200) = e 0,8866 = 0,4120,
S(1
et finalement la valeur de la fonction de rpartition value ce mme point :
F (1 200) = 1 0,4120 = 0,5880.

326

Solutions des exercices

yi

(10 000 y i )/(6 000)

Hn

1 000
3 400
4 500
7 500
15 000
17 500

1,5000
1,1000
0,9167
0,4167
0,8333
1,2500

0,0
0,0
0,5
0,5
0,5
0,0

0,0500
0,0526
0,0556
0,0588
0,0625
0,0667

TAB. E.1: Rsultats intermdiaires du calcul de lestimation par noyaux pour les
donnes de lexercice 3.12
3.12 a) En utilisant lquation de lestimateur de Nelsonalen, on trouve
1
20
= 0,0500
1
1
+
Hn (3 400) =
20 19
= 0,1026
1
1
1
Hn (4 500) =
+
+
20 19 18
= 0,1582
1
1
1
1
Hn (7 500) =
+
+
+
20 19 18 17
= 0,2170
1
1
1
1
1
Hn (15 000) =
+
+
+
+
20 19 18 17 16
= 0,2795
1
1
1
1
1
1
Hn (17 500) =
+
+
+
+
+
20 19 18 17 16 15
= 0,3462.
Hn (1 000) =

b) Le tableau E.1 prsente les rsultats intermdiaires. Lestimation est donc

h(10
000) =
(0,5)(0,0556 + 0,0588 + 0,0625)
6 000
= 0,00001449.
3.13 On a
1 =

3
.
3

Solutions des exercices

327

En entrant les donnes dans R, on peut calculer les troisime et deuxime


moment centraux facilement :
> x <- 1000 * c(rep(2, 2), rep(4, 6), rep(6, 12), rep(8, 10))
> (m <- mean(x))
[1] 6000
> mean((x - m)^3)
[1] -3.2e+09
> mean((x - m)^2)
[1] 3200000

On a donc
1 =

3 200 000 000

3 200 0003/2
= 0,559.

La distribution des donnes est donc asymtrique vers la gauche ou, de


manire quivalente, la bosse se trouve droite.
3.14 tant donn que la distribution empirique est symtrique, lestimateur du
coefficient dasymtrie est 0. En entrant les donnes dans R, on peut calculer
les quatrime et deuxime moment centraux facilement :
> x <- c(100, rep(200, 4), rep(300, 10), rep(400, 4), 500)
> (m <- mean(x))
[1] 300
> mean((x - m)^4)
[1] 2e+08
> mean((x - m)^2)
[1] 8000

On a donc
4
4

200 000 000


=
8 0002
= 3,125.

2 =

La distribution empirique des donnes sapproche donc de celle dune loi


normale.

328

Solutions des exercices


3.15 a) On a (n + 1)p = (20 + 1)(0,60) = 12,6, do
0,60 = 0,4x (12) + 0,6x (13)
= (0,4)(38) + (0,6)(39)
= 38,6.
b) On a (n + 1)p = (20 + 1)(0,75) = 15,75, do
0,75 = 0,25x (15) + 0,75x (16)
= (0,25)(41) + (0,75)(43)
= 42,5.
3.16 Par dfinition,
320

E [min(X , 320)] =

x f X (x) d x + 320(1 F X (320)).

En supposant que les donnes sont uniformment distribues lintrieur


des classes, la moyenne de celles-ci est affecte au point milieu. la classe
(200, 320], on attribue un nombre de donnes proportionnel la longueur de
leur classe par rapport la classe (200, 500], soit (120/300)(24) = (0,4)(24) = 9,6
donnes. On a au total n = 100 donnes. On a donc

50 + 0
20
100 + 50
34
+
2
100
2
100

22
320 + 200 9,6
200 + 100
+
+
2
100
2
100

24 9,6
+ 320
100

E 100 [min(X , 320)] =

= 5 + 25,5 + 33 + 24,96 + 46,08


= 134,54.
On peut vrifier ce rsultat laide de la fonction elev de actuar :
> x <- grouped.data(Classe = c(0, 50, 100, 200, 500),
+
> elev(x)(320)
[1] 134.54

Frequence = c(20, 34, 22, 24))

Solutions des exercices

329

3.17 tant donn que lintervalle est petit, on peut en calculer le niveau de confiance
exactement. En utilisant la loi binomiale avec paramtres n = 5 et p = 0,5, on
obtient
!
3
X
5
Pr[X (2) 0,5 < X (4) ] =
(0,5)k (0,5)5k
k
k=2
= 0,625.
3.18 tant donn que lintervalle est grand, on va utiliser lapproximation normale
avec correction pour la continuit pour dterminer le niveau de confiance.
On a, avec Y N (250, 125),
Pr[240 0,50 < 260] Pr[239,5 K < 259,5]
= (0,85) (0,94)
= 0,6287.
3.19 La valeur 10 est la 10e statistique dordre et la valeur 20 est la 14e statistique
dordre. Comme lintervalle est petit, on peut en calculer le degr de confiance
exactement. Soit N Binomiale(20, 0,55),
Pr[X (10) 0,55 < X (14) ] = Pr[N = 10, 11, 12, 13]
!
13 20
X
=
(0,55)k (0,45)20k
k
k=10
= 0,1593 + 0,1771 + 0,1623 + 0,1221
= 0,6208.
3.20 a) On obtient aisment
1
f Y (ln(x))
x

=
(ln(x))1 e ln(x) ,
()x

f X (x) =

x > 1.

On remarque que comme Y est dfinie sur [0, ), X = e Y est dfinie sur
[1, ). Cette distribution est la log-gamma de paramtres et .
b) La fonction R de la figure E.13 calcule le biais empirique pour des valeurs
de , n et r donnes. On remarquera que cette fonction dfinit une fonction interne qui se charge des tapes 2 et 3 de lalgorithme prsent dans
lexpos de lexercice. Cette fonction est ensuite passe replicate pour
raliser efficacement ltape 4 de lalgorithme.

330

Solutions des exercices

sim <- function(lambda, n, r)


{
## Fonction interne pour simuler un chantillon
## et calculer l'estimateur.
f <- function(lambda, n)
{
## Simulation des donnes. On pourrait aussi
## utiliser la fonction rlgamma() du package
## actuar.
x <- exp(rgamma(n, shape = 1, rate = lambda))
## Estimateur de lambda
1 / (1 - 1/mean(x))
}
## Simulation de 'r' chantillons
lc <- replicate(r, f(lambda, n))
## La fonction retourne une liste contenant le
## vecteur d'estimateurs et le biais empirique.
list(estimates = lc,
bias = mean(lc) - lambda)
}

F IG . E.13: Fonction R permettant la cration des chantillons et le calcul du biais


empirique

Solutions des exercices


i) Pour n = 10 et r = 1 000 on a
> simul.1 <- sim(5, 10, 1000)
> simul.1$bias
[1] 0.7635874

ii) Pour n = 1 000 et r = 100 on a


> simul.2 <- sim(5, 1000, 100)
> simul.2$bias
[1] -0.003825851

iii) Pour n = 1 000 et r = 1 000 on a


> simul.3 <- sim(5, 1000, 1000)
> simul.3$bias
[1] 0.0001300101

La taille de lchantillon a un impact sur le biais de lestimateur. On voit


quau passage dun petit chantillon (partie i)) un plus grand (partie ii))
le biais devient moins important et lestimateur est donc plus proche de
sa vraie valeur. En revanche, le nombre de simulation na un impact que
sur la force de la conclusion. De la partie ii) la partie iii), seul le nombre
de simulations change. Or, le biais change assez peu. Nous ne sommes
que conforts dans notre conclusion que lestimateur est probablement
sans biais pour .
c) On a un chantillon de 100 estimations. La figure E.14 prsente le gra
phique de la fonction de rpartition empirique de lestimateur .
Tel que
d) La figure E.15 prsente lhistogramme et logive de lestimateur .
suggr dans lnonc de lexercice, on a utilis les classes calcules par la
fonction hist pour construire logive. On a procd ainsi :
> gn <- hist(x, plot = FALSE)
> xg <- grouped.data(cj = gn$breaks, nj = gn$counts)
> Gn <- ogive(xg)

e) Comme il y a 100 donnes dans lchantillon, on a (101)(0,45) = 45,45 et


donc
0,45 = (0,55)x (45) + (0,45)x (46) .
Pour le 70e centile, la procdure est la mme. On a (101)(0,70) = 70,7 et
donc
0,70 = (0,30)x (70) + (0,70)x (71) .
Pour notre chantillon, on obtient

331

332

Solutions des exercices


> x <- simul.2$estimates
> Fn <- ecdf(x)
> plot(Fn, do.points = FALSE)

0.0

0.2

0.4

Fn(x)

0.6

0.8

1.0

ecdf(x)

4.8

5.0

5.2

5.4

F IG . E.14: Fonction de rpartition empirique de lestimateur de lexercice 3.20

> xs <- sort(x)


> 0.55 * xs[44] + 0.45 * xs[45]
[1] 4.959905

et
> 0.30 * xs[70] + 0.70 * xs[71]
[1] 5.068952

Plus simplement, on peut utiliser la mthode pour donnes groupes de


la fonction quantile dfinie dans actuar pour calculer les quantiles lisss
(soit linverse de logive) :
> quantile(xg, c(0.45, 0.7))

Solutions des exercices

333

> hist(x, prob = TRUE)

> plot(Gn)
ogive(xg)
1.0

3.0

Histogram of x

0.8
0.6

0.4

F(x)

2.0

0.2

1.0

Density

0.0

0.0

4.6

4.8

5.0

5.2

5.4

4.6

4.8

5.0

5.2

5.4

(a) Histogramme

(b) Ogive

F IG . E.15: Histogramme et ogive de lestimateur de lexercice 3.20

45%

70%

4.972414 5.068000

Les rsultats diffrent lgrement parce que la technique de lissage utilis


par quantile nest pas tout fait la mme que celle utilise ci-dessus.

Chapitre 4
4.1 En utilisant la technique de la fonction de rpartition, on a
F Y (y) = Pr[Y y]
= Pr[c X y]
= Pr[X y/c]
= F X (y/c)

= 1
+ y/c

c
= 1
c + y
et donc, Y Pareto(, c).

334

Solutions des exercices


4.2 En utilisant la technique de la fonction de rpartition, on a
F Y (y) = Pr[Y y]
= Pr[X ln(y)]
= F X (ln(y)).
tant donn la prsence de la valeur absolue dans la densit de X , il faut
sparer le domaine. Pour < x 0, on a 0 < y < 1, et donc
ln(y)

F X (ln(y)) =

1 x
e dx
2

1
= e ln(y)/ .
2
Pour 0 < x < , on a 1 < y < , et donc
0

1 x/
e dx +
2
1 ln(y)
= 1 e .
2
Z

F X (ln(y)) =

ln(y)

Z
0

1 x/
dx
e
2

Par consquent,
(

F (y) =

1 ln(y)/
,
2e
1 ln(y)/
,
1 2 e

0<y <1
y 1.

4.3 En utilisant le fait que, pour entier, () = ( 1)!, on trouve


Z x
1
t 1 e t / d t
( 1)! 0

x Z x
1
1
t /
2
t /
=
t
e
( 1)t
e
dt
+
0
( 1)!
0
Z x
x 1 e x/
1
=
+
t 2 e t / d t
( 1)!1 ( 2)!1 0
Z x
1
= Pr[Y = 1] +
t 2 e t / d t
( 2)!1 0

Pr[X x] =

avec Y Poisson(x/). La relation sobtient en continuant intgrer comme


ci-dessus jusqu obtenir
Pr[X x] = 1 Pr[Y = 1] Pr[Y = 0]
= Pr[Y ].

Solutions des exercices

335

4.4 En utilisant la technique de la fonction de rpartition, on a

y
F Y (y) = F X
1 y

y/(1 y)
= , ;
y/(1 y) +
= (, ; y),
o (a, b; x) est la fonction de rpartition dune distribution Bta(a, b) value
au point x. On a donc que Y Bta(, ).
4.5 En utilisant la technique de la fonction de rpartition, on obtient
F Y (y) = Pr[Y y]
= Pr[5X 1/4 y]

y 4
= Pr X >
5
y 4
= 1 FX
5

1
=
1 + (5/y)4
qui est la fonction de rpartition dune variable alatoire avec distribution Burr
inverse de paramtres = , = 4 et = 5.
4.6 a) Par dfinition, la distribution de Y est nomme log-gamma. On remarque
que comme X est dfinie sur [0, ), Y = e X est dfinie sur [1, ). On a donc
1
f X (ln(y))
y

=
(ln(y))1 e ln(y) ,
()y

f Y (y) =

y 1.

b) En utilisant la fonction gnratrice des moments de X , on trouve


E [Y ] = E [e X ]
= M X (1)


=
,
1

>1

E [Y 2 ] = E [e 2X ]
= M X (2)


=
,
2

> 2,

336

Solutions des exercices


do
Var[Y ] = E [Y 2 ] E [Y ]2


2
=

,
2
1

> 2.

c) De la partie b), on voit que


E [Y k ] = M X (k)


=
,
k

> k.

Les moments de Y existent donc seulement pour k < .


4.7 a) Il suffit de poser c = 1 + i dans le rsultat de lexercice 4.1.
b) En utilisant la technique de la fonction de rpartition, on trouve
y
1+i

(1 + i )
= 1
(1 + i ) + y

F Y (y) = F X

et donc, Y Burr(, , (1 + i )).


c) On a
x
1
fX
1+i
1+i
1 (ln(y/(1 + i )))1
=
1 + i () (y/(1 + i ))+1

f Y (y) =

(1 + i )) (ln(y) ln(1 + i ))1

()y +1

4.8 En utilisant la technique de la fonction de rpartition, on a


F Y (y) = F X (y )

= 1
+ y
et donc, Y Burr(, , 1/ ).

Solutions des exercices

337

4.9 En utilisant la technique de la fonction de rpartition, on a


F Y (y) = Pr[Y y]
= Pr[ln(1 + X /) y]
= Pr[X (e y 1)]
= F X ((e y 1))

= 1
+ (e y 1)
= 1 e y ,

y 0.

Ainsi, Y Exponentielle().
4.10 Soit Y , la variable alatoire du montant des sinistres en 2007. On dfinit
Y = (1,04)(1,045)(1,16)X
= 1,260688X .
En se reportant lexercice 4.7 b), on a que Y Burr( = 0,5, = 2, = 3,7821)
et donc que
Pr[Y > 4] = 1 F Y (4) = 0,6870.
4.11 a) On observe que la variable alatoire X obit une distribution Pareto
translate(3, 1). En utilisant la technique de la fonction de rpartition, on
trouve

y
F Y (y) = F X
1,10

1,10 3
= 1
.
y

b) On a Pr[Y > 2,2] = 1 F Y (2,2) = 0,125.


4.12 On a X | Binomiale(10, ) et Uniforme(0, 1). Par la loi des probabilits
totales,
Z 1

!
10 x
Pr[X = x] =
(1 )10x d
x
0
!Z
1
10
=
x (1 )10x d
x 0

338

Solutions des exercices


qui devient, en reconnaissant sous lintgrale la forme fonctionnelle dune
distribution Bta(x + 1, 11 x),

!
10 (x + 1)(11 x)
Pr[X = x] =
x
(12)

10!
x!(10 x)!
(10 x)!x!
11!
1
= .
11
=

Par consquent,
Pr[X > 6] =

10
X

Pr[X = i ]

i =7

4
.
11

4.13 Par la loi des probabilits totales, on trouve


Z x 1 ! 1 !
e
x
e

d
f X (x) =
()
()
0
Z
x 1
+1 e (x+) d
=
()() 0
qui devient, en reconnaissant sous lintgrale la forme fonctionnelle dune
distribution Gamma( + , x + )
f X (x) =

x 1 ( + )
()()(x + )+

et donc, X Pareto Gnralise(, , ).


4.14 On a
1

Pr[X = x] =

(1 )x1

( + )
=
()()

Z
0

( + ) 1

(1 )1 d
()()

(1 )x+2 d

qui devient, en reconnaissant sous lintgrale une distribution Bta( + 1, +


x 1),
( + )( + 1)(x + 1)
Pr[X = x] =
.
()()( + + x)

Solutions des exercices

339

4.15 Par la loi des probabilits totales, on obtient

f X (x) =

x 1 e x

x 1 e x
d
()

Z
x 1 (x +)
=
e
d
()
0
x 1
,
=
( + x )+1

en reconnaissant une distribution Gamma( + 1, x + ) sous lintgrale. La


densit obtenue est celle dune loi Burr(, , 1/ ).
4.16 On a X | Burr(5, 1, ) et Gamma(10, 2). On cherche E [X ] et Var[X ].
Il ne faut pas tenter de trouver la distribution marginale de X , mais plutt
conditionner :

E [X ] = E [E [X |]]

(4)(2)
=E
(5)
1
= E []
4
5
=
4
et

Var[X ] = E [Var[X |]] + Var[E [X |]]


2

(3)(3)
(4)(2) 2
(4)(2)
=E

+ Var
(5)
(5)
(5)
5
1
=
E [2 ] +
Var[]
48
16
145
=
.
48
4.17 Pour commencer, on utilise le lien entre le taux dchec et la fonction de

340

Solutions des exercices


survie pour trouver
S(x|) = e

Rx
0

(x|) d t

Z x

3
= exp
dt
+t
0

= exp 3 ln
+x


3
= exp ln
+x

=
.
+x

La fonction de rpartition est donc

F (x|) = 1

+x

do X | Pareto(3, ). Par consquent,


E [X ] = E [E [X |]]

=E
2
= 500
et
Var[X ] = E [Var[X |]] + Var[E [X |]]

3
+ Var
=E
4
2
= 850 000.
4.18 Soit f () la fonction de densit de probabilit dune Log-normale(, 2 ) et g ()
celle dune Gamma(, ). Pour comparer les queues de ces deux distributions,
il faut valuer
f (x)
lim
.
x g (x)
En liminant les termes qui ne dpendent pas de x, on obtient
lim

x 1 e (ln(x))

x 1 e x/

/22

= lim e (ln(x))
x

/22 ln(x)+x/

Or, de lexercice 1.4 on sait que x tend plus rapidement vers linfini que ln(x).
Lexposant tend donc vers , do la distribution log-normale a une queue
plus paisse que la distribution gamma.

Solutions des exercices

341

4.19 Une fonction desprance de vie rsiduelle linaire en x indique une distribution de Pareto telle que

1
x+
.
e(x) =
1
1

partir de e(x) = 2 000 + 2x, on trouve que = 1,5 et = 1 000. En utilisant les
formules de lannexe A pour lesprance limite dune loi de Pareto, on a que
le LER est
E [X ] E [X ; x]
E [X ]
= 0,30115.

LER =

4.20 a) Il sagit dune fonction linaire en x, on a donc que X Pareto. En utilisant


la relation de lexercice 4.19, on trouve que = 7/3 et = 16/3.
b) En utilisant la formule de lannexe A, on trouve que E [X ; 10] = 3,0215.
4.21 Pour X Gamma(, ), on a E [X ] = / et Var[X ] = /2 . On trouve les
paramtres suivants pour les trois sous-intervalles : 1 = 1, 1 = 1, 2 =
25, 2 = 5, 3 = 144 et 3 = 12. Pour le premier sous-intervalle, on a A
Gamma(1, 1) et
Pr[A 2] = (1; 2).
Pour le second sous-intervalle, on a B Gamma(25, 5) et
Pr[2 < B 8] = (25; 40) (25; 10).
Pour le troisime sous-intervalle, on a C Gamma(144, 12) et
Pr[8 < C 16] = (144, 192) (144; 96).
La densit raccorde est donc

0,5e x

,
0<x 2

(1; 2)

25 251 5x
0,2
5 x
e
f X (x) =
,
2<x 8
(25; 40) (25; 10)
(25)

0,3
12144 x 1441 e 12x

, 8 < x 16.
(144; 192) (144; 96)
(144)

342

Solutions des exercices


4.22 On a

f X (x) =

p/10,

0 < x < 10
3

(3)(100 )
1

, x 10
(1 p)
4
(100 + x) (100/110)3

0 < x < 10
p/10,
= (3)(1103 )

(1 p), x 10.

(100 + x)4

Pour que la distribution soit continue au point x = 10, on doit avoir


f X (10) =

p
,
10

soit
p
3
(1 p) = .
110
10
En rsolvant pour p, on trouve p = 3/14.
4.23 a) On pose X Weibull(1 , 1 ) et Y = X 1 Weibull inverse(2 , 2 ). On sait
de lannexe A que tous les moments positifs de la distribution Weibull
existent, alors que ceux de la distribution Weibull inverse nexistent que
pour k < 2 . Par ce critre, on voit que la distribution Weibull Inverse
possde une queue plus lourde.
Dautre part, on a
2

1 ( x)
f Y (x) 2 2 2 x 2 e 2
=
1 1 1 (1 x)1
f X (x)
1 1 x
e

x 1 2 e (2 x)

+(1 x)1

do

f Y (x)
(1 x)1 (2 x)2 (1 + 2 ) ln(x).
ln
f X (x)

Lorsque x , le terme central tend vers 0. Comme x tend plus rapidement vers que ln(x), on a que

f Y (x)
lim ln
= lim (1 x)1 (2 x)2 (1 + 2 ) ln(x)
x
x
f X (x)
= ,

343

0.000

0.005

0.010

0.015

0.020

Solutions des exercices

16

18

20

22

24

F IG . E.16: Comparaison des queues des distributions Weibull (trait mince) et Weibull inverse (trait pais)

do
f Y (x)
S Y (x)
= lim
= .
x f X (x)
x S X (x)
lim

Ainsi, en comparant les fonctions de survie on arrive aussi la conclusion


que la queue de la loi Weibull inverse est plus lourde que celle de la Weibull.
b) On fixe 1 et 1 de manire arbitraire et on rsoud numriquement pour
2 et 2 . La figure E.16 prsente le graphique des deux distributions pour
1 = 3, 1 = 0,1, 2 = 4,4744 et 2 = 0,1335.

344

Solutions des exercices


4.24 On a

S X (y)
et y
dy
E [X ]
0
Z t y

ty
S X (y)
f X (y)
e
e
dy
=
+
t
E [X ] 0
t
E [X ]
0
1
M X (t )
=
+
t E [X ] t E [X ]
M X (t ) 1
=
.
t E [X ]
Z

M Y (t ) =

Ce rsultat suppose que lim y e t y S X (y) = 0. En appliquant la rgle de lHpital, on voit quil sagit de la mme limite que t 1 lim y e t y f X (y) qui doit
tre 0 sinon lintgrale dfinissant M X (t ) ne convergerait pas.
4.25 a) Par dfinition de la fonction de survie :
Z
S(x) =
(1 + 2t 2 )e 2t d t
x

= (1 + x + x 2 )e 2x ,

x 0.

b) Par dfinition du taux dincidence :


d
ln S(x)
dx
d
d
(2x)
ln(1 + x + x 2 )
=
dx
dx
1 + 2x
= 2
.
1 + x + x2

h(x) =

c) On a dabord

Z
x

S(t ) d t =

(1 + t + t 2 )e 2t d t

= (1 + x + 0,5x 2 )e 2x
et donc

e(x) =

S(x) d x
S(x)

1 + x + 0,5x 2
.
1 + x + x2

d) On a

lim h(x) = lim 2

= 2.

1 + 2x
1 + x + x2

Solutions des exercices

345

e) On a
lim e(x) =

limx h(x)
1
= .
2

f) partir de c), on trouve


x + 0,5x 2
d
e(x) =
< 0,
dx
(1 + x + x 2 )2
pour x > 0, do e(x) est une fonction strictement dcroissante. Cependant, pour h(x), on a h(0) = 1, h(0,5) = 6/7 et h() = 2. On voit donc que
le taux dincidence nest pas une fonction strictement croissante.

Chapitre 5
P
P
5.1 On a 5i =1 x i = 6 211 et 5i =1 x i2 = 26 040 101. Pour trouver les estimateurs des
moments de et , on pose

E [X ] = E [E [X |]] = E [1 ] =

6 211
=
1
5

et
E [X 2 ] = E [E [X |]] = E [2 ] =

22
26 040 101
=
.
( 1)( 2)
5

En rsolvant, on trouve = 3,45 et = 3 048,87.


5.2 Par dfinition, la fonction de vraisemblance donne la probabilit dobtenir un
chantillon tel que celui obtenu. On doit donc avoir deux donnes entre 0 et
2 000 et quatre donnes entre 2 000 et 5 000, le tout sachant que les six donnes
sont plus petites que 5 000. On a alors
L() =

(1 e 2 000 )2 (e 2 000 e 5 000 )4


(1 e 5 000 )6

P
P
5.3 On a 5i =1 x i = 5 850 et 5i =1 x i2 = 5 867 500. Pour trouver les estimateurs des moments de et il suffit de poser gaux les deux premiers moments empiriques
et thoriques :
5 850
=
6

346

Solutions des exercices


et
2 + 2 2 =

5 867 500
.
6

On trouve alors = 34,83 et = 27,99.


5.4 La fonction de rpartition de la log-logistique tant
(x/)
,
1 + (x/)

F (x) =

on trouve, aprs avoir galis les quantiles thoriques et empiriques, que = 2


et = 200.
5.5 La densit de la variable alatoire sous-jacente est
f X (x) = F X0 (x) = px p1 .
Lesprance est donc
1

E [X ] =

xpx p1 d x

p
.
p +1

En posant E [X ] = x pour trouver un estimateur des moments de p, on obtient


x
.
1 x

p =

P
P
5.6 On a 5i =1 x i = 10 000 et 5i =1 x i2 = 30 000 000. On galise les deux premiers
moments thoriques et empiriques :

e +

2
2

et
2

e 2+2 =

10 000
5

30 000 000
.
5

= 0,6368. Par consquent,


On trouve alors = 7,40 et

ln(4 500) 7,40


Pr[X > 4 500] = 1
0,6368
= 1 (1,5919)
= 0,056.

Solutions des exercices

347

5.7 On pose simplement

p
2
= x = 4,2,
2

do = 3,3511.
5.8 a) Posons = . On a

Pr[X 500] = 1 e 500

= 0,25
et

Pr[X 1 000] = 1 e 1 000


= 0,50

do on trouve que = 0,000108 et = 1,2687. Ainsi, on a = 0,000747.


b) On cherche 0,80 tel que

1 e ( 0,80 ) = 0,80.
On trouve 0,80 = ( ln 0,20)1/ / = 1 947.
5.9 La distribution marginale de la variable X est une loi de Pareto(, ). Ainsi,
pour estimer les paramtres et par la mthode des quantiles, on pose

S X (450) =

+ 450

= 0,001

et

S X (50) =
+ 50

= 0,125.

Il suffit maintenant de manipuler les termes pour obtenir

ln +50
ln(0,125)

ln(0,001) ln
+450

0,3010

ln
= ln
+ 450
+ 50
0,3010 ( + 50) = ( + 450)0,3010 .

348

Solutions des exercices


5.10 Dabord, le rapport dlimination de perte avec une franchise forfaitaire est
LER =

E [X ; d ]
E [X ]

alors quavec une franchise atteinte il est


LER =

E [X ; d ] d (1 F (d ))
.
E [X ]

Par consquent, on a les quations suivantes :


E [X ; 200]
E [X ]
E [X ; 500]
0,79 =
E [X ]
E [X ; 200] 200(1 F (200))
0,32 =
E [X ]
E [X ; 500] 500(1 F (500))
0,52 =
E [X ]
0,56 =

Puisque E [X ] = 200, on trouve F (200) = 0,76 et F (500) = 0,892, do 0,01


et 0,48.
5.11 La fonction de rpartition dune loi U (a, b) tant
F (x) =

x a
,
ba

on a
50 a
= 0,80
ba
55 a
= 0,90,
ba
do on obtient a = 10 et b = 60.
5.12 Pour X Bernoulli(p), on a la fonction de vraisemblance
L(p; x 1 , . . . , x n ) =

n
Y

p xi (1 p)1xi

i =1
Pn

=p

i =1 x i

Pn

(1 p)n

i =1 x i

Solutions des exercices

349

et la fonction de log-vraisemblance
l (p; x 1 , . . . , x n ) =

n
X

x i ln(p) + n

n
X

x i ln(1 p),

i =1

i =1

do
Pn
0

l (p; x 1 , . . . , x n ) =

i =1 x i

Pn

i =1 x i

p
1p
n x n n x
=

.
p
1p

On trouve donc p = X .
5.13 a) On a la fonction de log-vraisemblance
n (x )2
1X
i

l (, ) = n ln p
2 i =1
2
2

et les drives partielles


n (x )
X

i
l (, 2 ) =

2
i =1
Pn
2
n

i =1 (x i )
2
)
=

l
(,
+
.
2
22
24

En posant ces drives gales 0 et en rsolvant pour et 2 , on obtient


les estimateurs du maximum de vraisemblance
n
1X
X i = X
n i =1
n
1X
2 =

(X i X )2 = S 2 .
n i =1

b) partir des calculs prcdents, on trouve


2
n
l (, 2 ) = 2
2

Pn
2
2
n
i =1 (x i )
2
l
(,

)
=

4
4
2
6
Pn
2
xi

l (, 2 ) = i =1 4
.
2

350

Solutions des exercices


Or,
h n i
n
E 2 = 2

Pn
i =1 (X i )
=0
E
4

et
"

n
E

24

Pn

i =1 (X i )
6

n
24

car E [X i ] = 0 et E [(X i )2 ] = 2 . On obtient ainsi la matrice variancecovariance :


2

/n
0
.
=
0
24 /n
Or, on sait que la distribution asymptotique conjointe des estimateurs du
maximum de vraisemblance est une normale multivarie sans biais et de
matrice variance-covariance .
c) On rappelle que () et () sont, dans lordre, les fonctions de rpartition
et de densit de probabilit dune loi N (0, 1). Par consquent,
A=

1 c
h(, 2 ) =

B=

1 c c
2
h(,

)
=

,
2
2 3

et

do


2 /n
0
A

)] = A B
Var[h(,
4
0
2 /n B
c 2 1 (c )2
+
.
=

n
2n2
2

Enfin, on sait que, asymptotiquement,



2 ) N (h(, 2 ), Var[h(,

2 )]).
h(,

Solutions des exercices

351

5.14 En utilisant la technique habituelle :

!
n
Pn
Y
2
n n
L() = 2
x i e i =1 xi
i =1

l () = n ln(2) + n ln() +

n
X

ln x i

n
X
i =1

i =1

x i2

n
n X
l 0 () =
x 2.
i =1 i

P
On trouve alors = n/ ni=1 x i2 . En calculant la drive seconde de la fonction
de log-vraisemblance, on voit quil sagit bien dun maximum.

5.15 a) On a f (x) = px p1 , do
L(p) = p n

n
Y
i =1

p1

xi

l (p) = n ln(p) + (p 1)

n
X

ln(x i )

i =1

l 0 (p) =

n
n X
+
ln(x i ).
p i =1

P
On trouve alors p = n/ ni=1 ln(x i ). En calculant la drive seconde, on
voit quil sagit bien dun maximum.

b) partir de a), on calcule


l 00 (p; x 1 , . . . , x n ) =

n
p2

do
I (p) = nE [p 2 ] =

n
p2

et
=
Var[p]

1
p2
=
.
I (p)
n

c) On sait que
p p 1,96
De a) et b), on a donc

Var[p].

p
p p 1,96 p .
n

352

Solutions des exercices


d) On a
1

E [X ] =
=

xpx p1 d x

p
.
p +1

Par la proprit dinvariance, lestimateur du maximum de vraisemblance


de E [X ] est
p
E [X ] =
,
1 + p
o p est lestimateur du maximum de vraisemblance de p dtermin en
a).
e) On pose E [X ] = h(p) avec
h(p) =

p
,
1+p

h 0 (p) =

1
.
(1 + p)2

do

Par la mthode delta,

Var E [X ] = h 0 (p)2 Var[p]


4 2

p
1
=
1+p
n

et

d E [X ] =
Var

et donc

1
1 + p

p 2
n

p
p
1,96
E [X ]
p .
1 + p
2 n
(1 + p)

5.16 On a
L() = 5 5

5
Y

( + x i )1

i =1

l () = 5 ln() + 5 ln ( + 1)

5
X
i =1

l 0 () =

5
X
5
+ 5 ln()
ln( + x i ).

i =1

ln( + x i )

Solutions des exercices

353

P
On obtient alors = 5/( 5i =1 ln(+x i )5 ln ) = 3,8629. En calculant la drive
seconde de la fonction de log-vraisemblance, on vrifie quil sagit bien dun
maximum.

5.17 La probabilit davoir une observation infrieure 2 est


Z 2
2
F (2) =
2xe x d x = 1 e 4 .
0

On a ensuite, pour un chantillon alatoire de taille 4,


L() = F (2)(1 F (2))3
= (1 e 4 )e 12
l () = ln(1 e 4 ) 12
l 0 () = 4(1 e 4 )1 e 4 12.
On trouve alors = 41 ln 43 .
5.18 On aura reconnu la densit dune N (0, ). On sait que lestimateur du maxi = Var[].
Or, on
mum de vraisemblance de est sans biais. Ainsi, MSE()
a
x2
1
ln f (x) = ln(2)
2
2
d2
1
x2
ln f (x) = 2 3
d 2
2

X2
1

I () = nE
2 2 3
2n
= 2

= I 1 (). Une approximation de lerreur quadratique moyenne est


et Var[]
donc
= Var[

)
d ]
MSE(
2 2
n
= 0,20.
=

5.19 a) On a une distribution log-gamma de paramtres = 2 et . De lannexe A,


on sait que

2
E [X ] =
.
1

354

Solutions des exercices


En posant E [X ] = X , on trouve que lestimateur des moments de est
p

X
= p
.
X 1

b) On a
Q
2n ni=1 ln(x i )
L() = Qn
+1
i =1 x i
n
n
X
X
l () = 2n ln() +
ln(ln(x i )) ( + 1) ln(x i )
i =1

i =1

n
2n X
l 0 () =

ln(x i ).
i =1

On trouve alors que = 2n/

Pn

i =1 ln(x i ).

5.20 a) On a
L() =

P5
Q
(5 )5 ( 5i =1 x i4 )e i =1 xi

((5))5
5
5
X
X
x i 5 ln (5)
l () = 25 ln() + 4 ln x i
i =1

i =1
5
25 X
l 0 () =
xi ,

i =1

P
do = 25/ 5i =1 x i = 1/2.

b) On a
l 00 () =

25
2

et donc la matrice dinformation de Fisher est

25
I () = E 2

25
=
(5/8)2
= 64.

=
Par consquent, Var[]

1
64 .

Solutions des exercices

355

5.21 Par dfinition de la fonction de vraisemblance :


L() = (Pr[X 2])2 Pr[5 X 11]Pr[X 11]

2
1
1
1
1
= 1

.
3
6
12
12
tant donn quil faudra faire appel des mthodes numriques pour rsoudre ce problme, on peut tout aussi bien minimiser la fonction de vraisemblance au lieu de la fonction de log-vraisemblance.
5.22 On a
L() = Pr[0 X 1]Pr[X 2]
= (1 e )e 2
l () = ln(1 e ) 2
l 0 () =

e
1 e

2.

On obtient = ln(1,5).
5.23 a) Par la mthode du maximum de vraisemblance habituelle, on trouve
n
= Pn

2
i =1 x i

Or, P k = F X (k) = 1 e k . Par la proprit dinvariance de lestimateur du


2
maximum de vraisemblance, on a donc Pk = 1 e k .
b) Par la mthode delta, on a que
Var[Pk ] =

P k

Var[]

= (k 2 e k )2 Var[].

Or, en laissant tomber les termes non fonction de ,


l () = n ln()

n
X
i =1

n
n X
l 0 () =
x2
i =1 i
n
l 00 () = 2

x i2 + . . .

356

Solutions des exercices


do

h ni
n
E 2 = 2

et
=
Var[]

2
.
n

Par consquent,
2

Var[Pk ] =

k 4 2 e 2k
.
n

c) On sait que Pk N (P k , Var[Pk ]). Or, si X 1 = X 2 = 10 et X 3 = 15, alors =


3/425, p10 = 0,5063 et
d P10 ] =
Var[

= 0,0405.
3

Ainsi, approximativement, P10 N (0,5063, 0,0405), do Pr[P10 0,5]


(0,0313) = 0,4875.
5.24 En premier lieu, on a
l (, ; x) = n ln() + n ln() ( + 1)

n
X

ln( + x i )

i =1

et
n
2
l (, ; x) = 2
2

2
n
X
2
n
1
l
(,
;
x)
=

+
(
+
1)
2
2
i =1 + x i

2
n

n X
1
l (, ; x) =
.

i =1 + x i
Pour la suite, on aura besoin des rsultats intermdiaires
1

dx
2
+1
0 ( + x) ( + x)

= 2
( + 2)

Z
1
1

E
=
dx
+1
+ X
0 + x (x + )
1
=
.
+1

1
+ X

Solutions des exercices

357

Ainsi,

h n i
2
E
l
(,
;
X
)
=
E
2
2

n
= 2
"

2 #
2
n
X
1
n

l (, ; X ) = E 2 + ( + 1)
E
2

i =1 + X i
n
= 2
( + 2)
"
2

#
n

1
n X
l (, ; X ) = E

i =1 + X i
n
=
( + 1)

et la matrice dinformation de Fisher est


n
2

I (, ) =
n

( + 1)

n
( + 1)
.
n
2 ( + 2)

La matrice de variance-covariance est donc


= I 1 (, )

2 ( + 1)2

=
( + 1)( + 2)
n

( + 1)( + 2)

.
2
2
( + 1) ( + 2)

De l, on obtient
2 ( + 1)2
= 0,28125
50
2
2
= ( + 1) ( + 2) = 656 250
d ]
Var[
50
+ 1)( + 2)
= (
d ,
)
Cov(
= 393,75.
50
d ]
=
Var[

358

Solutions des exercices


5.25 On a
h(, ) = Pr[X > 10]

=
+ 10

h(, )

ln
=

+ 10
+ 10

h(, )

10
=
.

+ 10
( + 10)2
Or,
= 0,0816
)
h(,

h(, )
= 0,1023
(,

h(, )
= 0,0292
(,

)
et donc

24 10 0,1023

d
)] = 0,1023 0,0292
Var[h(,
0,0292
10 40

= 0,2254.
p
Lintervalle de confiance est donc 0,0816 (1,44) 0,2254. tant donn quil
sagit dun intervalle pour une probabilit, la borne infrieure ne peut tre
plus petite que 0 (et la borne suprieure ne peut tre plus grande que 1).
Lintervalle de confiance est donc (0, 0,7653).
5.26 On sait que lestimateur du maximum de vraisemblance de est = X 1 et il
= 2 /n. Ici, on a = 0,0187.
est simple dtablir que Var[]
a) On a
h() = E [X ; 50]
1 e 50

d h() e 50 (50 + 1) 1
=
,
d
2
=

do

50
(50 + 1) 1
= e
Var[h()]
2

!2

2
n

Solutions des exercices

359

et
= (686,57)2 (0,000 043 88)
d )]
Var[h(
= 20,68.
b) On procde comme en a) avec
h() = 0,95
ln(0,05)

d h()
ln(0,05)
.
=
d
2
=

= 3 196.
d )]
On obtient Var[h(
5.27 a) On a que X |A = obit une loi de Bernoulli() et que A obit une loi
U (0, 1). On cherche
P3

f (|x 1 , x 2 , x 3 )

i =1 x i

P3

(1 )3

i =1 x i

(1)

= (1 ) .
On reconnat ici la forme fonctionnelle dune distribution Bta(2, 3). On
sait que, si la fonction de perte choisie est lerreur quadratique, lestimateur bayesien est lesprance de la distribution a posteriori. On a donc
=

2
2
= = 0,4.
2+3 5

b) On a
Z

Pr[0,2 < A < 0,4|X = x] =

0,4
0,2

(5)
(1 2 + 2 ) d
(2)(3)

= 0,3432.
5.28 On a que X | = Poisson() et que Gamma(, ). On a donc

!
!
Pn
e n i =1 xi e 1
f (|x 1 , . . . , x n )
Qn
()
i =1 x i !
Pn

= e (+n) +

i =1 x i 1

On reconnat ici la forme fonctionnelle dune distribution Gamma de paP


ramtres = + ni=1 x i et = + n. On sait que, si la fonction de perte

360

Solutions des exercices


choisie est lerreur quadratique, lestimateur bayesien est lesprance de la
distribution a posteriori. Par consquent
P
+ ni=1 x i
.
=
n +
5.29 a) On a que X |A = obit une loi de Pareto(, 1) et que A obit une
distribution Exponentielle(3). On a

n
3
f (|x 1 , . . . , x n ) 3e
Qn
+1
i =1 (1 + x i )
n e 3
+1
i =1 (1 + x i )

e 3
n
= Qn
i =1 (1 + x i )

= Qn

= n e

P
avec = 3 + ni=1 ln(1 + x i ). On reconnat alors la forme fonctionnelle
dune loi Gamma. On a donc, comme densit a posteriori, une loi Gamma
de paramtres = n + 1 et .

b) On sait que, si la fonction de perte choisie est lerreur quadratique, lestimateur bayesien est lesprance de la distribution a posteriori. On a
donc
n +1
7
=
=
= 0,68.
Pn
3 + i =1 ln(1 + x i ) 3 + 7,27
5.30 a) On a que X |B = obit une loi Exponentielle() et que B obit une loi
Gamma(2, 3). On a
P5

f (|x 1 , . . . , x 5 ) 6 e (3+

i =1 x i )

P
Puisque 5i =1 x i = 47, on reconnat ici la forme fonctionnelle dune loi
Gamma(7, 50). Avec une fonction de perte quadratique, lestimateur bayesien est lesprance de la distribution a posteriori. On a donc

7
=
= 0,14.
50
b) Avec une fonction de perte valeur absolue lestimateur bayesien est la
mdiane de la distribution a posteriori. Il faut donc choisir tel que
= x] = (7; 50)
= 1.
Pr[B |X
2

Solutions des exercices

361

Avec les informations donnes dans lnonc, on trouve


6,670
=
= 0,1334.
50
5.31 a) Soit X la variable alatoire du nombre de fois o un tudiant reste bloqu
dans un devoir. On a X | = Binomiale(3, p) et U (0,25, 0,75). On a
3 2

2 2
2 (1 )
f (|x 1 = 2, x 2 = 2) = R 0,75

3 2
2 2 d
0,25 2 2 (1 )

4 (1 )2
= R 0,75
4
2
0,25 (1 ) d
= 141,22 4 (1 )2 .
Avec une fonction de perte quadratique, lestimateur bayesien est lesprance de la distribution a posteriori. Ainsi,
Z 0,75

= 141,22
5 (1 )2 d = 0,5668.
0,25

b) On a
Pr[0,6 < < 0,7|X 1 = 2, X 2 = 2] = 1441,22

0,7
0,6

4 (1 )2 d p

= 0,3055.
5.32 a) Soit X la variable alatoire du montant dun sinistre en millions. On a
Y = X |X > 1,5. Par consquent,
Pr[Y > 29,5] =

F X (29,5) F X (1,5)
.
1 F X (1,5)

Or, par la proprit dinvariance de lestimateur du maximum de vraisemblance, on a

+1,5
+29,5
b
Pr(Y
> 29,5) = 1

+ 1,5
+ 29,5

= 0,0365.

+1,5
!

362

Solutions des exercices


b) On a

+ 1,5
h(, ) =
,
+ 29,5

h
+ 1,5
+ 1,5
=
ln
,

+ 29,5
+ 29,5
h
( + 1,5)1
= 28

( + 29,5)+1

et

h(, )
= 0,0238
(,

h(, )
= 0,0029,

)
(,

do

167,07 0,0238
= 0,0238 0,0029 23,92
d ,
)]
Var[h(
167,07 1 199,32
0,0029

= 0,00057.
5.33 Le montant pay par lassureur est Y = min(X , 3 000) 100|X > 100, do

f (y + 100)

X
, 0 y < 2 900

1 F X (100)

S X (3 000)
f Y (y) =
, y = 2 900

1 F X (100)

0,
y > 2 900,

,
0 y < 2 900

e 2 900 ,

0,

y = 2 900

y > 2 900.

La fonction de vraisemblance est donc


L() =

n
Y

f Y (y i )
i =1
8 (100++1 500)

= e

= 8 e 10 420 .

(e 2 900 )2

Solutions des exercices

363

Par la mthode usuelle, on trouve = 8/10 420. On cherche une estimation


de E [X ] = 1 . Par la proprit dinvariance de lestimateur du maximum de
vraisemblance, on a
E [X ] =

1 10 420
= 1 302,50.
=
8

5.34 Soit X la variable alatoire du montant dun sinistre et Y la variable alatoire


du montant pay par lassureur. On a Y = min(X , 150), do

y < 150

f X (y),
f Y (y) =

1 F X (150), y = 150

0,
y > 150,

, y < 150

e
e 150 ,

0,

y = 150

y > 150.

On a donc la fonction de vraisemblance


L() =

n
Y

f Y (y i )
i =1
5 (10++110)

= e

(e 150 )3

= 5 e 845 .
Par la technique usuelle, on trouve = 0,0059.
5.35 On a la fonction de rpartition empirique

0, x 0

2, 0 < x 2
F 9 (x) = 96

9, 2 < x 5

1, 5 < x 8.

Il faut maintenant trouver la valeur de qui minimise


X
Q() =
(F (x) F 9 (x))2
x=2,5,8

2
2 2
6 2
2
5
= 1e

+ 1e

+ 1 e 8 1 .
9
9

On trouve numriquement que le minimum est atteint en = 0,2286.

364

Solutions des exercices

Chapitre 6
6.1 La fonction de rpartition thorique est

F X (x) = 1

+x

= 1

1 000
1 000 + x

Ainsi, le nombre espr de sinistres dans chaque classe est


E 1 = 10(F (250) F (0)) = 3,6
E 2 = 10(F (500) F (250)) = 1,9556
E 3 = 10(F (1 000) F (500)) = 1,9444
E 4 = 10(F () F (1 000)) = 2,5.
On a les nombres de sinistres observs n 1 = 3, n 2 = 2, n 3 = 3 et n 4 = 2. La valeur
de la statistique du test du khi carr est donc
Q=

4 (n E )2
X
j
j
j =1

Ej

(3 3,6)2 (2 1,9556)2 (3 1,9444)2 (2 2,5)2


+
+
+
3,6
1,9556
1,9444
2,5
= 0,7740.
=

Soit 23, 0,10 = 6,2514 le 90e centile dune distribution khi carr avec trois degrs
de libert. Puisque 0,7740 < 6,2514, on ne rejette pas le modle.
6.2 La fonction de rpartition du modle est

F X (x) = 1

+x

= 1

50
50 + x

3,5

On a les nombres esprs de sinistres par classe suivants :


E 1 = 1 000(F (3) F (0)) = 184,49
E 2 = 1 000(F (7,5) F (3)) = 202,37
E 3 = 1 000(F (15) F (7,5)) = 213,93
E 4 = 1 000(F (40) F (15)) = 271,40
E 5 = 1 000(F () F (40)) = 127,80.

Solutions des exercices

365

La valeur de la statistique est donc


(180 184,49)2 (180 202,37)2 (235 213,93)2
+
+
184,49
202,37
213,93
2
2
(255 271,40)
(150 127,80)
+
+
271,40
127,80
= 9,5046.

Q=

Or, Pr[22 > 9,5046] = 0,0086 (o 22 est une variable alatoire avec distribution
khi carr avec deux degrs de libert). Par consquent, on ne rejette pas le
modle avec un seuil de signification de 0,86 %. Des seuils proposs, seul 0,5 %
est donc valide.
6.3 La fonction de rpartition empirique est

0,

0,2,
F 5 (x) = 0,4,

0,8,

1,

x < 0,1
0,1 x < 0,4
0,4 x < 0,8
0,8 x < 0,9
x 0,9.

La fonction de rpartition thorique est


x

F (x) =

1 + 2y
x
d y = (1 + x),
2
2

0 x 1.

La statistique de KolmogorovSmirnov est donc


D = max {|F (x i ) F 5 (x i )|, |F (x i ) F 5 (x i 1 )|}
i =1,...,5

= max{|F (0,1) F 5 (0,1)|, |F (0,1) F 5 (0)|,


|F (0,4) F 5 (0,4)|, |F (0,4) F 5 (0,1)|,
|F (0,8) F 5 (0,8)|, |F (0,8) F 5 (0,4)|,
|F (0,9) F 5 (0,9)|, |F (0,9) F 5 (0,8)|}
= 0,32.
La valeur critique du test de KolmogorovSmirnov avec un seuil de signification
p
de 5 % est c = 1,36/ 5 = 0,6082. Puisque D < c, on ne rejette pas le modle.

366

Solutions des exercices


6.4 a) La fonction de rpartition empirique est

0, x < 1

10 , 1 x < 2

6 , 2x <3
F 10 (x) = 10
8

10 , 3 x < 4

10 , 4 x < 8

1, x 8.
b) La fonction de rpartition thorique est

F X (x) = 1
On a donc F (1) = 59 , F (2) = 34 , F (3) =
Cramrvon Mises est
Q CvM =

10
X

2
2+x

.=

21
8
25 , F (4) = 9

et F (8) =

24
25

La distance de

(F (x i ) F 10 (x i ))2

i =1

3 6 2
21 8 2
5 2 2
+4
+2

= 2
9 10
4 10
25 10

2
2
8 9
24
+
+
1
9 10
25

= 0,3478.
c) On a cette fois une fonction de rpartition empirique telle que F 10 (2) =
9
F 10 (4) = 10
et F 10 (8) = 1. La valeur de la distance est donc
Q

CvM

3 6
=

4 10

8 9
+
9 10

24
+
1
25

6
10 ,

= 0,0242.
6.5 On trouve dabord la fonction de rpartition thorique :
x

F (x) =

y
x2
dy = ,
2
4

0 x 2.

On a ensuite F 4 (0,5) = 1/4, F 4 (1) = 2/4, F 4 (1,25) = 3/4, et F 4 (1,5) = 1. Le tableau E.2 prsente les diffrences entre les fonctions de rpartition. La statistique D 4 est donc 7/16 = 0,4375.

Solutions des exercices

367

|F n (x i ) F (x i )|

|F n (x i 1 ) F (x i )|

1
2
3
4

3/16
1/4
0,359375
7/16

1/16
0
0,109375
3/16

TAB. E.2: Diffrences entre les fonctions de rpartition thorique et empirique pour
les donnes de lexercice 6.5

xi

|F n (x i ) F (x i )|

|F n (x i 1 ) F (x i )|

1
4
6
7
8
9
9,5

0,1329
0,1257
0,0686
0,0814
0,0743
0,0471
0,0975

0,0100
0,0171
0,0743
0,0614
0,0686
0,0957
0,0454

TAB. E.3: Diffrences entre les fonctions de rpartition thorique et empirique pour
les donnes de lexercice 6.6

6.6 On trouve dabord la fonction de rpartition thorique :

F (x) =

x2
y
dy =
,
50
100

0 x 10.

On a ensuite F 7 (1) = 1/7, F 7 (4) = 2/7, F 7 (6) = 3/7, F 7 (7) = 4/7, F 7 (8) = 5/7,
F 7 (9) = 6/7 et F 7 (9,5) = 1. Le tableau E.3 prsente les diffrences entre les
fonctions de rpartition. La statistique de KolmogorovSmirnov vaut donc
p
D = 0,1329. Puisque la valeur critique du test est c = 1,36/ 7 = 0,5140 > D, on
ne rejette pas le modle.
6.7 On a

F X (x) = 1
+x

= 1

8
.
8+x

368

Solutions des exercices


On trouve ensuite que
E 1 = (20) (F (5) F (0))
= 7,6923
E 2 = (20) (F (20) F (5))
= 6,5934
E 3 = (20) (F () F (20))
= 5,7143.
Ainsi, la valeur de la statistique est
(10 7,6923)2 (5 6,5934)2 (5 5,7143)2
+
+
7,6923
6,5934
5,7143
= 1,1667.

Q=

6.8 On rappelle que F X (x; , ) = (; x), o (; x) est la fonction de rpartition


de la distribution Gamma(, 1). Le calcul de la statistique de Kolmogorov
Smirnov requiert donc les valeurs de (; 1,25), (; 5,5) et (; 7) pour = 3
et = 3,5. Or, avec la relation donne dans lnonc, on obtient

(1,25)2
(3; 1,25) = 1 e 1,25 1 + 1,25 +
= 0,1315
2

(5,5)2
5,5
= 0,9116
(3; 5,5) = 1 e
1 + 5,5 +
2

(7)2
(3; 7) = 1 e 7 1 + 7 +
= 0,9704.
2
Le tableau E.4 prsente les calculs pour les deux distributions postules. Pour la
Gamma(3, 0,01), la statistique de KolmogorovSmirnov est D = 0,6616 et pour
la Gamma(3,5, 0,01), la statistique est D = 0,6114. On choisit donc la deuxime
distribution pour la modlisation les donnes.
6.9 Lhypothse de taux dchec constant correspond une distribution exponentielle de paramtre = 0,01. On a donc F X (x) = 1 e x/100 et
E 1 = 50 (F (25) F (0)) = 11,0600
E 2 = 50 (F (40) F (25)) = 5,4240
E 3 = 50 (F (60) F (40)) = 6,0754
E 4 = 50 (F (80) F (60)) = 4,9741
E 5 = 50 (F () F (80)) = 22,4664.

Solutions des exercices

369

|F n (x i ) F (x i )|

|F n (x i 1 ) F (x i )|

xi

=3

= 3,5

=3

= 3,5

125
550
700

0,1185
0,1616
0,0296

0,1771
0,1114
0,0512

0,1315
0,6616
0,2204

0,0729
0,6114
0,1988

TAB. E.4: Diffrences entre les fonctions de rpartition thorique et empirique pour
les donnes de lexercice 6.8

tant donn que E 4 < 5, on regroupe (arbitrairement) E 3 et E 4 pour obtenir


E 3,4 = 11,0495. On obtient ensuite
(10 11,06)2 (5 5,4240)2
+
11,06
5,4240
2
(15 11,0495)
(20 22,4664)2
+
+
11,0495
22,4664
= 1,8179.

Q=

Puisque Pr[23 > 1,8179] = 0,61 > 0.05, on ne rejette pas lhypothse.
6.10 a) On les valeurs suivantes de la fonction de rpartition empirique : F 50 (25) =
0,20, F 50 (50) = 0,44, F 50 (100) = 0,68 et F 50 (200) = 0,90. Pour la distribution
de Pareto, on a F (25) = 0,4557, F (50) = 0,6464, F (100) = 0,8075 et F (200) =
0,9106. La distance de Cramrvon Mises est alors
Q CvM = (0,4557 0,2)2 + (0,6464 0,44)2
+ (0,8075 0,68)2 + (0,9106 0,9)2
= 0,1244.
Pour la distribution de Weibull, on a F (25) = 0,2212, F (50) = 0,3935, F (100) =
0,6321 et F (200) = 0,8647. La distance est alors
Q CvM = (0,2212 0,2)2 + (0,3935 0,44)2
+ (0,6321 0,68)2 + (0,8647 0,9)2
= 0,0062.
Comme 0,0062 < 0,1244, la distribution de Weibull est un meilleur modle.

370

Solutions des exercices


b) Pour la distribution de Pareto, on a
E 1 = 50 (F (25) F (0)) = 22,7834
E 2 = 50 (F (50) F (25)) = 9,5389
E 3 = 50 (F (100) F (50)) = 8,0552
E 4 = 50 (F (200) F (100)) = 5,1504
E 5 = 50 (F () F (200)) = 4,4721.
tant donn que E 5 < 5, on regroupe E 4 et E 5 pour obtenir E 4,5 = 9,6225.
On obtient alors
(10 22,7834)2 (12 9,5389)2
+
22,7834
9,5389
2
(16 9,6225)2
(12 8,0552)
+
+
8,0552
9,6225
= 13,9662.

Q=

Or, 23, 0,05 = 7,815 < Q. On rejette donc le modle avec distribution de
Pareto.
c) Comme 0,10 < 0,1244, le choix de la distribution log-normale serait meilleur.
6.11 a) On a
H0 : numros de dpart quiprobables
H1 : numros de dpart non quiprobables.
b) Pour un total de 144 courses et une probabilit uniforme de victoire de
1
8 , le nombre de victoires espr pour chaque numro est 144/8 = 18.
Les rsultats cumuls observs et esprs sont prsents dans le tableau
suivant :
Numro

Gains observs
Gains thoriques

29
18

48
36

66
54

91
72

108
90

118
108

133
126

144
144

cart absolu

11

12

12

19

18

10

La plus grande diffrence est observe pour le numro 4. On a donc D =


19/144 = 0,132. La valeur critique du test de KolmogorovSmirnov pour
une taille dchantillon n = 144 est 1,36/12 = 0,1133 pour un seuil = 0,05
et 1,63/12 = 0,1358 pour un seuil = 0,01. On rejette donc lhypothse H0
un niveau de confiance de 95 %, mais pas un niveau de confiance de
99 %.

Solutions des exercices

371

6.12 On a, dans lordre,



3
219,1
ln(100) = 226,01
2

3
219,2
ln(100) = 226,11
2

2
221,2
ln(100) = 225,81
2

2
ln(100) = 226,01
221,4
2

1
224,4
ln(100) = 226,70.
2

Le meilleur modle est donc la distribution de Pareto.

Chapitre 7
7.1 a) On trouve dabord lestimateur du maximum de vraisemblance du para k
nk
mtre . On a p k = Pr[N = k] = m
, k = 0, . . . , m et donc
k (1 )

L() =
l () =

m
Y
k=0
m
X

(p k )nk
n k ln p k

k=0

!
!
m
=
n k ln
+ k ln() + (m k) ln(1 )
k
k=0

m
X
k m k
0

.
l () =
nk

1
k=0
m
X

En rsolvant lquation l 0 () = 0, on trouve


Pm
kNk
1
k=0
=
Pm
m k=0 Nk
N
= .
m

372

Solutions des exercices


Par consquent,

N

E [] = E
m
E [N ]
=
m
m
=
m
= .

b) On a

N

Var[] = Var
m
Var[N ]
=
nm 2
m(1 )
=
nm 2
(1 )
=
.
nm

c) De la partie a), on a
d2
k
m k
ln p k = 2
d 2

(1 )2
do
2
= E [n d ln p N ]
I ()
d 2
n
n(m k)
= 2 E [N ] +
E [m N ]

(1 )2
nm mn(1 )
=
+

(1 )2
nm
=
(1 )

et donc
= I 1 ()
Var[]
=

(1 )
.
nm

Solutions des exercices

373

d) Un intervalle de confiance de niveau 1 pour est


z /2

Var[]

soit
s

z /2

(1 )
.
mn

Or, comme le paramtre est inconnu, on utilise en pratique lintervalle


approximatif
s
)

(1
z /2
.
mn
7.2 a) On a Pr[N = k] = k e /k!, k = 0, 1, . . . , et donc les fonctions de vraisemblance
!

k e n k
Y
L() =
k!
k=0
et de log-vraisemblance

l () =

n k (k ln ln k!).

k=0

Par les techniques habituelles, on trouve


P
kn k

= N = Pk=0
= 0,1001

n
k=0 k

= et Var[]
= Var[N ] = /n. On a donc N (, /n). Par conspuis E []
quent, un intervalle de confiance approximatif 95 % pour le paramtre
est
q
1,96

d ],
Var[

= /n.

d ]
avec Var[
Lintervalle de confiance est donc
r

0,1001 1,96

0,1001
.
10 000

374

Solutions des exercices


b) Avec la paramtrisation donne dans lnonc, E [N ] = et Var[N ] = (+1).
De plus,

!n k

Y
k
L() =
k+1
k=0 ( + 1)

X
n k (k ln (k + 1) ln( + 1))
l () =
k=0

et donc
P
kn k

= N = Pk=0
= 0,1001.

n
k=0 k

= 0,1001 et que Var[]


= (
+1)/n,

=
d ]
On trouve ensuite que E []
do Var[
0,1001(1,1001)/10 000. Lintervalle de confiance est donc
s
0,1001(1,1001)
0,1001 1,96
.
10 000
c) En posant = (+1)1 dans les formules de lannexe A, on trouve E [N ] = r
et Var[N ] = r ( + 1). Les estimateurs des moments de r et sont donc les
solutions des quations
P
kn k
r = Pk=0
= 0,1001

n
k=0 k
et
k 2 nk
k=0
P
n
k=0 k

r (1 + ) =

kn k
k=0
P
n
k=0 k

!2

= 0,10028

do on trouve r = 55,67 et = 0,0018.


d) On peut utiliser la fonction fitdistr du package MASS dans sa forme la
plus simple pour trouver les estimateurs du maximum de vraisemblance de
r et = r :
> x <- c(rep(0, 9048), rep(1, 905), rep(2, 45), rep(3, 2))
> fitdistr(x, "negative binomial")
size
5.273162e+01

mu
1.001000e-01

(3.797344e+02) (3.166543e-03)

Solutions des exercices

375

7.3 a) De lexercice 7.2, on sait que lestimateur du maximum de vraisemblance


du paramtre dune distribution de Poisson est la moyenne chantillonale.
Pour la variable alatoire N1 , on a 1 = x = 0,109. Pour la variable alatoire
N2 , on a 2 = x = 0,057.
b) On sait que la distribution de la somme de n variables alatoires indpendantes distribues selon des lois de Poisson de paramtre i , i = 1, . . . , n est
P
une Poisson de paramtre = ni=1 i . On obtient donc N Poisson(1 +
2 = 0,166).
7.4 a) De lexercice 7.1, on a
n
= =
7

P7

k=0

kn k

7n

= 0,0237.

b) Comme lexercice 7.2 c), on a


P

r = Pk=0

kn k

k=0

nk

= 0,166

et
k 2 nk
k=0
P
n
k=0 k

r (1 + ) =

kn k
k=0
P
n
k=0 k

!2

= 0,2244

On trouve alors r = 0,4715 et = 0,3521.


c) On utilise la fonction fitdistr du package MASS pour trouver les estimateurs du maximum de vraisemblance de r et = r :
> x <- c(rep(0, 861), rep(1, 121), rep(2, 13), rep(3, 3), 4, 6)
> fitdistr(x, "negative binomial")
size
0.65606189

mu
0.16600239

(0.21012471) (0.01442188)

7.5 On a

Pr[N = k| = ] f () d
Z
r
=
r +k1 e (+1) d .
(r )k! 0

Pr[N = k] =

376

Solutions des exercices


Or, en reconnaissant sous lintgrale la forme fonctionnelle dune distribution
Gamma(r + k, + 1), on obtient
Pr[N = k] =

(r + k)r

(r )k!( + 1)r +k

(r + k)
r
1 k
=
(r )(k 1) + 1
+1
(r + k)
=
r (1 )k ,
(r )(k 1)

avec = ( + 1)1 , soit la fonction de masse de probabilit dune distribution


binomiale ngative de paramtres r et .
7.6 Sans la franchise, lesprance de la frquence serait E [N ] = r (1 )/ = 15. De
plus, on a
S X (20) = e (0,01)(20) = 0,8187.
Cela signifie quenviron 82 % des sinistres seront dun montant suprieur
la franchise, cest--dire quenviron 82 % des sinistres vont produire une
rclamation. On a donc E [N ] = (0,8187)(15) = 12,28.
7.7 Tout dabord, il est clair distributions continues normale et gamma ne sont pas
appropries pour modliser la frquence de sinistres.
Pour choisir parmi les autres distributions possibles, on peut comparer la
2 = 1,496. Comme
moyenne et la variance chantillonales. On a = 2 et
2 , la loi binomiale est le meilleur choix.
>
La figure E.17 montre le graphique de k pk /pk1 = kn k /n k1 en fonction de k
pour k = 1, . . . , 6. La pente est clairement ngative. Ceci indique donc que le
membre de la famille (a, b, 0) avec a < 0, soit la binomiale, est le meilleur choix.

7.8 On regroupe les trois dernires classes pour obtenir une frquence significative
pour le calcul de la statistique. Si N Poisson(0,6), on a
E 0 = 365Pr[N = 0] = 200,32
E 1 = 365Pr[N = 1] = 120,19
E 2 = 365Pr[N = 2] = 36,06
E 3+ = 365Pr[N 3]
= 365 E 0 E 1 E 2 = 8,43.

Solutions des exercices

377

2.5

2.0

knk/nk1

1.5

1.0

F IG . E.17: Graphique de kn k /n k1 en fonction de k pour les donnes de


lexercice 7.7

On a les nombres de sinistres observs n 0 = 209, n 1 = 111, n 2 = 33 et n 3+ = 12.


La valeur de la statistique de Pearson est donc
Q=

3 (n E )2
X
j
j
j =0

Ej

(209 209.32)2 (111 120,19)2


+
209,32
120,19
(33 36,06)2 (12 8,43)2
+
+
36,06
8,43
= 2,85.
=

Bibliographie
Akaike, H. 1974, A new look at the statistical model identification, IEEE Transactions on Automatic Control, vol. 19, no 6, p. 716723.
Bguin, L.-P. 1990, Lexique gnral des assurances : lexique anglais-franais et
franais-anglais, Cahiers de lOffice de langue franaise, Publications du Qubec,
ISBN 2-55114107-9.
Charbonnier, J. 2004, Dictionnaire de la gestion des risques et des assurances, La
Maison Du Dictionnaire, Paris, ISBN 978-2-85608178-5.
Cossette, H., V. Goulet, M. Jacques et M. Pigeon. 2009, Modlisation des distributions
de sinistres : Exercices et solutions, Document libre publi sous contrat Creative
Commons, ISBN 978-2-9811416-1-3.
Dutang, C., V. Goulet et M. Pigeon. 2008, actuar: An R package for actuarial science, Journal of Statistical Software, vol. 25, no 7. URL http://www.jstatsoft.
org/v25/i07.
Goulet, V. 2012, Introduction la programmation en R, 3e d., Document libre
publi sous contrat Creative Commons, ISBN 978-2-9811416-2-0. URL http:
//cran.r-project.org/other-docs.html.
Goulet, V. 2013, ACT 2002 Mthodes numriques en actuariat, Partie III : Analyse
numrique, cole dactuariat, Universit Laval. URL http://libre.act.ulaval.
ca/cours/act_2002.
Hogg, R. V., A. T. Craig et J. W. McKean. 2005, Introduction to Mathematical Statistics,
6e d., Prentice Hall, Upper Saddle River, NJ, ISBN 0-13008507-3.
Hogg, R. V. et S. A. Klugman. 1984, Loss Distributions, Wiley, New York, ISBN 04718792-9-0.
Klugman, S. A., H. H. Panjer et G. Willmot. 2004, Loss Models: From Data to Decisions, 2e d., Wiley, New York, ISBN 0-4712157-7-5.
379

380

Bibliographie
Klugman, S. A., H. H. Panjer et G. Willmot. 2008, Loss Models: From Data to Decisions, 3e d., Wiley, New York, ISBN 978-0-470-18781-4.
Klugman, S. A., H. H. Panjer et G. Willmot. 2012a, Loss Models: From Data to
Decisions, 4e d., Wiley, New York, ISBN 978-1-118-31532-3.
Klugman, S. A., H. H. Panjer et G. Willmot. 2012b, Solutions Manual to Accompany
Loss Models: From Data to Decisions, 4e d., Wiley, New York, ISBN 978-1-11831531-6.
R Development Core Team. 2013, R: A Language and Environment for Statistical
Computing, R Foundation for Statistical Computing, Vienna, Austria. URL http:
//www.r-project.org.
Silverman, B. W. 1986, Density Estimation for Statistics and Data Analysis, Chapman
& Hall, London, ISBN 0-41224620-1.
Therneau, T. 2013, survival : A Package for Survival Analysis in S. URL http://cran.
r-project.org/package=survival, R package version 2.37-4.
Venables, W. N. et B. D. Ripley. 2002, Modern Applied Statistics with S, 4e d., Springer,
New York, ISBN 0-38795457-0.
Wheeler, B. 2013, SuppDists : Supplementary Distributions. URL http://cran.
r-project.org/package=SuppDists, R package version 1.1-9.

Ce document a t produit avec le systme de mise en page LATEX. Le texte principal est en
Adobe Utopia 11 points, le code informatique en Bera Mono (un clone de Bitstream Vera)
et les titres en Adobe Myriad Pro. Les graphiques ont t raliss avec R.