Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Philippe De Longueville
Michel Denuit
Jean-François Walhin
SOMMAIRE
1. Introduction
2. Chain Ladder Stochastique
3. Projected Case Estimates
4. Application
5. Conclusion
Références
Annexe
Résumé
1 Introduction.
Le paiement des sinistres ne s'eectue pas toujours en une fois, dans l'année même de survenance.
C'est particulièrement vrai dans certaines branches de l'assurance, comme par exemple la res-
ponsabilité civile automobile dans le cas de sinistres avec dommages corporels. Au contraire, le
règlement des sinistres s'étale au l du temps et il est nécessaire de constituer des réserves pour
pouvoir honorer les dettes futures. Comme le montant qui sera nalement payé pour le sinistre
est inconnu au départ, la somme à mettre en réserve est également inconnue et il faut l'estimer.
Ces estimations peuvent être calculées par des techniques, dites techniques IBNR (Incurred But
Not Reported), qui se basent sur l'évolution passée du coût des sinistres pour estimer son déve-
loppement futur. En pratique ces techniques sont utilisées soit pour estimer les réserves purement
IBNR, soit les réserves de sinistres totales.
Dans cet article, nous étudierons des techniques modernes, ou des compléments récents à des
techniques plus anciennes, d'estimation des réserves de sinistre.
Dans la section 2 nous examinerons la méthode bien connue de Chain Ladder. Cette méthode sera
analysée dans un cadre stochastique, permettant de dégager des formules pour l'estimation de la
variabilité des réserves calculées. Nous aurons ainsi des expressions pour l'erreur standard sur la
réserve correspondant à chaque année de survenance de sinistres examinée ainsi que sur la réserve
totale. Ces mesures de variabilité nous permettront de construire des intervalles de conance pour
les réserves.
Nous verrons également comment calculer très facilement ces diverses expressions par des formules
récursives.
Le modèle stochastique, qui sous-tend la méthode de Chain Ladder et qui est utilisé ici, repose
sur trois hypothèses que doivent vérier les données sur lesquelles on désire appliquer la méthode.
Nous verrons dans quelle mesure des tests permettent de vérier que les données satisfont bien à
ces hypothèses.
Ensuite, nous essaierons d'adapter les formules étudiées lors d'une utilisation pratique de la mé-
thode de Chain Ladder. En eet, cette méthode suppose que le coût du sinistre x années après
sa survenance est proportionnel au coût de l'année précédente et que cette proportion ne change
pas, que le sinistre soit survenu il y a 10 ans ou aujourd'hui. En pratique, il est possible que, suite
à un changement dans la politique de paiement ou de réservation par exemple, le développement
des sinistres ne se comporte pas dans les années récentes comme dans les années antérieures. Nous
verrons comment adapter les estimations et les formules d'erreur dans ce cas.
Pour clôturer cette deuxième section, nous examinerons les ratios S/P , c'est-à-dire les montants
de sinistres rapportés à l'encaissement, annuels et moyens, pour lesquels nous pourrons également
aboutir à des formules d'erreur standard.
La section suivante étudie une méthode qui travaille en parallèle sur les données concernant les
paiements eectués et sur les données concernant les montants mis en réserves au l du temps. Elle
permet donc d'utiliser toute l'information disponible et de modéliser séparément les évolutions des
paiements et des réserves tout en les liant entre elles. Nous verrons ensuite comment cette méthode
rejoint celle de Chain Ladder et nous essaierons d'adapter les formules d'erreur présentées dans
la deuxième section pour qu'elles puissent s'appliquer à cette méthode dite des "projected case
estimates".
La dernière section présentera une application des diverses méthodes proposées à des données
réelles, paiements et réserves sur 14 années, issues de la branche responsabilité civile automobile.
2 Chain Ladder stochastique.
La méthode de Chain Ladder est une méthode déterministe permettant d'estimer les réserves
de sinistres. Elle est très simple à utiliser mais les estimations qu'elle fournit pour les années
d'accident les plus récentes sont très sensibles à des variations dans les données observées. Il est
dès lors intéressant de pouvoir quantier la variabilité des réserves estimées, notamment pour
déterminer si la diérence entre les résultats obtenus par Chain Ladder et ceux obtenus par une
autre méthode est signicative, mais également pour construire des intervalles de conance sur
les estimations faites pour prévoir le montant ultime des sinistres. Pour mesurer cette variabilité,
il faut d'abord déterminer quel est le modèle stochastique qui sous-tend la méthode de Chain
Ladder et quelles sont les hypothèses sur lesquelles se base cette méthode.
Cn−1,1 Cn−1,2
Cn,n
La méthode de Chain Ladder estime les montants inconnus, Cik pour i + k > n + 1, par
où
n−k
X
Ci,k+1
fˆk = i=1
n−k
1 ≤ k ≤ n − 1. (2)
X
Cik
i=1
Il est donc supposé que Cik est proportionnel à Ci,k−1 et que le coecient de proportionnalité fk−1 ,
calculé sur base des données sinistres du passé ne dépend pas de l'année d'accident i.
Le montant ultime des sinistres survenus en année i est alors estimé par
La réserve de sinistre pour l'année d'accident i (c'est-à-dire ce qui reste à payer pour les sinistres
survenus en l'année i), qui est dénie par Ri = Cin − Ci,n+1−i , est alors estimée par
L'hypothèse (3) signie qu'étant donné le développement Ci1 , . . . , Cik des sinistres survenus en
année i, il existe un coecient fk tel que l'espérance de Ci,k+1 est égale à Cik fk . Ceci traduit deux
hypothèses de base de la méthode de Chain Ladder. Premièrement seule la valeur la plus récente
Cik est utile pour déterminer Ci,k+1 , et deuxièmement le facteur fk est indépendant de l'année
d'accident i considérée.
L'hypothèse (4) signie quant à elle que les années de survenance sont indépendantes entre elles.
Le théorème suivant montre que si on estime les paramètres du modèle (3) par (2) alors ce
modèle stochastique (3), combiné avec l'hypothèse (4) fournit exactement les mêmes réserves que
la méthode originale de Chain Ladder (1).
Théorème 2.1. Soit D = {Cik | i + k ≤ n + 1}, l'ensemble de toutes les données observées. Sous
les hypothèses (3) et (4), on a
Le théorème suivant montre que estimer fn+1−i · · · fn−1 par fˆn+1−i · · · fˆn−1 fournit un bon esti-
mateur.
Théorème 2.2. Sous les hypothèses (3) et (4), les estimateurs fˆk , donnés par (2) sont non biaisés
et non corrélés.
Par extension on peut également montrer que E(fˆn+1−i · · · fˆn−1 ) = fn+1−i · · · fn−1 , ce qui montre
que Ĉin = Ci,n+1−i · fˆn+1−i · · · fˆn−1 est un estimateur non biaisé de E(Cin | D) = Ci,n+1−i ·
fn+1−i · · · fn−1 . De la même manière, l'estimateur de la réserve, R̂i = Ĉin − Ci,n+1−i , est un
estimateur non biaisé de la vraie réserve Ri = Cin − Ci,n+1−i .
où D est déni comme plus haut, c'est-à-dire comme l'ensemble des données observées.
On s'intéresse ici à une moyenne conditionnelle basée sur l'ensemble de données spécique D
an d'obtenir la déviation moyenne entre Ĉin et Cin due uniquement à l'aléa futur subi par cet
ensemble de données bien spécié et sans tenir compte des déviations passées.
q
L'erreur standard se(Ĉin ) est dénie comme égale à mse(Ĉin ).
Si on s'intéresse à l'erreur sur la réserve, on doit calculer mse(R̂i ) = E[(R̂i − Ri )2 | D]. Comme
R̂i = Ĉin − Ci,n+1−i et Ri = Cin − Ci,n+1−i , on a nalement que
L'erreur d'estimation de la réserve pour une année d'accident est donc égale à l'erreur d'estimation
du montant nal à payer pour les sinistres survenus lors de cette année. En eet, ces deux grandeurs
sont égales à une constante additive près.
qui est une application de la règle générale E(X − a)2 = V ar(X) + (E(X) − a)2 .
Cette formule nous montre que nous aurons donc besoin d'estimer la variance de Cik , ce qui va
nous conduire à dégager une troisième hypothèse pour l'utilisation de la méthode de Chain Ladder.
Ci,k+1
Comme fˆk est la moyenne pondérée par Cik des facteurs de développement individuels , (en
Cik
Pn−k n−k
X n−k
X
ˆ i=1 Ci,k+1 Ci,k+1 Ci,k+1 Cik C
eet fk = Pn−k = Pn−k = Pn−k ), on peut montrer que V ar( Ci,k+1 | Ci1 , . . . , Cik )
i=1 Cik i=1 i=1 Cik i=1
Cik i=1 Cik
ik
doit être inversément proportionnel à Cik , et ce an que fˆk soit un estimateur non biaisé de variance
minimum. Nous reparlerons de cette hypothèse dans la section 2.5.1.
Ci,k+1 σk2
Cette hypothèse peut se réécrire V ar( Cik
| Ci1 , . . . , Cik ) = Cik
, ou encore
Cette hypothèse (5) est (avec (3) et (4)) la troisième hypothèse qui sous-tend implicitement la
méthode de Chain Ladder.
Les paramètres σk2 sont inconnus et devront être estimés.
Le théorème suivant donne la formule permettant d'estimer ce que nous cherchons, à savoir
mse(R̂i ).
Théorème 2.3. Sous les hypothèses (3), (4) et (5), mse(R̂i ) peut être estimé par
n−1
à !
\ X σ̂k2 1 1
2
mse(R̂i ) = Ĉin + Pn−k ,
k=n+1−i fˆ2
k Ĉik j=1 Cjk
où Ĉik = Ci,n+1−i · fˆn+1−i · · · fˆk−1 (k > n + 1 − i) sont les valeurs estimées de Cik et
Ĉi,n+1−i = Ci,n+1−i ,
n−k
X Ci,k+1
1
et où σ̂k = n−k−1
2
Cik ( − fˆk )2 (1 ≤ k ≤ n − 2) est un estimateur sans biais de σk2 ,
i=1
Cik
σ̂ 4
et σ̂n−1
2
= min ( σ̂n−2
2
2
, min (σ̂n−3 2
, σ̂n−2 )).
n−3
Nous avons maintenant des estimations pour la moyenne de la variable Ri (soit R̂i ) et pour
l'écart-type de cette variable (soit se(R̂i )). Il nous reste à faire une hypothèse paramétrique sur la
distribution de Ri pour pouvoir construire facilement des intervalles de conance sur les réserves
estimées. Si le volume de données est susant, on peut supposer que la distribution est normale,
de moyenne la valeur estimée R̂i et d'écart-type
h donné par l'erreur istandard se(R̂i ). Un intervalle
de conance à 95% est alors donné par R̂i − 2se(R̂i ), R̂i + 2se(R̂i ) .
Mais la distribution normale n'est peut-être pas une bonne approximation si la vraie distribution
de Ri n'est pas symétrique. De plus, la distribution normale peut conduire à une borne inférieure
négative même si la réserve ne peut pas être négative. Dans ces cas-là, il vaut mieux utiliser
une approche basée sur une distribution lognormale. Nous approximons alors la distribution de
la réserve R̂i par une distribution lognormale de paramètres µi et σi2 tels que la moyenne et la
variance des deux distributions soient égales, c'est-à-dire tels que :
ce qui conduit à :
σi2
µi = ln(R̂i ) −
2
se(R̂i )
σi2 = ln(1 + ( )2 ).
R̂i
Les bornes d'un intervalle de conance à 95% seront alors données par
· ¸
−σi2 −σi2
[exp(µi − 2σi ), exp(µi + 2σi )] = R̂i exp( − 2σi ), R̂i exp( + 2σi ) .
2 2
Prenons un petit exemple pour illustrer numériquement les diérentes formules rencontrées.
Soit le triangle des montants cumulés de sinistres suivant :
35.40 37.69 39.13 39.76 40.16
38.61 41.61 43.37 44.56
C = 43.85 47.30 49.45
49.52 53.33
55.47
Calculons les coecients de développement fˆk par la formule (2) et les coecients σ̂k2 par la formule
indiquée dans le théorème 2.3. Nous obtenons :
i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.45 0.0521 0.2282 50.90% [−0.01, 0.90] [0.15, 1.04]
3 1.60 0.2766 0.5259 32.89% [0.55, 2.65] [0.80, 2.88]
4 4.05 0.3715 0.6095 15.05% [2.83, 5.27] [2.97, 5.40]
5 8.69 0.5740 0.7576 8.72% [7.17, 10.20] [7.27, 10.30]
Nous observons ici une décroissance de l'erreur relative en fonction de l'année de survenance :
l'erreur absolue augmente moins vite que la valeur de la réserve.
i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.44 0.0028 0.0526 12% [0.33, 0.54] [0.34, 0.55]
3 1.39 0.0296 0.1721 12% [1.05, 1.74] [1.08, 1.77]
4 3.77 0.3160 0.5621 15% [2.65, 4.90] [2.77, 5.02]
5 7.82 0.7952 0.8918 11% [6.04, 9.61] [6.19, 9.76]
Examinons la sensibilité des résultats si on modie la donnée C 0 (2, 4) par rapport au dernier
exemple. Ce seul changement implique une modication des coecients fˆ3 et σ̂32 et aussi de σ̂42 de
par sa construction, modication qui va se répercuter sur toutes les années de survenance et faire
augmenter brusquement les erreurs standards (à cause de la forte augmentation de σ̂32 ).
35.40 37.69 39.13 39.76 40.16
38.61 40.62 42.77 44.56 45.01
C 00 =
43.85 47.30 49.00 50.45 50.96
49.52 52.59 54.80 56.42 56.99
55.47 59.06 61.54 63.36 64.00
Les coecients fˆk et σ̂k2 sont :
σ̂12 = 5.0327 ∗ 10−3 σ̂22 = 3.5648 ∗ 10−3 σ̂32 = 13.5511 ∗ 10−3 σ̂42 = 3.5648 ∗ 10−3 .
L'examen des réserves fournit le tableau suivant :
i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.45 0.3369 0.5804 129% [−0.71, 1.61] [0.04, 1.99]
3 1.96 1.4907 1.2210 62% [−0.49, 4.40] [0.53, 5.23]
4 4.40 2.0389 1.4279 32% [1.55, 7.26] [2.22, 7.88]
5 8.53 2.8472 1.6874 20% [5.15, 11.90] [5.65, 12.38]
Une augmentation d'un montant de sinistre de 2% a donc conduit à une forte augmentation de
la variabilité. Les erreurs standard relatives ont été multipliées par des coecients qui vont de 2
à 10 selon l'année de survenance.
Théorème 2.4. Sous les hypothèses (3), (4) et (5), mse(R̂) peut être estimé par
n
( Ã n
! n−1
)
\ X X X 2σ̂k2 /fˆk2
mse( R̂) = mse(R̂i ) + Ĉin Ĉjn Pn−k .
i=2 j=i+1 k=n+1−i j=1 Cjk
La preuve est donnée dans Mack [1].
Dans le premier exemple ci-dessus, la réserve totale vaut R̂ = 14.79 et l'erreur estimée vaut
\
mse( \
R̂) = 2.3900. Nous avons donc que se(R̂) = 1.5460, soit 10.45% de R̂.
k=n+1−i
où
Ci,k+1
Fik = Cik
,
σ̂ 2
(se(Fik )) = Ĉ k est (c'est l'hypothèse (5)) un estimateur de V ar(Fik | Ci1 , . . . , Cik ) = E[(Fik −
2
ik
fk )2 | Ci1 , . . . , Cik ] qui mesure la variation entre un coecient individuel Fik et la vraie valeur
fk , et
σ̂ 2
(se(fˆk ))2 = Pn−kk
Cjk
est (ceci est démontré dans le cadre de la section 2.6.1) un estimateur de
j=1
V ar(fˆk | Ci1 , . . . , Cik ) = E[(fˆk − fk )2 | Ci1 , . . . , Cik ] qui mesure la déviation entre la moyenne
estimée fˆk et la vraie valeur fk .
Sous cette forme, la formule du calcul de l'erreur conduit au programme de récursion suivant :
se(Ĉi,n+1−i ) = 0
³ ´
(se(Ĉi,k+1 ))2 = Ĉ 2 (se(Fik ))2 + (se(fˆk ))2 + (se(Ĉik ))2 fˆ2
ik k
En utilisant les données du premier exemple précédent, on obtient les résultats suivants pour les
estimateurs de la variance des coecients de développement individuels Fik et de la variance des
coecients de développement globaux de Chain Ladder fˆk :
4.54 ∗ 10−5 1.46 ∗ 10−5 6.76 ∗ 10−5 1.39 ∗ 10−5
4.16 ∗ 10−5 1.32 ∗ 10−5 6.10 ∗ 10−5 1.24 ∗ 10−5
(se(Fik ))2 = −5
3.67 ∗ 10−5 1.16 ∗ 10−5 5.35 ∗ 10−5 1.09 ∗ 10−5
3.25 ∗ 10 1.03 ∗ 10−5 4.76 ∗ 10−5 9.70 ∗ 10−6
2.90 ∗ 10−5 9.24 ∗ 10−6 4.25 ∗ 10−5 8.67 ∗ 10−6
(se(fˆ1 ))2 = 9.61 ∗ 10−6 (se(fˆ2 ))2 = 4.35 ∗ 10−6 (se(fˆ3 ))2 = 3.21 ∗ 10−5 (se(fˆ4 ))2 = 1.391 ∗ 10−5 .
L'utilisation de ces coecients dans la formule récursive conduit aux mêmes résultats que ceux
obtenus par la formule du théorème 2.3.
Pour la réserve totale sur toutes les années d'accident, on a la formule récursive suivante
à à n !!2 à à n !!2
X X
se Ĉi,k+1 = se Ĉi,k · fˆk2
i=n+1−k i=n+2−k
n
X
2
+ Ĉik · (se(Fik ))2
i=n+1−k
à n
!2
X
+ Ĉik · (se(fˆk ))2 ,
i=n+1−k
commençant avec k = 1.
On a donc besoin de valeurs pour fˆult , se(fˆult ) et se(Fi,ult ) ∀i. En pratique on xe fˆult , se(fˆult )
et se(Fi,ult ) pour un i donné. Pour cela, on xe fˆult , par régression ou suivant l'expérience comme
déjà discuté précédemment, puis on cherche k tel que
Il reste à estimer, de la manière la plus raisonnable possible, se(fˆult ) et se(Fi,ult ). On peut par
exemple prendre ces valeurs telles que
Il est donc important de vérier que le triangle de données sur lequel on veut travailler satisfait
bien à ces trois conditions avant de pouvoir appliquer la méthode de Chain Ladder. Les tests
présentés sont tirés de Mack [2].
En guise d'illustration, même si le nombre de données n'est pas vraiment susant pour eectuer
des tests, examinons le cas k = 1 de l'exemple déjà exploité dans les sections précédentes. Les
données sont les suivantes :
60
55
50
Montants Ci2
45
40
35
30
30 35 40 45 50 55
Montants Ci1
Nous voyons donc que les montants suivent de près la droite passant par l'origine et de pente fˆ1 .
En ce qui concerne le caractère aléatoire des résidus, il est dicile de juger vu le petit nombre de
données.
Si les graphes construits ne conduisent pas au résultat escompté, on peut remplacer (5) par d'autres
hypothèses sur la variance et examiner les mêmes types de graphiques que ci-dessus :
V ar(Ci,k+1 ) proportionnelle à 1 (c'est-à-dire, à k donné, V ar(Ci,k+1 ) identique ∀i), ce qui im-
P
plique wi inversément proportionnel à 1. Le problème de minimisation est alors min n−k i=1 (Ci,k+1 −
n−k
X
Ci,k+1 · Cik
Cik · fk )2 , ce qui conduit à la solution fˆk1 = i=1 n−k .
X
2
Cik
i=1
0.03
0.02
0.01
-0.01
Résidus
-0.02
-0.03
-0.04
-0.05
-0.06
-0.07
30 35 40 45 50 55
Montants Ci1
2
V ar(Ci,k+1 ) proportionnelle à Cik 2
, ce qui implique wi inversément proportionnel à Cik . Le
Pn−k 2 2
problème de minimisation est alors min i=1 (Ci,k+1 − Cik · fk ) /Cik , ce qui conduit à la
Xn−k
ˆ 1 Ci,k+1
solution fk2 = n−k .
i=1
C ik
Toutes les formules de calcul d'erreur standard seraient alors à revoir pour ces hypothèses et
coecients de développement donnés, ce qui est facilement faisable.
Illustrons le calcul des rangs rik et si,k+1 par notre exemple habituel, pour lequel n = 5 et pour
lequel les coecients de développement individuels sont les suivants :
k=1 k=2 k=3 k=4
1.0647 1.0382 1.0161 1.0101
1.0777 1.0423 1.0274
1.0787 1.0455
1.0769
Ces coecients conduisent aux rangs suivants :
Nous remarquons d'emblée que dans l'exemple, les coecients gardent le même rang d'une colonne
à l'autre (rik = sik ), ce qui va conduire évidemment à rejeter la non corrélation des coecients
successifs. Nous obtenons en eet T2 = T3 = 1.
On désire tester le triangle dans son ensemble et non pas par paires de colonnes. On va donc
utiliser une statistique de test T globale, moyenne pondérée par n − k − 1 (poids inversément
proportionnels à V ar(Tk )) des Tk :
n−2
X X n−2
n−k−1 n−k−1
T = Pn−2 Tk = Tk ,
k=2 k=2 n − k − 1 k=2
(n − 2)(n − 3)/2
1
E(T ) = 0 et V ar(T ) = .
(n − 2)(n − 3)/2
Si n − k ≥ 10, la distribution de Tk est normale en bonne approximation, et comme T est l'aggré-
gation de plusieurs Tk non corrélés (sous l'hypothèse nulle de non corrélation des coecients de
développement successifs, les Tk sont non corrélés), on peut supposer que T a approximativement
une distribution normale.
2 1
Dans l'exemple T = 3
· T2 + 3
· T3 = 1. Le nombre de données est néanmoins insusant pour
appliquer le test.
Comme le test n'est qu'approximatif et qu'on cherche à détecter des corrélations dans le triangle
entier, on ne prend pas un intervalle de conance à 95% qui a très peu de chances de rejeter la
non corrélation mais un intervalle de conance à 50%.
On ne rejettera donc pas la non corrélation si
−0.67 0, .67
p ≤T ≤ p .
(n − 2)(n − 3)/2 (n − 2)(n − 3)/2
2.5.3 Test de non eet d'une année calendrier.
Il reste à tester l'hypothèse (4), qui suppose l'indépendance des diérentes années de survenance
entre elles. En eet certains triangles de données sont sujets à des eets calendrier (comme par
exemple des changements dans le traitement ou la réservation des sinistres, des changements
d'ination) qui peuvent aecter plusieurs années d'accident de la même façon et donc perturber
l'indépendance.
Soit les éléments d'une diagonale
et les coecients de développement qui dépendent des éléments de Dj , soit que les éléments de
Dj sont au dénominateur :
Cj2 C1,j+1
Aj = { ,..., },
Cj1 C1j
soit que les éléments de Dj sont au numérateur :
Cj−1,2 C1,j
Aj−1 = { ,..., }.
Cj−1,1 C1,j−1
Donc, si les éléments de Dj sont plus grands que d'habitude, les éléments de Aj seront plus petits
et les éléments de Aj−1 plus grands que d'habitude.
Pour chaque colonne k , on marque les coecients de développement par un G s'ils sont supérieurs
à la médiane de la colonne et par un P s'ils sont inférieurs à la médiane. Remarquons que quand
le nombre d'éléments de la colonne est impair, il y a un élément qui est égal à la médiane et qui ne
sera pas marqué. Pour chaque diagonale Aj de coecients de développement (2 ≤ j ≤ n − 1), on
compte alors le nombre d'éléments marqués d'un G, soit Gj et le nombre d'éléments marqués d'un
P , soit Pj . S'il n'y a pas de changement d'une année calendrier à l'autre, alors Gj et Pj doivent
être proches l'un de l'autre, chaque coecient de développement ayant 50% de chances d'être G
G +P
ou P , ou, pour l'exprimer autrement, Zj = min(Gj , Pj ) doit être proche de j 2 j .
Dans l'exemple étudié, les coecients de développement individuel, déjà mentionnés dans la sec-
tion 2.5.2, conduisent à la décomposition en coecients P et coecients G suivante :
P P P ∗
G ∗ G
G G
P
Pour chacune des diagonales le décompte obtenu est alors le suivant :
diag j Pj Gj Zj
2 1 1 1
3 1 1 1
4 1 2 1
Pour élaborer un test, il faut tout d'abord déterminer quels sont les deux premiers moments de
Zj .
En cas de non rejet de l'hypothèse de non eet signicatif d'une année calendrier, Pj suit une loi
binomiale de paramètres nj = Gj + Pj et p = 1/2. On peut alors montrer que
µ ¶
nj nj − 1 nj
E(Zj ) = − ,
2 mj 2nj
µ ¶
nj (nj − 1) nj − 1 nj (nj − 1)
V ar(Zj ) = − + E(Zj ) − (E(Zj ))2 ,
4 mj 2nj
nj −1
où mj = b 2
c.
On ne teste pas les Zj séparément pour éviter une accumulation des erreurs
P de probabilité et on
considère donc une variable globale Z = Z2 + · · · + Zn−1 , avec E(Z) =
P E(Zj ) et V ar(Z) =
V ar(Zj ).
Nous pouvons supposer que Z suit une distribution normale et nous ne rejettons pas l'hypothèse
de non eet signicatif d'une année calendrier (au seuil α = 5%) si
p p
E(Z) − 2 V ar(Z) ≤ Z ≤ E(Z) + 2 V ar(Z).
Si le nombre de données était susant pour appliquer le test, nous trouverions 0.092 ≤ 3 ≤ 3.408,
ce qui conduirait à ne pas rejeter l'indépendance des années de survenance.
Nous allons donc travailler avec le triangle de données suivant, comportant n années de survenance
et n années de développement. Nous supposons que les m premières années de survenance forment
un bloc, c'est-à-dire ont un développement semblable, et que les n − m dernières années forment
un autre bloc, avec un schéma de développement diérent de celui du premier bloc.
C11 C12 ... C1,n−m C1,n−m+1 . . . C1,n−1 C1n
C21 C22 ... C2,n−m C2,n−m+1 . . . C2,n−1
.. .. .. ..
. . . .
...
Cm1 Cm2 . . . Cm,n−m Cm,n−m+1
Cm+1,1 Cm+1,2 . . . Cm+1,n−m
.. ..
. .
...
Cn−1,1 Cn−1,2
Cn1
Remarquons que le triangle pourrait être découpé en un nombre de blocs plus élevé.
Nous utilisons la méthode de Chain Ladder pour obtenir les montants ultimes de sinistres. Nous
considérons donc que les données satisfont aux trois hypothèses habituelles :
Les estimateurs fˆk de fk et σ̂k2 de σk2 auront la même forme que précédemment (voir (2) et théo-
rème 2.3) mais diéreront en fonction de k :
pour k allant de 1 à n − m − 1, les coecients sont calculés à partir des années de survenance
les plus récentes, soit de m + 1 à n,
pour k allant de n − m à n − 1, les coecients sont calculés comme avant, à partir des années
de survenance 1 à m.
Les coecients de développement fˆk sont donc toujours le résultat de régressions linéaires pondé-
rées par C1ik , mais sur un nombre de données moindre. Tout se passe comme si on travaillait sur
deux triangles diérents auxquels on applique, séparément, la méthode de Chain Ladder. Remar-
quons que tant qu'on travaille sur les deux triangles de façon séparée, on n'a pas besoin de fˆn−m
2
et σ̂n−m , coecients permettant de passer d'un triangle à l'autre. De plus, les trois hypothèses
doivent être vériées sur les deux triangles séparés et pas sur l'ensemble de données de départ. En
eet, si on sépare les années de survenance en deux groupes distincts, c'est justement parce que
l'hypothèse (3) n'est pas satisfaite par les données dans leur ensemble.
Le triangle supérieur droit, Cij , pour 1 ≤ i ≤ m et n − m + 1 ≤ j ≤ n + 1 − i conduit aux montants
ultimes C1n , Ĉ2n , . . . , Ĉmn .
Le triangle inférieur gauche Cij , pour m + 1 ≤ i ≤ n et 1 ≤ j ≤ n + 1 − i conduit aux montants
ultimes Cm+1,n−m , Ĉm+2,n−m , . . . , Ĉn,n−m .
C11 C12 . . . C1,n−m C1,n−m+1 . . . C1,n−1 C1n
C21 C22 . . . C2,n−m C2,n−m+1 . . . C2,n−1 Ĉ2n
.. .. .. .. .. ..
. . . . . .
Cm1 C . . . C C . . . Ĉ Ĉ
m2 m,n−m m,n−m+1 m,n−1 mn
Cm+1,1 Cm+1,2 . . . Cm+1,n−m
.. .. ..
. . .
Cn−1,1 Cn−1,2 . . . Ĉn−1,n−m
Cn1 Ĉn2 ... Ĉn,n−m
n−k
X Ci,k+1
σ̂k2 = 1
(n−k)−m−1
Cik ( − fˆk )2 1≤k ≤n−m−2
i=m+1
Cik
(7)
n−k
X Ci,k+1
σ̂k2 = 1
n−k−1
Cik ( − fˆk )2 n−m≤k ≤n−2
i=1
Cik
Les σ̂k2 sont des estimateurs sans biais des σk2 . Il faut encore estimer σn−m−1
2
et σn−1
2
, ce qui peut
se faire par extrapolation sur base des σ̂k précédents ou par une formule du type de celle utilisée
2
On voudrait encore pouvoir estimer les montants ultimes Ĉin pour m+1 ≤ i ≤ n et leur variabilité.
Pour cela, il faut donc d'abord faire une hypothèse sur la façon dont on va compléter le bloc restant,
à savoir le bloc inférieur droit. Nous allons envisager trois hypothèses diérentes.
où les fˆk sont calculés par (6) et les σ̂k2 sont calculés par (7).
La démonstration de cette formule, qui se trouve en annexe, est une adaptation de la démonstration
du théorème 2.3, donnée dans Mack [1].
La formule récursive déterminée à la section 2.4 reste valable, moyennant une petite adaptation :
³ ´
(se(Ĉi,k+1 )) = Ĉik (se(Fik )) + (se(fk )) + (se(Ĉik ))2 fˆk2 ,
2 2 2 ˆ 2
où
σ̂ 2
(se(Fik ))2 = Ĉ k
ik σ̂2
Pn−k k pour 1 ≤ k ≤ n − m − 1
ˆ j=m+1 Cjk
(se(fk )) =
2
σ̂k2
Pn−k pour n − m ≤ k ≤ n − 1.
j=1 Cjk
2.6.2 Deuxième hypothèse.
Utiliser des facteurs de développement calculés sur les m premières années pour compléter la partie
inférieure de la matrice, alors qu'on l'avait coupée en deux justement parce que le développement
des années récentes était diérent de celui des années antérieures, n'est peut-être pas très logique.
Une autre hypothèse est de supposer que le développement total, depuis l'année 1 jusqu'à l'année
n est le même pour toutes les années de survenance (depuis 1 jusque n). Nous supposons donc que
Cin = ftot · Ci1 ∀i. Nous estimons alors ftot par fˆtot sur les m premières années de survenance :
m
X
Ĉin
fˆtot = i=1
m .
X
Ci1
i=1
Nous examinons ensuite quel est le développement total déjà subi par les sinistres survenus durant
les années m + 1 à n et nous l'estimons par
n
X
Ĉi,n−m
i=m+1
fˆint = n .
X
Ci1
i=m+1
En calculant le rapport fˆtot /fˆint , nous obtenons le facteur par lequel multiplier les montants de
sinistres estimés en année de développement (n − m) an d'obtenir les montants de ces sinistres
en l'année de développement n. Ce facteur est donc comparable à un tail factor,
fˆtot
fˆult = ,
fˆint
et nous utilisons la formule obtenue à la section 2.4.2 pour obtenir l'estimation de la variabilité
de Ĉin pour m + 1 ≤ i ≤ n.
Remarque : d'autres dénitions du fˆult peuvent être utilisées pour compléter le triangle inférieur. Si
les observations conduisent à penser que le développement total des sinistres sera moins important
pour les années m + 1 à n que pour les années précédentes (parce qu'on s'aperçoit qu'on paie une
fraction plus importante du sinistre lors de la première année de développement), alors on peut
prendre
4/5fˆtot
fˆult = ,
fˆint
par exemple.
\ ˆ ) \ ˆ ) en % de S/P
ˆ
i Ĉin enci S/P se(S/P se(S/P
2 45.01 64 0.7033 0.0036 0.51%
3 51.05 77 0.6630 0.0068 1.03%
4 57.38 78 0.7357 0.0078 1.06%
5 64.16 85 0.7548 0.0089 1.18%
Pour ce faire une idée de la sinistralité attendue on travaille souvent avec un S/P moyen calculé
Xn
1 Cin
sur les dernières années de survenance. Dénissons ainsi (S/P )m = , le S/P
n − m + 1 i=m enci
moyen des années de survenance m (1 ≤ m ≤ n) à n et estimons-le en remplaçant simplement
Cin par Ĉin . Pour estimer l'erreur sur ce S/P moyen, nous aurons donc besoin de l'erreur d'une
somme et nous utilisons donc la même méthode que celle déjà employée à la section 2.3.2 pour
obtenir l'erreur sur la réserve totale. Nous obtenons alors :
n
( Ã n
! n−1
)
\ 1 X mse(Ĉin ) Ĉin X Ĉjn X 2σ̂k2 /fˆk2
ˆ )m ] =
mse[(S/P + Pn−k .
(n − m + 1)2 i=m (enci )2 enci j=i+1
encj
k=n+1−i j=1 Cjk
Pour l'exemple et pour (S/P )m étant le ratio S/P moyen calculé sur les années i à n (c'est-à-dire
m = i), cela nous donne :
\ ˆ )m ] \ ˆ )m ] en % de (S/P
ˆ )m
i Ĉin enci (S/P )m se[(S/P se[(S/P
1 40.16 60 0.7052 0.0039 0.55%
2 45.01 64 0.7142 0.0049 0.68%
3 51.05 77 0.7178 0.0060 0.84%
4 57.38 78 0.7452 0.0070 0.93%
5 64.16 85 0.7548 0.0089 1.18%
Enn, les S/P moyens utilisés sont le plus Pnsouvent obtenus par des moyennes pondérées par
1 C
l'encaissement, soit (S/P )pm = Pni=m in . L'erreur sur ce ratio S/P moyen est alors
n − m + 1 i=m enci
donnée par
1 \X n
\ ˆ p
P 2
mse[(S/P )m ] = ( n ) mse( Ĉin ),
i=m enci i=m
Pn
où mse(\ i=m Ĉin ) a été obtenu à la section 2.3.2.
Pour l'exemple et pour (S/P )pm étant le ratio S/P moyen pondéré calculé sur les années i à n
(c'est-à-dire m = i), cela nous donne :
\ ˆ )pm ] \ ˆ )p
ˆ )pm ] en % de (S/P
i Ĉin enci (S/P )pm se[(S/P se[(S/P m
1 40.16 60 0.7081 0.0042 0.60%
2 45.01 64 0.7158 0.0051 0.71%
3 51.05 77 0.7191 0.0061 0.84%
4 57.38 78 0.7456 0.0070 0.94%
5 64.16 85 0.7548 0.0089 1.18%
Reprenons toujours le même exemple traité dans les chapitres précédents et supposons que les don-
nées concernaient des montants totaux de sinistres (paiements + réserves) pouvant se décomposer
en une matrice des paiements décumulés C et une matrice des réserves de sinistres Q.
15.40 4.90 7.77 7.19 4.30 20.0 17.39 11.06 4.50 0.60
16.61 2.60 11.03 9.12 22.0 22.40 13.13 5.20
C=
21.35 7.29 5.59
Q=
22.5 18.66 15.22
24.52 8.49 25.0 20.32
30.47 25.0
15.40 4.90 7.77 7.19 4.30 20.0 17.39 11.06 4.50 0.60
16.61 2.60 11.03 9.12 4.97 22.0 22.40 13.13 5.20 0.69
C=
21.35 7.29 5.59 10.26 5.83 Q=
22.5 18.66 15.22 6.10 0.81
24.52 8.49 8.48 9.24 5.25 25.0 20.32 13.70 5.49 0.73
30.47 6.50 9.18 10.00 5.68 25.0 22.00 14.84 5.95 0.79
Si on recumule les paiements et qu'on les ajoute aux réserves de sinistres, on obtient les résultats
totaux suivants :
35.40 37.69 39.13 39.76 40.16
38.61 41.61 43.37 44.56 45.02
43.85 47.30 49.45 50.60 51.14
49.52 53.33 55.19 56.22 56.71
55.47 58.98 60.99 62.11 62.63
En remplaçant les diérents termes du facteur (k(j + 1) − h(j + 1)) par les estimateurs (9) et (11),
nous obtenons
n−j
X
Q∗ (i, j + 1)
i=1
Q̂∗ (i, j + 1) = n−j
· Q∗ (i, j),
X
Q∗ (i, j)
i=1
ce qui revient à appliquer la méthode de Chain Ladder standard au triangle des réserves.
Plutôt que d'utiliser la méthode vue à la section 3.3, on peut donc tout simplement compléter
le triangle des réserves par la méthode de Chain Ladder, calculer les coecients ĥ(j + 1) par la
formule (11) et enn compléter le triangle des paiements.
Les coecients de développement de la méthode de Chain Ladder calculés pour le triangle des
réserves ci-dessus sont
Comme il existe un lien entre ce modèle et la méthode de Chain Ladder, on peut espérer trouver
des formules pour les erreurs standard sur les montants estimés.
En ce qui concerne les réserves, extrapolées par la méthode de Chain Ladder, on peut appliquer
directement les formules du chapitre 2.
Examinons plus en détails le cas des paiements. Le modèle des paiements conduit à la formule
suivante :
Ĉi,k+1 = ĥ(k + 1) · Q̂ik ,
où Qik est estimé par la méthode de Chain Ladder, soit
Q̂ik = Q̂i,k−1 · fˆk−1 = . . . = Qi,n+1−i · fˆn+1−i · · · fˆk−1 .
On obtient donc que
Ĉi,k+1 = Qi,n+1−i · fˆn+1−i · · · fˆk−1 · ĥ(k + 1),
ce qui ressemble fort au modèle de Chain Ladder.
De manière similaire aux développements du chapitre 2, nous nous baserons donc sur les hypothèses
suivantes :
Indépendance des années de survenance entre elles,
E[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = fk · Qik ,
E[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = h(k + 1) · Qik ,
V ar[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = σk2 · Qik ,
V ar[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = τk2 · Qik .
Les paramètres sont estimés par les formules suivantes :
n−k
X
Qi,k+1
fˆk = i=1
n−k
,
X
Qi,k
i=1
n−k
X
Ci,k+1
i=1
ĥ(k + 1) = n−k
,
X
Qi,k
i=1
X n−k µ ¶2
1 Qi,k+1
σ̂k2 = Qik − fˆk ,
n − k − 1 i=1 Qik
X n−k µ ¶2
1 Ci,k+1
τ̂k2 = Qik − ĥ(k + 1) .
n − k − 1 i=1 Qik
Tous ces estimateurs sont non biaisés.
En adaptant la démonstration du théorème 2.3 (dont une version est donnée en annexe), nous
trouvons l'expression suivante pour l'estimation de l'erreur carrée moyenne sur le montant Cik :
" k−2
à ! à !#
\ X σ̂j2 1 1 2
τ̂k−1 1 1
2
mse(Ĉik ) = Ĉik + Pn−j + + Pn−k+1 .
j=n+1−i fˆ2
j Q̂ij l=1 Qlj ĥ(k)2 Q̂i,k−1 l=1 Ql,k−1
4 Application.
Nous allons maintenant appliquer les diverses méthodes proposées dans les chapitres précédents
à des données réelles, issues de contrats en responsabilité civile automobile d'une compagnie alle-
mande. Nous disposons de données concernant les montants payés et les montants en réserve pour
les sinistres survenus entre 1985 et 1998.
4.1 Données.
Les tableaux 1 et 2 reprennent respectivement les données de paiements et de réserves.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1985 31499 43711 45509 46312 46786 47204 47404 47768 47963 48168 48428 48557 48863 49081
1986 36822 49591 51733 52841 53605 54156 54857 55256 55433 55791 56014 56416 56640
1987 40962 53307 55310 56594 57359 58096 58525 58886 59416 59721 60031 60472
1988 43350 56043 57981 58942 59844 60463 61006 61349 61715 61934 62267
1989 42638 55788 58168 59980 60944 62208 63360 64064 64617 65018
1990 44666 60675 63281 64662 65543 66268 66797 67314 68541
1991 58291 83957 87690 90437 92102 94021 95751 96794
1992 69050 93642 97694 100042 101654 103027 104706
1993 68513 91377 95537 98251 100020 100857
1994 63337 85106 88755 91226 93105
1995 62555 81700 84782 86785
1996 59407 78481 81517
1997 61091 79892
1998 74211
La méthode PCE (Projected Case Estimates) donne des résultats plus élevés que Chain Ladder
quand on se rapproche des années de survenance plus récentes. C'est surtout vrai pour le montant
correspondant à l'année 1998, ce qui est dû à un coecient ĥ(2) (voir tableau 4) et à une réserve
de départ particulièrement élevés.
Le tableau 4 présente les coecients de développement de la méthode de Chain Ladder, fˆk et les
σ̂k correspondants ainsi que les coecients de développement du modèle des réserves ( k(j + 1))
et du modèle des paiements (h(j + 1)) de la méthode des "projected case estimates".
On observe une décroissance de l'erreur standard relative au l des années de survenance : l'erreur
absolue augmente moins vite que la valeur de la réserve.
Remarquons que pour la méthode de Chain Ladder, les résultats sont obtenus en travaillant di-
rectement avec le triangle des montants totaux. Pour l'autre méthode, les montants sont obtenus
en sommant les triangles de paiements et de réserves complétés séparément. Si on applique sépa-
rément la méthode de Chain Ladder aux triangles de paiements et de réserves, et puis qu'on les
somme, on obtient des montants plus faibles : par exemple ; 116,315,139 en 1998.
Nous constatons donc que les tests conduisent à rejeter la non corrélation des coecients de
développement successifs mais à accepter le non eet d'une année calendrier. En examinant les co-
ecients de développement individuels présentés dans le tableau 7, nous constatons que les années
de survenance plus récentes ne se comportent pas tout-à-fait comme les années plus anciennes, les
coecients sont plus faibles la première année et plus élevés l'année suivante.
Nous pouvons appliquer la méthode vue dans la section 2.6 et séparer le triangle en deux groupes :
nous considérons que les 8 premières années de survenance forment un groupe et les 6 dernières un
autre groupe. Nous obtenons donc deux triangles à compléter séparément et sur lesquels eectuer
les tests.
1. Triangle supérieur droit (taille n = 8) :
(a) test de non corrélation des coecients de développement successifs : −0, 2610 ∈
/ [−0.1730; 0.1730],
(b) test de non eet d'une année calendrier : 5 ∈ [4.3388; 10.4112].
2. Triangle inférieur gauche (taille n = 6) :
(a) test de non corrélation des coecients de développement successifs : 0.5666 ∈
/ [−0.2735; 0.2735],
(b) test de non eet d'une année calendrier : 2 ∈ [0.8787; 5.1213].
Nous constatons que le test de non corrélation des coecients n'est toujours pas vérié mais le
découpage du triangle apporte quand même une amélioration par rapport au triangle dans son
ensemble. D'ailleurs si on considérait des intervalles de conance à 95% (plutôt qu'à 50%), on
trouverait −0.2610 ∈ [−0.5164; 0.5164] pour le bloc supérieur droit et 0.5666 ∈ [−0.8165; 0.8165]
pour le bloc inférieur gauche, alors que pour le triangle entier le test échoue encore : 0.4133 ∈
/
[−0.2462; 0.2462].
Le bloc inférieur gauche et le bloc supérieur droit sont complétés séparément par la méthode de
Chain Ladder. Examinons les trois hypothèses envisagées pour compléter le bloc inférieur droit.
1. Première hypothèse.
Le bloc inférieur droit est complété en utilisant les coecients du bloc supérieur droit. Nous
obtenons les résultats présentés dans le tableau 8.
2. Deuxième hypothèse.
Le bloc inférieur droit est complété en utilisant un tail factor. Le développement total après
14 années subi par les sinistres survenus entre 1985 et 1992 est en moyenne fˆtot = 1, 5691. Le
développement déjà subi sur les 6 premières années par les sinistres survenus entre 1993 et
1998 est en moyenne fˆint = 1, 4536. Nous devons donc encore multiplier les montants obtenus
ˆtot
en sixième année de développement pour le bloc inférieur gauche par fˆult = ffint = 1, 0795
pour obtenir les montants ultimes (après 14 années de développement). Nous avons que
fˆ1 ≥ fˆult ≥ fˆ2 , en eet 1, 3228 ≥ 1, 0795 ≥ 1, 0414 et nous choisissons donc se(fˆ1 ) ≥
k fk σk i Cin Ri se(Ri ) se(Ri ) en % de Ri
1 1.3228 129.7850 1986 56,892,686 252,683 82,361 33%
2 1.0414 33.7574 1987 61,048,730 576,893 145,563 25%
3 1.0267 24.4490 1988 63,232,335 965,571 232,266 24%
4 1.0193 17.7686 1989 66,354,966 1,337,211 244,398 18%
5 1.0084 12.9136 1990 70,310,892 1,769,736 269,468 15%
6 1.0128 44.4508 1991 100,146,339 3,352,433 598,863 18%
7 1.0083 17.9956 1992 109,235,417 4,529,328 667,898 15%
8 1.0086 43.0330 1993 106,563,521 5,706,261 830,105 15%
9 1.0051 9.5186 1994 99,195,748 6,090,713 815,077 13%
10 1.0050 4.9988 1995 94,242,946 7,457,874 817,941 11%
11 1.0059 19.0237 1996 90,886,836 9,370,083 845,387 9%
12 1.0051 11.9030 1997 92,760,555 12,867,689 934,280 7%
13 1.0045 7.4477 1998 113,978,529 39,767,233 1,791,697 5%
se(fˆult ) ≥ se(fˆ2 ), ainsi que se(Fi1 ) ≥ se(Fi,ult ) ≥ se(Fi2 ) pour un certain i. Nous trouvons
alors les résultats présentés dans le tableau 9.
3. Constatations sur les deux premières hypothèses.
Par rapport au tableau 5 où on utilisait la méthode de Chain Ladder sur le triangle dans
son ensemble, on constate que l'utilisation de l'hypothèse 1 pour compléter le bloc inférieur
droit conduit à des erreurs relatives du même ordre de grandeur mais plus faibles quand on
se rapproche de l'année 1998. Ceci est dû au fait que les coecients de développement f1
à f5 sont estimés sur un groupe plus restreint d'années de survenance, où la volatilité des
coecients individuels est plus faible.
Le remplissage du bloc inférieur droit par l'hypothèse 2 conduit à des erreurs relatives encore
plus faibles. En eet, au lieu d'accumuler des erreurs d'estimation en utilisant une série de
coecients de développement, un seul coecient global est utilisé.
Remarquons que les erreurs calculées reètent les erreurs d'estimation des paramètres du
modèle mais ne permettent pas de dire que l'hypothèse 2 est meilleure que l'hypothèse 1.
4. Troisième hypothèse.
Nous repartons des coecients estimés par la méthode de Chain Ladder sur le triangle
inférieur gauche et rappelés dans le tableau 10.
k 1 2 3 4 5
fk 1.3228 1.0414 1.0267 1.0193 1.0084
Nous ajustons alors une courbe puissance inverse par régression linéaire de ln(fk − 1) sur
ln(1/k) et nous trouvons le modèle
Nous complétons alors le bloc inférieur droit par ces coecients pour obtenir les montants
ultimes présentés au tableau 12.
i 1993 1994 1995 1996 1997 1998
Ci,14 103,206,942 96,071,243 91,274,445 88,024,048 89,838,263 110,388,390
En résumé, l'hypothèse 1 suppose que les sinistres des années plus récentes, qui se sont développés
moins vite au début, vont ensuite reprendre le même développement que les sinistres des années
antérieures. L'hypothèse 2 suppose que, au total, ces sinistres se développent comme dans le
passé, et que donc, s'ils se développent moins au début, ils se développeront plus vite par la suite.
L'hypothèse 3 suppose que si les sinistres se sont développés moins vite au début, ils continueront
à le faire par la suite. Elle conduit donc à des montants naux moins élevés.
5 Conclusion.
Dans ce travail nous avons envisagé le problème de l'écart entre la vraie valeur du coût des
sinistres et le montant calculé par une méthode IBNR. Dans ce cadre, nous avons examiné des
formules d'estimation de la variabilité des réserves calculées par la méthode de Chain Ladder. Cette
méthode est très simple à utiliser et de ce fait ne reète pas toujours bien la réalité et présente des
faiblesses, notamment dans l'estimation des réserves pour les années d'accident les plus récentes.
Mais sa simplicité d'emploi est également un grand avantage en ce sens que l'utilisateur peut
facilement comprendre comment elle fonctionne et, le cas échéant, l'adapter pour qu'elle s'applique
de manière plus adéquate à ses données. Nous avons alors vu qu'il était encore possible de trouver
des formules d'erreur pour les réserves lorsqu'on utilise Chain Ladder de manière non standard.
D'autres adaptations des formules d'erreur ont ensuite été envisagées : d'une part dans le cas où
on s'intéresse au rapport entre la sinistralité et l'encaissement (formules d'erreur pour les ratios
S/P ) et d'autre part dans le cas de l'utilisation d'une méthode combinant l'examen de l'évolution
des paiements avec celui de l'évolution des réserves (projected case estimates).
Références
[1] Mack, Th. (1993). Distribution-free calculation of the standard error of Chain Ladder reserve
estimates. ASTIN Bulletin 23, 213-225.
[2] Mack, Th. (1993). Measuring the variability of chain ladder reserve estimates. Meeting of the
Casualty Actuarial Society, 101-182.
[3] Mack, Th. (1994). Which stochastic model is underlying the chain ladder method ?. Insu-
rance : Mathematics and Economics 15, 133-138.
[4] Mack, Th. (1999). The standard error of chain ladder reserve estimates : recursive calculation
and inclusion of a tail factor. ASTIN Bulletin 29, 361-366.
[5] Sherman, R.E. (1984). Extrapolating, smoothing, and interpolating development factors. Pro-
ceedings of the Casualty Actuarial Society, vol LXXI, 122-155.
[6] Taylor, G.C. (2000). Loss Reserving : an actuarial perspective. Kluwer Academic Publishers.
Annexe
Démonstration de l'adaptation du théorème donnant l'erreur sur une réserve individuelle au cas
de la décomposition en bloc du triangle de données et de l'utilisation de la première hypothèse,
voir la section 2.6.1, pour compléter le bloc inférieur droit.
L'erreur d'estimation de la réserve pour les années d'accident m + 1 ≤ i ≤ n correspondant au
bloc inférieur droit vaut :
où les fˆk sont calculés par (6) et les σ̂k2 sont calculés par (7).
Démonstration :
Nous utilisons les abréviations
Ei (X) = E(X | Ci1 , . . . , Ci,n+1−i ),
V ari (X) = V ar(X | Ci1 , . . . , Ci,n+1−i ).
Nous repartons de la dénition :
mse(R̂i ) = V ar(Cin | D) + (E(Cin | D) − Ĉin )2 ,
où D est l'ensemble des données utilisées, soit D = {Cik , 1 ≤ i ≤ m, n − m ≤ k ≤
n + 1 − i} ∪ {Cik , m + 1 ≤ i ≤ n, 1 ≤ k ≤ n + 1 − i}.
En appliquant de façon répétée le modèle de Chain Ladder (3) et l'hypothèse de va-
riance (5), le premier terme de la dénition de mse(R̂i ) peut être réécrit comme :
V ar(Cin | D) = V ari (Cin ) par (4)
= Ei (V ar(Cin | Ci1 , . . . , Ci,n−1 )) + V ari (E(Cin | Ci1 , . . . , Ci,n−1 ))
2 2
= Ei (Ci,n−1 ) σn−1 + V ari (Ci,n−1 ) fn−1 par (5) et (3)
2 2
= Ei (E(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) σn−1 + Ei (V ar(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) fn−1
2
+V ari (E(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) fn−1
2 2 2 2 2
= Ei (Ci,n−2 ) fn−2 σn−1 + Ei (Ci,n−2 ) σn−2 fn−1 + V ari (Ci,n−2 ) fn−2 fn−1
par (5) et (3)
..
.
n−1
X
= Ci,n+1−i fn+1−i · · · fk−1 · σk2 · fk+1
2 2
· · · fn−1 ,
k=n+1−i
k=n+1−i
fˆn+1−i · · · fˆn−1
n−1
X 2 2
2 · σ̂k2
= Ci,n+1−i
ˆ ˆ ˆ2
k=n+1−i Ci,n+1−i · fn+1−i · · · fk−1 · fk
n−1
X
2 σ̂k2 /fˆk2
= Ĉin (∗)
k=n+1−i
Ĉik
En ce qui concerne le deuxième terme de mse(R̂i ), nous utilisons le théorème 2.1 pour
le réécrire sous la forme :
Pour estimer ce second terme on ne peut pas simplement remplacer fk par son estima-
teur car cela conduirait à l'annuler. Nous utilisons donc une autre approche. Posons
où
Sk = fˆn+1−i · · · fˆk−1 · (fk − fˆk ) · fk+1 · · · fn−1 .
Nous avons alors
F 2 = (Sn+1−i + · · · + Sn−1 )2
n−1
X X
= Sk2 + 2 Sj Sk .
k=n+1−i j<k
Nous approximons ensuite Sk2 par E(Sk2 | Bk ) et Sj Sk par E(Sj Sk | Bk ), où Bk est l'en-
semble de toutes les données utiles et connues jusqu'à l'année de développement k ,
c'est-à-dire Bk = {Cij , j ≤ k, i + j ≤ n + 1, i ≥ m + 1} si k ≤ n − m − 1 et
Bk = {Cij , n − m ≤ j ≤ k, i + j ≤ n + 1} si k ≥ n − m.
Comme E(fk − fˆk | Bk ) = 0 (car fˆk est un estimateur non biaisé de fk ), nous avons
que E(Sj Sk | Bk ) = 0.
Comme, pour 1 ≤ k ≤ n − m − 1,
σ2
= Pn−k k ,
i=m+1 Cik
et comme, pour n − m ≤ k ≤ n − 1,
σk2
= Pn−k ,
i=1 Cik
nous obtenons
σ2
E(Sk2 | Bk ) = fn+1−i
2 2
· · · fk−1 · Pn−k k 2
· fk+1 2
· · · fn−1 pour 1 ≤ k ≤ n − m − 1,
i=m+1 Cik
et
σ2
E(Sk2 | Bk ) = fn+1−i
2 2
· · · fk−1 · Pn−kk 2
· fk+1 2
· · · fn−1 pour n − m ≤ k ≤ n − 1.
i=1 Cik
P
Nous estimons donc F 2 par 2
k E(Sk | Bk ) et nous pouvons à présent remplacer les
paramètres fk et σk2 , par leurs estimateurs fˆk et σ̂k2 , c'est-à-dire que nous estimons le
second terme de mse(R̂i ) par :
à n−m−1
X σ̂ 2
(E(Cin\ 2
| D) − Ĉin )2 = Ci,n+1−i fˆn+1−i
2
· · · fˆk−1
2
· Pn−k k · fˆk+1
2
· · · fˆn−1
2
n−1
!
X σ̂k2
+ fˆn+1−i
2
· · · fˆk−1
2
· Pn−k · fˆk+1
2
· · · fˆn−1
2
à n−m−1 n−1
!
X σ̂k2 /fˆk2 X
σ̂k2 /fˆk2
2
= Ĉin Pn−k + Pn−k (∗∗)
k=n+1−i i=m+1 Cik k=n−m i=1 Cik
En additionnant les expressions (∗) et (∗∗), nous retrouvons la formule proposée pour
\
mse( Ĉ ).
in
Résumé
L'estimation des réserves de sinistre se fait généralement par des techniques dites IBNR. Cet
article a pour but principal d'examiner l'une d'entre elles, la méthode Chain Ladder, dans un
cadre stochastique. Ce type d'analyse permet de dégager des formules pour estimer la variabilité
des réserves calculées et, par suite, de construire des intervalles de conance pour ces réserves.
Nous verrons également comment adapter facilement les formules étudiées pour des cas particuliers
d'utilisation pratique de la méthode de Chain Ladder.
Samenvatting
De schatting van de schadereserves gebeurt gewoonlijk aan de hand van technieken IBNR genoemd.
Dit artikel heeft als belangrijkste doel het onderzoek van één van deze technieken, de Chain
Ladder methode, in een stochastisch kader. Dit soort analyse laat toe formules af te leiden om
de variabiliteit van de berekende reserves te schatten, en bijgevolg betrouwbaarheidsintervallen te
construeren voor deze reserves. We zullen ook zien hoe op een gemakkelijke manier de bestudeerde
formules kunnen aangepast worden voor speciale gevallen van praktisch gebruik van de Chain
Ladder methode.
Abstract
The estimation of claims reserves is usually done by applying techniques called IBNR techniques.
The main objective of this article is to examine one of these techniques, sc. the Chain Ladder
method, within a stochastic framework. This kind of analysis allows us to deduct formulae to esti-
mate the variability of the calculated reserves and consequently enables us to construct condence
intervals for these reserves. We shall also demonstrate how the deducted formulae can easily be
adapted for particular cases of practical use of the Chain Ladder method.