Vous êtes sur la page 1sur 34

Sandra Pitrebois

Philippe De Longueville
Michel Denuit
Jean-François Walhin

Etude de techniques IBNR modernes

SOMMAIRE

1. Introduction
2. Chain Ladder Stochastique
3. Projected Case Estimates
4. Application
5. Conclusion
Références
Annexe
Résumé
1 Introduction.
Le paiement des sinistres ne s'eectue pas toujours en une fois, dans l'année même de survenance.
C'est particulièrement vrai dans certaines branches de l'assurance, comme par exemple la res-
ponsabilité civile automobile dans le cas de sinistres avec dommages corporels. Au contraire, le
règlement des sinistres s'étale au l du temps et il est nécessaire de constituer des réserves pour
pouvoir honorer les dettes futures. Comme le montant qui sera nalement payé pour le sinistre
est inconnu au départ, la somme à mettre en réserve est également inconnue et il faut l'estimer.
Ces estimations peuvent être calculées par des techniques, dites techniques IBNR (Incurred But
Not Reported), qui se basent sur l'évolution passée du coût des sinistres pour estimer son déve-
loppement futur. En pratique ces techniques sont utilisées soit pour estimer les réserves purement
IBNR, soit les réserves de sinistres totales.

Dans cet article, nous étudierons des techniques modernes, ou des compléments récents à des
techniques plus anciennes, d'estimation des réserves de sinistre.

Dans la section 2 nous examinerons la méthode bien connue de Chain Ladder. Cette méthode sera
analysée dans un cadre stochastique, permettant de dégager des formules pour l'estimation de la
variabilité des réserves calculées. Nous aurons ainsi des expressions pour l'erreur standard sur la
réserve correspondant à chaque année de survenance de sinistres examinée ainsi que sur la réserve
totale. Ces mesures de variabilité nous permettront de construire des intervalles de conance pour
les réserves.
Nous verrons également comment calculer très facilement ces diverses expressions par des formules
récursives.
Le modèle stochastique, qui sous-tend la méthode de Chain Ladder et qui est utilisé ici, repose
sur trois hypothèses que doivent vérier les données sur lesquelles on désire appliquer la méthode.
Nous verrons dans quelle mesure des tests permettent de vérier que les données satisfont bien à
ces hypothèses.
Ensuite, nous essaierons d'adapter les formules étudiées lors d'une utilisation pratique de la mé-
thode de Chain Ladder. En eet, cette méthode suppose que le coût du sinistre x années après
sa survenance est proportionnel au coût de l'année précédente et que cette proportion ne change
pas, que le sinistre soit survenu il y a 10 ans ou aujourd'hui. En pratique, il est possible que, suite
à un changement dans la politique de paiement ou de réservation par exemple, le développement
des sinistres ne se comporte pas dans les années récentes comme dans les années antérieures. Nous
verrons comment adapter les estimations et les formules d'erreur dans ce cas.
Pour clôturer cette deuxième section, nous examinerons les ratios S/P , c'est-à-dire les montants
de sinistres rapportés à l'encaissement, annuels et moyens, pour lesquels nous pourrons également
aboutir à des formules d'erreur standard.

La section suivante étudie une méthode qui travaille en parallèle sur les données concernant les
paiements eectués et sur les données concernant les montants mis en réserves au l du temps. Elle
permet donc d'utiliser toute l'information disponible et de modéliser séparément les évolutions des
paiements et des réserves tout en les liant entre elles. Nous verrons ensuite comment cette méthode
rejoint celle de Chain Ladder et nous essaierons d'adapter les formules d'erreur présentées dans
la deuxième section pour qu'elles puissent s'appliquer à cette méthode dite des "projected case
estimates".

La dernière section présentera une application des diverses méthodes proposées à des données
réelles, paiements et réserves sur 14 années, issues de la branche responsabilité civile automobile.
2 Chain Ladder stochastique.
La méthode de Chain Ladder est une méthode déterministe permettant d'estimer les réserves
de sinistres. Elle est très simple à utiliser mais les estimations qu'elle fournit pour les années
d'accident les plus récentes sont très sensibles à des variations dans les données observées. Il est
dès lors intéressant de pouvoir quantier la variabilité des réserves estimées, notamment pour
déterminer si la diérence entre les résultats obtenus par Chain Ladder et ceux obtenus par une
autre méthode est signicative, mais également pour construire des intervalles de conance sur
les estimations faites pour prévoir le montant ultime des sinistres. Pour mesurer cette variabilité,
il faut d'abord déterminer quel est le modèle stochastique qui sous-tend la méthode de Chain
Ladder et quelles sont les hypothèses sur lesquelles se base cette méthode.

2.1 La méthode de Chain Ladder déterministe.


Commençons par rappeler les notations et formules usuelles relatives à cette méthode. Soit Cik le
montant, cumulé jusqu'en l'année de développement k , des sinistres survenus en l'année d'accident
i, pour 1 ≤ i, k ≤ n. Cik peut représenter soit le montant payé, soit le coût total estimé (paiement
déjà eectué plus réserve) du sinistre. Les montants Cik sont connus pour i + k ≤ n + 1 et on
cherche à estimer les valeurs des Cik pour i + k > n + 1, et en particulier les valeurs ultimes Cin
pour 2 ≤ i ≤ n. Ces notations sont illustrées dans le triangle suivant :
 
C1,1 C1,2 · · · C1,n−1 C1,n
 C2,1 C2,2 · · · C1,n−1 
 
 .. .. 
C= . . 
...

 
Cn−1,1 Cn−1,2 
Cn,n

La méthode de Chain Ladder estime les montants inconnus, Cik pour i + k > n + 1, par

Ĉik = Ci,n+1−i · fˆn+1−i · · · fˆk−1 i + k > n + 1, (1)


n−k
X
Ci,k+1
fˆk = i=1
n−k
1 ≤ k ≤ n − 1. (2)
X
Cik
i=1

Il est donc supposé que Cik est proportionnel à Ci,k−1 et que le coecient de proportionnalité fk−1 ,
calculé sur base des données sinistres du passé ne dépend pas de l'année d'accident i.
Le montant ultime des sinistres survenus en année i est alors estimé par

Ĉin = Ci,n+1−i · fˆn+1−i · · · fˆn−1 2 ≤ i ≤ n.

La réserve de sinistre pour l'année d'accident i (c'est-à-dire ce qui reste à payer pour les sinistres
survenus en l'année i), qui est dénie par Ri = Cin − Ci,n+1−i , est alors estimée par

R̂i = Ci,n+1−i · fˆn+1−i · · · fˆn−1 − Ci,n+1−i 2 ≤ i ≤ n.


2.2 Un modèle stochastique pour la méthode de Chain Ladder.
Le modèle stochastique, présenté dans Mack [1] , [2] et [3] relatif à la méthode de Chain Ladder
repose sur trois hypothèses. Les deux premières sont les suivantes :

E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1 (3)


{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } ∀i, j sont indépendants (4)

L'hypothèse (3) signie qu'étant donné le développement Ci1 , . . . , Cik des sinistres survenus en
année i, il existe un coecient fk tel que l'espérance de Ci,k+1 est égale à Cik fk . Ceci traduit deux
hypothèses de base de la méthode de Chain Ladder. Premièrement seule la valeur la plus récente
Cik est utile pour déterminer Ci,k+1 , et deuxièmement le facteur fk est indépendant de l'année
d'accident i considérée.
L'hypothèse (4) signie quant à elle que les années de survenance sont indépendantes entre elles.

Le théorème suivant montre que si on estime les paramètres du modèle (3) par (2) alors ce
modèle stochastique (3), combiné avec l'hypothèse (4) fournit exactement les mêmes réserves que
la méthode originale de Chain Ladder (1).

Théorème 2.1. Soit D = {Cik | i + k ≤ n + 1}, l'ensemble de toutes les données observées. Sous
les hypothèses (3) et (4), on a

E(Cin | D) = Ci,n+1−i · fn+1−i · · · fn−1 .

La preuve est donnée dans Mack [1].

Le théorème suivant montre que estimer fn+1−i · · · fn−1 par fˆn+1−i · · · fˆn−1 fournit un bon esti-
mateur.

Théorème 2.2. Sous les hypothèses (3) et (4), les estimateurs fˆk , donnés par (2) sont non biaisés
et non corrélés.

La preuve est donnée dans Mack [1].

Par extension on peut également montrer que E(fˆn+1−i · · · fˆn−1 ) = fn+1−i · · · fn−1 , ce qui montre
que Ĉin = Ci,n+1−i · fˆn+1−i · · · fˆn−1 est un estimateur non biaisé de E(Cin | D) = Ci,n+1−i ·
fn+1−i · · · fn−1 . De la même manière, l'estimateur de la réserve, R̂i = Ĉin − Ci,n+1−i , est un
estimateur non biaisé de la vraie réserve Ri = Cin − Ci,n+1−i .

2.3 Calcul de l'erreur standard.


La formule d'estimation de l'erreur standard basée sur le modèle présenté à la section 2.2 est
présentée dans Mack [1] et [2].
2.3.1 Estimation de l'erreur sur la réserve d'une année de survenance et construction
d'un intervalle de conance.
Ĉin fournit un estimateur mais pas la valeur exacte de Cin . Dans cette section, nous introduisons
l'objet principal de cet article en nous intéressant à la distance moyenne entre l'estimateur et la
vraie valeur.
L'erreur carrée moyenne, mse(Ĉin ) de l'estimateur Ĉin de Cin se dénit par

mse(Ĉin ) = E[(Ĉin − Cin )2 | D],

où D est déni comme plus haut, c'est-à-dire comme l'ensemble des données observées.
On s'intéresse ici à une moyenne conditionnelle basée sur l'ensemble de données spécique D
an d'obtenir la déviation moyenne entre Ĉin et Cin due uniquement à l'aléa futur subi par cet
ensemble de données bien spécié et sans tenir compte des déviations passées.
q
L'erreur standard se(Ĉin ) est dénie comme égale à mse(Ĉin ).

Si on s'intéresse à l'erreur sur la réserve, on doit calculer mse(R̂i ) = E[(R̂i − Ri )2 | D]. Comme
R̂i = Ĉin − Ci,n+1−i et Ri = Cin − Ci,n+1−i , on a nalement que

mse(R̂i ) = E[(Ĉin − Cin )2 | D] = mse(Ĉin ).

L'erreur d'estimation de la réserve pour une année d'accident est donc égale à l'erreur d'estimation
du montant nal à payer pour les sinistres survenus lors de cette année. En eet, ces deux grandeurs
sont égales à une constante additive près.

Pour pouvoir calculer mse(Ĉin ), nous allons le décomposer selon la formule

mse(Ĉin ) = V ar(Cin | D) + (E(Cin | D) − Ĉin )2 ,

qui est une application de la règle générale E(X − a)2 = V ar(X) + (E(X) − a)2 .
Cette formule nous montre que nous aurons donc besoin d'estimer la variance de Cik , ce qui va
nous conduire à dégager une troisième hypothèse pour l'utilisation de la méthode de Chain Ladder.
Ci,k+1
Comme fˆk est la moyenne pondérée par Cik des facteurs de développement individuels , (en
Cik
Pn−k n−k
X n−k
X
ˆ i=1 Ci,k+1 Ci,k+1 Ci,k+1 Cik C
eet fk = Pn−k = Pn−k = Pn−k ), on peut montrer que V ar( Ci,k+1 | Ci1 , . . . , Cik )
i=1 Cik i=1 i=1 Cik i=1
Cik i=1 Cik
ik

doit être inversément proportionnel à Cik , et ce an que fˆk soit un estimateur non biaisé de variance
minimum. Nous reparlerons de cette hypothèse dans la section 2.5.1.
Ci,k+1 σk2
Cette hypothèse peut se réécrire V ar( Cik
| Ci1 , . . . , Cik ) = Cik
, ou encore

V ar(Ci,k+1 | Ci1 , . . . , Cik ) = Cik σk2 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1. (5)

Cette hypothèse (5) est (avec (3) et (4)) la troisième hypothèse qui sous-tend implicitement la
méthode de Chain Ladder.
Les paramètres σk2 sont inconnus et devront être estimés.
Le théorème suivant donne la formule permettant d'estimer ce que nous cherchons, à savoir
mse(R̂i ).
Théorème 2.3. Sous les hypothèses (3), (4) et (5), mse(R̂i ) peut être estimé par
n−1
à !
\ X σ̂k2 1 1
2
mse(R̂i ) = Ĉin + Pn−k ,
k=n+1−i fˆ2
k Ĉik j=1 Cjk

où Ĉik = Ci,n+1−i · fˆn+1−i · · · fˆk−1 (k > n + 1 − i) sont les valeurs estimées de Cik et
Ĉi,n+1−i = Ci,n+1−i ,
n−k
X Ci,k+1
1
et où σ̂k = n−k−1
2
Cik ( − fˆk )2 (1 ≤ k ≤ n − 2) est un estimateur sans biais de σk2 ,
i=1
Cik
σ̂ 4
et σ̂n−1
2
= min ( σ̂n−2
2
2
, min (σ̂n−3 2
, σ̂n−2 )).
n−3

La preuve est donnée dans Mack [1].


2
Remarque sur le choix de σ̂n−1 :
ˆ
 si fn−1 = 1 et qu'on croit que le développement des sinistres se termine après n − 1 années,
alors on prend σ̂n−1 = 0,
 sinon, on extrapole la série σ̂1 , . . . , σ̂n−2 , pour ajouter un terme supplémentaire, soit par
régression loglinéaire, soit en exigeant que σ̂σ̂n−3n−2
= σ̂σ̂n−1
n−2
soit vériée, pour autant que σ̂n−3 >
σ̂n−2 .
C'est cette dernière possibilité qui a été retenue dans le théorème 2.3.

Nous avons maintenant des estimations pour la moyenne de la variable Ri (soit R̂i ) et pour
l'écart-type de cette variable (soit se(R̂i )). Il nous reste à faire une hypothèse paramétrique sur la
distribution de Ri pour pouvoir construire facilement des intervalles de conance sur les réserves
estimées. Si le volume de données est susant, on peut supposer que la distribution est normale,
de moyenne la valeur estimée R̂i et d'écart-type
h donné par l'erreur istandard se(R̂i ). Un intervalle
de conance à 95% est alors donné par R̂i − 2se(R̂i ), R̂i + 2se(R̂i ) .
Mais la distribution normale n'est peut-être pas une bonne approximation si la vraie distribution
de Ri n'est pas symétrique. De plus, la distribution normale peut conduire à une borne inférieure
négative même si la réserve ne peut pas être négative. Dans ces cas-là, il vaut mieux utiliser
une approche basée sur une distribution lognormale. Nous approximons alors la distribution de
la réserve R̂i par une distribution lognormale de paramètres µi et σi2 tels que la moyenne et la
variance des deux distributions soient égales, c'est-à-dire tels que :

exp(µi + σi2 /2) = R̂i


exp(2µi + σi2 )(exp(σi2 ) − 1) = (se(R̂i ))2 ,

ce qui conduit à :

σi2
µi = ln(R̂i ) −
2
se(R̂i )
σi2 = ln(1 + ( )2 ).
R̂i

Les bornes d'un intervalle de conance à 95% seront alors données par
· ¸
−σi2 −σi2
[exp(µi − 2σi ), exp(µi + 2σi )] = R̂i exp( − 2σi ), R̂i exp( + 2σi ) .
2 2
Prenons un petit exemple pour illustrer numériquement les diérentes formules rencontrées.
Soit le triangle des montants cumulés de sinistres suivant :
 
35.40 37.69 39.13 39.76 40.16
38.61 41.61 43.37 44.56 
 

C = 43.85 47.30 49.45 

49.52 53.33 
55.47
Calculons les coecients de développement fˆk par la formule (2) et les coecients σ̂k2 par la formule
indiquée dans le théorème 2.3. Nous obtenons :

fˆ1 = 1.0750 fˆ2 = 1.0423 fˆ3 = 1.0221 fˆ4 = 1.0101,


σ̂12 = 1.6080 ∗ 10−3 σ̂22 = 0.5510 ∗ 10−3 σ̂32 = 2.6444 ∗ 10−3 σ̂42 = 0.5510 ∗ 10−3 .
Les coecients de développement permettent de compléter le triangle des montants par la for-
mule (1).
 
35.40 37.69 39.13 39.76 40.16
38.61 41.61 43.37 44.56 45.01
 
C= 43.85 47.30 49.45 50.54 51.05
49.52 53.33 55.58 56.81 57.38
55.47 56.63 62.15 63.52 64.16
Nous pouvons nalement estimer les réserves Ri pour 2 ≤ i ≤ 5 par R̂i = Ĉi5 − Ci,6−i et utiliser le
\
théorème 2.3 pour estimer l'erreur commise sur ces réserves. Nous obtenons ainsi mse( R̂ ) et en en i
\
prenant la racine carrée, nous obtenons se( \
R̂i ). Nous examinons également se(R̂i ) en pourcentage
de la réserve, et nalement nous construisons des intervalles de conance pour la réserve, basés
sur la distribution normale et sur la distribution lognormale.

i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.45 0.0521 0.2282 50.90% [−0.01, 0.90] [0.15, 1.04]
3 1.60 0.2766 0.5259 32.89% [0.55, 2.65] [0.80, 2.88]
4 4.05 0.3715 0.6095 15.05% [2.83, 5.27] [2.97, 5.40]
5 8.69 0.5740 0.7576 8.72% [7.17, 10.20] [7.27, 10.30]

Nous observons ici une décroissance de l'erreur relative en fonction de l'année de survenance :
l'erreur absolue augmente moins vite que la valeur de la réserve.

Modions quelques données et prenons l'exemple suivant :


 
35.40 37.69 39.13 39.76 40.16
38.61 40.62 42.77 43.63 44.07
 
C0 = 43.85 47.30 49.00 49.89 50.39
49.52 52.59 54.80 55.80 56.36
55.47 59.06 61.54 62.66 63.29
Les coecients fˆk et σ̂k2 sont :

fˆ1 = 1.0646 fˆ2 = 1.0421 fˆ3 = 1.0182 fˆ4 = 1.0101,


σ̂12 = 5.0327 ∗ 10−3 σ̂22 = 3.5648 ∗ 10−3 σ̂32 = 0.3282 ∗ 10−3 σ̂42 = 0.0302 ∗ 10−3 .
L'examen des réserves fournit le tableau suivant qui présente une toute autre évolution de l'erreur
\
relative, due au fait que l'erreur standard absolue se( R̂ ) évolue plus rapidement d'année en année
i
que dans le premier cas :

i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.44 0.0028 0.0526 12% [0.33, 0.54] [0.34, 0.55]
3 1.39 0.0296 0.1721 12% [1.05, 1.74] [1.08, 1.77]
4 3.77 0.3160 0.5621 15% [2.65, 4.90] [2.77, 5.02]
5 7.82 0.7952 0.8918 11% [6.04, 9.61] [6.19, 9.76]

Examinons la sensibilité des résultats si on modie la donnée C 0 (2, 4) par rapport au dernier
exemple. Ce seul changement implique une modication des coecients fˆ3 et σ̂32 et aussi de σ̂42 de
par sa construction, modication qui va se répercuter sur toutes les années de survenance et faire
augmenter brusquement les erreurs standards (à cause de la forte augmentation de σ̂32 ).
 
35.40 37.69 39.13 39.76 40.16
38.61 40.62 42.77 44.56 45.01
 
C 00 = 
 43.85 47.30 49.00 50.45 50.96 

49.52 52.59 54.80 56.42 56.99
55.47 59.06 61.54 63.36 64.00
Les coecients fˆk et σ̂k2 sont :

fˆ1 = 1.0646 fˆ2 = 1.0421 fˆ3 = 1.0295 fˆ4 = 1.0101,

σ̂12 = 5.0327 ∗ 10−3 σ̂22 = 3.5648 ∗ 10−3 σ̂32 = 13.5511 ∗ 10−3 σ̂42 = 3.5648 ∗ 10−3 .
L'examen des réserves fournit le tableau suivant :

i R̂i \
mse(R̂i ) \
se(R̂i ) \
se(R̂i ) en % de R̂i IC Normal IC Lognormal
2 0.45 0.3369 0.5804 129% [−0.71, 1.61] [0.04, 1.99]
3 1.96 1.4907 1.2210 62% [−0.49, 4.40] [0.53, 5.23]
4 4.40 2.0389 1.4279 32% [1.55, 7.26] [2.22, 7.88]
5 8.53 2.8472 1.6874 20% [5.15, 11.90] [5.65, 12.38]

Une augmentation d'un montant de sinistre de 2% a donc conduit à une forte augmentation de
la variabilité. Les erreurs standard relatives ont été multipliées par des coecients qui vont de 2
à 10 selon l'année de survenance.

2.3.2 Estimation de l'erreur sur la réserve totale.


Il est également intéressant de calculer l'erreur commise sur la réserve totale estimée R̂ = R̂2 +
· · · + R̂n . On ne peut pas se contenter de sommer les erreurs (se(R̂i ))2 parce qu'elles sont corrélées
entre elles (car toutes inuencées par les mêmes fˆk ) mais on peut utiliser le théorème suivant.

Théorème 2.4. Sous les hypothèses (3), (4) et (5), mse(R̂) peut être estimé par
n
( Ã n
! n−1
)
\ X X X 2σ̂k2 /fˆk2
mse( R̂) = mse(R̂i ) + Ĉin Ĉjn Pn−k .
i=2 j=i+1 k=n+1−i j=1 Cjk
La preuve est donnée dans Mack [1].
Dans le premier exemple ci-dessus, la réserve totale vaut R̂ = 14.79 et l'erreur estimée vaut
\
mse( \
R̂) = 2.3900. Nous avons donc que se(R̂) = 1.5460, soit 10.45% de R̂.

2.4 Formule récursive pour calculer l'erreur standard et introduction


d'un tail factor.
Cette formule est donnée par Mack [4].

2.4.1 Formule récursive de calcul de l'erreur standard.


Les erreurs standard sur les réserves estimées données à la section 2.3 peuvent être calculées de
façon récursive.
Reprenons le modèle d'estimation de Chain Ladder

Ĉin = Ci,n+1−i · fˆn+1−i · · · fˆn−1 .

Le théorème 2.3 donne la formule pour l'erreur standard sur Ĉin :


n−1
à !
X σ̂ 2
1 1
k
(se(Ĉin ))2 = Ĉin
2
+ Pn−k .
fˆ2 Ĉik k=n+1−i
Cjk k j=1

Cette formule peut être réécrite sous la forme :


n−1
X ³ ´
(se(Ĉin )) = 2 2
Ĉin (se(Fik )) + (se(fk )) /fˆk2 ,
2 ˆ 2

k=n+1−i


Ci,k+1
 Fik = Cik
,
σ̂ 2
 (se(Fik )) = Ĉ k est (c'est l'hypothèse (5)) un estimateur de V ar(Fik | Ci1 , . . . , Cik ) = E[(Fik −
2
ik
fk )2 | Ci1 , . . . , Cik ] qui mesure la variation entre un coecient individuel Fik et la vraie valeur
fk , et
σ̂ 2
 (se(fˆk ))2 = Pn−kk
Cjk
est (ceci est démontré dans le cadre de la section 2.6.1) un estimateur de
j=1

V ar(fˆk | Ci1 , . . . , Cik ) = E[(fˆk − fk )2 | Ci1 , . . . , Cik ] qui mesure la déviation entre la moyenne
estimée fˆk et la vraie valeur fk .
Sous cette forme, la formule du calcul de l'erreur conduit au programme de récursion suivant :

 se(Ĉi,n+1−i ) = 0
³ ´
 (se(Ĉi,k+1 ))2 = Ĉ 2 (se(Fik ))2 + (se(fˆk ))2 + (se(Ĉik ))2 fˆ2
ik k

En utilisant les données du premier exemple précédent, on obtient les résultats suivants pour les
estimateurs de la variance des coecients de développement individuels Fik et de la variance des
coecients de développement globaux de Chain Ladder fˆk :
 
4.54 ∗ 10−5 1.46 ∗ 10−5 6.76 ∗ 10−5 1.39 ∗ 10−5
4.16 ∗ 10−5 1.32 ∗ 10−5 6.10 ∗ 10−5 1.24 ∗ 10−5 
 
(se(Fik ))2 =  −5
3.67 ∗ 10−5 1.16 ∗ 10−5 5.35 ∗ 10−5 1.09 ∗ 10−5 

3.25 ∗ 10 1.03 ∗ 10−5 4.76 ∗ 10−5 9.70 ∗ 10−6 
2.90 ∗ 10−5 9.24 ∗ 10−6 4.25 ∗ 10−5 8.67 ∗ 10−6

(se(fˆ1 ))2 = 9.61 ∗ 10−6 (se(fˆ2 ))2 = 4.35 ∗ 10−6 (se(fˆ3 ))2 = 3.21 ∗ 10−5 (se(fˆ4 ))2 = 1.391 ∗ 10−5 .

L'utilisation de ces coecients dans la formule récursive conduit aux mêmes résultats que ceux
obtenus par la formule du théorème 2.3.

Pour la réserve totale sur toutes les années d'accident, on a la formule récursive suivante
à à n !!2 à à n !!2
X X
se Ĉi,k+1 = se Ĉi,k · fˆk2
i=n+1−k i=n+2−k
n
X
2
+ Ĉik · (se(Fik ))2
i=n+1−k
à n
!2
X
+ Ĉik · (se(fˆk ))2 ,
i=n+1−k

commençant avec k = 1.

2.4.2 Inclusion d'un tail factor.


Comme le développement des sinistres survenus en l'année d'accident i n'est pas nécessairement
terminé après n années de développement, on utilise un tail factor fˆult > 1 pour estimer le montant
ultime Ci,ult par
Ĉi,ult = Ĉin fˆult .

Y
On peut prendre fˆult = fˆk , où les fˆk futurs sont estimés par une extrapolation linéaire de
k=n
ln(fˆk − 1). Mais il faut prendre garde que ce tail factor soit plausible et en concordance avec
l'expérience acquise sur le développement futur des sinistres.

La récursion peut être facilement étendue pour inclure un tail factor :


³ ´
(se(Ĉi,ult ))2 = Ĉin
2
(se(Fi,ult ))2 + (se(fˆult ))2 + (se(Ĉin ))2 fˆult
2
.

On a donc besoin de valeurs pour fˆult , se(fˆult ) et se(Fi,ult ) ∀i. En pratique on xe fˆult , se(fˆult )
et se(Fi,ult ) pour un i donné. Pour cela, on xe fˆult , par régression ou suivant l'expérience comme
déjà discuté précédemment, puis on cherche k tel que

fˆk−1 > fˆult > fˆk .

Il reste à estimer, de la manière la plus raisonnable possible, se(fˆult ) et se(Fi,ult ). On peut par
exemple prendre ces valeurs telles que

se(fˆk−1 ) > se(fˆult ) > se(fˆk )


et
se(Fi,k−1 ) > se(Fi,ult ) > se(Fik ).
p
Une fois ces trois valeurs xées, on peut en déduire σ̂ult = se(Fi,ult ) Ĉin , et par suite déterminer
se(Fi,ult ) pour toutes les autres années de survenance i.
Un exemple numérique de cette procédure est donné à la section 4.2.3.

2.5 Vérication des hypothèses sous-jacentes à la méthode de Chain


Ladder.
Rappelons les trois hypothèses sur lesquelles repose la méthode de Chain Ladder et que nous avons
utilisées dans les sections précédentes :

E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1 (3),

{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } ∀i, j sont indépendants (4),


V ar(Ci,k+1 | Ci1 , . . . , Cik ) = Cik σk2 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1 (5).

Il est donc important de vérier que le triangle de données sur lequel on veut travailler satisfait
bien à ces trois conditions avant de pouvoir appliquer la méthode de Chain Ladder. Les tests
présentés sont tirés de Mack [2].

2.5.1 Vérication des hypothèses (3) et (5).


Fixons l'année de développement k . L'équation (3) peut alors être interprétée comme un modèle
de régression linéaire
Yi = c + Xi · b + ²i 1 ≤ i ≤ n,
où ²i est le terme d'erreur tel que E(²i ) = 0,
et où c = 0, Yi = Ci,k+1 , Xi = Cik et b = fk .
Les coecients de la régression sont déterminés par une minimisation des carrés des erreurs pon-
dérés n
X
wi · (Yi − c − Xi · b)2 ,
i=1

où les wi sont inversément proportionnels à la V ar(Yi ).


Donc, si l'hypothèse (5) est vériée, V ar(Ci,k+1 ) est proportionnelle à Cik , et donc wi est inversé-
ment proportionnel à Cik , ce qui conduit au problème de minimisation suivant :
n−k
X
min (Ci,k+1 − Cik · fk )2 /Cik .
i=1

En annulant la dérivée par rapport à fk de l'expression à minimiser, on trouve


n−k
X
Ci,k+1
fˆk = i=1
n−k
,
X
Cik
i=1

soit le résultat déjà fourni en (2).


Pour vérier les hypothèses (3) et (5), on peut examiner deux types de graphiques :
1. pour k donné, on construit le graphique de Ci,k+1 en fonction de Cik , et on regarde si les
points sont proches de la droite passant par l'origine et de pente fˆk ,

2. pour k donné, on construit le graphique des résidus (Ci,k+1 − Cik · fˆk )/ Cik en fonction de
Cik , et on vérie si l'hypothèse de variance utilisée conduit bien à des résidus aléatoires, ne
manifestant pas de tendance.

En guise d'illustration, même si le nombre de données n'est pas vraiment susant pour eectuer
des tests, examinons le cas k = 1 de l'exemple déjà exploité dans les sections précédentes. Les
données sont les suivantes :

Ci2 = (37.69 41.61 47.30 53.33),


Ci1 = (35.40 38.61 43.85 49.52),
fˆ1 = 1.0750,
et conduisent aux deux graphiques suivants.

60

55

50
Montants Ci2

45

40

35

30
30 35 40 45 50 55
Montants Ci1

Fig. 1  Exemple de vérication de l'hypothèse (3)

Nous voyons donc que les montants suivent de près la droite passant par l'origine et de pente fˆ1 .
En ce qui concerne le caractère aléatoire des résidus, il est dicile de juger vu le petit nombre de
données.

Si les graphes construits ne conduisent pas au résultat escompté, on peut remplacer (5) par d'autres
hypothèses sur la variance et examiner les mêmes types de graphiques que ci-dessus :
 V ar(Ci,k+1 ) proportionnelle à 1 (c'est-à-dire, à k donné, V ar(Ci,k+1 ) identique ∀i), ce qui im-
P
plique wi inversément proportionnel à 1. Le problème de minimisation est alors min n−k i=1 (Ci,k+1 −
n−k
X
Ci,k+1 · Cik
Cik · fk )2 , ce qui conduit à la solution fˆk1 = i=1 n−k .
X
2
Cik
i=1
0.03

0.02

0.01

-0.01

Résidus
-0.02

-0.03

-0.04

-0.05

-0.06

-0.07
30 35 40 45 50 55
Montants Ci1

Fig. 2  Exemple de vérication de l'hypothèse(5)

2
 V ar(Ci,k+1 ) proportionnelle à Cik 2
, ce qui implique wi inversément proportionnel à Cik . Le
Pn−k 2 2
problème de minimisation est alors min i=1 (Ci,k+1 − Cik · fk ) /Cik , ce qui conduit à la
Xn−k
ˆ 1 Ci,k+1
solution fk2 = n−k .
i=1
C ik
Toutes les formules de calcul d'erreur standard seraient alors à revoir pour ces hypothèses et
coecients de développement donnés, ce qui est facilement faisable.

2.5.2 Test de non corrélation des coecients de développement successifs.


Ci,k+1
L'hypothèse (3) peut se réécrire E( Cik
| Ci1 , . . . , Cik ) = fk 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1. On
Ci,k+1 Cik
peut prouver que cette hypothèse implique que les facteurs de développement Cik
et
Ci,k−1
sont
Ci,k+1
non corrélés : la valeur attendue du facteur Cik
est la même, que le facteur précédent CCi,k−1
ik
soit
plus grand ou plus petit que d'habitude.
Le test utilisé est le test de Spearman.
Ci,k+1
Pour chaque colonne k , on trie les facteurs Cik
par ordre croissant et on note rik , le rang de
Ci,k+1
Cik
, 1 ≤ rik ≤ n − k .
Cn−k,k+1
On retire ensuite le dernier coecient de la colonne, soit Cn−k,k
, on recommence le tri et on note
Ci,k+1
si,k+1 le rang de Cik
, 1 ≤ si,k+1 ≤ n − (k + 1).
On dénit alors
n−k
X (rik − sik )2
Tk = 1 − 6 2 ≤ k ≤ n − 2.
i=1
(n − k)3 − n + k
On peut montrer que −1 ≤ Tk ≤ 1, et que sous l'hypothèse de non corrélation, E(Tk ) = 0 et
1
V ar(Tk ) = n−k−1 .

Illustrons le calcul des rangs rik et si,k+1 par notre exemple habituel, pour lequel n = 5 et pour
lequel les coecients de développement individuels sont les suivants :
 
k=1 k=2 k=3 k=4
1.0647 1.0382 1.0161 1.0101
 
1.0777 1.0423 1.0274 
 
1.0787 1.0455 
1.0769
Ces coecients conduisent aux rangs suivants :

ri1 si2 ri2 si3 ri3


1 1 1 1 1
3 2 2 2 2
4 3 3
2

Nous remarquons d'emblée que dans l'exemple, les coecients gardent le même rang d'une colonne
à l'autre (rik = sik ), ce qui va conduire évidemment à rejeter la non corrélation des coecients
successifs. Nous obtenons en eet T2 = T3 = 1.

On désire tester le triangle dans son ensemble et non pas par paires de colonnes. On va donc
utiliser une statistique de test T globale, moyenne pondérée par n − k − 1 (poids inversément
proportionnels à V ar(Tk )) des Tk :
n−2
X X n−2
n−k−1 n−k−1
T = Pn−2 Tk = Tk ,
k=2 k=2 n − k − 1 k=2
(n − 2)(n − 3)/2

1
E(T ) = 0 et V ar(T ) = .
(n − 2)(n − 3)/2
Si n − k ≥ 10, la distribution de Tk est normale en bonne approximation, et comme T est l'aggré-
gation de plusieurs Tk non corrélés (sous l'hypothèse nulle de non corrélation des coecients de
développement successifs, les Tk sont non corrélés), on peut supposer que T a approximativement
une distribution normale.

2 1
Dans l'exemple T = 3
· T2 + 3
· T3 = 1. Le nombre de données est néanmoins insusant pour
appliquer le test.

Comme le test n'est qu'approximatif et qu'on cherche à détecter des corrélations dans le triangle
entier, on ne prend pas un intervalle de conance à 95% qui a très peu de chances de rejeter la
non corrélation mais un intervalle de conance à 50%.
On ne rejettera donc pas la non corrélation si
−0.67 0, .67
p ≤T ≤ p .
(n − 2)(n − 3)/2 (n − 2)(n − 3)/2
2.5.3 Test de non eet d'une année calendrier.
Il reste à tester l'hypothèse (4), qui suppose l'indépendance des diérentes années de survenance
entre elles. En eet certains triangles de données sont sujets à des eets calendrier (comme par
exemple des changements dans le traitement ou la réservation des sinistres, des changements
d'ination) qui peuvent aecter plusieurs années d'accident de la même façon et donc perturber
l'indépendance.
Soit les éléments d'une diagonale

Dj = {Cj1 , Cj−1,2 , . . . , C2,j−1 , C1j } 1 ≤ j ≤ n,

et les coecients de développement qui dépendent des éléments de Dj , soit que les éléments de
Dj sont au dénominateur :
Cj2 C1,j+1
Aj = { ,..., },
Cj1 C1j
soit que les éléments de Dj sont au numérateur :

Cj−1,2 C1,j
Aj−1 = { ,..., }.
Cj−1,1 C1,j−1

Donc, si les éléments de Dj sont plus grands que d'habitude, les éléments de Aj seront plus petits
et les éléments de Aj−1 plus grands que d'habitude.
Pour chaque colonne k , on marque les coecients de développement par un G s'ils sont supérieurs
à la médiane de la colonne et par un P s'ils sont inférieurs à la médiane. Remarquons que quand
le nombre d'éléments de la colonne est impair, il y a un élément qui est égal à la médiane et qui ne
sera pas marqué. Pour chaque diagonale Aj de coecients de développement (2 ≤ j ≤ n − 1), on
compte alors le nombre d'éléments marqués d'un G, soit Gj et le nombre d'éléments marqués d'un
P , soit Pj . S'il n'y a pas de changement d'une année calendrier à l'autre, alors Gj et Pj doivent
être proches l'un de l'autre, chaque coecient de développement ayant 50% de chances d'être G
G +P
ou P , ou, pour l'exprimer autrement, Zj = min(Gj , Pj ) doit être proche de j 2 j .
Dans l'exemple étudié, les coecients de développement individuel, déjà mentionnés dans la sec-
tion 2.5.2, conduisent à la décomposition en coecients P et coecients G suivante :
 
P P P ∗
G ∗ G 
 
G G 
P
Pour chacune des diagonales le décompte obtenu est alors le suivant :

diag j Pj Gj Zj
2 1 1 1
3 1 1 1
4 1 2 1

Pour élaborer un test, il faut tout d'abord déterminer quels sont les deux premiers moments de
Zj .
En cas de non rejet de l'hypothèse de non eet signicatif d'une année calendrier, Pj suit une loi
binomiale de paramètres nj = Gj + Pj et p = 1/2. On peut alors montrer que
µ ¶
nj nj − 1 nj
E(Zj ) = − ,
2 mj 2nj
µ ¶
nj (nj − 1) nj − 1 nj (nj − 1)
V ar(Zj ) = − + E(Zj ) − (E(Zj ))2 ,
4 mj 2nj
nj −1
où mj = b 2
c.

On ne teste pas les Zj séparément pour éviter une accumulation des erreurs
P de probabilité et on
considère donc une variable globale Z = Z2 + · · · + Zn−1 , avec E(Z) =
P E(Zj ) et V ar(Z) =
V ar(Zj ).
Nous pouvons supposer que Z suit une distribution normale et nous ne rejettons pas l'hypothèse
de non eet signicatif d'une année calendrier (au seuil α = 5%) si
p p
E(Z) − 2 V ar(Z) ≤ Z ≤ E(Z) + 2 V ar(Z).

Dans l'exemple nous trouvons :

diag j Zj E(Zj ) V ar(Zj )


2 1 0.50 0.2500
3 1 0.50 0.2500
4 1 0.75 0.1875
Total 3 1.75 0.6875

Si le nombre de données était susant pour appliquer le test, nous trouverions 0.092 ≤ 3 ≤ 3.408,
ce qui conduirait à ne pas rejeter l'indépendance des années de survenance.

2.6 Adaptation des formules d'erreur.


Les mesures de variabilité des réserves estimées par la méthode de Chain Ladder ont été eectuées
pour des coecients de développement calculés de manière standard, c'est-à-dire en utilisant toutes
les données disponibles.
En pratique, si on travaille avec un nombre important d'années de survenance et si on s'aperçoit
qu'il y a une cassure dans le triangle des données, c'est-à-dire que les sinistres survenus lors des
années les plus récentes ne se développent pas de la même façon que ceux des années antérieures,
on va peut-être utiliser des coecients de développement qui, au lieu d'être estimés à partir de
toutes les années précédentes, le sont à partir des années les plus récentes.

Nous allons donc travailler avec le triangle de données suivant, comportant n années de survenance
et n années de développement. Nous supposons que les m premières années de survenance forment
un bloc, c'est-à-dire ont un développement semblable, et que les n − m dernières années forment
un autre bloc, avec un schéma de développement diérent de celui du premier bloc.
 
C11 C12 ... C1,n−m C1,n−m+1 . . . C1,n−1 C1n
 C21 C22 ... C2,n−m C2,n−m+1 . . . C2,n−1 
 .. .. .. .. 
 
 . . . . 
...

 
 Cm1 Cm2 . . . Cm,n−m Cm,n−m+1 
 
 Cm+1,1 Cm+1,2 . . . Cm+1,n−m 
 .. .. 
 . . 
 
...

 Cn−1,1 Cn−1,2 
Cn1

Remarquons que le triangle pourrait être découpé en un nombre de blocs plus élevé.
Nous utilisons la méthode de Chain Ladder pour obtenir les montants ultimes de sinistres. Nous
considérons donc que les données satisfont aux trois hypothèses habituelles :

E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1 (3),


{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } ∀i, j sont indépendants (4),
V ar(Ci,k+1 | Ci1 , . . . , Cik ) = Cik σk2 1 ≤ i ≤ n, 1 ≤ k ≤ n − 1 (5).

Les estimateurs fˆk de fk et σ̂k2 de σk2 auront la même forme que précédemment (voir (2) et théo-
rème 2.3) mais diéreront en fonction de k :
 pour k allant de 1 à n − m − 1, les coecients sont calculés à partir des années de survenance
les plus récentes, soit de m + 1 à n,
 pour k allant de n − m à n − 1, les coecients sont calculés comme avant, à partir des années
de survenance 1 à m.

Les coecients de développement fˆk sont donc toujours le résultat de régressions linéaires pondé-
rées par C1ik , mais sur un nombre de données moindre. Tout se passe comme si on travaillait sur
deux triangles diérents auxquels on applique, séparément, la méthode de Chain Ladder. Remar-
quons que tant qu'on travaille sur les deux triangles de façon séparée, on n'a pas besoin de fˆn−m
2
et σ̂n−m , coecients permettant de passer d'un triangle à l'autre. De plus, les trois hypothèses
doivent être vériées sur les deux triangles séparés et pas sur l'ensemble de données de départ. En
eet, si on sépare les années de survenance en deux groupes distincts, c'est justement parce que
l'hypothèse (3) n'est pas satisfaite par les données dans leur ensemble.
Le triangle supérieur droit, Cij , pour 1 ≤ i ≤ m et n − m + 1 ≤ j ≤ n + 1 − i conduit aux montants
ultimes C1n , Ĉ2n , . . . , Ĉmn .
Le triangle inférieur gauche Cij , pour m + 1 ≤ i ≤ n et 1 ≤ j ≤ n + 1 − i conduit aux montants
ultimes Cm+1,n−m , Ĉm+2,n−m , . . . , Ĉn,n−m .
 
C11 C12 . . . C1,n−m C1,n−m+1 . . . C1,n−1 C1n
 C21 C22 . . . C2,n−m C2,n−m+1 . . . C2,n−1 Ĉ2n 
 
 .. .. .. .. .. .. 
 . . . . . . 
 
 Cm1 C . . . C C . . . Ĉ Ĉ 
 m2 m,n−m m,n−m+1 m,n−1 mn 
Cm+1,1 Cm+1,2 . . . Cm+1,n−m 
 
 .. .. .. 
 . . . 
 
 Cn−1,1 Cn−1,2 . . . Ĉn−1,n−m 
Cn1 Ĉn2 ... Ĉn,n−m

Ecrivons explicitement les formules fournissant les coecients fˆk et σ̂k2 :


n−k
X
Ci,k+1
fˆk = i=m+1
n−k
1≤k ≤n−m−1
X
Cik
i=m+1
n−k
(6)
X
Ci,k+1
fˆk = i=1
n−k
n−m≤k ≤n−1
X
Cik
i=1
Les fˆk sont des estimateurs sans biais des fk (la démonstration est analogue à celle du théo-
rème 2.2).

n−k
X Ci,k+1
σ̂k2 = 1
(n−k)−m−1
Cik ( − fˆk )2 1≤k ≤n−m−2
i=m+1
Cik
(7)
n−k
X Ci,k+1
σ̂k2 = 1
n−k−1
Cik ( − fˆk )2 n−m≤k ≤n−2
i=1
Cik

Les σ̂k2 sont des estimateurs sans biais des σk2 . Il faut encore estimer σn−m−1
2
et σn−1
2
, ce qui peut
se faire par extrapolation sur base des σ̂k précédents ou par une formule du type de celle utilisée
2

dans le théorème 2.3.


Donc, l'application de Chain Ladder aux deux triangles séparément nous permet d'utiliser la
formule du théorème 2.3 pour estimer la variabilité des réserves :
 pour le bloc supérieur droit
n−1
à !
\ X σ̂ 2
1 1
2 k
mse(Ĉin ) = Ĉin + Pn−k 2≤i≤m
fˆ2 Ĉik k=n+1−i
Cjk k j=1

 pour le bloc inférieur gauche


n−m−1
à !
\ X σ̂k2 1 1
2
mse(Ĉi,n−m ) = Ĉi,n−m + Pn−k m+2≤i≤n
k=n+1−i fˆ2k Ĉik j=m+1 Cjk

On voudrait encore pouvoir estimer les montants ultimes Ĉin pour m+1 ≤ i ≤ n et leur variabilité.
Pour cela, il faut donc d'abord faire une hypothèse sur la façon dont on va compléter le bloc restant,
à savoir le bloc inférieur droit. Nous allons envisager trois hypothèses diérentes.

2.6.1 Première hypothèse.


On applique Chain Ladder avec les coecients fk estimés sur les années d'accident 1 à m. On
suppose donc que le bloc à compléter satisfait aux hypothèses pour appliquer Chain Ladder et
qu'il se développe comme dans les années de survenance plus anciennes (comme le bloc supérieur
droit).
Nous obtenons alors, pour m + 1 ≤ i ≤ n :
" n−m−1 Ã ! n−1
à !#
\ X σ̂ 2 1 1 X σ̂k2 1 1
2 k
mse(Ĉin ) = Ĉin + + + ,
ˆ2 Ĉik Pn−k Cjk ˆ2 Ĉik Pn−k Cjk
k=n+1−i fk j=m+1 k=n−m fk j=1

où les fˆk sont calculés par (6) et les σ̂k2 sont calculés par (7).
La démonstration de cette formule, qui se trouve en annexe, est une adaptation de la démonstration
du théorème 2.3, donnée dans Mack [1].
La formule récursive déterminée à la section 2.4 reste valable, moyennant une petite adaptation :
³ ´
(se(Ĉi,k+1 )) = Ĉik (se(Fik )) + (se(fk )) + (se(Ĉik ))2 fˆk2 ,
2 2 2 ˆ 2


σ̂ 2
 (se(Fik ))2 = Ĉ k
 ik σ̂2
 Pn−k k pour 1 ≤ k ≤ n − m − 1
ˆ j=m+1 Cjk
 (se(fk )) =
2
σ̂k2
 Pn−k pour n − m ≤ k ≤ n − 1.
j=1 Cjk
2.6.2 Deuxième hypothèse.
Utiliser des facteurs de développement calculés sur les m premières années pour compléter la partie
inférieure de la matrice, alors qu'on l'avait coupée en deux justement parce que le développement
des années récentes était diérent de celui des années antérieures, n'est peut-être pas très logique.
Une autre hypothèse est de supposer que le développement total, depuis l'année 1 jusqu'à l'année
n est le même pour toutes les années de survenance (depuis 1 jusque n). Nous supposons donc que
Cin = ftot · Ci1 ∀i. Nous estimons alors ftot par fˆtot sur les m premières années de survenance :
m
X
Ĉin
fˆtot = i=1
m .
X
Ci1
i=1

Nous examinons ensuite quel est le développement total déjà subi par les sinistres survenus durant
les années m + 1 à n et nous l'estimons par
n
X
Ĉi,n−m
i=m+1
fˆint = n .
X
Ci1
i=m+1

En calculant le rapport fˆtot /fˆint , nous obtenons le facteur par lequel multiplier les montants de
sinistres estimés en année de développement (n − m) an d'obtenir les montants de ces sinistres
en l'année de développement n. Ce facteur est donc comparable à un tail factor,

fˆtot
fˆult = ,
fˆint
et nous utilisons la formule obtenue à la section 2.4.2 pour obtenir l'estimation de la variabilité
de Ĉin pour m + 1 ≤ i ≤ n.

Remarque : d'autres dénitions du fˆult peuvent être utilisées pour compléter le triangle inférieur. Si
les observations conduisent à penser que le développement total des sinistres sera moins important
pour les années m + 1 à n que pour les années précédentes (parce qu'on s'aperçoit qu'on paie une
fraction plus importante du sinistre lors de la première année de développement), alors on peut
prendre
4/5fˆtot
fˆult = ,
fˆint
par exemple.

2.6.3 Troisième hypothèse.


Le problème de la deuxième hypothèse est qu'on ne connaît pas la part du sinistre qui est payée
durant la première année de développement, on peut donc dicilement estimer quel est le coef-
cient de développement total permettant d'arriver aux montants ultimes (comment pourrait-on
trouver le 4/5 ci-dessus ?).
Une troisième façon de compléter le bloc inférieur droit, façon qui n'utilise que les données du
bloc inférieur gauche, est de partir des coecients de développement estimés pour les années de
développement 1 à n − m − 1 et d'extrapoler pour obtenir les coecients des années de dévelop-
pement suivantes. On peut par exemple ajuster une courbe exponentielle négative. Sherman [5]
montre qu'on obtient un meilleur ajustement en utilisant une courbe de la forme ft = 1 + at−b ,
où t représente l'année de développement et ft le coecient de développement pour l'année t. On
peut réécrire la fonction comme ln(ft − 1) = ln a + b ln 1t , et obtenir les paramètres a et b par une
régression linéaire de ln(ft − 1) sur ln 1t .
Le fonctionnement de ces trois hypothèses peut être résumé de la façon suivante. Prenons le
cas où, dans les années récentes, les sinistres se développent au début plus rapidement que par
le passé. L'hypothèse 1 suppose alors que ces sinistres vont, par la suite, reprendre le même
développement que les sinistres des années antérieures. L'hypothèse 2 suppose que, au total, ces
sinistres se développent comme dans le passé, et que donc, s'ils se développent plus vite au début,
ils se développeront moins vite par la suite. Enn, l'hypothèse 3 suppose que si les sinistres se
développent plus vite au début, ils continuent à le faire par la suite. Seule une connaissance
approfondie du portefeuille et de la réservation permet de choisir l'hypothèse la plus proche de la
réalité.

2.7 Formules d'erreur pour les ratios S/P.


Dans cette section nous nous intéressons au ratio S/P, d'une grande importance pour l'assureur.
Supposons que les Cik représentent les montants de sinistres à charge de l' assureur. Pour l'année
Cin
de survenance i, nous dénissons donc le ratio S/P correspondant par (S/P )i = , soit le
enci
montant nal des sinistres de l'année i divisé par l'encaissement de primes relatif à l'année i. Ce
ˆ )i = Ĉin et l'erreur d'estimation est directement obtenue par
ratio est estimé par (S/P
enci
\ ˆ )i ] = ( 1 )2 mse(
mse[(S/P \ Ĉin ),
enci
\
où mse( Ĉin ) a été obtenu à la section 2.3.1.
Pour le premier exemple, présenté à la section 2.3.1 et pour des encaissements annuels donnés,
nous obtenons les résultats suivants :

\ ˆ ) \ ˆ ) en % de S/P
ˆ
i Ĉin enci S/P se(S/P se(S/P
2 45.01 64 0.7033 0.0036 0.51%
3 51.05 77 0.6630 0.0068 1.03%
4 57.38 78 0.7357 0.0078 1.06%
5 64.16 85 0.7548 0.0089 1.18%

Pour ce faire une idée de la sinistralité attendue on travaille souvent avec un S/P moyen calculé
Xn
1 Cin
sur les dernières années de survenance. Dénissons ainsi (S/P )m = , le S/P
n − m + 1 i=m enci
moyen des années de survenance m (1 ≤ m ≤ n) à n et estimons-le en remplaçant simplement
Cin par Ĉin . Pour estimer l'erreur sur ce S/P moyen, nous aurons donc besoin de l'erreur d'une
somme et nous utilisons donc la même méthode que celle déjà employée à la section 2.3.2 pour
obtenir l'erreur sur la réserve totale. Nous obtenons alors :

n
( Ã n
! n−1
)
\ 1 X mse(Ĉin ) Ĉin X Ĉjn X 2σ̂k2 /fˆk2
ˆ )m ] =
mse[(S/P + Pn−k .
(n − m + 1)2 i=m (enci )2 enci j=i+1
encj
k=n+1−i j=1 Cjk
Pour l'exemple et pour (S/P )m étant le ratio S/P moyen calculé sur les années i à n (c'est-à-dire
m = i), cela nous donne :

\ ˆ )m ] \ ˆ )m ] en % de (S/P
ˆ )m
i Ĉin enci (S/P )m se[(S/P se[(S/P
1 40.16 60 0.7052 0.0039 0.55%
2 45.01 64 0.7142 0.0049 0.68%
3 51.05 77 0.7178 0.0060 0.84%
4 57.38 78 0.7452 0.0070 0.93%
5 64.16 85 0.7548 0.0089 1.18%

Enn, les S/P moyens utilisés sont le plus Pnsouvent obtenus par des moyennes pondérées par
1 C
l'encaissement, soit (S/P )pm = Pni=m in . L'erreur sur ce ratio S/P moyen est alors
n − m + 1 i=m enci
donnée par
1 \X n
\ ˆ p
P 2
mse[(S/P )m ] = ( n ) mse( Ĉin ),
i=m enci i=m
Pn
où mse(\ i=m Ĉin ) a été obtenu à la section 2.3.2.
Pour l'exemple et pour (S/P )pm étant le ratio S/P moyen pondéré calculé sur les années i à n
(c'est-à-dire m = i), cela nous donne :

\ ˆ )pm ] \ ˆ )p
ˆ )pm ] en % de (S/P
i Ĉin enci (S/P )pm se[(S/P se[(S/P m
1 40.16 60 0.7081 0.0042 0.60%
2 45.01 64 0.7158 0.0051 0.71%
3 51.05 77 0.7191 0.0061 0.84%
4 57.38 78 0.7456 0.0070 0.94%
5 64.16 85 0.7548 0.0089 1.18%

3 Projected case estimates.


L'utilisation de la méthode de Chain Ladder sur les montants totaux (paiements + réserves) de
sinistres suppose que les paiements et les réserves se développent de façon identique. La méthode
étudiée dans ce chapitre emploie deux types de facteurs de développement : l'un pour les réserves
et l'autre pour les paiements. Cette méthode, présentée dans le livre de Taylor [6] travaille donc
avec les deux types de données, ce qui permet d'utiliser toute l'information disponible, tout en
liant entre elles les évolutions des paiements et des réserves.

3.1 Modèle pour les réserves.


Cette méthode est présentée dans la version où on travaille en francs constants, on ramène par
exemple tous les montants en francs de la dernière année connue. Ces montants en francs constants
sont symbolisés par ∗. Dénissons
Q∗ (i, j) = réserve de sinistre estimée en période de développement j pour les
sinistres survenus en année d'accident i,

C (i, j) = montant payé en année de développement j pour les sinistres sur-
venus en année d'accident i.
Remarquons qu'en ce qui concerne les réserves, on travaille avec des montants cumulés et qu'en
ce qui concerne les paiements, on travaille avec des montants décumulés.
Le modèle retenu pour l'évolution des réserves est le suivant :
Q∗ (i, j + 1) = k(j + 1) · Q∗ (i, j) − C ∗ (i, j + 1), (8)
où k(j + 1) mesure la variation que subit, entre les années j et j + 1, la prévision qu'on fait sur
le coût total des sinistres survenus en l'année d'accident i.
En eet, Q∗ (i, j + 1) représente l'estimation de ce qu'il reste à payer à la n de l'année de dévelop-
pement j + 1 et Q∗ (i, j) représente cette même estimation à la n de l'année de développement j .
Si l'estimation n'a pas changé (c'est-à-dire k(j + 1) = 1), alors Q∗ (i, j + 1) est égal à la diérence
entre Q∗ (i, j) et ce qui est payé en l'année j + 1, soit C ∗ (i, j + 1).
L'estimateur de k(j + 1) choisi est une moyenne pondérée par les Q∗ (i, j) des coecients indivi-
duels :
n−j
X
(C ∗ (i, j + 1) + Q∗ (i, j + 1))
i=1
k̂(j + 1) = n−j
. (9)
X
Q∗ (i, j)
i=1

3.2 Modèle pour les paiements.


Le montant payé en l'année de développement j + 1, soit C ∗ (i, j + 1) est une fraction de Q∗ (i, j),
ce qui avait été mis en réserve à la n de l'année précédente :
C ∗ (i, j + 1) = h(j + 1) · Q∗ (i, j). (10)
A nouveau, ces coecients de développement sont estimés par une moyenne pondérée par les
Q∗ (i, j) des coecients individuels :
n−j
X
C ∗ (i, j + 1)
i=1
ĥ(j + 1) = n−j
. (11)
X
Q∗ (i, j)
i=1

3.3 Extrapolation des triangles.


Le triangle des paiements et le triangle des réserves sont complétés simultanément, diagonale par
diagonale, à l'aide des deux modèles (8) et (10), utilisés l'un après l'autre.
On commence par la première diagonale inconnue du triangle des paiements :
Ĉ ∗ (i, n − i + 2) = ĥ(n − i + 2) · Q∗ (i, n − i + 1) 2 ≤ i ≤ n.
On complète ensuite la première diagonale inconnue du triangle des réserves de sinistres :
Q̂∗ (i, n − i + 2) = k̂(n − i + 2) · Q∗ (i, n − i + 1) − Ĉ ∗ (i, n − i + 2) 2 ≤ i ≤ n.
On continue avec la diagonale suivante de la matrice des paiements :
Ĉ ∗ (i, n − i + 3) = ĥ(n − i + 3) · Q̂∗ (i, n − i + 2) 3 ≤ i ≤ n.
Et ainsi de suite...

Reprenons toujours le même exemple traité dans les chapitres précédents et supposons que les don-
nées concernaient des montants totaux de sinistres (paiements + réserves) pouvant se décomposer
en une matrice des paiements décumulés C et une matrice des réserves de sinistres Q.
   
15.40 4.90 7.77 7.19 4.30 20.0 17.39 11.06 4.50 0.60
16.61 2.60 11.03 9.12  22.0 22.40 13.13 5.20 
   
C=
21.35 7.29 5.59 
 Q=
22.5 18.66 15.22 

24.52 8.49  25.0 20.32 
30.47 25.0

Les coecients du modèle des réserves, calculés par (9) sont :

k̂(2) = 1, .1402 k̂(3) = 1.0915 k̂(4) = 1.0752 k̂(5) = 1.0889.


Les coecients du modèle des paiements, calculés par (11) sont :

ĥ(2) = 0.2601 ĥ(3) = 0.4173 ĥ(4) = 0.6742 ĥ(5) = 0.9556.


Les deux matrices peuvent alors être complétées diagonale par diagonale pour obtenir :

   
15.40 4.90 7.77 7.19 4.30 20.0 17.39 11.06 4.50 0.60
16.61 2.60 11.03 9.12 4.97 22.0 22.40 13.13 5.20 0.69
   
C=
21.35 7.29 5.59 10.26 5.83 Q=
22.5 18.66 15.22 6.10 0.81
24.52 8.49 8.48 9.24 5.25 25.0 20.32 13.70 5.49 0.73
30.47 6.50 9.18 10.00 5.68 25.0 22.00 14.84 5.95 0.79

Si on recumule les paiements et qu'on les ajoute aux réserves de sinistres, on obtient les résultats
totaux suivants :
 
35.40 37.69 39.13 39.76 40.16
38.61 41.61 43.37 44.56 45.02
 
43.85 47.30 49.45 50.60 51.14
 
49.52 53.33 55.19 56.22 56.71
55.47 58.98 60.99 62.11 62.63

3.4 Lien avec la méthode de Chain Ladder.


Dans cette section, nous proposons d'utiliser la technique Chain Ladder an d'analyser la méthode
des projected case estimates.
Si on combine les deux modèles (8) et (10) en un seul, on obtient

Q∗ (i, j + 1) = (k(j + 1) − h(j + 1)) · Q∗ (i, j).

En remplaçant les diérents termes du facteur (k(j + 1) − h(j + 1)) par les estimateurs (9) et (11),
nous obtenons
n−j
X
Q∗ (i, j + 1)
i=1
Q̂∗ (i, j + 1) = n−j
· Q∗ (i, j),
X
Q∗ (i, j)
i=1

ce qui revient à appliquer la méthode de Chain Ladder standard au triangle des réserves.
Plutôt que d'utiliser la méthode vue à la section 3.3, on peut donc tout simplement compléter
le triangle des réserves par la méthode de Chain Ladder, calculer les coecients ĥ(j + 1) par la
formule (11) et enn compléter le triangle des paiements.

Les coecients de développement de la méthode de Chain Ladder calculés pour le triangle des
réserves ci-dessus sont

fˆ1 = 0.8801 fˆ2 = 0.6743 fˆ3 = 0.4010 fˆ4 = 0.1333.


Ils conduisent à compléter le triangle des réserves de la même façon que dans la section 3.3.

Comme il existe un lien entre ce modèle et la méthode de Chain Ladder, on peut espérer trouver
des formules pour les erreurs standard sur les montants estimés.
En ce qui concerne les réserves, extrapolées par la méthode de Chain Ladder, on peut appliquer
directement les formules du chapitre 2.
Examinons plus en détails le cas des paiements. Le modèle des paiements conduit à la formule
suivante :
Ĉi,k+1 = ĥ(k + 1) · Q̂ik ,
où Qik est estimé par la méthode de Chain Ladder, soit
Q̂ik = Q̂i,k−1 · fˆk−1 = . . . = Qi,n+1−i · fˆn+1−i · · · fˆk−1 .
On obtient donc que
Ĉi,k+1 = Qi,n+1−i · fˆn+1−i · · · fˆk−1 · ĥ(k + 1),
ce qui ressemble fort au modèle de Chain Ladder.
De manière similaire aux développements du chapitre 2, nous nous baserons donc sur les hypothèses
suivantes :
 Indépendance des années de survenance entre elles,
 E[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = fk · Qik ,
E[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = h(k + 1) · Qik ,
 V ar[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = σk2 · Qik ,
V ar[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = τk2 · Qik .
Les paramètres sont estimés par les formules suivantes :

n−k
X
Qi,k+1
fˆk = i=1
n−k
,
X
Qi,k
i=1
n−k
X
Ci,k+1
i=1
ĥ(k + 1) = n−k
,
X
Qi,k
i=1
X n−k µ ¶2
1 Qi,k+1
σ̂k2 = Qik − fˆk ,
n − k − 1 i=1 Qik
X n−k µ ¶2
1 Ci,k+1
τ̂k2 = Qik − ĥ(k + 1) .
n − k − 1 i=1 Qik
Tous ces estimateurs sont non biaisés.

En adaptant la démonstration du théorème 2.3 (dont une version est donnée en annexe), nous
trouvons l'expression suivante pour l'estimation de l'erreur carrée moyenne sur le montant Cik :

" k−2
à ! à !#
\ X σ̂j2 1 1 2
τ̂k−1 1 1
2
mse(Ĉik ) = Ĉik + Pn−j + + Pn−k+1 .
j=n+1−i fˆ2
j Q̂ij l=1 Qlj ĥ(k)2 Q̂i,k−1 l=1 Ql,k−1

Remarquons qu'ici, l'ensemble D conditionnellement auquel on travaille est l'ensemble de toutes


les données Cij et Qij .
Remarquons enn que l'erreur obtenue porte sur un montant de paiement décumulé. Pour obtenir
l'erreur sur les paiements cumulés (et donc nalement sur les montants ultimes de sinistres), on
ne peut pas se contenter de sommer les erreurs sur les paiements décumulés, et il faudrait adapter
une formule du type de celle construite pour la somme des réserves à la section 2.3.2, ce qui n'est
pas immédiat.

4 Application.
Nous allons maintenant appliquer les diverses méthodes proposées dans les chapitres précédents
à des données réelles, issues de contrats en responsabilité civile automobile d'une compagnie alle-
mande. Nous disposons de données concernant les montants payés et les montants en réserve pour
les sinistres survenus entre 1985 et 1998.

4.1 Données.
Les tableaux 1 et 2 reprennent respectivement les données de paiements et de réserves.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1985 31499 43711 45509 46312 46786 47204 47404 47768 47963 48168 48428 48557 48863 49081
1986 36822 49591 51733 52841 53605 54156 54857 55256 55433 55791 56014 56416 56640
1987 40962 53307 55310 56594 57359 58096 58525 58886 59416 59721 60031 60472
1988 43350 56043 57981 58942 59844 60463 61006 61349 61715 61934 62267
1989 42638 55788 58168 59980 60944 62208 63360 64064 64617 65018
1990 44666 60675 63281 64662 65543 66268 66797 67314 68541
1991 58291 83957 87690 90437 92102 94021 95751 96794
1992 69050 93642 97694 100042 101654 103027 104706
1993 68513 91377 95537 98251 100020 100857
1994 63337 85106 88755 91226 93105
1995 62555 81700 84782 86785
1996 59407 78481 81517
1997 61091 79892
1998 74211

Tab. 1  Paiements cumulés (en milliers).

4.2 Résultats pour les montants en francs courants.


Nous examinons les montants sans tenir compte de l'ination, c'est-à-dire qu'on fait l'hypothèse
implicite d'une ination constante sur toute la période d'observation. Nous pouvons soit travailler
avec les paiements, soit avec les montants totaux (paiements plus réserves). Nous testons ensuite
si les hypothèses liées à l'utilisation de la méthode de Chain Ladder sont vériées par le triangle
des paiements et nous envisageons le cas où ce triangle est séparé en deux blocs distincts d'années
de survenance.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1985 30298 17875 9181 6324 5280 4390 4086 3724 3176 2748 2711 2441 1790 1160
1986 31562 19374 12314 9068 7352 6098 5492 4436 4095 4006 3932 3935 3716
1987 30975 17637 13143 9940 8285 7141 6381 6132 5500 4430 4330 3977
1988 30663 15453 10983 7834 6309 5608 4597 4113 3558 3510 3312
1989 34256 22821 16002 12937 10224 8722 7798 7001 6452 4982
1990 33768 20393 16368 11470 9336 8534 8808 8444 6500
1991 52319 31160 24682 20420 18519 17992 15417 14928
1992 43031 25069 22502 21257 20804 20306 14730
1993 52012 26968 21766 19263 19601 17641
1994 48321 24106 23127 21173 23077
1995 48787 24120 24334 23765
1996 47640 23303 22950
1997 54561 28220
1998 83807

Tab. 2  Réserves de sinistres (en milliers).

4.2.1 Paiements en francs courants.


Les résultats pour les paiements se trouvent dans le tableau 3.
Chain Ladder PCE
1985 49,081,105 49,081,105
1986 58,892,686 57,092,631
1987 61,048,730 61,221,169
1988 63,232,335 63,149,034
1989 66,354,966 66,688,925
1990 70,310,892 70,849,125
1991 100,146,339 102,722,924
1992 109,235,417 111,178,780
1993 106,563,521 109,038,895
1994 99,674,656 104,711,187
1995 94,416,888 99,791,030
1996 90,899,256 94,394,931
1997 92,784,165 96,358,740
1998 115,382,193 137,137,105

Tab. 3  Paiements cumulés naux en francs courants.

La méthode PCE (Projected Case Estimates) donne des résultats plus élevés que Chain Ladder
quand on se rapproche des années de survenance plus récentes. C'est surtout vrai pour le montant
correspondant à l'année 1998, ce qui est dû à un coecient ĥ(2) (voir tableau 4) et à une réserve
de départ particulièrement élevés.
Le tableau 4 présente les coecients de développement de la méthode de Chain Ladder, fˆk et les
σ̂k correspondants ainsi que les coecients de développement du modèle des réserves ( k(j + 1))
et du modèle des paiements (h(j + 1)) de la méthode des "projected case estimates".

Chain Ladder : fk Chain ladder : σk PCE : k(j+1) PCE : h(j+1)


1 1.3388 296.1864 0.9803 0.4294
2 1.0415 27.4872 0.9391 0.1289
3 1.0250 39.8119 0.9418 0.1010
4 1.0162 24.0810 1.0056 0.0836
5 1.0132 40.7404 0.9921 0.0799
6 1.0128 44.4508 0.9427 0.0884
7 1.0083 17.9956 0.9987 0.0710
8 1.0086 43.0330 0.9551 0.0900
9 1.0051 9.5186 0.9290 0.0653
10 1.0050 4.9988 1.0486 0.0765
11 1.0059 19.0237 1.0323 0.0886
12 1.0051 11.9030 0.9468 0.0832
13 1.0045 7.4477 0.7700 0.1218

Tab. 4  Coecients de développement.


Le tableau 5 présente les résultats du calcul des erreurs standards sur les réserves estimées par
Chain Ladder.
Année Réserve se(Ri) se(Ri) en % de Ri
1986 252,683 82,361 33%
1987 576,893 145,563 25%
1988 965,571 232,266 24%
1989 1,337,211 244,398 18%
1990 1,769,736 269,468 15%
1991 3,352,433 598,863 18%
1992 4,529,328 667,898 15%
1993 5,706,261 830,105 15%
1994 6,569,621 912,313 14%
1995 7,631,816 919,035 12%
1996 9,382,503 988,059 11%
1997 12,891,799 1,040,287 8%
1998 41,170,897 3,336,963 8%
Total 96,136,752 5,158,558 5%

Tab. 5  Erreurs sur les réserves.

On observe une décroissance de l'erreur standard relative au l des années de survenance : l'erreur
absolue augmente moins vite que la valeur de la réserve.

4.2.2 Montants totaux en francs courants.


Le tableau 6 présente les résultats pour ces montants.
Chain Ladder PCE
1985 50,241,285 50,241,285
1986 59,865,862 59,501,603
1987 63,730,359 63,447,369
1988 64,978,186 64,898,375
1989 69,564,580 69,246,803
1990 74,188,488 73,731,695
1991 110,019,968 108,449,549
1992 117,600,047 116,420,902
1993 115,832,609 114,402,232
1994 113,440,579 111,111,297
1995 108,038,881 105,867,657
1996 100,916,012 99,328,943
1997 102,887,504 101,274,010
1998 149,074,994 145,178,959

Tab. 6  Montants totaux cumulés naux en francs courants.

Remarquons que pour la méthode de Chain Ladder, les résultats sont obtenus en travaillant di-
rectement avec le triangle des montants totaux. Pour l'autre méthode, les montants sont obtenus
en sommant les triangles de paiements et de réserves complétés séparément. Si on applique sépa-
rément la méthode de Chain Ladder aux triangles de paiements et de réserves, et puis qu'on les
somme, on obtient des montants plus faibles : par exemple ; 116,315,139 en 1998.

4.2.3 Décomposition de la matrice en deux morceaux.


Si nous eectuons, sur le triangle des paiements courants (de taille n = 14) les tests présentés à
la section 2.5, nous obtenons les résultats suivants :
1. test de non corrélation des coecients de développement successifs :
/ [−0.0825; 0.0825],
0.4133 ∈
2. test de non eet d'une année calendrier : 24 ∈ [23.7990; 34.8651].
1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12 12-13 13-14
1985 0.9966 0.8880 0.9625 0.9892 0.9909 0.9980 1.0000 0.9931 0.9956 1.0044 0.9973 0.9932 0.9919
1986 1.0085 0.9287 0.9666 0.9846 0.9885 1.0016 0.9891 0.9972 1.0045 1.0025 1.0068 1.0001
1987 0.9862 0.9649 0.9720 0.9866 0.9938 0.9949 1.0017 0.9984 0.9882 1.0033 1.0014
1988 0.9660 0.9646 0.9683 0.9907 0.9988 0.9929 0.9979 0.9971 1.0026 1.0020
1989 1.0223 0.9435 0.9831 0.9760 0.9967 1.0032 0.9987 1.0001 0.9849
1990 1.0336 0.9825 0.9558 0.9836 0.9990 1.0107 1.0020 0.9905
1991 1.0407 0.9761 0.9865 0.9979 1.0126 0.9925 1.0050
1992 1.0591 1.0125 1.0092 1.0096 1.0071 0.9684
1993 0.9819 0.9912 1.0018 1.0179 0.9906
1994 0.9781 1.0244 1.0046 1.0337
1995 0.9504 1.0311 1.0131
1996 0.9508 1.0264
1997 0.9348

Tab. 7  Coecients individuels pour les montants totaux.

Nous constatons donc que les tests conduisent à rejeter la non corrélation des coecients de
développement successifs mais à accepter le non eet d'une année calendrier. En examinant les co-
ecients de développement individuels présentés dans le tableau 7, nous constatons que les années
de survenance plus récentes ne se comportent pas tout-à-fait comme les années plus anciennes, les
coecients sont plus faibles la première année et plus élevés l'année suivante.
Nous pouvons appliquer la méthode vue dans la section 2.6 et séparer le triangle en deux groupes :
nous considérons que les 8 premières années de survenance forment un groupe et les 6 dernières un
autre groupe. Nous obtenons donc deux triangles à compléter séparément et sur lesquels eectuer
les tests.
1. Triangle supérieur droit (taille n = 8) :
(a) test de non corrélation des coecients de développement successifs : −0, 2610 ∈
/ [−0.1730; 0.1730],
(b) test de non eet d'une année calendrier : 5 ∈ [4.3388; 10.4112].
2. Triangle inférieur gauche (taille n = 6) :
(a) test de non corrélation des coecients de développement successifs : 0.5666 ∈
/ [−0.2735; 0.2735],
(b) test de non eet d'une année calendrier : 2 ∈ [0.8787; 5.1213].
Nous constatons que le test de non corrélation des coecients n'est toujours pas vérié mais le
découpage du triangle apporte quand même une amélioration par rapport au triangle dans son
ensemble. D'ailleurs si on considérait des intervalles de conance à 95% (plutôt qu'à 50%), on
trouverait −0.2610 ∈ [−0.5164; 0.5164] pour le bloc supérieur droit et 0.5666 ∈ [−0.8165; 0.8165]
pour le bloc inférieur gauche, alors que pour le triangle entier le test échoue encore : 0.4133 ∈
/
[−0.2462; 0.2462].
Le bloc inférieur gauche et le bloc supérieur droit sont complétés séparément par la méthode de
Chain Ladder. Examinons les trois hypothèses envisagées pour compléter le bloc inférieur droit.
1. Première hypothèse.
Le bloc inférieur droit est complété en utilisant les coecients du bloc supérieur droit. Nous
obtenons les résultats présentés dans le tableau 8.
2. Deuxième hypothèse.
Le bloc inférieur droit est complété en utilisant un tail factor. Le développement total après
14 années subi par les sinistres survenus entre 1985 et 1992 est en moyenne fˆtot = 1, 5691. Le
développement déjà subi sur les 6 premières années par les sinistres survenus entre 1993 et
1998 est en moyenne fˆint = 1, 4536. Nous devons donc encore multiplier les montants obtenus
ˆtot
en sixième année de développement pour le bloc inférieur gauche par fˆult = ffint = 1, 0795
pour obtenir les montants ultimes (après 14 années de développement). Nous avons que
fˆ1 ≥ fˆult ≥ fˆ2 , en eet 1, 3228 ≥ 1, 0795 ≥ 1, 0414 et nous choisissons donc se(fˆ1 ) ≥
k fk σk i Cin Ri se(Ri ) se(Ri ) en % de Ri
1 1.3228 129.7850 1986 56,892,686 252,683 82,361 33%
2 1.0414 33.7574 1987 61,048,730 576,893 145,563 25%
3 1.0267 24.4490 1988 63,232,335 965,571 232,266 24%
4 1.0193 17.7686 1989 66,354,966 1,337,211 244,398 18%
5 1.0084 12.9136 1990 70,310,892 1,769,736 269,468 15%
6 1.0128 44.4508 1991 100,146,339 3,352,433 598,863 18%
7 1.0083 17.9956 1992 109,235,417 4,529,328 667,898 15%
8 1.0086 43.0330 1993 106,563,521 5,706,261 830,105 15%
9 1.0051 9.5186 1994 99,195,748 6,090,713 815,077 13%
10 1.0050 4.9988 1995 94,242,946 7,457,874 817,941 11%
11 1.0059 19.0237 1996 90,886,836 9,370,083 845,387 9%
12 1.0051 11.9030 1997 92,760,555 12,867,689 934,280 7%
13 1.0045 7.4477 1998 113,978,529 39,767,233 1,791,697 5%

Tab. 8  Résultats pour le bloc inférieur droit complété par l'hypothèse 1.

i Cin Ri se(Ri ) se(Ri ) en % de Ri


1986 56,892,686 252,683 82,361 33%
1987 61,048,730 576,893 145,563 25%
1988 63,232,335 965,571 232,266 24%
1989 66,354,966 1,337,211 244,398 18%
1990 70,310,892 1,769,736 269,468 15%
1991 100,146,339 3,352,433 598,863 18%
1992 109,235,417 4,529,328 667,898 15%
1993 108,865,326 8,008,066 830,105 10%
1994 101,338,408 8,233,373 519,729 6%
1995 96,278,623 9,493,551 547,325 6%
1996 92,850,021 11,333,268 601,415 5%
1997 94,763,701 14,871,335 714,654 5%
1998 116,440,501 42,229,205 1,654,940 4%

Tab. 9  Résultats pour le bloc inférieur droit complété par l'hypothèse 2.

se(fˆult ) ≥ se(fˆ2 ), ainsi que se(Fi1 ) ≥ se(Fi,ult ) ≥ se(Fi2 ) pour un certain i. Nous trouvons
alors les résultats présentés dans le tableau 9.
3. Constatations sur les deux premières hypothèses.
Par rapport au tableau 5 où on utilisait la méthode de Chain Ladder sur le triangle dans
son ensemble, on constate que l'utilisation de l'hypothèse 1 pour compléter le bloc inférieur
droit conduit à des erreurs relatives du même ordre de grandeur mais plus faibles quand on
se rapproche de l'année 1998. Ceci est dû au fait que les coecients de développement f1
à f5 sont estimés sur un groupe plus restreint d'années de survenance, où la volatilité des
coecients individuels est plus faible.
Le remplissage du bloc inférieur droit par l'hypothèse 2 conduit à des erreurs relatives encore
plus faibles. En eet, au lieu d'accumuler des erreurs d'estimation en utilisant une série de
coecients de développement, un seul coecient global est utilisé.
Remarquons que les erreurs calculées reètent les erreurs d'estimation des paramètres du
modèle mais ne permettent pas de dire que l'hypothèse 2 est meilleure que l'hypothèse 1.
4. Troisième hypothèse.
Nous repartons des coecients estimés par la méthode de Chain Ladder sur le triangle
inférieur gauche et rappelés dans le tableau 10.
k 1 2 3 4 5
fk 1.3228 1.0414 1.0267 1.0193 1.0084

Tab. 10  Coecients du bloc inférieur gauche.

Nous ajustons alors une courbe puissance inverse par régression linéaire de ln(fk − 1) sur
ln(1/k) et nous trouvons le modèle

fˆk = 1 + 0.2671 k −2.1038 ,


ce qui conduit aux coecients du tableau 11.
k 6 7 8 9 10 11 12 13
fk 1.0062 1.0045 1.0034 1.0026 1.0021 1.0017 1.0014 1.0012

Tab. 11  Coecients pour le bloc inférieur droit.

Nous complétons alors le bloc inférieur droit par ces coecients pour obtenir les montants
ultimes présentés au tableau 12.
i 1993 1994 1995 1996 1997 1998
Ci,14 103,206,942 96,071,243 91,274,445 88,024,048 89,838,263 110,388,390

Tab. 12  Résultats pour le bloc inférieur droit complété par l'hypothèse 3.

En résumé, l'hypothèse 1 suppose que les sinistres des années plus récentes, qui se sont développés
moins vite au début, vont ensuite reprendre le même développement que les sinistres des années
antérieures. L'hypothèse 2 suppose que, au total, ces sinistres se développent comme dans le
passé, et que donc, s'ils se développent moins au début, ils se développeront plus vite par la suite.
L'hypothèse 3 suppose que si les sinistres se sont développés moins vite au début, ils continueront
à le faire par la suite. Elle conduit donc à des montants naux moins élevés.

5 Conclusion.
Dans ce travail nous avons envisagé le problème de l'écart entre la vraie valeur du coût des
sinistres et le montant calculé par une méthode IBNR. Dans ce cadre, nous avons examiné des
formules d'estimation de la variabilité des réserves calculées par la méthode de Chain Ladder. Cette
méthode est très simple à utiliser et de ce fait ne reète pas toujours bien la réalité et présente des
faiblesses, notamment dans l'estimation des réserves pour les années d'accident les plus récentes.
Mais sa simplicité d'emploi est également un grand avantage en ce sens que l'utilisateur peut
facilement comprendre comment elle fonctionne et, le cas échéant, l'adapter pour qu'elle s'applique
de manière plus adéquate à ses données. Nous avons alors vu qu'il était encore possible de trouver
des formules d'erreur pour les réserves lorsqu'on utilise Chain Ladder de manière non standard.
D'autres adaptations des formules d'erreur ont ensuite été envisagées : d'une part dans le cas où
on s'intéresse au rapport entre la sinistralité et l'encaissement (formules d'erreur pour les ratios
S/P ) et d'autre part dans le cas de l'utilisation d'une méthode combinant l'examen de l'évolution
des paiements avec celui de l'évolution des réserves (projected case estimates).

Références
[1] Mack, Th. (1993). Distribution-free calculation of the standard error of Chain Ladder reserve
estimates. ASTIN Bulletin 23, 213-225.
[2] Mack, Th. (1993). Measuring the variability of chain ladder reserve estimates. Meeting of the
Casualty Actuarial Society, 101-182.
[3] Mack, Th. (1994). Which stochastic model is underlying the chain ladder method ?. Insu-
rance : Mathematics and Economics 15, 133-138.
[4] Mack, Th. (1999). The standard error of chain ladder reserve estimates : recursive calculation
and inclusion of a tail factor. ASTIN Bulletin 29, 361-366.
[5] Sherman, R.E. (1984). Extrapolating, smoothing, and interpolating development factors. Pro-
ceedings of the Casualty Actuarial Society, vol LXXI, 122-155.
[6] Taylor, G.C. (2000). Loss Reserving : an actuarial perspective. Kluwer Academic Publishers.
Annexe
Démonstration de l'adaptation du théorème donnant l'erreur sur une réserve individuelle au cas
de la décomposition en bloc du triangle de données et de l'utilisation de la première hypothèse,
voir la section 2.6.1, pour compléter le bloc inférieur droit.
L'erreur d'estimation de la réserve pour les années d'accident m + 1 ≤ i ≤ n correspondant au
bloc inférieur droit vaut :

" n−m−1 Ã ! n−1


à !#
\ X σ̂ 2
1 1 X σ̂ 2
1 1
2 k k
mse(Ĉin ) = Ĉin + Pn−k + + Pn−k ,
fˆ 2
Ĉik C jk fˆ 2
Ĉik C jk
k=n+1−i k j=m+1 k=n−m k j=1

où les fˆk sont calculés par (6) et les σ̂k2 sont calculés par (7).
Démonstration :
Nous utilisons les abréviations
Ei (X) = E(X | Ci1 , . . . , Ci,n+1−i ),
V ari (X) = V ar(X | Ci1 , . . . , Ci,n+1−i ).
Nous repartons de la dénition :
mse(R̂i ) = V ar(Cin | D) + (E(Cin | D) − Ĉin )2 ,
où D est l'ensemble des données utilisées, soit D = {Cik , 1 ≤ i ≤ m, n − m ≤ k ≤
n + 1 − i} ∪ {Cik , m + 1 ≤ i ≤ n, 1 ≤ k ≤ n + 1 − i}.
En appliquant de façon répétée le modèle de Chain Ladder (3) et l'hypothèse de va-
riance (5), le premier terme de la dénition de mse(R̂i ) peut être réécrit comme :
V ar(Cin | D) = V ari (Cin ) par (4)
= Ei (V ar(Cin | Ci1 , . . . , Ci,n−1 )) + V ari (E(Cin | Ci1 , . . . , Ci,n−1 ))
2 2
= Ei (Ci,n−1 ) σn−1 + V ari (Ci,n−1 ) fn−1 par (5) et (3)
2 2
= Ei (E(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) σn−1 + Ei (V ar(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) fn−1
2
+V ari (E(Ci,n−1 | Ci1 , . . . , Ci,n−2 )) fn−1
2 2 2 2 2
= Ei (Ci,n−2 ) fn−2 σn−1 + Ei (Ci,n−2 ) σn−2 fn−1 + V ari (Ci,n−2 ) fn−2 fn−1
par (5) et (3)
..
.
n−1
X
= Ci,n+1−i fn+1−i · · · fk−1 · σk2 · fk+1
2 2
· · · fn−1 ,
k=n+1−i

car Ei (Ci,n+1−i ) = Ci,n+1−i et V ar(Ci,n+1−i ) = 0.


Comme nous ne connaissons pas les paramètres fk et σk2 , nous les remplaçons par leurs
estimateurs fˆk et σ̂k2 , c'est-à-dire que nous estimons le premier terme de mse(R̂i ) par :
n−1
X
\
V ar(Cin | D) = Ci,n+1−i fˆn+1−i · · · fˆk−1 · σ̂k2 · fˆk+1
2
· · · fˆn−1
2

k=n+1−i

fˆn+1−i · · · fˆn−1
n−1
X 2 2
2 · σ̂k2
= Ci,n+1−i
ˆ ˆ ˆ2
k=n+1−i Ci,n+1−i · fn+1−i · · · fk−1 · fk
n−1
X
2 σ̂k2 /fˆk2
= Ĉin (∗)
k=n+1−i
Ĉik
En ce qui concerne le deuxième terme de mse(R̂i ), nous utilisons le théorème 2.1 pour
le réécrire sous la forme :

(E(Cin | D) − Ĉin )2 = Ci,n+1−i


2
(fn+1−i · · · fn−1 − fˆn+1−i · · · fˆn−1 )2 .

Pour estimer ce second terme on ne peut pas simplement remplacer fk par son estima-
teur car cela conduirait à l'annuler. Nous utilisons donc une autre approche. Posons

F = fn+1−i · · · fn−1 − fˆn+1−i · · · fˆn−1


= Sn+1−i + · · · + Sn−1 ,


Sk = fˆn+1−i · · · fˆk−1 · (fk − fˆk ) · fk+1 · · · fn−1 .
Nous avons alors

F 2 = (Sn+1−i + · · · + Sn−1 )2
n−1
X X
= Sk2 + 2 Sj Sk .
k=n+1−i j<k

Nous approximons ensuite Sk2 par E(Sk2 | Bk ) et Sj Sk par E(Sj Sk | Bk ), où Bk est l'en-
semble de toutes les données utiles et connues jusqu'à l'année de développement k ,
c'est-à-dire Bk = {Cij , j ≤ k, i + j ≤ n + 1, i ≥ m + 1} si k ≤ n − m − 1 et
Bk = {Cij , n − m ≤ j ≤ k, i + j ≤ n + 1} si k ≥ n − m.
Comme E(fk − fˆk | Bk ) = 0 (car fˆk est un estimateur non biaisé de fk ), nous avons
que E(Sj Sk | Bk ) = 0.
Comme, pour 1 ≤ k ≤ n − m − 1,

E((fk − fˆk )2 | Bk ) = V ar(fˆk | Bk )


Pn−k
i=m+1 V ar(Ci,k+1 | Bk )
= ³P ´2
n−k
i=m+1 ikC
Pn−k
σ 2 Cik
= ³Pi=m+1 k ´2
n−k
i=m+1 Cik

σ2
= Pn−k k ,
i=m+1 Cik

et comme, pour n − m ≤ k ≤ n − 1,

E((fk − fˆk )2 | Bk ) = V ar(fˆk | Bk )


Pn−k
i=1 V ar(Ci,k+1 | Bk )
= ³P ´2
n−k
i=1 Cik
Pn−k 2
σ Cik
= ³Pi=1 k ´2
n−k
i=1 Cik

σk2
= Pn−k ,
i=1 Cik
nous obtenons
σ2
E(Sk2 | Bk ) = fn+1−i
2 2
· · · fk−1 · Pn−k k 2
· fk+1 2
· · · fn−1 pour 1 ≤ k ≤ n − m − 1,
i=m+1 Cik

et
σ2
E(Sk2 | Bk ) = fn+1−i
2 2
· · · fk−1 · Pn−kk 2
· fk+1 2
· · · fn−1 pour n − m ≤ k ≤ n − 1.
i=1 Cik
P
Nous estimons donc F 2 par 2
k E(Sk | Bk ) et nous pouvons à présent remplacer les
paramètres fk et σk2 , par leurs estimateurs fˆk et σ̂k2 , c'est-à-dire que nous estimons le
second terme de mse(R̂i ) par :
à n−m−1
X σ̂ 2
(E(Cin\ 2
| D) − Ĉin )2 = Ci,n+1−i fˆn+1−i
2
· · · fˆk−1
2
· Pn−k k · fˆk+1
2
· · · fˆn−1
2

k=n+1−i i=m+1 Cik

n−1
!
X σ̂k2
+ fˆn+1−i
2
· · · fˆk−1
2
· Pn−k · fˆk+1
2
· · · fˆn−1
2

k=n−m i=1 Cik


à n−m−1 n−1
!
X σ̂k2 /fˆk2 X σ̂k2 /fˆk2
2
= Ci,n+1−i · fˆn+1−i
2
· · · fˆn−1
2
Pn−k + Pn−k
k=n+1−i i=m+1 Cik k=n−m i=1 Cik

à n−m−1 n−1
!
X σ̂k2 /fˆk2 X
σ̂k2 /fˆk2
2
= Ĉin Pn−k + Pn−k (∗∗)
k=n+1−i i=m+1 Cik k=n−m i=1 Cik

En additionnant les expressions (∗) et (∗∗), nous retrouvons la formule proposée pour
\
mse( Ĉ ).
in

Résumé
L'estimation des réserves de sinistre se fait généralement par des techniques dites IBNR. Cet
article a pour but principal d'examiner l'une d'entre elles, la méthode Chain Ladder, dans un
cadre stochastique. Ce type d'analyse permet de dégager des formules pour estimer la variabilité
des réserves calculées et, par suite, de construire des intervalles de conance pour ces réserves.
Nous verrons également comment adapter facilement les formules étudiées pour des cas particuliers
d'utilisation pratique de la méthode de Chain Ladder.

Samenvatting
De schatting van de schadereserves gebeurt gewoonlijk aan de hand van technieken IBNR genoemd.
Dit artikel heeft als belangrijkste doel het onderzoek van één van deze technieken, de Chain
Ladder methode, in een stochastisch kader. Dit soort analyse laat toe formules af te leiden om
de variabiliteit van de berekende reserves te schatten, en bijgevolg betrouwbaarheidsintervallen te
construeren voor deze reserves. We zullen ook zien hoe op een gemakkelijke manier de bestudeerde
formules kunnen aangepast worden voor speciale gevallen van praktisch gebruik van de Chain
Ladder methode.
Abstract
The estimation of claims reserves is usually done by applying techniques called IBNR techniques.
The main objective of this article is to examine one of these techniques, sc. the Chain Ladder
method, within a stochastic framework. This kind of analysis allows us to deduct formulae to esti-
mate the variability of the calculated reserves and consequently enables us to construct condence
intervals for these reserves. We shall also demonstrate how the deducted formulae can easily be
adapted for particular cases of practical use of the Chain Ladder method.

Vous aimerez peut-être aussi