Edude Ibnr Methodes

Sandra Pitrebois Philippe De Longueville Michel Denuit Jean-Franois Walhin
Etude de techniques IBNR modernes
SOMMAIRE
1. Introduction 2. Chain Ladder Stochastique 3. Projected Case Estimates 4. Application 5. Conclusion Rfrences Annexe Rsum
Introduction.
Le paiement des sinistres ne s'eectue pas toujours en une fois, dans l'anne mme de survenance. C'est particulirement vrai dans certaines branches de l'assurance, comme par exemple la responsabilit civile automobile dans le cas de sinistres avec dommages corporels. Au contraire, le rglement des sinistres s'tale au l du temps et il est ncessaire de constituer des rserves pour pouvoir honorer les dettes futures. Comme le montant qui sera nalement pay pour le sinistre est inconnu au dpart, la somme mettre en rserve est galement inconnue et il faut l'estimer. Ces estimations peuvent tre calcules par des techniques, dites techniques IBNR (Incurred But Not Reported), qui se basent sur l'volution passe du cot des sinistres pour estimer son dveloppement futur. En pratique ces techniques sont utilises soit pour estimer les rserves purement IBNR, soit les rserves de sinistres totales. Dans cet article, nous tudierons des techniques modernes, ou des complments rcents des techniques plus anciennes, d'estimation des rserves de sinistre. Dans la section 2 nous examinerons la mthode bien connue de Chain Ladder. Cette mthode sera analyse dans un cadre stochastique, permettant de dgager des formules pour l'estimation de la variabilit des rserves calcules. Nous aurons ainsi des expressions pour l'erreur standard sur la rserve correspondant chaque anne de survenance de sinistres examine ainsi que sur la rserve totale. Ces mesures de variabilit nous permettront de construire des intervalles de conance pour les rserves. Nous verrons galement comment calculer trs facilement ces diverses expressions par des formules rcursives. Le modle stochastique, qui sous-tend la mthode de Chain Ladder et qui est utilis ici, repose sur trois hypothses que doivent vrier les donnes sur lesquelles on dsire appliquer la mthode. Nous verrons dans quelle mesure des tests permettent de vrier que les donnes satisfont bien ces hypothses. Ensuite, nous essaierons d'adapter les formules tudies lors d'une utilisation pratique de la mthode de Chain Ladder. En eet, cette mthode suppose que le cot du sinistre x annes aprs sa survenance est proportionnel au cot de l'anne prcdente et que cette proportion ne change pas, que le sinistre soit survenu il y a 10 ans ou aujourd'hui. En pratique, il est possible que, suite un changement dans la politique de paiement ou de rservation par exemple, le dveloppement des sinistres ne se comporte pas dans les annes rcentes comme dans les annes antrieures. Nous verrons comment adapter les estimations et les formules d'erreur dans ce cas. Pour clturer cette deuxime section, nous examinerons les ratios S/P , c'est--dire les montants de sinistres rapports l'encaissement, annuels et moyens, pour lesquels nous pourrons galement aboutir des formules d'erreur standard. La section suivante tudie une mthode qui travaille en parallle sur les donnes concernant les paiements eectus et sur les donnes concernant les montants mis en rserves au l du temps. Elle permet donc d'utiliser toute l'information disponible et de modliser sparment les volutions des paiements et des rserves tout en les liant entre elles. Nous verrons ensuite comment cette mthode rejoint celle de Chain Ladder et nous essaierons d'adapter les formules d'erreur prsentes dans la deuxime section pour qu'elles puissent s'appliquer cette mthode dite des "projected case estimates". La dernire section prsentera une application des diverses mthodes proposes des donnes relles, paiements et rserves sur 14 annes, issues de la branche responsabilit civile automobile.
Chain Ladder stochastique.
La mthode de Chain Ladder est une mthode dterministe permettant d'estimer les rserves de sinistres. Elle est trs simple utiliser mais les estimations qu'elle fournit pour les annes d'accident les plus rcentes sont trs sensibles des variations dans les donnes observes. Il est ds lors intressant de pouvoir quantier la variabilit des rserves estimes, notamment pour dterminer si la dirence entre les rsultats obtenus par Chain Ladder et ceux obtenus par une autre mthode est signicative, mais galement pour construire des intervalles de conance sur les estimations faites pour prvoir le montant ultime des sinistres. Pour mesurer cette variabilit, il faut d'abord dterminer quel est le modle stochastique qui sous-tend la mthode de Chain Ladder et quelles sont les hypothses sur lesquelles se base cette mthode.
2.1
La mthode de Chain Ladder dterministe.
Commenons par rappeler les notations et formules usuelles relatives cette mthode. Soit Cik le montant, cumul jusqu'en l'anne de dveloppement k , des sinistres survenus en l'anne d'accident i, pour 1 i, k n. Cik peut reprsenter soit le montant pay, soit le cot total estim (paiement dj eectu plus rserve) du sinistre. Les montants Cik sont connus pour i + k n + 1 et on cherche estimer les valeurs des Cik pour i + k > n + 1, et en particulier les valeurs ultimes Cin pour 2 i n. Ces notations sont illustres dans le triangle suivant : C1,1 C1,2 C1,n1 C1,n C2,1 C2,2 C1,n1 . . . C= . . . Cn1,1 Cn1,2 Cn,n La mthode de Chain Ladder estime les montants inconnus, Cik pour i + k > n + 1, par
...
Cik = Ci,n+1i fn+1i fk1

o
nk
i + k > n + 1,
(1)
Ci,k+1 fk =
i=1 nk
1 k n 1. Cik
(2)
i=1
Il est donc suppos que Cik est proportionnel Ci,k1 et que le coecient de proportionnalit fk1 , calcul sur base des donnes sinistres du pass ne dpend pas de l'anne d'accident i. Le montant ultime des sinistres survenus en anne i est alors estim par
Cin = Ci,n+1i fn+1i fn1
2 i n.
La rserve de sinistre pour l'anne d'accident i (c'est--dire ce qui reste payer pour les sinistres survenus en l'anne i), qui est dnie par Ri = Cin Ci,n+1i , est alors estime par
Ri = Ci,n+1i fn+1i fn1 Ci,n+1i
2 i n.
2.2
Un modle stochastique pour la mthode de Chain Ladder.
Le modle stochastique, prsent dans Mack [1] , [2] et [3] relatif la mthode de Chain Ladder repose sur trois hypothses. Les deux premires sont les suivantes :
E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk
1 i n, 1 k n 1
sont indpendants
(3) (4)
{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } i, j
L'hypothse (3) signie qu'tant donn le dveloppement Ci1 , . . . , Cik des sinistres survenus en anne i, il existe un coecient fk tel que l'esprance de Ci,k+1 est gale Cik fk . Ceci traduit deux hypothses de base de la mthode de Chain Ladder. Premirement seule la valeur la plus rcente Cik est utile pour dterminer Ci,k+1 , et deuximement le facteur fk est indpendant de l'anne d'accident i considre. L'hypothse (4) signie quant elle que les annes de survenance sont indpendantes entre elles. Le thorme suivant montre que si on estime les paramtres du modle (3) par (2) alors ce modle stochastique (3), combin avec l'hypothse (4) fournit exactement les mmes rserves que la mthode originale de Chain Ladder (1).
Thorme 2.1. Soit D = {Cik | i + k n + 1}, l'ensemble de toutes les donnes observes. Sous
les hypothses (3) et (4), on a
E(Cin | D) = Ci,n+1i fn+1i fn1 .
La preuve est donne dans Mack [1].
Le thorme suivant montre que estimer fn+1i fn1 par fn+1i fn1 fournit un bon estimateur. Thorme 2.2. Sous les hypothses (3) et (4), les estimateurs fk , donns par (2) sont non biaiss
et non corrls.
La preuve est donne dans Mack [1].
Par extension on peut galement montrer que E(fn+1i fn1 ) = fn+1i fn1 , ce qui montre in = Ci,n+1i fn+1i fn1 est un estimateur non biais de E(Cin | D) = Ci,n+1i que C fn+1i fn1 . De la mme manire, l'estimateur de la rserve, Ri = Cin Ci,n+1i , est un estimateur non biais de la vraie rserve Ri = Cin Ci,n+1i .
2.3
Calcul de l'erreur standard.
La formule d'estimation de l'erreur standard base sur le modle prsent la section 2.2 est prsente dans Mack [1] et [2].
2.3.1
Estimation de l'erreur sur la rserve d'une anne de survenance et construction d'un intervalle de conance.
Cin fournit un estimateur mais pas la valeur exacte de Cin . Dans cette section, nous introduisons l'objet principal de cet article en nous intressant la distance moyenne entre l'estimateur et la vraie valeur. L'erreur carre moyenne, mse(Cin ) de l'estimateur Cin de Cin se dnit par mse(Cin ) = E[(Cin Cin )2 | D],
o D est dni comme plus haut, c'est--dire comme l'ensemble des donnes observes. On s'intresse ici une moyenne conditionnelle base sur l'ensemble de donnes spcique D an d'obtenir la dviation moyenne entre Cin et Cin due uniquement l'ala futur subi par cet ensemble de donnes bien spci et sans tenir compte des dviations passes.
L'erreur standard se(Cin ) est dnie comme gale
mse(Cin ).
Si on s'intresse l'erreur sur la rserve, on doit calculer mse(Ri ) = E[(Ri Ri )2 | D]. Comme i = Cin Ci,n+1i et Ri = Cin Ci,n+1i , on a nalement que R mse(Ri ) = E[(Cin Cin )2 | D] = mse(Cin ).
L'erreur d'estimation de la rserve pour une anne d'accident est donc gale l'erreur d'estimation du montant nal payer pour les sinistres survenus lors de cette anne. En eet, ces deux grandeurs sont gales une constante additive prs.
Pour pouvoir calculer mse(Cin ), nous allons le dcomposer selon la formule mse(Cin ) = V ar(Cin | D) + (E(Cin | D) Cin )2 ,
qui est une application de la rgle gnrale E(X a)2 = V ar(X) + (E(X) a)2 .
Cette formule nous montre que nous aurons donc besoin d'estimer la variance de Cik , ce qui va nous conduire dgager une troisime hypothse pour l'utilisation de la mthode de Chain Ladder. Ci,k+1 Comme fk est la moyenne pondre par Cik des facteurs de dveloppement individuels , (en Cik nk nk nk Ci,k+1 Ci,k+1 Cik Ci,k+1 = i=1 Ci,k+1 = eet fk = ), on peut montrer que V ar( Cik | Ci1 , . . . , Cik ) nk nk nk Cik i=1 Cik i=1 Cik i=1 Cik i=1 i=1 doit tre inversment proportionnel Cik , et ce an que fk soit un estimateur non biais de variance minimum. Nous reparlerons de cette hypothse dans la section 2.5.1. Cette hypothse peut se rcrire V ar(
Ci,k+1 Cik
| Ci1 , . . . , Cik ) =
2 k , Cik
ou encore (5)
2 V ar(Ci,k+1 | Ci1 , . . . , Cik ) = Cik k
1 i n, 1 k n 1.
Cette hypothse (5) est (avec (3) et (4)) la troisime hypothse qui sous-tend implicitement la mthode de Chain Ladder.
2 Les paramtres k sont inconnus et devront tre estims.
Le thorme suivant donne la formule permettant d'estimer ce que nous cherchons, savoir mse(Ri ).
Thorme 2.3. Sous les hypothses (3), (4) et (5), mse(Ri ) peut tre estim par
n1
2 mse(Ri ) = Cin
k=n+1i
k 2 f2
k
1 + Cik
1
nk j=1
Cjk
o Cik = Ci,n+1i fn+1i fk1 (k > n + 1 i) sont les valeurs estimes de Cik et i,n+1i = Ci,n+1i , C nk Ci,k+1 1 2 2 et o k = nk1 Cik ( fk )2 (1 k n 2) est un estimateur sans biais de k , Cik i=1 2 2 et n1 = min ( n2 , min (n3 , n2 )). 2 2
n3
La preuve est donne dans Mack [1]. Remarque sur le choix de n1 : 2 si fn1 = 1 et qu'on croit que le dveloppement des sinistres se termine aprs n 1 annes, alors on prend n1 = 0, sinon, on extrapole la srie 1 , . . . , n2 , pour ajouter un terme supplmentaire, soit par n2 rgression loglinaire, soit en exigeant que n3 = n1 soit vrie, pour autant que n3 > n2 n2 . C'est cette dernire possibilit qui a t retenue dans le thorme 2.3.
Nous avons maintenant des estimations pour la moyenne de la variable Ri (soit Ri ) et pour l'cart-type de cette variable (soit se(Ri )). Il nous reste faire une hypothse paramtrique sur la distribution de Ri pour pouvoir construire facilement des intervalles de conance sur les rserves estimes. Si le volume de donnes est susant, on peut supposer que la distribution est normale, de moyenne la valeur estime Ri et d'cart-type donn par l'erreur standard se(Ri ). Un intervalle de conance 95% est alors donn par Ri 2se(Ri ), Ri + 2se(Ri ) .
Mais la distribution normale n'est peut-tre pas une bonne approximation si la vraie distribution de Ri n'est pas symtrique. De plus, la distribution normale peut conduire une borne infrieure ngative mme si la rserve ne peut pas tre ngative. Dans ces cas-l, il vaut mieux utiliser une approche base sur une distribution lognormale. Nous approximons alors la distribution de 2 la rserve Ri par une distribution lognormale de paramtres i et i tels que la moyenne et la variance des deux distributions soient gales, c'est--dire tels que :
2 exp(i + i /2) = Ri 2 2 exp(2i + i )(exp(i ) 1) = (se(Ri ))2 ,
ce qui conduit :
i = ln(Ri )
2 i
2 i 2 se(Ri ) 2 = ln(1 + ( ) ). Ri
Les bornes d'un intervalle de conance 95% seront alors donnes par
[exp(i 2i ), exp(i + 2i )] = Ri exp( i 2i ), Ri exp( i + 2i ) . 2 2
Prenons un petit exemple pour illustrer numriquement les direntes formules rencontres. Soit le triangle des montants cumuls de sinistres suivant : 35.40 37.69 39.13 39.76 40.16 38.61 41.61 43.37 44.56 43.85 47.30 49.45 C= 49.52 53.33 55.47
Calculons les coecients de dveloppement fk par la formule (2) et les coecients k par la formule 2 indique dans le thorme 2.3. Nous obtenons : f1 = 1.0750 1 = 1.6080 103 2 f2 = 1.0423 f3 = 1.0221 f4 = 1.0101, 4 = 0.5510 103 . 2
2 = 0.5510 103 2
3 = 2.6444 103 2
Les coecients de dveloppement permettent mule (1). 35.40 37.69 38.61 41.61 C = 43.85 47.30 49.52 53.33 55.47 56.63
de complter le triangle des montants par la for-
39.13 43.37 49.45 55.58 62.15
39.76 44.56 50.54 56.81 63.52
40.16 45.01 51.05 57.38 64.16
Nous pouvons nalement estimer les rserves Ri pour 2 i 5 par Ri = Ci5 Ci,6i et utiliser le thorme 2.3 pour estimer l'erreur commise sur ces rserves. Nous obtenons ainsi mse(Ri ) et en en prenant la racine carre, nous obtenons se(Ri ). Nous examinons galement se(Ri ) en pourcentage de la rserve, et nalement nous construisons des intervalles de conance pour la rserve, bass sur la distribution normale et sur la distribution lognormale. i 2 3 4 5 Ri 0.45 1.60 4.05 8.69 mse(Ri ) 0.0521 0.2766 0.3715 0.5740 se(Ri ) 0.2282 0.5259 0.6095 0.7576 se(Ri ) en % de Ri 50.90% 32.89% 15.05% 8.72%
IC Normal [0.01, 0.90] [0.55, 2.65] [2.83, 5.27] [7.17, 10.20] IC Lognormal [0.15, 1.04] [0.80, 2.88] [2.97, 5.40] [7.27, 10.30]
Nous observons ici une dcroissance de l'erreur relative en fonction de l'anne de survenance : l'erreur absolue augmente moins vite que la valeur de la rserve. Modions quelques donnes et prenons 35.40 38.61 C = 43.85 49.52 55.47 l'exemple suivant :
37.69 40.62 47.30 52.59 59.06
39.13 42.77 49.00 54.80 61.54
39.76 43.63 49.89 55.80 62.66
40.16 44.07 50.39 56.36 63.29
Les coecients fk et k sont : 2 f1 = 1.0646 f2 = 1.0421 f3 = 1.0182 f4 = 1.0101,
1 = 5.0327 103 2
2 = 3.5648 103 2
3 = 0.3282 103 2
4 = 0.0302 103 . 2
L'examen des rserves fournit le tableau suivant qui prsente une toute autre volution de l'erreur relative, due au fait que l'erreur standard absolue se(Ri ) volue plus rapidement d'anne en anne que dans le premier cas :
i 2 3 4 5
Ri 0.44 1.39 3.77 7.82
mse(Ri ) 0.0028 0.0296 0.3160 0.7952
se(Ri ) 0.0526 0.1721 0.5621 0.8918
se(Ri ) en % de Ri 12% 12% 15% 11%
IC Normal [0.33, 0.54] [1.05, 1.74] [2.65, 4.90] [6.04, 9.61]
IC Lognormal [0.34, 0.55] [1.08, 1.77] [2.77, 5.02] [6.19, 9.76]
Examinons la sensibilit des rsultats si on modie la donne C (2, 4) par rapport au dernier exemple. Ce seul changement implique une modication des coecients f3 et 3 et aussi de 4 de 2 2 par sa construction, modication qui va se rpercuter sur toutes les annes de survenance et faire augmenter brusquement les erreurs standards ( cause de la forte augmentation de 3 ). 2 35.40 37.69 39.13 39.76 40.16 38.61 40.62 42.77 44.56 45.01 C = 43.85 47.30 49.00 50.45 50.96 49.52 52.59 54.80 56.42 56.99 55.47 59.06 61.54 63.36 64.00
Les coecients fk et k sont : 2 f1 = 1.0646 1 = 5.0327 103 2 f2 = 1.0421 f3 = 1.0295 f4 = 1.0101, 4 = 3.5648 103 . 2
2 = 3.5648 103 2
3 = 13.5511 103 2
L'examen des rserves fournit le tableau suivant :
i 2 3 4 5
Ri 0.45 1.96 4.40 8.53
mse(Ri ) 0.3369 1.4907 2.0389 2.8472
se(Ri ) 0.5804 1.2210 1.4279 1.6874
se(Ri ) en % de Ri 129% 62% 32% 20%
IC Normal [0.71, 1.61] [0.49, 4.40] [1.55, 7.26] [5.15, 11.90]
IC Lognormal [0.04, 1.99] [0.53, 5.23] [2.22, 7.88] [5.65, 12.38]
Une augmentation d'un montant de sinistre de 2% a donc conduit une forte augmentation de la variabilit. Les erreurs standard relatives ont t multiplies par des coecients qui vont de 2 10 selon l'anne de survenance.
2.3.2
Estimation de l'erreur sur la rserve totale.
Il est galement intressant de calculer l'erreur commise sur la rserve totale estime R = R2 + 2 + Rn . On ne peut pas se contenter de sommer les erreurs (se(Ri )) parce qu'elles sont corrles ) mais on peut utiliser le thorme suivant. entre elles (car toutes inuences par les mmes fk Thorme 2.4. Sous les hypothses (3), (4) et (5), mse(R) peut tre estim par
n n n1
mse(R) =
i=2
mse(Ri ) + Cin
j=i+1
Cjn
k=n+1i
2k /fk 2 2
nk j=1
Cjk
La preuve est donne dans Mack [1]. Dans le premier exemple ci-dessus, la rserve totale vaut R = 14.79 et l'erreur estime vaut mse(R) = 2.3900. Nous avons donc que se(R) = 1.5460, soit 10.45% de R.
2.4
Formule rcursive pour calculer l'erreur standard et introduction d'un tail factor.
Formule rcursive de calcul de l'erreur standard.
Cette formule est donne par Mack [4].
2.4.1
Les erreurs standard sur les rserves estimes donnes la section 2.3 peuvent tre calcules de faon rcursive. Reprenons le modle d'estimation de Chain Ladder
Cin = Ci,n+1i fn+1i fn1 . Le thorme 2.3 donne la formule pour l'erreur standard sur Cin :
n1
2 (se(Cin ))2 = Cin

k=n+1i
k 2 f2
k
1 + Cik
1
nk j=1
Cjk
Cette formule peut tre rcrite sous la forme :

n1
2 (se(Cin ))2 = Cin

k=n+1i
2 (se(Fik ))2 + (se(fk ))2 /fk ,
Fik =
fk , et (se(fk ))2 =
Ci,k+1 , Cik 2 2 (se(Fik )) = C k est (c'est l'hypothse (5)) un estimateur de V ar(Fik | Ci1 , . . . , Cik ) = E[(Fik ik fk )2 | Ci1 , . . . , Cik ] qui mesure la variation entre un coecient individuel Fik et la vraie valeur k 2 Pnk
j=1
Cjk
est (ceci est dmontr dans le cadre de la section 2.6.1) un estimateur de
V ar(fk | Ci1 , . . . , Cik ) = E[(fk fk )2 | Ci1 , . . . , Cik ] qui mesure la dviation entre la moyenne estime fk et la vraie valeur fk . Sous cette forme, la formule du calcul de l'erreur conduit au programme de rcursion suivant : se(Ci,n+1i ) = 0 (se(Ci,k+1 ))2 = C 2 (se(Fik ))2 + (se(fk ))2 + (se(Cik ))2 f 2
ik k
En utilisant les donnes du premier exemple prcdent, on obtient les rsultats suivants pour les estimateurs de la variance des coecients de dveloppement individuels Fik et de la variance des coecients de dveloppement globaux de Chain Ladder fk :
4.54 105 4.16 105 (se(Fik ))2 = 3.67 105 3.25 105 2.90 105 (se(f1 ))2 = 9.61 106
1.46 105 1.32 105 1.16 105 1.03 105 9.24 106
6.76 105 6.10 105 5.35 105 4.76 105 4.25 105
1.39 105 1.24 105 1.09 105 9.70 106 8.67 106 (se(f4 ))2 = 1.391 105 .
(se(f2 ))2 = 4.35 106
(se(f3 ))2 = 3.21 105
L'utilisation de ces coecients dans la formule rcursive conduit aux mmes rsultats que ceux obtenus par la formule du thorme 2.3.
Pour la rserve totale sur toutes les annes d'accident, on a la formule rcursive suivante
n 2 n 2
se
i=n+1k
Ci,k+1
= +
se
i=n+2k n
Ci,k 2 Cik (se(Fik ))2
2 fk
i=n+1k n 2
+
i=n+1k
Cik
(se(fk ))2 ,
commenant avec k = 1.
2.4.2
Inclusion d'un tail factor.
Comme le dveloppement des sinistres survenus en l'anne d'accident i n'est pas ncessairement termin aprs n annes de dveloppement, on utilise un tail factor fult > 1 pour estimer le montant ultime Ci,ult par Ci,ult = Cin fult .
On peut prendre fult =

k=n
fk , o les fk futurs sont estims par une extrapolation linaire de
ln(fk 1). Mais il faut prendre garde que ce tail factor soit plausible et en concordance avec l'exprience acquise sur le dveloppement futur des sinistres.
La rcursion peut tre facilement tendue pour inclure un tail factor :
2 2 (se(Ci,ult ))2 = Cin (se(Fi,ult ))2 + (se(fult ))2 + (se(Cin ))2 fult . On a donc besoin de valeurs pour fult , se(fult ) et se(Fi,ult ) i. En pratique on xe fult , se(fult ) et se(Fi,ult ) pour un i donn. Pour cela, on xe fult , par rgression ou suivant l'exprience comme dj discut prcdemment, puis on cherche k tel que fk1 > fult > fk . Il reste estimer, de la manire la plus raisonnable possible, se(fult ) et se(Fi,ult ). On peut par exemple prendre ces valeurs telles que se(fk1 ) > se(fult ) > se(fk )
et
se(Fi,k1 ) > se(Fi,ult ) > se(Fik ). Une fois ces trois valeurs xes, on peut en dduire ult = se(Fi,ult ) Cin , et par suite dterminer se(Fi,ult ) pour toutes les autres annes de survenance i. Un exemple numrique de cette procdure est donn la section 4.2.3.
2.5
Vrication des hypothses sous-jacentes la mthode de Chain Ladder.
Rappelons les trois hypothses sur lesquelles repose la mthode de Chain Ladder et que nous avons utilises dans les sections prcdentes :
E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk
1 i n, 1 k n 1
sont indpendants
(3), (4), (5).
{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } i, j

1 i n, 1 k n 1
Il est donc important de vrier que le triangle de donnes sur lequel on veut travailler satisfait bien ces trois conditions avant de pouvoir appliquer la mthode de Chain Ladder. Les tests prsents sont tirs de Mack [2].
2.5.1
Vrication des hypothses (3) et (5).
Fixons l'anne de dveloppement k . L'quation (3) peut alors tre interprte comme un modle de rgression linaire Yi = c + X i b + i 1 i n, o i est le terme d'erreur tel que E( i ) = 0, et o c = 0, Yi = Ci,k+1 , Xi = Cik et b = fk . Les coecients de la rgression sont dtermins par une minimisation des carrs des erreurs pondrs n
wi (Yi c Xi b)2 ,
i=1
o les wi sont inversment proportionnels la V ar(Yi ). Donc, si l'hypothse (5) est vrie, V ar(Ci,k+1 ) est proportionnelle Cik , et donc wi est inversment proportionnel Cik , ce qui conduit au problme de minimisation suivant :
nk
min
i=1
(Ci,k+1 Cik fk )2 /Cik .
En annulant la drive par rapport fk de l'expression minimiser, on trouve

nk
Ci,k+1 fk =
i=1 nk
, Cik
i=1
soit le rsultat dj fourni en (2). Pour vrier les hypothses (3) et (5), on peut examiner deux types de graphiques :
1. pour k donn, on construit le graphique de Ci,k+1 en fonction de Cik , et on regarde si les points sont proches de la droite passant par l'origine et de pente fk , 2. pour k donn, on construit le graphique des rsidus (Ci,k+1 Cik fk )/ Cik en fonction de
Cik , et on vrie si l'hypothse de variance utilise conduit bien des rsidus alatoires, ne manifestant pas de tendance.
En guise d'illustration, mme si le nombre de donnes n'est pas vraiment susant pour eectuer des tests, examinons le cas k = 1 de l'exemple dj exploit dans les sections prcdentes. Les donnes sont les suivantes :
Ci2 = (37.69 41.61 47.30 Ci1 = (35.40

et conduisent aux deux graphiques suivants.
60
53.33), 49.52),
38.61 43.85
f1 = 1.0750,
55
50 Montants Ci2
45
40
35
30 30
35
40 Montants Ci1
45
50
55
Fig. 1 Exemple de vrication de l'hypothse (3)
Nous voyons donc que les montants suivent de prs la droite passant par l'origine et de pente f1 . En ce qui concerne le caractre alatoire des rsidus, il est dicile de juger vu le petit nombre de donnes.
Si les graphes construits ne conduisent pas au rsultat escompt, on peut remplacer (5) par d'autres hypothses sur la variance et examiner les mmes types de graphiques que ci-dessus : V ar(Ci,k+1 ) proportionnelle 1 (c'est--dire, k donn, V ar(Ci,k+1 ) identique i), ce qui implique wi inversment proportionnel 1. Le problme de minimisation est alors min nk (Ci,k+1 i=1
nk
Ci,k+1 Cik Cik fk )2 , ce qui conduit la solution fk1 =

i=1 nk 2 Cik i=1
0.03
0.02
0.01
-0.01 Rsidus
-0.02
-0.03
-0.04
-0.05
-0.06
-0.07 30
35
40 Montants Ci1
45
50
55
Fig. 2 Exemple de vrication de l'hypothse(5)
2 2 V ar(Ci,k+1 ) proportionnelle Cik , ce qui implique wi inversment proportionnel Cik . Le nk 2 2 problme de minimisation est alors min i=1 (Ci,k+1 Cik fk ) /Cik , ce qui conduit la
Ci,k+1 . Cik i=1 Toutes les formules de calcul d'erreur standard seraient alors revoir pour ces hypothses et coecients de dveloppement donns, ce qui est facilement faisable. solution fk2 =
1 nk
nk
2.5.2
Test de non corrlation des coecients de dveloppement successifs.

Ci,k+1 Cik
L'hypothse (3) peut se rcrire E(
| Ci1 , . . . , Cik ) = fk
Ci,k+1 Cik
1 i n, 1 k n 1. On
Cik Ci,k1 prcdent CCik i,k1 Ci,k+1 Cik
peut prouver que cette hypothse implique que les facteurs de dveloppement non corrls : la valeur attendue du facteur plus grand ou plus petit que d'habitude. Le test utilis est le test de Spearman. Pour chaque colonne k , on trie les facteurs
Ci,k+1 , Cik
et
sont soit
est la mme, que le facteur
Ci,k+1 Cik
par ordre croissant et on note rik , le rang de

Cnk,k+1 , Cnk,k
1 rik n k .
on recommence le tri et on note
Ci,k+1 , Cik
On retire ensuite le dernier coecient de la colonne, soit
si,k+1 le rang de On dnit alors
1 si,k+1 n (k + 1).
nk
Tk = 1 6
i=1
(rik sik )2 (n k)3 n + k
2 k n 2.
On peut montrer que 1 Tk 1, et que sous l'hypothse de non corrlation, E(Tk ) = 0 et 1 V ar(Tk ) = nk1 .
Illustrons le calcul des rangs rik et si,k+1 par notre exemple habituel, pour lequel n = 5 et pour lequel les coecients de dveloppement individuels sont les suivants :
k=1 k=2 k=3 k=4 1.0647 1.0382 1.0161 1.0101 1.0777 1.0423 1.0274 1.0787 1.0455 1.0769
Ces coecients conduisent aux rangs suivants :
ri1 1 3 4 2
si2 1 2 3
ri2 1 2 3
si3 1 2
ri3 1 2
Nous remarquons d'emble que dans l'exemple, les coecients gardent le mme rang d'une colonne l'autre (rik = sik ), ce qui va conduire videmment rejeter la non corrlation des coecients successifs. Nous obtenons en eet T2 = T3 = 1.
On dsire tester le triangle dans son ensemble et non pas par paires de colonnes. On va donc utiliser une statistique de test T globale, moyenne pondre par n k 1 (poids inversment proportionnels V ar(Tk )) des Tk :
n2
T =
k=2
nk1 Tk = n2 k=2 n k 1
n2
k=2
nk1 Tk , (n 2)(n 3)/2
E(T ) = 0 et V ar(T ) =
1 . (n 2)(n 3)/2
Si n k 10, la distribution de Tk est normale en bonne approximation, et comme T est l'aggrgation de plusieurs Tk non corrls (sous l'hypothse nulle de non corrlation des coecients de dveloppement successifs, les Tk sont non corrls), on peut supposer que T a approximativement une distribution normale.
Dans l'exemple T = appliquer le test.
2 3
T2 +
1 3
T3 = 1. Le nombre de donnes est nanmoins insusant pour
Comme le test n'est qu'approximatif et qu'on cherche dtecter des corrlations dans le triangle entier, on ne prend pas un intervalle de conance 95% qui a trs peu de chances de rejeter la non corrlation mais un intervalle de conance 50%. On ne rejettera donc pas la non corrlation si
0.67 (n 2)(n 3)/2
0, .67 (n 2)(n 3)/2
2.5.3
Test de non eet d'une anne calendrier.
Il reste tester l'hypothse (4), qui suppose l'indpendance des direntes annes de survenance entre elles. En eet certains triangles de donnes sont sujets des eets calendrier (comme par exemple des changements dans le traitement ou la rservation des sinistres, des changements d'ination) qui peuvent aecter plusieurs annes d'accident de la mme faon et donc perturber l'indpendance. Soit les lments d'une diagonale
Dj = {Cj1 , Cj1,2 , . . . , C2,j1 , C1j }
1 j n,
et les coecients de dveloppement qui dpendent des lments de Dj , soit que les lments de Dj sont au dnominateur : C1,j+1 Cj2 ,..., }, Aj = { Cj1 C1j soit que les lments de Dj sont au numrateur :
Aj1 = {
C1,j Cj1,2 ,..., }. Cj1,1 C1,j1
Donc, si les lments de Dj sont plus grands que d'habitude, les lments de Aj seront plus petits et les lments de Aj1 plus grands que d'habitude. Pour chaque colonne k , on marque les coecients de dveloppement par un G s'ils sont suprieurs la mdiane de la colonne et par un P s'ils sont infrieurs la mdiane. Remarquons que quand le nombre d'lments de la colonne est impair, il y a un lment qui est gal la mdiane et qui ne sera pas marqu. Pour chaque diagonale Aj de coecients de dveloppement (2 j n 1), on compte alors le nombre d'lments marqus d'un G, soit Gj et le nombre d'lments marqus d'un P , soit Pj . S'il n'y a pas de changement d'une anne calendrier l'autre, alors Gj et Pj doivent tre proches l'un de l'autre, chaque coecient de dveloppement ayant 50% de chances d'tre G G +P ou P , ou, pour l'exprimer autrement, Zj = min(Gj , Pj ) doit tre proche de j 2 j .
Dans l'exemple tudi, les coecients de dveloppement individuel, dj mentionns dans la section 2.5.2, conduisent la dcomposition en coecients P et coecients G suivante : P P P G G G G P Pour chacune des diagonales le dcompte obtenu est alors le suivant : diag j 2 3 4
Pj 1 1 1
Gj 1 1 2
Zj 1 1 1
Pour laborer un test, il faut tout d'abord dterminer quels sont les deux premiers moments de Zj . En cas de non rejet de l'hypothse de non eet signicatif d'une anne calendrier, Pj suit une loi binomiale de paramtres nj = Gj + Pj et p = 1/2. On peut alors montrer que
E(Zj ) =
nj 2
nj 1 mj
nj , 2nj
V ar(Zj ) =
o mj =
nj 1 2
nj (nj 1) 4
nj 1 mj
nj (nj 1) + E(Zj ) (E(Zj ))2 , 2nj
On ne teste pas les Zj sparment pour viter une accumulation des erreurs de probabilit et on considre donc une variable globale Z = Z2 + + Zn1 , avec E(Z) = E(Zj ) et V ar(Z) = V ar(Zj ). Nous pouvons supposer que Z suit une distribution normale et nous ne rejettons pas l'hypothse de non eet signicatif d'une anne calendrier (au seuil = 5%) si
E(Z) 2 V ar(Z) Z E(Z) + 2

Dans l'exemple nous trouvons : diag j 2 3 4 Total
V ar(Z).
Zj 1 1 1 3
E(Zj ) 0.50 0.50 0.75 1.75
V ar(Zj ) 0.2500 0.2500 0.1875 0.6875
Si le nombre de donnes tait susant pour appliquer le test, nous trouverions 0.092 3 3.408, ce qui conduirait ne pas rejeter l'indpendance des annes de survenance.
2.6
Adaptation des formules d'erreur.
Les mesures de variabilit des rserves estimes par la mthode de Chain Ladder ont t eectues pour des coecients de dveloppement calculs de manire standard, c'est--dire en utilisant toutes les donnes disponibles. En pratique, si on travaille avec un nombre important d'annes de survenance et si on s'aperoit qu'il y a une cassure dans le triangle des donnes, c'est--dire que les sinistres survenus lors des annes les plus rcentes ne se dveloppent pas de la mme faon que ceux des annes antrieures, on va peut-tre utiliser des coecients de dveloppement qui, au lieu d'tre estims partir de toutes les annes prcdentes, le sont partir des annes les plus rcentes. Nous allons donc travailler avec le triangle de donnes suivant, comportant n annes de survenance et n annes de dveloppement. Nous supposons que les m premires annes de survenance forment un bloc, c'est--dire ont un dveloppement semblable, et que les n m dernires annes forment un autre bloc, avec un schma de dveloppement dirent de celui du premier bloc.
Cm2 . . . Cm,nm Cm1 Cm+1,1 Cm+1,2 . . . Cm+1,nm . . . . . . Cn1,1 Cn1,2 Cn1

...
C11 C21 . . .
C12 C22 . . .
... ...
C1,nm C2,nm . . .
C1,nm+1 C2,nm+1 . . . Cm,nm+1
. . . C1,n1 C1n . . . C2,n1
Remarquons que le triangle pourrait tre dcoup en un nombre de blocs plus lev.
...
Nous utilisons la mthode de Chain Ladder pour obtenir les montants ultimes de sinistres. Nous considrons donc que les donnes satisfont aux trois hypothses habituelles :
E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk

1 i n, 1 k n 1
sont indpendants
(3), (4), (5).
{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } i, j
1 i n, 1 k n 1
2 Les estimateurs fk de fk et k de k auront la mme forme que prcdemment (voir (2) et tho2 rme 2.3) mais direront en fonction de k : pour k allant de 1 n m 1, les coecients sont calculs partir des annes de survenance les plus rcentes, soit de m + 1 n, pour k allant de n m n 1, les coecients sont calculs comme avant, partir des annes de survenance 1 m.
Les coecients de dveloppement fk sont donc toujours le rsultat de rgressions linaires pond1 res par Cik , mais sur un nombre de donnes moindre. Tout se passe comme si on travaillait sur deux triangles dirents auxquels on applique, sparment, la mthode de Chain Ladder. Remar quons que tant qu'on travaille sur les deux triangles de faon spare, on n'a pas besoin de fnm et nm , coecients permettant de passer d'un triangle l'autre. De plus, les trois hypothses 2 doivent tre vries sur les deux triangles spars et pas sur l'ensemble de donnes de dpart. En eet, si on spare les annes de survenance en deux groupes distincts, c'est justement parce que l'hypothse (3) n'est pas satisfaite par les donnes dans leur ensemble. Le triangle suprieur droit, Cij , pour 1 i m et n m + 1 j n + 1 i conduit aux montants ultimes C1n , C2n , . . . , Cmn . Le triangle infrieur gauche Cij , pour m + 1 i n et 1 j n + 1 i conduit aux montants ultimes Cm+1,nm , Cm+2,nm , . . . , Cn,nm . C1,nm+1 . . . C1,n1 C1n C11 C12 . . . C1,nm C21 C2,nm+1 . . . C2,n1 C2n C22 . . . C2,nm . . . . . . . . . . . . . . . . . . m,n1 Cmn Cm1 Cm2 . . . Cm,nm Cm,nm+1 . . . C Cm+1,1 Cm+1,2 . . . Cm+1,nm . . . . . . . . . Cn1,1 Cn1,2 . . . Cn1,nm n2 n,nm Cn1 C ... C Ecrivons explicitement les formules fournissant les coecients fk et k : 2
nk
Ci,k+1 fk =
i=m+1 nk
1k nm1 Cik
(6)
i=m+1 nk
Ci,k+1 fk =
i=1 nk
nmk n1 Cik
i=1
Les fk sont des estimateurs sans biais des fk (la dmonstration est analogue celle du thorme 2.2).
nk
k 2
1 (nk)m1 i=m+1 nk
Cik ( Cik (
Ci,k+1 fk )2 Cik
1k nm2
(7)
k = 2
1 nk1 i=1
Ci,k+1 fk )2 Cik
nmk n2
2 2 2 Les k sont des estimateurs sans biais des k . Il faut encore estimer nm1 et n1 , ce qui peut 2 se faire par extrapolation sur base des k prcdents ou par une formule du type de celle utilise 2 dans le thorme 2.3.
Donc, l'application de Chain Ladder aux deux triangles sparment nous permet d'utiliser la formule du thorme 2.3 pour estimer la variabilit des rserves : pour le bloc suprieur droit
n1
2 mse(Cin ) = Cin
k=n+1i
k 2 f2
k
1 + Cik 1 + Cik
1
nk j=1
Cjk
2im
pour le bloc infrieur gauche

nm1
2 mse(Ci,nm ) = Ci,nm
k=n+1i
k 2 f2
k
1
nk j=m+1
Cjk
m+2in
On voudrait encore pouvoir estimer les montants ultimes Cin pour m+1 i n et leur variabilit. Pour cela, il faut donc d'abord faire une hypothse sur la faon dont on va complter le bloc restant, savoir le bloc infrieur droit. Nous allons envisager trois hypothses direntes.
2.6.1
Premire hypothse.
On applique Chain Ladder avec les coecients fk estims sur les annes d'accident 1 m. On suppose donc que le bloc complter satisfait aux hypothses pour appliquer Chain Ladder et qu'il se dveloppe comme dans les annes de survenance plus anciennes (comme le bloc suprieur droit). Nous obtenons alors, pour m + 1 i n :
nm1
2 mse(Cin ) = Cin
k=n+1i
k 2 f2
k
1 + ik C
1
nk j=m+1
n1
Cjk
+
k=nm
k 2 f2
k
1 + ik C
1
nk j=1
Cjk
o les fk sont calculs par (6) et les k sont calculs par (7). 2
La dmonstration de cette formule, qui se trouve en annexe, est une adaptation de la dmonstration du thorme 2.3, donne dans Mack [1]. La formule rcursive dtermine la section 2.4 reste valable, moyennant une petite adaptation :
2 2 (se(Ci,k+1 ))2 = Cik (se(Fik ))2 + (se(fk ))2 + (se(Cik ))2 fk ,

o (se(Fik ))2 = C k ik 2 Pnk k j=m+1 Cjk (se(fk ))2 = k 2 Pnk
j=1
pour 1 k n m 1 pour n m k n 1.
Cjk
2.6.2
Deuxime hypothse.
Utiliser des facteurs de dveloppement calculs sur les m premires annes pour complter la partie infrieure de la matrice, alors qu'on l'avait coupe en deux justement parce que le dveloppement des annes rcentes tait dirent de celui des annes antrieures, n'est peut-tre pas trs logique. Une autre hypothse est de supposer que le dveloppement total, depuis l'anne 1 jusqu' l'anne n est le mme pour toutes les annes de survenance (depuis 1 jusque n). Nous supposons donc que Cin = ftot Ci1 i. Nous estimons alors ftot par ftot sur les m premires annes de survenance :
m
Cin ftot =
i=1 m
. Ci1
i=1
Nous examinons ensuite quel est le dveloppement total dj subi par les sinistres survenus durant les annes m + 1 n et nous l'estimons par
n
Ci,nm fint =
i=m+1 n
. Ci1
i=m+1
En calculant le rapport ftot /fint , nous obtenons le facteur par lequel multiplier les montants de sinistres estims en anne de dveloppement (n m) an d'obtenir les montants de ces sinistres en l'anne de dveloppement n. Ce facteur est donc comparable un tail factor, ftot fult = , fint
et nous utilisons la formule obtenue la section 2.4.2 pour obtenir l'estimation de la variabilit de Cin pour m + 1 i n.
Remarque : d'autres dnitions du fult peuvent tre utilises pour complter le triangle infrieur. Si les observations conduisent penser que le dveloppement total des sinistres sera moins important pour les annes m + 1 n que pour les annes prcdentes (parce qu'on s'aperoit qu'on paie une fraction plus importante du sinistre lors de la premire anne de dveloppement), alors on peut prendre 4/5ftot fult = , fint
par exemple.
2.6.3
Troisime hypothse.
Le problme de la deuxime hypothse est qu'on ne connat pas la part du sinistre qui est paye durant la premire anne de dveloppement, on peut donc dicilement estimer quel est le coefcient de dveloppement total permettant d'arriver aux montants ultimes (comment pourrait-on trouver le 4/5 ci-dessus ?). Une troisime faon de complter le bloc infrieur droit, faon qui n'utilise que les donnes du bloc infrieur gauche, est de partir des coecients de dveloppement estims pour les annes de
dveloppement 1 n m 1 et d'extrapoler pour obtenir les coecients des annes de dveloppement suivantes. On peut par exemple ajuster une courbe exponentielle ngative. Sherman [5] montre qu'on obtient un meilleur ajustement en utilisant une courbe de la forme ft = 1 + atb , o t reprsente l'anne de dveloppement et ft le coecient de dveloppement pour l'anne t. On peut rcrire la fonction comme ln(ft 1) = ln a + b ln 1 , et obtenir les paramtres a et b par une t rgression linaire de ln(ft 1) sur ln 1 . t Le fonctionnement de ces trois hypothses peut tre rsum de la faon suivante. Prenons le cas o, dans les annes rcentes, les sinistres se dveloppent au dbut plus rapidement que par le pass. L'hypothse 1 suppose alors que ces sinistres vont, par la suite, reprendre le mme dveloppement que les sinistres des annes antrieures. L'hypothse 2 suppose que, au total, ces sinistres se dveloppent comme dans le pass, et que donc, s'ils se dveloppent plus vite au dbut, ils se dvelopperont moins vite par la suite. Enn, l'hypothse 3 suppose que si les sinistres se dveloppent plus vite au dbut, ils continuent le faire par la suite. Seule une connaissance approfondie du portefeuille et de la rservation permet de choisir l'hypothse la plus proche de la ralit.
2.7
Formules d'erreur pour les ratios S/P.
Dans cette section nous nous intressons au ratio S/P, d'une grande importance pour l'assureur. Supposons que les Cik reprsentent les montants de sinistres charge de l' assureur. Pour l'anne Cin de survenance i, nous dnissons donc le ratio S/P correspondant par (S/P )i = , soit le enci montant nal des sinistres de l'anne i divis par l'encaissement de primes relatif l'anne i. Ce Cin ratio est estim par (S/P )i = et l'erreur d'estimation est directement obtenue par enci
1 2 mse[(S/P )i ] = ( ) mse(Cin ), enci o mse(Cin ) a t obtenu la section 2.3.1. Pour le premier exemple, prsent la section 2.3.1 et pour des encaissements annuels donns, nous obtenons les rsultats suivants : i 2 3 4 5 Cin 45.01 51.05 57.38 64.16
enci 64 77 78 85
S/P 0.7033 0.6630 0.7357 0.7548
se(S/P ) 0.0036 0.0068 0.0078 0.0089
se(S/P ) en % de S/P 0.51% 1.03% 1.06% 1.18%
Pour ce faire une ide de la sinistralit attendue on travaille souvent avec un S/P moyen calcul n 1 Cin sur les dernires annes de survenance. Dnissons ainsi (S/P )m = , le S/P n m + 1 i=m enci moyen des annes de survenance m (1 m n) n et estimons-le en remplaant simplement Cin par Cin . Pour estimer l'erreur sur ce S/P moyen, nous aurons donc besoin de l'erreur d'une somme et nous utilisons donc la mme mthode que celle dj employe la section 2.3.2 pour obtenir l'erreur sur la rserve totale. Nous obtenons alors :
mse[(S/P )m ] =
1 (n m + 1)2
i=m
Cin mse(Cin ) + (enci )2 enci
Cjn encj j=i+1
n1
2k /fk 2 2
nk j=1
k=n+1i
Cjk
Pour l'exemple et pour (S/P )m tant le ratio S/P moyen calcul sur les annes i n (c'est--dire m = i), cela nous donne :
i 1 2 3 4 5
Cin 40.16 45.01 51.05 57.38 64.16
enci 60 64 77 78 85
(S/P )m 0.7052 0.7142 0.7178 0.7452 0.7548
se[(S/P )m ] 0.0039 0.0049 0.0060 0.0070 0.0089
se[(S/P )m ] en % de (S/P )m 0.55% 0.68% 0.84% 0.93% 1.18%
Enn, les S/P moyens utiliss sont le plus souvent obtenus par des moyennes pondres par n 1 i=m Cin p . L'erreur sur ce ratio S/P moyen est alors l'encaissement, soit (S/P )m = n n m + 1 i=m enci donne par
m mse[(S/P )p ] = (
1
n i=m
enci
) mse(
i=m
Cin ),
o mse( n Cin ) a t obtenu la section 2.3.2. i=m Pour l'exemple et pour (S/P )p tant le ratio S/P moyen pondr calcul sur les annes i n m (c'est--dire m = i), cela nous donne : i 1 2 3 4 5 Cin 40.16 45.01 51.05 57.38 64.16
enci 60 64 77 78 85
(S/P )p m 0.7081 0.7158 0.7191 0.7456 0.7548
m se[(S/P )p ] 0.0042 0.0051 0.0061 0.0070 0.0089
m se[(S/P )p ] en % de (S/P )p m 0.60% 0.71% 0.84% 0.94% 1.18%
Projected case estimates.
L'utilisation de la mthode de Chain Ladder sur les montants totaux (paiements + rserves) de sinistres suppose que les paiements et les rserves se dveloppent de faon identique. La mthode tudie dans ce chapitre emploie deux types de facteurs de dveloppement : l'un pour les rserves et l'autre pour les paiements. Cette mthode, prsente dans le livre de Taylor [6] travaille donc avec les deux types de donnes, ce qui permet d'utiliser toute l'information disponible, tout en liant entre elles les volutions des paiements et des rserves.
3.1
Modle pour les rserves.
Cette mthode est prsente dans la version o on travaille en francs constants, on ramne par exemple tous les montants en francs de la dernire anne connue. Ces montants en francs constants sont symboliss par . Dnissons Q (i, j) = rserve de sinistre estime en priode de dveloppement j pour les sinistres survenus en anne d'accident i, C (i, j) = montant pay en anne de dveloppement j pour les sinistres survenus en anne d'accident i. Remarquons qu'en ce qui concerne les rserves, on travaille avec des montants cumuls et qu'en ce qui concerne les paiements, on travaille avec des montants dcumuls.
Le modle retenu pour l'volution des rserves est le suivant :
Q (i, j + 1) = k(j + 1) Q (i, j) C (i, j + 1),
(8)
o k(j + 1) mesure la variation que subit, entre les annes j et j + 1, la prvision qu'on fait sur le cot total des sinistres survenus en l'anne d'accident i. En eet, Q (i, j + 1) reprsente l'estimation de ce qu'il reste payer la n de l'anne de dveloppement j + 1 et Q (i, j) reprsente cette mme estimation la n de l'anne de dveloppement j . Si l'estimation n'a pas chang (c'est--dire k(j + 1) = 1), alors Q (i, j + 1) est gal la dirence entre Q (i, j) et ce qui est pay en l'anne j + 1, soit C (i, j + 1). L'estimateur de k(j + 1) choisi est une moyenne pondre par les Q (i, j) des coecients individuels :
nj
(C (i, j + 1) + Q (i, j + 1)) k(j + 1) =

i=1 nj
. Q (i, j)
(9)
i=1
3.2
Modle pour les paiements.
Le montant pay en l'anne de dveloppement j + 1, soit C (i, j + 1) est une fraction de Q (i, j), ce qui avait t mis en rserve la n de l'anne prcdente :
C (i, j + 1) = h(j + 1) Q (i, j).
(10)
A nouveau, ces coecients de dveloppement sont estims par une moyenne pondre par les Q (i, j) des coecients individuels :
nj
C (i, j + 1) h(j + 1) =
i=1 nj
. Q (i, j)
(11)
i=1
3.3
Extrapolation des triangles.
Le triangle des paiements et le triangle des rserves sont complts simultanment, diagonale par diagonale, l'aide des deux modles (8) et (10), utiliss l'un aprs l'autre. On commence par la premire diagonale inconnue du triangle des paiements :
C (i, n i + 2) = h(n i + 2) Q (i, n i + 1)
2 i n.
On complte ensuite la premire diagonale inconnue du triangle des rserves de sinistres :
Q (i, n i + 2) = k(n i + 2) Q (i, n i + 1) C (i, n i + 2)

On continue avec la diagonale suivante de la matrice des paiements :
2 i n.
C (i, n i + 3) = h(n i + 3) Q (i, n i + 2)

Et ainsi de suite...
3 i n.
Reprenons toujours le mme exemple trait dans les chapitres prcdents et supposons que les donnes concernaient des montants totaux de sinistres (paiements + rserves) pouvant se dcomposer en une matrice des paiements dcumuls C et une matrice des rserves de sinistres Q.
15.40 16.61 C = 21.35 24.52 30.47
4.90 7.77 7.19 4.30 2.60 11.03 9.12 7.29 5.59 8.49
20.0 22.0 Q = 22.5 25.0 25.0
17.39 11.06 4.50 0.60 22.40 13.13 5.20 18.66 15.22 20.32
Les coecients du modle des rserves, calculs par (9) sont :
k(2) = 1, .1402
k(3) = 1.0915
k(4) = 1.0752
k(5) = 1.0889.
Les coecients du modle des paiements, calculs par (11) sont :
h(2) = 0.2601
h(3) = 0.4173
h(4) = 0.6742
h(5) = 0.9556.
Les deux matrices peuvent alors tre compltes diagonale par diagonale pour obtenir :
15.40 16.61 C = 21.35 24.52 30.47
4.90 7.77 7.19 4.30 2.60 11.03 9.12 4.97 7.29 5.59 10.26 5.83 8.49 8.48 9.24 5.25 6.50 9.18 10.00 5.68
20.0 22.0 Q = 22.5 25.0 25.0
17.39 22.40 18.66 20.32 22.00
11.06 13.13 15.22 13.70 14.84
4.50 5.20 6.10 5.49 5.95
0.60 0.69 0.81 0.73 0.79
Si on recumule les paiements et qu'on les ajoute aux totaux suivants : 35.40 37.69 39.13 38.61 41.61 43.37 43.85 47.30 49.45 49.52 53.33 55.19 55.47 58.98 60.99
rserves de sinistres, on obtient les rsultats
39.76 44.56 50.60 56.22 62.11
40.16 45.02 51.14 56.71 62.63
3.4
Lien avec la mthode de Chain Ladder.
Dans cette section, nous proposons d'utiliser la technique Chain Ladder an d'analyser la mthode des projected case estimates. Si on combine les deux modles (8) et (10) en un seul, on obtient
Q (i, j + 1) = (k(j + 1) h(j + 1)) Q (i, j).

En remplaant les dirents termes du facteur (k(j + 1) h(j + 1)) par les estimateurs (9) et (11), nous obtenons
nj
Q (i, j + 1) Q (i, j + 1) =
i=1 nj
Q (i, j), Q (i, j)
i=1
ce qui revient appliquer la mthode de Chain Ladder standard au triangle des rserves.
Plutt que d'utiliser la mthode vue la section 3.3, on peut donc tout simplement complter le triangle des rserves par la mthode de Chain Ladder, calculer les coecients h(j + 1) par la formule (11) et enn complter le triangle des paiements.
Les coecients de dveloppement de la mthode de Chain Ladder calculs pour le triangle des rserves ci-dessus sont
f1 = 0.8801
f2 = 0.6743
f3 = 0.4010 f4 = 0.1333.
Ils conduisent complter le triangle des rserves de la mme faon que dans la section 3.3.
Comme il existe un lien entre ce modle et la mthode de Chain Ladder, on peut esprer trouver des formules pour les erreurs standard sur les montants estims. En ce qui concerne les rserves, extrapoles par la mthode de Chain Ladder, on peut appliquer directement les formules du chapitre 2. Examinons plus en dtails le cas des paiements. Le modle des paiements conduit la formule suivante : Ci,k+1 = h(k + 1) Qik , o Qik est estim par la mthode de Chain Ladder, soit
Qik = Qi,k1 fk1 = . . . = Qi,n+1i fn+1i fk1 .

On obtient donc que
Ci,k+1 = Qi,n+1i fn+1i fk1 h(k + 1),
ce qui ressemble fort au modle de Chain Ladder. De manire similaire aux dveloppements du chapitre 2, nous nous baserons donc sur les hypothses suivantes : Indpendance des annes de survenance entre elles, E[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = fk Qik , E[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = h(k + 1) Qik , 2 V ar[Qi,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = k Qik , 2 V ar[Ci,k+1 | Ci1 , . . . , Cik , Qi1 , . . . , Qik ] = k Qik . Les paramtres sont estims par les formules suivantes :
nk
Qi,k+1 fk =
i=1 nk
, Qi,k
i=1 nk
Ci,k+1 h(k + 1) =
i=1 nk
, Qi,k
i=1
k 2 k 2
1 = nk1 1 = nk1
nk
Qik
i=1 nk
Qi,k+1 fk Qik
,
2
Qik
i=1
Ci,k+1 h(k + 1) Qik
Tous ces estimateurs sont non biaiss. En adaptant la dmonstration du thorme 2.3 (dont une version est donne en annexe), nous trouvons l'expression suivante pour l'estimation de l'erreur carre moyenne sur le montant Cik :
k2
2 mse(Cik ) = Cik
j=n+1i
j 2 f2
j
1 + Qij
1
nj l=1
Qlj
k1 2 h(k)2
1 Qi,k1
1
nk+1 l=1
Ql,k1
Remarquons qu'ici, l'ensemble D conditionnellement auquel on travaille est l'ensemble de toutes les donnes Cij et Qij . Remarquons enn que l'erreur obtenue porte sur un montant de paiement dcumul. Pour obtenir l'erreur sur les paiements cumuls (et donc nalement sur les montants ultimes de sinistres), on ne peut pas se contenter de sommer les erreurs sur les paiements dcumuls, et il faudrait adapter une formule du type de celle construite pour la somme des rserves la section 2.3.2, ce qui n'est pas immdiat.
Application.
Nous allons maintenant appliquer les diverses mthodes proposes dans les chapitres prcdents des donnes relles, issues de contrats en responsabilit civile automobile d'une compagnie allemande. Nous disposons de donnes concernant les montants pays et les montants en rserve pour les sinistres survenus entre 1985 et 1998.
4.1
Donnes.
1 31499 36822 40962 43350 42638 44666 58291 69050 68513 63337 62555 59407 61091 74211 2 43711 49591 53307 56043 55788 60675 83957 93642 91377 85106 81700 78481 79892 3 45509 51733 55310 57981 58168 63281 87690 97694 95537 88755 84782 81517 4 46312 52841 56594 58942 59980 64662 90437 100042 98251 91226 86785 5 46786 53605 57359 59844 60944 65543 92102 101654 100020 93105 6 47204 54156 58096 60463 62208 66268 94021 103027 100857 7 47404 54857 58525 61006 63360 66797 95751 104706 8 47768 55256 58886 61349 64064 67314 96794 9 47963 55433 59416 61715 64617 68541 10 48168 55791 59721 61934 65018 11 12 13 14 48428 48557 48863 49081 56014 56416 56640 60031 60472 62267
Les tableaux 1 et 2 reprennent respectivement les donnes de paiements et de rserves.

1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Tab. 1 Paiements cumuls (en milliers).
4.2
Rsultats pour les montants en francs courants.
Nous examinons les montants sans tenir compte de l'ination, c'est--dire qu'on fait l'hypothse implicite d'une ination constante sur toute la priode d'observation. Nous pouvons soit travailler avec les paiements, soit avec les montants totaux (paiements plus rserves). Nous testons ensuite si les hypothses lies l'utilisation de la mthode de Chain Ladder sont vries par le triangle des paiements et nous envisageons le cas o ce triangle est spar en deux blocs distincts d'annes de survenance.
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
1 30298 31562 30975 30663 34256 33768 52319 43031 52012 48321 48787 47640 54561 83807
2 17875 19374 17637 15453 22821 20393 31160 25069 26968 24106 24120 23303 28220
3 9181 12314 13143 10983 16002 16368 24682 22502 21766 23127 24334 22950
4 6324 9068 9940 7834 12937 11470 20420 21257 19263 21173 23765
5 5280 7352 8285 6309 10224 9336 18519 20804 19601 23077
6 4390 6098 7141 5608 8722 8534 17992 20306 17641
7 4086 5492 6381 4597 7798 8808 15417 14730
8 3724 4436 6132 4113 7001 8444 14928
9 3176 4095 5500 3558 6452 6500
10 2748 4006 4430 3510 4982
11 12 13 14 2711 2441 1790 1160 3932 3935 3716 4330 3977 3312
Tab. 2 Rserves de sinistres (en milliers).
4.2.1
Paiements en francs courants.

Chain Ladder 49,081,105 58,892,686 61,048,730 63,232,335 66,354,966 70,310,892 100,146,339 109,235,417 106,563,521 99,674,656 94,416,888 90,899,256 92,784,165 115,382,193 PCE 49,081,105 57,092,631 61,221,169 63,149,034 66,688,925 70,849,125 102,722,924 111,178,780 109,038,895 104,711,187 99,791,030 94,394,931 96,358,740 137,137,105
Les rsultats pour les paiements se trouvent dans le tableau 3.

1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Tab. 3 Paiements cumuls naux en francs courants.
k correspondants ainsi que les coecients de dveloppement du modle des rserves ( k(j + 1)) et du modle des paiements (h(j + 1)) de la mthode des "projected case estimates".
1 2 3 4 5 6 7 8 9 10 11 12 13 Chain Ladder : fk Chain ladder : k PCE : k(j+1) PCE : h(j+1) 1.3388 296.1864 0.9803 0.4294 1.0415 27.4872 0.9391 0.1289 1.0250 39.8119 0.9418 0.1010 1.0162 24.0810 1.0056 0.0836 1.0132 40.7404 0.9921 0.0799 1.0128 44.4508 0.9427 0.0884 1.0083 17.9956 0.9987 0.0710 1.0086 43.0330 0.9551 0.0900 1.0051 9.5186 0.9290 0.0653 1.0050 4.9988 1.0486 0.0765 1.0059 19.0237 1.0323 0.0886 1.0051 11.9030 0.9468 0.0832 1.0045 7.4477 0.7700 0.1218
La mthode PCE (Projected Case Estimates) donne des rsultats plus levs que Chain Ladder quand on se rapproche des annes de survenance plus rcentes. C'est surtout vrai pour le montant correspondant l'anne 1998, ce qui est d un coecient h(2) (voir tableau 4) et une rserve de dpart particulirement levs. Le tableau 4 prsente les coecients de dveloppement de la mthode de Chain Ladder, fk et les
Tab. 4 Coecients de dveloppement.
Le tableau 5 prsente les rsultats du calcul des erreurs standards sur les rserves estimes par Chain Ladder.
Anne Rserve se(Ri) se(Ri) en % de Ri 1986 252,683 82,361 33% 1987 576,893 145,563 25% 1988 965,571 232,266 24% 1989 1,337,211 244,398 18% 1990 1,769,736 269,468 15% 1991 3,352,433 598,863 18% 1992 4,529,328 667,898 15% 1993 5,706,261 830,105 15% 1994 6,569,621 912,313 14% 1995 7,631,816 919,035 12% 1996 9,382,503 988,059 11% 1997 12,891,799 1,040,287 8% 1998 41,170,897 3,336,963 8% Total 96,136,752 5,158,558 5%
Tab. 5 Erreurs sur les rserves.
On observe une dcroissance de l'erreur standard relative au l des annes de survenance : l'erreur absolue augmente moins vite que la valeur de la rserve.
4.2.2
Montants totaux en francs courants.

Chain Ladder 50,241,285 59,865,862 63,730,359 64,978,186 69,564,580 74,188,488 110,019,968 117,600,047 115,832,609 113,440,579 108,038,881 100,916,012 102,887,504 149,074,994 PCE 50,241,285 59,501,603 63,447,369 64,898,375 69,246,803 73,731,695 108,449,549 116,420,902 114,402,232 111,111,297 105,867,657 99,328,943 101,274,010 145,178,959
Le tableau 6 prsente les rsultats pour ces montants.

1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Tab. 6 Montants totaux cumuls naux en francs courants.
Remarquons que pour la mthode de Chain Ladder, les rsultats sont obtenus en travaillant directement avec le triangle des montants totaux. Pour l'autre mthode, les montants sont obtenus en sommant les triangles de paiements et de rserves complts sparment. Si on applique sparment la mthode de Chain Ladder aux triangles de paiements et de rserves, et puis qu'on les somme, on obtient des montants plus faibles : par exemple ; 116,315,139 en 1998.
4.2.3
Dcomposition de la matrice en deux morceaux.
Si nous eectuons, sur le triangle des paiements courants (de taille n = 14) les tests prsents la section 2.5, nous obtenons les rsultats suivants : 1. test de non corrlation des coecients de dveloppement successifs : 0.4133 [0.0825; 0.0825], / 2. test de non eet d'une anne calendrier : 24 [23.7990; 34.8651].
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
1-2 0.9966 1.0085 0.9862 0.9660 1.0223 1.0336 1.0407 1.0591 0.9819 0.9781 0.9504 0.9508 0.9348
2-3 0.8880 0.9287 0.9649 0.9646 0.9435 0.9825 0.9761 1.0125 0.9912 1.0244 1.0311 1.0264
3-4 0.9625 0.9666 0.9720 0.9683 0.9831 0.9558 0.9865 1.0092 1.0018 1.0046 1.0131
4-5 0.9892 0.9846 0.9866 0.9907 0.9760 0.9836 0.9979 1.0096 1.0179 1.0337
5-6 0.9909 0.9885 0.9938 0.9988 0.9967 0.9990 1.0126 1.0071 0.9906
6-7 0.9980 1.0016 0.9949 0.9929 1.0032 1.0107 0.9925 0.9684
7-8 1.0000 0.9891 1.0017 0.9979 0.9987 1.0020 1.0050
8-9 0.9931 0.9972 0.9984 0.9971 1.0001 0.9905
9-10 0.9956 1.0045 0.9882 1.0026 0.9849
10-11 1.0044 1.0025 1.0033 1.0020
11-12 12-13 13-14 0.9973 0.9932 0.9919 1.0068 1.0001 1.0014
Tab. 7 Coecients individuels pour les montants totaux.
Nous constatons donc que les tests conduisent rejeter la non corrlation des coecients de dveloppement successifs mais accepter le non eet d'une anne calendrier. En examinant les coecients de dveloppement individuels prsents dans le tableau 7, nous constatons que les annes de survenance plus rcentes ne se comportent pas tout--fait comme les annes plus anciennes, les coecients sont plus faibles la premire anne et plus levs l'anne suivante. Nous pouvons appliquer la mthode vue dans la section 2.6 et sparer le triangle en deux groupes : nous considrons que les 8 premires annes de survenance forment un groupe et les 6 dernires un autre groupe. Nous obtenons donc deux triangles complter sparment et sur lesquels eectuer les tests. 1. Triangle suprieur droit (taille n = 8) : (a) test de non corrlation des coecients de dveloppement successifs : 0, 2610 [0.1730; 0.1730], / (b) test de non eet d'une anne calendrier : 5 [4.3388; 10.4112]. 2. Triangle infrieur gauche (taille n = 6) :
/ (a) test de non corrlation des coecients de dveloppement successifs : 0.5666 [0.2735; 0.2735],
(b) test de non eet d'une anne calendrier : 2 [0.8787; 5.1213]. Nous constatons que le test de non corrlation des coecients n'est toujours pas vri mais le dcoupage du triangle apporte quand mme une amlioration par rapport au triangle dans son ensemble. D'ailleurs si on considrait des intervalles de conance 95% (plutt qu' 50%), on trouverait 0.2610 [0.5164; 0.5164] pour le bloc suprieur droit et 0.5666 [0.8165; 0.8165] pour le bloc infrieur gauche, alors que pour le triangle entier le test choue encore : 0.4133 / [0.2462; 0.2462]. Le bloc infrieur gauche et le bloc suprieur droit sont complts sparment par la mthode de Chain Ladder. Examinons les trois hypothses envisages pour complter le bloc infrieur droit. 1. Premire hypothse. Le bloc infrieur droit est complt en utilisant les coecients du bloc suprieur droit. Nous obtenons les rsultats prsents dans le tableau 8. 2. Deuxime hypothse. Le bloc infrieur droit est complt en utilisant un tail factor. Le dveloppement total aprs 14 annes subi par les sinistres survenus entre 1985 et 1992 est en moyenne ftot = 1, 5691. Le dveloppement dj subi sur les 6 premires annes par les sinistres survenus entre 1993 et 1998 est en moyenne fint = 1, 4536. Nous devons donc encore multiplier les montants obtenus ftot en sixime anne de dveloppement pour le bloc infrieur gauche par fult = fint = 1, 0795 pour obtenir les montants ultimes (aprs 14 annes de dveloppement). Nous avons que f1 fult f2 , en eet 1, 3228 1, 0795 1, 0414 et nous choisissons donc se(f1 )
1 2 3 4 5 6 7 8 9 10 11 12 13
fk k i Cin Ri se(Ri ) se(Ri ) en % de Ri 1.3228 129.7850 1986 56,892,686 252,683 82,361 33% 1.0414 33.7574 1987 61,048,730 576,893 145,563 25% 1.0267 24.4490 1988 63,232,335 965,571 232,266 24% 1.0193 17.7686 1989 66,354,966 1,337,211 244,398 18% 1.0084 12.9136 1990 70,310,892 1,769,736 269,468 15% 1.0128 44.4508 1991 100,146,339 3,352,433 598,863 18% 1.0083 17.9956 1992 109,235,417 4,529,328 667,898 15% 1.0086 43.0330 1993 106,563,521 5,706,261 830,105 15% 1.0051 9.5186 1994 99,195,748 6,090,713 815,077 13% 1.0050 4.9988 1995 94,242,946 7,457,874 817,941 11% 1.0059 19.0237 1996 90,886,836 9,370,083 845,387 9% 1.0051 11.9030 1997 92,760,555 12,867,689 934,280 7% 1.0045 7.4477 1998 113,978,529 39,767,233 1,791,697 5%
Tab. 8 Rsultats pour le bloc infrieur droit complt par l'hypothse 1.

i
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Cin Ri se(Ri ) se(Ri ) en % de Ri 56,892,686 252,683 82,361 33% 61,048,730 576,893 145,563 25% 63,232,335 965,571 232,266 24% 66,354,966 1,337,211 244,398 18% 70,310,892 1,769,736 269,468 15% 100,146,339 3,352,433 598,863 18% 109,235,417 4,529,328 667,898 15% 108,865,326 8,008,066 830,105 10% 101,338,408 8,233,373 519,729 6% 96,278,623 9,493,551 547,325 6% 92,850,021 11,333,268 601,415 5% 94,763,701 14,871,335 714,654 5% 116,440,501 42,229,205 1,654,940 4%
se(fult ) se(f2 ), ainsi que se(Fi1 ) se(Fi,ult ) se(Fi2 ) pour un certain i. Nous trouvons alors les rsultats prsents dans le tableau 9.
3. Constatations sur les deux premires hypothses. Par rapport au tableau 5 o on utilisait la mthode de Chain Ladder sur le triangle dans son ensemble, on constate que l'utilisation de l'hypothse 1 pour complter le bloc infrieur droit conduit des erreurs relatives du mme ordre de grandeur mais plus faibles quand on se rapproche de l'anne 1998. Ceci est d au fait que les coecients de dveloppement f1 f5 sont estims sur un groupe plus restreint d'annes de survenance, o la volatilit des coecients individuels est plus faible. Le remplissage du bloc infrieur droit par l'hypothse 2 conduit des erreurs relatives encore plus faibles. En eet, au lieu d'accumuler des erreurs d'estimation en utilisant une srie de coecients de dveloppement, un seul coecient global est utilis. Remarquons que les erreurs calcules retent les erreurs d'estimation des paramtres du modle mais ne permettent pas de dire que l'hypothse 2 est meilleure que l'hypothse 1. 4. Troisime hypothse. Nous repartons des coecients estims par la mthode de Chain Ladder sur le triangle infrieur gauche et rappels dans le tableau 10.
k 1 2 3 4 5 fk 1.3228 1.0414 1.0267 1.0193 1.0084
Tab. 10 Coecients du bloc infrieur gauche.
Nous ajustons alors une courbe puissance inverse par rgression linaire de ln(fk 1) sur ln(1/k) et nous trouvons le modle
fk = 1 + 0.2671 k 2.1038 ,
ce qui conduit aux coecients du tableau 11.

k 6 7 8 9 10 11 12 13 fk 1.0062 1.0045 1.0034 1.0026 1.0021 1.0017 1.0014 1.0012
Tab. 11 Coecients pour le bloc infrieur droit.
Nous compltons alors le bloc infrieur droit par ces coecients pour obtenir les montants ultimes prsents au tableau 12.
i 1993 1994 1995 1996 1997 1998 Ci,14 103,206,942 96,071,243 91,274,445 88,024,048 89,838,263 110,388,390
En rsum, l'hypothse 1 suppose que les sinistres des annes plus rcentes, qui se sont dvelopps moins vite au dbut, vont ensuite reprendre le mme dveloppement que les sinistres des annes antrieures. L'hypothse 2 suppose que, au total, ces sinistres se dveloppent comme dans le pass, et que donc, s'ils se dveloppent moins au dbut, ils se dvelopperont plus vite par la suite. L'hypothse 3 suppose que si les sinistres se sont dvelopps moins vite au dbut, ils continueront le faire par la suite. Elle conduit donc des montants naux moins levs.
Conclusion.
Dans ce travail nous avons envisag le problme de l'cart entre la vraie valeur du cot des sinistres et le montant calcul par une mthode IBNR. Dans ce cadre, nous avons examin des formules d'estimation de la variabilit des rserves calcules par la mthode de Chain Ladder. Cette mthode est trs simple utiliser et de ce fait ne rete pas toujours bien la ralit et prsente des faiblesses, notamment dans l'estimation des rserves pour les annes d'accident les plus rcentes. Mais sa simplicit d'emploi est galement un grand avantage en ce sens que l'utilisateur peut facilement comprendre comment elle fonctionne et, le cas chant, l'adapter pour qu'elle s'applique de manire plus adquate ses donnes. Nous avons alors vu qu'il tait encore possible de trouver des formules d'erreur pour les rserves lorsqu'on utilise Chain Ladder de manire non standard. D'autres adaptations des formules d'erreur ont ensuite t envisages : d'une part dans le cas o on s'intresse au rapport entre la sinistralit et l'encaissement (formules d'erreur pour les ratios S/P ) et d'autre part dans le cas de l'utilisation d'une mthode combinant l'examen de l'volution des paiements avec celui de l'volution des rserves (projected case estimates).
Rfrences
[1] Mack, Th. (1993). Distribution-free calculation of the standard error of Chain Ladder reserve estimates. ASTIN Bulletin 23, 213-225. [2] Mack, Th. (1993). Measuring the variability of chain ladder reserve estimates. Meeting of the Casualty Actuarial Society, 101-182. [3] Mack, Th. (1994). Which stochastic model is underlying the chain ladder method ?. Insurance : Mathematics and Economics 15, 133-138. [4] Mack, Th. (1999). The standard error of chain ladder reserve estimates : recursive calculation and inclusion of a tail factor. ASTIN Bulletin 29, 361-366. [5] Sherman, R.E. (1984). Extrapolating, smoothing, and interpolating development factors. Proceedings of the Casualty Actuarial Society, vol LXXI, 122-155. [6] Taylor, G.C. (2000). Loss Reserving : an actuarial perspective. Kluwer Academic Publishers.
Annexe
Dmonstration de l'adaptation du thorme donnant l'erreur sur une rserve individuelle au cas de la dcomposition en bloc du triangle de donnes et de l'utilisation de la premire hypothse, voir la section 2.6.1, pour complter le bloc infrieur droit. L'erreur d'estimation de la rserve pour les annes d'accident m + 1 i n correspondant au bloc infrieur droit vaut :
nm1
2 mse(Cin ) = Cin
k=n+1i
k 2 f2
k
1 + Cik
1
nk j=m+1
n1
Cjk
+
k=nm
k 2 f2
k
1 + Cik
1
nk j=1
Cjk
o les fk sont calculs par (6) et les k sont calculs par (7). 2
Nous utilisons les abrviations
Dmonstration :
Ei (X) = E(X | Ci1 , . . . , Ci,n+1i ), V ari (X) = V ar(X | Ci1 , . . . , Ci,n+1i ).

Nous repartons de la dnition :
mse(Ri ) = V ar(Cin | D) + (E(Cin | D) Cin )2 ,

o D est l'ensemble des donnes utilises, soit D = {Cik , 1 i m, n m k n + 1 i} {Cik , m + 1 i n, 1 k n + 1 i}. En appliquant de faon rpte le modle de Chain Ladder (3) et l'hypothse de va riance (5), le premier terme de la dnition de mse(Ri ) peut tre rcrit comme :
V ar(Cin | D) = = = =
V ari (Cin ) par (4) Ei (V ar(Cin | Ci1 , . . . , Ci,n1 )) + V ari (E(Cin | Ci1 , . . . , Ci,n1 )) 2 2 Ei (Ci,n1 ) n1 + V ari (Ci,n1 ) fn1 par (5) et (3) 2 2 Ei (E(Ci,n1 | Ci1 , . . . , Ci,n2 )) n1 + Ei (V ar(Ci,n1 | Ci1 , . . . , Ci,n2 )) fn1 2 +V ari (E(Ci,n1 | Ci1 , . . . , Ci,n2 )) fn1 2 2 2 2 2 = Ei (Ci,n2 ) fn2 n1 + Ei (Ci,n2 ) n2 fn1 + V ari (Ci,n2 ) fn2 fn1 par (5) et (3) . . .
n1
= Ci,n+1i
k=n+1i
2 2 2 fn+1i fk1 k fk+1 fn1 ,
car Ei (Ci,n+1i ) = Ci,n+1i et V ar(Ci,n+1i ) = 0.

2 Comme nous ne connaissons pas les paramtres fk et k , nous les remplaons par leurs estimateurs fk et k , c'est--dire que nous estimons le premier terme de mse(Ri ) par : 2 n1
V ar(Cin | D) = Ci,n+1i
k=n+1i 2 = Ci,n+1i n1
2 fn+1i fk1 k fk+1 fn1 2 2 2 2 2 fn+1i fn1 k 2 k=n+1i Ci,n+1i fn+1i fk1 fk k /fk 2 2 Cik ()
n1
2 = Cin
k=n+1i
En ce qui concerne le deuxime terme de mse(Ri ), nous utilisons le thorme 2.1 pour le rcrire sous la forme :
2 (E(Cin | D) Cin )2 = Ci,n+1i (fn+1i fn1 fn+1i fn1 )2 .
Pour estimer ce second terme on ne peut pas simplement remplacer fk par son estimateur car cela conduirait l'annuler. Nous utilisons donc une autre approche. Posons
F = fn+1i fn1 fn+1i fn1 = Sn+1i + + Sn1 ,

o Nous avons alors
Sk = fn+1i fk1 (fk fk ) fk+1 fn1 .
F 2 = (Sn+1i + + Sn1 )2
n1
=
k=n+1i
2 Sk + 2 j<k
Sj Sk .
2 2 Nous approximons ensuite Sk par E(Sk | Bk ) et Sj Sk par E(Sj Sk | Bk ), o Bk est l'ensemble de toutes les donnes utiles et connues jusqu' l'anne de dveloppement k , c'est--dire Bk = {Cij , j k, i + j n + 1, i m + 1} si k n m 1 et Bk = {Cij , n m j k, i + j n + 1} si k n m.
Comme E(fk fk | Bk ) = 0 (car fk est un estimateur non biais de fk ), nous avons que E(Sj Sk | Bk ) = 0.
Comme, pour 1 k n m 1,
E((fk fk )2 | Bk ) = V ar(fk | Bk ) =
nk i=m+1
V ar(Ci,k+1 | Bk )
nk i=m+1
Cik
2
nk i=m+1
2 k Cik
nk i=m+1 2 k nk i=m+1
Cik ,
=
et comme, pour n m k n 1,
Cik
E((fk fk )2 | Bk ) = V ar(fk | Bk ) =
nk i=1
V ar(Ci,k+1 | Bk )
nk i=1
Cik
2
nk i=1
2 k Cik
nk i=1 2 k nk i=1
Cik ,
Cik
nous obtenons
2 2 2 E(Sk | Bk ) = fn+1i fk1 2 k nk i=m+1
Cik
2 2 fk+1 fn1
pour 1 k n m 1,
et
2 2 2 E(Sk | Bk ) = fn+1i fk1 2 k nk i=1
Cik
2 2 fk+1 fn1
pour n m k n 1.
2 Nous estimons donc F 2 par k E(Sk | Bk ) et nous pouvons prsent remplacer les 2 paramtres fk et k , par leurs estimateurs fk et k , c'est--dire que nous estimons le 2 second terme de mse(Ri ) par : nm1 2 (E(Cin | D) Cin )2 = Ci,n+1i k=n+1i n1
2 2 fn+1i fk1 k 2
nk i=1
k 2
nk i=m+1
Cik
2 2 fk+1 fn1
+
k=nm
2 2 fn+1i fk1
Cik
2 2 fk+1 fn1 k /fk 2 2

nk i=m+1 n1
nm1
2 Ci,n+1i
2 2 fn+1i fn1
k=n+1i
Cik
+
k=nm
k /fk 2 2
nk i=1
Cik
nm1
2 = Cin
k=n+1i
k /fk 2 2
nk i=m+1
n1
Cik
+
k=nm
k /fk 2 2
nk i=1
Cik
()
En additionnant les expressions () et (), nous retrouvons la formule propose pour mse(Cin ).
Rsum
L'estimation des rserves de sinistre se fait gnralement par des techniques dites IBNR. Cet article a pour but principal d'examiner l'une d'entre elles, la mthode Chain Ladder, dans un cadre stochastique. Ce type d'analyse permet de dgager des formules pour estimer la variabilit des rserves calcules et, par suite, de construire des intervalles de conance pour ces rserves. Nous verrons galement comment adapter facilement les formules tudies pour des cas particuliers d'utilisation pratique de la mthode de Chain Ladder.
Samenvatting
De schatting van de schadereserves gebeurt gewoonlijk aan de hand van technieken IBNR genoemd. Dit artikel heeft als belangrijkste doel het onderzoek van n van deze technieken, de Chain Ladder methode, in een stochastisch kader. Dit soort analyse laat toe formules af te leiden om de variabiliteit van de berekende reserves te schatten, en bijgevolg betrouwbaarheidsintervallen te construeren voor deze reserves. We zullen ook zien hoe op een gemakkelijke manier de bestudeerde formules kunnen aangepast worden voor speciale gevallen van praktisch gebruik van de Chain Ladder methode.
Abstract
The estimation of claims reserves is usually done by applying techniques called IBNR techniques. The main objective of this article is to examine one of these techniques, sc. the Chain Ladder method, within a stochastic framework. This kind of analysis allows us to deduct formulae to estimate the variability of the calculated reserves and consequently enables us to construct condence intervals for these reserves. We shall also demonstrate how the deducted formulae can easily be adapted for particular cases of practical use of the Chain Ladder method.

Edude Ibnr Methodes

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Edude Ibnr Methodes

Transféré par

Droits d'auteur :

Formats disponibles

Sandra Pitrebois Philippe De Longueville Michel Denuit Jean-Franois Walhin

Etude de techniques IBNR modernes

Chain Ladder stochastique.

La mthode de Chain Ladder dterministe.

Cik = Ci,n+1i fn+1i fk1

Cin = Ci,n+1i fn+1i fn1

Ri = Ci,n+1i fn+1i fn1 Ci,n+1i

Un modle stochastique pour la mthode de Chain Ladder.

E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk

{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } i, j

E(Cin | D) = Ci,n+1i fn+1i fn1 .

La preuve est donne dans Mack [1].

Calcul de l'erreur standard.

L'erreur standard se(Cin ) est dnie comme gale

2 V ar(Ci,k+1 | Ci1 , . . . , Cik ) = Cik k

[exp(i 2i ), exp(i + 2i )] = Ri exp( i 2i ), Ri exp( i + 2i ) . 2 2

de complter le triangle des montants par la for-

39.13 43.37 49.45 55.58 62.15

39.76 44.56 50.54 56.81 63.52

40.16 45.01 51.05 57.38 64.16

37.69 40.62 47.30 52.59 59.06

39.13 42.77 49.00 54.80 61.54

39.76 43.63 49.89 55.80 62.66

40.16 44.07 50.39 56.36 63.29

Les coecients fk et k sont : 2 f1 = 1.0646 f2 = 1.0421 f3 = 1.0182 f4 = 1.0101,

Ri 0.44 1.39 3.77 7.82

mse(Ri ) 0.0028 0.0296 0.3160 0.7952

se(Ri ) 0.0526 0.1721 0.5621 0.8918

se(Ri ) en % de Ri 12% 12% 15% 11%

IC Normal [0.33, 0.54] [1.05, 1.74] [2.65, 4.90] [6.04, 9.61]

IC Lognormal [0.34, 0.55] [1.08, 1.77] [2.77, 5.02] [6.19, 9.76]

L'examen des rserves fournit le tableau suivant :

Ri 0.45 1.96 4.40 8.53

mse(Ri ) 0.3369 1.4907 2.0389 2.8472

se(Ri ) 0.5804 1.2210 1.4279 1.6874

se(Ri ) en % de Ri 129% 62% 32% 20%

IC Normal [0.71, 1.61] [0.49, 4.40] [1.55, 7.26] [5.15, 11.90]

IC Lognormal [0.04, 1.99] [0.53, 5.23] [2.22, 7.88] [5.65, 12.38]

Estimation de l'erreur sur la rserve totale.

Cette formule est donne par Mack [4].

2 (se(Cin ))2 = Cin

Cette formule peut tre rcrite sous la forme :

2 (se(Cin ))2 = Cin

2 (se(Fik ))2 + (se(fk ))2 /fk ,

est (ceci est dmontr dans le cadre de la section 2.6.1) un estimateur de

(se(f2 ))2 = 4.35 106

(se(f3 ))2 = 3.21 105

Ci,k 2 Cik (se(Fik ))2

Inclusion d'un tail factor.

On peut prendre fult =

fk , o les fk futurs sont estims par une extrapolation linaire de

Vrication des hypothses sous-jacentes la mthode de Chain Ladder.

E(Ci,k+1 | Ci1 , . . . , Cik ) = Cik fk

(3), (4), (5).

{Ci1 , . . . , Cin }, {Cj1 , . . . , Cjn } i, j

Vrication des hypothses (3) et (5).

(Ci,k+1 Cik fk )2 /Cik .

En annulant la drive par rapport fk de l'expression minimiser, on trouve

Ci2 = (37.69 41.61 47.30 Ci1 = (35.40

Fig. 1  Exemple de vrication de l'hypothse (3)

Ci,k+1 Cik Cik fk )2 , ce qui conduit la solution fk1 =

Fig. 2  Exemple de vrication de l'hypothse(5)

Test de non corrlation des coecients de dveloppement successifs.

L'erreur standard se(Cin ) est dnie comme gale

Les coecients fk et k sont : 2 f1 = 1.0646 f2 = 1.0421 f3 = 1.0182 f4 = 1.0101,

Vrication des hypothses sous-jacentes la mthode de Chain Ladder.

Vrication des hypothses (3) et (5).

Fig. 1 Exemple de vrication de l'hypothse (3)

Fig. 2 Exemple de vrication de l'hypothse(5)

Test de non corrlation des coecients de dveloppement successifs.

On retire ensuite le dernier coecient de la colonne, soit

si,k+1 le rang de On dnit alors

T3 = 1. Le nombre de donnes est nanmoins insusant pour

Test de non eet d'une anne calendrier.

pour le bloc infrieur gauche

Les coecients du modle des rserves, calculs par (9) sont :

Les coecients du modle des paiements, calculs par (11) sont :