Vous êtes sur la page 1sur 123

‫وزارة التعليم العالي والبحث العلمي‬

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA


RECHERCHE SCIENTIFIQUE
-‫جامعــــــــــــــــة باجــــــــي مختــــــــــــار‬
‫عنابــــــــــة‬
BADJI MOKHTAR - ANNABA UNIVERSITY
UNIVERSITÉ BADJI MOKHTAR - ANNABA
‫كليــــــــــــــــة العلـــــــــــــــــــــوم‬
FACULTY OF SCIENCES
FACULTE DES SCIENCES
Département de Mathématiques
Laboratoire de Probabilités et Statistiques (LaPS)

THÈSE
Présentée en vue de l’obtention du diplôme de
Doctorat en Mathématiques

Option : Modélisation Mathématiques – Actuariat

METHODE DE TARIFICATION DES RISQUES EN ASSURANCE


NON-VIE

Par : M. SADOUN Ahmed

Sous la direction de
REMITA Mohamed Riad Prof.U.B.M.Annaba
Co-directeur
ZEGHDOUDI Halim M.C.A U.B.M.Annaba

Devant le jury
PRESIDENT : Seddik-Ameur Nacera Prof. U.B.M. Annaba

EXAMINATEUR : Necir Abdelhakim Prof. U.M.K.Biskra

EXAMINATEUR : Chadli Assia Prof. U.B.M. Annaba

EXAMINATEUR : Arrar Nawel khadija M.C.A U.B.M. Annaba

Année 2018
Dedicace
Premièrement, je suis extrêmement reconnaissant à Allah qui m'a donné la
chance et le courage de terminer ce travail.
Je voudrais exprimer ma sincère gratitude à mon conseiller Prof. Remita
Mohamed Riad pour le soutien continu de mon étude de doctorat et de
recherches connexes, pour sa patience, sa motivation. Ses conseils m'ont aidé
tout au long de la recherche et de l'écriture de cette thèse.
Remerciements spéciaux à mon co-directeur Dr. Zeghdoudi Halim pour son
immense connaissance, ses conseils malgré toutes les obligations qu'il avait et
son amour de tous les mathématiciens.
Je voudrais également remercier les membres de mon comité de doctorat: Prof.
Necir Abdelhakim, Prof. Seddik-Ameur Nacera, Prof. Chadli Assia, et Dr .
Arrar Nawel qui ont accepté de siéger à mon comité dans un bref délai et dont
les précieux commentaires aideront à améliorer cette thèse.
Je reconnais humblement et avec gratitude l'amour continu et durable et le
soutien émotionnel donné par mes parents et mon frère et mes sœurs. Je ne
pourrais jamais aussi reconnaître ou remercier ma belle femme et mon joujou
seifou.
Je voudrais remercier tous mes amis et collègues et le personnel du département
de mathématiques et de l'université, en particulier Metiri Farouk
Une mention spéciale doit être faite ici pour mes amis intimes qui m'ont soutenu
et motivé pour continuer à travers les hauts et les bas vers mon but.
3

PERSONAL BIBLIOGRAPHY
Articles publiés
Sadoun, A. Remita, M.R. Zeghdoudi, H, Quantile credibility models (Quantile decom-
position). Proceedings of Computational Mathematics, Co ;2016, p 241.
Sadoun. Zeghdoudi, H. Remita, M.R, On Bayesian Premium Estimators for Gamma
Lindley Model under Squared Error and Linex Loss Function. Science Publications, Jour-
nal of Mathematics and Statistics 2017, 13 (3) : 284.291.
Zeghdoudi, H. Sadoun, A. Attoui, F.Z. Bayesian Premium Estimators for mixture of tow
gamma distributions. Journal of Statistical theory and applications, JSTA vol. 17, 2018.
4

Résumé
Dans cette thèse, nous expliquons d’abord les différentes méthodes classiques de tarifi-
cation des risques en assurance non-vie. Deux approches de calcul des primes concernant
la théorie de crédibilité sont proposées. Dans un premier temps, nous considérons la dis-
tribution Gamma Lindley (GaL) comme une distribution conditionnelle, nous nous basons
sur l’estimateur de la prime bayésienne sous les fonctions de perte de l’erreur quadratique
moyenne et linex avec des distributions à priori informatives. En utilisant l’approximation
de Lindley, des simulations numériques et une étude comparative sont obtenues. Dans un
deuxième temps, nous présentons le modèle de la crédibilité (quantiles), plus précisément,
nous montrons le rôle de la décomposition des quantiles dans la simplification du modèle
de Pitselis (2013). Nous introduisons une nouvelle approche pour le calcul de la prime de
crédibilité et une application avec des données réelles est donnée.
Mots-clés : Bonus-malus, modèle linéaire généralisé, crédibilité, fonction de perte,
l’erreur quadratique moyenne, Linex, prime bayésienne, distribution Gamma Lind-
ley, distribution Gamma, quantile, décomposition de p-quantile, facteur de développement.
‫ملخص‬
‫في هذه الرسالة ‪،‬نقوم أوال بشرح مختلف األساليب التقليدية لتسعير المخاطر في التأمين غير‬
‫الحياة‪ .‬ونقترح نهجي ن لحساب المكافآت لنظرية المصداقية‪ .‬أوال‪ ،‬علينا النظر في توزيع غاما‬
‫ليندلي (‪ )GaL‬كتوزيع مشروط خاص بمبالغ األضرار ‪ ،‬ونحن نعتمد على مقدر'' بيز' نقوم‬
‫باستخراجه تحت دالتين للخسارة‪:‬دالة الخطأ التربيعي التي هي دالة متناظرة و دالة غير متناظرة‬
‫خاصة بحساب األخطاء و هي ‪."linex" :‬‬
‫في هذه الحالة‪ ,‬مقدر'' بيز'' لقسط التأمين ال يملك شكال خطيا مما يدفعنا إلستعمال تقنية عددية‬
‫للتقريب و هي تقنية تقريب "ليندالي"‪.‬‬
‫قمنا بعمل محاكاة عددية لمقدر'' بيز''بواسطة طريقة متوسط مربعات الخطأ (‪)MSE‬لتأكيد‬
‫صحة النتائج النظرية المحصل عليها و مقارنة هذا المقدر تحت مختلف دوال الخسارة‬
‫المذكورة أعاله‪.‬‬
‫ثانيا‪ ،‬نقدم نموذجا للمصداقية (‪ ، )eltinauq‬على نحو أدق‪ ،‬نعرض دور التحليل الكمي في‬
‫تبسيط نموذج ‪ )2013(Pitselis‬مع تقديم نهج جديدا لحساب قسط المصداقية والقيام بتطبيق‬
‫مع بيانات حقيقية‪.‬‬
‫الكلمات المفتاحية‪ :‬بونوس‪-‬مالوس‪ ،‬نموذج خطي معمم‪ ،‬مصداقية‪ ،‬وظيفة خسارة‪،‬‬
‫متوسط الخطأ التربيعي‪ ،‬لينكس‪ ،‬رئيس بايزي‪ ،‬توزيع غاما ليندلي‪ ،‬توزيع غاما‪ ،‬كوانتي‪،‬‬
‫كوانتيل ديكولبوسيتيون‪ ،‬عامل التطوير‪.‬‬
5

Abstract
In this thesis, we explain first the different classical methods of risk pricing in non-life
insurance. Two approaches to calculate premiums concerning for credibility theory are pro-
posed. In the first time, we consider the gamma distribution Lindley (GaL) as a conditional
distribution, we focus on the Bayesian estimation of the premium under squared error loss
function (symmetric) and Linex loss function (asymmetric), using informative priors (the
Gamma prior). Because of its difficulty and non-linearity, we use a numerical approxi-
mation for computing the Bayesian premium. Finally, a simulation and comparative study
with varying sample sizes are given. In the second time, we present quantile credibility mo-
del. More precisely, we show how the quantile decomposition simplifies the Pitselis model
(2013). New premium credibility and an application with real data are given.
Key words : Bonus-malus, generalized linear model, credibility, Bayesian pre-
mium, Gamma Lindley distribution, Gamma distribution, loss function, squared er-
ror, Linex, Quantile, credibility, decomposition of p-quantile, Development factor
1

Table des matières

1 Tarification à priori 10
1.1 Les modèles linéaires généralisés . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Petit historique des applications actuarielles des modèles de rég-
ression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Moyenne et variance . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.3 Modèle de régression . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1.4 Fonction de lien canonique . . . . . . . . . . . . . . . . . . . . . . 18
1.1.5 Equations de vraisemblance . . . . . . . . . . . . . . . . . . . . . 19
1.1.6 Résolution des équations de vraisemblance . . . . . . . . . . . . . 22
1.1.7 Intervalle de confiance pour les paramètres . . . . . . . . . . . . . 25
1.1.8 Tests d’hypothèse sur les paramètres . . . . . . . . . . . . . . . . . 26
1.1.9 La pratique des modèles linéaires généralisés et l’importance du
choix de la sous-famille exponentielle . . . . . . . . . . . . . . . . 26

2 Tarification à posteriori 30
2.1 Systèmes bonus-malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.1 Vue d’ensemble des systèmes bonus-malus . . . . . . . . . . . . . 31
2.1.2 Description d’un système bonus-malus . . . . . . . . . . . . . . . 32
2.1.3 Analyse d’un système bonus-malus . . . . . . . . . . . . . . . . . 35
2.2 La Théorie de la crédibilité . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.1 Petit historique sur la théorie de crédibilité . . . . . . . . . . . . . 45
2.2.2 L’approche bayésienne en crédibilité . . . . . . . . . . . . . . . . . 48
2.2.3 Modèle de Bühlmann . . . . . . . . . . . . . . . . . . . . . . . . . 52

3 Estimation Bayésienne de la prime pour le modèle Gamma Lindley sous différentes


fonctions de perte 65
3.1 Inférences bayésiennes pour les paramètres . . . . . . . . . . . . . . . . . 66
3.1.1 Estimation des paramètres par maximum de vraisemblance . . . . . 66
3.1.2 Estimateurs Bayésiens des paramètres . . . . . . . . . . . . . . . . 67
3.2 Estimation bayésienne de la prime . . . . . . . . . . . . . . . . . . . . . . 71
2

3.2.1 Estimateurs bayésiens de la prime sous la fonction de perte quadra-


tique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.2 Estimateurs bayésiens de la prime sous la fonction de perte LINEX 73
3.3 Étude par simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4 Résultats et Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4 Méthode des Quantiles sous la théorie de la crédibilité (Décomposition de Quan-


tile) 83
4.1 Interprétation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 Préliminaires sur les quantiles . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 Modèles de crédibilité (quantile) . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.1 Le modèle de crédibilité de Pitselis (2013) . . . . . . . . . . . . . . 86
4.4 Discussion du nouveau modèle . . . . . . . . . . . . . . . . . . . . . . . . 88
4.4.1 Décomposition des p−quantiles . . . . . . . . . . . . . . . . . . . 88
4.4.2 Discussion sur les hypothèses . . . . . . . . . . . . . . . . . . . . 89
4.4.3 Calcul de la prime . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5 La nouvelle prime de crédibilité . . . . . . . . . . . . . . . . . . . . . . . 97
4.5.1 Estimation des paramètres du modèle . . . . . . . . . . . . . . . . 98
4.5.2 La variance des quantiles . . . . . . . . . . . . . . . . . . . . . . . 99
4.6 Application numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.6.1 Exemple d’organisation de la sécurité sociale (Algérie) . . . . . . . 103
4.6.2 Comparaison des modèles de crédibilités ( Bühlmann (1969), Pit-
selis (2013) et la nouvelle méthode). . . . . . . . . . . . . . . . . . 110

Bibliographie 114
6

Introduction
Le principe de l’assurance est le partage d’un danger, appelé un risque, parmi un col-
lectif, le même danger peut toucher les individus d’un groupe et causer un grand dégât.
Pour un individu tout seul, le dégât est souvent trop grand pour être supporté sans la perte
du niveau de la vie. Par contre, si le danger est partagé parmi tous les individus du collectif,
le sinistre devient supportable pour chacun. Ce principe d’assurance nécessite que chaque
membre du collectif soit concerné par le risque de la même façon. Sinon, les membres du
collectif qui ne sont pas du tout ou seulement très partiellement concernés par le risque,
ne sont, à priori, pas prêts de porter la même part du dégât que les autres (en tout cas,
s’ils ne sont pas forcés par la loi, comme dans l’assurance de responsabilité civile des voi-
tures), le principe d’une assurance (facultative) exige donc que le risque soit distribué dans
le collectif d’une façon homogène.
En réalité, le risque est rarement distribué d’une façon homogène dans le collectif. Les
assureurs ont par conséquent la tendance à sélectionner dans le groupe les individus avec
un ”bon” risque. Si la sélection est efficace, l’assurance aura moins de sinistres à payer et
peut donc offrir un meilleur tarif à ses assurés. Les autres assurances, par contre, restées
avec les ”moins bons” risques sont obligées d’augmenter leurs tarifs. Pour éviter ce clivage
du marché d’assurance, les autres assureurs doivent suivre le premier assureur ou pour
ne pas perdre leur clientèle antérieure, ils sont obligés d’offrir des tarifs différents entre
les bons risques et les mauvais risques. Le marché d’assurance a donc une tendance à la
différenciation des tarifs selon le degré des risques. La tendance inhérente de l’assurance
a comme effet que les actuaires sont tenus d’inventer et de développer des méthodes de
différenciation assez fines pour le calcul des tarifs.
Il y a au moins trois méthodes importantes de tarification en actuariat :
La méthode des modèles linéaires généralisés (Generalized Linear Models (GLM)).
Les modèles linéaires généralisés (GLM) ont été introduits dans les années 70 pour
traiter des variables de réponse non-continues ou bornées, pour éliminer la limitation des
modèles linéaires qui doivent avoir une réponse continue sans bornes. Cette méthode consiste
7

dans l’intégration de plus en plus des données dans la tarification. Par exemple : dans l’as-
surance de voiture, où un très grand nombre de contrats permettent de faire des statistiques
avancées, on utilise les informations suivantes : informations sur la voiture, informations du
propriétaire, kilométrage annuel, informations sur le domicile et informations sur d’autres
assurances dans la même compagnie. Toutes ces informations peuvent être utilisées pour
la tarification. Les GLM sont des outils bien connus et bien compris dans les statistiques et
surtout dans les sciences actuarielles.
La méthode de Bonus-Malus.
Il y a plusieurs systèmes de Bonus-Malus. Ils utilisent les informations sur les nombres
des accidents causés en utilisant la sinistralité d’un assuré des dernières années. Dans un
système de classes, après chaque année sans accident, le contrat est mis dans une meilleure
classe, après une année avec un ou plusieurs accidents, le contrat est puni en le posant dans
une classe pire dépendante du nombre des accidents.
La théorie de crédibilité.
Cette méthode utilise aussi les informations des années précédentes, en utilisant les
montants cumulés de sinistres des années précédentes. La nouvelle tarification s’effectue
comme une combinaison convexe de la moyenne individuelle des années antérieures et de
la moyenne du collectif des assurés. L’introduction à la théorie de la crédibilité peut être
trouvée, par exemple dans Goovaerts et W. J.(1987), Herzog (1996), Kaas, Dannenburg et
Goovaerts (1996), Klugman et Panjer (2004), et pour les introductions détaillées récentes,
on peut se référer, par exemple, à R. Norberg (2004). Cette méthode est surtout appliquée
dans les contrats d’assurance détaillés, comme les assurances de transport (camions, che-
mins de fer, bateaux, avions), assurance des objets d’art, assurance.
Pour un assuré, son risque X est caractérisé par une réalisation de θ. Chaque sinistre est
vu donc comme une variable aléatoire selon une distribution conditionnelle qui dépend de
θ. En plus, l’espérance des sinistres appelée aussi la prime de risque peut être calculée sur
la base de cette distribution conditionnelle.
En pratique, différents modèles ont été proposés pour chercher le meilleur estimateur de
8

la prime de risque. Parmi ces modéles : (Le modèle Bayésien proposé par Whitney (1918)
et le modèle de Bühlmann (1967, 1969))
- Le modèle bayésien quant à lui, consiste à supposer pour θ une distribution des si-
nistres à priori π (θ) appelée fonction de structure dans le contexte actuariel- qui décrit
l’expérience de risque du même paramètre appelée f (x | θ).
En combinant la distribution à priori avec la vraisemblance de f (x | θ) , on peut ob-
tenir la distribution à posteriori f (θ | x) qui établit la dépendance de θ sachant l’histo-
rique de l’expérience. La prime bayésienne PB - meilleure prime d’expérience représentant
l’espérance des sinistres futurs peut être calculée à partir de f (θ | x).
Cependant, la prime bayésienne qui sera chargée à l’assuré est une prime de crédibilité
ayant une forme linéaire seulement sous une famille de distributions et lois à priori conjuguées
spécifiées et doit être sous la fonction de perte de l’erreur quadratique.

PB = z × Pexpérience + (1 − z) × Pcollective

La forme de cet estimateur dans le cas ou π (θ) n’est pas conjuguée est toujours difficile
à obtenir à cause des intégrales compliquées. L’approximation de Lindley est une méthode
numérique d’approximation très utilisée pour résoudre ces formes d’intégrales et qui donne
des résultats numériques.
Notre étude se focalise sur l’estimation de la prime bayésienne, le problème majeur
réside dans le choix de la distribution de probabilité conditionnelle et la distribution à priori.
Le modèle de Bühlmann (1967) a développé des modèles dont la prime d’un contrat
est déterminée, en minimisant l’erreur quadratique moyenne entre la prime bayésienne et
son approximation. Bühlmann (1969) a forcé cette approximation à être linéaire et la prime
obtenue s’avère être une combinaison linéaire entre l’expérience individuelle X et celle de
l’ensemble du portefeuille, soit équivalente à la prime de crédibilité. On peut choisir une
autre variable exprimant l’expérience individuelle comme le quantile ζ p , Pitselis(2013) a
intégré le quantile au modèle de la crédibilité classique de Bühlmann (1967) il a trouvé des
résultats intéressants par rapport au modèle de Bühlmann (1967).
9

Notre étude repose sur l’utilisation de la décomposition de quantile pour simplifier le


modèle de Bühlmann (1969), on établit une prime de crédibilité plus réaliste que le modèle
de Pitselis (2013).
La thèse s’articule autour de quatre chapitres, le premier chapitre aborde d’un point
de vue plus précis la notion de tarification (dite à priori) pour des risques de masse. Nous
présentons ainsi en détails l’utilisation des modèles linéaires généralisés (GLM pour Ge-
neralize Linear Models). Le deuxième chapitre est consacré à la tarification par expérience
(ou à posteriori) très utile (bonus-malus et la théorie de la crédibilité). Le troisième et le
quatrième chapitre sont concentrés sur le calcul de prime dans la théorie de crédibilité.
En premier lieu, on estime la prime dans le cas où il est impossible d’établir une prime
de crédibilité, on utilise une combinaison entre la distribution de Gamma-Lindley et des
lois à priori informatives (l’extension de Jeffrey et gamma) sous deux fonctions de perte
(erreur quadratique, linex). On termine par une simulation numérique et une étude com-
parative de cette prime obtenue sous différentes fonctions de perte. De plus, on expose
une interprétation concernant la décomposition de quantile basée sur les modèles statis-
tiques ”Variance Components Models” dans le quatrième chapitre, une nouvelle prime de
crédibilité est proposée. On termine par une application numérique et une étude compara-
tive de la nouvelle prime et la prime du modèle de Bühlmann (1969) et Pitselis (2013). Les
conclusions et les perspectives sont présentées.
10

Chapitre 1

Tarification à priori

La tarification à priori est une méthode de tarification utilisée par les actuaires afin de
mieux segmenter les portefeuilles d’assurance. Cette méthode consiste à prédire le nombre
espéré de réclamations en fonction des caractéristiques observables des assurés tels que
l’âge, le sexe, le kilométrage, l’utilisation du véhicule, l’occupation, etc. Le but de la tari-
fication à priori est de construire des classes de risque homogènes où les assurés apparte-
nants à une même classe de risque paient la même prime. Une classe de risque peut être vue
comme un ensemble de caractéristiques, où les assurés appartenants à une même classe de
risque ont des caractéristiques observables identiques. Les caractéristiques observables des
assurés sont appelées variables de classification ou variables à priori. En général, la classi-
fication à priori est faite à l’aide des modèles de régression ou modèles linéaires généralisés
(GLM) développés par Nelder et Wedderburn (1972). Le but de la régression est d’analyser
la relation qui existe entre la variable réponse et les variables explicatives. En assurance au-
tomobile, la variable réponse représente généralement le nombre de réclamations ou le coût
des réclamations tandis que les variables explicatives représentent les variables de classifi-
cation. Cette relation peut être exprimée comme une équation qui prédit la variable réponse
à l’aide d’une fonction (combinaison linéaire) impliquant les variables explicatives et les
paramètres servant à la prédiction. Lors de la tarification à priori, on modélise généralement
le nombre de réclamations par les distributions de Poisson, binomiale négative, etc., tan-
11

dis que le coût des réclamations est généralement modélisé par les distributions gamma,
inverse-gaussienne, etc. Les techniques de classification des risques ont été le sujet de plu-
sieurs articles issus de la littérature actuarielle. On peut citer entre autres, Dionne et Vanasse
(1989) qui ont utilisé un modèle de régression binomiale négative et Dean, Lawless et Will-
mot (1989) qui ont utilisé la distribution de Poisson-inverse gaussienne pour modéliser le
nombre de réclamations.

1.1 Les modèles linéaires généralisés

1.1.1 Petit historique des applications actuarielles des modèles de rég-


ression

Longtemps, les actuaires se sont limités à utiliser le modèle linéaire gaussien lors-
qu’il s’agissait de quantifier l’impact de variables explicatives sur un phénomène d’intérêt
(fréquence ou coût des sinistres, probabilité d’occurrence d’événements assurés, ...). A
présent que la complexité des problèmes statistiques qui se posent à l’actuaire s’est considér-
ablement accrue, il est crucial de se tourner vers des modèles tenant mieux compte de la
réalité de l’assurance que ne le fait le modèle linéaire. Ce dernier impose en effet une série
de limitations peu conciliables avec la réalité des nombres ou des coûts des sinistres : den-
sité de probabilité (approximativement) gaussienne, linéarité du score et homoscédasticité.
Même s’il est possible de s’affranchir de certaines de ces contraintes en transformant
préalablement la variable réponse à l’aide de fonctions bien choisies, l’approche linéaire
s’accompagne de nombreux désavantages (travail sur une échelle artificielle, difficultés de
revenir aux quantités initiales, ...).
Une première étape dans l’utilisation de modèles plus appropriés à la réalité de l’assu-
rance a été franchie lors de l’application en sciences actuarielles à la fin du 20ème siècle par
les actuaires londoniens de la City University des modèles linéaires généralisés (GLM, pour
Generalized Linear Models). Ces modèles, introduits en statistique par Nelder & Wedder-
12

burn (1972), permettent de s’affranchir de l’hypothèse de normalité, en traitant de manière


unifiée des réponses dont la loi fait partie de la famille exponentielle linéaire (la quelle
compte, outre la loi normale, les lois de Poisson, binomiale, Gamma et Inverse Gaussienne).
Voyez notamment Gouriéroux, Monfort & Trognon (1984).
La régression de Poisson (et les modèles apparentés, tels que la régression binomiale
négative) est à présent un outil de choix pour l’élaboration d’une tarification automobile,
supplantant largement le modèle linéaire général et la régression logistique pour l’ana-
lyse des nombres de sinistres. La percée de cette méthode au sein des compagnies date
de l’inclusion dans les logiciels statistiques les plus usités (SAS en tête) de procédures
permettant d’appliquer cette technique (Genmod, en l’occurrence). Outre l’approche du
maximum de vraisemblance, les techniques GLM permettent l’analyse d’un grand nombre
de phénomènes dans une optique de quasi- vraisemblance, en ne spécifiant que la structure
moyenne-variance. Les économètres français ont à cet égard prouvé des résultats fonda-
mentaux de convergence des estimateurs obtenus de cette façon. Voyez notamment Gou-
rieroux, Monfort & Trognon (1984).
Plus récemment, les techniques GLM ont été appliquées avec succès aux problématiques
de l’assurance vie (établissement de tables de mortalité, estimation des indicateurs démogra-
phiques, projection de la mortalité, etc.). Voyez Del Warde & Denuit (2005) pour de nom-
breux exemples.
Ce chapitre est basé sur Mccullagh & Nelder (1989), Antoniadis, Berruyer & Carmona
(1992), Dobson (2002) et Fahrmeir & Tutz (2002). Nous insisterons sur le fait que les
estimateurs du maximum de vraisemblance peuvent être obtenus à l’aide d’ajustements
des moindres carrés pondérés répétés, en définissant des pseudo-réponses appropriées.
Ceci nous permettra de lever l’hypothèse de linéarité du score en passant aux modèles
généralisés additifs.
Afin de bien comprendre les généralisations du modèle linéaire gaussien dont il est
question dans cette section, rappelons que dans le cadre de ce modèle, on suppose que l’on
cherche à modéliser une variable Y à l’aide d’un certain nombre de variables explicatives
13

 t
X = X1 , ..., X p . De façon naturelle, la régression linéaire revient à supposer que

Y v N(µ, σ2 ) où µ = X t β.

Ce modèle proposé par Legendre et Gauss au début du 19ème siècle, et étudié en détails
par Fisher dans les années 20, s’est imposé en économétrie, mais s’avère difficilement
utilisable en assurance.
Les variables que l’on cherche à modéliser en assurance sont des coûts (à valeur dans
R+ ), des nombres de sinistres (à valeur dans N) ou des indicatrices du fait d’être sinistré
dans l’année (à valeur dans {0, 1}). Dans ce dernier cas, nous avions vu que les variables
latentes pouvaient être une solution intéressante. Plus particulièrement, on considérait des
modèles de la forme
Y v Bin(1, µ) où µ = E[Y] = F(X t β),

où F désigne la fonction de répartition associée à la loi logistique (pour les modèles LO-
GIT) ou à la loi gaussienne centrée et réduite (pour les modèles PROBIT).
De façon générale, on souhaite garder la structure linéaire du score en β, et considérer
que l’espérance de Y est une transformation de cette combinaison linéaire. Plus précisément,
on voudrait passer à des modèles de régression du type

Y v Loi (µ) où µ = E[Y] = g−1 (X t β),

où g−1 est une fonction ”bien choisie”, et où Loi désigne une loi paramétrique permettant
de modéliser correctement notre variable d’intérêt.
Ce type d’approche est à la base des modèles dits “linéaires généralises”, qui étendent le
modèle gaussien à une famille de lois particulière, appelée famille exponentielle (naturelle).
Dans ce chapitre, nous allons nous intéresser à la famille des modèles linéaires général-
isés. Font partie de cette classe, en plus de la loi normale, les lois de probabilité à deux
paramètres θ et φ dont la densité (discrète ou continue) peut se mettre sous la forme

yθ − b (θ)
f (y | θ, φ) = exp( + c(y, φ)), y ∈ S , (1.1)
φ
14

où le support S est un sous-ensemble de N ou de R. Le paramètre θ est appelé paramètre


naturel et φ est le paramètre de dispersion.
Souvent, une pondération est nécessaire, et on remplace φ par φ | ω, où ω est un poids
connu à priori.
Examinons quelques exemples de lois usuelles dont la densité peut se mettre sous la
forme (1.1).

Example 1.1 (Loi de Poisson). Si on considère la loi de Poisson Poi (λ) , on a


λy
f (y | λ) = exp (−λ) = exp (y ln λ − λ − ln y!) , y ∈ N,
y!
d’où S = N, θ = ln λ, φ = 1, b(θ) = exp θ = λ et c(y, φ) = − ln y!.

Example 1.2 (Loi Gamma). La densité associée à la loi Gamma peut se réécrire

1 ν ν−1 ν
!
y exp − y
Γ (ν) µ µ
qui peut se mettre sous la forme (1.1) avec S = R+ , θ = − µ1 , b (θ) = − ln (−θ) et φ = ν−1 .

Toutes les lois de probabilité dont la densité peut se mettre sous la forme (1.1) ne
possèdent pas de paramètres de dispersion φ. Ainsi, les exemples ci-dessus nous apprennent
par exemple que pour la loi de Poisson, φ = 1. Pour les lois possédant un paramètre de
dispersion φ, celui-ci contrôle la variance, comme nous le verrons plus loin. La prime pure
ne dépend quant à elle que du paramètre naturel θ. Ainsi, lorsque l’actuaire ne s’intéresse
qu’à la prime pure, le paramètre θ est le paramètre d’intérêt tandis que φ est considéré
comme un paramètre de nuisance. Toutefois, le paramètre φ est également fort important
dans la mesure où il contrôle la dispersion (et donc le risque).

1.1.2 Moyenne et variance

Pour une variable aléatoire Y dont la densité peut se mettre sous la forme (1.1), on peut
exprimer les deux premiers moments de Y à l’aide des fonctions b et c. Pour ce faire, notons

U= ln f (Y | θ, φ) .
∂θ
15

et
0 ∂2
U = ln f (Y | θ, φ) ,
∂θ2
de sorte que l’information de Fisher vaut V[U] = −E[U ].
0

Proposition 1.3 Pour une variable aléatoire Y dont la densité est de la forme (1.1), on a

0 00
E[Y] = b (θ) et V[Y] = b (θ) φ/ω,

où b et b désignent respectivement les dérivées premières et secondes par rapport à θ.


0 00

Preuve. Nous savons que E[U] = 0. Il suffit alors de remarquer que

∂ yθ − b (θ)
! 0
d y − b (θ)
ln f (y | θ, φ) = + c(y, φ) =
dθ ∂θ φ φ/ω

ce qui donne
0
E[Y] − b (θ)
E[U] = = 0,
φ/ω
d’où l’expression annoncée pour la moyenne de Y. D’autre part, puisque E[U] = 0,

 Y − b0 (θ) 2 


 !
V[U] = E[U ] = E 
2  = V[Y]
φ/ω {φ/ω}2
et
!2

Z
E[U ] =
2
ln f (y | θ, φ) f (y | θ, φ) dy
y∈s ∂θ
∂ ∂
Z
= ln f (y | θ, φ) f (y | θ, φ) dy
y∈s ∂θ ∂θ

" 2 # 00
b (θ)
= E − 2 ln f (Y | θ, φ) = .
∂θ φ/ω

Ainsi,
00
b (θ) 0
V[U] = E[−U ] = .
φ/ω

En combinant les deux dernières égalités, on obtient le résultat annoncé.


Dès lors, la variance de Y apparaı̂t comme le produit de deux fonctions :
16

1. la première, b (θ), qui dépend uniquement du paramètre θ est appelée fonction va-
00

riance ;
2. la seconde est indépendante de θ et dépend uniquement de φ.
En notant µ = E[Y], on voit que le paramètre θ est lié à la moyenne µ. La fonction
variance peut donc être définie en fonction de µ nous la noterons dorénavant V (µ).
La fonction variance est très importante dans les différents modèles, comme on peut le
constater au Tableau 1.1. Il est important de noter que, le cas de la loi normale mis à part,
la variance de Y est toujours fonction de la moyenne et croı̂t en fonction de cette dernière
pour les lois de Poisson, Gamma et Inverse Gaussienne (à paramètre φ fixé).

Loi de probabilité V (µ)


Normale 1
Poisson µ
Gamma µ2
Binomiale µ (1 − µ)

Table. 1. 1- Fonctions variance associées aux lois de probabilité usuelles dont la densité
est de la forme (1.1).

1.1.3 Modèle de régression

Considérons des variables aléatoires indépendantes mais non identiquement distribuées


Y1, Y2 , ..., Yn dont la densité est de la forme (1.1). Plus précisément, supposons que la densité
de probabilité de Yi est

yi θi − b (θi )
!
f (yi | θi , φ) = exp + c(yi , φ) , yi ∈ S . (1.2)
φ/ωi
17

Dès lors, la densité jointe de Y1, Y2 , ..., Yn est


n
Y
f (y | θ, φ) = f (yi | θi , φ)
i=1
P n n 
 yi θi − P b (θi ) n

 i=1 i=1
X 
= exp  + c(yi , φ) .
 φ/ωi i=1


Bien entendu, la vraisemblance vaut L (θ, φ | y) = f (y | θ, φ). On suppose que les θi sont
fonction d’un ensemble de p + 1 paramètres β0 ,β1 ,... ,β p , disons. Plus précisément, notant
µi la moyenne de Yi , on suppose que
p
X
g (µi ) = β0 + β j xi j = xit β = ηi
j=1

où la fonction monotone et dérivable g est appelée fonction de lien, le vecteur xi contient
des variables explicatives relatives à l’individu i et le vecteur β contient les p+1 paramètres.
Ainsi, un modèle linéaire généralisé est composé de trois éléments, à savoir
(i) de variables à expliquer Y1, Y2 , ..., Yn dont les densités sont de la forme (1.2).
 t
(ii) d’un ensemble de paramètres β = β0 , β1 , ..., β p appartenant à un ouvert non vide
de R p+1 et des variables explicatives X = (x1 , x2 , ..., xn )t la matrice X de dimension n×(p+1)
est supposée être de rang p + 1, i.e. la matrice carrée X t X de dimension (p + 1) × (p + 1)
est inversible ;
(iii) d’une fonction de lien g telle que g (µi ) = xit β où µi = E [Yi ] qui lie le prédicteur
linéaire ηi = xit β à la moyenne µi de Yi .
La plupart du temps, les variables explicatives sont toutes catégorielles dans un tarif
commercial. Une compagnie segmentant selon le sexe, le caractère sportif du véhicule et
l’âge de 1’assuré (3 classes d’âges, à savoir moins de 30 ans, 30-65 ans et plus de 65 ans).
Un assuré sera représenté par un vecteur binaire donnant les valeurs des variables ayant
servi à coder les caractéristiques de l’individu.
On choisit comme niveau de référence (i.e. celui pour lequel tous les Xi valent 0) les
modalités les plus représentées dans le porte- feuille. Les résultats s’interpréteront ensuite
18

comme une sur ou sous-sinistralité par rapport à cette classe de référence. Ainsi, le vecteur
(0, 1, 1, 0) représente un assuré masculin de moins de 30 ans conduisant un véhiculé sportif.
p
Le prédicteur linéaire (ou score) sera de la forme β0 + β j X j et le nombre ou le coût moyen
P
j=1
de sinistre est en général une fonction non-décroissante du score. L’ordonnée à l’origine,
ou intercept, β0 représente donc le score associé à la classe de référence (i.e. celle pour
laquelle Xi = 0 pour tout i, à savoir les hommes entre 30 et 65 ans dont le véhicule n’a pas
de caractère sportif) ; si β j > 0, cela indique que le fait de présenter la modalité traduite
par X j est un facteur agravant la sinistralité par rapport à celle de l’individu de référence,
au contraire β j < 0 indiquera les classes d’assurés moins risqués que les individus de
référence.

Example 1.4 (Régression de poisson). La régression log-linéaire de poisson est obtenue


en considérant Yi ∼ Poi(λi ), la fonction de lien étant celle induite par le paramètre naturel,
i.e.
ln λi = xit β ⇐⇒ λi = exp xit β .


Le plus souvent, on dispose d’une mesure de l’exposition au risque et on considère Yi ∼


Poi(di λi ), où di est la durée de la couverture octroyée à l’assuré i (cette durée multiplie la
fréquence annuelle λi sous l’hypothèse d’un processus de Poisson gouvernant la survenance
des sinistres).

1.1.4 Fonction de lien canonique

Chacune des lois de probabilité de la famille exponentielle linéaire possède une fonction
de lien spécifique, dite fonction de lien canonique, définie par θ = η, où θ est le paramètre
naturel. Le lien canonique est tel que g(µi ) = θi , or, µi = b (θi ) d’où g−1 = b . Les fonctions
0 0

de lien canoniques sont reprises au Tableau 1.2.


19

Loi de probabilité Fonction de lien canonique


Normale η=µ
Poisson η = ln µ
Gamma η= 1
µ

Binomiale η = ln µ − ln (1 − µ)
Table.1.2- Liens canoniques associés aux lois de
probabilité usuelles dont la densité est de la forme (1.1).

1.1.5 Equations de vraisemblance

En pratique, les coefficients de régression β0 , β1 , ..., β p et le paramètre de dispersion φ


sont inconnus et doivent donc être estimés sur la base des données. Dans cette subsection,
nous nous concentrons sur l’estimation des coefficients de régression β par la méthode du
maximum de vraisemblance. Il s’agit donc de maximiser la log- vraisemblance
n
X
L (θ (β) | y, φ) = ln f (yi | θi , φ)
i=1
n n
X yi θi − b (θi ) X
= + c (yi , φ) ,
i=1
φ/ωi i=1

où E [Yi ] = b (θi ) = µi et g (µi ) = xit β = ηi avec g monotone et dérivable. Rechercher


0

les estimateurs du maximum de vraisemblance revient à rechercher les β0 , β1 , ..., β p qui


vérifient les équations
U j = 0 pour j = 0, 1, ..., p, (1.3)

où

∂L (θ (β) | y, φ)
Uj =
∂β j
n
X ∂ ln f (yi | θi , φ)
=
i=1
∂β j
n
∂ yi θi − b (θi )
X !
= + c (yi , φ) .
i=1
∂β j φ/ω i
20

Afin d’obtenir U j , on se sert de la formule

∂ ln f (yi | θi , φ) ∂ ln f (yi | θi , φ) ∂θi ∂µi


= .
∂β j ∂θi ∂µi ∂β j

Comme µi = b (θi ), il vient


0

∂ ln f (yi | θi , φ) yi − b (θi ) yi − µi
0

= =
∂θi φ/ωi φ/ωi
∂µi 00
= b (θi ) ,
∂θi
et
∂µi ∂µi ∂ηi ∂µi
= = xi j .
∂β j ∂ηi ∂β j ∂ηi
On obtient
∂ ln f (yi |θi ,φ) ∂µi
∂ ln f (yi | θi , φ) ∂θi ∂β j
=
∂β j ∂µi
∂θi

(yi − µi ) xi j ∂µi
∂ηi
=
φ/ωi b00 (θi )
(yi − µi ) xi j ∂µi
= ,
V[Yi ] ∂ηi

et finalement
n
X (yi − µi ) xi j ∂µi n
X (yi − µi ) xi j
Uj = = .
i=1
V[Yi ] ∂ηi i=1
V[Yi ]g0 (µi )

Comme V[Yi ] = b (θi ) φ/ωi ,


00

n
X xi j
U j = 0 ⇐⇒ ωi (yi − µi ) = 0,
i=1
b (θi ) g0 (µi )
00

où le paramètre φ n’apparaı̂t plus. Les équations de vraisemblance relatives à β peuvent


donc être résolues sans se préoccuper de φ. Notez que si on choisit la fonction de lien
canonique, les équations de vraisemblance deviennent
n
X
ωi (yi − µi ) xi j = 0 pour j = 0, 1, ..., p.
i=1
21

Example 1.5 (Régression de Poisson). Supposons les réalisations n1 , n2 , ..., nu de variables


aléatoires de loi Poi(di λi ), la log-vraisemblanee est donnée par
n
X
L (β | n) = ln £ (β | n) = (− ln ni ! + ni (ηi + ln di ) − λi ) .
i=1

Les équations de vraisemblance s’écrivent donc


n
X n
X
ni = λi (1.4)
i=1 i=1

et pour j = 0, 1, ..., p,
n
X
xi j (ni − λi ) = 0. (1.5)
i=1

Comme les facteurs de risque en pratique ont le plus souvent un nombre fini de niveaux
et que les variables explicatives sont les indicatrices de ces niveaux, les équations de vrai-
semblance (1.5) ont une signification tarifaire très importante. Elles garantissent que pour
chaque sous-portefeuille correspondant à un niveau d’un des facteurs de risque, le nombre
total, des sinistres observés est égal à son homologue théorique. En effet, supposons par
exemple que xi1 = 1 si l’individu i est un homme, et 0 sinon ; (1.5) pour j = 1 garantit alors
que
X X
ni = λ̂i
hommes hommes

En pratique, si le portefeuille est suffisamment stable, on espère avoir des égalités approxi-
matives lorsque le modèle sera appliqué dans le futur.

Example 1.6 (Régression Gamma). Notons ni le nombre de sinistres causés par l’assuré
i, et, lorsque ni > 0, désignons par ci1 , ci2 , ..., cini les coûts de ceux-ci. Si nous considérons
ci1 , ci2 , ..., cini comme des réalisations de variables aléatoires indépendantes et de même loi
Gamma de moyenne µi et de variance µ2i /ν, la vraisemblance s’écrit
ni
YY
£ (β | c) = f (cik | xi , ν)
i|ni >0 k=1
ni !ν
ν ν
! !
YY 1
= cν−1 exp − cik .
i|ni >0 k=1
Γ (ν) µi ik
µi
22

Les équations de vraisemblance à résoudre pour obtenir β̂ sont les suivantes :


ni
∂ ∂ XX νcik
!
L (β | c) = −ν ln µi − =0
∂β j ∂β j i|n >0 k=1 µi
i

ou encore
ni !
XX cik
xi j 1− = 0.
i|ni >0 k=1
µi
 
Si on définit ĉi = µ̂i = exp β̂t xi le coût moyen d’un sinistre pour l’assuré i, l’estimateur du
maximum de vraisemblance β̂ de β est solution des équations
!
X ci•
ni − xi = 0.
i|n >0
ĉi
i

1.1.6 Résolution des équations de vraisemblance

Les estimateurs du maximum de vraisemblance β̂ j des paramètres β j sont solutions du


système (1.3). Les équations composant ce système ne possèdent en général pas de solution
explicite et doivent dès lors être résolues numériquement. On peut par exemple utiliser la
méthode de Newton-Raphson, que nous rappelons brièvement ci-dessous.
Notons U(β) le vecteur gradient de la log-vraisemblance, dont la composante j est

U j (β) = L (β | y)
∂β j
et notons H(β) la matrice hessienne de L (β | y), i.e. celle dont l’élément ( j, k) est
∂2
L (β | y) .
∂β j ∂βk

Pour β∗ proche de β̂, un développement limité de Taylor donne

0 = U(β̂) ≈ U(β∗ ) + H(β∗ )(β̂ − β∗ ),

qui permet d’écrire


U(β∗ ) + H(β∗ )(β̂ − β∗ ) ≈ 0,

ou encore
β̂ ≈ β∗ − H −1 (β∗ )U(β∗ ). (1.6)
23

Ceci suggère une procédure itérative pour obtenir l’estimateur du maximum de vrai-
semblance β̂ de β, partant d’une valeur initiale β̂(0) que l’on espère proche de β̂, on définit
la (r + 1)-ème valeur approchée β̂(r+1) de β̂ à partir de la r-ème β̂(r) par

β̂(r+1) ≈ β̂(r) − H −1 (β̂(r) )U(β̂(r) ). (1.7)

Cette procédure itérative pour obtenir l’estimateur du maximum de vraisemblance cor-


respond à la méthode de Newton-Raphson.

Remarque 1.7 Signalons une méthode astucieuse de résolution itérative des équations de
vraisemblance. A l’étape r, il suffit de minimiser un critère des moindres carrés pondérés
du type
n
X 2
ωk zk − xkt β
k=1

où les pseudo-réponses zk sont données par

∂ηk
zk = xkt β(r) + (yk − µk )
∂µk

les poids
∂ηk
!
ω−1 = V (µk ) .
k
∂µk
Dans ces formules, µk et ηk sont calculées pour les valeurs courantes β(r) du paramètre β.
On stoppera la procédure lorsque la différence entre β(r) et β(r−1) est suffisamment petite.

Example 1.8 (Régression de Poisson). Si les observations ni sont, de loi Poi (λi ), le vecteur
gradient, de L (β | n), de dimension p + 1, est donné par
n
X
U (β) = xi (ni − λi ) avec λi = di exp βt xi ,

i=1

où l’on a ajouté au vecteur xi une composante xi0 = 1. La matrice hessienne, de dimension
(p + 1) × (p + 1) est donnée par
n
X
H(β) = − xi xit λi = −X t diag(λ)X
i=1
24

où diag(λ) désigne la matrice diagonale de dimension n × n dont les éléments principaux
sont λ1 , ..., λn .
La procédure itérative pour obtenir l’estimateur du maximum de vraisemblance β̂ de β
est la suivante : partant d’une valeur initiale β̂(0) que l’on espère proche de β̂, on définit la
(r + 1)-ème valeur approchée β̂(r+1) de β̂ à partir de la r-éme β̂(r) par
 −1  
β̂(r+1) = β̂(r) + (X t diag λ̂(r) )X X t n − λ̂(r) . (1.8)

Une bonne valeur initiale β̂(0) est obtenue en prenant β̂(0)


0 = ln n, où n est le nombre moyen

de sinistres par police, et β̂(0)


j = 0 pour j = 1, ..., p. Notez que β̂
(0)
correspond en fait au
modèle de Poisson homogène.
L’algorithme itératif fournissant l’estimateur du. maximum de vraisemblance β dans le
modèle de Poisson peut encore s’écrire
X (r) t −1 X
 n  n
 
β̂(r+1)
= β̂ +  λ xi xi 
(r)
ixi ni − λ(r) i
i=1 i=1
 n q ! q !t −1
X
=  λi xi λi xi 
(r) (r)


i=1
n
ni − λ(r)
X q !q q 
λi xi  λi + λi xi β̂  .
(r)
 (r) i (r) t (r)


i=1 λi
(r)

On constate que β̂(r+1) n’est autre que l’estimateur des moindres carrés associé au modèle
de régression linéaire
ni − λ(r)
q   q !t
λi  + xi β̂  = λi xi β̂(r+1) + i ,
(r) 
 i t (r)
 (r)
λi
(r)

où i est un terme d’erreur gaussien centré. L’estimateur du maximum de vraisemblance du


paramètre β peut donc être obtenu à l’aide d’une méthode des moindres carrés itérative.
De manière équivalente, β̂ peut être obtenu grâce à un ajustement des moindres carrés
pondérés des pseudo-variables
ni − λ(r)
z(r)
i = i
+ xit β̂(r)
λ(r)
i
q
sur xi , où les poids λ(r)
i changent à chaque itération.
25

1.1.7 Intervalle de confiance pour les paramètres

Méthode du rapport de vraisemblance


La méthode du rapport de vraisemblance est basée sur le profil de vraisemblance, défini
pour le paramètre β j comme la fonction
 
£j βj | y = max £ (β | y) .
β0 ,...,β j−1, β j+1 ,...,β p

Si β̂ MV est l’estimateur du maximum de vraisemblance de β, 2{L(β MV | y) − L j (β j | y)}


est approximativement de loi du khi-deux à un degré de liberté, pour autant que β j soit la
vraie valeur du paramètre, où L j (β j | y) = ln £ j (β j | y). Dès lors, un intervalle de confiance
au niveau 1 − α pour β j est fourni par l’ensemble des valeurs ζ telles que la différence
L(β̂ MV | y) − L j (ζ | y) est suffisamment petite, ou encore telles que 2{L(β̂ MV | y) − L j (ζ |
y)} ≤ χ21−α,1 , i.e.
1
IC = {ζ ∈ R | L j (ζ | y) ≥ L(β̂ MV | y) − χ21−α,1 }.
2
Les extrémités de cet intervalle sont obtenues numériquement en approximant la fonc-
tion de vraisemblance par une surface de degré 2. Spécifiquement, nous recourons à l’ap-
proximation
1
L(β | y) ≈ L(β0 | y) + (β − β0 )t U(β) + (β − β0 )t H(β)(β − β0 ),
2
qui devrait être de bonne qualité pour β0 suffisamment proche de β. En approximant H(β)
par son espérance mathématique −τ on obtient encore
1
L(β | y) ≈ L(β0 | y) + (β − β0 )t U(β) − (β − β0 )t τ(β − β0 ).
2
Méthode de Wald
Grâce à l’approximation normale pour β̂, un intervalle de confiance au niveau de confiance
1 − α pour β j est donné par
h √ i
β̂ j ± z α2 v j j

où v j j est l’élément diagonal ( j j) de τ−1 . Cet intervalle de confiance est souvent appelé
intervalle de Wald. Les éléments de la diagonale de τ−1 traduisent donc la précision des
26

estimations ponctuelles β̂ j , tandis que les éléments hors diagonale estiment les covariances
existant entre les estimateurs des β j .

1.1.8 Tests d’hypothèse sur les paramètres

On désire tester l’hypothèse Ho : β = β0 = (β0 , β1 , ..., βq )t contre H1 : β = β1 =


(β0 , β1 , ..., βq )t où q < p < n. Ceci revient donc à tester la nullité simultanée de βq+1 , ..., β p .
On utilise alors la statistique ∆ qui vaut la différence entre les déviances des deux modèles,
à savoir
∆ = D0 − D1 = 2(ln Lβ̂1 (y) − ln Lβ̂0 (y)) ≥ 0.

On peut montrer que ∆ est approximativement de loi χ2p−q . On rejette H0 au profit de H1


lorsque
∆obs > χ2p−q;1−α ,

où χ2p−q;1−α est le quantile d’ordre 1 − α de la loi χ2p−q .


L’intérêt de ce type de test apparaı̂t lorsque l’actuaire se demande s’il convient de grou-
per certains niveaux des variables catégorielles. En effet, le test de nullité des coefficients
de régression indique seulement si le niveau en question doit être fusionné avec le niveau de
référence. Il se pourrait cependant que deux niveaux d’une variable catégorielle soient sta-
tistiquement équivalents, mais diffèrent tous deux du niveau de référence. On s’intéressera
alors à un test de type H0 : β1 = β2 . On pourrait tester H0 : β3 = 0 et H0 : β4 = 0, qui nous
indiqueraient si les moins de 30 ans ou les plus de 60 ans diffèrent des 30 − 65 ans, mais
aussi H0 : β3 = β4 qui nous indiquera s’il convient de grouper les moins de 30 ans avec les
plus de 65 ans.

1.1.9 La pratique des modèles linéaires généralisés et l’importance du


choix de la sous-famille exponentielle

Les quelques exemples mentionnés en introduction suffisent souvent en pratique : modé-


lisation des coûts des sinistres par un modèle de régression Gamma, et modélisation des
27

nombres par un modèle de régression de Poisson. Pourtant, le choix de la sous-famille n’est


pas neutre sur une tarification.
Considérons ainsi l’exemple (simpliste) suivant, basé sur trois observations,

observation i 1 2 3
variable à expliquer Yi (coût des sinistres) 1 2 8
variable explicative Xi (puissance du véhicule) 1 2 3
On cherche à ajuster un modèle linéaire généralisé, i.e. g(E[Y]) = a + βX où g est une
fonction de lien. La Figure 1.1 présente l’influence du choix de la loi de probabilité (pour
la fonction de lien canonique), en considérant successivement Yi de loi Normale, de loi de
Poisson et de loi Gamma.
Si les trois lois donnent des résultats proches au bord (pour des valeurs de X proches de
1 ou de 3), ailleurs, le comportement est sensiblement différent. En particulier, par rapport
aux deux autres lois, la loi Gamma propose un coût des sinistres plus important (à puissance
égale) pour les petites et les grandes puissances, et en contrepartie propose un coût moins
important pour les puissances moyennes. Ce coût reflétant la prime, et si le vrai modèle est
celui de Poisson, on peut interpréter ce graphique de la façon suivante :
- avec une modélisation normale, les véhicules de puissance moyenne payent pour le
risque des autres, en ayant une prime plus importante que leur vrai risque,
- avec une modélisation Gamma, les véhicules de puissance importante, ou très faible,
payent pour le risque des véhicules de puissance moyenne, sous-tarifés.
Aussi, et bien que cette analyse doit être mitigée par la prise en compte de l’impact de
la fonction de lien, on notera que le choix de la loi de la variable à expliquer n’est en aucun
cas neutre quant aux primes pures qui en découlent.
L’importance de la fonction de lien
Nous avons noté ci-dessus que le choix de la sous-famille exponentielle considérée
n’était pas neutre quant à la tarification. Le même résultat reste vrai pour le choix de la
fonction de lien. Toujours sur les trois observations, la Figure 2.1 représente l’influence de
28

Figure 1.1: Ajustement d’un modèle linéaire géniralisé à partir de trois points, pour des
lois normales, Poisson et Gamma.

la fonction de lien (pour une loi de Poisson et une loi Gamma pour Y). On peut noter qu’à
famille de lois fixée, le choix de la fonction de lien n’est, là encore, pas neutre.
Toutefois, on notera qu’il est souvent d’usage d’utiliser la fonction de lien logarith-
mique puisqu’elle présente l’avantage de donner un modèle multiplicatif, et les coefficients
β j ont alors une interprétation simple, en terme de multiplicateurs.
Si le choix de la fonction de lien n’est pas innocent en matière de tarification, il est
toutefois possible de prendre cette fonction comme inconnue, et de chercher à l’estimer
à partir des données. Pour cela, la transformation de Box-Cox permet d’avoir la forme
paramétrique simple  
λ

 x − 1 /λ, si λ , 0,


g (x) = 

 log (x) ,

 si λ = 0.
On notera que λ = 1 correspond à une fonction lien identité (modèle additif), et λ → 0 à
une fonction de lien logarithmique (modèle multiplicatif). Si λ = −1, on retrouve également
29

la fonction lien inverse. Aussi, un grand nombre de fonctions de lien usuelles appartiennent
à cette famille. Il est alors possible de chercher λ qui maximise la vraisemblance du modèle.

Figure 1.2: Ajustement d’un modèle linéaire généralisé àpartir de trois points, pour des lois
de Poisson-Gamma, avec différentes fonctionliens.
30

Chapitre 2

Tarification à posteriori

Si toutes les caractéristiques influençant le nombre de réclamations pouvaient être me-


surables et incorporées dans la tarification, les classes de risque seraient probablement ho-
mogènes. Les différences individuelles par rapport à la moyenne ne causeraient pas un
réajustement de la prime. Malheureusement, plusieurs des caractéristiques des assurés ne
peuvent être prises en compte dans la tarification à priori soit parce qu’elles ne sont pas
observables, soit parce qu’elles sont difficilement mesurables. On peut citer entre autres
l’agressivité au volant, les réflexes, la conduite sous l’effet de l’alcool, etc. Il est bien connu
que ces variables cachées peuvent avoir un impact significatif sur le nombre de réclamations
des assurés Denuit et al. (2007). Par conséquent, le portefeuille est encore hétérogène
malgré l’utilisation de plusieurs variables de classification dans la tarification à priori. Pour
cette raison, les actuaires utilisent une méthode de tarification basée sur l’expérience si-
nistre des assurés. Connu sous le nom de tarification à posteriori, c’est une méthode utilisée
par les actuaires afin de tenir compte des différences individuelles de chaque assuré dans
le portefeuille. Cette méthode consiste à modéliser l’hétérogénéité du portefeuille à l’aide
d’un effet aléatoire. L’analyse à posteriori de cet effet aléatoire en fonction du nombre de
réclamations de l’assuré permet de réévaluer la prime à priori afin de refléter le risque réel
que représente l’assuré. L’utilisation de l’historique des réclamations pour ajuster la prime
de l’assuré vient du fait qu’il est bien connu que le meilleur prédicteur du nombre d’acci-
31

dents futurs que l’assuré déclarera n’est pas l’âge ou le type de véhicule mais le nombre
d’accidents passés qu’il a déclarés Denuit et al. (2007).

2.1 Systèmes bonus-malus

2.1.1 Vue d’ensemble des systèmes bonus-malus

Les actuaires utilisent plusieurs systèmes ou conceptes mathématiques afin de déterminer


la prime des assurés en fonction de leur expérience sinistre. Ces systèmes de tarifica-
tion à posteriori pénalisent les assurés responsables d’un ou plusieurs accidents déclarés
par des surcharges (majorations ou malus) et récompensent les assurés n’ayant pas eu de
réclamations par des escomptes (rabais ou bonus). D’un point de vue des assurés, il n’est
pas toujours clair de la façon dont l’assureur détermine les rabais et majorations en fonc-
tion de leur historique de sinistre. Pour cette raison, les actuaires ont développé de nouvelles
méthodes de tarification à posteriori connu sous le nom de système bonus-malus. Le but
de ce système est de déterminer de manière adéquate mais aussi de manière à être com-
pris d’un large public (comme les assurés ainsi que des gens dans la compagnie tels que
les agents, les courtiers, les administrateurs, les dirigeants, etc.), le montant de prime à al-
louer à chaque assuré en fonction de son historique de réclamations. Les premiers systèmes
bonus-malus furent utilisés en assurance automobile et remontent à aussi loin qu’en 1910
en Angleterre, suivi de près par le Canada en 1930 Lemaire (1995). Ces systèmes accor-
daient une réduction de 10% par exemple, en cas d’une année passée sans réclamation. En
cas de réclamation, aucune pénalité n’était appliquée. Depuis ce temps, les systèmes bonus-
malus ont beaucoup évolué et une théorie fondée sur les chaı̂nes de Markov a permis de
mieux les analyser. Leur principal avantage est d’offrir un moyen simple de tenir compte de
variables de tarification à posteriori, tout en récompensant les assurés qui conduisent pru-
demment. Les systèmes bonus-malus sont surtout utilisés en assurance automobile car il est
généralement reconnu qu’un conducteur a un certain contrôle sur son nombre d’accidents.
32

C’est pour ce domaine que la théorie a été le plus développée et a acquis sa terminologie.
Le principe des bonus-malus se retrouve aussi, entre autres, en réassurance et en assurance
collective.
À travers le monde, soit les systèmes bonus-malus sont imposés par le gouvernement,
soit le marché est complètement libre. Lorsqu’ils sont imposés par le gouvernement, tous
les assureurs doivent adopter le même système. Tandis que lorsque le marché est complète-
ment libre chaque assureur construit son propre système. En Europe, une loi sur le libre
marché est en cours d’application, tandis que dans les pays asiatiques les bonus-malus
sont général-ement réglementés par le gouvernement Lemaire (2004). En Amérique, les
deux types se retrouvent. Dans le cas particulier du Québec, la SAAQI utilise un système
semblable au bonus-malus pour pénaliser les infractions au code de la route. La configura-
tion des systèmes varie aussi à travers le monde. Certains sont très simples et ne tiennent
compte que du nombre de réclamations, tandis que d’autres tiennent aussi compte de la
sévérité des accidents, de la possibilité de non augmentation de la prime et de la possibilité
de couverture gratuite Lemaire (1995, 2004).
Dans cette section, nous analyserons les systèmes bonus-malus à partir du concept de
système de tarification. Cette présentation offre un cadre mathématique rigoureux qui per-
met de synthétiser les notions essentielles de la théorie.

2.1.2 Description d’un système bonus-malus

En assurance automobile, un assureur doit établir un système de tarification de sorte


à être compétitif tout en contrôlant le risque qu’il assume. Soit (Xt )t∈N le risque à tarifer
et (Ct )t∈N la classe de tarif d’un risque. Muni de cette notation, nous allons préciser la
terminologie.

Definition 2.1 (Classe de tarif) Une classe de tarif (Ct ) détermine la prime à être chargée
au temps t pour assumer le risque encouru dans la période [t, t + 1]. Le processus (Ct )t∈N
représente l’évolution de la classe de tarif d’un risque dans le temps.
33

Il est généralement supposé que (Xt )t∈N est indépendant de (Ct )t∈N , i.e. que le risque
ne dépend pas de la classe de tarif. Nous adopterons aussi cette hypothèse. Cependant, la
classe de tarif dépend du risque comme le requiert tout système de tarification.

Definition 2.2 (Variable de tarification à posteriori) Variable de tarification dont la valeur


est connue après que le risque soit observé, i. e. si (Yt )t∈N est une variable de tarification à
posteriori pour le risque (Xt )t∈N , alors

Yt+1 est connue une fois Xt+1 observé,∀t ∈ N.

Pour les variables à posteriori, le nombre de réclamations, le nombre d’accidents res-


ponsables, ou le nombre d’infractions au code de la route, sont des exemples. Des études
comme celle de Lemaire (1977), montrent que les variables à posteriori sont de bien meilleurs
prédicteurs pour l’estimation du risque comparativement aux variables à priori. C’est pour-
quoi il est crucial que la règle de décision u d’un système de tarification incorpore des va-
riables à posteriori dans son design. Un système bonus-malus définit Yt comme le nombre
d’accidents responsables et At comme la classe de tarif de la période précédente.

Definition 2.3 (Système bonus-malus)


(i) Un système bonus-malus est un système de tarification où en début de période un
risque est classé dans la classe de tarif Ct . En fin de période, le risque est classé dans la
classe Ct+1 , d’après la règle de décision u . La règle de décision u détermine la classe de
tarif Ct+1 en fonction de la classe de tarif Ct et du nombre d’accidents responsables observé
Yt+1 de la période précédente
Ct+1 = u (Ct , Yt+1 ) (2.1)

À t = 0, la valeur de C0 est fixé à i0 ,


(ii) les classe de tarif (Ct )t∈N peuvent prendre leur valeur parmi l classes possibles. La
classe 1 accorde le plus grand bonus, tandis que la classe l accorde le plus grand malus.
(iii) À la i-ième classe de tarif correspond un pourcentage d’une prime de base bi tel
que b1 ≤ b2 ≤ ... ≤ bi .
34

Dans un système bonus-malus, les variables à priori mentionnées plus haut, comme
l’âge ou le type de voiture, sont utilisées pour déterminer la prime de base d’un nouvel
assuré. La prime accordée par la classe i correspond ainsi à la prime de base multipliée par
le niveau de prime bi .
Le système bonus-malus classique, présenté dans la définition précédente, peut être
généralisé en modifiant la règle de décision u. Par exemple, en plus du nombre d’accidents
responsables observé Yt+1 , nous pourrions aussi faire dépendre les classes de tarifs du type
0
d’accident Yt+1 tel que
0
 
Ct+1 = u Ct , Yt+1 , Yt+1 .

Example 2.4 (Système bonus-malus de la SAAQ) Au Québec, la SAAQ utilise un système


de points d’inaptitude basé sur la gravité relative des infractions au code de la route. Par
exemple, brûler un feu rouge entraı̂ne 3 points d’inaptitude, tandis qu’un excès de vitesse,
de 100km sur la limite prescrite, entraı̂ne 12 points d ’inaptitude. Ces points sont inscrits
au dossier du conducteur pour une période de deux ans. Le système bonus-malus tel que
présenté par la société de l’Assurance Automobile du Québec, possède 5 classes (voir le
tableau 2.1).
Ce système n’est pas un bonus-malus traditionel du fait que les classes sont définies
d’après la gravité relative des infractions au code de la route, plutôt que du nombre d’in-
fractions au code de la route. Cependant, le système n’en demeure pas moins un système
bonus-malus en tant que tel et constitue un exemple d’un système où les infractions mi-
neures n’entraı̂nent pas les mêmes sanctions que les infractions majeures. En ce sens, le
système de la SAAQ corrige un des défauts des systèmes bonus-malus que plusieurs auteurs
35

ont relevés Lemaire (2004).

Classe Points d’inaptitude Niveau de prime


5 > 15 796%
4 [12, 14] 572%
3 [8, 11] 348%
2 [4, 7] 200%
1 [0, 3] 100%
Table. 2.1 - Classe attribuée selon le nombre de points d’inaptitude

Example 2.5 (Système bonus-malus classique) Le système bonus-malus de la Thaı̈lande,


tel que présenté dans Lemaire(1995), constitue un exemple représentatif d’un système
bonus-malus classique. Il possède 7 classes avec un niveau de prime (b1 , ..., b7 ) =(60%,
70%, 80%, 100%, 120%, 130%, 140%) et la classe de départ C0 = 4. La règle de transi-
tion est 




 max(1, i − 1), k = 0 et 1 ≤ i ≤ 7


4, k = 1 et i < 4



u(i.k) = 


5, k > 1 et i < 4







min(7, i + 1), k , 0 et i ≥ 4



Ceci est représenté de façon compacte dans le tableau (2 .2).

2.1.3 Analyse d’un système bonus-malus

Structure markovienne

Il est généralement supposé que (Yt )t∈N forme une suite de variables aléatoires indépend-
antes et identiquement distribuées. Ceci revient à assumer que les habiletés de conduite
d’un assuré ne changent pas dans le temps, i.e. que les conducteurs n’apprennent pas de
leurs expériences. Nous poserons aussi cette hypothèse. Comme nous le verrons à la re-
marque (2.26) les systèmes bonus-malus possèdent un mécanisme pour compenser les la-
cunes de cette hypothèse.
36

Classe Niveau de prime k = 0 k=1 k>1


7 140 6 7 7
6 130 5 7 7
5 120 4 6 6
4 100 3 5 5
3 80 2 4 5
2 70 1 4 5
1 60 1 4 5
Table. 2.2 - Classe attribuée après k réclamations
Proposition 2.6 (Chaı̂ne de Markov de la classe de tarif)
Le processus de classe de tarif (Ct )t∈N forme une chaı̂ne de Markov homogène.

Preuve. Soit it la valeur prise par la classe de tarif au temps t. Avec (2.1) nous obtenons

P(Ct+1 = it+1 | Ct = it , ..., C0 = i0 )

= P(u(it , Yt+1 ) = it+1 | u(it−1 , Yt ) = it , ..., C0 = i0 )

= P(u(it , Yt+1 ) = it+1 ) (2.2)

= P(u(it , Yt+1 ) | Ct = it ) = P(Ct+1 = it+1 | Ct = it ).

En (2.2) nous utilisons le fait que les variables C0 , ..., Ct définies par Y1 , ... , Yt sont
indépendantes de u(it , Yt+1 ). La probabilité conditionnelle P(Ct+1 = it+1 | Ct = it ) donnée
par P(u(it , Yt+1 ) = it+1 ) ne dépend pas de la classe de tarif Ct puisque les Yt sont identique-
ment distribuées. Donc le processus de classe de tarif (Ct )t∈N forme une chaı̂ne de Markov
homogène.

Remarque 2.7 (Équation stochastique récursive) L’équation (2.1) peut être vue comme
une équation stochastique récursive et, comme il est souligné dans Rolski et autres (1998),
le processus (Ct )t∈N forme alors automatiquement une chaı̂ne de Markov. La preuve utilisée
ci-haut est d’ailleurs celle présentée dans la référence précédente.
37

Soit {pk }k∈N la distribution de probabilité commune à la suite (Yt )t∈N , nous pouvons
obtenir la matrice de transition Q associée à (Ct )t∈N en considérant chacun des éléments qi j
tel que Q = (qi j )i, j=1,,,.,l .

Proposition 2.8 (Probabilités de transition de la classe de tarif) La probabilité de transi-


tion qi j de passer de la classe i à la classe j est donnée par

  X∞
qi j = E 1 j (u (i, Yt+1 )) = pk 1 j (u (i, Yt+1 )) .
k=0

Preuve. Comme (Ct )t∈N forme une chaı̂ne de Markov, avec (2.1), nous obtenons le
résultat

qi j = P(Ct+1 = j | Ct = i)

= P(u(i, Yt ) = j | Ct = i)
 
= E 1 j (u (i, Yt+1 ))

Remarque 2.9 La quantité 1 j u (i, k) est parfois notée comme une règle de transition ti j (k),





 1, si la police passe de la classe i à la classe j

ti j (k) = 



 lorsque k réclamations surviennent.



 0, autrement

Ceci permet de former une matrice de transition T (k) = (ti j (k))i, j=1,...,l .T (k) est une ma-
trice 0 − 1 ayant exactement un 1 dans chaque ligne. La notation 1 j (u (i, k)) facilite l’ana-
lyse comme nous l’avons vu à la proposition (2.6). Tandis que la notation ti j (k) facilite
la présentation de la règle de décision comme nous l’avons vu dans les exemples (2.4)
et (2.5). Les tableaux récapitulatifs de ces exemples correspondent en effet à la matrice
T (k) représentée de façon compacte. Le choix de l’une où l’autre des notations dépend du
contexte.
En pratique, il est généralement supposé que le nombre d’accidents responsables Yt
suit une loi de Poisson avec intensité aléatoire Λ (Lemaire 1994). La distribution de Λ est
38

définie par sa fonction de densité g appelée fonction de structure. Le choix classique pour
la distribution de Λ est une distribution Gamma. La fréquence des réclamations suit alors
une loi Binomiale Négative

Lemme 2.10 Si Y ∼ Poisson(Λ) où Λ ∼ Γ (α, β) avec

xα−1 − βx
g (λ) = P (Λ = λ) = α e ,
β Γ (α)
β
alors Yt ˜ Binomiale Négative(α, 1+β ).

Preuve. En conditionnant sur Λ, nous pouvons utiliser la fonction génératrice des pro-
babilités d’une loi de Poisson

E (Y s ) = E(E(Y s | Λ))

= E(exp(Λ(s − 1))).

En reconnaissant la dernière égalité comme la fonction génératrice des moments de Λ,


nous obtenons la fonction génératrice des moments d’une loi Binomiale Négative

E (Y s ) = (1 − β (s − 1))−α
!α !−α
1 1
= 1− s
1+β 1+β

Avec la proposition (2.8) et le lemme (2.11) nous pouvons calculer q(n)


i j , la probabilité

de passer de la classe i à la classe j en n périodes, en multipliant la matrice Q par elle-même


n fois. Pour analyser le comportement asymptotique de la classe de tarif, nous utilisons la
notion de communication entre les classes i.e. que la classe i communique avec la classe j

i j > 0 Ross (2003).


si ∃ n ∈ N tel que q(n)

Proposition 2.11 (Ct )t∈N est une chaı̂ne de Markov ergodique si et seulement si toutes les
classes de tarif communiquent entre elles.
39

Preuve. Si toutes les classes de tarif communiquent entre elles, la matrice de transition
Q est irréductible et apériodique, d’où l’ergodicité de la chaı̂ne de Markov (Ct )t∈N .

Proposition 2.12 Si (Ct )t∈N est une chaı̂ne de Markov ergodique alors il existe une distri-
bution stationnaire a = (a j ) j=1,..,l où a j = lim q(n)
i j est la solution unique de l’équation
n→∞

l
X
a = aQ, a j = 1.
j=1

Preuve. Suit directement de la théorie sur les chaı̂nes de Markov.

Remarque 2.13 (i) Pour vérifier que toutes les classes d’une chaı̂ne de Markov commu-
niquent entre elles, une façon simple consiste à faire le graphe de la chaı̂ne de Markov. Si
le graphe est fermé, i. e. que tous les états peuvent être rejoint à partir de n’importe quel
état de départ, alors tous les états communiquent entre eux. Si ce n’est pas le cas, tous les
états ne communiquent pas entre eux, et la chaı̂ne de Markov n’est pas ergodique.
(ii) Plus de détails sur les notions d’ergodicité, d’irréductibilité et d’ apériodicité peuvent
être trouvés dans Rolski et autres (1998). Ces notions y sont introduites en utilisant le
concept de matrice régulière. Comme ces concepts ne sont pas directement reliés à notre
sujet, nous ne les élaborons pas davantage.

Mesures d’efficacité (système bonus-malus)

Dans cette partie nous précisons la définition des éléments sur lesquels reposent l’ef-
ficacité d’un système de tarification proposé par Lemaire pour analyser l’efficacité d’un
système bonus-malus Lemaire (1995, 2004), et donnent les mesures applicables dans le
contexte d’un système bonus-malus. Pour ce faire, nous utiliserons le processus de surplus
(Ut )t∈N dont voici la définition rigoureuse.

Definition 2.14 (Surplus dans un système bonus-malus) Soit X t+1 le montant des réclamat-
ions dans la période [t, t + 1], π(Ct ) la prime chargée en début de période pour la classe Ct
40

et u le niveau de réserve initial. Avec le niveau de surplus Ut+1 , évalué en fin de période,
nous définissons le processus de surplus (Ut )t∈N par
t
X t+1
X t
X t+1
X
Ut+1 =u+ π(C s ) − Xs = u + π(u (C s−1 , Y s )) − Xs
s=0 s=1 s=0 s=1

Sans perte de généralité, nous supposerons que la prime de base est de 1 et que le
montant des réclamations est mis à une échelle unitaire. Ceci permet de focaliser l’analyse
sur l’impact des niveaux de primes {b j } propre aux systèmes bonus-malus.

l
X
π(Ct ) = i0 j b j .
q(t)
j=1
E (Xt ) = 1, ∀t ∈ N.

Remarque 2.15 Voici un bref aperçu de la procédure qui mêne à la calibration d’un
système bonus-malus. Dans une première étape les (b j ) j=1,...,l sont déterminés à l’aide
de données et d’outils statistiques. Ensuite, u et (b j ) j=1,...,l sont choisis afin d’atteindre
un équilibre entre les critères d’efficacité. L’atteinte de l’équilibre entre les critères peut
éventuellement demander un réajustement des (b j ) j=1,...,l . En 1995, Lemaire dresse un bon
exposé de cette démarche. L’exemple détaillé de Denuit (2003), éclaire aussi par son aspect
très concret et orienté vers la pratique.

Stabilité financière

Un bon système de tarification doit induire une structure de primes qui apporte une sta-
bilité financière à l’assureur. Les bonus attribués par le système ne doivent pas ultimement
causer une insuffisance des tarifs.

Definition 2.16 Pour les systèmes bonus-malus, la stabilité financière est analysée à partir
du pourcentage stationnaire espéré de la prime de base que nous noterons par
l
X
0
b = a jb j.
j=1
41

0
Nous définissons aussi la classe stationnaire espérée c
l
X
0
c = a j j,
j=1

et le niveau de stationnarité relatif NS RE


0
b − b1
NS RE = .
bl − b1
0
Un pourcentage stationnaire espéré b supérieur à 1 suggère que le système n’accorde
ultimement que des malus. Parallèlement, si ce pourcentage est inférieure 1, le système
n’accorde ultimement que des bonus. L’interprétation du NS RE est semblable. Un niveau
faible du NS RE suggère une forte proportion des assurés dans les classes à fort bonus.
Tandis qu’un niveau élevé du NS RE suggère une meilleure répartition des assurés à
travers les classes.
Des mesures comme la probabilité de ruine, ou le niveau du surplus à la ruine, peuvent
0
aussi être utilisées. Mais, dans la littérature sur les bonus-malus, b est mis de l’avant à
cause de la nature markovienne des systèmes bonus-malus.

Proposition 2.17 (Stabilité financière d’un système bonus-malus) Un système bonus malus
est stable financièrement si
(i) il est transparent
0
b = 1.

(ii) lorsque la stationnarité est atteinte, l’assuré ne se retrouve pas dans une classe
extrême
0 < NS RE < 1.

0
Remarque 2.18 1. Le terme transparent découle du fait que, lorsque b , 1, les tarifs
changent progressivement dans le temps et les assurés ne peuvent alors anticiper convena-
blement les bonus. Le cas de figure où un assureur charge une prime très élevée aux nou-
veaux conducteurs pour compenser son déséquilibre financier est aussi dit non équitable.
42

2. Dans la plupart des pays développés, la fréquence moyenne des réclamations est
souvent en deçà de 10%. Ceci entraı̂ne un agglutinement des assurés dans les classes à
haut bonus et une non transparence du système. Parallèlement, même si ce phénomène est
connu, il est difficile à éviter car un système qui pénaliserait trop sévèrement les assurés ne
respecterait pas le principe d’assurance de transfert adéquat du risque.
3. Le NS RE est une mesure particulièrement utile pour comparer des systèmes entre
eux, car, généralement, des systèmes différents ont des niveaux de prime minimum b1 et
maximum bl différents.

Pour les systèmes imposés à tous les assureurs par le gouvernement, les mesures de
stabilité financière permettent d’anticiper le comportement des tarifs. Pour les assureurs
agissant dans un libre marché, les mesures de stabilité permettent, dans la phase de concep-
tion d’un système, de corriger les défaillances.

Example 2.19 (Suite de l’exemple 2.5) Supposons que la fréquence des réclamations suit
une loi de Poisson de paramètre λ. Le tableau (2.3) présente la classe stationnaire espérée
0 0
c , le pourcentage stationnaire espéré b et le niveau de stationnarité relatif NS RE pour
différentes valeurs de λ.
Le système bonus-malus de la Thaı̈lande est transparent et maintient les assurés dans
la classe médiane, si la fréquence des réclamations est de 0.5. La classe initiale de ce
système, la classe 4, est aussi la classe stationnaire espérée pour λ = 0.5. Le système est
donc stable financièrement dans un environnement où il y a une réclamation tous les deux
ans. Pour un environnement où le risque est plus élevé, le système réagit en chargeant une
surprime.
Parallèlement, pour un environnement où le risque est moins élevé, le système réagit en
43

accordant un bonus.

λ 0.10 0.25 0.50 1.00 1.25


0
c 1.59 2.49 4.02 6.01 6.40
0
b 67.19% 79.03% 100.82% 128.52% 133.42%
NS RE 8.99% 23.78% 51.03% 85.65% 91.78%
0 0
Table. 2.3- c , b et NS RE pour le système de la Thaı̈lande

Transfert adéquat du risque

Un système de tarification vise à faire contribuer équitablement chaque assuré au finan-


cement des réclamations. Cependant, si les malus sont trop élevés, le système n’encourage
pas les assurés à faire une réclamation et les empêche ainsi de bénéficier de la couverture
à laquelle ils ont droit. Pire, il peut encourager les assurés à s’enfuir après avoir causé
des dommages à des tiers. Pour éviter ces problèmes, les changements de prime entraı̂nés
par les bonus et les malus doivent être raisonnables, sans quoi le système ne transfère pas
adéquatement le risque. La définition suivante présente des mesures permettant de quanti-
fier l’ampleur des changements de prime induits par le système.

Definition 2.20 Pour les systèmes bonus-malus, l’ampleur des changements de prime in-
duits par le système est analysée à partir du coefficient de variation de la prime

Var(π(Ct ))
ρt = ,
E (π(Ct ))

et la rétention optimale moyenne

ε∗ = maxE(Rt (x, ε)),

où Rt (x, ε) est la compensation réelle induite par le système pour une rétention de ε

X ∞
X
Rt+1 (x, ε) = (XS | Xt = x) − [π (CS | Xt = x − ε) − π (CS | Xt = x)] .
s=t+1 s=t+1
44

La compensation réelle met en perspective le montant versé pour les réclamations et


la perte de bonus reliée à la déclaration d’une réclamation. Pour ce faire, il est nécessaire
de considérer toutes les réclamations et les bonus à venir Holtan (2001). La rétention ε
correspond ainsi à un déductible que l’assuré s’impose pour maximiser sa compensation
réelle.
Un coefficient de variation de la prime faible suggère que les changements de primes
apportés par les bonus ou les malus entraı̂nent une variation faible dans la prime et per-
mettent donc un transfert adéquat du risque. De même, une rétention optimale moyenne
faible suggère que le système transfère adéquatement le risque

Remarque 2.21 La rétention optimale moyenne est aussi appelée  appétit pour les bo-
nus de la terminologie anglaise  bonus hunger . Ce phénomène a traditionnellement
été compris comme la façon dont les systèmes bonus-malus introduisent le concept de
déductible. Récemment, les travaux de Moreno et autres (2006) ont montré que ce phénomène
peut aussi être considéré comme un mécanisme peu coûteux contre la fraude.

Proposition 2.22 (Principe de transfert du risque dans un système bonus-malus)


Un système bonus-malus respecte le principe de transfert du risque si
(i) Le coefficient de variation de la prime de l’assuré ρt est raisonnable,
(ii) La rétention optimale moyenne ε∗ est raisonnable.

Example 2.23 (Suite de (2.21)) À la stationnarité, si la prime de base est de 1, nous avons

0
lim π (Ct ) = b ,
t→∞
v
u
t l
X
lim Var(π(Ct )) = a j b2j − (b0 )2 ,
p
t→∞
j=1

d’où, pour le coefficient de variation de la prime de l’assuré


s
Pl
a j b2j − (b0 )2
j=1
lim ρt = .
t→∞ b0
45

Le tableau (2.4) présente les résultats de calcul pour différentes valeurs de λ

λ 0.10 0.25 0.50 1.00 1.25


Coefficient de variation 21.05% 27.30% 25.73% 12.45% 8.46%
Table. 2.4 - Coefficient de variation de la prime de l’assuré pour
le système de la Thailande

Example 2.24 Pour les valeurs de λ présentées, à la stationnarité, la prime de l’assuré


peut varier entre 8.46% et 2l.05% entre chaque période. Par exemple, pour λ = 0.5,
la prime de l’assuré peut augmenter ou diminuer de 25.73% entre chaque période. De
nos jours, il n’est pas rare de voir une police d ’assurance augmenter de 25% suite à la
déclaration d’un accident. En ce sens, le système bonus-malus de la Thaı̈lande respecte le
principe de transfert du risque.

Remarque 2.25 Le calcul de la rétention optimale moyenne est complexe et utilise des
méth-odes qui dépassent le cadre de ce chapitre. Nous référons le lecteur à Holtan (2001)
pour des exemples de calcul de la rétention optimale moyenne.

2.2 La Théorie de la crédibilité

2.2.1 Petit historique sur la théorie de crédibilité

Au sein d’un portefeuille d’assurance hétérogène, les assurés ne sont pas tous égaux
devant le risque, certains présentant un profil plus dangereux que d’autres. Réclamer une
prime de montant identique pour tous pourrait donc paraı̂tre inéquitable, car cela indui-
rait nécessairement la surtarification de certains assurés, et l’utilisation de ces surcroı̂ts de
prime pour dédommager les sinistres causés par les individus plus risqués. On peut bien
entendu diminuer l’hétérogénéité du portefeuille en le partitionnant en classes de risques
aussi homogènes que possible (Sur la base de caractéristiques observables, telles que le
sexe, l’âge, le domicile, etc. des assurés). Il subsistera malgré tout le plus souvent une cer-
taine hétérogénéité au sein de chaque classe, les facteurs observables étant loin d’expliquer
46

complètement la dangerosité des assurés. Il est donc assez naturel d’utiliser la sinistralité
relative à un individu pour réévaluer le montant de sa prime. En effet, la sinistralité d’un
individu devrait à tout le moins partiellement refléter le niveau de risque réel de celui-ci.
Cette pratique relève de la théorie de la crédibilité.
Ainsi, dès 1910, Allstate assurait contre les accidents du travail la société General Mo-
tors et un certain nombre de petites entreprises. En calculant le taux de prime moyen sur son
expérience, General Motors s’aperçut que sa prime d’assurance devrait être plus faible que
celle de l’ensemble des entreprises assurées. Prétextant que le nombre d’assurés était suf-
fisamment grand, General Motors exigea de son assureur de prendre en compte son propre
historique et non plus celui de l’ensemble des assurés. Au même moment, un petit construc-
teur indépendant, Tucker, fit la même demande. La question se posa alors assez clairement
aux yeux des actuaires d’Allstate : à partir de quelle taille peut-on considérer qu’une entre-
prise est suffisamment importante pour que l’on puisse tarifer sur son expérience propre.
Mowbray (1914) fut le premier à apporter une réponse claire à cette question, en posant
ainsi les bases de la crédibilité dite de stabilité (ou “limites fluctuations”). Mais s’il pro-
pose un seuil à partir duquel la taille est suffisante, que doit-on faire pour les entreprises
de taille plus faible. Quelques années plus tard, Whitney (1918) mentionne “la nécessité,
par souci d’équité pour l’assuré, de pondérer d’un côté l’expérience collective, et de l’autre
l’expérience individuelle”. Toute la théorie de la crédibilité visera précisément à calcu-
ler au mieux cette pondération. Notons qu’il faudra attendre la contribution de Bühlmann
(1967,1969) pour que ce problème de prise en compte de l’expérience en tarification trouve
une réponse satisfaisante.
L’idée fondamentale de la théorie de la crédibilité peut se résumer comme suit. Suppo-
sons avoir observé une police durant n années, et enregistre les montants annuels de sinistre
X1 , X2 , ..., Xn ; Xi est le montant de sinistre généré par cette police durant l’ième année d’ob-
servation. La prime pure “observée” est donc.

X1 + X2 + ... + Xn
p̄n =
n
47

L’assureur pourrait songer à réclamer dorénavant un montant p̄n à cet assuré, mais ce
serait faire fi du principe même de l’assurance en renonçant à toute mutualisation du risque
(l’assureur s’apparenterait alors à un prêteur, qui lisserait la sinistralité dans le temps, sans
mutualisation). De plus, que faire pour les assurés qui n’ont jamais déclaré de sinistres
(i.e., ceux pour lesquels X1 = X2 = ... = Xn = 0), les dispenser de payer la prime tout en
continuant à les couvrir. L’assureur est donc confronté à un dilemme : soit il continue à
exiger un montant pcoll identique à tous les assurés, mais pourrait mécontenter les “bons”
assurés qui, s’estimant lésés, risquent alors de partir à la concurrence, soit il se laisse tenter
par p̄n mais nie par là le principe même de l’assurance. Les actuaires américains ont alors
songé à réclamer une prime dont le montant serait un compromis entre ces deux positions
extrêmes. Ainsi, la prime pn exigée par la compagnie pour accorder sa garantie durant
l’année n + 1 est-elle donnée par

pn = α p̄n + (1 − α) pcoll , 0 ≤ α ≤ 1,

où α est le facteur de crédibilité (il mesure la “crédibilité” que l’on peut accorder à la
prime “observée” p̄n ).
Les choix usuels pour α sont
n
α=
n0 + n
qui tend vers 1 lorsque n tend vers +∞, où n0 est un paramètre fixé et n le nombre d’années
d’observation disponibles, et
n 
α = min ; 1 ,
n∗
où n∗ est une valeur seuil au-delà de laquelle on accorde une crédibilité totale a la police.

Remarque 2.26 1. But de cette approche : incorporer autant d’expérience individuelle


possible sans trop affecter la stabilité de la prime.
2. La distribution des primes est basée uniquement sur la taille des assurés. La tarifi-
cation n’est donc pas nécessairement précise et équitable.
48

Nous présentons dans cette section, une introduction à cette théorie, ainsi que certains
concepts de la crédibilité bayésienne. Ensuite, on présente le modèle original et classique
de Bühlmann.

2.2.2 L’approche bayésienne en crédibilité

L’ensemble des caractéristiques de risque d’un contrat est appelé niveau de risque, in-
tuitivement, on serait porté à croire qu’il est appelé à varier tout au long des différentes
périodes d’observation. Par exemple, un conducteur n’aura probablement pas les mêmes
habitudes de conduite à 20 qu’à 50 ans. Le risque que représente cet assuré en sera éventuell-
ement modifié. En pratique, ce changement se traduit par une classification différente de
l’assuré. Ainsi, le même assuré se verra attribuer une classification différente à 50 ans que
celle qu’il avait à 20 ans. II est également possible d’attribuer différents niveaux de risque à
un même contrat, reflètant ainsi les variations du risque de l’assuré tout au long de la durée
de vie du contrat. Cependant, afin de simplifier les calculs, on considère le niveau de risque
constant dans le temps.
On designe par θ la variable aléatoire représentant le risque d’un assuré. En fait, cette
variable peut être interprétée comme une variable qui englobe l’ensemble des caractéristiques
non observables d’un assuré. De plus, les paramètres de risque caractérisant chaque contrat
sont perçus comme des réalisations indépendantes de θ. On suppose que les paramètres de
risque de chaque assuré sont tous issus d’une même fonction de répartition U(θ). Cette
fonction reflète la structure de risque de l’ensemble du portefeuille. Bühlmann (1969)
a d’ailleurs désigné cette fonction par fonction de structure. On dénote une certaine ho-
mogénéité dans le portefeuille étant donné que les paramètres de risque proviennent tous
de la même fonction de distribution U(θ). Cependant, les différences entre les contrats
sont expliquées par le fait que le paramètre de risque caractérisant chaque contrat est une
réalisation différente de Ia variable aléatoire θ.
Le choix de la fonction de structure U(θ) dépend de l’approche utilisée. Selon une
approche bayésienne pure, U(θ) représente la perception à priori de l’assureur concernant
49

le risque. Généralement, elle est utilisée lorsqu’on ne détient aucune observation sur le
risque. comme c’est le cas par exemple pour une nouvelle ligne d’assurance. Cependant.
la fonction de structure U(θ) est en pratique, inconnue de l’assureur. Selon une approche
bayésienne empirique, les observations du portefeuille sont utilisées dans l’estimation de
la fonction de structure.
La prime bayésienne sera notée par E µ(θ) | X . Son expression est obtenue par un
 

processus à deux étapes. On doit d’abord obtenir la fonction de densité à posteriori du


paramètre de risque, soit p(θ | x1 , .., xt ), pour ensuite en évaluer l’espérance. L’obtention de
la fonction de densité à posteriori nécessite la formule de Bayes. Il en découle
t  
f x j | θ u(θ)
Q
j=1
p(θ | x1 , .., xt ) = R t   . (2.3)
f x j | θ u(θ)dθ
Q
θ j=1

L’espérance de la prime de risque conditionnelle aux observations est donc


+∞
Z
E µ(θ) | X1 = x1 , .., Xt = xt = µ(θ)p(θ | x1 , .., xt )dθ.
 
(2.4)
−∞

Notons que lorsque la distribution du paramètre de risque θ est continue, les sommations
dans (2.3) et (2.4) sont simplement remplacées par des intégrales.
Whitney (1918) et Bailey (1950) furent les premiers à démontrer que la prime bayésienne
est une prime de crédibilité bayésienne linéaire (ou exacte) pour certaines combinaisons de
distributions. Une prime de la forme πn+1 = zX + (1 − z)m est appelée prime de crédibilité
et 0 ≤ z ≤ 1 est le facteur de crédibilité.

Example 2.27 (Cas Poisson/Gamma).


Soit

Xt | θ v Poisson(θ)

θ v Gamma(α, λ),
50

c’est-à-dire

θ x e−θ
f (x | θ) = , x = 0, 1, ...
x!
λα α−1 −λθ
u(θ) = θ e ,θ  0
Γ (α)

a) la prime de risque.
On a
µ(θ) = E[Xt | θ] = θ.

On calcule également, pour usage futur,

σ2 (θ) = Var[Xt | θ] = θ.

b) la prime collective
On a
α
m = E[µ(θ)] = E[θ] =
λ
c) la prime bayésienne à partir de la distribution à posteriori de θ.
Tout d’abord, on a
n
Y
u(θ | x1 , ..., xn ) = u (θ) f (xt |θ)
t=1
Y
= θα−1 e−λθ θ xt e−θ
n
α+
P
xt −1 −(λ+n)θ
= θ t=1 e
n
d’où θ|X1 , ..., Xn v Gamma(e
α = α+ λ = λ + n). Par conséquent, la prime bayésienne
P
Xt ,e
t=1
51

est

Bn+1 = E[µ(θ) | X1 , ..., Xn ]


α
= E[θ | X1 , ..., Xn ] =
e
λ
e
n
α+
P
Xt
t=1
=
λ+n
n λ α
= X+
n+λ n+λλ
= zX + (1 − z)m

avec
n
z= .
n+λ
La prime bayésienne est donc linéaire dans le cas Poisson/Gamma.

Remarque 2.28 Il y a en fait cinq combinaisons de distributions qui résultent en une prime
bayésienne linéaire (plus leurs convolutions). Les formules de crédibilité exacte pour les
combinaisons de distributions issues de la famille exponentielle sont rassemblées dans ce
tableaux :
 
f (x | θ) Bernoulli(θ) Geometric(θ) Exponential(θ) N θ, σ21
 
π (θ) Beta(α, β) Beta(α, β) Gamma(α, β) N µ, σ22
       
f (θ | X) Beta α̃1 , β̃1 Beta α̂2 , β̂2 Gamma α̃3 , β̃3 N µ̃, σ̃22
¯
µ (θ) θ 1−θ
θ
1
θ
θ
α β β
m α+β α−1 α−1
µ
α+ i xi β+ i xi β+ i xi nσ22 x̄ + σ21 µ
P P P
PB α+β+n α+n−1 α+n−1 nσ22 + σ21
n n n n
z n+α+β n+α−1 n+α−1 σ2
n+ 1
σ2
2

Table 2.5 - Modèles de crédibilité bayésienne pour certaines


paires de distributions conjuguées
52

   P 
α̃1 , β̃1 α + j x j, β + n − i x j
P
   P 
α̃2 , β̃2 α + n, β + i x j
   P 
α̃3 , β̃3 α + n, β + i x j
 2P 
σ2 j x j + σ21 µ σ21 σ22
 
µ̃, σ̃22 nσ2 + σ2
, T σ2 + σ2
2 1 2 1

Table 2.6 - Nouveaux paramètres de la distribution a postérieure

2.2.3 Modèle de Bühlmann

Le calcul de la prime, selon une approche bayésienne, nécessite la connaissance les


fonctions de densité u(θ) et f (x | θ). Dans un tel contexte, on suppose que les montants
de sinistres sont des variables aléatoires issues de f (x | θ). Comme il a été mentionné
dans le sous section précédente, l’approximation de la prime de risque sous une approche
bayésienne peut s’avérer complexe. Par conséquent, on cherchera plutôt à obtenir une ap-
proximation de µ(θ) qui peut s’exprimer comme une fonction linéaire des observations.
Pour certaines combinaisons de u(θ) et f (x | θ), soit celles du modèle de Jewell (Jewell
l974), cette approximation sera équivalente à la prime bayésienne.
Pour contourner le problème de complexité de calcul de la prime bayésienne, Bühl-
mann (1967,1969) propose des modèles qui reposent essentiellement sur une approxima-
tion linéaire de la prime de risque. Il obtient ainsi une approximation de la prime de risque
µ(θ) qui peut s’exprimer sous la forme de la prime de crédibilité. Par conséquent, le calcul
de la prime est déterminé sous une approche bayésienne pure et nécessite la connaissance
des fonctions de densité u(θ) et f (x | θ). Par son modèle original, Bühlmann (1967) vient
donc corriger une faiblesse de la crédibilité bayésienne, soit celle de la complexité de calcul.
Cependant, en pratique, les fonctions u(θ) et f (x | θ) sont bien souvent inconnues de l’as-
sureur. Bühlmann (1969) a évité ce problème par son modèle classique, où l’on considère
plutôt un portefeuille composé de plusieurs contrats. Ainsi, les observations de l’ensemble
du portefeuille pourront être utilisées pour estimer les paramètres nécessaires au calcul de
la prime de crédibilité.
Dans son modèle classique, Bühlmann (1969) suppose que les montants de sinistres
53

sont des variables aléatoires issues d’une certaine fonction f (x | θ). Il est toutefois possible
de percevoir différemment le modèle classique de Bühtmann (1969).

Notation et relations de covariance

On définit la notation suivante :


h i
s2 = E [Var [Xit | θi ]] = E σ2 (θi ) .

a = Var [E [Xit | θi ]] = Var µ (θi ) .


 

Interprétation :
• s2 est une mesure de la non-homogénéité des périodes.
• a est une mesure de la non-homogénéité du collectif.

Thorme 2.29 Soit X, Y et θ des variables aléatoires dont la densité conjointe existe.
Alor
Cov (X, Y) = Cov (E [X | θ] , E [Y | θ]) + E [Cov (X, Y | θ)] .

Corollaire 2.30 En posant X ≡ Y dans le théorème 5.1, on obtient

Var [X] = E [Var [X | θ]] + Var [E [X | θ]] .

Thorme 2.31 Soit X1 , ....., Xn des variables aléatoires conditionnellement indépendantes


sachant la variable aléatoire θ et

E [Xt | θ] = µ (θ) ,

Var [Xt | θ] = σ2 (θ) , t = 1, ...., n

Alors

 a, t,u


Cov (Xt , Xu ) = 

 a + s2 ,

 t=u
= a + δtu s2 , t et u = 1, ...., n,
54

Cov (µ (θ) , Xt ) = a,

où δtu est le delta de Kronecker :



 1, t,u


δtu = 

t=u

 0,

Preuve. Pour le premier résultat, on a

Cov (Xt , Xu ) = Cov (E [Xt | θ] , E [Xu | θ]) + E [Cov (Xt , Xu | θ)]

= Cov (µ (θ) , µ (θ)) + E [δtu Var [Xt | θ]]


h i
= Var µ (θ) + δtu E σ2 (θ)
 

= a + δtu s2 .

De plus,

Cov (µ (θ) , Xt ) = Cov (µ (θ) , E [Xt | θ]) + E Cov (µ (θ) , Xt | θ)


 

= Var µ (θ) + E [0]


 

= a.

Modèle et prévision

Le modèle original de Bühlmann (1969) suppose un portefeuille composé d’un i contrat,


dont l’expérience est observée pendant t périodes. L’approximation linéaire πi,n+1 de la
prime de risque ne nécessite plus la connaissance des paramètres m, s2 et a car il est pos-
sible de les estimer à partir des observations des différents contrats. Le calcul de la prime est
donc développé sons une approche bayésienne empirique. On suppose que chaque contrat
est caractérisé par un paramètre de risque θ provenant d’une certaine fonction de structure
U (.) . De plus, Xi j désigne le montant total des sinistres du contrat i survenus au cours de
la période j.
55

Les hypothèses du modèle de Bühlmann sont les suivantes (version la moins restrictive).
(B1) Les contrats (θi , Xi ) , i = 1, ...., k sont indépendants, les variables aléatoires θ1 , ...., θI
sont identiquement distribuées et les variables aléatoires Xi j ont une variance finie.
(B2) Les variables aléatoires Xit ,sont telles que
h i
E Xi j | θi = µ (θi ) , i = 1, ...., k, j = 1, ...., t
 
Cov Xi j , Xir | θi = δ jr σ2 (θi ) , i = 1, ...., k, j, r = 1, ...., t.

Remarque 2.32 1. L’hypothèse d’indépendance entre les contrats peut ne pas être réaliste,
mais a) elle simplifie les calculs ; et b) c’est une bonne approximation dans plusieurs cas.
2. Hypothèse (B1) : indépendance inter contrats (between).
3. Hypothèse (B2) : homogénéité temporelle et indépendance intra contrats (within),
c’est-à-dire :

− µ (θi ) constante dans le temps.


− observations conditionnellement non corrélées.

Calcul de Ia prime

Le modèle classique de Bühlmann (1969) permet d’obtenir une approsimation de la


prime de risque par des fonctions linéaires homogènes et non homogènes des observations.
Comme dans le modèle original, cette combinaison linéaire est de la forme
k X
X t
ci0 + cir j Xr j (2.5)
r=1 j=1

Notons que l’exposant i désigne le contrat pour lequel on cherche à obtenir la prime de
crédibilité. Le théorème suivant présente la prime de crédibilité non homogène du modèle
classique de Bühlmann (1969).

Thorme 2.33 Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses
(B1) et (B2), la meilleure approximation linéaire non homogène de la prime de risque
56

µ (θi ) est
πi,n+1
B
= zXi + (1 − z) m (2.6)

ou
t
1X
Xi = Xi j (2.7)
t j=1
t
z= . (2.8)
t+ s2
a

Preuve. Par indépendance entre les contrats, on sait déjà que la prime de crédibilité du
contrat i sera une fonction de ses observations seulement.
On peut donc réduire le problème à trouver les coefficients cir j (r, i = 1, ...., k; r, j = 1, ...., t)
qui sont la solution du problème de minimisation suivant :

k X
t
2 
 X  
min E µ (θ ) − ci + ci
X   . (2.9)
 i 0 r j r j
c0 ,cr j
i i 
  
r=1 j=1

En calculant les dérivées partielles, d’abord par rapport à ci0 , on obtient


 k X
t

 X 
−2E µ (θi ) − ci0 + cir j Xr j  = 0,
r=1 j=1

et, par conséquent,


Xk X
t
ci∗0 =m−m cir j (2.10)
r=1 j=1

où
h i
m = E µ (θi ) = E Xr j .
 

Après avoir inséré (2.10) dans (2.9), les dérivées partielles par rapport à cir0 j0 , r = 1, ...., k, j =
0 0

1, ...., t sont

k X t
2 
∂ 
µ (θ ) − m −
X
i
  
E  i c Xrj − m  
∂cr0 j0
i 

r=1 j=1
rj  
 k X t

 X   
= −2E µ (θi ) − m − cir j Xr j − m Xr0 j0 − m  ,
r=1 j=1
57

ce qui conduit au système d’équations suivant :


h i X t
k X  
Cov µ (θi ) , Xr0 j0 = cir jCov Xr0 j0 , Xr j (2.11)
r=1 j=1

Ainsi, pour r = i
0

n
X  
a= cii j a + δ j0 j s2 . (2.12)
t=1

Puisque les contrats sont supposés indépendants, on a une superposition de matrices à


résoudre. Donc, pour chaque contrat, on a un système matriciel semblable à celui que l’on
retrouve dans le modèle original. Par conséquent, les coefficients cii j , j = 1, ..., t sont égaux.
En effectuant la sommation dans (2.12), on obtien
a
cii j = , i = 1, ..., k (2.13)
at + s2
Puisque cette expression de cii j ne dépend pas de i, ces coefficients sont tous égau, pour
r = i. Lorsque r , i, le membre de gauche de l’égalité (2.11) est nul puisque les contrats
0 0

sont supposés indépendants. Ce système étant symétrique, les coefficients cii j sont donc nuls
0
pour r , i.
Ainsi, en remplaçant les expressions obtenues pour ci∗0 et ci∗i j dans (2.5), on trouve
k X t
 k X t
 k X t
X  X  X
c0 +
i
cr j Xr j = m 1 −
i  cr j  +
i  cir j Xi j
r=1 j=1 r=1 j=1 i=1 j=1
 a  a
= m 1− + Xi.
at + s 2 at + s2
En posant z = a
at+s2
,on obtient donc la prime linéaire suivante :

πi,n+1
B
= zXi + (1 − z) m

Remarque 2.34 1. La prime de crédibilité a deux belles propriétés :


a) elle est sans biais, c’est-à-dire que
h i h i
E πi,n+1
B
= zE Xi + (1 − z) m = m.
58

En moyenne, l’assureur perçoit donc suffisamment de primes pour payer les sinistres.
n−→∞ n−→∞ n−→∞
b) puisque Xi −→ µ (θi ) et z −→ 1 alors πi,n+1
B
−→ µ (θi ) .
2. Puisque πi,n+1
B
est sans biais, une mauvaise estimation du facteur de crédibilité n’a
pas d’impact négatif sur le montant des primes perçu par l’assureur.
3. À cause de l’indépendance des contrats, les données collatérales, les données des
 
autres contrats, n’entrent pour le moment pas dans l’estimation de µ (θi ) ou cijt = 0 pour j , i .
4. Une approximation linéaire homogène de µ (Θi ) est de la forme
k X
X t
cir j .
r=1 j=1

Il est facile de démontrer que l’approximation est alors


k
1X
zXi + (1 − z) X, où S = Xi.
k i=1
6. La prime de crédibilité peut aussi s’écrire sous la forme
 
πi,n+1
B
= m + z Xi − m .

Il est intéressant de constater que la meilleure approximation linéaire de la prime de


risque est également la meilleure approximation linéaire de la prime bayésienne.
Ce résultat s’interprète comme une minimisation en deux étapes :
1. Trouver la meilleure approximation de la prime de risque (prime bayésienne).
2. Trouver la meilleure approximation linéaire de la prime bayésienne (prime de crédibilité).

Equilibre financier

• Tout système de tarification à posteriori doit jouir de la propriété d’équilibre financier.


Son introduction ne peut avoir aucun impact sur l’encaissement total de la compagnie.
• Ceci se justifie par le fait qu’un mécanisme de tarification à posteriori n’entraı̂ne pas
de modification de la sinistralité (le cas de l’aléa moral excepté).
• Dans le cas du modèle de Bühlmann, ceci se traduit par
h i h i
E πi,n+1
B
= zE X i + (1 − z) m = m.
59

Approche paramétrique

Dans un premier temps, on peut considérer que les distributions de θi et Xi j | θi sont


connues, comme en crédibilité bayésienne.
La notion de portefeuille n’est alors pas nécessaire puisque l’on détermine les distribu-
tions pour chaque contrat. On peut laisser tomber l’indice i dans les formules.
Il est maintenant très simple de calculer la prime de crédibilité de Bühlmann pour n’im-
porte quelle combinaison de distributions.

Example 2.35 (Bernoulli/uniforme)

Xj | θ ∼ Bernoulli (θ)

θ ∼ U (a, b) ,

alors la prime bayésienne est très compliquée. Ici, µ (θ) = θ et σ2 (θ) = θ (1 − θ) ,


d’où

m = E µ (θ)
 

a+b
= E [θ] =
h i2
s = E σ (θ)
2 2

h i
= E [θ] − E θ2
a + b a2 + ab + b2
= +
2 3
a = Var µ (θ)
 

(b − a)2
= Var [θ] = ,
12

donc

s2
K =
a  
6 (a + b) − 4 a2 + ab + b2
=
(b − a)2
60

et
n  n a+b
πi,t+1
B
= X+ 1− .
n+K n+K 2

Example 2.36 (Poisson/gamma)


On a

Sj | θ ∼ Poisson (θ)

θ ∼ Gamma (α, λ) .

On sait déjà que µ (θ) = σ2 (θ) = θ. Par conséquent,

α
m = E [θ] = ,
λ
α
s2 = E [θ] = ,
λ
α
a = Var [θ] = 2 ,
λ

d’où
s2
K= = λ,
a
et
n λ α
πi,t+1
B
= S+ .
n+λ n+λλ

Approche non paramétrique

En pratique, l’approche paramétrique est d’un intérêt limité puisqu’elle nécessite tou-
jours de déterminer les distributions de Xi j | θi et θi .
Avec l’approche non paramétrique, nous délaissons l’approche bayésienne pure pour
l’approche bayésienne empirique.
• Nous avons plusieurs réalisations de la variable aléatoire θ.
• U (θ) est la fonction de structure du portefeuille :
– avant : opinion à priori de l’assureur sur le niveau de risque d’un contrat ;
– maintenant : proportion de contrats avec un niveau de risque inférieur ou égal à θ,
distribution des niveaux de risque entre les contrats.
61

• Homogénéité du portefeuille : à quel point les moyennes des contrats sont semblables.
• Nous devons estimer les paramètres de structure du portefeuille :
1. m = E µ (θ) , moyenne du portefeuille ;
 
h i
2. s2 = E σ2 (θ) , variabilité moyenne du portefeuille, homogénéité temporelle.
3. a = Var µ (θ) , variance entre les moyennes des contrats, homogénéité du porte-
 

feuille.
• Nous développons des estimateurs sans biais des paramètres.
Estimation des paramètres du modèle de Bühlmann
Estimation de m
Intuitivement,
k t
1 XX
b=S =
m Xi j .
kt i=1 t=1
L’estimateur est effectivement sans biais :
k t
1 XX h i
b =
 
E m E Xi j
kt i=1 t=1
k t
1 XX
= m
kt i=1 t=1
= m.

Estimation de s2
Un estimateur sans biais de la variance du contrat i = 1, ...., n, est
t
1 X 2
Xi j − X i , t ≥ 2.
t − 1 j=1

Pour obtenir un estimateur sans biais de s2 , on prend la moyenne de tous ces estima-
teurs :
k t
1 XX  2
s =
b2
Xi j − X i .
k (t − 1) i=1 t=1
62

Pour démontrer l’absence de biais, on note d’abord que


 2  h i
E Xi j − X i | θi = Var Xi j − X i | θi
h i h i  
= Var Xi j | θi + Var X i | θi − 2Cov Xi j , X i | θi
σ2 (θi ) σ2 (θi )
= σ2 (θi ) + −2
t t
t−1 2
= σ (θi ) .
t
Par conséquent,
 2    2 
E Xi j − X i | θi = E E Xi j − X i | θi
t−1 h 2 i
= E σ (θi )
t
t−1 2
= s,
t
et
k t
h i 1 XX t − 1 2
s2 =
E b s.
k (t − 1) i=1 j=1 t
Estimation de a
Un estimateur intuitif de a = Var µ (θ) est
 

k
1 X 2
Xi − X .
k − 1 i=1

Or, cet estimateur est biaisé. En effet,


on a
 2  h i
E Xi − X = Var X i − X
h i h i  
= Var X i + Var X − 2Cov X i , X .

Par indépendance entre les contrats,


on a
k
  1X  
Cov X i , X = Cov X i , X j
k i=1
1 h i
= Var X i
k
63

et h i
h i Var X i
Var X = ,
k
d’où
 2  1−k h i
E Xi − X = Var X i .
k
et
k 
 
 1 X 2  h i
E  X i − X  = Var X i .
k − 1 i=1
Or,
h i h h ii h h ii
Var X i = Var E X i /θi + E Var X i /θi
σ (θi )
" 2 #
= Var µ (θi ) + E
 
t
s2
= a+ .
t
Un estimateur sans biais de a est donc
k
1 X 2 1
a=
b Xi − X − b s2 .
k − 1 i=1 t

a, 0 , qui est
a0 = max b

Problème l’estimateur b
a peut être négatif. En pratique, on posera b
un estimateur biaisé.
πi,n+1
Estimation de la prime de crédibilité bB

On estime la prime de crédibilité en remplaçant chaque paramètre inconnu par son


estimateur :

πi,n+1
B
=b
zXi + 1 −b

b z mb

où
t
z= .
t +b
s2 /b
b
a
h i
b = K et
Bien que tous les estimateurs soient sans biais, on ne peut conclure que E K
z] = z. Par conséquent, l’estimateur de la prime de crédibilité est fort proba-
donc que E[b
blement biaisé.
64

Example 2.37 Les données de cet exemple sont retirées de l’ensemble de données qui a
été obtenu dans le chapitre de l’organisation nationale de sécurité sociale (employés) en
Algérie, compétente pour les employés dans le domaine de l’assurance sociale, des ac-
cidents du travail et des maladies professionnelles et des allocations familiales. Les six
contrats correspondent à six classes différentes de quotas (dépenses) couvertes par l’or-
ganisation de sécurité sociale (employés) de l’Algérie pour 14 ans d’expérience pour la
période 1995 à 2009.

Table 2.8 - Montants de sinistres moyens (ratios Xi j ).


Contrat Sick Accid Matern Funer Other Manag
j=1 1000 6200 2100 5600 2800 900
j=2 1400 8500 4200 7300 3400 1100
j=3 7100 16800 12500 12500 8500 4200
j=4 8300 17200 13400 13000 9200 5600
j=5 5400 14300 7000 10700 6700 2150
j=6 5800 14700 7500 10900 7000 2400
j=7 6600 15600 9400 11900 7500 3280
j=8 6900 16300 9900 12200 7900 3500
j=9 2700 13800 6300 8900 4500 1400
j = 10 5100 14000 6600 10500 6500 1850
j = 11 9500 19100 14700 13700 9850 6050
j = 12 10400 22300 16800 14300 11350 6250
j = 13 6000 14900 7800 11500 7175 2750
j = 14 6450 15200 8000 11700 7350 3100

Table 2.9 - Modèle de crédibilité de Bühlmann (1969)


Contrat Sick Accid Matern
S ·j 5903.571429 14921.42857 9014.285714
ẑ 0.834821794 0.834821794 0.834821794
 
µ̂ θ j 6003.785 14677.846 8995.907
Contrat Funer Other Manag
S ·j 11050 7123.214286 3180.714286
ẑ 0.834821794 0.834821794 0.834821794
 
µ̂ θ j 10954.012 7176.93 3384.734
µ̂ = 8532.202381, Ŝ 2 = 2995008.659, α̂ = 15136975.72
65

Chapitre 3

Estimation Bayésienne de la prime pour


le modèle Gamma Lindley sous
différentes fonctions de perte

Nous considérons la distribution Gamma Lindley (GaL) comme une distribution condi-
tionnelle de X | θ, γ, nous nous concentrons sur l’estimateurs bayésienne de la prime sous la
fonction de perte quadratique (symétrique) et sous la fonction de perte Linex (asymétrique),
en utilisant des lois à priori gamma sur les paramètres. En raison de sa difficulté et de sa
non-linéarité, nous utilisons une approximation numérique (l’approximation de Lindley)
pour calculer l’estimateur Bayésienne de la prime . Enfin, une étude de simulation et com-
parative avec différentes tailles d’échantillons est donnée.
La théorie de la crédibilité est l’une des techniques quantitatives importantes en sciences
actuarielles qui permet aux compagnies d’assurances d’effectuer une évaluation de l’expérience
(ajuster les primes futures en fonction de l’expérience passée). Nous traitons l’estimateur de
la prime bayésienne développé par Bailey (1950), en considérant la distribution de Gamma
Lindley comme une distribution de réclamation qui est un outil populaire dans la théorie de
la crédibilité. La distribution de Gamma Lindley a été publiée en 2016 par Nedjar et Zegh-
doudi. Cette distribution est basée sur des mélanges des distributions ordinaires Gamma
66

(2, θ) et Lindley (θ), qui est l’une des distributions qui modélisent les données d’analyse de
survie. La fonction de densité de probabilité (p.d.f) et la fonction de distribution cumulative
(c.d.f.) sont données comme suit :

θ2 ((γ+γθ−θ)x+1)e−θx


γ(1+θ)
, x ≥ 0, γ, θ ≥ 0,
fGal (x; θ, γ) = 

(3.1)



 0, sinon,

et

((γ + γθ − θ) (θx + 1) + θ) e−θx


FGal (x; θ, γ) = 1 − , x ≥ 0, γ, θ ≥ 0. (3.2)
γ (1 + θ)
Il existe de nombreux articles traitant les nouvelles distributions à savoir : Lindley (1958),
Sharma et Shanker (2013), Ghitany et al. (2008), Sankaran (1970), Ghitany et Al-Mutairi
(2009), Zeghdoudi et Nedjar (2015). Récemment, Krishna et Kumar (2011) où ils ont utilisé
l’approche bayésienne et la probabilité maximale d’un ensemble incomplet de données
utilisant diverses fonctions de perte. D’autre part, Sajid et al. (2013) et Metiri et al. (2016)
ont étudié l’effet de certaines fonctions de perte sur l’estimateur de Bayes et le risque
subséquent en utilisant des lois à priori conjuguées naturelles.
Enfin, nous évaluons les estimateurs bayésiens sous les fonctions de perte ci-dessus,
une simulation utilisant la méthode de Monte-Carlo avec un calcul d’erreur a été réalisée.

3.1 Inférences bayésiennes pour les paramètres

3.1.1 Estimation des paramètres par maximum de vraisemblance

Dans cette partie, nous considérons l’estimation du maximum de vraisemblance des pa-
ramètres. Supposons un échantillon aléatoire {x1:n , x2:n , ···, xn:n } d’observations indépendantes
et identiquement distribuées (IID) de taille n obtenu à partir de GaL(θ, γ). La vraisemblance
pour des données complètes est :
!
n Pn
θ2n Y  −θ xi
(θ, γ) =  (γ + γθ − θ) xi + 1 e i=1 , (3.3)
γ (θ + 1) i=1
n
67

La Log vraisemblance peut être exprimée comme suit :

log (x | θ, γ) = 2n log θ − n log γ − n log (θ + 1) (3.4)


Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi .
 
i=1 i=1

Par conséquent, les MLE des paramètres θ et γ sont la solution simultanée des équations
normales suivantes. Par conséquent, les MLE peuvent être obtenus par une procédure
itérative. Ici, nous suggérons d’utiliser la méthode de Newton Raphson (N-R).
n n
2n n X X xi
− − xi + (γ − 1)  = 0,
θ θ + 1 i=1 (γ + γθ − θ) xi + 1

i=1

n
−n X xi
+ (θ + 1)  = 0,
γ + γθ θ) +

i=1
(γ − xi 1
 
Dans certaines conditions de régularité, les θ̂, γ̂ sont approximativement bi variés avec
 
une moyenne θ̂, γ̂ et matrice de covariance
     h i0  
I −1 θ̂, γ̂ i.e. θ̂, γ̂ ∼ N2 θ̂, γ̂ , I −1 θ̂, γ̂ .
 
où I θ̂, γ̂ est la matrice d’information de Fisher observée et définie comme
 2 
   − ∂ ∂θlog2 L − ∂ ∂θ∂γ
2 log L

I θ̂, γ̂ =  2 ,
 
 − ∂ log L − ∂2 log L 
∂θ∂γ ∂γ2 (θ̂,γ̂)
 
Les éléments diagonaux de I −1 θ̂, γ̂ fournissent les variances asymptotiques pour les
paramètres θ et γ respectivement. L’intervalle de confiance d’approximation normale de θ
 q   n o
et γ peut être défini comme θ̂ ± Z 2 var θ̂ et γ̂ ± Z α2 var (γ̂) respectivement.
p
α

3.1.2 Estimateurs Bayésiens des paramètres

Dans cette partie, nous avons obtenu les estimateurs Bayésiens des paramètres θ et
γ. Dans l’analyse bayésienne, nous devons spécifier une distribution préalable pour les
paramètres, nous considérons que deux distributions à priori gamma indépendants tels que,
68

Gamma(a, b) comme loi à priori sur θ et Gamma(c, d) comme loi à priori sur γ où a, b, c et
d sont des hyperparamètres non négatifs. La motivation de considérer Gamma comme des
dsitributions à priori est due à leur flexibilité calculatoire.

ba a−1 −bθ
g (θ) = θ e ; θ, a, b > 0
Γ (a)
dc c−1 −dγ
g (γ) = γ e ; γ, c, d > 0
Γ (c)
La distribution à priori conjointe pour θ et γ est donnée comme suit :

π (θ, γ) ∝ θa−1 γc−1 e(−bθ−dγ) ; a, b, c, d > 0. (3.5)

La distribution à postériori commune est donnée sous la forme


" !#
Pn
− dγ+θ x i +b
p (θ, γ | X) = R θ γ
−1 2n+a−1 c−n−1
e i=1 P (θ, γ) dθdγ, (3.6)
¯

où R et P (θ, γ) sont interprétés comme


" !#
Z Z Pn
− dγ+θ x i +b
R= θ γ
n+a−1 c−n−1
e i=1 P (θ, γ) dθdγ,
θ γ

n 
(γ + γθ − θ) xi + 1
Q 
i=1
P (θ, γ) = .
(θ + 1)n

Méthode d’approximation Lindley pour les estimateurs de Bayes :

On peut noter ici que la répartition à posteriori de p (θ, γ | X) prend une forme de ra-
¯
tio qui implique une intégration dans le dénominateur et ne peut être réduite à une forme
simple. Par conséquent, l’évaluation des espérances à poeteriori pour obtenir l’estimateur
de Bayes de θ et γ sera fastidieuse. Il existe différentes méthodes pour approximer le ra-
tio des intégrales de la forme ci-dessus, on peut citer les méthodes MCMC et notamment
l’algorythme de Metropolis-Hasting, L’approximation de Tierney-Kedane et l’approxima-
tion de Lindley (1980). Dans ce travail, nous proposons l’utilisation de l’approximation de
Lindley pour obtenir l’estimateur bayésien de θ et de γ. De nombreux auteurs ont utilisé
69

cette approximation pour obtenir les estimateurs de Bayes pour certaines distributions de
survie. Voir parmi d’autres, Howlader et Hossain (2002) et Jaheen (2005).
Considérons les intégrales de la forme (3.7) . Elles s’expriment sous forme de ratio
d’intégrales et correspondent aux estimateurs Bayésiens de u (θ, γ) sous une fonction de
perte quadratique :

u (γ, θ) eL(γ,θ)+G(γ,θ) d (γ, θ)


R
I (x) = E (u (θ, γ) | X) = , (3.7)
eL(γ,θ)+G(γ,θ) d (γ, θ)
R
¯

où
u (θ, γ) = est une fonction de θ et γ seulement
L (θ, γ) =Log- vraisemblance
G (θ, γ) =Log-densité commune
Selon D. V. Lindley (1958), si les estimations ML des paramètres sont disponibles et
n est suffisamment grand, alors le ratio ci-dessus de l’intégrale peut être approché comme
suit :
  1 h   
I (x) = u θ̂, γ̂ + ûγγ + 2ûγ p̂γ σ̂γγ + ûθγ + 2ûθ p̂γ σ̂θγ (3.8)
2
   i
+ ûγθ + 2ûγ b pθ σ̂γθ + ûθθ + 2ûθ bpθ σ̂θθ
1 h  
+ ûγ σ̂γγ + ûθ σ̂γθ L̂γγγ σ̂γγ + L̂γθγ σ̂γθ + L̂θγγ σ̂θγ + L̂θθγ σ̂θθ
2
  i
+ ûγ σ̂θγ + ûθ b
σθθ L̂θγγ σ̂θθ + L̂γθθ σ̂θγ + L̂θγθ σ̂θγ + L̂θθθ σ̂θθ ,

Où θ̂ et γ̂ sont le MLE de θ et γ respectivement.


∂u(θ̂,γ̂) ∂u(θ̂,γ̂) ∂u(θ̂,γ̂)
ûθ = ∂θ̂
, ûγ = ∂γ̂
, ûθγ = ∂θ̂∂γ̂
,
∂u(θ̂,γ̂) ∂2 u(θ̂,γ̂) ∂2 u(θ̂,γ̂)
ûγθ = ∂γ̂∂θ̂
, ûθθ = ∂θ̂2
, ûγγ = ∂γ̂2
,
∂G(θ̂,γ̂) ∂G(θ̂,γ̂) ∂ L(θ̂,γ̂)
2
p̂θ = ∂θ̂
, p̂γ = ∂γ̂
, L̂θθ = ∂θ̂2
,
∂2 L (θ̂,γ̂) ∂ L(θ̂,γ̂)
3 ∂3 L (θ̂,γ̂)
L̂γγ = ∂γ̂2
, L̂θθθ = ∂θ̂3
, L̂θθγ = ∂θ̂∂θ̂∂γ̂
,
∂3 L(θ̂,γ̂) ∂3 L(θ̂,γ̂) ∂3 L(θ̂,γ̂)
L̂γγθ = ∂γ̂∂γ̂∂θ̂
, L̂γθγ = ∂γ̂∂θ̂∂γ̂
, L̂θγγ = ∂θ̂∂γ̂∂γ̂
,
∂3 L(θ̂,γ̂)
L̂γθθ = ∂γ̂∂θ̂∂θ̂
.
70

Après la substitution de p (θ, γ | X) de (3.6) dans l’expression de I (x), cette intégrale


¯
doit être réduite comme l’intégrale de Lindley, où :

u (θ, γ) = γ,

L (θ, γ) = 2n log θ − n log γ − n log (θ + 1)


Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi ,
 
i=1 i=1

G (θ, γ) = (a − 1) log θ + (c − 1) log γ − (bθ + dγ) .

On a

uγ = 1, uγγ = uγθ = uθθ = uθγ = 0,


pθ = (a−1)
θ
− b, pγ = (c−1)
− d,
γ
n Pn n
Lθ = 2n n
+ xi (γ−1)
− xi , Lθγ = Lγθ = xi (1+xi )
2,
P P
θ
− (θ+1) [ (γ+γθ−θ)xi +1]
i=1 i=1 i=1 [(γ+γθ−θ)x i +1]
n 2 n
Lθθ = θ2 + (θ+1)2 − [ xi (γ−1)]
2, Lγ = + ,
−2n n P −n P (1+θ)xi
γ (γ+γθ−θ)xi +1]
i=1 [(γ+γθ−θ)xi +1] i=1 [
n 2[ xi (γ−1)]
3 n
[(1+θ)xi ]2
Lθθθ = 4n 2n
+ 3, Lγγ = γn2 − 2,
P P
θ 3 − 3
i=1 [(γ+γθ−θ)xi +1] i=1 [(γ+γθ−θ)xi +1]
(θ+1)
n 2x2 (1−γ)(1+x ) n
2[(1+θ)xi ]3
Lθθγ = Lγθθ = i
, Lγγγ = −2n + 3,
P i
P
+1 ]3 γ 3
i=1 [(γ+γθ−θ)x i i=1 [(γ+γθ−θ)xi +1]
n 2x2 (1+θ)(1+x )
Lθγγ = Lγγθ = − [ i i ]
3,
P
i=1 [(γ+γθ−θ)xi +1]

De nouveau, Parce que θ et γ sont indépendants X | γ, θ, σγθ = 0 θ , γ pour σγγ = − L1γγ ;


σθθ = − L1θθ .
Après évaluation de tous les u-termes, L-termes, et p-termes au point (θ̂, γ̂) et en utili-
sant l’expression ci-dessus, l’estimateur de Bayes approximatif de θ sous SELF est,
h  i
θ̂B = θ̂ + ûγ p̂γ σ̂γγ + 0.5 ûγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ . (3.9)

Ainsi, l’estimateur de Bayes de γ sous SELF est :


uγ = 1, uγγ = uγθ = uθθ = uθγ = 0 et le reste L-termes et p-termes sera comme ci-dessus,
donc nous avons
1 h  i
γ̂B = γ̂ + ûγ p̂γ σ̂γγ + ûγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ . (3.10)
2
71

3.2 Estimation bayésienne de la prime


Pour obtenir des estimateurs bayésiens, nous supposons que θ et γ sont des variables
aléatoires à valeurs réelles avec une fonction de densité de probabilité π (θ, γ). Rappelons
que la distribution conditionnelle de X | γ, θ est la distribution Gamma-Lindley et les distri-
butions de θ et γ sont supposées être connues dans cette partie. p (θ, γ | X) est la distribution
¯
à postériori de θ et γ compte tenu des données.
Dans cette partie, nous considérons l’estimateur bayésienne de la prime P•B en utilisant
les fonctions de perte et les loi à priori définies ci-dessous.

3.2.1 Estimateurs bayésiens de la prime sous la fonction de perte qua-


dratique

La fonction de perte ”squared error” et proposée par Legendree (1805) et Bühlmann


Straub (1996) pour développer la théorie des moindres carrés. Elle est donnée par
 2
L(β̂, β) = β̂ − β . (3.11)

Cette fonction de perte est de nature symétrique c’est-à-dire qu’elle donne une pondération
égale à la fois sur et sous estimation. Dans la littérature actuarielle, nous écrivons
 2
B
L(PSELF , µ (θ, γ)) = PSELF
B
− µ (θ, γ) , (3.12)

B
Où PSELF est l’estimateur de µ (θ, γ), elle doit être choisie de telle sorte que l’espérance
à postériori de la fonction de perte ”squared error”
h i Z ∞Z ∞
E L(PSELF , µ (θ, γ)) =
B B
L(PSELF , µ (θ, γ))p (θ, γ | X) dθdγ, (3.13)
0 0 ¯
Z ∞Z ∞ 2
= B
PSELF − µ (θ, γ) p (θ, γ | X) dθdγ,
0 0 ¯

est minimum
Z ∞ Z ∞
B
= E µ (θ, γ) | X = µ (γ, θ) p (γ, θ | X) dθdγ,
 
PSELF (3.14)
¯ 0 0 ¯
72

Distribution à posteriori en utilisant la loi Gamma à priori

Les lois informatives à priori sont celles qui insèrent délibérément des informations que
les actuaires ont à portée de main. Cela semble être une approche raisonnable puisque les
connaissances scientifiques à priori devraient jouer un rôle dans la statistique inférentielle.
Un préalable informatif fournit plus d’informations que les lois a prioris non informatives.
Cette loi est définie sur <+ . Elle est donnée par

π (θ, γ) ∝ θa−1 γc−1 e(−bθ−dγ) ; a, b, c, d > 0, (3.15)

où, a, b, c et d sont les hyper-paramètres.


L’espérance de distribution Gamma-Lindleyet définie par

2γ (1 + θ) − θ
u (θ, γ) = E X | θ, γ = µ (θ, γ) = ,
 
(3.16)
θγ (θ + 1)
où µ (θ, γ) est la prime individuelle.
Selon la fonction de perte d’erreur quadratique, l’estimateur bayésien de la prime µ (θ, γ)
est obtenu en substituant la distribution postérieure (3.16) dans (3.14), comme suit :
Z ∞Z ∞
PSELF = E µ (θ, γ) | X =
B
µ (θ, γ) p (θ, γ | X) dθdγ
 
(3.17)
¯ 0 0 ¯
n " !# 
Pn

(2γ(1+θ)−θ) [(γ+γθ−θ)xi +1] 
Q
θ2n+a−2 γc−n−2 e − dγ+θ x i +b 
i=1  i=1
n+1
(θ+1)  
= n " !#  ,
Pn

[(γ+γθ−θ)xi +1] 
Q
RR θn+a−1 γc−n−1 e− dγ+θ x i +b 
i=1  i=1

 dθdγ
(θ+1)n  
θ γ

Suivant la procédure décrite ci-dessus, nous avons

G (θ, γ) = (a − 1) log θ + (c − 1) log β − (bθ + dβ) , (3.18)

et

L (θ, γ) = 2n log θ − n log γ − n log (θ + 1) (3.19)


Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi .
 
i=1 i=1
73

On peut facilement vérifier que


−(2γθ2 +4γθ−θ2 +2γ) 2(2γθ3 +6γθ2 +6γθ−θ3 +2γ) −θ2
ûθ = 2 , ûθθ = 3 , ûθγ = ,
γ( θ+θ2) γ( θ+θ2) (γ(θ+θ2 ))2
ûγ = 1
γ2 (1+θ)
, ûγγ = −2
γ3 (1+θ)
, ûγθ = −1
(γ(1+θ))2
,

Qui sont remplacés dans l’équation suivante

  
B
=E µ (θ, γ) | X =û θ̂, γ̂

PSELF (3.20)
¯
1 h  i
+ ûγγ + 2ûγ p̂γ σ̂γγ + (ûθθ + 2ûθ p̂θ ) σ̂θθ
2
1 h    i
+ ûγ ûγγ L̂γγγ p̂γγ + L̂θθγ σ̂θθ + (ûθ σ̂θθ ) L̂θγγ σ̂θθ + L̂θθθ σ̂θθ .
2

3.2.2 Estimateurs bayésiens de la prime sous la fonction de perte LI-


NEX

La fonction de perte LINEX (linéaire-exponentielle) (le nom LINEX est justifié par le
fait que cette fonction de perte asymétrique augmente approximativement linéairement sur
un côté de zéro et approximativement exponentiellement sur l’autre côté) qui est asymétrique.
Elle a été introduite par Varian (1975). Rojo (1987), Basu et Ebrahimi (1991), Pandy
(1997), Soliman (2000), Nassar et Eissa (2004) ont utilisés celle-ci pour le calcul de l’esti-
mateur bayésien.
Elle peut être exprimée comme suit :
    
L(β̂, β) = exp α β̂ − β − α β̂ − β − 1, α , 0. (3.21)

Le signe et la grandeur du paramètre de forme α reflètent respectivement la direction et


le degré d’asymétrie. (Si α > 0), la surestimation est plus grave que la sous-estimation, et
vice-versa). Pour α proche de zéro, la perte LINEX est une perte d’erreur approximative-
ment carrée et donc presque symétrique. L’attente postérieure de l’équation de la fonction
de perte LINEX est :
h i  
E L(β̂, β) ∝ exp(αβ̂)E exp(−αβ) − α β̂ − E(β) − 1.
 
(3.22)
74

Selon le résultat de Zellner (1986), l’estimateur de β sous la fonction de perte LINEX


est β̂ qui minimise l’équation ci-dessus, il est donné par :

1 h h ii
β̂ = − log E e−αβ . (3.23)
α
B
Dans notre étude, l’objectif est de trouver l’estimateur bayésien de la prime PLIN qui est
la valeur qui minimise l’équation (3.22), elle est donnée par :

1 h h ii
B
PLIN = − log E e−αµ(θ,γ) . (3.24)
α
h i
Lorsque l’espérance E e−αµ(θ,γ) existe et finie (voir Calabria et Pulcini (1969)).
Thomson et Basu (1996) ont identifié une famille de fonctions de perte L(∆) où ∆ est
l’erreur d’estimation (β̂, β), telle que
— L(0) = 0.
— L(∆) > (<)L(−∆) > 0 pour tout ∆ > 0.
— L(·) est deux fois différentiable avec L0 (0) = 0 et L (∆) > 0 pour tout ∆ , 0.
00

— 0 < L (∆) > (<) − L (−∆) > 0 pour tout ∆ > 0.


0 0

L’estimateur bayésien de la prime correspondant sous la fonction de perte LINEX est :

1
B
= − log E h (θ, γ) | X ,
 
PLIN (3.25)
α ¯

où
h (θ, γ) = e−αµ(θ,γ) . (3.26)

Selon la fonction de perte de LINEX, l’estimateur bayésien de la prime µ (θ, γ) est


obtenu en substituant la distribution postérieure (3.16) dans (3.25), comme suit :
h i Z ∞
E e −αµ(θ,γ)
|X = e−αµ(θ,γ) p (θ, γ | X) dθdγ (3.27)
¯ 0 ¯
n " !# 
Pn

[(γ+γθ−θ)xi +1] 
Q
θ2n+a−1 γc−n−1 e− αµ(θ,γ)+dγ+θ x i +b 
i=1  i=1
n
(θ+1)
 
= n " !#  ,
Pn

[(γ+γθ−θ)xi +1] 
Q
RR θn+a−1 γc−n−1 e− dγ+θ x i +b 
i=1  i=1

 dθdγ
(θ+1)n  
θ γ
75

L (θ, γ) et G (θ, γ) sont les mêmes que ceux indiqués dans (3.19) et (3.18). En suivant les
mêmes étapes expliquées ci-dessus, on obtient :
h i h  i
ĥθ = −α uθ e(−αu(θ,γ)) , ĥθθ = −α uθθ − αu2θ e(−αu(θ,γ)) ,
h  i  
ĥθγ = −α uθγ − αuθ uγ e(−αu(θ,γ)) , ĥγ = −α uγ e(−αu(θ,γ)) ,
h  i h  i
ĥγγ = −α uγγ − αu2γ e(−αu(θ,γ)) , ĥγθ = −α uγθ − αuθ uγ e(−αu(θ,γ)) .

Qui sont remplacés dans l’équation suivante

1 1
=− log E e−αu(θ,γ) |X = − log e−αu(θ̂,γ̂)
h i h
B
PLIN (3.28)
α ¯ α
1 h    i
+ ĥγγ + 2ĥγ p̂γ bσγγ + ĥθθ + 2ĥθ p̂θ σ̂θθ
2
1 h     i#
+ ĥγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ + ĥθ σ̂θθ L̂θγγ σ̂θθ + L̂θθθ σ̂θθ .
2

Remarque 3.1 Le processus de formulation de la connaissance et des croyances d’une


personne concernant une ou plusieurs quantités incertaines dans une distribution de pro-
babilité (conjointe) pour ces quantités est révéle par Garthwaite et al. (2004). Dans le
contexte de l’analyse statistique bayésienne, il se présente le plus souvent comme une
méthode pour spécifier la distribution à priori pour un ou plusieurs paramètres inconnus
d’un modèle statistique. C’est une tâche difficile parce que nous devons d’abord identifier
la distribution préalable et ensuite ses hyperparamètres.
Dans cette thèse, nous nous concentrons sur la méthode proposée par Ahn, Park et
HM (2007) pour déterminer les hyperparamètres a, b, c et d du notre distribution à priori
gamma. Cette technique est basée sur la méthode bootstrap, nous adoptons les mêmes
étapes expliquées dans Sajid Ali, Muhammad Aslam, Sayed Mohsin Ali Kazmi (2013).

3.3 Étude par simulations


Dans cette section, une étude de simulation de Monte-Carlo est effectuée pour comparer
les méthodes d’estimation en utilisant les erreurs quadratique moyennes (MSE) comme
76

suit : 2
PN 
  i=1 P̂•B − µ (θ, γ)
MS E P̂•B = . (3.29)
N
Lorsque N est le nombre de réplications. Nous avons généré 100000 échantillons de
tailles n = 20, 40, 60 , 80, 100 et 1000 pour représenter les petites, moyennes et importantes
quantités d’observations de Gamma Lindley avec trois valeurs de θ (θ = 0.35423; 1; 9) avec
(γ = 1.5; 3; 4.5).
Afin de comparer les estimateurs bayésiens de la prime obtenus dans la partie ci-dessus
sous deux fonctions de perte différentes, nous choisissons les valeurs des hyperparamètres
a, b, c et d comme suit (a, b, c, d) = (1.2; 0.001; 1; 0.3), avec deux valeurs pour le paramétre
de LINEX (α = 0.1; −0.5).
— résultats du modèle basés sur la distribution de Gamma Lindley sont résumés dans
les tableaux suivants :

Table 3.1-Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de


perte d’erreur quadratique moyenne (γ = 1.5, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.153765 1.666667 0.1555556
n G.P
20 4.997307 1.614993 0.1673283
(3.046348e − 05) (9.471975e − 05) (3.786201e − 05)
40 5.071424 1.634784 0.1566296
(9.809331e − 07) (3.478296e − 06) (9.092648e − 06)
60 5.098026 1.644231 0.154794
(9.310077e − 08) (4.34702e − 07) (1.871041e − 06)
80 5.111654 1.649422 0.1544417
(1.025272e − 08) (8.359941e − 08) (5.764072e − 07)
100 5.119931 1.652677 0.154415
(4.487431e − 10) (1.858109e − 08) (2.314594e − 07)
1000 5.150331 1.665202 0.1553615
(3.434116e − 10) (3.366071e − 10) (4.987695e − 11)
77

Table 3.2- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 1.5, a = 1, b = 0.004, c = 1, d = 0.004, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.153765 1.666667 0.1555556
n G.P
20 4.96047 1.61492 0.1672811
(0.03736283) (0.002677836) (0.000137493)
40 5.052458 1.634389 0.1566093
(0.01026308) (0.00104184) (1.110451e − 06)
60 5.085255 1.643829 0.1547803
(0.004693506) (0.0005215545) (6.009828e − 07)
80 5.102028 1.649062 0.1544313
(0.002676713) (0.0003099141) (1.264012e − 06)
100 5.112207 1.65236 0.154334
(0.001727036) (0.0002046931) (1.492224e − 06)
1000 5.14955 1.665159 0.1553606
(1.77649e − 05) (2.274194e − 06) (3.800078e − 08)

Table 3.3- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 1.5, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.153765 1.666667 0.1555556
n G.P
20 5.171916 1.635624 0.1675587
(0.0003295484) (0.0009637486) (0.0001440801)
40 5.163393 1.64558 0.1567301
(9.271661e − 05) (0.0004446442) (1.379591e − 06)
60 5.160425 1.65154 0.1548624
(4.435941e − 05) (0.0002288093) (4.804549e − 07)
80 5.158868 1.654946 0.1544938
(2.604214e − 05) (0.0001373635) (1.127355e − 06)
100 5.157903 1.657117 0.1544571
(1.713005e − 05) (9.119846e − 05) (1.206676e − 06)
1000 5.154202 1.665653 0.1553659
(1.910046e − 07) (1.027085e − 06) (3.597277e − 08)
78

Table 3.4- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de


perte d’erreur quadratique moyenne (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.399907 1.833333 0.1888889
n G.P
20 5.245517 1.771582 0.1832947
(3.464839e − 08) (3.570231e − 07) (3.937284e − 06)
40 5.320573 1.800505 0.1849694
(3.330606e − 07) (2.689541e − 07) (2.143201e − 07)
60 5.346562 1.81104 0.186032
(2.715271e − 07) (2.623254e − 07) (3.817615e − 08)
80 5.359731 1.816463 0.1866555
(1.937792e − 07) (1.975259e − 07) (1.096881e − 08)
100 5.367686 1.819766 0.1870587
(1.409512e − 07) (1.474322e − 07) (4.080755e − 09)
1000 5.396656 1.831952 0.1886903
(2.084134e − 09) (2.333283e − 09) (4.650837e − 13)

Table 3.5- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.399907 1.833333 0.1888889
n G.P
20 5.207548 1.766747 0.1832283
(0.03700179) (0.004433743) (3.204255e − 05)
40 5.301051 1.798005 0.1849343
(0.009772392) (0.001248088) (1.5639e − 05)
60 5.333425 1.809354 0.1860081
(0.004419831) (0.0005750293) (8.298662e − 06)
80 5.349831 1.815191 0.1866374
(0.002507607) (0.0003291275) (5.069357e − 06)
100 5.348782 1.818745 0.1870441
(0.002613799) (0.0002128115) (3.40307e − 06)
1000 5.394745 1.831848 0.1886888
(2.664489e − 05) (2.205679e − 06) (4.100289e − 08)
79

Table 3.6- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.399907 1.833333 0.1888889
n G.P
20 5.427538 1.79561 0.1886775
(0.0007634619) (0.001423049) (4.471239e − 08)
40 5.416159 1.812972 0.1878023
(0.0002641203) (0.0004145909) (1.180747e − 06)
60 5.411364 1.819455 0.1879242
(0.0001312618) (0.0001926006) (9.305554e − 07)
80 5.408745 1.822815 0.1880724
(7.811271e − 05) (0.0001106374) (6.667109e − 07)
100 5.407098 1.824867 0.1881903
(5.171711e − 05) (7.168128e − 05) (4.880571e − 07)
1000 5.400672 1.832469 0.1886978
(5.847544e − 07) (7.476398e − 07) (3.6525117e − 09)

Table 3.7- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de


perte d’erreur quadratique moyenne (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.481954 1.888889 0.2
n G.P
20 5.329274 1.827011 0.193616
(1.168254e − 06) (6.246464e − 07) (2.077482e − 06)
40 5.403857 1.856448 0.1959277
(9.673216e − 07) (9.089205e − 07) (1.070641e − 07)
60 5.429509 1.866937 0.1970839
(5.578413e − 07) (5.664754e − 07) (1.68216e − 08)
80 5.442479 1.872305 0.1977365
(3.52083e − 07) (3.689678e − 07) (4.085179e − 09)
100 5.450306 1.875564 0.1981523
(2.40468e − 07) (2.563527e − 07) (1.229509e − 09)
1000 5.478765 1.887536 0.1998017
(2.973305e − 09) (3.342981e − 09) (5.370309e − 12)
80

Table 3.8-Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.481954 1.888889 0.2
n G.P
20 5.290906 1.865187 0.1935402
(0.03649938) (0.0005617763) (4.172944e − 05)
40 5.384137 1.870985 0.1958878
(0.009568302) (0.000320561) (1.690997e − 05)
60 5.416239 1.874504 0.1970568
(0.004318502) (0.0002069132) (8.662202e − 06)
80 5.43248 1.879245 0.197716
(0.002447731) (9.300239e − 05) (5.216632e − 06)
100 5.442285 1.88404 0.1981358
(0.001573686) (2.351128e − 05) (3.475418e − 06)
1000 5.477955 1.887429 0.1998001
(1.59943e − 05) (2.132462e − 06) (3.997879e − 08)

Table 3.9- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction


de perte LINEX (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.481954 1.888889 0.2
n G.P
20 5.512915 1.852012 0.1939944
(0.0009585949) (0.001359935) (3.606741e − 05)
40 5.500253 1.869397 0.1961272
(0.0003348473) (0.0003799159) (1.499893e − 05)
60 5.494853 1.875674 0.1972194
(0.0001663833) (0.000174635) (7.731462e − 06)
80 5.491902 1.878897 0.1978392
(9.895527e − 05) (9.984395e − 05) (4.669201e − 06)
100 5.490047 1.880857 0.1982349
(6.548409e − 05) (6.451587e − 05) (3.115667e − 06)
1000 5.482814 1.888072 0.1998102
(7.38487e − 07) (6.671339e − 07) (3.602843e − 08)
81

3.4 Résultats et Discussion


La performance dépend de la forme de la distribution d’origine et de la fonction de perte
supposée. La plupart des auteurs ont utilisé une erreur quadratique comme fonction de perte
symétrique. Cependant, en pratique, la fonction perte réelle n’est souvent pas symétrique.
On peut noter pour la distribution de Gamma Lindley que lorsque θ augmente, l’estimateur
de la prime Bayésien µ(θ, γ) diminue. De même, il est observé que l’estimateur de la prime
Bayesian qui donne la plus faible erreur absolue moyenne sur tous les autres estimateurs
bayésiens dans la majorité des cas est l’estimateur bayésien de la prime sous la fonction
de perte Linex surtout lorsque le paramètre de perte est inférieur à zéro (0) c’est-à-dire
(α = −0, 5). Il est toujours suivi par l’efficacité par la perte d’erreur quadratique, comme
le montrent les tableaux 1 et 2. Dans le tableau 3, on peut montrer que l’estimateur de la
prime bayésien en fonction de la perte Linex est également plus efficace que l’estimateur de
Bayes sous la fonction de l’erreur quadratique uniquement dans le cas des valeurs élevées
de θ. Au fur et à mesure que la taille de l’échantillon augmente, on constate que toutes
les MSE moyennes d’estimateurs convergent vers µ (θ, γ). En outre, nous concluons que
la performance est approximativement égale à un risque postérieur plus petit. En outre, les
résultats de Gamma Lindley sous la fonction de l’erreur quadratique sont plus précis en
général par rapport à ceux de Linex (α = −0, 5). À partir de la discussion susmentionnée,
nous pouvons conclure que la procédure de Bayes discutée dans ce document peut être
recommandée pour leur utilisation.
Dans ce chapitre, nous avons traité le problème des estimateurs bayésiens pour la distri-
bution Gamma Lindley, dans le cadre des fonctions de perte asymétriques et symétriques,
le paramètre de risque pour un preneur d’assurance n’est jamais connu en réalité, nous
avons construit des estimateurs bayésiens supérieurs à la suite de techniques d’inférence
bayésiennes. En imposant une distribution préalable, nous sommes en mesure de décrire la
structure de risque pour l’ensemble de la classe de notation. En pratique, le choix de cette
distribution préalable est subjectif par rapport aux jugements personnels ou induit à partir
82

de données historiques des groupes correspondants. En utilisant la simulation numérique,


il semble que les primes bayésiennes soient cohérentes et vérifient la condition de conver-
gence à la prime individuelle. D’après les résultats, nous observons que, dans la plupart des
cas, les estimateurs bayésiens pour la distribution Gamma Lindley sont plus efficaces, car
ils convergent plus rapidement vers la prime individuelle généralement sous la fonction de
l’erreur quadratique qui ont été mentionnés dans les tableaux ci-dessus.
83

Chapitre 4

Méthode des Quantiles sous la théorie de


la crédibilité (Décomposition de
Quantile)

Ce chapitre se concentre sur la théorie de la crédibilité et les quantiles. Plus précisément,


nous montrons comment la décomposition de quantile simplifie le modèle de Pitselis (2013),
qui intègre les quantiles dans le modèle classique de Bühlmann (1969). Une nouvelle prime
de crédibilité est proposée et une application avec des données réelles est établie.

4.1 Interprétation du modèle


Dans la littérature de la science actuarielle, il y a quelques articles abordants les quan-
tiles. Le document de Pitt (2006) démontre l’importance de quantiles dans la réglementation
et d’autres dans les approches stochastiques à l’évaluation des passifs d’assurance et les
marges de risque. Kudryavtsev (2009) a utilisé la régression du quantile pour le taux
de décision, y compris les charges de sécurité et décrit les avantages de l’approche de
régression quantile. Gebizlioglu et Yagci (2008) ont construit des intervalles de confiance
pour les quantiles bidimensionnelles des distributions de risque à deux variables. Denuit
84

(2008) a fourni des approximations précises pour les quantiles de la valeur actuelle atten-
due conditionnelle des paiements à la rente prestataire, compte tenu de l’évolution future
de l’indice de temps. Pitselis (2009) a appliqué la régression des quantiles comme une tech-
nique pour examiner l’adéquation des fonds propres d’une entreprise qui a besoin de rester
en bonne santé et d’éviter l’insolvabilité.
Pitselis (2013) a intégré les quantiles au modèle de la crédibilité classique de Bühlmann
(1967) et dans le modèle de la crédibilité de régression de Hachemeister (1975).
Il est possible d’interpréter différemment certains modèles de crédibilité, notamment le
modèle de Pitselis (2013). Nous proposons une toute autre interprétation des p−quantiles
des montants des sinistres ξ p j , voir Dannenburg, Goovaerts et Kaas (1996). Plutôt que de
présenter le p−quantiles ξ p j de l’expérience X ji du contrat j pour la période i comme une
 
variable aléatoire issue d’une certaine fonction f ξ p | θ , ils décomposent le quantile du
montant de sinistre en une somme de variables aléatoires. En fait, l’idée générale de cette
décomposition s’inspire des (Variance Components models), modèles bien connus en sta-
0
tistique. A titre de référence, Searle, Casella et McCulloch ( 1992) donnent les principaux
concepts de ces modèles. Dans un premier temps, nous présentons certaines hypothèses qui,
appliquées à la théorie de la crédibilité, conduisent à une forme simplifiée du modèle de Pit-
selis (2013). Cette simplification est basée d’une part sur le fait que l’on suppose le même
nombre d’observations pour chaque contrat, et d’autre part sur l’hypothèse d’indépendance
des composantes des variables ξ p j . Notons cependant que ce modèle peut être appliqué à un
portefeuille dont l’expérience de chaque contrat a été observée sur un nombre de variable
de périodes.

4.2 Préliminaires sur les quantiles


Dans cette section, nous fournissons une brève introduction sur la fonction quantile et
estimateurs de quantile nécessaire pour les estimateurs de crédibilité.
Soit F(x) = P[X ≤ x] la fonction de distribution d’ensemble des variables aléatoires
85

X1 , . . . , Xn .
Un quantile est la valeur qui correspond à une proportion déterminée de l’échantillon
ou la population (Gilchrist (2000)). Mathématiquement, il est donné par

ξ p = F −1 (p) = in f {x : F(x) ≥ p}. (4.1)

Soit X(1) , . . . , X(n) les statistiques d’ordre de X1 , . . . , Xn et ξ p le quantile d’ordre p.

ξ p = F −1 (p) = in f {x : F(x) ≥ p}.si et seulement si F(ξ p ) = p, 0 ≤ p < 1.

La fonction de distribution empirique peut être définie comme Fn (x) = fraction de


X1 , . . . , Xn qui est ≤ x.
!
j  j−1
ξ̂ p = n − p X( j−1) + n p − X( j) ,
n n

Pour
j−1 j
< p ≤ et j = 1, ...., n
n n
Et sa dérivé

0
  j−1 j
ξ̂ p = n X( j) − X( j−1) , Pour < p ≤ et j = 1, ...., n. (4.2)
n n
 
Nous appelons n X( j) − X( j−1) , j = 1, ...., n la distance de l’échantillon.
Parzen (1979) et Jones (1992) défini la fonction de densité quantile comme la dérivée de
ξ̂ p . Estimateurs de quantiles qui peuvent mieux se comporter dans de petits échantillons de
densités symétriques peuvent être obtenus par une fonction linéaire par morceaux déplacée

2j + 1
! !
2j − 1
ξ̂ p = n − p X( j) + n p − X( j+1) ,
2n 2n

pour
2j − 1 2j + 1
<p≤ et j = 1, ...., n.
2n 2n
Le ξ̂ p est indéfini pour p < 1
2n
ou p > 1 − 2n
1
. Maintenant la dérivée de ξ̂ p est donnée par

0
  2j − 1 2j + 1
ξ̂ p = n X( j+1) − X( j) , Pour <p≤ et j = 1, ...., n (4.3)
2n 2n
86

Dans les modèles paramétriques, lorsque F est d’un emplacement type d’échelle connue
ξ p −θ ξ p −θ
F( x−θ
σ
), ensuite F(ξ p ) = F( σ
) = p, et donc, Z p = ( σ
) avec F(Z p ) = p et ξ p = σz p + θ.
Puis estimer θ et σ par l’estimation du maximum de vraisemblance ou par des combinaisons
linéaires optimales de statistiques d’ordre. Après, utilisez le test d’adéquation, pour tester
l’hypothèse nulle pour diverses spécifications de Z p correspondant à des distributions de
probabilité bien connus, y compris les distributions longue queue (Cauchy, Pareto, valeurs
extrêmes, etc.), ou d’utiliser un mélange de distributions (robuste modèle paramétrique).
Dans un contexte non-paramétrique, on estime Z p par la fonction du quantile densité où,
par parcelles appropriées des fonctions quantile exemples de transformations de données.
Pour plus de détails sur les fonctions quantile, voir Parzen (2004).

4.3 Modèles de crédibilité (quantile)


Dans cette section, nous présentons brièvement modèle de crédibilité de Pitselis, et
fournir une nouvelle contribution pour simplifier.

4.3.1 Le modèle de crédibilité de Pitselis (2013)

Le modèle de crédibilité de Pitselis (2013) peut être défini comme suit :


Hypothèses :
(i) Pour un paramètre de risque θ j donné, les variabIes X1 j , X2 j , ..., Xt j , sont condition-
nellement indépendantes et identiquement distribuées.
 
(ii) θ j est une variable aléatoire avec une distribution U θ j ,
  h i
(iii) Ξ p θ j = E ξ̂ p j | θ j
    ω (θ )
(iv) ν p θ j = var ξ̂ p j | θ j = pn j j .
Les paramètres de structure sont définis comme suit :
h  i h  i h  i
Ξ = E Ξ p θ j , s2ξ p = E ν p θ j , ψ p = var Ξ p θ j . (4.4)
87

Sous les hypothèses ci-dessus, la prime de crédibilité et


 
Ξcréd
pj = ξ̂ z
pj pj + 1 − z p j Ξp. (4.5)

où ξ̂ p j est l’estimateur de la composante ξ p j , Ξ p qui peut être interprété comme la prime
collective de risque à la p−quantile, et le facteur de crédibilité est :

ψp
Zp =  . (4.6)
ψ p + s2ξ p

Estimation des paramètres de structure

Il est possible d’estimer les paramètres de structure Ξ p , ψ p et S ξ2p à partir des obser-
vations du portefeuille, nous présentons maintenant certains estimateurs des paramètres
impliqués dans le calcul du coefficient de crédibilité z p j .
f
Soit un portefeuille d’assurance composé de k contrats et dont l’expérience ξ p j , du
contrat j au cours de différent p−quantile. Les variables aléatoires suivantes constituent
des estimateurs non-biaisés des paramètres Ξ p , ψ p et S ξ2p du modèle classique de Pitselis
(2013).
K
1X
Ξ̂ p = ξ̂ p· = ξ̂ p j ,
K j=1
 
K ω̂ θ
1 X p j
ŝ2ξ p = ,
K j=1 n j
 
K  K ω̂ θ
1 X 2 1 X p j
ψ̂ p = ξ̂ p j − ξ̂ p· − ,
K j=1 K j=1 n j
donc la prime de crédibilité peut être calculée comme suit :
 
Ξ̂créd
pj = ξ̂ p j ẑ p j + 1 − ẑ p j Ξ̂ p .

où
ψ̂ p
ẑ p = .
ψ̂ p + ŝ2ξ p
88

4.4 Discussion du nouveau modèle

4.4.1 Décomposition des p−quantiles

Nous proposons, dans un premier temps, un modèle de crédibilité de base. On considère


un portefeuille composé de k contrats dont I’expénence X ji a été observée pendant T
périodes.
De plus, on suppose que l’on détient le même nombre d’observations pour chaque
contrat. on suppose que le montants total des sinistres du jéme contrat est égal à la prime de
risque de ce contrat, à laquelle on ajoute une certaine fluctuation spécifique au p−quantile
 
de contrat j, soit ξ̂ p j − Ξ p θ j . La prime de risque est la moyenne de p−quantile globale Ξ p
 
des sinistres du portefeuille à laquelle vient également s’ajouter une variation Ξ p θ j − Ξ p
propre au contrat. Nous notons par γ j cette variation et par γ p j la variation caractéristique
au p−quantile. Ainsi : le p−quantile ξ̂ p j du contrat j est décomposée en une somme de
variables aléatoires de la forme
      
ξ̂ p j = Ξ p + Ξ p θ j − Ξ p + ξ̂ p j − Ξ p θ j

ξ̂ p j = Ξ p + γ j + γ p j et j = 1, ....., k, (4.7)

Ξ p représente la moyenne globale des ξ̂ p j de l’ensemble du portefeuille. Chaque contrat


est caractérisé par une composante γ j qui lui est propre. Pour un contrat donné, cette com-
posante représente la variation aléatoire des quantiles autour de la moyenne Ξ p . Elle peut
donc s’interpréter comme une mesure du risque que représente le contrat j. Dans cette
optique, la distribution des composantes γ j décrit la structure de risque du portefeuille.
 
La prime de risque du contrat j, notée Ξ p θ j est la valeur espérée des sinistres du
contrat j sachant le risque que ce contrat représente. Selon notre décomposition la compo-
sante γ j reflète le niveau de risque du contrat j. Ainsi, la prime de risque est notée par :
h i
E ξ̂ p j | γ j = ζ = Ξ p + ζ. (4.8)

Les variables aléatoires γ p j symbolisent quant à elles la variation de ξ̂ p j du contrat j. En


 
fait, elles sont interprétées comme la fluctuation de ξ̂ p j autour de la prime de risque Ξ p θ j .
89

Hypothèses relatives à la décomposition de quantile de montants des sinistres

Les hypothèses suivantes concernent la décomposition que nous proposons :


h i  
(1) Les variables aléatoires γ j ( j = 1, ..., k) sont i.i.d, avec E γ j = 0 et var γ j = ψ p
h i  
(2) Les variables aléatoires γ jp ( j = 1, ..., k ) sont i.i.d, avec E γ jp = 0 et var γ jp =
S ξ2p
(3) Les variables aléatoires γ j ( j = 1, ..., k) et γ jp ( j = 1, ..., k ) sont indépendantes.
h i
(4) E ξ̂ p j | γ j = ζ = Ξ p + ζ.
  h i
(5) ν p γ j = var ξ̂ p j | γ j .
Les paramètres structurels définis comme suit :
h  i
Ξp = E Ξp θ j ,
h  i
S ξ2p = E ν p θ j ,
h  i
ψ p = var Ξ p θ j .

4.4.2 Discussion sur les hypothèses

Les deux premières hypothèses se retrouvent dans le modèle classique de Bühlmann


(1969). Pour la première hypothèse, on suppose l’indépendance des composantes γ j ( j = 1, ....., k) ,
ainsi qu’une distribution identique. Par conséquent, les différents contrats du portefeuille
sont indépendants et identiquement distribués. La composante γ j représente la variation de
 
la prime de risque autour de la moyenne globale, soit Ξ p θ j − Ξ p . Son espérance est donc
nulle et sa variance est égale à ψ p .
La deuxième hypothèse suppose les variables γ jp ( j = 1, ....., k ) indépendantes et iden-
tiquement distribuées. Pour un contrat j, on a donc les ξ̂ p j sont indépendants et identique-
ment distribués.
 
Puisque γ jp représente la variation des ξ̂ p j d’un contrat, soit ξ̂ p j − Ξ p θ j son espérance
est nulle. Quant à sa variance, elle est obtenue de la façon suivante :
h i h  i h i h  i   
var γ jp = var ξ̂ p j − Ξ p θ j = var ξ̂ p j + var Ξ p θ j − 2cov ξ̂ p j , Ξ p θ j .
90

On à
h i h  i  h i
var ξ̂ p j = var E ξ̂ p j | θ j + E var ξ̂ p j | θ j = ψ p + S ξ2p .

et
    h i h   i h    i
cov ξ̂ p j , Ξ p θ j = cov E ξ̂ p j | θ j , E Ξ p θ j | θ j + E cov ξ̂ p j , Ξ p θ j | θ j
h  i
= var Ξ p θ j + 0

= ψp

danc
h i
var γ jp = ψ p + S ξ2p + ψ p − 2ψ p = S ξ2p

L’hypothèse (4), quant à elle, donne l’expression de la prime de risque selon notre
notation.
La décomposition qui nous avons employé conduit à une simplification du modèle de
Pitselis (2013). Ceci est causé d’une part par le nombre de périodes d’observation identique
pour tous les contrats, mais aussi par l’indépendance entre γ j . On y suppose l’indépendance
des composantes γ j et γ jp pour j = 1, ....., k. Dans le modèle classique de Bühlmann (1969),
cette hypothèse est moins restrictive puisqu’on exige seulement une corrélation nulle des
composantes γ j et γ jp . En effet, selon le modèle classique de Bühlmann (1969), on a
      
cov γ j , γ jp = cov Ξ p θ j − Ξ p , ξ̂ p j − Ξ p θ j
      
= cov Ξ p θ j , ξ̂ p j − var Ξ p θ j

= ψ p − ψ p = 0,

L’espérance de ξ̂ p j , est obtenue en prenant l’espérance de chacune des composantes.


Puisque les composantes γ j ( j = 1, ....., k) et γ jp ( j = 1, ....., k ) sont indépendantes, la va-
riance de ξ̂ p j est simplement la somme des variances de ces deux composantes. Par conséquent
γ j et γ jp sont appelées ”Variance components Models”.
91

4.4.3 Calcul de la prime

Bien que les hypothèses de départ conduisent à une interprétation différente du modèle
de Pitselis (2013), il est possible de montrer qu’on va obtenir la même prime de crédibilité.
En effet, on effectue dans les lignes qui suivent le calcul de la prime selon les hypothèses
relatives aux composantes de ξ̂ p j en prenant l’espérance de chacune des composantes. Et il
en résulte une prime de crédibilité équivalente à celle obtenue dans Pitselis (2013).

Proposition 4.1 Dans un premier temps, on présente, par la proposition suivante, cer-
taines relations de covariance qui seront utiles notamment dans les preuves. Soient la va-
riable aléatoire ξ̂ p j telles que j = 1, ....., k
 
(i) cov ξ̂ p j , ξ̂ p0 j = ψ p + δ pp0 S ξ2p , (4.9)
  δ js  
(ii) cov ξ̂ p j , ξ̂ p. = ψ p + S ξ2p , (4.10)
k
  δ 0δ 
pp js

(iii) cov ξ̂ p. , ξ̂ p0 . = ψ p + S ξ2p , (4.11)
k
   
(iiii) cov ξ̂ p j , ξ̂ ps = δ js ψ p + S ξ2p . (4.12)

Preuve. Ces relations peuvent être démontrées à l’aide des hypothèses sous-jacentes
à la décomposition de ξ̂ p j . La covariance entre les deux ξ̂ p j d’un même contrat peut être
écrite de la façon suivante
   
(i) cov ξ̂ p j , ξ̂ p0 j = cov ξ̂ p j , ξ̂ p0 j
 
= cov Ξ p + γ j + γ p j , Ξ p0 + γ j + γ p0 j
    h i h i
= cov γ j , γ j + cov γ p j , γ p0 j = var γ j + δ pp0 var γ p j
h i h i  
= var γ j + var γ p j = ψ p + δ pp0 S ξ2p ,

K K
 
  1 X 1 X
(ii) cov ξ̂ p j , ξ̂ p. = cov Ξ p + γ j + γ p j , Ξ p + γs + γ ps 
 
K S =1 K S =1
K K
   
 1 X 1 X
= cov γ j , γ s  + cov γ p j , γ ps 
  
K S =1 K S =1
δ js h i δ js h i δ js  
= var γ j + var γ p j = ψ p + S ξ2p
K K K
92

De la même façon, on démontre la troisième relation :


 K K K K

   1 X 1 X 1 X 1 X 
(iii) cov ξ̂ p. , ξ̂ p0 . = cov Ξ p + γj + γ p j , Ξ p0 + γs + γ p0 s 
K j=1 K j=1 K S =1 K S =1
 K K
  K K

 1 X 1 X   1 X 1 X 
= cov  γ j, γ s  + cov  γp j, γ ps 
K j=1 K S =1 K j=1 K S =1
δ js h i δ js δ pp0 h i δ js  
= var γ j + var γ p j = ψ p + S ξ2p
K K K
δ pp0 δ js  
= ψ p + S ξ2p
K

       
(iiii) cov ξ̂ p j , ξ̂ ps = cov Ξ p + γ j + γ p j , Ξ p + γ s + γ ps = cov γ j , γ s + cov γ p j , γ ps
h i h i  
= δ js var γ j + δ js var γ p j = δ js ψ p + S ξ2p .

Thorme 4.2 Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses (B1),
(B2) et (B3) la meilleure approximation linéaire non homogène de la prime de risque Ξ p
est
 
Ξ̂créd
p j = ξ̂ p j ẑ p j + 1 − ẑ p j Ξ̂ p .

Preuve. La décomposition de ξ̂ p j que nous avons employée, par ses hypothèses, conduit
à une simplification du modèle classique de Pitseli (2013). Cependant, à l’aide de ces hy-
pothèses, on montre que la prime de crédibilité obtenue est la même que celle du modèle
Pitselis (2013).Tout comme dans le modèle de Bühlmann (1969), on cherche à obtenir une
approximation de la prime de risque par des combinaisons linéaires non-homogènes des
observations.Selon notre notation, la prime de risque Ξ p + γ j du contrat j est approximée
par une combinaison linéaire non-homogène de la forme :
K
X  
c0j + j
c ps Ξ p + γ s + γ ps . (4.13)
s=1
93

On cherche donc à obtenir les coefficients c0j∗ , c p1


j∗
, c p2
j∗
, ...., c pk
j∗
tels que l’erreur quadratique
entre la prime de risque du contrat j et son approximation est minimale. On doit minimiser

 K
2 
X  
E Ξ p + γ j − c0j − Ξ p + γ s + γ ps   .
j
 
c ps (4.14)
s=1

Par hypothèse, les contrats sont indépendants et identiquement distribués, ainsi que les ξ̂ p j
d’un même contrat. Ceci implique que le système que l’on doit résoudre est symétrique par
j
conséquent, les coefficients c ps , doivent être égaux dans la solution optimale pour s , j.
Dans ce cas, on a
K
X   c1j X
K
c1j X
K
j
c ps Ξ p + γ s + γ ps = Ξ p c1 +
j
γs + γ pr .
s=1
K s=1 K r=1
s,J r,J

Lorsque s = j les coefficients c pj j des différents p−quantiles sont égaux par symétrie. En
posant c2j = c pj j , on obtient pour s = j
 
c pj j Ξ p + γ j + γ p j = Ξ p c2j + c2j γ j + c2j γ p j .

Ainsi, l’expression linéaire suivante permet d’obtenir une approximation de la prime de


risque :  
 K K 
1X 1 X   
c0 + c1 Ξ p +
j j
γs + γ pr  + c2j Ξ p + γ j + γ p j .

(4.15)
 K s=1 K r=1 
s, j r, j
h i
Par la relation E x2 = var [x] + E [x]2 , le problème de minimisation entre la prime de
risque Ξ p + γ j et la prime linéaire est donc équivalent à la minimisation de
   
  K K  
1 X 1 X  
var Ξ p + γ j − c0 − c1 Ξ p +
j j
γs + γ pr  − c2 Ξ p + γ j + γ p j 
j
 
(4.16)
 
  K s=1 K r=1  
s, j r, j
   
  K K  
1 1
X X    
+ E Ξ p + γ j − c0 − c1 Ξ p +
2 j j
γs + γ pr  − c2 Ξ p + γ j + γ p j  .
j
 
  K s=1 K r=1  
s, j r, j

Dans un premier temps, on obtient la valeur optimale c0j∗ en minimisant le deuxième terme
de (4.16). Celui-ci est minimisé lorsque la quantité dont on calcule l’espérance est nulle. Se-
h i h i
lon les hypothèses formulées au début E γ j = 0 ( j = 1, ....., k) et E γ jp = 0 ( j = 1, ....., k ) .
94

On trouve donc l’expression suivante pour


 
c0j∗ = Ξ p 1 − c1j − c2j . (4.17)

On remarque qu’une telle expression implique que 1’approximation linéaire de la prime de


risque, telle que définie en (4.15), est sans biais. En effet,
   
  K K  
1 X 1 X  
E c0 + c1 Ξ p + γs + γ pr  + c2 Ξ p + γ j + γ p j 
 j j 
  j
  K K
s=1 r=1
 
s, j r, j
   
  X K K  
1 1 X  
= E Ξ p − c1 Ξ p − c2 Ξ p + c1 Ξ p + c1 
j j j j
γs + γ pr  + c2 Ξ p + c2 γ j + γ p j 
j j
  

  K K  
s=1 r=1
s, j r, j
   
  X K K  
1 1 X     h i
= E Ξ p + c1 
j
γs + γ pr  + c2 γ j + γ p j  = E Ξ p = Ξ p .
j
 
  K K r=1  
s=1
s, j r, j

Dans un deuxième temps, la minimisation du premier terme de (4.16) permet d’obtenir


les coefficients optimaux c1j∗ et c2j∗ . Pour ce faire, on ajoute et on retranche la quantité
j 
c1

K
Ξ p + γ j + γ j
p j à cette variance. Notons également que le coefficient c0 est omis puis-

qu’étant une constante, sa variance est nulle.La variance de (4.16) est donc réécrite ainsi :
h i
var c0j = 0,

donc
  
  j  K K 
 j c1   1 X 1 X
var Ξ p + γ j − c2 +  Ξ p + γ j + γ p j − c1 Ξ p +
j
γs + γ pr 
  
(4.18)
 k  K s=1 K r=1 
s, j r, j
  
  j    K K 
 j c1   1 X 1 X
= var Ξ p + γ j − c2 +  Ξ p + γ j + γ p j  + var c1 Ξ p + γs + γ pr 
   j  
k   K s=1 K r=1 
s, j r, j
  
  j  K K 
 j c1   j  1 X 1 X
− 2cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr  .
 
 k  K s=1 K r=1 
s, j r, j
95

On montre que la covariance est nulle


  
  j  K K
X 
 j c1   j  1 X 1
cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr 

 k  K s=1 K r=1 
s, j r, j
  
 j  j  K K 
c1   j c1  1 X 1 X 1 1 
= cov 1 − c2 +  γ j − c2 +  γ p j , c1 Ξ p + γs + γ pr − γ j − γ p j 

 j
   j 

 k k  K s=1 K r=1 K K 
s, j r, j
 
 j jX K   j j 
c c c c
= cov 1 − c2j + 1  γ j , 1 γ s  − cov 1 − c2j + 1  γ j , 1 γ j 
  
 
 
 
 
 
 k K s=1  k K
s, j
 
j jX K
 j c1j  c1j 
  
c c
 
−cov c2 +  γ p j , γ pr  + cov c2 +  γ p j , γ p j  .
 j
 1

 1 
 k K r=1  k K
r,J

car les composantes γ j et γ p j sont indépendantes par hypothèse. Puisqu’on suppose également
les contrats indépendants entre eux, on a donc
  
 j  j  K K 
c1   j c1  1 X 1 X 1 1
cov 1 − c2 +  γ j − c2 +  γ p j , c1 Ξ p + γs + γ pr − γ j − γ p j 
 j j  
 k k  K s=1 K r=1 K K 
s, j r, j
 j j  j j
c c   c  c  
= 1 − c2j + 1  1 δ jr var γ j − 1 − c2j + 1  1 var γ j
 
 

k K k K
c j  c j c j  c j
   
    
− c2j + 1  1 δ js var γ p j + c2j + 1  1 var γ p j ,

k K k K

pour j = s et j = r
  
  j  K K
X 
 j c1   j  1 X 1
cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr 

 k  K s=1 K r=1 
s, j r, j

c1j  c1j c1j  c1j


   
    
= 1 − c2 +  var γ j − 1 − c2 +  var γ j
 j  j
k K k K
 j c1j  c1j    j c1j  c1j
   
 
− c2 +  var γ p j + c2 +  var γ p j = 0.
 
k K k K

Le deuxième terme à droite de l’équation (4.18) est quant à lui minimisé lorsque le coeffi-
cient c1j est nul. Il ne reste donc qu’à trouver le coefficient c2j∗ qui minimise le premier terme
96

à droite de l’équation (4.18), soit


h  i
var Ξ p + γ j − c2j Ξ p + γ j + γ p j (4.19)
h i h  i   
= var Ξ p + γ j + var c2j Ξ p + γ j + γ p j − cov Ξ p + γ j , c2j Ξ p + γ j + γ p j
h i h i   
= var Ξ p + γ j + c2j var Ξ p + γ j + γ p j − 2c2j cov Ξ p + γ j , Ξ p + γ j + γ p j .

En posant nulle la dérivée partielle par rapport à c2j de (4.19) et en supposant l’indépendance
des composantes γ j ( j = 1, ....., k) et γ jp ( j = 1, ....., k ) on obtient l’expression pour c2j∗ :
 
cov Ξ p + γ j , Ξ p + γ j + γ p j
c2j∗ = h i
var Ξ p + γ j + γ p j
h i
var γ j
= h i h i
var γ j + var γ p j
On a donc
ψp
zp j = (4.20)
ψ p + S ξ2p

Le coefficient c2j∗ est donc équivalent au coefficient de crédibilité tel que défini dans le
modèle de Pitselis (2013). Selon la décomposition des montants de sinistres la prime de
risque du contrat j pour la (i)éme période est
 
Ξcréd
p j = ξ̂ p j z p j + 1 − z p j Ξ p ,

où
ψp
zp j = ,
ψ p + S ξ2p

ξ̂ p j = Ξ p + γ j + γ p j ,
h i
Ξp = E Ξp + γ j .

Elle est donc équivalente à la prime de crédibilité du modèle classique de Pitselis (2013).
97

4.5 La nouvelle prime de crédibilité


Nous voyons dans cette section la nouvelle prime de crédibilité. Cette prime basée sur la
variation de p−quantile pour chaque contrat j , c’est-à-dire qu’on peut vraiment calculer la
prime de crédibilité pour chaque contrat j, à l’aide de facteur de développement κi j sachant
que ẑ p j est indépendant. On prend le médiane comme un axe de départ pour calculer la
prime de crédibilité pour une certaine période d’expérience i comme c’est le cas dans le
modèle Pitselis (2013). Ensuite, pour une période i + 1 on calcule d’abord le facteur de
développement κi j qui représente la fréquence de développement de quantile p (médiane)
de contrat j de la période i jusqu’a i + 1 , on calcule aussi, la prime de crédibilité pour la
période i + 1 pour un p−quantile (médiane) ajouté au facteur de développement κi j .
Soit i = 1, ....., n et j = 1, ....., k ou 0 4 p, κi j 4 1.

 
Ξ̂2(créd)
pj = ξ̂ 1
pj ẑ p j + 1 − ẑ p j Ξ̂1p où κ1 j = 0,

 
f
  = ξ̂2
Ξ̂3(créd) p+κ

j
z p+κ2 j

j + 1 − ẑ p+κ 
j Ξ̂2 p+κ  ,
p+κ2 j j 2j 2j 2j

où
ξ̂2p j × p
κ2 j = − p,
ξ̂1p j

 
Ξ̂4(créd)
  = ξ̂3p+κ +κ3 j
 ẑ
j p+κ +κ3 j

j + 1 − ẑ p+κ +κ3 j j
 Ξ̂3 p+κ +κ3 j

p+κ2 j +κ3 j j 2j 2j 2j 2j

où  
ξ̂3  × p + κ2 j
p+κ2 j j  
κ3 j = − p + κ2 j ,
ξ̂2 
p+κ2 j j

Ξ̂5(créd)
  = ξ̂3p+κ +κ +κ  j ẑ p+κ +κ +κ  j
p+κ2 j +κ3 j +κ4 j j 2j 3j 4j 2j 3j 4j
 
+ 1 − ẑ p+κ +κ +κ  j Ξ̂3 p+κ +κ3 j +κ4 j

2j 3j 4j 2j
98

où  
ξ̂4  × p + κ2 j + κ3 j
p+κ2 j +κ3 j j  
κ4 j = − p + κ2 j + κ3 j ,
ξ̂3 
p+κ2 j +κ3 j j

En généralisant la prime de crédibilité, on obtient


 
 
Ξ̂i+1(créd)
! = ξ̂ i ! ẑ ! +1 − ẑ !   Ξ̂i !, (4.21)
j p+ κi j j p+ κi j j 
P P
p+ κi j j κi j p+ κ
P  P
p+
P
ij
i<2 i<2 i<2 i<2 i<2

où !
ξ̂i × p+ κ(i−1) j
P
!
κ(i−1) j j
 
i<2
P
p+  X 
κi j = −  p + κ(i−1) j  .
i<2
(4.22)
ξ̂i−1 P !
i<2
p+ κ(i−1) j j
i<2

4.5.1 Estimation des paramètres du modèle

Les variables aléatoires suivantes constituent des estimateurs non-biaisés des paramètres
Ξ p0 , ψ p0 et S ξ2 0 de notre modèle, ils sont presque les mêmes que ceux du modèle de Pitselis
p

(2013). Soit p = p + κi j ou 0 4 p 4 1, i = 1, ....., n et j = 1, ....., k .


0 P 0

i<2

K
1X
Ξ̂ p0 = ξ̂ p0 · = ξ̂ 0 , (4.23)
K j=1 p j
 
K ω̂ 0 θ
1 X p j
ŝ2ξ̂ 0 = , (4.24)
p K j=1
nj
 
K K ω̂ 0 θ
1 X 2 1 X p j
ψ̂ p0 = ξ̂ p0 j − ξ̂ p0 · − , (4.25)
K j=1 K j=1 n j
donc la prime de crédibilité peut être calculée comme suit :

 
Ξ̂i+1(créd)
0
p j
= ξ̂ i
0 ẑ p0 j + 1 − ẑ p0 j Ξ̂ 0 ,
p j
i
p
(4.26)

où
ψ̂ p0
ẑ p0 j = (4.27)
ψ̂ p0 + ŝ2ξ̂ 0
p
99

4.5.2 La variance des quantiles

Pour calculer la variance des quantiles ξ̂ p0 j pour l’échantillon du contrat j ( j = 1, ..., k),
nous pouvons appliquer les résultats qu’ on a vu dans la section précédente. Nous allons
 
montrer comment estimer le terme ω p0 θ j .
 
On génère la séquence {ξ p0 j , ω p0 θ j } par F j , ( j = 1, ..., K) des distributions échantillonnées
par un processus aléatoire d’une famille de distributions, qui n’ est pas nécessairement de
la même forme (de F) avec différents paramètres, voir Maritz (1989). Lorsque la distri-
bution de X est inconnue, la distribution naturelle sans estimation du p-quantile, ξ p0 j , est
l’échantillon p-quantile ξ̂ p0 j , de ξ p0 j . Lorsque la fonction de densité de probabilité f(.) est
continue avec dérivée continue au voisinage de ξ p j et si elle est différente de zéro, on peut
prendre
0 0
  p (1 − p )
ω p0 θ j = h  i
f ξ p0 j | θ j
 
où f ξ p0 j | θ j est la densité de la distribution de X à x = ξ p0 donné θ j , voir Buchinsky
(1998).
 
De plus, le terme ω p0 θ j , (nous allons ignorer l’indice j pour la facilité de la présentation)
0
peut être estimé à partir d’un intervalle de confiance construit à partir de la [np ]ième quantile
de la fonction de distribution cumulative, dire F(.),notée par ξ p0 et définie par F(ξ p0 ) = p .
0

En général, un intervalle de confiance exact peut être calculé pour la variable aléatoire Y ∼
FY (.) (par exemple, Mood, Graybill et Boes 1974). Spécifiquement

P(y( j) ≤ ξ p0 ≤ y(k) ) = P(y( j) ≤ ξ p0 ) − P(y(k) ≤ ξ p0 ), (4.28)

où y( j) et y(k) sont les statistiques des jème et kème ordre de y1 , ..., yn respectivement.Ensuite,

 
Xn   n  0
P(y( j) ≤ ξ p0 ) =   p i (1 − p0 )n−i . (4.29)
 i 
i= j

De même,  
k−1 
X  n  0
P(y(k) ≤ ξ p0 ) =   p i (1 − p0 )n−i . (4.30)
 i 
i=k
100

La substitution de (4.29) et (4.30) en (4.28) les rendements


 
k−1 
X  n  0
P(y( j) ≤ ξ p ≤ y(k) ) =
0   p i (1 − p0 )n−i . (4.31)
 
i
i= j

La construction d’un intervalle de confiance symétrique de niveau 1 − α pour ξ p0 est


simple. Notons j = [np − l], k = [np + l], et soit X ∼ B(n, p ). Ensuite,
0 0 0

0 0
P(y(np0 −l) ≤ ξ p0 ≤ y(np0 +l) ) = P([np − l] ≤ ξ p0 ≤ [np + l])

X−np
0
l
≈ P( √ 0 0 ≤ p 0
). (4.32)
np (1−p ) np (1 − p0 )
0 L
parce que √ X−np
0 0
→ N (0, 1) assimilant la probabilité dans (4.32) à 1 − α donne
np (1−p )

p 0
l = Z1− α2 np (1 − p0 ). (4.33)

Adaptation de la longueur de l’intervalle de confiance exact en (4.31) à celle de l’intervalle


 
de confiance asymptotique normale, on obtient une estimation pour ω p θ j :
 
  n ynp0 +l − ynp0 −l
ω̂ p0 θ j = 2
(4.34)
4Z1− α
2

4.6 Application numérique


Dans cette section, nous illustrons comment la variation p-quantile s’effectue dans un
cadre de crédibilité sur un ensemble de données obtenu auprès de la plus grande orga-
nisation de sécurité sociale en Grèce, composé de 6 contrats de classe différents pour
l’expérience des années de réclamation, entre juillet 1980 et juin 2001. Les différentes
classes sont (SickA, AccidA, MaternA, FunerExp, OtherA, ManagExp). Dans cet exemple,
nous appliquons notre nouvelle prime de crédibilité, pour une expérience de 21 ans d’expérience,
de 1980 à 2000 et pour 22 ans d’expérience en réclamation de 1980 à 2001. Le montant de
la réclamation pour le contrat j, pour la période 1980-2001. Le montant des indemnités est
en millions de drachmes (1 Euro = 340 : 75 drachmes).
101

Table1
Sommaires statistiques pour les montants des sinistres,
de l’année 1980-2000.
Contract Min Mean Median Max
SickA 3436 17166.00 16726.00 35650
AccidA 464 2027.38095 2024.00 3750
MaternA 609 6351.25 5443.00 15340
FunerExp 283 2843.05952 2336.00 7281
OtherA 232 3004.38095 3086.00 8862
ManagExp 275 2739.82143 1904.00 8645

Tableau 2
Sommaires statistiques pour les montants des sinistres,
de l’année 1980 et 2001.
Contract Min Mean Median Max
SickA 3436 17527.50 16782.50 35650
AccidA 464 1970.00 2003.50 3750
MaternA 609 6230.96 5332.00 15340
FunerExp 283 3026.55 2373.50 7281
OtherA 232 3027.00 3106.50 8862
ManagExp 275 2657.96 1884.00 8645
102

Tableau 3
Modèle de crédibilité du quantile (médian), de
l’année 1980-2000.
Contrat SickA AccidA MaternA
ξ̂ p 16726.00 2024.00 5443.00
ẑ p 0, 955415838 0, 955415838 0, 955415838
Ξ̂créd
p 16214, 49334 2167, 969691 5434, 53644
Contrat FunerExp OtherA ManagExp
ξ̂ p 2336.00 3086.00 1904.00
ẑ p 0, 955415838 0, 955415838 0, 955415838
Ξ̂créd
p 2466, 059432 3182, 621311 2053, 319791
Ξ̂ p = 5688.64881, ŝ2ξ p = 1484767, 18, ψ̂ p = 31817802, 59

Tableau 4
Modèle de crédibilité du quantile, de l’année 1980–2001.
Pitselis (2013)
Contrat SickA AccidA MaternA
ξ̂ p 16782.50 2003.50 5332.00
ẑ p 0, 855969465 0, 855969465 0, 855969465
Ξ̂créd
p 15121, 03576 2470, 663042 5319, 757404
Contrat FunerExp OtherA ManagExp
ξ̂ p 2373.50 3106.50 1884.00
ẑ p 0, 855969465 0, 855969465 0, 855969465
Ξ̂créd
p 2787, 371744 3414, 797361 2368, 374691
Ξ̂ p = 5247, ŝ2ξ p = 4832045, 551, ψ̂ p = 28716712, 25
103

Tableau 5
Modèle de crédibilité (médian p plus facteur de
développement κi j ), de l’année 1980–2001.
Contrat SickA AccidA MaternA
κi 0, 001688987 −0, 005064229 −0.010196583
ξ̂ p+κi 16786.508 1999.14 5284.464
ẑ p+κi 0.85599428 0.85589547 0.85582108
Ξ̂créd
p+κi 15125.3078 2465.50601 5275.70768
Contrat FunerExp OtherA ManagExp
κi 0, 008026541 0, 003321452 −0, 005252101
ξ̂ p+κi 2407, 235 3109.36 1879.588
ẑ p+κi 0, 856552093 0.85601832 0.85589274
Ξ̂créd
p+κi 2820, 314407 3418.23233 2363.12938
Contrat SickA AccidA MaternA
ṕ = p + κi j 0.501688 0.49493577 0.48980342
Ξ̂ ṕ 5250.85417 5235.44367 5223.73167
ŝ2ξ ṕ 4832045.55 4832045.55 4832045.55
ψ̂ ṕ 28722492.86 28699486.47 28682185.65
Contrat FunerExp OtherA ManagExp
ṕ = p + κi j 0, 508026541 0.503321 0.501688
Ξ̂ ṕ 5286, 8825 5254.57967 5250.85417
ŝ2ξ ṕ 4832045.55 4832045.55 4832045.55
ψ̂ ṕ 28852973.97 28728095.74 28698849.91

4.6.1 Exemple d’organisation de la sécurité sociale (Algérie)

Dans cette section, nous donnons un exemple numérique pour illustrer l’application
de la nouvelle prime proposée. Des comparaisons avec la nouvelle prime de Pitselis et la
104

prime de Bühlmann sont fournies ici pour démontrer l’équilibre de la nouvelle prime entre
Pitselis et Bühlmann. Les données sont extraites du chapitre de l’organisation nationale
de sécurité sociale (salariés) en Algérie, compétente pour les salariés dans le domaine de
l’assurance sociale, accidents du travail, maladies professionnelles et allocations familiales.
Les six contrats correspondent à six classes (contrats) différentes de quotas (Dépenses)
qui sont tous couverts par l’organisation algérienne de sécurité sociale (salariés), pour une
expérience de 14 années d’expérience en réclamations, de 1995 à 2009.

Remarque 4.3 Notre application est divisée en deux parties, dans la première partie,
nous calculons la nouvelle prime de crédibilité aux 11, 12, 13 et 14 ans d’expérience en
réclamations, et dans la deuxième partie, nous comparons nos résultats avec les résultats
de Pitselis et Bühlmann.

Table 6
Résumé des statistiques pour les montants des
réclamations de l’année 1995-2009.
Contrat Min Mean Median Max
Sick 1000 5903.571429 6225 10400
Accid 6200 14921.42857 15050 22300
Matern 2100 9014.285714 7900 16800
Funer 5600 11050.00000 11600 14300
Other 2800 7123.214286 7262.5 11350
Manag 900 3180.714286 2925 6250
105

Table 7
Modèle de crédibilité du quantile, p = 1/2, de l’année 1995-2006.
Contrat Sick Accid Matern
ξ̂ p 6600 14700 7500
ẑ p 0.810380132 0.810380132 0.810380132
Ξ̂créd
p 6930.254603 13494.33367 7659.596722
Contrat Funer Other Manag
ξ̂ p 11500 7000 2750
ẑ p 0.810380132 0.810380132 0.810380132
Ξ̂créd
p 10901.11725 7254.406656 3810.291093
Ξ̂ p = 8341.666667, ŝ2ξ p = 3307428.74, ψ̂ p = 14134987.93
106

Tableau 8
Modèle de crédibilité du quantile (médiane plus le facteu
de développement κi j ), p = 1/2 + κ12 j , de l’année 1995-2007.
Contrat Sick Accid Matern
p + κi 0.494318182 0.503401361 0.51
ξ̂ p+κi 6515.625 14807.48 7683
ẑ p+κi 0.808786208 0.808952773 0.809077677
Ξ̂créd
p+κi 6865.635888 13578.69700 7819.342404
Ξ̂ p+κi 8346.093833 8375.651500 8397.125000
ŝ2ξ p+κ 3232396.240 3232396.240 3232396.240
i

ψ̂ p+κi 13672222.4 13686960.80 13698029.65


Contrat Funer Other Manag
p + κi 0.486956522 0.50625 0.531818182
ξ̂ p+κi 11113.91000 7099.531000 3047.500000
ẑ p+κi 0.808655439 0.809006360 0.809512959
Ξ̂créd
p+κi 10579.71933 7345.032442 4080.058818
Ξ̂ p+κi 8322.136500 8384.921667 8468.125000
ŝ2ξ p+κ 3232396.240 3232396.24 3232396.240
i

ψ̂ p+κi 13660669.45 13691707.84 13736717.35


107

Tableau 9
Modèle de crédibilité du quantile (médiane plus le facteur,
de développement κi j ), p = 1/2 + κ13 j , de l’année 1995-2008.
Contrat Sick Accid Matern
p + κi 0.489339438 0.506546710 0.517766497
ξ̂ p+κi 6392.433000 14923.57000 7842.640000
ẑ p+κi 0.777450809 0.819114403 0.819616324
Ξ̂créd
p+κi 6848.842296 13762.23156 7966.685825
Ξ̂ p+κi 8443.257333 8503.277500 8530.317667
ŝ2ξ p+κ 3810361.417 3100600.804 3100600.804
i

ψ̂ p+κi 13311073.17 14040624.68 14088320.48


Contrat Funer Other Manag
p + κi 0.503873074 0.511631508 0.540979939
ξ̂ p+κi 11509.30000 7199.426000 3188.517000
ẑ p+κi 0.818994483 0.856231433 0.857271737
Ξ̂créd
p+κi 10964.02710 7388.640697 3958.927743
Ξ̂ p+κi 8496.834333 8515.532167 8586.261833
ŝ2ξ p+κ 3100600.804 2467474.594 2467474.594
i

ψ̂ p+κi 14029268.27 14695349.29 14820444.04


108

Tableau 10
Modèle de crédibilité du quantile (médiane plus le facteur,
de développement κi j ), p = 1/2 + κ14 j , de l’année 1995-2009.
Contrat Sick Accid Matern
p + κi 0.476522476 0.510838089 0.521553371
ξ̂ p+κi 6087.656000 15092.27000 7956.039000
ẑ p+κi 0.953794823 0.890731381 0.936654637
Ξ̂créd
p+κi 6194.893165 14375.55677 7995.055457
Ξ̂ p+κi 8408.546667 8533.083667 8571.971333
ŝ2ξ p+κ 841881.3134 1976872.827 1143551.254
i

ψ̂ p+κi 17378616.04 16114989.61 16909092.25


Contrat Funer Other Manag
p + κi 0.507843888 0.516113899 0.49627031
ξ̂ p+κi 11620.39000 7299.159000 2908.03000
ẑ p+κi 0.890797929 0.953220161 0.953409386
Ξ̂créd
p+κi 11282.06298 7357.777452 3167.641435
Ξ̂ p+κi 8522.216000 8552.22983 8480.21317
ŝ2ξ p+κ 1976872.827 845427.9395 845427.9395
i

ψ̂ p+κi 16126014.91 17227057.17 17300457.41


109

Figure 4.1: Evolution de la nouvelle prime de crédibilité.

Table 11
Le modéle de crédibilité Bühlmann (1967), de l’année 1995-2009.
Contrat Sick Accid Matern
X̄· j 5903.5710 14921.429 9014.2860
ẑ 0.9618761 0.9618761 0.9618761
 
µ̂ θ j 6003.7850 14677.846 8995.9070
Contrat Funer Other Manag
X̄· j 11050.000 7123.2140 3180.714286
ẑ 0.9618761 0.9618761 0.961876100
 
µ̂ θ j 10954.012 7176.9300 3384.734000
µ̂ = 8532.202, Ŝ 2 = 9065735, α̂ = 16337906
110

Table 12
Le modèle de crédibilité Pitselis (2013), de l’année 1995-2009.
Contrat Sick Accid Matern
ξ̂ p 6225 15050 7900
ẑ p 0.834821794 0.834821794 0.834821794
Ξ̂créd
p 6599.748056 13967.05038 7998.074560
Contrat Funer Other Manag
ξ̂ p 11600 7262.5 2925
ẑ p 0.834821794 0.834821794 0.834821794
Ξ̂créd
p 11086.91520 7465.875667 3844.836137
Ξ̂ p = 8493.75, ŝ2ξ p = 2995008.659, ψ̂ p = 15136975.72

4.6.2 Comparaison des modèles de crédibilités ( Bühlmann (1969),


Pitselis (2013) et la nouvelle méthode).

Les tableaux 7, 8, 9, et 10 montrent que, pour chaque contrat, les valeurs du quantile
sont différentes des valeurs des moyennes et des médianes résultant des valeurs des esti-
mateurs de crédibilité différentes pour le modèle Bühlmann (1969) et Pitselis (2013) par
rapport à la variation du modèle de crédibilité quantile. Le tableau 13 compare les résultats
de la nouvelle prime avec Pitselis (2013) et Bühlmann (1969) qui sont faites dans le tableau
11, 12.
La nouvelle prime de crédibilité augmente et diminue avec un taux de 2 à 5% par rapport
à la prime Pitselis(2013) et Bühlmann (1969) dans tous les contrats. Cela s’explique d’une
partie par l’augmentation et la diminution du facteur de crédibilité et par la modification
de la prime individuelle et collective d’un contrat d’autre part. Le changement de la prime
sera plus remarqué si l’on répète les calculs plusieurs fois avec de nouvelles expériences.
Notre modèle permet de reconnaı̂tre le rôle minimal joué par ces contrats dans les résultats
du portefeuille.
111

Table 13
Comparaison Bühlmann (1969), Pitselis (2013)
et la nouvelle méthode, de l’année 1995-2009.
Nouvelle méthode Pitselis (2013) Bühlmann (1969)
6194.893165 6599.748056 6003.7850
14375.55677 13967.05038 14677.846
7995.055457 7998.074560 8995.9070
11282.06298 11086.91520 10954.012
7357.777452 7465.875667 7176.9300
3167.641435 3844.836137 3384.7340

Figure 4.2: Comparaison entre trois méthodes de calcul des primes de crédibilité.

Remarque 4.4 :L’expérience de l’assuré doit être plus grande et plus proche de la médiane
pour obtenir des résultats plus crédibles.
112

Dans ce chapitre, nous avons présenté un modèle de crédibilité concentré sur le quantile
(décomposition du quantile), en introduisant une nouvelle prime de crédibilité basée sur la
variation de quantile. Ce concept de perte de décomposition peut également être utilisé
pour interpréter des modèles plus complexes tels que le modèle de Hachemeister ou même
des modèles de classification croisée. Il interprète bien le modèle de Pitselis (2013). Le
modèle de Pitselis (2013) ne peut pas donner un bon estimateur de la mesure du risque,
nous développons des mesures de risque plus réalistes, c’est-à-dire pour chaque contrat,
on a un facteur de développement indépendant qui peut rendre les Mesures de risque plus
crédibles. La prime sera plus crédible si les calculs sont répétés plusieurs fois pour de
nouvelles expériences, l’expérience de l’assuré doit être plus grande pour des résultats plus
crédibles, nous pouvons comparer ces résultats avec d’autres modèles de crédibilité qui ont
un facteur de crédibilité indépendant comme Bühlmann et Straub (1996).
113

Conclusion et perspective
Dans cette thèse, on a présenté les méthodes de tarification des risques traditionnels,
en particulier la théorie de crédibilité. Nous avons construit des estimateurs des primes
bayésiennes suivant les techniques d’inférence bayésiennes concernant les paramètres des
risques d’un assuré qui n’est jamais connu. En imposant une distribution à priori, nous
sommes en mesure de décrire de manière probabiliste la structure de risque pour l’ensemble
de la classe de notation. En pratique, le choix de cette distribution à priori est subjectif aux
jugements personnels ou induit par les données historiques du groupe correspondant.
À l’aide de la simulation numérique, il semble que les primes bayésiennes sont cohérentes
et vérifient la condition de convergence vers la prime individuelle.
Par la suite, en introduisant une pondération dans le modèle classique de Pitselis (2013),
leur décomposition du quantile des montants de sinistres en une somme de variables aléatoires
est en fait inspirée des modèles statistiques ”Variance Components Models”. Leur concept
de décomposition des montants de sinistres peut également être employé afin d’interpréter
des modèles plus complexes tels le modèle de Hachemeister (1975) ou encore des modèles
de classification croisée.
Pour des études futures, nous pouvons considérer les distributions de log-Lindley, in-
verse Lindley, ou autres distributions comme distributions conditionnelles au lieu de la
distribution de Lindley, et sous la fonction de perte entropie.
114

Bibliographie

[1] Ahn, S.E., C.S., Park, H.M., Kim. Hazard rate estimation of a mixture model with
censored lifetimes, Stoch. Environ. Res. Assess. 21 (2007), 711–716.

[2] Antoniadis, A., J. Berruyer, et R. Carmona (1992). Régression non linéaire et appli-
cations. Economica.

[3] Bailey, A.L., Credibility procedures, Laplace’s generalization of Bayes’ rule and the
combination of collateral knowledge with observed data, Proceedings of the Casualty
Actuarial Society, vol. 37, 7–23, 1950.

[4] Basu, A. P., and Ebrahimi, N. Bayesian approach to life testing and reliability estima-
tion using asymmetric loss function, J. Statist. Plann. Infer., 29, 21–31, 1991.

[5] Buchinsky, M., 1998. Recent advances in regression models : a practical guideline for
empirical research. The Journal of Human Resources 33 (1), 88–126.

[6] Bühlmann, H., Experience rating and credibility, Astin Bulletin, vol. 4, p. 199–207,
1967.

[7] Bühlmann, H., Experience rating and credibility, Astin Bulletin, vol. 5, p. 157–165,
1969.

[8] Bühlmann, H., Straub, E., Glaubgwürdigkeit für Schadensutze. Bulletin of the Swiss
association of actuaries 70, 111–133, 1996.

[9] Calabria, R. and G. Pulcini, 1969. Point estimation under asymmetric loss functions
for left truncated exponential samples. Comm. Statist. Theory Methods, 25 : 585-600.
115

[10] Dean, C., J. Lawless et G. Willmot. 1989.  A mixed Poisson - inverse Gaussian
regression model . Canadian Journal of Statistics 17, p. 171-182.

[11] Denuit, M., Pitrebois, S., Walhin, J.-F., Marketing et Systèmes Bonus-Malus, Actu-L
3, 89-105, 2003.

[12] Denuit, M. & Charpentier, A. (2005), Mathématiques de l’Assurance Non-Vie. Tome


II : Tarification et Provisionnement, Collection conomie et Statistiques Avancées,
Economica, Paris.

[13] Denuit M. et al., 2007 : Actuarial modelling of claim counts : risk classifi cation, credi-
bility and bonus-malus systems. Hoboken : Wiley, 384 p. ISBN 978-0-470- 02677-9.

[14] Denuit, M., 2008. Comonotonic approximations to quantiles of life annuity conditio-
nal expected present value. Insurance : Mathematics and Economics 42, 831–838.

[15] Dionne, G., & Vanasse, C. (1989). A generalization of actuarialautomobile insurance


rating models : the Negative Binomial distribution with a regression component. AS-
TIN Bulletin 19, 199-212.

[16] Dobson A. J. (2002). An introduction to Generalized Linear Models, Chapman Hall /


CRC second Edition.

[17] Fahrmeir, L., & Tutz, G. (2002). Multivariate Statistical Modelling Based on Genera-
lized Linear Models. Springer Verlag, New York.

[18] Garthwaite, H. P., Kadane, B. J. and O’Hagan, A. Elicitation, working paper in uni-
versity of Sheffield, 2004.

[19] Gebizlioglu, O.L., Yagci, B., (2008). Tolerance intervals for quantiles of bivariate
risks and risk measurement. Insurance : Mathematics and Economics 42, 1022–1027.

[20] Ghitany, M.E, Al-Mutairi D.K. Estimation methods for the discrete Po isson–Lindley
distribution. Journal of Statistical Computation and Simulation,79(1) :1–9, 2009.

[21] Ghitany, M.E, Atieh, B., Nadarajah, S. Lindley distribution and its application. Ma-
thematics and computers in simulation, 78 :493–506, 2008
116

[22] Goovaerts, M. J. and W. J. Hoogstad., Credibility Theory,4, Surveys of actuarial stu-


dies, Nationale-Nederlanden N.V., Netherlands, 1987.

[23] Gouri eroux, C., Monfort, A., & Trognon, A. (1984). Pseudo maximum likelihood
methods : Theory. Econometrica 52, 681-720.

[24] Gilchrist,W., 2000. Statistical modelling with quantile functions. Chapman and Hall,
New York.

[25] Hachemeister, C.A. Credibility for regression models with application to trend, Cre-
dibility theory and applications, Proceedings of the Berkeley actuarial research confe-
rence on credibility, Academic Press, New York, p. 129–163, 1975.

[26] Herzog, T.N. Introduction to credibility theory, 2nd ed. Actex Publications, Winsted,
1996.

[27] Howlader, H.A., Hossain, A. Bayesian survival estimation of Pareto distribution of the
second kind based on failure censored data, Computational Statistics Data Analysis,
38 :301–314, 2002.

[28] Holta :n, J., 2001, Optimal Loss Financing under Bonus-Malus Contracts, ASTlN
Bulletin,Vol. 31, no. 1, 161-173.

[29] Jaheen, Z.F. On record statistics from a mixture of two exponential distributions, J.
Statist. Comput. Simul., 75, 1-11, 2005.

[30] Jewell, W.S. Credible means are exact bayesian for exponential families, Astin Bul-
letin, vol. 8, p. 77–90, 1974.

[31] Jones, M.C., 1992. Estimating densities, quantiles, quantile densities and density
quantiles. Ann. Inst. Statist. Math., 44, 721-727.

[32] Kaas, R., Dannenburg, D., Goovaerts, M. Exact credibility for weighted observations,
Astin Bulletin 27 (2), 287–295, 1996.

[33] Klugman, S.A., H. Panjer, and G. Willmot. Loss Models : From data to decisions, 2nd
edition, Wiley, New York, Chapter 16, 2004.
117

[34] Kudryavtsev, A., 2009. Using quantile regression for rate-making. Insurance : Mathe-
matics and Economics 45, 296–304.

[35] Krishna, H., K. Kumar. Reliability estimation in Lindley distribution with progressi-
vely type II right censored sample, Math. Comput. Simul, 82 (2), 281–294, 2011.

[36] Legendre, A. Nouvelles méthodes pour la determination des orbites des comètes,
Courcier, City Paris, 1805.

[37] Lemaire, J. , 1977, Selection procedures of regression analysis applied to automobile


insurance, Mitteilungen der Vereinigung Schweizerischer Versicherungsmathemati-
ker, 143-160.

[38] Lemaire, J., Zi, H., A Comparative Analysis of 30 Bonus-Malus Systems, ASTlN
Bulletin, vol. 24, no. 2, 287-309.

[39] Lemaire, J., 1995, Bonus-Malus Systen1s in Automobile lnsurance, Kluwer Acade-
mic, Publisher, Boston.

[40] Lemaire, J., 2004, Bonus-Malus system, Encyclopeadia of Actuarial Science, Wiley,
New York, 184-191.

[41] Lindley, D.V.,. Fiducial distributions and Bayes’ theorem, Journal of the Royal Sta-
tistical Society, Series A20,102–107, 1958.

[42] Lindley, DV., Approximate Bayes methods. Trabajos de Estadistica de Investigacion


Operativa, 31(1) :223–245, 1980

[43] Maritz, J.S., 1989. Linear empirical Bayes estimation of quantiles. Statistics & Pro-
bability Letters 8, 59–65.

[44] McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, 2nd Ed. Chapman
& Hall, London.

[45] Metiri, F. Zeghdoudi, H. Remita, M.R, On Bayes Estimates of Lindley Distribution


under Linex Loss Function : Informative and Non Informative Priors. Global Journal
of Pure and Applied Mathematics. ISSN 0973-1768, Volume 12, Number 1,pp. 4395-
440 (2016).
118

[46] Mood, A.M., Graybill, F.A., Boes, D.C., 1974. Introduction to the Theory of Statistics.
McGraw-Hill.

[47] Moreno, L, Vazquez, F. J., Watt, R., 2006, Can Bonus-Malus Allieviate Insurance
Fraud ?, The Journal of risk and Insurance, Vol. 73, No. 1, 123-151

[48] Mowbray, A.H. How extensive a payroll exposure is necessary to give a dependable
pure premium, PCAS I, 24-30, 1914.

[49] Mowbray, A. H. 1914, How extensive a payroll exposure is necessary to give a de-
pendable pure premium ?, Proceedings of the Casualty Actuarial Society, vol. 1, p.
25–30.

[50] Nassar, M., and Eissa, F.H. Bayesian estimation for the exponentiated Weibull model,
Commun Statistical theory Meth., 33(10), 2343-2362, 2004.

[51] NelderJ., Wedderburn R. [1972]  Generalized linear models , Journal of Roy. Stat.
Soc. B, vol. 135, 370-384.

[52] Norberg, R. The credibility approach to ratemaking, Scandinavian actuarial journal,


181–221, 1979.

[53] Norberg, R.., Credibility theory, encyclopedia of actuarial science, Wiley, Chichester,
UK, 2004.

[54] Pandey, B.N. T-estimator of the scale parameter of the exponential distribution using
Linex loss function. Commun. Statistical Theory. Meth., 26(9), 2191–2202, 1997.

[55] Parzen, E., 1979. Nonparametric statistical data modelling. Journal of American Sta-
tistical Association, 74, 105-122.

[56] Parzen, E., 2004. Quantile probability and statistical data modeling. Statistical
Science, 19, 652-662.

[57] Pitt, D.G.W., (2006). Regression quantile analysis of claim termination rates for in-
come protection insurance. Annals of Actuarial Science 1 (II), 345–357.

[58] Pitselis, G., 2009. Solvency supervision based on a total balance sheet approach. Jour-
nal of Computational and Applied Mathematics 233 (1), 83–96.
119

[59] Pitselis, G., (2013). Quantile credibility models. Insurance : Mathematics and Econo-
mics 52 (2013) 477–489.

[60] Rolski, T., Schmidli, H., Schmidt, V., Tengels, J., 1998, Stochastic Processes for in-
surance and Finance, Wiley, New York.Tapez une équation ici.

[61] Rojo. On the admissibility of ”cx+d” with respect to the Linex loss Function, Com-
mun. Statistical Theory. Meth, 116, 3745-3748, 1987.

[62] Ross, S., 2003,Introduction to Probability Models, Academic Press, eighth edition,
New York.

[63] Sajid Ali, Muhammad Aslam, Syed Mohsin Ali Kazmi. A study of the effect of the
loss function on Bayes Estimate, posterior risk and hazard function for Lindley distri-
bution, Applied Mathematical Modelling, 37, 6068–6078, 2013.

[64] Sankaran, M. The discrete Poisson–Lindley distribution. Biometrics, 26, 145- 149,
1970.

[65] Sajid Ali, Muhammad Aslam, Syed Mohsin Ali Kazmi. A study of the efect of the
loss function on Bayes Estimate, posterior risk and hazard function for Lindley distri-
bution, Applied Mathematical Modelling, 37, 6068–6078, 2013.

[66] Searle, Casella and Mcculloch (1992). Variance Componenis ; John Wiley : New
York, 501 p.

[67] Société de l’Assurance Automobile du Québec, Les points d’Inaptitude, http : j


jwww.saaq.gouv.qc.cajdocumentsj documents pdfjpermisjpoints inaptitude. php.

[68] Soliman, A. Comparison of Linex and quadratic Bayes estimators for the Rayleigh
distribution. Commun. Statist. Theor. Meth., 29(1), 95–107, 2000.

[69] Thompson, R.D. and Basu, A.P. Asymmetric loss function for estimating reliability.
Journal of Bayesian Analysis in Statistics and Econometrics, Wiley, New York, 1996.

[70] Varian, H.R. A Bayesian approach to real estate assessment, Studies in Bayesian Eco-
nometrics and Statistics, Amsterdam : North-Holland, 195–208, 1975.
120

[71] Whitney, A.W. The theory of experience rating, Proceedings of the Casualty Actuarial
Society, vol. 4, 275–293, 1918.

[72] Zeghdoudi, H, Nedjar, Gamma Lindley distribution and its application. Journal of
Applied probability and statistics, vol. 10, 2015.

[73] Zellner, A. Bayesian estimation and prediction using asymmetric loss functions. Jour-
nal of Amsterdam statistical association, 81, 446–451, 1986.

Vous aimerez peut-être aussi