These Sadoun Ahmed

‫وزارة التعليم العالي والبحث العلمي‬
MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA

RECHERCHE SCIENTIFIQUE
-‫جامعــــــــــــــــة باجــــــــي مختــــــــــــار‬
‫عنابــــــــــة‬
BADJI MOKHTAR - ANNABA UNIVERSITY
UNIVERSITÉ BADJI MOKHTAR - ANNABA
‫كليــــــــــــــــة العلـــــــــــــــــــــوم‬
FACULTY OF SCIENCES
FACULTE DES SCIENCES
Département de Mathématiques
Laboratoire de Probabilités et Statistiques (LaPS)
THÈSE
Présentée en vue de l’obtention du diplôme de
Doctorat en Mathématiques
Option : Modélisation Mathématiques – Actuariat
METHODE DE TARIFICATION DES RISQUES EN ASSURANCE

NON-VIE
Par : M. SADOUN Ahmed
Sous la direction de
REMITA Mohamed Riad Prof.U.B.M.Annaba
Co-directeur
ZEGHDOUDI Halim M.C.A U.B.M.Annaba
Devant le jury
PRESIDENT : Seddik-Ameur Nacera Prof. U.B.M. Annaba
EXAMINATEUR : Necir Abdelhakim Prof. U.M.K.Biskra
EXAMINATEUR : Chadli Assia Prof. U.B.M. Annaba
EXAMINATEUR : Arrar Nawel khadija M.C.A U.B.M. Annaba
Année 2018
Dedicace
Premièrement, je suis extrêmement reconnaissant à Allah qui m'a donné la
chance et le courage de terminer ce travail.
Je voudrais exprimer ma sincère gratitude à mon conseiller Prof. Remita
Mohamed Riad pour le soutien continu de mon étude de doctorat et de
recherches connexes, pour sa patience, sa motivation. Ses conseils m'ont aidé
tout au long de la recherche et de l'écriture de cette thèse.
Remerciements spéciaux à mon co-directeur Dr. Zeghdoudi Halim pour son
immense connaissance, ses conseils malgré toutes les obligations qu'il avait et
son amour de tous les mathématiciens.
Je voudrais également remercier les membres de mon comité de doctorat: Prof.
Necir Abdelhakim, Prof. Seddik-Ameur Nacera, Prof. Chadli Assia, et Dr .
Arrar Nawel qui ont accepté de siéger à mon comité dans un bref délai et dont
les précieux commentaires aideront à améliorer cette thèse.
Je reconnais humblement et avec gratitude l'amour continu et durable et le
soutien émotionnel donné par mes parents et mon frère et mes sœurs. Je ne
pourrais jamais aussi reconnaître ou remercier ma belle femme et mon joujou
seifou.
Je voudrais remercier tous mes amis et collègues et le personnel du département
de mathématiques et de l'université, en particulier Metiri Farouk
Une mention spéciale doit être faite ici pour mes amis intimes qui m'ont soutenu
et motivé pour continuer à travers les hauts et les bas vers mon but.
3
PERSONAL BIBLIOGRAPHY
Articles publiés
Sadoun, A. Remita, M.R. Zeghdoudi, H, Quantile credibility models (Quantile decom-
position). Proceedings of Computational Mathematics, Co ;2016, p 241.
Sadoun. Zeghdoudi, H. Remita, M.R, On Bayesian Premium Estimators for Gamma
Lindley Model under Squared Error and Linex Loss Function. Science Publications, Jour-
nal of Mathematics and Statistics 2017, 13 (3) : 284.291.
Zeghdoudi, H. Sadoun, A. Attoui, F.Z. Bayesian Premium Estimators for mixture of tow
gamma distributions. Journal of Statistical theory and applications, JSTA vol. 17, 2018.
4
Résumé
Dans cette thèse, nous expliquons d’abord les différentes méthodes classiques de tarifi-
cation des risques en assurance non-vie. Deux approches de calcul des primes concernant
la théorie de crédibilité sont proposées. Dans un premier temps, nous considérons la dis-
tribution Gamma Lindley (GaL) comme une distribution conditionnelle, nous nous basons
sur l’estimateur de la prime bayésienne sous les fonctions de perte de l’erreur quadratique
moyenne et linex avec des distributions à priori informatives. En utilisant l’approximation
de Lindley, des simulations numériques et une étude comparative sont obtenues. Dans un
deuxième temps, nous présentons le modèle de la crédibilité (quantiles), plus précisément,
nous montrons le rôle de la décomposition des quantiles dans la simplification du modèle
de Pitselis (2013). Nous introduisons une nouvelle approche pour le calcul de la prime de
crédibilité et une application avec des données réelles est donnée.
Mots-clés : Bonus-malus, modèle linéaire généralisé, crédibilité, fonction de perte,
l’erreur quadratique moyenne, Linex, prime bayésienne, distribution Gamma Lind-
ley, distribution Gamma, quantile, décomposition de p-quantile, facteur de développement.
‫ملخص‬
‫في هذه الرسالة ‪،‬نقوم أوال بشرح مختلف األساليب التقليدية لتسعير المخاطر في التأمين غير‬
‫الحياة‪ .‬ونقترح نهجي ن لحساب المكافآت لنظرية المصداقية‪ .‬أوال‪ ،‬علينا النظر في توزيع غاما‬
‫ليندلي (‪ )GaL‬كتوزيع مشروط خاص بمبالغ األضرار ‪ ،‬ونحن نعتمد على مقدر'' بيز' نقوم‬
‫باستخراجه تحت دالتين للخسارة‪:‬دالة الخطأ التربيعي التي هي دالة متناظرة و دالة غير متناظرة‬
‫خاصة بحساب األخطاء و هي ‪."linex" :‬‬
‫في هذه الحالة‪ ,‬مقدر'' بيز'' لقسط التأمين ال يملك شكال خطيا مما يدفعنا إلستعمال تقنية عددية‬
‫للتقريب و هي تقنية تقريب "ليندالي"‪.‬‬
‫قمنا بعمل محاكاة عددية لمقدر'' بيز''بواسطة طريقة متوسط مربعات الخطأ (‪)MSE‬لتأكيد‬
‫صحة النتائج النظرية المحصل عليها و مقارنة هذا المقدر تحت مختلف دوال الخسارة‬
‫المذكورة أعاله‪.‬‬
‫ثانيا‪ ،‬نقدم نموذجا للمصداقية (‪ ، )eltinauq‬على نحو أدق‪ ،‬نعرض دور التحليل الكمي في‬
‫تبسيط نموذج ‪ )2013(Pitselis‬مع تقديم نهج جديدا لحساب قسط المصداقية والقيام بتطبيق‬
‫مع بيانات حقيقية‪.‬‬
‫الكلمات المفتاحية‪ :‬بونوس‪-‬مالوس‪ ،‬نموذج خطي معمم‪ ،‬مصداقية‪ ،‬وظيفة خسارة‪،‬‬
‫متوسط الخطأ التربيعي‪ ،‬لينكس‪ ،‬رئيس بايزي‪ ،‬توزيع غاما ليندلي‪ ،‬توزيع غاما‪ ،‬كوانتي‪،‬‬
‫كوانتيل ديكولبوسيتيون‪ ،‬عامل التطوير‪.‬‬
5
Abstract
In this thesis, we explain first the different classical methods of risk pricing in non-life
insurance. Two approaches to calculate premiums concerning for credibility theory are pro-
posed. In the first time, we consider the gamma distribution Lindley (GaL) as a conditional
distribution, we focus on the Bayesian estimation of the premium under squared error loss
function (symmetric) and Linex loss function (asymmetric), using informative priors (the
Gamma prior). Because of its difficulty and non-linearity, we use a numerical approxi-
mation for computing the Bayesian premium. Finally, a simulation and comparative study
with varying sample sizes are given. In the second time, we present quantile credibility mo-
del. More precisely, we show how the quantile decomposition simplifies the Pitselis model
(2013). New premium credibility and an application with real data are given.
Key words : Bonus-malus, generalized linear model, credibility, Bayesian pre-
mium, Gamma Lindley distribution, Gamma distribution, loss function, squared er-
ror, Linex, Quantile, credibility, decomposition of p-quantile, Development factor
1
Table des matières
1 Tarification à priori 10
1.1 Les modèles linéaires généralisés . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Petit historique des applications actuarielles des modèles de rég-
ression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Moyenne et variance . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.3 Modèle de régression . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1.4 Fonction de lien canonique . . . . . . . . . . . . . . . . . . . . . . 18
1.1.5 Equations de vraisemblance . . . . . . . . . . . . . . . . . . . . . 19
1.1.6 Résolution des équations de vraisemblance . . . . . . . . . . . . . 22
1.1.7 Intervalle de confiance pour les paramètres . . . . . . . . . . . . . 25
1.1.8 Tests d’hypothèse sur les paramètres . . . . . . . . . . . . . . . . . 26
1.1.9 La pratique des modèles linéaires généralisés et l’importance du
choix de la sous-famille exponentielle . . . . . . . . . . . . . . . . 26
2 Tarification à posteriori 30
2.1 Systèmes bonus-malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.1 Vue d’ensemble des systèmes bonus-malus . . . . . . . . . . . . . 31
2.1.2 Description d’un système bonus-malus . . . . . . . . . . . . . . . 32
2.1.3 Analyse d’un système bonus-malus . . . . . . . . . . . . . . . . . 35
2.2 La Théorie de la crédibilité . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.1 Petit historique sur la théorie de crédibilité . . . . . . . . . . . . . 45
2.2.2 L’approche bayésienne en crédibilité . . . . . . . . . . . . . . . . . 48
2.2.3 Modèle de Bühlmann . . . . . . . . . . . . . . . . . . . . . . . . . 52
3 Estimation Bayésienne de la prime pour le modèle Gamma Lindley sous différentes

fonctions de perte 65
3.1 Inférences bayésiennes pour les paramètres . . . . . . . . . . . . . . . . . 66
3.1.1 Estimation des paramètres par maximum de vraisemblance . . . . . 66
3.1.2 Estimateurs Bayésiens des paramètres . . . . . . . . . . . . . . . . 67
3.2 Estimation bayésienne de la prime . . . . . . . . . . . . . . . . . . . . . . 71
2
3.2.1 Estimateurs bayésiens de la prime sous la fonction de perte quadra-

tique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2.2 Estimateurs bayésiens de la prime sous la fonction de perte LINEX 73
3.3 Étude par simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4 Résultats et Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4 Méthode des Quantiles sous la théorie de la crédibilité (Décomposition de Quan-

tile) 83
4.1 Interprétation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 Préliminaires sur les quantiles . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 Modèles de crédibilité (quantile) . . . . . . . . . . . . . . . . . . . . . . . 86
4.3.1 Le modèle de crédibilité de Pitselis (2013) . . . . . . . . . . . . . . 86
4.4 Discussion du nouveau modèle . . . . . . . . . . . . . . . . . . . . . . . . 88
4.4.1 Décomposition des p−quantiles . . . . . . . . . . . . . . . . . . . 88
4.4.2 Discussion sur les hypothèses . . . . . . . . . . . . . . . . . . . . 89
4.4.3 Calcul de la prime . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5 La nouvelle prime de crédibilité . . . . . . . . . . . . . . . . . . . . . . . 97
4.5.1 Estimation des paramètres du modèle . . . . . . . . . . . . . . . . 98
4.5.2 La variance des quantiles . . . . . . . . . . . . . . . . . . . . . . . 99
4.6 Application numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.6.1 Exemple d’organisation de la sécurité sociale (Algérie) . . . . . . . 103
4.6.2 Comparaison des modèles de crédibilités ( Bühlmann (1969), Pit-
selis (2013) et la nouvelle méthode). . . . . . . . . . . . . . . . . . 110
Bibliographie 114
6
Introduction
Le principe de l’assurance est le partage d’un danger, appelé un risque, parmi un col-
lectif, le même danger peut toucher les individus d’un groupe et causer un grand dégât.
Pour un individu tout seul, le dégât est souvent trop grand pour être supporté sans la perte
du niveau de la vie. Par contre, si le danger est partagé parmi tous les individus du collectif,
le sinistre devient supportable pour chacun. Ce principe d’assurance nécessite que chaque
membre du collectif soit concerné par le risque de la même façon. Sinon, les membres du
collectif qui ne sont pas du tout ou seulement très partiellement concernés par le risque,
ne sont, à priori, pas prêts de porter la même part du dégât que les autres (en tout cas,
s’ils ne sont pas forcés par la loi, comme dans l’assurance de responsabilité civile des voi-
tures), le principe d’une assurance (facultative) exige donc que le risque soit distribué dans
le collectif d’une façon homogène.
En réalité, le risque est rarement distribué d’une façon homogène dans le collectif. Les
assureurs ont par conséquent la tendance à sélectionner dans le groupe les individus avec
un ”bon” risque. Si la sélection est efficace, l’assurance aura moins de sinistres à payer et
peut donc offrir un meilleur tarif à ses assurés. Les autres assurances, par contre, restées
avec les ”moins bons” risques sont obligées d’augmenter leurs tarifs. Pour éviter ce clivage
du marché d’assurance, les autres assureurs doivent suivre le premier assureur ou pour
ne pas perdre leur clientèle antérieure, ils sont obligés d’offrir des tarifs différents entre
les bons risques et les mauvais risques. Le marché d’assurance a donc une tendance à la
différenciation des tarifs selon le degré des risques. La tendance inhérente de l’assurance
a comme effet que les actuaires sont tenus d’inventer et de développer des méthodes de
différenciation assez fines pour le calcul des tarifs.
Il y a au moins trois méthodes importantes de tarification en actuariat :
La méthode des modèles linéaires généralisés (Generalized Linear Models (GLM)).
Les modèles linéaires généralisés (GLM) ont été introduits dans les années 70 pour
traiter des variables de réponse non-continues ou bornées, pour éliminer la limitation des
modèles linéaires qui doivent avoir une réponse continue sans bornes. Cette méthode consiste
7
dans l’intégration de plus en plus des données dans la tarification. Par exemple : dans l’as-
surance de voiture, où un très grand nombre de contrats permettent de faire des statistiques
avancées, on utilise les informations suivantes : informations sur la voiture, informations du
propriétaire, kilométrage annuel, informations sur le domicile et informations sur d’autres
assurances dans la même compagnie. Toutes ces informations peuvent être utilisées pour
la tarification. Les GLM sont des outils bien connus et bien compris dans les statistiques et
surtout dans les sciences actuarielles.
La méthode de Bonus-Malus.
Il y a plusieurs systèmes de Bonus-Malus. Ils utilisent les informations sur les nombres
des accidents causés en utilisant la sinistralité d’un assuré des dernières années. Dans un
système de classes, après chaque année sans accident, le contrat est mis dans une meilleure
classe, après une année avec un ou plusieurs accidents, le contrat est puni en le posant dans
une classe pire dépendante du nombre des accidents.
La théorie de crédibilité.
Cette méthode utilise aussi les informations des années précédentes, en utilisant les
montants cumulés de sinistres des années précédentes. La nouvelle tarification s’effectue
comme une combinaison convexe de la moyenne individuelle des années antérieures et de
la moyenne du collectif des assurés. L’introduction à la théorie de la crédibilité peut être
trouvée, par exemple dans Goovaerts et W. J.(1987), Herzog (1996), Kaas, Dannenburg et
Goovaerts (1996), Klugman et Panjer (2004), et pour les introductions détaillées récentes,
on peut se référer, par exemple, à R. Norberg (2004). Cette méthode est surtout appliquée
dans les contrats d’assurance détaillés, comme les assurances de transport (camions, che-
mins de fer, bateaux, avions), assurance des objets d’art, assurance.
Pour un assuré, son risque X est caractérisé par une réalisation de θ. Chaque sinistre est
vu donc comme une variable aléatoire selon une distribution conditionnelle qui dépend de
θ. En plus, l’espérance des sinistres appelée aussi la prime de risque peut être calculée sur
la base de cette distribution conditionnelle.
En pratique, différents modèles ont été proposés pour chercher le meilleur estimateur de
8
la prime de risque. Parmi ces modéles : (Le modèle Bayésien proposé par Whitney (1918)
et le modèle de Bühlmann (1967, 1969))
- Le modèle bayésien quant à lui, consiste à supposer pour θ une distribution des si-
nistres à priori π (θ) appelée fonction de structure dans le contexte actuariel- qui décrit
l’expérience de risque du même paramètre appelée f (x | θ).
En combinant la distribution à priori avec la vraisemblance de f (x | θ) , on peut ob-
tenir la distribution à posteriori f (θ | x) qui établit la dépendance de θ sachant l’histo-
rique de l’expérience. La prime bayésienne PB - meilleure prime d’expérience représentant
l’espérance des sinistres futurs peut être calculée à partir de f (θ | x).
Cependant, la prime bayésienne qui sera chargée à l’assuré est une prime de crédibilité
ayant une forme linéaire seulement sous une famille de distributions et lois à priori conjuguées
spécifiées et doit être sous la fonction de perte de l’erreur quadratique.
PB = z × Pexpérience + (1 − z) × Pcollective
La forme de cet estimateur dans le cas ou π (θ) n’est pas conjuguée est toujours difficile
à obtenir à cause des intégrales compliquées. L’approximation de Lindley est une méthode
numérique d’approximation très utilisée pour résoudre ces formes d’intégrales et qui donne
des résultats numériques.
Notre étude se focalise sur l’estimation de la prime bayésienne, le problème majeur
réside dans le choix de la distribution de probabilité conditionnelle et la distribution à priori.
Le modèle de Bühlmann (1967) a développé des modèles dont la prime d’un contrat
est déterminée, en minimisant l’erreur quadratique moyenne entre la prime bayésienne et
son approximation. Bühlmann (1969) a forcé cette approximation à être linéaire et la prime
obtenue s’avère être une combinaison linéaire entre l’expérience individuelle X et celle de
l’ensemble du portefeuille, soit équivalente à la prime de crédibilité. On peut choisir une
autre variable exprimant l’expérience individuelle comme le quantile ζ p , Pitselis(2013) a
intégré le quantile au modèle de la crédibilité classique de Bühlmann (1967) il a trouvé des
résultats intéressants par rapport au modèle de Bühlmann (1967).
9
Notre étude repose sur l’utilisation de la décomposition de quantile pour simplifier le

modèle de Bühlmann (1969), on établit une prime de crédibilité plus réaliste que le modèle
de Pitselis (2013).
La thèse s’articule autour de quatre chapitres, le premier chapitre aborde d’un point
de vue plus précis la notion de tarification (dite à priori) pour des risques de masse. Nous
présentons ainsi en détails l’utilisation des modèles linéaires généralisés (GLM pour Ge-
neralize Linear Models). Le deuxième chapitre est consacré à la tarification par expérience
(ou à posteriori) très utile (bonus-malus et la théorie de la crédibilité). Le troisième et le
quatrième chapitre sont concentrés sur le calcul de prime dans la théorie de crédibilité.
En premier lieu, on estime la prime dans le cas où il est impossible d’établir une prime
de crédibilité, on utilise une combinaison entre la distribution de Gamma-Lindley et des
lois à priori informatives (l’extension de Jeffrey et gamma) sous deux fonctions de perte
(erreur quadratique, linex). On termine par une simulation numérique et une étude com-
parative de cette prime obtenue sous différentes fonctions de perte. De plus, on expose
une interprétation concernant la décomposition de quantile basée sur les modèles statis-
tiques ”Variance Components Models” dans le quatrième chapitre, une nouvelle prime de
crédibilité est proposée. On termine par une application numérique et une étude compara-
tive de la nouvelle prime et la prime du modèle de Bühlmann (1969) et Pitselis (2013). Les
conclusions et les perspectives sont présentées.
10
Chapitre 1
Tarification à priori
La tarification à priori est une méthode de tarification utilisée par les actuaires afin de
mieux segmenter les portefeuilles d’assurance. Cette méthode consiste à prédire le nombre
espéré de réclamations en fonction des caractéristiques observables des assurés tels que
l’âge, le sexe, le kilométrage, l’utilisation du véhicule, l’occupation, etc. Le but de la tari-
fication à priori est de construire des classes de risque homogènes où les assurés apparte-
nants à une même classe de risque paient la même prime. Une classe de risque peut être vue
comme un ensemble de caractéristiques, où les assurés appartenants à une même classe de
risque ont des caractéristiques observables identiques. Les caractéristiques observables des
assurés sont appelées variables de classification ou variables à priori. En général, la classi-
fication à priori est faite à l’aide des modèles de régression ou modèles linéaires généralisés
(GLM) développés par Nelder et Wedderburn (1972). Le but de la régression est d’analyser
la relation qui existe entre la variable réponse et les variables explicatives. En assurance au-
tomobile, la variable réponse représente généralement le nombre de réclamations ou le coût
des réclamations tandis que les variables explicatives représentent les variables de classifi-
cation. Cette relation peut être exprimée comme une équation qui prédit la variable réponse
à l’aide d’une fonction (combinaison linéaire) impliquant les variables explicatives et les
paramètres servant à la prédiction. Lors de la tarification à priori, on modélise généralement
le nombre de réclamations par les distributions de Poisson, binomiale négative, etc., tan-
11
dis que le coût des réclamations est généralement modélisé par les distributions gamma,
inverse-gaussienne, etc. Les techniques de classification des risques ont été le sujet de plu-
sieurs articles issus de la littérature actuarielle. On peut citer entre autres, Dionne et Vanasse
(1989) qui ont utilisé un modèle de régression binomiale négative et Dean, Lawless et Will-
mot (1989) qui ont utilisé la distribution de Poisson-inverse gaussienne pour modéliser le
nombre de réclamations.
1.1 Les modèles linéaires généralisés
1.1.1 Petit historique des applications actuarielles des modèles de rég-

ression
Longtemps, les actuaires se sont limités à utiliser le modèle linéaire gaussien lors-
qu’il s’agissait de quantifier l’impact de variables explicatives sur un phénomène d’intérêt
(fréquence ou coût des sinistres, probabilité d’occurrence d’événements assurés, ...). A
présent que la complexité des problèmes statistiques qui se posent à l’actuaire s’est considér-
ablement accrue, il est crucial de se tourner vers des modèles tenant mieux compte de la
réalité de l’assurance que ne le fait le modèle linéaire. Ce dernier impose en effet une série
de limitations peu conciliables avec la réalité des nombres ou des coûts des sinistres : den-
sité de probabilité (approximativement) gaussienne, linéarité du score et homoscédasticité.
Même s’il est possible de s’affranchir de certaines de ces contraintes en transformant
préalablement la variable réponse à l’aide de fonctions bien choisies, l’approche linéaire
s’accompagne de nombreux désavantages (travail sur une échelle artificielle, difficultés de
revenir aux quantités initiales, ...).
Une première étape dans l’utilisation de modèles plus appropriés à la réalité de l’assu-
rance a été franchie lors de l’application en sciences actuarielles à la fin du 20ème siècle par
les actuaires londoniens de la City University des modèles linéaires généralisés (GLM, pour
Generalized Linear Models). Ces modèles, introduits en statistique par Nelder & Wedder-
12
burn (1972), permettent de s’affranchir de l’hypothèse de normalité, en traitant de manière

unifiée des réponses dont la loi fait partie de la famille exponentielle linéaire (la quelle
compte, outre la loi normale, les lois de Poisson, binomiale, Gamma et Inverse Gaussienne).
Voyez notamment Gouriéroux, Monfort & Trognon (1984).
La régression de Poisson (et les modèles apparentés, tels que la régression binomiale
négative) est à présent un outil de choix pour l’élaboration d’une tarification automobile,
supplantant largement le modèle linéaire général et la régression logistique pour l’ana-
lyse des nombres de sinistres. La percée de cette méthode au sein des compagnies date
de l’inclusion dans les logiciels statistiques les plus usités (SAS en tête) de procédures
permettant d’appliquer cette technique (Genmod, en l’occurrence). Outre l’approche du
maximum de vraisemblance, les techniques GLM permettent l’analyse d’un grand nombre
de phénomènes dans une optique de quasi- vraisemblance, en ne spécifiant que la structure
moyenne-variance. Les économètres français ont à cet égard prouvé des résultats fonda-
mentaux de convergence des estimateurs obtenus de cette façon. Voyez notamment Gou-
rieroux, Monfort & Trognon (1984).
Plus récemment, les techniques GLM ont été appliquées avec succès aux problématiques
de l’assurance vie (établissement de tables de mortalité, estimation des indicateurs démogra-
phiques, projection de la mortalité, etc.). Voyez Del Warde & Denuit (2005) pour de nom-
breux exemples.
Ce chapitre est basé sur Mccullagh & Nelder (1989), Antoniadis, Berruyer & Carmona
(1992), Dobson (2002) et Fahrmeir & Tutz (2002). Nous insisterons sur le fait que les
estimateurs du maximum de vraisemblance peuvent être obtenus à l’aide d’ajustements
des moindres carrés pondérés répétés, en définissant des pseudo-réponses appropriées.
Ceci nous permettra de lever l’hypothèse de linéarité du score en passant aux modèles
généralisés additifs.
Afin de bien comprendre les généralisations du modèle linéaire gaussien dont il est
question dans cette section, rappelons que dans le cadre de ce modèle, on suppose que l’on
cherche à modéliser une variable Y à l’aide d’un certain nombre de variables explicatives
13
t
X = X1 , ..., X p . De façon naturelle, la régression linéaire revient à supposer que
Y v N(µ, σ2 ) où µ = X t β.
Ce modèle proposé par Legendre et Gauss au début du 19ème siècle, et étudié en détails
par Fisher dans les années 20, s’est imposé en économétrie, mais s’avère difficilement
utilisable en assurance.
Les variables que l’on cherche à modéliser en assurance sont des coûts (à valeur dans
R+ ), des nombres de sinistres (à valeur dans N) ou des indicatrices du fait d’être sinistré
dans l’année (à valeur dans {0, 1}). Dans ce dernier cas, nous avions vu que les variables
latentes pouvaient être une solution intéressante. Plus particulièrement, on considérait des
modèles de la forme
Y v Bin(1, µ) où µ = E[Y] = F(X t β),
où F désigne la fonction de répartition associée à la loi logistique (pour les modèles LO-
GIT) ou à la loi gaussienne centrée et réduite (pour les modèles PROBIT).
De façon générale, on souhaite garder la structure linéaire du score en β, et considérer
que l’espérance de Y est une transformation de cette combinaison linéaire. Plus précisément,
on voudrait passer à des modèles de régression du type
Y v Loi (µ) où µ = E[Y] = g−1 (X t β),
où g−1 est une fonction ”bien choisie”, et où Loi désigne une loi paramétrique permettant
de modéliser correctement notre variable d’intérêt.
Ce type d’approche est à la base des modèles dits “linéaires généralises”, qui étendent le
modèle gaussien à une famille de lois particulière, appelée famille exponentielle (naturelle).
Dans ce chapitre, nous allons nous intéresser à la famille des modèles linéaires général-
isés. Font partie de cette classe, en plus de la loi normale, les lois de probabilité à deux
paramètres θ et φ dont la densité (discrète ou continue) peut se mettre sous la forme
yθ − b (θ)
f (y | θ, φ) = exp( + c(y, φ)), y ∈ S , (1.1)
φ
14
où le support S est un sous-ensemble de N ou de R. Le paramètre θ est appelé paramètre

naturel et φ est le paramètre de dispersion.
Souvent, une pondération est nécessaire, et on remplace φ par φ | ω, où ω est un poids
connu à priori.
Examinons quelques exemples de lois usuelles dont la densité peut se mettre sous la
forme (1.1).
Example 1.1 (Loi de Poisson). Si on considère la loi de Poisson Poi (λ) , on a

λy
f (y | λ) = exp (−λ) = exp (y ln λ − λ − ln y!) , y ∈ N,
y!
d’où S = N, θ = ln λ, φ = 1, b(θ) = exp θ = λ et c(y, φ) = − ln y!.
Example 1.2 (Loi Gamma). La densité associée à la loi Gamma peut se réécrire
!ν
1 ν ν−1 ν
!
y exp − y
Γ (ν) µ µ
qui peut se mettre sous la forme (1.1) avec S = R+ , θ = − µ1 , b (θ) = − ln (−θ) et φ = ν−1 .
Toutes les lois de probabilité dont la densité peut se mettre sous la forme (1.1) ne
possèdent pas de paramètres de dispersion φ. Ainsi, les exemples ci-dessus nous apprennent
par exemple que pour la loi de Poisson, φ = 1. Pour les lois possédant un paramètre de
dispersion φ, celui-ci contrôle la variance, comme nous le verrons plus loin. La prime pure
ne dépend quant à elle que du paramètre naturel θ. Ainsi, lorsque l’actuaire ne s’intéresse
qu’à la prime pure, le paramètre θ est le paramètre d’intérêt tandis que φ est considéré
comme un paramètre de nuisance. Toutefois, le paramètre φ est également fort important
dans la mesure où il contrôle la dispersion (et donc le risque).
1.1.2 Moyenne et variance
Pour une variable aléatoire Y dont la densité peut se mettre sous la forme (1.1), on peut
exprimer les deux premiers moments de Y à l’aide des fonctions b et c. Pour ce faire, notons
∂
U= ln f (Y | θ, φ) .
∂θ
15
et
0 ∂2
U = ln f (Y | θ, φ) ,
∂θ2
de sorte que l’information de Fisher vaut V[U] = −E[U ].
0
Proposition 1.3 Pour une variable aléatoire Y dont la densité est de la forme (1.1), on a
0 00
E[Y] = b (θ) et V[Y] = b (θ) φ/ω,
où b et b désignent respectivement les dérivées premières et secondes par rapport à θ.

0 00
Preuve. Nous savons que E[U] = 0. Il suffit alors de remarquer que
∂ yθ − b (θ)
! 0
d y − b (θ)
ln f (y | θ, φ) = + c(y, φ) =
dθ ∂θ φ φ/ω
ce qui donne
0
E[Y] − b (θ)
E[U] = = 0,
φ/ω
d’où l’expression annoncée pour la moyenne de Y. D’autre part, puisque E[U] = 0,
 Y − b0 (θ) 2 

 !
V[U] = E[U ] = E 
2  = V[Y]
φ/ω {φ/ω}2
et
!2
∂
Z
E[U ] =
2
ln f (y | θ, φ) f (y | θ, φ) dy
y∈s ∂θ
∂ ∂
Z
= ln f (y | θ, φ) f (y | θ, φ) dy
y∈s ∂θ ∂θ
∂
" 2 # 00
b (θ)
= E − 2 ln f (Y | θ, φ) = .
∂θ φ/ω
Ainsi,
00
b (θ) 0
V[U] = E[−U ] = .
φ/ω
En combinant les deux dernières égalités, on obtient le résultat annoncé.

Dès lors, la variance de Y apparaı̂t comme le produit de deux fonctions :
16
1. la première, b (θ), qui dépend uniquement du paramètre θ est appelée fonction va-
00
riance ;
2. la seconde est indépendante de θ et dépend uniquement de φ.
En notant µ = E[Y], on voit que le paramètre θ est lié à la moyenne µ. La fonction
variance peut donc être définie en fonction de µ nous la noterons dorénavant V (µ).
La fonction variance est très importante dans les différents modèles, comme on peut le
constater au Tableau 1.1. Il est important de noter que, le cas de la loi normale mis à part,
la variance de Y est toujours fonction de la moyenne et croı̂t en fonction de cette dernière
pour les lois de Poisson, Gamma et Inverse Gaussienne (à paramètre φ fixé).
Loi de probabilité V (µ)

Normale 1
Poisson µ
Gamma µ2
Binomiale µ (1 − µ)
Table. 1. 1- Fonctions variance associées aux lois de probabilité usuelles dont la densité
est de la forme (1.1).
1.1.3 Modèle de régression
Considérons des variables aléatoires indépendantes mais non identiquement distribuées

Y1, Y2 , ..., Yn dont la densité est de la forme (1.1). Plus précisément, supposons que la densité
de probabilité de Yi est
yi θi − b (θi )
!
f (yi | θi , φ) = exp + c(yi , φ) , yi ∈ S . (1.2)
φ/ωi
17
Dès lors, la densité jointe de Y1, Y2 , ..., Yn est

n
Y
f (y | θ, φ) = f (yi | θi , φ)
i=1
P n n 
 yi θi − P b (θi ) n

 i=1 i=1
X 
= exp  + c(yi , φ) .
 φ/ωi i=1

Bien entendu, la vraisemblance vaut L (θ, φ | y) = f (y | θ, φ). On suppose que les θi sont
fonction d’un ensemble de p + 1 paramètres β0 ,β1 ,... ,β p , disons. Plus précisément, notant
µi la moyenne de Yi , on suppose que
p
X
g (µi ) = β0 + β j xi j = xit β = ηi
j=1
où la fonction monotone et dérivable g est appelée fonction de lien, le vecteur xi contient
des variables explicatives relatives à l’individu i et le vecteur β contient les p+1 paramètres.
Ainsi, un modèle linéaire généralisé est composé de trois éléments, à savoir
(i) de variables à expliquer Y1, Y2 , ..., Yn dont les densités sont de la forme (1.2).
t
(ii) d’un ensemble de paramètres β = β0 , β1 , ..., β p appartenant à un ouvert non vide
de R p+1 et des variables explicatives X = (x1 , x2 , ..., xn )t la matrice X de dimension n×(p+1)
est supposée être de rang p + 1, i.e. la matrice carrée X t X de dimension (p + 1) × (p + 1)
est inversible ;
(iii) d’une fonction de lien g telle que g (µi ) = xit β où µi = E [Yi ] qui lie le prédicteur
linéaire ηi = xit β à la moyenne µi de Yi .
La plupart du temps, les variables explicatives sont toutes catégorielles dans un tarif
commercial. Une compagnie segmentant selon le sexe, le caractère sportif du véhicule et
l’âge de 1’assuré (3 classes d’âges, à savoir moins de 30 ans, 30-65 ans et plus de 65 ans).
Un assuré sera représenté par un vecteur binaire donnant les valeurs des variables ayant
servi à coder les caractéristiques de l’individu.
On choisit comme niveau de référence (i.e. celui pour lequel tous les Xi valent 0) les
modalités les plus représentées dans le portefeuille. Les résultats s’interpréteront ensuite
18
comme une sur ou sous-sinistralité par rapport à cette classe de référence. Ainsi, le vecteur
(0, 1, 1, 0) représente un assuré masculin de moins de 30 ans conduisant un véhiculé sportif.
p
Le prédicteur linéaire (ou score) sera de la forme β0 + β j X j et le nombre ou le coût moyen
P
j=1
de sinistre est en général une fonction non-décroissante du score. L’ordonnée à l’origine,
ou intercept, β0 représente donc le score associé à la classe de référence (i.e. celle pour
laquelle Xi = 0 pour tout i, à savoir les hommes entre 30 et 65 ans dont le véhicule n’a pas
de caractère sportif) ; si β j > 0, cela indique que le fait de présenter la modalité traduite
par X j est un facteur agravant la sinistralité par rapport à celle de l’individu de référence,
au contraire β j < 0 indiquera les classes d’assurés moins risqués que les individus de
référence.
Example 1.4 (Régression de poisson). La régression log-linéaire de poisson est obtenue

en considérant Yi ∼ Poi(λi ), la fonction de lien étant celle induite par le paramètre naturel,
i.e.
ln λi = xit β ⇐⇒ λi = exp xit β .

Le plus souvent, on dispose d’une mesure de l’exposition au risque et on considère Yi ∼

Poi(di λi ), où di est la durée de la couverture octroyée à l’assuré i (cette durée multiplie la
fréquence annuelle λi sous l’hypothèse d’un processus de Poisson gouvernant la survenance
des sinistres).
1.1.4 Fonction de lien canonique
Chacune des lois de probabilité de la famille exponentielle linéaire possède une fonction
de lien spécifique, dite fonction de lien canonique, définie par θ = η, où θ est le paramètre
naturel. Le lien canonique est tel que g(µi ) = θi , or, µi = b (θi ) d’où g−1 = b . Les fonctions
0 0
de lien canoniques sont reprises au Tableau 1.2.

19
Loi de probabilité Fonction de lien canonique

Normale η=µ
Poisson η = ln µ
Gamma η= 1
µ
Binomiale η = ln µ − ln (1 − µ)
Table.1.2- Liens canoniques associés aux lois de
probabilité usuelles dont la densité est de la forme (1.1).
1.1.5 Equations de vraisemblance
En pratique, les coefficients de régression β0 , β1 , ..., β p et le paramètre de dispersion φ

sont inconnus et doivent donc être estimés sur la base des données. Dans cette subsection,
nous nous concentrons sur l’estimation des coefficients de régression β par la méthode du
maximum de vraisemblance. Il s’agit donc de maximiser la log- vraisemblance
n
X
L (θ (β) | y, φ) = ln f (yi | θi , φ)
i=1
n n
X yi θi − b (θi ) X
= + c (yi , φ) ,
i=1
φ/ωi i=1
où E [Yi ] = b (θi ) = µi et g (µi ) = xit β = ηi avec g monotone et dérivable. Rechercher

0
les estimateurs du maximum de vraisemblance revient à rechercher les β0 , β1 , ..., β p qui

vérifient les équations
U j = 0 pour j = 0, 1, ..., p, (1.3)
où
∂L (θ (β) | y, φ)
Uj =
∂β j
n
X ∂ ln f (yi | θi , φ)
=
i=1
∂β j
n
∂ yi θi − b (θi )
X !
= + c (yi , φ) .
i=1
∂β j φ/ω i
20
Afin d’obtenir U j , on se sert de la formule
∂ ln f (yi | θi , φ) ∂ ln f (yi | θi , φ) ∂θi ∂µi

= .
∂β j ∂θi ∂µi ∂β j
Comme µi = b (θi ), il vient

0
∂ ln f (yi | θi , φ) yi − b (θi ) yi − µi
0
= =
∂θi φ/ωi φ/ωi
∂µi 00
= b (θi ) ,
∂θi
et
∂µi ∂µi ∂ηi ∂µi
= = xi j .
∂β j ∂ηi ∂β j ∂ηi
On obtient
∂ ln f (yi |θi ,φ) ∂µi
∂ ln f (yi | θi , φ) ∂θi ∂β j
=
∂β j ∂µi
∂θi
(yi − µi ) xi j ∂µi
∂ηi
=
φ/ωi b00 (θi )
(yi − µi ) xi j ∂µi
= ,
V[Yi ] ∂ηi
et finalement
n
X (yi − µi ) xi j ∂µi n
X (yi − µi ) xi j
Uj = = .
i=1
V[Yi ] ∂ηi i=1
V[Yi ]g0 (µi )
Comme V[Yi ] = b (θi ) φ/ωi ,

00
n
X xi j
U j = 0 ⇐⇒ ωi (yi − µi ) = 0,
i=1
b (θi ) g0 (µi )
00
où le paramètre φ n’apparaı̂t plus. Les équations de vraisemblance relatives à β peuvent

donc être résolues sans se préoccuper de φ. Notez que si on choisit la fonction de lien
canonique, les équations de vraisemblance deviennent
n
X
ωi (yi − µi ) xi j = 0 pour j = 0, 1, ..., p.
i=1
21
Example 1.5 (Régression de Poisson). Supposons les réalisations n1 , n2 , ..., nu de variables

aléatoires de loi Poi(di λi ), la log-vraisemblanee est donnée par
n
X
L (β | n) = ln £ (β | n) = (− ln ni ! + ni (ηi + ln di ) − λi ) .
i=1
Les équations de vraisemblance s’écrivent donc

n
X n
X
ni = λi (1.4)
i=1 i=1
et pour j = 0, 1, ..., p,
n
X
xi j (ni − λi ) = 0. (1.5)
i=1
Comme les facteurs de risque en pratique ont le plus souvent un nombre fini de niveaux
et que les variables explicatives sont les indicatrices de ces niveaux, les équations de vrai-
semblance (1.5) ont une signification tarifaire très importante. Elles garantissent que pour
chaque sous-portefeuille correspondant à un niveau d’un des facteurs de risque, le nombre
total, des sinistres observés est égal à son homologue théorique. En effet, supposons par
exemple que xi1 = 1 si l’individu i est un homme, et 0 sinon ; (1.5) pour j = 1 garantit alors
que
X X
ni = λ̂i
hommes hommes
En pratique, si le portefeuille est suffisamment stable, on espère avoir des égalités approxi-
matives lorsque le modèle sera appliqué dans le futur.
Example 1.6 (Régression Gamma). Notons ni le nombre de sinistres causés par l’assuré
i, et, lorsque ni > 0, désignons par ci1 , ci2 , ..., cini les coûts de ceux-ci. Si nous considérons
ci1 , ci2 , ..., cini comme des réalisations de variables aléatoires indépendantes et de même loi
Gamma de moyenne µi et de variance µ2i /ν, la vraisemblance s’écrit
ni
YY
£ (β | c) = f (cik | xi , ν)
i|ni >0 k=1
ni !ν
ν ν
! !
YY 1
= cν−1 exp − cik .
i|ni >0 k=1
Γ (ν) µi ik
µi
22
Les équations de vraisemblance à résoudre pour obtenir β̂ sont les suivantes :

ni
∂ ∂ XX νcik
!
L (β | c) = −ν ln µi − =0
∂β j ∂β j i|n >0 k=1 µi
i
ou encore
ni !
XX cik
xi j 1− = 0.
i|ni >0 k=1
µi

Si on définit ĉi = µ̂i = exp β̂t xi le coût moyen d’un sinistre pour l’assuré i, l’estimateur du
maximum de vraisemblance β̂ de β est solution des équations
!
X ci•
ni − xi = 0.
i|n >0
ĉi
i
1.1.6 Résolution des équations de vraisemblance
Les estimateurs du maximum de vraisemblance β̂ j des paramètres β j sont solutions du

système (1.3). Les équations composant ce système ne possèdent en général pas de solution
explicite et doivent dès lors être résolues numériquement. On peut par exemple utiliser la
méthode de Newton-Raphson, que nous rappelons brièvement ci-dessous.
Notons U(β) le vecteur gradient de la log-vraisemblance, dont la composante j est
∂
U j (β) = L (β | y)
∂β j
et notons H(β) la matrice hessienne de L (β | y), i.e. celle dont l’élément ( j, k) est
∂2
L (β | y) .
∂β j ∂βk
Pour β∗ proche de β̂, un développement limité de Taylor donne
0 = U(β̂) ≈ U(β∗ ) + H(β∗ )(β̂ − β∗ ),
qui permet d’écrire

U(β∗ ) + H(β∗ )(β̂ − β∗ ) ≈ 0,
ou encore
β̂ ≈ β∗ − H −1 (β∗ )U(β∗ ). (1.6)
23
Ceci suggère une procédure itérative pour obtenir l’estimateur du maximum de vrai-
semblance β̂ de β, partant d’une valeur initiale β̂(0) que l’on espère proche de β̂, on définit
la (r + 1)-ème valeur approchée β̂(r+1) de β̂ à partir de la r-ème β̂(r) par
β̂(r+1) ≈ β̂(r) − H −1 (β̂(r) )U(β̂(r) ). (1.7)
Cette procédure itérative pour obtenir l’estimateur du maximum de vraisemblance cor-

respond à la méthode de Newton-Raphson.
Remarque 1.7 Signalons une méthode astucieuse de résolution itérative des équations de
vraisemblance. A l’étape r, il suffit de minimiser un critère des moindres carrés pondérés
du type
n
X 2
ωk zk − xkt β
k=1
où les pseudo-réponses zk sont données par
∂ηk
zk = xkt β(r) + (yk − µk )
∂µk
les poids
∂ηk
!
ω−1 = V (µk ) .
k
∂µk
Dans ces formules, µk et ηk sont calculées pour les valeurs courantes β(r) du paramètre β.
On stoppera la procédure lorsque la différence entre β(r) et β(r−1) est suffisamment petite.
Example 1.8 (Régression de Poisson). Si les observations ni sont, de loi Poi (λi ), le vecteur
gradient, de L (β | n), de dimension p + 1, est donné par
n
X
U (β) = xi (ni − λi ) avec λi = di exp βt xi ,

i=1
où l’on a ajouté au vecteur xi une composante xi0 = 1. La matrice hessienne, de dimension
(p + 1) × (p + 1) est donnée par
n
X
H(β) = − xi xit λi = −X t diag(λ)X
i=1
24
où diag(λ) désigne la matrice diagonale de dimension n × n dont les éléments principaux
sont λ1 , ..., λn .
La procédure itérative pour obtenir l’estimateur du maximum de vraisemblance β̂ de β
est la suivante : partant d’une valeur initiale β̂(0) que l’on espère proche de β̂, on définit la
(r + 1)-ème valeur approchée β̂(r+1) de β̂ à partir de la r-éme β̂(r) par
−1
β̂(r+1) = β̂(r) + (X t diag λ̂(r) )X X t n − λ̂(r) . (1.8)
Une bonne valeur initiale β̂(0) est obtenue en prenant β̂(0)

0 = ln n, où n est le nombre moyen
de sinistres par police, et β̂(0)

j = 0 pour j = 1, ..., p. Notez que β̂
(0)
correspond en fait au
modèle de Poisson homogène.
L’algorithme itératif fournissant l’estimateur du. maximum de vraisemblance β dans le
modèle de Poisson peut encore s’écrire
X (r) t −1 X
 n  n

β̂(r+1)
= β̂ +  λ xi xi 
(r)
ixi ni − λ(r) i
i=1 i=1
 n q ! q !t −1
X
=  λi xi λi xi 
(r) (r)

i=1
n
ni − λ(r)
X q !q q 
λi xi  λi + λi xi β̂  .
(r)
 (r) i (r) t (r)

i=1 λi
(r)
On constate que β̂(r+1) n’est autre que l’estimateur des moindres carrés associé au modèle
de régression linéaire
ni − λ(r)
q   q !t
λi  + xi β̂  = λi xi β̂(r+1) + i ,
(r) 
 i t (r)
 (r)
λi
(r)
où i est un terme d’erreur gaussien centré. L’estimateur du maximum de vraisemblance du

paramètre β peut donc être obtenu à l’aide d’une méthode des moindres carrés itérative.
De manière équivalente, β̂ peut être obtenu grâce à un ajustement des moindres carrés
pondérés des pseudo-variables
ni − λ(r)
z(r)
i = i
+ xit β̂(r)
λ(r)
i
q
sur xi , où les poids λ(r)
i changent à chaque itération.
25
1.1.7 Intervalle de confiance pour les paramètres
Méthode du rapport de vraisemblance

La méthode du rapport de vraisemblance est basée sur le profil de vraisemblance, défini
pour le paramètre β j comme la fonction

£j βj | y = max £ (β | y) .
β0 ,...,β j−1, β j+1 ,...,β p
Si β̂ MV est l’estimateur du maximum de vraisemblance de β, 2{L(β MV | y) − L j (β j | y)}

est approximativement de loi du khi-deux à un degré de liberté, pour autant que β j soit la
vraie valeur du paramètre, où L j (β j | y) = ln £ j (β j | y). Dès lors, un intervalle de confiance
au niveau 1 − α pour β j est fourni par l’ensemble des valeurs ζ telles que la différence
L(β̂ MV | y) − L j (ζ | y) est suffisamment petite, ou encore telles que 2{L(β̂ MV | y) − L j (ζ |
y)} ≤ χ21−α,1 , i.e.
1
IC = {ζ ∈ R | L j (ζ | y) ≥ L(β̂ MV | y) − χ21−α,1 }.
2
Les extrémités de cet intervalle sont obtenues numériquement en approximant la fonc-
tion de vraisemblance par une surface de degré 2. Spécifiquement, nous recourons à l’ap-
proximation
1
L(β | y) ≈ L(β0 | y) + (β − β0 )t U(β) + (β − β0 )t H(β)(β − β0 ),
2
qui devrait être de bonne qualité pour β0 suffisamment proche de β. En approximant H(β)
par son espérance mathématique −τ on obtient encore
1
L(β | y) ≈ L(β0 | y) + (β − β0 )t U(β) − (β − β0 )t τ(β − β0 ).
2
Méthode de Wald
Grâce à l’approximation normale pour β̂, un intervalle de confiance au niveau de confiance
1 − α pour β j est donné par
h √ i
β̂ j ± z α2 v j j
où v j j est l’élément diagonal ( j j) de τ−1 . Cet intervalle de confiance est souvent appelé
intervalle de Wald. Les éléments de la diagonale de τ−1 traduisent donc la précision des
26
estimations ponctuelles β̂ j , tandis que les éléments hors diagonale estiment les covariances
existant entre les estimateurs des β j .
1.1.8 Tests d’hypothèse sur les paramètres
On désire tester l’hypothèse Ho : β = β0 = (β0 , β1 , ..., βq )t contre H1 : β = β1 =

(β0 , β1 , ..., βq )t où q < p < n. Ceci revient donc à tester la nullité simultanée de βq+1 , ..., β p .
On utilise alors la statistique ∆ qui vaut la différence entre les déviances des deux modèles,
à savoir
∆ = D0 − D1 = 2(ln Lβ̂1 (y) − ln Lβ̂0 (y)) ≥ 0.
On peut montrer que ∆ est approximativement de loi χ2p−q . On rejette H0 au profit de H1

lorsque
∆obs > χ2p−q;1−α ,
où χ2p−q;1−α est le quantile d’ordre 1 − α de la loi χ2p−q .

L’intérêt de ce type de test apparaı̂t lorsque l’actuaire se demande s’il convient de grou-
per certains niveaux des variables catégorielles. En effet, le test de nullité des coefficients
de régression indique seulement si le niveau en question doit être fusionné avec le niveau de
référence. Il se pourrait cependant que deux niveaux d’une variable catégorielle soient sta-
tistiquement équivalents, mais diffèrent tous deux du niveau de référence. On s’intéressera
alors à un test de type H0 : β1 = β2 . On pourrait tester H0 : β3 = 0 et H0 : β4 = 0, qui nous
indiqueraient si les moins de 30 ans ou les plus de 60 ans diffèrent des 30 − 65 ans, mais
aussi H0 : β3 = β4 qui nous indiquera s’il convient de grouper les moins de 30 ans avec les
plus de 65 ans.
1.1.9 La pratique des modèles linéaires généralisés et l’importance du

choix de la sous-famille exponentielle
Les quelques exemples mentionnés en introduction suffisent souvent en pratique : modé-

lisation des coûts des sinistres par un modèle de régression Gamma, et modélisation des
27
nombres par un modèle de régression de Poisson. Pourtant, le choix de la sous-famille n’est

pas neutre sur une tarification.
Considérons ainsi l’exemple (simpliste) suivant, basé sur trois observations,
observation i 1 2 3
variable à expliquer Yi (coût des sinistres) 1 2 8
variable explicative Xi (puissance du véhicule) 1 2 3
On cherche à ajuster un modèle linéaire généralisé, i.e. g(E[Y]) = a + βX où g est une
fonction de lien. La Figure 1.1 présente l’influence du choix de la loi de probabilité (pour
la fonction de lien canonique), en considérant successivement Yi de loi Normale, de loi de
Poisson et de loi Gamma.
Si les trois lois donnent des résultats proches au bord (pour des valeurs de X proches de
1 ou de 3), ailleurs, le comportement est sensiblement différent. En particulier, par rapport
aux deux autres lois, la loi Gamma propose un coût des sinistres plus important (à puissance
égale) pour les petites et les grandes puissances, et en contrepartie propose un coût moins
important pour les puissances moyennes. Ce coût reflétant la prime, et si le vrai modèle est
celui de Poisson, on peut interpréter ce graphique de la façon suivante :
- avec une modélisation normale, les véhicules de puissance moyenne payent pour le
risque des autres, en ayant une prime plus importante que leur vrai risque,
- avec une modélisation Gamma, les véhicules de puissance importante, ou très faible,
payent pour le risque des véhicules de puissance moyenne, sous-tarifés.
Aussi, et bien que cette analyse doit être mitigée par la prise en compte de l’impact de
la fonction de lien, on notera que le choix de la loi de la variable à expliquer n’est en aucun
cas neutre quant aux primes pures qui en découlent.
L’importance de la fonction de lien
Nous avons noté ci-dessus que le choix de la sous-famille exponentielle considérée
n’était pas neutre quant à la tarification. Le même résultat reste vrai pour le choix de la
fonction de lien. Toujours sur les trois observations, la Figure 2.1 représente l’influence de
28
Figure 1.1: Ajustement d’un modèle linéaire géniralisé à partir de trois points, pour des
lois normales, Poisson et Gamma.
la fonction de lien (pour une loi de Poisson et une loi Gamma pour Y). On peut noter qu’à
famille de lois fixée, le choix de la fonction de lien n’est, là encore, pas neutre.
Toutefois, on notera qu’il est souvent d’usage d’utiliser la fonction de lien logarith-
mique puisqu’elle présente l’avantage de donner un modèle multiplicatif, et les coefficients
β j ont alors une interprétation simple, en terme de multiplicateurs.
Si le choix de la fonction de lien n’est pas innocent en matière de tarification, il est
toutefois possible de prendre cette fonction comme inconnue, et de chercher à l’estimer
à partir des données. Pour cela, la transformation de Box-Cox permet d’avoir la forme
paramétrique simple 
λ

 x − 1 /λ, si λ , 0,


g (x) = 

 log (x) ,

 si λ = 0.
On notera que λ = 1 correspond à une fonction lien identité (modèle additif), et λ → 0 à
une fonction de lien logarithmique (modèle multiplicatif). Si λ = −1, on retrouve également
29
la fonction lien inverse. Aussi, un grand nombre de fonctions de lien usuelles appartiennent
à cette famille. Il est alors possible de chercher λ qui maximise la vraisemblance du modèle.
Figure 1.2: Ajustement d’un modèle linéaire généralisé àpartir de trois points, pour des lois
de Poisson-Gamma, avec différentes fonctionliens.
30
Chapitre 2
Tarification à posteriori
Si toutes les caractéristiques influençant le nombre de réclamations pouvaient être me-

surables et incorporées dans la tarification, les classes de risque seraient probablement ho-
mogènes. Les différences individuelles par rapport à la moyenne ne causeraient pas un
réajustement de la prime. Malheureusement, plusieurs des caractéristiques des assurés ne
peuvent être prises en compte dans la tarification à priori soit parce qu’elles ne sont pas
observables, soit parce qu’elles sont difficilement mesurables. On peut citer entre autres
l’agressivité au volant, les réflexes, la conduite sous l’effet de l’alcool, etc. Il est bien connu
que ces variables cachées peuvent avoir un impact significatif sur le nombre de réclamations
des assurés Denuit et al. (2007). Par conséquent, le portefeuille est encore hétérogène
malgré l’utilisation de plusieurs variables de classification dans la tarification à priori. Pour
cette raison, les actuaires utilisent une méthode de tarification basée sur l’expérience si-
nistre des assurés. Connu sous le nom de tarification à posteriori, c’est une méthode utilisée
par les actuaires afin de tenir compte des différences individuelles de chaque assuré dans
le portefeuille. Cette méthode consiste à modéliser l’hétérogénéité du portefeuille à l’aide
d’un effet aléatoire. L’analyse à posteriori de cet effet aléatoire en fonction du nombre de
réclamations de l’assuré permet de réévaluer la prime à priori afin de refléter le risque réel
que représente l’assuré. L’utilisation de l’historique des réclamations pour ajuster la prime
de l’assuré vient du fait qu’il est bien connu que le meilleur prédicteur du nombre d’acci-
31
dents futurs que l’assuré déclarera n’est pas l’âge ou le type de véhicule mais le nombre
d’accidents passés qu’il a déclarés Denuit et al. (2007).
2.1 Systèmes bonus-malus
2.1.1 Vue d’ensemble des systèmes bonus-malus
Les actuaires utilisent plusieurs systèmes ou conceptes mathématiques afin de déterminer

la prime des assurés en fonction de leur expérience sinistre. Ces systèmes de tarifica-
tion à posteriori pénalisent les assurés responsables d’un ou plusieurs accidents déclarés
par des surcharges (majorations ou malus) et récompensent les assurés n’ayant pas eu de
réclamations par des escomptes (rabais ou bonus). D’un point de vue des assurés, il n’est
pas toujours clair de la façon dont l’assureur détermine les rabais et majorations en fonc-
tion de leur historique de sinistre. Pour cette raison, les actuaires ont développé de nouvelles
méthodes de tarification à posteriori connu sous le nom de système bonus-malus. Le but
de ce système est de déterminer de manière adéquate mais aussi de manière à être com-
pris d’un large public (comme les assurés ainsi que des gens dans la compagnie tels que
les agents, les courtiers, les administrateurs, les dirigeants, etc.), le montant de prime à al-
louer à chaque assuré en fonction de son historique de réclamations. Les premiers systèmes
bonus-malus furent utilisés en assurance automobile et remontent à aussi loin qu’en 1910
en Angleterre, suivi de près par le Canada en 1930 Lemaire (1995). Ces systèmes accor-
daient une réduction de 10% par exemple, en cas d’une année passée sans réclamation. En
cas de réclamation, aucune pénalité n’était appliquée. Depuis ce temps, les systèmes bonus-
malus ont beaucoup évolué et une théorie fondée sur les chaı̂nes de Markov a permis de
mieux les analyser. Leur principal avantage est d’offrir un moyen simple de tenir compte de
variables de tarification à posteriori, tout en récompensant les assurés qui conduisent pru-
demment. Les systèmes bonus-malus sont surtout utilisés en assurance automobile car il est
généralement reconnu qu’un conducteur a un certain contrôle sur son nombre d’accidents.
32
C’est pour ce domaine que la théorie a été le plus développée et a acquis sa terminologie.
Le principe des bonus-malus se retrouve aussi, entre autres, en réassurance et en assurance
collective.
À travers le monde, soit les systèmes bonus-malus sont imposés par le gouvernement,
soit le marché est complètement libre. Lorsqu’ils sont imposés par le gouvernement, tous
les assureurs doivent adopter le même système. Tandis que lorsque le marché est complète-
ment libre chaque assureur construit son propre système. En Europe, une loi sur le libre
marché est en cours d’application, tandis que dans les pays asiatiques les bonus-malus
sont général-ement réglementés par le gouvernement Lemaire (2004). En Amérique, les
deux types se retrouvent. Dans le cas particulier du Québec, la SAAQI utilise un système
semblable au bonus-malus pour pénaliser les infractions au code de la route. La configura-
tion des systèmes varie aussi à travers le monde. Certains sont très simples et ne tiennent
compte que du nombre de réclamations, tandis que d’autres tiennent aussi compte de la
sévérité des accidents, de la possibilité de non augmentation de la prime et de la possibilité
de couverture gratuite Lemaire (1995, 2004).
Dans cette section, nous analyserons les systèmes bonus-malus à partir du concept de
système de tarification. Cette présentation offre un cadre mathématique rigoureux qui per-
met de synthétiser les notions essentielles de la théorie.
2.1.2 Description d’un système bonus-malus
En assurance automobile, un assureur doit établir un système de tarification de sorte

à être compétitif tout en contrôlant le risque qu’il assume. Soit (Xt )t∈N le risque à tarifer
et (Ct )t∈N la classe de tarif d’un risque. Muni de cette notation, nous allons préciser la
terminologie.
Definition 2.1 (Classe de tarif) Une classe de tarif (Ct ) détermine la prime à être chargée
au temps t pour assumer le risque encouru dans la période [t, t + 1]. Le processus (Ct )t∈N
représente l’évolution de la classe de tarif d’un risque dans le temps.
33
Il est généralement supposé que (Xt )t∈N est indépendant de (Ct )t∈N , i.e. que le risque
ne dépend pas de la classe de tarif. Nous adopterons aussi cette hypothèse. Cependant, la
classe de tarif dépend du risque comme le requiert tout système de tarification.
Definition 2.2 (Variable de tarification à posteriori) Variable de tarification dont la valeur

est connue après que le risque soit observé, i. e. si (Yt )t∈N est une variable de tarification à
posteriori pour le risque (Xt )t∈N , alors
Yt+1 est connue une fois Xt+1 observé,∀t ∈ N.
Pour les variables à posteriori, le nombre de réclamations, le nombre d’accidents res-

ponsables, ou le nombre d’infractions au code de la route, sont des exemples. Des études
comme celle de Lemaire (1977), montrent que les variables à posteriori sont de bien meilleurs
prédicteurs pour l’estimation du risque comparativement aux variables à priori. C’est pour-
quoi il est crucial que la règle de décision u d’un système de tarification incorpore des va-
riables à posteriori dans son design. Un système bonus-malus définit Yt comme le nombre
d’accidents responsables et At comme la classe de tarif de la période précédente.
Definition 2.3 (Système bonus-malus)

(i) Un système bonus-malus est un système de tarification où en début de période un
risque est classé dans la classe de tarif Ct . En fin de période, le risque est classé dans la
classe Ct+1 , d’après la règle de décision u . La règle de décision u détermine la classe de
tarif Ct+1 en fonction de la classe de tarif Ct et du nombre d’accidents responsables observé
Yt+1 de la période précédente
Ct+1 = u (Ct , Yt+1 ) (2.1)
À t = 0, la valeur de C0 est fixé à i0 ,

(ii) les classe de tarif (Ct )t∈N peuvent prendre leur valeur parmi l classes possibles. La
classe 1 accorde le plus grand bonus, tandis que la classe l accorde le plus grand malus.
(iii) À la i-ième classe de tarif correspond un pourcentage d’une prime de base bi tel
que b1 ≤ b2 ≤ ... ≤ bi .
34
Dans un système bonus-malus, les variables à priori mentionnées plus haut, comme
l’âge ou le type de voiture, sont utilisées pour déterminer la prime de base d’un nouvel
assuré. La prime accordée par la classe i correspond ainsi à la prime de base multipliée par
le niveau de prime bi .
Le système bonus-malus classique, présenté dans la définition précédente, peut être
généralisé en modifiant la règle de décision u. Par exemple, en plus du nombre d’accidents
responsables observé Yt+1 , nous pourrions aussi faire dépendre les classes de tarifs du type
0
d’accident Yt+1 tel que
0

Ct+1 = u Ct , Yt+1 , Yt+1 .
Example 2.4 (Système bonus-malus de la SAAQ) Au Québec, la SAAQ utilise un système

de points d’inaptitude basé sur la gravité relative des infractions au code de la route. Par
exemple, brûler un feu rouge entraı̂ne 3 points d’inaptitude, tandis qu’un excès de vitesse,
de 100km sur la limite prescrite, entraı̂ne 12 points d ’inaptitude. Ces points sont inscrits
au dossier du conducteur pour une période de deux ans. Le système bonus-malus tel que
présenté par la société de l’Assurance Automobile du Québec, possède 5 classes (voir le
tableau 2.1).
Ce système n’est pas un bonus-malus traditionel du fait que les classes sont définies
d’après la gravité relative des infractions au code de la route, plutôt que du nombre d’in-
fractions au code de la route. Cependant, le système n’en demeure pas moins un système
bonus-malus en tant que tel et constitue un exemple d’un système où les infractions mi-
neures n’entraı̂nent pas les mêmes sanctions que les infractions majeures. En ce sens, le
système de la SAAQ corrige un des défauts des systèmes bonus-malus que plusieurs auteurs
35
ont relevés Lemaire (2004).
Classe Points d’inaptitude Niveau de prime

5 > 15 796%
4 [12, 14] 572%
3 [8, 11] 348%
2 [4, 7] 200%
1 [0, 3] 100%
Table. 2.1 - Classe attribuée selon le nombre de points d’inaptitude
Example 2.5 (Système bonus-malus classique) Le système bonus-malus de la Thaı̈lande,

tel que présenté dans Lemaire(1995), constitue un exemple représentatif d’un système
bonus-malus classique. Il possède 7 classes avec un niveau de prime (b1 , ..., b7 ) =(60%,
70%, 80%, 100%, 120%, 130%, 140%) et la classe de départ C0 = 4. La règle de transi-
tion est 




 max(1, i − 1), k = 0 et 1 ≤ i ≤ 7


4, k = 1 et i < 4



u(i.k) = 


5, k > 1 et i < 4







min(7, i + 1), k , 0 et i ≥ 4




Ceci est représenté de façon compacte dans le tableau (2 .2).
2.1.3 Analyse d’un système bonus-malus
Structure markovienne
Il est généralement supposé que (Yt )t∈N forme une suite de variables aléatoires indépend-
antes et identiquement distribuées. Ceci revient à assumer que les habiletés de conduite
d’un assuré ne changent pas dans le temps, i.e. que les conducteurs n’apprennent pas de
leurs expériences. Nous poserons aussi cette hypothèse. Comme nous le verrons à la re-
marque (2.26) les systèmes bonus-malus possèdent un mécanisme pour compenser les la-
cunes de cette hypothèse.
36
Classe Niveau de prime k = 0 k=1 k>1

7 140 6 7 7
6 130 5 7 7
5 120 4 6 6
4 100 3 5 5
3 80 2 4 5
2 70 1 4 5
1 60 1 4 5
Table. 2.2 - Classe attribuée après k réclamations
Proposition 2.6 (Chaı̂ne de Markov de la classe de tarif)
Le processus de classe de tarif (Ct )t∈N forme une chaı̂ne de Markov homogène.
Preuve. Soit it la valeur prise par la classe de tarif au temps t. Avec (2.1) nous obtenons
P(Ct+1 = it+1 | Ct = it , ..., C0 = i0 )
= P(u(it , Yt+1 ) = it+1 | u(it−1 , Yt ) = it , ..., C0 = i0 )
= P(u(it , Yt+1 ) = it+1 ) (2.2)
= P(u(it , Yt+1 ) | Ct = it ) = P(Ct+1 = it+1 | Ct = it ).
En (2.2) nous utilisons le fait que les variables C0 , ..., Ct définies par Y1 , ... , Yt sont
indépendantes de u(it , Yt+1 ). La probabilité conditionnelle P(Ct+1 = it+1 | Ct = it ) donnée
par P(u(it , Yt+1 ) = it+1 ) ne dépend pas de la classe de tarif Ct puisque les Yt sont identique-
ment distribuées. Donc le processus de classe de tarif (Ct )t∈N forme une chaı̂ne de Markov
homogène.
Remarque 2.7 (Équation stochastique récursive) L’équation (2.1) peut être vue comme
une équation stochastique récursive et, comme il est souligné dans Rolski et autres (1998),
le processus (Ct )t∈N forme alors automatiquement une chaı̂ne de Markov. La preuve utilisée
ci-haut est d’ailleurs celle présentée dans la référence précédente.
37
Soit {pk }k∈N la distribution de probabilité commune à la suite (Yt )t∈N , nous pouvons
obtenir la matrice de transition Q associée à (Ct )t∈N en considérant chacun des éléments qi j
tel que Q = (qi j )i, j=1,,,.,l .
Proposition 2.8 (Probabilités de transition de la classe de tarif) La probabilité de transi-

tion qi j de passer de la classe i à la classe j est donnée par
X∞
qi j = E 1 j (u (i, Yt+1 )) = pk 1 j (u (i, Yt+1 )) .
k=0
Preuve. Comme (Ct )t∈N forme une chaı̂ne de Markov, avec (2.1), nous obtenons le
résultat
qi j = P(Ct+1 = j | Ct = i)
= P(u(i, Yt ) = j | Ct = i)

= E 1 j (u (i, Yt+1 ))
Remarque 2.9 La quantité 1 j u (i, k) est parfois notée comme une règle de transition ti j (k),





 1, si la police passe de la classe i à la classe j

ti j (k) = 



 lorsque k réclamations surviennent.



 0, autrement

Ceci permet de former une matrice de transition T (k) = (ti j (k))i, j=1,...,l .T (k) est une ma-
trice 0 − 1 ayant exactement un 1 dans chaque ligne. La notation 1 j (u (i, k)) facilite l’ana-
lyse comme nous l’avons vu à la proposition (2.6). Tandis que la notation ti j (k) facilite
la présentation de la règle de décision comme nous l’avons vu dans les exemples (2.4)
et (2.5). Les tableaux récapitulatifs de ces exemples correspondent en effet à la matrice
T (k) représentée de façon compacte. Le choix de l’une où l’autre des notations dépend du
contexte.
En pratique, il est généralement supposé que le nombre d’accidents responsables Yt
suit une loi de Poisson avec intensité aléatoire Λ (Lemaire 1994). La distribution de Λ est
38
définie par sa fonction de densité g appelée fonction de structure. Le choix classique pour
la distribution de Λ est une distribution Gamma. La fréquence des réclamations suit alors
une loi Binomiale Négative
Lemme 2.10 Si Y ∼ Poisson(Λ) où Λ ∼ Γ (α, β) avec
xα−1 − βx
g (λ) = P (Λ = λ) = α e ,
β Γ (α)
β
alors Yt ˜ Binomiale Négative(α, 1+β ).
Preuve. En conditionnant sur Λ, nous pouvons utiliser la fonction génératrice des pro-
babilités d’une loi de Poisson
E (Y s ) = E(E(Y s | Λ))
= E(exp(Λ(s − 1))).
En reconnaissant la dernière égalité comme la fonction génératrice des moments de Λ,

nous obtenons la fonction génératrice des moments d’une loi Binomiale Négative
E (Y s ) = (1 − β (s − 1))−α
!α !−α
1 1
= 1− s
1+β 1+β
Avec la proposition (2.8) et le lemme (2.11) nous pouvons calculer q(n)

i j , la probabilité
de passer de la classe i à la classe j en n périodes, en multipliant la matrice Q par elle-même

n fois. Pour analyser le comportement asymptotique de la classe de tarif, nous utilisons la
notion de communication entre les classes i.e. que la classe i communique avec la classe j
i j > 0 Ross (2003).

si ∃ n ∈ N tel que q(n)
Proposition 2.11 (Ct )t∈N est une chaı̂ne de Markov ergodique si et seulement si toutes les
classes de tarif communiquent entre elles.
39
Preuve. Si toutes les classes de tarif communiquent entre elles, la matrice de transition
Q est irréductible et apériodique, d’où l’ergodicité de la chaı̂ne de Markov (Ct )t∈N .
Proposition 2.12 Si (Ct )t∈N est une chaı̂ne de Markov ergodique alors il existe une distri-
bution stationnaire a = (a j ) j=1,..,l où a j = lim q(n)
i j est la solution unique de l’équation
n→∞
l
X
a = aQ, a j = 1.
j=1
Preuve. Suit directement de la théorie sur les chaı̂nes de Markov.
Remarque 2.13 (i) Pour vérifier que toutes les classes d’une chaı̂ne de Markov commu-
niquent entre elles, une façon simple consiste à faire le graphe de la chaı̂ne de Markov. Si
le graphe est fermé, i. e. que tous les états peuvent être rejoint à partir de n’importe quel
état de départ, alors tous les états communiquent entre eux. Si ce n’est pas le cas, tous les
états ne communiquent pas entre eux, et la chaı̂ne de Markov n’est pas ergodique.
(ii) Plus de détails sur les notions d’ergodicité, d’irréductibilité et d’ apériodicité peuvent
être trouvés dans Rolski et autres (1998). Ces notions y sont introduites en utilisant le
concept de matrice régulière. Comme ces concepts ne sont pas directement reliés à notre
sujet, nous ne les élaborons pas davantage.
Mesures d’efficacité (système bonus-malus)
Dans cette partie nous précisons la définition des éléments sur lesquels reposent l’ef-
ficacité d’un système de tarification proposé par Lemaire pour analyser l’efficacité d’un
système bonus-malus Lemaire (1995, 2004), et donnent les mesures applicables dans le
contexte d’un système bonus-malus. Pour ce faire, nous utiliserons le processus de surplus
(Ut )t∈N dont voici la définition rigoureuse.
Definition 2.14 (Surplus dans un système bonus-malus) Soit X t+1 le montant des réclamat-
ions dans la période [t, t + 1], π(Ct ) la prime chargée en début de période pour la classe Ct
40
et u le niveau de réserve initial. Avec le niveau de surplus Ut+1 , évalué en fin de période,
nous définissons le processus de surplus (Ut )t∈N par
t
X t+1
X t
X t+1
X
Ut+1 =u+ π(C s ) − Xs = u + π(u (C s−1 , Y s )) − Xs
s=0 s=1 s=0 s=1
Sans perte de généralité, nous supposerons que la prime de base est de 1 et que le
montant des réclamations est mis à une échelle unitaire. Ceci permet de focaliser l’analyse
sur l’impact des niveaux de primes {b j } propre aux systèmes bonus-malus.
l
X
π(Ct ) = i0 j b j .
q(t)
j=1
E (Xt ) = 1, ∀t ∈ N.
Remarque 2.15 Voici un bref aperçu de la procédure qui mêne à la calibration d’un
système bonus-malus. Dans une première étape les (b j ) j=1,...,l sont déterminés à l’aide
de données et d’outils statistiques. Ensuite, u et (b j ) j=1,...,l sont choisis afin d’atteindre
un équilibre entre les critères d’efficacité. L’atteinte de l’équilibre entre les critères peut
éventuellement demander un réajustement des (b j ) j=1,...,l . En 1995, Lemaire dresse un bon
exposé de cette démarche. L’exemple détaillé de Denuit (2003), éclaire aussi par son aspect
très concret et orienté vers la pratique.
Stabilité financière
Un bon système de tarification doit induire une structure de primes qui apporte une sta-
bilité financière à l’assureur. Les bonus attribués par le système ne doivent pas ultimement
causer une insuffisance des tarifs.
Definition 2.16 Pour les systèmes bonus-malus, la stabilité financière est analysée à partir
du pourcentage stationnaire espéré de la prime de base que nous noterons par
l
X
0
b = a jb j.
j=1
41
0
Nous définissons aussi la classe stationnaire espérée c
l
X
0
c = a j j,
j=1
et le niveau de stationnarité relatif NS RE

0
b − b1
NS RE = .
bl − b1
0
Un pourcentage stationnaire espéré b supérieur à 1 suggère que le système n’accorde
ultimement que des malus. Parallèlement, si ce pourcentage est inférieure 1, le système
n’accorde ultimement que des bonus. L’interprétation du NS RE est semblable. Un niveau
faible du NS RE suggère une forte proportion des assurés dans les classes à fort bonus.
Tandis qu’un niveau élevé du NS RE suggère une meilleure répartition des assurés à
travers les classes.
Des mesures comme la probabilité de ruine, ou le niveau du surplus à la ruine, peuvent
0
aussi être utilisées. Mais, dans la littérature sur les bonus-malus, b est mis de l’avant à
cause de la nature markovienne des systèmes bonus-malus.
Proposition 2.17 (Stabilité financière d’un système bonus-malus) Un système bonus malus
est stable financièrement si
(i) il est transparent
0
b = 1.
(ii) lorsque la stationnarité est atteinte, l’assuré ne se retrouve pas dans une classe
extrême
0 < NS RE < 1.
0
Remarque 2.18 1. Le terme transparent découle du fait que, lorsque b , 1, les tarifs
changent progressivement dans le temps et les assurés ne peuvent alors anticiper convena-
blement les bonus. Le cas de figure où un assureur charge une prime très élevée aux nou-
veaux conducteurs pour compenser son déséquilibre financier est aussi dit non équitable.
42
2. Dans la plupart des pays développés, la fréquence moyenne des réclamations est
souvent en deçà de 10%. Ceci entraı̂ne un agglutinement des assurés dans les classes à
haut bonus et une non transparence du système. Parallèlement, même si ce phénomène est
connu, il est difficile à éviter car un système qui pénaliserait trop sévèrement les assurés ne
respecterait pas le principe d’assurance de transfert adéquat du risque.
3. Le NS RE est une mesure particulièrement utile pour comparer des systèmes entre
eux, car, généralement, des systèmes différents ont des niveaux de prime minimum b1 et
maximum bl différents.
Pour les systèmes imposés à tous les assureurs par le gouvernement, les mesures de
stabilité financière permettent d’anticiper le comportement des tarifs. Pour les assureurs
agissant dans un libre marché, les mesures de stabilité permettent, dans la phase de concep-
tion d’un système, de corriger les défaillances.
Example 2.19 (Suite de l’exemple 2.5) Supposons que la fréquence des réclamations suit
une loi de Poisson de paramètre λ. Le tableau (2.3) présente la classe stationnaire espérée
0 0
c , le pourcentage stationnaire espéré b et le niveau de stationnarité relatif NS RE pour
différentes valeurs de λ.
Le système bonus-malus de la Thaı̈lande est transparent et maintient les assurés dans
la classe médiane, si la fréquence des réclamations est de 0.5. La classe initiale de ce
système, la classe 4, est aussi la classe stationnaire espérée pour λ = 0.5. Le système est
donc stable financièrement dans un environnement où il y a une réclamation tous les deux
ans. Pour un environnement où le risque est plus élevé, le système réagit en chargeant une
surprime.
Parallèlement, pour un environnement où le risque est moins élevé, le système réagit en
43
accordant un bonus.
λ 0.10 0.25 0.50 1.00 1.25

0
c 1.59 2.49 4.02 6.01 6.40
0
b 67.19% 79.03% 100.82% 128.52% 133.42%
NS RE 8.99% 23.78% 51.03% 85.65% 91.78%
0 0
Table. 2.3- c , b et NS RE pour le système de la Thaı̈lande
Transfert adéquat du risque
Un système de tarification vise à faire contribuer équitablement chaque assuré au finan-

cement des réclamations. Cependant, si les malus sont trop élevés, le système n’encourage
pas les assurés à faire une réclamation et les empêche ainsi de bénéficier de la couverture
à laquelle ils ont droit. Pire, il peut encourager les assurés à s’enfuir après avoir causé
des dommages à des tiers. Pour éviter ces problèmes, les changements de prime entraı̂nés
par les bonus et les malus doivent être raisonnables, sans quoi le système ne transfère pas
adéquatement le risque. La définition suivante présente des mesures permettant de quanti-
fier l’ampleur des changements de prime induits par le système.
Definition 2.20 Pour les systèmes bonus-malus, l’ampleur des changements de prime in-
duits par le système est analysée à partir du coefficient de variation de la prime
√
Var(π(Ct ))
ρt = ,
E (π(Ct ))
et la rétention optimale moyenne
ε∗ = maxE(Rt (x, ε)),
où Rt (x, ε) est la compensation réelle induite par le système pour une rétention de ε
∞
X ∞
X
Rt+1 (x, ε) = (XS | Xt = x) − [π (CS | Xt = x − ε) − π (CS | Xt = x)] .
s=t+1 s=t+1
44
La compensation réelle met en perspective le montant versé pour les réclamations et

la perte de bonus reliée à la déclaration d’une réclamation. Pour ce faire, il est nécessaire
de considérer toutes les réclamations et les bonus à venir Holtan (2001). La rétention ε
correspond ainsi à un déductible que l’assuré s’impose pour maximiser sa compensation
réelle.
Un coefficient de variation de la prime faible suggère que les changements de primes
apportés par les bonus ou les malus entraı̂nent une variation faible dans la prime et per-
mettent donc un transfert adéquat du risque. De même, une rétention optimale moyenne
faible suggère que le système transfère adéquatement le risque
Remarque 2.21 La rétention optimale moyenne est aussi appelée appétit pour les bo-
nus de la terminologie anglaise bonus hunger . Ce phénomène a traditionnellement
été compris comme la façon dont les systèmes bonus-malus introduisent le concept de
déductible. Récemment, les travaux de Moreno et autres (2006) ont montré que ce phénomène
peut aussi être considéré comme un mécanisme peu coûteux contre la fraude.
Proposition 2.22 (Principe de transfert du risque dans un système bonus-malus)

Un système bonus-malus respecte le principe de transfert du risque si
(i) Le coefficient de variation de la prime de l’assuré ρt est raisonnable,
(ii) La rétention optimale moyenne ε∗ est raisonnable.
Example 2.23 (Suite de (2.21)) À la stationnarité, si la prime de base est de 1, nous avons
0
lim π (Ct ) = b ,
t→∞
v
u
t l
X
lim Var(π(Ct )) = a j b2j − (b0 )2 ,
p
t→∞
j=1
d’où, pour le coefficient de variation de la prime de l’assuré

s
Pl
a j b2j − (b0 )2
j=1
lim ρt = .
t→∞ b0
45
Le tableau (2.4) présente les résultats de calcul pour différentes valeurs de λ
λ 0.10 0.25 0.50 1.00 1.25

Coefficient de variation 21.05% 27.30% 25.73% 12.45% 8.46%
Table. 2.4 - Coefficient de variation de la prime de l’assuré pour
le système de la Thailande
Example 2.24 Pour les valeurs de λ présentées, à la stationnarité, la prime de l’assuré

peut varier entre 8.46% et 2l.05% entre chaque période. Par exemple, pour λ = 0.5,
la prime de l’assuré peut augmenter ou diminuer de 25.73% entre chaque période. De
nos jours, il n’est pas rare de voir une police d ’assurance augmenter de 25% suite à la
déclaration d’un accident. En ce sens, le système bonus-malus de la Thaı̈lande respecte le
principe de transfert du risque.
Remarque 2.25 Le calcul de la rétention optimale moyenne est complexe et utilise des
méth-odes qui dépassent le cadre de ce chapitre. Nous référons le lecteur à Holtan (2001)
pour des exemples de calcul de la rétention optimale moyenne.
2.2 La Théorie de la crédibilité
2.2.1 Petit historique sur la théorie de crédibilité
Au sein d’un portefeuille d’assurance hétérogène, les assurés ne sont pas tous égaux
devant le risque, certains présentant un profil plus dangereux que d’autres. Réclamer une
prime de montant identique pour tous pourrait donc paraı̂tre inéquitable, car cela indui-
rait nécessairement la surtarification de certains assurés, et l’utilisation de ces surcroı̂ts de
prime pour dédommager les sinistres causés par les individus plus risqués. On peut bien
entendu diminuer l’hétérogénéité du portefeuille en le partitionnant en classes de risques
aussi homogènes que possible (Sur la base de caractéristiques observables, telles que le
sexe, l’âge, le domicile, etc. des assurés). Il subsistera malgré tout le plus souvent une cer-
taine hétérogénéité au sein de chaque classe, les facteurs observables étant loin d’expliquer
46
complètement la dangerosité des assurés. Il est donc assez naturel d’utiliser la sinistralité
relative à un individu pour réévaluer le montant de sa prime. En effet, la sinistralité d’un
individu devrait à tout le moins partiellement refléter le niveau de risque réel de celui-ci.
Cette pratique relève de la théorie de la crédibilité.
Ainsi, dès 1910, Allstate assurait contre les accidents du travail la société General Mo-
tors et un certain nombre de petites entreprises. En calculant le taux de prime moyen sur son
expérience, General Motors s’aperçut que sa prime d’assurance devrait être plus faible que
celle de l’ensemble des entreprises assurées. Prétextant que le nombre d’assurés était suf-
fisamment grand, General Motors exigea de son assureur de prendre en compte son propre
historique et non plus celui de l’ensemble des assurés. Au même moment, un petit construc-
teur indépendant, Tucker, fit la même demande. La question se posa alors assez clairement
aux yeux des actuaires d’Allstate : à partir de quelle taille peut-on considérer qu’une entre-
prise est suffisamment importante pour que l’on puisse tarifer sur son expérience propre.
Mowbray (1914) fut le premier à apporter une réponse claire à cette question, en posant
ainsi les bases de la crédibilité dite de stabilité (ou “limites fluctuations”). Mais s’il pro-
pose un seuil à partir duquel la taille est suffisante, que doit-on faire pour les entreprises
de taille plus faible. Quelques années plus tard, Whitney (1918) mentionne “la nécessité,
par souci d’équité pour l’assuré, de pondérer d’un côté l’expérience collective, et de l’autre
l’expérience individuelle”. Toute la théorie de la crédibilité visera précisément à calcu-
ler au mieux cette pondération. Notons qu’il faudra attendre la contribution de Bühlmann
(1967,1969) pour que ce problème de prise en compte de l’expérience en tarification trouve
une réponse satisfaisante.
L’idée fondamentale de la théorie de la crédibilité peut se résumer comme suit. Suppo-
sons avoir observé une police durant n années, et enregistre les montants annuels de sinistre
X1 , X2 , ..., Xn ; Xi est le montant de sinistre généré par cette police durant l’ième année d’ob-
servation. La prime pure “observée” est donc.
X1 + X2 + ... + Xn
p̄n =
n
47
L’assureur pourrait songer à réclamer dorénavant un montant p̄n à cet assuré, mais ce
serait faire fi du principe même de l’assurance en renonçant à toute mutualisation du risque
(l’assureur s’apparenterait alors à un prêteur, qui lisserait la sinistralité dans le temps, sans
mutualisation). De plus, que faire pour les assurés qui n’ont jamais déclaré de sinistres
(i.e., ceux pour lesquels X1 = X2 = ... = Xn = 0), les dispenser de payer la prime tout en
continuant à les couvrir. L’assureur est donc confronté à un dilemme : soit il continue à
exiger un montant pcoll identique à tous les assurés, mais pourrait mécontenter les “bons”
assurés qui, s’estimant lésés, risquent alors de partir à la concurrence, soit il se laisse tenter
par p̄n mais nie par là le principe même de l’assurance. Les actuaires américains ont alors
songé à réclamer une prime dont le montant serait un compromis entre ces deux positions
extrêmes. Ainsi, la prime pn exigée par la compagnie pour accorder sa garantie durant
l’année n + 1 est-elle donnée par
pn = α p̄n + (1 − α) pcoll , 0 ≤ α ≤ 1,
où α est le facteur de crédibilité (il mesure la “crédibilité” que l’on peut accorder à la
prime “observée” p̄n ).
Les choix usuels pour α sont
n
α=
n0 + n
qui tend vers 1 lorsque n tend vers +∞, où n0 est un paramètre fixé et n le nombre d’années
d’observation disponibles, et
n
α = min ; 1 ,
n∗
où n∗ est une valeur seuil au-delà de laquelle on accorde une crédibilité totale a la police.
Remarque 2.26 1. But de cette approche : incorporer autant d’expérience individuelle

possible sans trop affecter la stabilité de la prime.
2. La distribution des primes est basée uniquement sur la taille des assurés. La tarifi-
cation n’est donc pas nécessairement précise et équitable.
48
Nous présentons dans cette section, une introduction à cette théorie, ainsi que certains
concepts de la crédibilité bayésienne. Ensuite, on présente le modèle original et classique
de Bühlmann.
2.2.2 L’approche bayésienne en crédibilité
L’ensemble des caractéristiques de risque d’un contrat est appelé niveau de risque, in-
tuitivement, on serait porté à croire qu’il est appelé à varier tout au long des différentes
périodes d’observation. Par exemple, un conducteur n’aura probablement pas les mêmes
habitudes de conduite à 20 qu’à 50 ans. Le risque que représente cet assuré en sera éventuell-
ement modifié. En pratique, ce changement se traduit par une classification différente de
l’assuré. Ainsi, le même assuré se verra attribuer une classification différente à 50 ans que
celle qu’il avait à 20 ans. II est également possible d’attribuer différents niveaux de risque à
un même contrat, reflètant ainsi les variations du risque de l’assuré tout au long de la durée
de vie du contrat. Cependant, afin de simplifier les calculs, on considère le niveau de risque
constant dans le temps.
On designe par θ la variable aléatoire représentant le risque d’un assuré. En fait, cette
variable peut être interprétée comme une variable qui englobe l’ensemble des caractéristiques
non observables d’un assuré. De plus, les paramètres de risque caractérisant chaque contrat
sont perçus comme des réalisations indépendantes de θ. On suppose que les paramètres de
risque de chaque assuré sont tous issus d’une même fonction de répartition U(θ). Cette
fonction reflète la structure de risque de l’ensemble du portefeuille. Bühlmann (1969)
a d’ailleurs désigné cette fonction par fonction de structure. On dénote une certaine ho-
mogénéité dans le portefeuille étant donné que les paramètres de risque proviennent tous
de la même fonction de distribution U(θ). Cependant, les différences entre les contrats
sont expliquées par le fait que le paramètre de risque caractérisant chaque contrat est une
réalisation différente de Ia variable aléatoire θ.
Le choix de la fonction de structure U(θ) dépend de l’approche utilisée. Selon une
approche bayésienne pure, U(θ) représente la perception à priori de l’assureur concernant
49
le risque. Généralement, elle est utilisée lorsqu’on ne détient aucune observation sur le
risque. comme c’est le cas par exemple pour une nouvelle ligne d’assurance. Cependant.
la fonction de structure U(θ) est en pratique, inconnue de l’assureur. Selon une approche
bayésienne empirique, les observations du portefeuille sont utilisées dans l’estimation de
la fonction de structure.
La prime bayésienne sera notée par E µ(θ) | X . Son expression est obtenue par un

processus à deux étapes. On doit d’abord obtenir la fonction de densité à posteriori du

paramètre de risque, soit p(θ | x1 , .., xt ), pour ensuite en évaluer l’espérance. L’obtention de
la fonction de densité à posteriori nécessite la formule de Bayes. Il en découle
t
f x j | θ u(θ)
Q
j=1
p(θ | x1 , .., xt ) = R t . (2.3)
f x j | θ u(θ)dθ
Q
θ j=1
L’espérance de la prime de risque conditionnelle aux observations est donc

+∞
Z
E µ(θ) | X1 = x1 , .., Xt = xt = µ(θ)p(θ | x1 , .., xt )dθ.

(2.4)
−∞
Notons que lorsque la distribution du paramètre de risque θ est continue, les sommations
dans (2.3) et (2.4) sont simplement remplacées par des intégrales.
Whitney (1918) et Bailey (1950) furent les premiers à démontrer que la prime bayésienne
est une prime de crédibilité bayésienne linéaire (ou exacte) pour certaines combinaisons de
distributions. Une prime de la forme πn+1 = zX + (1 − z)m est appelée prime de crédibilité
et 0 ≤ z ≤ 1 est le facteur de crédibilité.
Example 2.27 (Cas Poisson/Gamma).

Soit
Xt | θ v Poisson(θ)
θ v Gamma(α, λ),
50
c’est-à-dire
θ x e−θ
f (x | θ) = , x = 0, 1, ...
x!
λα α−1 −λθ
u(θ) = θ e ,θ 0
Γ (α)
a) la prime de risque.
On a
µ(θ) = E[Xt | θ] = θ.
On calcule également, pour usage futur,
σ2 (θ) = Var[Xt | θ] = θ.
b) la prime collective
On a
α
m = E[µ(θ)] = E[θ] =
λ
c) la prime bayésienne à partir de la distribution à posteriori de θ.
Tout d’abord, on a
n
Y
u(θ | x1 , ..., xn ) = u (θ) f (xt |θ)
t=1
Y
= θα−1 e−λθ θ xt e−θ
n
α+
P
xt −1 −(λ+n)θ
= θ t=1 e
n
d’où θ|X1 , ..., Xn v Gamma(e
α = α+ λ = λ + n). Par conséquent, la prime bayésienne
P
Xt ,e
t=1
51
est
Bn+1 = E[µ(θ) | X1 , ..., Xn ]

α
= E[θ | X1 , ..., Xn ] =
e
λ
e
n
α+
P
Xt
t=1
=
λ+n
n λ α
= X+
n+λ n+λλ
= zX + (1 − z)m
avec
n
z= .
n+λ
La prime bayésienne est donc linéaire dans le cas Poisson/Gamma.
Remarque 2.28 Il y a en fait cinq combinaisons de distributions qui résultent en une prime
bayésienne linéaire (plus leurs convolutions). Les formules de crédibilité exacte pour les
combinaisons de distributions issues de la famille exponentielle sont rassemblées dans ce
tableaux :

f (x | θ) Bernoulli(θ) Geometric(θ) Exponential(θ) N θ, σ21

π (θ) Beta(α, β) Beta(α, β) Gamma(α, β) N µ, σ22

f (θ | X) Beta α̃1 , β̃1 Beta α̂2 , β̂2 Gamma α̃3 , β̃3 N µ̃, σ̃22
¯
µ (θ) θ 1−θ
θ
1
θ
θ
α β β
m α+β α−1 α−1
µ
α+ i xi β+ i xi β+ i xi nσ22 x̄ + σ21 µ
P P P
PB α+β+n α+n−1 α+n−1 nσ22 + σ21
n n n n
z n+α+β n+α−1 n+α−1 σ2
n+ 1
σ2
2
Table 2.5 - Modèles de crédibilité bayésienne pour certaines

paires de distributions conjuguées
52
P
α̃1 , β̃1 α + j x j, β + n − i x j
P
P
α̃2 , β̃2 α + n, β + i x j
P
α̃3 , β̃3 α + n, β + i x j
2P
σ2 j x j + σ21 µ σ21 σ22

µ̃, σ̃22 nσ2 + σ2
, T σ2 + σ2
2 1 2 1
Table 2.6 - Nouveaux paramètres de la distribution a postérieure
2.2.3 Modèle de Bühlmann
Le calcul de la prime, selon une approche bayésienne, nécessite la connaissance les

fonctions de densité u(θ) et f (x | θ). Dans un tel contexte, on suppose que les montants
de sinistres sont des variables aléatoires issues de f (x | θ). Comme il a été mentionné
dans le sous section précédente, l’approximation de la prime de risque sous une approche
bayésienne peut s’avérer complexe. Par conséquent, on cherchera plutôt à obtenir une ap-
proximation de µ(θ) qui peut s’exprimer comme une fonction linéaire des observations.
Pour certaines combinaisons de u(θ) et f (x | θ), soit celles du modèle de Jewell (Jewell
l974), cette approximation sera équivalente à la prime bayésienne.
Pour contourner le problème de complexité de calcul de la prime bayésienne, Bühl-
mann (1967,1969) propose des modèles qui reposent essentiellement sur une approxima-
tion linéaire de la prime de risque. Il obtient ainsi une approximation de la prime de risque
µ(θ) qui peut s’exprimer sous la forme de la prime de crédibilité. Par conséquent, le calcul
de la prime est déterminé sous une approche bayésienne pure et nécessite la connaissance
des fonctions de densité u(θ) et f (x | θ). Par son modèle original, Bühlmann (1967) vient
donc corriger une faiblesse de la crédibilité bayésienne, soit celle de la complexité de calcul.
Cependant, en pratique, les fonctions u(θ) et f (x | θ) sont bien souvent inconnues de l’as-
sureur. Bühlmann (1969) a évité ce problème par son modèle classique, où l’on considère
plutôt un portefeuille composé de plusieurs contrats. Ainsi, les observations de l’ensemble
du portefeuille pourront être utilisées pour estimer les paramètres nécessaires au calcul de
la prime de crédibilité.
Dans son modèle classique, Bühlmann (1969) suppose que les montants de sinistres
53
sont des variables aléatoires issues d’une certaine fonction f (x | θ). Il est toutefois possible
de percevoir différemment le modèle classique de Bühtmann (1969).
Notation et relations de covariance
On définit la notation suivante :

h i
s2 = E [Var [Xit | θi ]] = E σ2 (θi ) .
a = Var [E [Xit | θi ]] = Var µ (θi ) .

Interprétation :
• s2 est une mesure de la non-homogénéité des périodes.
• a est une mesure de la non-homogénéité du collectif.
Thorme 2.29 Soit X, Y et θ des variables aléatoires dont la densité conjointe existe.
Alor
Cov (X, Y) = Cov (E [X | θ] , E [Y | θ]) + E [Cov (X, Y | θ)] .
Corollaire 2.30 En posant X ≡ Y dans le théorème 5.1, on obtient
Var [X] = E [Var [X | θ]] + Var [E [X | θ]] .
Thorme 2.31 Soit X1 , ....., Xn des variables aléatoires conditionnellement indépendantes

sachant la variable aléatoire θ et
E [Xt | θ] = µ (θ) ,
Var [Xt | θ] = σ2 (θ) , t = 1, ...., n
Alors

 a, t,u


Cov (Xt , Xu ) = 

 a + s2 ,

 t=u
= a + δtu s2 , t et u = 1, ...., n,
54
Cov (µ (θ) , Xt ) = a,
où δtu est le delta de Kronecker :


 1, t,u


δtu = 

t=u

 0,

Preuve. Pour le premier résultat, on a
Cov (Xt , Xu ) = Cov (E [Xt | θ] , E [Xu | θ]) + E [Cov (Xt , Xu | θ)]
= Cov (µ (θ) , µ (θ)) + E [δtu Var [Xt | θ]]

h i
= Var µ (θ) + δtu E σ2 (θ)

= a + δtu s2 .
De plus,
Cov (µ (θ) , Xt ) = Cov (µ (θ) , E [Xt | θ]) + E Cov (µ (θ) , Xt | θ)

= Var µ (θ) + E [0]

= a.
Modèle et prévision
Le modèle original de Bühlmann (1969) suppose un portefeuille composé d’un i contrat,

dont l’expérience est observée pendant t périodes. L’approximation linéaire πi,n+1 de la
prime de risque ne nécessite plus la connaissance des paramètres m, s2 et a car il est pos-
sible de les estimer à partir des observations des différents contrats. Le calcul de la prime est
donc développé sons une approche bayésienne empirique. On suppose que chaque contrat
est caractérisé par un paramètre de risque θ provenant d’une certaine fonction de structure
U (.) . De plus, Xi j désigne le montant total des sinistres du contrat i survenus au cours de
la période j.
55
Les hypothèses du modèle de Bühlmann sont les suivantes (version la moins restrictive).
(B1) Les contrats (θi , Xi ) , i = 1, ...., k sont indépendants, les variables aléatoires θ1 , ...., θI
sont identiquement distribuées et les variables aléatoires Xi j ont une variance finie.
(B2) Les variables aléatoires Xit ,sont telles que
h i
E Xi j | θi = µ (θi ) , i = 1, ...., k, j = 1, ...., t

Cov Xi j , Xir | θi = δ jr σ2 (θi ) , i = 1, ...., k, j, r = 1, ...., t.
Remarque 2.32 1. L’hypothèse d’indépendance entre les contrats peut ne pas être réaliste,
mais a) elle simplifie les calculs ; et b) c’est une bonne approximation dans plusieurs cas.
2. Hypothèse (B1) : indépendance inter contrats (between).
3. Hypothèse (B2) : homogénéité temporelle et indépendance intra contrats (within),
c’est-à-dire :
− µ (θi ) constante dans le temps.

− observations conditionnellement non corrélées.
Calcul de Ia prime
Le modèle classique de Bühlmann (1969) permet d’obtenir une approsimation de la

prime de risque par des fonctions linéaires homogènes et non homogènes des observations.
Comme dans le modèle original, cette combinaison linéaire est de la forme
k X
X t
ci0 + cir j Xr j (2.5)
r=1 j=1
Notons que l’exposant i désigne le contrat pour lequel on cherche à obtenir la prime de
crédibilité. Le théorème suivant présente la prime de crédibilité non homogène du modèle
classique de Bühlmann (1969).
Thorme 2.33 Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses
(B1) et (B2), la meilleure approximation linéaire non homogène de la prime de risque
56
µ (θi ) est
πi,n+1
B
= zXi + (1 − z) m (2.6)
ou
t
1X
Xi = Xi j (2.7)
t j=1
t
z= . (2.8)
t+ s2
a
Preuve. Par indépendance entre les contrats, on sait déjà que la prime de crédibilité du
contrat i sera une fonction de ses observations seulement.
On peut donc réduire le problème à trouver les coefficients cir j (r, i = 1, ...., k; r, j = 1, ...., t)
qui sont la solution du problème de minimisation suivant :

k X
t
2 
 X  
min E µ (θ ) − ci + ci
X   . (2.9)
 i 0 r j r j
c0 ,cr j
i i 
  
r=1 j=1
En calculant les dérivées partielles, d’abord par rapport à ci0 , on obtient

 k X
t

 X 
−2E µ (θi ) − ci0 + cir j Xr j  = 0,
r=1 j=1
et, par conséquent,

Xk X
t
ci∗0 =m−m cir j (2.10)
r=1 j=1
où
h i
m = E µ (θi ) = E Xr j .

Après avoir inséré (2.10) dans (2.9), les dérivées partielles par rapport à cir0 j0 , r = 1, ...., k, j =
0 0
1, ...., t sont

k X t
2 
∂ 
µ (θ ) − m −
X
i
 
E  i c Xrj − m  
∂cr0 j0
i 

r=1 j=1
rj  
 k X t

 X 
= −2E µ (θi ) − m − cir j Xr j − m Xr0 j0 − m  ,
r=1 j=1
57
ce qui conduit au système d’équations suivant :

h i X t
k X
Cov µ (θi ) , Xr0 j0 = cir jCov Xr0 j0 , Xr j (2.11)
r=1 j=1
Ainsi, pour r = i
0
n
X
a= cii j a + δ j0 j s2 . (2.12)
t=1
Puisque les contrats sont supposés indépendants, on a une superposition de matrices à

résoudre. Donc, pour chaque contrat, on a un système matriciel semblable à celui que l’on
retrouve dans le modèle original. Par conséquent, les coefficients cii j , j = 1, ..., t sont égaux.
En effectuant la sommation dans (2.12), on obtien
a
cii j = , i = 1, ..., k (2.13)
at + s2
Puisque cette expression de cii j ne dépend pas de i, ces coefficients sont tous égau, pour
r = i. Lorsque r , i, le membre de gauche de l’égalité (2.11) est nul puisque les contrats
0 0
sont supposés indépendants. Ce système étant symétrique, les coefficients cii j sont donc nuls
0
pour r , i.
Ainsi, en remplaçant les expressions obtenues pour ci∗0 et ci∗i j dans (2.5), on trouve
k X t
 k X t
 k X t
X  X  X
c0 +
i
cr j Xr j = m 1 −
i  cr j  +
i  cir j Xi j
r=1 j=1 r=1 j=1 i=1 j=1
a a
= m 1− + Xi.
at + s 2 at + s2
En posant z = a
at+s2
,on obtient donc la prime linéaire suivante :
πi,n+1
B
= zXi + (1 − z) m
Remarque 2.34 1. La prime de crédibilité a deux belles propriétés :

a) elle est sans biais, c’est-à-dire que
h i h i
E πi,n+1
B
= zE Xi + (1 − z) m = m.
58
En moyenne, l’assureur perçoit donc suffisamment de primes pour payer les sinistres.
n−→∞ n−→∞ n−→∞
b) puisque Xi −→ µ (θi ) et z −→ 1 alors πi,n+1
B
−→ µ (θi ) .
2. Puisque πi,n+1
B
est sans biais, une mauvaise estimation du facteur de crédibilité n’a
pas d’impact négatif sur le montant des primes perçu par l’assureur.
3. À cause de l’indépendance des contrats, les données collatérales, les données des

autres contrats, n’entrent pour le moment pas dans l’estimation de µ (θi ) ou cijt = 0 pour j , i .
4. Une approximation linéaire homogène de µ (Θi ) est de la forme
k X
X t
cir j .
r=1 j=1
Il est facile de démontrer que l’approximation est alors

k
1X
zXi + (1 − z) X, où S = Xi.
k i=1
6. La prime de crédibilité peut aussi s’écrire sous la forme

πi,n+1
B
= m + z Xi − m .
Il est intéressant de constater que la meilleure approximation linéaire de la prime de

risque est également la meilleure approximation linéaire de la prime bayésienne.
Ce résultat s’interprète comme une minimisation en deux étapes :
1. Trouver la meilleure approximation de la prime de risque (prime bayésienne).
2. Trouver la meilleure approximation linéaire de la prime bayésienne (prime de crédibilité).
Equilibre financier
• Tout système de tarification à posteriori doit jouir de la propriété d’équilibre financier.

Son introduction ne peut avoir aucun impact sur l’encaissement total de la compagnie.
• Ceci se justifie par le fait qu’un mécanisme de tarification à posteriori n’entraı̂ne pas
de modification de la sinistralité (le cas de l’aléa moral excepté).
• Dans le cas du modèle de Bühlmann, ceci se traduit par
h i h i
E πi,n+1
B
= zE X i + (1 − z) m = m.
59
Approche paramétrique
Dans un premier temps, on peut considérer que les distributions de θi et Xi j | θi sont

connues, comme en crédibilité bayésienne.
La notion de portefeuille n’est alors pas nécessaire puisque l’on détermine les distribu-
tions pour chaque contrat. On peut laisser tomber l’indice i dans les formules.
Il est maintenant très simple de calculer la prime de crédibilité de Bühlmann pour n’im-
porte quelle combinaison de distributions.
Example 2.35 (Bernoulli/uniforme)
Xj | θ ∼ Bernoulli (θ)
θ ∼ U (a, b) ,
alors la prime bayésienne est très compliquée. Ici, µ (θ) = θ et σ2 (θ) = θ (1 − θ) ,

d’où
m = E µ (θ)

a+b
= E [θ] =
h i2
s = E σ (θ)
2 2
h i
= E [θ] − E θ2
a + b a2 + ab + b2
= +
2 3
a = Var µ (θ)

(b − a)2
= Var [θ] = ,
12
donc
s2
K =
a
6 (a + b) − 4 a2 + ab + b2
=
(b − a)2
60
et
n n a+b
πi,t+1
B
= X+ 1− .
n+K n+K 2
Example 2.36 (Poisson/gamma)

On a
Sj | θ ∼ Poisson (θ)
θ ∼ Gamma (α, λ) .
On sait déjà que µ (θ) = σ2 (θ) = θ. Par conséquent,
α
m = E [θ] = ,
λ
α
s2 = E [θ] = ,
λ
α
a = Var [θ] = 2 ,
λ
d’où
s2
K= = λ,
a
et
n λ α
πi,t+1
B
= S+ .
n+λ n+λλ
Approche non paramétrique
En pratique, l’approche paramétrique est d’un intérêt limité puisqu’elle nécessite tou-
jours de déterminer les distributions de Xi j | θi et θi .
Avec l’approche non paramétrique, nous délaissons l’approche bayésienne pure pour
l’approche bayésienne empirique.
• Nous avons plusieurs réalisations de la variable aléatoire θ.
• U (θ) est la fonction de structure du portefeuille :
– avant : opinion à priori de l’assureur sur le niveau de risque d’un contrat ;
– maintenant : proportion de contrats avec un niveau de risque inférieur ou égal à θ,
distribution des niveaux de risque entre les contrats.
61
• Homogénéité du portefeuille : à quel point les moyennes des contrats sont semblables.
• Nous devons estimer les paramètres de structure du portefeuille :
1. m = E µ (θ) , moyenne du portefeuille ;

h i
2. s2 = E σ2 (θ) , variabilité moyenne du portefeuille, homogénéité temporelle.
3. a = Var µ (θ) , variance entre les moyennes des contrats, homogénéité du porte-

feuille.
• Nous développons des estimateurs sans biais des paramètres.
Estimation des paramètres du modèle de Bühlmann
Estimation de m
Intuitivement,
k t
1 XX
b=S =
m Xi j .
kt i=1 t=1
L’estimateur est effectivement sans biais :
k t
1 XX h i
b =

E m E Xi j
kt i=1 t=1
k t
1 XX
= m
kt i=1 t=1
= m.
Estimation de s2
Un estimateur sans biais de la variance du contrat i = 1, ...., n, est
t
1 X 2
Xi j − X i , t ≥ 2.
t − 1 j=1
Pour obtenir un estimateur sans biais de s2 , on prend la moyenne de tous ces estima-
teurs :
k t
1 XX 2
s =
b2
Xi j − X i .
k (t − 1) i=1 t=1
62
Pour démontrer l’absence de biais, on note d’abord que

2 h i
E Xi j − X i | θi = Var Xi j − X i | θi
h i h i
= Var Xi j | θi + Var X i | θi − 2Cov Xi j , X i | θi
σ2 (θi ) σ2 (θi )
= σ2 (θi ) + −2
t t
t−1 2
= σ (θi ) .
t
Par conséquent,
2 2
E Xi j − X i | θi = E E Xi j − X i | θi
t−1 h 2 i
= E σ (θi )
t
t−1 2
= s,
t
et
k t
h i 1 XX t − 1 2
s2 =
E b s.
k (t − 1) i=1 j=1 t
Estimation de a
Un estimateur intuitif de a = Var µ (θ) est

k
1 X 2
Xi − X .
k − 1 i=1
Or, cet estimateur est biaisé. En effet,

on a
2 h i
E Xi − X = Var X i − X
h i h i
= Var X i + Var X − 2Cov X i , X .
Par indépendance entre les contrats,

on a
k
1X
Cov X i , X = Cov X i , X j
k i=1
1 h i
= Var X i
k
63
et h i
h i Var X i
Var X = ,
k
d’où
2 1−k h i
E Xi − X = Var X i .
k
et
k
 
 1 X 2  h i
E  X i − X  = Var X i .
k − 1 i=1
Or,
h i h h ii h h ii
Var X i = Var E X i /θi + E Var X i /θi
σ (θi )
" 2 #
= Var µ (θi ) + E

t
s2
= a+ .
t
Un estimateur sans biais de a est donc
k
1 X 2 1
a=
b Xi − X − b s2 .
k − 1 i=1 t
a, 0 , qui est
a0 = max b

Problème l’estimateur b
a peut être négatif. En pratique, on posera b
un estimateur biaisé.
πi,n+1
Estimation de la prime de crédibilité bB
On estime la prime de crédibilité en remplaçant chaque paramètre inconnu par son

estimateur :
πi,n+1
B
=b
zXi + 1 −b

b z mb
où
t
z= .
t +b
s2 /b
b
a
h i
b = K et
Bien que tous les estimateurs soient sans biais, on ne peut conclure que E K
z] = z. Par conséquent, l’estimateur de la prime de crédibilité est fort proba-
donc que E[b
blement biaisé.
64
Example 2.37 Les données de cet exemple sont retirées de l’ensemble de données qui a
été obtenu dans le chapitre de l’organisation nationale de sécurité sociale (employés) en
Algérie, compétente pour les employés dans le domaine de l’assurance sociale, des ac-
cidents du travail et des maladies professionnelles et des allocations familiales. Les six
contrats correspondent à six classes différentes de quotas (dépenses) couvertes par l’or-
ganisation de sécurité sociale (employés) de l’Algérie pour 14 ans d’expérience pour la
période 1995 à 2009.
Table 2.8 - Montants de sinistres moyens (ratios Xi j ).

Contrat Sick Accid Matern Funer Other Manag
j=1 1000 6200 2100 5600 2800 900
j=2 1400 8500 4200 7300 3400 1100
j=3 7100 16800 12500 12500 8500 4200
j=4 8300 17200 13400 13000 9200 5600
j=5 5400 14300 7000 10700 6700 2150
j=6 5800 14700 7500 10900 7000 2400
j=7 6600 15600 9400 11900 7500 3280
j=8 6900 16300 9900 12200 7900 3500
j=9 2700 13800 6300 8900 4500 1400
j = 10 5100 14000 6600 10500 6500 1850
j = 11 9500 19100 14700 13700 9850 6050
j = 12 10400 22300 16800 14300 11350 6250
j = 13 6000 14900 7800 11500 7175 2750
j = 14 6450 15200 8000 11700 7350 3100
Table 2.9 - Modèle de crédibilité de Bühlmann (1969)

Contrat Sick Accid Matern
S ·j 5903.571429 14921.42857 9014.285714
ẑ 0.834821794 0.834821794 0.834821794

µ̂ θ j 6003.785 14677.846 8995.907
Contrat Funer Other Manag
S ·j 11050 7123.214286 3180.714286
ẑ 0.834821794 0.834821794 0.834821794

µ̂ θ j 10954.012 7176.93 3384.734
µ̂ = 8532.202381, Ŝ 2 = 2995008.659, α̂ = 15136975.72
65
Chapitre 3
Estimation Bayésienne de la prime pour

le modèle Gamma Lindley sous
différentes fonctions de perte
Nous considérons la distribution Gamma Lindley (GaL) comme une distribution condi-
tionnelle de X | θ, γ, nous nous concentrons sur l’estimateurs bayésienne de la prime sous la
fonction de perte quadratique (symétrique) et sous la fonction de perte Linex (asymétrique),
en utilisant des lois à priori gamma sur les paramètres. En raison de sa difficulté et de sa
non-linéarité, nous utilisons une approximation numérique (l’approximation de Lindley)
pour calculer l’estimateur Bayésienne de la prime . Enfin, une étude de simulation et com-
parative avec différentes tailles d’échantillons est donnée.
La théorie de la crédibilité est l’une des techniques quantitatives importantes en sciences
actuarielles qui permet aux compagnies d’assurances d’effectuer une évaluation de l’expérience
(ajuster les primes futures en fonction de l’expérience passée). Nous traitons l’estimateur de
la prime bayésienne développé par Bailey (1950), en considérant la distribution de Gamma
Lindley comme une distribution de réclamation qui est un outil populaire dans la théorie de
la crédibilité. La distribution de Gamma Lindley a été publiée en 2016 par Nedjar et Zegh-
doudi. Cette distribution est basée sur des mélanges des distributions ordinaires Gamma
66
(2, θ) et Lindley (θ), qui est l’une des distributions qui modélisent les données d’analyse de
survie. La fonction de densité de probabilité (p.d.f) et la fonction de distribution cumulative
(c.d.f.) sont données comme suit :

θ2 ((γ+γθ−θ)x+1)e−θx


γ(1+θ)
, x ≥ 0, γ, θ ≥ 0,
fGal (x; θ, γ) = 

(3.1)



 0, sinon,
et
((γ + γθ − θ) (θx + 1) + θ) e−θx

FGal (x; θ, γ) = 1 − , x ≥ 0, γ, θ ≥ 0. (3.2)
γ (1 + θ)
Il existe de nombreux articles traitant les nouvelles distributions à savoir : Lindley (1958),
Sharma et Shanker (2013), Ghitany et al. (2008), Sankaran (1970), Ghitany et Al-Mutairi
(2009), Zeghdoudi et Nedjar (2015). Récemment, Krishna et Kumar (2011) où ils ont utilisé
l’approche bayésienne et la probabilité maximale d’un ensemble incomplet de données
utilisant diverses fonctions de perte. D’autre part, Sajid et al. (2013) et Metiri et al. (2016)
ont étudié l’effet de certaines fonctions de perte sur l’estimateur de Bayes et le risque
subséquent en utilisant des lois à priori conjuguées naturelles.
Enfin, nous évaluons les estimateurs bayésiens sous les fonctions de perte ci-dessus,
une simulation utilisant la méthode de Monte-Carlo avec un calcul d’erreur a été réalisée.
3.1 Inférences bayésiennes pour les paramètres
3.1.1 Estimation des paramètres par maximum de vraisemblance
Dans cette partie, nous considérons l’estimation du maximum de vraisemblance des pa-
ramètres. Supposons un échantillon aléatoire {x1:n , x2:n , ···, xn:n } d’observations indépendantes
et identiquement distribuées (IID) de taille n obtenu à partir de GaL(θ, γ). La vraisemblance
pour des données complètes est :
!
n Pn
θ2n Y −θ xi
(θ, γ) = (γ + γθ − θ) xi + 1 e i=1 , (3.3)
γ (θ + 1) i=1
n
67
La Log vraisemblance peut être exprimée comme suit :
log (x | θ, γ) = 2n log θ − n log γ − n log (θ + 1) (3.4)

Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi .

i=1 i=1
Par conséquent, les MLE des paramètres θ et γ sont la solution simultanée des équations
normales suivantes. Par conséquent, les MLE peuvent être obtenus par une procédure
itérative. Ici, nous suggérons d’utiliser la méthode de Newton Raphson (N-R).
n n
2n n X X xi
− − xi + (γ − 1) = 0,
θ θ + 1 i=1 (γ + γθ − θ) xi + 1

i=1
n
−n X xi
+ (θ + 1) = 0,
γ + γθ θ) +

i=1
(γ − xi 1

Dans certaines conditions de régularité, les θ̂, γ̂ sont approximativement bi variés avec

une moyenne θ̂, γ̂ et matrice de covariance
h i0
I −1 θ̂, γ̂ i.e. θ̂, γ̂ ∼ N2 θ̂, γ̂ , I −1 θ̂, γ̂ .

où I θ̂, γ̂ est la matrice d’information de Fisher observée et définie comme
 2 
 − ∂ ∂θlog2 L − ∂ ∂θ∂γ
2 log L

I θ̂, γ̂ =  2 ,
 
 − ∂ log L − ∂2 log L 
∂θ∂γ ∂γ2 (θ̂,γ̂)

Les éléments diagonaux de I −1 θ̂, γ̂ fournissent les variances asymptotiques pour les
paramètres θ et γ respectivement. L’intervalle de confiance d’approximation normale de θ
q n o
et γ peut être défini comme θ̂ ± Z 2 var θ̂ et γ̂ ± Z α2 var (γ̂) respectivement.
p
α
3.1.2 Estimateurs Bayésiens des paramètres
Dans cette partie, nous avons obtenu les estimateurs Bayésiens des paramètres θ et
γ. Dans l’analyse bayésienne, nous devons spécifier une distribution préalable pour les
paramètres, nous considérons que deux distributions à priori gamma indépendants tels que,
68
Gamma(a, b) comme loi à priori sur θ et Gamma(c, d) comme loi à priori sur γ où a, b, c et
d sont des hyperparamètres non négatifs. La motivation de considérer Gamma comme des
dsitributions à priori est due à leur flexibilité calculatoire.
ba a−1 −bθ
g (θ) = θ e ; θ, a, b > 0
Γ (a)
dc c−1 −dγ
g (γ) = γ e ; γ, c, d > 0
Γ (c)
La distribution à priori conjointe pour θ et γ est donnée comme suit :
π (θ, γ) ∝ θa−1 γc−1 e(−bθ−dγ) ; a, b, c, d > 0. (3.5)
La distribution à postériori commune est donnée sous la forme

" !#
Pn
− dγ+θ x i +b
p (θ, γ | X) = R θ γ
−1 2n+a−1 c−n−1
e i=1 P (θ, γ) dθdγ, (3.6)
¯
où R et P (θ, γ) sont interprétés comme

" !#
Z Z Pn
− dγ+θ x i +b
R= θ γ
n+a−1 c−n−1
e i=1 P (θ, γ) dθdγ,
θ γ
n
(γ + γθ − θ) xi + 1
Q
i=1
P (θ, γ) = .
(θ + 1)n
Méthode d’approximation Lindley pour les estimateurs de Bayes :
On peut noter ici que la répartition à posteriori de p (θ, γ | X) prend une forme de ra-
¯
tio qui implique une intégration dans le dénominateur et ne peut être réduite à une forme
simple. Par conséquent, l’évaluation des espérances à poeteriori pour obtenir l’estimateur
de Bayes de θ et γ sera fastidieuse. Il existe différentes méthodes pour approximer le ra-
tio des intégrales de la forme ci-dessus, on peut citer les méthodes MCMC et notamment
l’algorythme de Metropolis-Hasting, L’approximation de Tierney-Kedane et l’approxima-
tion de Lindley (1980). Dans ce travail, nous proposons l’utilisation de l’approximation de
Lindley pour obtenir l’estimateur bayésien de θ et de γ. De nombreux auteurs ont utilisé
69
cette approximation pour obtenir les estimateurs de Bayes pour certaines distributions de
survie. Voir parmi d’autres, Howlader et Hossain (2002) et Jaheen (2005).
Considérons les intégrales de la forme (3.7) . Elles s’expriment sous forme de ratio
d’intégrales et correspondent aux estimateurs Bayésiens de u (θ, γ) sous une fonction de
perte quadratique :
u (γ, θ) eL(γ,θ)+G(γ,θ) d (γ, θ)

R
I (x) = E (u (θ, γ) | X) = , (3.7)
eL(γ,θ)+G(γ,θ) d (γ, θ)
R
¯
où
u (θ, γ) = est une fonction de θ et γ seulement
L (θ, γ) =Log- vraisemblance
G (θ, γ) =Log-densité commune
Selon D. V. Lindley (1958), si les estimations ML des paramètres sont disponibles et
n est suffisamment grand, alors le ratio ci-dessus de l’intégrale peut être approché comme
suit :
1 h
I (x) = u θ̂, γ̂ + ûγγ + 2ûγ p̂γ σ̂γγ + ûθγ + 2ûθ p̂γ σ̂θγ (3.8)
2
i
+ ûγθ + 2ûγ b pθ σ̂γθ + ûθθ + 2ûθ bpθ σ̂θθ
1 h
+ ûγ σ̂γγ + ûθ σ̂γθ L̂γγγ σ̂γγ + L̂γθγ σ̂γθ + L̂θγγ σ̂θγ + L̂θθγ σ̂θθ
2
i
+ ûγ σ̂θγ + ûθ b
σθθ L̂θγγ σ̂θθ + L̂γθθ σ̂θγ + L̂θγθ σ̂θγ + L̂θθθ σ̂θθ ,
Où θ̂ et γ̂ sont le MLE de θ et γ respectivement.

∂u(θ̂,γ̂) ∂u(θ̂,γ̂) ∂u(θ̂,γ̂)
ûθ = ∂θ̂
, ûγ = ∂γ̂
, ûθγ = ∂θ̂∂γ̂
,
∂u(θ̂,γ̂) ∂2 u(θ̂,γ̂) ∂2 u(θ̂,γ̂)
ûγθ = ∂γ̂∂θ̂
, ûθθ = ∂θ̂2
, ûγγ = ∂γ̂2
,
∂G(θ̂,γ̂) ∂G(θ̂,γ̂) ∂ L(θ̂,γ̂)
2
p̂θ = ∂θ̂
, p̂γ = ∂γ̂
, L̂θθ = ∂θ̂2
,
∂2 L (θ̂,γ̂) ∂ L(θ̂,γ̂)
3 ∂3 L (θ̂,γ̂)
L̂γγ = ∂γ̂2
, L̂θθθ = ∂θ̂3
, L̂θθγ = ∂θ̂∂θ̂∂γ̂
,
∂3 L(θ̂,γ̂) ∂3 L(θ̂,γ̂) ∂3 L(θ̂,γ̂)
L̂γγθ = ∂γ̂∂γ̂∂θ̂
, L̂γθγ = ∂γ̂∂θ̂∂γ̂
, L̂θγγ = ∂θ̂∂γ̂∂γ̂
,
∂3 L(θ̂,γ̂)
L̂γθθ = ∂γ̂∂θ̂∂θ̂
.
70
Après la substitution de p (θ, γ | X) de (3.6) dans l’expression de I (x), cette intégrale

¯
doit être réduite comme l’intégrale de Lindley, où :
u (θ, γ) = γ,
L (θ, γ) = 2n log θ − n log γ − n log (θ + 1)

Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi ,

i=1 i=1
G (θ, γ) = (a − 1) log θ + (c − 1) log γ − (bθ + dγ) .
On a
uγ = 1, uγγ = uγθ = uθθ = uθγ = 0,

pθ = (a−1)
θ
− b, pγ = (c−1)
− d,
γ
n Pn n
Lθ = 2n n
+ xi (γ−1)
− xi , Lθγ = Lγθ = xi (1+xi )
2,
P P
θ
− (θ+1) [ (γ+γθ−θ)xi +1]
i=1 i=1 i=1 [(γ+γθ−θ)x i +1]
n 2 n
Lθθ = θ2 + (θ+1)2 − [ xi (γ−1)]
2, Lγ = + ,
−2n n P −n P (1+θ)xi
γ (γ+γθ−θ)xi +1]
i=1 [(γ+γθ−θ)xi +1] i=1 [
n 2[ xi (γ−1)]
3 n
[(1+θ)xi ]2
Lθθθ = 4n 2n
+ 3, Lγγ = γn2 − 2,
P P
θ 3 − 3
i=1 [(γ+γθ−θ)xi +1] i=1 [(γ+γθ−θ)xi +1]
(θ+1)
n 2x2 (1−γ)(1+x ) n
2[(1+θ)xi ]3
Lθθγ = Lγθθ = i
, Lγγγ = −2n + 3,
P i
P
+1 ]3 γ 3
i=1 [(γ+γθ−θ)x i i=1 [(γ+γθ−θ)xi +1]
n 2x2 (1+θ)(1+x )
Lθγγ = Lγγθ = − [ i i ]
3,
P
i=1 [(γ+γθ−θ)xi +1]
De nouveau, Parce que θ et γ sont indépendants X | γ, θ, σγθ = 0 θ , γ pour σγγ = − L1γγ ;

σθθ = − L1θθ .
Après évaluation de tous les u-termes, L-termes, et p-termes au point (θ̂, γ̂) et en utili-
sant l’expression ci-dessus, l’estimateur de Bayes approximatif de θ sous SELF est,
h i
θ̂B = θ̂ + ûγ p̂γ σ̂γγ + 0.5 ûγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ . (3.9)
Ainsi, l’estimateur de Bayes de γ sous SELF est :

uγ = 1, uγγ = uγθ = uθθ = uθγ = 0 et le reste L-termes et p-termes sera comme ci-dessus,
donc nous avons
1 h i
γ̂B = γ̂ + ûγ p̂γ σ̂γγ + ûγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ . (3.10)
2
71
3.2 Estimation bayésienne de la prime

Pour obtenir des estimateurs bayésiens, nous supposons que θ et γ sont des variables
aléatoires à valeurs réelles avec une fonction de densité de probabilité π (θ, γ). Rappelons
que la distribution conditionnelle de X | γ, θ est la distribution Gamma-Lindley et les distri-
butions de θ et γ sont supposées être connues dans cette partie. p (θ, γ | X) est la distribution
¯
à postériori de θ et γ compte tenu des données.
Dans cette partie, nous considérons l’estimateur bayésienne de la prime P•B en utilisant
les fonctions de perte et les loi à priori définies ci-dessous.
3.2.1 Estimateurs bayésiens de la prime sous la fonction de perte qua-

dratique
La fonction de perte ”squared error” et proposée par Legendree (1805) et Bühlmann

Straub (1996) pour développer la théorie des moindres carrés. Elle est donnée par
2
L(β̂, β) = β̂ − β . (3.11)
Cette fonction de perte est de nature symétrique c’est-à-dire qu’elle donne une pondération
égale à la fois sur et sous estimation. Dans la littérature actuarielle, nous écrivons
2
B
L(PSELF , µ (θ, γ)) = PSELF
B
− µ (θ, γ) , (3.12)
B
Où PSELF est l’estimateur de µ (θ, γ), elle doit être choisie de telle sorte que l’espérance
à postériori de la fonction de perte ”squared error”
h i Z ∞Z ∞
E L(PSELF , µ (θ, γ)) =
B B
L(PSELF , µ (θ, γ))p (θ, γ | X) dθdγ, (3.13)
0 0 ¯
Z ∞Z ∞ 2
= B
PSELF − µ (θ, γ) p (θ, γ | X) dθdγ,
0 0 ¯
est minimum
Z ∞ Z ∞
B
= E µ (θ, γ) | X = µ (γ, θ) p (γ, θ | X) dθdγ,

PSELF (3.14)
¯ 0 0 ¯
72
Distribution à posteriori en utilisant la loi Gamma à priori
Les lois informatives à priori sont celles qui insèrent délibérément des informations que
les actuaires ont à portée de main. Cela semble être une approche raisonnable puisque les
connaissances scientifiques à priori devraient jouer un rôle dans la statistique inférentielle.
Un préalable informatif fournit plus d’informations que les lois a prioris non informatives.
Cette loi est définie sur <+ . Elle est donnée par
π (θ, γ) ∝ θa−1 γc−1 e(−bθ−dγ) ; a, b, c, d > 0, (3.15)
où, a, b, c et d sont les hyper-paramètres.

L’espérance de distribution Gamma-Lindleyet définie par
2γ (1 + θ) − θ
u (θ, γ) = E X | θ, γ = µ (θ, γ) = ,

(3.16)
θγ (θ + 1)
où µ (θ, γ) est la prime individuelle.
Selon la fonction de perte d’erreur quadratique, l’estimateur bayésien de la prime µ (θ, γ)
est obtenu en substituant la distribution postérieure (3.16) dans (3.14), comme suit :
Z ∞Z ∞
PSELF = E µ (θ, γ) | X =
B
µ (θ, γ) p (θ, γ | X) dθdγ

(3.17)
¯ 0 0 ¯
n " !# 
Pn

(2γ(1+θ)−θ) [(γ+γθ−θ)xi +1] 
Q
θ2n+a−2 γc−n−2 e − dγ+θ x i +b 
i=1  i=1
n+1
(θ+1)  
= n " !#  ,
Pn

[(γ+γθ−θ)xi +1] 
Q
RR θn+a−1 γc−n−1 e− dγ+θ x i +b 
i=1  i=1

 dθdγ
(θ+1)n  
θ γ
Suivant la procédure décrite ci-dessus, nous avons
G (θ, γ) = (a − 1) log θ + (c − 1) log β − (bθ + dβ) , (3.18)
et
L (θ, γ) = 2n log θ − n log γ − n log (θ + 1) (3.19)

Xn Xn
+ log (γ + γθ − θ) xi + 1 − θ xi .

i=1 i=1
73
On peut facilement vérifier que

−(2γθ2 +4γθ−θ2 +2γ) 2(2γθ3 +6γθ2 +6γθ−θ3 +2γ) −θ2
ûθ = 2 , ûθθ = 3 , ûθγ = ,
γ( θ+θ2) γ( θ+θ2) (γ(θ+θ2 ))2
ûγ = 1
γ2 (1+θ)
, ûγγ = −2
γ3 (1+θ)
, ûγθ = −1
(γ(1+θ))2
,
Qui sont remplacés dans l’équation suivante

B
=E µ (θ, γ) | X =û θ̂, γ̂

PSELF (3.20)
¯
1 h i
+ ûγγ + 2ûγ p̂γ σ̂γγ + (ûθθ + 2ûθ p̂θ ) σ̂θθ
2
1 h i
+ ûγ ûγγ L̂γγγ p̂γγ + L̂θθγ σ̂θθ + (ûθ σ̂θθ ) L̂θγγ σ̂θθ + L̂θθθ σ̂θθ .
2
3.2.2 Estimateurs bayésiens de la prime sous la fonction de perte LI-

NEX
La fonction de perte LINEX (linéaire-exponentielle) (le nom LINEX est justifié par le
fait que cette fonction de perte asymétrique augmente approximativement linéairement sur
un côté de zéro et approximativement exponentiellement sur l’autre côté) qui est asymétrique.
Elle a été introduite par Varian (1975). Rojo (1987), Basu et Ebrahimi (1991), Pandy
(1997), Soliman (2000), Nassar et Eissa (2004) ont utilisés celle-ci pour le calcul de l’esti-
mateur bayésien.
Elle peut être exprimée comme suit :

L(β̂, β) = exp α β̂ − β − α β̂ − β − 1, α , 0. (3.21)
Le signe et la grandeur du paramètre de forme α reflètent respectivement la direction et

le degré d’asymétrie. (Si α > 0), la surestimation est plus grave que la sous-estimation, et
vice-versa). Pour α proche de zéro, la perte LINEX est une perte d’erreur approximative-
ment carrée et donc presque symétrique. L’attente postérieure de l’équation de la fonction
de perte LINEX est :
h i
E L(β̂, β) ∝ exp(αβ̂)E exp(−αβ) − α β̂ − E(β) − 1.

(3.22)
74
Selon le résultat de Zellner (1986), l’estimateur de β sous la fonction de perte LINEX

est β̂ qui minimise l’équation ci-dessus, il est donné par :
1 h h ii
β̂ = − log E e−αβ . (3.23)
α
B
Dans notre étude, l’objectif est de trouver l’estimateur bayésien de la prime PLIN qui est
la valeur qui minimise l’équation (3.22), elle est donnée par :
1 h h ii
B
PLIN = − log E e−αµ(θ,γ) . (3.24)
α
h i
Lorsque l’espérance E e−αµ(θ,γ) existe et finie (voir Calabria et Pulcini (1969)).
Thomson et Basu (1996) ont identifié une famille de fonctions de perte L(∆) où ∆ est
l’erreur d’estimation (β̂, β), telle que
— L(0) = 0.
— L(∆) > (<)L(−∆) > 0 pour tout ∆ > 0.
— L(·) est deux fois différentiable avec L0 (0) = 0 et L (∆) > 0 pour tout ∆ , 0.
00
— 0 < L (∆) > (<) − L (−∆) > 0 pour tout ∆ > 0.

0 0
L’estimateur bayésien de la prime correspondant sous la fonction de perte LINEX est :
1
B
= − log E h (θ, γ) | X ,

PLIN (3.25)
α ¯
où
h (θ, γ) = e−αµ(θ,γ) . (3.26)
Selon la fonction de perte de LINEX, l’estimateur bayésien de la prime µ (θ, γ) est

obtenu en substituant la distribution postérieure (3.16) dans (3.25), comme suit :
h i Z ∞
E e −αµ(θ,γ)
|X = e−αµ(θ,γ) p (θ, γ | X) dθdγ (3.27)
¯ 0 ¯
n " !# 
Pn

[(γ+γθ−θ)xi +1] 
Q
θ2n+a−1 γc−n−1 e− αµ(θ,γ)+dγ+θ x i +b 
i=1  i=1
n
(θ+1)
 
= n " !#  ,
Pn

[(γ+γθ−θ)xi +1] 
Q
RR θn+a−1 γc−n−1 e− dγ+θ x i +b 
i=1  i=1

 dθdγ
(θ+1)n  
θ γ
75
L (θ, γ) et G (θ, γ) sont les mêmes que ceux indiqués dans (3.19) et (3.18). En suivant les
mêmes étapes expliquées ci-dessus, on obtient :
h i h i
ĥθ = −α uθ e(−αu(θ,γ)) , ĥθθ = −α uθθ − αu2θ e(−αu(θ,γ)) ,
h i
ĥθγ = −α uθγ − αuθ uγ e(−αu(θ,γ)) , ĥγ = −α uγ e(−αu(θ,γ)) ,
h i h i
ĥγγ = −α uγγ − αu2γ e(−αu(θ,γ)) , ĥγθ = −α uγθ − αuθ uγ e(−αu(θ,γ)) .
Qui sont remplacés dans l’équation suivante
1 1
=− log E e−αu(θ,γ) |X = − log e−αu(θ̂,γ̂)
h i h
B
PLIN (3.28)
α ¯ α
1 h i
+ ĥγγ + 2ĥγ p̂γ bσγγ + ĥθθ + 2ĥθ p̂θ σ̂θθ
2
1 h i#
+ ĥγ σ̂γγ L̂γγγ σ̂γγ + L̂θθγ σ̂θθ + ĥθ σ̂θθ L̂θγγ σ̂θθ + L̂θθθ σ̂θθ .
2
Remarque 3.1 Le processus de formulation de la connaissance et des croyances d’une

personne concernant une ou plusieurs quantités incertaines dans une distribution de pro-
babilité (conjointe) pour ces quantités est révéle par Garthwaite et al. (2004). Dans le
contexte de l’analyse statistique bayésienne, il se présente le plus souvent comme une
méthode pour spécifier la distribution à priori pour un ou plusieurs paramètres inconnus
d’un modèle statistique. C’est une tâche difficile parce que nous devons d’abord identifier
la distribution préalable et ensuite ses hyperparamètres.
Dans cette thèse, nous nous concentrons sur la méthode proposée par Ahn, Park et
HM (2007) pour déterminer les hyperparamètres a, b, c et d du notre distribution à priori
gamma. Cette technique est basée sur la méthode bootstrap, nous adoptons les mêmes
étapes expliquées dans Sajid Ali, Muhammad Aslam, Sayed Mohsin Ali Kazmi (2013).
3.3 Étude par simulations

Dans cette section, une étude de simulation de Monte-Carlo est effectuée pour comparer
les méthodes d’estimation en utilisant les erreurs quadratique moyennes (MSE) comme
76
suit : 2
PN
i=1 P̂•B − µ (θ, γ)
MS E P̂•B = . (3.29)
N
Lorsque N est le nombre de réplications. Nous avons généré 100000 échantillons de
tailles n = 20, 40, 60 , 80, 100 et 1000 pour représenter les petites, moyennes et importantes
quantités d’observations de Gamma Lindley avec trois valeurs de θ (θ = 0.35423; 1; 9) avec
(γ = 1.5; 3; 4.5).
Afin de comparer les estimateurs bayésiens de la prime obtenus dans la partie ci-dessus
sous deux fonctions de perte différentes, nous choisissons les valeurs des hyperparamètres
a, b, c et d comme suit (a, b, c, d) = (1.2; 0.001; 1; 0.3), avec deux valeurs pour le paramétre
de LINEX (α = 0.1; −0.5).
— résultats du modèle basés sur la distribution de Gamma Lindley sont résumés dans
les tableaux suivants :
Table 3.1-Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de

perte d’erreur quadratique moyenne (γ = 1.5, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.153765 1.666667 0.1555556
n G.P
20 4.997307 1.614993 0.1673283
(3.046348e − 05) (9.471975e − 05) (3.786201e − 05)
40 5.071424 1.634784 0.1566296
(9.809331e − 07) (3.478296e − 06) (9.092648e − 06)
60 5.098026 1.644231 0.154794
(9.310077e − 08) (4.34702e − 07) (1.871041e − 06)
80 5.111654 1.649422 0.1544417
(1.025272e − 08) (8.359941e − 08) (5.764072e − 07)
100 5.119931 1.652677 0.154415
(4.487431e − 10) (1.858109e − 08) (2.314594e − 07)
1000 5.150331 1.665202 0.1553615
(3.434116e − 10) (3.366071e − 10) (4.987695e − 11)
77
Table 3.2- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction

de perte LINEX (γ = 1.5, a = 1, b = 0.004, c = 1, d = 0.004, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.153765 1.666667 0.1555556
n G.P
20 4.96047 1.61492 0.1672811
(0.03736283) (0.002677836) (0.000137493)
40 5.052458 1.634389 0.1566093
(0.01026308) (0.00104184) (1.110451e − 06)
60 5.085255 1.643829 0.1547803
(0.004693506) (0.0005215545) (6.009828e − 07)
80 5.102028 1.649062 0.1544313
(0.002676713) (0.0003099141) (1.264012e − 06)
100 5.112207 1.65236 0.154334
(0.001727036) (0.0002046931) (1.492224e − 06)
1000 5.14955 1.665159 0.1553606
(1.77649e − 05) (2.274194e − 06) (3.800078e − 08)

de perte LINEX (γ = 1.5, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.153765 1.666667 0.1555556
n G.P
20 5.171916 1.635624 0.1675587
(0.0003295484) (0.0009637486) (0.0001440801)
40 5.163393 1.64558 0.1567301
(9.271661e − 05) (0.0004446442) (1.379591e − 06)
60 5.160425 1.65154 0.1548624
(4.435941e − 05) (0.0002288093) (4.804549e − 07)
80 5.158868 1.654946 0.1544938
(2.604214e − 05) (0.0001373635) (1.127355e − 06)
100 5.157903 1.657117 0.1544571
(1.713005e − 05) (9.119846e − 05) (1.206676e − 06)
1000 5.154202 1.665653 0.1553659
(1.910046e − 07) (1.027085e − 06) (3.597277e − 08)
78
Table 3.4- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de

perte d’erreur quadratique moyenne (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.399907 1.833333 0.1888889
n G.P
20 5.245517 1.771582 0.1832947
(3.464839e − 08) (3.570231e − 07) (3.937284e − 06)
40 5.320573 1.800505 0.1849694
(3.330606e − 07) (2.689541e − 07) (2.143201e − 07)
60 5.346562 1.81104 0.186032
(2.715271e − 07) (2.623254e − 07) (3.817615e − 08)
80 5.359731 1.816463 0.1866555
(1.937792e − 07) (1.975259e − 07) (1.096881e − 08)
100 5.367686 1.819766 0.1870587
(1.409512e − 07) (1.474322e − 07) (4.080755e − 09)
1000 5.396656 1.831952 0.1886903
(2.084134e − 09) (2.333283e − 09) (4.650837e − 13)

de perte LINEX (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.399907 1.833333 0.1888889
n G.P
20 5.207548 1.766747 0.1832283
(0.03700179) (0.004433743) (3.204255e − 05)
40 5.301051 1.798005 0.1849343
(0.009772392) (0.001248088) (1.5639e − 05)
60 5.333425 1.809354 0.1860081
(0.004419831) (0.0005750293) (8.298662e − 06)
80 5.349831 1.815191 0.1866374
(0.002507607) (0.0003291275) (5.069357e − 06)
100 5.348782 1.818745 0.1870441
(0.002613799) (0.0002128115) (3.40307e − 06)
1000 5.394745 1.831848 0.1886888
(2.664489e − 05) (2.205679e − 06) (4.100289e − 08)
79

de perte LINEX (γ = 3, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.399907 1.833333 0.1888889
n G.P
20 5.427538 1.79561 0.1886775
(0.0007634619) (0.001423049) (4.471239e − 08)
40 5.416159 1.812972 0.1878023
(0.0002641203) (0.0004145909) (1.180747e − 06)
60 5.411364 1.819455 0.1879242
(0.0001312618) (0.0001926006) (9.305554e − 07)
80 5.408745 1.822815 0.1880724
(7.811271e − 05) (0.0001106374) (6.667109e − 07)
100 5.407098 1.824867 0.1881903
(5.171711e − 05) (7.168128e − 05) (4.880571e − 07)
1000 5.400672 1.832469 0.1886978
(5.847544e − 07) (7.476398e − 07) (3.6525117e − 09)
Table 3.7- Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction de

perte d’erreur quadratique moyenne (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04).
θ 0.35423 1 9.0
µ (θ, γ) 5.481954 1.888889 0.2
n G.P
20 5.329274 1.827011 0.193616
(1.168254e − 06) (6.246464e − 07) (2.077482e − 06)
40 5.403857 1.856448 0.1959277
(9.673216e − 07) (9.089205e − 07) (1.070641e − 07)
60 5.429509 1.866937 0.1970839
(5.578413e − 07) (5.664754e − 07) (1.68216e − 08)
80 5.442479 1.872305 0.1977365
(3.52083e − 07) (3.689678e − 07) (4.085179e − 09)
100 5.450306 1.875564 0.1981523
(2.40468e − 07) (2.563527e − 07) (1.229509e − 09)
1000 5.478765 1.887536 0.1998017
(2.973305e − 09) (3.342981e − 09) (5.370309e − 12)
80
Table 3.8-Estimateurs de la prime Bayésienne et MSE respectifs sous la fonction

de perte LINEX (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04, α = 0.1).
θ 0.35423 1 9.0
µ (θ) 5.481954 1.888889 0.2
n G.P
20 5.290906 1.865187 0.1935402
(0.03649938) (0.0005617763) (4.172944e − 05)
40 5.384137 1.870985 0.1958878
(0.009568302) (0.000320561) (1.690997e − 05)
60 5.416239 1.874504 0.1970568
(0.004318502) (0.0002069132) (8.662202e − 06)
80 5.43248 1.879245 0.197716
(0.002447731) (9.300239e − 05) (5.216632e − 06)
100 5.442285 1.88404 0.1981358
(0.001573686) (2.351128e − 05) (3.475418e − 06)
1000 5.477955 1.887429 0.1998001
(1.59943e − 05) (2.132462e − 06) (3.997879e − 08)

de perte LINEX (γ = 4.5, a = 1, b = 0.04, c = 1, d = 0.04, α = −0.5).
θ 0.35423 1 9.0
µ (θ) 5.481954 1.888889 0.2
n G.P
20 5.512915 1.852012 0.1939944
(0.0009585949) (0.001359935) (3.606741e − 05)
40 5.500253 1.869397 0.1961272
(0.0003348473) (0.0003799159) (1.499893e − 05)
60 5.494853 1.875674 0.1972194
(0.0001663833) (0.000174635) (7.731462e − 06)
80 5.491902 1.878897 0.1978392
(9.895527e − 05) (9.984395e − 05) (4.669201e − 06)
100 5.490047 1.880857 0.1982349
(6.548409e − 05) (6.451587e − 05) (3.115667e − 06)
1000 5.482814 1.888072 0.1998102
(7.38487e − 07) (6.671339e − 07) (3.602843e − 08)
81
3.4 Résultats et Discussion

La performance dépend de la forme de la distribution d’origine et de la fonction de perte
supposée. La plupart des auteurs ont utilisé une erreur quadratique comme fonction de perte
symétrique. Cependant, en pratique, la fonction perte réelle n’est souvent pas symétrique.
On peut noter pour la distribution de Gamma Lindley que lorsque θ augmente, l’estimateur
de la prime Bayésien µ(θ, γ) diminue. De même, il est observé que l’estimateur de la prime
Bayesian qui donne la plus faible erreur absolue moyenne sur tous les autres estimateurs
bayésiens dans la majorité des cas est l’estimateur bayésien de la prime sous la fonction
de perte Linex surtout lorsque le paramètre de perte est inférieur à zéro (0) c’est-à-dire
(α = −0, 5). Il est toujours suivi par l’efficacité par la perte d’erreur quadratique, comme
le montrent les tableaux 1 et 2. Dans le tableau 3, on peut montrer que l’estimateur de la
prime bayésien en fonction de la perte Linex est également plus efficace que l’estimateur de
Bayes sous la fonction de l’erreur quadratique uniquement dans le cas des valeurs élevées
de θ. Au fur et à mesure que la taille de l’échantillon augmente, on constate que toutes
les MSE moyennes d’estimateurs convergent vers µ (θ, γ). En outre, nous concluons que
la performance est approximativement égale à un risque postérieur plus petit. En outre, les
résultats de Gamma Lindley sous la fonction de l’erreur quadratique sont plus précis en
général par rapport à ceux de Linex (α = −0, 5). À partir de la discussion susmentionnée,
nous pouvons conclure que la procédure de Bayes discutée dans ce document peut être
recommandée pour leur utilisation.
Dans ce chapitre, nous avons traité le problème des estimateurs bayésiens pour la distri-
bution Gamma Lindley, dans le cadre des fonctions de perte asymétriques et symétriques,
le paramètre de risque pour un preneur d’assurance n’est jamais connu en réalité, nous
avons construit des estimateurs bayésiens supérieurs à la suite de techniques d’inférence
bayésiennes. En imposant une distribution préalable, nous sommes en mesure de décrire la
structure de risque pour l’ensemble de la classe de notation. En pratique, le choix de cette
distribution préalable est subjectif par rapport aux jugements personnels ou induit à partir
82
de données historiques des groupes correspondants. En utilisant la simulation numérique,

il semble que les primes bayésiennes soient cohérentes et vérifient la condition de conver-
gence à la prime individuelle. D’après les résultats, nous observons que, dans la plupart des
cas, les estimateurs bayésiens pour la distribution Gamma Lindley sont plus efficaces, car
ils convergent plus rapidement vers la prime individuelle généralement sous la fonction de
l’erreur quadratique qui ont été mentionnés dans les tableaux ci-dessus.
83
Chapitre 4
Méthode des Quantiles sous la théorie de

la crédibilité (Décomposition de
Quantile)
Ce chapitre se concentre sur la théorie de la crédibilité et les quantiles. Plus précisément,

nous montrons comment la décomposition de quantile simplifie le modèle de Pitselis (2013),
qui intègre les quantiles dans le modèle classique de Bühlmann (1969). Une nouvelle prime
de crédibilité est proposée et une application avec des données réelles est établie.
4.1 Interprétation du modèle

Dans la littérature de la science actuarielle, il y a quelques articles abordants les quan-
tiles. Le document de Pitt (2006) démontre l’importance de quantiles dans la réglementation
et d’autres dans les approches stochastiques à l’évaluation des passifs d’assurance et les
marges de risque. Kudryavtsev (2009) a utilisé la régression du quantile pour le taux
de décision, y compris les charges de sécurité et décrit les avantages de l’approche de
régression quantile. Gebizlioglu et Yagci (2008) ont construit des intervalles de confiance
pour les quantiles bidimensionnelles des distributions de risque à deux variables. Denuit
84
(2008) a fourni des approximations précises pour les quantiles de la valeur actuelle atten-
due conditionnelle des paiements à la rente prestataire, compte tenu de l’évolution future
de l’indice de temps. Pitselis (2009) a appliqué la régression des quantiles comme une tech-
nique pour examiner l’adéquation des fonds propres d’une entreprise qui a besoin de rester
en bonne santé et d’éviter l’insolvabilité.
Pitselis (2013) a intégré les quantiles au modèle de la crédibilité classique de Bühlmann
(1967) et dans le modèle de la crédibilité de régression de Hachemeister (1975).
Il est possible d’interpréter différemment certains modèles de crédibilité, notamment le
modèle de Pitselis (2013). Nous proposons une toute autre interprétation des p−quantiles
des montants des sinistres ξ p j , voir Dannenburg, Goovaerts et Kaas (1996). Plutôt que de
présenter le p−quantiles ξ p j de l’expérience X ji du contrat j pour la période i comme une

variable aléatoire issue d’une certaine fonction f ξ p | θ , ils décomposent le quantile du
montant de sinistre en une somme de variables aléatoires. En fait, l’idée générale de cette
décomposition s’inspire des (Variance Components models), modèles bien connus en sta-
0
tistique. A titre de référence, Searle, Casella et McCulloch ( 1992) donnent les principaux
concepts de ces modèles. Dans un premier temps, nous présentons certaines hypothèses qui,
appliquées à la théorie de la crédibilité, conduisent à une forme simplifiée du modèle de Pit-
selis (2013). Cette simplification est basée d’une part sur le fait que l’on suppose le même
nombre d’observations pour chaque contrat, et d’autre part sur l’hypothèse d’indépendance
des composantes des variables ξ p j . Notons cependant que ce modèle peut être appliqué à un
portefeuille dont l’expérience de chaque contrat a été observée sur un nombre de variable
de périodes.
4.2 Préliminaires sur les quantiles

Dans cette section, nous fournissons une brève introduction sur la fonction quantile et
estimateurs de quantile nécessaire pour les estimateurs de crédibilité.
Soit F(x) = P[X ≤ x] la fonction de distribution d’ensemble des variables aléatoires
85
X1 , . . . , Xn .
Un quantile est la valeur qui correspond à une proportion déterminée de l’échantillon
ou la population (Gilchrist (2000)). Mathématiquement, il est donné par
ξ p = F −1 (p) = in f {x : F(x) ≥ p}. (4.1)
Soit X(1) , . . . , X(n) les statistiques d’ordre de X1 , . . . , Xn et ξ p le quantile d’ordre p.
ξ p = F −1 (p) = in f {x : F(x) ≥ p}.si et seulement si F(ξ p ) = p, 0 ≤ p < 1.
La fonction de distribution empirique peut être définie comme Fn (x) = fraction de

X1 , . . . , Xn qui est ≤ x.
!
j j−1
ξ̂ p = n − p X( j−1) + n p − X( j) ,
n n
Pour
j−1 j
< p ≤ et j = 1, ...., n
n n
Et sa dérivé
0
j−1 j
ξ̂ p = n X( j) − X( j−1) , Pour < p ≤ et j = 1, ...., n. (4.2)
n n

Nous appelons n X( j) − X( j−1) , j = 1, ...., n la distance de l’échantillon.
Parzen (1979) et Jones (1992) défini la fonction de densité quantile comme la dérivée de
ξ̂ p . Estimateurs de quantiles qui peuvent mieux se comporter dans de petits échantillons de
densités symétriques peuvent être obtenus par une fonction linéaire par morceaux déplacée
2j + 1
! !
2j − 1
ξ̂ p = n − p X( j) + n p − X( j+1) ,
2n 2n
pour
2j − 1 2j + 1
<p≤ et j = 1, ...., n.
2n 2n
Le ξ̂ p est indéfini pour p < 1
2n
ou p > 1 − 2n
1
. Maintenant la dérivée de ξ̂ p est donnée par
0
2j − 1 2j + 1
ξ̂ p = n X( j+1) − X( j) , Pour <p≤ et j = 1, ...., n (4.3)
2n 2n
86
Dans les modèles paramétriques, lorsque F est d’un emplacement type d’échelle connue
ξ p −θ ξ p −θ
F( x−θ
σ
), ensuite F(ξ p ) = F( σ
) = p, et donc, Z p = ( σ
) avec F(Z p ) = p et ξ p = σz p + θ.
Puis estimer θ et σ par l’estimation du maximum de vraisemblance ou par des combinaisons
linéaires optimales de statistiques d’ordre. Après, utilisez le test d’adéquation, pour tester
l’hypothèse nulle pour diverses spécifications de Z p correspondant à des distributions de
probabilité bien connus, y compris les distributions longue queue (Cauchy, Pareto, valeurs
extrêmes, etc.), ou d’utiliser un mélange de distributions (robuste modèle paramétrique).
Dans un contexte non-paramétrique, on estime Z p par la fonction du quantile densité où,
par parcelles appropriées des fonctions quantile exemples de transformations de données.
Pour plus de détails sur les fonctions quantile, voir Parzen (2004).
4.3 Modèles de crédibilité (quantile)

Dans cette section, nous présentons brièvement modèle de crédibilité de Pitselis, et
fournir une nouvelle contribution pour simplifier.
4.3.1 Le modèle de crédibilité de Pitselis (2013)
Le modèle de crédibilité de Pitselis (2013) peut être défini comme suit :

Hypothèses :
(i) Pour un paramètre de risque θ j donné, les variabIes X1 j , X2 j , ..., Xt j , sont condition-
nellement indépendantes et identiquement distribuées.

(ii) θ j est une variable aléatoire avec une distribution U θ j ,
h i
(iii) Ξ p θ j = E ξ̂ p j | θ j
ω (θ )
(iv) ν p θ j = var ξ̂ p j | θ j = pn j j .
Les paramètres de structure sont définis comme suit :
h i h i h i
Ξ = E Ξ p θ j , s2ξ p = E ν p θ j , ψ p = var Ξ p θ j . (4.4)
87
Sous les hypothèses ci-dessus, la prime de crédibilité et

Ξcréd
pj = ξ̂ z
pj pj + 1 − z p j Ξp. (4.5)
où ξ̂ p j est l’estimateur de la composante ξ p j , Ξ p qui peut être interprété comme la prime
collective de risque à la p−quantile, et le facteur de crédibilité est :
ψp
Zp = . (4.6)
ψ p + s2ξ p
Estimation des paramètres de structure
Il est possible d’estimer les paramètres de structure Ξ p , ψ p et S ξ2p à partir des obser-
vations du portefeuille, nous présentons maintenant certains estimateurs des paramètres
impliqués dans le calcul du coefficient de crédibilité z p j .
f
Soit un portefeuille d’assurance composé de k contrats et dont l’expérience ξ p j , du
contrat j au cours de différent p−quantile. Les variables aléatoires suivantes constituent
des estimateurs non-biaisés des paramètres Ξ p , ψ p et S ξ2p du modèle classique de Pitselis
(2013).
K
1X
Ξ̂ p = ξ̂ p· = ξ̂ p j ,
K j=1

K ω̂ θ
1 X p j
ŝ2ξ p = ,
K j=1 n j

K K ω̂ θ
1 X 2 1 X p j
ψ̂ p = ξ̂ p j − ξ̂ p· − ,
K j=1 K j=1 n j
donc la prime de crédibilité peut être calculée comme suit :

Ξ̂créd
pj = ξ̂ p j ẑ p j + 1 − ẑ p j Ξ̂ p .
où
ψ̂ p
ẑ p = .
ψ̂ p + ŝ2ξ p
88
4.4 Discussion du nouveau modèle
4.4.1 Décomposition des p−quantiles
Nous proposons, dans un premier temps, un modèle de crédibilité de base. On considère

un portefeuille composé de k contrats dont I’expénence X ji a été observée pendant T
périodes.
De plus, on suppose que l’on détient le même nombre d’observations pour chaque
contrat. on suppose que le montants total des sinistres du jéme contrat est égal à la prime de
risque de ce contrat, à laquelle on ajoute une certaine fluctuation spécifique au p−quantile

de contrat j, soit ξ̂ p j − Ξ p θ j . La prime de risque est la moyenne de p−quantile globale Ξ p

des sinistres du portefeuille à laquelle vient également s’ajouter une variation Ξ p θ j − Ξ p
propre au contrat. Nous notons par γ j cette variation et par γ p j la variation caractéristique
au p−quantile. Ainsi : le p−quantile ξ̂ p j du contrat j est décomposée en une somme de
variables aléatoires de la forme

ξ̂ p j = Ξ p + Ξ p θ j − Ξ p + ξ̂ p j − Ξ p θ j
ξ̂ p j = Ξ p + γ j + γ p j et j = 1, ....., k, (4.7)
Ξ p représente la moyenne globale des ξ̂ p j de l’ensemble du portefeuille. Chaque contrat

est caractérisé par une composante γ j qui lui est propre. Pour un contrat donné, cette com-
posante représente la variation aléatoire des quantiles autour de la moyenne Ξ p . Elle peut
donc s’interpréter comme une mesure du risque que représente le contrat j. Dans cette
optique, la distribution des composantes γ j décrit la structure de risque du portefeuille.

La prime de risque du contrat j, notée Ξ p θ j est la valeur espérée des sinistres du
contrat j sachant le risque que ce contrat représente. Selon notre décomposition la compo-
sante γ j reflète le niveau de risque du contrat j. Ainsi, la prime de risque est notée par :
h i
E ξ̂ p j | γ j = ζ = Ξ p + ζ. (4.8)
Les variables aléatoires γ p j symbolisent quant à elles la variation de ξ̂ p j du contrat j. En

fait, elles sont interprétées comme la fluctuation de ξ̂ p j autour de la prime de risque Ξ p θ j .
89
Hypothèses relatives à la décomposition de quantile de montants des sinistres
Les hypothèses suivantes concernent la décomposition que nous proposons :

h i
(1) Les variables aléatoires γ j ( j = 1, ..., k) sont i.i.d, avec E γ j = 0 et var γ j = ψ p
h i
(2) Les variables aléatoires γ jp ( j = 1, ..., k ) sont i.i.d, avec E γ jp = 0 et var γ jp =
S ξ2p
(3) Les variables aléatoires γ j ( j = 1, ..., k) et γ jp ( j = 1, ..., k ) sont indépendantes.
h i
(4) E ξ̂ p j | γ j = ζ = Ξ p + ζ.
h i
(5) ν p γ j = var ξ̂ p j | γ j .
Les paramètres structurels définis comme suit :
h i
Ξp = E Ξp θ j ,
h i
S ξ2p = E ν p θ j ,
h i
ψ p = var Ξ p θ j .
4.4.2 Discussion sur les hypothèses
Les deux premières hypothèses se retrouvent dans le modèle classique de Bühlmann

(1969). Pour la première hypothèse, on suppose l’indépendance des composantes γ j ( j = 1, ....., k) ,
ainsi qu’une distribution identique. Par conséquent, les différents contrats du portefeuille
sont indépendants et identiquement distribués. La composante γ j représente la variation de

la prime de risque autour de la moyenne globale, soit Ξ p θ j − Ξ p . Son espérance est donc
nulle et sa variance est égale à ψ p .
La deuxième hypothèse suppose les variables γ jp ( j = 1, ....., k ) indépendantes et iden-
tiquement distribuées. Pour un contrat j, on a donc les ξ̂ p j sont indépendants et identique-
ment distribués.

Puisque γ jp représente la variation des ξ̂ p j d’un contrat, soit ξ̂ p j − Ξ p θ j son espérance
est nulle. Quant à sa variance, elle est obtenue de la façon suivante :
h i h i h i h i
var γ jp = var ξ̂ p j − Ξ p θ j = var ξ̂ p j + var Ξ p θ j − 2cov ξ̂ p j , Ξ p θ j .
90
On à
h i h i h i
var ξ̂ p j = var E ξ̂ p j | θ j + E var ξ̂ p j | θ j = ψ p + S ξ2p .
et
h i h i h i
cov ξ̂ p j , Ξ p θ j = cov E ξ̂ p j | θ j , E Ξ p θ j | θ j + E cov ξ̂ p j , Ξ p θ j | θ j
h i
= var Ξ p θ j + 0
= ψp
danc
h i
var γ jp = ψ p + S ξ2p + ψ p − 2ψ p = S ξ2p
L’hypothèse (4), quant à elle, donne l’expression de la prime de risque selon notre
notation.
La décomposition qui nous avons employé conduit à une simplification du modèle de
Pitselis (2013). Ceci est causé d’une part par le nombre de périodes d’observation identique
pour tous les contrats, mais aussi par l’indépendance entre γ j . On y suppose l’indépendance
des composantes γ j et γ jp pour j = 1, ....., k. Dans le modèle classique de Bühlmann (1969),
cette hypothèse est moins restrictive puisqu’on exige seulement une corrélation nulle des
composantes γ j et γ jp . En effet, selon le modèle classique de Bühlmann (1969), on a

cov γ j , γ jp = cov Ξ p θ j − Ξ p , ξ̂ p j − Ξ p θ j

= cov Ξ p θ j , ξ̂ p j − var Ξ p θ j
= ψ p − ψ p = 0,
L’espérance de ξ̂ p j , est obtenue en prenant l’espérance de chacune des composantes.

Puisque les composantes γ j ( j = 1, ....., k) et γ jp ( j = 1, ....., k ) sont indépendantes, la va-
riance de ξ̂ p j est simplement la somme des variances de ces deux composantes. Par conséquent
γ j et γ jp sont appelées ”Variance components Models”.
91
4.4.3 Calcul de la prime
Bien que les hypothèses de départ conduisent à une interprétation différente du modèle
de Pitselis (2013), il est possible de montrer qu’on va obtenir la même prime de crédibilité.
En effet, on effectue dans les lignes qui suivent le calcul de la prime selon les hypothèses
relatives aux composantes de ξ̂ p j en prenant l’espérance de chacune des composantes. Et il
en résulte une prime de crédibilité équivalente à celle obtenue dans Pitselis (2013).
Proposition 4.1 Dans un premier temps, on présente, par la proposition suivante, cer-
taines relations de covariance qui seront utiles notamment dans les preuves. Soient la va-
riable aléatoire ξ̂ p j telles que j = 1, ....., k

(i) cov ξ̂ p j , ξ̂ p0 j = ψ p + δ pp0 S ξ2p , (4.9)
δ js
(ii) cov ξ̂ p j , ξ̂ p. = ψ p + S ξ2p , (4.10)
k
δ 0δ
pp js

(iii) cov ξ̂ p. , ξ̂ p0 . = ψ p + S ξ2p , (4.11)
k

(iiii) cov ξ̂ p j , ξ̂ ps = δ js ψ p + S ξ2p . (4.12)
Preuve. Ces relations peuvent être démontrées à l’aide des hypothèses sous-jacentes
à la décomposition de ξ̂ p j . La covariance entre les deux ξ̂ p j d’un même contrat peut être
écrite de la façon suivante

(i) cov ξ̂ p j , ξ̂ p0 j = cov ξ̂ p j , ξ̂ p0 j

= cov Ξ p + γ j + γ p j , Ξ p0 + γ j + γ p0 j
h i h i
= cov γ j , γ j + cov γ p j , γ p0 j = var γ j + δ pp0 var γ p j
h i h i
= var γ j + var γ p j = ψ p + δ pp0 S ξ2p ,
K K
 
1 X 1 X
(ii) cov ξ̂ p j , ξ̂ p. = cov Ξ p + γ j + γ p j , Ξ p + γs + γ ps 
 
K S =1 K S =1
K K
   
 1 X 1 X
= cov γ j , γ s  + cov γ p j , γ ps 
  
K S =1 K S =1
δ js h i δ js h i δ js
= var γ j + var γ p j = ψ p + S ξ2p
K K K
92
De la même façon, on démontre la troisième relation :

 K K K K

 1 X 1 X 1 X 1 X 
(iii) cov ξ̂ p. , ξ̂ p0 . = cov Ξ p + γj + γ p j , Ξ p0 + γs + γ p0 s 
K j=1 K j=1 K S =1 K S =1
 K K
  K K

 1 X 1 X   1 X 1 X 
= cov  γ j, γ s  + cov  γp j, γ ps 
K j=1 K S =1 K j=1 K S =1
δ js h i δ js δ pp0 h i δ js
= var γ j + var γ p j = ψ p + S ξ2p
K K K
δ pp0 δ js
= ψ p + S ξ2p
K

(iiii) cov ξ̂ p j , ξ̂ ps = cov Ξ p + γ j + γ p j , Ξ p + γ s + γ ps = cov γ j , γ s + cov γ p j , γ ps
h i h i
= δ js var γ j + δ js var γ p j = δ js ψ p + S ξ2p .
Thorme 4.2 Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses (B1),
(B2) et (B3) la meilleure approximation linéaire non homogène de la prime de risque Ξ p
est

Ξ̂créd
p j = ξ̂ p j ẑ p j + 1 − ẑ p j Ξ̂ p .
Preuve. La décomposition de ξ̂ p j que nous avons employée, par ses hypothèses, conduit
à une simplification du modèle classique de Pitseli (2013). Cependant, à l’aide de ces hy-
pothèses, on montre que la prime de crédibilité obtenue est la même que celle du modèle
Pitselis (2013).Tout comme dans le modèle de Bühlmann (1969), on cherche à obtenir une
approximation de la prime de risque par des combinaisons linéaires non-homogènes des
observations.Selon notre notation, la prime de risque Ξ p + γ j du contrat j est approximée
par une combinaison linéaire non-homogène de la forme :
K
X
c0j + j
c ps Ξ p + γ s + γ ps . (4.13)
s=1
93
On cherche donc à obtenir les coefficients c0j∗ , c p1

j∗
, c p2
j∗
, ...., c pk
j∗
tels que l’erreur quadratique
entre la prime de risque du contrat j et son approximation est minimale. On doit minimiser

 K
2 
X
E Ξ p + γ j − c0j − Ξ p + γ s + γ ps   .
j
 
c ps (4.14)
s=1
Par hypothèse, les contrats sont indépendants et identiquement distribués, ainsi que les ξ̂ p j
d’un même contrat. Ceci implique que le système que l’on doit résoudre est symétrique par
j
conséquent, les coefficients c ps , doivent être égaux dans la solution optimale pour s , j.
Dans ce cas, on a
K
X c1j X
K
c1j X
K
j
c ps Ξ p + γ s + γ ps = Ξ p c1 +
j
γs + γ pr .
s=1
K s=1 K r=1
s,J r,J
Lorsque s = j les coefficients c pj j des différents p−quantiles sont égaux par symétrie. En
posant c2j = c pj j , on obtient pour s = j

c pj j Ξ p + γ j + γ p j = Ξ p c2j + c2j γ j + c2j γ p j .
Ainsi, l’expression linéaire suivante permet d’obtenir une approximation de la prime de

risque :  
 K K 
1X 1 X 
c0 + c1 Ξ p +
j j
γs + γ pr  + c2j Ξ p + γ j + γ p j .

(4.15)
 K s=1 K r=1 
s, j r, j
h i
Par la relation E x2 = var [x] + E [x]2 , le problème de minimisation entre la prime de
risque Ξ p + γ j et la prime linéaire est donc équivalent à la minimisation de
   
  K K  
1 X 1 X 
var Ξ p + γ j − c0 − c1 Ξ p +
j j
γs + γ pr  − c2 Ξ p + γ j + γ p j 
j
 
(4.16)
 
  K s=1 K r=1  
s, j r, j
   
  K K  
1 1
X X   
+ E Ξ p + γ j − c0 − c1 Ξ p +
2 j j
γs + γ pr  − c2 Ξ p + γ j + γ p j  .
j
 
  K s=1 K r=1  
s, j r, j
Dans un premier temps, on obtient la valeur optimale c0j∗ en minimisant le deuxième terme
de (4.16). Celui-ci est minimisé lorsque la quantité dont on calcule l’espérance est nulle. Se-
h i h i
lon les hypothèses formulées au début E γ j = 0 ( j = 1, ....., k) et E γ jp = 0 ( j = 1, ....., k ) .
94
On trouve donc l’expression suivante pour

c0j∗ = Ξ p 1 − c1j − c2j . (4.17)
On remarque qu’une telle expression implique que 1’approximation linéaire de la prime de

risque, telle que définie en (4.15), est sans biais. En effet,
   
  K K  
1 X 1 X 
E c0 + c1 Ξ p + γs + γ pr  + c2 Ξ p + γ j + γ p j 
 j j 
  j
  K K
s=1 r=1
 
s, j r, j
   
  X K K  
1 1 X 
= E Ξ p − c1 Ξ p − c2 Ξ p + c1 Ξ p + c1 
j j j j
γs + γ pr  + c2 Ξ p + c2 γ j + γ p j 
j j
  

  K K  
s=1 r=1
s, j r, j
   
  X K K  
1 1 X    h i
= E Ξ p + c1 
j
γs + γ pr  + c2 γ j + γ p j  = E Ξ p = Ξ p .
j
 
  K K r=1  
s=1
s, j r, j
Dans un deuxième temps, la minimisation du premier terme de (4.16) permet d’obtenir

les coefficients optimaux c1j∗ et c2j∗ . Pour ce faire, on ajoute et on retranche la quantité
j
c1

K
Ξ p + γ j + γ j
p j à cette variance. Notons également que le coefficient c0 est omis puis-
qu’étant une constante, sa variance est nulle.La variance de (4.16) est donc réécrite ainsi :
h i
var c0j = 0,
donc
  
  j  K K 
 j c1  1 X 1 X
var Ξ p + γ j − c2 +  Ξ p + γ j + γ p j − c1 Ξ p +
j
γs + γ pr 
  
(4.18)
 k  K s=1 K r=1 
s, j r, j
  
  j    K K 
 j c1   1 X 1 X
= var Ξ p + γ j − c2 +  Ξ p + γ j + γ p j  + var c1 Ξ p + γs + γ pr 
   j  
k   K s=1 K r=1 
s, j r, j
  
  j  K K 
 j c1  j  1 X 1 X
− 2cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr  .
 
 k  K s=1 K r=1 
s, j r, j
95
On montre que la covariance est nulle

  
  j  K K
X 
 j c1  j  1 X 1
cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr 

 k  K s=1 K r=1 
s, j r, j
  
 j  j  K K 
c1   j c1  1 X 1 X 1 1 
= cov 1 − c2 +  γ j − c2 +  γ p j , c1 Ξ p + γs + γ pr − γ j − γ p j 

 j
   j 

 k k  K s=1 K r=1 K K 
s, j r, j
 
 j jX K   j j 
c c c c
= cov 1 − c2j + 1  γ j , 1 γ s  − cov 1 − c2j + 1  γ j , 1 γ j 
  
 
 
 
 
 
 k K s=1  k K
s, j
 
j jX K
 j c1j  c1j 
  
c c
 
−cov c2 +  γ p j , γ pr  + cov c2 +  γ p j , γ p j  .
 j
 1

 1 
 k K r=1  k K
r,J
car les composantes γ j et γ p j sont indépendantes par hypothèse. Puisqu’on suppose également
les contrats indépendants entre eux, on a donc
  
 j  j  K K 
c1   j c1  1 X 1 X 1 1
cov 1 − c2 +  γ j − c2 +  γ p j , c1 Ξ p + γs + γ pr − γ j − γ p j 
 j j  
 k k  K s=1 K r=1 K K 
s, j r, j
 j j  j j
c c c  c
= 1 − c2j + 1  1 δ jr var γ j − 1 − c2j + 1  1 var γ j
 
 

k K k K
c j  c j c j  c j
   

− c2j + 1  1 δ js var γ p j + c2j + 1  1 var γ p j ,

k K k K
pour j = s et j = r
  
  j  K K
X 
 j c1  j  1 X 1
cov Ξ p + γ j − c2 +  Ξ p + γ j + γ p j , c1 Ξ p + γs + γ pr 

 k  K s=1 K r=1 
s, j r, j
c1j  c1j c1j  c1j

   

= 1 − c2 +  var γ j − 1 − c2 +  var γ j
 j  j
k K k K
 j c1j  c1j  j c1j  c1j
   

− c2 +  var γ p j + c2 +  var γ p j = 0.
 
k K k K
Le deuxième terme à droite de l’équation (4.18) est quant à lui minimisé lorsque le coeffi-
cient c1j est nul. Il ne reste donc qu’à trouver le coefficient c2j∗ qui minimise le premier terme
96
à droite de l’équation (4.18), soit

h i
var Ξ p + γ j − c2j Ξ p + γ j + γ p j (4.19)
h i h i
= var Ξ p + γ j + var c2j Ξ p + γ j + γ p j − cov Ξ p + γ j , c2j Ξ p + γ j + γ p j
h i h i
= var Ξ p + γ j + c2j var Ξ p + γ j + γ p j − 2c2j cov Ξ p + γ j , Ξ p + γ j + γ p j .
En posant nulle la dérivée partielle par rapport à c2j de (4.19) et en supposant l’indépendance
des composantes γ j ( j = 1, ....., k) et γ jp ( j = 1, ....., k ) on obtient l’expression pour c2j∗ :

cov Ξ p + γ j , Ξ p + γ j + γ p j
c2j∗ = h i
var Ξ p + γ j + γ p j
h i
var γ j
= h i h i
var γ j + var γ p j
On a donc
ψp
zp j = (4.20)
ψ p + S ξ2p
Le coefficient c2j∗ est donc équivalent au coefficient de crédibilité tel que défini dans le
modèle de Pitselis (2013). Selon la décomposition des montants de sinistres la prime de
risque du contrat j pour la (i)éme période est

Ξcréd
p j = ξ̂ p j z p j + 1 − z p j Ξ p ,
où
ψp
zp j = ,
ψ p + S ξ2p
ξ̂ p j = Ξ p + γ j + γ p j ,
h i
Ξp = E Ξp + γ j .
Elle est donc équivalente à la prime de crédibilité du modèle classique de Pitselis (2013).
97
4.5 La nouvelle prime de crédibilité

Nous voyons dans cette section la nouvelle prime de crédibilité. Cette prime basée sur la
variation de p−quantile pour chaque contrat j , c’est-à-dire qu’on peut vraiment calculer la
prime de crédibilité pour chaque contrat j, à l’aide de facteur de développement κi j sachant
que ẑ p j est indépendant. On prend le médiane comme un axe de départ pour calculer la
prime de crédibilité pour une certaine période d’expérience i comme c’est le cas dans le
modèle Pitselis (2013). Ensuite, pour une période i + 1 on calcule d’abord le facteur de
développement κi j qui représente la fréquence de développement de quantile p (médiane)
de contrat j de la période i jusqu’a i + 1 , on calcule aussi, la prime de crédibilité pour la
période i + 1 pour un p−quantile (médiane) ajouté au facteur de développement κi j .
Soit i = 1, ....., n et j = 1, ....., k ou 0 4 p, κi j 4 1.

Ξ̂2(créd)
pj = ξ̂ 1
pj ẑ p j + 1 − ẑ p j Ξ̂1p où κ1 j = 0,

f
= ξ̂2
Ξ̂3(créd) p+κ

j
z p+κ2 j

j + 1 − ẑ p+κ
j Ξ̂2 p+κ ,
p+κ2 j j 2j 2j 2j
où
ξ̂2p j × p
κ2 j = − p,
ξ̂1p j

Ξ̂4(créd)
= ξ̂3p+κ +κ3 j
ẑ
j p+κ +κ3 j

j + 1 − ẑ p+κ +κ3 j j
Ξ̂3 p+κ +κ3 j

p+κ2 j +κ3 j j 2j 2j 2j 2j
où
ξ̂3 × p + κ2 j
p+κ2 j j
κ3 j = − p + κ2 j ,
ξ̂2
p+κ2 j j
Ξ̂5(créd)
= ξ̂3p+κ +κ +κ j ẑ p+κ +κ +κ j
p+κ2 j +κ3 j +κ4 j j 2j 3j 4j 2j 3j 4j

+ 1 − ẑ p+κ +κ +κ j Ξ̂3 p+κ +κ3 j +κ4 j

2j 3j 4j 2j
98
où
ξ̂4 × p + κ2 j + κ3 j
p+κ2 j +κ3 j j
κ4 j = − p + κ2 j + κ3 j ,
ξ̂3
p+κ2 j +κ3 j j
En généralisant la prime de crédibilité, on obtient

 
 
Ξ̂i+1(créd)
! = ξ̂ i ! ẑ ! +1 − ẑ !   Ξ̂i !, (4.21)
j p+ κi j j p+ κi j j 
P P
p+ κi j j κi j p+ κ
P  P
p+
P
ij
i<2 i<2 i<2 i<2 i<2
où !
ξ̂i × p+ κ(i−1) j
P
!
κ(i−1) j j
 
i<2
P
p+  X 
κi j = −  p + κ(i−1) j  .
i<2
(4.22)
ξ̂i−1 P !
i<2
p+ κ(i−1) j j
i<2
4.5.1 Estimation des paramètres du modèle
Les variables aléatoires suivantes constituent des estimateurs non-biaisés des paramètres
Ξ p0 , ψ p0 et S ξ2 0 de notre modèle, ils sont presque les mêmes que ceux du modèle de Pitselis
p
(2013). Soit p = p + κi j ou 0 4 p 4 1, i = 1, ....., n et j = 1, ....., k .

0 P 0
i<2
K
1X
Ξ̂ p0 = ξ̂ p0 · = ξ̂ 0 , (4.23)
K j=1 p j

K ω̂ 0 θ
1 X p j
ŝ2ξ̂ 0 = , (4.24)
p K j=1
nj

K K ω̂ 0 θ
1 X 2 1 X p j
ψ̂ p0 = ξ̂ p0 j − ξ̂ p0 · − , (4.25)
K j=1 K j=1 n j
donc la prime de crédibilité peut être calculée comme suit :

Ξ̂i+1(créd)
0
p j
= ξ̂ i
0 ẑ p0 j + 1 − ẑ p0 j Ξ̂ 0 ,
p j
i
p
(4.26)
où
ψ̂ p0
ẑ p0 j = (4.27)
ψ̂ p0 + ŝ2ξ̂ 0
p
99
4.5.2 La variance des quantiles
Pour calculer la variance des quantiles ξ̂ p0 j pour l’échantillon du contrat j ( j = 1, ..., k),
nous pouvons appliquer les résultats qu’ on a vu dans la section précédente. Nous allons

montrer comment estimer le terme ω p0 θ j .

On génère la séquence {ξ p0 j , ω p0 θ j } par F j , ( j = 1, ..., K) des distributions échantillonnées
par un processus aléatoire d’une famille de distributions, qui n’ est pas nécessairement de
la même forme (de F) avec différents paramètres, voir Maritz (1989). Lorsque la distri-
bution de X est inconnue, la distribution naturelle sans estimation du p-quantile, ξ p0 j , est
l’échantillon p-quantile ξ̂ p0 j , de ξ p0 j . Lorsque la fonction de densité de probabilité f(.) est
continue avec dérivée continue au voisinage de ξ p j et si elle est différente de zéro, on peut
prendre
0 0
p (1 − p )
ω p0 θ j = h i
f ξ p0 j | θ j

où f ξ p0 j | θ j est la densité de la distribution de X à x = ξ p0 donné θ j , voir Buchinsky
(1998).

De plus, le terme ω p0 θ j , (nous allons ignorer l’indice j pour la facilité de la présentation)
0
peut être estimé à partir d’un intervalle de confiance construit à partir de la [np ]ième quantile
de la fonction de distribution cumulative, dire F(.),notée par ξ p0 et définie par F(ξ p0 ) = p .
0
En général, un intervalle de confiance exact peut être calculé pour la variable aléatoire Y ∼
FY (.) (par exemple, Mood, Graybill et Boes 1974). Spécifiquement
P(y( j) ≤ ξ p0 ≤ y(k) ) = P(y( j) ≤ ξ p0 ) − P(y(k) ≤ ξ p0 ), (4.28)
où y( j) et y(k) sont les statistiques des jème et kème ordre de y1 , ..., yn respectivement.Ensuite,
 
Xn   n  0
P(y( j) ≤ ξ p0 ) =   p i (1 − p0 )n−i . (4.29)
 i 
i= j
De même,  
k−1 
X  n  0
P(y(k) ≤ ξ p0 ) =   p i (1 − p0 )n−i . (4.30)
 i 
i=k
100
La substitution de (4.29) et (4.30) en (4.28) les rendements

 
k−1 
X  n  0
P(y( j) ≤ ξ p ≤ y(k) ) =
0   p i (1 − p0 )n−i . (4.31)
 
i
i= j
La construction d’un intervalle de confiance symétrique de niveau 1 − α pour ξ p0 est

simple. Notons j = [np − l], k = [np + l], et soit X ∼ B(n, p ). Ensuite,
0 0 0
0 0
P(y(np0 −l) ≤ ξ p0 ≤ y(np0 +l) ) = P([np − l] ≤ ξ p0 ≤ [np + l])

X−np
0
l
≈ P( √ 0 0 ≤ p 0
). (4.32)
np (1−p ) np (1 − p0 )
0 L
parce que √ X−np
0 0
→ N (0, 1) assimilant la probabilité dans (4.32) à 1 − α donne
np (1−p )
p 0
l = Z1− α2 np (1 − p0 ). (4.33)
Adaptation de la longueur de l’intervalle de confiance exact en (4.31) à celle de l’intervalle

de confiance asymptotique normale, on obtient une estimation pour ω p θ j :

n ynp0 +l − ynp0 −l
ω̂ p0 θ j = 2
(4.34)
4Z1− α
2
4.6 Application numérique

Dans cette section, nous illustrons comment la variation p-quantile s’effectue dans un
cadre de crédibilité sur un ensemble de données obtenu auprès de la plus grande orga-
nisation de sécurité sociale en Grèce, composé de 6 contrats de classe différents pour
l’expérience des années de réclamation, entre juillet 1980 et juin 2001. Les différentes
classes sont (SickA, AccidA, MaternA, FunerExp, OtherA, ManagExp). Dans cet exemple,
nous appliquons notre nouvelle prime de crédibilité, pour une expérience de 21 ans d’expérience,
de 1980 à 2000 et pour 22 ans d’expérience en réclamation de 1980 à 2001. Le montant de
la réclamation pour le contrat j, pour la période 1980-2001. Le montant des indemnités est
en millions de drachmes (1 Euro = 340 : 75 drachmes).
101
Table1
Sommaires statistiques pour les montants des sinistres,
de l’année 1980-2000.
Contract Min Mean Median Max
SickA 3436 17166.00 16726.00 35650
AccidA 464 2027.38095 2024.00 3750
MaternA 609 6351.25 5443.00 15340
FunerExp 283 2843.05952 2336.00 7281
OtherA 232 3004.38095 3086.00 8862
ManagExp 275 2739.82143 1904.00 8645
Tableau 2
Sommaires statistiques pour les montants des sinistres,
de l’année 1980 et 2001.
Contract Min Mean Median Max
SickA 3436 17527.50 16782.50 35650
AccidA 464 1970.00 2003.50 3750
MaternA 609 6230.96 5332.00 15340
FunerExp 283 3026.55 2373.50 7281
OtherA 232 3027.00 3106.50 8862
ManagExp 275 2657.96 1884.00 8645
102
Tableau 3
Modèle de crédibilité du quantile (médian), de
l’année 1980-2000.
Contrat SickA AccidA MaternA
ξ̂ p 16726.00 2024.00 5443.00
ẑ p 0, 955415838 0, 955415838 0, 955415838
Ξ̂créd
p 16214, 49334 2167, 969691 5434, 53644
Contrat FunerExp OtherA ManagExp
ξ̂ p 2336.00 3086.00 1904.00
ẑ p 0, 955415838 0, 955415838 0, 955415838
Ξ̂créd
p 2466, 059432 3182, 621311 2053, 319791
Ξ̂ p = 5688.64881, ŝ2ξ p = 1484767, 18, ψ̂ p = 31817802, 59
Tableau 4
Modèle de crédibilité du quantile, de l’année 1980–2001.
Pitselis (2013)
ξ̂ p 16782.50 2003.50 5332.00
ẑ p 0, 855969465 0, 855969465 0, 855969465
Ξ̂créd
p 15121, 03576 2470, 663042 5319, 757404
ξ̂ p 2373.50 3106.50 1884.00
ẑ p 0, 855969465 0, 855969465 0, 855969465
Ξ̂créd
p 2787, 371744 3414, 797361 2368, 374691
Ξ̂ p = 5247, ŝ2ξ p = 4832045, 551, ψ̂ p = 28716712, 25
103
Tableau 5
Modèle de crédibilité (médian p plus facteur de
développement κi j ), de l’année 1980–2001.
κi 0, 001688987 −0, 005064229 −0.010196583
ξ̂ p+κi 16786.508 1999.14 5284.464
ẑ p+κi 0.85599428 0.85589547 0.85582108
Ξ̂créd
p+κi 15125.3078 2465.50601 5275.70768
κi 0, 008026541 0, 003321452 −0, 005252101
ξ̂ p+κi 2407, 235 3109.36 1879.588
ẑ p+κi 0, 856552093 0.85601832 0.85589274
Ξ̂créd
p+κi 2820, 314407 3418.23233 2363.12938
ṕ = p + κi j 0.501688 0.49493577 0.48980342
Ξ̂ ṕ 5250.85417 5235.44367 5223.73167
ŝ2ξ ṕ 4832045.55 4832045.55 4832045.55
ψ̂ ṕ 28722492.86 28699486.47 28682185.65
ṕ = p + κi j 0, 508026541 0.503321 0.501688
Ξ̂ ṕ 5286, 8825 5254.57967 5250.85417
ŝ2ξ ṕ 4832045.55 4832045.55 4832045.55
ψ̂ ṕ 28852973.97 28728095.74 28698849.91
4.6.1 Exemple d’organisation de la sécurité sociale (Algérie)
Dans cette section, nous donnons un exemple numérique pour illustrer l’application
de la nouvelle prime proposée. Des comparaisons avec la nouvelle prime de Pitselis et la
104
prime de Bühlmann sont fournies ici pour démontrer l’équilibre de la nouvelle prime entre
Pitselis et Bühlmann. Les données sont extraites du chapitre de l’organisation nationale
de sécurité sociale (salariés) en Algérie, compétente pour les salariés dans le domaine de
l’assurance sociale, accidents du travail, maladies professionnelles et allocations familiales.
Les six contrats correspondent à six classes (contrats) différentes de quotas (Dépenses)
qui sont tous couverts par l’organisation algérienne de sécurité sociale (salariés), pour une
expérience de 14 années d’expérience en réclamations, de 1995 à 2009.
Remarque 4.3 Notre application est divisée en deux parties, dans la première partie,
nous calculons la nouvelle prime de crédibilité aux 11, 12, 13 et 14 ans d’expérience en
réclamations, et dans la deuxième partie, nous comparons nos résultats avec les résultats
de Pitselis et Bühlmann.
Table 6
Résumé des statistiques pour les montants des
réclamations de l’année 1995-2009.
Contrat Min Mean Median Max
Sick 1000 5903.571429 6225 10400
Accid 6200 14921.42857 15050 22300
Matern 2100 9014.285714 7900 16800
Funer 5600 11050.00000 11600 14300
Other 2800 7123.214286 7262.5 11350
Manag 900 3180.714286 2925 6250
105
Table 7
Modèle de crédibilité du quantile, p = 1/2, de l’année 1995-2006.
ξ̂ p 6600 14700 7500
ẑ p 0.810380132 0.810380132 0.810380132
Ξ̂créd
p 6930.254603 13494.33367 7659.596722
ξ̂ p 11500 7000 2750
ẑ p 0.810380132 0.810380132 0.810380132
Ξ̂créd
p 10901.11725 7254.406656 3810.291093
Ξ̂ p = 8341.666667, ŝ2ξ p = 3307428.74, ψ̂ p = 14134987.93
106
Tableau 8
Modèle de crédibilité du quantile (médiane plus le facteu
de développement κi j ), p = 1/2 + κ12 j , de l’année 1995-2007.
p + κi 0.494318182 0.503401361 0.51
ξ̂ p+κi 6515.625 14807.48 7683
ẑ p+κi 0.808786208 0.808952773 0.809077677
Ξ̂créd
p+κi 6865.635888 13578.69700 7819.342404
Ξ̂ p+κi 8346.093833 8375.651500 8397.125000
ŝ2ξ p+κ 3232396.240 3232396.240 3232396.240
i
ψ̂ p+κi 13672222.4 13686960.80 13698029.65

p + κi 0.486956522 0.50625 0.531818182
ξ̂ p+κi 11113.91000 7099.531000 3047.500000
ẑ p+κi 0.808655439 0.809006360 0.809512959
Ξ̂créd
p+κi 10579.71933 7345.032442 4080.058818
Ξ̂ p+κi 8322.136500 8384.921667 8468.125000
ŝ2ξ p+κ 3232396.240 3232396.24 3232396.240
i
ψ̂ p+κi 13660669.45 13691707.84 13736717.35

107
Tableau 9
Modèle de crédibilité du quantile (médiane plus le facteur,
p + κi 0.489339438 0.506546710 0.517766497
ξ̂ p+κi 6392.433000 14923.57000 7842.640000
ẑ p+κi 0.777450809 0.819114403 0.819616324
Ξ̂créd
p+κi 6848.842296 13762.23156 7966.685825
Ξ̂ p+κi 8443.257333 8503.277500 8530.317667
ŝ2ξ p+κ 3810361.417 3100600.804 3100600.804
i
ψ̂ p+κi 13311073.17 14040624.68 14088320.48

p + κi 0.503873074 0.511631508 0.540979939
ξ̂ p+κi 11509.30000 7199.426000 3188.517000
ẑ p+κi 0.818994483 0.856231433 0.857271737
Ξ̂créd
p+κi 10964.02710 7388.640697 3958.927743
Ξ̂ p+κi 8496.834333 8515.532167 8586.261833
ŝ2ξ p+κ 3100600.804 2467474.594 2467474.594
i
ψ̂ p+κi 14029268.27 14695349.29 14820444.04

108
Tableau 10
Modèle de crédibilité du quantile (médiane plus le facteur,
p + κi 0.476522476 0.510838089 0.521553371
ξ̂ p+κi 6087.656000 15092.27000 7956.039000
ẑ p+κi 0.953794823 0.890731381 0.936654637
Ξ̂créd
p+κi 6194.893165 14375.55677 7995.055457
Ξ̂ p+κi 8408.546667 8533.083667 8571.971333
ŝ2ξ p+κ 841881.3134 1976872.827 1143551.254
i
ψ̂ p+κi 17378616.04 16114989.61 16909092.25

p + κi 0.507843888 0.516113899 0.49627031
ξ̂ p+κi 11620.39000 7299.159000 2908.03000
ẑ p+κi 0.890797929 0.953220161 0.953409386
Ξ̂créd
p+κi 11282.06298 7357.777452 3167.641435
Ξ̂ p+κi 8522.216000 8552.22983 8480.21317
ŝ2ξ p+κ 1976872.827 845427.9395 845427.9395
i
ψ̂ p+κi 16126014.91 17227057.17 17300457.41

109
Figure 4.1: Evolution de la nouvelle prime de crédibilité.
Table 11
Le modéle de crédibilité Bühlmann (1967), de l’année 1995-2009.
X̄· j 5903.5710 14921.429 9014.2860
ẑ 0.9618761 0.9618761 0.9618761

µ̂ θ j 6003.7850 14677.846 8995.9070
X̄· j 11050.000 7123.2140 3180.714286
ẑ 0.9618761 0.9618761 0.961876100

µ̂ θ j 10954.012 7176.9300 3384.734000
µ̂ = 8532.202, Ŝ 2 = 9065735, α̂ = 16337906
110
Table 12
Le modèle de crédibilité Pitselis (2013), de l’année 1995-2009.
ξ̂ p 6225 15050 7900
ẑ p 0.834821794 0.834821794 0.834821794
Ξ̂créd
p 6599.748056 13967.05038 7998.074560
ξ̂ p 11600 7262.5 2925
ẑ p 0.834821794 0.834821794 0.834821794
Ξ̂créd
p 11086.91520 7465.875667 3844.836137
Ξ̂ p = 8493.75, ŝ2ξ p = 2995008.659, ψ̂ p = 15136975.72
4.6.2 Comparaison des modèles de crédibilités ( Bühlmann (1969),

Pitselis (2013) et la nouvelle méthode).
Les tableaux 7, 8, 9, et 10 montrent que, pour chaque contrat, les valeurs du quantile
sont différentes des valeurs des moyennes et des médianes résultant des valeurs des esti-
mateurs de crédibilité différentes pour le modèle Bühlmann (1969) et Pitselis (2013) par
rapport à la variation du modèle de crédibilité quantile. Le tableau 13 compare les résultats
de la nouvelle prime avec Pitselis (2013) et Bühlmann (1969) qui sont faites dans le tableau
11, 12.
La nouvelle prime de crédibilité augmente et diminue avec un taux de 2 à 5% par rapport
à la prime Pitselis(2013) et Bühlmann (1969) dans tous les contrats. Cela s’explique d’une
partie par l’augmentation et la diminution du facteur de crédibilité et par la modification
de la prime individuelle et collective d’un contrat d’autre part. Le changement de la prime
sera plus remarqué si l’on répète les calculs plusieurs fois avec de nouvelles expériences.
Notre modèle permet de reconnaı̂tre le rôle minimal joué par ces contrats dans les résultats
du portefeuille.
111
Table 13
Comparaison Bühlmann (1969), Pitselis (2013)
et la nouvelle méthode, de l’année 1995-2009.
Nouvelle méthode Pitselis (2013) Bühlmann (1969)
6194.893165 6599.748056 6003.7850
14375.55677 13967.05038 14677.846
7995.055457 7998.074560 8995.9070
11282.06298 11086.91520 10954.012
7357.777452 7465.875667 7176.9300
3167.641435 3844.836137 3384.7340
Figure 4.2: Comparaison entre trois méthodes de calcul des primes de crédibilité.
Remarque 4.4 :L’expérience de l’assuré doit être plus grande et plus proche de la médiane
pour obtenir des résultats plus crédibles.
112
Dans ce chapitre, nous avons présenté un modèle de crédibilité concentré sur le quantile
(décomposition du quantile), en introduisant une nouvelle prime de crédibilité basée sur la
variation de quantile. Ce concept de perte de décomposition peut également être utilisé
pour interpréter des modèles plus complexes tels que le modèle de Hachemeister ou même
des modèles de classification croisée. Il interprète bien le modèle de Pitselis (2013). Le
modèle de Pitselis (2013) ne peut pas donner un bon estimateur de la mesure du risque,
nous développons des mesures de risque plus réalistes, c’est-à-dire pour chaque contrat,
on a un facteur de développement indépendant qui peut rendre les Mesures de risque plus
crédibles. La prime sera plus crédible si les calculs sont répétés plusieurs fois pour de
nouvelles expériences, l’expérience de l’assuré doit être plus grande pour des résultats plus
crédibles, nous pouvons comparer ces résultats avec d’autres modèles de crédibilité qui ont
un facteur de crédibilité indépendant comme Bühlmann et Straub (1996).
113
Conclusion et perspective
Dans cette thèse, on a présenté les méthodes de tarification des risques traditionnels,
en particulier la théorie de crédibilité. Nous avons construit des estimateurs des primes
bayésiennes suivant les techniques d’inférence bayésiennes concernant les paramètres des
risques d’un assuré qui n’est jamais connu. En imposant une distribution à priori, nous
sommes en mesure de décrire de manière probabiliste la structure de risque pour l’ensemble
de la classe de notation. En pratique, le choix de cette distribution à priori est subjectif aux
jugements personnels ou induit par les données historiques du groupe correspondant.
À l’aide de la simulation numérique, il semble que les primes bayésiennes sont cohérentes
et vérifient la condition de convergence vers la prime individuelle.
Par la suite, en introduisant une pondération dans le modèle classique de Pitselis (2013),
leur décomposition du quantile des montants de sinistres en une somme de variables aléatoires
est en fait inspirée des modèles statistiques ”Variance Components Models”. Leur concept
de décomposition des montants de sinistres peut également être employé afin d’interpréter
des modèles plus complexes tels le modèle de Hachemeister (1975) ou encore des modèles
de classification croisée.
Pour des études futures, nous pouvons considérer les distributions de log-Lindley, in-
verse Lindley, ou autres distributions comme distributions conditionnelles au lieu de la
distribution de Lindley, et sous la fonction de perte entropie.
114
Bibliographie
[1] Ahn, S.E., C.S., Park, H.M., Kim. Hazard rate estimation of a mixture model with
censored lifetimes, Stoch. Environ. Res. Assess. 21 (2007), 711–716.
[2] Antoniadis, A., J. Berruyer, et R. Carmona (1992). Régression non linéaire et appli-
cations. Economica.
[3] Bailey, A.L., Credibility procedures, Laplace’s generalization of Bayes’ rule and the
combination of collateral knowledge with observed data, Proceedings of the Casualty
Actuarial Society, vol. 37, 7–23, 1950.
[4] Basu, A. P., and Ebrahimi, N. Bayesian approach to life testing and reliability estima-
tion using asymmetric loss function, J. Statist. Plann. Infer., 29, 21–31, 1991.
[5] Buchinsky, M., 1998. Recent advances in regression models : a practical guideline for
empirical research. The Journal of Human Resources 33 (1), 88–126.
[6] Bühlmann, H., Experience rating and credibility, Astin Bulletin, vol. 4, p. 199–207,
1967.
[7] Bühlmann, H., Experience rating and credibility, Astin Bulletin, vol. 5, p. 157–165,
1969.
[8] Bühlmann, H., Straub, E., Glaubgwürdigkeit für Schadensutze. Bulletin of the Swiss
association of actuaries 70, 111–133, 1996.
[9] Calabria, R. and G. Pulcini, 1969. Point estimation under asymmetric loss functions
for left truncated exponential samples. Comm. Statist. Theory Methods, 25 : 585-600.
115
[10] Dean, C., J. Lawless et G. Willmot. 1989. A mixed Poisson - inverse Gaussian
regression model . Canadian Journal of Statistics 17, p. 171-182.
[11] Denuit, M., Pitrebois, S., Walhin, J.-F., Marketing et Systèmes Bonus-Malus, Actu-L
3, 89-105, 2003.
[12] Denuit, M. & Charpentier, A. (2005), Mathématiques de l’Assurance Non-Vie. Tome

II : Tarification et Provisionnement, Collection conomie et Statistiques Avancées,
Economica, Paris.
[13] Denuit M. et al., 2007 : Actuarial modelling of claim counts : risk classifi cation, credi-
bility and bonus-malus systems. Hoboken : Wiley, 384 p. ISBN 978-0-470- 02677-9.
[14] Denuit, M., 2008. Comonotonic approximations to quantiles of life annuity conditio-
nal expected present value. Insurance : Mathematics and Economics 42, 831–838.
[15] Dionne, G., & Vanasse, C. (1989). A generalization of actuarialautomobile insurance

rating models : the Negative Binomial distribution with a regression component. AS-
TIN Bulletin 19, 199-212.
[16] Dobson A. J. (2002). An introduction to Generalized Linear Models, Chapman Hall /

CRC second Edition.
[17] Fahrmeir, L., & Tutz, G. (2002). Multivariate Statistical Modelling Based on Genera-
lized Linear Models. Springer Verlag, New York.
[18] Garthwaite, H. P., Kadane, B. J. and O’Hagan, A. Elicitation, working paper in uni-
versity of Sheffield, 2004.
[19] Gebizlioglu, O.L., Yagci, B., (2008). Tolerance intervals for quantiles of bivariate
risks and risk measurement. Insurance : Mathematics and Economics 42, 1022–1027.
[20] Ghitany, M.E, Al-Mutairi D.K. Estimation methods for the discrete Po isson–Lindley
distribution. Journal of Statistical Computation and Simulation,79(1) :1–9, 2009.
[21] Ghitany, M.E, Atieh, B., Nadarajah, S. Lindley distribution and its application. Ma-
thematics and computers in simulation, 78 :493–506, 2008
116
[22] Goovaerts, M. J. and W. J. Hoogstad., Credibility Theory,4, Surveys of actuarial stu-

dies, Nationale-Nederlanden N.V., Netherlands, 1987.
[23] Gouri eroux, C., Monfort, A., & Trognon, A. (1984). Pseudo maximum likelihood
methods : Theory. Econometrica 52, 681-720.
[24] Gilchrist,W., 2000. Statistical modelling with quantile functions. Chapman and Hall,
New York.
[25] Hachemeister, C.A. Credibility for regression models with application to trend, Cre-
dibility theory and applications, Proceedings of the Berkeley actuarial research confe-
rence on credibility, Academic Press, New York, p. 129–163, 1975.
[26] Herzog, T.N. Introduction to credibility theory, 2nd ed. Actex Publications, Winsted,
1996.
[27] Howlader, H.A., Hossain, A. Bayesian survival estimation of Pareto distribution of the
second kind based on failure censored data, Computational Statistics Data Analysis,
38 :301–314, 2002.
[28] Holta :n, J., 2001, Optimal Loss Financing under Bonus-Malus Contracts, ASTlN
Bulletin,Vol. 31, no. 1, 161-173.
[29] Jaheen, Z.F. On record statistics from a mixture of two exponential distributions, J.
Statist. Comput. Simul., 75, 1-11, 2005.
[30] Jewell, W.S. Credible means are exact bayesian for exponential families, Astin Bul-
letin, vol. 8, p. 77–90, 1974.
[31] Jones, M.C., 1992. Estimating densities, quantiles, quantile densities and density
quantiles. Ann. Inst. Statist. Math., 44, 721-727.
[32] Kaas, R., Dannenburg, D., Goovaerts, M. Exact credibility for weighted observations,
Astin Bulletin 27 (2), 287–295, 1996.
[33] Klugman, S.A., H. Panjer, and G. Willmot. Loss Models : From data to decisions, 2nd
edition, Wiley, New York, Chapter 16, 2004.
117
[34] Kudryavtsev, A., 2009. Using quantile regression for rate-making. Insurance : Mathe-
matics and Economics 45, 296–304.
[35] Krishna, H., K. Kumar. Reliability estimation in Lindley distribution with progressi-
vely type II right censored sample, Math. Comput. Simul, 82 (2), 281–294, 2011.
[36] Legendre, A. Nouvelles méthodes pour la determination des orbites des comètes,
Courcier, City Paris, 1805.
[37] Lemaire, J. , 1977, Selection procedures of regression analysis applied to automobile

insurance, Mitteilungen der Vereinigung Schweizerischer Versicherungsmathemati-
ker, 143-160.
[38] Lemaire, J., Zi, H., A Comparative Analysis of 30 Bonus-Malus Systems, ASTlN
Bulletin, vol. 24, no. 2, 287-309.
[39] Lemaire, J., 1995, Bonus-Malus Systen1s in Automobile lnsurance, Kluwer Acade-
mic, Publisher, Boston.
[40] Lemaire, J., 2004, Bonus-Malus system, Encyclopeadia of Actuarial Science, Wiley,
New York, 184-191.
[41] Lindley, D.V.,. Fiducial distributions and Bayes’ theorem, Journal of the Royal Sta-
tistical Society, Series A20,102–107, 1958.
[42] Lindley, DV., Approximate Bayes methods. Trabajos de Estadistica de Investigacion

Operativa, 31(1) :223–245, 1980
[43] Maritz, J.S., 1989. Linear empirical Bayes estimation of quantiles. Statistics & Pro-
bability Letters 8, 59–65.
[44] McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models, 2nd Ed. Chapman
& Hall, London.
[45] Metiri, F. Zeghdoudi, H. Remita, M.R, On Bayes Estimates of Lindley Distribution

under Linex Loss Function : Informative and Non Informative Priors. Global Journal
of Pure and Applied Mathematics. ISSN 0973-1768, Volume 12, Number 1,pp. 4395-
440 (2016).
118
[46] Mood, A.M., Graybill, F.A., Boes, D.C., 1974. Introduction to the Theory of Statistics.
McGraw-Hill.
[47] Moreno, L, Vazquez, F. J., Watt, R., 2006, Can Bonus-Malus Allieviate Insurance
Fraud ?, The Journal of risk and Insurance, Vol. 73, No. 1, 123-151
[48] Mowbray, A.H. How extensive a payroll exposure is necessary to give a dependable
pure premium, PCAS I, 24-30, 1914.
[49] Mowbray, A. H. 1914, How extensive a payroll exposure is necessary to give a de-
pendable pure premium ?, Proceedings of the Casualty Actuarial Society, vol. 1, p.
25–30.
[50] Nassar, M., and Eissa, F.H. Bayesian estimation for the exponentiated Weibull model,
Commun Statistical theory Meth., 33(10), 2343-2362, 2004.
[51] NelderJ., Wedderburn R. [1972] Generalized linear models , Journal of Roy. Stat.
Soc. B, vol. 135, 370-384.
[52] Norberg, R. The credibility approach to ratemaking, Scandinavian actuarial journal,

181–221, 1979.
[53] Norberg, R.., Credibility theory, encyclopedia of actuarial science, Wiley, Chichester,
UK, 2004.
[54] Pandey, B.N. T-estimator of the scale parameter of the exponential distribution using
Linex loss function. Commun. Statistical Theory. Meth., 26(9), 2191–2202, 1997.
[55] Parzen, E., 1979. Nonparametric statistical data modelling. Journal of American Sta-
tistical Association, 74, 105-122.
[56] Parzen, E., 2004. Quantile probability and statistical data modeling. Statistical
Science, 19, 652-662.
[57] Pitt, D.G.W., (2006). Regression quantile analysis of claim termination rates for in-
come protection insurance. Annals of Actuarial Science 1 (II), 345–357.
[58] Pitselis, G., 2009. Solvency supervision based on a total balance sheet approach. Jour-
nal of Computational and Applied Mathematics 233 (1), 83–96.
119
[59] Pitselis, G., (2013). Quantile credibility models. Insurance : Mathematics and Econo-
mics 52 (2013) 477–489.
[60] Rolski, T., Schmidli, H., Schmidt, V., Tengels, J., 1998, Stochastic Processes for in-
surance and Finance, Wiley, New York.Tapez une équation ici.
[61] Rojo. On the admissibility of ”cx+d” with respect to the Linex loss Function, Com-
mun. Statistical Theory. Meth, 116, 3745-3748, 1987.
[62] Ross, S., 2003,Introduction to Probability Models, Academic Press, eighth edition,
New York.
[63] Sajid Ali, Muhammad Aslam, Syed Mohsin Ali Kazmi. A study of the effect of the
loss function on Bayes Estimate, posterior risk and hazard function for Lindley distri-
bution, Applied Mathematical Modelling, 37, 6068–6078, 2013.
[64] Sankaran, M. The discrete Poisson–Lindley distribution. Biometrics, 26, 145- 149,
1970.
[65] Sajid Ali, Muhammad Aslam, Syed Mohsin Ali Kazmi. A study of the efect of the
loss function on Bayes Estimate, posterior risk and hazard function for Lindley distri-
bution, Applied Mathematical Modelling, 37, 6068–6078, 2013.
[66] Searle, Casella and Mcculloch (1992). Variance Componenis ; John Wiley : New
York, 501 p.
[67] Société de l’Assurance Automobile du Québec, Les points d’Inaptitude, http : j

jwww.saaq.gouv.qc.cajdocumentsj documents pdfjpermisjpoints inaptitude. php.
[68] Soliman, A. Comparison of Linex and quadratic Bayes estimators for the Rayleigh
distribution. Commun. Statist. Theor. Meth., 29(1), 95–107, 2000.
[69] Thompson, R.D. and Basu, A.P. Asymmetric loss function for estimating reliability.
Journal of Bayesian Analysis in Statistics and Econometrics, Wiley, New York, 1996.
[70] Varian, H.R. A Bayesian approach to real estate assessment, Studies in Bayesian Eco-
nometrics and Statistics, Amsterdam : North-Holland, 195–208, 1975.
120
[71] Whitney, A.W. The theory of experience rating, Proceedings of the Casualty Actuarial
Society, vol. 4, 275–293, 1918.
[72] Zeghdoudi, H, Nedjar, Gamma Lindley distribution and its application. Journal of
Applied probability and statistics, vol. 10, 2015.
[73] Zellner, A. Bayesian estimation and prediction using asymmetric loss functions. Jour-
nal of Amsterdam statistical association, 81, 446–451, 1986.

These Sadoun Ahmed

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

These Sadoun Ahmed

Transféré par

Droits d'auteur :

Formats disponibles

‫وزارة التعليم العالي والبحث العلمي‬

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA

Option : Modélisation Mathématiques – Actuariat

METHODE DE TARIFICATION DES RISQUES EN ASSURANCE

Par : M. SADOUN Ahmed

EXAMINATEUR : Necir Abdelhakim Prof. U.M.K.Biskra

EXAMINATEUR : Chadli Assia Prof. U.B.M. Annaba

EXAMINATEUR : Arrar Nawel khadija M.C.A U.B.M. Annaba

Table des matières

3 Estimation Bayésienne de la prime pour le modèle Gamma Lindley sous différentes

3.2.1 Estimateurs bayésiens de la prime sous la fonction de perte quadra-

4 Méthode des Quantiles sous la théorie de la crédibilité (Décomposition de Quan-

Notre étude repose sur l’utilisation de la décomposition de quantile pour simplifier le

1.1 Les modèles linéaires généralisés

1.1.1 Petit historique des applications actuarielles des modèles de rég-

burn (1972), permettent de s’affranchir de l’hypothèse de normalité, en traitant de manière

Y v Loi (µ) où µ = E[Y] = g−1 (X t β),

où le support S est un sous-ensemble de N ou de R. Le paramètre θ est appelé paramètre

Example 1.1 (Loi de Poisson). Si on considère la loi de Poisson Poi (λ) , on a

1.1.2 Moyenne et variance

où b et b désignent respectivement les dérivées premières et secondes par rapport à θ.

Preuve. Nous savons que E[U] = 0. Il suffit alors de remarquer que

 Y − b0 (θ) 2 

En combinant les deux dernières égalités, on obtient le résultat annoncé.

Loi de probabilité V (µ)

1.1.3 Modèle de régression

Considérons des variables aléatoires indépendantes mais non identiquement distribuées

Dès lors, la densité jointe de Y1, Y2 , ..., Yn est

Example 1.4 (Régression de poisson). La régression log-linéaire de poisson est obtenue

Le plus souvent, on dispose d’une mesure de l’exposition au risque et on considère Yi ∼

1.1.4 Fonction de lien canonique

de lien canoniques sont reprises au Tableau 1.2.

Loi de probabilité Fonction de lien canonique

1.1.5 Equations de vraisemblance

En pratique, les coefficients de régression β0 , β1 , ..., β p et le paramètre de dispersion φ

où E [Yi ] = b (θi ) = µi et g (µi ) = xit β = ηi avec g monotone et dérivable. Rechercher

les estimateurs du maximum de vraisemblance revient à rechercher les β0 , β1 , ..., β p qui

Afin d’obtenir U j , on se sert de la formule

∂ ln f (yi | θi , φ) ∂ ln f (yi | θi , φ) ∂θi ∂µi

Comme µi = b (θi ), il vient

Comme V[Yi ] = b (θi ) φ/ωi ,

où le paramètre φ n’apparaı̂t plus. Les équations de vraisemblance relatives à β peuvent

Example 1.5 (Régression de Poisson). Supposons les réalisations n1 , n2 , ..., nu de variables

Les équations de vraisemblance s’écrivent donc

Les équations de vraisemblance à résoudre pour obtenir β̂ sont les suivantes :

1.1.6 Résolution des équations de vraisemblance

Les estimateurs du maximum de vraisemblance β̂ j des paramètres β j sont solutions du

Pour β∗ proche de β̂, un développement limité de Taylor donne

0 = U(β̂) ≈ U(β∗ ) + H(β∗ )(β̂ − β∗ ),

qui permet d’écrire

β̂(r+1) ≈ β̂(r) − H −1 (β̂(r) )U(β̂(r) ). (1.7)

Cette procédure itérative pour obtenir l’estimateur du maximum de vraisemblance cor-

où les pseudo-réponses zk sont données par

Une bonne valeur initiale β̂(0) est obtenue en prenant β̂(0)

de sinistres par police, et β̂(0)

où i est un terme d’erreur gaussien centré. L’estimateur du maximum de vraisemblance du

1.1.7 Intervalle de confiance pour les paramètres

Méthode du rapport de vraisemblance

Si β̂ MV est l’estimateur du maximum de vraisemblance de β, 2{L(β MV | y) − L j (β j | y)}

1.1.8 Tests d’hypothèse sur les paramètres

On désire tester l’hypothèse Ho : β = β0 = (β0 , β1 , ..., βq )t contre H1 : β = β1 =

On peut montrer que ∆ est approximativement de loi χ2p−q . On rejette H0 au profit de H1

où χ2p−q;1−α est le quantile d’ordre 1 − α de la loi χ2p−q .

1.1.9 La pratique des modèles linéaires généralisés et l’importance du

où i est un terme d’erreur gaussien centré. L’estimateur du maximum de vraisemblance du