Vous êtes sur la page 1sur 27

Faculté des arts et des sciences

Mathématiques et statistique

Partie 2
Principes de tarification de base
Faculté des arts et des sciences
Mathématiques et statistique

Classification Multivariée

Nous avons vu comment revoir la tarification des variables de tarification une à la


fois (Classification Univariée) .

Cependant, ces techniques ont tendance à être biaisées, car elle ne prenne pas
compte pleinement de la corrélation qu'il peut exister entre les variables de
tarification.

Mettre à niveau la prime ou ajuster la prime pure ne corrige que partiellement ce


problème, car la tarification courante n'est qu'une approximation des « vrais »
relativités affectant la prime pure.

Quelques exemples de corrélations existantes :

- Certains territoires possèdent des valeurs de maisons plus élevés que d'autres
- Les jeunes conducteurs ont tendance à conduire des vieux véhicules
- Les jeunes conducteurs ont généralement des cotes de crédit plus basses
...
Faculté des arts et des sciences
Mathématiques et statistique

Procédure du Biais Minimum

Les procédures de Biais Minimum ont été très populaires lors de la 2e moitié du
20e siècle en classification et sont principalement des méthodes univariées
standardisées et itératives. Chacune d'entre elles consistent à sélectionner une
structure de tarification et une fonction de biais.

Structure de Tarification
- Additive
- Multiplicative
- Mixte

Fonction de Biais
- Balance Principle
- Moindres Carrés
- Khi Carré
- Maximum de Vraisemblance
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

La fonction de biais sera utilisée afin de comparer les primes pures observées aux
primes pures indiquées et de mesurer la différence. Chaque côté de l'équation doit
être pondéré par les expositions afin d'ajuster pour la distribution des risques.

Balance Principle

Sous cette fonction, la somme des primes pures indiquées pondérées doit être
égale à la somme des primes pures observées pondérées pour chaque niveau de
chacune des variables de tarification.

Les changements de tarification pour chacune des variables se feront selon un


processus itératif.

Somme [Expositions * Prime Pures observées]


=
Somme [Expositions * Taux de base*Relativités]

Car Prime Pure Indiquée = Taux de base * Relativités indiqués


Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Pour un système de tarification à deux variables (sexe et type de


territoire), calculer les relativités pour ces deux variables à la l'aide de 2 itérations
du « Balance Principle » et à partir des primes pures observés et de la distribution
des unités d'exposition ci-dessous :
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Solution :

Soit les relativités suivantes :


S1/S2 = Hommes / Femmes
T1/T2 = Urbain / Rurale

- Assumons un taux de base de 100 $. Les équations ci-dessous doivent balancer :

Hommes : 170* 650$ + 90* 300$ = 100$*170*s1*t1 + 100$*90*s1*t2

Femmes : 105* 250$ + 110* 240$ = 100$*105*s2*t1 + 100$*110*s2*t2

Urbain : 170* 650$ + 105* 250$ = 100$*170*s1*t1 + 100$*105*s2*t1

Rurale : 90* 300$ + 110* 240$ = 100$*90*s1*t2 + 100$*110*s2*t2


Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Suite...

Cette équation sera résolu de façon itérative, comme point de départ, on va


généralement commencer par les relativités obtenues à partir d'une analyse
univariée (i.e. Prime pure du niveau / prime pure du niveau de base) sur une
variable choisie au hasard, ici le type de territoire:

T1= 497 / 267 = 1.86


T2= 1.00

En remplaçant ces valeurs dans les équations de sexe on obtient :

Hommes : 137,500$ = 100$*170*s1*1.86 + 100$*90*s1*1.00


137,500$ = 40,620*s1
S1= 3.39
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Suite...

Pour les Femmes :

Femmes : 52,650$ = 100$*105*s2*1.86 + 100$*110*s2*1.00


52,650$ = 30,530*s2
S2= 1.72

Une fois les relativités de sexe obtenue, nous avons complété une itération de la
procédure. Il faudra en compléter plusieurs jusqu'à ce que les changements des
relativités obtenues soient mineurs. En utilisant nos nouvelles relativités de sexe
dans les équations des types de territoires, on obtient :

Urbain : 136,750$ = 100$*170*3.39*t1 + 100$*105*1.72*t1


136,750$ = 75,690 * t1
T1= 1.81 ce qui est différent de 1.86
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Suite...

Pour les territoires ruraux :

Rurale : 53,400$ = 100$*90*3.39*t2 + 100$*110*1.72*t2


53,400$ = 49,430$*t2
T2= 1.08 (différent de 1.00)

2e Itération :

Hommes : 137,500$ = 100$*170*s1*1.81 + 100$*90*s1*1.08


137,500$ = 40,490*s1
S1= 3.40 (très prêt de 3.39, on commence déjà à converger)
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Exemple 1 : Pour les Femmes (2e itération) :

Femmes : 52,650$ = 100$*105*s2*1.81 + 100$*110*s2*1.08


52,650$ = 30,885*s2
S2= 1.70

Pour cette exercice, nous allons arrêter ici, après la 2e itération. Ensuite, il nous
reste seulement à re-balancer les relativités selon les niveaux de bases (choisie
arbitrairement) :

S1 = 3.40 / 1.70 = 2.00


S2 = 1.70 / 1.70 = 1.00
T1 = 1.81 / 1.08 = 1.68
T2 = 1.08 / 1.08 = 1.00

Le niveau prime pure de base doit aussi être ajuster pour les normalisations :
100*1.08*1.72 = 185.76
Faculté des arts et des sciences
Mathématiques et statistique

Fonction de Biais

Balance Principle

Au lieu d'utiliser des primes pures, des ratios sinistres-primes pourraient aussi être
utilisés principalement à cause qu'ils produisent généralement des résultats plus
stables lorsque les risques ne sont pas distribués uniformément.

Pour y arriver, il faudra remplacer la prime pure dans les calculs précédents par le
ratio-sinistre prime multiplier par la relativité courante de la cellule en question.

La raison pourquoi on doit multiplier par la relativité courante est qu'on doit enlever
la tarification des variables analysés de la prime pour ensuite les ré-évaluer.

Par exemple, pour un risque en particulier :

RSP = Sinistres / Prime = Sinistres / (Niveau de base * Relativités Courantes)


Faculté des arts et des sciences
Mathématiques et statistique

Structure de Tarification

Les calculs nécessaire afin d'ajouter plusieurs autres variables (ou plusieurs autres
niveaux) de tarification rendent le processus beaucoup plus complexe et nécessite
l'utilisation d'un ordinateur. Pour cette raison, les questions d'examens ne devraient
pas contenir plus de deux variables.

En utilisant le « Balance Principle », les relativités doivent multiplier le taux de base


seulement si la structure de l'algorithme est multiplicative (ce qui est généralement
le cas). Si la structure est additive, nous allons plutôt travailler avec des
rabais/surcharges et non des relativités.

Le côté droit de la formule devient donc :

Somme [Expositons * Taux de base*( 1 + Somme des Rabais/Surcharges)]

Pour un algorithme mixte :

Somme [Expositions*Taux de base*(Relativités+Somme des


Rabais/Surcharges)]
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Un GLM est un modèle linéaire généralisé et est la technique de classification


standard utilisé dans plusieurs marchés à travers le monde (principalement en
lignes personnelles).

À cause de sa complexité, elle est moins transparente que les techniques


univariées plus simples, mais l'est quand même beaucoup plus que d'autres
méthodes avancées tel que les réseaux de neurones.

Contrairement à une régression linéaire standard, les GLMS ont des hypothèses
plus souples :

- Un GLM n'assume pas l'hypothèse de normalité


- La variance n'est pas nécessairement constante
- Une fonction (appelé la « link function ») définie la relation entre les variables
réponses (fréquence, sévérité, prime pure) et la combinaison linéaire des variables
de tarification (age, sexe, territoire...)
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Le choix de la « link function » va dépendre de la structure de l'algorithme :

- Additive = Fonction Identité (1.00)


- Multiplicative = Fonction logarithmique

Les distributions utilisées pour remplacer l'hypothèse de normalité font


généralement partie de la famille des lois exponentielles. Par exemple, les
standards de l'industrie pour l'assurance automobile sont:

- Réclamations = Loi Poisson


- Sévérité = Loi Gamma
- Prime Pure = Loi mixte Poisson/Gamma (appelé Loi Tweedie)

Une fois les paramètres du GLM sélectionnés, la méthode du maximum de


vraisemblance est ensuite utilisée afin de minimiser l'erreur produite entre
l'expérience observé et les résultats sortant du modèle.
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

On se rappelle qu'un modèle linéaire tente d'exprimer une variable observée Y par
une combinaison de plusieurs variables X i (ici X1 à X...) plus une variable d'erreur Ɛ
suivant une N(0,σ2) .

Y = β1X1 + β2X2 + β3X3 + …. + Ɛ

Sous forme matricielle et pour plusieurs variables observées, cette formule


devient :

Y = E(Y) + Ɛ avec E(Y)= X * β

Y = [ Y1 Y2 Y3 ... ]-1 β = [ β1 β2 β3 ... ]-1

Chaque variable de tarification Xi sera représenté par un vecteur


Xi = [ X1i X2i X3i ... ]-1 qui définit la présence d'un niveau d'une variable de tarification
(Xi = 1 si la variable observé Yi est à ce niveau, sinon 0 pour le niveau de base)
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Pour un modèle GLM, ces formules deviennent :

- La variable d'erreur Ɛ suit une loi provenant de la famille des lois exponentielle
(i.e. Poisson, Gamma,...)

- La relation entre les variables observées et la combinaison linéaire des variables


de tarification suit une fonction g (link function) :

E(Y)= g-1(X*β)

Par exemple si g est une fonction logarithmique, la structure de l'algorithme devient


multiplicative :
Y1 = Exp(β1X11 + β2X21 + …) = Exp(β1X11) * Exp(β2X21) * Exp(β3X31) ...

Où les Exp(βi) sont les relativités estimés.


Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Si au contraire g est égale à la fonction identité, la structure de l'algorithme devient


additive :

E(Y)= g-1(X*β) = X*β

E(Y1) = β1X11 + β2X21 + … = β1X11+β2X21+β3X31 ...

Où les βi sont les rabais/surcharges estimés.


Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple de résultat sortant d'un logiciel modélisant des GLMs:


Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : À partir des primes pures moyennes ci-dessous, estimer les relativités
à charger à partir d'un GLM où l'erreur suit une Poisson et la structure de
l'algorithme est multiplicative.
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

Définissons tout d'abord les différents vecteurs, dans cet exemple, il y a quatre
variables observées :
Hommes-Urbains, Hommes-Ruraux, Femmes-Urbains et Femmes-Ruraux
Et trois variables prédictives :
B1 = Hommes , B2 = Femmes , B3 = Urbain/Rurale

Note : Les Hommes/Femmes ne peuvent pas être regroupés ensembles


car il faut au moins une variable présente pour le niveau de base
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

Pour un algorithme multiplicatif, on choisit la fonction logarithmique comme « link


function ». L'inverse de cette fonction est la fonction exponentielle. Pour notre
vecteur contenant nos variables prédictives, on obtient :
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

On doit maintenant résoudre l'équation matricielle à l'aide de la technique du


maximum de vraisemblance :

La fonction de la loi Poisson est :

On doit donc évaluer cette fonction pour tous les y i et ensuite prendre le logarithme
afin de se faciliter des calculs:
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

Comme ui = g-1(Xi * β) ce qui représente l'estimé de la moyenne pour la variable


observée y, on obtient :

Finalement, si on remplace les variables par les données de cette exemple :


Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

Afin de trouver le maximum de vraisemblance, on dérive l'équation en fonction des


trois bétas, pour obtenir :
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Exemple 2 : Suite...

Comme on recherche les relativités =Exp(βi), on doit résoudre les équations


suivante :

R1*(R3+1) = 1300

R2*(R3+1) = 600

R3*(R1+R2) = 1200

Pour finalement obtenir : R1 = 478.95, R2 = 221.05, R3 = 1.714

Si les hommes sont le niveau de bases, les relativités sont rebalancés à :
R1 = 478.95/ 478.95 = 1.00 et
R2 = 221.05/ 478.95 = 0.462
Faculté des arts et des sciences
Mathématiques et statistique

Modélisation GLM

Comme vous avez plus le remarquer, les concepts derrières les GLMs sont
relativement complexes. Pour cette raison, une compréhension complète ne sera
pas attendue pour l'examen. Les sujets pouvant être testés seront :

- Compréhension de la théorie derrière un GLM (i.e. hypothèses de base)

- Définir les différents vecteurs/matrice pour résolution d'un GLM (sans résolution)
et expliquer brièvement les étapes nécessaires à la résolution
Faculté des arts et des sciences
Mathématiques et statistique

Exercices
Voici quelques exercices des examens antérieurs de la CAS
pertinents à la matière de cette section :

Exam 8 – Fall 2010 : #3, #4


Exam 8 – Fall 2010 : #3, #4
Exam 9 – Fall 2010 : #3, #4
Exam 9 - Fall 2009 : #3, #5
Exam 9 – Fall 2008 : #6,

Note
Les exercices sont disponibles sur la site de la CAS à l'adresse suivante :
http://www.casact.org/admissions/studytools/exam9/ et
http://www.casact.org/admissions/studytools/exam8/

Vous aimerez peut-être aussi