Cours Survie

Modèles de durée
Filière Professionnalisée ACTUARIAT

MASTER
ARMEL YODÉ
Université Félix Houphouët-Boigny

Table des matières
1 Modèles probabiliste de durées 3

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Caractérisation d’une variable de survie . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Fonction de survie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Densité de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 La fonction de survie conditionnelle . . . . . . . . . . . . . . . . . . . . . . 5
1.2.4 Fonction de hasard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.5 Fonction de hasard cumulé . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Quelques lois classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.1 Loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 La loi de Weibull W (α, λ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.3 La loi Gamma Γ(α, λ), α > 0, λ > 0 . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.4 Modèle de Gompertz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.5 Modèle de Gompertz-Makeham de paramètres γ0 , γ1 , γ2 > 0. . . . . . . . 10
1.3.6 Modèles composites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.6.1 Agrégation de lois . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.6.2 Modèles à hasard proportionnel . . . . . . . . . . . . . . . . . . . 12
1.3.6.2.a Modèles de Cox . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.6.2.b Modèles de fragilité . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.6.3 Transformations croissantes de la durée (modèles AFT15) . . . 13
1.3.6.4 Modèles à causes de sortie multiples . . . . . . . . . . . . . . . . 13
1.3.6.5 Modèles à choc commun . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Modèles paramétriques 15
2.1 Censure et vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1 Censure à droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1.1 Censure de type I : fixée C i = C . . . . . . . . . . . . . . . . . . . . 16
2.1.1.2 Censure de type II . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1.3 Censure de type III : aléatoire . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Censure à gauche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.3 Censure par intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Troncature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Ajustement du modèle de Gompertz Makeham par une méthode de régression . 19
3 Modèles non paramétriques 20

3.1 Estimateur de Kaplan-Meier (1958) . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Données non censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.2 Données censurées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.3 Propriétés de l’estimateur de Kaplan-Meier . . . . . . . . . . . . . . . . . 23
3.1.3.1 Cohérence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2
TABLE DES MATIÈRES 3
3.1.3.2 Convergence et normalité asymptotique . . . . . . . . . . . . . . 23
3.1.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Estimation de la fonction de survie par la méthode actuarielle . . . . . . . . . . 29
3.3 Estimation non paramétrique de la fonction de hasard intégrée . . . . . . . . . . 31
3.3.1 Estimateur de Breslow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.2 Estimateur de Nelson-Aalen . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4 Estimateur de Fleming-Harington de S X . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Comparaison des durées de vie de deux groupes indépendants . . . . . . . . . . 32
4 Modèles semi-paramétrique de Cox 34

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.2 Estimation de β lorsque h 0 est connue . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.3 Estimation de β lorsque h 0 est inconnue . . . . . . . . . . . . . . . . . . . . . . . . 37
4.3.1 Vraisemblance partielle : temps de décès distincts . . . . . . . . . . . . . 38
4.3.2 Vraisemblance partielle : temps de décès égaux. . . . . . . . . . . . . . . . 38
4.3.3 Maximisation de la vraisemblance partielle . . . . . . . . . . . . . . . . . 38
4.4 Tests dans le modèle de Cox . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.1 Tester l’hypothèse H0 : g(β) = 0 . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.1.1 Test du rapport de vraisemblance . . . . . . . . . . . . . . . . . . 39
4.4.1.2 Test de Wald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.1.3 Test du score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.2 Tester l’adéquation du modèle de Cox . . . . . . . . . . . . . . . . . . . . . 39
4.4.2.1 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . 40
4.4.2.2 Résidus de Schoenfeld . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5 Mise en oeuvre sur R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5.1 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5.2 Validation de l’hypothèse de proportionnalité . . . . . . . . . . . . . . . . . 43
4.5.2.1 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . 43
5 Tables de mortalité 45
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.2 Table de mortalité réglementaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.3 Table de mortalité d’expérience . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.4 Zone CIMA (Conférence Interafricaine des Marchés d’Assurance) . . . . . . . . 46
5.5 Tables de mortalités propectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.5.1 Diagramme de Lexis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.5.1.1 Modèles de Lee Carter (1992) . . . . . . . . . . . . . . . . . . . . . 51
5.5.1.2 Modèle log-Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.5.1.3 Modèle log-linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6 Exercices 54
Chapitre
1 Modèles probabiliste de durées
1.1 Introduction
Les modèles de durée apparaissent dans de nombreux domaines :
• medecine :
— durée de vie des patients après un infarctus ;
— durée de rémission (on parle de rémission lorsqu’une affection cède du terrain et
que l’état du patient s’améliore temporairement) ;
— durée séparant le diagnostic d’une maladie et la guérison ;
• assurance :
— durée de vie humaine ;
— durée en invalidité et en incapacité ;
— durée d’un arrêt de travail ;
— durée entre deux sinistres ;
— durée avant une ruine ;
— durée avant un rachat ;
• crédit : durée avant un défaut de paiement ;
• économie :
— durée de vie d’une entreprise,
— durée avant la faillite d’un individu
• ...
Définition 1.1.1. On appelle variable de durée de vie une variable aléatoire réelle T positive
représentant le temps écoulé avant la survenue d’un évènement bien défini.
La variable aléatoire T est la période allant de l’instant du début d’observation jusqu’à l’ap-
parition de l’événement d’intérêt.
Il existe quatre types de dates.
• La date d’origine ou état initial qui marque le début de la période de suivi.
• La date d’évènement qui correspond à l’instant où l’évènement d’intérêt se produit.
• La date de fin de suivi désigne la date à laquelle s’arrête le suivi.
• La date de dernière nouvelle désigne celle à compter de laquelle on ne dispose plus
d’informations sur les personnes.
Il existe trois types de données :
1. les données complètes : le temps de décès est observé ; la donnée représente la durée
de vie.
4
1.2. CARACTÉRISATION D’UNE VARIABLE DE SURVIE 5
2. les données censurées : la durée de vie commence ou se termine sur une partie souvent
en dehors de la période de suivi
3. les données tronquées : la durée de vie n’est observable que sur une partie de [0, +∞[
F IGURE 1.1 – Différents types de données
Le premier individu est dit non censuré ; l’évènement a été observé. Le deuxième individu est
censuré : il n’a pas connu l’évènement. Le troisième individu a été perdu de vue. Il n’a pas
connu l’évènement. Il est dit aussi censuré.
1.2 Caractérisation d’une variable de survie

Soit X une variable de durée de vie.
1.2.1 Fonction de survie

Définition 1.2.1. La fonction de survie associée à T est la fonction S définie sur R+ à valeurs
dans [0, 1] par
S ( t) = P(T > t).
La fonction de survie est, pour t fixé, la probabilité de survivre jusqu’à l’instant t.
Proposition 1.2.1. Nous avons les propriétés suivantes :

• la fonction S est decroissante, continue à droite et admet une limite à gauche ;
• lim S ( t) = 0 : à t très grand, S ( t) = 0 ; l’événement se produit obligatoirement.
t→+∞
• S (0) = 1.
La fonction de répartition est la fonction F définie par F ( t) = P(T ≤ t) = 1 − S ( t). A t fixé, F ( t)

représente la probabilité que l’événement se produise avant la date t.
Proposition 1.2.2. La durée de vie moyenne est E(T ) et nous avons

Z ∞
E(T ) = S ( t) dt.
0
Démonstration. En utilisant le théorème de Fubini pour intervertir espérance et intégrale :

Z ∞ Z ∞ ³ ´ ³Z ∞ ´ ³Z T ´
S ( t) dt = E 1T > t = E 1T > t = E dt = E(T ).
0 0 0 0
6 CHAPITRE 1. MODÈLES PROBABILISTE DE DURÉES
1.2.2 Densité de probabilité
Définition 1.2.2. Si la variable aléatoire T est à densité f , nous avons
P( t ≤ T < t + ε)
f ( t) = lim = −S ′ ( t).
ε→0 ε
Pour t fixé et ε assez petit, ε f ( t) représente la probabilité de subir l’événement dans un petit
intervalle de temps après l’instant t.
1.2.3 La fonction de survie conditionnelle

Soit T une variable de durée et x ≥ 0. On note T x la durée de vie résiduelle d’un individu
conditionnellemen au fait qu’il soit vivant à l’âge x. La loi de T x est la loi conditionnelle de T
sachant T > x.
Définition 1.2.3. La probabilité de survie conditionnelle entre x et x + t est :

³ ´ ³ ´ S ( x + t)
t px = P Tx > t = P T > x + t | T > x = .
S ( x)
Définition 1.2.4. Le taux de mortalité entre x et x + t est définie par :

³ ´ S ( x + t)
t qx = 1 −t p x = P T ≤ x + t | T > x = 1 − .
S ( x)
Lorsque x est un entier, on note p x =1 p x et q x =1 q x .
Définition 1.2.5. On appelle espérance de vie résiduelle à l’âge x

³ ´ ³ ´
e ( x) = E T − x | T > x = E T x .
Nous avons
Z ³∞ ´
e ( x) = P T x > t dt
0
Z +∞
1
= S ( t + u) dt
S ( x) 0
Z +∞
1
= S ( u) du.
S ( x) x
L’espérance de vie résiduelle est le nombre moyen d’années vécues par un individu d’âge
x entre l’âge x et l’âge limite ω. Si nous observons pour une année donnée, le nombre de
survivants l x , l x+1 , . . . , l ω d’âges respectifs x, x + 1, . . . , ω d’une population supposée avoir la
même loi de durée de vie T , alors il est courant d’estimer e( x) par la formule discrète :
1 ωX −x
eb( x) = l k+ x .
l x k=1
Cette formule peut aussi s’écrire sous la forme suivante, en considérant que les l x sont pro-
portionnels aux S ( x) :
1 ωX −x ωX
−x
eb( x) = S ( k + x) = k px.
S ( x) k=1 k=1
On considère à l’interieur d’un groupe homogène, à un instant pris comme origine, l’en-
semble des individus d’âge x en nombre L x . On suppose qu’ils décèdent indépendamment les
uns des autres. Soit la variable aléatoire définie par :
(
1 si l’individu i est vivant à la date t
X i ( t) =
0 sinon
La variable aléatoire X i ( t) suit une loi de Bernouilli de paramètre

P( X i ( t) = 1) = P(T x > t) = t p x .
E( X i ( t)) = t p x Var( X i ( t)) = t p x × t q x .
A la date t, le nombre de survivants du groupe initialement composé de L x individus est

Lx
X
L x+ t = X i ( t).
i =1
Définition 1.2.6. On appelle nombre probable (ou nombre moyen) de vivants à l’âge x + t la
quantité
l x + t = E( L x + t ) = L x × t p x .
Ainsi, on obtient
l x+ t Nombre moyen de vivants à l’âge x + t
t px = = .
Lx Nombre d’individus d’âge x à l’origine
1.2.4 Fonction de hasard

La fonction de hasard ou fonction de risque instantané nous permet de mesurer la vitesse
de changement d’état d’un individu à travers le temps.
Définition 1.2.7. La fonction de hasard est défini sur R+ par :
′ ´´′
f ( t) S ( t) ³ ³
h( t) = =− = − ln S ( t) .
S ( t) S ( t)
La fonction de hasard détermine entièrement la loi de X et nous avons :
³ Z t ´
S ( t) = exp − h( s) ds .
0
De même, la fonction de survie conditionnelle est donnée par :

³ Z t ´
S u ( t) = exp − h( s + u) ds .
0
Comment interprèter la fonction de hasard ?

F ′ ( t)
h( t) =
S ( t)
³ ´
P t < T ≤ t+u
= lim
u →0 uS ( t)
³ ´
P t < T ≤ t+u
= lim
u →0 u P( T > t )
³ ´
P t < T ≤ t+u | T > t
= lim .
u →0 u
Ainsi, nous avons pour u suffisamment petit :
³ ´
P t < T ≤ t+u | T > t ³ ´
≈ h( t) ⇐⇒ P t < T ≤ t + u | T > t ≈ h( t) u.
u
Dans le contexte de la mortalité, la fonction h( t) est ainsi appelé taux de décès à l’âge t : h( t) u
donne une approximation de la probabilité de décès dans un intervalle de temps [ t, t + u[ petit,
sachant qu’on a survécu jusqu’à l’âge t.
Remarque 1.2.1. Etant donné un individu d’âge x et supposé vivant à l’époque t, c’est à dire
à l’âge x + t, quelle est la probabilité qu’il décède entre les dates t et t + ε ? Pour répondre à cette
question, nous avons besoin de la fonction de hasard µ t+ x de T x . Nous avons alors
t p x − t+ε px
P( t < T x < t + ε|T x > t) = .
t px
Si la fonction t 7→ t p x est dérivable alors pour ε assez petit, on obtient

ε
t p x − t+ε p x = −( t p x )′ ε = − l ′x+ t .
Lx
Par suite, nous avons
1 l′
lim P( t < T x ≤ t + ε|T x > t) = − x+ t = µ x+ t .
ε→0 ε l x+ t
• Le taux instantanné de mortalité à l’âge x est
l ′x
µx = − .
lx
• Le taux instantanné de mortalité à l’âge x durant l’année t, c’est à dire à l’âge x + t est :
l ′x+ t
µ x+ t = − .
l x+ t
Remarque 1.2.2. La fonction de hasard est très utilisée pour la carctérisation d’une variable
de durée. Les 5 formes les plus usuelles de la fonction de hasard sont
1. constante (le système ne vieillit pas (durée de vie exponentielle))
2. croissant (le système se détériore (vieillisement))
3. décroissant (le système s’améliore)
4. en cloche
T
5. en baignoire .
S
La fonction de risque instantané passe par trois périodes :

- la première période est caractérisée par une décroissance de la fonction de risque
instantané. En fiabilité, elle correspond aux erreurs de conception ou de fabrication ;
en durée de vie humaine, elle correspond au début où le nouveau né est confronté
aux maladies infantiles graves, malformations congénitales ;
- la deuxième période correspond à une fonction de risque instantané constante (indé-
pendant du temps). En fiabilité, c’est la zone de vie utile des composants où le taux
de défaillance est constant.
- la troisième période est caractérisée par une fonction de risque instantané croissante.
Les décès dans cette période sont majoritairement causées par le vieillissement et
l’usure (fiabilité).
F IGURE 1.2 – Forme "baignoire"
Remarque 1.2.3. Si X prend ses valeurs dans N alors la loi de probabilité de X est décrite
par
p k = P(T = k), k ∈ N.
La fonction de survie est donnée pour tout k ≥ 0 par
S ( k ) = P( T > k ) =
X
p j.
j ≥ k+1
La fonction de hasard au point k est :

pk
h( k) = P(T = k | T > k − 1) = .
S ( k − 1)
La fonction de hasard au point k s’interprète donc comme le taux de décès au temps k.
Nous avons
S ( k)
1 − h( k ) = ⇐⇒ S ( k) = (1 − h( k))S ( k − 1).
S ( k − 1)
En procédant par récurrence, nous obtenons
k
Y
S ( k) = (1 − h( j )).
j =0
A toute variable aléatoire T absolument continue, on peut associer une variable aléatoire
discrète en considérant la partie entière de T . C’est ce que l’on fait lorsqu’on considère par
approximation l’âge d’un individu en année par exemple. En pratique, on est aussi amené à
faire l’inverse : on estime une loi discrète, car on dispose seulement de données discrétisées
par année par exemple et on veut ensuite calculer les taux de décès à n’importe quel âge.
Il faut alors faire des hypothèses pour passer d’une expression discrète à une expression en
temps continu. Parmi les méthodes classiques, citons :
— la linéarisation de la fonction de survie sur chaque intervalle [ k, k + 1[.
— l’hypothèse de constance de la fonction de hasard sur [ k, k + 1[, pour chaque k ∈ N, qui
conduit à la forme exponentielle, pour t ∈]0, 1[,
t qx = 1 − (1 − q x ) t .
En effet, si nous supposons que h( x + s) = h( x) pour x entier et s ∈]0, 1[ alors pour tout
t ∈]0, 1[
1 − t qx = t px
³ Z t ´
= exp − h( x + s) ds
³ 0 ´
= exp − h( x) t .
D’où le résultat.
1.2.5 Fonction de hasard cumulé

Définition 1.2.8. La fonction de hasard cumulé est définie par :
Z t
H ( t) = h( u) du.
0
Nous avons
S ( t) = exp(− H ( t)).
1.3 Quelques lois classiques

1.3.1 Loi exponentielle
On dit que X suit la loi exponentielle E (λ) si f ( t) = λ e−λ t 1R+ ( t). La fonction de survie est
S ( t) = e−λ t 1R+ ( t) et la fonction de hasard est h( t) = λ1R+ ( t). Puisque h( t) est constante en t,
les individus dont la survie suit une loi exponentielle sont tels que : un individu agé de t a
la même probabilité de subir l’événement dans l’instant qui suit qu’un individu d’age 0. La
loi exponentielle est la seule loi des durées de survie qui soit sans mémoire : pour tous t et x
positifs :
P( X > x + t| X > t) = P( X > x).
1.3.2 La loi de Weibull W (α, λ).

La loi de Weibull a deux paramètres :
• un paramètre de forme α
• un paramètre d’échelle λ
La fonction densité de probabilité, la fonction de survie et la fonction de risque instantané
sont respectivement données par :
α
f ( t) = αλα tα−1 e−(λ t) 1R+ ( t)
α
S ( t) = e−(λ t) 1R+ ( t)
h( t) = αλα tα−1 1R+ ( t).
— Lorsque α = 1, on a W (1, λ) = E (λ).

— Lorsque 0 < α < 1, le risque instantané est décroissant (rodage).
— Lorsque α > 1, le risque instantané est croissant (usure).
Cette flexibilité explique l’utilisation de cette distribution dès lors que l’on soupçonne une
évolution monotone du risque avec la durée.
1.3. QUELQUES LOIS CLASSIQUES 11
1.3.3 La loi Gamma Γ(α, λ), α > 0, λ > 0
La loi Gamma a deux paramètres :
• un paramètre de forme α
• un paramètre d’échelle λ
La fonction densité de probabilité, la fonction de survie et la fonction de risque instantané
sont respectivement données par :
λα
f ( t) = tα−1 e−λ t 1R+ ( t)
Γ(α)
• Lorsque α = 1, on a Γ(1, λ) = E (λ).
• Lorsque 0 < α < 1, le risque instantané est décroissant.
• Lorsque α > 1, le risque instantané est croissant.
1.3.4 Modèle de Gompertz

La variable de durée X suit la loi de Gombert si la fonction de hasard est
h( t) = γ1 × γ2t .
Ici γ1 est la mortalité de base et γ2 est l’influence de l’âge. La distribution de Gompertz tient
uniquement compte du décès dû au vieillissement.
1.3.5 Modèle de Gompertz-Makeham de paramètres γ0 , γ1 , γ2 > 0.

Makeham ajoute un paramètre supplémentaire γ0 > 0 pour tenir compte de la mortalité acci-
dentelle. Le risque instantané est
h( t) = γ0 + γ1 × γ2t .
Le modèle de Gompertz-Makeham est le modèle de référence pour la construction de tables

de mortalité. Ainsi, le paramètre γ0 représente un taux de décès accidentel (indépendant de
l’âge) et le terme en γ1 × γ2t représente un vieillissement exponentiel. On retrouve le modèle
exponentiel si γ1 = 0. La fonction de hasard h est croissante si γ2 > 1 et décroissante si 0 <
γ2 < 1.
Exercice 1.3.1. Supposons que le décès peut survenir de deux causes indépendantes, l’acci-
dent ou le vieillissement. La durée de vie d’un individu est alors de la forme :
T = min( X , Y )
où X est une durée jusqu’à un décès accidentel et Y une durée jusqu’à un décès dû au vieillisse-
ment. Nous supposons que X est une variable aléatoire de loi exponentielle de paramètre λ. La
fonction de hasard de X est h X ( t) = λ et Y est une variable aléatoire de Gompertz de fonction
de hasard h Y ( t) = βγ t .
1. Montrer que Y a pour fonction de répartition
³ β¡ ¢´
FY ( x) = 1 − exp − e lx − 1 , l = ln(γ), x ≥ 0.
l
Pour la suite de l’exercice, nous supposons les valeurs des paramètres α, β et l fixés :
α = 7.6655.10−4 , β = 6.1041.10−6 et l = 0.11511. Les valeurs de X , Y et T sont exprimées
en années.
2. Expliquer comment simuler une réalisation de la variable aléatoire Y .
3. Ecrire un algorithme pour simuler M = 10000 réalisations (T1 , . . . , T M ) de la variable
aléatoire T .
— En déduire un algorithme pour estimer par la méthode Monte Carlo E(T ) et P(T ≥
75), ainsi qu’un intervalle de confiance au niveau de confiance 0.95.
— Application numérique : donner les valeurs numériques obtenues pour E(T ) et P(T ≥
75) ainsi que les intervalles de confiance pour E(T ) et P(T ≥ 75) au niveau de confiance
0.95.
— Montrer que
S T ( k) ≤ E(T ) ≤
X X
S T ( k).
k≥1 k≥0
En déduire un encadrement pour E(T ) et comparer avec l’intervalle de confiance

précédent.
— Estimer la valeur médiane de T à partir de l’échantillon simulé à la question précé-
dente.
Rappel : la médiane satisfait l’égalité : P(T ≤ m) = 21 .
Exercice 1.3.2. Soient α > 0, β > 1 et Y une variable aléatoire de fonction de répartition
1
FY ( x) = ¡ x ¢−β x ≥ 0.
1+ α
Montrer que la fonction de hasard associée h Y est unimodale, croissante puis décroissante.
Cette loi est utilisée pour modéliser la mortalité due au cancer après diagnostic ou traitement.
Cela est-il cohérent avec la propriété de h Y ?
1.3.6 Modèles composites

Les modèles composites sont utiles lorsque l’on est confronté à une population hétérogène,
composées d’individus avec des lois de survie différentes.
1.3.6.1 Agrégation de lois
Soit une population P partitionnée en sous-populations P v avec v ∈ V ⊂ Rd . La loi de

survie étant homogène à l’intérieur des sous-populations, on peut donc définir la fonction de
survie S ( t, v), la fonction densité f ( t, v) et la fonction de hasard h( t, v), pour tout t ≥ 0 et pour
tout v ∈ V . En t = 0, les paramètres d’hétérogenéité v sont distribués dans V selon la loi de
probabilité π. Comme les proportions relatives d’individus des différentes sous-populations
se modifient au cours du temps, la distribution des paramètres v à l’instant t est notée π t .
A t = 0, si la taille de la population est N , le nombre d’individus de type v est π(v) × N et le
nombre d’individus de type v vivants en t est N × π(v) × S ( t, v). Le nombre total d’individus
vivant dans la population à la date t est
Z
N π(v)S ( t, v) dv.
V
La proportion d’individus de type v dans la population à l’instant t est
π(v) × S ( t, v)
π t ( v) = Z
π(v)S ( t, v) dv.
V
La fonction de survie est :
S̄ ( t) = P( X > t)
= E(E(1 X > t | v))
= E[P( X > t | v)]
Z
= S ( t, v)π(v) dv
= Eπ (S ( t, v))
La fonction densité de probabilité dans la population totale est
Z
f¯( t) = f ( t, v)π(v) dv
V
= Eπ ( f ( t, v))
La fonction de hasard est :
f¯( t)
h̄( t) =
S̄ ( t)
Z
f ( t, v)π(v) dv
V
= Z
S ( t, u)π( u) du
V
f ( t, v) S ( t, v)π(v)
Z
= Z dv
V S ( t, v)
S ( t, u)π( u) du
V
f ( t, v)
Z
= π t (v) dv
V S ( t, v)
Z
= h( t, v)π t (v) dv
V
= Eπt ( h( t, v)).
Exercice 1.3.3. Supposons que la loi de la variable de durée est pour l’individu de la sous-
population P v , v > 0 une loi de Weibull
β
S ( t, v) = e−vt 1 t≥0 β > 0.
De plus, on suppose que le paramètre d’hétérogénéité suit une loi Gamma Γ(α, !).
1. Calculer π t .
2. Calculer h̄.
3. Etudier la monotonie de h̄.
1.3.6.2 Modèles à hasard proportionnel

Un modèle à hasard proportionnel est un modèle semi-paramétrique dans lequel on se
donne une fonction de survie de base S 0 ( t) et l’on fait l’hypothèse que la fonction de survie
du phénomène observé est de la forme S θ ( t) = S 0 ( t)θ , pour un paramètre θ > 0 inconnu. La
fonction densité est
′ f θ ( t) f 0 ( t)
f θ ( t) = −S θ ( t) = θ f 0 ( t)S 0θ−1 ( t) ⇐⇒ h θ ( t) = =θ .
S θ ( t) S 0 ( t)
La fonction de hasard est donc de la forme :
h θ ( t) = θ h 0 ( t).
La fonction de hasard est ainsi proportionnelle à la fonction de hasard de base.
1.3.6.2.a Modèles de Cox
Le modèle de Cox intègre des variables explicatives pour définir le paramètre θ > 0.
On cherche à modéliser l’effet de variables explicatives connues sur le niveau de la fonc-
′
tion de risque. On écrit θ = e z β avec z = ( z1 , . . . , z p ) vecteur de p variables explicatives et
β = (β1 , . . . , β p ) le vecteur de paramètres.
1.3.6.2.b Modèles de fragilité

Dans le modèle de Cox, on cherche à modéliser l’effet de variables explicatives connues sur
le niveau de la fonction de hasard. Souvent, ces variables sont inobservables et on souhaite
tout de même évaluer les conséquences de ces variables inobservables sur la forme de la
fonction de survie. Nous posons
S θ ( t) = S ( t | θ ) = S 0 ( t)θ
avec θ aléatoire. En d’autres termes on se donne la loi de survie conditionnellement au para-
mètre θ , et la fonction de survie globale s’obtient par intégration :
S ( t) = E(S 0 ( t)θ )
l’espérance étant calculée par rapport à la loi de θ . Le paramètre θ s’appelle la "fragilité".
Les modèles de fragilité ont été introduits par Vaupel et al.[3] pour rendre compte de l’hé-
térogénéité individuelle dans un contexte de mortalité. Le paramètre de fragilité permet en
pratique d’introduire des différences de niveau de mortalité entre les individus, en supposant
que l’évolution de la mortalité avec l’âge est identique pour tous les individus. L’hétérogé-
néité est alors modélisée via la distribution du paramètre. Dans Vaupel et al. [3], il est fait
l’hypothèse que θ suit une loi Gamma.
1.3.6.3 Transformations croissantes de la durée (modèles AFT15)

Il s’agit d’un modèle semi-paramétrique dans lequel on se donne une fonction de survie
de base, S 0 ( t) et on fait l’hypothèse que la fonction de survie du phénomène observé est de la
forme
S θ ( t) = S 0 (θ t),
pour un paramètre θ > 0. La fonction de hasard est alors
h θ = θ h 0 (θ t).
1.3.6.4 Modèles à causes de sortie multiples

Dans certaines situations on est amené à distinguer entre différentes causes de sortie. Si
on note T1 , . . . , T n les variables de durée associées à chacune des causes étudiées, la survie
globale est simplement
T = min(T1 , . . . , T n ).
Si T1 , . . . , T n sont indépendantes alors il est facile de déterminer la loi T . Cependant, l’hypo-
thèse d’indépendance peut être parfois restrictive, et les modèles de fragilité fournissent un
moyen simple de la relâcher. Cette approche a été proposée initialement par Oakes [2]. On
suppose donc que les durées associées à chaque cause sont indépendantes conditionnellement
à θ et que les marginales (conditionnelles) sont de la forme
S i ( t | θ ) = (S i ( t))θ .
On obtient donc
n
³Y ´
S ( t1 , . . . , t n ) = E (S i ( t))θ .
i =1
1.3.6.5 Modèles à choc commun
L’idée est ici que la durée de survie dépend de deux facteurs, l’un propre à l’individu et
l’autre affectant la population dans son ensemble. Ce second facteur peut être un facteur
accidentel ou environnemental. On considère le modèle :
T i = min( X i , Z ).
Notons S i la fonction de survie de T i et S Z celle de Z . La fonction de survie de (T1 , . . . , T n ) est

n
Y
S ( t1 , . . . , t n ) = S i ( t i ) × S Z (max( t 1 , . . . , t n )).
i =1
Chapitre
2 Modèles paramétriques
2.1 Censure et vraisemblance

Le temps de survie X est dit censuré quand l’événement n’est pas observé. L’observations
est alors incomplète. Nous notons :
• X le temps de survie.
• T la durée réellement observée.
• ∆ l’indicateur de censure.
• C le temps de censure.
En pratique, on peut être confronté à une censure à droite ( X ≥ C ) ou à une censure à gauche
( X ≤ C ) ou les deux concomitamment.
2.1.1 Censure à droite

Exemples de censures
La durée de vie est dite censurée à droite si l’individu i n’a pas subi l’événement à sa
dernière observation. On sait seulement que la durée de vie est supérieure à une certaine
valeur connue C i pouvant
Prenons le casêtre
de aléatoire.
la durée Pourde vie l’individu
de patientsi donné ayantde
atteints temps de:survie X i
un cancers
et temps de censure C i , l’information disponible peut être résumé par :
À la fin du laps de temps prévu par l’étude, l’événement étudié qui est le
• la durée réellement observée : T i = min( X i , C i )
décès n’intervient pas obligatoirement chez tous les patients suivis et
• l’indicateur
pour dede censure ∆ i = 1la{Tdurée
tels patients, i =X i }
1{ Xvie
=de qui pas
i ≤Cn’est
i}
indique si l’événement
exactement connued’intérêt
(1) a
été observé (∆ i = 1) ou non (∆ i = 0).
Au cours du laps de temps prévu par l’étude, le suivi de certains patients
peut-être intérompu pour plusieurs raisons indépendantes à l’étude (2)

Début Fin
Non censuré
Censuré (1)
Censuré (2)
?
Décès Temps (t)
16
2.1. CENSURE ET VRAISEMBLANCE 17
2.1.1.1 Censure de type I : fixée C i = C
La durée réllement observé est T i = min( X i , C ). Ici, C est une constante fixée.
La contribution d’une observation non censurée à la vraisemblance est :
P( t i ≤ T i < t i + dt i , ∆ i = 1) = P( t i ≤ X i < t i + dt i , X i = 1 ≤ C )
= P( t i ≤ X i < t i + dt i ) = f X ( t i , θ ) dt i
étant donné que l’on peut toujours supposer dt i suffisamment petit pour que t i + dt i ≤ C .
La contribution d’une observation censurée à la vraisemblance est donnée par :
P( t i ≤ T i < t i + dt i , ∆ i = 0) = P( t i ≤ C < t i + dt i , X i ≥ C )
= P( X i ≥ C )
= S X (C ).
Ainsi, dans le cas où ∆ i = 0, comme T i = C , il n’y a pas de densité mais la probabilité que la
probabilité que lévénement est égale à S X (C ).
La vraisemblance du modèle associée aux observations ( t 1 , δ1 ), . . . , ( t n , δn ) est égale à
n ³
Y ´δ i ³ ´1−δ i
L(θ , ( t 1 , δ1 ), . . . , ( t n , δn )) = f X ( t i , θ) S X ( t i , θ) .
i =1
Exercice 2.1.1. Nous observons durant un intervalle de temps [0, C ] la durée de fonctionne-
ment jusqu’à une panne de n appareils neufs à t = 0, de "durée de vie" de loi exponentielle de
paramètre θ > 0. Exprimer θ par la methode du maximum de vraisemblance.
2.1.1.2 Censure de type II

C’est l’attente de r événements parmi n. La date de fin d’observation n’est pas définie à
l’avance. On décide d’observer les durées de vie et d’arrêter après r décès. Soit un échantillon
de durée de survie ( X 1 , . . . , X n ) et r > 0. On dit qu’il y a censure de type II pour cet échantillon
si au lieu d’observer directement ( X 1 , . . . , X n ), on observe (T1 , ∆1 ), . . . , (T n , ∆n ) avec
( (
n o 1 si X i = T i 1 si X i ≤ X (r)
T i = inf X i , X (r) ∆i = =
0 si X i ̸= T i 0 si X i > X (r)
où X (r) est la statistique d’ordre r de ( X 1 , . . . , X n ). La vraisemblance a une forme proche du

cas de la censure de type de type I :
n! h Y r i³ ´ n− r
L(θ , ( t 1 , δ1 ), . . . , ( t n , δn )) = f X ( x( i) , θ ) S X ( x(r) )
( n − r )! i=1
n! Y n ³ ´δ i ³ ´1−δ i
= f X ( t i , θ) S X ( t i , θ)
( n − r )! i=1
2.1.1.3 Censure de type III : aléatoire

Les variables C i sont aléatoires, équidistribuées et sont indépendantes des X i . A chaque
individu, on associe non seulement son temps de survie X i mais aussi son temps de censure
C i . On observe evidemment
T i = min( X i , C i )
Notons f X et S X (resp. f C et S C ) la densité et la fonction de survie de X (resp C ). Pour
l’individu i , on observe (T i , ∆ i ). {T1 , . . . , T n } sont i.i.d. ; {C 1 , . . . , C n } sont i.i.d. et indépendantes
des { X 1 , . . . , X n }. La densité de (T, ∆) peut être obtenue à partir de la densité conjointe de
( X , C ). En effet, la loi de (T, ∆) est caractérisée par :
18 CHAPITRE 2. MODÈLES PARAMÉTRIQUES
1. P(T ≤ t, ∆ = 1) (Cas non censuré)
P(T ≤ t, ∆ = 1) = P(T ≤ t, X ≤ C )
= P( X ≤ t, X ≤ C )
Z tZ ∞
= f X ,C ( u, v) dudv
0 u
Z t hZ ∞ i
= f X ( u) f C (v) dv du
0 u
Z t
= f X ( u)S C ( u) du.
0
La vraisemblance pour une observation non censurée au temps t est :
f X ( t)S C ( t).
2. P(T ≤ t, ∆ = 0) (Cas censuré)

P(T ≤ t, ∆ = 0) = P(T ≤ t, X > C )
= P(C ≤ t, X > C )
Z tZ ∞
= f X ,C ( u, v) dudv
0 v
Z t hZ ∞ i
= f C ( v) f X ( u) du du
0 v
Z t
= f C (v)S X (v) dv.
0
La vraisemblance pour une observation censurée au temps t est :
f C ( t)S X ( t).
La vraisemblance pour un échantillon observé de taille n ( t i , δ i ) i=1,...,n est :

n
Y n
Y
L(θ , ( t 1 , δ1 ), . . . , ( t n , δn )) = f T ( t i , θ) f T ( t i , θ)
i =1,δ i =1 i =1,δ i =0
Y n ³ ´δ i ³ ´1−δ i
= f X ( t i , θ )S C ( t i , θ ) f C ( t i , θ )S X ( t i , θ ) .
i =1
Lorsque la censure est non informative, c’est à dire que la loi de probabilité de la censure ne
dépnd pas du paramètre λ, nous avons
n h
Y iδ i h i1−δ i
L(θ , ( t 1 , δ1 ), . . . , ( t n , δn )) ∝ f X ( t i , θ) S X ( t i , θ) .
i =1
Exercice 2.1.2. Soit λ et β des paramètres strictement positifs inconnus. Nous considérons
une situation de censure aléatoire à droite : nous observons (T i , ∆ i ), i = 1, . . . , n, où :
³ ´
T i = inf X i , C i ∆ i = 1{ X i ≤C i }
dans laquelle les variables X i sont indépendantes de loi exponentielle de paramètre λ et les
censures C i sont indépendantes des durées X i , indépendantes entre elles et de loi exponentielle
de paramètre βλ.
1. Proposer une méthode pour estimer β et λ et déterminer des estimateurs βb et λ b par la
m]’ethode choisie.
1
2. simuler un échantillon (T i , ∆ i ), i =!, . . . , n pour λ = 1, β = 2 et n = 1000. Comparer
numériquement (βb, λ
b) à (β, λ).
2.2. TRONCATURE 19
2.1.2 Censure à gauche
La censure à gauche correspond au cas où l’individu a déjà subi l’évènement avant qu’il
soit observé. On sait seulement que la date de survenue de l’évènement est inférieure à une
certaine date connue. Pour chaque individu, on peut associer le couple de variables aléatoires
(T i , δ i ) :
T i = max( X i , C i ) ∆ i = 1{ X i ≥C i } .
Remarque 2.1.1. La censure à gauche et la censure à droite peuvent être observées simulta-
nément. On dispose de deux censures C 1i et C 2i , l’une à droite et l’autre à gauche avec C 1 < C 2 .
Au lieu de X , on observe le triplet (T i , ∆1i , ∆2i ) avec ∆1i = 1{ X i ≤C 1 } et ∆2i = 1{ X i ≤C 2 } et
i i
 1
C i
 si X ≤ C 1i
T = Xi si C 1i < X i ≤ C 2i

 2
Ci si C 2i < X i
2.1.3 Censure par intervalle

Définition 2.1.1. On dit qu’une observation X i est censurée dans l’intervalle (L i , R i ) si tout
ce que nous savons, c’est que la vraie valeur de l’observation se trouve dans (L i , R i ) :
£
T i = min min( X i , R i ), L i ].
2.2 Troncature
Une variable X est tronquée par un sous-ensemble de R+ , si au lieu de X , on observe X
uniquement si X ∈ A .On dit qu’il y a troncature à gauche lorsque la variable d’intérêt n’est
pas observable lorsqu’elle est inférieure à un seuil c > 0 et qu’il y a troncature à droite lorsque
la variable d’intérêt est supérieure à un seuil C > 0. Le phénomène de troncature est différent
de la censure, puisque dans ce cas on perd complètement l’information sur les observations
en dehors de la plage : dans le cas de la censure, on a connaissance du fait qu’il existe une
information, mais on ne connait pas sa valeur précise, simplement le fait qu’elle excède un
seuil ; dans le cas de la troncature on ne dispose pas de cette information. La distribution
observée est la loi conditionnelle à l’événement { X ∈ A }.
Exemple 2.2.1. On suppose que A = [ c, C ] avec 0 < c < C . La fonction de survie tronquée
S ( t| c ≤ X < C ) = P( X > t| c ≤ X < C )

P( X > t, c ≤ X < C )
=
P( c ≤ X < C )



1 si X < c
 S (C ) − S ( t)
= si c ≤ X < C


 S (C ) − S ( c )
0 si X > C
La troncature s’observe dans le cas d’un contrat d’arrêt de travail avec une franchise : les
arrêts de durée inférieure à la franchise ne sont pas observés et on ne dispose donc sur eux
d’aucune information.
20 CHAPITRE 2. MODÈLES PARAMÉTRIQUES
2.3 Ajustement du modèle de Gompertz Makeham par

une méthode de régression
Dans le cas du modèle de Gompertz-Makeham, il est possible d’estimer les paramètres
du modèle par une méthode de régression linéaire en utilisant les propriétés des taux de
mortalité. Rappelons que pour ce modèle, la fonction de hasard est
h( t) = α + βγ t .
Le taux de mortalité entre x et x + 1 est

S ( x + 1) ³ β ´
q x (θ ) = 1 − = 1 − exp − α − (γ − 1)γ x θ = (α, β, γ). (2.3.1)
S ( x) ln(γ)
Nous supposons que nous disposons des observations suivantes pour une année donnée, pour
des âges entiers x compris entre x0 et x1 :
— N x : nombre d’individus d’âge x.
— d x : nombre de décès à l’âge x.
dx
Nous définissons les taux bruts de mortalité par qbx = N x
.
L’objectif est maintenant d’ajuster ces taux bruts de mortalité avec un notre modèle pa-
ramétrique q x (θ ). Il faut donc estimer les paramètres du modèle. Dans le cas du modèle de
Gompertz-Makeham, nous avons θ = (α, β, γ) (3 paramères à estimer).
D’après (2.3.1), nous avons
β
ln(1 − q x (θ )) = −α − (γ − 1)γ x . (2.3.2)
ln(γ)
Si q x (θ ) est petit, nous avons l’approximation
ln(1 − q x (θ )) ≈ − q x (θ )
β
q x (θ ) ≈ α + (γ − 1)γ x
ln(γ)
β
(γ − 1)2 γ x
q x+1 (θ ) − q x (θ ) ≈
ln(γ)
³ ´ ³ β ´
ln q x+1 (θ ) − q x (θ ) ≈ x ln(γ) + ln (γ − 1)2 .
ln(γ)
³ ´
C’est une approximation lináire entre ln q x+1 (θ ) − q x (θ ) et l’âge x :
³ ´
ln qbx+1 (θ ) − qbx (θ ) = ax + b + Wx
en se restreignant aux x tels que qbx+1 (θ ) − qbx (θ ) > 0. On obtient ab et b

b puis les estimateurs
e b ln(γb)
b
b = e ab
γ β
b= .
(γ
b − 1)2
On déduit l’estimateur α
b de α par la formule (2.3.2).
Exercice 2.3.1. Appliquer cette méthode aux données démographiques d’un pays pour une
année donnée (données HMD par exemple).
Chapitre
3 Modèles non paramétriques
Nous considérons l’estimation non

³ paramétrique
´ de la fonction de survie S X ( t), de la fonc-
tion de hasard intégrée H X = − log S X ( t) d’une variable de durée X en présence des données
censurées à droite. On parle de modèles non paramétriques lorsqu’aucune hypothèse n’est
faite sur la forme de la distribution des temps de survie.
3.1 Estimateur de Kaplan-Meier (1958)

3.1.1 Données non censurées
Soit X une variable de durée de fonction de survie S X inconnue. Soient X 1 , . . . , X n des
variables aléatoires indépendantes de même loi que X . En l’absence de censure, l’estimateur
non paramétrique couramment utilisé est la fonction de survie empirique définie par :
1X n
Sbn ( t) = 1{ X i > t } .
n i=1
D’après la loi forte des grands nombres, nous avons

p.s
∀ t ∈ R, Sbn ( t) −−−−−−→ S ( t).
n−→+∞
De plus, nous avons une convergence uniforme avec le Théorème de Glivenko-Cantelli :

¯ ¯ p.s
sup ¯Sbn ( t) − S X ( t)¯ −−−−−−→ 0.
¯ ¯
t∈R n−→+∞
Par le TCL, nous avons ponctuellement un résultat de normalité asymptotique :

p ³ ´
L
³ ´
n Sbn ( t) − S X ( t) −−−−−−→ Z où Z ∼ N 0, p(1 − p) ; p = P( X ≤ t).
n−→+∞
3.1.2 Données censurées

On considère maintenant le cas des données censurées à droite. Soient X une variable de
durée censurée à droite de fonction de survie S X , C une censure aléatoire à droite de fonction
de survie S C . On suppose que X et C sont indépendantes. La durée réellement observée est
T = min( X , C ) et on note ∆ = 1{ X ≤C } l’indicateur de censure.
21
22 CHAPITRE 3. MODÈLES NON PARAMÉTRIQUES
On observe un échantillon i.i.d. (T1 , ∆1 ), . . . , (T n , ∆n ). Pour estimer S X , on ne peut pas se
contenter de prendre uniquement les données non censurées, c’est à dire les décès. En ef-
fet,
Pn
i =1 1{T i > x,∆ i =1} p.s P( x < X ≤ C )
Sen ( x) = Pn −−−−−−→ .
i =1 1 {∆ i =1 } n−→+∞ P( X ≤ C )
De plus, nous avons
³ ´ Z Z
P x<X ≤C = 1{ x< t≤ c} f X ( t) f C ( c) dtdc
Z ∞ hZ c i
= f C ( c) f X ( t) dt dc
Z0 ∞ ³
x
´
= f C ( c) S X ( x) − S X ( c) dc
0
Z ∞
= S X ( x) − f C ( c)S X ( c) dc
0
³ ´ Z Z
P X ≤C = 1{ x≤ c} f X ( t) f C ( c) dtdc
Z ∞ hZ c i
= f C ( c) f X ( t) dc
0
Z ∞0
= S X (0) − f C ( c)S X ( c) dc
Z ∞ 0
= 1− f C ( c)S X ( c) dc.
0
Par suite, nous avons
R∞
P( x < X ≤ C ) S X ( x) − 0 f C ( c)S X ( c) dc
= R∞ ̸= S X ( x) en général !
P( X ≤ C ) 1 − 0 f C ( c)S X ( c) dc
On observe un échantillon d’individus à des instants donnés t 0 = 0 < t 1 < . . . < t k−1 < t k = ∞.
A chaque instant t j , on note
— m j,k le nombre de décès dans l’intervalle I j =] t j−1 , t j ]
— c j,k le nombre de censurés dans l’intervalle I j =] t j−1 , t j ]
— n j,k le nombre de sujets exposés (en vie) à l’instant t j−1 (ni décédés, ni censurés :
X > t j−1 , C > t j−1 )
— q j,k la probabilité de décéder dans l’intervalle I j sachant que l’individu est en vie à
l’instant t j−1 .
Définition 3.1.1. On appelle estimateur sur échantillon réduit de q j,k :
m j,k
qb(1)
j,k
= .
n j,k − c j,k
3.1. ESTIMATEUR DE KAPLAN-MEIER (1958) 23
n o ³ ´ ³ ´
Pour tout j 0 ∈ 1, . . . , k , t 0 < t 1 < . . . < t j 0 −1 < t j 0 , comme P X > t 0 = P X > 0 = 1, nous avons
S X ( t j 0 ) = P( X > t j 0 )
= P( X > t j 0 , X > t j 0 −1 , . . . , X > t 0 )
³ ´ ³ ´ ³ ´
= P X > t0 × P X > t1 | X > t0 × P X > t2 | X > t0 , X > t1 ×
³ ´
. . . × P X > t j 0 | X > t j 0 −1 , X > t j 0 −2 , . . . , X > t 0
³ ´ ³ ´ ³ ´ ³ ´
= P X > t 0 × P X > t 1 | X > t 0 × P X > t 2 | X > t 1 × . . . × P X > t j 0 | X > t j 0 −1
j0 ³ ´
P X > t j | X > t j−1
Y
=
j =1
j0 ³
Y ´
= 1 − q j,k
j =1
Par suite, un estimateur de S X pour t quelconque est

Y ³ ´
Sb(1)
k,n
( t) = 1 − qb(1)
j,k
j:t j ≤t
Remarque 3.1.1. qb(1)j,k

surestime q j,k car on sous-estime la population exposée (on retranche
les c j,k au dénominateur). On sous-estime donc la fonction de survie S X .
Définition 3.1.2. On appelle estimateur actuariel de q j,k la quantité

m j,k
qb(2)
j,k
= c j,k .
n j,k − 2
Et nous en déduisons l’estimateur de S X , pour t quelconque

Y ³ ´
Sb(2)
k,n
( t ) = 1 − q
b (2)
j,k
.
j:t j ≤t
Mais Breslow et Crowley (1974) ont montré que Sb(2) k,n

( t) est un estimateur consistant de S X ,
pour tout choix de t 1 , . . . , t k , uniquement si
1
S X ( t) = 1 − p
1 + c 0 S C ( t)
pour une constante

¯ c¯ 0 > 0. Kaplan et Meier (1958) ont repris ces estimateurs en faisant tendre
δk = sup ¯ t j − t j−1 ¯ vers 0 lorsque k tend vers ∞. Ils ont montré
¯ ¯
j =1,...,k
K ³ m i ´1t∗( i) ≤t b
p.s
Sb(1)
Y
k,n
( t) −−−−−−−−−−→ 1− = S K M ( t)
k−→+∞,δk →0 i =1 ni
où t∗(1) , . . . , t∗(K ) sont les K valeurs distinctes des durées non censurées ordonnées parmi t 1 , . . . , t n ,
Xn
m i est le nombre de décès (non censurés) à la date t∗( i) , n i = 1 t j ≥ t∗ est le nombre de su-
( i)
j =1
jets exposés à la date t∗( i) .
Cet estimateur est aussi appelé estimateur "produit-limite". Il est
constant par intervalles, les sauts ayant lieu en chaque t∗( i) . Il est càdlàg et S K M ( t) = 0 lorsque
t > t∗(K ) , la plus grande des durées non censurées observées.
Remarque 3.1.2. Autre justification. Soient t∗(1) < t∗(2) < . . . < t∗(K ) les temps de décès or-
donnés de l’échantillon, m 1 , . . . , m K respectivement les nombres de décès au temps t∗(1) , . . . , t∗(K )
(les données censurées ne sont pas prises en compte). L’estimateur de Kaplan-Meier découle de
l’idée suivante : survivre après un temps t∗( i) , c’est être en vie juste avant t∗( i) et ne pas mourir
au temps t∗( i) . Nous avons donc
S ( t∗( i) ) = P( X > t∗( i) )

= P( X > t∗( i) , X > t∗( i−1) )
= P( X > t∗( i) | X > t∗( i−1) )P( X > t∗( i−1) )
= P( X > t∗( i) | X ≥ t∗( i) )P( X > t∗( i−1) )
= P( X > t∗( i) | X ≥ t∗( i) ) . . . P( X > t∗(1) | X ≥ t∗(1) )P( X > t 0 = 0)
i
P( X > t∗(l ) | X ≥ t∗(l ) ) × P( X > 0)
Y
=
l =1
où p l = P( X > t∗(l ) | X ≥ t∗(l ) ) = P( X > t∗(l ) | X > t∗(l −1) ) représente la probabilité pour un individu
de survivre au délà de l’instant t∗(l ) sachant qu’il était vivant juste avant t∗(l ) ; p l est estimée par
nl − ml ml
= 1− .
nl nl
Ainsi, n l − m l représente le nombre d’individus vivant et pas censurés après l’instant t∗l que
l’on divise par le nombre d’individus vivant et pas censurés juste avant l’instant t∗l .
L’estimateur de Kaplan-Meier de la fonction de survie S ( t) est donc défini par
 Y ³ mi ´

 1− si t ≥ t∗1 n ³ m i ´1t∗( i) ≤t
∗
S K M ( t) = i : t i ≤ t
b n i =
Y
1− .
1 t < t ∗
 i =1 ni
1
3.1.3 Propriétés de l’estimateur de Kaplan-Meier

3.1.3.1 Cohérence
En l’absence de censure, l’estimateur de Kaplan-Meier coïncide avec la fonction de survie
empirique.
Définition 3.1.3. On dit qu’un estimateur Se de la fonction de survie S X de X est cohérent si
pour tout t, nous avons
1³Xn X n Se( t) ´
Se( t) = 1{ T i > t } + 1{T i ≤ t,∆ i =0} .
n i=1 i =1 Se(T i )
Proposition 3.1.1. L’estimateur de Kaplan-Meier est l’unique estimateur cohérent de la fonc-
tion de survie S X .
3.1.3.2 Convergence et normalité asymptotique

Théorème 3.1.1. Nous avons
¯ ¯ p.s
sup ¯SbK M ( t) − S X ( t)¯ −−−−−→ 0
¯ ¯
t≥0 n→+∞
et pour tout t ≥ 0, nous avons

p L
n(SbK M ( t) − S X ( t)) −−−−−→ W ( t)
n→+∞
où W ( t) est une variable gaussienne centrée de fonction de covariance
³ ´ ´ Z min( t,s) f X ( u)
Cov W ( t),W ( s) = S X ( t)S X ( s) 2
du.
0 S X ( u)S C ( u)
Remarque 3.1.3. 1. L’estimateur de Kaplan-Meier est une fonction continue par mor-
ceaux avec des discontinuités ou des sauts aux temps de décès observés.
2. L’estimateur de Greenwood de la variance de l’estimateur de Kaplan-Meier de SbK M ( t)
est donné par :
mi
ar (SbK M ( t)) = (SbK M ( t))2
X
V
. (3.1.1)
i : t∗ ≤ t n i ( n i − m i )
i
En effet, on a
X ³ mi ´
ln(SbK M ( t)) = ln 1 − .
i : t∗ ≤ t ni
i
³ mi ´
Si on suppose en première approximation l’indépendance des variables ln 1 − ,
ni
nous obtenons
mi ´
µ ¶ µ ³ ¶
X
var ln(SbK M ( t)) = var ln 1 −
i : t∗i ≤ t ni
X ³ ³ m i ´´
≈ var ln 1 −
i : t∗ ≤ t ni
i
La variable n i − m i suit une loi binomiale B ( n i , p i ). Nous en déduisons que

mi mi p i (1 − p i )
µ ¶ µ ¶
E 1− = pi var 1 − = .
ni ni ni
Ainsi par la delta-methode
mi ´ mi 1 1 − pi
µ ³ ¶ µ ¶
var ln 1 − = var 1 − × 2=
ni ni pi ni pi
mi
1− p i ni mi
En estimant ni pi par mi = , on obtient
n i (1 − ni)
n i (n i − m i )
mi
µ ¶
X
var ln(SbK M ( t)) ≈ (3.1.2)
i : t∗ ≤ t n i ( n i − m i )
i
La delta-method :
var ( f ( Z )) ≈ var ( Z )( f ′ (E( Z )))2 .
Ainsi, nous obtenons :
1
µ ¶ ³ ´
var ln(SbK M ( t)) ≈ var SbK M ( t) × (3.1.3)
S 2 ( t)
De (3.1.2) et (3.1.3), on déduit l’estimateur de Greenwood (3.1.1) de la variance de SbK M ( t). Le
résultat (3.1.3) s’obtient, de manière théorique, de la propriété de normalité asymptotique de
l’estimateur de Kaplan-Meier.
De plus, un intervalle de confiance au niveau 1 − α pour S X ( t) est :
h r ³ ´ r ³ ´i
S K M ( t) − t 1−
b α V ar S K M ( t) , S K M ( t) + t 1−
b b α V
ar SbK M ( t)
2 2
où t 1− α2 est le quantile de la loi normale centrée-réduite.

3.1.4 Exemples
Exemple 3.1.1. Freireich en 1963 a fait un essai thérapeutique ayant pour but de comparer
les durées de rémission, en semaines, de sujets atteints de leucémie selon qu’ils aient recu ou
non du 6 M-P (le groupe témoin a recu un placebo et l’essai a été fait en double aveugle)
6 M-P : 6, 6, 6, 6+ , 7, 9+ , 10, 10+ , 11+ , 13, 16, 17+ , 19+ , 20+ , 22, 23, 25+ , 32+ , 32+ , 34+ , 35+ .
Placebo : 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23.
Les nombres suivis du signe + correspondent à des patients qui ont été perdus de vue à la date
considérée. Par exemple le quatrième patient traité par 6 M-P a eu une durée de rémission
supérieure à 6 semaines ; les trois premiers ont eu une durée de rémission égale à 6 semaines.
Données 6 M-P
A la main
m
t∗i mi ni 1− ni Sb( t∗i )
i
6 3 21 0.857 0.857
7 1 17 0.941 0.807
10 1 15 0.933 0.753
13 1 12 0.917 0.690
16 1 11 0.909 0.627
22 1 7 0.857 0.538
23 1 6 0.833 0.448
L’estimateur de Kapla-Meier de la fonction de survie du groupe "6MP" est



1 si 0 ≤ t < 6

0.857 si 6 ≤ t < 7





0.807 si 7 ≤ t < 10






0.753 si 10 ≤ t < 13
Ŝ 6 MP =


0.690 si 13 ≤ t < 16

0.627 si 16 ≤ t < 22





0.538 si 22 ≤ t < 23





0.448 si 23 ≤ t

Avec le logiciel R
> library(survival)
> temps_6MP<-c(6, 6, 6,6,7, 9, 10,10, 11,13, 16, 17, 19,20,22,23,25,32,32,34,35)
> event_6MP<-c(1, 1, 1, 0, 1,0,1,0,0,1,1,0,0,0,1,1,0,0,0,0,0)
> DonneesMP6=Surv(temps_6MP, event_6MP)
> temps_placebo<-c(1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23)
> DonneesMP6
[1] 6 6 6 6+ 7 9+ 10 10+ 11+ 13 16 17+ 19+ 20+ 22 23 25+ 32+ 32+

[20] 34+ 35+
> S6MP=survfit(DonneesMP6~1 ,conf.int=T)

> summary(S6MP)
Call: survfit(formula = DonneesMP6 ~ 1, conf.int = T)
time n.risk n.event survival std.err lower 95% CI upper 95% CI

6 21 3 0.857 0.0764 0.720 1.000
7 17 1 0.807 0.0869 0.653 0.996
10 15 1 0.753 0.0963 0.586 0.968
13 12 1 0.690 0.1068 0.510 0.935
16 11 1 0.627 0.1141 0.439 0.896
22 7 1 0.538 0.1282 0.337 0.858
23 6 1 0.448 0.1346 0.249 0.807
> plot(S6MP)
1.0
0.8
0.6
0.4
0.2
0.0
0 5 10 15 20 25 30 35
Les deux groupes
> Temps=c(6,6,6,6,7,9,10,10,11,13,16,17,19,20,22,23,25,
+ 32,32,34,35,1,1,2,2,3,4,4,5,5,
+ 8,8,8, 8,11,11,12,12,15,17,22,23)
> Statut=c(1,1,1,0,1,0,1,0,0,1,1,0,0,0,
+ 1,1,0,0,0,0,0,1,1,1,1,1,1,1,1,
+ 1,1,1,1,1,1,1,1,1,1,1,1,1)
> Groupe=c(rep("6MP",21),rep("P",21))
> Donnees=data.frame(Temps,Statut,Groupe)
> Donnees
Temps Statut Groupe
1 6 1 6MP
2 6 1 6MP
3 6 1 6MP
4 6 0 6MP
5 7 1 6MP
6 9 0 6MP
7 10 1 6MP
8 10 0 6MP
9 11 0 6MP
10 13 1 6MP
11 16 1 6MP
12 17 0 6MP
13 19 0 6MP
14 20 0 6MP
15 22 1 6MP
16 23 1 6MP
17 25 0 6MP
18 32 0 6MP
19 32 0 6MP
20 34 0 6MP
21 35 0 6MP
22 1 1 P
23 1 1 P
24 2 1 P
25 2 1 P
26 3 1 P
27 4 1 P
28 4 1 P
29 5 1 P
30 5 1 P
31 8 1 P
32 8 1 P
33 8 1 P
34 8 1 P
35 11 1 P
36 11 1 P
37 12 1 P
38 12 1 P
39 15 1 P
40 17 1 P
41 22 1 P
42 23 1 P
> s=survfit(Surv(Temps,Statut)~Groupe, data=Donnees)

> summary(s)
Call: survfit(formula = Surv(Temps, Statut) ~ Groupe, data = Donnees)
Groupe=6MP
6 21 3 0.857 0.0764 0.720 1.000
7 17 1 0.807 0.0869 0.653 0.996
10 15 1 0.753 0.0963 0.586 0.968
13 12 1 0.690 0.1068 0.510 0.935
16 11 1 0.627 0.1141 0.439 0.896
22 7 1 0.538 0.1282 0.337 0.858
23 6 1 0.448 0.1346 0.249 0.807
Groupe=P
1 21 2 0.9048 0.0641 0.78754 1.000
2 19 2 0.8095 0.0857 0.65785 0.996
3 17 1 0.7619 0.0929 0.59988 0.968
4 16 2 0.6667 0.1029 0.49268 0.902
5 14 2 0.5714 0.1080 0.39455 0.828
8 12 4 0.3810 0.1060 0.22085 0.657
11 8 2 0.2857 0.0986 0.14529 0.562
12 6 2 0.1905 0.0857 0.07887 0.460
15 4 1 0.1429 0.0764 0.05011 0.407
17 3 1 0.0952 0.0641 0.02549 0.356
22 2 1 0.0476 0.0465 0.00703 0.322
23 1 1 0.0000 NaN NA NA
> plot(s, lty=c(1,3), xlab="Time", ylab="Survival Probability")

> legend(25, 1.0, c("6MP", "P") , lty=c(1,3) )
> temp=summary(survfit(Surv(Temps,Statut)~Groupe,type="fh",data=Donnees))
1.0
6MP
P
0.8
Survival Probability
0.6
0.4
0.2
0.0
0 5 10 15 20 25 30 35
Time
3.2 Estimation de la fonction de survie par la méthode

actuarielle
La méthode actuarielle est la première méthode d’analyse de survie à voir le jour en 1912
(voir [1]) en tant que théorie statistique. Elle est utile lorsque l’on a beaucoup d’évènements
observés (beaucoup de t∗i ) car le graphique de Kaplan-Meier devient illisible. Voici les diffé-
rentes étapes de construction de l’estimateur par la méthode actuarielle. L’échelle des temps
est divisée en k intervalles de temps.
⋆ Soient les intervalles [0, a 1 [, . . ., [a j−1 , a j [,. . .,[a k−1 , +∞[. Pour tout t ∈ [a j−1 , a j [,
S ( t) = P( X ≥ t)
= P( X ≥ t| X ≥ a j−1 )P( X ≥ a j−1 ).
⋆ On note Q j la probabilité d’être vivant en a j sachant qu’on était vivant en a j−1 :
Q j = P( X ≥ a j | X ≥ a j−1 ).
Pour estimer Q j , il faut déterminer dans [a j−1 , a j [ le nombre e j de sujets exposés au

risque de décès et le nombre m j−1 de sujets décédés :
m j−1
qj = 1− .
ej
3.2. ESTIMATION DE LA FONCTION DE SURVIE PAR LA MÉTHODE ACTUARIELLE31
• Si dans [a j−1 , a j [, il n’y a aucune donnée censurée alors le nombre n j de sujets
vivants en a j est égal au nombre n j−1 de sujets vivants en a j−1 moins le nombre
m j−1 de sujets décédés dans [a j−1 , a j [ :
n j = n j−1 − m j−1 ⇐⇒ e j = n j−1 = n j + m j−1 .
• Si dans [a j−1 , a j [, il y a des données censurées, alors ces données correspondent

à des sujets qui ne sont présents que sur une partie de l’intervalle. Ces sujets ne
contribuent que pour une fraction au nombre de sujets exposés au risque de decès
dans [a j−1 , a j [. On suppose que les censures sont uniformément réparties dans l’in-
tervalle, c’est à dire que chaque individu censuré de [a j−1 , a j [ compte pour moitié.
Ainsi, l’hypothèse actuarielle suppose que le nombre de sujets exposś au risque de
décès dans [a j−1 , a j [ est
c j−1
e j = n j−1 − .
2
Ainsi, on obtient donc

m j−1
qj = 1− .
ej
⋆ L’estimateur de la fonction de survie par la méthode actuarielle est donné par :
m h−1
µ ¶
Y
SbAC ( t) = 1− .
a h ≤t eh
La variance estimée de SbAC ( t) est :
³ ´ ³ ´2 X m h−1
V
ar SbAC ( t) = SbAC ( t) .
a h ≤ t e h ( e h − m h−1 )
La méthode actuarielle est semblable à la méthode Kaplan-Meier mais les intervalles de

temps ne sont plus déterminés par la survenue des événements. Lles intervalles de temps
sont fixés à priori. Les calculs sont identiques.
Instants Censurés Morts dans Connus Survie Survie

aj dans [a j−1 , a j [ [a j−1 , a j [ vivants conditionnelle Sb(a j )
( c j−1 ) ( m j−1 ) à a j−1 ( n j−1 ) Sb(a j |a j−1 )
Exercice 3.2.1. Les données suivantes correspondent à des temps d’évènement. Les données
pour lesquelles il y a une censure à droite sont indiquées par "+" : 2, 5, 7+ , 4, 6, 9+ , 3, 5+ , 8, 10,
13+ , 6, 11, 4+ , 12+ , 4. On considère maintenant les intervalles [0, 4[, [4, 8[, [8, ∞[. Construisez
l’estimateur de la fonction de survie selon la méthode actuarielle.
3.3 Estimation non paramétrique de la fonction de ha-

sard intégrée
3.3.1 Estimateur de Breslow
³ ´
On a H X ( t) = − ln S X ( t) . si l’on veut estimer H X ( t), une méthode consiste à utiliser l’es-
timatuer de Kaplan-Meier de S X ( t) noté ici SbK M . On obtient alors :
 X ³ mi ´
−
 ln 1 − si t ≥ t∗1
ni
³ ´
b (1) ( t) = − ln SbK M
H = i : t∗i ≤ t
t < t∗ .

0
1
b (1) ( t) est
Un estimateur de la variance de H
³ ´
b (1) ( t) =
X mi
Var H .
i : t∗ ≤ t i i − m i )
i
n ( n
3.3.2 Estimateur de Nelson-Aalen

Le risque cumulé est défini par :
Z t Z t f ( u)
H ( t) = h( u) du = du.
0 0 S ( u)
Ici, f , S et h sont respectivement la densité de probabilité, la fonction de survie et la fonction

de risque instantané d’une variable de durée.
Définition 3.3.1. L’estimateur de Nelson-Alen de H ( t) est donnée par

X mi
b (2) ( t) =
H .
i : t∗ ≤ t n i
i
On admettra que la variance estimée de l’estimateur de Nelson-Aalen est

³ ´ X mi
V
ar Hb (2) ( t) = .
2
i : t∗ ≤ t n i i
Remarque 3.3.1. On montre que, sous certaines conditions, l’estimateur de Nelson-Aalen est
uniformément consistant, asymptotiquement normal et asymptotiquement sans biais.
3.4 Estimateur de Fleming-Harington de S X

b (2) :
On peut définir un estimateur de la fonction de survie S X à partir de H
³ ´
b (2) ( t) =
Y −m /n
SbF H ( t) = exp − H e i i.
i : t∗ i ≤ t
Un estimateur de la variance de SbF H ( t) est

³ ´ ³ X mi ´ X mi
V
ar SbF H ( t) = exp − 2 × 2
.
i : t∗ ≤ t n i i : t∗ ≤ t n i
i i
3.5. COMPARAISON DES DURÉES DE VIE DE DEUX GROUPES INDÉPENDANTS 33
3.5 Comparaison des durées de vie de deux groupes in-

dépendants
On souhaite comparer la survie de deux groupes. Notons S 1 et S 2 les fonctions de survie
des groupes 1 et 2 respectivement. On souhaite tester l’hypothèse H0 : S 1 = S 2 . S’il n’y a pas
de censure, on peut utiliser le test de Kolmogorov-Smirnov, le test de la somme des rangs, le
test de Mann-Whitney.
• Soit t∗(1) < . . . < t∗(k) les temps de décès ordonnés des deux groupes réunis.
• A chaque t∗( i) , on désigne par d i j le nombre de décès et r i j le nombre d’individus à
risque dans le groupe j juste avant t∗( i) .
nombre de décès en t∗( i) Survivant après t∗( i) Total

Groupe 1 d i1 r i1 − d i1 r i1
Groupe 2 d i2 r i2 − d i2 r i2
Total mi ri − mi ri
Sous l’hypothèse H0 , on doit avoir égalité des proportions de décès dans les deux
groupes et la variable aléatoire D i j qui donne ´ de décès dans le groupe j
³ le nombre
ri j
à l’instant t∗( i) suit la loi Hypergéométrique H r i , m i , ri . Nous avons
ri j ri − mi
E(D i j ) = m i V ar (D i j ) = m i r i1 r i2 r 2i .
ri ri − 1
De plus,
D i j − E(D i j )
p ≈ N (0, 1).
var (D i j )
• La varible de décision est
ri j 2
hP ³ ´i
k
i =1 ω i di j − mi
ri
Uj = ≈ χ2 (1) (3.5.1)
Pk
ω 2 m r i −m i r i1 r i2
i =1 i i r i −1 r 2i
Remarque 3.5.1. • Test du log-rang : w i = 1. Dans ce cas, le numérateur de la statistique

de test (3.5.1) est le carré de la différence entre le nombre de décès observés et le nombre
de dćès thóriques dans le groupe j sous l’hypothèse nulle :
theorique 2
(D observe
j
−Dj )
Uj = Pk r i −m i r i1 r i2 .
i =1 m i r −1 i r 2i
Le test du log-rank est le test le plus couramment employé, notamment lorsque les deux
fonctions de survie ne se croisent pas.
• Test de Wilcoxon généralisé (ou Breslow) : w i = r i . Les décès précoces ont un poids plus
important.
Exemple 3.5.1. Avec les données de Freireich

r i1 ×m i r i −m i r i1 r i2
t∗( i) d i1 r i1 d i2 r i2 mi ri mi
ri r i −1 r 2i
theorique
D 1observe D1
r i1 ×m i r i −m i r i1 r i2
= ki=1 d i1
P Pk Pk
= i =1 ri i =1 m i r i −1 r 2i
Avec le logiciel R : La fonction survdiff permet de comparer deux ou plusieurs courbes de

survie par le test du logrank.
Chapitre
Modèles semi-paramétrique de
4 Cox
4.1 Introduction
Le modèle à hasards proportionnels est un modèle dans lequel on se donne une fonction
de survie de base S 0 et l’on fait l’hypothèse que la fonction de survie du phénomène observé
est de la forme
³ ´θ
S ( t |θ ) = S 0 ( t ) où le paramètre θ > 0 est inconnu.
La fonction densité est

f ( x|θ ) = θ f 0 ( t)S 0θ−1 ( t).
La fonction de hasard est

f ( t |θ ) f 0 ( t)
h ( t |θ ) = =θ = θ h 0 ( t)
S ( t |θ ) S 0 ( t)
avec
f 0 ( t)
h 0 ( t) = .
S 0 ( t)
′
Le modèle à hasards proportionnels est dit de Cox si θ = e Z β avec Z = ( Z 1 , . . . , Z p )′ un vecteur
de p variables explicatives de la durée de vie et β = (β1 , . . . , β p )′ le vecteur des paramètres du
modèle. Le modèle de régression de Cox intègre donc des variables explicatives pour modéliser
l’effet de ces variables sur la distribution de la durée de vie.
Le modèle de Cox postule donc que la fonction de hasard pour l’individu i peut s’écrire :
′
h t | Z i , β = h 0 ( t) e β Z i
¡ ¢
où
p
• Z i = ( Z 1i , . . . , Z i ) est le vecteur de covariables pour l’individu i ;
• β = (β1 , . . . , β p )′ ∈ R p est inconnu ; le paramètre β j représente l’effet de la covariable Z j
sur la survie ;
• h 0 ( t) est une fonction non négative, indépendante de Z appelée risque de base ; cette
fonction est la même pour tous les individus ; aucune supposition paramétrique n’est
faite sur cette fonction et c’est la partie non-paramétrique du modèle.
′
• la fonction eβ Z i est le risque relatif et constitue la partie paramétrique du modèle ;
35
36 CHAPITRE 4. MODÈLES SEMI-PARAMÉTRIQUE DE COX
h( t| Z i )
Si l’on a deux individus, l’un caractérisé par Z i et l’autre par Z s alors le rapport h( t| Z s ) =
β′ ( Z i −Zs )
e mesure le risque relatif à tout moment t de connaître l’évènement pour l’individu
i par rapport au risque pour l’individu s. On remarque que ce rapport est constant dans le
temps.
Remarque 4.1.1. L’interprétation est faite en fixant les autres variables. Soit Z = ( Z 1 , . . . , Z p )′
le vectuer des covariables. Considérons la covariable Z 1 .
— Si Z 1 est une variable qualitative, par exemple
(
1 1 si l’individu est un homme
Z =
0 si l’individu est une femme
Soient deux individus i et s tels que
Z i = (1, Z 2 , . . . , Z p )′ Z = (0, Z 2 , . . . , Z p )′ .
L’individu i est un homme et l’individu s est une femme. Nous avons

³ ´
2 p
h( t | Z i ) h 0 ( t) exp β1 × 1 + β2 Z + . . . + β p Z
= ³ ´ = eβ1
h( t | Z s ) h ( t) exp β × 0 + β Z 2 + . . . + β Z p
0 1 2 p
eβ1 est le rapport de risque entre un homme et une femme toutes les choses égales par
ailleurs :
• si β1 > 0, eβ1 > 1 et le risque que l’événement d’intérêt se produise est plus élevé chez
les hommes que chez les femmes ;
• si β1 < 0, eβ1 < 1 et le risque que l’événement d’intérêt se produise est plus faible chez
les hommes que chez les femmes ;
• si β1 = 0, eβ1 = 1 et le risque que l’événement d’intérêt se produise est le même chez
les hommes que chez les femmes.
— Si Z 1 est une variable continue, β1 peut être interprèté en terme de rapport de risque
quand la variable Z 1 augmente d’une unité :
³ ´
h 0 ( t) exp β1 × ( Z 1 + 1) + β2 Z 2 + . . . + β p Z p
³ ´ = eβ1
h 0 ( t) exp β1 Z + β2 Z + . . . + β p Z
1 2 p
• si β1 > 0, eβ1 > 1, le risque que l’événement d’intérêt se produise augmente quand Z 1
augmente (et diminue quand Z 1 diminue) ;
• si β1 < 0, eβ1 < 1 et le risque que l’événement d’intérêt se produise augmente quand
Z 1 diminue (et diminue quand Z 1 augmente) ;
• si β1 = 0, eβ1 = 1 et la variable Z 1 n’a pas d’impact sur le risque instantané.
L’objet est d’estimer le paramètre β et la fonction de survie de base h 0 ( t).
Remarque 4.1.2. Nous avons les fonctions ci-dessous.

′
• Fonction de hasard : h X ( t | Z, β) = h 0 ( t) e Z β .
′
• Fonction de hasard cumulé : H X ( t | Z, β) = H0 ( t) e Z β .
Z′ β
• Fonction de survie : S X ( t | Z, β) = e−H0 ( t) e .
Z ′ β(1− H0 ( t))
• Densité de probabilité : f X ( t | Z, β) = h 0 ( t) e .
4.2. ESTIMATION DE β LORSQUE H0 EST CONNUE 37
4.2 Estimation de β lorsque h 0 est connue

On observe (T1 , ∆1 ), . . . , (T n , ∆n ) où
— ∆ i = 1 X i ≤C i , T i = min( X i , C i )
— X 1 , . . . , X n sont i.i.d. de densité f X (·, β)
— C 1 , . . . , C n sont i.i.d. de densité f C (·, β)
— ( X 1 , . . . , X n ) et (C 1 , . . . , C n ) sont indépendants.
La vraisemblance est donnée par
¢ Yn ³ ´δ i ³ ´1−δ i
L ( t 1 , δ1 ), . . . , ( t n , δn ), β = f X ( t i , β)S C ( t i , β) f C ( t i , β)S X ( t i , β)
¡
.
i =1
Dans le cas d’une censure non informative, la vraisemblance est
¢ Yn ³ ´δ i ³ ´1−δ i
L ( t 1 , δ1 ), . . . , ( t n , δn ), β ∝ f X ( t i , β) S X ( t i , β)
¡
i =1
n ³
Y ´δ i
= h X ( t i , β) S X ( t i , β)
i =1
n ³ ′
´δ i Z′ β
h0 ( t i ) e Z i β e− H0 ( t i ) e
i
Y
=
i =1
La log-vraisemblance est donnée par
³ ¡ n
¢´ X ³ ´ Xn ′
ln L ( t 1 , δ1 ), . . . , ( t n , δn ), β = δ i ln( h 0 ( t i )) + Z ′i β − H0 ( t i ) e Z i β .
i =1 i =1
L’estimateur du maximum de vraisemblance est solution de :

³ ¡ ¢´
∂ ln L ( t 1 , δ1 ), . . . , ( t n , δn ), β n ³ ′
´
δ i Z ik − H0 ( t i ) Z ik e Z i β = 0
X
= k = 1, . . . , p.
∂βk i =1
Exemple 4.2.1. Le modèle de Weibull. La fonction de hasard de base est h 0 ( t) = α tα−1 et la

fonction de hasard cumulé est H0 ( t) = tα . La fonction de hasard du modèle à hasard propor-
′
tionnel est h X ( t | Z, β, α) = e Z β α tα−1 . On suppose ici que les paramètres inconnus sont α et β.
La log-vraisemblance est donnée par :
³ ¡ ¢´ n n ³ ´ Xn ′
δ i (α − 1) ln( t i ) + Z ′i β − tαi e Z i β
X X
ln L ( t 1 , δ1 ), . . . , ( t n , δn ), β = ln(α) δ i +
i =1 i =1 i =1
Les estimateurs α
b et βb son sont solutions du système :
³ ¡ ¢´
∂ ln L ( t 1 , δ1 ), . . . , ( t n , δn ), β n n ′
δ i Z ik − tαi Z ik e Z i β = 0
X X
= 0≤k≤ p
∂βk i =1 i =1
³ ¡ ¢´
∂ ln L ( t 1 , δ1 ), . . . , ( t n , δn ), β 1X n n n ′
ln( t i ) tαi e Z i β = 0.
X X
= δi + δ i ln( t i ) −
∂α α i=1 i =1 i =1
Le système est résolu par des méthodes numériques.

4.3 Estimation de β lorsque h 0 est inconnue

On observe (T1 , ∆1 ), . . . , (T n , ∆n ) où
— ∆ i = 1 X i ≤C i , T i = min( X i , C i )
— X 1 , . . . , X n sont i.i.d. de densité f X (·, β)
— C 1 , . . . , C n sont i.i.d. de densité f C (·, β)
— ( X 1 , . . . , X n ) et (C 1 , . . . , C n ) sont indépendants.
La vraisemblance est donnée par
¢ Yn ³ ´δ i ³ ´1−δ i
L ( t 1 , δ1 ), . . . , ( t n , δn ), β = f X ( t i , β)S C ( t i , β) f C ( t i , β)S X ( t i , β)
¡
.
i =1
Dans le cas d’une censure non informative, la vraisemblance est
¢ Yn ³ ´δ i ³ ´1−δ i
L ( t 1 , δ1 ), . . . , ( t n , δn ), β ∝ f X ( t i , β) S X ( t i , β)
¡
i =1
n ³ ′ ′
´δ i ³ Z ′ β ´1−δ i
h 0 ( t i ) e Z i β e Z i β H0 ( t i ) e− H0 ( t i ) e
i
Y
=
i =1
Cette fonction de vraisemblance ne peut pas être maximisée lorsque h 0 et H0 restent incon-
nue. Cox a proposé en 1972 une fonction de vraisemblance partielle qui ne dépend pas de h 0 .
Soient 0 = t∗0 < t∗1 < . . . < t∗k les temps de décès ordonnés. Définissons
n o
C i = ensemble des censures entre t∗i−1 et t∗i
n o
D i = ensemble des décès à l’instant t∗i
pour tout i = 1, . . . , k. La connaissance de ( t i , δ i ), i = 1, . . . , n est équivalente à celle de (C i , D i )

i = 1, . . . , k. Ainsi, nous cherchons β maximisant
³ ´ ³ ´
P (C i , D i ), i = 1, . . . , k = P C 1 ∩ D 1 ∩ . . . ∩ C k ∩ D k
= P(C 1 ) × P C 1 | D 1 × P(C 2 | C 1 ∩ D 1 ) × P(D 2 | C 1 ∩ C 2 ∩ D 1 )
¡ ¢
× P(C 3 | C 1 ∩ C 2 ∩ D 1 ∩ D 2 ) × P(D 3 | C 1 ∩ C 2 ∩ C 3 ∩ D 1 ∩ D 2 )
×...
× P(C k | C 1 ∩ . . . ∩ C k−1 ∩ D 1 ∩ . . . ∩ D k−1 )
× P(D k | C 1 ∩ . . . ∩ C k ∩ D 1 ∩ . . . ∩ D k−1 )
k k
P D i | C 1 ∩ . . . ∩ C i ∩ D 1 ∩ . . . ∩ D i−1 ) P(C i | C 1 ∩ . . . ∩ C i−1 ∩ D 1 ∩ . . . ∩ D i−1 )
Y ¡ ¢Y
=
i =1 i =1
Nous remarquons aussi que le complementaire R i de C 1 ∩ . . . ∩ C i ∩ D 1 ∩ . . . ∩ D i−1 décrit la

population à risque juste avant l’instant de décès t∗i (vivants et non censurés). L’idée de base
de la vraisemblance partielle de Cox est de supposer que les probabilités conditionnelles des
censures ne sont pas informatives pour estimer β. Ce qui nous amène à ignorer dans la vrai-
semblance le terme associé à la censure pour ne conserver que :
³ ´ Yk
P (C i , D i ), i = 1, . . . , k ≍ P Di | Ri
¡ ¢
i =1
4.3. ESTIMATION DE β LORSQUE H0 EST INCONNUE 39
4.3.1 Vraisemblance partielle : temps de décès distincts
Nous supposons qu’il n’y a pas d’ex aequo (temps de décès distincts), les événements D i
sont des singletons, D i = { j i },
h X ( t∗i | Z j i , β)
P( D i | R i ) = n
1 t j ≥ t∗ h X ( t∗i | Z j , β)
X
i
j =1
Z ′j β
h 0 ( t∗i ) e i
= n
Z ′j β
1 t j ≥ t∗ h 0 ( t∗i ) e
X
i
j =1
Z ′j β
e i
= n
X Z ′j β
1 t j ≥ t∗ e
i
j =1
Définition 4.3.1. La vraisemblance partielle de Cox est définie par
′
eβ Z j i
′
k
Y n ³
Y eβ Z i ´δ i
L Cox (β) = n
= n
′ ′
i =1
1{ t j ≥ t∗ } eβ Z j i =1
1{ t j ≥ t ∗ } e β Z j
X X
i i
j =1 j =1
Les hypothèses de Cox sont

— la censure et la variable de durée sont indépendantes ;
— la censure est non informative : elle ne renseigne pas sur la loi de X et sa densité ne
dépend pas de β.
— Seul l’ordre des événements importe et non la date précise.
— Hypothèse des temps distincts (durée de vie continue).
On montre que cette vraisemblance partielle a les mêmes propriétés d’une vraisemblance
exacte.
4.3.2 Vraisemblance partielle : temps de décès égaux.

, D i = { j : t j = t∗i , δ i = 1} l’ensemble des individus
Soient d i le nombre de décès à l’instant t∗i X
∗
dont le temps de décès est égal à t i et S i = Z j . La vraisemblance proposée par Breslow
j ∈D i
(1974) est :
³ ´
k
Y exp β′ S i
L Bres (β) = n
hX id i .
i =1
1{ t j ≥ t∗ } exp(β′ Z j )
i
j =1
4.3.3 Maximisation de la vraisemblance partielle

Pour maximiser la vraisemblance partielle et ainsi déterminer les paramètres β, il est
fréquent d’utiliser l’algorithme de Newton-Raphson. L’estimateur ainsi obtenu est convergent
et asymptotiquement normal
4.4 Tests dans le modèle de Cox

4.4.1 Tester l’hypothèse H0 : g(β) = 0
On se propose de tester une hypothèse H0 : g(β) = 0 contre H1 : g(β) ̸= 0 où g est définie
sur R p à valeurs dans Rs . Trois tests asymptotiques sont classiquement utilisés.
4.4.1.1 Test du rapport de vraisemblance
L’idée est de comparer le maximum de vraisemblance L(βb) et le maximum de vraisem-

blance L(βb0 ) sous l’hypothèse H0 et d’accepter l’hypothèse nulle si ces 2 valeurs sont proches.
La variable de décision est ³ ¡ ´
T RV = −2 ln L(βb0 ) − L(βb)
qui converge en loi vers la loi de khi-deux à s degrés de liberté notée χ2 ( s). La région critique
du test au niveau α est n o
W = T RV > χ2 ( s)1−α .
4.4.1.2 Test de Wald
L’idée de Wald est que si g(βb) ≃ 0 alors on accepte H0 . La variable de décision est
³ ´′ h³ ∂ g ´ ³ ∂ g ´′ i−1 ³ ´
T W = n g(β̂) (β̂) I −1 (β̂) (β̂) g(β̂)
∂β ∂β
où la matrice  ∂g
1 (β) ∂ g 1 (β)

∂β1
... ∂β p 
∂g 
.. .. ..
=
 
∂β  . . . 
∂ g s (β) ∂ g s (β)

∂β1
... ∂β p
est de rang s pour tout β. Sous l’hypothèse H0 , T W converge en loi vers la loi de khi-deux à s
degrés de libertés notée χ2 ( s). La région critique du test au niveau α est
n o
W = T W > χ2 ( s)1−α .
4.4.1.3 Test du score

La variable de décision est
1 ³ ∂ ln(L(βb0 )) ´′ −1 b0 ³ ∂ ln(L(βb0 )) ´
TS = I (β ))
n ∂β ∂β
converge en loi vers la loi de khi-deux à s degrés de libertés notée χ2 ( s). La région critique du
test au niveau α est n o
W = T S > χ2 ( s)1−α .
4.4.2 Tester l’adéquation du modèle de Cox

L’hypothèse de hasards proportionnels suppose qu’avec des covariables constantes dans
le temps, le ratio de risques entre deux personnes est aussi constant dans le temps. Dans le
cas multivarié, cette hypothèse doit tenir pour toutes les covariables. Il convient donc d’en
vérifier la validité avant toute interprétation des résultats.
4.5. MISE EN OEUVRE SUR R 41
4.4.2.1 Représentations graphiques
Dans le cas de variables qualitatives ou discrètes présentant un nombre restreint de va-
leurs différentes, un test graphique permet de vérifier simplement la validité de l’hypothèse
Z′ β
de hasards proportionnels. Puisque S X ( t | Z, β) = e−H0 ( t) e , nous avons
ln − ln(S X ( t | Z, β)) = ln( H0 ( t)) + Z ′ β.

¡ ¢
Il est possible de vérifier si les courbes t 7→ ln − ln(S X ( t | Z, βb)) sont approximativement

¡ ¢
translatées l’une de l’autre, c’est à dire, ont un écart constant au cours du temps, pour des
individus ayant des modalités différentes pour les variables explicatives. Dès lors, les repré-
sentations graphiques des estimations de Kaplan-Meier des fonctions de survie pour chaque
valeur Z distincte doivent être des courbes approximativement parallèles sur une échelle log-
log complémentaire.
Dans le cas continu, l’approche est similaire ; elle consiste à partitionner la variable et à la
traiter comme une variable qualitative.
4.4.2.2 Résidus de Schoenfeld

Pour calculer le résidu de Schoenfeld d’une variable Z donnée, on compare sa valeur à une
date t i pour un individu i à la valeur moyenne parmi les individus encore à risques à cette
date :
′
Z ik eβ Z j
X
j ∈R i
³ ´
r ik = δ i Z ik − ; 1 ≤ i ≤ n, 1 ≤ k ≤ p
β′ Z j
X
e
j ∈R i
avec
— R i l’ensemble des individus qui sont encore dans la base au moment du décès de l’in-
dividu i ;
— Z ik la valeur de la kième covariable associée à l’individu i .
Nous définissons alors les résidus standardisés r ∗ik qui sont les résidus divisés par l’écart-type
des résidus. Si l’hypothèse des risques proportionnels est vérifiée, alors les résidus doivent
être distribués de la même manière au cours du temps. Une façon de le vérifier est de tracer,
pour chaque variable Z k , le nuage des points ( t i , r ∗ik ), pour les individus décédés. Si aucune
tendance n’est observée, l’hypothèse de hasard proportionnel est acceptée.
Un test statistique consiste à tester la nullité du coefficient de corrélation entre les r ∗ik et t i .
Il est également possible de réaliser une régression linéaire
r ∗ik = β0 + β1 t i + ε i
et tester la nullité du coefficient β1 .
4.5 Mise en oeuvre sur R

4.5.1 Estimation
Nous utilisons la base de données pbc disponible dans le package survival. Il s’agit d’une
base constituée au cours d’une expérience aléatoire menée entre 1974 et 1984, pour étudier
l’efficacité de la D-pénicillamine sur la cholangite (ou cirrhose) bilaire primitive (Primary
Biliary Cirrhosis) du foie. Cette maladie dégénérative, probablement autoimmune, engendre
une inflammation des voies biliaires pouvant conduire au développement d’une cirrhose du
foie, voire à la mort du patient.
> data(pbc,package="survival")
> head(pbc)
id time status trt age sex ascites hepato spiders edema bili chol
1 1 400 2 1 58.76523 f 1 1 1 1.0 14.5 261
2 2 4500 0 1 56.44627 f 0 1 1 0.0 1.1 302
3 3 1012 2 1 70.07255 m 0 0 0 0.5 1.4 176
4 4 1925 2 1 54.74059 f 0 1 1 0.5 1.8 244
5 5 1504 1 2 38.10541 f 0 1 1 0.0 3.4 279
6 6 2503 2 2 66.25873 f 0 1 0 0.0 0.8 248
albumin copper alk.phos ast trig platelet protime stage
1 2.60 156 1718.0 137.95 172 190 12.2 4
2 4.14 54 7394.8 113.52 88 221 10.6 3
3 3.48 210 516.0 96.10 55 151 12.0 4
4 2.54 64 6121.8 60.63 92 183 10.3 4
5 3.53 143 671.0 113.15 72 136 10.9 3
6 3.98 50 944.0 93.00 63 NA 11.0 3
La base comporte 418 observations de patients, dont 312 ont participé à une expérience
aléatoire afin de tester la validité du médicament (drug : 1 = D-pénicillamine ; 2 = placebo).
Les 106 autres patients ont accepté, en parallèle de ce protocole, de fournir plusieurs infor-
mations et de se faire suivre régulièrement. Qu’ils participent ou non à l’expérience, le suivi
des patients prend fin en juillet 1986. Au cours de la période d’étude, certains patients ne dé-
velopperont pas de complications (status=0), se feront tranplanter un nouveau foie (status=1)
ou décèderont (status=2). La variable time précise ainsi le nombre de jours écoulés entre le
début du suivi du patient et juillet 1986, la date de la transplantation ou du décès. Dans ce
document, nous nous intéressons à la durée de vie avant le décès ; les personnes greffées se-
ront considérées comme censurées. Sous R, il faut pour cela déclarer un objet de "survie" avec
la fonction Surv comme suit Surv(time,status==2).
La maladie, peu fréquente, touche principalement des femmes (elles constituent 89% des
patients de l’échantillon) et débute en moyenne vers 50 ans. Elle peut ne pas causer de symp-
tômes dans sa phase initiale de telle sorte que l’âge est souvent endogène à la durée de la ma-
ladie. Néanmoins, plusieurs examens peuvent être pratiqués pour diagnostiquer la maladie,
notamment des analyses sanguines. Parmi les anomalies qui peuvent alors être constatées,
on note, par exemple, une présence d’autant plus élevée de bilirubine (bili en mg/dl) dans le
sang que la maladie est en phase avancée, et des altérations du taux d’albumine (albumin
en mg/dl) et de taux de prothrombine (protime). Enfin, la présence d’oedèmes plus ou moins
sévères est aussi le signe d’une maladie déjà avancée (edema : 0 = absence, 0.5 = modéré,
1 = présent malgré l’utilisation d’un traitement diurétique). Toutes ces informations sont
présentes dans la base de données et enregistrées au début du suivi, de telle sorte que les
covariables du modèle sont constantes dans le temps.
L’estimation du modèle de Cox peut être effectuée sous R par la fonction coxph du package
survival, dont la syntaxe complète est donnée ci-dessous.
> fit.pbc <- coxph(formula = Surv(time,status==2) ~ age

+ + factor(edema) + log(bili) + log(protime)
+ + log(albumin),
+ data = pbc,
+ ties = "efron")
> summary(fit.pbc)
Call:
coxph(formula = Surv(time, status == 2) ~ age + factor(edema) +
log(bili) + log(protime) + log(albumin), data = pbc, ties = "efron")
n= 416, number of events= 160

(2 observations deleted due to missingness)
coef exp(coef) se(coef) z Pr(>|z|)

age 0.040453 1.041283 0.007712 5.246 1.56e-07 ***
factor(edema)0.5 0.281884 1.325625 0.225233 1.252 0.210743
factor(edema)1 1.012472 2.752396 0.289755 3.494 0.000475 ***
log(bili) 0.859048 2.360912 0.083244 10.320 < 2e-16 ***
log(protime) 2.359929 10.590195 0.773143 3.052 0.002270 **
log(albumin) -2.515764 0.080801 0.652616 -3.855 0.000116 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
exp(coef) exp(-coef) lower .95 upper .95

age 1.0413 0.96035 1.02566 1.0571
factor(edema)0.5 1.3256 0.75436 0.85252 2.0613
factor(edema)1 2.7524 0.36332 1.55981 4.8568
log(bili) 2.3609 0.42357 2.00550 2.7793
log(protime) 10.5902 0.09443 2.32704 48.1953
log(albumin) 0.0808 12.37607 0.02249 0.2904
Concordance= 0.835 (se = 0.017 )

Likelihood ratio test= 231.9 on 6 df, p=<2e-16
Wald test = 238.9 on 6 df, p=<2e-16
Score (logrank) test = 327.5 on 6 df, p=<2e-16
— Le taux de bilirubine a été intégré au modèle sous la forme logarithmique. Chaque

point supplémentaire de log(bili) est associé, toutes choses égales par ailleurs, à un
risque journalier de décès 2,4 fois (exp(coef)=2.36) supérieur, quel que soit le nombre
de jours passés depuis le diagnostic.
— Etre âgé au moment du diagnostic est aussi associé à un risque de décès plus im-
portant. Ainsi, chaque année supplémentaire est associée à une augmentation de 4%
(exp(coef)=1.04) du risque journalier de décès.
— La présence d’oedèmes est mesurée par une variable qualitative. Une personne pré-
sentant des oedèmes sévères a un risque journalier de décès 2,75 fois plus élevé que
celui d’une personne sans oedème (toutes choses égales par ailleurs). Le ratio de risque
associé à un accrois- sement du taux de prothrombine est le plus élevé ; une augmenta-
tion d’un point du (log) du taux de prothrombine est associé, toutes choses égales par
ailleurs, à un risque de décès 10.6 fois plus élevé.
— Seul le taux d’albumine est associé à un risque moindre. En effet, l’albumine étant pro-
duit en partie par le foie, un taux faible en révèle le disfonctionnement. Ainsi, chaque
point perdu de log(albumin) est associé un risque journalier de décès 12 fois supérieur
(exp(-coef)=12.27).
4.5.2 Validation de l’hypothèse de proportionnalité
4.5.2.1 Représentations graphiques
> surv.edema <- survfit(formula = Surv(time,status==2) ~ factor(edema), data=pbc)
> plot(surv.edema, fun="cloglog",lty = c(1:3),xlab = "Time", ylab = "Log(-Log(H(t)))")

> legend("bottomright",legend=c("edema=0","edema=0.5","edema=1"),lty=c(1:3))
1
0
−1
Log(−Log(H(t)))
−2
−3
−4
−5
edema=0
edema=0.5
edema=1
−6
50 100 200 500 1000 2000 5000
Time
Dans le cas continu, l’approche consiste à partitionner la variable et à la traiter comme

une variable qualitative. Dans notre exemple, l’âge est partitionné en 3 classes à l’aide de la
fonction cut.
> strata.age <- cut(pbc$age,breaks=c(20,40,60,Inf))

> surv.age <- survfit(formula = Surv(time,status==2) ~ strata.age, data=pbc)
> plot(surv.age, fun="cloglog",lty = c(1:3),xlab = "Time", ylab = "Log(-Log(H(t)))")
> legend("bottomright",legend=c("age=(20,40]","age=(40,60]","age=+60"),lty=c(1:3))
1
0
−1
Log(−Log(H(t)))
−2
−3
−4
age=(20,40]
−5
age=(40,60]
age=+60
50 100 200 500 1000 2000 5000
Time
Chapitre
5 Tables de mortalité
5.1 Introduction
Une table de mortalité est un outil de mesure des probabilités de décès, de survie et de
l’espérance de vie selon l’âge et le sexe dans une population donnée. Il existe deux types de
tables de mortalité :
— La table de mortalité réglementaire : il s’agit de tables élaborées le plus souvent
par les pouvoirs publiques ou par des organismes privés à partir des statistiques de
décès observées sur la population.
— La table de mortalité d’expérience : elle est construite par et pour les assureurs.
L’assureur utilise les tables de mortalités afin de quantifier les risques.
5.2 Table de mortalité réglementaire
En France, les tables de mortalité réglementaires sont établies par l’Institut National de
la Statistique et des Etudes Economiques (INSEE) sur la base de la population française
globale. Parmi ces tables, certaines correspondent à des tables de génération et d’autres à des
tables du moment.
— La table de mortalité du moment : une table de mortalité du moment s’établit sur

une génération fictive fixée dans le temps ; elle compte 100000 individus soumis aux
conditions de mortalité applicables au moment choisi. Pour chaque âge, sont données
les statistiques suivantes : nombre de décès, nombre de survivants, nombre d’années
vécues, nombre d’années restant à vivre, et espérance de vie résiduelle.
— La table de mortalité de génération. La table de mortalité de génération ne prend

pas en compte une génération fictive mais une génération particulière (la génération
1900 par exemple), en donnant les mêmes statistiques. Son inconvénient est qu’il faut
attendre l’extinction complète d’une génération pour en appliquer les probabilités de
décès (il ne serait ainsi pas possible de réaliser une table de mortalité de la génération
1970, à moins d’avoir recours à des projections de mortalité).
46
5.3. TABLE DE MORTALITÉ D’EXPÉRIENCE 47
5.3 Table de mortalité d’expérience

Les assureurs peuvent construire des tables de mortalité d’expérience depuis 1993 en
France. Elles permettent de refléter d’avantage le risque réel porté par l’assureur puisqu’elles
sont construites à partir des données du porte-feuille.
5.4 Zone CIMA (Conférence Interafricaine des Marchés

d’Assurance)
Conformément aux résolutions des états généraux de l’assurance vie, le Comité de Suivi a
engagé en juillet 2009 un processus de construction de nouvelles tables de mortalité propres
à la zone CIMA. L’instauration de ces nouvelles tables devrait permettre d’accompagner le
développement du secteur de l’assurance vie dans la zone CIMA et de renforcer sa solidité sur
la base d’instruments de tarification fiables, en adéquation réelle avec les risques couverts.
La réforme envisagée fournira aux compagnies d’assurance vie les moyens d’effectuer une
tarification plus juste du risque viager, à l’aide d’outils techniques appropriés, permettant un
provisionnement suffisant des contrats en portefeuille. Les travaux réalisés au cours de cette
phase ont permis d’obtenir deux jeux de tables de mortalité : les tables CEMAC H et CEMAC
F ainsi que les tables UEMOA H et UEMOA F. En pondérant ces tables par sous région en
fonction du poids de chaque sous région dans l’exposition au risque global, les travaux de
compilation ont permis d’obtenir un jeu de tables uniques pour l’ensemble de la zone CIMA à
savoir les tables CIMA H et CIMA F. La table CIMA H sera utilisée pour la tarification des
garanties en cas de décès. La table CIMA F sera utilisée pour la tarification des contrats en
cas de vie.
5.5 Tables de mortalités propectives

L’objectif des tables de mortalité prospectives est de tenir compte des évolutions de la
mortalité au cours du temps.
Définition 5.5.1. Soit x un entier. Le taux de décès brut à l’âge x durant l’année t est défini
par :
Nombre de décès durant l’année t d’individus d’âge x à leur anniversaire

m( t, x) = .
Nombre moyen de personnes d’âge x durant l’année t
Définition 5.5.2. le taux de mortalité q( t, x) est la probabilité qu’un individu d’âge exact x à
l’instant exact t décède durant l’intervalle de temps [ t, t + 1[.
La force de mortalité (ou fonction de hasard) µ( t, x) (notée aussi classiquement h( t, x) dans les
mod‘eles de durée) est le taux instantané de mortalité, qui vérifie
³ ´
P décéder entre t et t + dt, à l’âge x ≃ µ( t, x) dt.
Si nous supposons que les deux hypothèses suivantes sont vérifiées :

— Hypothèse 1 : Pour tous t, x entiers, µ( t + s, x + u) = µ( t, x), pour tous s, u ∈ [0, 1[,
— Hypothèse 2 : La population est stationnaire, i.e. la répartition par âge reste constante
dans le temps.
48 CHAPITRE 5. TABLES DE MORTALITÉ
Alors nous avons : ³ ´
m( t, x) = µ( t, x) et q( t, x) = 1 − exp − µ( t, x) .
Ce qui implique que ³ ´

µ( t, x) = − ln 1 − q( t, x) .
5.5.1 Diagramme de Lexis

Lors des études de mortalité, il est rare que l’on dispose d’une information exacte sur
les âges au décès et les dates de décès ; ces données sont le plus souvent disponibles sous
forme arrondie, en âge entier et année entière. Afin de déterminer correctement les taux
bruts de mortalité dans ce contexte, on utilise un formalisme particulier, le diagramme de
Lexis. Le diagramme de Lexis est un outil graphique permettant d’étudier l’évolution de la
mortalité en fonction de l’âge et du temps. Dans l’étude de la mortalité, il est important de
noter l’intervention du temps sous trois formes :
• l’âge des individus : cette variable influence évidemment le risque de décès ;
• la date d’observation : le risque de mourir à un âge donné pourra varier d’une année
à l’autre au gré de circonstances telles qu’une épidémie, une guerre. On parle d’effet
de période.
• la génération ou date de naissance : des phénomènes tels que l’amélioration des
conditions sanitaires, les progrès de la médecine conduisent à modifier le risque de
mortalité à un âge donné au cours du temps ; de plus, on peut imaginer que le passé
d’une génération donnée puisse modifier le niveau de sa mortalité future : typique-
ment, une épidémie intervenant à une date t et touchant les gens d’âge x à cette date
peut contribuer à diminuer les taux de décès aux âges supérieurs à x pour cette géné-
ration, en entraînant la mort prématurée des individus les moins résistants.
On dispose ainsi de trois coordonnées pour repérer un événement tel que le décès d’un indi-
vidu :
— l’âge de l’individu concerné par l’événement ;
— la date à laquelle il se produit ;
— le moment de naissance de l’individu concerné par l’événement.
Ces trois données sont évidemment redondantes : seules deux d’entre elles sont en fait né-
cessaires pour repérer l’événement. Néanmoins, les trois deviennent indispensables lorsqu’on
s’intéresse à un groupe d’individus. Le diagramme de Lexis permet le repérage de faits dé-
mographiques en fonction des trois coordonnées date, âge, génération. Il privilégie en fait les
coordonnées “âge” et “date”, qui se voient chacune attribuer un axe.
5.5. TABLES DE MORTALITÉS PROPECTIVES 49
La vie d’un individu est donc représentée par une ligne parallèle à la première bissectrice,
qui coupe l’axe des abscisses en l’année de la naissance et s’arrête au "point mortuaire" dont
les coordonnées sont la date de décès sur l’axe des abscisses et l’âge de décès sur l’axe des
ordonnées.
Les enregistrements des populations se font généralement à trois âges.

• L’âge exact de décès : c’est la différence entre l’instant de décès et l’instant de nais-
sance ; c’est simplement le temps précis qui s’est écoulé entre la naissance et le décès.
Âge exact = Instant de décès - Instant de naissance.
• L’âge révolu correspond à l’âge exact au dernier anniversaire et donc à la partie entière
de l’âge exact.
Age révolu = Age exact au dernier anniversaire = E[Age exact]
• L’âge atteint (dans l’année) est la différence entre le millésime de l’année de décès et
le millésime de l’année de naissance :
Age atteint = Millésime [décès] - Millésime [naissance]
Remarque 5.5.1. On considère un individu né le 1er juillet 2000 à 0h00 et il est décédé le
20 janvier 2002 à 12h00. L’âge exact de cet individu à son décès est de 1 an 6 mois 20 jours
12 heures et 0 seconde. Il a été déterminé en faisant la différence entre le moment du décès
(le moment de référence pour lequel l’âge est établi) et le moment de la naissance (le point de
départ depuis lequel l’âge est décompté). L’âge exact est donc simplement le temps précis qui
s’est écoulé entre la naissance de l’individu et le moment de référence.
Le décès est survenu à l’âge révolu de 1 an ; l’âge révolu correspond donc à l’âge exact
au dernier anniversaire ou, autre définition, à la partie entière de l’âge exact au moment de
référence.
Pour obtenir l’âge au décès en âge atteint, il suffit de retirer le millésime de l’année de
la naissance (2000) de celui où le décès est survenu (2002), ce qui donne 2. En différence de
millésimes, l’âge au décès de l’individu concerné était donc de 2 ans.
L’âge révolu sur un diagramme de Lexis est représenté comme suit : à un instant t, le
nombre de lignes ayant traversé le segment vertical de couleur orange donne le nombre d’in-
dividus ayant x années à l’instant t.
Sur un diagramme de Lexis, l’âge atteint est représenté comme suit : le nombre de lignes
traversant le segment horizontal de couleur orange donne le nombre d’individus ayant l’âge
x entre t et t + 1.
Il est également possible de représenter le nombre de décès par âge atteint. Le nombre de
lignes s’arrêtant dans le carré de couleur orange correspond au nombre de décès d’individus
d’âge x entre t et t + 1.
Dans un diagramme de Lexis, une droite modélise la durée de vie d’un individu né à
l’âge 0 en g et décédé à l’âge x en t. Nous pouvons utiliser les diagrammes de Lexis pour
visualiser les générations à prendre en compte dans le calcul d’un taux de décès par année et
par génération. Pour calculer un taux de décès à l’âge x l’année t, il faut prendre en compte
les individus, qui atteignent le rectangle [ t, t + 1[×[ x, x + 1[.
Nous voyons que cette estimation concerne les individus issus des générations g − 1 et g. L’ex-
position L x,t correspond alors au temps accumulé que passent les individus des générations
g et g − 1 dans le rectangle [ t, t + 1[×[ x, x + 1[. Ce temps est de couleur verte dans le graphique
précédent.
5.5.1.1 Modèles de Lee Carter (1992)

La mortalité est décomposée en deux éléments, l’un propre à l’âge et l’autre tendanciel.
L’objectif est de projeter la composante relative au temps, en extrapolant dans le futur les
tendances passées, sans tenir compte de l’évolution présumée de la mortalité au regard d’ex-
perts (comme les progrès de la médecine, l’apparition de nouvelles maladies, l’évolution du
style de vie,...). On considère µ x ( t) le taux instantané de mortalité à la date t pour l’âge x. Le
modèle de Lee-Carter suppose que
ln(µ t,x ) = α x + β x κ t ,
où
— α x (composante spécifique à l’âge) rend compte du comportement moyen du taux cen-
tral de mortalité (pris en logarithme) au cours du temps ;
— κ t (composante temporelle) traduit quant à elle l’évolution temporelle de la mortalité.
On pourra remarquer que, dans le cadre des projections, c’est la modélisation de ce κ t
qui permettra d’explorer de nouveaux modèles. Chez Lee et Carter (1992), il s’agissait
d’une marche aléatoire et depuis Renshaw et Haberman (2003) il est classiquement
modélisé par un processus ARIMA.
— β x (composante propre à l’âge croisée avec l’effet temporel) décrit l’évolution du taux
central de mortalité (pris en logarithme) à l’âge x relativement aux autres âges
d
ln(µ t,x ) = β x .
dt
Si on observe des µ∗t,x , on considère le modèle
ln(µ∗t,x ) = α x + β x κ t + ε xt .
Pour rendre le modèle identifiable, on impose les contraintes suivantes :

(
t= tm x= xm
X X xn est l’âge min d’observation
κt = 0 βx = 1
t= t n x= x n xm est l’âge max d’observation
On suppose que ε xt est un terme d’erreur qui reflète les particularités propres à l’âge x ou à
la date t qui ne sont pas capturées par le modèle. Par hypothèse, nous avons E(ε xt ) = 0.
Les paramètres (α x , β x , κ t ) sont solution du problème :

X³ ´2 t= tm x= xm
ln(µ∗t,x ) − α x + β x κ t
X X
min sous les contraintes κt = 0 β x = 1.
x,t x,t t= t n x= x n
Nous avons au total 2( x M − xm + 1) + ( t M − t m + 1) paramètres à estimer.
Estimation des paramètres

L’estimation des paramètres se fait en 4 étapes :
1. Estimations de α x .
tM
1
b∗x ( t)).
X
α
bx = ln(µ
t M − t m + 1 t= t m
2. Estimation de κ t et β x . Posons
³ ´
Z = Z xt avec Z xt = ln(µ∗t,x ) − α
bx .
³ ´ v
b = βbx = P 1
³ ´ p ³X ´
β κ b t = λ1
b= κ v1 j u 1
x j v1 j t
j
′ ′
où u 1 (resp. v1 ) est le vecteur propre de Z Z (resp. ZZ ) associé à la plus grande valeur
propre λ1 avec Z = ln(µ bt,x ) − α
bx .
3. On peut améliorer l’estimation en utilisant le fait que l’on souhaite faire coincider
les nombres de décès par âges observés avec les valeurs données par le modèle. Pour
chaque t
xM xM
obs th
= L xt µ∗xt
X X X
D xt = D xt
x= x m x= x m x
xM
obs
L xt eαb x +βx κb t .
X X
D xt =
b
x= x m x
En posant
X³ ´
F (κ) = L xt eαb x +βx κb t − D xt
obs
,
b
on cherche κ tel que F (κ) = 0. Par un algorithme de type Newton-Raphson :
F (k i )
k i+1 = k i − i≥1 k o k.
b
F ′ (k i )
e qui doit être ajusté pour vérifier P t k

On en déduit un deuxième estimateur k e = 0. Nous
obtenons alors
k∗t = k
e − k̄ t
avec
tM
1 X
k̄ t = k.
e
t M − t m + 1 t= t m
Il faut aussi corriger les α
b x pour que la somme α x + β x k t reste inchangée :
α
b x + βbx k
et → α
b x + βbx k̄ t + βbx ( k
e t − k̄ t ) α∗t = α
b x + βbx k̄ t .
5.5.1.2 Modèle log-Poisson

Le modèle de Lee-Carter suppose l’homoscédasticité des résidus, Cette hypothèse est peu
réaliste (notamment aux âges élevés, si on a des effectifs faibles, on a plus d’incertitude). Le
modèle log-Poisson modélise directement le nombre de décès plutôt que le taux instantané
de mortalité. Soit D xt le nombre de décès à l’âge x durant l’année t et L xt l’exposition au
risque. On considère que D xt est une variable aléatoire telle que E(D xt ) = L xt µ xt , avec µ xt =
α x +β x k t
e . La loi de D xt est la loi de Poisson P (L xt µ xt ). En utilisant la méthode du maximum
de vraisemblance et un algorithme de type Newton-Raphson, on obtient
³ 1 X ´X
k∗t = kbt − k
bt β
bx
tM − tm + 1 t x
βb β
bx
β∗x = P α∗x = β
X
bx − k.
b
x βx tM − tm + 1 t
b
5.5.1.3 Modèle log-linéaire

Les modèles de Lee Carter et de log-Poisson ont beaucoup de paramètres. Ceci permet un
bon ajustement des observations, mais peut être un inconvénient pour faire des prédictions
(problème classique de la généralisation en apprentissage statistique). Si nous disposons de
peu de données, nous pouvons préférer des modèles avec moins de paramètres, qui seront
plus robustes en prédiction. Nous pouvons par exemple considérer les modèles log-linéaires.
Par exemple, nous pouvons partir des logits :
³ q
t,x
´
logit( q t,x ) = ln ≃ ln(µ t,x ).
1 − q t,x
L’approximation étant assez fiable, sauf aux âges élevés. Nous considérons alors une régres-
sion standard par rapport au temps t, pour chaque âge x :
logit( q t,x ) = α x + β x t + ε x,t .
Les paramètres α x et β x peuvent être estimés par la méthode des moindres carr és ordinaires.
Chapitre
6 Exercices
Exercice 1. La fonction de survie d’une durée de vie est définie par :

(q
t
1 − 100 0 ≤ t ≤ 100
S ( t) =
0 sinon
1. Quelle proportion de sujets disparaît entre 19 et 36 ans ?

2. Quelle espérance de vie est associée à cette durée de vie ?
3. Quelle est l’espérance de vie résiduelle d’un sujet de trente six ans ?
Exercice 2. Une durée de vie T a pour densité : f ( t) = β2 t exp(−β t)1 t≥0 où β > 0.
1. Déterminez sa fonction de survie.
2. Déterminez le hasard instantané.
³ ´
3. Déterminez la distribution de T − u | T > u pour u > 0.
Exercice 3. T est une durée de vie continue, S ( t) est sa fonction de survie, f ( t) la fonction de
probabilité, h( t) la fonction de hasard. Voici trois hypothèses usuelles valables pour k ∈ N :
— Uniform Death Distribution (UDD) : t 7→ f ( k + t) est constante sur [0, 1[
— Constant Force of Mortality (CFM) : t 7→ h( k + t) est constante sur [0, 1[
1
— Balducci (BAL) : t 7→ est affine sur [0, 1[
S ( k + t)
1. Montrez sous chaque hypothèse il existe λ : R → R telle que λ ◦ S ( k + t) est affine en t
2. Pour x ∈ N et 0 < t ≤ 1, on note t q x = P(T ≤ x + t|T > x) et q x =1 q x
(a) Montrez que sous l’hypothèse UDD : t q x = tq x .
(b) Montrez que sous l’hypothèse BAL : 1 − t q x+ t = (1 − t) q x .
Exercice 4. Voici les durées de vie en jours de 21 patients atteints d’une infection virale : 6,
6, 6, 6+, 7, 9+, 10, 10+, 11+, 13, 16, 17+, 19+, 20+, 22, 23, 25+, 32+, 32+, 34+, 35+
1. Représentez l’estimateur de Kaplan-Meier de la fonction de survie
2. Déterminez et représentez le hasard cumulé issu de l’estimateur de Neslon-Aalen.
55
56 CHAPITRE 6. EXERCICES
Exercice 5. Considérons un groupe de n individus d’âges (θ1 , . . . , θn ) et de durée de maintien
résiduelle ( X 1 , . . . , X n ) indépendantes et marginalement distribuées selon une loi de Pareto
de deuxième espèce :
S i ( t) = θ α
i (t + θi )
−α
t ≥ 0.
1. Soit un individu d’âge θ dans ce groupe. Expliciter sa fonction de hasard h et sa fonc-
tion espérance de vie résiduelle e. Que peut-on en déduire quant à la pertinence du
modèle proposé ?
2. Expliciter la fonction de survie de cet individu conditionnée par le fait qu’il sera en vie
dans x années. Que peut-on en déduire ?
3. Supposons que ce groupe de n individus soit observé jusqu’à son extinction et notons
x = ( x1 , . . . , xn ) les durées de survie observées. Donnez l’estimateur du maximum de
vraisemblance de α.
4. Supposons à présent que le groupe n’est plus observé que pendant c années. Don-
nez l’estimateur du maximum de vraisemblance de α à l’aide des observations t =
( t 1 , . . . , t n ) où t i = min( x i , c)
Exercice 6. On considère les durées (guérison en semaines) de patients à qui l’on a adminis-
tré deux types de traitements :
— Groupe 1 : 5, 6, 6+ , 7, 8, 9+ , 10
— Groupe 2 : 1+ , 2+ , 4, 5, 5+ , 6, 7+
. Tester l’égalité des deux survies des deux groupes à un risque α = 5%.
Exercice 7. Voici la durée de vie de survie en jours de 21 patients atteints d’une infection
virale :
6, 6, 6, 6+ , 7, 9+ , 10, 10+ , 11+ , 13, 16, 17+ , 19+ , 20+ , 22, 23, 25+ , 32+ , 32+ , 34+ , 35+ .
Déterminez et représentez le risque cumulé issu de l’estimateur de Nelson-Aalen.

Exercice 8. On considère une variable aléatoire T décrivant une durée de vie ou de fonc-
tionnement et on note S et h respectivement la fonction de survie et la fonction de hasard
associée.
1. Rappelez le lien entre S et h.
R∞
2. Démontrer que E(T ) = 0 S ( t) dt
3. Donner l’expression de E(T ) dans le cas d’une de Weibull.
4. donner l’expression e′ ( t) = −1 + e( t) h( t) où e( t) désigne l’espérance de vie résiduelle.
Exercice 9. La durée de vie d’un homme T h est distribuée selon la loi exponentielle E (η) ; la
durée de vie de son épouse T f a pour fonction de hasard : λT f ( t) = θ22t , θ > 0. T f et T h sont
indépendantes et T = min(T f , T h ).
1. Montrez que T f est distribuée selon une loi de Weibull.
2. Déterminez la fonction de hasard de T , sa densité et sa fonction de survie.
3. Exprimez en fonction η et θ la probabilité que le mari survive à son épouse.
Exercice 10. Soit X une variable de survie de fonction de survie

1
S ( t, θ ) = θ > 0; ∀ x ≥ 0.
(1 + x)θ
1. Calculer la fonction de hasard h(·, θ ) et la densité f (·, θ ). Que dire du comportement de

la fonction de hasard en focntion de x ≥ 0 ?
57
2. Calculer l’espérance de vie résiduelle :
e θ ( x) = Eθ ( X − x | X > x).
donner la condition sur θ > 0 pour que cette expérence existe.
Exercice 11. Les données suivantes décrites par Freireich (1963) ont été obtenues lors d’un
essai thérapeutique ayant pour but de comparer les durées de rémission (exprimées en se-
maines) de sujets atteints de leucémie selon qu’ils ont reçu de la 6-mercaptopurine (notée
6-MP) ou un placebo. Les données suivies du signe + correspondent à des patients qui ont
été perdus de vue à la date fournie. L’essai a été réalisé en double aveugle, ce qui signifie
que ni le patient, ni le médecin ne sont informés de l’attribution du traitement ou du pla-
Traitement Durée de rémission
cebo 6‘MP 6,6,6,6+ ,7,9+ ,10,10+ ,11+ ,13,16,17+ ,19+ ,20+ ,22,23,25+ ,32+ ,32+ ,34+ , 35+
Placebo 1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23
1. Déterminer l’estimateur de Kaplan-Meier de la fonction de survie dans chacun des

deux groupes de traitement.
2. Comparer les fonctions de survie des deux groupes en utilisant le test du log-rank au
niveau α = 0.05.
NB : le quantile d’ordre 0.95 d’un khi-deux à un degré de liberté est 3.841459.
Exercice 12. Un échantillon de durée de vie T i ( X i , ∆ i ), i = 1, 2, 3, 4, 5 est donné par {(2, 0), (4, 1), (6, 1), (7, 1)}.
1. Faire le graphique de l’estimateur de Kaplan-Meier de S T
2. Calculer une estimation non-paramétrique de la durée de vie moyenne. Comparer cette
valeur avec l’estimation de la moyenne sous l’hypothèse d’une loi exponentielle avec un
paramètre λ inconnu.
Exercice 13. On s’intéresse au remboursement anticipé des crédits, c’est à dire au fait qu’un
emprunteur rembourse sa dette avant l’échéance initialement prévue au moment de l’accord
de prêt. Pour cela on dispose d’informations collectées jusqu’au 31 décembre 2007. En parti-
culier le client A a contracté un emprunt le premier janvier 2002 d’une durée de 10 ans et
continue de rembourser régulièrement. Le client B a contracté un emprunt le premier jan-
vier 2000 pour une durée de 8 ans et 6 mois et a respecté les clauses initiales. Le client C
s’est endetté pour 15 ans le premier janvier 2003, il est décédé le 30 septembre 2007 alors
qu’il remboursait régulièrement son emprunt. Le client D a procédé le 31 mars 2006 au rem-
boursement anticipé d’un crédit à 5 ans ouvert le premier janvier 2004. Au moyen de ces
informations, indiquez pour chacun de ces 4 clients quelle valeur de la durée doit être prise
en compte pour l’analyse, indiquez également si cette durée est censurée et précisez si l’éven-
tuelle censure est déterministe ou aléatoire.
Exercice 14. les données suivantes correspondent à des temps d’évènement. Les données
pour lesquelles il y a une censure à droite sont indiquées par "+" : 2, 5, 7+ , 4, 6, 9+ , 3, 5+ , 8, 10,
13+ , 6, 11, 4+ , 12+ , 4. On considère maintenant les intervalles [0, 4[, [4, 8[, [8, ∞[. Construisez
l’estimateur de la fonction de survie selon la méthode actuarielle.
Exercice 15. On considère une variable de durée de vie T ayant une densité f ( t) et une
fonction de survie S ( t).
1. Qu’est ce qu’une variable de durée de vie ?
58 CHAPITRE 6. EXERCICES
2. Montrer que Z ∞
E(T ) = S ( t) dt.
0
3. On suppose par la suite une fonction de survie de la forme
36
S ( t) = .
( t + 6)2
(a) Quel est le temps moyen de survie ?

(b) Quelle est la fonction de risque instantanée associée à cette survie ?
(c) Quel est le temps moyen de survie après t 0 = 6. Comparez ce dernier résultat à la
réponse donnée en (a). Comment expliquez-vous ceci ?
(d) Quelle est la médiane des temps de survie ?
(e) Quel est le temps t 1 tel que 75% des individus devraient avoir connu l’évènement ?
Exercice 16. Comparaison de plusieurs fonctions de survie. On considère le jeu de données
colonsurvival de R.
1. Au seuil de 5% doit-on rejeter l’hypothèse : la proportion de survivants au delà de 2500
jours (variable time) est la même chez les hommes et chez les femmes ?
2. Au seuil de 5% doit-on rejeter l’hypothèse : en tout point la fonction de survie est la
même chez les hommes et chez les femmes ?
Exercice 17.
1. On considère les données amlsurvival de R. Au seuil de 5%, doit-on rejeter l’hypothèse :
la fonction de survie des patients ne change pas quand on arrête la chimiothérapiea ?
2. Comparaison de la fonction de survie de plusieurs échantillons On considère les don-
nées veteransurvival de R. Au seuil de 5%, doit-on rejeter l’hypothèse : la fonction de
survie d’un sujet ne change pas quel que soit le type de cellules : squamous/smallcell/adeno/large ?
Bibliographie
[1] Böhmer P. Theorie der unabhängigen Wahrscheinlichkeiten Rapports. Mémoires et procès

verbaux du septième congrès international d’actuaires. Amsterdam, 1912,327-343
[2] Oakes D. [1989] Bivariate survival models induced by frailties, Journal of the American
Statistical Association 84, 487-493, 1989.
[3] Vaupel J. W., Manton K., Stallard E., 1979, The impact of heterogeneity in individual
frailty on the dynamics of mortality, Demography, 16, p. 439-454.
[4] Planchet F., Modèles de durée. Support de cours, 2019-2020. ISFA Lyon.
[5] Promislow David S., Fundamentals of Actuarial Mathematics, John Wiley & Sons, 2015.
[6] Sallah K., Méthode actuarielle d’estimation des courbes de survie : principe, différences
avec la méthode de Kaplan-Meier, DELBIM-Université de Lomé
[7] Quantin Simon, Modèles sem-paramétrique de survie en temps continu sous R, document
de travail, Modélisation statistique, INSEE, M 2018/02.
59

Cours Survie

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Survie

Transféré par

Droits d'auteur :

Formats disponibles

Modèles de durée

Filière Professionnalisée ACTUARIAT

Université Félix Houphouët-Boigny

1 Modèles probabiliste de durées 3

3 Modèles non paramétriques 20

4 Modèles semi-paramétrique de Cox 34

1 Modèles probabiliste de durées

F IGURE 1.1 – Différents types de données

1.2 Caractérisation d’une variable de survie

1.2.1 Fonction de survie

La fonction de survie est, pour t fixé, la probabilité de survivre jusqu’à l’instant t.

Proposition 1.2.1. Nous avons les propriétés suivantes :

La fonction de répartition est la fonction F définie par F ( t) = P(T ≤ t) = 1 − S ( t). A t fixé, F ( t)

Proposition 1.2.2. La durée de vie moyenne est E(T ) et nous avons

Démonstration. En utilisant le théorème de Fubini pour intervertir espérance et intégrale :

1.2.3 La fonction de survie conditionnelle

Définition 1.2.3. La probabilité de survie conditionnelle entre x et x + t est :

Définition 1.2.4. Le taux de mortalité entre x et x + t est définie par :

Lorsque x est un entier, on note p x =1 p x et q x =1 q x .

Définition 1.2.5. On appelle espérance de vie résiduelle à l’âge x

La variable aléatoire X i ( t) suit une loi de Bernouilli de paramètre

E( X i ( t)) = t p x Var( X i ( t)) = t p x × t q x .

A la date t, le nombre de survivants du groupe initialement composé de L x individus est

1.2.4 Fonction de hasard

De même, la fonction de survie conditionnelle est donnée par :

Comment interprèter la fonction de hasard ?

Si la fonction t 7→ t p x est dérivable alors pour ε assez petit, on obtient

La fonction de risque instantané passe par trois périodes :

F IGURE 1.2 – Forme "baignoire"

La fonction de hasard au point k est :

1.2.5 Fonction de hasard cumulé

1.3 Quelques lois classiques

1.3.2 La loi de Weibull W (α, λ).

— Lorsque α = 1, on a W (1, λ) = E (λ).

1.3.4 Modèle de Gompertz

1.3.5 Modèle de Gompertz-Makeham de paramètres γ0 , γ1 , γ2 > 0.

Le modèle de Gompertz-Makeham est le modèle de référence pour la construction de tables

En déduire un encadrement pour E(T ) et comparer avec l’intervalle de confiance

1.3.6 Modèles composites

1.3.6.1 Agrégation de lois

Soit une population P partitionnée en sous-populations P v avec v ∈ V ⊂ Rd . La loi de

La proportion d’individus de type v dans la population à l’instant t est

1.3.6.2 Modèles à hasard proportionnel

1.3.6.2.b Modèles de fragilité

1.3.6.3 Transformations croissantes de la durée (modèles AFT15)

1.3.6.4 Modèles à causes de sortie multiples

Notons S i la fonction de survie de T i et S Z celle de Z . La fonction de survie de (T1 , . . . , T n ) est

2.1 Censure et vraisemblance

2.1.1 Censure à droite

Décès Temps (t)

2.1.1.2 Censure de type II

où X (r) est la statistique d’ordre r de ( X 1 , . . . , X n ). La vraisemblance a une forme proche du

2.1.1.3 Censure de type III : aléatoire

2. P(T ≤ t, ∆ = 0) (Cas censuré)

La vraisemblance pour un échantillon observé de taille n ( t i , δ i ) i=1,...,n est :

2.1.3 Censure par intervalle

S ( t| c ≤ X < C ) = P( X > t| c ≤ X < C )

2.3 Ajustement du modèle de Gompertz Makeham par

Le taux de mortalité entre x et x + 1 est

Si q x (θ ) est petit, nous avons l’approximation

en se restreignant aux x tels que qbx+1 (θ ) − qbx (θ ) > 0. On obtient ab et b

3 Modèles non paramétriques

Nous considérons l’estimation non