Vous êtes sur la page 1sur 4

Examen : Modèles de Durée

Correction de l’examen du 6 janvier 2010


Gilbert Colletaz
7 janvier 2010

Exercices
1. Les temps de survie suivent une distribution exponentielle à deux paramètres λ et µ
si leur fonction de densité a pour écriture
{
0 si t < µ,
f (t) = (1)
λ exp (−λ(t − µ)) si t ≥ µ.

(a) deux solutions qui partent de l’égalité fondamentale f (t) = − δS(t)


δt . Soit on intègre
f (), soit on vérifie que la dérivée de − exp (−λ(t − µ)) donne bien f().
Comme par ailleurs h(t) = f (t)/S(t), il vient immédiatement h(t) = λ.
(b) Comme S(t) = exp (−λ(t − µ)), on a − log S(t) = λt − λµ. Dans un graphique
ayant les temps de survie en abscisse et l’opposé du log de la survie en ordonnée,
on devrait trouver une droite.
(c) La pente de la droite précédente est une estimation de λ et la valeur de l’abscisse
associée à une ordonnée nulle est une estimation de µ.
(d)

n
l(λ, µ) = δi log f (ti ) + (1 − δi ) log S(ti )
i=1
∑n
= δi (log λ − λ(ti − µ)) + (1 − δi )(−λ(ti − µ))
i=1
∑n ∑
n
= δi log λ − λ (ti − µ)
i=1 i=1

n ∑n
= log λ δi − λ ti + λnµ
i=1 i=1

(e) A cause de la transformation en log, λ doit être strictement positif alors que µ
est un réel quelconque.
(f) Comme la fonction de log-vraisemblance est croissante en µ, la valeur de ce pa-
ramètre doit être la plus élevée possible. Par ailleurs, on a la contrainte t ≥ µ.

1
La combinaison des deux propositions donne immédiatement la solution µ̂ =
min (t1 , t2 , . . . , tn ).
(g) on part de la condition du premier ordre :

1∑ ∑
ˆ n n
δl(λ, µ)
= δi − ti + nµ̂ = 0
δλ λ i=1 i=1

et donc, ∑n
δi
λ̂ = ∑n i=1
t
i=1 i − nµ̂
2. Sachant que l’exponentielle est un cas particulier de la Weibull dans laquelle on impose
une contrainte, que la Weibull et la log-normale sont obtenues à partir de la Gamma
dans laquelle on impose une seule contrainte, il s’agit de construire des tests de type
LRT qui sous H0 sont des réalisations de Chi2 avec un nombre de degrés de liberté
égal au nombre de contraintes imposées.
Dans ces conditions :
H
– exponentielle versus weibull : LRT=-2(22380 - 22531) = 302 ∼0 χ2 (1)
H
– exponentielle versus gamma : LRT=-2(22016 - 22531) = 1030 ∼0 χ2 (2)
H
– weibull versus gamma : LRT=-2(22016 - 22380) = 728 ∼0 χ2 (1)
H
– log-normale versus gamma : LRT=-2(22016 - 22062) = 92 ∼0 χ2 (1)
Aux seuils de risque usuels on rejette l’hypothèse nulle dans tous les cas. On retiendrait
donc la gamma. On précise encore que la log-logistique n’est pas considérée dans les
tests précédents car elle ne peut pas être obtenue par imposition de contraintes dans
n’importe laquelle des distributions précédentes .
3. Au client A correspond une durée de censurée de 72 mois, avec censure déterministe.
Il en va de même pour le client B : censure déterministe avec une durée de 96 mois.
Le client C est enregistré avec une censure aléatoire et une durée de 57 mois. Avec D
on a une durée non censurée de 27 mois.
4. (a) Calcul de la survie
ti di ni 1 − di /ni Ŝ(ti )
0 0 16 1 1
2 1 16 0.935 0.935
3 1 15 0.933 0.875
4 2 14 0.857 0.750
5 1 11 0.909 0.682
6 2 9 0.777 0.530
8 1 6 0.833 0.442
10 1 4 0.750 0.331
11 1 3 0.667 0.221
(b) Avec la formule de Greenwood, la variance de l’estimateur de la survie au temps
t est donnée par :
∑ di
V (Ŝ(t)) = Ŝ(t)2
(ni − di )ni
ti ≤t

Le détail des calculs est dans la table suivante :

2
di ∑ di
ti di ni Ŝ(ti ) Ŝ(t)2 (ni −di )ni ti ≤t (ni −di )ni V (Ŝ(t))
0 0 16 1 1 1 0 0
2 1 16 0.935 0.879 0.0042 0.0042 0.0037
3 1 15 0.875 0.766 0.0048 0.0089 0.0068

Et donc V (Ŝ(3)) = 0.00684.

Ŝ(t)2 (1−Ŝ(t))
Si on prend la formule de Peto, V (Ŝ(t)) = nt , il vient : V (Ŝ(t)) =
0.766(1−0.875)
15 = 0.00638.
(c) Le détail des calculs est dans la table suivante.
Intervalle ni di ci Effectif risqué moyen 1 − di /(ni − ci /2) Ŝ
ni − ci /2
[0, 4[ 16 2 0 16 0.875 0.875
[4, 8[ 14 5 3 12.5 0.600 0.525
[8, ∞[ 6 3 3 4.5 0.333 0.175
5. (a) Comme β̂S > 0 et que S est codée 1 pour les femmes, le risque augmente pour les
personnes de sexe féminin. Par ailleurs, le ratio de risque associée à une variable
de coefficient β est donné par eβ . On en déduit qu’ici, à autres caractéristiques
identiques, le risque de survenue de l’événement étudié pour une femme est 2.23
fois plus élevé que pour un homme, ce qui correspond à une hausse de 123%.
En revanche ce risque de survenue est identique pour les personnes célibataire ou
vivant en couple (et ayant les mêmes autres caractéristiques).
(b) Au moins deux solutions possibles.
i. Connaissant la variance de β̂S , il s’agit de trouver celle de eβ̂S . Il suffit donc
d’appliquer la méthode delta puisque e() est une fonction continue dérivable.
Rappel : on part d’une approximation de Taylor au premier ordre
δf (x)
f (x) = f (x0 ) + (x − x0 )
δx |x=x0
D’où il vient
2
δf (x)
V ar[f (x)] = V ar[x]
δx
On a donc finalement :

V ar[eβ̂S ] = 0.12 (exp 0.8)2 = 0.049729

ce qui donne un écart-type de 0.223 et donc un intervalle de confiance à 95%


du type 2.23 ± 0.446
ii. On a P rob[0.8 − 2 ∗ 0.1 ≤ β̂s ≤ 0.8 + 2 ∗ 0.1] = P rob[0.6 ≤ β̂s ≤ 1.0] = 0.95,
et donc : P rob[exp (0.6) ≤ exp (β̂s ) ≤ exp (1)] = P rob[1.822 ≤ exp (β̂s ) ≤
2.718] = 95%
6. Dans le modèle de Cox, le risque au temps t pour un individu ayant un ensemble de
caractéristiques x est donné par h(t | x) = h0 (t) × r(x). Le risque de base correspond
à la partie h0 (t), c’est à dire à la composante du risque total indépendante des caracté-
ristiques des individus. C’est aussi le risque afférent à un individu pour lequel r(x)=1.

3
Par ailleurs, si on considère deux individus i et j de caractéristiques xi et xj , alors on
a:
h(t, xi ) h0 (t)r(xi ) r(xi )
= =
h(t, xj ) h0 (t)r(xj ) r(xj )
et si les caractéristiques sont invariantes dans le temps alors le rapport des risque est
une constante : les risques sont proportionnels.

Le modèle de Cox est qualifié de semi-paramétrique car on peut estimer les coef-
ficients des caractéristiques par maximisation d’une vraisemblance partielle (partie
paramétrique), alors que le risque de base peut être estimé par une procédure non
paramétrique.

Vous aimerez peut-être aussi