Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Exercices
1. Les temps de survie suivent une distribution exponentielle à deux paramètres λ et µ
si leur fonction de densité a pour écriture
{
0 si t < µ,
f (t) = (1)
λ exp (−λ(t − µ)) si t ≥ µ.
(e) A cause de la transformation en log, λ doit être strictement positif alors que µ
est un réel quelconque.
(f) Comme la fonction de log-vraisemblance est croissante en µ, la valeur de ce pa-
ramètre doit être la plus élevée possible. Par ailleurs, on a la contrainte t ≥ µ.
1
La combinaison des deux propositions donne immédiatement la solution µ̂ =
min (t1 , t2 , . . . , tn ).
(g) on part de la condition du premier ordre :
1∑ ∑
ˆ n n
δl(λ, µ)
= δi − ti + nµ̂ = 0
δλ λ i=1 i=1
et donc, ∑n
δi
λ̂ = ∑n i=1
t
i=1 i − nµ̂
2. Sachant que l’exponentielle est un cas particulier de la Weibull dans laquelle on impose
une contrainte, que la Weibull et la log-normale sont obtenues à partir de la Gamma
dans laquelle on impose une seule contrainte, il s’agit de construire des tests de type
LRT qui sous H0 sont des réalisations de Chi2 avec un nombre de degrés de liberté
égal au nombre de contraintes imposées.
Dans ces conditions :
H
– exponentielle versus weibull : LRT=-2(22380 - 22531) = 302 ∼0 χ2 (1)
H
– exponentielle versus gamma : LRT=-2(22016 - 22531) = 1030 ∼0 χ2 (2)
H
– weibull versus gamma : LRT=-2(22016 - 22380) = 728 ∼0 χ2 (1)
H
– log-normale versus gamma : LRT=-2(22016 - 22062) = 92 ∼0 χ2 (1)
Aux seuils de risque usuels on rejette l’hypothèse nulle dans tous les cas. On retiendrait
donc la gamma. On précise encore que la log-logistique n’est pas considérée dans les
tests précédents car elle ne peut pas être obtenue par imposition de contraintes dans
n’importe laquelle des distributions précédentes .
3. Au client A correspond une durée de censurée de 72 mois, avec censure déterministe.
Il en va de même pour le client B : censure déterministe avec une durée de 96 mois.
Le client C est enregistré avec une censure aléatoire et une durée de 57 mois. Avec D
on a une durée non censurée de 27 mois.
4. (a) Calcul de la survie
ti di ni 1 − di /ni Ŝ(ti )
0 0 16 1 1
2 1 16 0.935 0.935
3 1 15 0.933 0.875
4 2 14 0.857 0.750
5 1 11 0.909 0.682
6 2 9 0.777 0.530
8 1 6 0.833 0.442
10 1 4 0.750 0.331
11 1 3 0.667 0.221
(b) Avec la formule de Greenwood, la variance de l’estimateur de la survie au temps
t est donnée par :
∑ di
V (Ŝ(t)) = Ŝ(t)2
(ni − di )ni
ti ≤t
2
di ∑ di
ti di ni Ŝ(ti ) Ŝ(t)2 (ni −di )ni ti ≤t (ni −di )ni V (Ŝ(t))
0 0 16 1 1 1 0 0
2 1 16 0.935 0.879 0.0042 0.0042 0.0037
3 1 15 0.875 0.766 0.0048 0.0089 0.0068
Ŝ(t)2 (1−Ŝ(t))
Si on prend la formule de Peto, V (Ŝ(t)) = nt , il vient : V (Ŝ(t)) =
0.766(1−0.875)
15 = 0.00638.
(c) Le détail des calculs est dans la table suivante.
Intervalle ni di ci Effectif risqué moyen 1 − di /(ni − ci /2) Ŝ
ni − ci /2
[0, 4[ 16 2 0 16 0.875 0.875
[4, 8[ 14 5 3 12.5 0.600 0.525
[8, ∞[ 6 3 3 4.5 0.333 0.175
5. (a) Comme β̂S > 0 et que S est codée 1 pour les femmes, le risque augmente pour les
personnes de sexe féminin. Par ailleurs, le ratio de risque associée à une variable
de coefficient β est donné par eβ . On en déduit qu’ici, à autres caractéristiques
identiques, le risque de survenue de l’événement étudié pour une femme est 2.23
fois plus élevé que pour un homme, ce qui correspond à une hausse de 123%.
En revanche ce risque de survenue est identique pour les personnes célibataire ou
vivant en couple (et ayant les mêmes autres caractéristiques).
(b) Au moins deux solutions possibles.
i. Connaissant la variance de β̂S , il s’agit de trouver celle de eβ̂S . Il suffit donc
d’appliquer la méthode delta puisque e() est une fonction continue dérivable.
Rappel : on part d’une approximation de Taylor au premier ordre
δf (x)
f (x) = f (x0 ) + (x − x0 )
δx |x=x0
D’où il vient
2
δf (x)
V ar[f (x)] = V ar[x]
δx
On a donc finalement :
3
Par ailleurs, si on considère deux individus i et j de caractéristiques xi et xj , alors on
a:
h(t, xi ) h0 (t)r(xi ) r(xi )
= =
h(t, xj ) h0 (t)r(xj ) r(xj )
et si les caractéristiques sont invariantes dans le temps alors le rapport des risque est
une constante : les risques sont proportionnels.
Le modèle de Cox est qualifié de semi-paramétrique car on peut estimer les coef-
ficients des caractéristiques par maximisation d’une vraisemblance partielle (partie
paramétrique), alors que le risque de base peut être estimé par une procédure non
paramétrique.