Académique Documents
Professionnel Documents
Culture Documents
(analyse de survie)
GMMA 106
40
Temperature (°F)
220
190
170
150
30
Motorette No.
20
10
0
1. Analyse de survie
et données censurées
L’analyse de survie consiste à analyser la durée avant qu’un
2. Analyses de événement précis se produise.
survie paramétriques
Voici quelques exemples
3. Ce que nous ne
verrons pas
– Durée avant la résurgence d’une tumeur
4. Les mains dans le
cambouis – Durée avant qu’un composant électronique casse
– Durée avant qu’un étudiant s’endorme pendant ce
cours. . .
L’analyse de survie est spécifique car les données sont très
particulières
– positives et fortement asymétriques
– l’intérêt porte sur une durée éloignée plutôt qu’un
comportement moyen
– présence de censure
1. Analyse de survie
et données censurées
Définition 1. Une observation est dite censurée lorsque cette
2. Analyses de dernière est partiellement connue. Par exemple l’observation est
survie paramétriques
plus grande/petite qu’une valeur seuil; ou encore l’observation
3. Ce que nous ne
verrons pas est comprise dans l’intervalle [a, b].
4. Les mains dans le
cambouis
Dans un contexte médical, la censure peut apparaı̂tre lorsque
le patient quitte l’étude
le patient ne montre pas de symptômes/progrès avant la fin
de l’étude
le fichier du patient est perdu. . .
1. Analyse de survie
et données censurées
Les observations peuvent présenter différents types de
2. Analyses de censure
survie paramétriques
3. Ce que nous ne gauche l’observation est plus petite qu’une valeur mais de
verrons pas
combien ?
4. Les mains dans le
cambouis intervalle l’observation est tombée quelque part dans un
intervalle donnée mais où ?
droite l’observation est plus grande qu’une valeur mais de
combien ?
L’expérience elle-même peut engendrer cette censure
type 1 L’expérience à une durée prédéterminée provoquant
éventuellement une censure à droite
type 2 L’expérience s’arrête lorsqu’un nombre prédéterminé
d’unités/patients ont faillies.
1. Analyse de survie
et données censurées
Soient T1 , . . . , Tn n durées de survie et Ci le temps de censure
2. Analyses de (à droite) pour le i-ème sujet. La réponse observée est alors
survie paramétriques
donnée par
3. Ce que nous ne
verrons pas Ti∗ = min(Ti , Ci ),
4. Les mains dans le
cambouis ou sous une autre forme
1. Analyse de survie
et données censurées
Définition 2. Soit T de densité f et f.d.r. F . On appelle
2. Analyses de
survie paramétriques a) fonction de survie (survival function)
3. Ce que nous ne
verrons pas
S(t) = Pr[T > t] = 1 − F (t) ∈ [0, 1]
4. Les mains dans le
cambouis
1. Analyse de survie
et données censurées
Remarque. La connaissance d’une seule de ces fonctions permet
2. Analyses de de connaı̂tre les autres. En effet
survie paramétriques
3. Ce que nous ne d
verrons pas h(t) = − ln S(t)
4. Les mains dans le
dt
cambouis
H(t) = − ln S(t)
S(t) = exp{−H(t)}.
1. Analyse de survie
et données censurées Puisque S(t) = Pr[T > t], une estimation non paramétrique
2. Analyses de est
1X
survie paramétriques n
3. Ce que nous ne Ŝ(t) = 1 − 1{t≤Ti }
verrons pas n
i=1
4. Les mains dans le
cambouis
Mais cet estimateur n’est pas pertinent en présence de
censure
Il est plus adapté d’utiliser l’estimateur de Kaplan–Meier
D’autres estimateurs existent “Nelson–Aalen” ou “life table”
mais nous ne les verrons pas
1. Analyse de survie
et données censurées
Exercice 1. Soient 0 = t0 < t1 < t2 < · · · < tn les durée de
2. Analyses de survie ordonnées. Montrez que pour k ∈ {1, . . . , n},
survie paramétriques
Y
3. Ce que nous ne k
verrons pas
4. Les mains dans le S(tk ) = Pr[T > tj | T > tj−1 ].
cambouis
j=1
1. Analyse de survie
et données censurées
Exercice 1. Soient 0 = t0 < t1 < t2 < · · · < tn les durée de
2. Analyses de survie ordonnées. Montrez que pour k ∈ {1, . . . , n},
survie paramétriques
Y
3. Ce que nous ne k
verrons pas
4. Les mains dans le S(tk ) = Pr[T > tj | T > tj−1 ].
cambouis
j=1
1 − dj /nj ,
1. Analyse de survie
et données censurées
Soit les données de survie suivantes 6, 8+, 12, 3, 21, 12. D’où
2. Analyses de
survie paramétriques
j tj nj dj 1 − dj /nj Ŝ(tj )
3. Ce que nous ne
verrons pas 0 0 6 0 1 1
4. Les mains dans le
cambouis
1 3 6 1 1 − 1/6 5/6
2 6 5 1 1 − 1/5 4/5 × 5/6
3 8+ 4 0 1 4/5 × 5/6
4 12 3 2 1 − 2/3 2/3 × 4/5 × 5/6
5 21 1 1 0 0 × 2/3 × 4/5 × 5/6
1.0
et données censurées
2. Analyses de
0.8
survie paramétriques
3. Ce que nous ne
verrons pas
0.6
S(t)
4. Les mains dans le
^
cambouis
0.4
0.2 Temperature (°F)
220
190
170
150
0.0
1. Analyse de survie
et données censurées
Il faut garder en mémoire que l’estimateur de Kaplan–Meier
2. Analyses de repose sur deux hypothèses importantes :
survie paramétriques
3. Ce que nous ne censure non informative Suppose l’indépendance entre Ti et
verrons pas
Ci dans la représentation Ti∗ = min(Ti , Ci ). Si elle ne pas
4. Les mains dans le
cambouis vérifiée, estimateur biaisé.
homogénéité Chaque Ti provient de la même loi. Si ce n’est
pas le cas, risque de mauvaise interprétation/non sens. . .
1. Analyse de survie
et données censurées
2. Analyses de
survie paramétriques
f (t) = λ exp(−λt), S(t) = exp(−λt)
3. Ce que nous ne h(t) = λ, H(t) = λt
verrons pas
4. Les mains dans le
cambouis Exercice 3. Montrez qu’un modèle exponentiel est sans
mémoire, i.e.,
1. Analyse de survie
et données censurées
2. Analyses de
survie paramétriques
f (t) = λ exp(−λt), S(t) = exp(−λt)
3. Ce que nous ne h(t) = λ, H(t) = λt
verrons pas
4. Les mains dans le
cambouis Exercice 3. Montrez qu’un modèle exponentiel est sans
mémoire, i.e.,
1. Analyse de survie
et données censurées
2. Analyses de
survie paramétriques
f (t) = κλ−κ tκ−1 exp{−(t/λ)κ }, S(t) = exp{−(t/λ)κ }
3. Ce que nous ne
verrons pas
h(t) = κλ−κ tκ−1 , H(t) = λ−κ tκ
4. Les mains dans le
cambouis
1.0
10
κ = 0.5
5
κ=1
κ = 1.5
0.8
8
0.6
6
H(t)
S(t)
h(t)
0.4
4
0.2
2
0.0
0
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
t t t
1. Analyse de survie
et données censurées
Nous allons utiliser l’estimateur du maximum de
2. Analyses de vraisemblance
survie paramétriques
Attention à la présence de données censurées. La
3. Ce que nous ne
verrons pas contribution de la i-ème observation ti à la vraisemblance est
4. Les mains dans le
cambouis – f (ti ; θ) si ti n’est pas censurée
– Pr[T > ti ] = 1 − F (ti ) si ti est censurée à droite
– Pr[T < ti ] = F (ti ) si ti est censurée à gauche
– Pr[a < T < b] = F (b) − F (a) si ti est censuré par
l’intervalle [ai , bi ]
1. Analyse de survie
et données censurées
Nous allons utiliser l’estimateur du maximum de
2. Analyses de vraisemblance
survie paramétriques
Attention à la présence de données censurées. La
3. Ce que nous ne
verrons pas contribution de la i-ème observation ti à la vraisemblance est
4. Les mains dans le
cambouis – f (ti ; θ) si ti n’est pas censurée
– Pr[T > ti ] = 1 − F (ti ) si ti est censurée à droite
– Pr[T < ti ] = F (ti ) si ti est censurée à gauche
– Pr[a < T < b] = F (b) − F (a) si ti est censuré par
l’intervalle [ai , bi ]
La vraisemblance est alors
Y Y Y Y
L(θ) = f (ti ; θ) {1−F (ti )} F (ti ) {F (bi )−F (ai )},
i∈N C i∈D i∈G i∈I
1. Analyse de survie
et données censurées
Nous avons à peine survolé l’analyse de survie. Les personnes
2. Analyses de intéressées pourrant regarder les thèmes suivants :
survie paramétriques
3. Ce que nous ne Comparaison de fonctions de survie
verrons pas
Modèles de Cox, modèles de fragilité (frailty models)
4. Les mains dans le
cambouis Modèle log-logistique
1. Analyse de survie
et données censurées Écrire la vraisemblance pour ce modèle
2. Analyses de
survie paramétriques
Écrire une fonction R calculant l’estimateur du maximum de
3. Ce que nous ne vraisemblance et sa variance.
verrons pas
Commentez vos résultats et faire de jolies représentations
4. Les mains dans le
cambouis graphiques