Académique Documents
Professionnel Documents
Culture Documents
Notes de Cours
MASTER 2 ESA
voies professionnelle et recherche
Gilbert Colletaz
2 dcembre 2015
2
Avertissements
3
4
1 Introduction 9
1.1 La nature des donnes de survie . . . . . . . . . . . . . . . . 9
1.2 La description de la distribution des temps de survie . . . . 11
5
6 TABLE DES MATIRES
3 Lapproche paramtrique 69
3.1 Les modles AFT et les modles PH . . . . . . . . . . . . . . 70
3.1.1 Les Modles temps de vie acclre . . . . . . . . . 70
3.1.2 Les Modles risques proportionnels . . . . . . . . . 74
3.2 Les principales modlisations AFT . . . . . . . . . . . . . . . 77
3.2.1 La distribution exponentielle . . . . . . . . . . . . . . 77
3.2.2 La distribution de Weibull . . . . . . . . . . . . . . . . 78
3.2.3 La distribution log-normale . . . . . . . . . . . . . . . 79
3.2.4 La distribution log-logistique . . . . . . . . . . . . . . 80
3.2.5 La distribution Gamma gnralise . . . . . . . . . . 81
3.3 Estimation avec diffrents types de censure et tests sur les
coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.4 Choix dune distribution et tests de spcification . . . . . . . 83
3.4.1 Slection au moyen du test de rapport de vraisemblance 84
3.4.2 Les aides graphiques . . . . . . . . . . . . . . . . . . . 85
3.5 estimation de fractiles sur les dures dvnement . . . . . . 91
3.6 Donnes censures gauche, droite et par intervalle . . . . 93
3.6.1 La structuration des donnes . . . . . . . . . . . . . . 93
3.6.2 Estimation dun modle Tobit via LIFEREG . . . . . . 94
3.7 PROC LIFEREG . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Introduction
9
10 CHAPITRE 1. INTRODUCTION
Tous les individus sont suivis pendant les 52 semaines suivant la premire
administration du traitement. On considre plus particulirement 3 sujets
qui vont permettre dillustrer certaines des caractristiques les plus fr-
quentes des donnes de survie et notamment deux cas possibles de censure
droite.
Cest donc une fonction continue monotone non croissante telle que
S(0) = 1 et limt S(t) = 0.
dF(t) dS(t)
f (t) = = (1.2)
dt dt
12 CHAPITRE 1. INTRODUCTION
Cette fonction est lie aux prcdents objets puisquen effet avec le thorme
des probabilits conditionnelles il vient :
f (t)
h(t) =
S(t)
Il est encore possible de dfinir le risque cumul H(t) selon :
Z t
H(t) = h(s)ds (1.4)
0
Avec lgalit suivante entre fonction de survie et fonction de risque
cumul :
H(t) = log[S(t)]
en effet
Z t
f (t) d log St
h(t) = = S(t) = exp[ h(s)ds] = exp[H(t)]
S(t) dt 0
Toutes ces fonctions sont donc lies entre elles : la connaissance de S(t)
permet celle de f (t) via (1.2) et donc celles de h(t) par (1.3) et H(t) par
(1.4). De mme, la connaissance de h(t) permet celle de H(t) donc de S(t)
et finalement de f (t). En dautres termes, si on se donne une seule de ces
fonctions, alors les autres sont dans le mme temps galement dfinies. En
particulier, un choix de spcification sur la fonction de risque instantan
implique la slection dune certaine distribution des donnes de survie.
14 CHAPITRE 1. INTRODUCTION
Chapitre 2
1. en faisant toutefois limpasse sur les dmonstrations qui relvent dune r-criture
de KM en termes de processus de comptage permettant de faire appel la thorie des
martingales. A lvidence le temps imparti ce cours ne permet pas daborder ces aspects.
2. Ces deux estimations sont en maintenant aisment ralisables avec SAS 9.2
15
16 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
o
(a) peut tre estim par 1 dt2 /nt2 o dt2 est le nombre dindividus
ayant connu lvnement en t2 et nt2 le nombre dindividus qui au-
raient pu connatre lvnement en question entre t1 exclu et t2 . En
dautres termes nt2 est le nombre dindividus risque au temps t2 .
Si le temps tait vraiment continu on devrait toujours avoir d = 1.
2.1. LESTIMATEUR DE KAPLAN-MEIER DE LA FONCTION DE SURVIE : UNE PRSENTATION HEURIS
On a donc :
dt2
2 ) = (1
S(t 1)
) S(t (2.1)
nt 2
Lquation prcdente donne une rcurrence permettant de calculer S(t)
pour tout temps dvnement t observ, sachant quinitialement S(0) =1:
Y di
=
S(t) (1 ) (2.2)
ni
i|ti t
0. 75
0. 50
0. 25
0. 00
0 20 40 60 80 100 120
t emps
6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*,
316*, 335*, 346*
On obtient alors :
ti di ni 1 di /ni i)
S(t F(t i)
i ) = 1 S(t
0 0 19 1 1 0
6 1 19 0.947 0.947 0.053
19 1 18 0.944 0.895 0.105
32 1 17 0.941 0.842 0.158
42 2 16 0.875 0.737 0.263
94 1 13 0.923 0.680 0.320
207 1 10 0.90 0.612 0.388
253 1 7 0.957 0.525 0.475
Remarques :
Il existe des dures suprieures 253 jours mais elles sont toutes cen-
sures. En consquence dans ce deuxime exemple, et contrairement
au prcdent, la valeur estime de la fonction de survie correspon-
dant au temps dvnement maximal observ (soit 253 jours) ne
sannule pas. Prcdemment nous avions S(120) = 0 du fait que la
dure maximale tait non censure. En dautres termes, le fait que
lestimateur de la fonction de survie sannule ne signifie pas que tous
les individus ont connu lvnement tudi mais seulement que la
dure maximale ne correspond pas une censure. Pour vous en per-
suader, reprenez les chiffres de ce second exemple en remplaant
346* par 346.
En ce qui concerne la reprsentation graphique de la fonction de
survie beaucoup vont la tracer jusquau temps t = 253, ce qui est rai-
sonnable puisque lestimateur KM nest pas dfini au-del du temps
dvnement maximal. Toutefois, vous trouverez aussi des prsen-
tations qui vont la prolonger jusquau temps t = 346, maximum des
temps censurs qui est ici suprieur au plus grand temps dvne-
ment connu, avec une horizontale dordonne 0.525. On retrouve une
20 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
0. 75
0. 50
0. 25
0. 00
t emps
Legend: Pr oduct - Li mi t Est i mat e Cur ve Censor ed Obser vat i ons
jours : au moins 75% des individus nont pas connu lvnement avant 42
jours. On peut galement construire des intervalles de confiance sur ces
percentiles et SAS utilise pour cela une mthodologie base sur un test de
signe propos par Brookmeyer et Crowley (1982), lintervalle de confiance
p]2 c Var[S(t)]},
du pime centile ICp est alors donn par ICp = {t|[1 S(t)
o c est la valeur critique au seuil dun Chi2 un degr de libert, et
Var[S(t)] qui sera dfinie dans le paragraphe
est la variance estime de S(t)
suivant.
Remarques
Elle est encore gale f (t) (plus prcisment, f (t)dt si Y est conti-
nue).
Cas dun temps censur : la vraisemblance associe est gale simple-
ment gale la probabilit que T soit suprieure t, soit S(t).
k
Y
L= (1 2 i1 )di (1 i )di (1 2 i )mi
i=1
k
Y
= (1 i )di m
i
i
(1 2 i1 )di +mi
i=1
Finalement en notant
P ni le nombre dindividus risque au temps dv-
nement ti , soit ni = ji (d j + m j ), on obtient :
2.3. LES PRINCIPALES HYPOTHSES ET LEUR SIGNIFICATION 25
k
Y
L= (1 i )di ni i di
i=1
et la log-vraisemblance :
k
X
`= di log(1 i ) + (ni di ) log(i )
i=1
`() di ni di ni di di
= + = 0 i = =1 , i = 1, . . . , k
i 1 i i ni ni
Lestimateur de Kaplan-Meier est alors donn par :
Y di
=
S(t) (1 )
ni
i|ti t
ce qui est bien lexpression (2.2) dj vue dans la section prcdente page
17.
n
Y
L= [ f (ti )M(ti )]i [m(ti )S(ti )]1i
i=1
n
Y
= [ f (ti )i S(ti )1i ][M(ti )i m(ti )1i ]
i=1
Yn
[ f (ti )i S(ti )1i ]
i=1
Pour simplifier on admet galement que les groupes de risque sont or-
donns : 1 > 2 > > J1 > J . Que se passe til si on estime une
fonction de risque avec un tel chantillon en travaillant sous lhypothse
dhomognit ? Il est tout dabord vident que la fonction de risque de cet
chantillon est un mlange des J fonctions de risque affrentes chacun des
groupes. Par ailleurs lestimateur un temps dvnement donn de cette
fonction est obtenu en considrant les individus encore risque ce temps.
Or, lorsque le temps dvnement augmente la proportion des individus
faible risque doit saccrotre alors que simultanment la proportion des
individus risqu lev doit diminuer. Ce mouvement nest sans doute pas
uniforme : on peut avoir une faible probabilit de connatre un vnement
et cependant le subir rapidement, et inversement une personne peut avoir
28 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
une forte probabilit pour que se ralise un vnement sans que celui-ci se
produise court terme. Mais en moyenne cette tendance doit tre vrifie.
Ainsi le risque estim sur lchantillon complet doit dcrotre. Pour autant,
il faut se garder dappliquer cette conclusion chaque individu puisque
lon sait, par construction, que son risque est constant. Concrtement, ima-
ginez que les individus soient des entreprises de cration rcente et que
lvnement dintrt soit la survenue dune faillite : le fait dobtenir une
dcroissance du risque dans lchantillon ne signifie pas ncessairement que
le risque de faillite est leve dans les premiers mois qui suivent la cration
dune entreprise puis diminue si elle a survcu un certain temps puisque
lon obtiendrait la mme volution avec des entreprises risque constant
certaines trs risques mlanges avec des firmes risque quasi-nul.
2
!1
MV ) = `() |
V(
i j =MV i,j=1,...,k
et donc : X X
di
log(S(t)) = log(1 )= log( i )
ni
i|ti t i|ti t
o
di /ni est la proportion dindividus ayant connu lvnement parmi
les individus risque en ti , et donc
1di /ni est la proportion dindividus nayant pas connu lvnement
parmi les individus risque en ti .
2 `() ni di di
2
= 2
, i = 1, . . . , k
i i (1 i )2
di (ni di )
Var( i ) =
n3i
30 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
Var[log( i )] = 2 i]
i Var[
n2i di (ni di )
=
(ni di )2 n3i
di
=
(ni di )ni
Et donc :
X di
Var[log(S(t))] = 2lSt =
(ni di )ni
i|ti t
On veut Var[S(t)].
Sachant que lon connat Var[log(S(t))] et que natu-
rellement Var[S(t)] = Var[exp{log(S(t))}], il suffit de reprendre la mthode
delta applique maintenant g() = exp() pour obtenir finalement la formule
de Greenwood :
Var[S(t)]
= Var[exp{log(S(t))}]
= [exp{log(S(t))}] 2
Var[log(S(t))]
X di
2
= S(t)
(ni di )ni
i|ti t
2
= S(t) 2lSt
3. Rappel : soit calculer Var[g(x)] o g() est une fonction continue drivable. Un dve-
g(x)
loppement de Taylor lordre 1 au voisinage de x0 donne : g(x) = g(x0 ) + (x x0 ) x |x=x0 =
0 02
g(x0 ) + (x x0 )gx0 et donc Var[g(x)] = g x0 Var(x). Ici g(x) = log(x) et g(x)=1/x.
2.5. LA CONSTRUCTION DIC SUR LA SURVIE 31
St = lSt S(t), (2.3)
z/2 S
S(t) (2.4)
t
et S t
S t log(S t )
log[ log (St )] = .
S t log(S t )
h (xL , xU )n 12 [1 + n 2 ]S(t),
S(t) (2.5)
lSt
e (xL , xU ) S ,
S(t) (2.6)
t
" #
|W 0 (x)|
la borne e (xL , xU ) vrifiant = Pr supxL xxU > e (xL , xU ) .
x(1x)
Si on compare (2.4) et (2.6), on voit que les bornes affrentes aux bandes
de Nair sont proportionnelles aux bornes des IC ponctuels et correspondent
simplement un ajustement du seuil de risque utilis dans ces dernires.
S(t)S(t)
5. Le point de dpart utilise le fait que n S(t) converge vers une martingale gaus-
sienne centre. On passe ensuite par une transformation faisant apparatre un pont brownien
p
{W 0 (x), x [0, 1].}, pondr par 1/ x(1 x) chez Nair, permettant de rcuprer les valeurs
critiques idoines
2.5. LA CONSTRUCTION DIC SUR LA SURVIE 33
Un exemple
Pour illustrer les points prcdents, on utilise des donnes de Klein et
moeschberger(1997) distribues avec linstallation de SAS (fichier BMT).
proc format;
value risk 1=ALL 2=AML-Low Risk 3=AML-High Risk;
data BMT;
input Group T Status @@;
format Group risk.;
label T=Disease Free Time;
datalines;
1 2081 0 1 1602 0 1 1496 0 1 1462 0 1 1433 0 1 1377 0 1 1330 0
1 996 0 1 226 0 1 1199 0 1 1111 0 1 530 0 1 1182 0 1 1167 0 1
418 1 1 383 1 1 276 1 1 104 1 1 609 1 1 172 1 1 487 1 1 662 1
1 194 1 1 230 1 1 526 1 1 122 1 1 129 1 1 74 1 1 122 1 1 86 1
1 466 1 1 192 1 1 109 1 1 55 1 1 1 1 1 107 1 1 110 1 1 332 1 2
2569 0 2 2506 0 2 2409 0 2 2218 0 2 1857 0 2 1829 0 2 1562 0 2
1470 0 2 1363 0 2 1030 0 2 860 0 2 1258 0 2 2246 0 2 1870 0 2
1799 0 2 1709 0 2 1674 0 2 1568 0 2 1527 0 2 1324 0 2 957 0 2
932 0 2 847 0 2 848 0 2 1850 0 2 1843 0 2 1535 0 2 1447 0 2
1384 0 2 414 1 2 2204 1 2 1063 1 2 481 1 2 105 1 2 641 1 2 390
1 2 288 1 2 421 1 2 79 1 2 748 1 2 486 1 2 48 1 2 272 1 2 1074
1 2 381 1 2 10 1 2 53 1 2 80 1 2 35 1 2 248 1 2 704 1 2 211 1
2 219 1 2 606 1 3 2640 0 3 2430 0 3 2252 0 3 2140 0 3 2133 0 3
1238 0 3 1631 0 3 2024 0 3 1345 0 3 1136 0 3 845 0 3 422 1 3
162 1 3 84 1 3 100 1 3 2 1 3 47 1 3 242 1 3 456 1 3 268 1 3
318 1 3 32 1 3 467 1 3 47 1 3 390 1 3 183 1 3 105 1 3 115 1 3
164 1 3 93 1 3 120 1 3 80 1 3 677 1 3 64 1 3 168 1 3 74 1 3 16
1 3 157 1 3 625 1 3 48 1 3 273 1 3 63 1 3 76 1 3 113 1 3 363
1;
Dans cet exemple on ne considre pas les informations relatives la
variable risk. Les estimations KM de la survie, les intervalles de confiance
ponctuels et une bande de confiance, ici de Nair, sont obtenus avec les
instructions suivantes :
proc lifetest data=BMT plots=s(cl cb=ep); time T * Status(0);
run;
Le seuil de risque par dfaut est utilis ( = 5%) et les rsultats sont
prsents dans le graphique (2.1).
34 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
H(t)
= log S(t) (2.8)
On peut montrer que H(t) < H(t)
: lestimateur de Nelson-Aalen est tou-
jours infrieur lestimateur de Breslow 6 . Il ny a cependant aucune raison
6. Ceci vient du fait que la fonction log tant concave elle se situe sous sa tangente et
donc, si on considre un dveloppement de Taylor lordre 1, 1l vient log(1 x+ ) < x+ .
P P
Comme dune part H(t) = i|t t di , on obtient immdiatement
= i|t t log (1 di ) et H(t)
i ni i ni
la proprit annonce.
2.7. LESTIMATION KERNEL DU RISQUE INSTANTAN 35
Var(S(t))
Var(H(t)) = (2.9)
2
S(t)
o Var(S(t)) est la variance de lestimateur KM drive prcdemment.
X di (ni d j )
Var(H(t)) = , (2.10)
i|ti t
n3i
Cest cette dernire formulation qui utilise dans la proc LIFETEST de SAS)
k
X
hn (t) = 1 K
t ti
4H n (ti ) (2.13)
b b
i=1
k
1 X t ti 2
s2 (h n (t)) = K 4Var(H n (ti ))
b2 i=1 b
15
un lissage biweight : KBW (x) = 16 (1 x2 )2 , 1 x 1
Un exemple
Les rsultats sont regroups dans le graphique 2.1. Par dfaut, cest un
Kernel de type Epanechnikov qui est mis en oeuvre. On remarque bien leffet
de lissage accentu associ laugmentation du paramtre de bandwith. Par
ailleurs, il semble que le risque de dcs soit lev au moment et peu aprs la
date du diagnostic, et quil tend ensuite dcrotre assez rgulirement pour
atteint un plateau o il est pratiquement nul entre 1200 et 2000 jours, avant
de remonter vers les plus longues dures. Il faut cependant se souvenir
des effets de bords et ne pas commenter une volution qui serait en fait
essentiellement de leur fait. Ces effets affectent la prcision des estimations
et une faon de les mettre en vidence est de construire des intervalles de
confiance autour de la fonction lisse. Cela est effectu dans le graphique 2.2.
Dans le prsent exercice, on observe des amplitudes pour les IC aux dures
faibles et leves qui interdisent de commenter les volutions observes
sur ces temps. La seule conclusion raisonnable concerne la dcroissance du
risque quelque mois aprs le diagnostic.
Groupe 1 2 total
Individus ayant connu lvnement d1i d2i di
Individus nayant pas connu lvnement n1i d1i n2i d2i ni di
Individus risqus n1i n2i ni
11. SAS donne galement par dfaut une statistique de type LRT. Celle-ci suppose une
distribution exponentielle des dures qui na aucune raison dtre gnralement valide.
Pour cette raison nous ne la traiterons pas ici. En revanche, elle rapparatra dans le chapitre
3 consacr aux modles paramtriques.
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 41
di
e1i = n1i pour le 1er groupe
ni
di
e2i = n2i
ni
di
= (ni n1i )
ni
= di e1i pour le second groupe
Une fois ces tables construites pour lensemble des temps dvnement,
ensemble obtenu par lunion des deux sous-ensembles de temps dvne-
ment affrents chacun des groupes (les temps considrs sont donc soient
observs dans le groupe 1 soient observs dans le groupe 2), on calcule 4
quantits :
O 1 E1
P N(0, 1)
( i )1/2
ou encore,
(O1 E1 )2
P (1).
i
, Exemple 3 : Les donnes suivantes, reprises de Freireich et alii. (1963),
dcrivent les temps de survie (employ ici au sens littral) de patients leu-
cmiques avec traitement 6-MP (groupe 1, 21 patients) et sans traitement
12. Cette distribution est relative au nombre de succs dans une succession de t tirages
sans remplacement. Pour mmoire, la distribution binomiale considre une succession de
tirages avec remplacement. Une variable hypergomtrique X de paramtres n,s,t o n est
le nombre total dvnements et s le nombre de succs parmi ces n, vrifie
s ns !
a a!
Prob(X = k) = k ntk , avec = .
t
b b!(a b)!
ts(nt)(ns)
Son esprance est donne par tsn et sa variance par n2 (n1) . Dans ce qui nous intresse ici,
on considre que lon a, chaque date dvnement, n1i tirages, soit t = n1i , que le nombre
de succs est di parmi un total de ni lments, et comme par construction n2i = ni n1i , on
obtient la formule donne dans le texte.
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 43
Groupe 1 : 6, 6, 6, 6*, 7, 9*, 10, 10*, 11*, 13, 16, 17*, 19*, 20*, 22, 23, 25*,
32*, 32*, 34*, 35*
Groupe 2 : 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22,23
On obtient alors :
1 0 21 2 21 2 42 1 1
2 0 21 2 19 2 40 1.05 0.95
3 0 21 1 17 1 38 0.553 0.447
4 0 21 2 16 2 38 1.135 0.865
5 0 21 2 14 2 37 1.2 0.8
6 3 21 0 12 3 35 1.909 1.091
7 1 17 0 12 1 39 0.586 0.414
8 0 16 4 12 4 29 2.286 1.714
10 1 15 0 8 1 28 0.652 0.348
11 0 13 2 8 2 23 1.238 0.762
12 0 12 2 6 2 21 1.333 0.667
13 1 12 0 4 1 18 0.75 0.25
15 0 11 1 4 1 16 0.733 0.267
16 1 11 0 3 1 15 0.786 0.214
17 0 10 1 3 1 14 0.769 0.231
22 1 7 1 2 2 9 1.556 0.444
23 1 6 1 1 2 7 1.714 0.286
O1 = 9 O2 = 21 E1 = 19.25 E2 = 10.75
17. Par exemple, avec k=3, en cas de rejet de H0 : S1 (t) = S2 (t) = S3 (t), alors dans le premier
cas on est amen regarder H0 : S1 (t) = S2 (t), H0 : S1 (t) = S3 (t), H0 : S2 (t) = S3 (t) et donc
nH = 3. Dans le second, si S1 () est prise comme rfrence, on aura seulement H0 : S1 (t) = S2 (t)
et H0 : S1 (t) = S3 (t) avec nH = 2.
18. Naturellement il faut adapter les expressions des variances ou des variances-
covariances pour tenir compte de la prsence des poids wi .
46 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
Remarques
Sous certaines conditions et notamment si le ratio des taux de risque
est constant alors le log-rank a le plus fort pouvoir dans la classe
des tests de rangs linaires (Peto et Peto, 1972). Sous cette hypothse
de risque proportionnel, que nous dtaillerons par la suite (Chapitre
3), les fonctions de survie S1 (t) et S2 (t) des individus appartenant
deux classes diffrentes i et j vrifient S1 (t) = S2 (t)k . En consquence
on obtient des courbes parallles dans lespace log log(St ) versus
log(t). Un simple graphique peut donc, visuellement, permettre de
voir si lhypothse en question est raisonnable ou pas 20 .
Les tests les plus couramment utiliss sont ceux du logrank et de
Wilcoxon-Gehan. A moins davoir de bonnes raisons de faire autre-
ment, on conseille gnralement de les considrer en priorit. Dans
tous les cas il est important de ne pas fonder le choix du test ex-post
la vue des rsultats : les conclusions que lon est amen tirer selon
les diffrents tests peuvent se contredire et il serait alors possible de
valider nimporte quelle conjecture. Il est donc important de faire
ce choix ex-ante compte-tenu notamment de la perception a priori
que lon a de la validit de lhypothse de risques proportionnels
ou des plages sur lesquelles la divergence des survies est la plus
intressante considrer.
19. Ainsi par exemple, avec p proche de 1 et q proche de zro on se concentre sur les
carts existant aux temps dvnements faibles, retrouvant ainsi la limite les pondrations
de Peto-Peto. Avec p proche de zro et q proche de 1 on va accorder plus de poids aux
carts existants aux temps dvnements levs (alors que la survie est la plus faible). Avec
p = 1/2 et q = 1/2, ce sont les carts observs pour des survies aux environ de 0.5 qui sont
sur-pondrs.
20. Admettons la proportionnalit des risques : h1 (t) = kh2 (t) o k est une constante posi-
Rt
tive. En utilisant les relations fondamentales, il vient :log S1 (t) = H1 (t) = 0 h1 (u)du =
Rt
0 kh2 (u)du = kH2 (t) = k log S2 (t), soit encore S1 (t) = S2 (t)k . En consquence,
log log S1 (t) = log k+log log S2 (t) assurant ainsi le paralllisme des courbes dans lespace
log log S(t) versus t ou encore versus log(t).
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 47
Ces tests requirent que la distribution des censures ne soit pas trop
dsquilibre entre les diffrentes sous-populations.
Lorsque les courbes de survie se coupent alors la puissance des tests
peut tre affecte, ceci videmment en raison dun effet de compen-
sation algbrique qui se produit dans le calcul de la somme des
quantits d1ti e1ti . Par ailleurs lintersection des courbes remet en
cause lhypothse de risque proportionnel 21 et donc loptimalit du
test de log-rank.
Lorsque les effectifs des individus risque diminuent, la prcision
des estimateurs se dgrade. Il est donc recommand de surveiller
lvolution de ces effectifs avec laugmentation des temps de survie
afin de sassurer quun nombre raisonnable dobservations sont uti-
lises dans la construction des estimateurs de la survie et des tests
de comparaison.
Un premier exemple
Pour illustrer les dveloppements qui prcdent, nous prenons les don-
nes de Lee(1992) : il sagit de comparer lefficacit de deux traitements
dimmunothrapies (BCG vs. Cryptosporium parvum) sur la survie de pa-
tients dveloppant un mlanome malin. Pour chaque patient on connat la
nature du traitement, le temps de survie censur ou non (une toile signale
un temps censur) ainsi que son appartenance une classe dge. Ces in-
formations sont prsentes dans le tableau (2.2).
survies estimes montre que le paralllisme nest pas vrifi sur les temps
les plus faibles, ce qui peut affecter le test de logrank. Il peut donc tre utile
de le complter par un autre test, ici Wilcoxon-Gehan. Les deux courbes de
survie obtenues sont par ailleurs prsentes dans le graphique (2.4).
Les rsultats des tests demands sont prsents dans le tableau 2.3 et
conduisent ne pas rejeter, aux seuils de risque usuels, lhypothse dgalit
des survies et donc lquivalence en termes defficacit des deux traitements.
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 49
Statistique Chi2 df SL
Log-rank 1.2893 0.7558 1 0.3847
Wilcoxon 34.000 0.9115 1 0.3397
Un deuxime exemple
Test Chi2 df SL
Log-rank 13.8037 2 0.0010
Wilcoxon 16.2407 2 0.0003
Test de Log-rank
Groupe Groupe Chi2 SL brut SL Bon.
ALL AML-High Risk 2.6610 0.1028 0.3085
ALL AML-Low Risk 5.1400 0.0234 0.0701
AML-High Risk AML-Low Risk 13.8011 0.0002 0.0006
Test de Wilcoxon
Groupe Groupe Chi2 SL brut SL Bon.
ALL AML-High Risk 3.8056 0.0511 0.1532
ALL AML-Low Risk 5.1415 0.0234 0.0701
AML-High Risk AML-Low Risk 16.2052 <0.0001 0.0002
Table 2.5 Tests dgalit des survies entre tous les couples - donnes BMT
Les rsultats des tests dgalit des trois courbes et des tests simples sont
respectivement dans les tableaux 2.4 et 2.5. Avec un seuil de risque de 10%
on serait conduit rejeter lhypothse dgalit jointe. Les tests dhypothses
simples quand eux permettent daccepter lhomognit des survies des
patients appartenant aux groupes ALL et AML-High Risk et les distinguer
de celles affrentes aux patients classs dans le groupe des ALM-Low risk,
ces derniers tant favoriss au regard du temps de survenue du dcs.
Un exemple
On reprend les donnes de Lee (1992) dj utilises. Il sagissait dtu-
dier lefficacit compare de deux traitements (BCG vs. Cryptosporidium
parvum). Dans cette base nous avons galement la rpartition des patients
en 3 classes dge, information qui navait pas t utilise prcdemment.
On peut imaginer que lefficacit dun traitement soit affecte par lge du
patient. Si tel est le cas, alors on pourrait attribuer lun des traitement ce
qui ne serait quune consquence de rpartition par ge htrogne entre les
deux chantillons, ou bien au contraire masquer la plus grande efficacit de
lun des traitement en raison dune rpartition par ge dsquilibre. Dans
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 53
tous les cas, le risque davoir une mauvaise apprciation de leur efficacit
relative peut tre lev.
proc lifetest;
time time*c(0);
strata agegrp /test=wilcoxon group=treat;
run;
proc sort;
by agegrp;
run;
proc lifetest;
by agegrp;
time time*c(0);
strata treat /test=wilcoxon;
run;
Ces statistiques ont ici un seul degr de libert et les rsultats sont donns
dans le tableau 2.7.
Finalement, on construit la statistique de test stratifie comme indique plus
haut pour obtenir, avec v = (3.0 + 5.0 + 4.0) = 6.0 et V = (155.615 + 35.0 +
62
11.0) = 201.615, une valeur de 201.615 = 0.1786 qui est, sous lhypothse
nulle, la ralisation dun Chi2 1 degr de libert comme indiqu dans le
tableau 2.6 22 .
22. Cette faon de procder rconcilie les rsultats apparemment contradictoires de SAS
54 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
et Stata sur les tests stratifis et qui avaient t relevs dans une note de la FAQ de Stata Why
do Stata and SAS differ in the results that they report for the stratified generalized Wilcoxon test for
time-to-event data ? disponible ici : http ://www.stata.com/support/faqs/stat/wilcoxon.html.
La combinaison de la commande STRATA avec loption GROUP donne bien des rsultats
identiques ceux obtenus avec la commande sts test treat, wilcoxon strata(agegrp) de
Stata. Lorigine de la contradiction tait lemploi sous SAS, par les auteurs de la note en
question, de la commande STRATA couple avec la commande TEST. A leur dcharge, il est
vrai que loption GROUP nexistait pas dans la version 8 de SAS.
23. Voir la documentation de LIFETEST pour le dtail des expressions
2.8. COMPARAISON DE COURBES DE SURVIE ESTIMES PAR KAPLAN-MEIER 55
Logrank Wilcoxon
Variable Stat. Chi2 SL Stat. Chi2 SL
Age -83.7764 0.6107 0.4345 -12.6165 0.0320 0.8581
Prior 36.2253 0.4980 0.4804 -5.7669 0.0389 0.8436
DiagTime -93.9987 1.0011 0.3170 -65.2381 0.8031 0.3702
Kps 1220.1 44.8525 <.0001 920.4 57.4490 <.0001
Treatment -0.5002 0.00817 0.9280 -3.1226 0.8782 0.3487
Dans ce qui suit, on teste limpact des variables Age, Prior, DiagTime,
Kps et Treatment sur la survie.
proc lifetest data=VALung;
time SurvTime*Censor(1);
test Age Prior DiagTime Kps Treatment;
run;
On rcupre alors les rsultats donns dans le tableau 2.8 pour ce qui
concerne les statistiques individuelles et dans le tableau 2.9 pour la pro-
cdure de slection. Notez que dans le premier lordre de prsentation est
celui qui est donn par la commande test du programme dappel, dans
le second les variables sont classes en fonction de leur contribution la
construction de la statistique globale v0 V 1 v. On rappelle galement que le
nombre de degr de libert du Chi2 est toujours de 1 dans le premier tableau
alors quil est gal au nombre de variables incorpores dans le meilleur mo-
dle dans le second. Ainsi, la variable la plus pertinente pour sparer les
survies est KPS. Si on veut retenir deux variables, celles-ci seraient Kps et
DiagTime, etc. . .. Notez aussi que le nombre de degr de libert saccrot
dune unit avec lajout dune variable supplmentaire indpendamment
du nombre de valeurs diffrentes que prend la variable en question. Enfin,
vous remarquerez galement que cet exemple illustre la non quivalence
des tests Logrank et Wilcoxon.
Logrank Wilcoxon
DF Variable Chi2 SL 4Chi2 Variable Chi2 SL 4Chi2
1 Kps 44.8525 <.0001 44.8525 Kps 57.4490 <.0001 57.4490
2 Treatment 46.2596 <.0001 1.4071 Age 58.5609 <.0001 1.1119
3 Prior 46.6821 <.0001 0.4225 DiagTime 58.7809 <.0001 0.2200
4 DiagTime 46.7795 <.0001 0.0974 Treatment 58.8881 <.0001 0.1072
5 Age 46.8386 <.0001 0.0591 Prior 58.9000 <.0001 0.0120
25. Mme si ceci nest pas totalement justifi, puisque lon est dans une procdure de
slection pas pas, une rgle simple consiste comparer ces accroissements la valeur
critique dun Chi2 1 degr de libert. Que lon considre ou non une stratification selon la
nature de la tumeur, on constate quaucun des accroissements nest significatif. Ceci rejoint
parfaitement les conclusions que lon pouvait tirer de lexamen des statistiques univaries.
58 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
Logrank Wilcoxon
Variable Stat. Chi2 SL Stat. Chi2 SL
Age -40.7383 0.1485 0.7000 14.4158 0.0466 0.8290
Prior -19.9435 0.1802 0.6712 -26.3997 0.8336 0.3612
DiagTime -115.9 1.4013 0.2365 -82.5069 1.3127 0.2519
Kps 1123.1 43.4747 <.0001 856.0 51.9159 <.0001
Treatment -4.2076 0.6967 0.4039 -3.1952 1.0027 0.3167
Logrank Wilcoxon
DF Variable Chi2 SL 4Chi2 Variable Chi2 SL 4Chi2
1 Kps 43.4747 <.0001 43.4747 Kps 51.9159 <.0001 51.9159
2 Treatment 45.2008 <.0001 1.7261 Age 53.5489 <.0001 1.6329
3 Age 46.3012 <.0001 1.1004 Treatment 54.0758 <.0001 0.5269
4 Prior 46.4134 <.0001 0.1122 Prior 54.2139 <.0001 0.1381
5 DiagTime 46.4200 <.0001 0.00665 DiagTime 54.4814 <.0001 0.2674
galement tre utiles dans le cadre des analyses contemporaines des don-
nes de survie. Cest particulirement le cas lorsquau lieu de connatre la
date exacte de survenue dun vnement ou dune censure on ne connat
quun intervalle de temps dans lequel lun ou lautre se ralise. Un autre
cas de figure est celui o le nombre de dures observes est important :
alors quavec KM les calculs sont raliss pour chacune de ces dures, ils ne
sont effectus que pour chacun des intervalles de temps considrs dans la
construction dune table de survie.
26. On fait apparatre lexposant * pour distinguer les estimateurs construits avec les
effectifs risque corrigs ni des estimateurs KM construits sur ni .
2.9. LES TABLES DE SURVIE - LA MTHODE ACTUARIELLE 59
di di
qi = ci = ,
ni 2
ni
et la probabilit de survie conditionnelle au cours du iime intervalle est
donc i = 1 qi .
Soit donc :
i
Y
Prob[survie au cours du i ime
intervalle] = S i = j
j=1
= i S i1
avec naturellement S 0 = 1.
60 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
Un exemple
Cet exemple utilise des donnes regroupes : on ne connat pas pour
chaque individu la date exacte de lvnement ou de la censure mais seule-
ment son appartenance un intervalle de temps correspondant ici un
dcoupage en trimestres dinformations mensuelles. Les trois premires co-
lonnes du tableau 2.12 correspondent aux informations de dpart. Ainsi,
pour la priode allant du 12ime mois inclus au 15ime mois exclu, 10 indi-
vidus sont risqus au dbut de lintervalle, 2 vont connatre lvnement
tudi et 2 sont censurs.
Notez bien que les informations affrentes un intervalle de temps donn
sont utilises pour construire lestimation de la survie pour le dbut de
lintervalle suivant. Si on fait lhypothse dune distribution uniforme des
survenues dvnements et des censures au cours de chaque intervalle de
temps, alors la reprsentation graphique ne sera plus une fonction en es-
calier mais doit simplement relier entre eux les diverses survies estimes
comme le montre le graphe 2.6.
Remarques :
Lorsque di est nul alors la probabilit conditionnelle estime sur le
iime intervalle est nulle. Ceci est naturellement techniquement exact
mais peut tre en pratique compltement irraliste et montre que
le choix des intervalles de temps a un impact sur les rsultats de
lanalyse.
Si lamplitude des intervalles tend vers zro alors les estimations
donnes par la mthode actuarielle tendent vers celles de lestima-
teur de Kaplan-Meier. Pour cette raison ce dernier est aussi appel
product-limit estimator
2.9. LES TABLES DE SURVIE - LA MTHODE ACTUARIELLE 61
Table 2.12 Exemple de calculs pour une table de survie, mthode actua-
rielle
Une des raisons pour lesquelles les deux estimateurs diffrent pro-
vient de la non similitude du traitement des donnes censures.
Par ailleurs lestimateur KM donne une estimation de la survie
pour tous les temps dvnements observs et lestimateur reste
constant entre deux temps dvnement observs, alors que la m-
thode actuarielle donne des estimations pour les dures correspon-
dant aux bornes suprieures des intervalles (avec naturellement tou-
jours S(0) = 1).
Avec la mthode actuarielle on peut encore estimer les fonctions
de risque instantan h(t) et de densit f (t). Si on note ti1,i la dure
correspondant au milieu du iime intervalle, on utilise habituellement
les expressions suivantes :
i )q
S(t i ) di
S(t n
f(ti1,i ) = i
= i
, et
ti ti1 ti ti1
qi
i1,i ) =
h(t .
qi
(ti ti1 )(1 2)
En pratique, sur petits chantillons ces estimateurs ne sont pas par-
ticulirement bons.
3 0
;
on pourrait faire :
data obs ;
input duree cens eff ;
cards ;
5 1 1
8 1 2
3 0 1
;
PLOT=(s) ou PLOT=(s,h)
Attention : avec SAS 9.2 lorsque les sorties ODS ne sont pas actives
alors PLOT=(h) graphe la courbe de risque instantan issue de lanalyse
dune table de survie, aucun graphe ntant disponible avec lestimation
de Kaplan-Meier. En revanche, avec des sorties graphiques ODS actives,
lappel de Kaplan-Meier couple avec PLOT=(h) graphe lestimation ker-
nel du risque instantan. Toujours dans ce dernier cas, un certain nombre
doptions peuvent tre couples lappel du graphique, via PLOT=h(liste
doptions) du type BANDWITDTH= , KERNEL= , CL, etc. . ..
Nous verrons lutilit ventuelle des graphes de log[S(t)] versus t et
de log{ log[S(t)]} versus log(t) dans le chapitre suivant.
68 CHAPITRE 2. LAPPROCHE NON PARAMTRIQUE
Chapitre 3
Lapproche paramtrique
69
70 CHAPITRE 3. LAPPROCHE PARAMTRIQUE
1 yc
fY (y) = fY 0 ( ) (3.4)
b b
yc
En termes de survie, on a donc galement : SY (y) = SY0 ( b ).
Yi = log(Ti ) = 0 + 1 Si + b u (3.11)
et la survie des femmes :
log(t) 0
S0 (t) = Pr[u > ] (3.12)
b
alors que celle des hommes devient :
log(t) 0 1
t
S(t) = Pr[u > ] = S0 t exp(1 ) = S0 (3.13)
b e1
Avec ce codage binaire 0/1, il vient i = e1 : si 1 > 0 le temps dclre
pour les hommes relativement aux femmes. Au contraire, si 1 < 0 le temps
74 CHAPITRE 3. LAPPROCHE PARAMTRIQUE
Remarques
1. la plupart des ajustement paramtriques de la survie ont comme ex-
plique le logarithme des temps de survie. Il est cependant possible
dans la Proc LIFEREG dexpliquer T et non pas log T en utilisant
loption NOLOG. La transformation en logarithme est galement
dsactive si vous spcifiez pour les temps dvnement une distri-
bution normale ou une distribution logistique.
2. Les distributions log-normale et de Weibull sont des exemples de
distributions qui ne sont pas des distributions position-chelle. En
revanche, ces alatoires prises en logarithme en font partie (respecti-
vement distribution normale et de Gumbel). On les retrouvera donc
naturellement lorsquil sagira de modliser le logarithme des temps
de survie.
o h() est la fonction de risque. Elle est donc crite comme le produit de
deux fonctions, lune hi 0(t) tant dpendante du temps mais pas des carac-
tristiques individuelles, et lautre, r(x) ne dpendant pas du temps mais
uniquement des caractristiques des individus. A lvidence, h0 (t) est le
risque dun individu pour lequel r(x) = 1. Pour cette raison, h0 () est gale-
ment nomm risque de base.
Lexplication du nom donn ces modles se comprend aisment si
on considre le ratio de risque affrent deux individus pour une dure
t quelconque : on obtient une fonction indpendante du temps qui est de
plus une constante si les valeurs des deux ensemble dexplicatives xi et x j
sont elles-mme invariantes :
hi (t) r(xi )
= (3.15)
h j (t) r(x j )
il vient :
hi (t) h i
= exp 1 (xi1 x j1 ) + . . . + k (xik x jk ) (3.17)
h j (t)
Remarques
1. Une caractristique des modles risque proportionnels est que si
S0 (t) est dans une certaine famille de distribution paramtriques alors
en gnral S(t) nest pas dans la mme famille, ce qui est contraire
ce quon vrifie avec les modles AFT. Ceci est une des raisons pour
lesquelles les modles paramtriques sont du type AFT plutt que
PH.
2. Un cas intressant considrer est la distribution de Weibull dont la
densit scrit :
!1 !
t t
fT (t|(x), ) = exp , (3.19)
(x) (x) (x)
avec t 0, > 0, (x) > 0.
et la fonction de risque :
" #1
t
hT (t|x) = = t1 (x) (3.22)
(x) (x)
il vient :
" Z t #
S(t) = exp du = et (3.24)
0
dS
f (t) = = et (3.25)
dt
On reconnat bien dans cette dernire expression la densit dune expo-
nentielle de paramtre . Ainsi, une fonction de risque constante quivaut
une distribution exponentielle des dures dvnement. On vrifie imm-
diatement que la proprit AFT est vrifie puisque pour deux individus i
et j diffrents caractriss par les paramtres constants i > 0 et j > 0, on
a:
3
1.5
=
= 0.5
2
= 1.0
1
0 t
0 1 2 3 4
" #
1 1 (log t) 2
fT (t) =
exp , t > c, > 0. (3.29)
2
t 2
Par ailleurs,
!
log(t)
FT (t) = , (3.30)
!
log(t)
ST (t) = 1 , (3.31)
h log(t) i
1
t
hT (t) = h log(t) i , (3.32)
!!
log(t)
HT (t) = log 1 , t > 0, > 0. (3.33)
8. "petit" car compte-tenu de la puissance de calcul des processeurs actuels, les temps
dexcution ne sont plus trs sensiblement dgrads par des appels ces procdures din-
tgration numriques.
9. On retrouve ici quelque chose que vous connaissez : en conomtrie des variables qua-
litatives, on sait quil est difficile de justifier lemploi dun Probit plutt que dun Logit : les
deux ajustements conduisent gnralement des ajustements qualitativement identiques.
3.2. LES PRINCIPALES MODLISATIONS AFT 81
h(t)
6
t1
h(t) = 1+t = 1.0
5
=
8.0
3
=
= 0.5
2 4.0
1
= 1.0
0 t
0 1 2 3 4 5
1
S(t) = (3.37)
1 + t
t1
h(t) = (3.38)
1 + t
On rappelle que si T est une alatoire log-logistique, alors Y = log T a
une distribution logistique.
Des exemples de fonctions de survie obtenues pour diverses valeurs du
paramtre de forme sont prsents dans le graphique 3.2. Rappelez-vous
galement que des volutions similaires de la fonction de risque peuvent
tre obtenues avec la distribution log-normale.
!
v || 2 2 log t
f (t) = v exp (v 2 ), v = exp (3.39)
t v( )
2
10. Gamma() est une gnralisation de la fonction factorielle des arguments rel et
complexe. Pour les entiers, on a (n) = (n 1)!
11. nomm "Shape" dans les sorties de Proc LIFEREG.
3.4. CHOIX DUNE DISTRIBUTION ET TESTS DE SPCIFICATION 83
12. On sait quun inconvnient de ce test est de rendre obligatoire lestimation des deux
modles, contraint et non contraint, pour rcuprer les valeurs des vraisemblances. Dans le
cas prsent, ceci nest pas un obstacle majeur puisquil suffit de modifier un mot clef dans
lappel de la Proc LIFEREG pour changer de distribution.
3.4. CHOIX DUNE DISTRIBUTION ET TESTS DE SPCIFICATION 85
Attention : le test LRT oppose deux modles dont lun est un cas particulier
de lautre. Il ne valide pour autant pas le modle retenu. Par exemple, si
on est amen ne pas rejeter H0 en confrontant la distribution exponen-
tielle et la Weibull, cela signifie simplement que le modle le plus simple,
ici lexponentiel, est compte-tenu des donnes disponibles au moins aussi
vraisemblable que le modle Weibull. Si on rejette H0, alors lexponentiel
est moins vraisemblable que la Weibull. Mais, quelle que soit la dcision, il
est videmment possible que les deux distributions soient en fait errones,
et que la vraie distribution soit toute autre.
1
1 [1 SLN (t)] = + log t,
" #
1 SLL (t)
log = log + log t.
SLL (t)
Ainsi, en appliquant S(t) la transformation adapt lun ou lautre
modle on devrait obtenir, avec cette transformation en ordonne et
3.4. CHOIX DUNE DISTRIBUTION ET TESTS DE SPCIFICATION 87
15. "gnralis" pouvant tre compris comme ntant pas ncessairement une mesure
dun cart entre un y observ et un y calcul, mais comme un objet devant vrifier certaines
proprits si le modle ajust est satisfaisant.
16. FU (u) = P[U u] = P[FX (X) u] = P[X F1 X
(u)] = FX [F1
X
(u)] = u. Ce thorme
est plus connu sous une formulation inverse : si U est une uniforme sur [0,1] alors X =
F1
X
(U) a comme fonction de rpartition FX (). Il fonde la mthode dite de la transformation
inverse : pour gnrer des pseudo-alatoires ayant la distribution FX (), il suffit de gnrer
des ralisations u dune uniforme sur [0,1] et de prendre x = F1 X
(u).
17. FY (y) = P[Y y] = P[ log(U) y] = P [U ey ] = 1 FU [ey ] = 1 ey . En
diffrenciant par rapport y le premier et le dernier terme de cette suite dgalits, il vient :
fY (y) = yey , et on reconnat l la densit dune exponentielle de paramtre = 1.
3.4. CHOIX DUNE DISTRIBUTION ET TESTS DE SPCIFICATION 89
un exemple
Distribution lmax
Exponentielle -983.49
Weibull -980.74
Log-normale -970.92
log-logistique -961.76
Gamma -967.50
yp = X + zp (3.43)
model duree*cens(0)=...
LIFEREG comprend que les temps reports dans la variable dure sont
censurs droite lorsque la variable cens prend la valeur 0. Dans le cas
plus gnral, il faut une autre syntaxe. La solution adopte dans LIFEREG
est dassocier chaque individu deux dures de vie Li et Ui qui seront les
imes observations des variables L et U. Leur interprtation est la suivante :
1. Si Ui est une valeur manquante, alors lindividu i est censur droite
au temps Li ,
2. Si Li est une valeur manquante, alors lindividu i est censur gauche
au temps Ui ,
94 CHAPITRE 3. LAPPROCHE PARAMTRIQUE
individu t1 t2
1 4.1 .
2 . 5.2
3 3.2 6.5
4 3.9 3.9
5 0. 4.3
6 5.6 1.7
dun modle Tobit de type 1 avec double censure, on a une variable latente
y et une variable observe y dfinies par :
21. Vous pouvez vous rafrachir la mmoire propos de ce modle et de diverses variantes
en consultant le polycopi de cours de Christophe Hurlin disponible ladresse suivante :
http://www.univ-orleans.fr/deg/masters/ESA/CH/Qualitatif_Chapitre3.pdf
96 CHAPITRE 3. LAPPROCHE PARAMTRIQUE
Pour cela nous allons reprendre un exemple donn sur le site de l"Institute
For Digital Research And Education" rattach UCLA 23 . On dispose pour
200 lves des rsultats dun test daptitude aux tudes universitaires don-
nant un score compris, par construction entre 200 et 800 (variable APT).
On veut expliquer ce score par deux autres mesures : un score de lecture
(variable READ) et un score de math (variable MATH). Une dernire variable
(variable PROG) ayant trois modalits indique le type de parcours suivi
par chaque tudiant : 1=Academic, 2=General, 3=Vocational. La censure
provient du fait que tous les tudiants ayant rpondus correctement lors
du test toutes les questions se voient attribus un score de 800, mme si
leur aptitude nest pas gale. De mme les tudiants ayant rpondu incor-
rectement toutes les questions du test reoivent une score de 200, mme si
leur inaptitude nest pas la mme 24 . Sur la variable latente APT , le modle
ajust est donc :
o,
1 si PROGi = 1,
Academici =
0 sinon,
et,
1 si PROGi = 2,
Generali =
0 sinon,
data tobit;
input id read math prog apt;
if apt = 800
then upper=.;
else upper=apt;
cards;
1 34 40 3 352
2 39 33 3 449
..
.
198 47 51 2 616
199 52 50 2 558
200 68 75 2 800
;
run;
Table 3.3 Estimation dun Probit avec censure droite via LIFEREG
run;
proc print data=predict label;
format index Predict 7.2;
run;
Dans la table 3.4, nous prsentons les rsultats des calculs pour une
dizaine dlves de lchantillon.
PROC LIFEREG
MODEL
BY
CLASS
OUTPUT <OUT=...>
WEIGHT
MODEL
La commande MODEL est requise : elle prcise notamment le nom de
lexplique, les explicatives, la distribution utilise. Elle peut prendre
trois formes dont deux seulement ont t vues ici :
MODEL explique*<censor(list)>=variables explicatives</options> ;
Sous cette forme, sil y a censure, il sagit dune censure droite.
Dans ce cas, la variable censor donne linformation ncessaire :
toutes ses observations gales aux valeurs prcises dans list
signale que pour lindividu concern, la variable explique est
censure.
MODEL(lower,upper)=explicatives</options> ;
Avec cette syntaxe on autorise une censure droite, gauche
ou par intervalle. Linterprtation seffectue selon les rgles vues
prcdemment et relatives aux valeurs des variables lower et up-
per.
Lapproche semi-paramtrique
105
106 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
Le risque devant tre positif pour toutes les valeurs des explicatives,
on respecte cette exigence en imposant une transforme logarithmique sur
lindex :
r(x) = exp (x> ) = exp(x1 1 + x2 2 + . . .) (4.2)
Soit au total 4 :
h(t) = h0 (t) exp (x> ) (4.3)
1. Ryan, Thomas P. & Woodall (2005), The Most-Cited Statistical Papers, Journal of
Applied Statistics, Vol. 32, No. 5, 461-474, July 2005
2. Avec 25 869 citations
3. Avec 18 193 citations
4. Notez qu la diffrence de lcriture du modle linaire usuel, il ny a pas de constante
dans lindex du modle de Cox pour la simple raison quelle serait indtermine. En effet,
c, h(t) = h0 (t) exp (c) exp (c + x> ). En consquence, on force c = 0 et le terme constant
ventuel est implicitement intgr la composante risque de base h0 (t).
4.1. LE MODLE DE COX ET SON ESTIMATION 107
Notez bien qu part la condition h0 (t) > 0, aucune hypothse nest faite sur
le risque de base 5 .
n i i
Y X
P hi (ti )
=
h (t )
j i Si (ti )] (4.8)
h
jRt j i (t )
i=1 i jRti
n
Y
i
hi (ti )
PL = P (4.9)
jRt h j (t i )
i=1 i
P hi (ti )
jRt h j (ti )
i
hi (ti )
P = Pr[i|ti ]
jRt h j (ti )
i
hi (ti )
Pr[i|ti ] = P (4.10)
jRt h j (ti )
i
h0 (ti )r(xi )
=P (4.11)
jRt h0 (ti )r(xj )
i
r(xC )
r(xA ) + r(xB ) + r(xC ) + r(xD ) + r(xE )
7. ces temps tant seulement ncessaires pour identifier les individus risque chaque
date de survenue de lvnement
110 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
e1 1 e1 1 e1 0
PL =
e1 1 + e1 1 + e1 0 e1 1 + e1 0 e1 0
e21
=
3e 1 + 2e21 + 1
4.1. LE MODLE DE COX ET SON ESTIMATION 111
et
PL e21 (3e1 + 2)
= >0
1 (3e1 + 2e21 + 1)2
En consquence, pour maximiser PL, va tendre vers linfini. A titre dexer-
cice, vous pouvez vrifier que si nous avions utilis le codage oppos,
savoir, sexe=0 pour les hommes et 1 pour les femmes, alors la drive de la
vraisemblance partielle obtenue serait ngative, i.e. pour la maximisation,
tendrait vers . Dans cet exemple, la sparation parfaite tient ce que
les dures longues sont exclusivement le fait des femmes.
Dans ce cas, Firth a propos de maximiser une vraisemblance partielle qui
incorpore un terme de pnalit reposant sur la matrice dinformation de
Fisher estime. La log-vraisemblance pnalise est donne par
1
log(PL ) = log(PL) + log(|I()|) (4.14)
2
log(PL)
avec I() = 2 . On peut montrer que log(PL ) est concave en mme
lorsque log(PL) est monotone. En consquence, les valeurs qui maximisent
log(PL ) restent finies mme en cas de parfaite sparation 8 . Certains auteurs,
comme Allisson, prconisent mme lemploi systmatique de la correction
de Firth : les estimateurs obtenus sur petits chantillons par maximisation
de log(PL ) seraient plus prcis et permettraient le calcul dintervalles de
confiance plus fiables que ceux drivs via la maximisation de log(PL).
En principe, les dures tant supposes tre les ralisations dune ala-
toire continue, la probabilit que deux individus ou plus connaissent lv-
nement tudi au mme instant est nulle. En pratique cependant les donnes
sont souvent releves selon une certaine discrtisation du temps (donnes
hebdomadaires, mensuelles, etc...) de sorte quil est courant quune mme
dure de survie soit affrente plusieurs individus. Fondamentalement
cela ne complique pas srieusement les critures prcdentes, simplement
le nombre de calculs peut devenir tel si on utilise la contribution exacte de
ces individus la vraisemblance partielle que des approximations ont t
proposes dont trois sont implmentes sous PHREG. Le plus simple est
de prsenter ces ajustements au moyen dun exemple. Supposons que pour
une certaine dure deux individus A et B aient connu lvnement et que
trois autres C, D, E soient risque. Pour simplifier les critures, on notera
ri = exp (> xi ), i = A, B, C, D, E.
! !
rA rB
(4.15)
r A + r B + r C + r D + rE rB + rC + rD + rE
mais il est tout aussi plausible que B ait connu lvnement avant A
et dans ce cas cette probabilit serait :
! !
rB rA
(4.16)
rA + rB + rC + rD + rE rA + rC + rD + rE
! !
rA rB
r A + r B + r C + r D + rE rB + rC + rD + rE
! !
rB rA
+ (4.17)
rA + rB + rC + rD + rE rA + rC + rD + rE
o o Dti = {i1 , i2 , . . . , idi } sont les indices des di individus pour qui
lvnement se ralise en ti . Cette approximation vite notamment
davoir rvaluer les dnominateurs des diffrents termes de la
vraisemblance partielle. Par exemple, si on reconsidre le cas des 5
individus prcdents, avec 2 vnements simultans, on aura, la
place de (4.17) lvaluation de
2rA rB
(rA + rB + rC + rD + rE )2
Du fait de la simplicit des calculs, cette mthode est une des plus po-
pulaires. Cest dailleurs cette approximation qui est mise en oeuvre
par dfaut dans la proc PHREG. La littrature souligne cependant
quelle conduit des estimations des coefficients qui peuvent tre
fortement biaiss vers zro notamment lorsque le nombre dvne-
ments concomitants di est lev relativement leffectif risque en
ti .
TIES=EFRON. Il sagit ici est de corriger le dnominateur utilis
dans lapproximation de Breslow. Si on compare celui-ci celui du
calcul exact, on peut sapercevoir quil est lvidence trop lev.
Lide dEfron est dintroduire la moyenne des risques des individus
ayant connu lvnement et non pas leur niveau de risque total.
Formellement lexpression de la log-vraisemblance devient :
k
Q
Y jDti r j
PLEFRON = Qdi hP j1 P
i (4.21)
i=1 j=1 lRt
r l d i lD t
r l
i i
dexcution est plus lev, elle semble fournir des estimations des
coefficients toujours plus proches de ceux obtenus avec la mthode
exacte.
TIES=DISCRETE. Cette option se dmarque fondamentalement des
trois prcdentes du fait que le temps est ici considr comme tant
discret : si des vnement concomitants sont observs, cest quils se
sont rellement produits simultanment et il ny a plus aucune raison
de chercher imaginer des classements dans leur ordre darrive.
Rappelons quau temps ti nous avons di individus, dont les indices
sont reprs par Dti = {i1 , i2 , . . . , idi }, qui ont connu lvnement tu-
di alors quil y avait Rti individus risqus. La probabilit que se soit
prcisment ces individus rfrencs par Dti qui aient connu lv-
nement est donc la probabilit de prendre di individus parmi tous
les individus risque, soit :
Q
jDt r j
P Q i (4.22)
Pi jPi r j
Pour rsumer, le choix entre les diverses options prcdentes doit dabord
se faire en fonction dune rponse la question suivante : le temps est-
il vraiment discret, les vnements concomitants se ralisent-ils effective-
ment au mme instant ? ou est-il continu, les vnements apparemment
116 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
La commande Model
structure des donnes en est directement affecte. Par exemple, avec la pre-
mire nous aurons en principe un seul enregistrement par individu prsent
dans lchantillon de travail, alors que la seconde rclamera gnralement
plusieurs enregistrements par individu.
1. La premire version. On prcise la nom de la variable contenant les
temps dvnements, ventuellement le signe * suivi du nom dune
autre variable et une liste de valeurs de censure entre parenthses : si
pour un individu lobservation de la deuxime variable appartient
cette liste, alors, pour cet individu le temps indiqu est un temps
dvnement censur droite. Si elle ny appartient pas, alors lv-
nement sest ralis au temps indiqu. Suit ensuite le signe = puis la
liste des variable explicatives des dures. Ainsi :
model time = x1 x2;
model time*cens(0,1,3) = x1 x2;
Dans le premier exemple il ny a pas de censure. Dans le second, si
censi {0, 1, 3} alors timei correspond une dure censure droite,
sinon, lvnement sest effectivement ralis en timei pour lindividu
de rang i.
2. La seconde version est adapte une structure de donnes de type
processus de comptage : chaque enregistrement prcise les bornes t1 et
t2 dun intervalle de dures de la forme ]t1 , t2 ], ouvert gauche et
ferm droite cest dire tel quun vnement qui se ralise en t1
nappartient pas cet intervalle alors quil y appartient sil survient
en t2 y est incluse. La variable de censure a le mme comportement
que dans la version prcdente mais nest relative qu la dure t2 .
Dans ce format, un individu donn est souvent dcrit par plusieurs
enregistrements sil est observ sur plusieurs sous-priodes. Soit par
exemple, un client masculin (variable genre code 1) qui a t suivi
pendant 24 mois aprs un premier achat. Il a repass une commande
8 mois aprs, puis une autre 20 mois aprs cet achat initial. A la fin
des 24 mois, il na plus repass de commande. Cette personne sera
dcrite par trois enregistrements :
b1 b2 cens genre
0 8 1 1
8 20 1 1
20 24 0 1
associe :
model (t1 , t2 )*cens(0) = genre contact . . .;
On notera enfin que si la borne basse dun intervalle de dures, t1
est souvent la borne haute de lintervalle immdiatement prcdent,
ce nest pas obligatoire : les intervalles peuvent tre discontinus.
La commande Class
Applique une variable catgorielle, elle va crer automatiquement
un ensemble dindicatrices qui pourront tre intgres dans lquation
estimer. Pour lessentiel, elle vite simplement le passage par une tape
Data dans laquelle on crerait les indicatrices en question. A priori son
emploi simplifie la construction de lquation estimer, limite les risques
derreur et facilite la maintenance du programme puisquun recodage de la
variable catgorielle initiale est automatiquement pris en compte, sans que
lon ait reprendre les codes de ltape Data.
Le point essentiel est videmment de connatre les modalits de cration
des indicatrices et quelles valeurs leurs sont attribues pour pouvoir inter-
prter correctement les rsultats des ajustements. Par ailleurs, mme dans le
cas simple o une indicatrice binaire, 0/1, est cre, il faut bien videmment
savoir ce que signifient le "1" et le "0". Le design des indicatrices est gr par
loption PARAM. Nous allons examiner seulement les deux valeurs les plus
courantes donnes option en supposant lexistence de deux variables :
Groupe, avec les modalits "A", "B"et "C",
4.1. LE MODLE DE COX ET SON ESTIMATION 119
de loption param=.
On vient de voir que dans le cas dune variable catgorielle com-
prenant c modalits, loption param=glm crait c variables indica-
trices, puis PHREG forait zro le coefficient de lindicatrice de
rfrence. Loption param=ref va crer seulement c1 indicatrices
en ne crant pas celle qui est mise en rfrence explicitement par
lutilisateur 11 . Pour ce faire, dans la commande Class on doit
naturellement lister les variables catgorielles considrer, mais
aussi la modalit de rfrence pour chacune delle. Ainsi les deux
commandes :
11. Cette modalit de rfrence napparatra donc pas dans la table des rsultats de
lajustement.
12. quivalentes puisque param=ref est utilis par dfaut. Habituez-vous cependant
faire apparatre explicitement la valeur des options, cela facilite la comprhension lors des
relectures ultrieures du programme que lon vient dcrire, et limite les sources derreur
notamment lorsque les valeurs par dfaut changent lorsquon passe dune procdure
lautre. Par exemple, dans SAS 9.4, comme on la signal, linstruction Class de la proc
LIFEREG a comme dfaut param=glm, alors que cette mme instruction a pour dfaut
param=ref dans la proc PHREG. Rappelons que dans la proc LOGISTIC, Class a comme
dfaut param=effect, o les indicatrices sont codes -1 dans la modalit de rfrence. Ainsi,
dans notre exemple, class groupe/param=effect crerait 2 indicatrices selon la Class
Level Information table suivante :
h( t) = h0 (t)r(x)
= h0 (t) exp (> x)
= h0 (t) exp(1 x1 + 2 x2 + . . . + k xk ) (4.24)
dh(t) = h0 (t)dr(x)
r(x)
= h0 (t) dx j
x j
= j [h0 (t)r(x)]dx j (4.25)
h(t) = h0 (t)r(x)
= h0 (t)[r(x)|x j = b] r(x)|x j = a] (4.26)
La prsence de h0 (t) fait que lon prfre mesurer limpact dune va-
riable sur le risque en termes relatifs. En effet, pour deux individus, l et m
122 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
hl (x)|x j = a)
RR =
hm (x)|x j = b)
e j a
=
e j b
= e j (ab) (4.27)
Si les deux valeurs xlj et xmj sont spare dune unit, on a videmment
RR = e j (4.28)
c i/ j = exp(> [xi x j ]]
RR (4.30)
Son calcul est donc particulirement simple et le plus difficile est sans
doute chercher dans la syntaxe des instructions
Linstruction Contrast
Avec cette instruction, on devra indiquer la valeur du coefficient de
pondration de chacun des coefficients estims. Pour cela, il faut naturel-
lement savoir identifier lexplicative correspondante chaque coefficient.
Cela est videmment simple pour les variables continues dans la mesure
ou le nom de la variable identifie galement son coefficient. En revanche,
en prsence de variables catgorielles, le nom de la variable va souvent
renvoyer plusieurs indicatrices et donc plusieurs coefficients. Dans ce cas,
linstruction Contrast exige que lon ait parfaitement compris le fonction-
nement des options PARAM= et REF= de la commande CLASS. Dans ce qui
suit, nous utiliserons toujours le systme dindicatrices cres par loption
PARAM=REF.
14. Construit partir du Chi2 de Wald. On rappelle que cet intervalle est invalid par
lutilisation de loption firth dans la commande model.
15. La syntaxe est la suivante :
Contrast ... / alpha= test= mot-clef;
o mot-clef {NONE, ALL, LR, WALD, SCORE} et || < 1. Par dfaut test=wald. Les bornes
de lintervalle de confiance sont galement calcles avec une statistique de Wald.
4.2. LES RATIOS DE RISQUE 127
Linstruction Hazardratio
A priori plus simple utiliser que linstruction Contrast dans la mesure
o elle ne suppose pas la connaissance de la structure et des valeurs des
indicatrices cres par Class : elle rclame le nom de la variable pour
laquelle on veut calculer le ou les ratios de risque, et les valeurs des autres
variables qui vont conditionner le calcul
1. Cas dune variable continue : il sagit du cas le plus simple on a vu
que pour une modification dune unit, le ratio de risque associ est
simplement e , o est le coefficient de la variable. Dans la table de
sortie standard affichant les rsultats de lestimation dun modle,
la colonne intitule "Hazard Ratio" donne dj les estimations de
ceux-ci prcisment pour une augmentation dune unit de lex-
plicative concerne. Les valeurs affiches 17 sont donc simplement
les exponentielles des coefficients indiqus en premire colonne
du mme tableau. Vous pouvez cependant tre amens calculer
un rapport de risque pour des augmentations non unitaires . Par
exemple si lge est une explicative, il peut tre plus intressant de
calculer le ratio de risque entre deux personnes qui diffrent de 5 ou
10 annes, plutt que dune seule. Dans ce cas, il suffit dexcuter la
16. Pourquoi 2 degrs de libert ?
17. Lorsquil sagit du coefficient dune variable dont limpact dpend de la valeur dune
autre explicative, typiquement en cas dinteractions explicites dans la commande Model,
PHREG ne calcule pas, et naffiche donc pas, de ratio de risque pour cette variable.
128 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
proc format;
value prog 1="long" 0="court";
value lieu 1="B" 0="A";
run;
proc phreg data=uis;
format treat prog.;
format site lieu.;
class treat(ref="court") site(ref="A") / param=ref;
model time*censor(0) = age ndrugtx treat site age*site /
risklimits;
contrast "RR, 20 ans, site B versus A" site 1 age*site 20 /
estimate=exp;
contrast "RR, 30 ans, site B versus A" site 1 age*site 30 /
estimate=exp;
contrast "RR, + 5 ans, site A" age 5 / estimate=exp;
contrast "RR, +5 ans, site B" age 5 age*site 5 / estimate=exp;
hazardratio "RR, 20 ans, site B versus A" site / diff=ref at
(age=20) cl=both;
hazardratio "RR, 30 ans, site B versus A" site / diff=ref at
(age=30) cl=both;
hazardratio "RR, 5ans de plus, site A" age / units=5 at
(site="A") cl=both;
hazardratio "RR, 5ans de plus, site B" age / units=5 at
(site="B") cl=both;
run; quit;
20. Pour encore plus dexemples, voyez Paul T. Savarese et Michael J. Patetta, An Over-
view of the Class, Contrast and Hazardratio Statements in the SAS 9.2 PHREG Procedure,
Paper 253-2010, SAS Global Forum 2010.
4.2. LES RATIOS DE RISQUE 131
24. Toujours titre dexercice, vous devriez pouvoir reconstruire leur syntaxe, et au
passage remarquez la plus grande facilit dans la prise en compte de la variable dinterac-
tion : elle doit tre explicitement traite avec contrast, elle est automatiquement gre par
hazardratio.
4.3. LESTIMATION DE LA SURVIE DE BASE 133
25. Hanley (2008) prcise lgamment le lien qui existe entre lquation (4.36) et les-
timateur usuel de Kaplan-Meier. Dans ce dernier, il ny a pas dexplicatives, tous les in-
dividus sont supposs homognes, et le risque serait estim par di /card(Rti ). La prise en
compte des ratios de risque au dnominateur revient retrouver lquivalent dun effec-
tif dindividus homognes partir densembles dindividus htrognes. On reprend son
exemple : soit un modle ayant une seule explicative, sexe=0 si la personne est une femme,
1 sinon, et son coefficient estim = 0.4054, avec donc exp () = 1.5. Si un temps dv-
nement ti on a 50 femmes et 60 hommes risque alors, le dnominateur de (4.36) est gal
(50 1 + 60 1.5) = 140. i.e. ce temps, on a lquivalent de 140 femmes. Lestimateur KM
dans cette population homogne constitue uniquement de femmes serait gal di /140, et
cest cette quantit qui est recre par (4.36).
134 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
Notez que les estimateurs prcdents sont valus sur les temps
dvnements effectifs : H 0t et S 0t sont des fonctions en escaliers.
2. Lestimateur de Flemming-Harrington :
Introduit partir de SAS 9.4, il modifie lestimateur de Breslow
en cas dvnement simultans. Alors que dans le prcdent les
individus concerns ont une pondration unitaire, de sorte que le
numrateur de 4.36 est gal di , ils vont ici recevoir des pondrations
diffrencies.
3. Lestimateur Product-Limit :
On considre un modle temps discret et on note 0i la probabi-
lit conditionnelle de connatre lvnement une dure ti pour un
individu en base, i.e. un individu pour lequel les explicatives sont
toutes de valeur nulle. On sait que la survie dun individu ayant des
>
caractristiques x j est donne par S j (t) = S0 (t)exp( x j ) et, si k est la
nombre total dvnements observs, la vraisemblance est donne
par 26
Y k Y Y
> x j > x j
L= (1 e0i ) e0i (4.39)
i=1 jDi jRi Di
e> xi
i
x
e
0i = 1 P
(4.40)
( x j )
>
jRi e
exp(> x j )
et donc une probabilit de ralisation de lvnement en ti gale 1 0i
4.3. LESTIMATION DE LA SURVIE DE BASE 135
En pratique, lorsque les effectifs des ensembles dindividus ayant les mmes
temps dvnements ne sont pas trop grands par rapport ceux des indivi-
dus risque, les courbes de survie calcules par ces trois estimateurs sont
gnralement proches.
data base0;
input age ndrugtx treat site;
format treat prog.;
format site lieu.;
cards;
0 0 0 0
136 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
0 0 0 0
;
run;
Si les explicatives sont invariantes dans le temps, alors ce ratio est une
constante relativement aux dures : si le ratio de risque entre i et j est gal
3 pour une dure de 3 mois, il doit tre gal 3 pour une dure de 12
mois, de 24 mois, etc...Il peut arriver que cette hypothse paraisse errone :
en gnral, cela survient notamment lorsque lon a une htrognit au
4.4. LANALYSE STRATIFIE AVEC LE MODLE DE COX 137
constance entre deux hommes, et qui plus est, au mme niveau dans les
deux cas : si le ratio est gal 3 entre deux femmes ayant certaines
caractristiques, il sera aussi de 3 entre deux hommes ayant les mmes
caractristiques et cela sur toutes les dures possibles. Pour obtenir ce
rsultat, lanalyse stratifie va imposer des coefficients identiques sur les
explicatives mais va estimer des risques de base spcifiques chaque
strate. Ainsi, dans le cas de deux strates A et B, nous avons :
h0,A (t) exp(1 xi1 + 2 xi2 + . . . + k xik ) si i A,
hti =
h0,B (t) exp(1 xi1 + 2 xi2 + . . . + k xik ) si i B.
donc retir toute rfrence la variable site dans la liste des explicatives
puisquil sagit de la variable de stratification. Il suffit ensuite de rclamer
lestimation de la survie des individus dont les valeurs des explicatives
sont dans le fichier verifPH. Cest ce que va faire la commande BASELINE
du programme ci-dessous. Celle-ci prend en entre le contenu de verifPH
(option covariate=nom du fichier contenant les valeurs dsires pour les
explicatives 27, 28 ), et cr en sortie le fichier surverif (option out=nom de
fichier), qui contiendra les estimateurs rclams ainsi que les valeurs des
explicatives du fichier rfrenc par covariate, de sorte pouvoir aisment
retrouver dans la nouvelle table quel individu se rapporte telle ou telle
estimation. Dans le cas prsent le mot clef loglogs demande la
sauvegarde, sous le nom lls de la transforme log log(S t ). Loption
rowid=site dans baseline permettra daffecter les observations cres, et
donc les courbes affiches par sgplot, chacun des sites 29 .
27. Notez que dans la commande baseline si vous ne spcifiez pas de fichier via
covariate=, PHREG va prendre par dfaut un individu qui aura comme caractristiques
pour les explicatives numriques la valeur moyenne de chaque variable dans la strate, et la
modalit de rfrence pour chaque variable catgorielle.
28. Notez galement que baseline peut naturellement semployer sans strata : on peut
par exemple demander des estimations de la survie, o du risque cumul pour des individus
types partir dune estimation non stratifie.
29. Pour une raison que jignore, il faut intercaler une proc sort avant lappel de sgplot.
En son absence, celle-ci relie le premier et le dernier point des deux courbes.
4.5. EXPLICATIVES NON CONSTANTES DANS LE TEMPS 141
30. Dans le cas contraire, il suffirait dintroduire une indicatrice de censure sur "du-
ree_evenement"
4.5. EXPLICATIVES NON CONSTANTES DANS LE TEMPS 143
duree
_evenement id=1 id=2 id=3 id=4
7 0 1 0 0
8 0 1 1
9 1 1
12 0
Table 4.10 Valeurs attendues pour "statut" pour chaque individu selon les
dures dvnement. La case est marque si lindividu nest plus risque.
proc phreg;
model duree_evenement= statut x1 x2 . . . xk;
if duree_statut>duree_evenement or missing(duree_statut)=1
then statut=statut_ini;
else statut=1-statut_ini;
run;
Ce rsidu est donc simplement lcart, mesur sur une dure t et pour
lindividu i, entre le nombre dvnements subis et le nombre
dvnements prvus par lquation ajuste.
Dans un modle de Cox Ni (t) vaut typiquement 0 ou 1 et, compte-tenu du
domaine de ralisation de S i (t), les rsidus de martingales appartiennent
] , 1], leur distribution est donc fortement asymtrique. Positifs, ils sont
le fait dindividus ayant connu lvnement trot tt, ngatifs ils signalent
des individus qui survivent plus longtemps que prvu lvnement 33 .
Le graphe de ces rsidus fait apparatre gnralement deux nuages de
points distincts qui distinguent individus censurs et non censurs. A des
fins dillustration, nous donnons dans la figure 4.3 le graphe de ces rsidus
obtenu en excutant le code ci dessous, repris des exemples prcdents qui
demande la cration de la table res contenant en plus des donnes
initiales les variables rmart et index contenant respectivement les
rsidus de martingales et > x.
yaxis grid;
refline 0 / axis=y;
scatter y=mart x=index / group=censor;
run;
n
X
1 (x) =
W i
I(x1i < x)M (4.46)
i=1
36. Cf. laide de Proc PHREG, section Details - Assessment of the Proportional Hazards
Model pour les curieux.
4.6. TESTS DE VALIDATION 151
Il est alors ais dobtenir la figure 4.9 et par exemple dtudier plus
spcifiquement les individus pour lesquels les rsidus de dviance sont,
en valeur absolue, suprieurs 2. En comparant les figures 4.3 et 4.9 vous
pouvez constater que ces individus atypiques sont effectivement plus
aisment identifiables, loeil nu, sur le rsidus de dviance que sur les
rsidus de martingales.
Li
DFBETA = I1 () (4.48)
>
LDi = Li I1 ()
Li (4.50)
Ces statistiques sont sauvegardes dans la table rfrence dans la
commande output= au moyen des options
DFBETA = liste de noms en nombre infrieur ou gal au nombre
dexplicatives de la commande model, k. Si la taille de la liste, k0 est
infrieure k, seules les variations des k0 premiers coefficients sont
sauvegardes.
LD= nom de variable. Cette variable contiendra les variations de la
fonction de vraisemblance associ au retrait de chaque observation.
age_logt = age*log(time);
ndrugtx_logt = ndrugtx*log(time);
treat_logt = treat*log(time);
site_logt=site*log(time);
run;
quit;
Les rsultats de la table 4.12 sont alors obtenus. Lorsque le temps nest pas
transform par passage aux logarithmes, nous arrivons aux rsultats de la
table 4.13. Aux seuils usuels de risque, nous ne pouvons rejeter la validit
de lhypothse PH pour les trois variables age, ndrugtx et site. La
conclusion diffre pour la dure du traitement selon quune
transformation logarithmique est applique (dans ce cas, non rejet de PH)
ou non (rejet de PH). Si on veut prendre ce dernier rsultat en compte, il
faudrait alors laisser la variable treat*time parmi les explicatives.
exp > xr
pr,ti = P (4.54)
>
rR exp xr
ti
Leur intrt provient du fait quils sont fonction de lcart entre les
coefficients j , j = 1, . . . , k du modle de Cox et les coefficients
j,t , j = 1, . . . , k dun modle de Cox coefficients variables avec les dures
E[sij ] = j,ti j En consquence, pour chaque explicative xj, j = 1 . . . , k, ils
vont permettre de statuer, au moins visuellement, sur le test H0 : j,ti = j
versus H1 : j,ti , j , i.e. constance versus non constance des coefficients en
fonction des dures et donc sur la validit de lhypothse PH, celle-ci
supposant leur constance.
Pour cela, on va grapher les rsidus de Schoenfeld en fonction des dures,
avec donc un graphe par explicative. Sous H0, ils devraient tre
alatoirement distribus autour de zro. Pour faciliter la lecture des
graphes, on prfre travailler avec les rsidus de Schoenfeld standardiss :
si
ri = ne I1 () (4.55)
une liste de noms pour ces rsidus. On retrouve ici les mmes rgles
quavec les statistiques DFBETA : sil y a k explicatives dans lquation
estime et si la longueur de la liste de noms est k1 < k, alors seuls les
rsidus associs aux k1 premire explicatives de la commande MODEL sont
sauvegards.
On peut ensuite ajuster une rgression locale sur chaque srie de rsidus,
lhypothse nulle tant favorise par lobtention dune horizontale. Par
ailleurs, la forme du lissage peut servir dindication quant la faon dont
le coefficient varie avec les dures.
On illustre la dmarche avec les donnes de lexemple prcdent et en
nous intressant la constance des coefficients de age et ndrugtx. Lappel
PHREG pourrait ainsi incorporer les lignes suivantes 41 :
model time*censor(0) = age ndrugtx treat site;
output out=res wtressch=wtsch_age wtsch_lndrugtx;
et se poursuivre par :
proc loess data=res;
model wtsch_age=time;
run;
proc loess data=res;
model wtsch_ndrugtx=time;
run;
On obtient finalement les graphes 4.10 et 4.11
Dans cet exemple, on ne constate pas de dviation importante par rapport
lhorizontale, ce qui joue en faveur du respect de lhypothse PH pour
les deux variables tudies.
41. Pensez alors mettre les explicatives age et ndrugtx en premire et seconde position
dans la commande model.
160 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE
la ligne
On rcupre les graphes 4.12, 4.13, 4.14 et 4.15, dans chacun desquels 40
trajectoires simules sont reprsentes en plus de lobserve, ainsi que le
test KS gnr par loption resample. En ce qui concerne ce dernier, la
table rcapitulative 4.14 est galement fournie. On constate que cette
mthode ne remet pas en cause lhypothse de risques proportionnels sauf
pour la variable relative la dure du traitement, confirmant ainsi un
rsultat antrieur (Cf. table 4.13) obtenu laide de la prise en compte
dinteractions avec les dures.
162 CHAPITRE 4. LAPPROCHE SEMI-PARAMTRIQUE