Académique Documents
Professionnel Documents
Culture Documents
C1 Statistiques
Dfinitions
Pour chaque sujet il faut connatre :
La date de dbut dobservation (cest la date
dorigine), la date des dernires nouvelles et
ltat aux dernires nouvelles.
Date dorigine :
Date qui dfinit pour chaque sujet le temps 0.
Exple : Date dinclusion dans un essai, date de
diagnostic de la premire mtastase.
Dure de surveillance :
Date des dernire nouvelle Date dorigine
Date de Point
Date au del de laquelle on ne tiendra pas
compte des informations et pour laquelle on
cherchera connatre ltat de chaque sujet.
2
Dfinitions
Temps de participation :
Si les dernire nouvelles sont antrieures la
date de point ti = D. Dernire nouvelle D.
Origine. Si le sujet nest pas dcd, il sera
considr comme perdu de vue la date de
point.
Si les dernires nouvelles sont postrieures la
date de point, ti = D. de Point D. Origine.
Si la date de point est la date de lanalyse, le
temps de participation est gal la dure de
surveillance
Exemple de calcul du temps de participation ti (en mois) et de l'tat di en ti
Numro du
Date et tat aux
Date Origine
malade
dernires nouvelles
1
2
3
4
Etat la date
de point
1/4/1977
Vivant
Vivant
DCD
Perdu de vue
ti
di
15
3
12
9
0
0
1
0
Dfinitions
Perdu de vue
Sujet dont on ne connat pas ltat la date de
point (sujet 4)
Attention cest une source de biais importants
Exclu-vivant :
Un sujet vivant la date de point (sujet 1 et 2)
Distributions de survie
Fonction de survie :
La variable dure de vie T (D. du Dcs D.
Origine) est une variable alatoire non ngative.
Cest une variable alatoire continue : la
probabilit de dcs chaque instant t est
infiniment petite. Cette hypothse nest pas
toujours vrifie : par exemple dans une tude
mettant en uvre une intervention chirurgicale,
il y a risque de dcs opratoire, dans ce cas
dautre modle peuvent tre utilis.
Densit de probabilit de dure de survie:
f(t) =lim [ prob (t < T< (t+dt) ] / dt
dt ->0
Fonction de rpartition :
t
S(t)
On sintresse la probabilit de survie ad del
de t: cest la fonction de survie
S(t) = Prob( T> t) = 1 F(t)
Fonction monotone dcroissante continue telle
que S(0) =1
Lim (S(t) = 0 quand t-> infini
5
h(t)limdt0
Proprits
h(t)
f(t)
S'(t)
d ln S t
S(t)
S(t)
dt
t
S(t)exp h(u)du
0
On a donc
H(t)h(u)duln S(t)
0
Et
f(t)h(t)exp H(t)
Courbe de survie
Tableau des valeurs
Jour
0
1
6
7
10
Exposs
100
100
97
95
92
DCD
0
3
2
PDV
0
0
0
P(DCD)
0
0,03
2/97
=0,0206
P(Viv.)
1
0,97
Pcum(Viv)
1
1*0,97
0,9794
0,97*
0,9794 =
0,95002
0,95002
Estimation de lintervalle de
confiance de la survie
Mthode de Greenwood
Si*(1
d1
d2
di
....
)
n1 n1d1 n2 n2d2
ni ni di
3
2
100(1003) 97(972)
10
11
Principe du test
Si les deux courbes de survie sont identiques,
les risques un moment donn sont les mmes
dans les deux groupes. Ainsi, si au jour 97, 176
sujets sont soumis au risque dans le groupe 1 et
162 dans le groupe 2, le nombre total d'exposs
est de 176+162 = 338. Si au jour 97, on a deux
dcs en tout, le risque lmentaire est de 2/338
soit 0,0059. Sous cette hypothse, on aurait du
obtenir dans le premier groupe 176*0,0059 =
1,04 dcs et 2-1,04 = 0,96 dans le second
groupe.
12
Hypothses alternatives
Les vnements ne surviennent pas avec la
mme frquence ou pas au mme moment
dans les deux groupes
Statistique : Khi 2
Calcul du total des vnements attendus dans un des
groupes EA
Par diffrence EB = Total des vnements - Ea
Khi 2 avec DDL = 1
Khi 2 =
(O A - E A)
E A * EB
EA + E B
Exemple
Groupe 1
Dlai
1
12
15
18
24
28
36
Groupe 1
Exposs
DCD PDV PDCV
100
0
0 0,0000
100
1
0 0,0100
99
0
4 0,0000
95
3
0 0,0316
92
4
0 0,0435
88
0
5 0,0000
83
5
0,0602
PiVI
1,0000
0,9900
1,0000
0,9684
0,9565
1,0000
0,9398
PcVi
1,0000
0,9900
0,9900
0,9587
0,9171
0,9171
0,8618
PiVI
1,0000
1,0000
0,9931
1,0000
1,0000
0,9929
0,9571
PcVi
1,0000
1,0000
0,9931
0,9931
0,9931
0,9861
0,9438
Groupe 2
Dlai
1
12
15
18
24
28
36
Gpe 2
Exposs DCD PDV PDCV
150
0
0 0,0000
150
0
5 0,0000
145
1
0 0,0069
144
0
0 0,0000
144
0
3 0,0000
141
1
0 0,0071
140
6
0 0,0429
14
Exemple
Attendus
Dlai Exposs
1
12
15
18
24
28
36
250
250
244
239
236
229
223
Total
Khi 2 =
0
5
4
0
3
5
0
(O A - E A)
E A * EB
EA + E B
0,0000
0,0040
0,0041
0,0126
0,0169
0,0044
0,0493
2
=
Attendus
Gpe 1
0,00
0,40
0,41
1,19
1,56
0,38
4,09
8,036
Attendus
Gpe 2
0,00
0,60
0,59
1,81
2,44
0,62
6,91
12,964
2
(13 - 8,036)
8,036 * 12,964
21
= 4,97 DDL = 1
Khi 2 > 3,84 Il existe une diffrence
significative entre les 2 groupes au
seuil de risque 5%
15
Mthode actuarielle
Semblable la mthode KaplanMeier mais les intervalles de temps
ne sont plus dtermins par la
survenue des vnements.
La taille des intervalles de temps est
fixe a priori : 1 semaine, 1 mois,1
an
On calcule la probabilit de survie
dans chaque intervalle => moins
exacte que Kaplan-Meieir.
Le nombre dexposs dans
lintervalle est le nombre de
personne expose en dbut
dintervalle moins la moitis des
perdus de vue dans lintervalle.
Puis les calculs sont identiques.
16
Modle de Cox :
Approche semi-paramtrique
Modle multi-varies
Permet la prise en compte simultane de
plusieurs variables pour expliquer la survie sans
donner aux fonctions de survie des formes
paramtriques prcises
Utilit de ce modle
Ajustement sur des variables pronostiques dans
un essai thrapeutique
Identification des associations de variables
pertinentes des fins pronostiques
.
17
Donnes
Donnes usuelles de survie, pour
chaque sujet
Date dorigine, Date des dernires
nouvelles et tat
Les sujets pour lesquels on ne connat
pas ltat la date de point ou ceux qui
ne sont pas mort cette date
constituent des donnes censures
Risque instantan
Cest le produit dune fonction
h0(t) qui ne dpend que du
temps et dune fonction c(b,X)
qui nen dpend pas.
La dpendance est mesure par
le vecteur des coefficients de
rgression b.
Finalement, le risque instantan
scrit :
=(t, X1,X2,..) = 0(t) exp( jXj)
La relation entre le risque instantan
et les covariables est log-linaire :
Lob )=log[(t, X1,X2,..)]
=log(0(t) + jXj)
19
Risque instantan
Si par exemple, les variables Xj
reprsentent des facteurs de risque et
si elles sont toutes gales 0, 0 (t)
est le risque instantan de sujets ne
prsentant aucun facteur de risque.
La forme de 0 (t) ntant pas prcise,
cest plutt lassociation entre les variables Xj
et la sur venue de lvnement considr qui
est lintrt central du modle. Cela revient
dterminer les coefficients j
Le rapport des risques instantans
de 2 individus dont les
caractristiques respectives sont (X
1 , X2 , ..., Xp ) et (X 1 , X2 , ...,
Xp ) est :
Variable X dichotomique
X prend les valeurs 1 ou 0 selon la prsence
ou labsence dune caractristique donne.
Le rapport des risques instantan des sujets
de la classe 1 par rapport la classe 0 est :
=(t, 1)
=(t, 1)
=e
Estimation et test
Le principe pour le modle de Cox
est de nestimer que les coefficients
j . On ne cherche pas estimer 0(t).
Les estimateurs des j sont obtenus
par la mthode du maximum de
vraisemblance. Plus exactement,
seule la partie de la vraisemblance
comportant de linformation sur les
coefficients j est retenue pour les
calculs. On parle de vraisemblance
de Cox.
On teste lhypothse H0 que le
vecteur des effets ( , ) est
nul grce 3 tests :
Le test du score
Le test de Wald
Le test du rapport de vraissemblance
22
Conclusions
Les modles multivaris permettent
de reprsenter la variable tudie en
fonction de plusieurs autres
variables.
Le modle de COX :
La variable expliquer est dichotomique,
les variables explicatives peuvent tre
qualitatives ou quantitatives.
Il permet dexprimer le risque instantan de
survenue de lvnement en fonction des
facteurs explicatifs
La rgression logistique
La variable expliquer est dichotomique,
les variables explicatives peuvent tre
qualitatives ou quantitatives.
Ce modle permet de dterminer la
probabilit de survenue de lvnement
tudi en fonction des facteurs explicatifs
23
Conclusions
Le modle de Cox
Est adapt aux donnes dont le dlai de
suivi est variable selon les sujets et aux
donnes censures
Si la priode de suivi est fixe et si il ny
a pas de donnes censure le modle de
rgression logistique convient aussi
bien que le modle de Cox.
Le modle de Cox
permet de tenir compte de linteraction des
variables explicatives
Le risque instantan est le produit dune
fonction qui dpend du temps et dune
fonction qui ne dpend que des variables
explicatives (caractristiques du sujet).
Cest lhypothse du risque proportionnel.
Le modle est multiplicatif : le risque
instantan de survenue de lvnement est
multipli par une constante quand on
change la valeur dune variable explicative
24
SAS et la survie
Analyse exploratoire :
LIFEREG : modles
paramtriques
LIFETEST pour
calculer les fonctions risque et de
survie,
tests de diffrence entre plusieurs
fonctions de survie.