Vous êtes sur la page 1sur 25

Courbes de survie

C1 Statistiques

Dfinitions
Pour chaque sujet il faut connatre :
La date de dbut dobservation (cest la date
dorigine), la date des dernires nouvelles et
ltat aux dernires nouvelles.

A partir de ces lments on calcule :


Le temps de participation, le recul et la dure de
surveillance.

Date dorigine :
Date qui dfinit pour chaque sujet le temps 0.
Exple : Date dinclusion dans un essai, date de
diagnostic de la premire mtastase.

Date de dernire nouvelles :


Au moment de lanalyse, il faut disposer pour
chaque sujet de la date des dernires nouvelles.
Si le sujet est dcd la date des dernire
nouvelles est le dcs

Dure de surveillance :
Date des dernire nouvelle Date dorigine

Date de Point
Date au del de laquelle on ne tiendra pas
compte des informations et pour laquelle on
cherchera connatre ltat de chaque sujet.
2

Dfinitions
Temps de participation :
Si les dernire nouvelles sont antrieures la
date de point ti = D. Dernire nouvelle D.
Origine. Si le sujet nest pas dcd, il sera
considr comme perdu de vue la date de
point.
Si les dernires nouvelles sont postrieures la
date de point, ti = D. de Point D. Origine.
Si la date de point est la date de lanalyse, le
temps de participation est gal la dure de
surveillance
Exemple de calcul du temps de participation ti (en mois) et de l'tat di en ti
Numro du
Date et tat aux
Date Origine
malade
dernires nouvelles
1
2
3
4

01/01/1976 DCD le 1/7/1977


01/01/1977 Vivant le 1/1/1978
01/01/1976 DCD le 1/1/1977
01/04/1976 Vivant le 1/1/1977

Etat la date
de point
1/4/1977
Vivant
Vivant
DCD
Perdu de vue

ti

di
15
3
12
9

0
0
1
0

Dfinitions
Perdu de vue
Sujet dont on ne connat pas ltat la date de
point (sujet 4)
Attention cest une source de biais importants

Exclu-vivant :
Un sujet vivant la date de point (sujet 1 et 2)

Les perdus de vue et les exclus vivants


correspondent des donnes censures
Recul :
D. de Point D. Origine : cest le dlai
maximum potentiel dobservation du sujet

Distributions de survie
Fonction de survie :
La variable dure de vie T (D. du Dcs D.
Origine) est une variable alatoire non ngative.
Cest une variable alatoire continue : la
probabilit de dcs chaque instant t est
infiniment petite. Cette hypothse nest pas
toujours vrifie : par exemple dans une tude
mettant en uvre une intervention chirurgicale,
il y a risque de dcs opratoire, dans ce cas
dautre modle peuvent tre utilis.
Densit de probabilit de dure de survie:
f(t) =lim [ prob (t < T< (t+dt) ] / dt
dt ->0
Fonction de rpartition :
t

F(t) prob (T t) f(u)du


0

S(t)
On sintresse la probabilit de survie ad del
de t: cest la fonction de survie
S(t) = Prob( T> t) = 1 F(t)
Fonction monotone dcroissante continue telle
que S(0) =1
Lim (S(t) = 0 quand t-> infini
5

Risque instantan de dcs


Cette fonction sappelle aussi force de
mortalit ou fonction de risque

h(t)limdt0

prob ((tT t dt)/(T t)


dt

Proprits

h(t)

f(t)
S'(t)

d ln S t
S(t)
S(t)
dt
t

S(t)exp h(u)du
0

On a donc

Fonction de risque cumule


t

H(t)h(u)duln S(t)
0

Et

f(t)h(t)exp H(t)

Risque instantan de dcs


La fonction de risque h(t) fournit la
description la plus concrte dune
distribution de survie.

Courbe a : risque instantan constant, il ny


a pas de vieillissement (plage 10 15 ans)
Courbe b : le risque instantan augmente
avec lge, il y a vieillissement
Courbe c : diminution du risque instantan
avec lge (plage de 0 1 an)
7

Comparaison de courbes de survies


Probabilits conditionnelles et
indpendance
L'vnement A est dit indpendant de B
si la probabilit de voir se raliser A ne
dpend pas de la ralisation ou de la
non ralisation de B.
P(A/B) = P(A/non B) = P(A)
Si, et seulement si, A et B sont
indpendants, on a :
P(A et B) = P(A) * P(B)
Application la survie Kaplan -Meier
Soit les vnements Morts-Vivants
P(Vivant) = 1 - P(Mort)
tre vivant au jour J+1 cest ne pas tre
mort au jour 0, 1,J, J+1. Donc la
probabilit d'tre vivant au jour J et au
jour J+1 est gale au produit des
probabilits d'tre vivant au jour 0 et
jour 1 et et au jour J+1.
8

Courbe de survie
Tableau des valeurs
Jour
0
1
6

7
10

Exposs
100
100
97

95
92

DCD
0
3
2

PDV
0
0
0

P(DCD)
0
0,03
2/97
=0,0206

P(Viv.)
1
0,97

Pcum(Viv)
1
1*0,97

0,9794

0,97*
0,9794 =
0,95002
0,95002

Jour = dlai en jours entre l'entre dans l'tude et la


survenue de l'vnement.
Exposs = nombre de personnes exposes au risque au
jour j
DCD = Nombre de dcs (vnements) constats au jour J
PDV = Nombre de perdus de vue au jour J
P(DCD) = probabilit de mourir au jour J (Nombre de
dcs parmi les exposs au jour j)
P(Viv) = Probabilit au jour j d'tre en vie = 1-P(DCD)
Pcum(Viv) = Probabilit cumule de survie au jour J =
Probabilit d'tre en vie au jour J0 et J1 et Jn.

Estimation de lintervalle de
confiance de la survie
Mthode de Greenwood
Si*(1

d1
d2
di

....
)
n1 n1d1 n2 n2d2
ni ni di

Faire le calcul pour J6 avec


alpha = 0,05
Epsilon 5% = 1,96
0,95002*(11,96)*

3
2

100(1003) 97(972)

10

Comparaison de courbes de survies


Position du problme
On dsire comparer l'volution de
2 groupes de sujets.
Pour cela, on pourrait comparer
les pourcentages de dcs
survenant dans chacun de ces
groupes; ou encore comparer les
taux de survie un instant donn.
Ces solutions ne permettent pas
de tenir compte des moments
auxquels les dcs se produisent.
Le test qui permet de tenir compte
du nombre de dcs et de leur
dlais est le test du Logrank.

11

Comparaison de courbes de survies


lments ncessaires la
comparaison :
Deux tableaux de survie
Jour,
Nombre de sujets soumis au risque
juste avant ce jour,
Nombre d'vnement ce jour,
Perdus de vue,
Probabilit lmentaire,
Probabilit globale

Principe du test
Si les deux courbes de survie sont identiques,
les risques un moment donn sont les mmes
dans les deux groupes. Ainsi, si au jour 97, 176
sujets sont soumis au risque dans le groupe 1 et
162 dans le groupe 2, le nombre total d'exposs
est de 176+162 = 338. Si au jour 97, on a deux
dcs en tout, le risque lmentaire est de 2/338
soit 0,0059. Sous cette hypothse, on aurait du
obtenir dans le premier groupe 176*0,0059 =
1,04 dcs et 2-1,04 = 0,96 dans le second
groupe.
12

Comparaison de courbes de survies


Hypothses
Hypothse nulle
Les vnements surviennent avec la mme
frquence dans les deux groupes et au
mme moment.

Hypothses alternatives
Les vnements ne surviennent pas avec la
mme frquence ou pas au mme moment
dans les deux groupes

Statistique : Khi 2
Calcul du total des vnements attendus dans un des
groupes EA
Par diffrence EB = Total des vnements - Ea
Khi 2 avec DDL = 1
Khi 2 =

(O A - E A)

E A * EB
EA + E B

Si Khi 2 > Khi 2 alpha, rejet de H0


13

Exemple
Groupe 1
Dlai
1
12
15
18
24
28
36

Groupe 1
Exposs
DCD PDV PDCV
100
0
0 0,0000
100
1
0 0,0100
99
0
4 0,0000
95
3
0 0,0316
92
4
0 0,0435
88
0
5 0,0000
83
5
0,0602

PiVI
1,0000
0,9900
1,0000
0,9684
0,9565
1,0000
0,9398

PcVi
1,0000
0,9900
0,9900
0,9587
0,9171
0,9171
0,8618

PiVI
1,0000
1,0000
0,9931
1,0000
1,0000
0,9929
0,9571

PcVi
1,0000
1,0000
0,9931
0,9931
0,9931
0,9861
0,9438

Groupe 2
Dlai
1
12
15
18
24
28
36

Gpe 2
Exposs DCD PDV PDCV
150
0
0 0,0000
150
0
5 0,0000
145
1
0 0,0069
144
0
0 0,0000
144
0
3 0,0000
141
1
0 0,0071
140
6
0 0,0429

14

Exemple
Attendus
Dlai Exposs
1
12
15
18
24
28
36

250
250
244
239
236
229
223
Total

Khi 2 =

DCD PDV PDCD


0
1
1
3
4
1
11
21

0
5
4
0
3
5
0

(O A - E A)
E A * EB
EA + E B

0,0000
0,0040
0,0041
0,0126
0,0169
0,0044
0,0493

2
=

Attendus
Gpe 1
0,00
0,40
0,41
1,19
1,56
0,38
4,09
8,036

Attendus
Gpe 2
0,00
0,60
0,59
1,81
2,44
0,62
6,91
12,964

2
(13 - 8,036)
8,036 * 12,964
21

= 4,97 DDL = 1
Khi 2 > 3,84 Il existe une diffrence
significative entre les 2 groupes au
seuil de risque 5%
15

Mthode actuarielle
Semblable la mthode KaplanMeier mais les intervalles de temps
ne sont plus dtermins par la
survenue des vnements.
La taille des intervalles de temps est
fixe a priori : 1 semaine, 1 mois,1
an
On calcule la probabilit de survie
dans chaque intervalle => moins
exacte que Kaplan-Meieir.
Le nombre dexposs dans
lintervalle est le nombre de
personne expose en dbut
dintervalle moins la moitis des
perdus de vue dans lintervalle.
Puis les calculs sont identiques.
16

Modle de Cox :
Approche semi-paramtrique
Modle multi-varies
Permet la prise en compte simultane de
plusieurs variables pour expliquer la survie sans
donner aux fonctions de survie des formes
paramtriques prcises

Utilit de ce modle
Ajustement sur des variables pronostiques dans
un essai thrapeutique
Identification des associations de variables
pertinentes des fins pronostiques
.

La variable expliquer est


dichotomique, les variables explicatives
peuvent tre qualitatives ou quantitatives
Permet dexprimer le risque instantan
de survenue de lvnement en fonction
des facteurs explicatifs.

17

Donnes
Donnes usuelles de survie, pour
chaque sujet
Date dorigine, Date des dernires
nouvelles et tat
Les sujets pour lesquels on ne connat
pas ltat la date de point ou ceux qui
ne sont pas mort cette date
constituent des donnes censures

Les variables explicatives Xj


Sont qualitatives ou quantitatives

La variable T est le dlai entre la date


dorigine et la date de survenue de
lvnement
Le modle de Cox permet
dexprimer le risque instantan de
survenue de lvnement en fonction
de linstant t et des variables Xj
18

Risque instantan
Cest le produit dune fonction
h0(t) qui ne dpend que du
temps et dune fonction c(b,X)
qui nen dpend pas.
La dpendance est mesure par
le vecteur des coefficients de
rgression b.
Finalement, le risque instantan
scrit :
=(t, X1,X2,..) = 0(t) exp( jXj)
La relation entre le risque instantan
et les covariables est log-linaire :
Lob )=log[(t, X1,X2,..)]
=log(0(t) + jXj)
19

Risque instantan
Si par exemple, les variables Xj
reprsentent des facteurs de risque et
si elles sont toutes gales 0, 0 (t)
est le risque instantan de sujets ne
prsentant aucun facteur de risque.
La forme de 0 (t) ntant pas prcise,
cest plutt lassociation entre les variables Xj
et la sur venue de lvnement considr qui
est lintrt central du modle. Cela revient
dterminer les coefficients j
Le rapport des risques instantans
de 2 individus dont les
caractristiques respectives sont (X
1 , X2 , ..., Xp ) et (X 1 , X2 , ...,
Xp ) est :

=(t, X1,X2,..) = exp( jXj)


=(t, X1,X2,..) = exp( jXj)

Ce rapport ne dpend pas du temps.


Le modle est dit risques
proportionnel. Cest un hypothse
importante du modle de Cox
20

Variable X dichotomique
X prend les valeurs 1 ou 0 selon la prsence
ou labsence dune caractristique donne.
Le rapport des risques instantan des sujets
de la classe 1 par rapport la classe 0 est :

=(t, 1)

=(t, 1)

=e

Le coefficient est le logarithme du risque


instantan de la classe 1 par rapport la classe 0

De faon gnrale, les coefficients j


reprsentent leffet de la caractristique Xj
et la survenue de lvnement. Si j =0 la
jime caractristique na pas dinfluence sur
la caractristique. Si j est positif et si
2sujets ne diffrent que par leur jime
caractristique, des valeurs leve de la
jime caractristique sont associes un
risque instantan plus lev. Inversement si
j est ngatif.
21

Estimation et test
Le principe pour le modle de Cox
est de nestimer que les coefficients
j . On ne cherche pas estimer 0(t).
Les estimateurs des j sont obtenus
par la mthode du maximum de
vraisemblance. Plus exactement,
seule la partie de la vraisemblance
comportant de linformation sur les
coefficients j est retenue pour les
calculs. On parle de vraisemblance
de Cox.
On teste lhypothse H0 que le
vecteur des effets ( , ) est
nul grce 3 tests :
Le test du score
Le test de Wald
Le test du rapport de vraissemblance
22

Conclusions
Les modles multivaris permettent
de reprsenter la variable tudie en
fonction de plusieurs autres
variables.
Le modle de COX :
La variable expliquer est dichotomique,
les variables explicatives peuvent tre
qualitatives ou quantitatives.
Il permet dexprimer le risque instantan de
survenue de lvnement en fonction des
facteurs explicatifs

La rgression linaire multiple


La variable a expliquer est quantitative, sa
distribution est normale.

La rgression logistique
La variable expliquer est dichotomique,
les variables explicatives peuvent tre
qualitatives ou quantitatives.
Ce modle permet de dterminer la
probabilit de survenue de lvnement
tudi en fonction des facteurs explicatifs

23

Conclusions
Le modle de Cox
Est adapt aux donnes dont le dlai de
suivi est variable selon les sujets et aux
donnes censures
Si la priode de suivi est fixe et si il ny
a pas de donnes censure le modle de
rgression logistique convient aussi
bien que le modle de Cox.
Le modle de Cox
permet de tenir compte de linteraction des
variables explicatives
Le risque instantan est le produit dune
fonction qui dpend du temps et dune
fonction qui ne dpend que des variables
explicatives (caractristiques du sujet).
Cest lhypothse du risque proportionnel.
Le modle est multiplicatif : le risque
instantan de survenue de lvnement est
multipli par une constante quand on
change la valeur dune variable explicative

24

SAS et la survie
Analyse exploratoire :
LIFEREG : modles
paramtriques
LIFETEST pour
calculer les fonctions risque et de
survie,
tests de diffrence entre plusieurs
fonctions de survie.

Modle Cox risque


proportionnel
PHREG pour construire un
modle Cox risque
proportionnel,
validation des hypothses,
construction de modles Cox
risque non proportionnels.
25