Estimation Non Parametrique de Kaplan

ESTIMATION NON PARAMETRIQUE DE KAPLAN-MEIER
Estimation non paramétrique :

Les estimations non paramétriques ne dépendent pas d'une loi de distribution en particulier et
peuvent donc être utilisées lorsqu’aucune loi ne fournit d'ajustement adéquat aux données.
L’estimateur de Kaplan-Meier :
L'estimateur de Kaplan-Meier, également connu sous le nom de l’estimateur produit-limite,
est un estimateur pour estimer la fonction de survie d’après des données de durée de vie. En
recherche médicale, il est souvent utilisé pour mesurer la fraction de patients en vie pour une
certaine durée après leur traitement. Il est également utilisé en économie et en écologie.
La courbe de Kaplan-Meier :
Une courbe d’estimation de Kaplan-Meier pour la fonction de survie est une série de marches
horizontales de grandeur décroissante qui, quand un échantillon suffisamment grand est
utilisé, permet d’approcher la fonction de survie réelle dans cette population. La valeur de la
fonction de survie entre les échantillons successifs observés est considérée comme étant
constante.
Un avantage important de la courbe de Kaplan-Meier est que cette méthode peut prendre en
compte certains types de données censurées, en particulier censurées par la droite, ce qui
intervient lorsqu’un patient disparaît d’une étude, c’est-à-dire qu’on ne dispose plus de ses
données avant que l’évènement attendu (par exemple le décès), soit observé. Sur le graphique,
les petits traits verticaux indiquent ces censures. Si aucune troncature ou censure n’intervient,
la courbe de Kaplan-Meier est équivalente à la fonction de survie.
Formule :
-Soit S(t) la probabilité qu’un membre d’une population donnée ait une durée de vie
supérieure à t. Pour un échantillon de taille N dans cette population, les durées observées
jusqu’à chaque décès des membres de l’échantillon N sont :

À chaque ni correspond un ti, ni étant le nombre de personnes « à risque » juste avant le
temps ti, et di le nombre de décès au temps ti.
-L’estimateur de Kaplan-Meier est l’estimation du maximum de vraisemblance non-
paramétrique de S(t). C’est un produit de la forme :
-Lorsqu’il n’y aucune censure, ni est le nombre de survivants juste avant le temps ti.

-Lorsqu’il y a censure, ni est le nombre de survivants moins le nombre de pertes (cas
censurés). Ce sont seulement ces cas survivants qui continuent à être observés (qui n’ont pas
encore été censurés) qui sont « à risque » de décès (observé).
Ici une autre définition possible parfois utilisée :
Les deux définitions diffèrent uniquement aux moments des évènements observés. La
dernière définition est « continue à droite » tandis que la première est « continue à gauche ».
Soit T la variable aléatoire qui mesure le temps d’échec et soit F(t) sa Fonction de répartition
cumulative. On note que :
En conséquence, la définition continue à gauche de S(t) peut être préférée pour rendre
l’estimation compatible avec une estimation continue à droite de F(t).
L’estimateur de Kaplan-Meier est une statistique, et certains estimateurs sont utilisés pour
approcher sa variance. Un de ces estimateurs les plus courants est la formule de Greenwood :
Exemple :
Pour bien comprendre comment construire une courbe de survie de Kaplan-Meier,
considérons un exemple :
Imaginons que nous suivants des patients atteints d’une forme grave de cancer. On commence
le suivi au moment du diagnostic du cancer et on regarde combien de temps le patient reste en
vie après cette date. Imaginons que le premier patient décède au bout de 10mois. Le deuxième
patient atteint de la même forme de cancer décède au bout de 20mois. Et le troisième au bout
de 30mois.
La courbe de survie (les données non censurées)
Présentons les données collectées sous forme d’un tableau :

Patient Décès survenu à
1 10
2 20
3 30
Au début de la période d’observation, les trois patients sont en vie. Nous avons donc la
probabilité de survie pendant cette période égal à 1 (c’est à dire 100%). A 10mois un patient
décède alors que deux autres patients restent en vie. Cela signifie qu’à partir de 10mois la
probabilité de survie est égale à 2/3 ou 66%. On fait une marge d’escalier à 10 mois est on
continue la courbe à la hauteur de 0.66. A 20 mois un autre patient décède. Un seul patient
reste en vie. A partir de 20 mois la probabilité de survie est donc égale à 1/3 ou 33%.
Puisqu’une seule personne reste en vie sur 3. On fait une autre marche d’escalier à 20 mois et
on continue le trait à la hauteur de 0.33. En fin à 30 mois le dernier patient décède. A ce
moment, il ne reste plus de survivants. La probabilité de survie tombe à 0. On ajoute la
dernière marche d’escalier à 30 mois. Cette approche convient bien quand nous connaissons
la date de décès de chaque patient. Cela suppose aussi que tous les patients soient décédés au
moment on fait l’analyse. Or, bien heureusement, dans la vraie vie, les patients peuvent guérir
du cancer.
L’événement, le décès n’aura pas lieu pour ces patients pendant la période d’observation.
Aussi en pratique on ne connait pas toujours la date du décès, même pour les patients qui
décèdent. Par exemple, le patient peut déménager dans une autre ville ou dans un autre pays et
ne sera plus suivi par son centre médical d’origine. Dans les vraies données de survie, il y a
toujours une portion de patients pour lesquels le suivi s’arrête à un moment donné, alors que
l’événement n’a pas eu lieu. Dans ce cas, on dit que les données sont censurées. Ici, la censure
est un terme. Ce mot ne porte aucune signification négative. Il veut simplement dire que
l’événement n’a pas eu lieu pendant la période de suivi.
La courbe de survie (données censurées)

Imaginons que le patient 1 a été suivi pendant 10 mois et ensuite on l’a perdu de vue. On ne
sait pas si le décès a eu lieu après ces 10 mois, mais on sait que pendant ces mois il restait en
vie .Nous avons l’information incomplète pour ce patient .La courbe de survie doit prendre en
compte les données censurées.
Dans le tableau de données on ajoute deux mesures .Le temps de suivi du patient et aussi une
valeur binaire qui indique si le décès a eu lieu ou pas. 0 signifie que le décès n’a pas été
observé .1 indique que le décès a eu lieu au bout de la période de suivi.
Patient Time Event
1 10 0
2 20 1
3 30 1
Comme dans le cas précédent, au début les trois patients sont en vie. La probabilité de survie
est 100% on pose donc le trait à 1. Mais à 10 mois on perd de vue un patient. On ne peut pas
diminuer la probabilité de survie, parce qu’on ne sait pas si le patient est vivant ou pas. On
garde la même probabilité, par contre à partir de 10 mois, on considère que l’effectif total
n’est plus 3 mais seulement 2 personnes, et on continue l’observation. A 20 mois un autre
patient décède. Puisque notre effectif total ne compte que deux personnes à ce moment, la
marche d’escalier est plus grande. Nous avons une seule personne qui reste en vie sur 2 et pas
sur 3. La probabilité de survie est donc de 50%. Enfin, à 30 mois le dernier patient décède et
la probabilité retombe à 0.

Estimation Non Parametrique de Kaplan

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estimation Non Parametrique de Kaplan

Transféré par

Droits d'auteur :

Formats disponibles

ESTIMATION NON PARAMETRIQUE DE KAPLAN-MEIER

Estimation non paramétrique :

-Lorsqu’il n’y aucune censure, ni est le nombre de survivants juste avant le temps ti.

Présentons les données collectées sous forme d’un tableau :

La courbe de survie (données censurées)

Vous aimerez peut-être aussi