Vous êtes sur la page 1sur 71

Les statistiques pour les Nuls en 2008

Professeur Sylvie Naveau


Hpital Antoine Bclre
Clamart

Lauteur dclare navoir aucun


conflit dintrt

Chen MS Ann Surg 2006;243:321-328

Critres dinclusion

Calcul du nombre de sujets ncssaires

Formulation bilatrale
Critre de jugement : taux de rcidive
2ans.
: 20%. Traitement percutan: 30% ;
Chirurgie: 10%.
= 5%; =20%. Nombre de sujets: 60 par
groupe.
10% carts au protocole
70
patients par groupe

Analyse statistique

,Test t de Student.
Les courbe de survie ont t calcules par
la mthode de Kaplan Meer. Les survies
ont t compares avec le test de Mantel
Cox.
Ltude pronostique multivarie a t faite
avec le modle de Cox
Tests bilatraux
Analyse en intention de traiter

Calcul du nombre de sujets ncessaires dpend du critre


de jugement

Fait intervenir deux quantits dfinies par le


problme clinique
Le bnfice escompt mesur par la
diffrence plausible entre le rsultat moyen
avec le nouveau traitement et celui du
traitement de rfrence:.
La variabilit de la rponse au traitement,
mesure par la variance de la rponse entre
sujets:.
Deux quantits dfinies par les statisticiens:
Risque
Risque

Les risques

Risque : risque de mettre en vidence


une diffrence qui nexiste pas.
Risque : risque de ne pas mettre en
vidence une diffrence qui, en ralit
existe.
La quantit (1-): la puissance (la
probabilit de mettre en vidence la
diffrence si elle existe.)

Calcul du nombre de sujets ncessaires

La connaissance de 1- est trs


importante quand on dit quune diffrence
est non significative. Ne pas mettre en
vidence de diffrence significative entre
deux traitements ne prouve nullement que
les traitements sont quivalents.

Test bilatral et test unilatral

Formulation bilatrale:On cherche


une diffrence sans lui donner de
sens priori.
Formulation unilatrale: On cherche
une diffrence en lui donnant un sens
a priori. La moyenne du groupe 1 >
celle du groupe 2 ou linverse.

Calcul du nombre de sujets ncessaires

Exemple pour une variable


quantitative:
Situation unilatrale
Groupes gaux
n=2 / x [Z(1- ) +Z(1- )]
Z(1- ) = 1.65;
Situation bilatrale:Z(1- /2) = 1.96

Tests statistiques les plus


frquents

Variables qualitatives:
Test du : analyse des tableaux de contingence
l lignes et c colonnes:pour chaque case
leffectif calcul est le produit du total de sa
ligne par le total de sa colonne divis par le total
gnral.
=(o-c)/c ; ddl=(l-1)(c-1)
Conditions dapplication:effectifs calculs5
sinon corrig de Yates ou test de Fisher
exact.

Tests statistiques les plus frquents

Variables quantitatives:
Comparaison de 2 moyennes: Test t de
Student.
t=ma-mb/s/na +s/n b
ddl=na +n b-2
Comparaison de plusieurs
moyennes:Analyse de variance
Condition dapplication: distribution normale
et galit des variances.

Tests statistiques les plus frquents

Tests non paramtriques:


Pas de contrainte de normalit de
distribution;Ils sappliquent quelque soit la
distribution de la variable dans la population.
Ces tests reposent sur la notion de rangs.
Le principe est de comparer la distribution
observe avec celle que le hasard aurait
donn.

Tests statistiques les plus frquents

Comparaison de 2 moyennes: Test de


Mann et Whitney ou de Wilcoxon ranksum test.
Comparaison de plusieurs moyennes:
Test de Kruskall et Wallis.

Tests statistiques les plus frquents

Variables quantitatives: Correction


pour comparaisons multiples.
Augmentation du risque de conclure
par erreur une diffrence
significative. Pour conclure avec un
risque de 5% si on fait 5 comparaisons
le seuil de signification de chacune des
analyses doit tre diminu 0.01.

Survie globale et sans rcidive en intention de traiter

Courbe de survie

Date dorigine

Date des DN

Temps de participation

Date de point

Temps

Recul

Donnes censures droite:Sujets perdus de vue et


sujets exclus vivants qui sont des sujets suivis
rgulirement et vivant la date de point

Courbe de survie

Mthode de Kaplan-Meer
Les taux de survie sont estims par un
calcul de probabilits conditionnelles.
Le temps est dcoup en intervalles
ingaux dbutant linstant dun dcs
et sarrtant juste avant le dcs
suivant.

Courbe de survie

Pour chaque intervalle la probabilit de


survie conditionnelle est gale la
probabilit de survivre jusqu la fin de
lintervalle sachant quon tait vivant au
dbut .
Elle est estime comme le rapport du nombre
de sujets vivants la fin de lintervalle
(nombre de sujets risque au dbut de
lintervalle le nombre de dcs dans
lintervalle) sur le nombre de sujets exposs
au risque au dbut de lintervalle.

Courbe de survie

La probabilit cumule de survie un


temps donn est gale au produit des taux
de survie conditionnelle dans les
intervalles prcdant le dernier dcs.
La probabilit cumule de survie doit tre
exprime avec son intervalle de confiance

Intervalle de confiance

lIC estime, la fourchette dans laquelle la


probabilit cumule de survie a 95% de
chance de se situer, lorsque le risque
derreur est fix 5%.

Interprtation dun intervalle de confiance

Un IC trop large est peu utile car si il a


de grandes chances dinclure la valeur
du paramtre, les valeurs limites seront
trop loignes pour reprsenter une
information utilisable dans le contexte
clinique et/ou biologique.

Courbes de survie

La comparaison des courbes de survie se


fait avec le test du logrank qui ressemble
dans sa formulation mathmatique au
sans en avoir les conditions dapplication
(pas deffectifs minimaux ncessaires)
Ce test ne sinterprte de faon simple
que si les diffrences entre les
probabilits de survie des groupes sont
toujours de mme signe , cest-- dire
lorsque les courbes ne se croisent pas.

Survie globale et sans rcidive en fonction de


la taille de la tumeur A<3cm; B>3cm et <5cm

Ajustement

La mthode dajustement permet de


prendre en compte dans le test de
comparaison les facteurs que lon sait tre
li au critre de jugement

Ajustement

Les analyses unidimensionnelles ne


tiennent pas compte de liens qui
peuvent exister entre deux variables
expliquantes.
Elles ne permettent pas , lorsque
plusieurs covariables sont
statistiquement lies au
pronostic,didentifier celle qui le sont
indpendamment des autres.

Ajustement

Exemple: La relation entre lobsit


llvation des GT.
En analyse unidimensionnelle les sujets
qui ont une augmentation des GT>100ui/l
sont plus souvent obses mais ils ont
galement une consommation dalcool plus
souvent>50g/j.

Ajustement

Exemple:Consommation dalcool,variable de confusion.

Obsit:BMI30

Augmentation des
GT>100

Consommation
dalcool 50g/j

Ajustement

Lobsit est-elle un facteur prdictif dune


lvation des GT100u/l indpendant de la
consommation dalcool

Ajustement

Mthode de Mantel Haenszel: critre de jugement et


variable dajustement sont des variables qualitatives.
Principe du test:combiner linformation provenant de
plusieurs tableaux 2x2.Chaque tableau correspondant
un niveau de la variable dajustement.
Variable dajustement: consommation
dalcool.(variable qualitative en deux classes).Niveau
1: Consommation dalcool50g/j, niveau
2:consommation dalcool<50g/j.
Pour chaque niveau on a un tableau donnant la
rpartition de llvation des GT100 , (critre de
jugement qualitatif en 2 classes) entre les patients
obses et les non obses.

Ajustement

Conditions dapplication
Absence dinteraction entre le facteur tudi (obsit)
et le facteur dajustement (consommation dalcool),
cest--dire que les diffrences de frquence dans
chaque classe ne soit pas diffrentes dune classe
lautre
Interaction qualitative : diffrence de frquence de sens
inverse dune classe lautre:ajustement impossible
Interaction quantitative:les diffrences vont dans le
mme sens mais leur importance est diffrente dune
classe lautre, calcule par un test dhtrognit, et
doit tre discute.

AJUSTEMENT

Si la liaison entre GT et obsit disparat


aprs ajustement sur la consommation
dalcool cela signifie que la liaison entre
obsit et GT en unidimensionnel ntait
quapparente. Elle tait due au fait que les
patients obses avaient une
consommation dalcool suprieure aux
patients non obses.

Analyses multidimensionnelles

lanalyse multidimensionnelle peut faire


disparatre des liaisons apparentes en analyse
unidimensionnelle avec des covariables
dnommes facteurs de confusion.
Rciproquement, des analyses
multidimensionnelles peuvent faire apparatre
des liens entre deux variables qui nont pas t
dmontrs de faon significative en
unidimensionnelle.
Les analyses multidimensionnelles permettent
dlaborer des scores prdictifs

Type danalyses multidimensionnelles prdictives

Type danalyse

Variable
explique

Variables
expliquantes

Rgression
multiple

Quantitative

Quantitatives

Rgression
logistique

Qualitative

Quantitatives et
Qualitatives

Analyse
discriminante

Qualitative

Quantitatives et
qualitatives

Modle de Cox

Censure

Qualitatives et
quantitatives

Modle de Cox ou de hasard proportionnel

Il est utilis lorsque la variable explique est une


variable censure (binaire) traduisant la survenue
dun vnement.
Le modle de Cox tient compte des sujets nayant
pas la totalit du suivi.
Modle non paramtrique sans contraintes de
distribution.

Analyses multidimensionnelles

Lanalyse comporte dabord une tude


unidimensionnelle pour slectionner [en
gnral en retenant un p (entre 0.10 et
0,25)] les covariables utilises dans
lanalyse multidimensionnelle.
Le modle ne devrait inclure au maximum
quune covariable par dix vnements, 2
pour 20, 3 pour 30 etc.

Conclusion

Le traitement percutan est aussi efficace


que la rsection chirurgicale pour le
traitement des petits CHC unique de
moins de 5 cm mais risque =20% de
conclure tort labsence de diffrence

Le but de cette tude tait de valider la valeur


prdictive du Fibrotest (FT) pour le
diagnostic du stade de fibrose dans la MAF.

Lancet 2001; 357:1069-1075

Regression logistique

Le risque de la maladie en fonction de


X1,X2,X3Xi :
R = exp(+ixi)/ [1+ exp(+ixi)]
Cette fonction de risque qui exprime une
probabilit varie entre 0 et 1.
dpend de la frquence de la maladie
les sont des paramtres qui mesurent la
relation entre le facteur et la maladie
Exp (i) est une estimation de lodds-ratio li
Xi aprs ajustement sur les facteurs pris en
compte dans la fonction logistique

Patients

Critres dinclusion :

buveurs excessifs:consommation dalcool > 50 g /jour


dans lanne prcdente.
sans hpatopathies non alcooliques.
Anticorps anti-HCV, anti-HIV et Ag HBs-.
Anomalies biologiques hpatiques justifiant la BH.

Mthodes (1)

Gold standard :Score de fibrose histologique.


Classification Mtavir
5 stades :
Stade 0 : pas de fibrose
Stade 1 : fibrose non septale
Stade 2 : quelques septa
Stade 3 : Nombreux septa
Stade 4 : Cirrhose

Dtermination prospective des constituants du FT


sauf, Haptoglobine et acide hyaluronique
(srothque).

Mthodes (2)

Analyse statistiques :

Analyse unidimensionnelle:
Test Fisher exact,,Test t de student,Mann-Whitney,
analyse de variance avec test de Bonferroni pour les
comparaisons multiples
Analyse multidimensionnelle:
rgression logistique.
Analyse diagnostique
Indices informationnelles : Se, Sp VPP, VPN
Aire sous la courbe ROC

Caractristiques des patients n = 221

Age (ans) (m esm)

47 0,7

Sexe masculin (%)

170 (77)

Alcool (g/jour)

146 7

Dure dalcoolisation (ans)

Dlai entre PBH et FT (mdiane:j)

17 1
9

Caractristiques histologiques

Taille de la biopsie (mm)


Espaces porte (n)
Fragments (n)

15 0,5
14,4 0,7
2,2 0,1

Score de fibrose:

Pas de fibrose, F0:


Fibrose non septale, F1
Quelques septa, F2:
Nombreux septa, F3:
Cirrhose, F4:
HAA (%):

16 (7%)
65 (29%)
48 (22%)
24 (11%)
68 (31%)
64 (29 %)

Variable explique : fibrose septale


F0-F1/F2-F3-F4

Analyse unidimensionnelle :
F0 F1

n
Age la biopsie
Apo A1 (g/l)
Haptoglobine (g/l)
2 macro (g/l)
GGT (UI/l)
Bilirubinmie (nmol/l)
Fibrotest
Acide hyaluronique (g/l)

81
44,11
1,70 0,06
1,60 0,09
1,71 0,07
224 43
17 9
0,29 0,02
64 42

F2 F3 F4
140
48,80,9
1,2 0,05
1,2 0,07
2,2 0,05
391 32
60 7
0,66 0,02
455 31

<0,002
<0,002
<0,002
<0,002
<0,002
<0,002
<0,002
<0,002

Valeurs du FT selon le score de fibrose

1.00

0.67

0.33

0.00
0

Fibrosis

Valeurs de lacide hyaluronique selon le


score de fibrose

2000.0

Hyalu

1333.3

666.7

0.0
0

Fibrosis

Variable explique:fibrose septale


(F0-F1/F2-F3-F4) prevalence :63%
Comparaison de la valeur diagnostique du
Fibrotest et de lAcide hyaluronique

AUROC:

Fibrotest

Ac.hyaluronique

0,84 0,03

0,79 0,03

Roc curves du fibrotest et de lacide


hyaluronique pour le diagnostic dune fibroseF2
1.00

Hyalu
Fibrotest

Sensitivity

0.75

0.50

0.25

0.00
0.00

0.25

0.50

1-Specificity

0.75

1.00

Courbes ROC (Receiver Operating Characteristic)

Permet de guider le choix du seuil dune


variable quantitative
Chaque point sur la courbe reprsente une
valeur seuil.
Laxe des ordonnes correspond la
sensibilit et laxe des abscisses (1spcificit)(faux positifs:probabilit davoir le
signe quand on nest pas malade).
Une valeur seuil optimale est celle qui
correspond au point dinflexion de la courbe.

COURBE ROC DU TP POUR LE DIAGNOSTIC


DE CIRRHOSE (n=1026) prvalence de la
cirrhose 28,5%
100
90
80

SENSIBILITE

80

94
88 90 92
83 86

100

97

75
72

70

68

60

64

50
40

59

30

55
52

20

46
43

10

24

0
0

20

40

60

80

100

1-SPECIFICITE
S.Naveau et al Gastroenterol Clin Biol 1999;23:1215-1224

Valeur diagnostique du TP (n:1026)


TP
Sensibilit
Spcificit
VPP
VPN

< 80 %
84 %
92 %
81 %
94 %

Prvalence de la cirrhose : 28,5 %


S.Naveau et al Gastroenterol Clin Biol 1999;23:1215-1224

Courbes ROC (Receiver Operating Characteristic)

Laire sous la courbe ROC correspond la valeur


diagnostique du test.

Plus laire sous la courbe ROC est importante


meilleur est le test, pour prdire une maladie.

La ligne diagonale est une ligne de rfrence puisque


cest la courbe ROC dun examen sans valeur
diagnostique

Courbes ROC (Receiver Operating Characteristic)

Les valeurs de laire sous la courbe vont de


0 1.
Laire sous la courbe est la probabilit que
la valeur dun examen dun sujet tir au
sort partir de la population de malades
soit plus levs que celle dun autre sujet
tir au sort partir dune population de non
malades
On peut comparer les aires sous les
courbes ROC.

Variable explique:fibrose septale:


F0-F1/F2 F3 F4

prvalence : 63 %

Valeur diagnostique du Fibrotest

Seuil du FT
0,30
0,70

Sensibilit
0,84
0,55

Spcificit
0,66
0,93

VPP
0,82

VPN
0,70

0,93

0,53

Evaluation diagnostique
M+

M-

S+

Vrais Positifs
VP

Faux Positifs
FP

S-

Faux Ngatifs
FN

Vrais Ngatifs
VN

VP + FN

FP + VN

* Sensibilit d un examen :
probabilit pour un sujet malade
de prsenter un rsultat positif
l examen : P (S+/M+).
* Spcificit :
probabilit pour un sujet non
malade de prsenter un rsultat
ngatif l examen : P (S-/M-).

* La valeur prdictive positive :


probabilit d tre malade chez
les sujets dont le rsultat de
de l examen est + :
P (M+/S+).
* La valeur prdictive ngative :
probabilit d tre non malade
chez les sujets dont le rsultat
de l examen est ngatif:
P (M-/S-).

Evaluation diagnostique

Les VPP et VPN dpendent de la prvalence


Lorsque la prvalence diminue la VPP
diminue et la VPN augmente

Critre de jugement : cirrhose , F0-F3/F4 ,


prvalence : 31%
Comparaison de la valeur diagnostique du
Fibrotest et de lAcide hyaluronique

AUROC:

Fibrotest

Acide hyaluronique

0,950,01

0,930,03

Roc curves du fibrotest et de lacide


hyaluronique pour le diagnostic de F4
1.00

Hyalu
Fibrotest

Sensitivity

0.75

0.50

0.25

0.00
0.00

0.25

0.50

1-Specificity

0.75

1.00

Critre de jugement :Cirrhose, F0-F3/ F4


prvalence : 31%

Valeur diagnostique du Fibrotest

Seuil du FT

Sensibilit

Spcificit

VPP

VPN

0,30

1,00

0,50

0,47

1,00

0,70

0,91

0,87

0,76

0,96

Conclusion

Chez le buveur excessif le Fibrotest est un


estimateur quantitatif simple et non invasif de la
fibrose hpatique.
Sa sensibilit est meilleure que celle de lacide
hyaluronique pour le diagnostic des formes
modres.
Lutilisation du Fibrotest devrait aider mieux
poser lindication de la BH chez les patients
ayant une maladie alcoolique du foie.

Vous aimerez peut-être aussi