Vous êtes sur la page 1sur 28

Principes des tests

d’hypothèse
Z. Serhier
LIM,FMPC
Objectifs

• Expliquer les étapes d’un test statistique

• Elaborer des hypothèses à tester

• Définir les risques d’erreur

• Expliquer la règle de décision d’un test d’hypothèse

• Définir la puissance statistique

• Définir le degré de signification


2
Exemple : comparaison de taux de guérison

 On souhaite comparer deux traitements dans le


cadre d’un essai randomisé sur les lombosciatiques :
◦ corticoïdes par infiltrations
◦ placebo
 Critère de jugement : succès/échec à J20 par auto-
évaluation du patient
 Planification de l’étude : inclusion prévue de 43
patients/groupe
3
Exemple : comparaison de taux de guérison

 Au terme de l’étude
◦ 85 patients inclus
◦ résultats observés :
 corticoïdes : 22/43 (51,2 %) de succès
 placebo : 10/42 (23,8 %) de succès

◦ différence statistiquement significative


 on conclut à une différence d’efficacité
entre les corticoïdes et le placebo

4
Principes des tests

• Etablir une hypothèse nulle


• Proposer une hypothèse alternative
• Choix du risque d'erreur : +++
• Observation
• Calcul d'un écart (Résultats d'un test de
comparaison)
• Interprétation finale d'un test

5
Les hypothèses a priori

• L’hypothèse nulle (H0)


• celle que l’on cherche à réfuter
• celle qui peut être « vraie », tant qu’on n’ait pas démontré le
contraire

Exemple :
H0 : Vrai pourcentage de succès identiques sous
corticoïdes et sous placebo (Tc=Tp)

6
Les hypothèses a priori

 L’hypothèse alternative (H1)


◦ hypothèse qui sera retenue en cas de rejet de l’hypothèse
nulle
◦ celle que l’on cherche à démontrer

Exemple :
H1 : Les vrais pourcentages de succès sont
différents sous corticoïdes et sous placebo

7
Hypothèse bilatérale ou unilatérale

 Selon le type du problème posé : hypothèse


alternative bilatérale ou unilatérale
◦ H1 bilatérale : lorsqu’on ne cherche pas à connaître le
sens de la différence (exemple : les taux de succès sont
différents entre les deux groupes Tc≠Tp)

◦ H1 unilatérale : lorsqu’on s’intéresse à un sens


particulier de l’inégalité (exemple : le taux de succès est
plus élevé dans le groupe traité Tc>Tp)

8
Les risques d’erreurs

 Erreur de première espèce (a)


◦ probabilité de trouver une différence statistiquement
significative alors qu’il n’y en a pas
◦ Prob (Rejeter H0 alors que H0 est vraie)
◦ 5%

Exemple :
Conclure à une différence d’efficacité entre corticoïdes
et placebo alors qu’en réalité les taux de succès sont
identiques

9
Les risques d’erreurs

• Erreur de seconde espèce ()


• probabilité de ne pas mettre en évidence une
différence statistiquement significative alors
qu’elle existe
• Prob(Ne pas rejeter H0 alors que H1 est vraie)
Exemple
Ne pas réussir à prouver une différence d’efficacité
entre corticoïdes et placebo alors que cette
différence existe
10
Puissance

• Puissance statistique : (1- )

• c’est l’aptitude à mettre en évidence une


différence lorsqu’elle existe
• on calcule un nombre de sujets nécessaire pour
obtenir une puissance donnée

11
Risques d’erreurs

Réalité
Décision
H0 vraie H0 fausse

Rejet de H0 α 1-β
(différence est (rejet à tort) (puissance)
statistiquement
significative)

Non-rejet de H0 1-α β
(pas de différence (manque de
statistiquement
significative) puissance)
Le calcul du nombre de sujets nécessaire

• Hypothèse quantitative sous H1 a priori :


• 70 % de succès sous corticoïdes
• 40 % de succès sous placebo
 (différence de 30 %)
• Risques d’erreur
• erreur de première espèce : a = 5%
• erreur de seconde espèce :  = 20%
 43 patients par groupe

13
L’expérience

• Recueil des données

• Observations

14
Test statistique

 Résultats observés :

◦ taux de succès sous corticoïdes : 22/43 (51,2 %)

◦ taux de succès sous placebo : 10/42 (23,8 %)

 Test statistique consiste à :

◦ Calculer l’écart entre les paramètres

◦ Confronter cet écart à un modèle de distribution


théorique (comparer à une valeur seuil)

15
Distribution de l’écart sous H0

Valeurs assez probables

Valeurs peu probable

-1,96 +1,96

2,3
16
• Statistique de test >=VS  Rejet de H0 (Diff
significative)
• p<=5%  Rejet de H0 (Diff significative)

17
FACULTE MEDECINE -UM6SS-CASABLANCA
Statistique de test (exemple)

◦ statistique du chi-deux observée : 6,77 (estimée à partir


des données recueillies)
◦ le chi-deux observé est supérieur à la valeur théorique
(3,84) (ou p < 0,05)
◦ degré de signification associé : p = 0,009

 rejet de H0
 on met en évidence une différence
significative entre les vrais pourcentages de
succès
18
Règle de décision

• Règle de décision (Neyman-Pearson)


• soit la statistique observée est supérieure à la valeur
théorique  p  0,05
 rejet de H0
• soit la statistique observée est inférieure à la valeur
théorique  p > 0,05
 non rejet de H0

19
Le degré de signification (« p »)

Exemple
si les taux de succès sous corticoïdes et sous
placebo sont identiques, la probabilité d’observer
une telle différence (i.e. 51,2% vs 23,8%) ou une
différence plus grande encore est de 0,009

20
Le degré de signification (« p »)

• Définition :
• quantifie le « désaccord » entre ce qu’on observe et
l’hypothèse nulle H0
• la probabilité d’observer des résultats au moins aussi
en désaccord avec l’hypothèse nulle H0 que ceux qu’on
a observés

21
Le degré de signification (« p »)

• Interprétation :

• plus le degré de signification est faible, plus on est

convaincu que les résultats observés ne sont pas en

cohérence avec l’hypothèse nulle

22
Le degré de signification (« p »)

Le degré de signification nous permet d’affirmer


avec plus ou moins de conviction qu’il y a une
différence, mais en aucun cas il ne nous renseigne
sur l’importance de cette différence

23
Le degré de signification (« p »)

 Exemple :
1) 22/43 (51,2%) vs 10/42 (23,8%)
Différence d’efficacité = 27,4% (p = 0,009)
2) 14/22 (63,6%) vs 5/21 (23,8%)
Différence d’efficacité = 39,8% (p = 0,009)
3) 1104/4200 (26,3%) vs 1000/4200 (23,8%)
Différence d’efficacité = 2,5% (p = 0,009)

24
Le degré de signification (« p »)

 La valeur de p dépend :
◦ de la différence observée entre les deux groupes
◦ de la taille d’échantillon

 S’il existe une différence réelle, aussi infime soit-elle,


entre 2 groupes, n’importe quel test statistique va
aboutir à une valeur de p inférieure à 0,05, dès lors
que le nombre de sujets étudiés sera important

25
Le degré de signification (« p »)

La signification statistique n’implique pas la


pertinence signification clinique

26
Interprétation

Ne pas mettre en évidence de différence


statistiquement significative entre deux groupes

ne signifie pas

qu’il y ait équivalence entre les deux groupes

27
Interprétation

 Un résultat non statistiquement significatif peut


avoir 2 causes :
◦ l’hypothèse H0 est vraie (i.e. il y a équivalence entre les
deux groupes)

◦ la puissance statistique n’est pas suffisante (i.e. nombre


de sujets insuffisant)

28

Vous aimerez peut-être aussi