Vous êtes sur la page 1sur 26

MSPRH – MESRS

Université Oran 1 Ahmed Ben Bella Faculté de médecine


Centre Hospitalier et Universitaire d’Oran – Service d’Epidémiologie et de Médecine Préventive

Grands principes de l'analyse des


données en recherche clinique

Dr RAIAH M.
SEMEP CHUO
Email: raiahmourad@yahoo.fr
1. Introduction (1/2)

En épidémiologie et en recherche clinique, l’analyse


statistique des données consiste assez souvent à
pratiquer des tests de comparaison.

On cherche ainsi à comparer un paramètre à une valeur


de référence ou plusieurs paramètres entre eux.
Les paramètres peuvent être quantitatifs (moyenne,
médiane…) ou qualitatifs (pourcentage).
1. Introduction (2/2)

A titre d'exemple, on peut citer les situations suivantes :


La valeur moyenne de la pression artérielle systolique est-elle
statistiquement différente selon que la personne soit obèse ou non ?
La prévalence du tabac est-elle statistiquement différente selon le
sexe dans une population donnée ?
Les pourcentages de guérison dans un essai thérapeutique évaluant
des antihypertenseurs de 100 sujets hypertendus (un groupe de 50
sujets recevant le médicament A et un groupe de 50 sujets recevant le
médicament B) sont-ils statistiquement différents ?
Dans ces situations, l’objet est de comparer des
paramètres pour en sortir, le chercheur doit
recourir aux tests statistiques
2. Principe général des tests statistiques (1/2)
Le principe général d’un test est de juger si la différence observée est
due au hasard ou au contraire cette différence ne pourrait pas être due
au hasard et elle est significative.
Indépendamment de la nature d’un test, son principe et son
déroulement sont toujours les mêmes.
2. Principe général des tests statistiques (2/2)

Le principe des tests statistiques revient à formaliser un


raisonnement s’appuyant sur les étapes suivantes :

Formuler une hypothèse


Calculer le test de comparaison
Conclure par un rejet ou un non rejet de l’hypothèse
initiale
3. Formulation des hypothèses du test statistique (1/3)

Un test statistique se base sur la formulation :

d’une hypothèse de départ dite hypothèse nulle (notée


H0), qui suppose l’absence de différence entre les
deux paramètres à comparer,
contre une autre hypothèse dite hypothèse alternative
(notée H1).
3. Formulation des hypothèses du test statistique (2/3)

L’hypothèse nulle notée H0 est l’hypothèse que l’on désire


contrôler : elle consiste à dire qu’il n’existe pas de
différence statistiquement significative entre les
paramètres comparés. Cette hypothèse est formulée dans
le but d’être rejetée.
L’hypothèse alternative notée H1 est la négation de H0,
elle permet de conclure que « H0 est fausse ». La
décision de rejeter H0 signifie que H1 est réalisée ou H1 est
vraie.
3. Formulation des hypothèses du test statistique (3/3)
Si l’on reprend l’exemple de l’essai thérapeutique, pour
déterminer s’il existe une différence d’efficacité entre les deux
antihypertenseurs, on procède par un raisonnement par l’absurde
qui consiste à supposer qu’il n’y a pas de différence entre PA et
PB (ce qui suppose au préalable que H0 est vraie).
On calcule alors la probabilité d’observer les résultats obtenus
sous cette hypothèse.
Si cette probabilité est inférieure à un seuil fixé au départ (en
général 5% dit risque « de première espèce » ou alpha « α »), on
rejette l’hypothèse nulle et on accepte H1.
4. Calcul d’un test de comparaison

Une fois que les hypothèses sont clairement posées, le


test est appliqué.
Tous les tests de comparaison consistent :
1. À calculer une quantité mathématique exprimant
l’écart entre les paramètres ou les distributions.
2. À confronter cette quantité à un modèle de
distribution théorique (comparaison à une valeur
tabulaire).
5. Choix du seuil de décision et risque α (1/2)

Comme toute décision fondée sur les observations d’un


échantillon et quel que soit le test utilisé, la conclusion
d’un test statistique qui consiste à trancher entre les
deux hypothèses nulle et alternative comporte un risque
d’erreur
5. Choix du seuil de décision et risque α (2/2)

Le risque α, encore appelé seuil de décision ou seuil de


signification, est le risque de rejeter à tort l’hypothèse H0.
Ce risque, appelé risque de 1ère espèce, se retrouve
lorsque le clinicien considère qu'une différence existe
entre les échantillons alors que celle-ci est le simple fruit
du hasard.
Généralement le seuil de la signification statistique est
fixé à 5%.
6. Risque β et puissance d’un test (1/3)
L’erreur de 2ème espèce, notée β, est la probabilité d’accepter
H0 alors qu’elle est fausse.
Il s’agit de la probabilité de ne pas conclure que deux groupes
sont différents alors qu'ils le sont dans la réalité.
Le risque β est estimé à 20 %.

Par exemple, c'est le risque de prouver qu'un médicament A


n'est pas meilleur qu'un médicament B (ou un placébo)
alors qu'il l'est en réalité
6. Risque β et puissance d’un test (2/3)

Quant à la puissance d’un test statistique, elle est


donnée par la probabilité 1-β.

Ce concept mesure la capacité du test à conclure au


rejet de H0 quand celle-ci est effectivement fausse.
C'est donc sa capacité à déceler une différence
significative quand il y en a réellement une.
6. Risque β et puissance d’un test (3/3)

La puissance statistique d'un test peut être comparée à


celle d'une loupe :
Si un signe est perçu, son existence peut être
affirmée.
Dans le cas contraire, cela ne veut pas dire que ce
signe n'existe pas, mais peut être serait-il perceptible
avec une loupe plus puissante.
7. Degré de signification « p » (1/3)

Une valeur inférieure à 5% permet de conclure au rejet de


H0 en faveur de l’hypothèse alternative H1 c’est-à-dire à
l’existence d’une différence significative entre les
paramètres à comparer.
Mais on désire aller plus loin et préciser la limite du
risque pris.
On appelle degré de signification p, cette limite à
postériori
7. Degré de signification « p » (2/3)
Il convient d'appeler une différence statistique significative
toute différence qui a, au minimum, cinq chances sur 100 de se
produire simplement par hasard.
Le seuil de la signification statistique est fixé historiquement à
5 %, celui-ci peut être plus restrictif en fonction des études et
correspond au risque d'erreur α.

De ce fait, une valeur de p inférieure à 5 % rejette l'H0 et


l'hypothèse alternative est plus probable
7. Degré de signification « p » (3/3)

Il est indispensable de connaître la valeur exacte de


ce degré de signification « p » afin de désacraliser ce
seuil de p < 0,05.
Une p-value non significative ne prouve pas que
l'étude soit sans résultat, sachant que la valeur de p est
dépendante de la taille de l'échantillon, il sera difficile
de trouver une différence statistiquement significative
avec des groupes de petites tailles.
8. Notion du nombre de sujets nécessaires (NSN)

Le calcul du NSN a pour but de contrôler que


l’expérience envisagée permettra de conclure sur
l’hypothèse formulée a priori.

Le mode de calcul est dépendant du test qui sera


utilisé pour la comparaison.
9. Exemple d’interprétation d’un test statistique (1/6)
On désire comparer la pression artérielle diastolique d’un groupe
de sujets sains et d’un groupe de sujets atteints de drépanocytose.

L’étude a donné les résultats suivants :


Effectif PAD (mmHg)
Sujets sains 88 70,1
Sujets drépanocytaires 85 61,8
9. Exemple d’interprétation d’un test statistique (2/6)

On pose :
H0 : les pressions artérielles sont identiques
H1 : la pression artérielle est différente chez les
drépanocytaires
Après l’application du test statistique approprié, on a
trouvé une différence significative (p < 0,05), c’est-à-
dire H0 est rejetée.
Le degré de signification p = 0,00001.
9. Exemple d’interprétation d’un test statistique (3/6)

Interprétation :

La pression diastolique est significativement plus


basse chez les sujets atteints de drépanocytose (car p <
0,05).
Ainsi, on a une chance sur 100 000 que cette
différence est due au hasard (p = 0,00001).
9. Exemple d’interprétation d’un test statistique (4/6)
On désire étudier le risque de complications après traitement des
fractures, en fonction de l’existence d’une ouverture cutanée
(fracture ouverte). On étudie une série de 96 fractures opérées
dans un centre chirurgical.
Absence de %
Fracture ouverte Complications Total
complications complications
Non 15 65 80 17,75
Oui 6 10 16 37,5
Total 21 75 96
9. Exemple d’interprétation d’un test statistique (5/6)

On pose :
H0 : la fréquence des complications est identique qu’il y ait
ou non une fracture ouverte
H1 : il existe une fréquence de complications postopératoires
plus élevée chez les sujets présentant une fracture ouverte
Après l’application du test statistique approprié, on a
trouvé une différence non significative (p > 0,05),
c’est-à-dire H0 n’est pas rejetée (p = 0,19).
9. Exemple d’interprétation d’un test statistique (6/6)

Interprétation :
La fréquence des complications postopératoires n’est
pas significativement plus élevée chez les sujets
présentant une fracture ouverte.
En effet, on a 19 chances sur 100 que la différence
des pourcentages (17,75 % vs 37,5 %) est due au
hasard, mais pas à l’existence d’une ouverture
cutanée.
10. Conclusion

Les tests statistiques sont d’usage très fréquent en


épidémiologie et recherche clinique.
Ils sont utiles en tant qu’outil d’évaluation des résultats
des analyses comparatives :
Ils permettent de comparer une valeur observée à une valeur
de référence ou bien deux valeurs observées.
Ils concluent à l’existence ou non d’une différence
significative entre les valeurs comparées.

Vous aimerez peut-être aussi