Vous êtes sur la page 1sur 39

Biostatistiques II

Nadine Saleh
PharmD, MS, PhD
Comparaison de deux moyennes
1- Echantillons Indépendants
2- Echantillons Appariés
3- Echantillon Unique
1-Echanillons Independants
Comparaison de 2 moyennes (m1, m2) : 2 groupes de sujets d’effectifs (n1, n2)

But
− Vérifier si une différence existe entre les moyennes d’un critère de jugement (variable quantitative) chez deux
groupes de sujets ou deux populations: c’est un test d’égalité ou d’homogénéité (test de comparaison de 2
moyennes observées)

− Savoir si un écart entre ces 2 moyennes est dû à une simple fluctuation d’échantillonnage ou non, avec une
probabilité de se tromper définie à l’avance. Cette probabilité est souvent de 5 % (par défaut sur la plupart des
logiciels).

− Indiquer quelle confiance, ou incertitude, les moyennes des échantillons (ou de votre hypothèse), sont
statistiquement différentes.

- Comparer les moyennes sur 2 échantillons indépendants


Contexte de comparaison de 2 moyennes

Exemples

1- Pour comparer deux somnifères, on attribue soit le somnifère A soit le somnifère B à deux groupes de 50 sujets
chacun, groupes constitués aléatoirement. Comment montrer que B allonge plus la durée de sommeil que A?

•2- On souhaite comparer la valeur moyenne de la tension artérielle de deux groupes de patients, selon la présence ou
non d’un facteur de risque supposé (tabac, alcool, variant génétique, toxique). Les sujets se répartissent en 17 fumeurs
dont la PA moyenne m1= 148.8 et 15 non fumeurs dont la PA moyenne m2= 139.8.
Doit on considérer que la PA des fumeurs diffère de celle des non fumeurs?
Contexte de comparaison de 2 moyennes

Exemples

1- Comparaison de la moyenne d’heures de sommeil entre médicament A et B


V1 : Variable quantitative (heure de sommeil)
V2 : Variables qualitatives à 2 classes (type de médicament)

Deux traitements A et B (B = placebo),


comparer la durée de sommeil mA = 5.41h, mB = 5.02h,
Hypothèse:
H0: µA = µB
absence de différence (( on ne met pas en évidence de différence entre les deux traitements )) un gain de 0.39
h = 23 minutes n’est pas négligeable mais insuffisant pour montrer la supériorité de A sur un placebo
H1 : µA > µB (Formulation unilatérale)
A savoir

Groupes Indépendants

Signifie que l’échantillon 1 est constitué de manière indépendante de l’échantillon 2 (par opposition aux échantillons
appariés) :
- Les sujets de l’échantillon 1 ne sont pas les mêmes que ceux de l’échantillon 2

- Les 2 échantillons peuvent être d’effectifs différents.


Conditions d’application

Questions à se poser:

− Critère de jugement: Quantitatif? Variable quantitative continue

− Les groupes sont indépendants ou dépendants Choix de la technique diffère

− La distribution de la variable suit une loi normale? Distribution normale

− Le nombre d’échantillon est ≥ ou ≤ 30? Echantillon grand ou petit


Comparaison de 2 moyennes

Quand l’utiliser
− Lorsque l’analyse porte sur une relation bivariée comprenant une variable qualitative ( non métrique = nominale ou
ordinale) et une variable quantitative (métrique) (e.g comapraison de l’age entre hommes et femmes)

Exemple:
 v1 : v quantitative (ex. âge)
 v2 : v qualitative à 2 classes (ex. sexe)
Moyenne de v1 selon que v2 = x ou v2 = y

Ex : Age moyen des ♂ diffère-t-il de celui des ♀?


H 0 : mH = mF
H1 : mH  mF
Tests à utiliser
Comparaison de 2 moyennes –Echantillons Indépendants

Echantillons petits n1 et/ou n2 <30 Echantillons grands n1 et n2 ≥30

Egalité des variances


Distribution est normale? (homoscédasticité)
Des 2 groupes
Oui
Non
Oui Non

Test paramétrique:
Independant sample Ajustement de Test T
Egalite des variances T test (directement donné dans SPSS)
Test non paramétrique: (Mann-Whitney) = Test Non
T de
ou transformer la variable student
Oui Non

Test paramétrique:
Independant sample Ajustement de Test T
T test (directement donné dans SPSS)
= Test T de
student
II. Test T ou Test de Student

I- Définition

• Parfois appelé aussi test de Student-Fisher

• Il permet de comparer la moyenne de deux groupes d'observations

• Il s’applique à la comparaison de 2 moyennes issues d’un même groupe ou de deux groupes indépendants

II- Conditions de validité

• Pas de conditions particulières si n≥30

• Si n<30, la distribution de la variable étudiée doit suivre une loi normale.


Test T pour échantillons indépendants: Procédure SPSS

 Regarder les données dans « data view »


 Regarder les variables dans « variable view »
 Coder la variable qualitative ex: Sexe: homme = 1; femme = 2
 Passer à l’analyse
Première application : Procédure SPSS

 Déterminer s’il y a une différence de poids entre les hommes et les femmes de la population de
l’échantillon

 Poids femme ǂ Poids des hommes??


Première application : Procédure SPSS
Test T pour échantillons indépendants: Procédure SPSS
On sélectionne: Analyse Comparer les moyennes Test T pour échantillons indépendants

On séléctionne la variable Dépendante sur


laquelle on souhaite faire le test de comparaison
de moyennes

On sélectionne la variable qualitative à partir de laquelle


on veut faire les deux sous échantillons. On sélectionne 1
seul critère de regroupement

On définit les sous échantillons à partir des valeurs de la variable non métrique:
 utilise des valeurs spécifiques: deux codes pour les groupes à comparer [numérique (1
ou 2, 6.25 ou 12.5) ou alphanumérique (oui ou non)]

Il est possible de cliquer sur Options pour contrôler le traitement des données manquantes et le niveau de
l'intervalle de confiance
Résultats et Interprétation

le nombre de patients, la
moyenne et l’écart type de l’âge
dans les 2 populations

1 2 3
Vérification de la normalité (petits échantillons): Procédure SPSS

 Normalité de la variable dépendante (test variable)

 Trois méthodes:
1- Histogramme
2- Les valeurs de Skewness, kurtosis
3- Test de Shapriro-Wilk ou Kolmogorov-Smirnov
Histogramme: Procédure SPSS

On sélectionne: Graphs Legacy dialogs Histogram (display normal curve)


ou bien Analyse descriptive statistics Explore Plots
Autres: Procédure SPSS

On sélectionne: Analyse descriptive statistics Explore Plots Normality plots with tests
Résultats et Interprétation

La différence d’âge moyenne entre les 2


groupes

T test

5 6 4 T test ajusté

Test d’égalité des variances = Test de Levene


H0= variances égales Pour que le test de comparaison de moyennes soit
H1 = variances inégales significatif il faut que p value soit ≤ 0.05

 Si p>0.05--NS--on considère le résultat basé sur


l’hypothèse de variances égales, on lit les résultats sur la
première ligne.
Conclusion: Test de Levene non significatif --- égalité des variances---
 Si p<0.05—Significatif-----on passe à la seconde ligne T test----test sign (p=0,013) et IC ne passe pas par 0--il y a une
différence d’age entre les hommes et les femmes, les hommes sont
plus agés
Condition de normalité n’est pas satisfaite

 Si échantillons indépendants et de petite taille


 Distribution non normale (données non gaussiennes)
 Comparer les 2 moyennes: Test non-paramétrique: Mann-Witney
On sélectionne: Analyze nonparametric tests independent samples objectives cutomize analysis fields

Attention ca doit être nominale et pas


scale (continue)
Condition de normalité n’est pas satisfaite

On sélectionne: Settings choose tests cutomize analysis Mann-Witney U


2-Echantillons Appariés
Test à utiliser
Comparaison de 2 moyennes pour groupes dépendants ou appariés

n1 ou n2 <30
n1 & n2 ≥30

Distribution normale??
Normalité de la distribution de la différence
Test T de
student
Oui Non

Test non
Test T de
Paramétrique:
student
(Wicoxon)
ou transformer
la variable
Test T pour échantillons appariés:

I- Définition
• Il compare la moyenne de deux variables pour un seul groupe.
• Il permet de calculer la différence de valeurs entre les deux variables pour chaque individu et de tester si la
moyenne de ces différences diffère de 0.

Exemple:

Dans le cadre d'une étude sur l'hypertension, des mesures sont prises sur tous les patients au début de
l'étude, un traitement est administré, puis on procède à une nouvelle mesure. Par conséquent, chaque sujet
est l'objet de deux mesures, souvent nommées mesures avant et après.

Le principe est le suivant:


H0= la différence moyenne entre les mesures est égale à 0 = traitement n’a pas d’effet
H1= la difference moyenne n’est pas égale à 0 = traitement efficace
Conditions du T test apparié: Procédure SPSS
• S’assurer de la condition d’application
• Distribution normale des différences---- créer une variable di= différence de avant-après.
• Décrire cette di et voir sa normalité

Conclusion: Test NS---H0 non rejeté----distribution de di normale


---Ttest
Test T pour échantillons appariés: Procédure SPSS
On sélectionne: Analyse Comparer les moyennes Test T pour échantillons appariés

On séléctionne les deux variables


dont on souhaite comparer les
moyennes et on clique sur la flèche (il
faut sélectionner les variables en
même temps). On peut sélectionner
une ou plusieurs paires de variables

Il est possible cliquer sur Options pour contrôler le traitement des données manquantes et le niveau de l'intervalle de confiance
Résultats et Interprétation

On a un écart de 22 entre les deux


moyennes

IC n’inclut pas le p≤0.05, on peut donc en conclure que la


zero différence entre les deux moyennes est
statistiquement significative
Test non paramétrique pour échantillons appariés : Procédure SPSS
• Distribution de di non normale

On sélectionne: Analyze Non parametric test Related samples objectives customize analysis fields settings
Résultats et Interprétation
3-Echanillon Unique
Tests à utiliser
Comparaison de 2 moyennes à échantillon unique

n ≥30 n<30

Distribution normale??
Test T de
student
Oui Non

Test T de Test non


student Paramétrique : (Wilcoxon)
ou transformer
la variable
Test T pour échantillon unique:
I- Définition
• Il permet de comparer la moyenne d’une variable quantitative avec une valeur, issue de données
secondaires

• Il permet de tester si la moyenne d'une seule variable diffère d'une constante spécifiée.

Exemple:

Un chercheur souhaite tester si le QI moyen d'un groupe de 10 étudiants diffère de 100.


Test T pour échantillon unique: Procédure SPSS

N= 10
Valeur connue moyenne = 100
Moyenne de l’échantillon
N<30, il faut s’assurer de la normalité
- Tracer l’histogramme
- Calculer le test de normalité
Test T pour échantillon unique (distribution normale): Procédure SPSS

On sélectionne: Analyse Comparer les moyennes Test T pour échantillon unique

On sélectionne la variable dont on veut


comparer la moyenne à la valeur du test,
puis on entre la valeur du test
Résultats et Interprétation

Est-ce que cette moyenne est statistiquement


différente de la valeur du test (100)?

La différence entre les 2 valeurs

Conclusion: Test NS---H0 non rejeté----pas de difference


IC passe par 0---NS---- H0 non rejeté-
Test T pour échantillon unique (distribution non normale): Procédure SPSS

On sélectionne: Analyse Non parametric tests One sample objectives customize analysis field settings
Résulats et Interprétation
Synthèse

 One sample T test ou Wilcoxon


Comparaison d’une moyenne à une constante

 Two independent samples T test, T test ajusté ou Mann Witney


Comparaison de moyennes de 2 échantillons indépendants

 Paired samples T test ou Wilcoxon


Comparaison de moyennes de 2 échantillons appariés

Vous aimerez peut-être aussi