Vous êtes sur la page 1sur 44

COMPARAISON DE

MOYENNES
ISED/UCAD
Objectifs éducationnels
spécifiques
n A la fin de la séance, le stagiaire doit être capable
de :
u choisir le test de comparaison de deux

moyennes en fonction des caractéristiques des


données
u définir les conditions nécessaires à la
réalisation du test
u donner les règles de décision

u effectuer le calcul

u tirer les conclusions


TESTS DE COMPARAISON DE
MOYENNES
n 1- Comparaison d’une moyenne observée a une
moyenne donnée
u 1.1 Bases théoriques

u 1.2 Grands échantillons N≥ 30 et s connu

u 1.3 Grands échantillons N≥ 30 et s inconnu

u 1.4 Petits échantillons s connu et P normale

u 1.5 Petits échantillons s inconnu et P normale

n 2- Comparaison de 2 moyennes observées


u 2.1 Grands échantillons N1 ≥ 30 N2 ≥ 30

u 2.2 Petits échantillons

n 3- Les deux séries de mesure sont appariées


u 3.1 Test paramétrique
Comparaison d’une moyenne
observée a une moyenne
donnée
BASES THEORIQUES
n Supposons une population distribuée normalement avec
une moyenne µ et une variance s²
n Si on prélève un échantillon aléatoire et que l’on calcule la
moyenne x ,peut on en conclure, si x est différent de µ,
que la moyenne a changé
n On peut simplement mesurer la différence entre x et µ :
u Si la différence est grande on est tenté de dire que la

moyenne a changé
u Si la différence est faible on est tenté de dire que la

moyenne n’a pas changé


n Deux critiques
u On tient pas compte de la variance s²

u Que signifie différence grande? Différence petite?


BASES THEORIQUES
n Pour tirer une conclusion, on raisonne de la
façon suivante :
u on suppose que la moyenne n’a pas changé

u l’échantillon est tiré d’une population normale


N(µ,s²).
u La distribution d’échantillonnage sera N(µ,

s²/n)
u La variable centrée réduite Z

x-µ
=Z est N(0,1)
s n
BASES THEORIQUES
n Si Z est proche de 0 on dira que la moyenne
n’a pas changée
n Si Z est significativement loin de 0 on dira
que la moyenne a changé

Z
0

Région critique Région critique

Région critique = zone de rejet de H0


BASES THEORIQUES
n Il faut définir des valeurs critiques qui
délimiteront la zone de non rejet et les
zones de rejet.
n En général on considère que l’on rejette
l’hypothèse d’égalité des moyennes si Z
tombe dans l’une des régions critiques. Les
valeurs critiques sont choisies de telle
manière que la probabilité de Z à l’intérieur
des régions critiques est de 5%.
GRANDS ECHANTILLONS

n I- GRANDS ECHANTILLONS N≥ 30 s²
CONNU
n II- GRANDS ECHANTILLONS N≥ 30 s²
INCONNU
GRANDS ECHANTILLONS N≥ 30 s²
CONNU
n Comme il a été indiqué ci-dessus, on étudie la
paramètre x - µ qui suit une loi normale N(0,1)
Z=
s n
n Remarque : il faut définir avant tout calcul:
u Les hypothèses statistiques

u Le seuil de signification

u Les conditions d’application du test

u La statistique qui convient

u La règle de décision

après le calcul
u La décision et la conclusion
GRANDS ECHANTILLONS N≥ 30 s²
CONNU
n Exemple: on sait que la réponse à un ttt ARV chez des
sujets VIH + est µ=23,7 jours avec une variance de 16. On
donne une drogue x à 100 sujets et on trouve x = 22,7
jours.
u La drogue a-t-elle modifié le temps de réponse au ttt
n Solution
u 1. Hypothèses statistiques
t H0 x = 23,7
t H1 x # 23,7
u 2. Seuil de signification
t α= 0,05 test bilatéral
u 3. Conditions d’application du test
t Échantillon aléatoire provenant d’une population de
variance connue, Grand échantillon
GRANDS ECHANTILLONS N≥ 30 s²
CONNU
4.Statistique x-µ
u
=Z
s n µ=23,7 s²= 16
Z est distribué suivant la loi normale centrée réduite
u 5. Règles de décision

D’après H1 et au seuil α= 0,05 les valeurs


critiques de l’écart réduit sont :
Z0,025= +1,96 Z0,025= -1,96
test bilatéral
On adopte la règle suivante:
Rejeter H0 si Z>+1,96 ou Z<-1,96
Sinon, ne pas rejeter l’hypothèse H0
GRANDS ECHANTILLONS N≥ 30 s²
CONNU
u 6- Calcul de l’écart réduit
22,7 - 23,7 -1
Z= = = -2,5
4 100 0,4

u7- Conclusion
La valeur Z=-2,5 se situe dans la zone de rejet de
H0
La drogue modifie la réponse au traitement

Z
-2,5 -1,96 0 +1,96
GRANDS ECHANTILLONS N≥ 30
s² INCONNU
n On vas estimer s² par
s² =
å (x i
)
-x ²
N -1
n C’est en général le cas: s² est inconnu
n L’hypothèse H0 est µ = x

n Le paramètre Z x-µ suit une loi normale


Z=
s n

centrée réduite N (0,1).


GRANDS ECHANTILLONS N≥ 30
s² INCONNU
n Exemple
u Soit un échantillon de 82 garçons âgés de 13
ans. La moyenne x = 43,5kg.
u Peut-on estimer que cet échantillon provient

d’une population dont la moyenne est µ= 44kg.

å (x - x ) ² = 522
On a
i

n Solution
u 1- Hypothèses statistiques:

t H 0
x = 44kg

H 1
x ¹ 44kg
GRANDS ECHANTILLONS N≥ 30
s² INCONNU

u 2- Seuil de signification: α=0,05


u 3- Condition d’application du test

t Grand échantillon, variance de la population


inconnue
t s² est estimé par
s² =
å( x i
)
-x ²
N -1

u 4- statistique
x-µ
µ=44
Z =
s n
x =43,5kg
GRANDS ECHANTILLONS N≥ 30
s² INCONNU
t Z est distribué suivant une loi normale
centrée réduite
u 5- Règle de décision

t D’après H1 et au seuil α=0,05, les


valeurs critiques sont
Z0,025= +1,96 Z0,025= -1,96
test bilatéral
On adopte la règle suivante:
Rejeter H0 si Z > +1,96 ou Z < -1,96
Sinon, ne pas rejeter l’hypothèse H0
GRANDS ECHANTILLONS N≥ 30
s² INCONNU
å (x )
u 6-Calcul de Z
-x ² 522
= 2,54
i
t Calcul de s → s= s=
N -1 82 - 1
43,5 - 44 - 0,5
Z= = = -1,78
2,54 82 2,54 82
u 7-Conclusion
t La valeur Z= -1,78 se situe dans la région

d’acceptation de H0
t On peut estimer que l’échantillon provient de la

population où m= 44 kg
-1,78

-1,96 0 +1,96 Z
Petits échantillons
q Petits échantillons s² connue, population normale

q Petits échantillons s² inconnue, population normale


PETITS ECHANTILLONS s² CONNUE,
POPULATION NORMALE

n Puisque la variable suit une loi normale dans la


population et sa variance est connue, la paramètre
Z suit une loi normale centrée réduite

x-µ
Z =
s N
n Nous sommes dans le même cas que grand
échantillon N ≥ 30 s² connue
n On utilise la loi de STUDENTÞ Table de STUDENT
Petits échantillons s² inconnue,
population normale
n On estime s² variance inconnue par s² (s²
estimateur de s²)

s=
å (x i
)
-x ²
N -1

x - µ
t =
n Le paramètre t s N
est distribué suivant la loi de Student avec N-1
degrés de liberté
Petits échantillons s² inconnue,
population normale

n Exemple
u On connaît la concentration plasmatique du
calcium chez le sujet sain d’âge 20 à 44 ans µ=
2,5mmol/l. Chez 18 malades on a trouvé
x =3,2 mmol/l avec s estimé = 1,1mmol/l
u La concentration plasmatique du calcium a-t-elle
variée?
Petits échantillons s² inconnue,
population normale
n 1- Hypothèse statistique
u H0 x = 2,5
H1 # 2,5
u
x
n 2- Seuil de signification α= 0,05
n 3- Conditions d’application du test
u Échantillon aléatoire provenant d’une population normale,
variance inconnue, petit échantillon N<30
n 4- Statistique
u En supposant H0 vraie, la statistique de x suit une loi de
Student avec N-1 degrés de liberté

x - µ
t =
s N
Petits échantillons s² inconnue,
population normale
n 5- Règle de décision
d’après H1 au seuil α=0,05 et avec 18-1 degrés de
libertés la valeur critique de l’écart réduit est:
t0,05;17= 2,11.
La règle de décision est: rejeter H0 si t >2,11 sinon
ne pas rejeter H0 (test unilatéral)
n 6- Calcul de t 3,2 - 2,5 0,7
t= = X 18 = 2,7
1,1 18 1,1
n 7- Conclusion
u Puisque t >2,11 donc on rejette H0. Les résultats
sont augmentés chez les malades
Comparaison de 2 moyennes
observées
Grands échantillons n1≥ 30 n2 ≥30

n On va rechercher si 2 échantillons ε1et ε2


peuvent provenir de la même population de
répartition normale

n 2 cas:
u cas où l’on connaît variance s² commune

u cas où la variance commune est inconnue


Grands échantillons n1≥ 30 n2 ≥30
n Si nous avons 2 populations normales de variance
commune s² de moyenne µx µy.
u La distribution d’échantillonnage de
x est
æ s ² ö
ç
N
ç µ ÷ ,
÷
è
X
n1 ø
u La distribution d’échantillonnage de y est
æ s ² ö
N ç
ç µ ÷ ,
÷ æ s² s ² ö÷
è
y
n2 ø N ç
ç xµ-
y
,
N
µ
+
N ÷
è 2 ø
u La différence x - y est ou encore
1

æ æ 1 1 ö ö
Nç µ - µ , s ²ç
ç
+ ÷÷
ç
è
x y
è N1 N 2 ÷ø ÷ø
Grands échantillons n1≥ 30 n2 ≥30
u Les hypothèses à tester seront

H :µ = µ
0 X y
(µ - µ ) = 0
x y

H :µ ¹ µ
1 X y

n Si la variance commune est inconnue, on estimera


cette variance à partir des variances des
échantillons ( les échantillons sont grands)
u Le paramètre étudié

Z =
(x 1
- x 2
)- 0
2 2
s 1
+ s 2

N 1 N 2
Grands échantillons n1≥ 30 n2 ≥30

u eIle suit une loi normale réduite centrée N(0,1) si


H0 est vraie c’est à dire si

x1
- x 2
=0 ou

x1
= x 2

u La règle de décision sera: rejeter H0 si Z>Zα/2 ou


Z<- Zα/2
Grands échantillons n1≥ 30 n2 ≥30
n Exemple
u Dans une population A, le dosage d’un métabolite
urinaire a donné les résultats suivants:
nA= 100 x = 6,3 mg/ 24 heuressA= 1,7
A

u dans une population B, on a obtenu les résultats


suivants :
nB= 253 = 4,5 mg/ 24 heuressB= 1,5
x B

u Le métabolite urinaire est-il en quantité différente dans


la population A et dans la population B? (Risque α=
0,05)
Grands échantillons n1≥ 30 n2 ≥30
n Solution H 0 x A = xB
u 1- hypothèses statistiques
H 1 x A ¹ xB
u 2- Seuil de signification α=0,05

u 3- Conditions d’application du test :

variances inconnues mais grand échantillons


u 4- Statistique à utiliser

Z = x A
- x
B
2 2
s A
+ s B

N A N B

Distribué suivant N(0,1) si H0 est vraie


Grands échantillons n1≥ 30 n2 ≥30
u 5- régle de décision
t Zcritique=1,96

t On rejette H0 si |Z|>1,96

u 6- Calcul de Z

6,3 - 4,5 1,8


Z = = = 9,28
2 2 0,194
1,7 +
1,5
100 253
u 7- Conclusion: On rejette l’hypothèse nulle H0 de
l’égalité des moyennes observées. Les deux
moyennes observées ne proviennent pas de
population identique.
Petits échantillons
n Hypothèses : populations normales, de variances
inconnues mais supposés égales s1²= s2²= s² et
l’un des échantillons ou les deux sont petits < 30.
n Dans ce cas la distribution x1 x2
- est normale
n Hypothèse: H 0 : µ 1 = µ 2
H 1
: µ 1
¹ µ 2

n La distribution de l’écart réduit, en supposant H0


vraie, est x - x2 et suit une loi de
t = 1

1 1 Student à u= N1+N2-2
s +
N 1 N 2 degrés de liberté
n La variance commune est estimée par
2 å (x i1 x ) + å (x - x
- 1 i2 )
2
s =
(N + N - 2)
1 2
Petits échantillons
n Exemple :
u On veut étudier si l’absorption d’une drogue
modifie la réaction à un test.
u On a obtenu les résultats suivants

166 167 169 170 174 167 162 165 168 162
173 172 170 166 173 160 164 158 165 169
Groupe Placébo Groupe avec drogue

u Y-a-t-il une modification de réaction à


l’administration de la drogue?
u On suppose que les résultats de l’épreuve de
chaque groupe sont distribués normalement de
variance inconnue mais supposés égales
Petits échantillons

n Solution H 0
:µ 1
2
= µ
H :µ ¹ µ
u 1- Hypothèse statistique 1 1 2

u 2- Seuil de signification α=0,05

u 3- Conditions d’application du test: population normale;

variances supposées égales, petits échantillons


u 4- Statistique à utiliser
t = x1 - x2
1 1
s +
N 1 N 2

Distribuée suivant une loi de Student à u= N1+N2-2 ddl

u Régle de décision
t 0,05; 18 =2,101
On rejette H0 si t >2,101 ou t >-2,101
Petits échantillons
u 6- Calcul de s²
x 1
= 170 x 2
= 164

å (x - x ) = 80
i1 1 å (x i2 )
- x 2 = 112

80 +112 192
s= = = 10,667
10 +10 - 2 18

(170 -164) 6
t= = = 4,10
1 1 2
3,27 + 3,27
10 10 10
u Décision: On rejette H0 t= 4,10>t 0,025; 18
L’écart observé est significatif au seuil α=0,05
DEUX SERIES APPARIEES
DEUX SERIES APPARIEES
TEST PARAMETRIQUES
n On a comparé deux moyennes mesurées sur 2 échantillons
indépendants.
n Dans une expérimentation, on peut envisager qu’une
mesure soit liée, appariée à une seconde mesure. Par
exemple, on peut sur une population, mesurer un paramètre
avant et après administration d’un médicament.
n Test à utiliser
u On ne peut utiliser la méthode de comparaison de 2
moyennes observées car les mesures ne sont pas
indépendantes.
u On utilise la méthode des couples : elle consiste à faire,
pour chaque couple de valeurs la différence des 2
valeurs.
u En cas d’inefficacité du traitement la moyenne de ces
différences ne doit pas différer significativement de 0.
u D’où le test qui consistera à comparer à comparer la
moyenne des différences à la valeur de 0.
DEUX SERIES APPARIEES
TEST PARAMETRIQUES
d -0
n Le paramètre t= suit une loi de STUDENT
s N
N-1 ddl
n La variance s sera estimée par

æ n ö
n
çådi÷ ²
è ø
å
2 i =1
d i
-
N
s² = i =1

N -1
DEUX SERIES APPARIEES
TEST PARAMETRIQUES
n Exemple
u On a mesuré un paramètre chez 15 adultes

normaux, après administration d’un placébo,


après administration d’un médicament.
L’ordre a été défini aléatoirement. Les
résultats sont les suivants :
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Ap PC 15 13 8 9 7 12 11 12 11 9 10 12 11 7 12
Ap MD 17 16 10 9 9 13 14 15 14 11 14 11 13 10 13
u Y – a-t-il une modification du paramètre
après administration de la drogue ?
DEUX SERIES APPARIEES
TEST PARAMETRIQUES
n d = M2-M1 2 3 2 0 2 1 3 3 3 2 4 -1 2 +3 1

å d = 30
30
d= =2
15

84 -
(30 ) ²
åd 24
2
= 84 Þ s² = 15 = = 1,7143
14 14

s = 1,3093

n Hypothèses statistiques
u H0: µ = 0
d

u H1:
µ d
#0
DEUX SERIES APPARIEES
TEST PARAMETRIQUES
n Seuil de signification α=0,05,test bilatéral
n Conditions d’application : d est distribué suivant une
loi normale de variance s
2
inconnue N<
d
30
n Statistique t=
d
u si H0 est vraie sd N suit une loi de
Student avec N1

degrés de liberté ( u )
n Règles de décision
u α=0,05 u = 15-1= 14
u tα=0,05 ; 14 = 2,145= t seuil

n On rejette H0 si | t | > t seuil


DEUX SERIES APPARIEES
TEST PARAMETRIQUES
n Calcul de t
2
ut = = 5,92
1,3093
15

n Décision et conclusion
u t =5,92 5,92 > 2,146
u La drogue modifie le paramètre.

u La différence est significative p < 0,001


MERCI

Vous aimerez peut-être aussi