Vous êtes sur la page 1sur 11

Tests sur la moyenne

Mohamed LEMDANI

MISO
Université de Lille

28 Septembre 2023
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Exemple

Comparaison d’une moyenne à une moyenne théorique (test à un échantillon)


Variable observée X : quantitative continue.
Paramètre étudié : moyenne de X sur la population (µ).
Objectif : Comparer ce paramètre µ à une valeur théorique (connue) µ0 .
Hypothèses : H0 : {µ = µ0 } contre H1 : {µ , µ0 } (cas bilatéral) ou {µ <> µ0 } (unilatéral).
Données : n observations (sur
P l’échantillon) de X =⇒ x1 , x2 , .. .P
, xn .
x2i

xi n
Calcul de la moyenne x̄ = 2
et de la variance s = − x̄2 .
n n−1 n
x̄ − µ0
Variable de décision : t = √ ∼ Stν sous H0 , avec ν = n − 1.
s/ n
Conditions d’utilisation :
• X ∼ N(µ, σ) ou
• n "grand" (n > 30).
Préciser le risque α et construire les zones d’acceptation/rejet à partir de la table de
Student.
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Exemple

Exemple 3
Dans le cadre d’un contrôle de qualité, pour lequel le poids moyen d’un comprimé
P
doit être égal à 3g, on prélève et pèse 10 comprimés. On note : xi = 32.0g et
P 2 2
xi = 103.84 g . Peut-on conclure à un écart par rapport aux exigences de
production, au seuil de 5 % ?
Variable observée : X = poids d’un comprimé, observée sur un échantillon de taille
n = 10 (représentant la population du lot de comprimés testé).
µ = moyenne de X sur le lot et µ0 = 3 g.
H0 : {µ = µ0 } versus H1 : {µ , µ0 }.
x̄ − µ0
Variable de décision : t = √ ∼ St9 sous H0 .
s/ n
Conditions : n = 10 (petit échantillon) =⇒ condition de normalité de X nécessaire :
X ∼ N(µ, σ) (admise).

 
10 103.84
Calculs : x̄ = 32.0/10 = 3.2 g et s2 = − 3.22 = 0.36 =⇒ s = 0.36 = 0.6
9 10
3.2 − 3
=⇒ tc = √ ≈ 1.054.
0.6/ 10
Zone de non-rejet : tc ∈ [−2.262, 2.262] =⇒ non rejet de H0 au seuil de 5% (au risque
de 5%, on ne peut pas conclure à un écart par rapport aux exigences de production).
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Mise en œuvre Exemple

Comparaison de deux moyennes (variances) pour deux échantillons indépendants


Variable observée X : quantitative continue.
Paramètres étudiés : moyennes (et variances) de X sur la population : µ1 , µ2 (et σ21 , σ22 ).
Objectif : Comparer µ1 à µ2 (et σ21 à σ22 ).
Hypothèses : H0 : {µ1 = µ2 } versus H1 : {µ1 , µ2 } (ou {µ1 < µ2 } ou {µ1 > µ2 }).
Test paramétrique : test de Student (ou test t).
x̄1 − x̄2 x̄1 − x̄2
Variable de décision : t = q ou t= q 2 2
.
s2 2 s1
n1
+ ns
2 n
+ sn2
1 2
Conditions d’utilisation :
• X ∼ N(µ1 , σ1 ) sur Pop 1, X ∼ N(µ2 , σ2 ) sur Pop 2 ou
• n1 , n2 > 30.
Le test de Student ne peut pas être utilisé si
• n1 ou n2 < 30 et
• X / N sur cet échantillon.
Dans ce cas, utiliser un test non paramétrique (ici celui de Mann et Whitney).
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Mise en œuvre Exemple

Mise en œuvre du test de Student


Avant de comparer les moyennes µ1 et µ2 , d’abord comparer les variances σ21 et σ22 .
Hypothèses : K0 : {σ21 = σ22 } versus K1 : {σ21 , σ22 }.
x̄1 − x̄2
Si non-rejet de K0 : utiliser t = q pour tester H0 contre H1 .
s2 2
n1
+ ns
2
x̄1 − x̄2
Si rejet de K0 : utiliser t = r pour tester H0 contre H1 .
s21 s22
n1
+ n2
Comparaison des variances le test de Fisher.
s2 n −1 s2 n −1
Variable de décision : F = 12 ∼ Fn12 −1 sous K0 ou F = 22 ∼ Fn21 −1 sous K0 .
s2 s1
Conditions d’utilisation : identiques à celles du test t.
s2grand
Choix de la formule de F (α = 5%) : F = 2 .
spetit
x̄1 − x̄2
Si non-rejet de K0 , t = q ∼ Stn1 +n2 −2 sous H0 .
s2 2
n1
+ ns
2
Si rejet de K0 , t ∼ Stν sous H0 , avec ν "compliqué".
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Mise en œuvre Exemple

Exemple 4
On souhaite comparer les durées de vie moyennes de 2 types d’ampoules électriques.
Pour cela on observe la durée de vie X de 10 ampoules de type "ancien" et de 12
P
ampoules de type "nouveau". On note, pour le type "ancien", xi = 18 000 h et
P 2 P P
xi = 32 760 000 h2 , pour le type "nouveau", xi = 24 000 h et x2i = 48 550 000 h2 .
Peut-on affirmer que les ampoules de type nouveau sont plus efficaces au seuil de 5% ?
On admettra la normalité de la durée de vie d’une ampoule, pour chacun des types.
Variable observée : X = ’Durée de vie d’une ampoule’ (h) observée sur deux
échantillons de tailles n1 = 10 et n2 = 12 (1= ’Ancien’ et 2 = ’Nouveau’).
H0 : {µ1 = µ2 } versus H1 : {µ1 < µ2 }.
K0 : {σ1 = σ2 } versus K1 : {σ1 , σ2 }.
Calculs : x̄1 = 18 000/10 = 1 800
 h et x̄2 = 24 000/12 = 2 000 h.
10 32 760 000
2
s1 = − 1 8002
= 40 000 h2 .
9  10 
12 48 550 000
s22 = − 2 0002 = 50 000 h2 .
11 12
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Mise en œuvre Exemple

Exemple 4 (suite)
X = ’Durée de vie d’une ampoule’ (h).
H0 : {µ1 = µ2 } versus H1 : {µ1 < µ2 } et K0 : {σ1 = σ2 } versus K1 : {σ1 , σ2 }.
n1 = 10, n2 = 12, x̄1 = 1 800 h, x̄2 = 2 000 h, s21 = 40 000 h et s22 = 50 000 h2 .
2

Conditions : X ∼ N(µ1 , σ1 ) sur Pop 1, X ∼ N(µ2 , σ2 ) sur Pop 2 (énoncé).


Test K0 /K1 : F = s22 /s21 ∼ F11
9 , sous K0 .
Zone de rejet de K0 (5%) : Fc < [3.9, +∞[ =⇒ non-rejet de K0 au seuil de 5%.
Fc = 50 000/40 000 = 1.25.
9 × 40 000 + 11 × 500 000
Variance commune : s2 = = 45 500 h2 .
10 + 12 − 2
x̄1 − x̄2
t= q ∼ St20 sous H0 .
s2 s2
n1
+ n2
Zone de rejet unilatérale (α = 5%) : tc ∈ ] − ∞, −1.725].
Rejet ⇒ choix de H1 ⇒ µ1 < µ2 ⇒ x̄1 < x̄2 ⇒ t < 0 : rejet côté −∞, α(table) = 10%.
1 800 − 2 000
Calcul : tc = q ≈ −2.190 =⇒ Rejet de H0 au seuil de 5% (au risque 5%,
45 500 45 500
10
+ 12
on peut dire qu’en moyenne les ampoules de type "Récent" ont une durée de vie plus
longue).
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Essai croisé - Exemple

Problématique
X : variable quantitative continue, définie sur deux populations =⇒ comparer les
moyennes µ1 et µ2 de X =⇒ comparaison à partir d’échantillons indépendants.
Exemple : comparer les tailles moyennes d’arbres de deux espèces différentes.

Cas de "traitements" pour une même population : comparer deux traitements


(Population = Patients), deux méthodes de dosages (Population = Flacons), . . .
Possibilité de prendre un échantillon pour chaque traitement (affectation par tirage au
sort de deux groupes indépendants) ou de constituer un seul échantillon où chaque
individu subit les deux traitements (séries appariées).
x̄1 − x̄2
Test t échantillons indépendants : t = q = Différence/Variabilité.
s2 2
+ ns
 n1 2

Intergroupe + Intragroupe en échantillons indépendants,


Variabilité =
Intragroupe en échantillons appariés.
Mise en évidence plus facile d’une différence dans le cas d’échantillons appariés.
Une seule population Deux populations Échantillon observé à deux reprises
Théorie Essai croisé - Exemple

Séries appariées : essai croisé (cross over)


• Échantillon n de sujets suivant deux traitements A et B (l’un puis l’autre).
• Tirage au sort : groupe "A suivi de B" et groupe "B suivi de A".
• Période de wash out entre les deux traitements.
• Critère de jugement observé à deux reprises : X (pour A) et Y (pour B).
Présentation des données :
Sujets 1 2 ... n
X X1 X2 ... Xn
Y Y1 Y2 ... Yn
D D1 = X1 − Y1 D1 = X2 − Y2 ... Dn = Xn − Yn

Hypothèses : H0 : {µX = µY } versus H1 : {µX , µY } (ou {µX < µY } ou {µX > µY }).
Calcul de D = X − Y (ou D = Y − X).
Hypothèses (réécriture) : H0 : {µD = 0}, H1 : {µD , 0} (ou {µD < 0} ou {µD > 0})
=⇒ test de type Observé/Théorique (à un échantillon).
x̄ − µ0 d̄
Test paramétrique (Student) : t = √ = √ .
s/ n sD / n
Une seule population Deux populations Échantillon observé à deux reprises

Séries appariées : test t (suite)


H0 : {µD = 0} versus H1 : {µD , 0} (ou {µD < 0} ou {µD > 0}).

t= √ ∼ Stn−1 sous H0 .
sD / n
Conditions :
• D ∼ N(µD , σD ) ou
• n > 30.
Conditions non remplies (n < 30 et D / N) =⇒ utiliser un test non paramétrique (test
de Wilcoxon).
Autres types d’appariements : familial, par voisinage, . . .
Exemple 5 : On souhaite comparer les rendements moyens à l’hectare, pour une
céréale, entre deux types d’engrais A et B. Pour cela, on dispose de 10 parcelles situées
dans des régions différentes et dont chacune est découpée en deux : une moitié où sera
utilisé l’engrais A et l’autre ou l’on utilisera l’engrais B. On note, à la fin de la saison, le
rendement à l’hectare X (en tonnes). Peut-on conclure à un rendement plus élevé en
moyenne pour l’engrais A au seuil de 10% ?
Une seule population Deux populations Échantillon observé à deux reprises

Exemple 5 (suite)

Parcelle 1 2 3 4 5 6 7 8 9 10
XA 2.5 4.3 6.6 5.4 3.8 4.2 3.9 4.7 2.9 3.7
XB 2.6 4.0 6.4 5.2 3.8 4.1 3.8 4.8 2.7 3.6
D −0.1 0.3 0.2 0.2 0.0 0.1 0.1 −0.1 0.2 0.1

Échantillon de taille n = 10 avec deux observations XA et XB pour chaque parcelle.


H0 : {µA = µB } versus H1 : {µA > µB }.
D = XA − XB =⇒ H0 : {µD = 0} versus H1 : {µD > 0}.

Variable de décision : t = √ ∼ St9 sous H0 .
sD / n
Conditions : n = 10=⇒ nécessité de la condition de normalité (D ∼ N(µD , σD )).
Zone de rejet unilatérale à 10% : tc ∈ [1.383, +∞[ (rejet de H0 au seuil de 10%).
H1 =⇒ µD > 0 =⇒ t > 0.
P P 2
Calculs : di = 1.0, di =0.26. 
10 0.26
2
d̄ = 1.0/10 = 0.1 et sD = − 0.12 = 0.16/9 = 16/(9 × 100).
9 10 √
p 0.1 × 10
sD = 16/(9 × 100) = 4/30 =⇒ tc = ≈ 2.372.
4/30

Vous aimerez peut-être aussi