9 6 Comparaison

COMPARAISON DE DEUX MOYENNES
Quels cas traiter en classe de B.T.S.A ?

Cet article se limite aux tests paramétriques, seuls aux programmes de la plupart des sections
de B.T.S.A.
1. Echantillons indépendants
Position du problème : On considère deux populations dans lesquelles on étudie un
même caractère quantitatif, on en déduit alors deux variables aléatoires X1 et X2. On
désire comparer les moyennes μ1 et μ2 de ces deux variables aléatoires. Pour cela, on
prélève dans chacune des populations un échantillon aléatoire et simple. On note
respectivement n1 et n2 les tailles de ces échantillons, x1 et x 2 leurs moyennes,
s12 et s 22 leurs variances.
Quels sont les cas qui peuvent se présenter ?
• Les populations sont distribuées normalement ou pas (ou on n'en sait rien).
Les variances respectives, σ1 et σ 2 , des populations sont connues (c'est assez rare)
2 2
•
ou pas.
• Les variances des populations sont égales ou pas. On a parfois de bonnes raisons de
penser qu'elles sont égales, par exemple, lorsqu'on sait que le facteur considéré peut
avoir une influence sur la moyenne mais pas sur la variance de la grandeur étudiée.
On peut également tester leur égalité.
Quels cas sait-on traiter dans le cadre des tests paramétriques ?
• Cas où les populations sont distribuées normalement et de variances connues.

Dans ce cas, la démonstration est tout à fait accessible aux étudiants. Si les
échantillons sont de grande taille la condition de normalité n'est pas indispensable
grâce au théorème "central-limit".
• Cas où les populations sont distribuées normalement et de même variance (ces
variances étant inconnues).
On peut alors demander aux étudiants de donner une estimation ponctuelle de la
variance commune (voir bulletin n°2 "Test de Student pour comparer deux moyennes"
et bulletin n° 7 " Résumé sur les lois de probabilité ").
En principe, on ne sait pas traiter les autres cas par des tests paramétriques. Cependant, si
les échantillons sont de grande taille (effectifs supérieurs à 30) on peut procéder par
approximation(s) :
- Si les populations sont distribuées normalement l’approximation consiste à remplacer
les variances inconnues par leurs estimations ponctuelles pour se ramener au cas où
ENFA - Bulletin du GRES n°9 – février 2000 page 18
Contact : Conf PY-MATH@educagri.fr
les variances sont connues. Cette approximation se justifie par le fait que la variance
de l’estimateur non biaisé de la variance d’une population, c’est-à-dire V (Ŝ²) ou
V(σˆ ² ) suivant la notation utilisée, tend vers 0 quand n tend vers +∞.
- Si les populations ne sont pas distribuées normalement, une deuxième approximation
est nécessaire : l’approximation de la loi de X1 − X 2 par une loi normale en vertu
du théorème “central-limit”.
Dans la pratique, avec nos étudiants, étant donné l'intitulé des programmes ("Cas des
petits et des grands échantillons"), on ne se préoccupe pas de la normalité des
populations ni de l'égalité des variances lorsque les échantillons sont de grande taille.
D'où l'ordre des cas dans l'organigramme présenté à la page suivante.
Quelques remarques
• Lorsque les populations sont distribuées normalement et de variances inégales (on
peut alors se demander quel est l'intérêt de comparer les moyennes) on met en œuvre
d'autre tests qui ne sont pas au programme des classes de B.T.S.A. (voir, par exemple,
l'ouvrage de P.DAGNELIE "Statistique théorique et appliquée", Tome 2)
• Lorsqu'on parle de tests statistiques il y a plusieurs approches
- L'approche purement scolaire : que les étudiants sachent résoudre "proprement"
les exercices qu'on trouve dans les annales ; c'est le but visé par l'organigramme de
la page suivante.
- Une approche qui vise l'utilisation des statistiques pendant les stages et la future
vie professionnelle de nos étudiants. Il est alors bon d'insister sur l'importance du
protocole d'expérimentation : que les échantillons soient de vrais échantillons
aléatoires dont les tailles ont été choisies, qu'il n'y ait pas de biais flagrant [ex :
pour comparer deux "concentrés" (produit de complément à une ration animale),
on compare les résultats de deux échantillons d'exploitations sans se préoccuper
du fait que la ration de base est très variable d'une exploitation à l'autre, sans
compter qu'il faudrait travailler par animal et non par exploitation].
• Pour ce qui est du choix des tailles d'échantillons : de grandes tailles d'échantillons
rendent ces tests plus robustes à la non normalité, des échantillons de même taille les
rendent plus robustes à l'inégalité des variances (DAGNELIE, ancienne édition).
2. Echantillons appariés
Les programmes ne disent pas tous explicitement si ce cas doit être traité ou pas. Dans le
doute, il est préférable de le faire. L'article suivant donne un exemple d'exercice de ce
type.

On pourra utiliser l'organigramme suivant inspiré d'un ancien fascicule du C.N.P.R. :
H0 : μ1 = μ2
oui Méthode
non
Echantillons Echantillons des
indépendant appariés couples
oui non
Pas de test Sous H0, la v.a

oui X1 − X 2
U0 =
σ12 et σ 22 σ12 σ 22
connus +
n1 n 2
Populations distribuées normalement
ou grands échantillons est de loi N(0, 1)
non
Sous H0, la v.a

X1 − X 2
oui U0 =
n1 > 30 et s12 s2
n2 > 30 + 2
n1 − 1 n 2 − 1
est approximativement
de loi N(0, 1)
non
Sous H0, la v.a
X1 − X 2
T0 = est
oui n 1S12 + n 2 S 22 ⎛ 1 1 ⎞
⎜ + ⎟
σ 12 = σ 22 n 1 + n 2 − 2 ⎜⎝ n 1 n 2 ⎟⎠
Populations distribuées de loi de Student à n1 + n2 - 2 ddl.
normalement n S 2 + n 2 S 22
( 1 1 est un estimateur
non n1 + n 2 − 2
sans biais de la variance commune)
Pas de test
paramétrique

Exercices
Exercice 1 (D'après un sujet du B.T.S.A I.A.A)
On désire comparer le travail de deux doseuses pour boîtes de haricots verts de quantité
nominale égale à 800 g. Les deux distributions sont supposées normales et les variances des
deux machines sont : σ1 = 20 g ² et σ 2 = 16 g ² . On prélève un échantillon de 20 éléments
2 2
sur chacune des deux machines, ce qui donne les deux valeurs moyennes suivantes :
x1 = 807 g pour la première machine et
x 2 = 805 g pour la deuxième machine
Les dosages moyens de ces deux machines sont-ils différents au risque de 5 % ?
Exercice 2 (d'après un sujet du B.T.S.A "Productions animales")

Les poids à la naissance (en kg) de deux échantillons de veaux de deux races différentes sont
les suivants :
Race Parthenaise : 53, 49, 40, 48, 43, 42, 43, 46, 42, 43, 38, 40, 50, 44.
Race Charolaise : 46, 46, 48, 38, 42, 42, 40, 53, 55, 41, 47, 30.
1. Calculer la moyenne et l'écart type de chacun de ces échantillons.
2. A l'aide d'un test bilatéral, au risque α de 5%, dire si l'on peut considérer que les
variances des deux populations sont égales.
3. Peut-on conclure, au vu de ces échantillons et au risque de 5%, que les poids
moyens à la naissance des deux races sont différents ?
Remarque : l'énoncé ne précise pas que les populations sont distribuées normalement, on est
donc amené à le supposer.
Pour la comparaison de deux variances voir le bulletin n°4.
Exercice 3 (d'après un sujet du B.T.S.A "Productions animales")

On a relevé la masse, en quintaux, de pois protéagineux produits sur 40 parcelles
expérimentales de un hectare chacune. Les résultats obtenus sont résumés dans le tableau
suivant :
Masse en quintaux [30 ; 35[ [35 ; 40[ [40 ; 45[ [45 ; 50[ [50 ; 55[
Nombre de parcelles 3 8 17 10 2
1. Calculer la moyenne et l'écart type de cette série statistique.

2. Dans un autre échantillon de 50 parcelles, également de un hectare chacune, avec un mode
de culture différent, on a obtenu une masse moyenne de 44,6 quintaux avec un écart type de
6,12 quintaux.
La différence entre les moyennes des deux échantillons de parcelles est-elle significative, au
seuil de 5%, d'une différence entre les deux modes de culture ?

Indications de correction
Exercice 1
H0 : μ1 = μ2 H1 : μ1 ≠ μ2
Nous sommes dans le cas d'échantillons indépendants issus de populations distribuées
normalement et de variances connues.
X1 − X 2
Sous H0, la variable aléatoire U 0 = est de loi N(0, 1).
σ12 σ 22
+
n1 n2
Le test est bilatéral, α = 5%, donc on rejette H0 si u0 est à l'extérieur de l'intervalle
[-1,96; 1,96].
u0 ≈ 1,49
On ne rejette donc pas H0 au seuil de 5%. On ne peut pas conclure que les dosages moyens des
deux machines sont différents.
Exercice 2
1. Moyennes des échantillons en kg : x1 ≈ 44,36 et x 2 = 44.
Ecarts types des échantillons en kg : s1 ≈ 4,13 et s 2 ≈ 6,45.
H0 : σ1 = σ 2 H1 : σ1 ≠ σ 2
2 2 2 2
2.
On suppose que les populations sont distribuées normalement, les échantillons sont
⎛ n 2S22 ⎞ ⎛ n1S12 ⎞
indépendants, donc, sous H0, la variable aléatoire F0 = ⎜ ⎟ ⎜ ⎟ est de loi de
⎜ n 2 − 1⎟ ⎜ n1 − 1 ⎟
⎝ ⎠ ⎝ ⎠
Fisher-Snedecor à k1 = 11 et k2 = 13 ddl.
Le test est bilatéral, α = 5%. On rejettera H0 si f0 est supérieur à f0,975.
3,05 < f0,975 < 3,25.
f0 ≈ 2,47. (calcul effectué avec les valeurs non arrondies des variances)
On ne rejette pas H0 au risque α de 5%. Les variances des deux populations peuvent donc être
considérées comme égales.
3. H0 : μ1 = μ2 H1 : μ1 ≠ μ2
Nous sommes dans le cas de populations supposées distribuées suivant des lois normales de
même variance. Les échantillons sont indépendants.
X1 − X 2
Sous H0, la variable aléatoire T0 = est de loi de Student à n1 +
n1S12 + n 2S22 ⎛ 1 1 ⎞
⎜⎜ + ⎟⎟
n1 + n 2 − 2 ⎝ 1
n n 2⎠
n2 – 2 ddl.
Le test est bilatéral, α = 5%. On refusera H0 si t0 est en dehors de l'intervalle
[-t0,975 ; t0,975]. Le nombre de degrés de liberté est 24. t0,975 = 2,06.
n1s12 + n 2s 22
≈ 30,80 . Ce nombre est une estimation ponctuelle de la variance commune des
n1 + n 2 − 2
deux populations. (calcul effectué avec les valeurs non arrondies des variances)
t0 ≈ 0,16.
On ne rejette pas H0 au risque α de 5%, on ne peut donc pas conclure, au vu de ces
échantillons, que les poids moyens à la naissance des deux races sont différents.
Exercice 3
1. Moyenne de l'échantillon en quintaux : x = 42,5.
Ecart type de l'échantillon en quintaux : s ≈ 4,87.
2. H0 : μ1 = μ2 H1 : μ1 ≠ μ2
Les échantillons sont indépendants et de grande taille donc, sous H0, la variable aléatoire
X1 − X 2
U0 = est approximativement de loi N(0, 1).
s12 s 22
+
n1 − 1 n 2 −1
Le test est bilatéral, α = 5%, donc on rejette H0 si u0 est à l'extérieur de l'intervalle
[-1,96; 1,96].
u0 ≈ -1,79
On ne rejette donc pas H0 au seuil de 5%. La différence entre les moyennes de ces deux
échantillons n'est pas significative d'une différence entre les deux modes de culture.
≈≈≈≈≈≈≈≈≈≈≈≈


9 6 Comparaison

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

9 6 Comparaison

Transféré par

Droits d'auteur :

Formats disponibles

COMPARAISON DE DEUX MOYENNES

Quels cas traiter en classe de B.T.S.A ?

Quels cas sait-on traiter dans le cadre des tests paramétriques ?

• Cas où les populations sont distribuées normalement et de variances connues.

ENFA - Bulletin du GRES n°9 – février 2000 page 19

Pas de test Sous H0, la v.a

Sous H0, la v.a

ENFA - Bulletin du GRES n°9 – février 2000 page 20

Exercice 2 (d'après un sujet du B.T.S.A "Productions animales")

Exercice 3 (d'après un sujet du B.T.S.A "Productions animales")

1. Calculer la moyenne et l'écart type de cette série statistique.

ENFA - Bulletin du GRES n°9 – février 2000 page 21

Ecarts types des échantillons en kg : s1 ≈ 4,13 et s 2 ≈ 6,45.

ENFA - Bulletin du GRES n°9 – février 2000 page 23

Vous aimerez peut-être aussi