Vous êtes sur la page 1sur 2

Section 2 Tests de comparaisons de moyennes

I. Test de Student de comparaison de deux moyennes

La statistique construite pour l’occasion est la différence entre les deux moyennes,
réduite en la divisant par un écart-type estimé global. Elle suit un t de Student dont le
nombre de degrés de liberté est égal à la taille de l’effectif global moins deux

Les hypothèses à tester sont :


• hypothèse nulle H0 : m1 = m2
• hypothèse alternative H1 : m1 ≠ m2

La valeur de t est la suivante :

𝑚𝑚2 − 𝑚𝑚1
𝑡𝑡 = 1 1
𝑑𝑑𝑑𝑑 = 𝑛𝑛1 + 𝑛𝑛2 − 2
�𝑆𝑆 2 (𝑛𝑛 +𝑛𝑛 )
1 2

avec S2 est l’estimateur de la variance commune aux deux échantillons :

𝑛𝑛1 𝑛𝑛2
2
1 2
𝑆𝑆 = ��(𝑥𝑥1𝑖𝑖 − 𝑚𝑚1 )2 + ��𝑥𝑥2𝑗𝑗 − 𝑚𝑚2 � �
(𝑛𝑛1 + 𝑛𝑛2 − 2)
𝑖𝑖=0 𝑗𝑗=0

Conditions d'application :
o Les deux échantillons sont indépendants entre eux, sont aléatoires et ont n1 et n2
unités indépendantes
o La variable aléatoire suit une loi normale ou elle a des effectifs supérieurs à 30.
o Il est aussi nécessaire de vérifier l'égalité des variances des échantillons (grâce au
test de Fisher). Cette condition est indispensable pour des effectifs inégaux.

II. L’analyse de la variance à un facteur


L’analyse de la variance à un facteur, ANOVA1 permet d’expliquer les variations
de la variable dépendante Y par un seul facteur explicatif. Développée par Fischer,
l’analyse de la variance repose sur la comparaison de deux estimateurs de la variance
commune aux J populations normales.

L’analyse de la variance permet de tester les hypothèses suivantes :


• Hypothèse nulle H0 : m1 = m2 = m3 = ……… = mj
• Hypothèse alternative H1 : au moins une des moyennes est différente des autres

Cours d’analyse de données Pr Mohammed BEN AMAR


Un premier estimateur de la variance est obtenu à partir de l’ensemble des N
observations en divisant la somme totale des carrés (STC) par ses degrés de liberté soit
N–1

Un deuxième estimateur est obtenu en mesurant la variabilité existante entre les


moyennes des échantillons. On l’appelle la moyenne des carrés due au facteur (MCF).
Cette dernière est calculée en divisant la somme des carrés due au facteur par ses
degrés de liberté J – 1.

Un troisième estimateur de la variance est obtenu cette fois en combinant les


variances intra-échantillons. L’estimateur est appelé la moyenne des carrés due à
l’erreur (MCE) est il est calculé en divisant la somme des carrés due à l’erreur par son
degré de liberté N – J.

Les trois sommes des carrés sont calculées par les formules suivantes :

𝑗𝑗 𝑛𝑛 𝑇𝑇 2
𝑗𝑗
𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑗𝑗=𝑖𝑖 ∑𝑖𝑖=1 𝑌𝑌𝑖𝑖𝑖𝑖2 − 𝑁𝑁
2
𝑇𝑇 𝑇𝑇 2
SCF = ∑𝑗𝑗𝑗𝑗=𝑖𝑖 𝑗𝑗 −
𝑛𝑛𝑗𝑗 𝑁𝑁
SCE = STC – SCF

Source Somme Degrés Moyenne


F observé
de variation des carrés de liberté des carrés
Facteur SCF J–1 MCF MCF/MCE
Erreur SCE N–j MCE
Total SCT N–1
Avec
J : Nombre des modalités
N : Taille de l’échantillon

Deux conditions sont nécessaires pour que les résultats d’une ANOVA soient valides :
l’homogénéité de la variance intragroupe et la normalité des données.
Remarque : Le test de Levene est utilisé pour accepter l’hypothèse d’homogénéité de
la variance intragroupe. Selon le test de Levene, pour chaque variable dépendante, une
analyse de variance est réalisée sur les écarts absolus des valeurs aux moyennes des
groupes respectifs. Si le test de Levene est statistiquement significatif, l'hypothèse
d'homogénéité des variances doit être rejetée.
Formellement :
Dki = |Xki – mi|
H0 = 𝜎𝜎12 = 𝜎𝜎22 = ⋯ = 𝜎𝜎𝑝𝑝2

Cours d’analyse de données Pr Mohammed BEN AMAR

Vous aimerez peut-être aussi