Vous êtes sur la page 1sur 17

ANALYSE DE LA VARIANCE

ANOVA
ANALYSE DE LA VARIANCE
• La méthode « d’analyse de variance » est une
procédure permettant de vérifier
simultanément l’égalité des moyennes de
plusieurs populations.
• Conditions d’application :
– Nous supposons que toutes les populations sont
normalement distribuées et qu’elles ont une
variance égale.
Analyse de variance à un facteur
• L’analyse de variance permet de tester l’effet d’un
facteur qui admet plusieurs modalités sur la
valeur de la moyenne.
• Les « k » modalités du facteur définissent les « k »
populations (ou groupes) étudiées.
• On veut tester avant commercialisation le nettoyant
Nettoie-Tout. Pour ce faire, on installe des présentoirs à
trois emplacements différents dans des supermarchés :
– dans quatre supermarchés le présentoir est placé près du pain,
– dans quatre autres il est près de la bière et
– dans les quatre derniers il est avec les autres nettoyants.
EXEMPLE
• Voici le nombre de bouteilles de 350 ml
vendues dans chaque supermarché :

Près du pain 20 15 24 18

Près de la bière 12 18 10 15

Avec d’autres nettoyants 25 28 30 32


• Vérifier si on peut conclure, au seuil de signification
α=0.05, que l’emplacement a un effet sur le nombre
moyen de bouteilles vendues, c'est-à-dire que les
nombres moyens de bouteilles vendues dans les trois
emplacements ne sont pas les mêmes.
– On suppose que les distributions sont approximativement
normales et qu’elles ont une variance égale.
CONTESXT GENERALE

Hypothèses du test :
H0 : μ1 = μ2 = … = μk
H1 : Au moins 2 moyennes sont différentes
CONTEXT GENERALE

k échantillons indépendants
1 2 … k
Taille : n1 n2 … nK
X11 X21 Xk1
X12 X22 Xk2
Observations : …
… … …
X1n1 X2n2 Xknk

Moyenne : X1 X2 … XK
CONCEPT DE BASE DE L’ANOVA

• Le principe de l’analyse de variance est basé sur la


décomposition de la variation totale des données
en deux composantes.

Variation totale Variation due


Variation due
(autour de la à l’erreur
au facteur
moyenne = + d’échantillonnage
(intergroupe)
globale X ) (intragroupe)
Somme des carrés totale (SCT)
• Somme des carrés totale (ou variation totale) :
SCT   (X ij  X ) 2

i, j
 La variation totale autour de la moyenne
globale.
Somme des carrés due au facteur (SCF)

• Somme des carrés due au facteur :


SCF   n i (Xi  X) 2

– La variation due au facteur.


Somme des carrés due à l’erreur

• Somme des carrés due à l’erreur :


SCE   (X ij  X i ) 2

i, j
– La variation due à l’erreur.

• Ainsi
SCT = SCF + SCE
Carrés moyens

Carré moyen dû à l’erreur : SCE


CME 
(ou variance résiduelle) nk

SCF
Carré moyen dû au facteur : CMF 
k 1

CMF
F
Statistique : CME
Tableau d’analyse de variance et test F
de Fisher

Source
Somme de Degrés de
de la Carré moyen F
carrés liberté
variation
SCF CMF
Facteur SCF k -1 CMF  F
k 1 CME

Erreur SCE n–k SCE


CME 
nk
Totale SCT n-1
TEST DE FISHER
• La statistique « F » du tableau d’analyse de
variance est utilisée pour le test sur l’égalité
des moyennes.
• On l’appelle le F de Fisher.
• Hypothèses du test :
H0 : μ1 = μ2 = … = μk
H1 : Au moins 2 moyennes sont différentes.
TEST DE FISHER
• Conditions d’utilisation du test F de Fisher :
– Les Xi sont de loi Normale dans les populations de
référence ou les tailles d’échantillons sont assez grandes.
– Les variances des k populations sont égales :
12 = 22 = … = k2 = 2
– Les k échantillons sont prélevés de manière indépendante.
TEST DE FISHER
• Statistique du test : CMF
F
CME
• Si H0 est vraie, la statistique F obéit à une loi
Fisher à (k-1) et (n-k) degrés de liberté.
• La valeur critique du test et le seuil
expérimental sont calculés avec cette loi.
TEST DE FISHER

• Règle de décision : Rejeter H0 si F > fα


avec le seuil expérimental :
Rejeter H0 si α* < α
f(F)

0
F

Vous aimerez peut-être aussi