Vous êtes sur la page 1sur 4

37

Chapter 3

Analyse de la variance à un facteur

3.1 Introduction
L’analyse de la variance (ANOVA) est une méthode statistique qui permet d’étudier
la modification de la moyenne µ d’une variable quantitative selon l’influence éventuelle
d’un ou de plusieurs variables qualitatifs (facteurs d’expérience).
L’ANOVA donne une information plus complète et plus détaillée de la relation
entre les divers niveaux de la variable indépendante et la variable dépendante. Elle
permet de calculer l’effet d’une/plusieurs facteurs sur une/des variables des unités
statistiques, ainsi que d’interaction entre ces facteurs souvent si important.

• L’ANOVA 1 → la moyenne n’est influencée que par un seul facteur.


Exemple : l’effet de type du sol sur la croissance des plantes.

• L’ANOVA 2 → la moyenne est influencée que par deux facteurs.


Exemple : l’effet de type du sol et l’humidité sur la croissance des plantes.

• L’ANOVA 3 → la moyenne est influencée par trois facteurs.


Exemple : l’effet de type du sol, l’humidité, la température, sur la croissance
des plantes.

Objectif :

• L’analyse de variance (en anglais analysis of variance, ANOVA) a comme ob-


jectif de comparer des ensembles de plus de deux moyennes, en tentant d’identifier
les sources de variation qui peuvent expliquer les différences entre elles.

La démarche à suivre :
1 ère étape : formulation des hypothèses
Un facteur A est souvent une variable qualitative présentant un nombre restreint de
modalités. Le nombre de modalités (c’est-à-dire de niveaux) du facteur A sera noté
I. L’objectif est de tester l’égalité des moyennes de ces populations, à savoir de tester
l’hypothèse nulle :

H0 : µ1 = µ2 = ... = µ I .
H1 : ∃il 6= ik tel queµil 6= µik il existe au moins deux moyennes différentes

Pour chaque population i (ou modalité i du facteur A), on dispose d’un échantillon
y de ni observations de la variable réponse Y :

yi1 , yi2 , ..., yini .


Exemple
Étudier les performances de trois laboratoires relativement à la détermination de
38 Chapter 3. Analyse de la variance à un facteur

la quantité de sodium de Lasalocide dans la nourriture volaille. Une portion de


nourriture contenant la dose nominale de 85 mg/kg de sodium de Lasalocide a été
envoyée à chacun des laboratoires à qui il a été demandé de procéder à 10 réplica-
tions de l’analyse. Les mesures de sodium de Lasalocide obtenues sont exprimées
en mg/kg. Elles sont reproduites dans le tableau suivant :

Lab. A Lab. B Lab. C


1 87 88 85
2 88 93 84
3 84 88 79
4 84 89 86
5 87 85 81
6 81 87 86
7 86 86 88
8 84 89 83
9 88 88 83
10 86 93 83

Sur chaque essai, on observe deux variables.

1. Le laboratoire. Il est totalement contrôlé. La variable "Laboratoire" est con-


sidérée comme qualitative avec trois modalités bien déterminées : A, B, et C.
Nous l’appelons le facteur.

2. La quantité de sodium de lasalocide. La variable "Lasalocide" est considérée


comme quantitative comme généralement tous les résultats obtenus par une
mesure. Nous l’appelons la variable réponse.
La variable mesurée dans un tel schéma expérimental sera notée Y . Pour les
observations, nous utilisons deux indices :
a. le premier indice indique le numéro du groupe dans la population ("Labo-
ratoire") ;
b. le second indice indique le numéro de l’observation dans l’échantillon ("Es-
sai").
Pour le premier indice, nous utiliserons en général l’indice i.
Pour le second indice, nous utiliserons en général l’indice j.
Ainsi, les observations seront notées en général :

yij telquei = 1, ..., I; j = 1, ..., J.

Notons les moyennes de chaque échantillon par :


J
1
ȳi. =
j ∑ yij telquei = 1, ..., I.
j =1

et les variances de chaque échantillon par :


J
1
Si2 =
j ∑ (yij − ȳi. )2 telquei = 1, ..., I.
j =1

On aimerait savoir, et c’est l’objet de l’analyse de variance, s’il y a une différence


pour les teneurs en sodium de lasalocide entre les trois laboratoires.
Y a-t-il un effet laboratoire sur les teneurs en sodium de lasalocide ?
3.1. Introduction 39

Cette question est l’objet principal de l’analyse de la variance à un facteur.


2 ème étape : détermination de la statistique du test
Supposons qu’un facteur contrôlé A possède I modalités, chacune d’entre elles étant
notée Ai . Pour chacune des modalités, on effectue J (J ≥ 2) mesures d’une variable
réponse Y supposée continue. Le nombre total de mesures est donc I × J.
Nous regroupons les valeurs que peut prendre la réponse Y dans les conditions
Ai lors des J répétitions dans le tableau suivant :

Facteur A Y
A1 Y11 , ..., Y1J
. .
. .
. .
Ai Yi1 , ..., YiJ
. .
. .
. .
AI YI1 , ..., YI J

On a observé n = I × J valeurs de la variable Y indexée par deux indices i et j. . La


moyenne de ces valeurs par rapport à l’indice i est notée Y.j . Il s’agit simplement de
la moyenne de valeurs de la j-ème colonne du tableau :
I
Y.j = ∑ Yij
i =1

La moyenne de ces valeurs par rapport à l’indice j est notée Yi. . Il s’agit simple-
ment de la moyenne de valeurs de la i-ème ligne du tableau :
J
Yi. = ∑ Yij
j =1

La moyenne globale par rapport aux indices i et j est notée Y.. . Il s’agit simple-
ment de la moyenne globale du tableau :

I J
1
Y.. =
IJ ∑ ∑ Yij
i =1 j =1

3 ère étape : calcul des sommes des carrés des écarts La variation totale théorique,
ou somme totale des carrés des écarts est égale à :

I J
SCTOT = ∑ ∑ (Yij − Y.. )2
i =1 j =1

On appelle variation théorique due au facteur A, la quantité :


I
SCF = j ∑ (Yi. − Y.. )2
i =1
40 Chapter 3. Analyse de la variance à un facteur

et variation résiduelle, la quantité :

I J
SCR = ∑ ( ∑ (Yij − Y.. ))
i =1 j =1

Remarque :
SCTOT = SCF + SCR
SCTOT = SCintergroupe + SCintragroupe
4 ère étape : calcul des carrés moyens
On a défini ci-dessus les carrés moyens, qui constituent eux aussi des mesures glob-
ales de variations :
SCF SCF
CMF = S2F = =
ddl F I−1
SCR SCR
CMR = S2R = =
ddl R I ( J − 1)
SCT SCT
CMT = S2T = =
ddlT IJ − 1
5 ère étape : calcul du Fobserv
Le test Fischer-Snedecor (Fobserv ) est le ratio entre deux sommes des carrés pondérés
par leurs degrés de liberté respectif I − 1, I J − I.

CMR
Fobserv =
CMF
6 ère étape : la décision

Hypothèses et seuil: 
H0 : µ1 = µ2 = ... = µ p
H1 : il ∃µi 6= µ j
L’hypothèse nulle ne prédit aucune différence alors que l’hypothèse alternative prédit
q’au moins un groupe différera d’un autre groupe.

L’ANOVA ne dit pas quels sont les groupes qui diffèrent cependant (nous verrons
des techniques complémentaires au prochain cours).

Le test F est de la forme :


Rejet de H0 si CM
CMF > s ( α )
R

3.2 Exercices
Exercice 1 :
Pour définir l’impact de la nature du sol sur la croissance d’une plante X, un botaniste
a mesuré la hauteur des plantes pour 4 types de sol. Pour chaque type de sol, il dis-
posait de 3 réplicats.