Vous êtes sur la page 1sur 21

L’Analyse de Variance 1

1. Généralités
2. Le modèle
3. Calculs pratiques
4. Conditions d’application de l’ANOVA
5. Mesure de la décomposition de la SCE
L’Analyse de Variance 1

1. Généralités

Le modèle linéaire simple

 Projection :
 Y = a + bX1 + b2X2 +….+ ei
 X continue: régression linéaire simple
 X discrète: ANOVA
 Combinaisons: régression multiple, ANOVA2, ANCOVA

 Les erreurs suivent une distribution :


 normale
 centrée
 de variance constante
 et sont indépendantes
L’Analyse de Variance 1

1. Généralités

Quand utiliser l’ANOVA

Fréquence
 Pour tester l’effet d’une
variable explicative discrète
 variable explicative = facteur
et chaque facteur a plusieurs
niveaux ou traitements
 l’ANOVA teste si toutes les mC mN mN+P
moyennes sont égales Rendement
Témoin
Expérimental (N)
Expérimental (N+P)
L’Analyse de Variance 1

1. Généralités mN+P

Fréquence
Possibilités et limites

 Permet de tester si
toutes les moyennes
sont égales (au niveau mC mN
a)...

Fréquence
 …mais si on rejette H0,
l’ANOVA ne dit pas
lesquelles

mC mN mN+P
Rendement
L’Analyse de Variance 1

1. Généralités

Types d’ANOVA

 Fixe : les traitements sont déterminés (manipulés)


par le chercheur

 Aléatoires : les modalités sont choisies au hasard


dans une population de modalités: on peut estimer
l’effet du facteur pour d’autres modalités non étudiées

 Données identiques, modèles différents, calculs


identiques mais seulement pour l’ANOVA à un critère
de classification!
L’Analyse de Variance 1

1. Généralités

ANOVA fixe :
rendement agricole

sable argile terreau


21 16 23
20 18 31
16 11 24
ni 3 3 3 9 =N
Ti. 57 45 78 180 = T
yi. 19 15 26 20
L’Analyse de Variance 1

1. Généralités

ANOVA aléatoire:
poids de l’ours noir
280

240
variable dépendante est

Poids (kg)

le poids, 200

160
 facteur (X) = site, p=3
120
 Question = effet site,
Riding Kluane Algonquin
au-delà des sites étudiés
Mountain
L’Analyse de Variance 1
2. Le modèle
Y Les p moyennes sont-
elles identiques?

Les modalités de A
m ai influencent-elles Y?

e ij
Yij  m  a i  eij

 A1 A2 A3 A4
m moyenne de Y
a i effet de la ième modalité
 (constante). Ho : ai = 0
e ij erreur aléatoire
L’Analyse de Variance 1
2. Le modèle

 Dans une ANOVA, la variance totale est répartie en


deux composantes:

 intergroupe: variance des moyennes des différents


groupes (traitements)
 intragroupe (erreur): variance des observations
autour de la moyenne du groupe
L’Analyse de Variance 1
2. Le modèle
Répartition de la somme des carrés totale

m2
Y m
m3
m1

SC Totale SC Modèle (Groupes) SC Erreur


Groupe 1
Groupe 2
Groupe 3
L’Analyse de Variance 1
2. Le modèle
Décomposition de la Somme des Carrés
des Ecarts (SCE)
Ho : les p moyennes sont égales
Ha : au moins une moyenne diffère des autres

SCET = SCEA + SCER(=E)


p ni p ni p ni

  ij ..   i. ..   ij i.
(Y  Y ) 2
 (Y  Y ) 2
 (Y  Y ) 2

i1 j1 i1 j1 i1 j1

= SCEinter + SCEintra
= SCEB + SCEW

L’Analyse de Variance 1
2. Le modèle

Tableau d’ANOVA

Sources Somme Degré de Carré F


de variation des carrés liberté (ddl) moyen (CM)
k ni
  (Yij  Y )
2
Totale n-1 SCET/ddl
i 1 j1
k CMA
 n i (Y i  Y )
2
Facteur p-1 SCEA/ddl
i 1 CMR
k ni
  Y i j  Yi
2
Résidus ( ) n-p SCER/ddl
i1 j 1
L’Analyse de Variance 1
2. Le modèle F plus petit mN+P

Frequence
 CMintergroupe mesure les mC mN
différences moyennes au F plus grand

Frequence
carré entre moyennes des
groupes
 CMrésiduel est une mesure de la
précision

mC mN mN+P
Rendement
L’Analyse de Variance 1
2. Le modèle F plus petit mN+P

Frequence
L’hypothèse nulle

 H0: les moyennes de tous les


groupes sont les mêmes, ou mC mN
 H0: il n’y a pas d’effet des F plus grand

Frequence
groupes, ai =0 , ou
 H0: F = CMintergroupe/ CMerreur = 1
 pour p groupes et pour un
nombre d’observations N, on
compare avec la distribution
de F au niveau a avec p - 1 et
N - p degrés de liberté mC mN mN+P
Rendement
L’Analyse de Variance 1
3. Calculs pratiques

SCET   (Yij  Y ) 2  Yij  Y 2  2YijY


2

ij ij ij ij

 Yij  NY 2  2Y Yij
2
, or : Y ij  NY
ij
 ij ij

 Yij  NY
2 2 2
SCET   Yij 
2 T
ij
 N
 ij

SCE A   (Yi.  Y ) 2   n i (Yi.  Y ) 2


2 2
Ti. T
ij i
SCE A   
 i ni N
SCE R  SCET  SCE A
L’Analyse de Variance 1
3. Calculs pratiques
Exemple
sable argile terreau
21 16 23
20 18 31
16 11 24
Ti. 57 45 78 180
2
180
SCET  212  20 2  .... = 264
9
57 2 45 2 180 2 = 186
SCE A    ....
3 3 9

L’Analyse de Variance 1
3. Calculs pratiques

Exemple

SV SCE ddl CM F

A 186 2 93 7,15

R 78 6 13

T 264 8

F2
6,a  0,05  5,14
L’Analyse de Variance 1

4. Conditions d’application de l’ANOVA

eij aléatoires = indépendants et chaque eij : N (0,  )


2

- indépendants : plan d’expérience :


• modalités indépendantes
• individus indépendants : pas de double mesure, tirage au
hasard

- de moyenne nulle : par construction


- de distribution normale : normalité de Y? étude graphique (TP)
- de même variance : homoscédasticité
L’Analyse de Variance 1

4. Conditions d’application de l’ANOVA

 Ces conditions s’appliquent aux résidus et non aux


données brutes

 …on doit tester les conditions d’application après que


l’analyse soit faite et que les résidus soient obtenus
L’Analyse de Variance 1

5. Mesure de la décomposition de la SCE

Part de la variabilité de Y expliquée par l’ANOVA :

SCE A
 2 0  2  1
SCE T

NB:2 inclue
* SCET expliquée de façon linéaire : r2
* SCET expliquée de façon non linéaire : 2-r2

2 ≥ r2
L’Analyse de Variance 1

5. Mesure de la décomposition de la SCE

Exemple

Part de la variabilité du rendement


expliqué par le sol:

186
 
2
 0,70
264