Vous êtes sur la page 1sur 32

Analyse de la variance

(ANOVA à un facteur)
L’analyse de la variance (ANOVA) a pour objectif d’étudier l’influence
d’un ou plusieurs facteurs sur une variable quantitative. Nous nous
intéresserons ici au cas où les niveaux, ou modalités, des facteurs sont
fixés par l’expérimentateur. On parle alors de modèle fixe.

C’est la comparaison de moyennes pour plusieurs groupes (> 2).

Il s'agit de comparer la variance intergroupe (entre les différents


groupes : écart des moyennes des groupes à la moyenne totale) à la
variance intragroupe (somme des fluctuations dans chaque groupe).

Principe
L'analyse de la variance permet d'étudier le comportement d'une
variable quantitative à expliquer en fonction d'une ou de plusieurs
variables qualitatives, aussi appelées nominales catégorielles.
La variance
En statistique et en théorie des probabilités, la variance est une
mesure de la dispersion des valeurs d'un échantillon ou d'une
distribution de probabilité. Elle exprime la moyenne des carrés des
écarts à la moyenne, aussi égale à la différence entre la moyenne des
carrés des valeurs de la variable et le carré de la moyenne, selon le
théorème de König-Huygens. Ainsi, plus l'écart à la moyenne est grand
plus il est prépondérant dans le calcul total de la variance qui
donnerait donc une bonne idée sur la dispersion des valeurs.
Les conditions d’application
de l’analyse de la variance
Hypothèses à tester
Décomposition de la variation totale
Tableaux de données
Décomposition de la variabilité
des observations
Estimation de la variance
Exécution du test
Tableau de l’analyse de la variance
Exercice
Les conditions d’application
de l’analyse de la variance

L’indépendance des échantillons

La normalité des distributions


SHAPIRO-WILK; D’AGOSTINO; ANDERSON-DARLING…

L’homogénéité des variances


BARTLETT; LEVENE; BROWN-FORSYTHE…
Homogénéité des variances
(Test de BARTLETT)

Rejeter l’hypothèse 𝑯𝟎
Groupe1 Groupe2 Groupe3

45 78 354
34 69 338
35 86 351
29 58 332
42 57 341
37 64 358
44 ------ 347
28 ------ ------
Groupe1 Groupe2 Groupe3

68,0625 87,0489 66,2596


7,5625 0,1089 61,7796
3,0625 300,3289 26,4196
60,0625 113,8489 199,0996
27,5625 136,1889 23,6196
0,0625 21,8089 147,3796
52,5625 ------ 1,2996
76,5625 ------ ------
𝒏𝟏 = 𝟖 𝒏𝟐 = 𝟔 𝒏𝟑 = 𝟕
𝑿𝟏 = 𝟑𝟔, 𝟕𝟓 𝑿𝟐 = 𝟔𝟖, 𝟔𝟕 𝑿𝟑 = 𝟑𝟒𝟓, 𝟖𝟓𝟖
𝑽𝟏 = 𝟑𝟔, 𝟗𝟑𝟕𝟓 𝑽𝟐 = 𝟏𝟎𝟗, 𝟖𝟖𝟖𝟗 𝑽𝟑 = 𝟕𝟓, 𝟏𝟐𝟐𝟒
𝟖 𝟔 𝟕
𝑺𝟐𝟏 = 𝑽𝟏 𝑺𝟐𝟐 = 𝑽𝟐 𝑺𝟐𝟑 = 𝑽𝟑
𝟕 𝟓 𝟔

𝑺𝟐𝟏 = 𝟒𝟐, 𝟐𝟏𝟒 𝑺𝟐𝟐 = 𝟏𝟑𝟏, 𝟖𝟔 𝑺𝟐𝟑 = 𝟖𝟕, 𝟔𝟒𝟐𝟖


Estimation globale de la variance

𝟕 × 𝟒𝟐, 𝟐𝟏𝟒 + 𝟓 × 𝟏𝟑𝟏, 𝟖𝟔 + 𝟔 × 𝟖𝟕, 𝟔𝟒𝟐𝟖


𝑺²𝒑 =
𝟐𝟏 − 𝟑

𝑺²𝒑 = 𝟖𝟐, 𝟐𝟓𝟖𝟔


𝟏 𝟏 𝟏 𝟏 𝟏
𝑪=𝟏+ + + −
𝟑×𝟐 𝟕 𝟓 𝟔 𝟐𝟏 − 𝟑

𝑪 = 𝟏, 𝟎𝟕𝟔
𝑩 = (𝟐𝟏 − 𝟑) 𝐥𝐧 𝟖𝟐, 𝟐𝟓𝟖𝟔 − 𝟕𝐥𝐧 𝟒𝟐, 𝟐𝟏𝟒 + 𝟓 𝐥𝐧 𝟏𝟑𝟏, 𝟖𝟔 + 𝟔 𝐥𝐧 𝟖𝟕, 𝟔𝟒𝟐𝟖

𝑩 = 𝟏, 𝟗𝟒

𝟐 𝑩
Statistique test 𝛘 = =1,8
𝑪

Valeur critique 𝛘𝟐 (𝟑−𝟏; 𝟎,𝟎𝟓) = 𝛘𝟐 (𝟐; 𝟎,𝟎𝟓) = 𝟓, 𝟗𝟗

𝛘𝟐 < 𝛘𝟐 (𝟐; 𝟎,𝟎𝟓)


Toutes les variances sont égales
Analyse de la variance
(Hypothèses à tester)
Calcul de la moyenne globale

𝟑𝟏𝟐𝟕
𝑿= = 𝟏𝟒𝟖, 𝟗
𝟐𝟏
Mesure de la dispersion intra-groupe
𝑿𝟏 = 𝟑𝟔, 𝟕𝟓
𝑿𝟐 = 𝟔𝟖, 𝟔𝟕
𝑿𝟑 = 𝟑𝟒𝟓, 𝟖𝟓𝟖

G1 G2 G3
Total j 295,5 659,3334 525,8572

𝑺𝑪𝑬𝑹 = 𝟏𝟒𝟖𝟎, 𝟔𝟗𝟎𝟔


Mesure de la dispersion inter-groupes
𝑿𝟏 = 𝟑𝟔, 𝟕𝟓
𝑿𝟐 = 𝟔𝟖, 𝟔𝟕
𝑿𝟑 = 𝟑𝟒𝟓, 𝟖𝟓𝟖

𝑺𝑪𝑬𝑨 = 𝟖 𝟑𝟔, 𝟕𝟓 − 𝟏𝟒𝟖, 𝟗 2 + 𝟔 𝟔𝟖, 𝟔𝟕 − 𝟏𝟒𝟖, 𝟗 2

+ 𝟕 𝟑𝟒𝟓, 𝟖𝟓𝟖 − 𝟏𝟒𝟖, 𝟗 2

𝑺𝑪𝑬𝑨 = 𝟒𝟏𝟎𝟕𝟖𝟗, 𝟐𝟕
Mesure de la dispersion totale

𝑺𝑪𝑬𝑻 = 𝟒𝟏𝟐𝟐𝟔𝟗, 𝟗𝟔𝟒𝟑


Carré moyen résiduel

𝟏𝟒𝟖𝟎, 𝟔𝟗𝟎𝟔
𝑪𝒂𝒓𝒓é 𝒎𝒐𝒚𝒆𝒏 𝒓é𝒔𝒊𝒅𝒖𝒆𝒍 = = 𝟖𝟐, 𝟐𝟔
𝟐𝟏 − 𝟑
Carré moyen associé au facteur

𝟒𝟏𝟎𝟕𝟖𝟗, 𝟐𝟕
𝑪𝒂𝒓𝒓é 𝒎𝒐𝒚𝒆𝒏 𝒂𝒔𝒔𝒐𝒄𝒊é 𝒂𝒖 𝒇𝒂𝒄𝒕𝒆𝒖𝒓 = = 𝟐𝟎𝟓𝟑𝟗𝟒, 𝟔𝟒
𝟑−𝟏
Exécution du test
(Statistique test 𝑭𝒐𝒃𝒔 )

𝟐𝟎𝟓𝟑𝟗𝟒,𝟔𝟒
𝑭𝒐𝒃𝒔 =
𝟖𝟐,𝟐𝟔
= 𝟐𝟒𝟗𝟔, 𝟗
𝑭𝟑−𝟏
𝟐𝟏−𝟑 𝟎, 𝟎𝟓 = 𝑭 𝟐
𝟏𝟖 𝟎, 𝟎𝟓 = 𝟑, 𝟓𝟓𝟓

𝑭𝒐𝒃𝒔 > 𝑭𝟐𝟏𝟖 𝟎, 𝟎𝟓 = 𝟑, 𝟓𝟓𝟓


Les densités moyennes ne sont pas toutes les mêmes.
Le type de forêt a un effet significatif sur la densité des
sapins (nbre par km²).

Vous aimerez peut-être aussi