Vous êtes sur la page 1sur 9

ANOVA à effets principaux (main effects)

ANOVA factorielle (factorial ANOVA)

Introduction

Il s’agit maintenant de travailler non plus avec un seul facteur (cas de l’ANOVA simple, one way) mais en
étudiant l’effet de 2 facteurs croisés ou plus.
Les échantillons seront toujours supposés indépendants dans chacune des conditions définies par le croisement
des facteurs.
Les sources de variation à prendre en compte sont
- Le facteur A
- Le facteur B
- et, éventuellement, l'interaction A*B (cet effet est souvent le plus intéressant à détecter et à interpréter).

Dans ce cas, la forme générale du tableau d'analyse de variance est la suivante :

Sources Somme Moyenne


ddl F p
de variation des Carrés des Carrés
Facteur A ........... ........... ........... ........... ...........
Facteur B ........... ........... ........... ........... ...........
Interaction AB ........... ........... ........... ........... ...........
Résidu ........... ........... ...........
Total ........... ...........

Les analyses factorielles se font essentiellement sur ordinateur (Statistica, SPSS …).
Nous allons en apprendre l’interprétation des divers effets sur des exemples.
Discussion d’un plan factoriel à 2 effets avec ou sans interaction
utilisant l’ANOVA factorielle sur Statistica

Dans une expérience, des individus sont soumis à la prise Dose du Quantité y
simultanée de 2 produits, une molécule (médicament) et un alcool médicament d’alcool (Effet)
(données ci-contre). A 1 3,50
A 1 4,50
On considère l’effet combiné de cette prise pour un 1er médicament
A 1 2,60
(dose A ou B) et un alcool (quantité 1 ou 2)
A 1 5,00
A 1 4,60
Discussion de l’analyse de variance : 1er cas sans interaction A 2 6,80
A 2 7,50
L’analyse de variance factorielle montre que nous avons
A 2 8,00
- un effet significatif du médicament (𝑝 = 0.013 < 0.05)
A 2 10,00
- un effet hautement significatif de l’alcool (𝑝 = 0.001 ≪ 0.05)
A 2 5,00
- Toutefois, il n’y a pas d’interaction alcool-médicament (𝑝 ≈
B 1 6,60
0.92 ≫ 0.05)
B 1 8,00
B 1 5,40
Univariate Tests of Significance for Effet B 1 6,50
Sigma-restricted parameterization
Effective hypothesis decomposition
B 1 5,50
SS Degr. of MS F p B 2 15,00
Effect Freedom B 2 11,00
Intercept 973,0 1 973,0 253,3 0,0000 B 2 9,00
Méd 30,0 1 30,0 7,8 0,0130
Alcool 61,6 1 61,6 16,0 0,0010
B 2 8,00
Méd*Alcool 0,0 1 0,0 0,0 0,9195 B 2 7,00
Error 61,5 16 3,8
Ce 1 tableau (à droite) nous montre une
er
Méd; Weighted Means (Alcool médicament.sta)
différence significative (8.20 contre 5.75, Current effect: F(1, 16)=7,8127, p=,01297
p=0.013) entre les effets moyens du Effective hypothesis decomposition
Méd Effet Effet Effet Effet N
médicament des doses A et B, Mean Std.Err. -95,00% +95,00%
Cell No.
indépendamment de la dose d’alcool 1 Dose A 5,75 0,72 4,13 7,37 10
consommée. 2 Dose B 8,20 0,92 6,11 10,29 10

L’effet moyen, par exemple, de la dose A du médicament est égal à 5.75 pour les 10 individus dont
5 ont consommé une quantité 1 d’alcool et les 5 autres une quantité 2.

Ce 2ème tableau (à droite) nous montre la Alcool; Weighted Means (Alcool médicament.sta)
Current effect: F(1, 16)=16,036, p=,00102
différence hautement significative (8.73 Effective hypothesis decomposition
contre 5.22, p=0.001) entre les effets moyens Alcool Effet Effet Effet Effet N
des quantités 1 et 2 de l’alcool Cell No. Mean Std.Err. -95,00% +95,00%
1 Qtté 1 5,22 0,50 4,10 6,34 10
indépendamment de la dose de médicament
2 Qtté 2 8,73 0,88 6,74 10,72 10
consommée (A ou B).
L’effet moyen, par exemple, dû à la quantité 2 d’alcool est égal à 8.73 pour les 10 individus ayant
pris une dose A ou B du médicament.
Ce 3ème tableau (à droite) est le plus
intéressant puisqu’on tient compte de Méd*Alcool; Weighted Means (Alcool médicament.sta)
Current effect: F(1, 16)=,01054, p=,91949
l’effet moyen simultané des 2 variable Effective hypothesis decomposition
(alcool et médicament). Méd Alcool Effet Effet Effet Effet N
Cell No. Mean Std.Err. -95,00% +95,00%
L’effet moyen, par exemple, de la dose B 1 Dose A Qtté 1 4,04 0,44 2,83 5,25 5
du médicament est égal à 6.40 pour les 5 2 Dose A Qtté 2 7,46 0,81 5,20 9,72 5
individus ayant consommé une quantité 1 3 Dose B Qtté 1 6,40 0,47 5,09 7,71 5
4 Dose B Qtté 2 10,00 1,41 6,07 13,93 5
d’alcool, alors qu’il est égal à 10.00 pour les
5 autres individus ayant consommé une quantité 2 d’alcool.
Le dernier graphe montre l’effet non significatif de l’interaction alcool-médicament (𝑝 ≈ 0.92)
On y voit l’effet de l’alcool (à gauche) pour la prise A de médicament : augmentation entre les
quantités 1 et 2 d’alcool (cercle bleu et carré rouge). Mais on y voit aussi l’effet de l’alcool (à droite)
pour la prise B de médicament : augmentation entre les quantités 1 et 2 d’alcool (cercle bleu et carré
rouge).
Ce sont les 2 pentes semblables qui indiquent bien qu’il n’y a pas interaction, les effets sont
comparables lors du changement de la quantité d’alcool à gauche (Dose A du médicament) et à
droite (dose B du médicament).

Current effect: F(1, 16)=,01054, p=,9195


13
Alcool
11 Pentes semblables
Qtté 1
Qtté 2
9
Effet

1
Dose A Dose B
Dose
Discussion de l’analyse de variance : 2 cas avec interaction Médicament
ème
Effet
Alcool
L’analyse de variance factorielle montre ici que nous avons 2 d’interaction
- un effet très hautement significatif du médicament (𝑝 < A 1 2,90
0.0001) A 1 4,20
- un effet très hautement significatif de l’alcool (𝑝 < A 1 5,05
0.0001) A 1 2,24
- une interaction alcool-médicament significative (𝑝 = A 1 5,10
0.014 < 0.051) A 2 4,00
Univariate Tests of Significance for Effet Int A 2 8,25
Sigma-restricted parameterization A 2 6,00
Effective hypothesis decomposition A 2 8,50
SS Degr. of MS F p
Effect Freedom
A 2 4,60
Intercept 1038,4 1 1038,4 511,8 0,0000 B 1 7,10
Méd 90,0 1 90,0 44,4 0,0000 B 1 7,50
Alcool 85,7 1 85,7 42,2 0,0000
B 1 5,40
Méd*Alcool 15,6 1 15,6 7,7 0,0136
Error 32,5 16 2,0 B 1 5,66
B 1 6,21
B 2 11,60
Je vous laisse le soin de discuter les 2 tableaux suivants (en B 2 13,20
vous inspirant du 1er cas plus haut)
B 2 12,50
B 2 13,50
Méd; Weighted Means (Alcool médicament.sta)
Current effect: F(1, 16)=44,364, p=,00001
B 2 10,60
Effective hypothesis decomposition
Méd Effet Int Effet Int Effet Int Effet Int N
Cell No. Mean Std.Err. -95,00% +95,00%
1 Dose A 5,08 0,65 3,62 6,55 10
2 Dose B 9,33 1,03 6,99 11,67 10

Alcool; Weighted Means (Alcool médicament.sta)


Current effect: F(1, 16)=42,216, p=,00001
Effective hypothesis decomposition
Alcool Effet Int Effet Int Effet Int Effet Int N
Cell No. Mean Std.Err. -95,00% +95,00%
1 Qtté 1 5,14 0,53 3,94 6,33 10
2 Qtté 2 9,28 1,12 6,74 11,81 10

Méd*Alcool; Weighted Means (Alcool médicament.sta)


Dans ce 3ème tableau de l’effet simultané Current effect: F(1, 16)=7,6941, p=,01355
des 2 paramètres (alcool et médicament), Effective hypothesis decomposition
Méd Alcool Effet Int Effet Int Effet Int Effet Int N
on a bien un effet d’interaction (𝑝 = Mean Std.Err. -95,00% +95,00%
Cell No.
0.014 < 0.05) 1 Dose A Qtté 1 3,90 0,57 2,30 5,49 5
2 Dose A Qtté 2 6,27 0,92 3,72 8,82 5
3 Dose B Qtté 1 6,37 0,40 5,25 7,50 5
4 Dose B Qtté 2 12,28 0,53 10,80 13,76 5
Le graphe suivant montre cette fois-ci l’effet significatif de cette interaction alcool-médicament.
On y voit, à gauche, pour la dose A du médicament, l’effet plutôt faible dû à l'alcool quand on passe
de la quantité 1 à la quantité 2 (cercle bleu et carré rouge).
On y voit, à droite pour la dose B du médicament, l’effet beaucoup plus fort dû à l’alcool quand on
passe de la quantité 1 à la quantité 2 (cercle bleu et carré rouge).
C’est la pente plus forte pour la quantité 2 d’alcool qui indique qu’il y a interaction.

Current effect: F(1, 16)=7,6941, p=,01355


16
Alcool
Qtté 1
12 Qtté 2
Effet Int

8 Pente 2
plus élevée

4
Pente 1

0
Dose A Dose B

En conclusion
Nous avons donc un 1er cas où les effets de l’alcool et du médicament, tout en étant réellement
significatifs, semblaient juste s’ajouter de façon arithmétique sans effet l’un sur l’autre (absence
d’interaction).
Le 2ème cas montre, par contre, qu’en passant à une prise B du médicament, l’augmentation de la
dose d’alcool provoque cette fois-ci un effet qui pourrait être foudroyant car l‘alcool interagit avec
le médicament (𝑝 = 0.014 < 0.05) d'où les risques de potentialisation signalés lors de la prise
simultanée d'alcool et de médicaments.
Série n° 3 - Corrigé

1 – Qualité de l’eau des communes belges


𝐻0 : «𝐿𝑒𝑠 𝑝𝐻 𝑚𝑜𝑦𝑒𝑛𝑠 𝑠𝑜𝑛𝑡 𝑐𝑜𝑚𝑝𝑎𝑟𝑎𝑏𝑙𝑒𝑠 𝑝𝑜𝑢𝑟 𝑙𝑒𝑠 5 𝑐𝑜𝑚𝑚𝑢𝑛𝑒𝑠 »
Nous avons
𝑛1 = 𝑛2 = 𝑛3 = 𝑛4 = 𝑛5 = 4 𝑛 = 5 ∗ 5 = 25 𝑘=5
On a la somme ∑𝑖,𝑗 𝑥𝑖𝑗 = (27.79 + ⋯ + 31.01) = 136.400
136.4
Ce qui donne la moyenne générale 𝑥̅ = = 5.4560 ≈ 5.46
25

Variance factorielle

27.79 2 31.01 2
𝑆𝐶𝐸𝑓𝑎𝑐 = ∑ 𝑛𝑗 𝑥̅𝑗2 2
− 𝑛𝑥̅ = 5 (( ) + ⋯+ ( ) ) − 25 ∗ 5.45602 = 753.836 − 744.198
5 5
𝑗

= 9.638
𝑆𝐶𝐸𝑓𝑎𝑐 9.638
𝑉𝑎𝑟𝑓𝑎𝑐 = = = 2.4095
𝑘−1 (5 − 1)
Variance résiduelle

2
𝑆𝐶𝐸𝑟é𝑠 = ∑ 𝑥𝑖𝑗 − ∑ 𝑛𝑗 𝑥̅𝑗2 = (154.660 + ⋯ + 193.801) − 753.836 = 757.461 − 753.836 = 3.625
𝑖,𝑗 𝑗

𝑆𝐶𝐸𝑟é𝑠 3.625
𝑉𝑎𝑟𝑟é𝑠 = = = 0.1813
𝑛−𝑘 (25 − 5)
𝑉𝑎𝑟𝑓𝑎𝑐 2.4095
𝐹= = = 13.29
𝑉𝑎𝑟𝑟é𝑠 0.1813
On a 𝐹 = 13.29 ≫ 𝐹5% (4,20) = 2.87

L’hypothèse nulle est rejetée, l’eau d’au moins une des communes a un pH moyen qui diffère de

façon significative des autres.

Traitement sur Statistica

Commune; Weighted Means


Current effect: F(4, 20)=13,296, p=,00002
Effective hypothesis decomposition
Commune Mesure Mesure Mesure Mesure N
Cell No. Mean Std.Err. -95,00% +95,00%
1 Stavelot 5,56 0,10 5,28 5,84 5
2 Baelen 5,51 0,13 5,15 5,87 5
3 Dison 5,70 0,27 4,96 6,44 5
4 Herve 4,32 0,10 4,05 4,59 5
5 Sankt-Vith 6,20 0,27 5,45 6,96 5
Levene's Test for Homogeneity of Variances
Effect: Commune
Degrees of freedom for all F's: 4, 20
MS MS F p
Effect Error
Mesure 0,137 0,036 3,784 0,019

Univariate Tests of Significance for Mesure


Sigma-restricted parameterization
Effective hypothesis decomposition
SS Degr. of MS F p
Freedom
Effect
Intercept 744,20 1 744,20 4106,51 0,000000
Commune 9,64 4 2,41 13,30 0,000019
Error 3,62 20 0,18

Newman-Keuls test; variable Mesure


Le test post hoc SNK montre que les pH des communes Homogenous Groups, alpha = ,05000
sont comparables sauf celui d’Hervé qui est Error: Between MS = ,18122, df = 20,000
significativement plus bas que les autres (𝑝𝐻 = 4.32), ce Commune Mesure 1 2
que montre bien le graphe. Cell No. Mean
4 Herve 4,32 ****
2 Baelen 5,51 ****
1 Stavelot 5,56 ****
3 Dison 5,70 ****
Que représente 𝑀𝑒𝑎𝑛 ± 𝑆𝐸 ?? 5 Sankt-Vith 6,20 ****
Que représente 𝑀𝑒𝑎𝑛 ± 1.96 ∗ 𝑆𝐸 ??
Mean
6,8 Mean±SE
Mean±1,96*SE
6,4

6,0
Mesure

5,6

5,2

4,8

4,4

4,0
Stavelot Baelen Dison Herve Sankt-Vith
Commune

2 – Quantité de glucosinolate dans le colza


126.4 + ⋯ + 76.8 489.6
Moyenne générale 𝑥̅ = = = 25.7684 ≈ 25.7684 ≈ 25.77
5+3+4+4+3 19
126.4 83.0 102.6 100.8 76.8
𝑥̅1 = 5
= 25.280 𝑥̅ 2 = 3
= 27.6667 𝑥̅ 3 = 4
= 25.650 𝑥̅4 = 4
= 25.200 𝑥̅ 5 = 3
= 25.600

Variance factorielle

𝑆𝐶𝐸𝑓𝑎𝑐 = ∑ 𝑛𝑗 𝑥̅𝑗2 − 𝑛𝑥̅ 2 = (5 ∗ 25.282 + 3 ∗ 27.66672 + ⋯ ) − 19 ∗ 25.76842 = 12629.66 − 12616.20


𝑗
𝑆𝐶𝐸𝑓𝑎𝑐 13.46
𝑆𝐶𝐸𝑓𝑎𝑐 = 13.46 et 𝑉𝑎𝑟𝑓𝑎𝑐 = 𝑘−1
= (5−1) = 3.345
Variance résiduelle
2
𝑆𝐶𝐸𝑟é𝑠 = ∑ 𝑥𝑖𝑗 − ∑ 𝑛𝑗 𝑥̅𝑗2 = 12637.80 − 12629.66
𝑖,𝑗 𝑗
𝑆𝐶𝐸𝑟é𝑠 8.14
𝑆𝐶𝐸𝑟é𝑠 = 8.14 et 𝑉𝑎𝑟𝑟é𝑠 = 𝑛−𝑘
= (19−5) = 0.581
𝑉𝑎𝑟𝑓𝑎𝑐 3.345
On en déduit le facteur de Fisher-Snedecor 𝐹 = 𝑉𝑎𝑟𝑟é𝑠
= 0.581 = 𝟓. 𝟕𝟔 > 𝐹5% (4,14) = 3.11

L’hypothèse nulle est rejetée, au moins un des résultats diffère significativement des autres.

Le calcul exact (sur Statistica) donne

𝑆𝐶𝐸𝑓𝑎𝑐𝑡 = 8.1447 ≈ 𝟖. 𝟏𝟒 𝑆𝐶𝐸𝑟é𝑠 = 13.4364 ≈ 𝟏𝟑. 𝟒𝟒 et 𝐹 = 5.7740 ≈ 𝟓. 𝟕𝟕


Test SNK (à interpréter)
Newman-Keuls test
Homogenous Groups, alpha = ,05000
Error: Between MS = ,58176, df = 14,000
Ech Valeur 1 2
Cell No. Mean
4 4 25,20 ****
1 1 25,28 ****
5 5 25,60 ****
3 3 25,65 ****
2 2 27,67 ****

Graphe illustratif

30 Mean
Mean±SE
Mean±1,96*SE
29

28
Valeur

27

26

25

24
L1 L2 L3 L4 L5
Laboratoire

3 – Exposition à un toxique
𝑛1 = 𝑛2 = 𝑛3 = 𝑛4 = 20 𝑛 = 80 𝑘 = 4
8∗7+4∗8+⋯+4∗11 178 195 181
𝑥̅1 = = = 8.90 𝑥̅ 2 = = 9.75 𝑥̅ 3 = = 9.05
5+4+3+4+4 20 20 20
161 715
𝑥̅ 4 = 20
= 8.05 Moyenne générale 𝑥̅ = 80
= 8.9375

Variance factorielle

𝑆𝐶𝐸𝑓𝑎𝑐 = ∑ 𝑛𝑗 𝑥̅𝑗2 − 𝑛𝑥̅ 2 = 20(8.902 + 9.752 + ⋯ ) − 80 ∗ 8.93752 = 6419.55 − 6390.31


𝑗
𝑆𝐶𝐸𝑓𝑎𝑐 29.24
𝑆𝐶𝐸𝑓𝑎𝑐 = 29.24 et 𝑉𝑎𝑟𝑓𝑎𝑐 = 𝑘−1
= (4−1) = 9.747

Variance résiduelle
2
𝑆𝐶𝐸𝑟é𝑠 = ∑ 𝑥𝑖𝑗 − ∑ 𝑛𝑗 𝑥̅𝑗2 = (5 ∗ 72 + 4 ∗ 82 + ⋯ + 0 ∗ 102 + 0 ∗ 112 ) − 6419.55 = 6533.00 − 6419.55
𝑖,𝑗 𝑗
𝑆𝐶𝐸𝑟é𝑠 113.45
𝑆𝐶𝐸𝑟é𝑠 = 113.45 et 𝑉𝑎𝑟𝑟é𝑠 = 𝑛−𝑘
= (80−4) = 1.493

𝑉𝑎𝑟𝑓𝑎𝑐 9.747
𝐹= = = 𝟔. 𝟓𝟑
𝑉𝑎𝑟𝑟é𝑠 1.493
On a 𝐹 = 6.53 > 𝐹5% (3,76) = 2.73

L’hypothèse nulle est rejetée, l’exposition d’au moins un des ateliers au toxique diffère significativement

des autres.

Traitement sur SPSS

ANOVA
Exposition
Sum of Mean
Squares df Square F Sig.
Between Groups 29,237 3 9,746 6,529 0,00055
Within Groups 113,450 76 1,493
Total 142,688 79

Sig. (c’est le « p » degré de signification) = 0.00055<<0.05, hautement significatif

Post Hoc Tests, Homogeneous Subsets

Le test SNK nous montre qu’en fait, l’atelier D avec une exposition moyenne de 8.05 est significativement

plus bas que les 3 autres ateliers dont l’exposition est semblable.

Autrement dit, le seul atelier qui est le moins exposé à la toxicité est l’atelier D.

Exposition
Subset for
Atelier N alpha = 0.05
1 2
Student-Newman-Keuls a D 20 8,05
A 20 8,90
C 20 9,05
B 20 9,75
Sig. 1,000 0,078

Vous aimerez peut-être aussi