Vous êtes sur la page 1sur 10

64

CINQUIEME PARTIE
ANALYSE DE VARIANCE
A UN FACTEUR CONTROLE
1. Application la comparaison de plusieurs moyennes.
Lanalyse de variance est souvent utilise comme un test dgalit de moyennes. Mais elle a
beaucoup dautres applications, cest pourquoi on ltudie part.
a) But du test
Lorsqu'on veut montrer l'galit des moyennes de plusieurs sries de mesures, il n'est pas possible
d'effectuer un test de Student sur les moyennes prises deux deux parce que les tests statistiques
peuvent dmontrer une non-diffrence, mais pas une galit au sens mathmatique du terme.
Le problme de l'galit des moyennes revient, dans ce cas montrer si elles peuvent tre
diffrencies ou non en fonction d'un certain facteur, appel facteur diffrenciant.
b) Notion de facteur diffrenciant
Il s'agit d'une grandeur qualitative ou quantitative suivant laquelle on peut discerner les rsultats d'une
mme tude.
Exemple :
Numro de lot ou date dans une fabrication
Laboratoire, appareil ou oprateur dans une srie de mesures physico-chimiques
Lieu gographique
Grandeur physique (temprature, pression) si l'on veut dmontrer une corrlation avec cette grandeur
c) Principe du test
On partage l'chantillon en "groupes" suivant le facteur discriminant que l'on veut prendre en
compte. Dans le domaine de la validation de mthodes de mesure, ce partage est naturel puisqu'on
s'intresse des sries de mesures d'une mme grandeur, effectues des moments diffrents, sur
des appareils diffrents ou par des laboratoires diffrents.
La variabilit existe toujours d'un groupe l'autre, mais celle-ci peut tre due au hasard.
L'analyse de variance permet de montrer si la variabilit d'un groupe l'autre peut s'expliquer
uniquement par le hasard ou si le facteur discriminant intervient dans cette variabilit.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

65
Pour ceci, on compare l'aide d'un test de Fisher-Sndcor la variance l'intrieur des groupes
ou "variance intra-goupes" la variance entre les groupes appele "variance inter-groupes". Si la
variance inter-groupes n'est pas significativement suprieure la variance intra-groupes, les
diffrentes moyennes sont dclares globalement gales (il n'y a pas de facteur diffrenciant).
Il faut videmment que le facteur choisi soit pertinent, c'est dire qu'il existe des raisons physiques ou
exprimentales permettant de prconiser l'influence de ce facteur sur les mesures.
Lorsqu'on veut tester plusieurs facteurs il faut les considrer globalement par une analyse de variance
multifactorielle car l'influence de deux ou de plusieurs facteurs n'quivaut pas la somme des
influences des facteurs pris sparment (il peut y avoir synergie ou au contraire inhibition de l'effet de
deux facteurs).
d) Calcul de la variance intra-groupes
On calcule les variances l'intrieur de chaque groupe.

s 2j =

x ij m j

i variant de 1 nj

nj 1

xij : ime valeur dans le jme groupe

(38)

nj : effectif du jme groupe

mj : moyenne du jme groupe


Ensuite on fait la somme sur les k groupes :

S INTRA = n j 1 s 2 j variant de 1 k
j

(39)

SIntra peut galement tre calcul directement l'aide d'une double somme :

S INTRA =

k nj

(x ij m j )

j=1i =1

A partir de SIntra on calcule la variance intra-groupes

S
VINTRA = INTRA =
Nk

Pierre Jost

S INTRA
INTRA

avec N = nj et INTRA = N - k

Statistiques lusage des ingnieurs et des techniciens

(40)

66
e) Calcul de la variance inter-groupes
On calcule la moyenne gnrale M et la variance des moyennes de chaque groupe par rapport cette
moyenne gnrale. En d'autres termes chaque groupe de moyenne mj est considr par rapport la
moyenne gnrale comme une mesure de poids nj.

VINTER =

Sinter
k 1

S INTER = n j m j M

j variant de 1 k

(41)

et
(42)

f) Test proprement dit


En principe VINTER > VINTRA. Si ce n'est pas le cas on peut conclure que les moyennes sont gales ou
encore que le facteur discriminant est mal choisi puisqu'il a tendance regrouper les moyennes.
(une forte inhomognit des variances peut galement conduire ce rsultat)
On termine par un test de Fisher.

F=
et

VINTRER
VINTRA

F F(k-1, N-k,1-)

(43)

Si la condition (43) est vraie, alors le facteur considr est un facteur discriminant et les
moyennes varient significativement avec ce facteur. Dans le cas contraire les moyennes sont
gales lorsqu'on fait varier le facteur en question. Le choix du facteur diffrenciant est par
consquent trs important. Dans les problmes de maintenance on pourra effectuer le test en fonction
de l'ge d'un composant lectronique ou d'une colonne chromatographique par exemple. En
validation de mthodes de mesures, le facteur tudi est simplement le numro de la srie de
mesures, l'chantillon tant videmment identique.
g) Variance Totale
On dfinit la variance totale comme la variance de toutes les mesures par rapport la moyenne
gnrale :
k nj

S T = xij M
j =1i =1

VTOTAL =

Pierre Jost

ST
N 1

Statistiques lusage des ingnieurs et des techniciens

(44)

(45)

67
h) Tableau danalyse de variance
Les trois variances ne sont pas indpendantes.
Origine

SCE

Degrs de libert

Variances

Intra-groupes

SINTRA

N-k

VINTRA

Inter-groupes

SINTER

k-1

VINTER

Totale

ST

N-1

VTOTAL

On peut dmonter que les sommes des carrs des carts (nots SCE) ainsi que les degrs de
liberts sont additifs. Cette quation est appele quation de l'analyse de variance.

ST = S Intra + S Inter

et

N-1=(N-k)+(k-1)

On en dduit :

VTOTAL =

1
( ( N k )VINTRA + ( k 1)VINTER )
N 1

(46)

L'quation 46 est intressante puisqu'elle permet de calculer la variance totale partir de rsultats
partiels (mj, sj et nj) sans avoir remonter aux rsultats bruts.
i) Variance lie au facteur discriminant, variance inter-laboratoire
La variance inter-groupes ne dpend pas uniquement de l'effet du facteur discriminant sur les
mesures, mais galement des erreurs alatoires "naturelles", donc de la variance intra-groupes. On
peut dcomposer VINTER en ses deux composantes, la variance intra-groupe et la variance due
uniquement au facteur discriminant. On peut montrer que :

VINTER = VINTRA + n VA

(47)

VA est la contribution du facteur discriminant (appel A par convention) la variance intra-groupes. VA


est appel "variance lie au facteur A". Lorsque l'effet de A est nul VINTER = VINTRA.

n reprsente le nombre moyen de mesures par srie. n n'est pas une moyenne arithmtique, il est
dfini par l'quation :

n 2j
1
N
somme tendue de j = 1 k
n=
k 1
N
VA =

VINTER VINTRA
n

(48)

(49)

Dans les essais inter-laboratoires on effectue des sries de mesures dans des laboratoires
diffrents sur le mme chantillon. On fait ensuite une analyse de variance en considrant comme
facteur contrl, le nom du laboratoire. L'influence du facteur "laboratoire" est une variable alatoire
de variance VA appele dans ce cas "Variance inter-laboratoire" et note VL.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

68
j) Interprtation graphique de l'analyse de variance
Traons sur un mme graphique toutes les valeurs de xij en faisant apparatre clairement les sries de
mesures. On place en abscisse la valeur de i + 10 (j-1) par exemple si les effectifs de chaque srie
sont infrieurs 10.

xi,j

Srie 1

Srie 2

Srie 3

Srie 4

m
m

i+8(j-1)
Fig. 29 a
Distribution des mesures brutes xij dans une analyse de variance
L'analyse de variance permet de scinder ce graphique en deux graphiques mettant en vidence la
variance intra-groupes et la variance inter-groupes. Traons les diffrences rij = xij -mj c'est dire les
mesures rapportes aux moyennes de chaque groupe.

xi,j - mj
Srie 1

Srie 2

Srie 3

Srie 4

1
0

i+8(j-1)

-1
Fig. 29 b
Distribution des diffrences xij - mj dans une analyse de variance
On obtient une distribution de moyenne nulle qui admet comme variance globale lorsqu'on mlange
toutes les valeurs de rij, la variance intra-groupe VINTRA. Dans le cas d'une analyse inter-laboratoire,
cette variance reflte les incertitudes lies une mthode de mesure, les diffrentes variances sj
doivent donc en principe tre homognes. (une faible variation de sj d'un groupe l'autre est
acceptable puisque les mesures sont effectues par des personnes diffrentes avec des appareils
diffrents).

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

69
Lorsqu'on a retranch les fluctuations rij sur la figure 29 a, il reste une distribution statistique de
moyennes autour de la moyenne gnrale M.

mj

Srie 1

Srie 2

3
2

Srie 3

Srie 4

m
m

M
i+8(j-1)

Fig. 29 c
Distribution des moyennes mj dans une analyse de variance
La variance de cette distribution est la variance inter-groupes VINTER.
L'objet de l'analyse de variance est de montrer que cette dernire peut tre explique
uniquement par les fluctuations alatoires c'est dire qu'elle est du mme ordre de grandeur
que VINTRA ou au contraire qu'il faut invoquer l'effet du facteur diffrenciant.
2. Conditions pour une bonne mise en application de lanalyse de variance.
a) Distribution gaussienne des donnes
Lanalyse de variance peut conduire des rsultats inexacts si les donnes de chaque groupe ne
sont pas distibues suivant une loi Normale. Il faudrait donc faire un test de Shapiro-Wilk pour les
donnes de chaque groupe, ce quon fait rarement. Lorsque le nombre de mesures de chaque groupe
est > 20 la condition de normalit est suppose vrifie.
b) Homognit des variances lintrieur des groupes.
Normalement, la variance inter-groupes doit tre suprieure la variance intra-groupes, faute de quoi
la variance due au facteur diffrenciant devient ngative ce qui est anormal.
Si les variances des groupes sont inhomognes c'est--dire sil en existe une qui est nettement
suprieure aux autres, la variance intra-groupes devient anormalement leve et parfois suprieure
la variance inter-groupes. Il est donc recommand de vrifier pralablement lhomognit des
variances laide dun test de Cochran ou de Bartlett.
Si lhomognit des variances est en dfaut on recherchera lexistence de points aberrants.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

70
3. Application de lanalyse de variance lvaluation de la qualit dune mesure
physique.
La qualit dune mesure physique sexprime par sa fidlit et son exactitude.
a) Dfinitions concernant la fidlit

La fidlit est l'troitesse de l'accord entre des rsultats d'essais indpendants obtenus
dans des conditions de variabilit exprimentales stipules.
On considre trois dfinitions de la fidlit suivant la variabilit des conditions exprimentales :

La rptabilit reprsente la qualit de l'accord entre des mesures d'un mme chantillon
effectues dans des conditions exprimentales trs faiblement variables. Elle s'obtient en
rptant un protocole de mesure sur un mme chantillon, l'appareillage et l'oprateur tant
identiques et les mesures tant effectues dans un faible intervalle de temps. Evidemment la
rptabilit n'intgre pas les erreurs systmatiques ou les dfauts d'appareillage. Elle donne
simplement une mesure de la dispersion du signal pour un protocole de mesure effectu sur
un appareil donn et par un oprateur donn.

La reproductibilit correspond la mme dfinition, mais dans le cas de mesures effectues


dans des conditions fortement variables (oprateurs, appareillages, poques et souvent
laboratoires diffrents). Plus la variabilit des conditions exprimentales est grande, plus le
nombre de causes d'erreurs prises en compte dans la dispersion des rsultats est grande. En
principe, une tude de reproductibilit implique une campagne d'essais inter-laboratoires
impliquant des entreprises diffrentes et parfois des pays diffrents.

Un niveau intermdiaire de variabilit des conditions exprimentales a t prconis lorsque


de vritables essais inter-laboratoires sont impossibles (le plus souvent pour des raisons de
confidentialit lorsqu'on tudie un produit ou un matriau nouveau). On limite les facteurs de
variabilit l'quipement, au personnel et au temps. Parfois, seul le facteur temps peut tre
pris en considration. On parle alors de Fidlit intermdiaire ou reproductibilit intralaboratoire
b) Calculs concernant la fidlit

On effectue une analyse de variance en prenant comme facteur diffrenciant, le labo ou lappareillage
ou le jour de la mesure.
On exprime toujours une non-fidlit, c'est dire qu'on donne un nombre d'autant plus grand que
la fidlit est plus mauvaise.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

71
Variance de rptabilit et de reproductibilit.
La variance de rptabilit appele Vr n'est autre que la variance intra-groupes VINTRA.
La variance de reproductibilit VR s'exprime par deux relations diffrentes suivant l'influence du
facteur diffrenciant :
si l'influence du facteur diffrenciant est ngligeable VR = VT et voisin de VINTRA
dans le cas contraire VR = VLABO + VINTRA
Ecarts-types de rptabilit et de reproductibilit
Ce sont les racines carrs des variances correspondantes. Leur intrt est qu'ils s'expriment dans les
mmes units que les moyennes

s r = Vr et s R = VR
Coefficients de variation de rptabilit et de reproductibilit
Ce sont les carts-types diviss par la moyenne gnrale

s
s
CVr = r et CVR = R
M
M
b) Dfinition de lexactitude
L'exactitude d'une mthode de mesure exprime l'troitesse de l'accord
entre la valeur mesure et la valeur admise comme exacte
La valeur exacte peut tre un poids talon, une rsistance talon etc.., mais aussi un produit naturel
ou un matriau de composition certifie ou ayant les proprits physiques certifies.

b) Evaluation de lexactitude dune mesure physique

L'exactitude d'une mthode d'analyse n'est pas proprement parler une grandeur mesurable.
On value l'exactitude en comparant la valeur exprimentale la valeur thorique par un test
de Student au seuil de 95 %, ou en montrant que la valeur thorique se trouve dans l'intervalle
de confiance de 95 % de la valeur exprimentale. On rpond ce test par "oui" ou "non". Pour
moduler la rponse, on peut agir sur le risque du test de Student mais la valeur = 5 % est
communment admise.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

72

On peut galement exprimer quantitativement lexactitude au moyen dun biais qui exprime
la diffrence entre la moyenne mesure et la valeur exacte. Ce biais peut tre exprim
comme une diffrence algbrique ou une diffrence relative ou encore un taux de
recouvrement.

Si VR reprsente la variance de reproductibilit et si la valeur exacte M0 est connue, on


admet qu'une mthode est exacte si la moyenne gnrale M n'est pas significativement
diffrente de M0 au risque bilatral de 5 %.
M M 0 t ( N 1, 0.975)

VR
N

(50)

N : nombre total de mesures ; M : moyenne gnrale


Dans ce cas lexactitude sexprime par VRAI ou FAUX sans considration quantitative.

On peut galement un biais algbrique ou relatif.


D = M-M0 ou encore D = (M-M0)/M0 (biais relatif parfois exprim en %)

Si lintervalle de confiance sur le biais est faible (lintervalle de confiance sur le biais
D est gal lintervalle de confiance sur M) on peut lutiliser comme facteur correctif
de la mthode de mesure, mais seulement dans un domaine exprimental voisin de M .
Si on veut corriger la mthode de mesure dans un large domaine, il faut faire ltude
dexactitude plusieurs points de ce domaine et modliser le biais par une fonction
adquate.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

73

ANALYSE DE VARIANCE
CE QUIL FAUT ABSOLUMENT RETENIR
Principe de lanalyse de variance.
Calcul des variances intra et inter-groupes.

S INTRA = n j 1 s 2 j variant de 1 k
j

Sinter = n j m j M

j variant de 1 k

VINTRA =

S INTRA
avec N = nj
N k

VINTER =

Sinter
k 1

Test de Fisher pour lanalyse de variance.


F=

VINTRER
VINTRA

et

F F(k-1, N-k,1-)

(conclusion : moyennes dpendantes du facteur diffrenciant)

Variance totale et variance inter-laboratoire


k nj

S T = xij M
j =1i =1

VLabo =

VTOTAL =

VINTER VINTRA
avec
n

ST
N 1

n 2j
1
N
pour j = 1 k
n=
k 1
N

Dfinition de la rptabilit et de la reproductibilit dune mesure


Calcul de lcart-type de rptabilit et de reproductibilit.
Dfinition et valuation de lexactitude dune mesure

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens