Vous êtes sur la page 1sur 48

Chapitre II : Statistique applique aux plans dexpriences

Mthodologie danalyse exprimentale II-1



CHAPITRE II : STATISTIQUE APPLIQUEE AUX
PLANS DEXPERIENCES


2.1 INTRODUCTION


Dans ce chapitre, nous allons considrer des expriences dans lesquelles
nous comparons deux conditions (aussi appeles traitements). Elles sont
frquemment appeles exprience comparative simple. Nous dbuterons
avec un exemple illustrant une exprience labore pour dterminer si deux
formulations diffrentes dun mme produit donnent des rsultats
quivalents.

La discussion de cet exemple nous conduira une rvision de plusieurs
concepts de base en statistique tels que :

- les variables randomises,
- les distributions de probabilit,
- les chantillons alatoires,
- les distributions dchantillonnage
- les tests dhypothses.

Exemple

La rsistance en tension dun mortier fait de ciment
portland est une importante caractristique de ce
produit. Un ingnieur est intress comparer la
rsistance dune formulation modifie, dans lequel un
polymre a t ajout durant le mixage, celle de la
formulation standard (non modifie).

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-2
Lexprimentateur a effectu :

- dix observations de la tension pour la formulation modifie
- dix observations pour la formulation standard.

Nous pouvons considrer ces deux (2) formulations comme deux (2)
traitements ou deux (2) niveaux de la variable indpendante formulation.
Les donnes sont prsentes dans le tableau suivant.



j
Formulation modifie
Y
1j

Formulation standard
Y
2j

1
2
3
4
5
6
7
8
9
10
16.85
16.40
17.21
16.35
16.52
17.04
16.96
17.15
16.59
16.57
17.50
17.63
18.25
18.00
17.86
17.75
18.22
17.90
17.96
18.15


Les donnes de lexprience sont prsentes sur le graphique suivant.


Formulation modifie
Formulation standard




16 17 18 19




Diagramme point


y
1
= 16.76 y
2
= 17.92

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-3
Un examen rapide de ce graphique rvle que la rsistance du mortier
standard semble suprieure celle du mortier modifi. Ce constat est
galement vrifi si lon compare les rsistances moyennes des deux
mortiers:

- 16.76 pour la formulation modifie,
- 17.92 pour la formulation standard.


- Toutefois, il est difficile de dterminer si la diffrence
observe entre les moyennes est suffisamment grande pour nous
permettre de conclure que les deux formulations sont rellement
(significativement) diffrentes.

- Il est possible que la diffrence observe soit le rsultat dune
variation dans les chantillons prlevs et que les deux
formulations soient en faite identiques.

- Il est mme possible quune deuxime srie dchantillons
donne des rsultats compltement contradictoires.



Une technique dinfrence statistique appele test dhypothse peut tre
utilise pour assister lexprimentateur dans la comparaison de ces deux
formulations.


Un test dhypothse sert comparer,
dune faon objective, deux chantillons
avec une connaissance a priori du risque
associ la prise dune mauvaise dcision.


Avant de prsenter les tests dhypothses pour des expriences
comparatives simples, il est ncessaire de dvelopper et de rviser certains
concepts statistiques de base.


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-4
2.2 CONCEPTS STATISTIQUES DE BASE

Chacune des observations de lexprience dcrite prcdemment sappelle
un essai. On notera que les essais individuels diffrent, de sorte quune
variation ou du bruit est prsent dans les rsultats.

Ce bruit est habituellement appel lerreur exprimentale ou
simplement erreur.

Il sagit dune erreur statistique, ce qui
signifie quelle provient dune variation
incontrle et gnralement invitable. La
prsence derreurs ou bruit implique que
la variable dpendante, aussi appele la
rponse (rsistance en tension dans notre
exemple) est une variable alatoire.

N.B. Une variable alatoire peut tre discrte ou continue.



2.2.1 Description graphique de la variabilit

On utilise frquemment une reprsentation graphique simple pour nous
aider analyser les donnes dune exprience. Le diagramme points,
lhistogramme et le diagramme en bote sont des moyens utiles pour
reprsenter des donnes.


Le diagramme points :

- est un moyen utile de reprsenter un nombre assez restreint
de donnes (<20 observations)

- permet lexprimentateur de voir rapidement la position
gnrale ou la tendance centrale des observations de mme
que leur tendue correspondante.

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-5
Formulation modifie
Formulation standard


16 17 18 19




Diagramme point

Par exemple, dans le cas du ciment portland, le diagramme points nous
rvle que les deux formulations diffrent trs certainement quant leurs
moyennes, mais quelles produisent une variabilit relativement similaire
dans les mesures des rsistances.

Lhistogramme

L'histogramme montre:

- la tendance centrale,
- ltendue,
- la forme gnrale de la distribution des observations.

Lhistogramme est utilis quand le nombre de points devient difficile
distinguer dans le diagramme point (> 20 observations). La figure
suivante prsente un histogramme type.











Poids (kg)

Histogramme
0.33 0.38 0.43 0.48 0.53 0.58 0.63 0.68 0.73
F
r

q
u
e
n
c
e

30


20


10


0
y
1
= 16.76 y
2
= 17.92

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-6

Le Diagramme en boite :

Le diagramme en bote est galement un outil frquemment employ pour
illustrer sur un mme graphique la concentration et lparpillement des
donnes.

Ce diagramme permet :

- de reprsenter les quartiles infrieur et suprieur (25% et
75%),

- la position mdiane (50%)

- ltendue des donnes.

La figure suivante prsente le diagramme en bote pour les donnes de
notre exemple sur le ciment portland.













Formulation modifie Formulation standard


Ce diagramme rvle clairement la diffrence entre les moyennes des
rsistances en tension pour les deux formulations. Il indique aussi que les
deux (2) formulations produisent une distribution relativement symtrique
et une variabilit similaire.



17.21
17.04
16.72
16.52
16.35
18.25
18.15
17.93
17.75
17.50
19


18


17


16
R

s
i
s
t
a
n
c
e

e
n

t
e
n
s
i
o
n

(
K
g
/
c
m
2
)

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-7

2.2.2 Distribution de probabilit

Pour dcrire dune faon plus complte les donnes provenant dun
chantillon, nous devons utiliser le concept de distribution de probabilit.
La structure de probabilit dune variable alatoire y est dcrite par sa
distribution de probabilit.

- Si y est discrte, on appelle la distribution de
probabilit de y, p(y), la fonction probabilit de y.

- Si y est continue, la distribution de probabilit de y,
f(y), est appele la fonction densit de probabilit de
y.


On notera que :

- pour la distribution de probabilit discrte, cest la
hauteur de la fonction p(y) qui reprsente la probabilit,

- que la probabilit associe une distribution de
probabilit continue correspond laire sous la courbe
comprise dans un intervalle donn.




La figure suivante illustre des distributions de probabilit hypothtiques
discrte et continue.





Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-8



Y discrte:


pour toutes les valeurs de y
j,
on a:

0 p(y
j
) 1

P(y = y
j
) = p(y
j
)

=1 ) y ( p
j



Distribution discrte








Y continue.


0 f(y)
P(a yb) =

b
a
f(y) dy

b
a
f(y) dy = 1


Distribution continue



y
1
y
2
y
3
. . . .
P(y
j
)
P(y=y
j
) = p(y
i
)
y
P(asysb)
a b
f(y
i
)
y
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-9

2.2.3 Moyenne, variance et esprance

Moyenne et esprance

La moyenne dune distribution de
probabilit est une mesure de sa tendance
centrale ou de sa localisation.

Mathmatiquement, on dfinit la moyenne qui peut tre exprime en terme
de lesprance (E(y) : valeur moyenne de la variable alatoire y aprs
une infinit dessais) comme suit :

= = u

+

discrte y ) y ( yp
continue y dy ) y ( yf
) y ( E
touslesy


Variance

Ltendue ou la dispersion dune
distribution de probabilit peut tre
mesure par la variance.

Elle est dfinie comme suit :

V(y) =

u
u
= o

+

discrte y ) y ( p ) y (
continue y dy ) y ( f ) y (
touslesy
2
2
2


Nous pouvons aussi exprimer la variance en termes de lesprance comme
suit:
V(y) = E [(y-)]= o

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-10
Les concepts desprance et de variance seront utiliss trs souvent dans ce
cours. Cest pourquoi nous ferons un rappel sommaire sur ces statistiques.
Si y est une variable alatoire avec une moyenne . et une variance o et c
une constante, alors:

1. E(c) = c 4. V(c) = 0
2. E(y) = 5. V(y) = o
3. E(cy) = cE(y) = c 6. V(cy) = c
2
V(y) = c o

Sil y a deux variables alatoires disons y
1
et y
2
avec :
E(y
1
) =
1
et V(y
1
) = o
1
et E(y
2
) =
2
et V(y
2
) = o
2

Nous aurons alors :

7. E(y
1
+ y
2
) = E(y
1
) + E(y
2
) =
1
+
2

Il est possible de montrer que :

8. V(y
1
+ y
2
) = V(y
1
) + V(y
2
) + 2 Cov(y
1
, y
2
)

O Cov (y
1,
y
2
) = E [(y
1
-
1
)( y
2
-
2
)]est la covariance des variables
alatoires y
1
et y
2
. La covariance est une mesure de lassociation linaire
entre y
1
et y
2
. Plus spcifiquement, nous pouvons dmontrer que si y
1
et y
2
sont indpendantes, alors Cov (y
1,
y
2
) = 0. Nous pouvons aussi dmontrer
que :
9. V (y
1
- y
2
) = V(y
1
) + V(y
2
) - 2 Cov(y
1
, y
2
)

Si y
1
et y
2
sont indpendantes, alors nous avons:

10. V (y
1
y
2
)= V(y
1
) + V(y
2
) = o
1
+ o
2

Et,
11. E(y
1
.y
2
)=E(y
1
).E(y
2
)=
1
.
2

Cependant, noter quen gnral
) y ( E
) y ( E
y
y
E
2
1
2
1
=
|
|
.
|

\
|
Peu importe
si y
1
et y
2
sont indpendantes ou non.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-11
2.2.4 Echantillons et distribution dchantillons

Lobjectif principal de l'infrence statistique est de
tirer des conclusions sur une population partir
dun chantillon prlev de cette dernire.

La plupart des mthodes que nous allons tudier assument que les
chantillons utiliss sont alatoires. Cest--dire que si la population
contient N lments et que nous slectionnons un chantillon de taille n de
ces lments, alors si chacun des
! n )! n N (
! N

chantillons possibles ont une


probabilit gale dtre choisis, la procdure employe sappelle un
chantillonnage alatoire. En pratique, il est parfois difficile dobtenir un
chantillon alatoire de sorte que lemploi dune table de nombres
alatoires peut tre utile.

Linfrence statistique utilise souvent des quantits calcules partir des
observations dun chantillon.

Nous dfinissons une statistique comme
nimporte quelle fonction des observations dun
chantillon qui ne contient pas de paramtres
inconnus.

Par exemple, supposons que y
1
, y
2
, y
3
, y
4
, .., y
n
reprsentent un
chantillon de taille n. Alors, la moyenne de lchantillon et la variance de
lchantillon sont des statistiques.
n
y
y
n
1 i
i
=
=
1 n
) y y (
S
n
1 i
2
i
2

=


Ces quantits sont respectivement des mesures de la tendance centrale et de
la dispersion de lchantillon. Souvent S = S , appel lcart type, est
utilis comme une mesure de la dispersion. Les ingnieurs prfrent
employer lcart type comme mesure de la dispersion puisque les units
sont alors les mmes que celles de la variable dintrt y.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-12
2.2.5 Proprits de la moyenne et de la variance de lchantillon

La moyenne de lchantillon est un estimateur de la
moyenne de la population (u) et la variance de
lchantillon est un estimateur de la variance de la
population (o).

En gnral, un estimateur dun paramtre inconnu est une statistique qui
correspond ce paramtre. On notera quun estimateur est une variable
alatoire. La valeur numrique dun estimateur donn, calcule partir
dun chantillon, sappelle un estim.

Exemple

Par exemple, supposons que nous voulons estimer la
moyenne et la variance de la rsistance dune certaine
fibre de textile. Un chantillon alatoire de n=25 fibres
est prlev et la rsistance est mesure.

La moyenne et la variance de lchantillon sont calcules, de sorte que y =
18,6 et S
2
= 1,20. Ainsi, lestim de u est y = 18,6 et lestim de o
2
est S
2
=
1,20.

Il y a plusieurs proprits requises pour tre de bons estimateurs. Deux des
plus importantes sont les suivantes:

1. Lestimateur doit tre sans biais. Cest--dire que la moyenne
aprs plusieurs chantillons ou lesprance de lestimateur doit
tre le paramtre quon estime.

2. Un estimateur sans biais doit avoir une variance minimum. Cette
proprit stipule que la variance minimum de lestimateur a une
variance qui est plus petite que la variance de nimporte quel
estimateur de ce paramtre.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-13
Nous pouvons facilement dmontrer que y et S
2
sont respectivement des
estimateurs sans biais de u et de o
2
. Premirement, considrons y
utilisant les proprits desprance, nous avons :

u = u = =
|
|
.
|

\
|
=
|
|
|
|
|
.
|

\
|
=

= = =
=
n
1 i
n
1 i
i
n
1 i
i
n
1 i
i
n
1
) y ( E
n
1
y E
n
1
n
y
E ) y ( E

Puisque lesprance de chaque observation y
i
est . Ainsi y est un
estimateur sans biais de .



Considrons maintenant la variance de lchantillon S. Nous avons :

) SS ( E
1 n
1
) y y ( E
1 n
1
1 n
) y y (
E ) S ( E
n
1 i
i
n
1 i
i

=
=

O

=
=
n
1 i
i
) y y ( SS est la somme des carrs des observations y
i


De plus,
) 1 n (
)
n

( n ) (
y n ) y ( E ) y y ( E ) SS ( E
n
1 i
n
1 i
i
n
1 i
i
o =
o
+ u o + u =


=
= =


Par consquent,
) SS ( E
1 n
1
) S ( E o =

=

En fin, nous voyons que S est un estimateur sans biais de o
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-14

2.2.6 Degrs de libert (df)


La quantit (n-1) de lquation prcdente
est appele le nombre de degrs de libert
de la somme des carrs (SS).

Ceci est un rsultat trs gnral. Il stipule que si y est une variable alatoire
avec une variance o et

=
=
n
1 i
i
) y y ( SS a u degrs de libert, alors :

SS
E o =
|
.
|

\
|
u



Le nombre de degrs de libert de la
somme des carrs est gal au nombre
dlments indpendants dans la somme
des carrs.

Par exemple,

=
=
n
1 i
i
) y y ( SS
consiste en la somme des carrs des n lments

y y ,......, y y , y y , y y
n 3 2 1
.

Ces lments ne sont pas tous indpendants puisque :

=
=
n
1 i
i
0 ) y y (

En effet, seulement (n 1) de ces lments sont indpendants, impliquant
que SS a (n-1) degrs de libert.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-15

2.2.7 Les distributions normales et autres

Habituellement nous pouvons dterminer la distribution de probabilit
dune statistique particulire si nous connaissons la distribution de
probabilit de la population dans laquelle lchantillon a t prlev
(population mre). La distribution de probabilit dune statistique est
appele une distribution dchantillonnage. Nous allons discuter
brivement de certaines distributions dchantillonnage utiles.

Une des plus importantes distributions dchantillonnage est la
distribution normale. Si y est une variable alatoire, alors la distribution
de probabilit de y est :





| |
+ < <
t o
=
o u
y
e
2
1
) y ( f
/ ) y ( ) 2 / 1 (






O -< <+ est la moyenne de la distribution et o
2
> 0 est la variance.
La distribution normale est illustre la figure ci haut.


Puisque les diffrences dans la valeur des essais (rsultant de lerreur
exprimentale) sont habituellement bien dcrites par la distribution
normale, cette dernire joue un rle important dans lanalyse des donnes
dune exprience.

Plusieurs distributions dchantillonnage peuvent aussi tre dfinies en
termes de variables normales alatoires. Nous utilisons habituellement la
notation y~N(, o
2
) pour indiquer que y est distribue suivant une
distribution dchantillonnage normale avec une moyenne u et une variance
o
2


Distribution normale
y
f(y)
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-16

Un cas spcial fort important de la distribution normale est la
distribution normale standard (centre rduite): = 0 et o
2
=1. Nous
voyons que si y~N(,o
2
) alors la variable alatoire
o
u
=
y
Z
suit une distribution normale standard dnote par N(0,1). Une table est
utilise pour dterminer la probabilit associe une valeur Z donne
(Annexe: Table A).

Nous pouvons aussi obtenir la probabilit cumulative associe la valeur Z
partir des quations suivantes:












Si Z>0,
z 0,33267 1
1
T o
e
2
1
1 Prob
) 0,937298T 0,1201676T 361836T (z/2)(0,4
3
+
=
=
+

Si Z _ 0
z 33267 , 0 1
1
T o
e
2
1
ob Pr
) T 937298 , 0 T 1201676 , 0 T 4361836 , 0 )( 2 / z (
3
+
=
t
=
+


Exemple, Si z = 1,46, alors Prob = 0,9278 (ou 92,78%)

Si z = -0,5 , alors Prob = 0,3085 (ou 30,85%)

Le lecteur pourra vrifier quon obtiendrait les mmes rsultats en
utilisant une table de la distribution normale standard.
Prob
-3 -2 -1 0 +1 +2
+3 Z
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-17
2.2.7.1 Thorme central limite

Examinons maintenant le cas o les chantillons de taille n proviennent
dune population autre que normale. Que peut-on dire maintenant de la
forme de la distribution de probabilit?

Pour prciser cette distribution, nous faisons appel un thorme trs
important de la statistique, soit le thorme central limite.


Soit y
1
, y
2
, y
3
, y
4
, .., y
n
, les observations dun
chantillon alatoire de taille n provenant dune
population infinie possdant une moyenne et une
variance o
2
. Alors la distribution de la variable
alatoire y approche celle de la distribution
normale de moyenne et de variance o
2
/n mesure
que n tend vers linfini.


- Ce thorme stipule que lon peut approximer la distribution de la
moyenne y avec la distribution normale en notant que la taille de
lchantillon est suffisamment grande.


- Ce thorme est trs utile puisquil nimpose aucune restriction sur
la forme de la population laquelle appartiennent les observations
individuelles.


En notant que la moyenne et la variance de la population existent, la
forme de la distribution de la moyenne y approche celle dune
normale mesure que la taille de lchantillon augmente.



Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-18
Daprs les rsultats empiriques de diffrentes expriences, les statisticiens
ont tabli certaines pratiques que nous rsumons comme suit:

1 La distribution de la moyenne y est approximativement
normale, quelle que soit la forme de la population mre, ds que
lchantillon est constitu dau moins 30 observations.

2. Si la population possde une distribution pratiquement
symtrique, il semble quun chantillon dau moins 15
observations soit suffisant pour que la distribution de la
moyenne soit approximativement normale.

3. Si la population mre est distribue normalement, la
distribution de la moyenne y est aussi une distribution normale
quelle que soit la taille de lchantillon.


2.2.7.2 Autres distributions (

, t, F)

Une variable alatoire forme de la somme des carrs de k variables
alatoires indpendantes normales centrs rduites (moyenne = 0 et
variance =1) suit une distribution du

avec k degrs de libert.


= z
1
+ z
2
+ z
3
+ ..+z
k



2
i
i i
k
1 i
k
1 i
2
i

k
y
z

o
u
= = ;

= =
0 < < , E() = k, V() = 2k




Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-19
La distribution du dpend du nombre de degrs de libert k. Ainsi, pour
les diffrentes valeurs de k. nous obtenons des distributions diffrentes
comme la montre la figure suivante.














Diffrentes distributions


Pour valuer les probabilits associes cette distribution, nous utilisons
une table (annexe: Table C) dont les valeurs sont exprimes en fonction:


- dun niveau de probabilit o,
- du nombre de degrs de libert k
- de la valeur de .


Comme exemple dune variable alatoire qui suit une distribution

supposons y
1
, y
2
, y
3
, y
4
, .., y
n
, un chantillon alatoire dune distribution
N(, o
2
). Alors :

2
n
1 i
2
i
2
) y y (
SS
o

=
o

=
~
2
1 n
;

Cest--dire, SS/o
2
suit une distribution

avec (n-1) degrs de libert.

k=1
k=5

k=15
;
2

f(;
2
)
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-20
Plusieurs techniques discutes dans ce cours impliquent le calcul et la
manipulation de la somme des carrs. Le rsultat de cette dernire
quation est extrmement important et sapplique frquemment:

Une somme des carrs de variables normales
alatoires lorsque elle est divise par o suit une
distribution .appele KHI DEUX.

Si z et
k
sont respectivement, une variable normale standard indpendante
et une variable KHI DEUX alatoire, alors la variable alatoire suivante
suit une distribution de student (t) avec k degrs de libert, dnot t
k
.

k /
z
t
2
k
k
;
=

La moyenne et la variance de t sont respectivement =0 et o
2
= k/(k-2) pour
k>2.


Plusieurs distributions de t
sont illustres la figure
suivante:







Diffrentes distributions t


Noter que la distribution t devient une distribution normale standard
lorsque k=. Pour valuer les probabilits associes cette distribution,
nous utilisons une table dont les valeurs sont exprimes en fonction dun
niveau de probabilit o, du nombre de degrs de libert et de la valeur de t
(Annexe: Table B).

k= (normale)

k=10

k=1
t
f(t)
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-21
Si y
1
, y
2
, y
3
, y
4
, .. , y
n
est un chantillon alatoire d'une distribution
N(,o
2
), alors la quantit suivante est distribue suivant une distribution t
avec (n-1) degrs de libert : t
n-1


n / S
y
t
u
=

La dernire distribution que nous allons considrer est la distribution F. Si

u
et
v
, deux variables alatoires KHI-DEUX indpendantes avec
respectivement u et v degrs de libert, alors le rapport suivant suit une
distribution de Fisher (F) avec u degrs de libert au numrateur et v
degrs de libert au dnominateur.

v /
u /
F
2
v
2
u
v , u
;
;
=




Deux distributions
F diffrentes sont
illustres la figure
suivante.




Diffrentes distributions F


Cette distribution est trs importante pour lanalyse statistique des
plans dexpriences. Pour valuer les probabilits associes cette
distribution, nous utilisons une table dont les valeurs sont exprimes en
fonction dun niveau de probabilit o des degrs de libert (u et v) et de la
valeur de F (Annexe: Table D).




u = 10, v = 5
u = 10, v =25
F
f(F)
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-22
Pour un exemple dune statistique qui suit une distribution F, supposons
que nous avons deux populations normales indpendantes avec une mme
variance o
2
. Si Y
11
, Y
12
, Y
13
, Y
1n
est un chantillon alatoire de taille n
1
de la premire population et Y
21
, Y
22
, Y
23
, , Y
2n
un chantillon alatoire
de taille n
2
de la deuxime population, alors

2
2
2
1
S
S
~ Fn
l
-1, n
2
-1

o S
1
et S
2
sont les variances des deux populations.

Ce rsultat dcoule directement des deux quations suivantes (vues
prcdemment):

2
n
1 i
2
i
2
) y y (
SS
o

=
o

=
~
2
1 n
;

v /
u /
F
2
v
2
u
v , u
;
;
=


3 Infrences sur une diffrence de moyennes, plans randomiss

Nous sommes maintenant prts poursuivre notre exemple du ciment
portland. On se souviendra que (2) deux formulations diffrentes de
mortiers taient tudies et on voulait dterminer si elles taient diffrentes
du point de vue de la rsistance en tension.

Dans cette section, nous verrons comment les donnes dune telle
exprience comparative simple peuvent tre analyses en utilisant les
procdures des tests dhypothses et dintervalles de confiance pour
comparer les moyennes de deux (2) traitements.

Nous allons assumer quun plan dexprience compltement randomis est
utilis. Dans un tel plan, les donnes sont considres comme
chantillonnes alatoirement partir dune distribution normale.


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-23
3.1 Tests dhypothses

Souvent on dsire tester lgalit des moyennes de deux chantillons
indpendants. Dans lexemple du ciment portland, nous pouvons prsumer
que les rsistances moyennes en tension des deux (2) formulations sont
gales. Les hypothses que nous voulons tester sont :

H
0
: u
1
= u
2
hypothse nulle : le traitement na pas deffet
H
1
: u
1
= u
2
hypothse alternative : le traitement a un effet

O u
1
est la rsistance moyenne en tension de la formulation modifie et u
2

est la rsistance moyenne en tension de la formulation standard.

Lhypothse alternative indique
gnralement la prsence dun test
bilatral puisque que cette hypothse est
vraie lorsque u
1
< u
2
ou bien u
1
> u
2
.

Le principe de lhypothse nulle est reli au concept de la diffrence
significative.

Du point de vue statistique, la diffrence
entre les moyennes de deux chantillons est
dite significative (rejet de lhypothse nulle)
si elle est trop grande pour tre simplement
due au hasard.

Lorsque nous formulons lhypothse nulle, nous supposons que la
diffrence entre les statistiques calcules est zro; toute diffrence qui
pourrait exister est simplement due leffet du hasard; elle nest donc pas
significative (acceptation de lhypothse nulle).

Dans tous les tests dhypothses, la rgion critique de test dpend du
rapport critique et de sa distribution de probabilit; elle doit tre compatible
avec les hypothses de base que nous devons considrer dans tout problme
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-24
statistique. Le point critique (dbut de rgion critique) est lendroit sur la
distribution de probabilit partir duquel nous rejetons ou acceptons
lhypothse nulle.

Deux types derreurs peuvent survenir lorsquon effectue un test
dhypothses.

Si lhypothse nulle est rejete
lorsquelle est vraie nous commettons
une erreur du type I.

Si lhypothse nulle nest pas rejete
lorsquelle est fausse, nous commettons
une erreur du type II.

Les probabilits associes ces deux types derreurs sont reprsentes de
la faon suivante :



o = P(erreur du type I) = P(rejeter Ho / Ho est vraie)


| = P(erreur du type II) = P(accepter Ho / Ho est fausse)



Parfois il est plus pratique de travailler avec la puissance du test, o :

Puissance = 1 - | = P(rejeter Ho / Ho est fausse)

La procdure gnrale pour effectuer les tests dhypothses consiste
spcifier une certaine probabilit pour lerreur du type I (o), souvent
appele le niveau significatif du test, puis de concevoir le test de telle
sorte que la probabilit de lerreur de type II est relativement faible.


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-25

o = P(erreur du type I) = P(rejeter Ho / Ho est vraie)

| = P(erreur du type II) = P(accepter Ho / Ho est fausse)

































Relation entre les deux risques derreur



1 c
x u
0

2 c
x x
Rejet de H
0
Non rejet de H
0
Rejet de H
0

/2 /2
=P(
1 c
x X
2 c
x |u=u
1
)
=P(
1 c
x X
2 c
x |u=u
3
)
u
0

u
2

=P(
1 c
x X
2 c
x |u=u
2
)
u
3

u
1

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-26
Exemple : Suite

La rsistance en tension dun mortier fait de ciment portland est une
importante caractristique de ce produit. Un ingnieur est intress
comparer la rsistance dune formulation modifie, dans lequel un
polymre a t ajout durant le mixage, celle de la formulation standard
(non modifie).




16 17 18 19





Supposons que nous puissions assumer que les variances des rsistances en
tension des deux (2) formulations sont identiques. Le test statistique
appropri pour comparer deux moyennes dans un plan compltement
randomis est alors:
2 1
p
2 1
o
n
1
n
1
S
y y
t
+

=


o
2 1
y et y sont les moyennes des deux (2) chantillons et n
1
et n
2
leur
tailles respectives. S
p
est un estim de la variance commune o
1
= o
2
= o,
calcul de la faon suivante :

2 n n
S ) 1 n ( S ) 1 n (
S
2 1
2
2 2
2
1 1 2
p
+
+
=


et
2
2
2
1
S et S sont Les variances individuelles des chantillons.

Pour dterminer si nous devons rejeter H
0
: u
1
= u
2
, nous devons comparer
t
0
la distribution t avec (n
1
+ n
2
- 2) degrs de libert.


y
1
= 16.76 y
2
= 17.92
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-27
Si |t
0
| > t
o/2
,
n1 + n2 -2


o : t
o/2
,
n1 + n2 -2
est la portion o/2 de la distribution t avec (n
1
+ n
2
- 2)
degrs de libert, nous rejetons H
0
et nous concluons que les rsistances
moyennes en tension des deux (2) formulations sont significativement
diffrentes.

Cette procdure peut tre justifie de la faon suivante. Si nous chantillons
partir de deux (2) distributions normales indpendantes, alors la
distribution de
2 1
y y est N[u
1
- u
2
, o(1/n
1
+ 1/n
2
)].


Si o est connue et Ho: u
1
= u
2
est vraie, la distribution de Z
0
suivante est
alors N(0,1).

2 1
2 1
o
n
1
n
1
y y
Z
+ o

=


Toutefois, en remplaant dans cette dernire quation o par S
p
, nous
passons dune distribution standard normale Z
0
une distribution t avec
(n
1
+n
2
-2) degrs de libert.
Si maintenant H
0
est vraie, to de lquation plus haut est distribu selon
t
n1+n2-2
, par consquent, nous devrions nous attendre voir 100(1-o)% des
valeurs t
0
se trouver entre les limites -t
o/2
,
n1+n2-2
, et +t
o/2
,
n1 + n2 -2
.

Un chantillon produisant une valeur to lextrieur de ces limites est
inhabituel si lhypothse nulle (Ho) est vraie et quil y a une vidence
montrant que H
0
doit tre rejete. Il est noter que o est la probabilit
dune erreur de type I pour ce test.

Pour certains problmes, nous dsirons rejeter H
0
seulement si une
moyenne est plus grande que lautre. On construit alors un test unilatral
(H
1
: u
1
> u
2
) et on rejette Ho seulement si t
0
> t
o
,
n1 + n2 -2
. Si nous dsirons
rejeter H
0
seulement si u
1
< u
2
, alors lhypothse alternative devient
H
1
: u
1
< u
2
et on rejette H
0
seulement si t
0
> -t
o
,
n1 + n2 -2
..

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-28
Pour illustrer cette procdure, considrons les donnes de lexemple du
ciment portland. A partir des donnes de cet exemple nous trouvons que

Formulation modifie Formulation standard

1
y = 16,76 kgf/cm
2

1
y = 17,92 kgf/cm
2

S
1
= 0.100 S
2
= 0.061
S
1
= 0.316 S
2
= 0.247
n
1
= 10 n
2
=10

et
2 n n
S ) 1 n ( S ) 1 n (
S
2 1
2
2 2
2
1 1 2
p
+
+
= 081 , 0
2 10 10
061 , 0 ) 1 10 ( 100 , 0 ) 1 10 (
=
+
+
=

S
p
= 0.284

Le test statistique est
2 1
p
2 1
o
n
1
n
1
S
y y
t
+

= 13 , 9
10
1
10
1
284 , 0
92 , 17 76 , 16
=
+

=


Ainsi 2.5% sur la distribution t avec 18 (10 + 10 - 2) degrs de libert
nous trouvons t
0.025,18
= 2.101.

Puisque |t
0
| = 9.13> t
0.025,18
= 2.101, nous rejetons lhypothse
nulle (H
0
: u
1
= u
2
) et nous concluons que les rsistances moyennes en
tension des deux (2) formulations sont significativement diffrentes un
niveau de signification de 5% (o = 0.05).


Note: mme si la supposition dans la normalit
des donnes est requise pour dvelopper la
procdure de ce test dhypothses, on peut montrer
quun cart mme modr par rapport la
normalit naffecte pas srieusement les rsultats.




Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-29
3.2 Choix de la taille de lchantillon

La slection de la taille de lchantillon est lun des aspects les plus
importants dune analyse exprimentale. Le choix de la taille de
lchantillon, la probabilit | (erreur de type II) et la diffrence entre les
moyennes des chantillons sont troitement lis. Supposons que nous
dsirons tester lhypothse :
H
0
: u
1
= u
2

H
1
: u
1
= u
2


et que les moyennes ne sont pas gales de sorte que o = u
1
- u
2


Puisque H
0
: u
1
= u
2
nest pas vraie, nous sommes proccups par le fait de
ne pas rejeter H
0
. La probabilit dune erreur du type II dpend de la
diffrence relle entre les moyennes (o). Le graphique de la probabilit | en
fonction de o pour une taille dchantillon donne sappelle la courbe
defficacit (operating characteristic curve ou O.C..) dun test. Lerreur |
est aussi fonction de la taille de lchantillon.

Gnralement, pour une valeur donne de o
lerreur | diminue mesure que la taille de
lchantillon augmente; cest--dire quune
diffrence donne entre les moyennes devient plus
facile dtecter mesure que la taille de
lchantillon augmente.

La figure suivante prsente un ensemble de courbes defficacit
(hypothses H
0
: u
1
= u
2
et H
1
: u
1
= u
2
) pour le cas o les variances des
deux populations o
1
et o
2
sont inconnues mais gales et un niveau de
signification o = 0.05.

Ces courbes assument aussi que la taille des chantillons prlevs dans
les deux populations est gale; cest--dire n
1
= n
2
= n. Le paramtre d de
laxe horizontal est
o
o
o
u u
2 2
2 1
=

= d

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-30
La division de |o|par 2o permet lexprimentateur dutiliser un mme
ensemble de courbes, indpendamment de la valeur de la variance (la
diffrence dans les moyennes est exprime dans les mmes units que
lcart type). De plus, la taille de lchantillon utilise pour construire ces
courbes est n* = 2n - 1.























En examinant ces courbes, nous notons que:

1 Plus la diffrence entre les moyennes (u
1
- u
2
) est grande, plus faible
est la probabilit de faire une erreur du type II pour une taille
dchantillon et un o donns. Ainsi, pour une taille dchantillon et
un o donns, le test dtectera une grande diffrence plus facilement
quune petite diffrence.

2. Plus la taille de lchantillon augmente plus la probabilit de faire une
erreur du type II diminue pour une diffrence entre les moyennes et
un o donns. Ainsi, pour dtecter une diffrence spcifique o, nous
devons augmenter la taille de lchantillon afin de rendre le test plus
puissant.
P
r
o
b
a
b
i
l
i
t


d
'
a
c
c
e
p
t
e
r

H
0

/

H
0

e
s
t

f
a
u
s
s
e

(
|
)

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-31
Les courbes defficacit sont souvent
utilises pour dterminer la taille des
chantillons dans une analyse
exprimentale.

Par exemple, considrons le cas du ciment portland. Supposons que nous
voulons dtecter avec une forte probabilit une diffrence dau moins 0.5
kgf/cm
2
entre les rsistances moyennes en tension des deux (2)
formulations. Ainsi, puisque u
1
- u
2
= 0.5 kgf/cm
2
est la diffrence critique
que nous voulons dtecter, nous trouvons que d, le paramtre de laxe
horizontal de la courbe defficacit, est

o
=
o
=
o
u u
=
25 , 0
2
5 , 0
2
2 1
d

Malheureusement. d est fonction dun paramtre inconnu, o.

Cependant, si nous supposons que nous avons de bonnes raisons de croire,
en se basant sur des expriences antrieures que lcart type de nimporte
quel chantillon de la rsistance en tension dpassera 0.25 kgf/cm
2
. Ainsi
en utilisant o = 0.25 dans lquation ci-dessus nous trouvons que d=1. Si
nous dsirons rejeter lhypothse nulle dans 95% du temps lorsque u
1
-
u
2
=0.5, alors | = 0.05.

Sur la figure prcdente avec | = 0.05 et d = 1, nous trouvons que n* = 16
(approximativement). Par consquent, puisque n*=2n- 1, la taille requise de
lchantillon est

9 5 , 8
2
1 16
2
1 * n
n ~ =
+
=
+
=

Nous utiliserons donc deux (2) chantillons de tailles n
1
= n
2
= 9.

Les courbes defficacit sont trs utiles pour dterminer la taille des
chantillons dans une analyse exprimentale.


Leur emploi dans diffrents plans dexpriences sera discut plus tard.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-32
3.3 Intervalles de confiance

Mme si les tests dhypothses sont des procdures utiles, ils ne
fournissent, toutefois, pas toutes les informations ncessaires.

Il est souvent prfrable de fournir un
intervalle lintrieur duquel la valeur
dun paramtre est susceptible de se
retrouver. Cet intervalle sappelle un
intervalle de confiance.

Dans beaucoup dexpriences industrielles, lexprimentateur sait dj que
les moyennes u
1
et u
2
diffrent. Par consquent, tester lhypothse nulle H
o
:
u
1
= u
2
ne prsente aucun intrt particulier. Lexprimentateur est plus
souvent intress par un intervalle de confiance sur la diffrence entre les
moyennes u
1
- u
2
.

Pour dfinir un intervalle de confiance, supposons que u est un paramtre
inconnu. Pour obtenir un estim de lintervalle de u, nous devons trouver
deux (2) statistiques, L et U, de telle sorte que


P (L s u s U) = 1 - o est vraie.


Lintervalle L s u s U sappelle lintervalle de
confiance 100(1 - o)% pour le paramtre u.

Linterprtation de l'intervalle est que si pour des chantillons alatoires
rpts, des intervalles de confiance sont construits, 100(1 - o)% de ceux-l
contiendront la vraie valeur de u. Les statistiques L et U sont appeles les
limites infrieure et suprieure de confiance. Si o = 0.05, alors lquation
L s u s U est appele lintervalle de confiance 95% pour u.



Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-33
Supposons maintenant que nous dsirons dterminer un intervalle de
confiance 100(1 - o)% pour la vraie diffrence entre les moyennes u
1
- u
2

pour le problme du ciment portland. Lintervalle peut tre obtenu de la
faon suivante. La statistique :

2 1
p
2 1 2 1
n
1
n
1
S
) ( y y
+
u u
est distribue suivant t
n1 + n2 2
. Ainsi,
o =
|
|
|
|
|
.
|

\
|
+ + s u u
s +
o =
|
|
|
|
|
.
|

\
|
+ s
+
u u
s
+ o
+ o
+ o + o
1
n
1
n
1
S t y y ) (
n
1
n
1
S t y y
P
1 t
n
1
n
1
S
) ( y y
t P
2 1
p 2 n n , 2 / 2 1 2 1
2 1
p 2 n n , 2 / 2 1
2 n n , 2 /
2 1
p
2 1 2 1
2 n n , 2 /
2 1
2 1
2 1 2 1


est un intervalle de confiance 100(1 - o)% pour u
1
- u
2
. Lintervalle de
confiance pour le problme du ciment portland est
16,76 17,92 - (2,101)2,284 s u u s +
2 1
10
1
10
1

16,76- 17,92 + (2,101)2,284
10
1
10
1
+

-1,16 0,27 s u
1
- u
2
s -1,16 + 0,27

-l,43 s u
1
- u
2
s -0,89

Ainsi, lestim de lintervalle de confiance 95% de la diffrence des
moyennes stend de -1,43 kgf/cm
2
et -0,89 kgf/cm
2
.

En dautres termes, lintervalle de confiance est :

u
1
- u
2
= -1,16 kgf/cm
2
0,27 kgf/cm
2


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-34
La diffrence entre les rsistances moyennes est -1,16 kgf/cm
2
et la
prcision sur lestim est 0,27 kgf/cm
2
.

Puisque u
1
- u
2
= 0 nest pas inclus dans cet intervalle, les donnes ne
supportent pas, un niveau de confiance de 5%, lhypothse nulle
voulant que u
1
= u
2
. Il est donc trs probable que la rsistance moyenne
en tension de la formulation non modifie excde celle de la
formulation modifie (u
1
< u
2
).

3.4 Cas o
2
2
2
1
o = o

Si nous dsirons tester
H
0
: u
1
= u
2

H
1
: u
1
= u
2


et ne pouvons raisonnablement assumer que les variances sont gales, alors
le test t sur deux (2) chantillons doit tre modifi.

Le test statistique devient :

2
2
2
1
2
1
2 1
0
n
S
n
S
y y
t
+

=


Cette statistique nest pas distribue exactement suivant t. Cependant, la
distribution t
0
peut tre estime par t si nous utilisons v comme le nombre
de degrs de libert tel que :


1 n
n / S
1 n
) n / S (
n
S
n
S
v
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+
=


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-35
3.5 Cas o
2
2
2
1
o = o
sont connues

Si les variances des deux (2) populations sont connues, alors lhypothse :

H
0
: u
1
= u
2

H
1
: u
1
= u
2


peut tre teste en utilisant la statistique

2
2
2
1
2
1
2 1
0
n n
Y Y
Z
o
+
o

=


Si les deux (2) populations sont normales, ou si la taille des chantillons est
suffisamment grande pour que le thorme central limite sapplique. La
distribution de Z
0
est N(0,1) si lhypothse nulle est vraie. Ainsi, la rgion
critique est trouve en utilisant la distribution normale plutt que la
distribution t. Spcifiquement, nous rejetons H
0
si 'Z
0
'>Z
o/2
o Z
o/2
est la
rgion suprieure o/2 de la distribution normale standard.

Pour ce test, contrairement la
distribution t, il nest pas ncessaire
dassumer que lchantillonnage provient
de populations normales.

Lintervalle de confiance 100(1 - o)% pour u
1
-u
2
o les variances sont
connues est :

2
2
2
1
2
1
2 / 2 1 2 1
2
2
2
1
2
1
2 / 2 1
n n
Z y y
n n
Z y y
o
+
o
+ s u u s
o
+
o

o o


Comme nous lavons dj mentionn, lintervalle de confiance est un
supplment utile aux tests dhypothses.


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-36
3.6 Comparaison entre une seule moyenne et une valeur spcifie

Certaines expriences ncessitent de comparer la moyenne dune
population u une valeur spcifique, disons u
0
. Les hypothses sont :

H
0
: u = u
0

H
1
: u = u
0


Si la population est normale et que nous connaissons sa variance, ou si la
population est non normale mais que la taille de lchantillon est
suffisamment grande pour que le thorme central limite sapplique, alors
lhypothse peut tre teste en utilisant une application directe de la
distribution normale. La statistique est
n /
y
Z
0
0
o
u
=

Si H
0
: u = u
0
est vraie alors la distribution de Z
0
est N(0,1). Par
consquent, la rgle de dcision pour H
0
: u = u
0
est de rejeter lhypothse
nulle si 'Z
0
'>Z
o/2
. La valeur de la moyenne u
0
dans lhypothse nulle est
habituellement dtermine selon une des trois (3) faons suivantes : elle
peut tre dtermine partir dune vidence antrieure, dune connaissance
du procde ou par exprimentation; elle peut aussi tre le rsultat dun
quelconque modle thorique dcrivant la situation tudie; finalement, elle
peut aussi tre dtermine partir des spcifications dun client.

Lintervalle 100(1 - o)% de la vraie moyenne de la population est :

n / Z y n / Z y
2 / 2 /
o + s u s o
o o


Exemple
Un vendeur fournit un lot de tissus un manufacturier
de vtements. Le manufacturier dsire connatre si la
rsistance moyenne la rupture du lot est suprieure
200 psi. Si elle est suprieure cette valeur, il accepte le
lot. Des expriences antrieures indiquent quune
variance raisonnable pour la mesure de la rsistance
la rupture est de 100 (psi)
2
.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-37
Les hypothses tester sont: Ho: u = 200
H
1
: u > 200

Noter quil sagit dun test unilatral. Ainsi, le manufacturier acceptera le
lot seulement si lhypothse nulle H
0
: u = 200 est rejete (c--d. si Z
0
> Z
o
).
Quatre (4) chantillons sont slectionns dune faon alatoire et la
rsistance moyenne a la rupture est y = 214 psi. La valeur de la statistique
est :
80 . 2
4 / 10
200 214
n /
y
Z
0
0
=

=
o
u
=

Si une erreur du type I de o = 0.05 est spcifie, nous trouvons partir
dune table de la distribution normale standard Z
o
= Z
005
= 1.645
(1.645>2.80). Ainsi, lhypothse nulle H
0
est rejete et il conclut que la
rsistance moyenne la rupture du lot est suprieure 200 psi. Il acceptera
donc le lot.

Si la variance de la population est inconnue, nous
devons supposer que la population est distribue
normalement. On notera quune dviation mme
modre de la normalit naffectera pas
srieusement les rsultats.

Pour tester H
0
: u = uo dans le cas dune variance inconnue, nous utilisons
la variance de lchantillon S
2
comme un estim de o
2
. En remplaant o par
S dans lquation ci-haut, nous obtenons la statistique

n / S
y
t
0
0
u
=


Lhypothse nulle H
0
: u = u
0
est rejete si 't
0
'>t
o/2 , n-1
, o t
o/2 , n-1
, dnote la
rgion suprieure o/2 de la distribution t avec (n-l) degrs de libert.
Lintervalle de confiance 100(1-o)%

n / S t y n / S t y
1 n , 2 / 1 n , 2 / o o
+ s u s

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-38

3.7 Sommaire

Le tableau suivant prsente un sommaire des tests sur les moyennes
discutes dans les sections prcdentes.

Tests sur des moyennes (variance connue)

Hypothse Test Statistique Critre de rejet


H
0
: u = u
0

H
1
: u = u
0


H
0
: u = u
0

H
1
: u < u
0


H
0
: u = u
0

H
1
: u > u
0








n /
y
Z
0
0
o
u
=







'Z
0
' > Z
o/2



Z
0
< - Z
o



Z
0
> Z
o





H
0
: u
1
= u
2

H
1
: u
1
= u
2


H
0
: u
1
= u
2

H
1
: u
1
< u
2


H
0
: u
1
= u
2

H
1
: u
1
> u
2









2
2
2
1
2
1
2 1
0
n n
Y Y
Z
o
+
o

=



'Z
0
' > Z
o/2



Z
0
< - Z
o



Z
0
> Z
o






Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-39
Tests sur des moyennes (variance inconnue)


Hypothse Test Statistique Critre de rejet

H
0
: u = u
0

H
1
: u = u
0


H
0
: u = u
0

H
1
: u < u
0


H
0
: u = u
0

H
1
: u > u
0






n / S
y
t
0
0
u
=


't
0
' > t
o/2, n-1



t
0
< - t
o,n-1



t
0
> t
o,n-1




H
0
: u
1
= u
2

H
1
: u
1
= u
2



H
0
: u
1
= u
2

H
1
: u
1
< u
2



H
0
: u
1
= u
2

H
1
: u
1
> u
2




2 1
2 1
0
n
1
n
1
Sp
Y Y
t
+

=

v=n1+n2-2

ou bien

2
2
2
1
2
1
2 1
0
n
S
n
S
Y Y
t
+

=


1 n
n / S
1 n
) n / S (
n
S
n
S
v
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+
=




't
0
' > t
o/2,v




t
0
< - t
o,v




t
0
> t
o,v






Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-40
4 Infrences sur une diffrence de moyennes, plans pairs

4.1 Le problme de la comparaison paire

Dans les expriences de comparaison
simple, nous pouvons augmenter
considrablement la prcision en
effectuant des comparaisons paires de la
variable exprimentale.

Exemple:

Considrons le cas dun duromtre utilis pour
mesurer la duret dun mtal donn. Cet appareil
mesure lempreinte laisse par un pntrateur enfonc
sous une charge donne. Supposons que deux (2) types
de pntrateurs sont disponibles pour cet appareil et
que lon souponne que lun des pntrateurs donne
une valeur diffrente de la duret.

Une exprience peut tre ralise de la faon suivante. Un certain nombre
dprouvettes peuvent tre alatoirement slectionn (exemple 20). La
moiti de ces prouvettes peut tre teste avec le pntrateur #1 et lautre
moiti avec le pntrateur #2. Lassignation des prouvettes chacun des
pntrateurs seffectue dune faon alatoire. Puisquil sagit dun plan
dexprience compltement randomis, la duret moyenne des deux (2)
chantillons peut tre compare laide du test t dcrit la section
prcdente.

En y regardant de plus prs, on notera quil y a un dsavantage srieux
utiliser un plan compltement randomis pour ce type de problme.

Supposons, par exemple, que les prouvettes de mtal ont t prpares de
diffrents lots ou encore quelles ne sont pas parfaitement homognes, de
telle sorte que cela puisse affecter la duret. Ce manque dhomognit
des prouvettes contribuera certes la variabilit dans les mesures de
la duret et tendra faire augmenter lerreur exprimentale, rendant
ainsi plus difficile la dtection dune diffrence relle entre les pntrateurs.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-41

Pour palier une telle possibilit, considrons lalternative suivante.
Assumons que la surface de chaque prouvette est suffisamment grande
pour que deux (2) tests de duret puissent y tre effectus. Cette alternative
pourrait consister diviser chaque prouvette en deux (2) parties, et
assigner dune faon alatoire chacune des deux (2) parties chacun des
deux (2) pntrateurs. Lordre dans lequel les pntrateurs sont testes pour
une prouvette particulire est aussi randomis. Lexprience ralise
suivant ce plan produit les donnes du tableau suivant.


Eprouvette Pntrateur #1 Pntrateur #2
1
2
3
4
5
6
7
8
9
10
7
3
3
4
8
3
2
9
5
4
6
3
5
3
8
2
4
9
4
5


Nous pouvons crire le modle statistique dcrivant les donnes de cette
exprience comme suit

)
`

=
=
c + | + u =
10 ,..., 2 , 1 j
2 , 1 i
y
ij j i ij

o y
ij
est lobservation de la duret pour le pntrateur i sur lprouvette j,

i
est la vraie duret moyenne du j
ime
pntrateur, |
j
est leffet sur la
duret d la j
ime
prouvette, et c
ij
est lerreur alatoire exprimentale de
moyenne 0 et variance o
i
2
. Cest--dire, o
1
2
est la variance des mesures
de duret effectues avec le pntrateur #1 et o
2
2
est la variance des
mesures de duret effectues avec le pntrateur #2.

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-42
Nous allons frquemment utiliser des modles de cette nature pour
dcrire les rsultats des analyses exprimentales.

Notez que si nous calculons la j
ime
diffrence paire

d
j
= y
1j
y
2j
j=1,2,,10

Lesprance de cette diffrence est :

d
= E(d
j
)
= E(y
1j
y
2j
)
= E(y
1j
) E(y
2j
)
=
1
+ |
j
(u
2
+ |
j
)
= (
1
u
2
)

Cest--dire, nous pouvons infrer sur la diffrence de la duret moyenne
des deux (2) pntrateurs
1
u
2
en infrant sur la moyenne des diffrences

d
. Notez que leffet additif des prouvettes |
j
sannule lorsque les
observations sont paires de cette manire.
Tester H
0
:
1
= u
2
est quivalent tester :

H
0
:
d
= 0
H
0
:
d
= 0

Le test statistique pour cette hypothse est :

n / S
d
t
d
0
=
o
=
=
n
1 j
j
d
n
1
d
moyenne des diffrences


2 / 1
n
1 j
n
1 j
j j
2 / 1
n
1 j
j
d
1 n
) d (
n
1
d
1 n
) d d (
S

=

= = =
cart type des diffrences.


H
0
:
d
= 0 est rejete si |t
0
| > t
o/2, n-1
.
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-43

Partant des donnes du problme prcdent, nous trouvons


d1 = 7 6 = 1
d2 = 3 3 = 0
d3 = 3 5 = -2
d4 = 4 3 = 1
d5 = 8 - 8 = 0
d6 = 3 - 2 = 1
d7 = 2 - 4 = -2
d8 = 9 9 = 0
d9 = 5 4 = 1
d10 = 4 5 = -1

Ainsi,

=
= = =
n
1 j
j
10 , 0 ) 1 (
10
1
d
n
1
d

20 , 1
1 10
) 1 (
10
1
13
1 n
) d (
n
1
d
S
2 / 1
2 / 1
n
1 j
n
1 j
j j
d
=

=

= =




Le test statistique est :

26 , 0
10 20 , 1
10 , 0
n / S
d
t
d
o
=

= =


Puisque t
0
.
025
,
9
= 2,262, nous ne pouvons pas rejeter lhypothse nulle
H
0
:
d
= 0. Il ny a donc pas dvidence indiquant que les durets mesures
avec les deux (2) pntrateurs sont diffrentes.



Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-44

4.2 Avantages du plan de comparaison paire.

Le plan utilis dans cette exprience sappelle un plan
comparaison paire. Ce plan est un cas spcial dun plan plus
gnral appel plan randomis en bloc.

Le terme bloc rfre une unit relativement homogne (dans notre cas,
les prouvettes de mtal sont des blocs) et le bloc reprsente une restriction
par rapport au plan compltement randomis puisque les combinaisons des
traitements sont seulement randomises lintrieur de chaque bloc. Nous
aborderons ce plan un peu plus loin.

Avant de quitter notre exemple, plusieurs points doivent tre mentionns.
Notez que mme si 2n = 2(10) = 20 observations ont t prises, seulement
n-1 = 9 degrs de libert taient disponibles pour le test t (nous savons que
plus le nombre de degrs de libert augmente pour t, plus le test devient
sensible). En bloquant (ou en effectuant des paires), nous avons
effectivement perdu (n-1) degrs de libert, mais nous esprons avoir appris
davantage sur le procd en liminant les sources additionnelles de
variabilit (la diffrence entre les prouvettes). Nous pouvons obtenir une
certaine indication de la qualit des informations obtenues avec ce plan
comparaison paire. Pour ce faire, comparons lcart type des diffrences
(S
d
) avec lcart type S
p
, que nous aurions obtenu si nous avions utilis un
plan compltement randomis. En utilisant les donnes du problme de
duret, nous calculons lcart type de ta faon suivante :

2 n n
S ) 1 n ( S ) 1 n (
S
2 1
2
2 2
2
1 1
p
+
+
=

Nous trouvons que S
p
= 2,32. En comparant avec S
d
= 1,20, nous
remarquons que le fait de bloquer ou pairer les observations a permis de
rduire lestim de la variabilit par prs de 50%. Nous pouvons aussi
calculer lintervalle de confiance sur u
1
- u
2
et vrifier ce mme constat. En
utilisant les donnes paires, un intervalle de confiance 95% est calcul

86 , 0 10 , 0 10 / ) 20 , 1 )( 262 , 2 ( 10 , 0 n / S t d
d 9 , 025 . 0
= =

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-45

En utilisant cette fois les donnes non paires

18 , 2 10 , 0
10 / 1 10 / 1 / ) 32 , 2 )( 101 , 2 ( 90 , 4 80 , 4
n / 1 n / 1 / S t y y
2 1 p 18 , 025 . 0 2 1

+
+


Lintervalle de confiance calcul partir des donnes paires est beaucoup
plus troit que celui calcul partir des donnes non paires. Ceci illustre la
proprit de rduction du bruit du blocage.

Bloquer n'est pas toujours la meilleure stratgie employer en analyse
exprimentale. Si la variabilit intra bloc est la mme que la variabilit inter
bloc, alors la variance de
2 1
y y est la mme peu importe le plan employ.
Dans une telle situation, le fait dutiliser un plan bloqu est un choix
beaucoup moins judicieux puisque nous perdons alors (n -1) degrs de
libert et obtenons un intervalle de confiance plus large sur u
1
- u
2
.




5 Infrences sur les variances de distributions normales

Dans beaucoup dexpriences, nous sommes intresss dterminer les
diffrences possibles entre les rponses moyennes de deux (2) traitements.
Cependant, dans certaines expriences cest la comparaison entre les
variabilits qui est importante.


Exemple:

Dans lindustrie des aliments et boissons, par exemple,
il est important que la variabilit dans le remplissage
soit la plus faible possible, de telle sorte que le poids
ou le volume des contenants soit prs de la valeur
nominale. Dans les laboratoires chimiques, nous
pourrions tre intresss par la variabilit entre deux
(2) techniques analytiques diffrentes.


Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-46
Nous allons brivement examiner les tests dhypothses et les intervalles de
confiance pour les variances de distributions normales. Contrairement aux
tests sur les moyennes, les procdures employes pour tester les variances
sont relativement sensibles lhypothse de la normalit.

Supposons que nous voulons tester hypothse que la variance dune
population normale est gale une constante, disons k. Formellement nous
voulons tester :
H
0
: o = o
0

H
1
: o = o
0


Le test statistique est :
2
0
2
0
2
0
S ) 1 n ( SS
o

=
o
= ;

o ) y y ( SS
1 i
i
=
= est la somme des carrs des donnes de lchantillon.

Lhypothse nulle est rejete si :

2
1 n ), 2 / ( 1
2
0
2
1 n , 2 /
2
0
2
1 n ), 2 / ( 1
2
0
2
1 n , 2 /
2
0
ou o ou
o o o o
; < ; ; > ; ; < ; ; > ;

sont respectivement les rgions suprieure (o/2) et infrieure (1- (o/2)) de
la distribution KHI-DEUX avec (n-1) degrs de libert.

Lintervalle de confiance 100(i-o)% sur o
2
est :

2
1 n ), 2 / ( 1
2
1 n , 2 /
S ) 1 n (

S ) 1 n (
o o
;

s o s
;



Maintenant, supposons que nous dsirons tester lgalit des variances de
deux (2) populations normales. Si deux chantillons indpendants (et
alatoires) de tailles n
1
et n
2
sont respectivement prlevs dans des
populations 1 et 2, alors le test statistique pour les hypothses

H
0
: o = o
0

H
1
: o = o
0


est : F
0
= S
1
/S
2

Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-47
Lhypothse nulle est rejete si F
o
> F
o/2,n1-1,n2-1
ou si F
o
< F
1-(o/2),n1-1,n2-1
o
F
o
> F
o/2,n1-1,n2-1
ou si F
o
< F
1-(o/2),n1-1,n2-1
sont respectivement les rgions
suprieure (o/2) et infrieure (1-(o/2)) de la distribution F avec (n
1
-1) et
(n
2
-1) degrs de libert.

De plus, notez la relation suivante entre les rgions infrieure et suprieure
1 2
2 1
v , v ,
v , v , 1
F
1
F
o
o
=
Exemple:

Un ingnieur chimique dsire tudier la variabilit
inhrente de deux (2) instruments de mesure utiliss
pour effectuer la surveillance dun certain procd. Il
suspecte que le plus vieux des deux (2) instruments
(type 1) a une variance plus grande que celle du plus
rcent (type 2). Ainsi, il dsire tester les hypothses
suivantes

H
0
: o = o
0

H
1
: o = o
0


Deux (2) sries de mesures alatoires de tailles n
1
= 12 et n
2
= 10 sont
effectues; S
1
= 14,5 et S
2
= 10,8. Le test statistique est

F
0
= S
1
/S
2
= 14,5/10,8 = 1,34

Dans la table de la distribution F (Annexe: Table D), il trouve que
F
0.05
,
11,9
= 3,10, de telle sorte que lhypothse nulle ne peut tre rejete.
Ainsi, la variance du vieil instrument nest pas suprieure celle du plus
rcent.

Lintervalle de confiance 100(1 - o)% est calcul de la faon suivante

1 n , 1 n , 2 /
2
2
2
1
2
2
2
1
1 n , 1 n ), 2 / ( 1
2
2
2
1
1 2 1 2
F
S
S
F
S
S
o o
s
o
o
s

Pour illustrer cette dernire expression. F
0.025,9,11
= 3.59 et
Chapitre II : Statistique applique aux plans dexpriences
Mthodologie danalyse exprimentale II-48
81 , 4 34 , 0
) 59 , 3 (
8 , 10
5 , 14
) 255 , 0 (
8 , 10
5 , 14
255 , 0
92 , 3
1
F
1
F
2
2
2
1
2
2
2
1
9 , 11 , 025 . 0
11 , 9 , 975 . 0
s
o
o
s
s
o
o
s
= = =


Tests sur des variances de distributions normales
Hypothses Test statistique Critre de rejet

H
0
: o = o
0

H
1
: o = o
0


H
0
: o = o
0

H
1
: o < o
0


H
0
: o = o
0

H
1
: o > o
0







2
0
2
0
2
0
S ) 1 n ( SS
o

=
o
= ;


2
1 n ), 2 / ( 1
2
0
2
1 n , 2 /
2
0
ou
o
o
; < ;
; > ;



2
1 n , 1
2
0 o
; < ;


2
1 n ,
2
0 o
; > ;


H
0
: o = o
0

H
1
: o = o
0




F
0
= S
1
/S
2



F
o
> F
o/2,n1-1,n2-1

ou
F
o
< F
1-(o/2),n1-1,n2-1


H
0
: o = o
0

H
1
: o < o
0




F
0
= S
1
/S
2



F
o
< F
o,n1-1,n2-1


H
0
: o = o
0

H
1
: o > o
0




F
0
= S
1
/S
2



F
o
> F
o,n1-1,n2-1