Vous êtes sur la page 1sur 39

PLANS D’EXPÉRIENCES

I-Introduction
Les plans d’expériences permettent d’organiser au mieux les essais qui accompagnent une
recherche scientifique ou des études industrielles. Ils sont applicables à de nombreuses
disciplines et à toutes les industries à partir du moment où l’on cherche le lien qui existe entre
une grandeur d’intérêt « y » et des variables « xi ». L’utilisation des plans d’expériences
permet d’obtenir un maximum de renseignements avec un minimum d’expériences. Pour cela,
il faut suivre des règles mathématiques et adopter une démarche rigoureuse. Il existe de
nombreux plans d’expériences adaptés à tous les cas rencontrés par un expérimentateur. Nous
aborderons dans ce cours, la modélisation d’une réponse par la méthode de planification des
expériences dans le cas des plans factoriels complets à deux niveaux et le plan composite
centré.
I-1 Les objectifs de plans d’expériences

Les plans d’expériences permettent de :


-Planifier des expériences qui permettent d’obtenir l’information le plus riche possible
- d’organiser au mieux les essais qui accompagnent une recherche scientifique ou des études
industrielles.
-Minimiser le nombre d’expériences (coût)
- Interpréter les résultats des expériences.

Ils sont applicables à de nombreuses disciplines et à toutes les industries à partir du moment
où l’on cherche le lien qui existe entre une grandeur d’intérêt « y » et des variables « xi ».
Les facteurs contrôlés : Paramètres mesurables et réglables

Les facteurs contrôlés

Paramètres xi Système
Réponse y

II-Les grandes étapes d’une étude


II-1 Les facteurs influents
- la consommation d’essence d’une voiture : cette consommation est en fonction de plusieurs
paramètres (facteurs) tels que la vitesse du véhicule, la manière de conduire, de la puissance
du moteur, du nombre de personnes transportées … etc.

1
- Le prix du produit chimique dépend de la qualité des matières premières, des rendements
des unités de production, des spécifications imposées, des conditions de fabrication …etc.
-Le rendement en blé qui est fonction de la nature du terrain, de la quantité d’engrais
incorporé, de l’exposition au soleil, du climat, de la variété de blé ensemencé, etc.
II-1-1 Les différents types de facteurs
La construction des plans et l’interprétation des résultats dépendent en grande partie des types
de facteurs rencontrés dans l’étude. On distingue plusieurs types de facteurs : les facteurs
continus, les facteurs discrets, les facteurs ordonnables, les facteurs booléens.
a -Facteurs continus
La pression est un exemple de facteur continu. Dans un intervalle de pression donné, on peut
choisir toutes les valeurs possibles. Il en est de même d’une longueur, d’une concentration ou
d’une température. Les valeurs prises par les facteurs continus sont donc représentées par des
nombres continus.
b- Facteurs discrets
Au contraire, les facteurs discrets ne peuvent prendre que des valeurs particulières. Ces
valeurs ne sont pas forcément numériques : on peut représenter un facteur discret par un nom,
une lettre, une propriété ou même par un nombre qui n’a alors en soi aucune valeur numérique
mais qu’une signification de repère. Par exemple, on peut s’intéresser aux couleurs d’un
produit : bleu, rouge et jaune sont des facteurs discrets.
c-Facteurs ordonnables
Il s’agit de facteurs discrets que l’on peut mettre dans un ordre logique. Par exemple, grand,
moyen, petit, ou encore premier, deuxième, troisième et quatrième.
d- Facteurs booléens
Les facteurs booléens sont des facteurs discrets qui ne peuvent prendre que deux
valeurs : haut ou bas, ouvert ou fermé, blanc ou noir, etc.
II-2 Modélisation
On peut écrire que la grandeur d’intérêt (réponses « y ») Sous une forme mathématique en
fonction des facteurs (xi) par :

(1)

où est une fonction inconnue (modèle théorique) des facteurs influents contrôlés

.
II-3 Optimisation

2
Recherches des conditions expérimentales qui donnent le meilleur résultat.

Conclusion
La compréhension de la méthode des plans d’expériences s’appuie sur deux notions
essentielles celles d’espace expérimentale et celle de modélisation mathématique des
grandeurs étudiées.
III- Espace expérimental
Pour présenter l’espace expérimental nous utiliserons un espace à deux dimensions, ce qui
facilitera les représentations graphiques. Il est ensuite facile d’étendre les notions introduites à
des espaces multidimensionnels.
Un facteur continu peut être représenté par un axe gradué et orienté. S’il y a un
second facteur continu, il est représenté, lui aussi, par un axe gradué et orienté.
Ce second axe est disposé orthogonalement au premier. On obtient ainsi un
repère cartésien qui définit un espace euclidien à deux dimensions. Cet espace
est appelé l’espace expérimental (figure 1). L’espace expérimental comprend tous les points
du plan « facteur 1 × facteur 2 » et chacun d’eux représente une expérience.

Espace experimental
Facteur 2

Facteur 1

Figure 1 – Chaque facteur est représenté par un axe gradué et orienté. Les axes des facteurs
sont orthogonaux entre eux. L’espace ainsi défini est l’espace expérimental.
III-1 Domaine d’un facteur
La valeur donnée à un facteur pour réaliser une expérience est appelée niveau.

3
Lorsqu’on étudie l’influence d’un facteur, en général, on limite ses variations entre deux
bornes. La borne inférieure est le niveau bas. La borne supérieure est le niveau haut. Si l’on
étudie l’influence de la vitesse du véhicule sur la consommation, celle-ci peut varier, par
exemple, entre 80 et 120 km/h. La vitesse de 80 km/h est le niveau bas et la vitesse de 120
km/h est le niveau haut. C’est l’expérimentateur qui définit ces deux niveaux en fonction des
spécificités de l’étude. L’ensemble de toutes les valeurs que peut prendre le facteur entre le
niveau bas et le niveau haut, s’appelle le domaine de variation du facteur ou plus simplement
le domaine du facteur.

III-2 Points expérimentaux

Dans un espace expérimental à deux dimensions, le niveau x 1 du facteur 1 et le niveau x 2


peuvent être considérés comme les cordonnée d’un point expérimental.

Donc un plan d’expérience est représenté par un ensemble des points expérimentaux.

Figure 3 –Les niveaux des facteurs définissent des points expérimentaux. Dans l’espace
expérimental

4
Le regroupement des domaines des facteurs définit le domaine d’étude qui est la zone où
l’expérimentateur sélectionne une partie de l’espace expérimental pour réaliser ses essais.
III-3 Domaine d’étude
Le domaine d’étude est défini par les niveaux hauts et les niveaux bas de tous les facteurs et
éventuellement par des contraintes entre les facteurs.
Example : Supposons que le second facteur soit la surcharge du véhicule définie comme toute
masse supplémentaire à celle du véhicule et du chauffeur. Le niveau bas de la surcharge est 0
kg et le niveau haut 300 kg, par exemple. S’il n’y a pas de contraintes, le domaine d’étude est
représenté par tous les points dont les surcharges sont comprises entre 0 et 300 kg et dont les
vitesses sont comprises entre 80 et 120 km/h.

Figure 4 – Le domaine d’étude est défini par la réunion des domaines


des différents facteurs (ici, il n’y a pas de contraintes).
Il peut y avoir des contraintes sur le domaine d’étude. Par exemple, il peut être impossible
d’atteindre la vitesse de 120 km/h avec une surcharge trop élevée. La figure 1.5 illustre une
réduction possible du domaine d’étude initial. Une zone du domaine d’étude initial échappe
aux expériences.

5
Figure 5 – Le domaine d’étude sous contraintes est représenté par la partie grisée.

IV Plans factoriels complets à deux niveaux (2k)

IV -1 Facteurs. Plan 2k
Ce sont les plus utilisés car les plus simples et les plus rapides à mettre en œuvre. Ils sont
notés 2k où le 2 correspond aux niveaux maximal et minimal qui délimitent le domaine
d’étude d’un facteur et k est le nombre de facteurs étudiés. Pour un plan factoriel complet à k
facteurs, il va donc falloir mener 2k expériences.
IV -2 Example d’un plan à deux niveau (k=2) si dans l'étude d'un process la température
doit intervenir, on peut décider de ne travailler qu'avec une température de 20 oC puis de 60oC.
On dira alors que le niveau bas du facteur température est 20 oC et le niveau haut est 60oC ; le
domaine expérimental de la température sera 20oC-60oC.

20oC 60oC
Domaine de la
température
-1 +1

Le modèle postulé des plans factoriels complets 22 est :

(2)

6
(3)
où :

est la réponse,

Représente le niveau du facteur 1

Représente le niveau du facteur 2

Est le produit des niveaux des facteurs 1 et 2.

est le coefficient constant du modèle ;

est le coefficient du facteur 1 ;

est le coefficient du facteur 2 ;

est le coefficient du terme .


IV -3 Signification du coefficient constant

Pour trouver la signification du coefficient constant a0, il suffit de donner la valeur 0 (unités
codées) aux niveaux des deux facteurs. Le point représentatif de l’expérience correspondante
est alors au centre du domaine d’étude et la réponse en ce point a pour valeur y0. En remplace
la valeur 0 dans La relation (3) on trouve :

(4)

La valeur du coefficient constant est égale à la réponse au centre du


domaine d’étude.

7
Figure 5 Le coefficient constant a pour valeur la réponse au centre du domaine d’étude
IV -4 Signification du coefficient du facteur 1
Considérons les deux points B et D qui se trouvent au niveau haut du facteur 1.
Les coordonnées de ces points sont, en unités codées :

La réponse au point B est y2, réponse que l’on peut écrire en remplaçant les niveaux par leurs
valeurs en unités codées :
y2 = a0 + a1*(+1) + a2*(–1) + a12*(+1)*(–1) = a0 + a1 – a2 – a12
La réponse au point D est y4, que l’on peut écrire en remplaçant les niveaux par
leurs valeurs en unités codées :
y4 = a0 + a1*(+1) + a2*(+1) + a12*(+1)*(+1) = a0 + a1 + a2 + a12
Additionnons les deux réponses y2 et y4 :
y2 + y4 = 2(a0 + a1)
Faisons le même calcul pour les points A et C qui se trouvent au niveau bas du
facteur 1 et où les réponses sont respectivement y1 et y3. On obtient :
y1 + y3 = 2(+a0 – a1)

8
Si on soustrait ces deux dernières relations, on a :
4a1 = –y1 + y2 –y3 + y4
relation que l’on peut écrire :*

(5)

Où est la moyenne des réponses au niveau haut du facteur 1. On nomme cette

moyenne . Quant à l’expression , c’est la moyenne des réponses au niveau

bas du facteur 1, soit . On peut écrire :

(6)
Le coefficient a1 est donc la demi-différence entre la moyenne des réponses au niveau haut du
facteur 1 et la moyenne des réponses au niveau bas du même facteur 1. Quand on passe du
niveau bas au niveau haut, la réponse varie, en moyenne, comme la différence. Si cette
différence est grande, la réponse varie beaucoup, si cette différence est faible, la réponse varie
peu. On a donc là un moyen de savoir comment la réponse varie en fonction du facteur 1.
C’est la raison pour laquelle on appelle le coefficient a1 l’effet du facteur 1.
IV -5 Signification du coefficient du facteur 2
De la même manière, on montre que le coefficient a2 est égal à la variation
moyenne de la réponse quand le facteur 2 passe du niveau zéro au niveau haut. Il
représente l’influence du facteur 2 dans le domaine d’étude. On l’appelle « effet du facteur 2
».
D’une manière générale, quand le modèle choisi est un polynôme, les coefficients des termes
du premier degré sont les effets des facteurs.
IV -6 Matrice d'expériences
La matrice d'expériences est le tableau qui indique le nombre d'expériences à réaliser avec la
façon de faire varier les facteurs et l'ordre dans lequel il faut réaliser les expériences. Ce
tableau est donc composé de +1 et de -1. Soit, par exemple, la matrice d'expériences suivante :
Exp X1 X2

9
1 -1 -1

2 +1 -1

3 -1 +1

4 +1 +1

On réalisera alors, dans la pratique 4 expériences. La colonne de gauche de la matrice


d'expérience indique le numéro de l'expérience (ou de l'essai). La troisième ligne indique que
lors de la réalisation du deuxième essai, le facteur X 1 sera au niveau haut alors que le facteur
X2 sera, lui, au niveau bas. Dans le cas où l'on ajoute à droite de la matrice d'expérience une
colonne avec les réponses, on obtient la « matrice d'expériences et des réponses »

IV -7 Effet global et effet moyen d'un facteur


IV -7 -1Un seul facteur :
Supposons qu'il n'y ait qu'un seul facteur X1 à deux niveaux. Notons y2 la réponse (résultat de
l'expérience) lorsque X1 est au niveau +1 et y1 la réponse lorsque X1 est au niveau -1. La
matrice d'expérience et des réponses est :

Exp X1 Réponse : Y rep

1 -1 y1

2 +1 y2

On appelle effet global d'un facteur (sous-entendu : sur la réponse) la variation de la réponse
quand le facteur passe du niveau -1 au niveau +1.
On appelle effet moyen d'un facteur (sous-entendu : sur la réponse) la demi-variation de la
réponse quand le facteur passe du niveau 0 au niveau +1. Ainsi, l'effet moyen est défini comme
étant la moitié de l'effet global.
IV -7 -2 Deux facteurs
L’effet d’un facteur « A » sur la réponse « y » s’obtient en comparant les valeurs prises par «
y » quand A passe du niveau (-1) au niveau (+1). Soient y1 et y2 ces valeurs (Figure 6).
Nous distinguons :
-L’effet global par (y2 - y1)
- L’effet moyen par (y2 – y1)/2

10
Figure 6 – Illustration de l’effet du facteur 1

L’effet du facteur 1 peut être positif ou négatif suivant le signe du coefficient

IV -8 Signification du coefficient a12

Il y a interaction entre deux facteurs A et B (coefficient a12) si l’effet de A sur la réponse


dépend du niveau de B ou inversement
On peut calculer le coefficient a12 par une méthode analogue à celle qui a été utilisée pour les
coefficients a1 et a2
. On trouve que le coefficient a12 est égal à :

(7)
Le coefficient a12 est appelé l’interaction entre les facteurs 1 et 2.

11
Figure 7 – Illustration d’une interaction entre deux facteurs

IV -9 Variables centrées réduites


Lorsqu’on attribue la valeur −1 au niveau bas d’un facteur et la valeur +1 au niveau haut, on
effectue deux modifications importantes :
 On déplace l’origine des mesures. Dans l’exemple choisi, le milieu de l’intervalle
[−1 ; +1] correspond à une valeur de 100 km/h. La valeur numérique de la
nouvelle origine, zéro, diffère donc de l’origine exprimée en unité courante.
 On change l’unité de mesure. Par exemple, si le niveau bas du facteur « vitesse du
véhicule » est 80 km/h et le niveau haut 120 km/h, il y a 40 km/h entre ces deux
valeurs, soit 40 fois l’unité de vitesse. Entre −1 et +1 il y a deux unités nouvelles : la
nouvelle unité vaut 20 km/h, on lui donne le nom de Pas.

12
Ces deux modifications entraînent l’introduction de nouvelles variables que l’on
appelle variables centrées réduites (v.c.r) : centrées pour indiquer le changement
d’origine et réduites pour signaler la nouvelle unité. On utilise également le terme de variables
codées ou d’unités codées.
Le passage des variables d’origine A aux variables codées x, et inversement, est donné par la
formule suivante

(A0 est la valeur centrale en unités courantes) :


L’intérêt des unités codées est de pouvoir présenter les plans d’expériences de la même
manière quels que soient les domaines d’étude retenus et quels que soient les facteurs. La
théorie des plans d’expériences présente ainsi une grande généralité.
L’utilisation des v.c.r est très répandue dans les logiciels de plans d’expériences et certaines
opérations comme la recherche des meilleurs points d’expériences par le critère de D-
optimalité ne sont réalisables qu’avec ces variables.
Les variables codées résultent du rapport de deux grandeurs de même unité physique, elles
sont donc sans dimension. La disparition des unités naturelles associée au fait que tous les
facteurs ont le même domaine de variation (deux unités codées) permet la comparaison
directe des effets des facteurs entre eux.

V - La régression
la régression recouvre plusieurs méthodes d’analyse statistique permettant d’approcher une
variable à partir d’autres qui lui sont corrélées. Par extension, le terme est aussi utilisé pour
certaines méthodes d’ajustement de courbe.
On note Y la variable aléatoire réelle à expliquer (variable endogène, dépendante
ou réponse) et X la variable explicative ou effet fixe (exogène). Le
modèle revient à supposer, qu’en moyenne, E(Y ), est une fonction affine de
X. L’écriture du modèle suppose implicitement une notion préalable de causalité

13
dans le sens où Y dépend de X car le modèle n’est pas symétrique.

Figure 8 Exemple de régression linaire

avec

ou bien

Ou bien

Représente l’erreur, l’estimation de l’erreur supposée nulle

Donc l’équation finale s’écrit :


V – 1 Valeurs ajustées, résidus et somme des carrés des résidus
Une fois les coefficients de la droite estimés, on calcule pour chaque individu :

S’appelle la valeur ajustée ou prédite de Y par le modèle.

14
S’appelle le résidu de l'observation i. C'est l'écart entre la valeur de Y observée
sur l'individu

et la valeur prédite. Le résidu est une approximation du terme d'erreur .

- la somme des carrés des résidus est . Elle mesure la distance de la droite de
régression aux points du nuage de points qui est minimale au sens des moindres carrés.
- La statistique σˆ2 = SCR/(n − 2) est un estimateur sans biais de σ2.

Comment mesurer la qualité de l'ajustement


Pour le modèle choisi, Y peut varier en fonction :
- de X, selon la relation linéaire postulée
- d'autres variables non prises en compte et synthétisées dans le terme d'erreur.
On va mesurer la part de chacune de ces deux sources de variation pour évaluer la qualité de
l'ajustement du modèle aux données.
1. Décomposition de la variation totale des observations
On peut tout d'abord écrire la décomposition suivante :

On peut montrer la propriété suivante :

15
Ainsi, la variation totale des observations yi autour de leur moyenne y,

peut être décomposée en deux parties : SCT = SCR + SCE

où représente la variance expliquée par la régression (mesure la variation

des valeurs ajustées autour de la moyenne y¯) et représente la variance


résiduelle ou non expliquée (partie de la variation totale qui n'est pas expliquée par le modèle
de régression).
2. Le coefficient de détermination R2
Afin d'avoir une idée globale de la qualité de l'ajustement linéaire, on dénit R 2 le coefficient
de détermination qui est le carré du coefficient de corrélation R :
R2 = SCE/SCT
Il mesure la part de la variation totale de Y expliquée par le modèle de régression sur X.

V-1Analyse de régression multiple sous forme matricielle


L’analyse de régression sous forme matricielle est d’un emploi commode pour la résolution
des problèmes sur ordinateur. Il s’agit de trouver par la méthode des moindres carrés les
coefficients de l’équation de régression suivante :

Cette équation s’écrit d’une manière simple en système d’équation suivante :

Présentons sous forme matricielle le matériel statistique de départ :

16
Cette matrice est appelée matrice des variables indépendantes.
Soit Y le vecteur des observations :

Le vecteur solution des coefficients B, s’obtient à partir du produit suivant :

Où est la matrice inverse de la matrice

Et est la matrice transposée de , l’estimation de l’erreur =0


Deux matrices interviennent constamment dans la théorie des plans d’expériences :

– la matrice d’information

– la matrice de dispersion

VI - Notions de statistique appliquées aux plans d’expériences


VI -1 Erreur expérimentale
Si l’on effectue plusieurs fois la même mesure, on ne trouve pas toujours le même résultat. Il
y a une dispersion des mesures. On caractérise le plus souvent la série de mesures par deux
chiffres : la moyenne et l’écart-type qui est un indice de la dispersion des mesures autour de la
moyenne. Les erreurs ainsi constatées sont appelées les erreurs aléatoires.
À côté de l’erreur aléatoire, il se peut qu’il y ait des variations d’ensemble des mesures. Tous
les résultats peuvent être plus forts ou plus faibles d’une valeur donnée. Il y a un décalage
constant de toutes les mesures. Cette erreur n’est plus aléatoire, elle est systématique.

17
L’erreur totale est la somme de ces deux types d’erreur.
VI -2 Moyenne
Par définition, la moyenne arithmétique d’un ensemble de valeurs est la somme de toutes les
valeurs divisées par le nombre de valeurs. Ici, la moyenne arithmétique est égale à :

Soit

VI -3 Variance
la variance est une mesure de la dispersion des valeurs d'un échantillon ou d'une distribution
de probabilité. Elle exprime la moyenne des carrés des écarts à la moyenne, aussi égale à la
différence entre la moyenne des carrés des valeurs de la variable et le carré de la moyenne.
Ainsi, plus l'écart à la moyenne est grand plus il est prépondérant dans le calcul total
La variance est toujours positive, et ne s’annule que si les valeurs sont toutes égales. Sa racine

carrée définit l’écart type σ, d’où la notation . la variance


est la moyenne des carrés des écarts à cette moyenne s’écrit :

Pourquoi prend-on la racine carrée de la variance ? Simplement pour exprimer la


dispersion dans la même unité que les données d’origine et que la moyenne. Les
comparaisons sont ainsi facilitées. En effet, quand on a élevé au carré les écarts à la moyenne,
on a aussi élevé au carré l’unité de mesure. La variance est donc
exprimée avec une unité qui a pour dimension le carré de l’unité d’origine.

VI -4 Écart-type
l’écart-type est une mesure de la dispersion des valeurs d'un échantillon statistique ou d'une
distribution de probabilité. Il est défini comme la racine carrée de la variance ou, de manière
équivalente, comme la moyenne quadratique des écarts par rapport à la moyenne.

18
Exemple :

VI -5 Degrés de liberté
Soit n réponses mesurées indépendamment les unes des autres. Il n’existe pas de relation
mathématique entre elles. Les n écarts à la moyenne correspondants ne sont pas indépendants.
En effet, il existe une relation mathématique entre ces écarts. Quand on en connaît n − 1, on
peut calculer le dernier avec la relation mathématique. Par exemple, reprenons les quatre

écarts à la moyenne de l’exemple


Les trois premiers écarts sont :
11.10 - 11.50 = -0.40
12.60 - 11.50 = +1.10
10.40 - 11.50 = -1.10
Le quatrième écart s’obtient facilement puisque la somme des écarts est toujours
égale à 0 : – 0,4 + 1,1 – 1,1 = 0
quatrième écart = 0,4
Il n’y a donc que n − 1 écarts indépendants. On dit que la série des n écarts à la moyenne
possède n − 1 degrés de liberté (ou ddl). Le nombre de degrés de liberté est important car il
intervient dans de nombreuses formules de statistique.

VII-Tests de Signification des effets


Test de signification des effets du modèle.
On appelle effets les coefficients des facteurs et ceux des interactions dans l'écriture du
modèle.
Les calculs statistiques qui permettent de savoir si les effets sont significatifs, de calculer les
intervalles de confiance ou de valider la linéarité du modèle font intervenir d'une part les
résidus , c'est-à-dire la différence entre la valeur expérimentale et la valeur prédite par le
modèle et, d'autre part un estimateur sans biais de la variance commune des résidus. Cet
estimateur est donné par :

19
où est le nombre d'expériences réalisées et le nombre de coefficients du modèle.
Dans ces conditions, on peut montrer que tous les effets ont la même variance donnée par :

où est le nombre d'expériences réalisées. Cela apporte une grande simplification au niveau
des calculs.
ATTENTION
Si l'on réalise un plan complet et que l'on calcule tous les effets, le calcul de s 2 est impossible
puisque alors n = p (un plan complet 2 3 conduit à 8 expériences et 8 effets : 3 effets pour les
facteurs, 3 effets pour les interactions d'ordre 2 et enfin 1 effet pour l'interaction d'ordre 3).
C'est pour cela que, dans la pratique, il est d'usage de négliger les interactions d'ordre élevé (3
ou plus). C'est souvent le contexte et la connaissance de lois régissant le phénomène étudié
qui permet de négliger certaines interactions et donc de pouvoir conduire des calculs
statistiques.
Si néanmoins on veut travailler avec tous les effets, une méthode efficace pour déterminer
est la méthode dite des (mesures au centre). On effectue alors plusieurs mesures au centre du
domaine (tous les facteurs sont réglés à 0) et on détermine à partir des résultats sur ces
( points au centre).
Réalisation du test de signification des effets.
Le test utilisé est le test " t"de Student. Un effet sera dit significatif (c'est-à-dire que la
variable ou l'interaction qui lui est associée a une influence sur la réponse), s'il est, pour un
risque donné, significativement différent de 0. On testera donc l'hypothèse :

Contrer l'hypothèse : Pour cela, on calcule :

On utilise alors une table de Student à degrés de liberté ( est le nombre


d'expériences réalisées et le nombre d'effets y compris la constante).On choisit un risque
de première espèce  (le plus souvent 5% ou 1%) et on lit dans cette table de Student la
valeur tit(,), en utilisant la partie de la table relative à un test bilatéral. La règle du test est
alors la suivante :

 Si on rejette H0 au risque accepté.

 Si , on accepte H0 au risque accepté.


Si l'hypothèse H0 est acceptée, cela veut dire que l'effet en question n'est pas, au risque 
significativement différent de 0 et donc que la variable qui lui est associée n'a pas d'influence
sur la réponse.
Exemple.
On considère une réaction chimique dont le rendement dépend de deux facteurs, la
température et la pression. Le technicien décide d'effectuer un plan d'expérience avec le
domaine expérimental suivant :

20
Niveau bas : -1 Niveau haut :+1

Température : T 60oC 80oC

Pression : P 1 bar 2 bars

La réponse étudiée, rendement de l'expérience, est donnée par le tableau suivant :


Exp T P Y (Rend)

1 -1 -1 60

2 +1 -1 65

3 -1 +1 75

4 +1 +1 85

Déterminons une estimation ponctuelle des effets de chacune des variables

Exp Moy T P Y (%)

1 +1 -1 -1 60

2 +1 +1 -1 65

3 +1 -1 +1 75

4 +1 +1 +1 85

Diviseur 4 4 4

Effets a0 = 71,25 a1 = 3,75 a2 = 8,75

le modèle s'écrit :
Y = 71, 25 + 3, 75T + 8, 75P
Test de signification des coefficients
Exp Moy T P Y (%) Yest ei e i2

1 +1 -1 -1 60 58,75 1,25 1,5625

2 +1 +1 -1 65 66,25 -1,25 1,5625

3 +1 -1 +1 75 76,25 -1,25 1,5625

4 +1 +1 +1 85 83,75 1,25 1,5625

On cherche à tester la non influence d'une variable sur la réponse. On choisit un risque de 5
%.

21
La variance des résidus est :
La variance commune des estimateurs des coefficients du modèle est :

La statistique (t) de Student associé vaut :


La table de Student donne, pour un risque de 5 % avec :

Pour l'effet de T on a . On accepte H0 au risque de 5 % et


l'effet de la température T n'est pas significatif.

Pour l'effet = 8, 75 de P on a = 7 < 12,71. On accepte H0 au risque de 5 % et l'effet de


la pression P n'est pas significatif.
On peut donc considérer que les coefficients a1 et a2 ne sont pas significativement différent
de 0 ; leur valeur est probablement due à un « bruit ».
La conclusion de cette étude est que l'on doit rejeter un modèle linéaire pour expliquer le
rendement de cette réaction chimique. Il faudrait refaire une étude avec un modèle polynomial
du second degré, ce qui sort du cadre de ce cours.
Intervalle de confiance des effets du modèle.
Variance expérimentale connue.
On suppose que compte tenu de nombreuses expériences faites antérieurement on connaît
l'écart-type expérimental s. Dans ce cas l'intervalle de confiance d'un effet est donné, par :
risque 5% : [ai -1,96si ; ai + 1,96si]
risque 1% : [ai -2,58si ; ai + 2,58si]
où si² est la variance commune des estimateurs des coefficients.
Le cas où la variance expérimentale est inconnue est le plus courant.
Rappelons que si l'on détermine tous les effets, on ne pas calculer la variance commune des
résidus ( voir paragraphe précédente ). On supposera donc, dans la suite, que l'on a négliger
au moins un effet.
On calcule alors s², variance commune des résidus avec  = n- p degrés de liberté puis on en
déduit

variance commune des effets. On choisit alors un risque a et on détermine avec table de
Student le nombre t(). L'intervalle de confiance d'un effet ai est alors donné par :
[ai - t()si ; ai + t()si]

Exemple.
Considérons le plan d'expérience 23suivant dans lequel on néglige l'interaction d'ordre 3.

22
X1 X2 X3 X1X2 X1X3 X2X3 Y

-1 -1 -1 +1 +1 +1 5,2

+1 -1 -1 -1 -1 -1 4,7

-1 +1 -1 -1 +1 +1 5,1

+1 +1 -1 +1 -1 -1 5,5

-1 -1 +1 +1 -1 -1 4,9

+1 -1 +1 -1 +1 -1 4,6

-1 +1 +1 -1 -1 +1 4,8

+1 +1 +1 +1 +1 +1 5,3

Le calcul des effets se faisant comme il a été dit plus haut, on obtient le modèle :
Y = 5,0125 + 0,0125X1 + 0,1625X2 - 0,1125X3 +0,2125X1X2 + 0,0375X1X3 - 0,0125X2X3
Avant de déterminer les intervalles de confiance des effets, regardons leur significativité. Pour
cela, déterminons les résidus et la variance commune de ceux-ci.
Yi observés Yi estimés ei e²i

5,2 5,1875 + 0,0125 0,000156

4,7 4,7125 - 0,0125 0,000156

5,1 5,1125 - 0,0125 0,000156

5,5 5,4875 + 0,0125 0,000156

4,9 4,9125 - 0,0125 0,000156

4,6 4,5875 + 0,0125 0,000156

4,8 4,7875 + 0,0125 0,000156

5,3 5,3125 - 0,0125 0,000156

La variance commune des résidus est donc :


s² 8*0,000156 =0,00125
= 8-7
donc s = 0,035. La variance commune de tous les effets est alors
s² =0,000156
si² =
8
le "t" de Student pour chaque effet se calcul avec
ti = |ai|

23
si
Par exemple, pour le coefficient de la variable X1 on obtient
0,1625 =13
t1 =
0,0125
La table de Student donne pour un risque et  = n - p = 8 - 7 =1 , t crit(0,05 ; 1) =
12,71.
Un effet sera donc significatif au risque de 5% s'il son "t i" et supérieur à 12,71. On obtient le
tableau suivant.
Variable effet t Résultat

Constante 5,0125 t0 = 401>12,71 Significatif

X1 a1 = 0,125 t1 = 1<12,71 non significatif

X2 a2 = 0,1625 t2 = 13>12,71 Significatif

X3 a3 = - 0,1125 t3 = 9<12,71 Non significatif

X1X2 a12 = 0,2125 t12 = 17>12,71 Significatif

X1X3 a13 = 0,0375 t13 = 3<12,71 non significatif

X2X3 a23 = - 0,0125 t23 = 1<12,71 non significatif

Ce tableau montre que seul la variable X2 et l'interaction X1X2 sont significatives. Il faudrait
donc retenir un modèle de la forme :
Y = 5,0125 + 0,1625 X2 +0,2125 X1X2
Nous déterminerons un intervalle de confiance, au risque de 5%, pour les coefficients a 2 et a12.
Rappelons que cet intervalle se calcule avec :
[ai - t()si ; ai + t()si] = [ai - 12,71*0,0125 ; ai + 12,71*0,0125]
coefficient k Borne inférieure estimateur de k Borne supérieure

2 0,0036 a2 = 0,1625 0,3214

12 0,0536 a12 = 0,2125 0,3714

Remarque importante.
Cherchons l'intervalle de confiance d'un effet non significatif, par exemple a1. On obtient :
[0,125-12,71*0,0125 ; 1,125+12,71*0,0125] = [-0,1469 ; 0,1717]
On constate que 0 est dans cet intervalle de confiance, ce qui montre bien que le coefficient
n'est pas significativement différent de 0 au risque de 5%.
Analyse de la variance. Validation du modèle linéaire.
L'analyse de la variance consiste à comparer à l'aide d'un test F la somme des carrés des écarts
due uniquement à la régression (donc au modèle), avec la somme des carrés des résidus.
Précisons ces notions en introduisant un vocabulaire spécifique à l'analyse de variance.

24
On notera par la suite Yi les réponses observées lors de la réalisation des expériences et Y iest la
réponse estimée à l'aide du modèle linéaire. On notera, de même, Y moy la moyenne des
réponses.
On définit alors trois types de "variations"
1- La variation due à la liaison linéaire :
SCEL =  ( Yiest - Ymoy )²

SCEL se lit : "somme des carrés des écarts dues à la liaison".


2- La variation résiduelle :
SCER =  ( Yi - Yiest )²

SCER se lit : "somme des carrés des écarts des résidus".


3- La variation totale :
STCE = SCEL + SCER
STCE se lit : " somme totale des carrés des écarts".
On définit de plus un "carré moyen" qui est le quotient d'une somme de carrés par son degré
de liberté.
SCEL aura (p- 1) degrés de liberté (p est le nombre de coefficients estimé à partir du modèle).
SCER aura (n - p) degrés de libertés (n est le nombre d'expériences réalisées).
SCET aura (n - 1) degrés de liberté.
En outre, on note CML le carré moyen associé à SCEL, et CMR le carré moyen associé à
SCER.
Le tableau de l'analyse de variance se présente alors de la façon suivante :
Variation due à Somme des carrés DDL Carré moyen F

SCEL = CML Fobs = CML


Liaison SCEL p-1
p-1 s²

Résidus SCER n-p


SCEE = s²
n-p
Totale SCET n-1

Le test F permet alors de comparer pour un risque fixé à l'avance le F obs que l'on a calculé dans
le tableau précédent avec un F(critique) lu dans la table de Fisher-Snedecor avec (p-1) et (n -
p) degrés de liberté.

Le test est la suivant :


Hypothèse H0 : " les deux carrés moyens sont de même grandeur" et donc la régression n'est
pas significative
hypothèse H1 : " le carré moyen dû à la régression est significativement plus grand que le
carré moyen dû aux résidus" donc la régression est globalement significative
La règle du test est alors pour un risque  choisi :
Si Fobs est inférieure au F(critique), on accepte l'hypothèse H0.

25
Si Fobs est supérieur au F(critique), on accepte l'hypothèse H1 avec la confiance 1- .
Reprenons l'exemple du paragraphe 5.2.2 en considérant tous les effets, ceux des variables et
ceux des interactions d'ordre 2. On obtient le tableau d'analyse de variance suivant :
Variation due à Somme des carrés DDL Carré moyen F

SCEL = 0,1146 = CML Fobs = CML = 91,6667


Liaison SCEL 7-1
7-1 s²

Résidus SCER 8-7


SCEE = s² = 0,0012
8-7
Totale SCET 8 - 1 0.0984

La table de Fischer-Snédecor donne pour 1 = 6 et 2 = 1, F(crit) = 234, pour un risque de


5%. On a : (Fobs = 91,667) < (Fcrit = 234) donc on rejette l'hypothèse de linéarité du modèle.
Celà est bien en accord avec le fait que certains coefficients ne sont pas significatifs.
En revanche, effectuons une nouvelle analyse de variance avec un modèle linéaire ne
contenant que les coefficients significatifs, a 2 et a12. Le nouveau tableau d'analyse de variance
est alors :
on a cette fois n = 8, mais p = 3 (3coefficients estimés).
Variation due à Somme des carrés DDL Carré moyen F

SCEL = 0,2863 = CML Fobs = CML = 12,3118


Liaison SCEL 3-1
3-1 s²

Résidus SCER 8-3


SCEE = s² = 0,0232
8-3
Totale SCET 8 - 1 0.0984

La table de Fischer-Snédecor donne pour 1 = 2 et 2 = 5, F(crit) = 5,79, pour un risque de


5%. On a : (Fobs = 12,3118) > (Fcrit = 5,79) donc on accepte l'hypothèse H1 de linéarité du
modèle. Cela est bien en accord avec le fait que tous les coefficients sont significatifs.
Utilisation de "points au centre".
Si l'on ne néglige aucune interaction, il n'est pas passible de faire de calculs statistiques
puisque l'on a "consommer" tous les degrés de liberté (division par 0). <dans ce cas, on
accompagne les n essais du plan d'expérience par un certain nombre d'essais au centre du
domaine expérimental. Ces essais servent à calculer un écart-type appelé écart-type
expérimental. Tous les calculs réalisés plus haut se font alors avec l'écart-type expérimental
au lieu et place de l'écart-type résiduel.
Coefficient de détermination
Appelé aussi coefficient de corrélation, il est défini par :

26
ou

Lorsque l’échantillon est d’étendue assez faible, il est nécessaire d’apporter une correction
pour l’erreur systématique. L’estimation de la force de la liaison par le coefficient de
corrélation multiple est d’autant plus exagérée que le nombre de degrés de liberté de
l’échantillon La formule de correction est :

Où est la valeur corrigée du coefficient de régression multiple. Plus le coefficient de


détermination est proche de 1, plus le modèle est représentatif c'est-à-dire, meilleur.
Calcule de l’estimation de la variance d’erreur
Estimateur sans biais

Estimateur convergent de variance des estimateurs


Estimer la matrice de variance-covariance des estimateurs

L’expression de est donné par :

On calcule cette dernière à l’aide de l’estimateur qui est donné par :

(k nombre est paramètres, p nombre de coefficients)

le test t de Student :
Le test utilisé est le test « t de Student ». Un effet sera dit significatif (c'est-à-dire que la
variable ou l'interaction qui lui est associée a une influence sur la réponse), s'il est, pour un
risque donné, significativement différent de 0. On testera donc l'hypothèse :

Contrer l'hypothèse : Pour cela, on calcule :

27
,
On utilise alors une table de Student à = n - p degrés de liberté (n est le nombre
d'expériences réalisées et p le nombre d'effets y compris la constante).On choisit un risque de

première espèce (le plus souvent 5% ou 1%) et on lit dans cette table de Student la

valeur , en utilisant la partie de la table relative à un test bilatéral. La règle du


test est alors la suivante :

 Si , on accepte H0 au risque accepté.

 Si , on rejette H0 au risque accepté.

Si l'hypothèse H0 est acceptée, cela veut dire que l'effet en question n'est pas, au risque
significativement différent de 0 et donc que la variable qui lui est associée n'a pas d'influence
sur la réponse.

VIII- Intervalle de confiance


un intervalle de confiance encadre une valeur réelle que l’on cherche à estimer à l’aide de
mesures prises par un procédé aléatoire. En particulier, cette notion permet de définir une
marge d'erreur entre les résultats d'un sondage et un relevé exhaustif de la population totale.
Un intervalle de confiance doit être associé à un niveau, en général sous la forme d’un
pourcentage, qui minore la probabilité de contenir la valeur à estimer. L’intervalle de
confiance Ic dépend :
– de la probabilité choisie par l’utilisateur ; cette probabilité est souvent de 95 ou

99 % ;( risque)
– de la qualité de l’écart-type calculé.

Dans le cas des plans d’expériences, il est rare que n soit élevé. On a, le plus souvent, réalisé
quelques mesures de la réponse au même point d’expériences, en général au centre du

28
domaine expérimental. Il s’agit de répétitions, c’est-à-dire de mesures réalisées dans les
mêmes conditions expérimentales. Supposons que l’écart-type ait été obtenu avec 5 mesures
de répétition et que l’on souhaite une probabilité de 95 %. Dans ce cas, si l’on effectue une
mesure yi, on aura 95 % de chances que l’intervalle yi ± 2,78s contienne la moyenne de la
population. Avec 10 mesures de répétition pour le calcul de l’écart-type, on pourra dire que
l’on a 95 % de chances que l’intervalle yi ± 2,26 s contienne la moyenne de la population.

La formulation de l'intervalle de confiance autour d'une moyenne observée

avec un écart type observé sur un échantillon de taille est donné par

C’est la valeur trouvée dans le tableau t student . Le graphique suivant illustre la notion de

niveau de confiance en tant qu'intégrale de la fonction pour , représentée par


l'aire de la zone en bleu.

Exemple : soit les résultats des étudiants suivants :


83 73 62 63 71 77 77 59 92
-Trouver l’intervalle de confiance du moyenne réel avec avec un risque de =0.005 (

) et df =8 ( )

La comparaison des variances :

29
La comparaison des variances nous permis de vérifier l'homoscédasticité pour cela on calcule

le test F donné par :

numérateur donc
On met arbitrairement la plus grande variance au .

le choix arbitraire est mis selon une condition unilatérale pour cela on utilise la table F a
2.5% pour avoir un risque de 5%.

VIII-1 Analyse de la variance ANOVA


VIII-2 Principes de l’analyse de la variance
L’analyse de la variance consiste à rechercher les sources de variation des réponses. On
suppose que les réponses ont été calculées avec le modèle postulé

en utilisant la méthode des moindres carrés c’est-à-dire en minimisant la somme des carrés

des écarts. Dans ce cas, les réponses calculées s’écrivent et les écarts prennent des

valeurs particulières qui s’appellent les résidus. Les résidus sont donc des valeurs
particulières des écarts. On a :

L’analyse classique de la variance fait intervenir non pas les réponses mais la différence entre

les réponses et leur moyenne ou Cette différence est désignée soit par
écarts à la moyenne, soit par réponse corrigée de la moyenne. Dans le cas des réponses
calculées, on parle aussi de modèle corrigé de la moyenne. Dans le cadre de la méthode des
moindres carrés, la moyenne des réponses mesurées est égale à la moyenne des réponses

calculées avec le modèle postulé. On a donc, étant la moyenne des réponses :

Lorsqu’on élève les deux membres de cette relation au carré, on obtient :

30
C’est la relation de base de l’analyse de la variance. Le membre de gauche est la somme des
carrés des écarts à la moyenne des réponses mesurées. Cette somme se décompose en deux
éléments : la somme des carrés des écarts à la moyenne des réponses calculées avec le modèle
et la somme des carrés des résidus. La somme des carrés des résidus est la plus faible valeur
de la somme des carrés des écarts. On a donc :

Si l’on divise la somme des carrés des résidus par le nombre de degrés de liberté des résidus,

on obtient la variance des résidus. La variance des résidus est donc la plus petite

variance des écarts On peut écrire :

Degrés de liberté
C’est cette valeur minimale de la variance des écarts qui est généralement adoptée comme
étalon de comparaison pour évaluer l’importance d’un coefficient. La variance des
coefficients est alors calculée :
– soit par la formule générale utilisée par les ordinateurs :

– soit par la formule simplifiée lorsqu’il s’agit de plans factoriels et d’un modèle postulé
polynomial :

En résumé, la variance des résidus de l’analyse de la variance sert à calculer la variance des
coefficients. C’est la variance des coefficients qui sert d’étalon pour tester si un coefficient est
significatif ou non.

VIII-3 Coefficient de détermination R2


31
L’analyse de la variance permet de calculer une statistique très utile : le R 2 ou R carré. Cette
statistique est le rapport de la somme des carrés des réponses calculées (corrigées de la
moyenne) à la somme des carrés des réponses mesurées (corrigées de la moyenne) :
Modèle corrigé de la moyenne : 965,30
Réponses mesurées corrigées de la moyenne 975,72

Si le modèle permet de retrouver exactement la valeur des réponses mesurées, la


somme des carrés des réponses calculées est égale à la somme des carrés des réponses
mesurées. Le R2 est égal à 1.
Si le modèle fournit des réponses calculées égales à la moyenne, la somme des
carrés des réponses calculées est égale à 0. Le R 2 est égal à 0. On dit que le modèle n’a pas de
puissance d’explication.
Le R2 est donc une mesure de la qualité du modèle. S’il est égal à 1, le modèle
permet de retrouver la valeur des réponses mesurées. S’il est égal à 0, le modèle n’en dit pas
plus que la moyenne des réponses. Dans la pratique, il est difficile d’indiquer la valeur d’un
bon R2 car les valeurs varient beaucoup d’une discipline à l’autre.
VIII-4 Hypothèses à tester : L'hypothèse nulle correspond au cas où les distributions suivent
la même loi normale. L'hypothèse alternative est qu'il existe au moins une distribution dont la
moyenne s'écarte des autres moyennes :

L'hypothèse nulle

L'hypothèse alternative.
VIII-5 Décomposition de la variance
Le principe de l’ANOVA est de comparer la variation intergroupe à la variation intragroupe.
-L’intergroupe est la variation au sein d’un groupe
- L’intragroupe représente les écarts qui existent dans d’un échantillon qui appartient au
même groupe (femmes ou hommes).
La variation totale par rapport aux réponses s’écrit :

32
La variation intergroupe s’écrit :

Et la variation intragroupe s’écrit :

Pour faire le test ANOVA il faut calculer le Test de Fisher « F » donné par la formule

suivante :

sont les degrés de liberté.

Si donc la variation intergroupe est supérieure à la variation intragroupe


Alors les écarts sont importants
Il y a deux fois plus d’écart intergroupe que l’écart intragroupe
6. Plans fractionnaires
6.1 Introduction
Lors de la réalisation d'un plan d'expérience à deux niveaux, le nombre d'expériences à
réaliser augmente d'une manière significative avec le nombre de variables prises en compte.
Pour k variables, le plan comporte 2 k expériences à réaliser. Un plan 2 5 nécessite 32
expérimentations. Or dans de nombreux domaines les interactions d'ordre élevé sont souvent
considérées comme négligeables. Trop d'expériences sont donc réalisées d'où l'idée de
diminuer la taille des plans et donc d'utiliser pour l'étude de k facteurs des matrices
d'expériences issues de plan 2k-1, 2k-2, , 2k-p.

33
6.2 Loi de composition interne dans l'ensemble des colonnes des matrices d'expériences
Nous avons déjà vu au chapitre précédent que les colonnes des interactions de plusieurs
variables se fabriquaient par produit ligne à ligne de ces colonnes. Nous allons développer
cette notion en remarquant que la matrice des effets, pour un plan d'expériences, a des
colonnes qui ne sont constituées que de +1 et de -1. Soit E le sous ensemble de IR n composé
de vecteurs dont les composantes dans la base canonique ne sont que des +1 ou des -1.
L'égalité des vecteurs de IRn induit l'égalité des vecteurs de E. On définit une multiplication
dans E de la manière suivante. Le produit de deux vecteurs de E est un vecteur de E dont les
composantes dans la base canonique sont les produit des composantes de même rang.

Exemple Dans IR4, s i A = et B = alors AB =


Cette multiplication est commutative, associative, elle possède un élément neutre, qui est le
vecteur n'ayant que des +1 comme composantes et enfin, pour tout vecteur A de E on a : AA
= I.
6.3 Plan fractionnaire 23-1 pour étudier trois facteurs. Notion d'Aliase
Nous savons qu'un plan complet pour étudier trois facteurs est un plan 2 3 nécessitant 8
expériences. Nous désirons n'en réaliser que quatre et donc pour cela nous ne pouvons utiliser
qu'une matrice d'expériences d'un plan 22. La matrice des effets d'un tel plan est :
Exp I = Moy A B AB

1 +1 -1 -1 +1

2 +1 +1 -1 -1

3 +1 -1 +1 -1

4 +1 +1 -1 +1

Comme nous devons placer le troisième facteur C, nous le plaçons dans la colonne de
l'interaction AB. Ainsi, la matrice d'expérience du plan fractionné sera :
Exp A B C

1 -1 -1 +1

2 +1 -1 -1

3 -1 +1 -1

4 +1 -1 +1

34
C'est cette matrice qui servira, une fois les quatre expériences réalisées, à calculer les effets de
A, B, C et de leurs interactions éventuelles. Le plan réalisé avec la matrice précédente est
appelé plan fractionnaire 23-1.
Du point de vue du vocabulaire, le fait de poser C = AB se traduit en disant que l'on a
aliasé le facteur C avec l'interaction AB. Il est naturel, à ce stade de notre étude de se
demander si les effets de A, B et C calculés avec ce plan fractionnaires sont les mêmes que
celles que l'on aurait obtenues avec un plan complet. Nous allons voir qu'il n'en est rien.
Compte tenu des résultats du paragraphe précédent nous avons :
C = AB donc CC = I = CAB
I = CAB donc AI = ACAB = C(AA)B = CIB d'où A = CB
I = CAB donc BI = BCAB =CA(BB) = CAI d'où B = CA
Ainsi, non seulement le facteur C est aliasé avec l'interaction AB mais le facteur A est aliasé
avec l'interaction CB et le facteur B est aliasé avec l'interaction CA. Autrement dit les effets
obtenus avec le plan fractionnaire ne sont pas des effets purs. Avant de préciser cette notion,
constatons que l'égalité I = CAB nous a fourni tous les aliases, on dit que I = CAB est un
générateur d'aliase.
Précisons maintenant le fait que la notion d'aliase ne nous donne pas des effets purs.
Supposons que nous ayons réalisé d'une part le plan fractionnaire 23-1 dont il vient d'être
question mais aussi le plan complet 2 3 correspondant. Nous aurions successivement les
matrices des effets suivantes.

Plan fractionnaire 23-1.

Exp I A B C Yexp

ABC CB CA AB

1 +1 -1 -1 +1 y1

2 +1 +1 -1 -1 y2

3 +1 -1 +1 -1 y3

4 +1 +1 -1 +1 y4

effets a0 a1 a2 a3

Plan complet 23.


Exp I A B C AB AC BC ABC Yexp

1 +1 -1 -1 -1 +1 +1 +1 -1 a

35
2 +1 +1 -1 -1 -1 -1 +1 +1 y2

3 +1 -1 +1 -1 -1 +1 -1 +1 y3

4 +1 +1 +1 -1 +1 -1 -1 +1 b

5 +1 -1 -1 +1 +1 -1 -1 +1 y1

6 +1 +1 -1 +1 -1 +1 -1 -1 c

7 +1 -1 +1 +1 -1 -1 +1 -1 d

8 +1 +1 +1 +1 +1 +1 +1 +1 y4

effets a'0 a'1 a'2 a'3 a'12 a'13 a'23 a'123

Remarquons que les lignes de la matrice d'expériences du plan fractionné 2 3-1 sont, dans
l'ordre, les lignes 5,2,3,8 de la matrice d'expériences du plan complet 2 3. Calculons le
coefficient a1 du plan fractionné 23-1 (effet de A aliasé à l'interaction CB) :
-y1+y2-y3+y4
a1 =
4
Calculons les effets de A (soit a' 1), puis l'effet de l'interaction CB (soit a' 23) pour le plan
complet 23.
-a+y2-y3+b-y1+c-d+y4
a'1 =
8
a+y2-y3-b-y1-c+d+y4
a'23 =
8
Nous constatons que : a1 = a' 1 + a' 23 ceci montre bien que l'effet a'1, obtenu avec le plan
fractionnaire n'est pas un effet pur. On montrerait de la même manière que :
a2 = a' 2 + a' 13 et a3 = a' 3 + a' 12
En l'absence de toute hypothèse supplémentaire sur les effets, un plan fractionnaire est
inexploitable, puisque les effets obtenus ne sont pas purs. Pour une interprétation correcte, il
faut avoir une connaissance approfondie du phénomène étudié. Nous allons voir dans le
paragraphe suivant, que pour obtenir les effets principaux de 4 facteurs il est possible de ne
faire que 8 expériences au lieu de 16 nécessaires pour un plan complet 24.
6.4 Plan fractionnaire 24-1
La matrice d'expérience d'un plan 23 comporte 3 colonnes dans lesquelles nous plaçons les
trois premières variables A, B, C. Pour placer la quatrième variable D, nous décidons de
l'aliaser avec l'interaction d'ordre la plus élevé du plan 2 3, c'est à dire l'interaction ABC. Nous
obtenons l'aliase
D = ABC qui nous permet de déterminer le générateur d'aliase : I = DABC. En effet :
D = ABC I = DABC

36
nous avons alors : I = DABC
Nous constatons que si, comme il est d'usage, on néglige les interactions d'ordre 3, on obtient
bien les effets principaux.
Montrons sur un exemple, comment on peut, en outre, interpréter les interactions d'ordre 2.
Exemple
On veut étudier l'influence de 4 facteurs sur la pureté d'un précipité. Les variables retenues et
leurs niveaux sont donnés dans le tableau suivant :
Variable Niveau -1 Niveau +1

A : quantité de base utilisé normale en excès

B : vitesse d'addition de la base lente rapide

C : température de la filtration à chaud à froid

D : lavage du précipité normal prolongé

La matrice des effets est la suivante, la réponse Y représentant la pureté diminuée de 90 :


Moy A B C ABC AB AC BC Y

DBC DAC DAB D DC DB AD

+1 -1 -1 -1 -1 +1 +1 +1 3, 1

+1 +1 -1 -1 +1 -1 -1 +1 4, 1

+1 -1 +1 -1 +1 -1 +1 -1 2, 2

+1 +1 +1 -1 -1 +1 -1 -1 1, 3

+1 -1 -1 +1 +1 +1 +1 -1 4, 0

+1 +1 -1 +1 -1 -1 -1 -1 4, 1

+1 -1 +1 +1 -1 -1 -1 +1 -0, 1

+1 +1 +1 +1 +1 +1 +1 +1 0, 6

Les résultats sur les effets sont les suivants :


Cst A B C ABC AB AC BC

37
DBC DAC DAB D DC DB AD

2, 41 0, 11 -1, 41 -0, 26 0, 31 -0, 16 0, 09 -0, 49

En négligeant les interactions d'ordre 3, nous retiendrons : effet de A = 0, 11 ; effet de B = -1,


41 ; effet de C = -0, 26 et effet de D = 0, 31.
Pour pouvoir effectuer des tests statistiques, le plan d'expérience a été suivi de deux
expériences au centre du domaine expérimental. Les résultats obtenus sont les suivants :
y01 = 2, 2 et y02 = 2, 1
La moyenne des réponses au centre est donc
2,2+2,1
0 = = 2,15
2
La variance expérimentale est alors déterminée avec un degré de liberté par :
(2,2-2,15)²+(2,1-2,15)²
s02 = = 0,05
2-1
ce qui conduit à l'écart-type expérimental s0 = 0, 07 .
L'écart-type de l'estimateur d'un coefficient du modèle est donné alors par :
s0 0,007
si = = 0,025

Nous savons qu'au risque , un coefficient sera significatif si > ttable(n0 - 1, ) × si .


Au risque de 5 %, et avec n0 - 1 = 2 - 1 = 1 degré de liberté, on obtient t table(1, 5%) = 12, 706.
Ainsi, un coefficient sera significatif s'il est tel que > 0, 318 Nous constatons donc que,
 l'effet de la variable B est hautement significatif.
 l'effet de l'aliase (BC, AD) est significatif.
 l'effet de D est non significatif de justesse.
 les autres effets ne sont pas significatifs.
Étudions l'aliase (BC, AD) en nous demandant laquelle des deux interactions à le plus de
chance d'être réelle. Pour cela, examinons séparément l'influence sur la pureté de chacune de
ces interactions.
Étude de l'interaction AC
C = -1 C = +1

A = -1 P =(3,1+2,2)/2 = 2, 65 P = (4-0,1)/2 = 1, 95

A = +1 P = (4,1+1,3)/2 = 2, 70 P = (4,1+0,6)/2 = 2, 35

L'examen de ce tableau montre que les conditions optimales seront obtenues avec : A au
niveau +1 et C au niveau -1.
Étude de l'interaction DB
D = -1 D = +1

B = -1 P =(3,1+4,1)/2 = 3, 6 P =(4,1+4,0)/2 = 4, 05

38
B = +1 P =(1,3-0,1)/2 = 0, 6 P =(2,2+0,6)/2 = 1, 4

L'examen de ce tableau montre que les conditions optimales seront obtenues avec : B au
niveau -1 et D au niveau -1. En conclusion : L'effet principal de la variable B étant négatif, il
faut effectivement se placer au niveau -1 pour cette variable. En résumé, nous obtiendrons la
plus grande pureté avec :

Variable Niveau Réalité

A +1 Base en excès

B -1 Vitesse d'addition de la base lente

C -1 Filtration à chaud

D -1 Lavage du précipité normal

39

Vous aimerez peut-être aussi