Académique Documents
Professionnel Documents
Culture Documents
1. Introduction
Les plans d'expériences ("Design of Experiment" (D.O.E.) en anglais abrégés PEX en français), sont utilisés
dans les études industrielles en recherche-développement. Ils interviennent dans de nombreux domaines
industriels. On peut notamment citer :
• industries chimiques, pétrochimiques et pharmaceutiques
• industries mécaniques et automobiles
• industries métallurgiques
Leur utilisation vise aux buts suivants :
• détermination des facteurs clés dans la conception d'un nouveau produit ou d'un nouveau procédé
• optimisation des réglages d'un procédé de fabrication ou d'un d'appareil de mesure
• prédiction par modélisation du comportement d'un procédé
Les plans d'expériences s'inscrivent dans une démarche générale d'amélioration de la qualité.
Le succès de la démarche originale des plans d'expériences réside dans la possibilité d'interprétation de
résultats expérimentaux avec un effort minimal sur le plan expérimental : la minimisation du nombre
nécessaire d'expériences permet un gain en temps et en coût financier.
Il faut néanmoins comprendre que les plans d'expériences ne sont pas un outil destiné a priori à la recherche
fondamentale car ils ne permettront jamais une explication du phénomène physico-chimique étudié.
Les facteurs étudiés dans un plan d'expériences sont bien entendu les facteurs d'entrée. Un facteur est
une grandeur le plus souvent mesurable mais il peut s'agir d'une grandeur qualitative comme les différents
lots d'une matière première.
La réponse est la grandeur mesurée à chaque essai ; le plan vise à déterminer quels facteurs l'influencent
ou quelle est son évolution en fonction de ceux-ci. Cette grandeur est le plus souvent mesurable mais elle
peut également être qualitative.
Dans ce cas ce peut être par exemple une appréciation visuelle sur l'état d'une surface ou une
appréciation bon, moyen ou mauvais sur un produit alimentaire.
Une notion importante est celle d'interaction entre deux facteurs d'entrée. On parle d'interaction entre
deux facteurs A et B quand l'effet du facteur A sur la réponse va dépendre de la valeur du facteur B.
4. Domaine d’étude
Un expérimentateur qui lance une étude s'intéresse à une grandeur qu'il mesure à chaque essai. Cette
grandeur s'appelle la "réponse", c'est la grandeur d'intérêt. La valeur de cette grandeur dépend de plusieurs
variables ou "facteurs". La valeur donnée à un facteur pour réaliser un essai est appelée "niveau". Lorsqu'on
étudie l'influence d'un facteur, en général, on limite ses variations entre deux bornes appelées
respectivement : "niveau bas" (-1) et "niveau haut" (+1).
2
COURS PLANIFICATION-VALIDATION DE MODELES
Par exemple, pour deux facteurs, le domaine d'étude est une surface et l'espace expérimental est . A
chaque point du domaine d'étude correspond une réponse. A l'ensemble de tous les points du domaine
d'étude correspond un ensemble de réponses qui se localisent sur une surface appelée la "surface de
réponse" :
Les k variables Xi, i = 1, ... , k peuvent être soit aléatoires, soit contrôlées c'est-à-dire qu'elles sont connues
sans erreur. Nous supposerons dans la suite que les variables X i, i = 1, ... , k sont contrôlées. Nous nous
intéressons aux modèles dits linéaires, c'est-à-dire aux modèles du type :
dans lequel 0, 1, ... , k sont des réels appelés coefficients du modèle (c'est, ici, un modèle sans
interaction).
La différence entre valeur (yi)obs observée de Y obtenue lors de la réalisation de l'expérience i et la valeur y i
attendue est l’erreur notée i, qui peut être dû à des facteurs non contrôlés (dérive des appareils, adresse de
l'expérimentateur, etc). Cela justifie le fait que nous adopterons désormais le modèle suivant :
3
COURS PLANIFICATION-VALIDATION DE MODELES
6.1. Plan 2k
Si dans l'étude d'un processus la température doit intervenir, et celle-ci varie dans un intervalle [20°C
60°C], c’est un facteur quantitatif. On dira alors que le niveau bas du facteur température est 20 oC et le
niveau haut est 60oC ; on peut décider de ne travailler qu'avec une température de 20 oC puis de 60oC : au lieu
de faire plusieurs variations de T, on en fait que deux et le domaine expérimental de la température sera
20oC-60oC. Si le facteur est qualitatif, le niveau bas et le niveau haut correspondront à deux modalités du
facteur, par exemple deux types de solvant. Dans la pratique, le niveau bas sera codé -1 et le niveau haut +1.
Un plan pour lequel chacun des k facteurs ne possède que 2 niveaux est appelé plan 2k.
L’utilisation des variables centrées réduites présente l’intérêt de pouvoir généraliser la théorie des plans
d’expériences quels que soient les facteurs ou les domaines d’études retenus. Remplacer les variables codées
va permettre d’avoir pour chaque facteur le même domaine de variation [-1, +1] et de pouvoir ainsi
comparer entre eux l’effet des facteurs.
Exemple : on choisit pour le facteur température un domaine d’étude :[10°C, 40°C], on affecte la valeur -1 à
10°C et +1 à 40°C. On note t la variable codée et T la variable naturelle. On peut les lier par la relation
suivante où T0 est le milieu de l’intervalle du domaine d’étude et ΔT la moitié de la largeur du domaine, ici :
T0=25°C et ΔT=15°C :
T −T 0
∆T
t=
Les variables centrées réduites sont sans dimension, une température de 20°C correspond à une variable
centrée réduite de -0.33
La matrice d'expériences est le tableau qui indique le nombre d'expériences à réaliser avec la façon de faire
varier les facteurs et l'ordre dans lequel il faut réaliser les expériences. Ce tableau est donc composé de +1 et
de -1. Soit, par exemple, la matrice d'expériences suivante
Exp X1 X2
1 -1 -1
2 +1 -1
3 -1 +1
4 +1 +1
4
COURS PLANIFICATION-VALIDATION DE MODELES
Dans le cas où l'on ajoute à droite de la matrice d'expérience une colonne avec les réponses, on obtient la
« matrice d'expériences et des réponses ».
Supposons qu'il n'y ait qu'un seul facteur X 1 à deux niveaux. Notons y2 la réponse (résultat de l'expérience) lorsque
X1 est au niveau +1 et y1 la réponse lorsque X1 est au niveau -1. La matrice d'expérience et des réponses est :
1 -1 y1
2 +1 y2
On appelle effet global d'un facteur la variation de la réponse quand le facteur passe du niveau -1 au niveau
+1. On appelle effet moyen d'un facteur la demi-variation de la réponse quand le facteur passe du niveau -1
au niveau +1. Ainsi, l'effet moyen est défini comme étant la moitié de l'effet global.
la réponse théorique au centre du domaine est : a0=(y1+y2)/2 qui est la moyenne des réponses.
b) Deux facteurs.
Supposons que nous ayons maintenant 2 facteurs X1 et X2 avec chacun deux niveaux (plan 22). Une matrice
d'expérience et des réponses est, par exemple :
1 -1 -1 y1
2 +1 -1 y2
3 -1 +1 y3
4 +1 +1 y4
5
COURS PLANIFICATION-VALIDATION DE MODELES
L'effet moyen de X1 est toujours la demi-variation de la réponse lorsque X1 passe du niveau -1 au niveau +1.
Or, pour chacun des niveaux de X 1, il y a 2 expériences (une pour chacun des niveaux de X 2 ).
Nous devons alors envisager des réponses moyennes.
y 1+ y 3
Quand X1 est au niveau -1, nous avons la réponse moyenne :
2
y 2+ y 4
et quand X1 est au niveau +1, nous avons la réponse moyenne :
2
y 2+ y 4 y 1+ y 3
− − y 1+ y 2− y 3+ y 4
L'effet global a1 de X1 donne : a1= 2 2 = 4
2
− y 1− y 2+ y 3+ y 4
L'effet moyen a2 de X2 se calcule de la même manière : a2=
4
Comme dans le cas à un seul facteur, on calcule a 0 ou "réponse théorique" pour X1 = 0 (au centre de son
domaine de variation) comme la moyenne des réponses observées aux niveaux -1 et +1.
y 3+ y 4 y 1+ y 2
+ y 1+ y 2+ y 3+ y 4
a0= 2 2 = 4
2
Plus généralement, la matrice d'expériences comporte k colonnes pour les facteurs principaux et 2k lignes
soit 2k essais. Elle se construit selon la règle suivante (algorithme de YATES):
• colonne du 1er facteur: alternance de -1 et +1
• colonne du 2e facteur: alternance de -1 et +1 de 2 en 2
• colonne du 3e facteur: alternance de -1 et +1 de 4 en 4
• colonne du 4e facteur: alternance de -1 et +1 de 8 en 8
et ainsi de suite pour un nombre plus élevé de facteurs.
En adoptant ces règles empiriques, la matrice des effets est une matrice de Hadamard qu’on écrit pour deux
et trois facteurs comme suit :
7. Notion d'interaction
6
COURS PLANIFICATION-VALIDATION DE MODELES
Isoler l’effet de chaque facteur ne rend pas compte toujours de l’ensemble du phénomène. Il arrive que l’un
des facteurs renforce l’effet de l’autre. Cela s’appelle une interaction. On dit qu'il y a interaction entre deux
facteurs si l'effet moyen de l'un n'est pas le même suivant que l'on se place au niveau bas ou au niveau haut
de l'autre. L'interaction entre deux facteurs X 1 et X2 sera, dans la suite, considérée comme un nouveau
facteur que l'on notera X1X2
Du point de vue du vocabulaire, une interaction entre deux facteurs sera qualifiée d'interaction d'ordre 2, une
interaction entre trois facteurs sera une interaction d'ordre 3, etc...
Pour calculer l'effet d'une interaction entre deux variables X i et Xj on ajoute à la matrice des effets une
colonne, que l'on baptise XiXj, et que l'on obtient en faisant le produit "ligne à ligne" des colonnes des
variables Xi et Xj
Exemple numérique :On considère une réaction chimique dont le rendement dépend de deux facteurs, la
température et la pression. Le technicien décide d'effectuer un plan d'expérience avec le domaine
expérimental suivant :
Exp T P Y (Rend)
1 -1 -1 60
2 +1 -1 65
3 -1 +1 75
4 +1 +1 85
Déterminons une estimation ponctuelle de chacun des coefficients du modèle. Nous obtenons le tableau
suivant qui permet d'obtenir les résultats demandés.
7
COURS PLANIFICATION-VALIDATION DE MODELES
La représentation graphique des effets : elle représente mieux l’influence des facteurs sur la réponse, la
représentation des effets principaux se fait simplement à partir du tableau des réponses moyennes aux
différents niveaux des facteurs.
T P
Niveau + 1 60 + 85 = 75 75 + 85 = 80
2 2
Le graphique de l’interaction permet de conclure si celle-ci est négligeable ou pas, on constate que les deux
segments de droite ne sont pas parallèles donc que l'interaction n'est pas, à priori, négligeable.
8
COURS PLANIFICATION-VALIDATION DE MODELES
On appelle effets les coefficients des facteurs et ceux des interactions dans l'écriture du modèle.
Les calculs statistiques qui permettent de savoir si les effets sont significatifs, de calculer les intervalles de
confiance ou de valider la linéarité du modèle font intervenir d'une part les résidus e i , c'est-à-dire la
différence entre la valeur expérimentale et la valeur prédite par le modèle et, d'autre part de la variance
commune des résidus :
s²= ei²/(n-p)
ATTENTION
Si l'on réalise un plan complet et que l'on calcule tous les effets, le calcul de s 2 est impossible puisque
alors n = p (un plan complet 23 conduit à 8 expériences et 8 effets : 3 effets pour les facteurs, 3 effets
pour les interactions d'ordre 2 et enfin 1 effet pour l'interaction d'ordre 3). C'est pour cela que, dans
la pratique, il est d'usage de négliger les interactions d'ordre élevé (3 ou plus). C'est souvent le
contexte et la connaissance de lois régissant le phénomène étudié qui permet de négliger certaines
interactions et donc de pouvoir conduire des calculs statistiques.
Le test utilisé est le test « t » de Student. Un effet sera dit significatif (c'est-à-dire que la variable ou
l'interaction qui lui est associée a une influence sur la réponse), s'il est, pour un risque donné,
significativement différent de 0.
On utilise alors une table de Student à = n - p degrés de liberté (n est le nombre d'expériences réalisées et p
le nombre d'effets y compris la constante).On choisit un risque de première espèce (le plus souvent 5% ou
1%) et on lit dans cette table de Student la valeur tcrit(,).
Exemple.
On reprend l’exemple de la réaction chimique dont le rendement dépend de deux facteurs, la température et
la pression.
9
COURS PLANIFICATION-VALIDATION DE MODELES
1 +1 -1 -1 60
2 +1 +1 -1 65
3 +1 -1 +1 75
4 +1 +1 +1 85
Diviseur 4 4 4
1 +1 -1 -1 60 . . .
2 +1 +1 -1 65 . . .
3 +1 -1 +1 75 . . .
4 +1 +1 +1 85 . . .
On cherche à tester la non influence d'une variable sur la réponse. On choisit un risque de 5 %.
1
-
2
La variance des résidus est : s =
.−.
∑ e 2i =… . .
- La variance commune des estimateurs des coefficients du modèle est
2
s ….
: s2i = = =..… … … … … … ..
n ….
|ai|
La statistique << t>> de Student associé vaut : t i=
si
10
COURS PLANIFICATION-VALIDATION DE MODELES
tcrit(0,05 ; 1) = ………
2. Pour l'effet a2 = 8, 75 de P on a t2 = ……. < ……... Au risque de 5 % l'effet de la pression P n'est pas
significatif.
On peut donc considérer que les coefficients a1 et a2 ne sont pas significativement différent de 0.
La conclusion de cette étude est que l'on doit rejeter un modèle linéaire pour expliquer le rendement
de cette réaction chimique. Il faudrait refaire une étude avec un modèle polynomial du second degré.
On calcule s², variance commune des résidus avec = n- p degrés de liberté puis on en déduit si variance
commune des effets. On choisit alors un risque et on détermine avec table de Student le nombre t().
L'intervalle de confiance d'un effet ai est alors donné par : [ai - t()si ; ai + t()si]
Exemple.
X1 X2 X3 X 1X 2 X 1X 3 X 2X 3 Y
-1 -1 -1 +1 +1 +1 5,2
+1 -1 -1 -1 -1 -1 4,7
-1 +1 -1 -1 +1 +1 5,1
+1 +1 -1 +1 -1 -1 5,5
-1 -1 +1 +1 -1 -1 4,9
+1 -1 +1 -1 +1 -1 4,6
-1 +1 +1 -1 -1 +1 4,8
+1 +1 +1 +1 +1 +1 5,3
Le calcul des effets se faisant comme il a été dit plus haut, on obtient le modèle :
11
COURS PLANIFICATION-VALIDATION DE MODELES
Avant de déterminer les intervalles de confiance des effets, regardons leur significativité. Pour cela,
déterminons les résidus et la variance commune de ceux-ci.
2 ……….×…………
La variance commune des résidus est donc : s = =… … … … … … .
… … .−… …
Donc :
s = …………….
|ai|
ti =
si
tcrit(0,05 ; 1) = 12,71.
Un effet sera donc significatif au risque de 5% si son "ti" et supérieur à 12,71. On obtient le tableau suivant :
12
COURS PLANIFICATION-VALIDATION DE MODELES
X1 a1 = 0,125 t1 = …..<12,71
X2 a2 = 0,1625 t2 = ……>12,71
X3 a3 = - 0,1125 t3 = …..<12,71
Ce tableau montre que seul la variable X 2 et l'interaction X1X2 sont significatives. Il faudrait donc retenir un
modèle de la forme :
Y = ....................................................................................................
Nous déterminerons un intervalle de confiance, au risque de 5%, pour les coefficients a 2 et a12. Rappelons
que cet intervalle se calcule avec :
Remarque importante :
Cherchons l'intervalle de confiance d'un effet non significatif, par exemple a1. On obtient :
On constate que 0 est dans cet intervalle de confiance, ce qui montre bien que le coefficient n'est pas
significativement différent de 0 au risque de 5%.
3 3,18
4 2,78
5 2,57
6 2,45
7 2,37
8 2,31
9 2,26
10 2,23
11 2,20
12 2,18
13 2,16
14 2,15
15 2,13
16 2,12
17 2,11
18 2,10
19 2,09
20 2,08
14