Vous êtes sur la page 1sur 14

COURS PLANIFICATION-VALIDATION DE MODELES

1. Introduction
Les plans d'expériences ("Design of Experiment" (D.O.E.) en anglais abrégés PEX en français), sont utilisés
dans les études industrielles en recherche-développement. Ils interviennent dans de nombreux domaines
industriels. On peut notamment citer :
• industries chimiques, pétrochimiques et pharmaceutiques
• industries mécaniques et automobiles
• industries métallurgiques
Leur utilisation vise aux buts suivants :
• détermination des facteurs clés dans la conception d'un nouveau produit ou d'un nouveau procédé
• optimisation des réglages d'un procédé de fabrication ou d'un d'appareil de mesure
• prédiction par modélisation du comportement d'un procédé
Les plans d'expériences s'inscrivent dans une démarche générale d'amélioration de la qualité.
Le succès de la démarche originale des plans d'expériences réside dans la possibilité d'interprétation de
résultats expérimentaux avec un effort minimal sur le plan expérimental : la minimisation du nombre
nécessaire d'expériences permet un gain en temps et en coût financier.
Il faut néanmoins comprendre que les plans d'expériences ne sont pas un outil destiné a priori à la recherche
fondamentale car ils ne permettront jamais une explication du phénomène physico-chimique étudié.

2. Qu’est-ce qu’un plan d’expérience ?


Les plans d'expériences permettent d'organiser au mieux les essais qui accompagnent une recherche
scientifique ou des études industrielles. Ils sont applicables à de nombreuses disciplines et à toutes les
industries à partir du moment où l'on recherche le lien qui existe entre une grandeur d’intérêt et des variables
dans un but d'optimisation.
La méthode classique d'étude consiste en la mesure de la réponse Y pour plusieurs valeurs de la variable
Xi tout en laissant fixe la valeur des (n - 1) autres variables. On itère alors cette méthode pour chacune des
variables. Ainsi, par exemple, si nous avons 4 variables et si l'on décide de donner 5 valeurs expérimentales
à chacune d'elles, nous sommes conduits à effectuer 5 4 = 625 expériences. Ce nombre élevé dépasse les
limites de faisabilité tant en temps qu'en coût. Il faut donc réduire le nombre d'expériences à effectuer sans
pour autant perdre sur la qualité des résultats recherchés.
Le traitement des résultats se fait enfin à l'aide de la régression linéaire simple ou multiple et l'analyse de
variance.
Il existe trois grandes familles de plans d’expériences :
1. Les "plans de criblages": dont l'objectif est de découvrir les facteurs les plus influents sur une
réponse donnée en un minimum d'expériences.
2. Les "plans de modélisation": dont l'objectif est de trouver la relation mathématique qui lie les
réponses mesurées aux variables associés aux facteurs soit via une démarche mathématique
analytique ou purement matricielle.
3. Les "plans de mélange": dont l'objectif est le même que la deuxième famille mais où les facteurs
ne sont pas indépendants et sont contraints (par exemple leur somme/ ou leur rapport doit être égale à
une certaine constante).
1
COURS PLANIFICATION-VALIDATION DE MODELES

3. Vocabulaire de base des plans d'expérience


Le scientifique est souvent amené à comprendre comment réagit un système en fonction des facteurs
susceptibles de le modifier. Pour visualiser cette évolution, il mesure une réponse et va ensuite essayer
d'établir des relations de cause à effet entre les réponses et les facteurs.

Parmi les facteurs on distinguera :


• les facteurs contrôlables qui dépendent directement du choix du technicien (pression, température,
matériau …)
• les facteurs non contrôlables qui varient indépendamment du choix du technicien (conditions
climatiques, environnement d'utilisation…)
• les facteurs d'entrée dont on cherche à analyser une influence (matière première, vitesse d'agitation,
température, rendement …)

Les facteurs étudiés dans un plan d'expériences sont bien entendu les facteurs d'entrée. Un facteur est
une grandeur le plus souvent mesurable mais il peut s'agir d'une grandeur qualitative comme les différents
lots d'une matière première.
La réponse est la grandeur mesurée à chaque essai ; le plan vise à déterminer quels facteurs l'influencent
ou quelle est son évolution en fonction de ceux-ci. Cette grandeur est le plus souvent mesurable mais elle
peut également être qualitative.
Dans ce cas ce peut être par exemple une appréciation visuelle sur l'état d'une surface ou une
appréciation bon, moyen ou mauvais sur un produit alimentaire.
Une notion importante est celle d'interaction entre deux facteurs d'entrée. On parle d'interaction entre
deux facteurs A et B quand l'effet du facteur A sur la réponse va dépendre de la valeur du facteur B.

4. Domaine d’étude
Un expérimentateur qui lance une étude s'intéresse à une grandeur qu'il mesure à chaque essai. Cette
grandeur s'appelle la "réponse", c'est la grandeur d'intérêt. La valeur de cette grandeur dépend de plusieurs
variables ou "facteurs". La valeur donnée à un facteur pour réaliser un essai est appelée "niveau". Lorsqu'on
étudie l'influence d'un facteur, en général, on limite ses variations entre deux bornes appelées
respectivement : "niveau bas" (-1) et "niveau haut" (+1).

2
COURS PLANIFICATION-VALIDATION DE MODELES

Par exemple, pour deux facteurs, le domaine d'étude est une surface et l'espace expérimental est . A
chaque point du domaine d'étude correspond une réponse. A l'ensemble de tous les points du domaine
d'étude correspond un ensemble de réponses qui se localisent sur une surface appelée la "surface de
réponse" :

5. Notion de modèle et de régression linéaire multiple


La méthode des plans d’expériences repose essentiellement sur la création et l’exploitation de modèles de la
fonction objectif (réponse). Il est donc naturel d’analyser dans les détails cette composante primordiale.
La régression linéaire multiple est une méthode d'analyse de données quantitatives. Elle a pour but de mettre
en évidence la liaison pouvant exister entre une variable dite expliquée, que l'on notera Y et plusieurs autres
variables dites explicatives que l'on notera X1, X2, ... , Xk.

Les k variables Xi, i = 1, ... , k peuvent être soit aléatoires, soit contrôlées c'est-à-dire qu'elles sont connues
sans erreur. Nous supposerons dans la suite que les variables X i, i = 1, ... , k sont contrôlées. Nous nous
intéressons aux modèles dits linéaires, c'est-à-dire aux modèles du type :

Y =0 +1X1 + 2X2 + ... +kXk

dans lequel 0, 1, ... , k sont des réels appelés coefficients du modèle (c'est, ici, un modèle sans
interaction).

La différence entre valeur (yi)obs observée de Y obtenue lors de la réalisation de l'expérience i et la valeur y i
attendue est l’erreur notée i, qui peut être dû à des facteurs non contrôlés (dérive des appareils, adresse de
l'expérimentateur, etc). Cela justifie le fait que nous adopterons désormais le modèle suivant :

Y =0 +1X1 + 2X2 + ... +kXk + 

3
COURS PLANIFICATION-VALIDATION DE MODELES

6. Plan factoriel complet 2k

6.1. Plan 2k

Si dans l'étude d'un processus la température doit intervenir, et celle-ci varie dans un intervalle [20°C
60°C], c’est un facteur quantitatif. On dira alors que le niveau bas du facteur température est 20 oC et le
niveau haut est 60oC ; on peut décider de ne travailler qu'avec une température de 20 oC puis de 60oC : au lieu
de faire plusieurs variations de T, on en fait que deux et le domaine expérimental de la température sera
20oC-60oC. Si le facteur est qualitatif, le niveau bas et le niveau haut correspondront à deux modalités du
facteur, par exemple deux types de solvant. Dans la pratique, le niveau bas sera codé -1 et le niveau haut +1.
Un plan pour lequel chacun des k facteurs ne possède que 2 niveaux est appelé plan 2k.

6.2. Variables codées ou variables centrées réduite

L’utilisation des variables centrées réduites présente l’intérêt de pouvoir généraliser la théorie des plans
d’expériences quels que soient les facteurs ou les domaines d’études retenus. Remplacer les variables codées
va permettre d’avoir pour chaque facteur le même domaine de variation [-1, +1] et de pouvoir ainsi
comparer entre eux l’effet des facteurs.

Exemple : on choisit pour le facteur température un domaine d’étude :[10°C, 40°C], on affecte la valeur -1 à
10°C et +1 à 40°C. On note t la variable codée et T la variable naturelle. On peut les lier par la relation
suivante où T0 est le milieu de l’intervalle du domaine d’étude et ΔT la moitié de la largeur du domaine, ici :
T0=25°C et ΔT=15°C :

T −T 0
∆T
t=

Les variables centrées réduites sont sans dimension, une température de 20°C correspond à une variable
centrée réduite de -0.33

6.3 Matrice d'expériences.

La matrice d'expériences est le tableau qui indique le nombre d'expériences à réaliser avec la façon de faire
varier les facteurs et l'ordre dans lequel il faut réaliser les expériences. Ce tableau est donc composé de +1 et
de -1. Soit, par exemple, la matrice d'expériences suivante
Exp X1 X2

1 -1 -1

2 +1 -1

3 -1 +1

4 +1 +1

4
COURS PLANIFICATION-VALIDATION DE MODELES

Dans le cas où l'on ajoute à droite de la matrice d'expérience une colonne avec les réponses, on obtient la
« matrice d'expériences et des réponses ».

6.4 Effet global et effet moyen d'un facteur.

a)Un seul facteur :

Supposons qu'il n'y ait qu'un seul facteur X 1 à deux niveaux. Notons y2 la réponse (résultat de l'expérience) lorsque
X1 est au niveau +1 et y1 la réponse lorsque X1 est au niveau -1. La matrice d'expérience et des réponses est :

Exp X1 Réponse : Y rep

1 -1 y1

2 +1 y2

On appelle effet global d'un facteur la variation de la réponse quand le facteur passe du niveau -1 au niveau
+1. On appelle effet moyen d'un facteur la demi-variation de la réponse quand le facteur passe du niveau -1
au niveau +1. Ainsi, l'effet moyen est défini comme étant la moitié de l'effet global.

Effet global de X1 : y2 - y1 ; effet moyen de X1 : a1 = (y2-y1)/2

la réponse théorique au centre du domaine est : a0=(y1+y2)/2 qui est la moyenne des réponses.

b) Deux facteurs.

Supposons que nous ayons maintenant 2 facteurs X1 et X2 avec chacun deux niveaux (plan 22). Une matrice
d'expérience et des réponses est, par exemple :

Exp X1 X2 Réponse : Y rep

1 -1 -1 y1

2 +1 -1 y2

3 -1 +1 y3

4 +1 +1 y4

Calcul des effets.

5
COURS PLANIFICATION-VALIDATION DE MODELES

L'effet moyen de X1 est toujours la demi-variation de la réponse lorsque X1 passe du niveau -1 au niveau +1.
Or, pour chacun des niveaux de X 1, il y a 2 expériences (une pour chacun des niveaux de X 2 ).
Nous devons alors envisager des réponses moyennes.

y 1+ y 3
Quand X1 est au niveau -1, nous avons la réponse moyenne :
2

y 2+ y 4
et quand X1 est au niveau +1, nous avons la réponse moyenne :
2

y 2+ y 4 y 1+ y 3
− − y 1+ y 2− y 3+ y 4
L'effet global a1 de X1 donne : a1= 2 2 = 4
2

− y 1− y 2+ y 3+ y 4
L'effet moyen a2 de X2 se calcule de la même manière : a2=
4

Comme dans le cas à un seul facteur, on calcule a 0 ou "réponse théorique" pour X1 = 0 (au centre de son
domaine de variation) comme la moyenne des réponses observées aux niveaux -1 et +1.

y 3+ y 4 y 1+ y 2
+ y 1+ y 2+ y 3+ y 4
a0= 2 2 = 4
2

Remarque : Nous aurions obtenu le même résultat en raisonnant à partir de X2.

c) Trois facteurs et plus.

Plus généralement, la matrice d'expériences comporte k colonnes pour les facteurs principaux et 2k lignes
soit 2k essais. Elle se construit selon la règle suivante (algorithme de YATES):
• colonne du 1er facteur: alternance de -1 et +1
• colonne du 2e facteur: alternance de -1 et +1 de 2 en 2
• colonne du 3e facteur: alternance de -1 et +1 de 4 en 4
• colonne du 4e facteur: alternance de -1 et +1 de 8 en 8
et ainsi de suite pour un nombre plus élevé de facteurs.
En adoptant ces règles empiriques, la matrice des effets est une matrice de Hadamard qu’on écrit pour deux
et trois facteurs comme suit :

7. Notion d'interaction

6
COURS PLANIFICATION-VALIDATION DE MODELES

Isoler l’effet de chaque facteur ne rend pas compte toujours de l’ensemble du phénomène. Il arrive que l’un
des facteurs renforce l’effet de l’autre. Cela s’appelle une interaction. On dit qu'il y a interaction entre deux
facteurs si l'effet moyen de l'un n'est pas le même suivant que l'on se place au niveau bas ou au niveau haut
de l'autre. L'interaction entre deux facteurs X 1 et X2 sera, dans la suite, considérée comme un nouveau
facteur que l'on notera X1X2

Du point de vue du vocabulaire, une interaction entre deux facteurs sera qualifiée d'interaction d'ordre 2, une
interaction entre trois facteurs sera une interaction d'ordre 3, etc...

7.1. Plan complet avec interactions. Calcul et graphique des effets.

Pour calculer l'effet d'une interaction entre deux variables X i et Xj on ajoute à la matrice des effets une
colonne, que l'on baptise XiXj, et que l'on obtient en faisant le produit "ligne à ligne" des colonnes des
variables Xi et Xj

Exemple numérique :On considère une réaction chimique dont le rendement dépend de deux facteurs, la
température et la pression. Le technicien décide d'effectuer un plan d'expérience avec le domaine
expérimental suivant :

Niveau bas : -1 Niveau haut :+1


Température : T 60oC 80oC
Pression : P 1 bar 2 bars

La réponse Y étudiée, rendement de l'expérience, est donnée par le tableau suivant :

Exp T P Y (Rend)
1 -1 -1 60
2 +1 -1 65
3 -1 +1 75
4 +1 +1 85

Déterminons une estimation ponctuelle de chacun des coefficients du modèle. Nous obtenons le tableau
suivant qui permet d'obtenir les résultats demandés.

Exp Moy T P TP Y (%)


1 +1 -1 -1 +1 60
2 +1 +1 -1 -1 65
3 +1 -1 +1 -1 75
4 +1 +1 +1 +1 85
Diviseur 4 4 4 4
Effets a0=71,25 a1=3,75 a2=8,75 a12=1,25
La colonne TP est bien le produit ligne à ligne des colonnes T et P.

7
COURS PLANIFICATION-VALIDATION DE MODELES

le modèle s'écrit :Y = 71, 25 + 3, 75T + 8, 75P + 1, 25PT

La représentation graphique des effets : elle représente mieux l’influence des facteurs sur la réponse, la
représentation des effets principaux se fait simplement à partir du tableau des réponses moyennes aux
différents niveaux des facteurs.

T P

Niveau - 1 60 + 75 = 67,5 60 + 65 = 62,5


2 2

Niveau + 1 60 + 85 = 75 75 + 85 = 80
2 2

Le graphique de l’interaction permet de conclure si celle-ci est négligeable ou pas, on constate que les deux
segments de droite ne sont pas parallèles donc que l'interaction n'est pas, à priori, négligeable.

8. Calculs statistiques et interprétation des résultats- Validation

8.1 Test de signification des effets

8
COURS PLANIFICATION-VALIDATION DE MODELES

On appelle effets les coefficients des facteurs et ceux des interactions dans l'écriture du modèle.

Les calculs statistiques qui permettent de savoir si les effets sont significatifs, de calculer les intervalles de
confiance ou de valider la linéarité du modèle font intervenir d'une part les résidus e i , c'est-à-dire la
différence entre la valeur expérimentale et la valeur prédite par le modèle et, d'autre part de la variance
commune des résidus :

s²= ei²/(n-p)

Où n est le nombre d'expériences réalisées et p le nombre de coefficients du modèle. Dans ces


conditions, on peut montrer que tous les effets ont la même variance donnée par : si²=s2/n

ATTENTION

Si l'on réalise un plan complet et que l'on calcule tous les effets, le calcul de s 2 est impossible puisque
alors n = p (un plan complet 23 conduit à 8 expériences et 8 effets : 3 effets pour les facteurs, 3 effets
pour les interactions d'ordre 2 et enfin 1 effet pour l'interaction d'ordre 3). C'est pour cela que, dans
la pratique, il est d'usage de négliger les interactions d'ordre élevé (3 ou plus). C'est souvent le
contexte et la connaissance de lois régissant le phénomène étudié qui permet de négliger certaines
interactions et donc de pouvoir conduire des calculs statistiques.

8.2. Réalisation du test de signification des effets.

Le test utilisé est le test « t » de Student. Un effet sera dit significatif (c'est-à-dire que la variable ou
l'interaction qui lui est associée a une influence sur la réponse), s'il est, pour un risque donné,
significativement différent de 0.

Pour cela, on calcule : ti = |ai|/si

On utilise alors une table de Student à  = n - p degrés de liberté (n est le nombre d'expériences réalisées et p
le nombre d'effets y compris la constante).On choisit un risque de première espèce  (le plus souvent 5% ou
1%) et on lit dans cette table de Student la valeur tcrit(,).

La règle du test est alors la suivante :

 Si ti > tcrit(), l’effet est significatif.


 Si ti < tcrit(),l’effet n’est pas significatif.

Exemple.

On reprend l’exemple de la réaction chimique dont le rendement dépend de deux facteurs, la température et
la pression.

9
COURS PLANIFICATION-VALIDATION DE MODELES

Niveau bas : -1 Niveau haut :+1

Température : T 60oC 80oC

Pression : P 1 bar 2 bars

Déterminons une estimation ponctuelle des effets de chacune des variables.


Exp Moy T P Y (%)

1 +1 -1 -1 60

2 +1 +1 -1 65

3 +1 -1 +1 75

4 +1 +1 +1 85

Diviseur 4 4 4

Effets a0 = 71,25 a1 = 3,75 a2 = 8,75

Le modèle s'écrit :Y = 71, 25 + 3, 75T + 8, 75P

Test de signification des coefficients :

Exp Moy T P Y (%) Yest ei ei2

1 +1 -1 -1 60 . . .

2 +1 +1 -1 65 . . .

3 +1 -1 +1 75 . . .

4 +1 +1 +1 85 . . .

On cherche à tester la non influence d'une variable sur la réponse. On choisit un risque de 5 %.

1
-
2
La variance des résidus est : s =
.−.
∑ e 2i =… . .
- La variance commune des estimateurs des coefficients du modèle est
2
s ….
: s2i = = =..… … … … … … ..
n ….

|ai|
La statistique << t>> de Student associé vaut : t i=
si
10
COURS PLANIFICATION-VALIDATION DE MODELES

La table de Student donne, pour un risque de 5 % avec  = n - p = ….-….. = ….. :

tcrit(0,05 ; 1) = ………

1. Pour l'effet a1 = 3, 75 de T on a t1 = ...... < ………

Au risque de 5 % l'effet de la température T n'est pas significatif.

2. Pour l'effet a2 = 8, 75 de P on a t2 = ……. < ……... Au risque de 5 % l'effet de la pression P n'est pas
significatif.

On peut donc considérer que les coefficients a1 et a2 ne sont pas significativement différent de 0.

La conclusion de cette étude est que l'on doit rejeter un modèle linéaire pour expliquer le rendement
de cette réaction chimique. Il faudrait refaire une étude avec un modèle polynomial du second degré.

8.3 Intervalle de confiance des effets du modèle.

On calcule s², variance commune des résidus avec  = n- p degrés de liberté puis on en déduit si variance
commune des effets. On choisit alors un risque et on détermine avec table de Student le nombre t().

L'intervalle de confiance d'un effet ai est alors donné par : [ai - t()si ; ai + t()si]

Exemple.

Considérons le plan d'expérience 23suivant dans lequel on néglige l'interaction d'ordre 3.

X1 X2 X3 X 1X 2 X 1X 3 X 2X 3 Y

-1 -1 -1 +1 +1 +1 5,2

+1 -1 -1 -1 -1 -1 4,7

-1 +1 -1 -1 +1 +1 5,1

+1 +1 -1 +1 -1 -1 5,5

-1 -1 +1 +1 -1 -1 4,9

+1 -1 +1 -1 +1 -1 4,6

-1 +1 +1 -1 -1 +1 4,8

+1 +1 +1 +1 +1 +1 5,3

Le calcul des effets se faisant comme il a été dit plus haut, on obtient le modèle :
11
COURS PLANIFICATION-VALIDATION DE MODELES

Y = …….. + …….X1 + ……..X2 +……X3 +………X1X2 +………X1X3 +…………X2X3

Avant de déterminer les intervalles de confiance des effets, regardons leur significativité. Pour cela,
déterminons les résidus et la variance commune de ceux-ci.

Yi observés Yi estimés ei e²i


5,2
4,7
5,1
5,5
4,9
4,6
4,8
5,3

2 ……….×…………
La variance commune des résidus est donc : s = =… … … … … … .
… … .−… …

Donc :

s = …………….

La variance commune de tous les effets est alors :


2
2 s
S=
i =… … … … … …. .
… ..

Le "t" de Student pour chaque effet se calcule avec :

|ai|
ti =
si

Par exemple, pour le coefficient de la variable X1 on obtient : t1=………../………..=………

La table de Student donne pour un risque et  = n - p = 8 - ….. =…. ,

tcrit(0,05 ; 1) = 12,71.

Un effet sera donc significatif au risque de 5% si son "ti" et supérieur à 12,71. On obtient le tableau suivant :

Variable effet t Résultat

12
COURS PLANIFICATION-VALIDATION DE MODELES

Constante 5,0125 t0 = …….>12,71

X1 a1 = 0,125 t1 = …..<12,71

X2 a2 = 0,1625 t2 = ……>12,71

X3 a3 = - 0,1125 t3 = …..<12,71

X 1X 2 a12 = 0,2125 t12 = ……>12,71

X 1X 3 a13 = 0,0375 t13 = …..<12,71

X 2X 3 a23 = - 0,0125 t23 = ……<12,71

Ce tableau montre que seul la variable X 2 et l'interaction X1X2 sont significatives. Il faudrait donc retenir un
modèle de la forme :

Y = ....................................................................................................

Nous déterminerons un intervalle de confiance, au risque de 5%, pour les coefficients a 2 et a12. Rappelons
que cet intervalle se calcule avec :

[ai - t()si ; ai + t()si] = [ai - 12,71*0,0125 ; ai + 12,71*0,0125]

coefficient ak estimateur de ak Borne inférieure Borne supérieure


a2 a2 = 0,1625 0,0036 0,3214
a12 a12 = 0,2125 0,0536 0,3714

Remarque importante :

Cherchons l'intervalle de confiance d'un effet non significatif, par exemple a1. On obtient :

[0,125-12,71*0,0125 ; 1,125+12,71*0,0125] = [-0,1469 ; 0,1717]

On constate que 0 est dans cet intervalle de confiance, ce qui montre bien que le coefficient n'est pas
significativement différent de 0 au risque de 5%.

TABLE DE STUDENT AU RISQUE 5%


 DDL) t(crit)
1 12,70
2 4,30
13
COURS PLANIFICATION-VALIDATION DE MODELES

3 3,18
4 2,78
5 2,57
6 2,45
7 2,37
8 2,31
9 2,26
10 2,23
11 2,20
12 2,18
13 2,16
14 2,15
15 2,13
16 2,12
17 2,11
18 2,10
19 2,09
20 2,08

14

Vous aimerez peut-être aussi