Vous êtes sur la page 1sur 11

Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

I. Chapitre I : Introduction générale et plans factoriels

I.1. Introduction
L’analyse de données permet d’analyser de grands ensembles de données non structurés, notamment
quand les paramètres ne peuvent pas être suffisamment maîtrisés. Ces méthodes d’analyses permettent
d’interpréter des essais déjà réalisés et de décrire les influences des paramètres mis en jeu, de manière
qualitative. Sous le terme « analyse de données » sont regroupées l’ensemble des méthodes permettant de
collecter, d’organiser, de résumer, de présenter et d’étudier des données de façon à en tirer le maximum
d’informations.
La méthodologie des plans d’expériences permet une recherche expérimentale planifiée appelée
« plans d’expériences ». L’expérimentation ne peut pas être quelconque : elle doit fournir l’information
désirée. Cette démarche expérimentale va aider l’expérimentateur à structurer sa recherche de manière
différente, à confronter et à valider ses propres hypothèses, à mieux comprendre les phénomènes étudiés et à
traiter les problèmes.
La compréhension de la méthode des plans d’expériences s’appuie sur deux notions essentielles, celle
d’espace expérimental et celle de modélisation mathématique des grandeurs étudiées.

I.2. Qu’est-ce qu’un plan d’expériences ?


Les plans d’expériences constituent essentiellement une stratégie de planification d’expériences afin
d’obtenir des conclusions solides et adéquates de manière efficace et économique. La méthodologie des plans
d’expériences se base sur le fait qu’une expérience convenablement organisée conduira fréquemment à une
analyse et à une interprétation statistique relativement simple des résultats.
Les plans d’expériences permettent d’organiser au mieux les essais qui accompagnent une recherche
scientifique ou des études industrielles. Ils s’appliquent à de nombreuses disciplines et à toutes les industries
à partir du moment où l’on recherche le lien qui existe entre une grandeur d’intérêt « y » et des variables « xi ».
Il faut penser aux plans d’expériences si l’on s’intéresse à une fonction du type :
y = f (xi).
Avec les plans d’expériences, on obtient le maximum de renseignements avec le minimum
d’expériences. Pour cela, il faut suivre des règles mathématiques et adopter une démarche rigoureuse.

I.3. Domaine d’étude et surface de réponse


I.3.1. Domaine d’étude
Le domaine d’étude concerne les intervalles délimités par le maximum et le minimum des variables
xi. Ce domaine d’étude est fixé par l’expérimentateur selon ses objectifs et le phénomène étudié.

1
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

y
(Réponse)

x2

x2-max B D

Domaine d’étude plan


x2-min (ABDC) C
A

x1
x1-min x1-min

Figure (I.1) : Les réponses associées aux points du domaine d’étude forment la surface de réponse.

I.3.2. Réponse et surface de réponse


a) La réponse
On qualifie de réponse la grandeur qui est observée pour chaque expérience réalisée. On supposera
toujours ici que cette grandeur est numérique et qu’une seule réponse à la fois est observée (des techniques de
planification multiréponses existent aussi). Il appartient aux spécialistes du phénomène étudié de cerner au
mieux ce qui les intéresse et de fournir le type de réponse étudié ainsi que l’objectif souhaité vis-à-vis de celle-
ci. Cet objectif est dans la plupart des cas une recherche d’extremum.
b) La surface de réponse
Les niveaux xi représentent les coordonnées d’un point expérimental qui y est la valeur de la réponse
en ce point. On définit un axe orthogonal à l’espace expérimental (domaine d’étude) et on l’attribue à la
réponse. La représentation géométrique du plan d’expériences et de la réponse nécessite un espace ayant une
dimension de plus que l’espace expérimental. Un plan à deux facteurs utilise un espace à trois dimensions pour
être représenté : une dimension pour la réponse, deux dimensions pour les facteurs.
À chaque point du domaine d’étude correspond une réponse. À l’ensemble de tous les points du
domaine d’étude correspond un ensemble de réponses qui se localisent sur une surface appelée la surface de
réponse.
I.4. Les facteurs
On qualifie de facteur toute variable, obligatoirement contrôlable, susceptible d’influer sur la réponse
observée. La différence fondamentale entre la notion classique de variable et celle de facteur tient donc dans
le fait que tout facteur doit pouvoir être modifié sans difficulté.
En général, un facteur varie entre deux bornes : la borne inférieure et la borne supérieure. Dans le
langage des plans d’expériences, on dit que le facteur varie entre le niveau bas (borne inférieure que l’on note
le plus souvent par -1) et le niveau haut (borne supérieure que l’on note le plus souvent par +1). L’ensemble

2
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

de toutes les valeurs que peut prendre le facteur entre le niveau bas et le niveau haut s’appelle le domaine de
variation. Un facteur peut prendre plusieurs niveaux à l’intérieur de son domaine de variation.

Domaine du facteur
Niveau bas Niveau haut

-1 +1 Axe du facteur

Figure (I.2) : Domaine de variation du facteur.


L’effet d’un facteur sur la réponse y s’obtient en comparant les deux résultats de mesure y1 et y2 de
réponse, mesurée lorsque le facteur passe d’un niveau (0) à un niveau (+). Si l’écart entre y1 et y2 est important,
on dit que le facteur est influent ou significatif.

I.4.1. Variable centrée réduite (Variable codée)


Pour établir un modèle exprimant la réponse en fonction des paramètres opératoires, sa
nécessite la transformation de ces derniers en variables codées ou variables centrées réduites.
La formule permettant le passage des variables réelles zi aux variables codées xi est :

zi − zi0 (I.1)
xi = (i = 1, 2, … k)
Δzi
Avec :
x1, x2, …, xk : Variables centrées réduites ou variables codées ;
z1, z2, …, zk : Facteurs contrôlables (variables réelles) ;
z10 , z20 , … , zk0 : Variables réelles correspondantes au centre du plan ou parfois niveau fondamental ;

zimax + zimin (I.2)


zi0 =
2
zi : Unité ou intervalle de variation suivant l’axe des zi ;

zmax
i − zmin
i (I.3)
Δzi =
2
zmin : Valeur minimale de la variable réelle ;
zman : Valeur maximale de la variable réelle ;
K : le nombre de facteurs indépendants.

I.5. Notion d’interaction


Lorsque plusieurs facteurs agissent sur la même réponse du système étudiée, alors ils sont susceptibles
de provoquer des interactions. Si l’effet d’un facteur dépend du niveau d’un autre facteur, on dit qu’il y a
interaction entre ces deux facteurs.

3
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

Le graphique I.3 ci-dessous étudie les effets des facteurs A et B, ayant chacun deux niveaux. On distingue trois
cas :
Dans le premier cas, on peut observer que l’effet du facteur A ne dépend pas des niveaux de B. En
effet les droites correspondantes sont parallèles. De la même façon l’effet de B ne dépend pas des niveaux de
A. Cela signifie qu’il n’y a aucune interaction entre les facteurs A et B, aux niveaux testés. On dit alors que
les facteurs A et B sont indépendants.
Par contre dans le deuxième et troisième cas, on remarque immédiatement que les droites traduisant l’effet des
facteurs ne sont pas parallèles. L’effet de A change suivant que le facteur B est au niveau 1 ou 2. Cela signifie
qu’une interaction entre les facteurs A et B s’est manifestée. On dit alors que les facteurs A et B ne sont pas
indépendants.
On peut noter dans le troisième cas, que l’effet de A s’inverse suivant le niveau de B, cela signifie que
l’interaction est particulièrement forte.

Réponse

R11 Avec B1 Cas n° 1 :


Les droites sont parallèles ;
R21 Il n’y a pas d’interaction ;
R12 L’effet de A est indépendant des niveaux de B.
Avec B2
R22

Facteur A
A1 A2

Réponse
Avec B1 Cas n° 2 :
R11 Les droites ne sont pas parallèles ;
R21
Il y a interaction ;
R12 L’effet de A n’est pas indépendant des niveaux de B.
Avec B2
R22

Facteur A
A1 A2

Réponse

R12
Avec B1
R21 Cas n° 3 :
R11 Les droites se coupent ;
Avec B2 Il y a une très forte interaction ;
R22 L’effet de A s’inverse selon le niveau de B.

Facteur A
A1 A2

Figure (I.3) : Les différents interactions entre les facteurs A et B, ayant chacun deux niveaux.

4
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

I.6. Notion de modèle et de régression linéature multiple


I.6.1. Notion de modèle
a) Modèle postulé
Un modèle mathématique est une traduction d’une observation dans le but de lui appliquer les outils,
les techniques et les théories mathématiques, puis généralement, en sens inverse, la traduction des résultats
mathématiques obtenus en prédictions ou opérations dans le monde réel.
Dans le cas des plans d’expérience on choisit une fonction mathématique qui relie la réponse aux
facteurs. On prend un développement limité de la série de Taylor-Mac Laurin. Les dérivées sont supposées
constantes et le développement prend la forme d’un polynôme de degré plus ou moins élevé :

y = β0 + ∑ βi xi + ∑ βij xi xj + ⋯ + ∑ βii xi2 + βij…z xi xj … xz (I.4)

• y est la réponse ou la grandeur d’intérêt. Elle est mesurée au cours de l’expérimentation et elle est obtenue
avec une précision donnée.
• xi représente le niveau attribué au facteur i par l’expérimentateur pour réaliser un essai. Cette valeur est
parfaitement connue. On suppose même que ce niveau est déterminé sans erreur (hypothèse classique de
la régression).
• β0, βi, βij, βii sont les coefficients du modèle mathématique adopté. Ils ne sont pas connus et doivent être
calculés à partir des résultats des expériences.
L’intérêt de modéliser la réponse par un polynôme est de pouvoir calculer ensuite toutes les réponses du
domaine d’étude sans être obligé de faire les expériences. Ce modèle est appelé "modèle postulé" ou "modèle
a priori".
b) Modèle de l’expérimentateur
Deux compléments doivent être apportés au modèle précédemment décrit.
Le premier complément est le "manque d’ajustement". Cette expression traduit le fait que le modèle a
priori est fort probablement différent du modèle réel qui régit le phénomène étudié. Il y a un écart entre ces
deux modèles. Cet écart est le manque d’ajustement.
Le second complément est la prise en compte de la nature aléatoire de la réponse. En effet, si l’on
mesure plusieurs fois une réponse en un même point expérimental, on n’obtient pas exactement le même
résultat. Les résultats sont dispersés. Les dispersions ainsi constatées sont appelées erreurs expérimentales.
Ces deux écarts, manque d’ajustement et erreur expérimentale, sont souvent réunis dans un seul écart, notée .
Le modèle utilisé par l’expérimentateur s’écrit alors :

y = β0 + ∑ βi xi + ∑ βij xi xj + ⋯ + ∑ βii xi2 + βij…z xi xj … xz + 𝜀 (I.5)

c) Système d’équations
Chaque point expérimental permet d’obtenir une valeur de la réponse. Cette réponse est modélisée par
un polynôme dont les coefficients sont les inconnues qu’il faut déterminer. A la fin du plan d’expériences, on
a un système de n équations (s’il y a n essais) à p inconnues (s’il y a p coefficients dans le modèle choisi a
priori). Ce système s’écrit d’une manière simple en notation matricielle :

5
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

Y = Xβ+ε (I.6)

• y est le vecteur des réponses.


• X est la matrice de calcul, ou matrice du modèle, qui dépend des points expérimentaux choisis pour
exécuter le plan et du modèle postulé.
• β est le vecteur des coefficients.
•  est le vecteur des écarts.
Ce système possède un nombre d’équations inférieur au nombre d’inconnues. Il y a n équations et p + n
inconnues. Pour le résoudre, on utilise une méthode de régression basée sur le critère des moindres carrés. On
obtient ainsi les estimations des coefficients du modèle.

I.6.2. Notion de régression linéaire


En statistiques, en économétrie et en apprentissage automatique, un modèle de régression linéaire est
un modèle de régression qui cherche à établir une relation linéaire entre une variable (souvent notée y) dite
expliquée et une ou plusieurs variables (souvent notées xi) dites explicatives.
a) Régression linéaire simple
On cherche à modéliser la relation entre deux variables quantitatives continues.
Un modèle de régression linéaire simple est de la forme suivante :

(I.7)
y = β0 + β1 x + ε
Où :
- y est la variable à expliquer (à valeurs dans R) ;
- x est la variable explicative (à valeurs dans R) ;
-  est le terme d’erreur aléatoire du modèle ;
- β0 et β1 sont deux paramètres à estimer.
Remarques :
• La désignation “simple” fait référence au fait qu’il n’y a qu’une seule variable explicative x pour expliquer
y.
• La désignation “linéaire” correspond au fait que le modèle (1) est linéaire en β0 et β1.
Pour n observations, on peut écrire le modèle de régression linéaire simple sous la forme :

(I.8)
yi = β0 + β1 xi + εi
On suppose que :
- xi est observée et non aléatoire ;
- yi est observée et aléatoire ;
- i est une variable aléatoire, non observée.

(I.9)
ε̂i = yi − ŷi
Où 𝐲̂𝐢 est la valeur prédite par le modèle lorsque x = xi :

6
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

(I.10)
ŷi = β̂0 + β̂1 xi
On peut écrire matriciellement le modèle (I.8) de la manière suivante :

(I.11)
Y=Xβ+ ε
Où :
y1 1 x1 ε1
y2 1 x2 β ε2 (I.12)
Y = ( ⋮ ), X=( ), β = ( 0) et ε=(⋮)
⋮ ⋮ β1
yn 1 xn εn
- Y désigne le vecteur à expliquer de taille n × 1,
- X la matrice explicative de taille n × 2,
-  le vecteur d’erreurs de taille n × 1.
L’estimation des paramètres β0 et β1 est obtenue par minimisation de la somme des carrés des écarts entre
observations et modèle (moindres carrés). On cherche β0 et β1 qui minimisent la somme des carrés des résidus :
Pour une séquence d’observations {(xi,yi) i = 1…, n}, le critère des moindres carrés s’écrit :
n
(I.13)
min ∑[yi − (β0 + βi xi )]2 = min F(β0 , β1 )
β0 ,β1 β0 ,β1
i=1
Le minimum est atteint pour :
∂F(β0 ,β1 )
∂β0
| =0
β =β̂ ,β =β ̂
(I.14)
{∂F(β ,β ) 0 0 1 1
0 1
∂β1
| =0
̂0 ,β1 =β
β0 =β ̂1

La solution du problème d’optimisation est :


1
∑n ̅ )(yi −𝑦̅)
i=1(xi −x cx,y
β̂1 = n 1 n = s2x (I.15)
{ ∑ (x −x̅)2
n i=1 i

β̂0 = y̅n − β̂1 x̅


Où :
cx,y est la covariance empirique entre les xi et les yi ;
sx² est la variance empirique de xi ;
𝐱̅, 𝐲̅ sont les moyennes arithmétiques des variables x et y.
1 1 (I.16)
x̅ = n ∑ni=1 xi et y̅ = n ∑ni=1 yi
Le coefficient de corrélation est donné par la formule :
1 n

R= n i=1(xi − x̅n )(yi − y̅n ) =
cx,y
(I.17)
v v
√1 ∑ni=1(xi − x̅n )2 √1 ∑ni=1(yi − y̅n )2 √ x √ y
n n
Tel que vx, vy sont la variance de x et de y donnée par :
n n
1 1 (I.18)
Vx = ∑(xi − x̅)2 ; Vy = ∑(yi − y̅)2
n n
i=1 i=1
Le coefficient de corrélation est égal à 1 dans le cas où l’une des variables est une fonction affine
croissante de l’autre variable, à -1 dans le cas où une variable est une fonction affine et décroissante. Les

7
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

valeurs intermédiaires renseignent sur le degré de dépendance linéaire entre les deux variables. Plus le
coefficient est proche des valeurs extrêmes -1 et 1, plus la corrélation linéaire entre les variables est forte.
b) Régression linéaire multiple
Un modèle de régression linéaire multiple avec p variables est de la forme suivante :
p
(I.19)
y = β0 + ∑ βj xj + ε
j=1
Où :
y est la variable à expliquer (à valeurs dans R) ;
x1,…,xn sont les variables explicatives (à valeurs dans R) ;
 est le terme d’erreur aléatoire du modèle ;
β0, β1,…,p sont les paramètres à estimer.
Remarque :
La désignation “multiple” fait référence au fait qu’il y a plusieurs variables explicatives xj pour expliquer y.
Pour n observations, on peut écrire le modèle de régression linéaire multiple sous la forme :
p
(I.20)
yi = β0 + ∑ βj xij + εi Pour i = 1, . . . , n
j=1
On suppose que :
- i est une variable aléatoire, non observée,
- xij est observé et non aléatoire,
- yi est observé et aléatoire.
On peut écrire matriciellement le modèle (I.20) de la manière suivante :

(I.21)
Y=Xβ+ ε
Où :
y1 1 x11 … x1p β0 ε1
y2 1 x21 … x2p β ε2 (I.22)
Y = ( ⋮ ), X= , β = ( 1) et ε=(⋮)
⋮ ⋮ ⋮ ⋮
yn (1 xn1 … xnp ) βp εn
- Y désigne le vecteur à expliquer de taille n,
- X la matrice explicative de taille n × (p + 1),
-  le vecteur d’erreurs de taille n.
A partir de l’échantillon (aléatoire) de n observations {(𝐱𝐢𝟏 , … , 𝐱𝐢𝐩 , 𝐲𝒊 ), 𝐢 = 𝟏, . . . , 𝐧 }, on veut estimer les
̂ qui minimise la somme des erreurs quadratiques :
paramètres β0, β1, …, βp. On cherche 𝛃
2 (I.23)
ε2i = (yi − β0 − β1 xi1 − ⋯ −βp xip )
On doit donc résoudre le problème d’optimisation suivant :
p 2
n
(I.24)
β̂ = arg min
p−1
∑ [yi − (β0 + ∑ βj xij )] = arg min
p−1
F(β)
β∈ℝ β∈ℝ
i=1 j=1

8
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

Avec :
p 2
n
(I.25)
F(β) = ∑ [yi − (β0 + ∑ βj xij )] = (Y − Xβ)T (Y − Xβ) = Y T Y − 2Y T Xβ + βT X T Xβ
i=1 j=1

Le minimum est atteint pour :


∂F(β) (I.26)
=0
∂β
On en déduit après quelques manipulations :
−1 (I.27)
β̂ = (X T X) X T Y

I.7. Plan factoriel 2k complet


Un plan est dit factoriel quand, dans une même expérimentation, il est étudié plusieurs facteurs dont
les niveaux sont croisés. Il est dit complet si tous les croisements possibles figurent dans l’expérimentation.
Dans un plan factoriel complet 2k, k facteurs sont étudiés dans une même expérimentation, chacun à 2
niveaux (souvent niveau BAS et niveau HAUT). Toutes les combinaisons des niveaux des facteurs doivent
être étudiées : elles sont en nombre 2k définissant autant traitements différents (les conditions expérimentales).
Le nombre d’essais à réaliser est donc aussi égal à 2K s’il n’est pas prévu de répéter chaque traitement
; dans le cas contraire, en appelant r le nombre de répétitions - qui doit être le même pour tous les traitements
- le nombre total d’essais à réaliser dans le plan expérimental est : N = r.2k.

I.7.1. Représentation de la matrice des essais par l’algorithme de Yates


Pour k variables (ou facteurs x1, x2, …, xk), la matrice d’expérience comporte k colonnes.
• Toutes les colonnes commencent par -1 ;
• On alterne les -1 et le +1 toutes les lignes pour la première colonne ;
• On alterne les -1 et le +1 toutes les deux lignes pour la seconde colonne, toutes les quatre lignes pour
la troisième ;
• En générale, on alterne les -1 et les +1 toutes les 2j-1 lignes pour la jeme colonne.

Exemple :
Pour 2 variables, la matrice d’expériences est :

Expérience x1 x2
1 -1 -1
2 +1 -1
3 -1 +1
4 +1 +1

9
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

Pour 3 variables, la matrice d’expériences est :


Expérience x1 x2 x3
1 -1 -1 -1
2 +1 -1 -1
3 -1 +1 -1
4 +1 +1 -1
5 -1 -1 +1
6 +1 -1 +1
7 -1 +1 +1
8 +1 +1 +1

I.7.2. Calcul des effets dans le cas d’un plan 23 (facteurs étudiés : x1, x2 et x3)
Pour un plan factoriel 23 dont les facteurs sont x1, x2 et x3, le modèle mathématique sans les interactions
est donné par :

(I.28)
yi = b0 + b1 x1 + b2 x2 + b3 x3 Pour i = 1, . . . , n = 8
À l’aide d’une matrice factorielle (matrice des effets) utilisant l’algorithme de Yates, l’effet de chaque
facteur peut être calculé :
Expérience Constante moyenne x1 x2 x3 y
1 +1 -1 -1 -1 y1
2 +1 +1 -1 -1 y2
3 +1 -1 +1 -1 y3
4 +1 +1 +1 -1 y4
5 +1 -1 -1 +1 y5
6 +1 +1 -1 +1 y6
7 +1 -1 +1 +1 y7
8 +1 +1 +1 +1 y8
Diviseur 8 8 8 8
Effet b0 b1 b2 b3
Le calcul des effets est réalisé par la somme des réponses affecté du signe du niveau du facteur divisé par le
nombre d’expériences :
y1 + y2 + y3 + y4 + y5 + y6 + y7 + y8
b0 = moy =
8
−y1 + y2 − y3 + y4 − y5 + y6 − y7 + y8
Ex 1 = b1 =
8 (I.29)
−y1 − y2 + y3 + y4 − y5 − y6 + y7 + y8
Ex 2 = b2 =
8
−y1 − y2 − y3 − y4 + y5 + y6 + y7 + y8
Ex 3 = b3 =
8

10
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels

I.7.3. Calcul des interactions le cas d’un plan 23 (facteurs étudiés : x1, x2 et x3)
Pour un plan factoriel 23 dont les facteurs sont x1, x2 et x3, le modèle mathématique avec les interactions
est donné par :

(I.30)
yi = b0 + b1 x1 + b2 x2 + b3 x3 + b4 x1 x2 + b5 x1 x3 + b6 x2 x3 + b7 x1 x2 x3 i = 1, . . . ,8
Pour calculer l’effet d’une interaction entre deux variables xi et xj on ajoute à la matrice des effets une
colonne, que l’on baptise xixj, et que l’on obtient en faisant le produit "ligne à ligne" des colonnes des variables
xi et xj.
La matrice des effets et des interactions est représentée comme suite :
Expérience Constante moyenne x1 x2 x3 x1x2 x1x3 x2x3 x1x2x3 y
1 +1 -1 -1 -1 +1 +1 +1 -1 y1
2 +1 +1 -1 -1 -1 -1 +1 +1 y2
3 +1 -1 +1 -1 -1 +1 -1 +1 y3
4 +1 +1 +1 -1 +1 -1 -1 -1 y4
5 +1 -1 -1 +1 +1 -1 -1 +1 y5
6 +1 +1 -1 +1 -1 +1 -1 -1 y6
7 +1 -1 +1 +1 -1 -1 +1 -1 y7
8 +1 +1 +1 +1 +1 +1 +1 +1 y8
Diviseur 8 8 8 8 8 8 8 8
Effet b0 b1 b2 b3 b4 b5 b6 B7

Le calcul des interactions est donné par :


+y1 − y2 − y3 + y4 + y5 − y6 − y7 + y8
Ex1 x2 = b4 =
8
+y1 − y2 + y3 − y4 − y5 + y6 − y7 + y8
Ex1 x3 = b5 =
8 (I.31)
+y1 + y2 − y3 − y4 − y5 − y6 + y7 + y8
Ex2 x3 = b6 =
8
−y1 + y2 + y3 − y4 + y5 − y6 − y7 + y8
Ex1 x2 x3 = b7 =
8

11

Vous aimerez peut-être aussi