Académique Documents
Professionnel Documents
Culture Documents
I.1. Introduction
L’analyse de données permet d’analyser de grands ensembles de données non structurés, notamment
quand les paramètres ne peuvent pas être suffisamment maîtrisés. Ces méthodes d’analyses permettent
d’interpréter des essais déjà réalisés et de décrire les influences des paramètres mis en jeu, de manière
qualitative. Sous le terme « analyse de données » sont regroupées l’ensemble des méthodes permettant de
collecter, d’organiser, de résumer, de présenter et d’étudier des données de façon à en tirer le maximum
d’informations.
La méthodologie des plans d’expériences permet une recherche expérimentale planifiée appelée
« plans d’expériences ». L’expérimentation ne peut pas être quelconque : elle doit fournir l’information
désirée. Cette démarche expérimentale va aider l’expérimentateur à structurer sa recherche de manière
différente, à confronter et à valider ses propres hypothèses, à mieux comprendre les phénomènes étudiés et à
traiter les problèmes.
La compréhension de la méthode des plans d’expériences s’appuie sur deux notions essentielles, celle
d’espace expérimental et celle de modélisation mathématique des grandeurs étudiées.
1
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
y
(Réponse)
x2
x2-max B D
x1
x1-min x1-min
Figure (I.1) : Les réponses associées aux points du domaine d’étude forment la surface de réponse.
2
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
de toutes les valeurs que peut prendre le facteur entre le niveau bas et le niveau haut s’appelle le domaine de
variation. Un facteur peut prendre plusieurs niveaux à l’intérieur de son domaine de variation.
Domaine du facteur
Niveau bas Niveau haut
-1 +1 Axe du facteur
zi − zi0 (I.1)
xi = (i = 1, 2, … k)
Δzi
Avec :
x1, x2, …, xk : Variables centrées réduites ou variables codées ;
z1, z2, …, zk : Facteurs contrôlables (variables réelles) ;
z10 , z20 , … , zk0 : Variables réelles correspondantes au centre du plan ou parfois niveau fondamental ;
zmax
i − zmin
i (I.3)
Δzi =
2
zmin : Valeur minimale de la variable réelle ;
zman : Valeur maximale de la variable réelle ;
K : le nombre de facteurs indépendants.
3
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
Le graphique I.3 ci-dessous étudie les effets des facteurs A et B, ayant chacun deux niveaux. On distingue trois
cas :
Dans le premier cas, on peut observer que l’effet du facteur A ne dépend pas des niveaux de B. En
effet les droites correspondantes sont parallèles. De la même façon l’effet de B ne dépend pas des niveaux de
A. Cela signifie qu’il n’y a aucune interaction entre les facteurs A et B, aux niveaux testés. On dit alors que
les facteurs A et B sont indépendants.
Par contre dans le deuxième et troisième cas, on remarque immédiatement que les droites traduisant l’effet des
facteurs ne sont pas parallèles. L’effet de A change suivant que le facteur B est au niveau 1 ou 2. Cela signifie
qu’une interaction entre les facteurs A et B s’est manifestée. On dit alors que les facteurs A et B ne sont pas
indépendants.
On peut noter dans le troisième cas, que l’effet de A s’inverse suivant le niveau de B, cela signifie que
l’interaction est particulièrement forte.
Réponse
Facteur A
A1 A2
Réponse
Avec B1 Cas n° 2 :
R11 Les droites ne sont pas parallèles ;
R21
Il y a interaction ;
R12 L’effet de A n’est pas indépendant des niveaux de B.
Avec B2
R22
Facteur A
A1 A2
Réponse
R12
Avec B1
R21 Cas n° 3 :
R11 Les droites se coupent ;
Avec B2 Il y a une très forte interaction ;
R22 L’effet de A s’inverse selon le niveau de B.
Facteur A
A1 A2
Figure (I.3) : Les différents interactions entre les facteurs A et B, ayant chacun deux niveaux.
4
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
• y est la réponse ou la grandeur d’intérêt. Elle est mesurée au cours de l’expérimentation et elle est obtenue
avec une précision donnée.
• xi représente le niveau attribué au facteur i par l’expérimentateur pour réaliser un essai. Cette valeur est
parfaitement connue. On suppose même que ce niveau est déterminé sans erreur (hypothèse classique de
la régression).
• β0, βi, βij, βii sont les coefficients du modèle mathématique adopté. Ils ne sont pas connus et doivent être
calculés à partir des résultats des expériences.
L’intérêt de modéliser la réponse par un polynôme est de pouvoir calculer ensuite toutes les réponses du
domaine d’étude sans être obligé de faire les expériences. Ce modèle est appelé "modèle postulé" ou "modèle
a priori".
b) Modèle de l’expérimentateur
Deux compléments doivent être apportés au modèle précédemment décrit.
Le premier complément est le "manque d’ajustement". Cette expression traduit le fait que le modèle a
priori est fort probablement différent du modèle réel qui régit le phénomène étudié. Il y a un écart entre ces
deux modèles. Cet écart est le manque d’ajustement.
Le second complément est la prise en compte de la nature aléatoire de la réponse. En effet, si l’on
mesure plusieurs fois une réponse en un même point expérimental, on n’obtient pas exactement le même
résultat. Les résultats sont dispersés. Les dispersions ainsi constatées sont appelées erreurs expérimentales.
Ces deux écarts, manque d’ajustement et erreur expérimentale, sont souvent réunis dans un seul écart, notée .
Le modèle utilisé par l’expérimentateur s’écrit alors :
c) Système d’équations
Chaque point expérimental permet d’obtenir une valeur de la réponse. Cette réponse est modélisée par
un polynôme dont les coefficients sont les inconnues qu’il faut déterminer. A la fin du plan d’expériences, on
a un système de n équations (s’il y a n essais) à p inconnues (s’il y a p coefficients dans le modèle choisi a
priori). Ce système s’écrit d’une manière simple en notation matricielle :
5
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
Y = Xβ+ε (I.6)
(I.7)
y = β0 + β1 x + ε
Où :
- y est la variable à expliquer (à valeurs dans R) ;
- x est la variable explicative (à valeurs dans R) ;
- est le terme d’erreur aléatoire du modèle ;
- β0 et β1 sont deux paramètres à estimer.
Remarques :
• La désignation “simple” fait référence au fait qu’il n’y a qu’une seule variable explicative x pour expliquer
y.
• La désignation “linéaire” correspond au fait que le modèle (1) est linéaire en β0 et β1.
Pour n observations, on peut écrire le modèle de régression linéaire simple sous la forme :
(I.8)
yi = β0 + β1 xi + εi
On suppose que :
- xi est observée et non aléatoire ;
- yi est observée et aléatoire ;
- i est une variable aléatoire, non observée.
(I.9)
ε̂i = yi − ŷi
Où 𝐲̂𝐢 est la valeur prédite par le modèle lorsque x = xi :
6
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
(I.10)
ŷi = β̂0 + β̂1 xi
On peut écrire matriciellement le modèle (I.8) de la manière suivante :
(I.11)
Y=Xβ+ ε
Où :
y1 1 x1 ε1
y2 1 x2 β ε2 (I.12)
Y = ( ⋮ ), X=( ), β = ( 0) et ε=(⋮)
⋮ ⋮ β1
yn 1 xn εn
- Y désigne le vecteur à expliquer de taille n × 1,
- X la matrice explicative de taille n × 2,
- le vecteur d’erreurs de taille n × 1.
L’estimation des paramètres β0 et β1 est obtenue par minimisation de la somme des carrés des écarts entre
observations et modèle (moindres carrés). On cherche β0 et β1 qui minimisent la somme des carrés des résidus :
Pour une séquence d’observations {(xi,yi) i = 1…, n}, le critère des moindres carrés s’écrit :
n
(I.13)
min ∑[yi − (β0 + βi xi )]2 = min F(β0 , β1 )
β0 ,β1 β0 ,β1
i=1
Le minimum est atteint pour :
∂F(β0 ,β1 )
∂β0
| =0
β =β̂ ,β =β ̂
(I.14)
{∂F(β ,β ) 0 0 1 1
0 1
∂β1
| =0
̂0 ,β1 =β
β0 =β ̂1
7
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
valeurs intermédiaires renseignent sur le degré de dépendance linéaire entre les deux variables. Plus le
coefficient est proche des valeurs extrêmes -1 et 1, plus la corrélation linéaire entre les variables est forte.
b) Régression linéaire multiple
Un modèle de régression linéaire multiple avec p variables est de la forme suivante :
p
(I.19)
y = β0 + ∑ βj xj + ε
j=1
Où :
y est la variable à expliquer (à valeurs dans R) ;
x1,…,xn sont les variables explicatives (à valeurs dans R) ;
est le terme d’erreur aléatoire du modèle ;
β0, β1,…,p sont les paramètres à estimer.
Remarque :
La désignation “multiple” fait référence au fait qu’il y a plusieurs variables explicatives xj pour expliquer y.
Pour n observations, on peut écrire le modèle de régression linéaire multiple sous la forme :
p
(I.20)
yi = β0 + ∑ βj xij + εi Pour i = 1, . . . , n
j=1
On suppose que :
- i est une variable aléatoire, non observée,
- xij est observé et non aléatoire,
- yi est observé et aléatoire.
On peut écrire matriciellement le modèle (I.20) de la manière suivante :
(I.21)
Y=Xβ+ ε
Où :
y1 1 x11 … x1p β0 ε1
y2 1 x21 … x2p β ε2 (I.22)
Y = ( ⋮ ), X= , β = ( 1) et ε=(⋮)
⋮ ⋮ ⋮ ⋮
yn (1 xn1 … xnp ) βp εn
- Y désigne le vecteur à expliquer de taille n,
- X la matrice explicative de taille n × (p + 1),
- le vecteur d’erreurs de taille n.
A partir de l’échantillon (aléatoire) de n observations {(𝐱𝐢𝟏 , … , 𝐱𝐢𝐩 , 𝐲𝒊 ), 𝐢 = 𝟏, . . . , 𝐧 }, on veut estimer les
̂ qui minimise la somme des erreurs quadratiques :
paramètres β0, β1, …, βp. On cherche 𝛃
2 (I.23)
ε2i = (yi − β0 − β1 xi1 − ⋯ −βp xip )
On doit donc résoudre le problème d’optimisation suivant :
p 2
n
(I.24)
β̂ = arg min
p−1
∑ [yi − (β0 + ∑ βj xij )] = arg min
p−1
F(β)
β∈ℝ β∈ℝ
i=1 j=1
8
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
Avec :
p 2
n
(I.25)
F(β) = ∑ [yi − (β0 + ∑ βj xij )] = (Y − Xβ)T (Y − Xβ) = Y T Y − 2Y T Xβ + βT X T Xβ
i=1 j=1
Expérience x1 x2
1 -1 -1
2 +1 -1
3 -1 +1
4 +1 +1
9
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
I.7.2. Calcul des effets dans le cas d’un plan 23 (facteurs étudiés : x1, x2 et x3)
Pour un plan factoriel 23 dont les facteurs sont x1, x2 et x3, le modèle mathématique sans les interactions
est donné par :
(I.28)
yi = b0 + b1 x1 + b2 x2 + b3 x3 Pour i = 1, . . . , n = 8
À l’aide d’une matrice factorielle (matrice des effets) utilisant l’algorithme de Yates, l’effet de chaque
facteur peut être calculé :
Expérience Constante moyenne x1 x2 x3 y
1 +1 -1 -1 -1 y1
2 +1 +1 -1 -1 y2
3 +1 -1 +1 -1 y3
4 +1 +1 +1 -1 y4
5 +1 -1 -1 +1 y5
6 +1 +1 -1 +1 y6
7 +1 -1 +1 +1 y7
8 +1 +1 +1 +1 y8
Diviseur 8 8 8 8
Effet b0 b1 b2 b3
Le calcul des effets est réalisé par la somme des réponses affecté du signe du niveau du facteur divisé par le
nombre d’expériences :
y1 + y2 + y3 + y4 + y5 + y6 + y7 + y8
b0 = moy =
8
−y1 + y2 − y3 + y4 − y5 + y6 − y7 + y8
Ex 1 = b1 =
8 (I.29)
−y1 − y2 + y3 + y4 − y5 − y6 + y7 + y8
Ex 2 = b2 =
8
−y1 − y2 − y3 − y4 + y5 + y6 + y7 + y8
Ex 3 = b3 =
8
10
Cours : Plan d’expériences Chapitre I : Introduction générale et plans factoriels
I.7.3. Calcul des interactions le cas d’un plan 23 (facteurs étudiés : x1, x2 et x3)
Pour un plan factoriel 23 dont les facteurs sont x1, x2 et x3, le modèle mathématique avec les interactions
est donné par :
(I.30)
yi = b0 + b1 x1 + b2 x2 + b3 x3 + b4 x1 x2 + b5 x1 x3 + b6 x2 x3 + b7 x1 x2 x3 i = 1, . . . ,8
Pour calculer l’effet d’une interaction entre deux variables xi et xj on ajoute à la matrice des effets une
colonne, que l’on baptise xixj, et que l’on obtient en faisant le produit "ligne à ligne" des colonnes des variables
xi et xj.
La matrice des effets et des interactions est représentée comme suite :
Expérience Constante moyenne x1 x2 x3 x1x2 x1x3 x2x3 x1x2x3 y
1 +1 -1 -1 -1 +1 +1 +1 -1 y1
2 +1 +1 -1 -1 -1 -1 +1 +1 y2
3 +1 -1 +1 -1 -1 +1 -1 +1 y3
4 +1 +1 +1 -1 +1 -1 -1 -1 y4
5 +1 -1 -1 +1 +1 -1 -1 +1 y5
6 +1 +1 -1 +1 -1 +1 -1 -1 y6
7 +1 -1 +1 +1 -1 -1 +1 -1 y7
8 +1 +1 +1 +1 +1 +1 +1 +1 y8
Diviseur 8 8 8 8 8 8 8 8
Effet b0 b1 b2 b3 b4 b5 b6 B7
11