Académique Documents
Professionnel Documents
Culture Documents
Cours
Plans d’expériences
1
AU : 2023-2024
La grandeur physique y mesurée par l’expérimentateur est appelée réponse, cette réponse
varie en fonction des grandeurs physiques Ui modifiables par l’expérimentateur, appelées
facteurs.
La fonction mathématique f reliant les facteurs à la réponse est un polynôme du premier ou
second degré dans le cas des plans d’expériences.
La valeur donnée à un facteur pour réaliser un essai est appelée niveau.
Les variations des facteurs sont bornées par une valeur maximale et une valeur minimale
appelées respectivement niveau haut et niveau bas, le code (-1) est affecté au niveau bas, et le
code (+1) est affecté au niveau haut.
L’ensemble de toutes les valeurs que peut prendre le facteur entre le niveau bas et le niveau
haut, s’appelle le domaine de variation du facteur, ou plus simplement, le domaine du
facteur.
2
AU : 2023-2024
La réunion des domaines de chaque facteur définit le « domaine d’étude ». Ce domaine
d’étude est la partie de l’espace expérimental retenu par l’expérimentateur pour faire ses
essais.
Une étude, c’est-à-dire un ensemble d’expériences bien définies, est représentée par une série
de points disposés dans le domaine d’étude.
À chaque point du domaine d’étude correspond une réponse. À l’ensemble de tous les points
du domaine d’étude correspond un ensemble de réponses qui se localisent sur une surface
appelée la Surface de réponse.
3
AU : 2023-2024
Les valeurs des coefficients sont estimées par la méthode des moindres carrés.
Le modèle ajusté est évalué à l’aide de quatre outils statistiques suivant :
La comparaison de la variance attribuable à la régression à la variance
résiduelle, au moyen du test de Fisher, pour ce faire, on calcule ainsi :
4
AU : 2023-2024
F régression=
∑ ( Y^ i−Y ) /ϑ x
2
∑ (Y i−Y )2 /ϑ R
Avec
Ȳ : la valeur moyenne des réponses mesurées.
υ𝑥 : Nombre de degrés de liberté associé à la somme des carrés des écarts à la
moyenne de la régression
υ𝑅 Nombre de degrés de liberté associé à la somme des carrés des résidus
La valeur de ce rapport doit être supérieure à la valeur critique de Fisher à un niveau
de confiance supérieur à 95% (F0.05 (νx,νR)) pour la régression soit significative.
Le coefficient de détermination de la régression multilinéaire R2 qui est défini
par le rapport de dispersion totale des résultats suivant :
2
R=
∑ ( Y^ i−Y )
2
∑ (Y i−Y )2
Plus la valeur de R² est proche de l’unité, meilleur est l’ajustement.
Le coefficient de détermination ajusté (RA²)
R
2
=1−
∑ ( Y i−Y^ i ) /ϑR
2
=1-
∑ 2
e i /ν R
A
∑ (Y i −Y^ )2 /ϑ T ∑ (Y i −Y^ )2 /ϑ T
Avec:
υ𝑇 Le nombre de degré de liberté associé à la somme des carrés des écarts à la moyenne des réponses
mesurées. Plus la valeur de R2A est proche de l’unité, meilleur est l’ajustement.
L’analyse graphique des résidus ri permet la vérification de la distribution autour de zéro au
moyen du diagramme de Daniel
L’exploitation du modèle ajusté n’est possible qu’après sa validation c’est-à-dire vérifier que,
dans tout le domaine d’étude, sa qualité prévisionnelle est bonne. Dans la pratique, deux
méthodes de validation sont utilisées :
5
AU : 2023-2024
Analyse de manque d’ajustement
Avec mi moyenne des réponses d’une expérience répliquée plusieurs fois, en général au
centre du domaine.
Avec la variance due au manque d’ajustement (SSΔ) et le nombre de degré de liberté (νΔ),
qui lui est associé sont donné par l’expression suivante :
Le modèle est validé si la variance due au manque d’ajustement, est non significative, c’est-à-
dire si la valeur du rapport F défini par :
6
AU : 2023-2024
Avec
7
AU : 2023-2024
I.4. Variables codées
Etant impossible de comparer les variables ayant des unités différentes, il est nécessaire donc
d’effectuer un codage pour surmonte ce problème. Notons alors « xi » les valeurs des
variables codées qui sont définies de la manière suivante :
𝑢max i+𝑢min i i
Avec : 𝑢 = 2
𝑢max i – 𝑢min i
Et 𝑢′ = 2
Ainsi, les facteurs obtenus sont sans dimensions par conséquent directement comparables
entre eux.
Avec :
Y : vecteur des réponses.
X : matrice des effets.
a : vecteur des coefficients.
e : vecteur des résidus.
Ce système ne peut pas, en général, être résolu simplement car le nombre d’équations est
inférieur au nombre d’inconnues. En effet, il y a n équations et (p + n) inconnues. Cette
résolution ne peut être menée à bien que si l’on utilise une méthode de régression qui introduit
p équations supplémentaires. La plupart du temps cette méthode est basée sur le critère
d’optimisation des moindres carrés.
On obtient ainsi les estimations les plus probables des coefficients que l’on note : â
Le résultat de ce calcul est :
â = (tX X)-1 t X Y
8
AU : 2023-2024
Critères de D-Optimilaté
Afin d’expliciter le principe du critère de D-optimalité, il est nécessaire de revenir sur les
bases de la régression multilinéaires.
Notion de base sur les régressions multilinéaires obtient une réponse
Si l’expérimentateur réalise un essai en un point expérimental, il obtient une réponse
yi qu’il
peut modéliser, selon le modèle du second degré avec interaction :
y représente la réponse analysée. Celle-ci est mesurée avec une certaine erreur.il s’agit donc
d’une variable aléatoire. xi
sont les facteurs fixés dans le plan d’expérience, ils n’introduisent
9
AU : 2023-2024
pas d’erreur. e est le résidu c’est-à-dire l’écart entre la valeur renvoyé par le modèle
mathématique et la valeur mesurée expérimentalement. Ce résidu est également une variable
aléatoire, centrée de variance r 2.
Après réalisation d’un plan d’expérience comportant n points expérimentaux, on a un système
de n équations à p coefficients ai (i=0….20).
y=X.a+e
Avec y : vecteur des réponses ;
X : matrice des effets ;
ei i mi
La variance d’erreur r2 est proportionnelle à la somme des carrées des écarts, qui s’écrit
sous forme matricielle et e . Or, cette variance d’erreur est la somme de la variance d’erreur
2 2 2 m
due à l’incertitude sur les σ r =Δ + σ m
paramètres 2 et de la variance d’erreur de mesure, 2 .
10
AU : 2023-2024
La relation représente p équations, c’est-à-dire une par coefficient. On se retrouve alors avec
le système de n+p équations à n+p inconnues, qui peut être résolu :
â= XtX Xy
1
t
y X X X
1
t
ê= Xty
Ces relations permettent d’estimer le jeu de coefficients du modèle ainsi que les résidus, ceci
à partir des facteurs et des réponses mesurées. L’accent circonflexe montre qu’il s’agit de
valeurs obtenues par la méthode de recherche du minimum de variance d’erreur.
Les jeux de coefficients ainsi obtenus est utilisé pour écrire le modèle mathématique. Ce
modèle permet de calculer les réponses dans le domaine d’étude.
De même, une estimation de la variance de l’erreur de mesure, ( m2)est, peut être réalisée à
Pour les paramètres, il est défini une région de confiance de niveau α telle que :
11
AU : 2023-2024
V (â) m2 X t X 1
Dans cette relation, la matrice V(â) est la matrice des variances –covariance des coefficients.
Les variances sont disposées sur la diagonale principale de V(â) et les covariances sont
éléments non diagonaux.
Pour déterminer les variances sur les coefficients du modèle, on est amené à calculer,
l’inverse de la matrice d’information (matrice de dispersion) et donc à utiliser le déterminant
de XtX comme diviseur. Ainsi,, une maximisation du déterminant de la matrice d’information
conduira à une réduction des variances d’erreur sur les coefficients du modèle.
Les deux principales utilisations possibles de la méthode des plans d’expériences (MPE)
sont :
La technique de screening : parmi les facteurs recensés par l’expérimentateur cet
outil permet de déterminer ceux qui ont une influence statistiquement non négligeable
12
AU : 2023-2024
sur les variations de la réponse. on procède ainsi implicitement à une simplification
du problème. On cherche pourquoi la réponse varie.
p équations supplémentaires. La plupart du temps cette méthode est basée sur le critère
d’optimisation des moindres carrés.
On obtient ainsi les estimations les plus probables des coefficients que l’on note :
â
Le résultat de ce calcul est :
â = (tX X)-1 t X Y
Formule dans laquelle la matrice tX est la matrice transposée de X.
Deux matrices interviennent constamment dans la théorie des plans d’expériences :
- la matrice d’information t X X ;
- la matrice de dispersion (tX X)-1
Les plans factoriels fractionnaires sont des plans à deux niveaux, ils permettent d’étudier tous
les facteurs, ainsi qu’il réduisent le nombre d’essais par rapport aux plans factoriels.
Un plan comportant k facteurs à deux niveaux est noté 2k-q
le k en exposant signifie qu’il y a k facteurs étudiés.
le 2 indique le nombre de niveaux par facteur.
Le plan complet a été divisé par 2q.
13
AU : 2023-2024
Il y a donc 2q essais à éliminer et 2k essais à retenir pour l’étude, le choix de rejet ou de
rétention de essais n’est possible qu’en connaissant convenablement la théorie des
aliases.
X= [Xs Xβ]
Xβ : sous matrice de dimension (n,p-n).
14
AU : 2023-2024
Ces plans utilisent comme modèle mathématiques des polynômes de premier degré sans
interaction. Y=𝑎0 + ∑ 𝑎i 𝑥i
Ils permettent également l’étude de grand nombre de facteur avec un minimum d’essais.
Y= 𝑎0 + ∑ 𝑎i 𝑥i
Pour un polynôme de degré d et de nombre de facteurs k, le nombre des coefficients est donné
par la formule :
(𝑘+𝑑)!
N= 𝑑!𝑘!
Qui est égal au nombre de points expérimentaux.
AU : 2023-2024
Pour mieux connaître le domaine expérimental, l’expérimentateur peut ajouter des points
d’expériences supplémentaires et retrouve une disposition identique à celle de départ.
AU : 2023-2024
Figure I. 4. Plan de Doehlert
AU : 2023-2024
Dans un espace à trois dimensions, la répartition des points expérimentaux est représentée par
une sphère de rayon unité puisque six nouveaux points s’ajoutent aux points de l’hexagone et
chaque point forme avec ses voisins les plus proches un tétraèdre régulier.
FigureI. 5. Disposition des points expérimentaux d’un plan de Doehlert pour trois
facteurs
Pour un plan de Doehlert à trois facteurs, le premier et le deuxième facteur prennent cinq
niveaux, le troisième prend trois niveaux, la matrice correspondante est représentée par le
tableau suivant :
Cette matrice correspond à vingt et un points régulièrement répartis sur l’hyper sphère à
quatre dimensions de rayon unité.
Les plans de Doehlert permettent d’obtenir des modèles de second degré avec un minimum
d’essais.
Le modèle mathématique utilisé dans ce cas pour l’interprétation des résultats et pour la
construction des surfaces de réponse est un polynôme de second degré avec interaction.