Vous êtes sur la page 1sur 11

Chapitre 2 Expériences comparatives avec un facteur

• Problématique
• 1 facteur à 2 modalités ( niveaux )
- Test d’hypothèse
- Test t de Student
- Intervalle de confiance
• 1 facteur à 3 modalités et plus
- Modèle d’analyse de variance
- Décomposition variabilité : ANOVA
- Test F de Fisher
- Analyse des résidus
- Comparaisons a posteriori
- Nombre de répétitions

Chapitre 2 1
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

Exemples de problématique
Exemple 2.1- procédé de gravure chimique (« wet etching »)
enlèvement du silicium sur des « wafers » avant métallisation
variable de réponse Y : taux d’enlèvement du procédé
comparaison efficacité de 2 solutions (facteur)
données : taux d’enlèvement sur 10 « wafers » chaque solution
solution 1 : 9.9 10.6 9.4 10.3 9.3 10.0 9.6 10.3 10.2 10.1
solution 2 : 10.2 10.0 10.6 10.2 10.7 10.7 10.4 10.4 10.5 10.3
différence significative ?

Exemple 2.2 - effet du flux du C2F6 sur l’uniformité gravure « wafer »


variable de réponse Y : uniformité ( % ) tranches (« wafer ») de silicium

1 facteur à 3 modalités: taux du C2F6 - modalités (niveaux) : 125 -160-200


flux Y uniformité
125 2.7 4.6 2.6 3.0 3.2 3.8
160 4.9 4.6 5.0 4.2 3.6 4.2
200 4.6 3.4 2.9 3.5 4.1 5.1
différences significatives ? si oui, lesquelles ?

Chapitre 2 2
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
Méthodes d’analyse
Ex 2.1 Test t de Student
cadre pour des expériences de comparaison simple :
1 facteur variant à 2 modalités
utilisé dans tous les plans expérimentaux avec :
plusieurs facteurs variant à 2 modalités

Ex 2.2 ANOVA ANALYSIS OF VARIANCE


analyse de la variance
- 1 facteur avec k ( 3 et plus ) modalités
- aussi avec plusieurs (2 et plus) facteurs
- test t ne s’applique pas directement
- méthode d’analyse : ANOVA
- décomposition de la variabilité selon les sources
- méthode d’analyse fondamentale employée
dans toutes les expériences industrielles / scientifiques

Chapitre 2 3
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à 2 niveaux : test t Student (1 / 6 )


niveau 1 facteur A niveau 2
0.14

Y ~ N (µ1, σ2 ) Hypothèse nulle H : µ1 = µ2


0.14

0.12
0.12
0 Y ~ N(µ2, σ2 )
0.10
Hyp. alternative H1 : µ1 ≠ µ2 0.10

0.08
0.08
GAUSS

GAUSS

0.06

σ σ
0.06

0.04 0.04

0.02 0.02

0.00
µ1 Y 0.00
µ2 Y
-0.02 -0.02
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26 -2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
U U

y11 y12 … y1 n1 échantillon y21 y22 … y2 n2

facteur A affecte t-il la variable de réponse Y ?


y1 = ∑ y1i / n1 moyennes y2 = ∑ y2i / n2

S 12 = ∑( y1i – y1 )2/( n1 - 1 ) variances S22 = ∑( y2i – y2 )2/( n2 - 1 )

σ2 = [ (n1 – 1) s12 + (n2 – 1) s22 ] / (n1 + n2 - 2) estimation erreur expérimentale σ

décision basée sur écart y1 - y2

Chapitre 2 4
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à 2 niveaux : test t Student (2 / 6 )

test de comparaison effet du facteur A

différence des moyennes


t =
écart type (différences des moyennes )

Statistique t de Student
y1 – y2
t =
σ [ 1/n1 + 1/n2 ] 0.5
loi Student avec df = n1 + n2 - 2 degrés de liberté

t « près de zéro » supporte


H0 : pas de différence c-à-d facteur n’affecte pas Y

t « très différente de zéro » supporte


H1 : le facteur A affecte la moyenne de Y
t est un rapport signal / bruit
t distance entre les moyennes en unités d’écart types

Chapitre 2 5
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à 2 niveaux : test t Student (3 / 6 )

 procédure objective distribution Student


pour décider si t
est « grand » df >= 30
df =30
 En 1908, W. S. Gosset Student df =2
( pseudonyme Student ) ≈
df = 1
obtient la distribution t normale

appelé « Student »

 Tables

 logiciel statistique
« p-value »

Chapitre 2 6
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à 2 niveaux : test t Student (4 / 6 )
B o ît e à m o u s t a c h e s : t a u x e t c h
1 0 .8

Ex 2.1 : analyse 1 0 .6

1 0 .4

Sol 1 2 1 0 .2

taux etch
y 9.97 10.40
1 0 .0

9 .8

S 0.42 0.23 9 .6

9 .4

M e d ia n
9 .2
25% -75%
1 2
M in - M a x
t y p e s o lu t io n

Tests t ; Classmt : type solution (Ex-2.1-gravure.sta) Groupe1: 1 Groupe2: 2

Valeur N N Ecart- Ecart-


Moyenne Moyenne dl p Ratio F p
t Actifs Actifs Type Type

taux -
9.97000 10.4000 18 0.01115 10 10 0.421769 0.230940 3.3354 0.0873
etch 2.8278

p -value = risque rejeter faussement l’hypothèse H0

Chapitre 2 7
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à 2 niveaux : test t Student (5 / 6 )

vérification de la normalité des données


Droite de Henry Catégorisée : taux etch
2.0

1.5

1.0
Valeur Normale Théorique

0.5

0.0

-0.5

-1.0

-1.5

-2.0
9. 2 9.4 9.6 9.8 10.0 10.2 10.4 10.6 10.8 9.2 9.4 9. 6 9.8 10.0 10.2 10.4 10.6 10.8

type solution: 1 ty pe solution: 2

Chapitre 2 8
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à 2 niveaux : test t Student (6 / 6 )

Méthode intervalles de confiance

Forme générale : intervalle de confiance pour θ

L≤ θ≤ U avec P(L≤ θ≤ U ) = 1-α

Intervalle de confiance à 100(1- α )%


différence entre 2 moyennes

µ1 - µ2 : ( y1 - y2 ) ± σ * tdf , 1 – α/2 * ( 1/n1 + 1/n2 ) 0.5

df = n1 + n2 - 2
percentile distribution Student

Ex 2.1 : Intervalle différence de moyenne µ1 - µ2


( - 0.758 à - 0.1015) coefficient confiance de 95%

Chapitre 2 9
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (1/13 )

Exemple 2.3 : optimisation « larger the better »

• recherche nouvelle composition de fibres synthétique tissus


 facteur X : % coton varie entre 15 et 35
 réponse Y : force de tension tissu à maximiser
 5 modalités de X fixées à: 15 20 25 30 35
 exécution : complètement aléatoire / n = 5 répétitions

Données y ij tension
Boîtes à Moustaches Catég. : Y
26

24

X i/j 1 2 3 4 5 moyenne 22

15 1 7 7 15 11 9 9.8 20

18
20 2 12 17 12 18 18 15.4
16
Y

25 3 14 18 18 19 19 17.6 14

30 4 19 25 22 19 23 21.6
12

10

35 5 7 10 11 15 11 10.8 8

Median
6
25%-75%
15 20 25 30 35
Min-Max
X

Chapitre 2 10
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (2/13 )

ANOVA : analyse de la variabilité


Tableau des données
niveau i observations yi j moyennes
1 y11 y12 y13 … y1 n y1.
facteur 2 y21 y22 y23 …. Y2 n y2
contrôlé ……………………………………………
X i yi1 y12 yi3 …. yi n yi.
…………………………………………….
a ya1 ya2 ya3 …. ya n ya.

 a niveaux du facteur - a traitements à comparer


 n répétitions dans un ordre complètement aléatoire
 nombre total d’essais (observations) : a n
 objectif : comparer les traitements (effet de X sur Y)
hypothèse nulle = pas de différences
X n’influence pas Y

Chapitre 2 11
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (3/13 )

Modèle de classification simple


Y ij = µ + τi + εij i = 1, 2,…,a j = 1, 2,..,n
a : nombre de modalité du facteur
j : nombre de répétitions
µ : effet général
τi : effet différentiel i-ième traitement
εij : erreur expérimentale ~ N ( 0 , σ2 )

autres modélisations
si le facteur X quantitatif : modèle polynomial

exemple Y = β0 + β1X + β2X2 + ε

Chapitre 2 12
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (4/13 )

Décomposition de la variabilité
a n
SST variabilité totale SST = ∑∑ ( yij − y.. ) 2
i =1 j =1
équation de décomposition
a n a n

∑∑ ij .. ∑∑ i. .. ij i.
( y − y
i=1 j =1
) = [( y − y ) + ( y − y 2
)]2

i=1 j =1
a a n
= n∑( yi. − y.. ) +∑∑( yij − yi. )2
2

i=1 i=1 j =1

SST = SSTreatments + SSE

inter variabilité intra variabilité


Chapitre 2 13
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (5/13 )

Tableau d’analyse de la variance

Source Somme carrés Deg. lib. Carré moyen F

Traitements SS trait = n ∑ ( y i. – y.. )2 a–1 MS trait F0 = MS trait/MSE

Résiduelle SS E = SS T - SS trait a(n-1) MS E

Totale SS T = ∑ ∑ (y ij – y .. ) 2 an – 1

distribution de référence pour F0 : distribution F de Fisher


avec df1 = a – 1 degrés de liberté au numérateur
et df2 = a(n-1) degrés de liberté au dénominateur
Test de H0 : µ1 = µ2 = …. = µa
F0 > Fα ,a −1,a ( n −1)
Rejeter l’hypothèse nulle au seuil α si

Chapitre 2 14
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (6/13 )

Distribution F de Fisher

• si X1 suit une loi Khi-deux avec df1 ddl


X2 suit une loi Khi-deux avec df2 ddl
X1 et X2 sont indépendantes alors

( X1 / df1 ) / ( X2 / df2 ) suit une loi F( df1,df2 )

• t 2df = F ( 1, df ) : carré Student

= Fisher F( df1 = 1, df2 = df )

distribution F est employée dans

toutes les analyses de plans d’expériences

Chapitre 2 15
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (7/13 )


Ex. 2.3 : analyse avec STATISTICA

Degr. De
SC MC F p
liberté
différences
ord. origine 5655.040 1 5655.040 701.6179 0.000000
X 475.760 4 118.940 14.7568 0.000009 significatives

Erreur 161.200 20 8.060


lesquelles ?

X {1} {2} {3} {4} {5}

1 15 0.0386 0.0027 0.00015 0.9798


Test de
2 20 0.0385 0.7373 0.0190 0.1164
Tukey:
compare
3 25 0.0027 0.7373 0.2102 0.0092 toutes
les paires
4 30 0.00015 0.0190 0.2102 0.0002

5 35 0.9798 0.1164 0.0092 0.0002

Chapitre 2 16
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (8/13 )

analyse des résidus

 important de faire une vérification a posteriori


quand on ajuste un modèle statistique
 hypothèses de base
- distribution normale ? les plus
- variance constante ? importantes
- indépendance observations ?
- modèle OK ?
 Si hypothèses de base violées
- quoi faire ?
- réponse : transformer Y
transformation de Box-Cox Y λ
- 2 <λ <2

Chapitre 2 17
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (9/13)

Analyse des résidus

Residual Plots for Y


Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
5.0
90
2.5
Residual
Percent

50 0.0

10 -2.5

1 -5.0
-5.0 -2.5 0.0 2.5 5.0 10.0 12.5 15.0 17.5 20.0
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


6.0 5.0

4.5 2.5
Frequency

Residual

3.0 0.0

1.5 -2.5

0.0 -5.0
-4 -2 0 2 4 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order

Chapitre 2 18
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (10/13 )
Tracé des Moyennes & Intervall e de Confia nce (95.00% )

Modèle de régression 30
Y

si facteur quantitatif
25

20

Valeurs
15

10

Y= 6 2 . 6 1 -9 . 0 1 1 x + 0 . 4 8 1 x ** 2 - 0 . 0 0 7 6 x ** 3 0
15 20 25 30 35
Y
X

25 S 3.04839
R-Sq 69.4%
R-Sq(adj) 65.0%

20
Y

15

10

5
15 20 25 30 35
X

Chapitre 2 19
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (11/13)


nombre de répétitions : n = ?

n dépend de
alpha (α ) : taux de fausse détection
risque de rejeter une hypothèse vraie
beta (β ) : taux de manque de détection
risque d’accepter une hypothèse fausse
σ : erreur expérimentale
∆ = λ σ : écart de moyenne à détecter
λ = ∆/σ : facteur de proportionnalité
k : nombre de modalités (groupes) à comparer

n : nombre de répétitions de chaque sous groupe (modalité)


n = fonction (α , β, σ, λ, k )

Cas des expériences avec plusieurs facteurs :


n entre 2 et 5 est généralement suffisant
consulter l’annexe
Chapitre 2 20
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada
1 facteur à k niveaux : ANOVA (12/13 )
nombre de répétitions : n = ?
k=2 n
alpha 0.10 0.05 0.01
beta 0.10 0.05 0.10 0.05 0.10 0.05
λ 0.5 70 88 86 * * *
1.0 18 23 23 27 32 38
1.6 8 10 10 12 14 16
2.0 6 7 7 8 10 11
3.0 3 4 4 5 6 6
* : > 100

k=3 n
alpha 0.10 0.05 0.01
beta 0.10 0.05 0.10 0.05 0.10 0.05
λ 0.5 85 * * * * *
1.0 22 27 27 32 37 43
1.6 10 12 11 14 16 18
2.0 7 8 8 9 11 12
3.0 4 4 5 5 6 7
* : > 100

Chapitre 2 21
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

1 facteur à k niveaux : ANOVA (13/13 )


nombre de répétitions : n = ?
k=4 n
alpha 0.10 0.05 0.01
beta 0.10 0.05 0.10 0.05 0.10 0.05
λ 0.5 70 88 86 * * *
1.0 25 30 30 36 40 47
1.6 11 13 13 15 17 20
2.0 7 9 9 10 12 13
3.0 4 5 5 5 6 7
* : > 100
k=5 n
alpha 0.10 0.05 0.01
beta 0.10 0.05 0.10 0.05 0.10 0.05
λ 0.5 85 * * * * *
1.0 27 33 32 39 43 50
1.6 11 14 14 16 18 21
2.0 8 9 9 11 12 14
3.0 4 5 5 6 7 7
* : > 100

k = 6 , 7, 8 , 9 consulter le site
http://www.cours.polymtl.ca/mth6301

Chapitre 2 22
Copyright © Génistat Conseils Inc., 2004, Montréal, Canada

Vous aimerez peut-être aussi