Regression Plot
Customer
440
390
Y = 182.807 + 0.476288X
R-Squared = 0.695
340
350
400
450
Supplier
Jan-16
Fethi Derbeli
Terminologie
Correlation: La corrlation est une mesure de la force
dassociation entre deux variables quantitatives (ex: pression et
rendement). Et mesure le degr de linarit entre deux variables
supposes compltement indpendantes lune de lautre.
Le coefficient de corrlation, r, est toujours compris entre -1 et
+1.
Regression Equation: Lquation appropri, pas ncessairement
linaire qui permet de prdire les outputs en connaissant linputs
Coefficient de Determination: r2, represente ladquation du
modle de la regression ou la quantit de variation gnre par
lquation de regression.
Quelle est la diffrence entre la correlation et la regression?
Jan-16
Fethi Derbeli
Corrlation
La formule de correlation :
(x x)(y y)
(x x) (y y)
i
Covariance
rxy
1
n -1
( s
i=1
xi x
x
)( ) =
yi y
sy
rx
y
n -1
i=1
(x i x (yi y
s) sy )
x
Fethi Derbeli
Coefficient de Correlation
Forte
Modre
Output
Input
r = 0.646
Output
Output
Output
Jan-16
r = 0.196
r = - 0.963
Input
Input
r = 0.963
Input
Output
Output
faible
Input
r = - 0.646
Fethi Derbeli
Input
r = - 0.196
Jan-16
Fethi Derbeli
Exemple Corrlation
Filename: Pizza.mtw
Toujours grapher les data en premier lieu
Graph > Plot
Effectuer la corrlation
Stat > Basic Statistics > Correlation
42
41
Pizza Sales
40
39
38
37
36
35
34
P-Value = 0.000
33
32
35
40
45
Income
Jan-16
Fethi Derbeli
Rsum
La corrlation est un outil trs utile dans les
industries de transformation
La corrlation est une mesure de la relation
linaire entre deux variables quantitatives
Attention ne pas toujours assumer la causalit
La corrlation prpare aux techniques de
rgression
Jan-16
Fethi Derbeli
Rgression simple
Tandis que la corrlation nous dit quelle association linaire il y a entre deux
variables, la rgression dfinit plus prcisment cette association.
La rgression rsulte en une quation qui utilise une ou plusieurs variable(s) pour
expliquer la variation dune autre variable.
Exemples de prediction de lquations:
Y = a + bx
Y = a + bx + cx2
Y = a + bx + cx2 + dx3
(Modle linaire)
(quadratique)
(cubique)
Stat>Regression>Regression
peut effectuer une rgression simple ou multiple
peut enregistrer plusieurs calculs
Stat>Regression>Residuals plots
ncessite que les valeurs rsiduelles soient enregistres partir dun
graphique de rgression ou dune courbe ajuste.
vrifie des suppositions implicites
sur les donnes
Fethi Derbeli
Jan-16
Exemples de Modle
Quadratique
Cubique
Y = b0 + b1x + b2x2
Jan-16
Fethi Derbeli
Cofficient de Determination R
La valeur R-carre est simplement le carre du
coefficient de correlation. Cest aussi la fraction de la
variation des variables de sortie (response) et la variable
gnr par lquation.
Quel est la valeur adquate? a dpend. un chemiste peut
exiger un R2 de 0.99. Aussi , le fait davoir 65% de
variation pour dautre produit peut tre une bonne
valeur. a dpend de lindustrie.
Jan-16
Fethi Derbeli
10
Exemple du Pizza
Fn: Pizza.mtw
Step 1: Reprsentation graphique des data
Graph > Plot
Step 2: Effectuer lanalyse de la corrlation
Stat > Basic Statistics > Correlation
Step 3: Gnrer lquation de prdiction
Stat > Regression > Fitted Line Plot
Storage: Residuals, Fits
Options: Display confidence bands, Display prediction
bands
Step 4: Analyse du modle
Est ce quon a besoin dun modle a haut niveau?
Vrifier la graphe du rsidus
Jan-16
Fethi Derbeli
11
Jan-16
Fethi Derbeli
12
Exemple Pizza
Regression Analysis: Pizza Sales versus Income
The Model
DF
1
19
20
SS
MS
79.559 79.5591
34.921 1.8379
114.480
F
43.2871
P
0.000
Fethi Derbeli
13
Exemple Pizza
Regression Plot
Pizza Sales = 18.2807 + 0.476288 Income
S = 1.35571
R-Sq = 69.5 %
R-Sq(adj) = 67.9 %
44
quation de prdiction
avec la ligne de formet. Est
ce que R-Sq and R-Sq(adj)
sont trs diffrentes?
42
Pizza Sales
40
38
36
34
Regression
95% CI
32
95% PI
30
35
40
45
Income
Jan-16
Fethi Derbeli
La moyenne de tout
echantillon de la
population entre la ligne
rouge bande de confiance
95.
14
Courbe? Rsidus?
Jan-16
Fethi Derbeli
15
I Chart of Residuals
Residual
Residual
0
-1
UCL=5.052
Mean=-1.0E-14
-2
-5
-3
-2
-1
10
20
Normal Score
Observation Number
Histogram of Residuals
Residual
Frequency
LCL=-5.052
1
0
-1
-2
-3
-2.5-2.0-1.5-1.0-0.5-0.00.5 1.0 1.5 2.0 2.5
34
Residual
35
36
37
38
39
40
41
Fit
Class Exercise: Using the regression equation and your data, calculate the
residual by hand for the first data point.
Jan-16
Fethi Derbeli
16
A vrifier
I Chart: Ya t-il
une tendance ou
des outliers?
Residual
Residual
Nrmalit des
residus?
I Chart of Residuals
0
-1
UCL=5.052
Mean=-1.0E-14
-2
-5
-3
-2
-1
20
Observation Number
Histogram of Residuals
La prsentation doit
tre alatoire
Residual
Frequency
10
Normal Score
Histogram
Forme du courbe
(cloche)?
LCL=-5.052
Le graphe prsente
comment le rsidus se
comporte le long de
lexperience.
Le graphe reprsente la
position des valeurs
relles par rapport aux
valeurs de lquation
0
-1
-2
-3
-2.5-2.0-1.5-1.0-0.5-0.00.5 1.0 1.5 2.0 2.5
34
35
Residual
36
37
38
39
40
41
Fit
Dispersionn alatoire et
pas de tendance?
Jan-16
Fethi Derbeli
17
u
u
Jan-16
Fethi Derbeli
18
Jan-16
Fethi Derbeli
19
Vars
R-Sq
R-Sq(adj)
C-p
1
1
2
2
3
3
4
71.5
20.3
80.8
75.5
86.8
86.3
95.6
70.4
17.5
79.3
73.7
85.3
84.7
94.9
134.8
422.8
84.4
113.9
52.4
55.4
5.0
3.0752
5.1376
2.5713
2.9003
2.1706
2.2148
1.2833
Jan-16
Fethi Derbeli
S
p
e
e
d
T
i
r
e
c
o
n
d
R
e
a
c
t
i
m
e
S
t
r
t
c
o
n
d
Comparer le
modle 01
variable avec le
modle 04
variables.
X
X
X
X
X X
X X X
X
X X
X X X X
20
Coef
-19.798
0.9954
SE Coef
5.994
0.1189
R-Sq = 71.5%
T
-3.30
8.37
P
0.003
0.000
One Variable
R-Sq(adj) = 70.4%
Jan-16
Coef
4.601
0.69629
-2.7492
4.9066
-1.1398
SE Coef
3.691
0.05702
0.3796
0.5200
0.1622
R-Sq = 95.6%
T
1.25
12.21
-7.24
9.43
-7.03
P
0.224
0.000
0.000
0.000
0.000
Four Variables
R-Sq(adj) = 94.9%
Fethi Derbeli
21
Rsum
Jan-16
Fethi Derbeli
22
Tolrancement raliste
Jan-16
Fethi Derbeli
23
Tolrancement raliste
Une mthode graphique simple pour tablir les
niveaux optimum et les tolrances appropries des
ENTRES.
Ds que l'on a dtermin qu'une sortie continue
dpend linairement d'une entre continue, la
spcification des sorties est utilise pour crer la
spcification des entres.
Les nuages de points et les droites d'ajustement
dmontrent la relation entre les entres et les
sorties, mais pas ncessairement les causes et
effets.
Jan-16
Fethi Derbeli
24
Jan-16
Fethi Derbeli
25
Fethi Derbeli
26
31
Output
30
29
40
34
33
Fethi Derbeli
Output
35
Jan-16
45
50
Input
Entre n1
32
Entre n2
32
31
30
29
28
27
45
50
55
60
Input
27
95 % de l'effet total
des facteurs autres que
cette variable d'entre
Output
31
30
29
40
45
50
Input
Jan-16
Fethi Derbeli
28
32
31
Output
30
29
40
45
50
Input
et Sup. = 48.5
29
Output
31
Y = 18.4182 + 0.256929X
30
R-Sq = 0.933
29
Regression
95% PI
28
40
45
50
Input
Fethi Derbeli
30
Questions?
Jan-16
Fethi Derbeli
31