Académique Documents
Professionnel Documents
Culture Documents
B. P a la gos
UMR ITAP
Ce ma gre f
be rna rd.pa la gos @ ce ma gre f.fr
Par exemple
y peut-être le prix du pain en fonction de la teneur en eau x
y xi
réponse prédicteur(s)
variable à expliquer variable(s) explicative(s)
sortie entrée(s)
variable dépendante variable(s) indépendante(s)
variable exogène variable(s) endogène (s)
PRI EAU
63.00 3635.00
PRIX du pain en fonction de la teneur en EAU 77.00 3190.00
86.00 3530.00
89.00 3350.00
91.00 3070.00
92.00 3635.00
95.00 3490.00
100 120
95.00 3460.00
106.00 3380.00
PRI
74.00 3500.00
76.00 4030.00
85.00 3365.00
80
57.00 3515.00
95.00 3960.00
60
132.00 2925.00
152.00 2720.00
EAU
2 échantillons x et y de moyennes x et y
( x x )( y
i i y)
r ( x, y ) i 1
r estimateur de n n
(x x) ( y
i 1
i
2
i 1
i y)2
significativité de r .
1 r ( x, y ) 1
Y Y Y
X X X
r = -1 r = -.6 r=0
Y Y
X X
r = .6 r=1
r = 0.5 r = - 0.9
r = 0.8
r = 0.0
80
60
EAU
n 2
yˆ a bx
yˆ i a bxi
yi yi - ŷi
14
0
ŷi
10
0
80
60
xi
2500 3000 3500 4000
EAU
140
120
PRI
100
80
60
100
80
60
y x yi xi i
n n 2
yˆ a bx
n
coefficients de régression
yi y ( xi x )
b i 1
n b (pente) et a (ordonnée à l’origine)
i
( x
i 1
x ) 2
a y bx
yi
7
ŷi yi y
yi yˆ i
6
y
y
yˆ i y
5
n
SST ( yi y ) 2
4
i 1
xi
n
2 3 4 5 6 7 8 SSE ( yi yˆ i ) 2
i 1
x
n
i 1
infrarouge
Win 11.8 11.5 11.2
10.2
9.2
8.2
8.6 9.6 10.6 11.6 12.6 13.6 14.6
référence
ˆ 2 i 1
n2
ˆ j
Variance de j 2 ˆ 2 si t rejet de H 0
ˆ j n
ˆ
j
( xi x )2
i 1
T Loi de Student à n-2 degrés de liberté :
valeur t ayant la probabilité d'être dépassée en
valeur absolue.
P ( - t T t ) = 1 - .
Ou : P ( T - t ) = /2 = P ( T t )
0.5
1.0
Sample Quantiles
0.0
0.0
-0.5
-1.0
-1.0
8 9 10 11 12 13
-2 -1 0 1 2
infrarouge
Theoretical Quantiles
5 régressions
a: régression sans pb
yi 1 xi1 2 xi 2 i
Observation i de la Influence de
consommation Terme constant l ’isolation
mensuelle
Influence de la
température Erreur
aléatoire
SSR ( yˆ i y ) 2 ( yˆi y ) 2
SSR i 1
i 1 CMM
p p
Erreurs n-p-1 n
(résiduals)
n
SSE ( yi yˆ i ) 2
SSE
( yi yˆi ) 2
i 1 CME i 1
n p 1 n p 1
Totale n
n-1 n
SST ( yi y ) 2
SST i 1
( yi y ) 2
i 1
S y2
n 1 n 1
i 1 Quand p=1 R² = r²
r : coefficient de corrélation linéaire
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments 24
TEST DE L’EXISTENCE DU MODELE
Test H 0 : 1 2 ........ p 0
n
SSR ( yˆ i y ) 2 SSR / p
i 1
F ( p, n p 1)
SSE / n p 1
n
SSE ( yi yˆ i ) 2
i 1
SSR / p
Si f rejet de H 0
SSE / n p 1
Si H 0 acceptée : y y
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments 25
EXEMPLE de MLR
rendement maïs dose engrais niveau précipitation
y x1 x2
40 100 10
50 200 20
50 300 10
reg1=lm(rdt ~ eng + pluie) 70 400 30
65 500 20
Coefficients: 65 600 20
80 700 30
Estimate Std. Error t value Pr(>|t|)
(Intercept) 28.095238 2.491482 11.277 0.000352 ***
eng 0.038095 0.005832 6.532 0.002838 **
pluie 0.833333 0.154303 5.401 0.005690 **
--- p-value
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Residual standard error: 2.315 on 4 degrees of freedom
Multiple R-Squared: 0.9814, Adjusted R-squared: 0.972
F-statistic: 105.3 on 2 and 4 DF, p-value: 0.0003472
Exemple de traitement
V1 V2 V3 V4 CAL
7 26 6 60 78.5
1 29 15 52 74.3
11 56 8 20 104.3
11 31 8 47 87.6
7 52 6 33 95.6
11 55 9 22 109.2
3 71 X 17 6 y 102.7
1 31 22 44 72.5
2 54 18 22 93.1
21 47 4 26 115.9
1 40 23 34 83.8
11 66 9 12 113.3
10 68 8 12 109.4
quantité de :
V1 : tricalcium aluminate
V2 : tricalcium silicate
V3 : tetracalcium alumino ferrite
V4 : dicalcium silicate
CAL: calories par gramme de ciment
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments 27
REGRESSION MLR
V1 V2 V3 V4 CAL
120
min 1 26 4 6 72.5
100
Q1 2 31 8 20 83.8
80
Q2 7 52 9 26 95.6
60
moy 7.5 48.2 11.8 30 95.4
40
Q3 11 56 17 44 109.2
20
max 21 71 23 60 115.9
s 5.9 15.6 6.4 16.7 15.1
0
V1 V2 V3 V4 CAL
V1 V2 V3 V4 CAL
V1 1 0.23 -0.82 -0.24 0.73
Matrice de corrélation
V2 1 -0.13 -0.97 0.82
V3 1 0.03 -0.53
V4 1 -0.82
V5 1
Residual standard error: 2.444 on 8 degrees of freedom
Multiple R-Squared: 0.9824, Adjusted R-squared: 0.9736
F-statistic: 111.7 on 4 and 8 DF, p-value: 4.721e-07
On fait une ACP normée sur le tableau X donc sans la variable CAL
ACP sur le tableau X comprenant les variables V1 V2 V3 V4
Valeur propres
[1] 2.235 1.576 0.186 0.001
Proportion of Variance 0.558 0.394 0.0466 0.0004
Cumulative Proportion 0.558926 0.9529425 0.99959406 1.0000000000
Loadings (vecteurs propres):
C1 C2 C3 C4
v1 -0.476 0.509 0.676 0.241
v2 -0.564 -0.414 -0.314 0.642
U= v3 0.394 -0.605 0.638 0.268
v4 0.548 0.451 -0.195 0.677
ACP sur X
MLR
X y C SCORES
V1 V2 V3 V4 CAL
7 26 6 60 78.5
C1 C2 C3 C4
1 29 15 52 74.3
11 56 8 20 104.3 1 -1.4672378 -1.9030358 -0.53000037 0.038529908
11 31 8 47 87.6
2 -2.1358287 -0.2383536 -0.29018640 -0.029832930
7 52 6 33 95.6
11 55 9 22 109.2 3 1.1298705 -0.1838772 -0.01071259 -0.093700786
3 71 17 6 102.7
4 -0.6598954 -1.5767743 0.17920354 -0.033116396
1 31 22 44 72.5
2 54 18 22 93.1 5 0.3587645 -0.4835379 -0.74012232 0.019187145
21 47 4 26 115.9
6 0.9666396 -0.1699440 0.08570243 -0.012167032
1 40 23 34 83.8
11 66 9 12 113.3 7 0.9307051 2.1348166 -0.17298595 0.008295395
10 68 8 12 109.4 8 -2.2321379 0.6916707 0.45971967 0.022605633
9 -0.3515156 1.4322451 -0.03156437 -0.044987631
10 1.6625430 -1.8280967 0.85119311 0.019836723
11 -1.6401799 1.2951128 0.49417844 0.031388975
12 1.6925940 0.3922488 -0.01980997 0.037185301
13 1.7456786 0.4375254 -0.27461537 0.036775709
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 95.4000 0.6430 148.373 < e-10 ***
C1 9.8791 0.4476 22.072 3.8e-09 ***
C2 0.1327 0.5331 0.249 0.8091
C3 4.6539 1.5492 3.004 0.0149 *
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.318 on 9 degrees of freedom
Multiple R-Squared: 0.9822, Adjusted R-squared: 0.9763
F-statistic: 165.4 on 3 and 9 DF, p-value: 3.45e-08
RCP : facteurs calculés qu’à partir des variables initiales (et donc
sans référence à la variable à expliquer y).
• Notion de covariance : x i
x yi y
0.5 Cov<0 Cov>0
0.4
0.3
0.2
0.1
Cov0
0
-0.1
-0.2
-0.3
-0.4
-0.5
(x)
||x ||
Dans Rn
cos(x,y) = r(x,y)
||y|| (y) y
xTycov(x,y)
• Comment ça marche :
– Cherche les combinaisons linéaires u de X, telles
que :
Cov(Xu,y) maximale
= 0.01
0 T35
1.80 2.4377