Vous êtes sur la page 1sur 41

Méthodes de régression

B. P a la gos
UMR ITAP
Ce ma gre f
be rna rd.pa la gos @ ce ma gre f.fr

B. Palagos Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments 
LA REGRESSION LINEAIRE

Utilisée pour expliquer, décrire ou prédire une variable quantitative y en


fonction d’une ou plusieurs variables x1 ,….., xp.

Par exemple
y peut-être le prix du pain en fonction de la teneur en eau x

y xi
réponse prédicteur(s)
variable à expliquer variable(s) explicative(s)
sortie entrée(s)
variable dépendante variable(s) indépendante(s)
variable exogène variable(s) endogène (s)

p = 1 régression linéaire simple


p > 1 régression linéaire multiple (MLR)

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  2
MESURE DE LA RELATION ENTRE 2 VARIABLES CONTINUES

PRI EAU
63.00 3635.00
PRIX du pain en fonction de la teneur en EAU 77.00 3190.00
86.00 3530.00
89.00 3350.00
91.00 3070.00

Corrélation : -0.76 92.00 3130.00


140

92.00 3635.00
95.00 3490.00
100 120

95.00 3460.00
106.00 3380.00
PRI

74.00 3500.00
76.00 4030.00
85.00 3365.00
80

57.00 3515.00
95.00 3960.00
60

132.00 2925.00
152.00 2720.00

2500 3000 3500 4000 153.00 2340.00

EAU

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  3
COEFFICIENT DE CORRELATION

 : Coefficient de corrélation (Pearson) entre deux variables aléatoires X


et Y (populations)

2 échantillons x et y de moyennes x et y

 ( x  x )( y
i i  y)
r ( x, y )  i 1
r estimateur de  n n

 (x  x)  ( y
i 1
i
2

i 1
i  y)2

 r est toujours compris entre -1 et + 1.

 si r proche de + 1 ou - 1 , x et y sont bien corrélées; le nuage de points


est presque aligné le long d'une droite (croissante si r > 0, décroissante si
r < 0).

 r = 0 Pas de lien linéaire entre x et y

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  4
COEFFICIENT DE CORRELATION

 Si taille échantillon n est faible il faut être prudent sur la

significativité du coefficient calculé. Il existe des tables

statistiques (et logiciels) qui donnent la limite de

significativité de r .

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  5
ddl = n-2
n=3 r > 0.99
n= 7 r > 0.75

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  6
COEFFICIENT DE CORRELATION

 1  r ( x, y )  1
Y Y Y

X X X
r = -1 r = -.6 r=0
Y Y

X X
r = .6 r=1

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  7
COEFFICIENT DE CORRELATION

Toujours faire un graphique

r = 0.5 r = - 0.9

r = 0.8
r = 0.0

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  8
FAIRE PASSER UNE DROITE

On modélise la relation linéaire entre y et x par


y = a+b x (équation d’une droite)
140
100 120
PRI

80
60

2500 3000 3500 4000

EAU

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  9
MOINDRES CARRES

n 2

On cherche la droite (a et b ) telle que  y  yˆ 


i 1
i i minimum MCO

yˆ  a  bx
yˆ i  a  bxi

yi yi - ŷi
14
0

ŷi points de coordonnées ( xi , yi )


PRI

ŷi
10
0
80
60

xi
2500 3000 3500 4000

EAU

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  10
RESULTAT DES MOINDRES CARRES

140
120
PRI

100
80
60

2500 3000 3500 4000 MCO


EAU

Équation de la droite 140

PRI = 258 – 0.05 EAU


PRI

100
80
60

2500 3000 3500 4000


Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments 
EAU 11
ESTIMATIONS – Cas p=1

y    x yi     xi   i
n n 2

Moindre carrés : a et b tels que   i2    yi  (a  bxi )


minimum i 1 i 1

yˆ  a  bx

n
coefficients de régression
  yi  y ( xi  x )
b i 1
n b (pente) et a (ordonnée à l’origine)
 i
( x
i 1
 x ) 2

a  y  bx

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  12
CAS DE LA REGRESSION SIMPLE p=1

yi
7

ŷi yi  y
yi  yˆ i
6

y
y

yˆ i  y
5

n
SST   ( yi  y ) 2
4

i 1
xi
n
2 3 4 5 6 7 8 SSE   ( yi  yˆ i ) 2
i 1
x
n

SST  SSR  SSE SSR   ( yˆ i  y ) 2


i 1

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  13
COEFFICIENT DE DETERMINATION - R²

 R2 = SSR/SST coefficient de détermination ou pourcentage de


variance expliquée par la régression

 Permet de juger de la qualité Propriétés


de la régression 0  R2  1
 Idéal R² = 1
 Mauvaise régression: R² = 0
n
Quand p=1 R² = r²
 i
( ˆ
y  y ) 2
r : coefficient de corrélation linéaire
R 2  i n1
Pour le pain: r=-0.76 donc R²= (-0.76)²
 ( yi  y ) 2

i 1

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  14
Étalonnage d’un appareil de mesure
variété référence infrarouge
Ami 8.6 9.1
Apollo 11.1 12.4 Taux de protéine de 26 variétés de blé
Arminda 11.6 12.5
Artaban
Avital
10.9
10
10.1
10.6 - analyse chimiques très précises, très longues
Baroudeur
Beauchamp
11.6
10.4
11.5
10.8
(mesure de référence) ( x )
CWRS 11.6 11.3
Camp-Remy
Carolus
12.9
9
11.6
8.2
- Spectrométrie proche infra-rouge (SPIR) plus
Castan 13.1 12.9 rapide mais mesure indirecte à mettre en
Centauro 10.3 10.4
Courtot 13.1 13.3 relation avec méthode de référence (y)
Duck 11.6 11.3
Manital 14 13.7
Recital1 11.5 11.1 - régression y= a+bx+E
Recital2 10.5 9.8
Rossini 9.7 9.1
Scipion 11 11.6 Données / droite de régression
Sidéral
Sleipjner
11.6
12
11.5
13.2
y = 0.157+0.981x R²=0.785
14.2
Soissons1 10.6 10.1
Soissons2 10 10.3 13.2
Tango = 11.5 11.5
12.2
Thésée 10.1 9.2

infrarouge
Win 11.8 11.5 11.2

10.2

9.2

8.2
8.6 9.6 10.6 11.6 12.6 13.6 14.6
référence

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  15
Étalonnage d’un appareil de mesure

Calculs avec logiciel R


Response: infrarouge
Df Sum Sq Mean Sq F value Pr(>F)
Reference 1 38.731 38.731 87.954 1.696e-09 ***
Residuals 24 10.569 0.440
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
 
Coefficients: p-value
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.1566 1.1741 0.133 0.895
reference 0.9808 0.1046 9.378 1.70e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
 
Residual standard error: 0.6636 on 24 degrees of freedom
Multiple R-Squared: 0.7856, Adjusted R-squared: 0.7767
F-statistic: 87.95 on 1 and 24 DF, p-value: 1.696e-09

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  16
TEST DE NULLITE D’ UN COEFFICIENT

Les tests supposent hypothèse normalité des erreurs (vérification a posteriori)

Test H 0 :  j  0 Coefficient pas significatif


n
Variance de l’erreur  ( y  yˆ )
i i
2

ˆ  2  i 1
n2
ˆ j
Variance de j 2 ˆ  2 si  t rejet de H 0
ˆ  j  n
ˆ
j
 ( xi  x )2
i 1
T Loi de Student à n-2 degrés de liberté :
valeur t ayant la probabilité  d'être dépassée en
valeur absolue.
P ( - t  T  t ) = 1 - .
Ou : P ( T  - t ) =  /2 = P ( T  t )

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  17
COMMENT VERIFIER LES HYPOTHESES SUR L’ERREUR

On regarde les résidus après régression ei  yi  yˆ i

Pour vérifier l’homoscedasticté


Pour vérifier la normalité
Normal Q-Q Plot
1.0
residuals(caliblm)

0.5

1.0
Sample Quantiles
0.0

0.0
-0.5
-1.0

-1.0

8 9 10 11 12 13
-2 -1 0 1 2
infrarouge
Theoretical Quantiles

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  18
JUGEMENT REGRESSION - R²

5 régressions

a: régression sans pb

b: modèle pas bon- résidus <0 puis


>0 puis <0modèle quadratique

c: a priori une observation atypique

d: points alignés mais s’écartent


différemment (variance erreurs pas
constante)

e: droite n’existe que par la dernière


observation

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  19
REGRESSION LINEAIRE MULTIPLE (MLR)

Explication de la consommation de « fuel »


On veut modéliser la consommation d ’un agent énergétique en fonction de
facteurs explicatifs :
• La température moyenne sur un mois est une explication de la consommation
• L ’épaisseur de l ’isolation en est un autre

Gallons/Month Avrg. Temp (oF) Insulation (Inches)

275.30 40.00 3.00


363.80 27.00 3.00
164.30 40.00 10.00
40.80 73.00 6.00
94.30 64.00 6.00
230.90 34.00 6.00
366.70 9.00 6.00
300.60 8.00 10.00
237.80 23.00 10.00
121.40 63.00 3.00
31.40 65.00 10.00
203.50 41.00 6.00
441.10 21.00 3.00
323.00 38.00 3.00
52.50 58.00 10.00

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  20
REGRESSION LINEAIRE MULTIPLE (MLR)

Un modèle de régression linéaire

yi    1 xi1   2 xi 2   i

Observation i de la Influence de
consommation Terme constant l ’isolation
mensuelle
Influence de la
température Erreur
aléatoire

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  21
REGRESSION LINEAIRE MULTIPLE (MLR)

n observations yi p variables xj continues n>p


Modèle fuel : n=15 p=2

Pour chaque observation : yi    1 xi1  .....   p xip   i

Coefficients inconnus terme d’erreur non observé

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  22
Décomposition de la variance et tests

Source de Somme des Ddl (df) Carrés moyens (mean square)


variation (source) carrés (sum of
square)
Régression n p n

SSR   ( yˆ i  y ) 2  ( yˆi  y ) 2
SSR i 1
i 1 CMM  
p p

Erreurs n-p-1 n

(résiduals)
n
SSE   ( yi  yˆ i ) 2
SSE
 ( yi  yˆi ) 2
i 1 CME   i 1
n  p 1 n  p 1

Totale n
n-1 n
SST   ( yi  y ) 2
SST i 1
 ( yi  y ) 2
i 1
  S y2
n 1 n 1

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  23
COEFFICIENT DE DETERMINATION - R²

 R2 coefficient de détermination ou pourcentage de variance


expliquée par la régression

 Permet de juger de la qualité Propriétés


de la régression 0  R2  1
 Idéal R² = 1
 Mauvaise régression: R² = 0 • Si p augmente R²
n il existe R² ajusté
 i
( ˆ
y  y ) 2
2 ( n  1) R 2
p
R 2  i n1 > Raj 
n  p 1
 i
( y  y ) 2

i 1 Quand p=1 R² = r²
r : coefficient de corrélation linéaire
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  24
TEST DE L’EXISTENCE DU MODELE

Test H 0 : 1   2  ........   p  0

n
SSR   ( yˆ i  y ) 2 SSR / p
i 1
 F ( p, n  p  1)
SSE / n  p  1
n
SSE   ( yi  yˆ i ) 2
i 1

F Loi de Fisher à (p,n-p-1 )degrés de liberté :


valeur f ayant la probabilité 0.05 d'être dépassée.

SSR / p
Si  f rejet de H 0
SSE / n  p  1

Si H 0 acceptée : y  y  
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  25
EXEMPLE de MLR
rendement maïs dose engrais niveau précipitation
y x1 x2
40 100 10
50 200 20
50 300 10
  reg1=lm(rdt ~ eng + pluie) 70 400 30
65 500 20
Coefficients: 65 600 20
80 700 30
Estimate Std. Error t value Pr(>|t|)
(Intercept) 28.095238 2.491482 11.277 0.000352 ***
eng 0.038095 0.005832 6.532 0.002838 **
pluie 0.833333 0.154303 5.401 0.005690 **
--- p-value
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
 
Residual standard error: 2.315 on 4 degrees of freedom
Multiple R-Squared: 0.9814, Adjusted R-squared: 0.972
F-statistic: 105.3 on 2 and 4 DF, p-value: 0.0003472
 

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  26
REGRESSION MLR cas multicolinéarité

Exemple de traitement
V1 V2 V3 V4 CAL
7 26 6 60 78.5
1 29 15 52 74.3
11 56 8 20 104.3
11 31 8 47 87.6
7 52 6 33 95.6
11 55 9 22 109.2
3 71 X 17 6 y 102.7
1 31 22 44 72.5
2 54 18 22 93.1
21 47 4 26 115.9
1 40 23 34 83.8
11 66 9 12 113.3
10 68 8 12 109.4

quantité de :
V1 : tricalcium aluminate
V2 : tricalcium silicate
V3 : tetracalcium alumino ferrite
V4 : dicalcium silicate
CAL: calories par gramme de ciment
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  27
REGRESSION MLR

V1 V2 V3 V4 CAL

120
min 1 26 4 6 72.5

100
Q1 2 31 8 20 83.8

80
Q2 7 52 9 26 95.6

60
moy 7.5 48.2 11.8 30 95.4

40
Q3 11 56 17 44 109.2

20
max 21 71 23 60 115.9
s 5.9 15.6 6.4 16.7 15.1

0
V1 V2 V3 V4 CAL

V1 V2 V3 V4 CAL
V1 1 0.23 -0.82 -0.24 0.73
Matrice de corrélation
V2 1 -0.13 -0.97 0.82
V3 1 0.03 -0.53
V4 1 -0.82
V5 1

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  28
REGRESSION MLR

Résultats de la régression MLR y  X  

Estimate Std. Error t value Pr(>|t|)


(Intercept) 63.4888 70.0031 0.907 0.3909
V1 1.5494 0.7440 2.082 0.0709
V2 0.4960 0.7231 0.686 0 0.5121
V3 0.1004 0.7540 0.133 0.8974
V4 -0.1572 0.7084 -0.222 0.8299

 
Residual standard error: 2.444 on 8 degrees of freedom
Multiple R-Squared: 0.9824, Adjusted R-squared: 0.9736
F-statistic: 111.7 on 4 and 8 DF, p-value: 4.721e-07
 

Au risque de 5% aucun coefficient n’est significatif


que faire????
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  29
REGRESSION SUR COMPOSANTES PRINCIPALES

On fait une ACP normée sur le tableau X donc sans la variable CAL
ACP sur le tableau X comprenant les variables V1 V2 V3 V4
Valeur propres
[1] 2.235 1.576 0.186 0.001
Proportion of Variance 0.558 0.394 0.0466 0.0004
Cumulative Proportion 0.558926 0.9529425 0.99959406 1.0000000000
 
Loadings (vecteurs propres):
C1 C2 C3 C4
v1 -0.476 0.509 0.676 0.241
v2 -0.564 -0.414 -0.314 0.642
U= v3 0.394 -0.605 0.638 0.268
v4 0.548 0.451 -0.195 0.677

C1= - 0.476 v1 – 0.564 v2 + 0.394 v3 + 0.548 v4 Combinaisons linéaires


C2= 0.509 v1 – 0.414 v2 - 0.605 v3 + 0.451 v4
C3= 0.676 v1 – 0.314 v2 + 0.638 v3 - 0.195 v4
C4= 0.241 v1 + 0.642 v2 + 0.268 v3 + 0.677 v4

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  30
REGRESSION SUR COMPOSANTES PRINCIPALES

ACP sur X
MLR
X y C SCORES
V1 V2 V3 V4 CAL
7 26 6 60 78.5
C1 C2 C3 C4
1 29 15 52 74.3
11 56 8 20 104.3 1 -1.4672378 -1.9030358 -0.53000037 0.038529908
11 31 8 47 87.6
2 -2.1358287 -0.2383536 -0.29018640 -0.029832930
7 52 6 33 95.6
11 55 9 22 109.2 3 1.1298705 -0.1838772 -0.01071259 -0.093700786
3 71 17 6 102.7
4 -0.6598954 -1.5767743 0.17920354 -0.033116396
1 31 22 44 72.5
2 54 18 22 93.1 5 0.3587645 -0.4835379 -0.74012232 0.019187145
21 47 4 26 115.9
6 0.9666396 -0.1699440 0.08570243 -0.012167032
1 40 23 34 83.8
11 66 9 12 113.3 7 0.9307051 2.1348166 -0.17298595 0.008295395
10 68 8 12 109.4 8 -2.2321379 0.6916707 0.45971967 0.022605633
9 -0.3515156 1.4322451 -0.03156437 -0.044987631
10 1.6625430 -1.8280967 0.85119311 0.019836723
11 -1.6401799 1.2951128 0.49417844 0.031388975
12 1.6925940 0.3922488 -0.01980997 0.037185301
13 1.7456786 0.4375254 -0.27461537 0.036775709

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  31
REGRESSION SUR COMPOSANTES PRINCIPALES

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 95.4000 0.6430 148.373 < e-10 ***
C1 9.8791 0.4476 22.072 3.8e-09 ***
C2 0.1327 0.5331 0.249 0.8091
C3 4.6539 1.5492 3.004 0.0149 *
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.318 on 9 degrees of freedom
Multiple R-Squared: 0.9822, Adjusted R-squared: 0.9763
F-statistic: 165.4 on 3 and 9 DF, p-value: 3.45e-08

CAL = 95.4 + 9.88 C1 + 0.13 C2 +4.65 C3


On repasse aux variables initiales:
CAL = 95.4 + 7.78 V1 + 4.16 V2 + -0.85 V3 – 6.38 V4
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  32
REGRESSION PLS

 Méthode plus récente


 Partial Least Square
 Proche de la régression sur composantes principales

RCP : facteurs calculés qu’à partir des variables initiales (et


donc sans référence à la variable à expliquer y).

PLS : La variable à expliquer et les variables explicatives


sont prises en comptes simultanément.

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  33
REGRESSION PLS et PCR

RCP et PLS : On remplace l’espace initial par un espace de faible


dimension engendré par un petit nombre de composantes (ou
facteurs) ou variables latentes qui sont construites l’une après l’autre
de façon itérative. Ces facteurs seront les nouvelles variables
explicatives d’un modèle de régression linéaire.

Les facteurs sont orthogonaux (non corrélés), et sont des


combinaisons linéaires des variables explicatives initiales.

RCP : facteurs calculés qu’à partir des variables initiales (et donc
sans référence à la variable à expliquer y).

PLS : La variable à expliquer et les variables explicatives sont prises


en comptes simultanément.

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  34
REGRESSION PLS

• Notion de covariance :  x i 
 x  yi  y 
0.5 Cov<0 Cov>0
0.4

0.3

0.2

0.1
Cov0
0

-0.1

-0.2

-0.3

-0.4

-0.5

-0.4 -0.2 0 0.2 0.4 0.6

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  35
REGRESSION PLS

• Notion de covariance (bis) :


– Cov(x,y) = (x) (y) r(x,y)

 (x)
||x || 
Dans Rn

cos(x,y) = r(x,y)

||y|| (y) y

xTycov(x,y)

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  36
REGRESSION PLS

• Comment ça marche :
– Cherche les combinaisons linéaires u de X, telles
que :
Cov(Xu,y) maximale

– Une régression est ensuite calculée entre les


variables latentes de X et y

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  37
v633 v649 v666 v683 v700 v716 v733 ytep X : absorbances aux longueurs
1 0.70 0.94 1.48 1.40 0.31 0.06 0.06 87.37 d'onde (nm) 633 649 666
2 1.93 2.47 3.49 3.14 0.90 0.24 0.12 87.16 683 700 716 733, mesurées
3 1.27 1.66 2.45 2.21 0.54 0.13 0.08 87.57
sur des pommes
4 1.07 1.22 1.71 1.51 0.36 0.10 0.10 87.16
5 0.49 0.64 1.00 0.90 0.15 0.01 0.04 85.99
ytep (dernière colonne) : teneur
6 0.59 0.83 1.30 1.15 0.19 0.01 0.04 86.41 en eau des pommes
7 0.43 0.46 0.69 0.65 0.14 0.04 0.07 80.75
8 0.53 0.48 0.67 0.64 0.14 0.03 0.06 78.74
9 1.25 1.30 1.67 1.62 0.65 0.33 0.25 79.26 On cherche à prédire ytep
10 3.18 3.81 4.66 4.18 1.60 0.60 0.30 85.56 en fonction de X
11 1.36 1.51 2.04 1.94 0.66 0.30 0.23 82.35
12 2.20 2.68 3.54 3.25 1.15 0.45 0.27 83.08
13 0.46 0.60 1.09 1.10 0.23 0.04 0.06 81.13
14 1.96 2.39 3.41 3.20 0.95 0.24 0.11 79.97
15 0.56 0.77 1.33 1.31 0.29 0.05 0.06 82.44

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  38
Estimate Std. Error t value Pr(>|t|)
(Intercept) 77.726 5.987 12.982 3.74e-06 ***
v633 -32.425 12.013 -2.699 0.0307 *
v649 78.507 35.796 2.193 0.0644 .
v666 -53.496 45.350 -1.180 0.2767
v683 45.365 38.510 1.178 0.2773
v700 -103.69 55.062 -1.883 0.1017
v716 50.320 127.846 0.394 0.7056
v733 22.613 114.740 0.197 0.8494
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.509 on 7 degrees of freedom


Multiple R-Squared: 0.8906, Adjusted R-squared: 0.7813
F-statistic: 8.143 on 7 and 7 DF, p-value: 0.006459

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  39
Matrice de corrélation des prédicteurs

v633 v649 v666 v683 v700 v716 v733


v633 1.00 0.99 0.98 0.97 0.99 0.93 0.79
v649 0.99 1.00 0.99 0.99 0.98 0.90 0.74
V666 0.98 0.99 1.00 1.00 0.97 0.86 0.68
v683 0.97 0.99 1.00 1.00 0.97 0.86 0.69
v700 0.99 0.98 0.97 0.97 1.00 0.96 0.83
v716 0.93 0.90 0.86 0.86 0.96 1.00 0.96
v733 0.79 0.74 0.68 0.69 0.83 0.96 1.00

Corrélations très élevées !!

Année 2008 -2009


M2 Sciences des Procédés - Sciences des Aliments  40
p-Value
Probabilité d’être supérieur à la statistique calculée
(ou valeur absolue) que l’on compare au risque 
choisi
p Value  ( = 0.01). p Value  ( = 0.01).
Pas de rejet H0 Rejet H0
p Value
Rejet

 = 0.01

0 T35
1.80 2.4377

La valeur 1.80 est dans


Master2la region
Biotech B.P d’acceptation 79
Année 2008 -2009
M2 Sciences des Procédés - Sciences des Aliments  41

Vous aimerez peut-être aussi