com 28/07/2012
Régression Simple
lM
Exercices
ero
1
ua
ni
FP
départements.
1
www.elmerouani.jimdo.com 28/07/2012
3 5 28
4 9 39
lM
5 10 39
6 12 45
7 15 51
ero
3
ua
ni
FP
Questions:
Te
1. Représenter graphiquement le nuage des points et
donner le modèle de régression y=ax+b par la méthode
des moindres carrées. Interpréter le résultat.
tou
2. Calculer les différents dispersion selon la loi des écarts.
3. Déterminer le coefficient de détermination et le
coefficient de corrélation.
4. Représenter l’analyse de la variance et le test F
5. S’assurer à l’aide d’un test T de Student que a est
an
2
www.elmerouani.jimdo.com 28/07/2012
Solution 1:
Relation entre les commandes et le
1.- nombre de visites de représentants
®E
60
Commandes (1000 DH)
50
lM
40
30
20
10
ero
0
0 5 10 15 20
Nombres de visites
5
ua
ni
FP
1 2 23 46 4 -6 36 -13 78
Te
2 3 27 81 9 -5 25 -9 45
3 5 28 140 25 -3 9 -8 24
4 9 39 351 81 1 1 3 3
tou
5 10 39 390 100 2 4 3 6
6 12 45 540 144 4 16 9 36
7 15 51 765 225 7 49 15 105
Total: 56 252 2313 588 0 140 0 297
an
Moy. 8 36 330,4 84 0 20 0 42,4
3
www.elmerouani.jimdo.com 28/07/2012
b = Y − aX = 36 − ( 2,12)(8) = 19
lM
Compte tenu de la valeur du paramètre b, égal à 19,
l’équation de la droite qui représente le mieux les
relations entre le nombre de visites X et le montant des
commandes Y est:
ero
Y = 2 ,12 X + 19
7
ua
ni
FP
4
www.elmerouani.jimdo.com 28/07/2012
“Y dépend de X”.
• L’erreur attachée à l’hypothèse nulle est mesurée
par la dispersion totale des Yi, c’est-à-dire par la
lM
( )
ero
= ∑ Yi − Y
2
Dispersion totale
9
ua
ni
FP
10
5
www.elmerouani.jimdo.com 28/07/2012
le modèle:
lM
dispersion résiduelle = Σ(Ŷi-Yi)2
e2=7,9.
11
ua
ni
FP
(Yi-Y)2=(Ŷi-Y)2+(Ŷi-Yi)2
On en tire la décomposition suivante:
∑(Yi-Y)2=∑(Ŷi-Y)2+∑(Ŷi-Yi)2
tou
6
www.elmerouani.jimdo.com 28/07/2012
∑ (Yˆ )
2
−Y
ero
dispersion exp liquée
R2 = =
i
∑ (Y )
2
dispersion totale i −Y
13
ua
ni
FP
14
7
www.elmerouani.jimdo.com 28/07/2012
∑ (Yˆ )
2
−Y
R=
i
∑ (Y )
®E
2
i −Y
σ XY σ
ero
R= et R = a X
σ Xσ Y σ Y
15
ua
ni
FP
• Donc -1 ≤ R ≤ 1.
an
16
8
www.elmerouani.jimdo.com 28/07/2012
17
ua
ni
FP
4.-
4.- Test F:
• La valeur du coefficient de correlation est calculée à
Te
partir des données disponibles, les résultats de sept
départements dans notre exercice.
tou
18
9
www.elmerouani.jimdo.com 28/07/2012
19
ua
ni
FP
∑ (Yˆ )
2
i −Y
tou
∑( ) 2
Yˆi − Yi Dipersion résiduelle moyenne
n − k −1
an
• Dans notre exemple, F=395. Cette valeur doit
être comparée à celle qui est lue dans une table
de Fisher-Snédécor pour k=1 degré de liberté au
numérateur et n-k-1=7-1-1=5 au dénominateur à
un seuil de confiance α.
20
10
www.elmerouani.jimdo.com 28/07/2012
21
ua
ni
FP
F0,01=16,26
22
11
www.elmerouani.jimdo.com 28/07/2012
23
ua
ni
FP
∑X i
2
− nX 2
tou
Où S XY est l’écart-type des erreurs du modèle avec:
∑ (Y )
2
− Yˆi
S XY =
i
an
n−2
A partir des chiffres de notre exemple, il apparaît
que: 7,94
S = XY = 1,59 = 1,26
5
et Sa=1,26/11,83=0,106
24
12
www.elmerouani.jimdo.com 28/07/2012
a − 0 a
t = =
Sa Sa
lM
13
www.elmerouani.jimdo.com 28/07/2012
27
ua
ni
FP
Te
28
14
www.elmerouani.jimdo.com 28/07/2012
29
ua
ni
FP
- n est faible;
- Xi est éloigné de la moyenne.
tou
Pour X0=20 et α=0,01,
2
Y=61,4±4(1,26) 1 + 12
7 140
Soit Y=61,4±5,9.
La régression linéaire simple nous a permis de présenter les
an
aspects principaux des techniques de régression qui peuvent
être utilisées dans l’élaboration de modèles de prévision.
30
15
www.elmerouani.jimdo.com 28/07/2012
Exercice 2:
• On s’intéresse dans un secteur de production
à la relation entre les bénéfices réalisés par les
®E
été réalisées:
Budget 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20
de
ero
publicité
Bénéfices 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60
31
ua
ni
FP
Questions:
Te
variances de â et de b̂ .
32
16
www.elmerouani.jimdo.com 28/07/2012
Questions: (suite)
f) Déterminez au seuil de signification de 0,05 , un
intervalle de confiance pour a, un intervalle de
®E
Solution 2:
Te
aˆ =
∑ (X )− nX
i i
2 2
i
bˆ = Y − aˆX
34
17
www.elmerouani.jimdo.com 28/07/2012
Xi Yi Xi 2 Yi2 XiYi
15 48 225 2304 720
8 43 64 1849 344
36 77 1296 5929 2772
41 89 1681 7921 3649
16 50 256 2500 800
®E
8 40 64 1600 320
21 56 441 3136 1176
21 62 441 3844 1302
lM
53 100 2809 10000 5300
10 47 100 2209 470
32 71 1024 5041 2272
17 58 289 3364 986
ero
58 102 3364 10404 5916
6 35 36 1225 210
20 60 400 3600 1200
362 938 12490 64926 27437
35
ua
ni
FP
n = 15
362
X= = 24,13 ⇒ X 2 = 582,26
Te
15
938
tou
Y = = 62,53
15
27437 − 15 × 24,13 × 62,53
aˆ = = 1,28
12490 − 15 × 582,26
an
Yˆ = 1,28 X + 31,67
36
18
www.elmerouani.jimdo.com 28/07/2012
c)
R=
∑ ( X Y ) − nXY
i i
nσ X σ Y
Te
σX =
1
∑ (X i − X )2 = 3753,73 = 15,82
n 15
tou
σY =
1
∑ (Yi − Y )2 = 6269,73 = 20,44
n 15
an
R = 0,989
38
19
www.elmerouani.jimdo.com 28/07/2012
d) Dispersion totale:
∑ (Y − Y )
2
i = 6269,73
Dispersion expliquée:
∑ (Yˆ − Y )
®E
2
i = 6150,13
lM
Dispersion résiduelle:
∑ (Y − Yˆ )
2
i i = 132,01
ero
6269,73=6150,13+132,01
39
ua
ni
FP
6269,73
• Ce coefficient est proche de 1, on peut en
tou
40
20
www.elmerouani.jimdo.com 28/07/2012
e) On a σˆ ε2 = 10,155
Alors,
σˆ ε2
S = Var (aˆ ) =
®E
2
= 0,0027
∑ (X −X)
aˆ 2
i
et
lM
() 2 1
Var b = σˆ ε +
ˆ X2
= 2,2526
∑ (X i − X )
2
n
ero
41
ua
ni
FP
∑ εˆ2
σˆ ε2
La variable σ 2 = (n − 2) σ 2 suit une loi χ
Te
i 2
ε ε
à (n-2) degrés de liberté.
tou
σ ε2
L’intervalle de confiance pour σˆ ε2 est alors:
an
σˆ ε2 σˆ ε2
I = ( n − 2) ; ( n − 2) = [5,336 ; 26,35]
B A
42
21
www.elmerouani.jimdo.com 28/07/2012
[
• L’intervalle pour a: aˆ − t1−α σˆ aˆ ; aˆ + t1−α σˆ aˆ ]
avec t lue sur la table de Student à n-2=13
degré de liberté. (t=2,16).
I = [1,166 ; 1,391]
®E
[bˆ − t σˆ bˆ ; bˆ + t1−α σˆ bˆ ]
lM
• Intervalle pour b: 1−α
I = [28,432 ; 34,916]
ero
43
ua
ni
FP
ˆ
g) Le t empirique de Student est donné par a ,
σˆ
on compare la valeur de ce rapport avec aˆ
t=2,16.
Te
44
22
www.elmerouani.jimdo.com 28/07/2012
h)
1 ( x0 − x ) 2 1 ( x0 − x ) 2
I (Y0 ) = (ax0 + b) − t1−α S 1 + + ; ( ax0 + b) + t1−α S 1 + +
n ∑ x 2 n ∑ x 2
®E
45
ua
ni
FP
Références:
Te
• Exercice 1:
Jean-Pierre Vedrine, « Techniques
tou
46
23