Vous êtes sur la page 1sur 17

TD

Modèle linéaire gaussien simple


Nombre de visites commandes

1 2 23

2 3 27

3 5 28

4 9 39

5 10 39

6 12 45

7 15 51

1) Représenter graphiquement
2) Déterminer la droite de régression par la méthode de MCO
3) Interpréter
4) Calculer le coefficient de détermination et le coefficient de corrélation
5) Représenter l'analyse de la variance test de Fisher
6) S'assurer avec un test t de Student que a est significativement non nul
7) Déterminer l'intervalle de confiance du paramètre a
8) Prévision de Y pour X=20
9) Déterminer l'intervalle de confiance de la prévision précédente.
60

50

40
y = 2,1214x + 19,029

30

20

10

0
0 2 4 6 8 10 12 14 16
X(i) Y(i) X(i)-8 Y(i)-36 (X(i)-8)² (y(i)-36)² (X(i)-8)(Y(i)-36)

1 2 23 -6 -13 36 169 78

2 3 27 -5 -9 25 81 45

3 5 28 -3 -8 9 64 24

4 9 39 1 3 1 9 3

5 10 39 2 3 4 9 6

6 12 45 4 9 16 81 36

7 15 51 7 15 49 225 105

56 252 0 0 140 638 297

moyenne X 8

Moyenne Y 36

a= 2,12142857

b= 19,0285714
X(i) Y(i) (y(i)-36)² estimation erreur erreur²

1 2 23 169 23,2714286 0,27142857 0,07367347

2 3 27 81 25,3928571 -1,60714286 2,58290816

3 5 28 64 29,6357143 1,63571429 2,67556122

4 9 39 9 38,1214286 -0,87857143 0,77188776

5 10 39 9 40,2428571 1,24285714 1,54469388

6 12 45 81 44,4857143 -0,51428571 0,2644898

7 15 51 225 50,85 -0,15 0,0225

Total 56 252 638 -3,5527E-15 7,93571429


dispersion Totale= 638

dispersion résiduelle= 7,93571429

dispersion expliquée= 630,064286

Coefficient de détermination= 0,98756158

Coefficient de corrélation= 0,99376133


Validité du modèle global
(linéaire vs constante)
Les tests précédents permettent d’avoir une idée de la validité de la
régression dans son ensemble.
On veut connaitre la validité des coefficients du modèle en comparant
avec l’hypothèse 𝐻0 ( coefficient nulle).

Nous pouvons démontrer que


𝑎 1
𝑡= avec σ𝑎 = σε
𝑥𝑖 −𝑋 2
σ𝑎
est une statistique qui suit une loi de Student à (n-2) degrés de liberté.
Les intervalles de confiance à un seuil α sont donnés par

𝑎−𝑡 α σ𝑎 ; 𝑎 + 𝑡 α σ𝑎
1− ;𝑛−2
2 1− ;𝑛−2
2
et

𝑏−𝑡 α σ ;𝑏 + 𝑡 α σ
1− ;𝑛−2 𝑏 1− ;𝑛−2 𝑏
2 2
Erreur de prévision
L’erreur de prévision 𝜀𝑛+1 = (yn+1 − yn+1 ) satisfait les propriétés
suivantes :
𝐸(𝜀𝑛+1 )=0

2
1 (𝑋n+1 −𝑋)²
σ²𝜀𝑛+1 = 𝜎ε (1 + + )
𝑛 (𝑥𝑖 − 𝑋)²

A nouveau on ne connaît pas σε et on l’estime donc par σε


Intervalle de confiance pour la prédiction
Avec les notations et hypothèses précédentes, on a

𝜀𝑛+1
~𝑡𝑛−2
σ𝜀𝑛+1
d’où pour un α donné, on déduit l’intervalle de confiance suivant pour
yn+1 :
yn+1 − 𝑡 α σ𝜀𝑛+1 ; yn+1 + 𝑡 α σ𝜀𝑛+1
1− ;𝑛−2 1− ;𝑛−2
2 2
Budget pub 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20

bénéfice 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60


1) On admet l'existence d'une relation linéaire. Y=ax+b+ε
Calculer les coefficients par la méthode des MCO
2) Calculer le coefficient de corrélation
3) Précisez l'équation d'analyse de la variance.
Calculer ses valeurs et en déduire le coefficient de détermination
4) Déterminer l'estimation de la variance de l'erreur.
5) Calculer une estimation de la variance de a et b.
6) Déterminer au seuil de 5%, un intervalle de confiance pour a, b, et
de la variance de l'erreur
7) Peut-on affirmer que les coefficients a et b sont significativement
différents de 0 pour α=0,05.
8) Déterminer un intervalle de confiance pour le benefice de prévisible
relatif à une entreprise qui consacre un budget de 48 à son programme
publicitaire α=0,05
benefice
120

y = 1,2787x + 31,674
100

80

60

40

20

0
0 10 20 30 40 50 60 70
X 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20 362

Y 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60 938

X-24,13 -9,133 -16,133 11,87 16,87 -8,13 -16,13 -3,13 -3,13 28,87 -14,13 7,87 -7,13 33,87 -18,13 -4,13

Y-62,53 -14,53 -19,533 14,47 26,47 -12,5 -22,53 -6,53 -0,53 37,47 -15,53 8,47 -4,53 39,47 -27,53 -2,53

(X-24,13)² 83,42 260,284 140,8 284,5 66,15 260,3 9,818 9,82 833,3 199,8 61,9 50,9 1147 328,82 17,08 3753,73333

()*() 132,7 315,138 171,7 446,4 101,9 363,5 20,47 1,67 1082 219,5 66,6 32,3 1337 499,27 10,47 4799,93333

moyenne 24,1333333
62,5333333

a= 1,2787092
b= 31,6738181
X 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20 362
Y 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60 938
(Y-62,53)² 211,2 381,551 209,3 700,5 157,1 507,8 42,68 0,28 1404 241,3 71,7 20,6 1558 758,08 6,418 6269,73333
estimation 50,85 41,9035 77,71 84,1 52,13 41,9 58,53 58,5 99,45 44,46 72,6 53,4 105,8 39,346 57,25
erreur 2,854 -1,0965 0,707 -4,9 2,133 1,903 2,527 -3,47 -0,55 -2,539 1,59 -4,59 3,839 4,3461 -2,75
erreur² 8,148 1,20233 0,5 24 4,55 3,623 6,384 12,1 0,308 6,447 2,54 21,1 14,74 18,888 7,573 132,014439

Vous aimerez peut-être aussi