Vous êtes sur la page 1sur 6

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

Rappel :

Les paramètres b 1 et b 0 , qui définissent “la meilleur droite” (au sens
Les paramètres b 1 et b 0 , qui définissent “la meilleur droite” (au sens des moindres
carrées) qui passe par les données {x i , y i }, sont donnés par :
b 1 = cov(X, Y )
X
ou aussi
n
x i y i − nx¯y¯
i=1
b 1 =
(2)
n
x
i 2 − nx¯ 2
i=1
On définit ainsi yˆ i = b 1 x i + b 0 qui est la valeur expliqué de y i .
Rappel :
n
1
(x i − x¯)(y i − y¯),
i=1
n
cov(X, Y ) = 1
(x i − x¯)(y i − y¯),
n
i=1
(3)
n
1
2
X
i=1
n
2
σ¯
= 1
(x i − x¯) 2 .
X
n
i=1

2

et

b 0 = y¯ b 1 x¯

(1)

cov(X, Y ) =

n 1

=

n 1

(x i x¯) 2 ,

Rappel :

Les résidus sont obtenues par la formule :

r i = y i yˆ i = y i b 1 x i b 0

(4)

Rappel :

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

Le coefficient de détermination est donnée par : SCE r 2 = (5) SCT =
Le coefficient de détermination est donnée par :
SCE
r 2 =
(5)
SCT = 1 − SCR
SCT
avec
n
2
– SCR : somme des carrés des résidus. SCR =
.
r i
i=1
n
2
– SCT : somme des carrés totale. SCT =
(y i − y¯) 2 = s¯ Y (n − 1).
i=1
n
– SCE : somme des carrés expliquée. SCE =
(y i − yˆ) 2 .
i=1
Ici nous avons un problème car nous en connaissons pas le signe de r. Pour cela on
peut utiliser si besoin la relation :
s¯ X
s¯ Y

r = b 1

.

(6)

Exercice 1

a.

 

On obtient en utilisant les formules ci-dessus :

 

x¯ = 3.5;

y¯ = 9;

s¯ X = 1.871;

s¯ Y = 4.69;

σ¯ X = 1.708;

σ¯ Y = 4.28.

(7)

 

b 1 = 2.34;

b 0 = 0.8.

(8)

b.

 

On obtient en utilisant les formules ci-dessus :

 

r 1 = 0.14;

r 2 = 1.51;

r 3 = 2.83;

r 4 = 0.83;

r 5 = 1.49;

r 6 = 0.86

(9)

c.

 

On obtient en utilisant les formules ci-dessus :

 
 

SCR = 14;

SCT = 110;

r 2 = 0.873.

 

(10)

Exercice 2

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

a.

 

On obtient en utilisant les formules ci-dessus :

 

x¯ = 3.8;

y¯ = 23.2;

s¯ X = 2.775;

s¯ Y = 5.357;

σ¯ X = 2.482;

σ¯ Y = 4.792.

(11)

 

b 1 = 1.877;

b 0 = 30.33.

(12)

b.

 

On obtient en utilisant les formules ci-dessus :

 

r 1 = 1.578;

r 2 = 0.299;

r 3 = 0.948;

r 4 = 1.545;

r 5 = 0.682.

(13)

 

SCR = 6.33.

(14)

c.

Rappel de cours :

 

L’écart-type estimé du terme d’erreur s est donné par :

 
 

s =

SCR

n

2 .

(15)

Ici : s 6.33/3 2.11 1.453.

 
 

d.

Rappel de cours :

 
 

La statistique de test à utiliser est :

 
 

t =

r r 2 n 2,

r − r 2 √ n − 2 ,

(16)

 

1

associé à la v.a. T de loi de Student à n 2 ddl.

 

Rappel de cours :

 
 

On peut aussi l’écrire : t = b 1 /s b 1 avec :

 

s

(17)

 

s b 1 =

n

i=1

(x i x¯) 2

On a ici t = 7.17 avec un loi de Student à 3 ddl (car r = 0.97). Remarque : (x i x¯) 2 = 30.8 ; s b 1 = 0.262 ; t = 7.17.

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

Test bilatéral donc on cherche t α/2 tel que :

P(|T| > t α/2 ) = α 1 P(|T| < t α/2 ) = α P(|T| < t α/2 ) = 1 α

(18)

On trouve à l’aide de la table : t α/2 = 3.1824. En conclusion, t se trouve dans la zone de rejet donc on rejette H 0 .

e.

Les i doivent être indépendantes et identiquement distribuées, de loi normal centrée en 0 et d’écart type σ.

Exercice 3

a.

Si on utilise le confort comme variable indépendante, il suffit d’inverser les rôles de x et y puis d’utiliser les mêmes résultats. Notons Y i les v.a. associé aux conforts. Nous avons :

 

x¯ = 165.4;

y¯ = 3.7;

s¯ X = 37.0;

s¯ Y = 1.06;

σ¯ X = 35.1;

σ¯ Y = 1.005.

(19)

 

b 1 = 0.026;

b 0 = 0.53.

(20)

b.

 

Nous avons :

r = 0.893;

t = 5.62 T suit une loi de Student à 8 ddl.

(21)

Hypothèse nulle : “Le confort est proportionnelle au prix”. Test bilatéral donc on cherche t α/2 tel que :

 
 

P(|T| > t α/2 ) = α 1 P(|T| < t α/2 ) = α P(|T| < t α/2 ) = 1 α

(22)

On trouve à l’aide de la table : t α/2 = 2.3060. En conclusion, t se trouve dans la zone de rejet donc on rejette H 0 . Il y a pas de relation entre le prix et le confort. On accepte H 0 et donc que β 1 = 0. D’après le modèle y i = β 0 + i .

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

Exercice 4

a.

 

x¯ = 5.5;

y¯ = 10.37;

s¯ X = 3.03;

s¯ Y = 6.29;

σ¯ X = 2.87;

σ¯ Y = 5.96.

(23)

b 1 = 2.02;

b 0 = 0.73.

(24)

b.

 

On obtient en utilisant les formules :

r 1 = 1.21; r 6 = 1.22;

r 2 = 2.41; r 7 = 0.20;

r 3 = 0.73; r 8 = 1.39;

r 4 = 0.74; r 9 = 1.53;

r 5 = 2.24; r 10 = 0.85.

(25)

Les résidus restent aux voisinages de 0 et la répartition a l’air aléatoire. A priori on peut essayer de faire une régression linéaire entre les variables X et Y . En effet les r i sont très proches d’être égaux aux ε i qui eux suivent une loi N (0, σ 2 ) d’après le modèle de base. Le modèle n’est pas remis en cause.

Remarque : On a

SCR = 0 (obtenue avec les valeurs approché donc attention aux conclusions hatives !); r = 0.97; t = 11.63; t α/2 = 2.3060 (seuil à 5%)

(26)

On rejette l’hypothèse nulle : “β 1 = 0”. Il y a donc une relation significative entre X et Y (y i = β 1 x i + β 0 + i ).

Exercice 5

a.

x¯ = 5.5;

y¯ = 38.11;

s¯ X = 3.03;

s¯ Y = 34.07;

σ¯ X = 2.87;

σ¯ Y = 32.32.

(27)

 

b 1 = 10.98;

b 0 = 22.3.

(28)

Correction de la feuille de travaux dirigé n 8

Alain Olivetti

b.

On obtient en utilisant les formules :

r 1 = 12.62; r 6 = 7.60;

r 2 = 2.83; r 7 = 5.58;

r 3 = 2.35; r 8 = 1.57;

r 4 = 6.63; r 9 = 3.45;

r 5 = 6.62; r 10 = 11.46.

(29)

Les résidus semblent se répartir dans une bande autour de 0 mais la répartition n’a pas l’air aléatoire. On ne peut pas utiliser le modèle décrit en cours pour réaliser une régression linéaire entre X et Y .