Vous êtes sur la page 1sur 10

www.elmerouani.jimdo.

com 03/05/2012
®E

Régression multiple
lM

Exemple et exercice
ero

1
ua
ni
FP

Exemple:
Te

• Supposons que les services de police


souhaitent établir un modèle de régression
tou
linéaire reliant la variable endogène « taux de
criminalité juvénile » mesuré par un indicateur
Y, à la densité de la population urbaine
an
mesurée par un indicateur X1 et au taux de
scolarité X2. On a relevé 5 observations:

1
www.elmerouani.jimdo.com 03/05/2012

Y X1 X2
1 2 4
®E

1 3 2
lM

2 5 2
3 7 1
ero
3 8 1

3
ua
ni
FP

Question:
Te

• La spécification de l’équation de régression


retenue est Y=a1X1+a2X2+b+ε; donnez une
tou
estimation des paramètres de cette équation.
an

2
www.elmerouani.jimdo.com 03/05/2012

Réponse:
• Nous avons donc à déterminer les paramètres
de l’équation estimée Yˆ = aˆ1 X 1 + aˆ 2 X 2 + bˆ . Pour
®E

simplifier les calculs matriciels, nous opérons


un changement de variables y=Y-2, x1=X1-5;
lM

x2=X2-2.
• On obtient
ero

5
ua
ni
FP

y x1 x2
-1 -3 2
Te

-1 -2 0
0 0 0
tou

1 2 -1
1 3 -1
an

aˆ = ( x′x ) x′y
On sait que −1

3
www.elmerouani.jimdo.com 03/05/2012

−3 2 
 
− 2 0 
−3 − 2 0 2 3    26 − 11
x′x =   ⋅ 0 0  =  
 2 0 0 − 1 − 1    − 11 6 
 2 − 1
 3 − 1
 
®E

 6 11 
1  6 11   35 35   0,17 0,31 
(x x ) = 
′ −1
= = 
35 11 26   11 26   0,31 0,74 
lM

 
 35 35 
 −1
 
 −1
ero
 −3 − 2 0 2 3    10 
x′y =   0 =  
 2 0 0 −1 −1   − 4
1
1
  7
ua
ni
FP

 0,17 0,31  10   0,46 


â =    =  

Te
 0,31 0,74   
4 0,14 
tou

bˆ = Y − aˆ1 X 1 − aˆ 2 X 2 = 2 − (0,46 ⋅ 5) − (0,14 ⋅ 2) = −0,58

D’où l’expression finale de l’équation de


an

régression multiple estimée:

Yˆ = 0 , 46 X 1 + 0 ,14 X 2 − 0 , 58

4
www.elmerouani.jimdo.com 03/05/2012

• Ceci signifie qu’il existe une relation positive


assez forte entre le taux de criminalité juvénile
et la densité urbaine, l’augmentation de
l’indicateur de la densité urbaine d’une unité
®E

entraine l’augmentation de la criminalité


juvénile de 46%, (alors que l’augmentation du
lM
taux de scolarisation d’une unité de mesure
entraine la baisse de la criminalité juvénile de
…!)
ero

9
ua
ni
FP

Exercice:
Te

• On veut exprimer l’évolution de l’indice du


revenu nominale moyen (Y) d’un ménage de
tou
salariés en fonction de l’indice général des
prix (X1) et de l’indice du produit intérieur brut
réel (X2). On se limite à 9 observations par
an
simplifications:

10

5
www.elmerouani.jimdo.com 03/05/2012

i yi X1i X2i
1 100 100 100
2 106 104 99
®E
3 107 106 110
4 120 111 126
5 111 111 113
lM

6 116 115 103


7 123 120 102
8 133 124 103
ero

9 137 126 98

11
ua
ni
FP

Questions:
Te

1. Après avoir calculé la matrice (X’X)-1, calculez


X’Y et en déduire le vecteur â des estimations
tou
des paramètres du modèle:
Y=a1X1+a2X2+a3+ε
2. Calculez Yˆ = Xaˆ et le résidu εˆ = Y − Yˆ
an

3. Calculez une estimation de la variance des


résidus (σˆ ε2 )

12

6
www.elmerouani.jimdo.com 03/05/2012

Questions: (suite)
4. Calculez l’estimation σ̂ â , effectuez le test de
Student pour a1. construire un intervalle de
®E

confiance à 0,95% pour a1.


5. Même question que précédemment pour a2.
lM
ero

13
ua
ni
FP

Réponses:
Te

1. Pour simplifier les calculs on peut centrer les


données. Le modèle s’écrira alors:
y − Y = a1 (x1 − X 1 ) + a2 (x2 − X 2 ) + ε − ε
tou

on pose: (x − X ) = X ;
1 1 1

(x − X 2 ) = X 2;
an
2

y −Y = Y
Le tableau des valeurs centrées est le suivant:

14

7
www.elmerouani.jimdo.com 03/05/2012

i yi X1i X2i
1 -17 -13 -6
2 -11 -9 -7
®E
3 -10 -7 4
4 3 -2 20
5 -6 -2 7
lM

6 -1 2 -3
7 6 7 -4
8 16 11 -3
ero

9 20 13 -8

15
ua
ni
FP

• L’équation estimée du modèle est


Yˆ = aˆ1 X 1 + aˆ 2 X 2 + aˆ3 + εˆ
Te

 aˆ 
aˆ =  1  = ( X ′X ) ( X ′Y )
−1
tou
 aˆ 2 
−1
 ∑ X 12t ∑X X   ∑ X 1tYt 
=  1t 2t



∑ X Y 

 ∑ X 1t X 2t ∑X 2
2t   2 t t 
an
−1
 650 − 112   872 
=    
 − 112 648   − 72 
1  648 112  872   1,3629 
=   = 
408656  112 650  − 72   0,1245 
16

8
www.elmerouani.jimdo.com 03/05/2012

• La détermination du coefficient â3 fait appel à


la relation:
Y = aˆ1 X 1 + aˆ 2 X 2 + aˆ3
• D’où
®E

aˆ3 = Y − aˆ1 X 1 − aˆ 2 X 2
2. Yˆ = Xaˆ = 1,3629 X 1 + 0,1245 X 2 − 50,206
lM

εˆ = Y − Yˆ = Y − Xaˆ = Y − 1,3629 X 1 − 0,1245 X 2 + 50,206


3.
1 [(Y − Xaˆ)' (Y − Xaˆ)] = (Y′Y − aˆ′X ′Y )
ero
σˆ 2 =
n−k
∑(εˆi2 ) =
n−k 9 −3

17
ua
ni
FP

 872 
aˆ ′X ′Y = (1,3629 0,1245)  = 1179,5
 − 72 

Y ′Y = ∑ yi2 = 1248
Te

D’où l’on obtient:


68,5
σˆ ε2 = = 11,4
tou
6
4. Les calculs permettent d’obtenir σˆ aˆ = 0,1344, on sait
1

que (aˆ1 − a1 ) Suit une loi de Student à 6 degrés de


an

σˆ aˆ1
liberté. Pour vérifier est ce que a1=0, l’indicateur est
alors égale à 1,3629/0,1344=10,14. L’intervalle
d’acceptation est fourni par la table de Student au seuil
de signification de 0,05; I=[-2,447; +2,447].
18

9
www.elmerouani.jimdo.com 03/05/2012

Donc a1 ≠ 0, c’est-à-dire la variable X1 intervient


dans la détermination de Y.
5. Les calculs permettent d’obtenir σˆ aˆ = 0,1347, on
sait que (aˆ 2 − a2 ) Suit une loi de Student à
2

σˆ aˆ
®E

6 degrés de liberté. Pour vérifier est ce que a2=0,


lM
l’indicateur est alors égale à
0,1245/0,1347=0,924. L’intervalle d’acceptation
est fourni par la table de Student au seuil de
signification de 0,05; I=[-2,447; +2,447].
ero

19
ua
ni
FP

• Donc a2=0 au seuil de signification de


0,05. d’où la variable X2 (l’indice de PIB
Te
réel) n’intervient pas dans la détermination
de Y (le salaire nominal des ménages).
tou

• Il faut donc éliminer la variable X2 du


modèle, et procéder à une nouvelle
an
estimation de a1, à moins que les données
soient erronées, ou qu’il y ait d’autres
variables explicatives omises.

20

10

Vous aimerez peut-être aussi