Vous êtes sur la page 1sur 53

CHAPITRE II :

MODELE LINEAIRE DE
REGRESSION MULTIPLE
(M.R.M)
Les M.R.M. sont du type :

.
Y t a1X 1t a2 X 2t ... ap X pt U t
Yt: Variable endogne, alatoire cause de lintroduction de Ut

X1t Xpt Sont les observations chaque priode t des variables


exognes

a1X1t apXpt Est la partie dterministe ou systmatique ou


explicative du modle.

Ut est la partie alatoire du modle.


HYPOTHESES DANS LE
M.R.M :
Hypothse 1 :
Le modle est correctement spcifi

Autrement dit, Il faut que les variables


explicatives retenues soient les
meilleures sans omission dautres
variables, la vraie relation soit une relation
linaire dans ou par rapport aux
paramtres estimer et enfin la variable
alatoire intervienne de manire additive.
Hypothse 2 :
Les Yt et les Xit sont des grandeurs
numriques observes sans erreur.
E(Ut) = 0 quelque soient Xit.
Pour i = 1p
Hypothse 3 :
Hypothse dhomoscdasticit
Ut est distribue selon une loi
indpendante de t et des Xit , pour
t=1,n et i = 1,....p
V (U t ) E (U ) t
2
u
2

est une quantit finie


Hypothse 4 :
Indpendance des erreurs

Cov (Ut ,U t ) 0
'
Hypothse 5 :
La loi de distribution de lala est
une loi gaussienne de moyenne
nulle et lcart-type fini.
Hypothse 6 :
Hypothse sur les variables exognes:
Absence de colinarit des
variables X1tXpt et E (vecteur
unit).
Hypothse 7 :

On nintroduit pas de restriction sur les estimateurs.


Ils peuvent tre positifs, ngatifs ou nuls.
DETERMINATION ET
PROPRIETES DES
ESTIMATEURS :
Dtermination du vecteur des estimateurs
1) calcul de par les M.C.O :
La mthode consiste chercher les
paramtres a tels que :
i

n
soit minimum.

(u
i 1
) t
2


Revenons hypothse 4, concernant U

X U X U ... X U ... X
1
' '
2
'
j
'
p 1 U E U 0
'
U X est le transpos de X


X '.(Y X a ) 0

(X '.Y ) (X ' X . a ) 0

X '.Y X '.X a

1 1
(X ' X ) X 'Y (X ' X ) (X ' X ) a

1
a (X ' X ) .X 'Y
Proprits de

a (X ' X ) 1 X '(Xa U )

a (X ' X ) 1 (X ' Xa X 'U )

a (X ' X ) 1 (X ' X ).a (X ' X ).X 'U

a a (X ' X ) 1 X 'U

E (a ) E a (X ' X ) 1 X 'U

E (a ) E (a ) (X ' X ) 1 X ' E (U ) ; E(U) tant egal 0

E (a ) a donc a est un estimateur sans biais de a.

V (a ) (X ' X )
u
2 1

On montre quune condition ncessaire et


suffisante pour que soit un estimateur
convergent de a est que les vecteurs
variables exognes ne tendent pas tre
colinaires quand n tend vers linfini.

Autrement dit H6 reste valable quand n tend


vers linfini
est BLUE si et seulement si:
(Best Linear Unbiaised Estimator)
Meilleur estimateur linaire sans biais

E( a )=a n Lorsque n tend vers linfini

tend vers 0 quand n tend vers linfini


V (a )
Dtermination de S2 estimateur de u2

2
u t
2

On sait que: S 2

Avec u t
u 'u
n p

s 2 est un estimateur sans biais de u2


p est le nombre de paramtres estimer
n est le nombre dobservations
LE COEFFICIENT DE CORRELATION MULTIPLE

n n
t
(
Y Y ) t
(
Y 2
X t a ) 2

R2 t=1
n
t=1

t
(
Y
t=1
Y ) 2
Tests dhypothses dans le
M.R.M

1/ Le test de Fisher (F)


suit une loi khi-deux (n-p)
Si a= 0 ^y^y suit
la loi khi-deux p -Ces deux khi-
deux sont indpendants en probabilit.

Or, on sait que le rapport de 2 khi-deux est un


test de FISHER.
Donc,
la variable F qui suit une loi de Fisher est:


Y 'Y
p Y 'Y n-p
F=
= tend vers un Fp;n-p ddl
u 'u p u 'u
np
-Solution du Test :
On compare le F thorique cd le F lu sur la table de distribution de
Fisher et le F calcul partir de nos observations:

2 cas peuvent se prsenter :


* F calcul > F thorique ; on rejette Ho. Cela veut dire que les variables
retenues sont explicatives.
* F calcul < F thorique ; non rejet de Ho .

Exemple : Soit un modle 5 variables exognes ( y compris la


constante) et suppose quil a t estim sur 25 observations. Supposons

enfin que le rsultat obtenu est : Y 'Y 20

3.0
5 u 'u

La valeur lue sur la table du F de Fisher pour 5 et 20 d.d.l


Et 2,71 au seuil de 5% et 4,10 au seuil de 1%
Nous allons rejeter au seuil de 5% ( car 3>2,71) mais on ne
pourra pas la rejeter au seuil de 1% ( car 3<4,10)..
2/Test Student
suit une loi de STUDENT (n-p) ddI

Solution du test :



P -t . ak < a k <+t . ak =0.95

2 cas possibles :


* appartient lintervalle -t . a , +t . ak

k

alors on ne refuse pas H0

* nappartient pas cet intervalle alors on refuse H0


EXEMPLE Mt = e + aIt + bCt +Ut

pour n = M t 15.8 3.07I t 1.92Ct


22, on a (10.53) (0.81) (1.25)
15.8
T suit une loi de Student 19 ddI,
10.53 le t lu sur la table 5% est 2,093.
Tc = 1,5< TT donc non rejet de H0 .
!!!!!(nest pas important)
3.07
T 2 donc le coefficient est diffrent de 0
linvestissement explique le niveau des
0.81 importations.

1.92
T 2 donc selon lchantillon, la consommation nexplique
1.25 pas le niveau des importations.
3) Test de DURBIN & WATSON :
Problme de lautocorrlation des rsidus
Il y a autocorrlation des rsidus quand le modle est mal spcifi

Dans le cas de lomission dune variable


significative ou linclusion dune variable non
significative, les rsidus ne sont plus distribus
de faon alatoire autour du Y mais refltent le
comportement des variables omis ou inclus.
Pour sassurer du risque dautocorrlation des erreurs,
on procde au test de Durbin & Watson.

d
(u t u t 1 ) 2

2
u t

on peut dduire

d 22
(u u t t 1 )

u t
2
Tableau de dcisions

0 d1 d2 4- d2 4- d1 4

AUTOCORRELATION AUTOCORRELATION
DOUTE INDEPENCE DOUTE
POSITIIVE NEGATIVE

.
Durbin & Watson ont dtermin 2 valeurs d1 et
d2 fonction de n et de p.
Donc on calcule ^d partir de sa formule et
donner rsultats de lestimation ; ensuite, nous
serons face plusieurs ventualits :
*^d < d1 on rejette H0
* d1 <^d <d2 doute
b
^d>d2 non rejet H0 , absence
dautocorrlation des rsidus.
Exemple :
Log Mt = 0,469 Log Ct + 0,034 Log FBCFt +
0,471 Log Xt 0,993

^DW = 1,414

n = 15 et p = 3 d1=0,82 et d2=1,75
0 0,82 1,75 4- 1,75=2,25 4- 0,82=3,18 4
1,414
AUTOCORRELATION AUTOCORRELATION
DOUTE Indpendance DOUTE
POSITIIVE NEGATIVE

donc 0,82 < ^DW < 1,75 il y a doute


APPLICATION

MODELES MULTIPLES
Ex1
Soit le modle suivant concernant le cas
dune banque. On veut tudier limpact
trois variables (dpenses publicitaires X1,
les crdits X2 et les dpts X3) sur le
rsultat net de cette banque (Y). (Y, X1, X2
et X3 sont en million de dh)
Le tableau ci-dessous regroupe les variables
tudier:
Anne Y X1 X2 X3
1989 12 2 45 121
1990 14 1 43 132
1991 10 3 43 154
1992 16 6 47 145
1993 14 7 42 129
1994 19 8 41 156
1995 21 8 32 132
1996 19 5 33 147
1997 21 5 41 128
1998 16 8 38 163
1999 19 4 32 161
2000 21 9 31 172
2001 25 12 35 174
2002 21 7 29 180
Yt= ao +a1X1t+a2X2t+a3X3t+Ut
Mettre le modle sous sa forme matricielle.
Estimer les paramtres du modle
Calculer le R2

Les donnes de base sous forme matricielle sont:


1 2 45 121

12 1 1 43 132 U 1

14
1 3 43 154 U 2
10 U 3

1 6 47 145
16 U 4

1 7 42 129
14

19 1 8 a

41 156 0
a
21 et 1 8 32 132
Y X et U
A 1 et

1 5 a
19 33 147
2
21
1 5 41 128 a
3
16
1 8 38 163
19

1 4 32 161
21
1 9 31 172

25
21 1 12 35 174
U 14
1 7 29 180

On sait que = (XX)-1XY
1 2 45 121

1 1 43 132

1 3 43 154

1

1

1

1 1 1 1 1 1 1 1 1 1 1 1 1 1

2 1 3 7 1
X'X x
45 3 43 29 1

121 132 154 180 1


1

1

1

1

1 7 29 180
Donc XX est gal

14 85 532 2094

85 631 3126 13132
532 3126 20666 78683

2094 13132 78683 317950

(XX)-1 est :

20.16864 0.015065 0.23145 0.07617



0.015065 0.013204 0.001194 0.00094
0.23145 0.001194 0.003635 0.000575

0.07617 0.00094 0.000575 0.000401

XY est gale
12

14

10

16

14
1 1 1 1 1 1 1 1 1 1 1 1 1 1 19 248

2 1 3 7 21 1622
*
45 43 43
29 19 9202

121 132 154 180 21 37592

16

19
21

25

21

est don est gal

32,89132


1 0 ,8019
( X ' X ) X 'Y
0,38136

0,03713
0= 32,89,1= 0,80, 2= -0,38 et 3=-0,03

Donc
Yt= 32,89+0,8X1t-0,38X2t-0,03X3t
+Ut
Sachant que

R 1
2 e 2
t

(y t y) 2
Calcule ^
1 Anne ,2 Yt ,3 Y t ,4 et ,

de R2 5 e ,6 yt yt et 7
2
t

t
( y y t

) 2

1 2 3 4 5 6 7
1989 12 12,84 -0,84 0,7056 -5,7142857 32,653
1990 14 12,39 1,61 2,5921 -3,7142857 13,796
1991 10 13,18 -3,18 10,1124 -7,7142857 59,51
1992 16 14,39 1,61 2,5921 -1,7142857 2,9388
1993 14 17,7 -3,7 13,69 -3,7142857 13,796
1994 19 17,88 1,12 1,2544 1,28571429 1,6531
1995 21 22,2 -1,2 1,44 3,28571429 10,796
1996 19 18,86 0,14 0,0196 1,28571429 1,6531
1997 21 16,51 4,49 20,1601 3,28571429 10,796
1998 16 18,76 -2,76 7,6176 -1,7142857 2,9388
1999 19 17,92 1,08 1,1664 1,28571429 1,6531
2000 21 21,9 -0,9 0,81 3,28571429 10,796
2001 25 22,71 2,29 5,2441 7,28571429 53,082
2002 21 20,76 0,24 0,0576 3,28571429 10,796
Moyenne 17,71
Somme 248 248 0 67,46 226.86
Donc
R2= 1-(67,45/226,86) = 0,702
1/Calculer lestimation de la
variance de lerreur ainsi que
les carts types de chacun des
coefficients.
2/Les variables exognes sont-
elles significativement
contributives pour expliquer la
variable endogne
1/On sait que:

t 14

^ 2 e 2
t
67,45 67,45
t 1
6,745
n k 1 14 3 1 10
La matrice des variances et covariances estimes des
coefficients nous est donne par:

^ ^
( X ' X ) 2 1
^ ^
2 ( X ' X ) 1
20,16 0,015 0,2314 0,076

0,015 0,0132 0,0012 0,00094
6,745 x
0,2314 0,0012 0,0036 0,00057

0,076 0,00094 0,0006 0,0004

Les variances des coefficients de rgression
se trouvent sur la 1re diagonale
^ 2 ^
0 6,745 x 20,17 136,04
0 11,66
alors

^ 2 ^
1 6,745x0,013 0,084
1 0,29
alors

^ 2 ^
2 6,745x0,0036 0,024
2 0,15
alors

^ 2 ^
3 6,745 x0,0004 0,0026
3 0,05
alors
2/ Pour cela nous devons calculer

i
^
t i
i
Pour 1, t1= 0,80/0,29= 2,75>2
X1 est pertinente
Pour 2, t2= va(-0,38/0,15)= 2,53>2

X2 est pertinente.
Pour 3, t3= va(0,03/0,05)=0,60<2 X3
nest pas contributive lexplication de
Y

Vous aimerez peut-être aussi