Chapitre 2 Econométrie

Imen HENTATI ÉCONOMÉTRIE
Chapitre II : Le Modèle de Régression Linéaire

Multiple
I- Introduction
Le modèle de régression linéaire simple prend en considération une seule variable
explicative, cependant plusieurs situations en pratique nécessitent la prise en
compte de plusieurs facteurs explicatifs. Le modèle de régression linéaire multiple
est une généralisation du modèle linéaire simple au cas où le nombre de variable
explicative est strictement supérieur à un.
II- Le modèle et ses hypothèses
1- Le modèle :
Le modèle de régression linéaire multiple à k variables explicatives s’écrit sous la

forme :
y t   0  1 x1t   2 x 2t  .....   k x kt   t pour t=1,2,…,T
Avec ;
yt est la variable dépendante.
x1,t , x 2,t ,..., x k ,t sont les variables explicatives.
 t est le terme d’erreur.
 0 , 1 ,...,  k sont les paramètres à estimer :  0 est la constante du modèle et
 j (j=1,2,…,k) sont les coefficients de réaction.
y
j 
Tel que x j s’interprète comme étant la variation moyenne de y suite à une
augmentation d’une unité de xj.
2- Forme matricielle :
Si on écrit le modèle pour chaque instant « t » on obtient ;

y1   0  1 x11   2 x 21  .....   k x k1   1
y 2   0  1 x12   2 x 22  .....   k x k 2   2
.
.
.
yT   0  1 x1T   2 x 2T  .....   k x kT   T
qui peut s’écrire sous la forme matricielle suivante :
1
 y1
     
  1 x11 .. x k1   0   1 
 
 y2   1    2 
.   1 x12 .. x k 2  *  .    . 
  : : : :     
.    .  . 

  1 x1T : x kT     
 yT
   k   T 
Avec
Y est un vecteur de dimension (T,1) qui représente la variable à expliquer.
X est une matrice de dimension (T, k+1) qui représente les variables
explicatives.
 est un vecteur de dimension (T,1) qui représente les paramètres à estimer.
 est un vecteur de dimension (T,1) qui représente les termes d’erreur.
Ainsi la forme matricielle compacte du modèle est :
Y(T ,1)  X (T ,k 1) *  ( k 1,1)   (T ,1)

3- Hypothèses
3.1 Hypothèses sur la matrice X

X est une matrice non aléatoire : E ( X )  X
Pas de relations linéaires entres les variables explicatives et donc pas de
multicolinéarité.
3.2 Hypothèses sur les erreurs

Les erreurs sont d’espérance nulle E ( t )  0t  1,2,..., T
1
  E ( 1 )   0 
     
 . .  . 
E ( )  E 
  .   .   0
.
     
  E ( )   0 

   T
T   
Les erreurs sont de variance constante : V ( t )   t (les erreurs sont
2
homosédastiques)
Les erreurs sont non auto-corrélées : cov( t ,  t ' )  0t  t '
Sous la forme matricielle ces deux derniers résultats s’écrivent sous la forme :
V ( )  E[(  E ( )).(  E ( )) ' ]  E ( . ' ) 

  1    2 0 .. 0 
    
.    0  2
0 0 
E   * ( 1 ............ T )   :   I
2
 . .. . 
 
  
  T    0 0  2 
2
Les termes d’erreurs suivent la loi normale multi variée.
 t  N (0,  2 )
  N (0,  2 I )
3.3 Hypothèse sur la relation entre les variables explicatives et les erreurs
Les variables explicatives sont indépendants des erreurs : cov( t , x jt )  0 pour
j=1,2,…,k
Sous la forme matricielle on écrit ; E ( X '. )  0
III- Estimation du modèle
1- La méthode des MCO :
Soit le modèle
y t   0  1 x1t   2 x 2t  .....   k x kt   t
 0 
 
 
  1 
.
 
 
Le problème est donc d’estimer par MCO le vecteur des paramètres :  k
2
^ ^ ^' ^
Principe du MCO : MinQ   ( y t  y t )   et    t   . 

2 2
La résolution n’est pas simple, c’est pourquoi il est préférable de passer aux
écritures matricielles :
^
La forme matricielle de  :
^ ^
  Y Y
Avec ;
^ ^
Y (T ,1)  X (T ,k 1) .  ( k 1,1)
^' ^
Ainsi la forme matricielle de   :
^' ^ ^ ^ ' ^
   Y Y  2Y X    X ' X  ***
' '
^ ^ ' ^
D’où le principe du MCO devient : MinQ  Y Y  2Y X    X X 
' ' '
Pour trouver le vecteur des paramètres estimés, ceci revient à vérifier la

condition du premier ordre :
Q ^
^
 0  2 X '
Y  2 X '
X  0
 ***
D’où :
3
^
 MCO  ( X ' X ) 1 ( X ' .Y )
Remarque : Pour s’assurer qu’il s’agit bien d’un minimum il faut vérifier que la
matrice X’X est une matrice positive.
2- Propriétés de l’estimateur MCO :

^
2-1-  MCO est un estimateur sans biais:

On a ;
^
 MCO  ( X ' X ) 1 ( X ' Y )
 ( X ' X ) 1 X ' ( X   )
   ( X ' X ) 1 X ' 
Ainsi ;
^
E (  MCO )  
^ 
D’où  MCO est un estimateur sans biais de .
2-2-  MCO est un estimateur BLUE :
Formule de la variance :
^ ^ ^ ^ ^
V (  )  E[(   E (  ))(   E (  ))' ]
^ ^
 E[(    )(    )' ]
 E[(( X ' X ) 1 X '  )(( X ' X ) 1 X '  )' ]
 E[( X ' X ) 1 X '  ' X ( X ' X ) 1 ]
  2 ( X ' X ) 1
Remarque : si la variance du terme d’erreur est inconnue, on la remplace par son
estimateur :
^ 2 SCR
 
T  K 1
Forme de la variance :
La matrice variance-covariance des paramètres est une matrice carrée de
dimension (k+1, k+1) qui a la forme de :
4
 ^ ^ ^ ^ ^ ^ ^

V (  0 ) cov( 0 ,  1 ) cov( 0 ,  2 ) ... cov( 0 ,  k 
 ^ 
 V (  1) 
 ^

 V ( 2 ) 
 .. 
 ^ 
 V (  ) 
 k 
Théorème de gauss Markov :

^
 MCO est le meilleur estimateur dans la classe des estimateurs linéaire et sans
biais, on dit qu’il est BLUE.
3-Mesure de la qualité d’ajustement linéaire:

Le coefficient de détermination linéaire R², exprime la proportion de la variabilité
totale exprimée par le modèle linéaire :
SCE SCR
R2   1
SCT SCT
Avec,
Régression Simple Régression multiple
SCT   2   2
(y t  Y ) 2   y t2  T Y (Y  Y )' (Y  Y )  Y ' Y  T Y
SCE ^  ^ 2  2 ^  ^  ^ ^  2
 ( yt  Y )2   yt  T Y (Y  Y )' (Y  Y )  Y ' Y  T Y
^ '  2
  X 'Y  T Y
SCR ^ ^ ^ ^ ^
 ( yt  y t ) 2    t
2
 '   Y ' Y   ' X 'Y ***
***
^ ^ ^ ^
 '   (Y  X  )' (Y  X  )
^ ^
 (Y '  ' X ' )(Y  X  )
^ ^ ^ ^
 Y 'Y  Y ' X    ' X 'Y   ' X ' X 
^ '
 Y ' Y   X 'Y
IV- Test de significativité des paramètres :
5
1- Test de Significativité individuel des paramètres :

j  0,1,..., k
On veut tester l’hypothèse selon laquelle un des coefficients  j avec
est égale à 0.
Hypothèses :
 H 0 :  j  0

 H 1 :  j  0
Valeur calculée (variance du terme d’erreur est supposée inconnue)
^ ^ ^ ^
 j  E ( j )  jj  j0
T jc   
^ ^ ^ ^ ^ ^
V ( j ) V ( j ) V ( j )
Valeur théorique
La valeur théorique est une valeur lue sur la table de Student et elle est égale à :
t  (T  K  1)
1
2
Décision
Si valeurcalculée soush 0  valeurthéorique : On rejette H 0 et donc le paramètre est
significatif au seuil de  .
2- Test de Significativité global des paramètres
Le test de significativité globale sert à tester la pertinence du modèle. Il répond à

la question de savoir si l’ensemble des variables exogènes apporte de
l’information utile à la connaissance de la variable endogène. Ceci dit, seuls les
paramètres associés aux variables explicatives interviennent dans le test, la
constante n’est donc prise en compte ici, car c’est bien l’influence des exogènes
sur la variable expliquée que l’on cherche à établir.
Hypothèses
 H 0 :  j  0j  1,2,..., k

 H 1 :  j  0
Valeur calculée
SCE / K R2 / K
F  c

SCR / T  K  1 (1  R 2 ) /(T  K  1)
Valeur théorique
La valeur théorique est une valeur lue sur la table de Fisher et elle est égale à :
F ( K , T  K  1)
Décision
Si valeurcalculée soush 0  valeurthéorique : On rejette H 0 et donc le modèle est
globalement significatif au seuil  .
V- Prévision :
6
1- Prévision Ponctuelle :
Pour obtenir une prévision ponctuelle de y étant donnée x1, p , x 2, p ,....., x k , p des
valeurs particulières de x1 , x 2 ,....., x k , il suffit de les remplacer dans le modèle
estimé :
^ ^ ^ ^
y p   0   1 x1 p  ...   k x kp
^
 xp '
Ainsi l’erreur de prévision e p peut être définie comme :
^ ^ ^
e p  y p  y p  x p '    p  x p '   x p ' (   )   p
Avec ;
E (e p )  0
V (e p )  E (e p  E (e p )) 2
 E (e p ) 2  E (e p e 'p )
^ ^
 E[( x p ' (    )   p )( x p ' (    )   p )' ]
^
 x p 'V (  ) x p   2
  2 ( x p ' ( X ' X ) 1 x p  1)
2- Intervalle de prédiction :
Sous l’hypothèse de normalité des erreurs, et pour un niveau de confiance (1-  ) et

étant donnée x1, p , x 2, p ,....., x k , p des valeurs particulières de x1 , x 2 ,....., x k , l’intervalle de
prédiction de y s’écrit sous la forme :
^
y p [ y p  Z a . V (e p ) ]
1
2
Avec ; V (e p )   ( x p ' ( X ' X ) x p  1)

2 1
Si la variance du terme d’erreur est inconnue, alors l’intervalle de prédiction de y

s’écrit sous la forme:
^ ^
y p [ y p  t a (T  K  1). V (e p ) ]
1
2
^ ^ 2
Avec ; V (e p )   ( x p ' ( X ' X ) x p  1)

1
Application 2
7
On étudie l’influence des heures de travail et du capital utilisé sur la production

industrielle. Pour cela, on dispose des observations de 9 entreprises résumés dans
le tableau suivant :
Observatio Travail (heures) Capital Production (100 tonnes)

n - x1i i- (machines/heures) yi
-i - - -
- x 2i -
1 1100 300 60
2 1200 400 120
3 1430 420 190
4 1500 400 250
5 1520 510 300
6 1620 590 360
7 1800 600 380
8 1820 630 430
9 1800 610 440
On suppose que la production (yi) est expliquée par un modèle de régression linéaire
multiple avec deux variables explicatives, le capital (x1i) et le travail (x2i) ;
y i  a 0  a1 .x1i  a 2 .x 2i   i
pour i=1,2,…,9. avec i est un terme d’erreur.
1- Écrire le modèle sous la forme matricielle.

2- Déterminer la forme littérale puis numérique de X’X.
3- Déterminer la forme littérale puis numérique de X’Y.
4- Donner l’expression de l’estimateur de par la méthode des moindres
carrées ordinaires. En déduire le vecteur des paramètres estimés, sachant
que la matrice inverse de X’X est égale à :
6.3047771
-0.00780042 0.0000151
0 .0116199 -0.00003096 0.00007228
5- Sachant que SCR=3193,76668 déterminer la matrice des variances

covariances des estimateurs. On donne F5%(2, 6)=5.14
6- On donne SCT=147888,889. Au seuil de 5%, tester la significativité globale

du modèle.
8

Chapitre 2 Econométrie

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 2 Econométrie

Transféré par

Droits d'auteur :

Formats disponibles

Imen HENTATI ÉCONOMÉTRIE

Chapitre II : Le Modèle de Régression Linéaire

Le modèle de régression linéaire multiple à k variables explicatives s’écrit sous la

Si on écrit le modèle pour chaque instant « t » on obtient ;

Y(T ,1)  X (T ,k 1) *  ( k 1,1)   (T ,1)

3.1 Hypothèses sur la matrice X

3.2 Hypothèses sur les erreurs

V ( )  E[(  E ( )).(  E ( )) ' ]  E ( . ' ) 

Les termes d’erreurs suivent la loi normale multi variée.

Sous la forme matricielle on écrit ; E ( X '. )  0

III- Estimation du modèle

1- La méthode des MCO :

Principe du MCO : MinQ   ( y t  y t )   et    t   . 

Pour trouver le vecteur des paramètres estimés, ceci revient à vérifier la

2- Propriétés de l’estimateur MCO :

2-1-  MCO est un estimateur sans biais:

2-2-  MCO est un estimateur BLUE :

Théorème de gauss Markov :

3-Mesure de la qualité d’ajustement linéaire:

Régression Simple Régression multiple

IV- Test de significativité des paramètres :

1- Test de Significativité individuel des paramètres :

2- Test de Significativité global des paramètres

Le test de significativité globale sert à tester la pertinence du modèle. Il répond à

Sous l’hypothèse de normalité des erreurs, et pour un niveau de confiance (1-  ) et

Avec ; V (e p )   ( x p ' ( X ' X ) x p  1)

Si la variance du terme d’erreur est inconnue, alors l’intervalle de prédiction de y

Avec ; V (e p )   ( x p ' ( X ' X ) x p  1)

On étudie l’influence des heures de travail et du capital utilisé sur la production

Observatio Travail (heures) Capital Production (100 tonnes)

pour i=1,2,…,9. avec i est un terme d’erreur.

1- Écrire le modèle sous la forme matricielle.

5- Sachant que SCR=3193,76668 déterminer la matrice des variances

6- On donne SCT=147888,889. Au seuil de 5%, tester la significativité globale

Vous aimerez peut-être aussi