Vous êtes sur la page 1sur 65

Année Universitaire 2019/2020

Économétrie

Cours et Travaux dirigés

Imen Ouerghi
Sommaire

Introduction ................................................................................................................................................. 5

1. Définition de l'économétrie .................................................................................................................. 5

2. Utilité de l'économétrie ........................................................................................................................ 5

3. Modèle économétrique ......................................................................................................................... 5

a) Modèle: ........................................................................................................................................... 6

b) Modèle économique: ........................................................................................................................ 6

4. Paramètres et Variables ........................................................................................................................ 6

a) les paramètres: ................................................................................................................................. 6

b) les variables: .................................................................................................................................... 6

Chapitre 1.................................................................................................................................................... 8

Régression linéaire simple ........................................................................................................................... 8

Introduction ................................................................................................................................................. 8

I. Spécification du modèle et des hypothèses ........................................................................................... 8

1) Spécification du modèle ................................................................................................................... 8

2) Spécification des hypothèses ............................................................................................................ 8

II. Estimateurs des moindres carrés ordinaires et leurs propriétés ......................................................... 9

1) Présentation de la méthode des moindres carrés ordinaires ............................................................... 9

2) Détermination des estimateurs des paramètres du modèle: .............................................................. 10

3) Propriétés des estimateurs: ................................................................................................................ 13

4) Estimation de la variance des paramètres: .......................................................................................... 15

III. Décomposition de la variance totale ....................................................................................... 16

1. Équation d'analyse de variance ................................................................................................ 16

2. Coefficient de détermination ................................................................................................. 17

VI. Les tests statistiques: ........................................................................................................................... 19

2
1) Test de Student .............................................................................................................................. 19

a) Test bilatéral: ............................................................................................................................. 19

b) Test de significativité: .................................................................................................................... 19

c) Test unilatéral: ............................................................................................................................... 20

d) Estimation par Intervalle de confiance: .......................................................................................... 20

V. Test de significativité globale: .............................................................................................................. 22

IV. Prévision: ............................................................................................................................................ 23

1) Prévision ponctuelle ....................................................................................................................... 23

2) Intervalle de prévision .................................................................................................................... 23

Chapitre 2.................................................................................................................................................. 25

Régression linéaire multiple....................................................................................................................... 25

Introduction ............................................................................................................................................... 25

I .Spécification du modèle et des hypothèses ........................................................................................ 25

1. Spécification du modèle ................................................................................................................. 25

2. Écriture matricielle .................................................................................................................... 25

3. Spécification des hypothèses .......................................................................................................... 26

II . Les estimateurs des moindres carrés ordinaires et leurs propriétés ................................................... 27

1) Détermination des estimateurs des paramètres du modèle: ................................................................. 27

2) Propriétés des estimateurs: ............................................................................................................... 27

3) Estimation de la variance de  ....................................................................................................... 28

4) Matrice des variances covariances des paramètres:............................................................................. 31

III . Décomposition de la variance totale ..................................................................................... 32

1) Équation d'analyse de variance .................................................................................................... 32

2) Coefficient de détermination .................................................................................................... 32

3) Coefficient de détermination ................................................................................................. 32

IV. Les tests statistiques: ........................................................................................................................... 33

3
1) Test de Student .................................................................................................................................. 33

a) Test bilatéral: ................................................................................................................................. 34

b) Test de significativité: .................................................................................................................... 34

c) Test unilatéral: ............................................................................................................................... 35

d) Intervalle de confiance: .................................................................................................................. 35

V. Test de significativité globale ................................................................................................................ 37

VI . Prévision: ........................................................................................................................................... 38

1) Prévision ponctuelle .......................................................................................................................... 38

2) Intervalle de prévision ....................................................................................................................... 39

Travaux Dirigés ......................................................................................................................................... 40

Série n°1 ................................................................................................................................................... 41

Série n°2 ................................................................................................................................................... 43

Série n°3 ................................................................................................................................................... 54

4
Introduction

1. Définition de l'économétrie

Plusieurs définitions ont été attribuées à la notion de l'économétrie, nous reprenons au niveau de ce
cours deux définitions afin de comprendre clairement cette notion.

Définition 1: L'économétrie est définie comme étant un outil à la disposition de l'économiste qui
lui permet d'infirmer ou de confirmer les théories qu'il construit (Bourbonnais. R). Pour ce faire, un
traitement mathématique s'effectue sur des données statistiques, permettant de vérifier la validité ou
non des théories économiques.

Définition 2: Le terme ÉCONOMÉTRIE se décompose en deux mots: "Écono" (Économie ou


théorie économique) et "métrie" (évaluation ou mesure). Ainsi, l'économétrie est définie comme
étant l'évaluation (ou la mesure) des théories économiques.

2. Utilité de l'économétrie

Les résultats d'une analyse économétrique sont d'une grande utilité pour les décideurs. Ses
principaux objectifs sont :
- L'élaboration des prévisions à partir des résultats des modèles explicatifs.
- La compréhension des phénomènes étudiés en mettant en évidence l'effet isolé de chaque
déterminant introduit dans le modèle.
- l'évaluation des effets de certaines actions ou politiques économiques
Le champ d'application de l'économétrie et varié et touche plusieurs domaines à savoir:
- la production: détermination du volume de production d'une entreprise par le facteur travail.
- Le marketing: déterminer l'effet de la publicité sur l'évolution des ventes.
- Le transport : prévoir le nombre de voyageurs pour le transport publics.

3. Modèle économétrique

Toute analyse économétrique se base sur des modèles il est donc indispensable de définir la notion du
modèle, puis la notion du modèle économique et économétrique.

5
a) Modèle:
Un modèle consiste en la représentation formelle d'idées ou de connaissances relative à un
phénomène. Ces idées sont généralement traduites sous la forme d'un système
mathématique.

b) Modèle économique:
Un modèle économique est une formalisation logique de ce que l'analyse économique
suggère être s économétrique est un modèle économique faisant intervenir l'aléatoire. En
effet, le modèle économétrique fait intervenir une variable remplaçant l'effet des facteurs
qui ont été oubliés par l'économètre.

MODÈLE ÉCONOMIQUE + L'ALÉATOIRE = MODÈLE ÉCONOMÉTRIQUE

4. Paramètres et Variables

Les relations existantes dans un modèle économétrique font intervenir des paramètres et des
variables. La distinction entre paramètres et variables est fondamentale. Ainsi, nous avons :

a)les paramètres:

Ce sont des constantes inconnues dont le modèle économétrique permet donner leurs
valeurs (on dit estimer leurs valeurs).

b)les variables:

Nos distinguons deux types de variables: les variables économiques et les variables
d'erreurs (ou aléatoires). Plus précisément

- les variables économiques: se décomposent en variable dépendante et variables


indépendantes.

* les variables explicatives sont des données qui permettent d'expliquer la variable
dépendante. Ce sont des variables explicatives (appelée aussi variables exogènes).

* La variable dépendante (appelée aussi variables endogènes) est déterminée par le


modèle en question, elle est expliquée par les variables explicatives.

- la variable d'aléatoire : appelée aussi terme d'erreur ou terme aléatoire, qui remplace les
facteurs qui échappent au contrôle de l'économétrie. Autrement dit, elle remplace les facteurs qui
peuvent expliquer la variable dépendante et qui ne sont pas introduit dans le modèle sous forme de
variables explicatives.

6
Modèle économiques: variable dépendante+ variables indépendantes

Modèle économétrique :
Variable aléatoire ou terme d'erreur

Exemple d'un modèle économétrique

Nous considérons la relation de y en fonction de x : x est exprimée en fonction de y

 y : var iable expliquée


y  f ( x ) avec 
 x : variable e xplicative

Le modèle économétrique s'écrit comme suit

a et b constantes inconnues du modèle à déterminer leurs valeurs


  terme d' erreur
yt  a  bxt   t avec 

 t : indice temporel

7
Chapitre 1

Régression linéaire simple

Introduction
Le modèle de la régression linéaire simple représente le cas le plus simple à traiter. Son étude est
toutefois indispensable pour la compréhension des méthodes plus complexes.

I. Spécification du modèle et des hypothèses

1) Spécification du modèle

On cherche à mettre en avant une relation de dépendance entre les variables y et x . y est celle
que l'on cherche à expliquer (à prédire), on parle de variable endogène (dépendante) ; x est la
variable explicative (prédictive), on parle de variable exogène (indépendante).

Un modèle linéaire simple est un modèle qui comporte une seule variable explicative. Il se
présente comme suit:

yt  a  bxt   t
Avec:

  y : variable expliquée par x(dépendan te , endogène)


  x : variable expli cative (indépenda nte, exogène)

 a et b : les paramètres inconnus à estimer
 ε : variable aléatoire

2) Spécification des hypothèses

Un des objectifs de l'économétrie est de réduire autant que possible l'incertitude non
maitrisable des phénomènes étudiés (  t ). Ceci conduit à formuer certaines hypothèses concernant
le terme d'erreur. Ces hypothèses sont nécessaires pour l'obtention d'estimateurs efficaces. Nous
présentons dans ce qui suit les hypothèses liées à l'estimation d'un modèle simple:

H1: E(  t )  0 : le terme d'erreur a une espérance mathématique nulle. C'est à dire que le
terme d'erreur peut prendre des valeurs positives ou négatives ayant un effet plus au moins
important sur la variable dépendante (y) mais en moyenne cet effet est nul.

8
H2: V (  t )   2 : le terme d'erreur a une variance constante. Cette hypothèse traduit l'idée
que l'incertitude garde le même degré de variabilité et influe de la même manière la variable
expliquée. (On dit que les erreurs dont l'hypothèse de l'Homoscédastique ou bien c'est l'hypothèse
de l'homoscédasticité) .

H3: E(  t , t 1 )  0 : les termes d'erreurs sont indépendants d'une observation à une autre, c'est
l'hypothèse d'absence d'autocorrélation des erreurs. Cette hypothèse suppose que pour deux
observations distinctes l'effet de l'incertitude (  t ) à l'année t n'est pas affecté par celui de l'année t-1.

H4: E( xt , t )  0 pour toutes les observations le terme d'erreur est indépendant (  t ) de la


variable explicative ( x ). Plus précisément, les effets de la variable aléatoire et de la variable
explicative sur la variable expliquée sont séparés.

H5: les variables aléatoires sont distribuées selon la loi Normale d'espérance mathématique
E(  t )  0 et de variance V (  t )   2 .  t  N ( 0, 2 ) .

En résumé:

H1: E(  t )  0 t
H2: V (  t )   2 t
H3: E(  t , t 1 )  0 t
H4: E( xt , t )  0 t
H5:  t  N ( 0, 2 )

II. Estimateurs des moindres carrés ordinaires et leurs propriétés

1) Présentation de la méthode des moindres carrés ordinaires

Les T observations sur un phénomène donné sont représentés par T points dans un repère cartésien.
Ces T points forment un nuage de points.

Notre objectif est d'essayer de résumer l'information fournie par e nuage de points sous une forme
simplifiée. On dit qu'on procède à un ajustement du nuage de points qui est représenté par une
droite d'ajustement linéaire.

En effet, par le nuage de points on peut faire passer une infinité de droites et un bon ajustement est
celui qui traduit de la manière la plus fiable la réalisation du phénomène étudiée. Plus exactement
celui qui fait perdre le minimum d'informations.

Le problème qui se pose est de trouver la droite (l'équation de la droite) qui soit proche de tous les
points du nuage. C'est à dire de trouver les valeurs des constantes a et b de l'équation de la droite :

yt  a  bxt   t .

9
La solution préconisée est celle qui consiste à choisir la droite qui minimise la somme des carrés
des distances entre les points du nuage et la droite d'ajustement linéaire. On parle dans ce cas de la
méthode des Moindres Carrés Ordinaires (MCO). Soit analytiquement:
T
Min  ( y t  a  bxt ) 2  Min   t2
t 1

2) Détermination des estimateurs des paramètres du modèle:

La méthode des MCO consiste à minimiser la somme des carrés des erreurs (des écarts entre les
valeurs observées de y et les valeurs estimées qui se trouvent sur la droite d'ajustement linéaire. soit:
T
Min  ( yt  a  bxt )2  Min  t2
t 1

Il s'agit de minimiser une fonction à deux inconnus a et b .

Les conditions nécessaires de minimisation nous permettent d'obtenir par la méthode MCO les
estimateurs des paramètres a et b notés â et b̂ .


t 1
t
2
  ( y t  a  bxt ) 2  f ( a ,b )

Minimiser la fonction f revient mathématiquement à appliquer les conditions suivantes:

- Condition du premier ordre:

 f a'  0
 '
 f b  0

- Condition du deuxième ordre: les dérivées secondes doivent être toutes positives

10
 f a'  0
La résolution du système  permet de trouver les expressions des estimateurs de a et b notés
 f b'  0

successivement â et b̂ qui se présentent comme suit :

 f a'  0 
 f a'   ( y t  a  bxt )  0 
 f '  ( y t  a  bxt )  0
 '   '   a'
 f b  0 
 f b   xt ( y t  a  bxt )  0 
 f b  xt ( y t  a  bxt )  0

T
 xt y t  T x y
b̂  t 1
T
et â  y  b̂x
 x  Tx
2
t
2

t 1
T
 (xt - x )(yt  y ) COV ( x, y)
Autre expression de b̂ : b̂  t 1
T

V(x)
 (xt  x )2
t 1

 Interprétation économique des paramètres du modèle:

b̂ : L'effet multiplicateur de x sur y

â : La valeur autonome de y

Exemple:

Le directeur commercial d'une entreprise agroalimentaire commercialisant un bien Z souhaite étudier la


variation de la demande des consommateurs pour ce bien en fonction de son prix. Il spécifie pour cela le
modèle linéaire suivant:
qi  a0  a1 pi   i i  1,...,N

Où qi indique la demande du bien, pi son prix, et  i terme aléatoire vérifient les hypothèses de la régression linéaire
simple.
Le tableau suivant donne, pour un échantillon de 15 personnes, les valeurs de la demande du bien Z en fonction
du prix:
pi 18 16 17 12 15 15 4 13 11 6 8 10 7 7 7
qi 3 3 7 6 10 15 16 13 9 15 9 15 12 18 21

1) Tracer sur un diagramme cartésien le nuage des points liant q i et pi. Que-peut conclure?
2) Estimer les coefficients a0 et a1 par la méthode des MCO et donner l'équation de la droite d'ajustement
linéaire.
3) Donner l'interprétation économique de a1 , de â1 . Le signe de â1 est-il plausible?

11
Corrigé
1) qi

pi

On remarque que le nuage de points est décroissant, il n'est pas vraiment linéaire et qu'il se prête
difficilement à un ajustement linéaire.
15

 (p i - p)(qi  q )
2) â1  i 1 et â0  p  â1 p
15

 (p
i 1
i  p) 2

15
15

p i
q
i 1
i
On calcule: p  i 1
 11,06 et q   11,47 q̂i  20,75  0,87 pi
15 15

qi pi (qi  q ) (pi - p) (pi - p) (pi - p) (pi - p) 2 (qi  q ) 2 q̂ i (qi  q̂i )2


3 18 -8,46 6,94 -58,71 48,16 71,57 5,63 6,91
3 16 -8,46 4,94 -41,79 24,40 71,57 7,33 18,74
7 17 -4,46 5,94 -26,49 35,28 19,89 6,47 0,28
6 12 . . . . . . .
10 15 . . . . . . .
15 15 . . . . . . .
16 4 . . . . . . .
13 13 . . . . . . .
9 11 . . . . . . .
15 6 . . . . . . .
9 8 . . . . . . .
15 10 . . . . . . .
12 7 0,54 -4,06 -2,19 16,48 0,29 14,87 8,23
18 7 6,54 -4,06 -26,55 16,48 42,77 14,87 9,79
21 7 9,46 -4,06 -38,73 16,48 91,01 14,87 37,57
Total 172 166 ----- ------ -234,43 278,88 401,71 ------ 204,93

SCT SCR

12
15

 (p i - p)(qi  q )
 234,43
â1  i 1
  0,87 et â0  11,47  ( 0,87 )11,06  20,75
15
278,88
 (p
i 1
i  p )2

L'équation de la droite d'ajustement linéaire est la suivante : q̂i  20,75  0,87 pi

q i
3) a1  : C'est la variation de la demande suite à une variation unitaire du prix
pi
q̂
â1  i  0,87 : C'est une estimation de la variation de la demande suite à une variation unitaire du prix
pi
Le signe de â1 est plausible car il est négatif, ceci veut dire que si le prix augmente d'une unité alors la
quantité demandée diminue de 0,87 unité ce qui est conforme à la théorie de la demande.

3) Propriétés des estimateurs:

-Linéarité:
P1) â et b̂ sont des estimateurs linéaires, puisqu'il s'agit d'un modèle linéaire.

-Centralité:
P2) â et b̂ sont des estimateurs sans biais, en effet E( â )  0 et E( b̂ )  0
T T T 0 T T y
 
t


t 1
(xt - x )(yt  y ) 
t 1
(xt - x )y t   ( xt - x ) y 
t 1
(xt - x )y t 
t 1
(xt - x )( a  bxt   t )
b̂  T
 T
1
 T
 T

(xt 1
t  x )2 (x
t 1
t  x )2 (x
t 1
t  x )2 (x
t 1
t  x )2

T
(Sachant que ( x
t 1
t - x )  0 et yt  a  bxt   t ) )

Le développement de cette expression permet de trouver :

T t 
y T T T

 (xt - x )( a  bxt   t ) a 
t 1
(xt - x )  b  (xt - x )x t   (x - x)
t
t 1
b̂  T
 T
1 t 1 t

 (x
t 1
t  x )2  (x
t 1
t  x )2

13
T T T
On note que :  ( xt - x )  0 et  (xt - x )xt = (xt  x )2 donc après simplification on obtient
t 1 t 1 t 1

l'expression suivante de b̂ :

T T T
b  (x - x)x
t 1
t t  (x - x)
t 1
t t  (x - x)
t 1
t t
b̂  T
 T
b T

 (x
t 1
t x ) 2
 (x
t 1
t x ) 2
 (x
t 1
t  x )2

 T 
 T 

 (xt - x )x t 
 t 1
 t 1
(xt  x ) 

2

 

En calculant l'espérance mathématique de l'expression précédente on trouve :

 T   T 

 t 1
(xt - x ) t 


  (x - x)
t 1
t

 t
E( b̂ )  E  b    E( b )  E  

T
 
T
2 
  (xt  x ) 2    (xt  x ) 
 t 1   t 1 
Du fait que E( b )  b (d'après les propretés de l'espérance mathématique) on a alors:
 T  T

 (x - x)
t

 t (x - x) t
E( b̂ )  E( b )  E  T
t 1
b T
t 1
E(  t ) (D'après : H1: E(  t )  0 )
 2 



t 1
(xt  x ) 

(x
t 1
t x ) 2

T
 (xt - x)
t 1
E( b̂ )  b  T
E(  t )  b  E( b̂ )  b CQFD
 (xt x ) 2

t 1

Donc b̂ est un estimateur sans biais de b.

Remarque : on peut démontrer aussi que E( â )  a

-Convergence:
P3) â et b̂ sont des estimateurs convergents, en effet lim V ( â )  0 et lim V ( b̂ )  0
T  T 
Démonstration:

14
2
T T  T   T 

b (xt - x )t  
(xt - x ) t 
  (xt - x ) t 


  (xt - x )t 
 2
V ( b̂ )  t 1
T
t 1
 V( b )  V  T
t 1
  0 T
t 1
 V  t   T
   2 

t 1
(xt  x ) 2 


t 1
(xt  x ) 2 




t 1
(xt  x ) 

 (x
t 1
t  x )2

2 cte
lim V ( b̂ )  lim   0 b̂ est un estimateur convergent (CQFD)
t  t  T 
(x
t 1
t  x )2

Théorème de Gauss-Markov:

Les estimateurs des MCO de la régression sont sans biais et convergents. On peut même aller plus
loin et prouver que parmi les estimateurs linéaires sans biais de la régression, les estimateurs MCO
sont à variance minimale c.-à-d. il n'existe pas d'autres estimateurs linéaires sans biais présentant
une plus petite variance. Les estimateurs des MCO sont BLUE (Best Linear Unbiased Estimator).
On dit qu'ils sont efficaces.

4) Estimation de la variance des paramètres:

D'après 3) on trouve que la variance du paramètre b est donnée par l'expression suivante :
2
V ( b̂ )  T

 (x
t 1
t  x )2

 
 
On montre de même que celle de a est : 1
V ( â )   2  
2
x 
T 

T
 (xt  x )2 
 t 1


On remarque que les variances des paramètres a et b dépendent toutes les deux de la variance
des erreurs, il est donc utile d'estimer sa valeur.
La variance estimée des erreurs par la méthode des MCO est donnée par l'expression suivante:
T

 ˆ
t 1
t
2
SCR Somme des carrés des résidus
V̂ ( ˆ t2 )  ˆ 2   
T 2 T 2 deg ré de liberté
Par conséquent, les variances estimées des paramètres sont données par les expressions
suivantes:
 
 
ˆ 2 1 2

V̂ ( b̂ )  et V̂ ( â )  ˆ  
2 x
T 
(x
T


T
t x ) 2  (xt  x )2 
 
t 1  t 1 
On peut ainsi déduire les écarts types estimés des paramètres sont donnés par les racines carrés des
variances estimées. On ainsi:

15
ˆ 2 et ----
ˆ b̂  V̂ ( b̂ )  T
 (xt  x ) 2
t 1

Suite de l'exemple:

4) Donner une estimation de la variance des erreurs.

5) Calculer les variances estimées des estimateurs de a0 et a1 .

Corrigé
T 15

 ˆ t2 SCR
( q i  q̂i ) 2
204, ,93
4) ˆ 2  t 1
  i 1
  15,76
N 2 N 2 15  2 13

 
1 p̂ 2   1 ( 11,47 )2 
5) V̂ ( â0 )  ˆ 2   15   15,76   7 ,76
N 2 15 278,88 
 
i 1
(qi  q )


ˆ 2 15,76
V̂ ( â1 )  15
  0,056
 (q
278,88
i  qi )2
i 1

III. Décomposition de la variance totale

1. Équation d'analyse de variance

La méthode des MCO fournie les meilleurs estimateurs (sous les hypothèses de la MCO). Ce
paragraphe a pour objectif de vérifier l'adéquation entre le modèle et les faits rérls. Une telle
procédure se base aussi bien sur l'analyse de la variance totale de la variable endogène que sur les
tests statistiques.

La variance de y t dépend de celle de x et de celle de e. on a ainsi:

Variance totale = Variance expliquée par x + Variance résiduelle

On obtient dès lors l'équation d'analyse de variance :

SCT = SCE + SCR

SCT est la somme des carrés totaux, elle indique la variabilité totale de Y c.-à-d. l'information
disponible dans les données.

16
SCE est la somme des carrés expliqués, elle indique la variabilité expliquée par le modèle c.-à-d. la
variation de Y expliquée par X.

SCR est somme des carrés résiduels, elle indique la variabilité non-expliquée (résiduelle) par le
modèle c.-à-d. l'écart entre les valeurs observées de Y et celles prédites par le modèle.

T T T


t 1
(ŷ t  y ) 2 = t 1
(yt  ŷ t ) 2 +  ( ŷ
t 1
t  y )2

A partir de ces informations, nous pouvons produire une première version du tableau
d'analyse de variance (Tableau 1.1). La version complète nous permettra de mener le test de
significativité globale de la régression comme nous le verrons plus loin (section 3.1).

Source de Somme des Somme des Carré


variation carrés carrés moyen
Régression (X) T SCE/1
SCE=  ( ŷt  y )2 1
t 1

Résiduelle ( ̂ ) T SCR/T-2
SCR=  (yt  ŷt )2 T-2
t 1

Totale T SCT/T-1
SCT=  (ŷt  y ) 2 T-1
t 1

1:le nombre de variable explicative dans le modèle (une seule puisqu'il s'agit d'un modèle simple)
T-2: le degré de liberté des erreurs (nombre d'observation - nombre de paramètres à estimés)
T-1: (T-2) +1

2. Coefficient de détermination

Il est possible de déduire un indicateur à partir de l'équation d'analyse de variance. C'est le


coefficient de détermination notée R2 . Il indique la proportion de variance de Y expliquée par le
modèle.
Ce coefficient est le rapport de la variabilité expliquée à la variabilité totale.( Il mesure la part de la
variabilité totale qui est expliquée par x).

SCE SCR
R2  1
SCT SCT

Le coefficient de détermination permet d'apprécier la qualité de l'ajustement linéaire.


0  R2 1

17
Deux situations extrêmes peuvent survenir :

- si SCR = 0 alors SCT = SCE : les variations de y sont complètement expliquées par
celles de x. On a un modèle parfait, la droite de régression passe exactement par tous les
points du nuage (ŷ i = yi) et R 2  1
- si SCE = 0 : x n'apporte aucune information sur y il s'agit d'une mauvaise
spécification, le nuage de point est très dispersé et R 2  0
* si R2 est proche de 1 donc il s'agit d'une bonne qualité d'ajustement linéaire (pour R2=0.8
: 80% de la variabilité totale est expliquée par le modèle, 20% reste inexpliquée ou
résiduelle (expliquée par d'autres facteurs) )

Par contre si R2 est proche de zéro la qualité de l'ajustement est mauvaise.

Dans le cas où le modèle est mal spécifié ceci peut être expliqué soit par l'existence des
facteurs autres que x qui peuvent expliquer y, soit que la relation entre y et x n'est
pas linéaire.

Suite de l'exemple:

6) Établir le tableau d'analyse de variance ANOVA.

7) Calculer et interpréter le coefficient de détermination

Corrigé

6) Le tableau d'analyse de variance

Source de Somme des carrés Somme des Carré


variation carrés moyen
N
Régression SCE   (q̂ t  q ) 2
(X) i 1
N 1 SCE/1=211,08
  a (pt  p )2  211,08
2
1
i 1

Résiduelle N SCR/N-2=
SCR   (qt  q̂i )2  204,93
( ̂ ) i 1
N-2=13 15,76
Totale N _________
SCT  (qi  q )2  413,01 N-1=14
i 1

a
2
SCE= 2
1 ( pt  p ) 2 = (-0,87) .278,88 = 211,08
i 1

SCT= SCE+SCR= 211,08+204,93=413,01


211,08 204,93
7) Le coefficient de détermination: R 2  1  0,51
413,01 413,01
51% de la variabilité de y provient de celle de x et 49% reste inexpliquée (provient des résidus), il
s'agit d'une moyenne qualité d'ajustement linéaire

18
VI. Les tests statistiques:

1) Test de Student
Soit le modèle linéaire suivant : yt  a  bxt   t

On veut tester si les paramètres inconnus sont égaux à une valeur particulière généralement
suggérée par la théorie. Ce test est individuel (test sur a et sur b) et réalisé en fonction du test de
Student pour accepter ou rejeter l'hypothèse supposée.

a) Test bilatéral:
Ce test est réaliser en 4 étapes, il consiste à tester

1ère étape: Tester si le paramètre est égal ou non à une valeur suggérée par la théorie

 H 0 : b  b*

 H1 : b  b
*

2ème étape:

Pour effectuer ce test on commence par calculer une valeur empirique notée tc ( le t de student
calculé) telle que :

b̂  b
tc   T( T  2 ) qui Suit un t de student à (T-2) degré de liberté
ˆ b̂

3ème étape:

On cherche une valeur théorique à partir de la table de student notée t ( T  2 )

4ème étape: Règle de décision:

On compare la valeur théorique à celle empirique en suivant la règle suivante:

 t  t ( T  2 ) on accepte H
 c  0


si Avec un risque d'erreur égal à 
 tc  ( T  2 ) on accepte H 1

b) Test de significativité:
Ce test consiste à tester l'hypothèse nulle H0: b=0 contre une hypothèse alternative H1:b  0 en
suivant les 4 étapes cité ci dessus:

H 0 : b  0

 H1 : b  0

19

tc   T( T  2 )
ˆ b̂

 t  t ( T  2 ) on accepte H
 c  0


si
 tc  ( T  2 ) on accepte H 1

Si on accepte H0 alors b est significativement égal à 0 (ou statistiquement non significatif) au


risque de  %.

Si on accepte H1 alors b est significativement différent de 0 (ou on dit que c'est significatif) au
risque de  %.

c) Test unilatéral:
Deux cas sont possibles

 t  t ( T  2 ) on rejette H 0
 H : b  b* b̂  b *  c 2
er
1 cas :  0 tc   T( T  2 ) si t  t ( T  2 ) on accepte H
 H1 : b  b
*
ˆ b̂  c 2 0


 t  t ( T  2 ) on accepte H 0
 H 0 : b  b* b̂  b *  c 2
2ème
cas :  tc   T( T  2 ) si t  t ( T  2 ) on rejette H
 H1 : b  b
*
ˆ b̂  c 2
0

d) Estimation par Intervalle de confiance:


Les tests d'hypothèses peuvent également être effectués en utilisant une estimation par intervalle
de confiance. Pour cela, il suffit de fournir une estimation par IC des paramètres considérés

On sait que :

b̂  b *
tc   T( T  2 )
ˆ b̂

IC/ Pt c  t ( t  2 )  1  
P t t c  t   1  
 b̂  b * 
P  t   t   1  
 ˆ b̂ 
 
P  ˆ b̂t  b̂  b*  ˆ b̂t  1  

IC/  
P b̂  ˆ b̂t  b*  b̂  ˆ b̂t  1  

20
Par exemple si  =5% alors il y a 95% de chance que la vraie valeur du paramètre b soit comprise
dans l'intervalle de confiance.


Si b  IC  b̂  ˆ b̂ t ( t  2 ) ; 
b̂  ˆ b̂ t ( t  2 ) on accepte H0 à  % risque d'erreur
Si b  IC  b̂  ˆ t
b̂ 
(t  2) ; 
b  ˆ b̂ t ( t  2 ) on accepte H1 à  % risque d'erreur

Suite de l'exemple:

8) Construire des intervalles de confiance pour a0 et a1 au niveau de confiance 95%.


9) Tester la significativité des paramètres a0 et a1 au seuil de 5%.
10) Tester, au seuil de 5%, l'hypothèse nulle H0 a0 = -1.
Corrigé


8) Intervalle de confiance de a0 : IC( a0 )  20,75  7,76  2,160 ; 20,75  7,76  2,160 
IC( a0 )  14,73 ; 20,76

Intervalle de confiance de a1 : IC( a1 )   0,87  0,056  2,160 ;  0,87  0,056  2,160 
IC( a1 )   1,38 ;  0,35

9) Test de significativité de a0 :

0  IC( a0 )  14,73 ; 20,76  a0 est significativement différents de zéro au risque de 5%

Test de significativité de a1 :
0  IC( a1 )   1,38 ;  0,35  a1 est significativement différents de zéro au risque de 5%

10) On test l'hypothèse suivante:

 H 0 : a 0  1

 H 1 : a1  1

* Estimation par IC:  1  IC( a1 )   1,38 ;  0,35  a1 est significativement égal à1 au risque de 5%

On peut effectuer le test par le calcul suivant :

â1  a1  0;87  ( 1 )
tc    0,56
ˆ â1 0,056

21
0,56  2,160  On accepte H0 donc a1 est significativement égal à 1 au risque de 5%

V. Test de significativité globale:


Ce test permet d'étudier la significativité globale du modèle .Il suit la loi de Fisher et se présente
comme suit :

Soit le modèle linéaire suivant

yt  a  bxt   t

H 0 : b  0

 H1 : b  0
Pour mener ce test on calcule la statistique de Fisher suivante:

SCE / 1 SCE
Fc   .( T  2 )  F ( 1,T  2 )
SCR / T  2 SCR

Cette statistique est comparée à une valeur théorique obtenue à partir de la table de Fisher notée: F ( 1 ,T  2 )

 Fc  F ( 1,T  2 ) on accepte H 0

si F  F ( 1,T  2 ) on accepte H

c
 1

Si on accepte H0 le modèle est globalement non significatif à  % risque d'erreur. Par contre si on
accepte H1 on conclut que le modèle est globalement significatif à  % risque d'erreur.

Remarque : on peut exprimer la statistique de Fisher en fonction de R2

SCE SCE / SCT R2


.( T  2 )  .( T  2 )  .( T  2 )
SCR SCT  SCE / SCT 1 R2

Suite de l'exemple:

11) Tester la significativité globale du modèle

Corrigé

11) Test de significativité globale

 H 0 : a 0  1

 H 1 : a1  1

22
SCE / 1 SCE
Fc   .( N  2 )
SCR / N  2 SCR
211,08
 ( 15  2 )  6,64
413,01

On calcule cette valeur au Fisher tabulé à 1 et 13 ddl à 5 % risque d'erreur: F5% ( 1 ,15  2 )  4,67

On remarque que Fc  6,64  F ( 1,13 )  4,67 donc on accepte H1 le modèle est globalement
5%
significatif au risque de 5%.

IV. Prévision:

La régression est beaucoup utilisée pour la prédiction (ou prévision, on utilise plutôt ce terme
quand on manipule des données longitudinales). Pour une nouvelle valeur donnée de la variable
exogène X, nous voulons connaître la valeur que prendrait l'endogène Y

1) Prévision ponctuelle
On cherche à calculer ŷT  qui est la valeur de y à la date T   . Soient donc:

 : horizon de la prévision
T   : observation à laquelle on veut faire la prévision
yT  : la vraie valeur de y à T  
ŷT  : prévision de yT  (la valeur prévue)
L'estimation ponctuelle de yT  serait alors :

ŷT   â  b̂xT 

2) Intervalle de prévision
Une prédiction ponctuelle est intéressante. Mais nous ne savons pas quel degré de
confiance nous pouvons lui accorder. Il est donc plus intéressant de s'intéresser à un intervalle
de prédiction (fourchette de prédiction) en lui associant une probabilité de recouvrir la vraie
valeur y.

Il s'agit d'estimer yT  par intervalle de confiance pour un niveau de confiance égale à 1  


IC  ŷT   ˆ pt ( t  2 ) ; 
ŷT   ˆ pt ( t  2 )

Avec ̂ p =  2 1  1  ( xT   x )  est l'écart type de la prévision


2

 T ( x t  x ) 
2

23
Remarque:

Connaissant yT  il est possible de tester la portée prévisionnelle du modèle en observant si


yT   IC estimé.
- Si yT   IC ( yT  )  Pas de changement structurel  le modèle demeure compatible avec les
données.
- Si yT   IC ( yT  )  le modèle n'est pas compatible avec la réalité.

Suite de l'application:

Calculer pour p16 = 10 une prévision ponctuelle de la quantité demandée, puis donner un intervalle
de confiance de la prévision à 95% degré de confiance.

Réponse:

La prévision ponctuelle da la quantité demandée est donnée par l'équation de la droite d'ajustement
linéaire: q̂i  20,75  0,87 pi

Ainsi pour p16 = 10 on a q̂i  20,75  0,87 10  12,05

12,05 est la valeur prévue de la demande du bien Z pour un prix égal à 10 u. m

L'intervalle de confiance de la prévision:

IC  12,05  4,10  2,160 ; 12,05  4,10  2,160 )  3,19 ; 20,90 )

̂ p = 15,761  1  ( 10  11,06 )   4,10 écart type de la prévision


2

 15 278,88 

24
Chapitre 2

Régression linéaire multiple

Introduction
Le modèle de la régression linéaire multiple est une généralisation du modèle simple, il
contient k variables explicatives avec k > 2.

I .Spécification du modèle et des hypothèses

1. Spécification du modèle

La régression linéaire multiple est la généralisation multivariée de la régression simple. Nous


cherchons à expliquer les valeurs prises par la variable endogène Y à l'aide de k variables
exogènes

L'équation de la régression s'écrit :


yt = a0 + a1xt,1 + a2xt,2 + · · · + akxt,k +  t
Avec:
 y : variable expliquée
  x , x ,..., x : K variables explicativ es
 1 2 k

  a0 , a2 ,..., ak ; les ( K  1 ) paramètres inconnus à estimer


  ε : variable aléatoire


2. Écriture matricielle

Soit le modèle linéaire multiple suivant :


yt  a0  a1 xt,1  a2 xt,2  ...  ak xt,k   t
On a :
Pour t = 1 : y1  a0  a1 x1,1  a2 x1,2  ...  ak x1 ,k   1
Pour t = 2 : y2  a0  a1 x2,1  a2 x2,2  ...  ak x2 ,k   2

Pour t = T : yT  a0  a1 x,T.1  a2 xT,2,  ...  ak xT,k   T

 y1  x x1,2 ... x1,k   a0    1 


   1,1     
 y2   x2 ,1 x2 ,2 ... x2 ,k   a1    2 
 .   a    . 
  . . . .
  2  
 .   . . . .   .   . 
 yT       


  xT ,1

xT ,2 xT ,k   ak    t 
Avec:
Y( T ,1 )  X ( T ,k 1 ) .A( k 1,1 )   ( T ,1 )

25
 y1   x1,1 x1,2 ... x1,k   a0   1 
       
 y2   x 2 ,1 x 2 ,2 ... x 2 ,k   a1   2 
 . 
Y( T ,1 )   ; X ( T ,k 1 )  . . . .  ; A( k 1,1 )   a2  ;  ( t ,1 )  . 
     
 .   . . . .   .  . 
 yT  x  a   
   T ,1 xT ,2 xT ,k   k  t
 

3. Spécification des hypothèses

L'estimation du modèle économétrique défini plus haut nécessite préalablement la


formulation d'un ensemble d'hypothèses concernant essentiellement le terme aléatoire
(appelées hypothèses des MCO).
H1: le terme d'erreur a une espérance mathématique nulle. C'est à dire que le terme
d'erreur peut prendre des valeurs positives ou négatives ayant un effet plus au moins
important sur la variable dépendante (y) mais en moyenne cet effet est nul. E(  )  0
H2: le terme d'erreur a une variance constante. Cette hypothèse traduit l'idée que
l'incertitude garde le même degré de variabilité et influe de la même manière la variable
expliquée. V (  t )   2 .
H3: les termes d'erreurs sont indépendants d'une observation à une autre, c'est
l'hypothèse d'absence d'autocorrélation des erreurs. Cette hypothèse suppose que pour deux
observations distinctes l'effet de l'incertitude (  t ) à l'année t n'est pas affecté par celui de
l'année t-1. E(  t , t 1 )  0 .

Sous H2 et H3 on a :

 E(  12 ) E(  1 2 ) ... ... E(  1 T )    2 0 ... ... 0 


   
 E(  2  1 ) E(  2
2 ) ... ... E(  2  2 )   0 2 ... ... 0 
V( )   . . . .  . . . .    2 .I
    n

 . . . .   . . . . 
   
 E (  T 1 ) . . ... E(  T2 )   0 ... 2

V (  ) est la matrice des variances -covariances des termes d'erreurs, elle est symétrique.

H4: pour toutes les observations le terme d'erreur est indépendant (  t ) de la variable
explicative ( x ). Plus précisément, les effets de la variable aléatoire et de la variable
explicative sur la variable expliquée sont séparés. E(  , X )  0

H5: les variables aléatoires sont distribuées selon la loi Normale d'espérance
mathématique E(  t )  0 et de variance V (  t )   2 .  t  N ( 0, 2 )

 H6: La matrice (X ′ X) est régulière c.-à-d. dét.(X′X)  0 et (X′X)−1 existe.

26
II . Les estimateurs des moindres carrés ordinaires et leurs propriétés

Les étapes processus de modélisation sont les suivantes:

1. Estimer les valeurs des coefficients (a0, a1 , . . . , ak) à partir d'un échantillon de
données (estimateur des moindres carrés ordinaires).
2. Évaluer la précision de ces estimations (biais, variance des estimateurs).
3. Mesurer le pouvoir explicatif du modèle dans sa globalité (tableau d'analyse de
variance, coefficient de détermination).
4. Tester la réalité de la relation entre Y et les exogènes Xt (test de significativité
globale de la régression).
5. Tester l'apport d'un groupe de variables explicatives dans l'explication de Y (test
de significativité simultanée d'un groupe de coefficient).

1) Détermination des estimateurs des paramètres du modèle:

Avec l'écriture matricielle, nous pouvons produire une écriture condensée. Soit ε le vecteur
des erreurs, avec ε′ = (ε1, . . . , εT). La somme desi carrés des erreurs devient: SCR = ∑ ε2

M.C.O  Min SCR  Min  ˆ t2 avec ˆ t  yt  ŷt


T

t 1

On a Y= XA+ε  ε = Y-XA
 ˆ t2 = ˆ ' ˆ
T

t 1

Développons l'expression
 ˆ t2 = ˆ ' ˆ = (Y − XA)′(Y − XA)
T

t 1

= Y ′ Y − Y ′ XA − A′ X′Y + A′ X′XA
= Y ′ Y − 2A′X′ Y + A′X′ XA
= Y ′ Y − 2A′X′Y + A′X′XA = f ( A )
Condition du premier ordre:

( Y ' Y - 2A' X ' Y + A' X ' XA)


f '( A)  0  0
A

Après simplification on trouve :

  ( X ' X)-1 X 'Y

2) Propriétés des estimateurs:

Deux questions reviennent toujours lorsque l'on souhaite étudier les propriétés d'un
estimateur : est-il sans biais ? Est-il convergent ?
Nous allons directement à l'essentiel dans cette partie. Le détail de la démarche a déjà
été exposé dans le cadre de la régression simple (chapitre 2).

27
Biais
L'estimateur  est sans biais si E (  ) = A. Voyons à quelles conditions cette propriété est
respectée. Développons  :

  ( X ' X) -1 X ' Y
= (X′X) −1 X′ (XA + ε)
= (X ′ X) −1 X ′ XA + (X′X) −1 X′ ε
 = A + (X′X) −1X ′ ε

Ainsi, en passant à l'espérance mathématique :

E(a ) = E(A )+ E[(X ′ X)−1 X ′ ε]

E(a ) = A + E[(X ′ X)−1 X ′ ε] avec (E(A )=A)

On sait que X est non aléatoire, nous avons E[(X ′X)−1X′ε] = (X′X)−1X′E(ε) ; de plus
E(ε)= 0

Par hypothèse. Au final, nous avons bien:


E( Â ) = A
 est un estimateur sans biais

Convergence :

En calculant la variance de l'expression suivante:

V ( Â ) = V(A) + V[(X ′ X)−1 X ′ ε] on a V(A)=0 (A est constante )


V ( Â ) = V[(X ′ X)−1 X ′ ε]
= [(X ′ X)−1 X ′ ] 2 V(ε) ( d'après H2 : V (  t )   2 )
= [(X ′ X)−1 X ′ ][X(X ′ X)−1 ]  2

V ( Â ) = (X ′ X)−1  2 ( si T   V ( Â )  0 )
 est un estimateur convergent

3) Estimation de la variance de Â

Par analogie avec le chapitre 1:

La variance estimée des erreurs par la méthode des MCO est donnée par l'expression suivante:

28
T

 ˆ t
2
SCR
V̂ ( ˆ t2 )  ˆ 2  t 1
 (K+1 est le nombre de paramètres à estimer)
T  ( k  1)  T  k 1

Donc la variance estimée de  est donnée par l'expression suivante:

V̂ ( Â ) = (X ′ X)−1 ̂ 2

C'est la matrice des variances-covariances des paramètres estimés qui se présente comme suit:

 V̂ ( â0 ) côv( â0 , â1 ) ... ... côv( â0 , âk ) 


 
 côv( â1 , â0 ) V̂ ( â1 ) ... ... côv( â1 , âk ) 
V̂ ( Â )   . . . .

 
 . . . . 
 
 côv( âk , â0 ) . . ... V̂ ( âk )  n

C'est une matrice symétrique qui contient les variances des paramètres sur sa diagonale
principale et en dehors de sa diagonale principale se trouve les covariances des paramètres.

Application:
On désir estimer la relation :

yt  a  bx.t1  cxt 2   t avec t  1,...,6

Où les erreurs  i vérifient les hypothèses classiques. On dispose de la série d'observations


suivantes:

yt 0 24 12 8 12 16
xt1 -2 -1 0 0 1 2
xt2 -5 4 0 -2 2 1

1) Écrire le modèle de la régression donné ci-dessus sous forme matricielle: Y  XA   et expliquer


chaque vecteur et matrice.
2) Calculer  , l'estimateur de  par la méthode des MCO.
3) Donner un estimateur sans biais de  2 .
4) Calculer V̂ ( Â ) . Donner l'écart type de chaque coefficient estimé de la régression.

29
Réponse:

1)
0 1  2  5 
     a0   1 
 24  1  1 4     
  1 0  a1   2 
0 
Y( 6 ,1 )   12  ; X ( 6 ,3 )    ; A( 3 ,1 )   a2  ;   . 
  1 0  2    ( 6 ,1 )
 
8  1 1  a3   .
 12   2     
1 2    6
 
 1 
 16 

Y X .A  
2) Â  ( X ' X)-1 X 'Y
Calculons ( X ' X)-1 et X 'Y

1
( X ' X)-1  C Xt ' X
X'X
1  2  5 
 
1  1 4 
 1 1 1 1 1 1  6 0 0 
 1 0 0   
X X    2  1 0 0 1 2 
'
   0 10  10 
  5 4 0  2 2 1 1 0  2   0  10 50 
 1 1 2   

1 2 1 

6 0 0
10  10
X' X  0 10  10  6  2400
 10 50
0  10 50

 400 0 0   400 0 0 
   
CA   0 300  60   C A   0
t
300  60 
 0  60 60   0  60 60 
   

 400 0 0   0,166 0 0 
1 1    
( X X)  ' C X ' X 
' t -1
 0 300  60    0 0,125  0,025 
X X 2400   
 0  60 60   0  0,0250 0,025 

30
0
 
 24 
 1 1 1 1 1 1    72 
  12  
X 'Y    2  1 0 0 1 2    120 
  5 4 0  2 2 1  8   20 
  12   
 
 16 
 
 0,166 0 0  72   12   â 
      
  ( X ' X)-1 X 'Y   0 0,125  0,025 120     0,5    b̂ 
 0  0,0250 0,025  20   2,5   ĉ 

ŷt  12  0,5xt1  12 xt 2

SCR SCR
3)  2  
T  k 1 6  2 1

Calcul de SCR : SCR   yt  ŷt 


2

yt xt 1 xt 2 ŷt y t
 ŷt 
2

0 -2 -5 0.5 0.25
24 -1 4 22,5 2,25
12 0 0 . .
8 0 -2 . .
12 1 2 . .
16 2 1 . .
- - - - SCR=30

SCR 30
  2
  10
6  2 1 3

4) Matrice des variances covariances des paramètres:

 0,166 0 0  1,66 0 0 
   
V̂ ( Â )     X ' X   10 0 0,125  0,025    0 1,25  0,25 
2 1

 0  0,025 0,025   0  0,25 0,25 



Les variances estimées des paramètres:
V̂ ( â )  1,66 ; V̂ ( b̂ )  1.25 et V̂ ( ĉ )  0.25
Les écarts types estimés des paramètres:

ˆ  V̂ ( â )  1,66  1,25 ; ˆ  V̂ ( b̂ )  1.25  1,11 et ˆ  V̂ ( ĉ )  0.25  0.5


â b̂ ĉ

31
III . Décomposition de la variance totale

1) Équation d'analyse de variance

Par analogie avec le chapitre 1 l'équation d'analyse de variance est la suivante :

SCT = SCE + SCR

Avec :

SCT    yt  y    yt2  Ty 2 Y' Y  Ty 2


T 2 T

t 1 t 1

A partir de ces informations, le tableau d'analyse de variance est le suivant:

Source de Somme des carrés Somme des Carré


variation carrés moyen
Régression (X) SCE= Â' X ' Y  TY ' k SCE/k
Résiduelle ( ̂ ) SCR= Y' Y  Â' X ' Y T-k-1 SCR/T-k-1
Totale SCT= Y' Y  TY 2 T-1

2) Coefficient de détermination

Le coefficient de détermination R2 permet d'apprécier la qualité d'ajustement linéaire en


mesurant le pourcentage de la variabilité de y qui est attribuable à la variabilité des xk et
qui est donc expliquée.
SCE SCR
R2   1 ( 0  R 2  1)
SCT SCT

Problèmes associés à R 2 :

 R 2 est sensible au nombre de variables explicatives introduites dans le modèle, il augmente


chaque fois qu'on introduit une nouvelle variable explicative et ce indépendamment de son
pouvoir explicatif.
 R 2 est également une fonction décroissante du nombre d'observation pour un même nombre de
variables explicatives.

3) Coefficient de détermination

Il convient donc d'utiliser le coefficient de détermination ajusté (ou corrigé) R 2 qui tient compte du
nombre de variables explicatives dans le modèle ainsi que de la taille de l'échantillon:

SCR / T  k  1 SCR T 1
R 2  1  1 
SCT / T  1 SCT T  k  1
Où bien en fonction de R 2 :

32
 SCR T 1   SCT  SCE T 1   T 1 
R 2  1     1     1  ( 1  R 2 ) 
 SCT T  k  1  SCT T  k  1  T  k  1
R 2 Permet d'apprécier avec fiabilité la qualité d'ajustement linéaire.

Si R 2 est proche de R 2 ( R 2 - R 2 proche de zéro) avec R 2 valeur élevée on peut conclure que
la qualité d'ajustement linéaire est bonne et que la valeur élevée de R 2 n'est pas due au
nombre de variable explicatives dans le modèle mais plutôt à leur pouvoir explicative.

Remarque: R 2 peut être inférieur à 1( R 2  1 ).

Suite de l'application:

5) Calculer le coefficient de détermination R2. Interpréter le résultat.


6) Calculer le coefficient de détermination R 2 .Quelle est la différence fondamentale entre les deux
coefficients R2 et R 2 ?

Corrigé:
SCE 30
6) R 2  1  0.90
SCT 320
0
 
 24 
 12 
 72 
2

SCT  Y ' Y  Ty  0 24 12 8 12 16


2
   6   1184  864  320
8  6 
 12 
 
 16 
 
R 2 est élevé mais pour apprécier la qualité de l'ajustement linéaire on doit calculer R 2

 T 1   6 1 
7) R 2  1  ( 1  R 2 )    1  ( 1  0.9 )   0,83
 T  k  1  6  2  1

R 2 est proche de R 2 avec R 2 élevé donc on peut conclure que la qualité d'ajustement linéaire est
bonne et que la valeur élevée de R 2 n'est pas due au nombre de variable explicatives dans le modèle
mais plutôt à leur pouvoir explicative

IV. Les tests statistiques:

1) Test de Student
Soit le modèle linéaire suivant :

yt  a0  a1 xt,1  a2 xt,2  ...  ak xt,k   t

33
On veut tester si les paramètres inconnus sont égaux à une valeur particulière généralement
suggérée par la théorie. Ce test est individuel et réalisé en fonction du test de Student pour
accepter ou rejeter l'hypothèse supposée.

a) Test bilatéral:
Ce test est réaliser en 4 étapes, il consiste à tester

1ère étape: Tester si le paramètre est égal ou non à une valeur suggérée par la théorie

H 0 : ai  a*
 i=1,...,k
 H 1 :a i  a
*

2ème étape:

Pour effectuer ce test on commence par calculer une valeur empirique notée tc ( le t de student
calculé) telle que :

âi  a
tc   T ( T  k  1 ) qui suit un t de student à (T-k-1) degré de liberté
ˆ ai

3ème étape:

On cherche une valeur théorique à partir de la table de student notée t ( T  k  1 )

4ème étape: Règle de décision:

On compare la valeur théorique à celle empirique en suivant la règle suivante:

 t  t ( T  k  1 ) on accepte H

 c  0
si Avec un risque d'erreur égal à 
 t c  ( T  k  1 ) on accepte H
1

b) Test de significativité:

Ce test consiste à tester l'hypothèse nulle H0: b=0 contre une hypothèse alternative H1: ai  0
en suivant les 4 étapes cité ci dessus:

H 0 : ai  0

 H 1 : ai  0

âi
tc   ( T  k  1 )
ˆ âi

34
 t  t ( T  k  1 ) on accepte H

 c  0
si
 t c  ( T  k  1 ) on accepte H
1

Si on accepte H0 alors ai est significativement égal à 0 (ou statistiquement non significatif)


au risque de  %.

Si on accepte H1 alors ai est significativement différent de 0 (ou on dit que c'est significatif)
au risque de  %.

c) Test unilatéral:
Deux cas sont possibles

H 0 : ai  a* â  a *
er
1 cas :  tc   T( T  k  1)
 H 1 : ai  a
*
ˆ âi

 t c  t 2 ( T  k  1 ) on rejette H 0

si t  t ( T  k  1 ) on accepte H
 c 2 0

H : a  a* â  a *
2ème cas :  0 i tc   T( T  k  1)
 H 1 : ai  a
*
ˆ âi

 t c  t 2 ( T  k  1 ) on accepte H 0

si t  t ( T  k  1 ) on rejette H
 c 2 0

d) Intervalle de confiance:
 
Si a*  IC  âi  ˆ âi t ( t  k  1 ) ; âi  ˆ âi t ( t  k  1 ) on accepte H0

 
Si a*  IC  âi  ˆ âi t ( t  k  1 ) ; âi  ˆ âi t ( t  k  1 ) on accepte H1

Suite de l'application :

8) Sous l'hypothèse de normalité, tester à 5%:

a) La significativité statistique de chaque coefficient.


b) Tester l'hypothèse nulle c=2.
c) tester l'hypothèse nulle b+c=1.

35
Corrigé:

8) a-significativité des coefficients:

Pour a :

H 0 : a  0 â 12
 Avec t c   T( T  k  1)  tc   9.302 et
H1 : a  0 ˆ ai 1.23
t 0.05 ( 6  2  1 )  3.182

On a :  t c  9.302  3.182 donc on accepte l'hypothèse H1 : a est statistiquement


significatif au seuil de 5%

Pour b :

H 0 : b  0 b̂  0.5
 Avec t c   T ( T  k  1 )  tc   0.447
 H1 : b  0 ˆ b̂
i
1.118

On a :  t c  0.447  3.182 donc on accepte l'hypothèse H0 : b est statistiquement non


significatif au seuil de 5%.

Pour c :

H 0 : c  0 ĉ 2.5
 Avec t c   T ( T  k  1)  tc  5
 H1 : c  0 ˆ ĉ 0.5

On a :  t c  5  3.182 donc on accepte l'hypothèse H1 : c est statistiquement


significatif au seuil de 5%

H : c  2 ĉ  2 2.5  2
b-  0 Avec t c   T( T  k  1)  tc  1
 H1 : c  2 ˆ ĉ 0.5

 t c  1  3.182 donc on accepte l'hypothèse H0 : c est statistiquement différent de 2 au


seuil de 5%.

H 0 : b  c  1 b̂  ĉ  1
c-  avec t c   T( T  k  1)
 H1 : b  c  1 V̂ ( b̂  ĉ )

36
b̂  ĉ  1 b̂  ĉ  1  0.5  2.5  1
tc    1
V̂ ( b̂  ĉ ) V̂ ( b̂ )  V̂ ( ĉ )  2 côv( b̂ , ĉ ) 1.66  1.25  2( 0.25 )

On a t c  3.182 on accepte H0 donc b  c est significativement égale à 1 au seuil de 5%

V. Test de significativité globale

Il s'agit de tester simultanément la nullité de l'ensemble des paramètres du modèle en dehors


de la constante. Ce test permet de tester s'il existe au moins une variable exogène ( parmi les
variables introduites dans le modèle) qui contribue à l'explication de y ou si la variable
endogène y se réduit à une constante.

Remarque: le test de significativité globale n'a un sens que si le modèle contient une constante
(si non on aura yt   t )

Ce test permet d'étudier la significativité globale du modèle. Il suit la loi de Fisher et se


présente comme suit :

Soit le modèle linéaire suivant

yt  a0  a1 xt,1  a2 xt,2  ...  ak xt,k   t

On test l'hypothèse suivante:

H 0 : a1  a 2  a3  ...  a k  0

 H 1 : au  moins un paramètre différent de zéro

Pour mener ce test on calcule la statistique de Fisher suivante:

SCE / k SCE T  k  1
Fc   .  F( k ,T  k  1 )
SCR / T  k  1 SCR k

Cette statistique est comparée à une valeur théorique obtenue à partir de la table de Fisher notée:
F ( k ,T  k  1 ) à k et T-k-1 degrés de liberté.

 Fc  F ( k , T  k  1 ) on accepte H 0

si F  F ( k , T  k  1 ) on accepte H

c
 1

Si on accepte H0 le modèle est globalement non significatif à  % risque d'erreur.

37
Si on accepte H1 on conclut que le modèle est globalement significatif à  % risque d'erreur. Il
existe au moins une des variables explicatives introduites dans le modèle qui contribue à
l'explication de y.

Remarque : on peut exprimer la statistique de Fisher en fonction de R2

SCE T  k  1 SCE / SCT T  k 1 R2 T  k 1


( .)    
SCR k SCT  SCE / SCT k 1 R 2
k

Suite de l'exemple

9) Tester, au seuil de 5%, la significativité globale du modèle

Corrigé

9- Tester la significativité globale:


H 0 : a  b  c  0

 H 1 : au  moins un paramètre différent de zéro

Pour mener ce test on calcule la statistique de Fisher suivante:

SCE / k SCE T  k  1
Fc   .  F ( k ,T  k  1 )
SCR / T  k  1 SCR k
R2 T  k 1 0.90 6  2 1
     13.5
1 R 2
k 1  0.90 2

Avec F0.05 ( 2 , 3 )  9.55

On a Fc  F0.05 ( 2 , 3 )  9.55 donc on accepte H1 le modèle est globalement significatif au


seuil de 5%

VI . Prévision:

La régression est beaucoup utilisée pour la prédiction (ou prévision, on utilise plutôt ce terme
quand on manipule des données longitudinales). Pour une nouvelle valeur donnée de la
variable exogène X, nous voulons connaître la valeur que prendrait l'endogène Y

1) Prévision ponctuelle
On cherche à calculer ŷT  qui est la valeur de y à la date T   . Soient donc:

 : horizon de la prévision

38
T   : observation à laquelle on veut faire la prévision
yT  : la vraie valeur de y à T  
ŷT  : prévision de yT  (la valeur prévue)
L'estimation ponctuelle de yT  serait alors :

ŷT   â0  â1 xT  ,1  â2 xT  ,2  ...  âk xT  ,k


xT  ,1 


avec : T .  ,2  le vecteur des observations à la période 
x


xT  ,k 

2) Intervalle de prévision

Une prédiction ponctuelle est intéressante. Mais nous ne savons pas quel degré de
confiance nous pouvons lui accorder. Il est donc plus intéressant de s'intéresser à un
intervalle de prédiction (fourchette de prédiction) en lui associant une probabilité de
recouvrir la vraie valeur y.

Il s'agit d'estimer yT  par intervalle de confiance pour un niveau de confiance égale à


1


IC  ŷT   ˆ p t ( t  k  1 ) ; 
ŷT   ˆ p t ( t  k  1 )

Avec ̂ p =  2 1  X ' ( X ' X ) 1 X   est l'écart type de la prévision et X  le vecteur des


observations à la période 

Remarque:

Connaissant yT  il est possible de tester la portée prévisionnelle du modèle en observant si


yT   IC estimé.
- Si yT   IC ( yT  )  Pas de changement structurel  le modèle demeure compatible avec
les données.
- Si yT   IC ( yT  )  le modèle n'est pas compatible avec la réalité.

39
Travaux Dirigés

40
Série n°1

OPÉRATIONS SUR LES MATRICES

Objectifs de la série : Au terme de ces deux semaines et sans se référer au cours, l’étudiant aura des acquis de
quelques outils qui seront d'une grande utilité pour la compréhension du cours.

Exercice 1

On considère les matrices suivantes :

2 0 1  3 2  1
  
 1  3 2  2 1  2 2
A    , B    , C  1 1 1 , D 0 1
  1 0 3 3 1 3   1 0 2  3 
    4 0 
 2

1) Calculer toutes les sommes possibles de deux de ces matrices.


2) Effectuer les multiplications suivantes : 2A, -3B, 2 D.
3) Calculer tous les produits possibles de deux de ces matrices.
4) Donner la matrice transposée de chaque matrice donnée ci-dessus.
5) Déterminer la trace des matrices C et D.
6) La matrice C est-elle inversible ? Justifier votre réponse.

Exercice 2
Calculer les déterminants suivants :

0 1 0 1
1 1 2 1 2 1
0 0 2 2
D 1  1 2 3 , D 2   2  1 0 , , D3 
1 0 1 0
1 3 1 1 3 1
4 3 2 1

41
Exercice 3
On considère les matrices suivantes :

1 2 1   0 1  2   2 2 4
     
X   0  1 2  , Y   0 0 3  , Z    1 3 2
 1 2  3 0 0 0    1 1 4
     

1) a) Montrer que la matrice X est inversible.


b) Calculer la matrice inverse de X.
c) Déterminer Q vérifiant l’équation XQ=Xt. (Xt est la matrice transposée de X)
d) Calculer XXt.

2) a) Déterminer le rang de la matrice Z.


b) La matrice Z est- elle de plein rang? Justifier votre réponse

3) Montrer que Y est nilpotente. Donner son ordre de nilpotence.

N.B : Une matrice est nilpotente si elle s’annule à un ordre k tel que : Yk =O (O est ma matrice nulle)

Exercice 4
On considère les systèmes d’équations linéaires suivants :

2 x  y  2 z  t  0
x  y  z  4  x  2 y  3z  4 3x  y  2z  2t  6
  
S1  2x  y  3z  9 , S 2  2 x  3 y  z  11 , S 3  
 x  y  2z  3  x  3 y  2 z  1  x  2 y  2z  t  3
  x  y  2z  t  3

1) Écrire les systèmes linéaires donnés ci dessus sous une forme matricielle : AX=B
2) Calculer le déterminant des matrices A associées aux systèmes S1 et S2.
3) Les matrices associées aux systèmes S1 et S2 sont-elles inversibles? Justifier votre réponse.

Bon travail

42
Série n°2
Régression linéaire simple, estimation des paramètres, tableau ANOVA, tests statistiques

Objectifs de la série : Cette série permettra aux étudiants l'étude approfondie de la régression linéaire simple,
en fonction de l'analyse de la variance totale, la significativité globale d'un modèle linéaire simple. Aussi la série
présentera la régression linéaire multiple.

Exercice 1
Le directeur commercial d'une entreprise agroalimentaire commercialisant un bien Z souhaite étudier la variation
de la demande des consommateurs pour ce bien en fonction de son prix. Il spécifie pour cela le modèle linéaire
suivant:
qi  a0  a1 pi   i i  1,...,N

Où qi indique la demande du bien, pi son prix, et  i terme aléatoire vérifient les hypothèses de la régression linéaire
simple.
Le tableau suivant donne, pour un échantillon de 15 personnes, les valeurs de la demande du bien Z en fonction du
prix:

pi 18 16 17 12 15 15 4 13 11 6 8 10 7 7 7
qi 3 3 7 6 10 15 16 13 9 15 9 15 12 18 21

1) Tracer sur un diagramme cartésien le nuage des points liant qi et pi. Que-peut conclure?
2) Estimer les coefficients a0 et a1 par la méthode des MCO et donner l'équation de la droite d'ajustement
linéaire.
3) Donner l'interprétation économique de a1 , de â1 . Le signe de â1 est-il plausible?
4) Donner une estimation de la variance des erreurs.
5) Calculer les variances estimées des estimateurs de a0 et a1 .

Exercice 2

On considère pour un secteur donné de l'industrie, une fonction de production à un seul facteur, le travail. On
spécifie le modèle linéaire simple:

yi    xi   i avec i  1,...,25

yi représente le niveau de production pour une firme i (output), et xi la quantité de travail engagé (input) en heures
de travail. Les erreurs  i vérifient les hypothèses de la régression linéaire simple.

43
25 25 25
On vous donne: y  20 , x  10 ,  ( yi  y )2  120 ;
i 1
 ( xi  x )2  64 et
i 1
( xi 1
i  x )( yi  y )  32

et SCR= 104

1) Estimer les paramètres  et  par la méthode des MCO. Quelle est leur interprétation économique? les signes
sont ils plausibles?
2) Les coefficients  et  sont-ils significatifs au seuil de 5%.
3) Tester, au seuil de 5%, l'hypothèse nulle H0 :  =1.
4) Établir le tableau d'analyse de la variance.
5) Calculer et interpréter le coefficient de détermination R 2.

Exercice 3

Soit le modèle linéaire simple suivant:

LogDi  a0  a1 LogRi  i avec i  1,...,N (1)

Di est la dépense alimentaire en dinars tunisien du ménage "i", R i son revenu disponible en dinars tunisien. Les
 i constituent des termes aléatoires indépendants et identiquement distribués selon la loi normale d'espérance
mathématique nulle et de variance  2 . L'estimation par la méthode des MCO du modèle (1), sur un échantillon de 20
ménages, a donné les résultats suivants:

LôgDi  2.78 0.25 LogRi


( 2.64 ) ( 0.089 )

Les chiffres entre parenthèses indiquent les écart-types estimés des estimateurs de a0 et a1.

1) Construire les intervalles de confiances de a0 et a1


2) Tester la significativité des paramètres a0 et a1
3) Tester, au seuil de 5%, l'hypothèse nulle selon laquelle le paramètre a1 est égal à l'unité.
4) Tester, au seuil de 5%, l'hypothèse nulle selon laquelle le paramètre a1 est égal à 0.5.
5) Calculer le coefficient de détermination R2. Interpréter le résultat trouvé.

Exercice 4

On considère le modèle linéaire suivant:

y t  0  1 xt   t t=1,...,7

Avec :
- yt : indique le rendement par hectare de blé exprimé en quintaux par hectare.

44
- xt : représente la quantité d'engrais utilisé exprimée en quintaux par hectare.
-  t : terme aléatoire qui vérifie les hypothèses de la régression classique.
L'estimation du modèle par la méthode des moindres carrés ordinaires (MCO) a donné les résultats suivants:
- Les estimateurs des paramètres  et  sont : ˆ  32.86 et ˆ  6.785 .
0 1 0 1

- Les variances estimées des paramètres sont: ˆ 1  0.435 et ˆ 2ˆ 0  8.712 .


2
ˆ

-Le tableau d'analyse de la variance (ANOVA) est le suivant:

Source de la variabilité Somme des carrés Degré de liberté Carré moyen


Régression SCE= 1289.28 1 1289.28
Résidus SCR= ? 5 ̂ 2 =?
Total SCT=1350.26 6

1) Tester la significativité des paramètres  0 et 1 au seuil de 5%.


2) Calculer la valeur de SCR, ensuite calculer la variance estimée des erreurs ̂ 2 .
3) Calculer le coefficient de détermination R2. Interpréter le résultat trouvé.

Exercice 5
Un économiste s'efforce de déterminer le lien existant entre la production et les facteurs de production. Il dispose
pour cela des statistiques trimestrielles sur les 6 dernières années.

A) Dans un premier temps, il opte pour une spécification linéaire de la relation entre la production Q et la
production L (en utilisant le logarithme népérien).

LogQt  0  1LogLt   t (I) t=1,...,T


Où LogQt et LogLt sont respectivement le logarithme de la quantité produite de la quantité (en tonnes) et de
la quantité de travail effectué (en nombre d'heures) utilisée à la date t.
 t : Terme aléatoire du modèle vérifiant les hypothèses de la MCO.
L'estimation par la MCO du modèle I donné les résultats suivants:
LogQ̂t   9.25 2.1 LogLt SCT= 0.017 SCR1= 0.011
( 0.60 ) ( 4.72 )

Les valeurs entre parenthèses sont les écarts types estimés.

1) Interpréter les paramètres du modèle. les signes sont-ils plausibles


2) Le facteur travail est-il un facteur déterminant de la production au seuil de 5% ? autrement dit tester la
significativité de 1 . Interpréter
3) Calculer le coefficient de détermination R2. Commenter.
4) En se basant sur les résultats précédents, quels conseils peut-on donner à cet économiste.

45
B) Dans un deuxième temps l'économiste a introduit dans son modèle le facteur capital, en se basant sur la
fonction de production de type Cobb-Douglass:
Qt  ALt 1 K t2
Où Qt, Lt et Kt représentent respectivement la quantité produite, la quantité de travail utilisée et
le capital investi à la date t. Après linéarisation on obtient:
LogQt  0  1LogLt  2 LogKt   t (II)
 0 et LogKt sont respectivement les logarithmes de A et du capital investi.
L'estimation du modèle (II) par la MCO a donné les résultats suivants:
LogQ̂t  0.013 0.6 LogLt  0.61 LogKt ; SCR2=0.003 ; Cov( ˆ 1 , ˆ 2 )  0.023
( 2.77 ) ( 0.36 ) ( 0.08 )

Les valeurs entre parenthèses sont les écarts types estimés.


5) Interpréter  2 , son signe est-il plausible?
6) Tester l'hypothèse H 0 : 1   2  1 . Autrement dit est ce que les rendements d'échelle sont
constants au seuil de 5%.
Au vu des résultats ci-dessus, peut-on affirmer que le modèle (II) est meilleur que le modèle (I).

Bon travail

46
47
48
Série n°3

LA RÉGRESSION LINÉAIRE MULTIPLE, TESTS STATISTIQUES

Objectifs de la série : Cette série permettra aux étudiants de bien comprendre : la Régression linéaire multiple,
l'estimation de cette régression par la méthode des MCO, les propriétés des estimateurs, la significativité des
paramètres et la significativité globale d'un modèle linéaire simple.

Exercice 1
On désir estimer la relation
yt  a  bx1t  cx2t   t avec i  1,...,6 (1)
Où les erreurs  i vérifient les hypothèses classiques.
on dispose de la série d'observations suivantes:

yt 0 24 12 8 12 16
x1t -2 -1 0 0 1 2
x2t -5 4 0 -2 2 1

1) Écrire le modèle de régression sous forme matricielle:


Y  X  
Expliquer chaque vecteur et matrice.
2) Calculer ̂ , l'estimateur de  par la méthode des MCO. Donner la matrice de variances-
covariances de ̂ , (V ̂ ).
3) Donner un estimateur sans biais de  2 . Calculer V̂(ˆ ) . Donner l'écart type de chaque coefficient
estimé de la régression.
4) Calculer le coefficient de détermination R2, et interpréter le résultat.
5) Sous l'hypothèse de normalité, tester à 5%:

a) La significativité statistique de chaque coefficient.


b) Tester l'hypothèse nulle c=2.
c) tester l'hypothèse nulle b+c=1.

Exercice 2
L'estimation d'un modèle linéaire par les MCO, sur une série de données trimestrielles, donne les
résultats suivants:

ŷ  2.2  0.14 x1t  3.48 x2t  0.34 x3t t  1,...,64


( 3.4 ) ( 0.005) ( 2.2 ) ( 0.15 )

49
Les chiffres entre parenthèses indiquent les écart-type. On donne aussi :
SCE=112.5 et SCR= 19.5.

1) Les coefficients de régression sont ils significatifs au seuil de 5%?


2) Calculer le coefficient de détermination multiple R2.
3) Calculer le coefficient de détermination R 2 . Quelle est la différence fondamentale entre
les deux coefficients?
4) Effectuer un test global de la significativité.

Exercice 3
On se propose d'estimer, sur la période [1961-1990], le modèle de régression linéaire suivant:

yt   0  1 x1t   2 x2t  t avec t  1,..., T

où y est la variable expliquée du modèle, x1 et x2 constituent des variables explicatives. Les


erreurs  t sont supposées homoscedastiques, indépendantes, et d'espérance mathématique nulle.
 0 , 1 et  2 sont les paramètres à estimer. On fournit les calculs intermédiaires suivants:

 0.0643 0.0057  0.0149


2 1
 
ˆ (X' X)   0.0459  0.0274
 0.0286 

 112.15 
 
X' Y   366.65 , SCR = 42.823
 579.65
 

1) Estimer les coefficients de la régression  0 , 1 et  2 et  2 par la méthode des MCO.


2) Construire, au niveau de confiance de 95%, les intervalles de confiance de  0 , 1 et  2 et  2
3) Tester la significativité statistique individuelle des paramètres  0 , 1 et  2 avec un risque
d'erreur de 5 %.
4) Construire le tableau ANOVA. Préciser la qualité d'ajustement linéaire. En déduire le
coefficient de détermination ajusté. Tester si le modèle est globalement significatif.
5) Tester, au seuil de 5%, l'hypothèse nulle suivante: H0:  0 =0 et 1 +  2 =0

Bon travail

50
Références
- Bourbonnais. Régis, « Économétrie ». Dunod 8 ème et 9 ème éd. 2011-2015.
- Ghazouani. Samir et Goaied Mohamed. "Économétrie", tome 1 Edition S CLS.1997
- Hanène Ben Wada-Jamoussi." Initiation à l'économétrie". Tunis, C.P.U, 2000
- Kriaa Farouk " Économétrie: cours et exercices corrigés" 2008

51
Corrigé de la série 2

52
53
54
55
56
57
58
Corrigé de la série n°3

59
60
61
62
63
64
65

Vous aimerez peut-être aussi