Académique Documents
Professionnel Documents
Culture Documents
Économétrie
Imen Ouerghi
Sommaire
Introduction ................................................................................................................................................. 5
a) Modèle: ........................................................................................................................................... 6
Chapitre 1.................................................................................................................................................... 8
Introduction ................................................................................................................................................. 8
2
1) Test de Student .............................................................................................................................. 19
Chapitre 2.................................................................................................................................................. 25
Introduction ............................................................................................................................................... 25
3
1) Test de Student .................................................................................................................................. 33
VI . Prévision: ........................................................................................................................................... 38
4
Introduction
1. Définition de l'économétrie
Plusieurs définitions ont été attribuées à la notion de l'économétrie, nous reprenons au niveau de ce
cours deux définitions afin de comprendre clairement cette notion.
Définition 1: L'économétrie est définie comme étant un outil à la disposition de l'économiste qui
lui permet d'infirmer ou de confirmer les théories qu'il construit (Bourbonnais. R). Pour ce faire, un
traitement mathématique s'effectue sur des données statistiques, permettant de vérifier la validité ou
non des théories économiques.
2. Utilité de l'économétrie
Les résultats d'une analyse économétrique sont d'une grande utilité pour les décideurs. Ses
principaux objectifs sont :
- L'élaboration des prévisions à partir des résultats des modèles explicatifs.
- La compréhension des phénomènes étudiés en mettant en évidence l'effet isolé de chaque
déterminant introduit dans le modèle.
- l'évaluation des effets de certaines actions ou politiques économiques
Le champ d'application de l'économétrie et varié et touche plusieurs domaines à savoir:
- la production: détermination du volume de production d'une entreprise par le facteur travail.
- Le marketing: déterminer l'effet de la publicité sur l'évolution des ventes.
- Le transport : prévoir le nombre de voyageurs pour le transport publics.
3. Modèle économétrique
Toute analyse économétrique se base sur des modèles il est donc indispensable de définir la notion du
modèle, puis la notion du modèle économique et économétrique.
5
a) Modèle:
Un modèle consiste en la représentation formelle d'idées ou de connaissances relative à un
phénomène. Ces idées sont généralement traduites sous la forme d'un système
mathématique.
b) Modèle économique:
Un modèle économique est une formalisation logique de ce que l'analyse économique
suggère être s économétrique est un modèle économique faisant intervenir l'aléatoire. En
effet, le modèle économétrique fait intervenir une variable remplaçant l'effet des facteurs
qui ont été oubliés par l'économètre.
4. Paramètres et Variables
Les relations existantes dans un modèle économétrique font intervenir des paramètres et des
variables. La distinction entre paramètres et variables est fondamentale. Ainsi, nous avons :
a)les paramètres:
Ce sont des constantes inconnues dont le modèle économétrique permet donner leurs
valeurs (on dit estimer leurs valeurs).
b)les variables:
Nos distinguons deux types de variables: les variables économiques et les variables
d'erreurs (ou aléatoires). Plus précisément
* les variables explicatives sont des données qui permettent d'expliquer la variable
dépendante. Ce sont des variables explicatives (appelée aussi variables exogènes).
- la variable d'aléatoire : appelée aussi terme d'erreur ou terme aléatoire, qui remplace les
facteurs qui échappent au contrôle de l'économétrie. Autrement dit, elle remplace les facteurs qui
peuvent expliquer la variable dépendante et qui ne sont pas introduit dans le modèle sous forme de
variables explicatives.
6
Modèle économiques: variable dépendante+ variables indépendantes
Modèle économétrique :
Variable aléatoire ou terme d'erreur
7
Chapitre 1
Introduction
Le modèle de la régression linéaire simple représente le cas le plus simple à traiter. Son étude est
toutefois indispensable pour la compréhension des méthodes plus complexes.
1) Spécification du modèle
On cherche à mettre en avant une relation de dépendance entre les variables y et x . y est celle
que l'on cherche à expliquer (à prédire), on parle de variable endogène (dépendante) ; x est la
variable explicative (prédictive), on parle de variable exogène (indépendante).
Un modèle linéaire simple est un modèle qui comporte une seule variable explicative. Il se
présente comme suit:
yt a bxt t
Avec:
Un des objectifs de l'économétrie est de réduire autant que possible l'incertitude non
maitrisable des phénomènes étudiés ( t ). Ceci conduit à formuer certaines hypothèses concernant
le terme d'erreur. Ces hypothèses sont nécessaires pour l'obtention d'estimateurs efficaces. Nous
présentons dans ce qui suit les hypothèses liées à l'estimation d'un modèle simple:
H1: E( t ) 0 : le terme d'erreur a une espérance mathématique nulle. C'est à dire que le
terme d'erreur peut prendre des valeurs positives ou négatives ayant un effet plus au moins
important sur la variable dépendante (y) mais en moyenne cet effet est nul.
8
H2: V ( t ) 2 : le terme d'erreur a une variance constante. Cette hypothèse traduit l'idée
que l'incertitude garde le même degré de variabilité et influe de la même manière la variable
expliquée. (On dit que les erreurs dont l'hypothèse de l'Homoscédastique ou bien c'est l'hypothèse
de l'homoscédasticité) .
H3: E( t , t 1 ) 0 : les termes d'erreurs sont indépendants d'une observation à une autre, c'est
l'hypothèse d'absence d'autocorrélation des erreurs. Cette hypothèse suppose que pour deux
observations distinctes l'effet de l'incertitude ( t ) à l'année t n'est pas affecté par celui de l'année t-1.
H5: les variables aléatoires sont distribuées selon la loi Normale d'espérance mathématique
E( t ) 0 et de variance V ( t ) 2 . t N ( 0, 2 ) .
En résumé:
H1: E( t ) 0 t
H2: V ( t ) 2 t
H3: E( t , t 1 ) 0 t
H4: E( xt , t ) 0 t
H5: t N ( 0, 2 )
Les T observations sur un phénomène donné sont représentés par T points dans un repère cartésien.
Ces T points forment un nuage de points.
Notre objectif est d'essayer de résumer l'information fournie par e nuage de points sous une forme
simplifiée. On dit qu'on procède à un ajustement du nuage de points qui est représenté par une
droite d'ajustement linéaire.
En effet, par le nuage de points on peut faire passer une infinité de droites et un bon ajustement est
celui qui traduit de la manière la plus fiable la réalisation du phénomène étudiée. Plus exactement
celui qui fait perdre le minimum d'informations.
Le problème qui se pose est de trouver la droite (l'équation de la droite) qui soit proche de tous les
points du nuage. C'est à dire de trouver les valeurs des constantes a et b de l'équation de la droite :
yt a bxt t .
9
La solution préconisée est celle qui consiste à choisir la droite qui minimise la somme des carrés
des distances entre les points du nuage et la droite d'ajustement linéaire. On parle dans ce cas de la
méthode des Moindres Carrés Ordinaires (MCO). Soit analytiquement:
T
Min ( y t a bxt ) 2 Min t2
t 1
La méthode des MCO consiste à minimiser la somme des carrés des erreurs (des écarts entre les
valeurs observées de y et les valeurs estimées qui se trouvent sur la droite d'ajustement linéaire. soit:
T
Min ( yt a bxt )2 Min t2
t 1
Les conditions nécessaires de minimisation nous permettent d'obtenir par la méthode MCO les
estimateurs des paramètres a et b notés â et b̂ .
t 1
t
2
( y t a bxt ) 2 f ( a ,b )
f a' 0
'
f b 0
- Condition du deuxième ordre: les dérivées secondes doivent être toutes positives
10
f a' 0
La résolution du système permet de trouver les expressions des estimateurs de a et b notés
f b' 0
f a' 0
f a' ( y t a bxt ) 0
f ' ( y t a bxt ) 0
' ' a'
f b 0
f b xt ( y t a bxt ) 0
f b xt ( y t a bxt ) 0
T
xt y t T x y
b̂ t 1
T
et â y b̂x
x Tx
2
t
2
t 1
T
(xt - x )(yt y ) COV ( x, y)
Autre expression de b̂ : b̂ t 1
T
V(x)
(xt x )2
t 1
â : La valeur autonome de y
Exemple:
Où qi indique la demande du bien, pi son prix, et i terme aléatoire vérifient les hypothèses de la régression linéaire
simple.
Le tableau suivant donne, pour un échantillon de 15 personnes, les valeurs de la demande du bien Z en fonction
du prix:
pi 18 16 17 12 15 15 4 13 11 6 8 10 7 7 7
qi 3 3 7 6 10 15 16 13 9 15 9 15 12 18 21
1) Tracer sur un diagramme cartésien le nuage des points liant q i et pi. Que-peut conclure?
2) Estimer les coefficients a0 et a1 par la méthode des MCO et donner l'équation de la droite d'ajustement
linéaire.
3) Donner l'interprétation économique de a1 , de â1 . Le signe de â1 est-il plausible?
11
Corrigé
1) qi
pi
On remarque que le nuage de points est décroissant, il n'est pas vraiment linéaire et qu'il se prête
difficilement à un ajustement linéaire.
15
(p i - p)(qi q )
2) â1 i 1 et â0 p â1 p
15
(p
i 1
i p) 2
15
15
p i
q
i 1
i
On calcule: p i 1
11,06 et q 11,47 q̂i 20,75 0,87 pi
15 15
SCT SCR
12
15
(p i - p)(qi q )
234,43
â1 i 1
0,87 et â0 11,47 ( 0,87 )11,06 20,75
15
278,88
(p
i 1
i p )2
q i
3) a1 : C'est la variation de la demande suite à une variation unitaire du prix
pi
q̂
â1 i 0,87 : C'est une estimation de la variation de la demande suite à une variation unitaire du prix
pi
Le signe de â1 est plausible car il est négatif, ceci veut dire que si le prix augmente d'une unité alors la
quantité demandée diminue de 0,87 unité ce qui est conforme à la théorie de la demande.
-Linéarité:
P1) â et b̂ sont des estimateurs linéaires, puisqu'il s'agit d'un modèle linéaire.
-Centralité:
P2) â et b̂ sont des estimateurs sans biais, en effet E( â ) 0 et E( b̂ ) 0
T T T 0 T T y
t
t 1
(xt - x )(yt y )
t 1
(xt - x )y t ( xt - x ) y
t 1
(xt - x )y t
t 1
(xt - x )( a bxt t )
b̂ T
T
1
T
T
(xt 1
t x )2 (x
t 1
t x )2 (x
t 1
t x )2 (x
t 1
t x )2
T
(Sachant que ( x
t 1
t - x ) 0 et yt a bxt t ) )
T t
y T T T
(xt - x )( a bxt t ) a
t 1
(xt - x ) b (xt - x )x t (x - x)
t
t 1
b̂ T
T
1 t 1 t
(x
t 1
t x )2 (x
t 1
t x )2
13
T T T
On note que : ( xt - x ) 0 et (xt - x )xt = (xt x )2 donc après simplification on obtient
t 1 t 1 t 1
l'expression suivante de b̂ :
T T T
b (x - x)x
t 1
t t (x - x)
t 1
t t (x - x)
t 1
t t
b̂ T
T
b T
(x
t 1
t x ) 2
(x
t 1
t x ) 2
(x
t 1
t x )2
T
T
(xt - x )x t
t 1
t 1
(xt x )
2
T T
t 1
(xt - x ) t
(x - x)
t 1
t
t
E( b̂ ) E b E( b ) E
T
T
2
(xt x ) 2 (xt x )
t 1 t 1
Du fait que E( b ) b (d'après les propretés de l'espérance mathématique) on a alors:
T T
(x - x)
t
t (x - x) t
E( b̂ ) E( b ) E T
t 1
b T
t 1
E( t ) (D'après : H1: E( t ) 0 )
2
t 1
(xt x )
(x
t 1
t x ) 2
T
(xt - x)
t 1
E( b̂ ) b T
E( t ) b E( b̂ ) b CQFD
(xt x ) 2
t 1
-Convergence:
P3) â et b̂ sont des estimateurs convergents, en effet lim V ( â ) 0 et lim V ( b̂ ) 0
T T
Démonstration:
14
2
T T T T
b (xt - x )t
(xt - x ) t
(xt - x ) t
(xt - x )t
2
V ( b̂ ) t 1
T
t 1
V( b ) V T
t 1
0 T
t 1
V t T
2
t 1
(xt x ) 2
t 1
(xt x ) 2
t 1
(xt x )
(x
t 1
t x )2
2 cte
lim V ( b̂ ) lim 0 b̂ est un estimateur convergent (CQFD)
t t T
(x
t 1
t x )2
Théorème de Gauss-Markov:
Les estimateurs des MCO de la régression sont sans biais et convergents. On peut même aller plus
loin et prouver que parmi les estimateurs linéaires sans biais de la régression, les estimateurs MCO
sont à variance minimale c.-à-d. il n'existe pas d'autres estimateurs linéaires sans biais présentant
une plus petite variance. Les estimateurs des MCO sont BLUE (Best Linear Unbiased Estimator).
On dit qu'ils sont efficaces.
D'après 3) on trouve que la variance du paramètre b est donnée par l'expression suivante :
2
V ( b̂ ) T
(x
t 1
t x )2
On montre de même que celle de a est : 1
V ( â ) 2
2
x
T
T
(xt x )2
t 1
On remarque que les variances des paramètres a et b dépendent toutes les deux de la variance
des erreurs, il est donc utile d'estimer sa valeur.
La variance estimée des erreurs par la méthode des MCO est donnée par l'expression suivante:
T
ˆ
t 1
t
2
SCR Somme des carrés des résidus
V̂ ( ˆ t2 ) ˆ 2
T 2 T 2 deg ré de liberté
Par conséquent, les variances estimées des paramètres sont données par les expressions
suivantes:
ˆ 2 1 2
V̂ ( b̂ ) et V̂ ( â ) ˆ
2 x
T
(x
T
T
t x ) 2 (xt x )2
t 1 t 1
On peut ainsi déduire les écarts types estimés des paramètres sont donnés par les racines carrés des
variances estimées. On ainsi:
15
ˆ 2 et ----
ˆ b̂ V̂ ( b̂ ) T
(xt x ) 2
t 1
Suite de l'exemple:
Corrigé
T 15
ˆ t2 SCR
( q i q̂i ) 2
204, ,93
4) ˆ 2 t 1
i 1
15,76
N 2 N 2 15 2 13
1 p̂ 2 1 ( 11,47 )2
5) V̂ ( â0 ) ˆ 2 15 15,76 7 ,76
N 2 15 278,88
i 1
(qi q )
ˆ 2 15,76
V̂ ( â1 ) 15
0,056
(q
278,88
i qi )2
i 1
La méthode des MCO fournie les meilleurs estimateurs (sous les hypothèses de la MCO). Ce
paragraphe a pour objectif de vérifier l'adéquation entre le modèle et les faits rérls. Une telle
procédure se base aussi bien sur l'analyse de la variance totale de la variable endogène que sur les
tests statistiques.
SCT est la somme des carrés totaux, elle indique la variabilité totale de Y c.-à-d. l'information
disponible dans les données.
16
SCE est la somme des carrés expliqués, elle indique la variabilité expliquée par le modèle c.-à-d. la
variation de Y expliquée par X.
SCR est somme des carrés résiduels, elle indique la variabilité non-expliquée (résiduelle) par le
modèle c.-à-d. l'écart entre les valeurs observées de Y et celles prédites par le modèle.
T T T
t 1
(ŷ t y ) 2 = t 1
(yt ŷ t ) 2 + ( ŷ
t 1
t y )2
A partir de ces informations, nous pouvons produire une première version du tableau
d'analyse de variance (Tableau 1.1). La version complète nous permettra de mener le test de
significativité globale de la régression comme nous le verrons plus loin (section 3.1).
Résiduelle ( ̂ ) T SCR/T-2
SCR= (yt ŷt )2 T-2
t 1
Totale T SCT/T-1
SCT= (ŷt y ) 2 T-1
t 1
1:le nombre de variable explicative dans le modèle (une seule puisqu'il s'agit d'un modèle simple)
T-2: le degré de liberté des erreurs (nombre d'observation - nombre de paramètres à estimés)
T-1: (T-2) +1
2. Coefficient de détermination
SCE SCR
R2 1
SCT SCT
17
Deux situations extrêmes peuvent survenir :
- si SCR = 0 alors SCT = SCE : les variations de y sont complètement expliquées par
celles de x. On a un modèle parfait, la droite de régression passe exactement par tous les
points du nuage (ŷ i = yi) et R 2 1
- si SCE = 0 : x n'apporte aucune information sur y il s'agit d'une mauvaise
spécification, le nuage de point est très dispersé et R 2 0
* si R2 est proche de 1 donc il s'agit d'une bonne qualité d'ajustement linéaire (pour R2=0.8
: 80% de la variabilité totale est expliquée par le modèle, 20% reste inexpliquée ou
résiduelle (expliquée par d'autres facteurs) )
Dans le cas où le modèle est mal spécifié ceci peut être expliqué soit par l'existence des
facteurs autres que x qui peuvent expliquer y, soit que la relation entre y et x n'est
pas linéaire.
Suite de l'exemple:
Corrigé
Résiduelle N SCR/N-2=
SCR (qt q̂i )2 204,93
( ̂ ) i 1
N-2=13 15,76
Totale N _________
SCT (qi q )2 413,01 N-1=14
i 1
a
2
SCE= 2
1 ( pt p ) 2 = (-0,87) .278,88 = 211,08
i 1
18
VI. Les tests statistiques:
1) Test de Student
Soit le modèle linéaire suivant : yt a bxt t
On veut tester si les paramètres inconnus sont égaux à une valeur particulière généralement
suggérée par la théorie. Ce test est individuel (test sur a et sur b) et réalisé en fonction du test de
Student pour accepter ou rejeter l'hypothèse supposée.
a) Test bilatéral:
Ce test est réaliser en 4 étapes, il consiste à tester
1ère étape: Tester si le paramètre est égal ou non à une valeur suggérée par la théorie
H 0 : b b*
H1 : b b
*
2ème étape:
Pour effectuer ce test on commence par calculer une valeur empirique notée tc ( le t de student
calculé) telle que :
b̂ b
tc T( T 2 ) qui Suit un t de student à (T-2) degré de liberté
ˆ b̂
3ème étape:
t t ( T 2 ) on accepte H
c 0
si Avec un risque d'erreur égal à
tc ( T 2 ) on accepte H 1
b) Test de significativité:
Ce test consiste à tester l'hypothèse nulle H0: b=0 contre une hypothèse alternative H1:b 0 en
suivant les 4 étapes cité ci dessus:
H 0 : b 0
H1 : b 0
19
b̂
tc T( T 2 )
ˆ b̂
t t ( T 2 ) on accepte H
c 0
si
tc ( T 2 ) on accepte H 1
Si on accepte H1 alors b est significativement différent de 0 (ou on dit que c'est significatif) au
risque de %.
c) Test unilatéral:
Deux cas sont possibles
t t ( T 2 ) on rejette H 0
H : b b* b̂ b * c 2
er
1 cas : 0 tc T( T 2 ) si t t ( T 2 ) on accepte H
H1 : b b
*
ˆ b̂ c 2 0
t t ( T 2 ) on accepte H 0
H 0 : b b* b̂ b * c 2
2ème
cas : tc T( T 2 ) si t t ( T 2 ) on rejette H
H1 : b b
*
ˆ b̂ c 2
0
On sait que :
b̂ b *
tc T( T 2 )
ˆ b̂
IC/ Pt c t ( t 2 ) 1
P t t c t 1
b̂ b *
P t t 1
ˆ b̂
P ˆ b̂t b̂ b* ˆ b̂t 1
IC/
P b̂ ˆ b̂t b* b̂ ˆ b̂t 1
20
Par exemple si =5% alors il y a 95% de chance que la vraie valeur du paramètre b soit comprise
dans l'intervalle de confiance.
Si b IC b̂ ˆ b̂ t ( t 2 ) ;
b̂ ˆ b̂ t ( t 2 ) on accepte H0 à % risque d'erreur
Si b IC b̂ ˆ t
b̂
(t 2) ;
b ˆ b̂ t ( t 2 ) on accepte H1 à % risque d'erreur
Suite de l'exemple:
8) Intervalle de confiance de a0 : IC( a0 ) 20,75 7,76 2,160 ; 20,75 7,76 2,160
IC( a0 ) 14,73 ; 20,76
Intervalle de confiance de a1 : IC( a1 ) 0,87 0,056 2,160 ; 0,87 0,056 2,160
IC( a1 ) 1,38 ; 0,35
9) Test de significativité de a0 :
Test de significativité de a1 :
0 IC( a1 ) 1,38 ; 0,35 a1 est significativement différents de zéro au risque de 5%
H 0 : a 0 1
H 1 : a1 1
* Estimation par IC: 1 IC( a1 ) 1,38 ; 0,35 a1 est significativement égal à1 au risque de 5%
â1 a1 0;87 ( 1 )
tc 0,56
ˆ â1 0,056
21
0,56 2,160 On accepte H0 donc a1 est significativement égal à 1 au risque de 5%
yt a bxt t
H 0 : b 0
H1 : b 0
Pour mener ce test on calcule la statistique de Fisher suivante:
SCE / 1 SCE
Fc .( T 2 ) F ( 1,T 2 )
SCR / T 2 SCR
Cette statistique est comparée à une valeur théorique obtenue à partir de la table de Fisher notée: F ( 1 ,T 2 )
Fc F ( 1,T 2 ) on accepte H 0
si F F ( 1,T 2 ) on accepte H
c
1
Si on accepte H0 le modèle est globalement non significatif à % risque d'erreur. Par contre si on
accepte H1 on conclut que le modèle est globalement significatif à % risque d'erreur.
Suite de l'exemple:
Corrigé
H 0 : a 0 1
H 1 : a1 1
22
SCE / 1 SCE
Fc .( N 2 )
SCR / N 2 SCR
211,08
( 15 2 ) 6,64
413,01
On calcule cette valeur au Fisher tabulé à 1 et 13 ddl à 5 % risque d'erreur: F5% ( 1 ,15 2 ) 4,67
On remarque que Fc 6,64 F ( 1,13 ) 4,67 donc on accepte H1 le modèle est globalement
5%
significatif au risque de 5%.
IV. Prévision:
La régression est beaucoup utilisée pour la prédiction (ou prévision, on utilise plutôt ce terme
quand on manipule des données longitudinales). Pour une nouvelle valeur donnée de la variable
exogène X, nous voulons connaître la valeur que prendrait l'endogène Y
1) Prévision ponctuelle
On cherche à calculer ŷT qui est la valeur de y à la date T . Soient donc:
: horizon de la prévision
T : observation à laquelle on veut faire la prévision
yT : la vraie valeur de y à T
ŷT : prévision de yT (la valeur prévue)
L'estimation ponctuelle de yT serait alors :
ŷT â b̂xT
2) Intervalle de prévision
Une prédiction ponctuelle est intéressante. Mais nous ne savons pas quel degré de
confiance nous pouvons lui accorder. Il est donc plus intéressant de s'intéresser à un intervalle
de prédiction (fourchette de prédiction) en lui associant une probabilité de recouvrir la vraie
valeur y.
IC ŷT ˆ pt ( t 2 ) ;
ŷT ˆ pt ( t 2 )
T ( x t x )
2
23
Remarque:
Suite de l'application:
Calculer pour p16 = 10 une prévision ponctuelle de la quantité demandée, puis donner un intervalle
de confiance de la prévision à 95% degré de confiance.
Réponse:
La prévision ponctuelle da la quantité demandée est donnée par l'équation de la droite d'ajustement
linéaire: q̂i 20,75 0,87 pi
15 278,88
24
Chapitre 2
Introduction
Le modèle de la régression linéaire multiple est une généralisation du modèle simple, il
contient k variables explicatives avec k > 2.
1. Spécification du modèle
25
y1 x1,1 x1,2 ... x1,k a0 1
y2 x 2 ,1 x 2 ,2 ... x 2 ,k a1 2
.
Y( T ,1 ) ; X ( T ,k 1 ) . . . . ; A( k 1,1 ) a2 ; ( t ,1 ) .
. . . . . . .
yT x a
T ,1 xT ,2 xT ,k k t
Sous H2 et H3 on a :
. . . . . . . .
E ( T 1 ) . . ... E( T2 ) 0 ... 2
V ( ) est la matrice des variances -covariances des termes d'erreurs, elle est symétrique.
H4: pour toutes les observations le terme d'erreur est indépendant ( t ) de la variable
explicative ( x ). Plus précisément, les effets de la variable aléatoire et de la variable
explicative sur la variable expliquée sont séparés. E( , X ) 0
H5: les variables aléatoires sont distribuées selon la loi Normale d'espérance
mathématique E( t ) 0 et de variance V ( t ) 2 . t N ( 0, 2 )
26
II . Les estimateurs des moindres carrés ordinaires et leurs propriétés
1. Estimer les valeurs des coefficients (a0, a1 , . . . , ak) à partir d'un échantillon de
données (estimateur des moindres carrés ordinaires).
2. Évaluer la précision de ces estimations (biais, variance des estimateurs).
3. Mesurer le pouvoir explicatif du modèle dans sa globalité (tableau d'analyse de
variance, coefficient de détermination).
4. Tester la réalité de la relation entre Y et les exogènes Xt (test de significativité
globale de la régression).
5. Tester l'apport d'un groupe de variables explicatives dans l'explication de Y (test
de significativité simultanée d'un groupe de coefficient).
Avec l'écriture matricielle, nous pouvons produire une écriture condensée. Soit ε le vecteur
des erreurs, avec ε′ = (ε1, . . . , εT). La somme desi carrés des erreurs devient: SCR = ∑ ε2
t 1
On a Y= XA+ε ε = Y-XA
ˆ t2 = ˆ ' ˆ
T
t 1
Développons l'expression
ˆ t2 = ˆ ' ˆ = (Y − XA)′(Y − XA)
T
t 1
= Y ′ Y − Y ′ XA − A′ X′Y + A′ X′XA
= Y ′ Y − 2A′X′ Y + A′X′ XA
= Y ′ Y − 2A′X′Y + A′X′XA = f ( A )
Condition du premier ordre:
Deux questions reviennent toujours lorsque l'on souhaite étudier les propriétés d'un
estimateur : est-il sans biais ? Est-il convergent ?
Nous allons directement à l'essentiel dans cette partie. Le détail de la démarche a déjà
été exposé dans le cadre de la régression simple (chapitre 2).
27
Biais
L'estimateur  est sans biais si E (  ) = A. Voyons à quelles conditions cette propriété est
respectée. Développons  :
 ( X ' X) -1 X ' Y
= (X′X) −1 X′ (XA + ε)
= (X ′ X) −1 X ′ XA + (X′X) −1 X′ ε
 = A + (X′X) −1X ′ ε
On sait que X est non aléatoire, nous avons E[(X ′X)−1X′ε] = (X′X)−1X′E(ε) ; de plus
E(ε)= 0
Convergence :
V ( Â ) = (X ′ X)−1 2 ( si T V ( Â ) 0 )
 est un estimateur convergent
3) Estimation de la variance de Â
La variance estimée des erreurs par la méthode des MCO est donnée par l'expression suivante:
28
T
ˆ t
2
SCR
V̂ ( ˆ t2 ) ˆ 2 t 1
(K+1 est le nombre de paramètres à estimer)
T ( k 1) T k 1
V̂ ( Â ) = (X ′ X)−1 ̂ 2
C'est la matrice des variances-covariances des paramètres estimés qui se présente comme suit:
C'est une matrice symétrique qui contient les variances des paramètres sur sa diagonale
principale et en dehors de sa diagonale principale se trouve les covariances des paramètres.
Application:
On désir estimer la relation :
yt 0 24 12 8 12 16
xt1 -2 -1 0 0 1 2
xt2 -5 4 0 -2 2 1
29
Réponse:
1)
0 1 2 5
a0 1
24 1 1 4
1 0 a1 2
0
Y( 6 ,1 ) 12 ; X ( 6 ,3 ) ; A( 3 ,1 ) a2 ; .
1 0 2 ( 6 ,1 )
8 1 1 a3 .
12 2
1 2 6
1
16
Y X .A
2) Â ( X ' X)-1 X 'Y
Calculons ( X ' X)-1 et X 'Y
1
( X ' X)-1 C Xt ' X
X'X
1 2 5
1 1 4
1 1 1 1 1 1 6 0 0
1 0 0
X X 2 1 0 0 1 2
'
0 10 10
5 4 0 2 2 1 1 0 2 0 10 50
1 1 2
1 2 1
6 0 0
10 10
X' X 0 10 10 6 2400
10 50
0 10 50
400 0 0 400 0 0
CA 0 300 60 C A 0
t
300 60
0 60 60 0 60 60
400 0 0 0,166 0 0
1 1
( X X) ' C X ' X
' t -1
0 300 60 0 0,125 0,025
X X 2400
0 60 60 0 0,0250 0,025
30
0
24
1 1 1 1 1 1 72
12
X 'Y 2 1 0 0 1 2 120
5 4 0 2 2 1 8 20
12
16
0,166 0 0 72 12 â
 ( X ' X)-1 X 'Y 0 0,125 0,025 120 0,5 b̂
0 0,0250 0,025 20 2,5 ĉ
ŷt 12 0,5xt1 12 xt 2
SCR SCR
3) 2
T k 1 6 2 1
yt xt 1 xt 2 ŷt y t
ŷt
2
0 -2 -5 0.5 0.25
24 -1 4 22,5 2,25
12 0 0 . .
8 0 -2 . .
12 1 2 . .
16 2 1 . .
- - - - SCR=30
SCR 30
2
10
6 2 1 3
0,166 0 0 1,66 0 0
V̂ ( Â ) X ' X 10 0 0,125 0,025 0 1,25 0,25
2 1
31
III . Décomposition de la variance totale
Avec :
t 1 t 1
2) Coefficient de détermination
Problèmes associés à R 2 :
3) Coefficient de détermination
Il convient donc d'utiliser le coefficient de détermination ajusté (ou corrigé) R 2 qui tient compte du
nombre de variables explicatives dans le modèle ainsi que de la taille de l'échantillon:
SCR / T k 1 SCR T 1
R 2 1 1
SCT / T 1 SCT T k 1
Où bien en fonction de R 2 :
32
SCR T 1 SCT SCE T 1 T 1
R 2 1 1 1 ( 1 R 2 )
SCT T k 1 SCT T k 1 T k 1
R 2 Permet d'apprécier avec fiabilité la qualité d'ajustement linéaire.
Si R 2 est proche de R 2 ( R 2 - R 2 proche de zéro) avec R 2 valeur élevée on peut conclure que
la qualité d'ajustement linéaire est bonne et que la valeur élevée de R 2 n'est pas due au
nombre de variable explicatives dans le modèle mais plutôt à leur pouvoir explicative.
Suite de l'application:
Corrigé:
SCE 30
6) R 2 1 0.90
SCT 320
0
24
12
72
2
T 1 6 1
7) R 2 1 ( 1 R 2 ) 1 ( 1 0.9 ) 0,83
T k 1 6 2 1
R 2 est proche de R 2 avec R 2 élevé donc on peut conclure que la qualité d'ajustement linéaire est
bonne et que la valeur élevée de R 2 n'est pas due au nombre de variable explicatives dans le modèle
mais plutôt à leur pouvoir explicative
1) Test de Student
Soit le modèle linéaire suivant :
33
On veut tester si les paramètres inconnus sont égaux à une valeur particulière généralement
suggérée par la théorie. Ce test est individuel et réalisé en fonction du test de Student pour
accepter ou rejeter l'hypothèse supposée.
a) Test bilatéral:
Ce test est réaliser en 4 étapes, il consiste à tester
1ère étape: Tester si le paramètre est égal ou non à une valeur suggérée par la théorie
H 0 : ai a*
i=1,...,k
H 1 :a i a
*
2ème étape:
Pour effectuer ce test on commence par calculer une valeur empirique notée tc ( le t de student
calculé) telle que :
âi a
tc T ( T k 1 ) qui suit un t de student à (T-k-1) degré de liberté
ˆ ai
3ème étape:
t t ( T k 1 ) on accepte H
c 0
si Avec un risque d'erreur égal à
t c ( T k 1 ) on accepte H
1
b) Test de significativité:
Ce test consiste à tester l'hypothèse nulle H0: b=0 contre une hypothèse alternative H1: ai 0
en suivant les 4 étapes cité ci dessus:
H 0 : ai 0
H 1 : ai 0
âi
tc ( T k 1 )
ˆ âi
34
t t ( T k 1 ) on accepte H
c 0
si
t c ( T k 1 ) on accepte H
1
Si on accepte H1 alors ai est significativement différent de 0 (ou on dit que c'est significatif)
au risque de %.
c) Test unilatéral:
Deux cas sont possibles
H 0 : ai a* â a *
er
1 cas : tc T( T k 1)
H 1 : ai a
*
ˆ âi
t c t 2 ( T k 1 ) on rejette H 0
si t t ( T k 1 ) on accepte H
c 2 0
H : a a* â a *
2ème cas : 0 i tc T( T k 1)
H 1 : ai a
*
ˆ âi
t c t 2 ( T k 1 ) on accepte H 0
si t t ( T k 1 ) on rejette H
c 2 0
d) Intervalle de confiance:
Si a* IC âi ˆ âi t ( t k 1 ) ; âi ˆ âi t ( t k 1 ) on accepte H0
Si a* IC âi ˆ âi t ( t k 1 ) ; âi ˆ âi t ( t k 1 ) on accepte H1
Suite de l'application :
35
Corrigé:
Pour a :
H 0 : a 0 â 12
Avec t c T( T k 1) tc 9.302 et
H1 : a 0 ˆ ai 1.23
t 0.05 ( 6 2 1 ) 3.182
Pour b :
H 0 : b 0 b̂ 0.5
Avec t c T ( T k 1 ) tc 0.447
H1 : b 0 ˆ b̂
i
1.118
Pour c :
H 0 : c 0 ĉ 2.5
Avec t c T ( T k 1) tc 5
H1 : c 0 ˆ ĉ 0.5
H : c 2 ĉ 2 2.5 2
b- 0 Avec t c T( T k 1) tc 1
H1 : c 2 ˆ ĉ 0.5
H 0 : b c 1 b̂ ĉ 1
c- avec t c T( T k 1)
H1 : b c 1 V̂ ( b̂ ĉ )
36
b̂ ĉ 1 b̂ ĉ 1 0.5 2.5 1
tc 1
V̂ ( b̂ ĉ ) V̂ ( b̂ ) V̂ ( ĉ ) 2 côv( b̂ , ĉ ) 1.66 1.25 2( 0.25 )
Remarque: le test de significativité globale n'a un sens que si le modèle contient une constante
(si non on aura yt t )
H 0 : a1 a 2 a3 ... a k 0
H 1 : au moins un paramètre différent de zéro
SCE / k SCE T k 1
Fc . F( k ,T k 1 )
SCR / T k 1 SCR k
Cette statistique est comparée à une valeur théorique obtenue à partir de la table de Fisher notée:
F ( k ,T k 1 ) à k et T-k-1 degrés de liberté.
Fc F ( k , T k 1 ) on accepte H 0
si F F ( k , T k 1 ) on accepte H
c
1
37
Si on accepte H1 on conclut que le modèle est globalement significatif à % risque d'erreur. Il
existe au moins une des variables explicatives introduites dans le modèle qui contribue à
l'explication de y.
Suite de l'exemple
Corrigé
SCE / k SCE T k 1
Fc . F ( k ,T k 1 )
SCR / T k 1 SCR k
R2 T k 1 0.90 6 2 1
13.5
1 R 2
k 1 0.90 2
VI . Prévision:
La régression est beaucoup utilisée pour la prédiction (ou prévision, on utilise plutôt ce terme
quand on manipule des données longitudinales). Pour une nouvelle valeur donnée de la
variable exogène X, nous voulons connaître la valeur que prendrait l'endogène Y
1) Prévision ponctuelle
On cherche à calculer ŷT qui est la valeur de y à la date T . Soient donc:
: horizon de la prévision
38
T : observation à laquelle on veut faire la prévision
yT : la vraie valeur de y à T
ŷT : prévision de yT (la valeur prévue)
L'estimation ponctuelle de yT serait alors :
xT ,1
avec : T . ,2 le vecteur des observations à la période
x
xT ,k
2) Intervalle de prévision
Une prédiction ponctuelle est intéressante. Mais nous ne savons pas quel degré de
confiance nous pouvons lui accorder. Il est donc plus intéressant de s'intéresser à un
intervalle de prédiction (fourchette de prédiction) en lui associant une probabilité de
recouvrir la vraie valeur y.
IC ŷT ˆ p t ( t k 1 ) ;
ŷT ˆ p t ( t k 1 )
Remarque:
39
Travaux Dirigés
40
Série n°1
Objectifs de la série : Au terme de ces deux semaines et sans se référer au cours, l’étudiant aura des acquis de
quelques outils qui seront d'une grande utilité pour la compréhension du cours.
Exercice 1
2 0 1 3 2 1
1 3 2 2 1 2 2
A , B , C 1 1 1 , D 0 1
1 0 3 3 1 3 1 0 2 3
4 0
2
Exercice 2
Calculer les déterminants suivants :
0 1 0 1
1 1 2 1 2 1
0 0 2 2
D 1 1 2 3 , D 2 2 1 0 , , D3
1 0 1 0
1 3 1 1 3 1
4 3 2 1
41
Exercice 3
On considère les matrices suivantes :
1 2 1 0 1 2 2 2 4
X 0 1 2 , Y 0 0 3 , Z 1 3 2
1 2 3 0 0 0 1 1 4
N.B : Une matrice est nilpotente si elle s’annule à un ordre k tel que : Yk =O (O est ma matrice nulle)
Exercice 4
On considère les systèmes d’équations linéaires suivants :
2 x y 2 z t 0
x y z 4 x 2 y 3z 4 3x y 2z 2t 6
S1 2x y 3z 9 , S 2 2 x 3 y z 11 , S 3
x y 2z 3 x 3 y 2 z 1 x 2 y 2z t 3
x y 2z t 3
1) Écrire les systèmes linéaires donnés ci dessus sous une forme matricielle : AX=B
2) Calculer le déterminant des matrices A associées aux systèmes S1 et S2.
3) Les matrices associées aux systèmes S1 et S2 sont-elles inversibles? Justifier votre réponse.
Bon travail
42
Série n°2
Régression linéaire simple, estimation des paramètres, tableau ANOVA, tests statistiques
Objectifs de la série : Cette série permettra aux étudiants l'étude approfondie de la régression linéaire simple,
en fonction de l'analyse de la variance totale, la significativité globale d'un modèle linéaire simple. Aussi la série
présentera la régression linéaire multiple.
Exercice 1
Le directeur commercial d'une entreprise agroalimentaire commercialisant un bien Z souhaite étudier la variation
de la demande des consommateurs pour ce bien en fonction de son prix. Il spécifie pour cela le modèle linéaire
suivant:
qi a0 a1 pi i i 1,...,N
Où qi indique la demande du bien, pi son prix, et i terme aléatoire vérifient les hypothèses de la régression linéaire
simple.
Le tableau suivant donne, pour un échantillon de 15 personnes, les valeurs de la demande du bien Z en fonction du
prix:
pi 18 16 17 12 15 15 4 13 11 6 8 10 7 7 7
qi 3 3 7 6 10 15 16 13 9 15 9 15 12 18 21
1) Tracer sur un diagramme cartésien le nuage des points liant qi et pi. Que-peut conclure?
2) Estimer les coefficients a0 et a1 par la méthode des MCO et donner l'équation de la droite d'ajustement
linéaire.
3) Donner l'interprétation économique de a1 , de â1 . Le signe de â1 est-il plausible?
4) Donner une estimation de la variance des erreurs.
5) Calculer les variances estimées des estimateurs de a0 et a1 .
Exercice 2
On considère pour un secteur donné de l'industrie, une fonction de production à un seul facteur, le travail. On
spécifie le modèle linéaire simple:
yi représente le niveau de production pour une firme i (output), et xi la quantité de travail engagé (input) en heures
de travail. Les erreurs i vérifient les hypothèses de la régression linéaire simple.
43
25 25 25
On vous donne: y 20 , x 10 , ( yi y )2 120 ;
i 1
( xi x )2 64 et
i 1
( xi 1
i x )( yi y ) 32
et SCR= 104
1) Estimer les paramètres et par la méthode des MCO. Quelle est leur interprétation économique? les signes
sont ils plausibles?
2) Les coefficients et sont-ils significatifs au seuil de 5%.
3) Tester, au seuil de 5%, l'hypothèse nulle H0 : =1.
4) Établir le tableau d'analyse de la variance.
5) Calculer et interpréter le coefficient de détermination R 2.
Exercice 3
Di est la dépense alimentaire en dinars tunisien du ménage "i", R i son revenu disponible en dinars tunisien. Les
i constituent des termes aléatoires indépendants et identiquement distribués selon la loi normale d'espérance
mathématique nulle et de variance 2 . L'estimation par la méthode des MCO du modèle (1), sur un échantillon de 20
ménages, a donné les résultats suivants:
Les chiffres entre parenthèses indiquent les écart-types estimés des estimateurs de a0 et a1.
Exercice 4
y t 0 1 xt t t=1,...,7
Avec :
- yt : indique le rendement par hectare de blé exprimé en quintaux par hectare.
44
- xt : représente la quantité d'engrais utilisé exprimée en quintaux par hectare.
- t : terme aléatoire qui vérifie les hypothèses de la régression classique.
L'estimation du modèle par la méthode des moindres carrés ordinaires (MCO) a donné les résultats suivants:
- Les estimateurs des paramètres et sont : ˆ 32.86 et ˆ 6.785 .
0 1 0 1
Exercice 5
Un économiste s'efforce de déterminer le lien existant entre la production et les facteurs de production. Il dispose
pour cela des statistiques trimestrielles sur les 6 dernières années.
A) Dans un premier temps, il opte pour une spécification linéaire de la relation entre la production Q et la
production L (en utilisant le logarithme népérien).
45
B) Dans un deuxième temps l'économiste a introduit dans son modèle le facteur capital, en se basant sur la
fonction de production de type Cobb-Douglass:
Qt ALt 1 K t2
Où Qt, Lt et Kt représentent respectivement la quantité produite, la quantité de travail utilisée et
le capital investi à la date t. Après linéarisation on obtient:
LogQt 0 1LogLt 2 LogKt t (II)
0 et LogKt sont respectivement les logarithmes de A et du capital investi.
L'estimation du modèle (II) par la MCO a donné les résultats suivants:
LogQ̂t 0.013 0.6 LogLt 0.61 LogKt ; SCR2=0.003 ; Cov( ˆ 1 , ˆ 2 ) 0.023
( 2.77 ) ( 0.36 ) ( 0.08 )
Bon travail
46
47
48
Série n°3
Objectifs de la série : Cette série permettra aux étudiants de bien comprendre : la Régression linéaire multiple,
l'estimation de cette régression par la méthode des MCO, les propriétés des estimateurs, la significativité des
paramètres et la significativité globale d'un modèle linéaire simple.
Exercice 1
On désir estimer la relation
yt a bx1t cx2t t avec i 1,...,6 (1)
Où les erreurs i vérifient les hypothèses classiques.
on dispose de la série d'observations suivantes:
yt 0 24 12 8 12 16
x1t -2 -1 0 0 1 2
x2t -5 4 0 -2 2 1
Exercice 2
L'estimation d'un modèle linéaire par les MCO, sur une série de données trimestrielles, donne les
résultats suivants:
49
Les chiffres entre parenthèses indiquent les écart-type. On donne aussi :
SCE=112.5 et SCR= 19.5.
Exercice 3
On se propose d'estimer, sur la période [1961-1990], le modèle de régression linéaire suivant:
Bon travail
50
Références
- Bourbonnais. Régis, « Économétrie ». Dunod 8 ème et 9 ème éd. 2011-2015.
- Ghazouani. Samir et Goaied Mohamed. "Économétrie", tome 1 Edition S CLS.1997
- Hanène Ben Wada-Jamoussi." Initiation à l'économétrie". Tunis, C.P.U, 2000
- Kriaa Farouk " Économétrie: cours et exercices corrigés" 2008
51
Corrigé de la série 2
52
53
54
55
56
57
58
Corrigé de la série n°3
59
60
61
62
63
64
65