Vous êtes sur la page 1sur 120

Économétrie et Séries Temporelles

Filiére: Finance et Ingénierie Décisionnelle

Soukaina HADIRI
s.hadiri@uiz.ac.ma

March 1, 2022

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 1 / 333


Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 1 / 333
Introduction

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 2 / 333
Introduction

Introduction

Avant d’entrer dans le vif du module, il est inéluctable de montrer d’abord,


la place de l’économétrie dans les sciences économiques en général et dans
la science financière en particulier.
Exemple 1: Un patient se présente à une clinique en espérant
diagnostiquer sa maladie. Le medecin traitant l’examine progressivement
par des moyens tels que l’interrogatoire, la radiologie et les tests sanguins.
(tout ce passe dans des laboratoires spécialisès).
Exemple 2: s’inspire de la science économique, dans cette dernière on ne
dispose pas des laboratoires dédiés aux expériences pour en étudier
l’intéraction entre les phénomènes économiques et leur comportements
futurs.
=)La science économéque nécessite un outil technique capable de jouer le
rôle de l’expérience pour répondre aux objectifs propres à la discipline
économéque.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 3 / 333
QU’EST CE QUE L’ÉCONOMÉTRIE ?

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 4 / 333
QU’EST CE QUE L’ÉCONOMÉTRIE ?

QU’EST CE QUE L’ÉCONOMÉTRIE ?

L’économétrie est le principal outil d’analyse quantitative utilisé par


les économistes et financières dans divers domaines d’application,
comme la macroéconomie, la finance ou le marketing
Dans son acception la plus restreinte, l’économétrie est un ensemble
de techniques utilisant les statistiques qui vérifient la validité
empirique des relations supposées entre les phénomènes économiques
et mesurent les paramètres de ces relations.
Au sens large, l’économétrie est l’art de construire et d’estimer des
modèles empiriques adéquats par rapport aux caractéristiques de la
réalité, et intelligibles au regard de la théorie économique.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 5 / 333


QU’EST CE QUE L’ÉCONOMÉTRIE ?

QU’EST CE QUE L’ÉCONOMÉTRIE ?

La démarche économétrique consiste à représenter à l’aide d’équations le


comportement d’un phénomène observé et à estimer les coefficients des
équations en recourant à l’historique du phénomène et ceci dans le but de
le comprendre, de l’expliquer, de le reproduire et de le prévoir. Admettons
que nous constatons le fait économique suivant :

Figure: Revenu disponible et Consommation des ménages au cours du temps


Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 6 / 333
QU’EST CE QUE L’ÉCONOMÉTRIE ?

QU’EST CE QUE L’ÉCONOMÉTRIE ?

En mettant en abscisse le revenu disponible et en ordonnée la


consommation des ménages, on obtient le graphique suivant :

Figure: Consommation des ménages en fonction du revenu disponible

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 7 / 333


QU’EST CE QUE L’ÉCONOMÉTRIE ?

QU’EST CE QUE L’ÉCONOMÉTRIE ?

On s’aperçoit que les points forment une droite. On peut supposer qu’elle
a pour équation:
Ct = a1 Rt + a0
où Ct et Rt désignent respectivement la consommation et le revenu
disponible à l’instant t.
A partir de cette droite (ou dit modèle), des données recueillies sur la
consommation et le revenu disponible des ménages au fil du temps et de la
théorie économétrique, on peut déterminer la valeur des paramètres a1 et
a0 . La connaissance de ces valeurs nous permettra d’une part de mesurer
l’influence de la variable explicative (Rt ) sur la variable à expliquer (Ct ) et
d’autre part de prévoir l’évolution de la variable endogène. En connaissant
l’évolution future de la consommation des ménages, une entreprise peut
par exemple envisager d’augmenter ou non sa production.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 8 / 333


QU’EST CE QUE L’ÉCONOMÉTRIE ?

Nous pouvons distinguer deux types de spécifications:


Les modèles en série temporelle, les variables représentent des
phénomènes observés à intervalles de temps réguliers.
Par exemple la consommation et le revenu annuel sur 20 ans pour un
pays donné. Le modèle s’écrit alors:

Ct = a0 + a1 Rt t = 1, . . . , 20,

où Ct et Rt sont la consommation et le revenu au temps t.


Les modèles en coupe instantanée, les variables représentent des
phénomènes observés au même instant mais concernant plusieurs
individus.
Par exemple la consommation et le revenu observés sur un échantillon
de 20 pays. Le modèle s’écrit alors:

Ci = a0 + a1 Ri i = 1, . . . , 20,

où Ci et Ri sont la consommation et le revenu du pays i pour une


année donnée.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 9 / 333
QU’EST CE QUE L’ÉCONOMÉTRIE ?

Rôle du terme aléatoire

Il existe une multitude de facteurs susceptibles d’expliquer la


consommation. C’est pourquoi nous ajoutons un terme ("t ) qui synthétise
l’ensemble de ces informations non explicitées dans le modèle:

Ct = a0 + a1 Rt + "t

si le modèle est spécifie en série temporelle

Ci = a0 + a1 Ri + "i

si le modèle est spécifie en coupe instantanée.


Le terme "t représente l’erreur de specification du modèle, c’est-a-dire
l’ensemble des phénomènes explicatifs de la consommation non lies au
revenu. Il mesure la di↵érence entre les valeurs réellement observées de Ct
et les valeurs qui auraient été observées si la relation spécifiée avait été
rigoureusement exacte.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 10 / 333
Le modèle de régression linèaire simple

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 11 / 333
Le modèle de régression linèaire simple Spécification

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 12 / 333
Le modèle de régression linèaire simple Spécification

Le modèle de régression linèaire simple

Modèle générale
Le modèle que nous allons étudier tout au long de cette section est le
suivant:
y = a0 + a1 x + "
x : variable explicative,
y : variable à expliquée,
" le teme d’erreur,
a0 et a1 paramètres (ou coefficients du modèle).
x est observée sans erreur ! variable certaine, indépendente de "
A supposer que x et y comprennent des observations déterminées par le
temps, on peut réecrire le modèle: yt = ↵ + xt + "t où t est un indice qui
désigne la date à laquelle la valeur de la variable à été observée.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 13 / 333


Le modèle de régression linèaire simple Spécification

Le modèle de régression linèaire simple

Le terme d’erreur ne peut être prévu pour chaque observation. Il est


possible de faire un certain nombre d’hypothèses. Ainsi on suppose:
La nullité de l’erreur moyenne
Erreur peut prendre des valeurs positives ou négatives.
L’espérance mathématique de l’erreur est nulle E (") = 0.

Absence d’autocorrélation des erreurs


Valeur de l’erreur en t ne dépend pas de l’erreur en t-1.
Erreur commise à une date n’a pas d’influence sur erreur commise à
une autre date.
E ("t "t 1) = 0 8t 6= t 1.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 14 / 333


Le modèle de régression linèaire simple Spécification

Le modèle de régression linèaire simple

Homoscédasticité des erreurs


Homoscédasticité: variance des erreurs est constante quel que soit t.
Le risque de l’amplitude de l’erreur est le même quel que soit la
période.
(Hétéroscédasticité: variance des erreurs non constante.)
E ("2 ) = "2 8t.
Où "2 reprèsente la variance du terme de l’erreur.

La normalité du terme d’erreur


Terme d’erreur suit une loi normale d’espérance nulle et de variance
constante.
"t ⇠ N(0, 2
" ).
Permet de contruire des tests statistiques.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 15 / 333
Le modèle de régression linèaire simple Estimation des paramètres

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 16 / 333
Le modèle de régression linèaire simple Estimation des paramètres

Soit le modèle suivant:

yt = a0 + a1 xt + "t , t = 1, . . . , n.

H1: Le modèle est linéaire en xt (ou en n’importe quelle


transformation de xt ).
H2: Les valeurs xt sont observées sans erreur (xt non aléatoires).
H3: E ("t ) = 0.
H4: E ("2t ) = 2
", la variance de l’erreur est constante.
H5: t 6= t0 ) E ("t "t 0 ) = 0, les erreurs sont non corrélées.
H6: Cov (xt , "t ) = 0 , l’erreur est indépendante de la variable
explicative.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 17 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 18 / 333


Le modèle de régression linèaire simple Estimation des paramètres

La représentation graphique ne donne qu’une impression de la corrélation


entre deux variables sans donner une idée précise de l’intensité de la liaison,
C’est pourquoi nous calculons une statistique appelée coefficient de
corrélation linéaire simple, noté rx,y . Il est égal à:
Pn
Cov (X , Y ) (xt x)(yt y )
rx,y = = pPn t=1 pPn .
X Y t=1 (xt x)2 t=1 (yt y )2

En développant la formule, on trouve


P Pn Pn
n ni=1 xi yi i=1 xi i=1 yi
=r ⇣ ⌘ r ⇣P ⌘2 .
Pn P n
2 P n n
n i=1 xi2 i=1 xi
2 n i=1 yi2 i=1 yi
2

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 19 / 333


Le modèle de régression linèaire simple Estimation des paramètres

On peut démontrer que, par construction, ce coefficient reste compris


entre –1 et 1 :
– proche de 1, les variables sont corrélées positivement ;
– proche de –1, les variables sont corrélées négativement ;
– proche de 0, les variables ne sont pas corrélées.
Dans la pratique, ce coefficient est rarement très proche de l’une de ces
trois bornes et il est donc difficile de proposer une interprétation fiable à la
simple lecture de ce coefficient. Ceci est surtout vrai en finance où les
variables sont toutes plus au moins liées entre elles. De plus, ce coefficient
n’est calculé que à partir d’un échantillon d’observations et non pas sur
l’ensemble des valeurs.
On appelle ⇢x,y ce coefficient empirique qui est une estimation du vrai
coefficient rx,y .

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 20 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Soit à tester l’hypothèse

H0 : rx,y = 0 contre l’hypothèse H1 : rx,y 6= 0.

Nous pouvons démontrer que


⇢x,y
q 2 Tn 2
1 ⇢x,y
n 2

Nous calculons alors une statistique, appelé le t de Student empirique:

|⇢x,y |
t⇤ = q 2
1 ⇢x,y
n 2

↵/2
Si t ⇤ > tn 2 valeur lue dans une table de Student au seuil ↵ = 5% à n 2
degrés de liberté, nous rejetons l’hypothèse H0 , le coefficient de correlation
est donc significativement di↵erent de 0.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 21 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Exercice

Un chercheur veut étudier la relation existant entre le chi↵re d’a↵aire y


(considéré comme variable endogène) de la société et le niveau de
production d’un produit x (considéré comme variable exogène). Il relève
10 couples (x, y ) de données consignés dans le tableau:

x 16 18 23 24 28 29 26 31 32 34

y 20 24 28 22 32 28 32 36 41 41

1) Tracer le nuage de points et le commenter.


2) Calculer le coefficient de corrélation simple et tester sa signification par
rapport à 0 pour un seuil ↵ = 0, 05.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 22 / 333


Le modèle de régression linèaire simple Estimation des paramètres

1) Le nuage de points indique que les couples de valeurs sont


approximativement alignés: les deux variables semblent corrélées
positivement.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 23 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 24 / 333


Le modèle de régression linèaire simple Estimation des paramètres

2) Après calcul, on obtient ⇢x,y = 0, 89.


Le t de Student empirique est égal à:

|⇢x,y |
t⇤ = q 2 = 5, 49 > t80,025 = 2, 306.
1 ⇢x,y
n 2

Donc le coefficient de corrélation entre x et y est significativement


di↵érent de 0.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 25 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Estimation des paramètres

En traçant un graphique des couples de données liant le revenu et la


consommation observée, nous obtenons un nuage de points que nous
pouvons ajuster à l’aide d’une droite. L’estimateur des coefficients a0 et a1
est obtenu en minimisant la distance au carré entre chaque observation et
la droite, d’où le nom d’estimateur des moindres carrés ordinaires (MCO):
n
X n
X
Min "2t = Min (yt a0 a1 xt )2 .
t=1 t=1

La résolution analytique est la suivante:


Pn Pn
t=1 (xt x)(yt y ) (xt yt ) nx̄ ȳ
ba1 = Pn = Pt=1
n
t=1 (xt x) 2
t=1 (xt )
2 nx 2

b
a0 = y b
a1 x

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 26 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Estimation des paramètres

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 27 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Propriétés des estimateurs

Écrivons
yt = a0 + a1 xt + "t ,
et
ȳ = a0 + a1 x̄ + "¯,
on obtient: Pn
(xt x)"t
a1 = a1 + Pt=1
b n .
t=1 (xt x)2
On alors, Pn
t=1 (xt x)E ("t )
a1 ) = E (a1 ) + P
E (b n = E (a1 )
t=1 (xt x)2
car E ("t ) = 0.
De même on démontre que E (b
a0 ) = a0 . Ce qui signifie que les estimateurs
sont sans biais.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 28 / 333


Le modèle de régression linèaire simple Estimation des paramètres

Puisque les estimateurs sont sans biais, pour qu’ils soient convergents il
suffit que : limn!+1 V (ba1 ) = limn!+1 V (b a0 ) = 0.
En e↵et:
"✓ P ◆2 #
n
(x t x)" t
V (ba1 ) = E (b a1 ))2 = E (b
a1 E (b a1 a1 )2 = E Pt=1
n 2
t=1 (x t x)
2 ! 3
n 2 n
X X X
V (b
a1 ) = E 4 ! t "t 5 = !t2 E ("2t ) + 2 !t !t 0 E ("t "t 0 ),
t=1 t=1 t<t 0

(xt x)
où on a posé !t = Pn .
j=1 (xj x)2
D’après les hypothèses H4 et H5, on obtient
n
X 2
"
V (ba1 ) = !t2 "2 = Pn .
t=1 (xt x)2
t=1
2
"
a1 ) = Pn
V (b !n!+1 0.
t=1 (xt x)2
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 29 / 333
Le modèle de régression linèaire simple Estimation des paramètres

Une démonstration analogue pour b


a0 donne
✓ ◆
2 1 x2
V (b
a0 ) = " + Pn !n!+1 0.
n t=1 (xt x)2
Théorème de Gauss-Markov: Les estimateurs des MCO ont la plus
petite variance parmi les estimateurs linéaires sans biais. On dit que ce
sont des estimateurs BLUE (Best Linear Unbiased Estimator).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 30 / 333


Le modèle de régression linèaire simple Inférence statistique

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 31 / 333
Le modèle de régression linèaire simple Inférence statistique

Construction des tests

Nous allons maintenant introduire de nouveau l’hypothèse qui est celle de


la normalisé des erreurs. Cette hypothèse n’est pas indispensable afin
d’obtenir des estimateurs convergents mais elle va nous permettre de
construire des tests statistiques concernant la validité du modèle estimé.
Soit
"t N (0, "2 ).
Cette hypothèse permet de définir la loi de probabilité des estimateurs.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 32 / 333


Le modèle de régression linèaire simple Inférence statistique

L’estimateur de la variance de l’erreur " noté b"2 est égal à:


n
X
1
b"2 = et2 ,
n 2
t=1

où le résidu et est donné par

et = yt ybt , t = 1 . . . , n.

Ce qui nous permet de définir les estimateurs empiriques de la variance de


chacun des coefficients:

b"2
bba21 = Pn
t=1 (xt x)2
✓ ◆
1 x2
bba20 = b"2 + Pn .
n t=1 (xt x)2

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 33 / 333


Le modèle de régression linèaire simple Inférence statistique

L’hypothèse de normalité des erreurs implique que:

b
a1 a1 b
a0 a0
, N (0, 1)
b
a1 b
a0
Pn 2
t=1 et b"2 2
2
= (n 2) 2 n 2
" "
b
a1 a1 b
a0 a0
) , Tn 2
bba1 bba0

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 34 / 333


Le modèle de régression linèaire simple Inférence statistique

Il est donc possible maintenant de mettre en place des tests statistiques


afin d’apporter des réponses à des problèmes tels que:
comparaison d’un coefficient de régression par rapport à une valeur
fixée;
comparaison de deux coefficients de régression provenant de deux
échantillons di↵érents;
détermination d’un intervalle de confiance pour un coefficient.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 35 / 333


Le modèle de régression linèaire simple Inférence statistique

Test bilatéral, test unilatéral

1) Test bilatéral
Soit à tester, à un seuil de 5%, l’hypothèse H0 : a1 = 0 contre l’hypothèse
H1 : a1 6= 0.
Sous H0 , on a ba1bba a1 = bab1 ba 0 suit une loi de Student à n 2 degrés de
1 1
liberté.
Le test d’hypotheses bilatéral consiste donc à comparer le ratio de Student
empirique t ⇤ = |b a1 |
bba à la valeur du t de Student lue dans la table à n 2
1
degrés de liberté et pour un seuil de probabilité ↵ égal à 5%.
1 ↵
Si |t ⇤ | > tn 22 nous rejetons l’hypothèse H0
) le coefficient théorique inconnu a1 est significativement di↵érent de 0.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 36 / 333


Le modèle de régression linèaire simple Inférence statistique

2) Test unilatéral
Soit à tester, à un seuil de 5%, l’hypothèse H0 : a1 = 0 contre l’hypothèse
H1 : a1 > 0 ou a1 < 0
Sous H0 , on a ba1bba a1 = bab1 ba 0 suit une loi de Student à n 2 degrés de
1 1
liberté.
Le test d’hypotheses unilatéral consiste donc à comparer le ratio de
Student empirique t ⇤ = |b a1 |
bba à la valeur du t de Student lue dans la table à
1
n 2 degrés de liberté et pour un seuil de probabilité ↵ égal à 5%.
Si t ⇤ > tn1 2↵ nous rejetons l’hypothèse H0
) le coefficient théorique inconnu a1 est significativement di↵érent de 0.
Remarque : Si nous rejetons l’hypothèse H0 pour un test bilatéral, alors
nous rejetons forcément (pour un même seuil de probabilité) l’hypothèse
H0 pour un test unilatéral.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 37 / 333


Le modèle de régression linèaire simple Inférence statistique

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 38 / 333


Le modèle de régression linèaire simple Inférence statistique

Exercice

On s’intéresse à la relation entre les bénéfices réalisés par les entreprises et


le budget annuel qu’elles consacrent à la publicité. 15 observations ont été
réalisées
Budget 15 8 36 41 16 8 21 21
Bénéfices 48 43 77 89 50 40 56 62
Budget 53 10 32 17 58 6 20
Bénéfices 100 47 71 58 102 35 60

Répondons aux questions suivantes


1 Calculer les estimateurs b
a1 , b
a0 et le coefficient de corrélation r
2
2 Sachant que b = 10, 155, procéder à l’estimation des variances de a
" 1
et a0 .
3 Déterminer au seuil de signification de 5%, un intervalle de confiance

pour a1 , a0 et b"2 .
4 Peut-on affirmer que les coefficients a et a sont significativement
1 0
di↵érents de 0 pour 5%?
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 39 / 333
Le modèle de régression linèaire simple Inférence statistique

Solution

1) Après calculs, on obtient b1 = 1, 28, b


aP a0 = 31, 67 et r = 0, 989.
2) On a n = 15, x̄ = 24, 13, nt=1 (xt x)2 = 15 X2 = 3753, 733 et
b"2 = 10, 155, donc:
b"2
bba21 = Pn = 0, 0027,
t=1 (xt x)2
✓ ◆
1 x2
bba20 = b"2 + Pn = 2, 252.
n t=1 (xt x)2
3) Nous savons que ba1bba a1 et ba0bba a0 suivent la loi de Student Tn 2 .
1 0
L’intervalle de confiance pour a1 et a0 nous est donné respectivement par:
b
a1 a1 ↵/2 ↵/2
= ±tn 2 ) a1 = b a1 ± bba1 ⇥ tn 2
bba1
b
a0 a0 ↵/2 ↵/2
= ±tn 2 ) a0 = b
a0 ± bba0 ⇥ tn 2
bba0
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 40 / 333
Le modèle de régression linèaire simple Inférence statistique

Solution
↵/2
Avec n 2 = 13 degré de liberté et ↵/2 = 0, 025, on a tn 2 = 2, 16 lu
dans le tableau de Student.
Donc, les intervalles de confiance pour a1 et a0 sont respectivement:
↵/2 ↵/2
[b
a1 bba1 ⇥ tn 2; b
a1 + bba1 ⇥ tn 2] = [1, 166; 1, 391],

↵/2 ↵/2
[b
a0 bba0 ⇥ tn 2; b
a0 + bba0 ⇥ tn 2] = [28, 432; 34, 916]

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 41 / 333


Le modèle de régression linèaire simple Inférence statistique

Solution
2
Nous savons que (n 2) b"2 2 .
n 2
"
2
L’intervalle de confiance pour b" est

b"2 b"2
[(n 2) 2
; (n 2) 2
]
1 ↵/2 ↵/2

Avec n 2 = 13 degré de liberté et ↵/2 = 0, 025, on a 2 = 5, 01 et


↵/2
2 = 24, 74 lus dans le tableau de 2 .
1 ↵/2
Donc
b"2 2 [5, 336; 26, 35].

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 42 / 333


Le modèle de régression linèaire simple Inférence statistique

Solution

4) On procède à un test d’hypotheses bilatéral qui consiste donc à


comparer les ratio de Student empiriques t ⇤ = |b a1 |
bba = 24, 63 et 1
|b
a0 | ↵/2
t⇤ = bba0 = 21, 10 à la valeur du tn 2 = 2, 16 de Student lue dans la table
à n 2 degrés de liberté et pour un seuil de probabilité égal à 5%.
Puisque ces valeurs sont supérieurs en valeur absolue à 2, 16, alors les deux
paramètres a1 et a0 sont significativement di↵érents de 0.
La variable exogène x contribue bien à expliquer la variable
endogène y .

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 43 / 333


Le modèle de régression linèaire simple Inférence statistique

Équation et tableau d’analyse de la variance

On peut démontrer que


n
X
et = 0,
t=1

et par suite, on trouve l’équation fondamentale d’analyse de la variance:


n
X n
X n
X
(yt ȳ )2 = (b
yt ȳ )2 + et2 .
|t=1 {z } |t=1 {z } |t=1
{z }
=SCT =SCE =SCR

La variabilité totale (SCT) est égale à la variabilité expliquée (SCE) + la


variabilité des résidus (SCR).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 44 / 333


Le modèle de régression linèaire simple Inférence statistique

Coefficient de détermination

Cette équation va nous permettre de juger de la qualité de l’ajustement


d’un modèle.
En e↵et, plus la variance expliquée est proche de la variance totale, meilleur
est l’ajustement du nuage de points par la droite des moindres carrés.
Il est d’usage de calculer le rapport:

SCE SCR
R2 = =1 .
SCT SCT
R 2 est appelé le coefficient de détermination, et R le coefficient de
corrélation multiple (dans le cas particulier du modèle de régression à une
seule variable explicative, il est égal au coefficient de corrélation linéaire
simple entre x et y ).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 45 / 333


Le modèle de régression linèaire simple Inférence statistique

Coefficient de détermination ajusté

Mème si le R 2 reste un bon indicateur de la qualité de l’ajustement, son


principal inconvénient provient du fait qu’il augmente mécaniquement
lorsque l’on ajoute des variables explicatives supplémentaires. Ce qui
signifie qu’il suffit d’ajouter arbitrairement les variables explicatives pour
que le R 2 augmente. Ce qui a↵aiblit la parcimonie du modèle, c’est-à-dire
sa capacité à décrire la réalité avec un nombre restreint de variables. C’est
pour cette raison qu’on introduit la notion de R 2 ajusté calculé comme
suit: ⇣ n 1 ⌘ SCR
Ra2 = 1 .
n 2 SCT

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 46 / 333


Le modèle de régression linèaire simple Inférence statistique

Tableau d’analyse de la variance


Variation Somme des carrés Degré de liberté Carrés moyens
P
x SCE = nt=1 (b
y ȳ )2 1 SCE
Pn t 2 1
SCR
Résidu SCR = t=1 et n-2 n 2
P
Total SCT = nt=1 (yt ȳ )2 n 1

Le test H0 : a1 = 0 est équivalent au test d’hypothèse H0 : SCE = 0 (la


variable explicative xt ne contribue pas à l’explication du modèle). La
statistique de ce test est donnée par:
SCE R2
ddlSCE 1
F⇤ = =
SCR 1 R2
ddlSCR n 2

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 47 / 333


Le modèle de régression linèaire simple Inférence statistique

Test de significativité globale du modèle

F ⇤ suit une statistique de Fisher à 1 et n 2 degrés de liberté.


Si F ⇤ > F1;n

2 nous rejetons au seuil ↵ l’hypothèse H0 et donc la variable
xt est significative.
Dans le cas contraire, nous acceptons l’hypothèse d’égalité des variances,
donc la variable xt n’est pas explicative de la variable yt .

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 48 / 333


Le modèle de régression linèaire simple Inférence statistique

Exercice

On s’intéresse à la relation entre les tailles Xi en cm de certains tiges


matériaux et leur poids Yi en Kg . 10 observations ont été réalisées:

Taille 150 175 200 225 250 275 300 325 350 375
Poids 18 24 26 23 30 27 34 35 33 40
Question: Donner le tableau d’analyse de la variance associé à cette
échantillon. Faire un test de Fisher à un seuil de 5%.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 49 / 333


Le modèle de régression linèaire simple Inférence statistique

Xi Yi (Yi Y )2 Ybi bi Y )2
(Y (Yi bi )2
Y
150 18 121 19.84 83.90 3.38
175 24 25 21.87 50.83 4.53
200 26 9 23.91 25.90 4.36
225 23 36 25.95 9.30 8.70
250 30 1 27.98 1.04 4.08
275 27 4 30.02 1.04 9.12
300 34 25 32.05 9.30 3.8
325 35 36 34.09 25.90 0.82
350 33 16 36.13 50.83 9.79
375 40 121 38.16 83.90 3.38
Total 394 341.94 51.96

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 50 / 333


Le modèle de régression linèaire simple Inférence statistique

Variation Somme des carrés Degré de liberté Carrés moyens


SCE
x SCE = 341.94 1 1 = 341.94
SCR
Résidu SCR = 51.96 8 8 = 6.5
Total SCT = 394 9
Soit le test d’hypothèse H0 : SCE = 0 contre H1 : SCE 6= 0.
La statistique de ce test est donnée par:
SCE
ddlSCE 341.94
F⇤ = SCR
= = 52.73.
ddlSCR
6.5


Puisque F1;n 0.05 ⇤ ↵
2 = F1;8 = 5.32, alors F > F1;n 2 .
Donc, nous rejetons au seuil ↵ l’hypothèse H0 et donc la variable
explicative est significative.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 51 / 333


Le modèle de régression linèaire simple Inférence statistique

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 52 / 333


Le modèle de régression linèaire simple Inférence statistique

La prévision dans le modèle de régression simple

Lorsque les coefficients du modèle ont été estimés, il est possible de


calculer une prévision à un horizon h. Soit le modèle estimé sur la période
t = 1, . . . , n;
yt = ba0 + b
a1 xt + et
Si la valeur de la variable explicative xt est connue en n + 1 (xn+1 ), la
prévision est donnée par :
ybn+1 = b
a0 + b
a1 xn+1
L’erreur de prévision est égale à:
en+1 = yn+1 ybn+1 = (a0 b
a0 ) + (a1 b
a1 )xn+1 + "n+1
En se référant aux hypothèses du modèle, on a:
E (en+1 ) = 0
✓ ◆
2 1 (xn+1 x)2
V (en+1 ) = b" + Pn +1 .
n t=1 (xt x)2
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 53 / 333
Le modèle de régression linèaire simple Inférence statistique

L’hypothèse de normalité de "t permet alors de determiner un intervalle à


(1 ↵)% pour la prévision:
✓ ✓ ◆◆
2 1 (xn+1 x)2
en+1 N 0, b" + Pn +1
n t=1 (xt x)2

b
a +b a1 xn+1 yn+1
) r⇣0 ⌘ Tn 2.
2
b" 1
+ P(x
n
n+1 x)
+ 1
n (xt x)2
t=1

On obtient alors l’intervalle de prédiction:


s
↵/2 1 (xn+1 x)2
yn+1 = ybn+1 ± tn 2 b" + Pn + 1.
n t=1 (xt x)2

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 54 / 333


Le modèle de régression linèaire simple Inférence statistique

Exercice

A partir de l’exercice précédent, déterminer au seuil 5%, un intervalle de


confiance pour le poids prévisible relatif à une taille de 400cm d’un tige.
Solution
On a l’intervalle de prédiction IY40 est donné par:
s
↵/2 1 (xn+1 x)2
yn+1 = ybn+1 ± tn 2 b" + Pn +1
n t=1 (xt x)2
P
où xn+1 = 400, x = 262.5, nt=1 (xt x)2 = 51562.5, ybn+1 = 40.02,
↵/2
tn 2 = t80.025 = 2.306, b"2 = SCR
n 2 = 6.5.
Donc,
IY40 = [21.86; 58.17].

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 55 / 333


Le modèle de régression linèaire simple Inférence statistique

Linéarisation des modèles non-linéaires

Le modèle log-linéaire:
a1
yt = 0 xt

Pour linéariser ce modèle, on procède à une transformation logarithmique.


Ainsi, on a
ln(yt ) = a0 + a1 ln(xt )
avec a0 = ln( 0)

Le modèle exponentiel:

yt = exp(a0 + a1 xt )

Là aussi, on procède à une transformation logarithmique pour linéariser ce


modèle :
ln(yt ) = a0 + a1 xt

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 56 / 333


Le modèle de régression linèaire simple Inférence statistique

Linéarisation des modèles non-linéaires

Le modèle hyperbolique:
a1
yt = + y0t
xi x0t
Le modèle hyperbolique peut aussi être estimé car il est déjà linéaire en a1 .
L’équation se présente alors simplement comme suit:
ỹt = a1 x̃t . Avec ỹt = yt y0t et x̃t = xt 1x0t
Le modèle parabolique: Le modèle parabolique se présente sous la forme
suivante:
yt = a0 + a1 xt + a2 xt2
Ce modèle est déjà linéaire par rapport aux paramètres. Par conséquent, il
n’y a pas besoin de procèder à quelle que transformation que ce soit.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 57 / 333


Le modèle de régression linèaire simple Inférence statistique

Linéarisation des modèles non-linéaires

Le modèle logistique:
ymax,t ymin,t
yt = ymin,t +
1 + exp(a0 + a1 xt )

Le modèle logistique est linéarisé en prenant le logarithme tel que:


⇣y ymin,i ⌘
max,i
ln = a0 + a1 xt
yt ymin,i

La forme linéarisée du modèle logistique est :

ln(ỹt ) = a0 + a1 xt
ymax,t ymin,t
Avec ỹt =
yt ymin,t

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 58 / 333


Le modèle de régression linèaire simple Inférence statistique

Estimateur du maximum de vraisemblance

L’estimation par les moindres carrés ordinaires ne fait aucune hypothèse


sur la loi de distribution des perturbations aléatoires. Il est simplement
supposé que celles-ci sont indépendantes et identiquement distribuées.
L’estimation par maximum de vraisemblance consiste à faire une
hypothèse sur la distribution de probabilité de ✏t .
Soit
2
"t N (0, " ),

alors on aura:
2
yt N (a0 + a1 xt , " ).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 59 / 333


Le modèle de régression linèaire simple Inférence statistique

Estimateur du maximum de vraisemblance

Fonction de densité et fonction de vraisemblance: On a


1 ⇣ 1⇣y a0 a1 xt ⌘2 ⌘
t
f (yt ) = p exp
" 2⇡ 2 "

Ainsi, en notant par L(a0 , a1 , " ), la fonction de vraisemblance, on a :


n
Y n h
Y ⇣ ⌘i
1 1
L(a0 , a1 , ") = f (yt ) = 1 exp (y
2 t
a0 a1 xt )2
(2⇡ 2 2
t=1 t=1 ")2 "

1 ⇣ n
1 X ⌘
= n exp 2
(yt a0 a1 xt )2
(2⇡ 2
")2
2 " t=1

Il est souvent plus facile de chercher à maximiser le logarithme de la


fonction de vraisemblance plutot que la fonction elle-meme.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 60 / 333


Le modèle de régression linèaire simple Inférence statistique

Estimateur du maximum de vraisemblance

Prenant le logarithme de la fonction de vraisemblance, on a:


n
n n 2 1 X
LogL(a0 , a1 , ") = log(2⇡) log( ") 2
(yt a0 a1 xt )2
2 2 2 " t=1

La méthode du maximum de vraisemblance consiste à choisir les


paramètres a0 , a1 de sorte à maximiser cette fonction de
log-vraisemblance. Pour cela, il faut dériver la dérivée et retrouver les
conditions de premier ordre afin d’en déduire chacun des paramètres.:
n
@LogL(a0 , a1 , ") 2 X
= 2
(yt a0 a1 xt ) = 0
@a0 2 " t=1

n
@LogL(a0 , a1 , ") 2 X
= 2
(yt a0 a1 xt )xt = 0
@a1 2 " t=1

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 61 / 333


Le modèle de régression linèaire simple Inférence statistique

Estimateur du maximum de vraisemblance

Ainsi la solution au problème de minimisation de la somme des carrés de


résidus se présente comme suit:

Cov (x, y )
b
a1 =
Var (x)

b
a0 = ȳ b
a1 x̄
Ce qui montre bien que les estimateurs de maximum de vraisemblance sont
équivalents aux estimateurs des MCO lorsque les erreurs sont normaux.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 62 / 333


Le modèle de régression linèaire simple Inférence statistique

Le modèle de régression linèaire simple

Exemple de données: les appartements Parisiens

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 63 / 333


Le modèle de régression linèaire simple Inférence statistique

Mise en oeuvre de la régression linéaire simple

Sortie sous R
#Manipulation des données
>p=2
>n=6
> appart = as.data.frame(matrix(0,6,2))
> names(appart)=c(’surface’,’prix’)
> appart[,’surface’] = c(28,50,55,110,60,48)
> appart[,’prix’] = c(130,280,268, 500, 320,250)
> plot(appart)
> mod<-lm(appart$prix appart$surface)
> x<-appart$surface
> y<-appart$prix
> mod<-lm(yvx)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 64 / 333


Le modèle de régression linèaire simple Inférence statistique

Mise en oeuvre de la régression linéaire simple

Sortie sous R
> names(mod)
> summary(mod)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 65 / 333


Le modèle de régression linèaire simple Inférence statistique

Mise en oeuvre de la régression linéaire simple

> anova(mod)
> summary(mod)$r.squared
> x0 <- 50
> predict(mod,data.frame(x=x0 ),interval=”prediction”)
> predict(mod,data.frame(x=x0 ),interval=”confidence”)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 66 / 333


Le modèle de régression linèaire simple Inférence statistique

Quelques compléments utiles

Représentation des intervalles de confiance et de prédiction

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 67 / 333


Le modèle de régression linèaire simple Inférence statistique

Quelques compléments utiles

Quelques graphiques permettant de “vérifier visuellement” des hypothèses


sous-jacentes.
Graphique croisant les valeurs prédites ybt et les résidus et = yt ybt

On observe un “comportement aléatoire” et “une variance constante”.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 68 / 333


Le modèle de régression linèaire simple Inférence statistique

Quelques compléments utiles

On observe une “structure évidente” dans les résidus (qui ne sont plus
vraiment aléatoires). Donc il faut “changer” le modèle pour essayer de
prendre en compte cette structure.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 69 / 333


Le modèle de régression linèaire simple Inférence statistique

Quelques compléments utiles

On observe que “la variance des résidus n’est pas constante”, elle augmente
clairement en fonction de ybt (elle dépend donc des xt ). Il n’y a donc pas
homoscédasticité.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 70 / 333


Le modèle de régression linèaire simple Inférence statistique

Quelques compléments utiles

Normalité des résidus. La théorie sous-jacente à l’inférence du modèle


(tests d’hypothèses portant sur les paramètres et aux intervalles de
confiance et de prédiction) suppose la normalité du terme d’erreur ✏t .
Il convient donc de tester cette hypothèse a posteriori en utilisant les
résidus du modèle. Pour cela, on peut faire un test de normalité de
Shapiro-Wilk.

> residus=resid(mod)
> shapiro.test(residus)

on accepte la normalité des résidus (pvalue = 0.715 5%).


Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 71 / 333
Le modèle linéaire multiple

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 72 / 333
Le modèle linéaire multiple

Le modèle linéaire multiple

Le modèle de régression linéaire multiple n’est qu’une extension du modèle


de régression linéaire simple au cas multivarié dans lequel interviennent
plusieurs variables exogènes dans l’explication du phénomène étudié.
On parle aussi de modèle de régression linéaire général ou standard pour
souligner que ce modèle reste valable quel que soit le nombre d’exogènes
qui s’y figurent.
Dans sa forme générale, il s’écrit de la sorte:

yt = a0 + a1 x1t + · · · + ak xkt + "t , t = 1, 2, . . . , n.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 73 / 333


Le modèle linéaire multiple

Afin d’en alléger l’écriture et de faciliter l’expression de certains résultats,


on a habituellement recours aux notations matricielles.

Y = |{z}
|{z} X a + |{z}
|{z} " ,
(n,1) (n,k+1) (k+1,1) (n,1)

où
0 1 0 1 0 1
y1 1 x11 x21 ··· xk1 0 1 "1
B y2 C B 1 x12 x22 ··· xk2 C a0 B "2 C
B C B C B C B C
B .. C B .. .. .. .. C B a1 C B .. C
B . C B . . . ··· . C B . C
Y =B C,X = B C,a = B
B a2 C
C," = B C.
B yt C B 1 x1t x2t ··· xkt C B .. C B "t C
B C B C @ A B C
B .. C B .. .. .. .. C . B .. C
@ . A @ . . . ··· . A @ . A
ak
yn 1 x1n x2n ··· xkn "n

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 74 / 333


Le modèle linéaire multiple

La méthode des moindres carrés

La méthode des moindres carrés cherche la meilleure estimation des


paramètres a en minimisant la quantité:
n
X
Min "2t = Min"0 " = Min (Y Xa)0 (Y Xa) ,
t=1

où M 0 désigne la transposée de la matrice M.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 75 / 333


Le modèle linéaire multiple

Les hypothèses de la méthode des MCO

Hypothèses probabilistes (hypothèses stochastiques):


H1: Les X sont observés sans erreur (non aléatoires)
H2: E (") = 0, en moyenne le modèle est bien spécifié
0
H3: E ("" ) = "2 I la variance de l’erreur est constante
(homoscédasticité)
H4: i 6= j ) E ("i , "j ) = 0 les erreurs sont non-corrélées
(non-autocorrélation des erreurs)
H5: Cov (", X ) = 0, l’erreur est indépendante des variables explicatives
H6: " N (0, 2
")

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 76 / 333


Le modèle linéaire multiple

Les hypothèses de la méthode des MCO

Hypothèses structurelles:
H7: Rang (X 0 X ) = k + 1; (X 0 X ) 1 existe, ou encore det(X 0 X ) 6= 0
X 0X 1
H8: ( n ) tend vers une matrice finie non singulière quand
n ! +1
H9: n > k + 1, le nombre d’observations est supérieur au nombre de
paramètres du modèle (variables explicatives + constante)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 77 / 333


Le modèle linéaire multiple

Estimateurs des MCO

La résolution analytique par MCO est la suivante:

a = (X 0 X )
b 1
X 0Y

D’une manière développée:

0 P 1
P yt 0
n
P P
···
P 10
b
1
B
B P x1t yt
C
C B P P x1t P x2t P xkt a0
C B P x1t 2
··· CB b C
B
B x2t yt C B P x1t Px1t 2x2t P x1t xkt CB a1 C
B .. C=B x2t x2t x1t x2t ··· x2t xkt CB b
a2 C
B C B CB C
B . C @ .. .. .. .. CB .. C
··· A@ A
B
@
.. C
A P. P . P . P. 2 .
P . xkt xkt x1t xkt x2t ··· xkt b
ak
xkt yt | {z } | {z }
| {z } X 0X a
X 0Y

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 78 / 333


Le modèle linéaire multiple

Propriétés des estimateurs

Écrivons

a = (X 0 X )
b 1
X 0 Y = (X 0 X ) 1
X 0 (Xa + ") = a + (X 0 X ) 1
X 0 ",
alors,

a) = E (a) + E ((X 0 X )
E (b 1
X 0 ") = E (a) + (X 0 X ) 1
X 0 E (") = E (a)

car E (") = 0.
Ce qui signifie que les estimateurs sont sans biais.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 79 / 333


Le modèle linéaire multiple

Propriétés des estimateurs

La matrice des variances et covariances des coefficients de régression qu’on


note ⌦ba est donnée par
⌦ba = "2 (X 0 X ) 1
0 1
Var (b a0 ) a0 , b
Cov (b a1 ) · · · Cov (b a0 , b
ak )
B a0 , b
Cov (b a1 ) Var (b a1 ) · · · Cov (ba1 , b
ak ) C
B C
⌦ba = B .. .. .. C
@ . . ··· . A
ak , b
Cov (b ak , b
a0 ) Cov (b a1 ) · · · Var (b ak )
✓ ◆ 1
2 X 0X
) lim ⌦ba = lim " = 0.
n n
Théorème de Gauss-Markov: Les estimateurs des MCO ont la plus
petite variance parmi les estimateurs linéaires sans biais.
Ce sont des estimateurs BLUE (Best Linear Unbiased Estimator).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 80 / 333


Le modèle linéaire multiple

Propriétés des estimateurs

Après un calcul matriciel, il apparaı̂t que nous pouvons estimer sans biais
2
" par:
ee 0
b"2 =
n k 1
avec et = yt ybt est le résidu, c’est-à-dire l’écart entre la valeur observée
de la variable à expliquer et sa valeur estimée (ajustée).
En remplaçant la variance de l’erreur par son estimateur, nous obtenons:
b ba = b2 (X 0 X )
⌦ 1
"

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 81 / 333


Le modèle linéaire multiple

Équation d’analyse de la variance et qualité d’un


ajustement

L’équation fondamentale d’analyse de la variance:


n
X n
X n
X
(yt ȳ )2 = (b
yt ȳ )2 + et2 .
|t=1 {z } |t=1 {z } |t=1
{z }
=SCT =SCE =SCR
Cette équation va nous permettre de juger de la qualité de l’ajustement
d’un modèle; en e↵et, plus la variance expliquée est proche de la variance
totale, meilleur est l’ajustement global du modèle. C’est pourquoi nous
calculons le rapport
SCE SCR
R2 = =1
SCT SCT
est appelé le coefficient de détermination, et R le coefficient de
corrélation multiple. R 2 mesure la proportion de la variance de Y
expliquée par la régression de Y sur X .
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 82 / 333
Le modèle linéaire multiple

Exercice
Soit le modèle yt = a0 + a1 x1t + a2 x2t + a3 x3t + "t , où :
t y x1 x2 x3
1 12 2 45 121
2 14 1 43 132
3 10 3 43 154
4 16 3 47 145
5 14 7 42 129
6 19 8 41 156
7 21 8 32 132
8 19 5 33 147
9 21 5 41 128
10 16 8 38 163
11 19 4 32 161
12 21 9 31 172
13 25 12 35 174
14 21 7 29 180
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 83 / 333
Le modèle linéaire multiple

Questions:

1 Mettre le modèle sous forme matricielle en spécifiant bien les


dimensions de chacune des matrices
2 Estimer les paramètres du modèle
3 Calculer l’estimation de la variance de l’erreur ainsi que les écarts
types de chacun des coefficients.
4 Calculer le coefficient de détermination et commenter

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 84 / 333


Le modèle linéaire multiple

Solution
Réponses: 1) Forme matricielle: Y = Xa + ", où

0 1
0 1 1 2 45 121 0 1 0 1
12 B C a0 "1
B C B 1 1 43 132 C B "2 C
B 14 C B C B a1 C
Y =B .. C, X = B 1 3 43 154 C, a = B C, " = B
B .. C .
C
@ A B .. .. .. .. C @ a2 A @ . A
. @ A
. . . . a3
21 | {z } "14
| {z } 1 7 29 180 | {z }
(14,1)
| {z } (4,1) (14,1)
(14,4)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 85 / 333


Le modèle linéaire multiple

a = (X 0 X )
2) Estimation des paramètres: Nous savons que b 1X 0Y . Donc,
0 0 1
on doit calculer X X puis (X X ) .
0 1
0 1 1 2 45 121
1 1 1 ··· 1 B 1 1 43 132 C
B C B C
2 1 3 · · · 7 CB C
X 0X = B@ 45 43 43 · · · 29 A B
1 3 43 154 C
B .. .. .. .. C
@ . . . . A
121 132 154 · · · 180
1 7 29 180
0 1
14 85 532 2094
B 85 631 3126 13132 C
X 0X = B
@ 532 3126 20666 78683 A
C

2094 13132 78683 317950

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 86 / 333


Le modèle linéaire multiple

0 1
20, 16864 0, 015065 0, 23145 0, 07617
B 0, 015065 0, 013204 0, 001194 0, 00094 C
(X 0 X ) 1
=B
@ 0, 23145
C.
0, 001194 0, 003635 0, 000575 A
0, 07617 0, 00094 0, 000575 0, 000401

On a
0 1 0 12 1 0 1
1 1 1 ··· 1 248
B B 14 C B
2 1 3 ··· 7 C CB C B 1622 C
X 0Y = B B C= C
@ 45 43 43 · · · 29 A @ ... A @ 9202 A
121 132 154 · · · 180 21 37592

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 87 / 333


Le modèle linéaire multiple

Alors,

0 10 1
20, 16864 0, 015065 0, 23145 0, 07617 248
B 0, 015065 0, 013204 0, 001194 0, 00094 C B 1622 C
a=B
b @ 0, 23145
CB C
0, 001194 0, 003635 0, 000575 A @ 9202 A
0, 07617 0, 00094 0, 000575 0, 000401 37592
0
1 0 1
b
a0 32, 89132
B b
a 1
C B 0, 801900 C
a=B
b @ b
C=B C
a2 A @ 0, 38136 A
b
a3 0, 03713

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 88 / 333


Le modèle linéaire multiple

3)Calcul de b" et de bba .


t yt ybt et et2
1 12 12, 84 0, 84 0, 71
2 14 12, 39 1, 61 2, 58
3 10 13, 18 3, 18 10, 11
4 16 13, 39 1, 61 2, 58
5 14 17, 70 3, 70 13, 67
6 19 17, 88 1, 12 1, 26
7 21 22, 20 1, 20 1, 44
8 19 18, 86 0, 14 0, 02
9 21 16, 51 4, 49 20, 14
10 16 18, 76 2, 76 7, 63
11 19 17, 92 1, 08 1, 17
12 21 21, 90 0, 90 0, 81
13 25 22, 71 2, 29 5, 27
14 21 20, 76 0, 24 0, 06
Somme 0 67, 45
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 89 / 333
Le modèle linéaire multiple

On a P14 2
ee 0 t=1 et 67, 45
b"2
= = = = 6, 745.
n k 1 14 3 1 10
)⌦b ba = b2 (X 0 X ) 1
"
0 1
20, 16864 0, 015065 0, 23145 0, 07617
B 0, 015065 0, 013204 0, 001194 0, 00094 C
b ba = 6, 745 ⇥ B
⌦ C
@ 0, 23145 0, 001194 0, 003635 0, 000575 A
0, 07617 0, 00094 0, 000575 0, 000401
Les variances des coefficients de régression se trouvent sur la première
diagonale:

bba20 = 6, 745 ⇥ 20, 17 = 136, 04 ) bba0 = 11, 66,


bba21 = 6, 745 ⇥ 0, 013 = 0, 087 ) bba1 = 0, 29,
bba22 = 6, 745 ⇥ 0, 0036 = 0, 024 ) bba2 = 0, 15,
bba23 = 6, 745 ⇥ 0, 0004 = 0, 0026 ) bba3 = 0, 05.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 90 / 333
Le modèle linéaire multiple

4) Le coefficient de détermination R 2 est


P14 2
2 SCE SCR t=1 et
R = =1 =1 P14 .
SCT SCT t=1 (yt y )2
P14 P14
Nous avons ee 0 = 2
t=1 et = 67, 45 et t=1 (yt y )2 = 226, 86, donc

67, 45
R2 = 1 = 0, 702.
226, 86

Puisque R 2 > 0, 5 l’ajustement global du modèle linéaire est bon.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 91 / 333


Le modèle linéaire multiple

Construction des tests

L’hypothèse de normalité des erreurs implique que:

b
ai ai
N (0, 1),
b
ai

b"2 2
(n k 1) 2 n k 1,
"
b
ai ai
Tn k 1.
bbai

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 92 / 333


Le modèle linéaire multiple

Construction des tests

Nous pouvons mettre en place un certain nombre de tests statistiques que


nous allons expliciter.
1) Comparaison d’un paramètre ai à une valeur fixée a

H0 : ai = a, contre H1 : ai 6= a.

↵/2
Si tbai > tn k 1 nous rejetons l’hypothèse H0 et alors ai est
significativement di↵erent de a (au seuil de ↵).
↵/2
Si tbai  tn k 1 nous acceptons l’hypothèse H0 et alors ai est n’est
pas significativement di↵erent de a (au seuil de ↵).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 93 / 333


Le modèle linéaire multiple

Construction des tests

2) Comparaison d’un ensemble de paramètres à un ensemble de


valeurs fixées:
Nous cherchons à tester simultanément l’égalité d’un sous-ensemble de
coefficients de régression à des valeurs fixées.

H0 : aq = aq , contre H1 : aq 6= aq ,

où q étant le nombre de coefficients retenus.


Pour accepter H0 , il suffit que:
1 b 1 (b
(b
aq a q )0 ⌦baq aq aq )  F ↵ (q, n k 1).
q
F ↵ (q, n k 1) est loi de Fisher au seuil ↵ à q et n k 1 degrés de
liberté.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 94 / 333


Le modèle linéaire multiple

Construction des tests

3) Intervalle de confiance de la variance de l’erreur:


L’intervalle de confiance de la variance de l’erreur permet de déterminer
une fourchette de variation de l’amplitude de l’erreur.
Pour un intervalle à (1 ↵%), il est donné par :

(n k 1)b"2 (n k 1)b"2
IC = 2
; 2
1 2

avec 21 à n k 1 degrés de liberté et ↵/2 de probabilité d’être dépassée


et 22 à n k 1 degrés de liberté et 1 ↵/2 de probabilité d’être
dépassée.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 95 / 333


Le modèle linéaire multiple

Exercice

En reprenant les données du tableau de l’exemple précédent, on demande


de répondre aux questions suivantes:
1 Les variables explicatives sont-elles significativement contributives
pour expliquer la variable endogène?
2 Le coefficient a1 est-il significativement inférieur à 1?
3 Les coefficients a1 et a2 sont-ils simultanément et significativement
di↵érents de 1 et 0, 5?
4 Quel est l’intervalle de confiance pour la variance de l’erreur ?
(Les seuils choisis seront de 5%.)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 96 / 333


Le modèle linéaire multiple

Solution

1) Il convient de calculer les trois ratios de Student et de les comparer à la


valeur lue dans la table pour un seuil de 5%:

|b
a1 | 0, 80 0,05
tba⇤1 = = = 2, 75 > 2, 228 = t10 ) a1 6= 0.
bba1 0, 29

Donc, la variable explicative x1 est contributive à l’explication de y .

|b
a2 | | 0, 38| 0,05
tba⇤2 = = = 2, 53 > t10 ) a2 6= 0,
bba2 0, 15

|b
a3 | | 0, 03| 0,05
tba⇤3 = = = 0, 60 < t10 ) a3 = 0.
bba3 0, 05
La variable x2 est explicative de y alors que la variable x3 n’est pas
contributive à l’explication de y , il convient donc de la retirer de ce modèle
et de procéder à une nouvelle estimation.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 97 / 333
Le modèle linéaire multiple

Solution

1) Nous aurions pu tout aussi bien répondre à cette question en calculant


les intervalles de confiance de chacun des coefficients:
↵/2 ↵/2
ICa1 = [b
a1 bba1 ⇥ tn k 1; b
a1 + bba1 ⇥ tn k 1] = [0, 14; 1, 45].

De même, nous obtenons :

ICa2 = [ 0, 71; 0, 04],

ICa3 = [ 0, 14; 0, 08].


La valeur 0 n’appartient pas à l’intervalle de confiance à 95% de a1 et a2 ,
donc ces deux coefficients sont significativement di↵érents de 0; en
revanche, 0 appartient à l’intervalle de confiance de a3 , ce coefficient n’est
pas significativement di↵érent de 0.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 98 / 333


Le modèle linéaire multiple

Exemple

2) Nous posons le test d’hypothèses unilatéral suivant:

H0 : a1 = 1, contre H1 : a1 < 1.

Sous H0 , nous avons


b
a1 a1 0, 80 1 0,05
= = 0, 68 > 1, 81 = t10
bba1 0, 29

) Acceptation de H0 .

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 99 / 333


Le modèle linéaire multiple

Exemple

3) Le test d’hypothèses est le suivant:


✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
a1 1 a1 1
H0 : = , contre H1 : 6= .
a2 0, 5 a2 0, 5

Calculons F ⇤ = 1
aq
(b b 1 (b
a q )0 ⌦ aq aq ) ,
q
✓ ◆ baq ✓ ◆
0, 80 1
où q = 2, b
aq = , āq = et
0, 38 0, 5
✓ ◆
b ba = 6, 745. 0, 013204 0, 001194
⌦ q
0, 001194 0, 003635
✓ ◆
b 1 11, 57140 3, 80213
) ⌦baq = .
3, 80213 42, 03506

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 100 / 333
Le modèle linéaire multiple

Exemple

Donc, F ⇤ =
✓ ◆✓ ◆
1 11, 57140 3, 80213 0, 8 1
(0, 8 1; 3, 8 + 0, 5)
2 3, 80213 42, 03506 3, 8 + 0, 5
0,05
) F ⇤ = 0, 612 < 4, 10 = F ↵ (q, n k 1) = F2;10 .
Et par suite, on accepte l’hypothèse H0 .
Les données ne sont pas incompatibles avec la possibilité que les
coefficients a1 et a2 soient simultanément et respectivement égaux à 1 et
0, 5.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 101 / 333
Le modèle linéaire multiple

Exemple

4) L’intervalle de confiance de la variance de l’erreur à un seuil


(1 ↵)% = 95% est calcule à partir de la formule
 " #
(n k 1)b"2 (n k 1)b"2 10 ⇥ 6, 745 10 ⇥ 6, 745
IC = 2
; 2
= 2
; 2
1 2 0,025 0,975

pour 10 degrés de liberté.


Soit 3, 30  "2  20, 75. La variance vraie (mais inconnue) 2
" de l’erreur
à 95% de chance de se situer dans cet intervalle.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 102 / 333
Le modèle linéaire multiple

Construction du tableau d’analyse de la variance et test de


signification globale d’une régression

Dans cette section, nous allons nous interroger sur la signification globale
du modèle de régression, c’est-à-dire si l’ensemble des variables explicatives
a une influence sur la variable à expliquer.
Ce test peut être formulé de la manière suivante:

H0 : a1 = a2 = · · · = ak = 0
H1 : Il existe au moins ai 6= 0

Le cas où l’hypothèse H0 est acceptée signifie qu’il n’existe aucune relation
linéaire significative entre la variable à expliquer et les variables explicatives
(ou encore que la Somme des Carrés Expliqués n’est pas significativement
di↵érente de 0).

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 103 / 333
Le modèle linéaire multiple

ANOVA

Nous reprenons l’équation fondamentale d’analyse de la variance:


n
X n
X n
X
2 2
(yt ȳ ) = (b
yt ȳ ) + et2 .
|t=1 {z } |t=1 {z } |t=1
{z }
=SCT =SCE =SCR

Nous traçons le tableau d’analyse de la variance permettant d’e↵ectuer le


test de Fisher. Soit
Pn
⇤ yt ȳ )2 /k
(b R 2 /k
F = n t=12
P =
t=1 et /(n k 1) (1 R 2 )/(n k 1)

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 104 / 333
Le modèle linéaire multiple

ANOVA

Variation SC DDL CM
SCE
x1 , . . . , xk SCE k k
SCR
Résidu SCR n k 1 n k 1
Total SCT n 1

L’hypothèse de normalité des erreurs implique que sous H0 , F ⇤ suit une loi
de Fisher (rapport de deux chi-deux).
Si F ⇤ > F ↵ (k, n k 1), nous rejetons H0 et le modèle est globalement
explicatif.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 105 / 333
Le modèle linéaire multiple

Exemple

Tester la significativité globale du modèle vu dans l’exercice précédent.


Le tableau d’analyse de la variance permettant d’e↵ectuer le test de Fisher
est:

Variation SC DDL CM
x1 , x2 , x3 SCE = 159, 41 3 53, 13
Résidu SCR = 67, 45 10 6, 745
Total SCT = 226.86 13

SCE /3 0,95
On a F ⇤ = SCR/10 = 7, 87 et F(3;10) = 3, 71.
0,95
Puisque F ⇤ > F(3;10) , nous rejetons H0 et le modèle est globalement
explicatif.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 106 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

A- L’autocorrélation des erreurs


Lorsque l’hypothèse (i 6= j ) E ("i , "j ) = 0) càd les erreurs sont
0
non-corrélées) n’est plus vérifiée, la matrice E (✏✏ ) = ⌦✏ 6= "2 I n’a plus
cette forme particulière (elle n’est plus composée de 0 à l’extérieur de la
première diagonale et les estimateurs obtenus par la méthode des MCO
sont sans biais mais ne sont plus à variance minimale, en e↵et:
0 0 1 0 0 0 1
⌦â = E ((â a)(â a) ) = (X X ) X E (✏✏ )X (X X )
0 1 (X 0 ⌦ 0 1
= (X X ) ✏ X )(X X)
C’est-à-dire que â est un estimateur dont la première diagonale de la
0
matrice des variances et covariances est supérieure à celle de "2 (X X ) 1 .

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 107 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

L’estimateur des Moindres Carrés Généralisés (MCG)


Considérons le modèle linéaire général

Y = |{z}
|{z} Xa + |{z}

(n,1) (n,k+1) (n,1)
0
dans lequel E (✏✏ ) = ⌦✏ 6= "2 I (⌦✏ est de dimension (n, n)). Nous
désirons déterminer un estimateur de a qui ait les mêmes propriétés que
l’estimateur des MCO: sans biais, fonction linéaire de Y et à variance
minimale. Il est démontré que cet estimateur est donné par :
0 1 (X 0 ⌦ 1 Y )
â = (X ⌦✏ 1 X ) ✏

Cet estimateur est appelé estimateur des Moindres Carrés Généralisés


(MCG) ou encore estimateur de Aitken.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 108 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

Les causes et la détection de l’autocorrélation des erreurs


Nous sommes en présence d’une autocorrélation des erreurs lorsque les erreurs
sont liées par un processus de reproduction

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 109 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

L’autocorrélation des erreurs peut être observée pour plusieurs raisons:


l’absence d’une variable explicative importante dont l’explication résiduelle
permettrait de ”blanchir” les erreurs;
une mauvaise spécification du modèle, les relations entre la variable à expliquer et
les variables explicatives ne sont pas linéaires et s’expriment sous une autre forme
que celle du modèle estimé (logarithmes, etc.).
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 110 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

Test de Durbin et Watson


Le test de Durbin et Watson (DW) permet de détecter une autocorrélation
des erreurs d’ordre 1 selon la forme :
2
✏t = ⇢✏t 1 + vt , vt N (0, v)

Le test d’hypothèses est le suivant: H0 : ⇢ = 0, H1 : ⇢ 6= 0.


Pour tester l’hypothèse nulle H0 , nous calculons la statistique de Durbin et
Watson: Pn
(et et 1 )2
DW = t=2Pn 2
t=1 et
où et sont les résidus de l’estimation du modèle.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 111 / 333
Le modèle linéaire multiple

Problèmes particuliers: la violation des hypothèses

Test de Durbin et Watson


Afin de tester l’hypothèse H0 , Durbin et Watson ont tabulé les valeurs
critiques de DW au seuil de 5 % en fonction de la taille de l’échantillon n
et du nombre de variables explicatives (k). La lecture de la table permet
de déterminer deux valeurs d1 et d2 comprises entre 0 et 2 qui délimitent
l’espace entre 0 et 4 selon le schéma 1: Selon la position du DW empirique
dans cet espace, nous pouvons conclure:

Si d2 < DW < 4 d2 , on accepte l’hypothèse H0 ;


Si 0 < DW < d1 , on rejette l’hypothèse H0 , ⇢ > 0
Si 4 d1 < DW < 4, on rejette l’hypothèse H0 , ⇢ < 0
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 112 / 333
Le modèle linéaire multiple

Exercice (Tests d’indépendance des erreurs)


Soit le modèle à trois variables explicatives:

yt = a0 + a1 x1t + a2 x2t + a3 x3t + ✏t

Nous avons les données suivantes (voir les données dans le fichier
”EXviolation.xls”):

Questions:
1 Estimer les coefficients du modèle.
2 E↵ectuer l’analyse graphique des résidus.
3 Calculer la statistique de Durbin et Watson et E↵ectuer le test.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 113 / 333
Le modèle linéaire multiple

Solution

1) Sous Eviews, Les résultats de l’estimation sont les suivants:

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 114 / 333
Le modèle linéaire multiple

Solution

2) Le graphique des résidus est obtenu directement à partir Eviews:

L’analyse de ce graphique révéle des résidus qui semblent cycliques, ceci


montre qu’il ya une autocorrélation positive des résidus.
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 115 / 333
Le modèle linéaire multiple

Solution

3) Les conditions d’utilisation du test de Durbin et Watson sont bien


respectées: le modèle est spécifié en série temporelle, le nombre
d’observations (n = 20) est supérieur à 15 et enfin, le modèle estimé
comporte un terme constant.

Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 116 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

Les procédures d’estimation en cas d’autocorrélation des erreurs


Si nous retenons l’hypothèse d’une autocorrélation des erreurs d’ordre 1, le
modèle linéaire s’écrit :
Y = Xa + ✏, avec ✏t = ⇢✏t 1 + vt , |⇢| < 1
(processus autorégressif d’ordre 1: AR(1) où vt N (0, 2
v) et
0 0
E (vt , vt ) = 0 pour t 6= t )

E (✏t ) = E (⇢✏t 1 + vt ) = 0
E (✏2t ) = E ((⇢✏t 1 + vt )2 ) = ⇢2 E (✏2t 1 ) + E (vt2 ) car vt est indépendant de
✏t .
La variance de ✏t étant homoscédastique, nous avons:
E (✏2t ) = E (✏2t 1 ) = "2 .
2
2 v
Soit : " (1 ⇢2 ) = 2
v, ; 2
" =
(1 ⇢2 )
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 117 / 333
Le modèle linéaire multiple

Problèmes particuliers : la violation des hypothèses

2
On a Cov (✏t , ✏t+1 ) = E (✏t ✏t+1 ) = E (✏t (⇢✏t + vt+1 ))) = ⇢
Cov (✏t , ✏t+2 ) = E (✏t ✏t+2 ) = E (✏t (⇢✏t+1 + vt+2 )) = E (✏t ✏t+1 ) = ⇢2 2

.....
Cov (✏t , ✏t+i ) = ⇢i 2

La matrice des variances-covariances de l’erreur dans ce cas est alors:
0 1
1 ⇢ ⇢2 · · · ⇢n 1
B ⇢ 1 ⇢ · · · ⇢n 2 C
2 B 2 C
⌦✏ = v B ⇢ ⇢ 1 · · · ⇢n 3 C
2
(1 ⇢ ) @ B C
.... .... · · · ..... .... A
⇢n 1 ⇢n 2 ⇢n 3 · · · 1
L’estimateur des MCG est égal:
0 0
â = (X ⌦✏ 1 X ) 1
(X ⌦✏ 1 Y )
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 118 / 333
Les modèles à décalages temporels

Plan
1 Introduction
2 QU’EST CE QUE L’ÉCONOMÉTRIE ?
3 Le modèle de régression linèaire simple
Spécification
Estimation des paramètres
Inférence statistique
4 Le modèle linéaire multiple
5 Les modèles à décalages temporels
Les modèles linéaires autorégressifs
Les modèles à retards échelonnés
6 Les modèles à équations simultanées
7 Séries chronologiques
Stationnarité
Les tests de racine unitaire et la stratégie séquentielle de test
Modèles linéaires (de Box-Jenkins)
8 Èconométrie des données de panel
Soukaina HADIRI s.hadiri@uiz.ac.ma Économétrie et Séries Temporelles March 1, 2022 119 / 333

Vous aimerez peut-être aussi