Académique Documents
Professionnel Documents
Culture Documents
Cours d’Econométrie I
Niveau : (L3) Licence Fondamentale en : Finance / Monnaie, Finance et
Banque
2
Chapitre 0 : Rappel statistique et
initiation à l’économétrie
3
B. Les indicateurs de dispersion :
4
II. Économétrie:
L'économétrie peut être définie comme l'application des méthodes statistiques à l'étude
des phénomènes économiques .Plus précisément la démarche économétrique comporte
trois étapes :
1) Construire un modèle testable qui soit justifié par la théorie économique et qui puisse
être vérifié statistiquement ;
2) Estimer les paramètres du modèle ;
3) Vérifier que les écarts entre les observations et les résultats théoriques du modèle ne
sont pas systématiques.
Théorie
Formalisation de la théorie
Modélisation
Ré-spécifier les
données Ré-spécifier le modèle
Remarque :
Seule la théorie (économique,…) doit nous guider pour la spécification du modèle, les
données ne doivent servir qu’à valider ou invalider les hypothèses que l’on émet…
Il est donc nécessaire de bien comprendre les hypothèses sous-jacentes à chacune des
fonctions proposées.
- La mise en évidence de relations entre des variables économiques qui n’étaient pas a
priori évidentes ou pressenties.
5
- L’induction statistique ou l’inférence statistique consiste à inférer, à partir des
caractéristiques d’un échantillon, les caractéristiques d’une population. Elle permet
de déterminer des intervalles de confiance pour des paramètres du modèle ou de
tester si un paramètre est significativement inférieur, supérieur ou simplement
différent d’une valeur fixée.
- La simulation qui mesure l’impact de la modification de la valeur d’une variable sur
une autre (∆𝐶𝑡 = 𝛼1 ∆𝑌𝑡 ).
- La prévision, par l’utilisation de modèles économétriques, qui est utilisée par les
pouvoirs publics ou l’entreprise afin d’anticiper et éventuellement de réagir à
l’environnement économique.
Simplicité.
𝑑𝑦 Peut être appliqué directement dans un premier temps pour vérifier l’existence
= d’une relation.
𝑎
𝑑𝑥 Estimation directe des paramètres par la méthode des moindres carrés.
6
Archétype de la croissance (décroissance) qui s’épuise.
𝑑𝑦 Exp : salaire = f(ancienneté) ou vente = f(publicité).
=
𝑑𝑥/𝑥 Linéarisation par ln(𝑦) = 𝑎 ln(𝑥) + b
𝑎
7
1. Le coefficient de corrélation de Pearson :
8
Chapitre1 : Le modèle de
régression simple
Nous commençons notre étude par le modèle le plus simp le : une variable endogène
est expliquée par une variable exogène. Après avoir étudié les conséquences
probabilistes de l’erreur d’observation, nous présentons en I. les formules de base
permettant d’estimer les paramètres du modèle. Les hypothèses stochastiques et leurs
conséquences sont étudiées au paragraphe II.
En III. et IV., la qualité de l’estimation d’un modèle est examinée à l’aide des
premiers tests statistiques (Student, Fisher).
Enfin, en V., le modèle de régression simple est étudié en tant qu’outil de prévision
avec le degré de confiance que nous pouvons en attendre.
I. Présentation du modèle :
Soit la fonction de consommation keynésienne :
𝐶 = 𝛼0 + 𝛼1 𝑌
Où : C=
consommation Y
= revenu,
𝛼1= propension marginale à consommer ;
𝛼0= consommation autonome ou incompressible.
1. Vocabulaire :
La variable consommation est appelée « variable à expliquer » ou « variable endogène ».
La variable revenu est appelée « variable explicative » ou « variable exogène » (c’est le
revenu qui explique la consommation).
𝛼1et 𝛼0 sont les paramètres du modèle ou encore les coefficients de régression.
2. Spécification :
Nous pouvons distinguer deux types de spécification :
Les modèles en série temporelle, les variables représentent des phénomènes observés à
intervalles de temps réguliers, par exemple la consommation et le revenu annuel sur
20 ans pour un pays donné. Le modèle s’écrit alors :
𝐶𝑡 = 𝛼0 + 𝛼1𝑌𝑡 ; 𝑡 = 1, … , 20
Où : 𝐶𝑡 = consommation au temps t.
𝑌𝑡 = revenu au temps t.
9
Les modèles en coupe instantanée, les variables représentent des phénomènes observés
au même instant mais concernant plusieurs individus, par exemple la consommation et
le revenu observés sur un échantillon de 20 pays. Le modèle s’écrit alors :
𝐶𝑖 = 𝛼0 + 𝛼1𝑌𝑖 ; 𝑖 = 1, … , 20
Où : C = consommation du pays i pour une année donnée,
Y = revenu du pays i pour une année donnée.
𝑦𝑡 = 𝛼0 + 𝛼1𝑥𝑡 + 𝜀𝑡 ; 𝑡 = 1,… , 𝑛
1
𝑥𝑡 = variable explicative au temps t
𝛼0 et 𝛼1 = paramètres du modèle
𝜀𝑡 = erreur de spécification (différence entre le vrai et le modèle spécifié), cette erreur est
inconnue et restera inconnue.
𝑛 = nombre d’observation.
L’estimation et son évaluation ne prend effet que si certaines hypothèses sont respectées.
Ces hypothèses permettent de déterminer les propriétés des estimateurs et de mettre en place
les outils de statistique inférentielle ou inductive (tests d’hypothèses, intervalle de confiance).
Hypothèses :
-H2 : les valeurs 𝑥𝑡 sont observées sans erreurs (𝑥𝑡 non aléatoire).
-H3 : 𝐸(𝜀𝑡 ) = 0, l’espérance mathématique de l’erreur est nulle : en moyenne le modèle est
bien spécifié et donc l’erreur moyenne est nulle.
-H4 : 𝑉(𝜀2) = 𝜎 2, la variance de l’erreur est constante 1 : le risque de l’amplitude de l’erreur
𝑡 𝜀
est le même quelle que soit la période.
-H5 : 𝐸(𝜀𝑡 𝜀𝑡′ ) = 0 𝑠𝑖 𝑡 ≠ 𝑡′, les erreurs sont non corrélées (ou encore indépendantes) : une
erreur à l’instant 𝑡 n’a pas d’influence sur les erreurs suivantes.
1
Cette hypothèse s’appelle l’hypothèse d’homoscédasticité ; dans le cas où cette hypothèse n’est pas
vérifiée, on parle alors de modèle hétéroscédastique.
1
La résolution analytique est la suivante :
𝛼^ =∑𝑦𝑡 −
∑ 𝑥𝑡 𝑎^ 𝟎 = 𝒚 −
0 1 ﻟ
𝑛
𝑛 𝑛 𝑛
⟹ ⟹
∑ 𝑥 𝑡 (𝑦𝑡 − 𝛼^0 − 𝛼^1 𝑥𝑡 ) ❪∑ 𝑥𝑡 (𝑦𝑡 − 𝛼^0 − 𝛼^1 𝑥 𝑡 ) = 0
=0 𝗅𝑡=1
𝗅𝑡 =1
𝑛 𝑛
Remarque :
1
Application 1 :
On voulait estimer la relation de consommation des cafés pour les étudiants de l’école ESTIM
en fonction de leurs revenus journaliers. Les données sur le montant du revenu journalier et
du montant dépensé pour la consommation des cafés étaient les suivantes :
i 1 2 3 4 5 6 7 8 9 10 11 12
Yi 0 0 2 1 1 3 3 4 2 3 1 2
Xi 5 3 10 10 5 4 5 7 8 6 6 7
Réponse :
L’équation à estimer est la suivante : 𝑦𝑖 = 𝛼0 + 𝛼1𝑥𝑖 + 𝜀𝑖 ; 𝑖 = 1,… , 12
Avec : 𝑦𝑖 = la consommation en café pour l’individu i
𝑥𝑖 = revenu du l’individu i
𝛼0 et 𝛼1 = paramètres du modèle
𝜀𝑖 = erreur de spécification (différence entre le vrai et le modèle spécifié)
∑ ∑𝑥𝑡
∑(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦) 𝑎𝑣𝑒𝑐 𝑦 = 𝑒𝑡 𝑥 =
𝛼^0 = 𝑦 + 𝛼^1 𝑥 𝑒𝑡 = ∑(𝑥𝑖 − 𝑥)² 𝑦𝑡 𝑛
𝛼^ 1
𝑛
7
6
5 y = 0,0886x + 1,2722
𝛼^ 4,67 ∑( 𝑥𝑖 − 𝑥) (𝑦 − 𝑦) = 0,0886 4
𝑖
= = 3
1
{ ∑(𝑥𝑖 − 𝑥)2 52,67 2
𝛼^ 0 = 𝑦 + 𝛼^ 1 𝑥 = 1,833 − 0,0886 ∗ 6,333 = 1,272 1
0
0246810 12
1
3. Propriétés statistiques des estimateurs
Propriétés de 𝑎^ 𝟏 :
𝛼^ ∑(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦) ∑[(𝑥𝑖 − 𝑥)𝑦𝑖 − (𝑥𝑖 − 𝑥)𝑦] ∑((𝑥𝑖 − 𝑥)𝑦𝑖 ) − ∑(𝑥𝑖 − 𝑥)𝑦
= = =
1
∑(𝑥𝑖 − 𝑥)2 ∑(𝑥𝑖 − 𝑥)2 ∑(𝑥𝑖 − 𝑥)2
Or ∑(𝑥𝑡 − 𝑥) = ∑ 𝑥𝑡 − ∑ 𝑥 = ∑ 𝑥𝑡 − 𝑛𝑥 = 𝑛𝑥 − 𝑛𝑥 = 0
Posant : 𝒙𝒊−𝒙
𝒘𝒕 =∑(𝒙𝒊−𝒙)𝟐 ⟹ = ∑ 𝑤𝑖 𝑦𝑖 ⟹ est un estimateur linéaire.
𝛼^1
1
ﻟ ∑𝑤 𝑖 = 0
I
⟹ ∑𝑥𝑖𝑤𝑖 = 1
❪
I ∑𝑤𝑖 ² = 1
𝗅 ∑(𝑥 − 𝑥 ) 2
𝑖
𝛼^ 1 = ∑ 𝑤𝑖 𝑦𝑖 = ∑ 𝑤𝑖 (𝛼0 + 𝛼1 𝑥 𝑖 + 𝜀𝑖 ) = 𝛼0 ∑ 𝑤𝑖 + 𝛼1 ∑ 𝑤𝑖 𝑥 𝑖 + ∑ 𝑤𝑖 𝜀𝑖
𝜎²
⨀𝑉(𝛼^ 1 ) = 𝑉 (𝛼1 + ∑ 𝑤𝑖 𝜀𝑖 ) = ∑ 𝑤𝑖 ²𝑉(𝜀𝑖 ) = 𝜎² ∑ 𝑤𝑖 ² =
∑(𝑥𝑖 −
𝝈² 𝑛⟶+∞
𝑽 (𝑎 ^ 𝟏 ) = −−−−−→ 0 ⟹ on dit que 1 est un estimateur c onvergent
∑(𝒙𝒊 − α^
Propriétés de
𝑎^ 𝟎 :
∑𝑦𝑖 1
𝛼^ 0 = 𝑦 − 𝛼^1 𝑥 − ∑𝑤𝑖𝑦𝑖 𝑥 = ∑𝑦𝑖 ( − ∑𝑤 𝑖 𝑥)
= 𝑛
�
⟹ 𝛼^0 = ∑𝑦𝑖 𝑞𝑖 ⟹ 𝛼^ 0 est une variable linéaire
ﻟ ∑𝑞 𝑖 = 1
I
𝟏 ∑𝑥 𝑞 = 0
I ∑ 𝑞2 =
𝒒𝒕 = − ∑𝒘 𝒊 𝒙 ⟹
𝒏 ❪
1
𝑖 𝑖
2
1 𝑥
+
𝗅 𝑖 𝑛 ∑(𝑥𝑖 − 𝑥)2
1
𝛼^0 = ∑ 𝑦𝑖 𝑞𝑖 = ∑ 𝑞𝑖 (𝛼0 + 𝛼1 𝑥 𝑖 + 𝜀𝑖 ) = 𝛼0 ∑ 𝑞𝑖 + 𝛼1 ∑ 𝑞𝑖 𝑥 𝑖 + ∑ 𝑞𝑖 𝜀𝑖
𝟏 𝒙𝟐 𝑛 ⟶+∞
⟹ 𝑽(𝑎^ 𝟎 ) = 𝝈² [ + ∑( 𝒙𝒊 − 𝒙 )𝟐] −−−−→ 0 𝛼^ 0 est un estimateur convergent.
𝒏
Remarque :
⟹ 𝑠𝑖 𝑥 > 0 alors α^0 et α^1 sont liés négativement, plus particulièrement une sur-
estimation
de l’un se traduit par une sous-estimation de l’autre.
2
𝜎^𝜀 2 =∑ 𝑡 = 𝑆. 𝐶.
𝑑𝑑𝑙 𝑅 ; avec ddl = (nbres d′ observation− nbres de paramètres)
𝑑𝑑𝑙
∑ 𝗌𝟐∑ 𝗌𝟐
𝝈^𝗌 𝟐 = 𝒕 = 𝒕
𝒅𝒅𝒍𝒏 − 𝟐
( 𝑛−2) 𝜎 2
En effet, 𝐸 (∑ 𝜀 2 ) = (𝑛 − 2)𝜎 2 ⟹ 𝐸 (𝜎^ 2 ) = 𝐸 ( ) = 𝜎 2.
�
𝑡 𝜀 𝜀 (𝑛−2) 𝜀
Ce qui nous permet de déterminer les estimateurs de la variance de chacun des paramètres :
1 𝜎^
2
𝑉 ^ (𝛼^ ) = 𝜎^ 2
2 𝑥
[ 0 � +
𝑛 ∑( 𝑥𝑖 − 𝑥
1
]
)2
𝑉^ ( 𝛼 ^ ) = 𝜀
1 ∑(𝑥𝑖 − 𝑥)2
1
III. Analyse de la variance :
1. Décomposition de la variance :
𝑦𝑡 − 𝑦̅ = (𝑦𝑡 − 𝑦^𝑡 ) + (𝑦^𝑡 − 𝑦̅ )
⟹ ∑ (𝑦𝑡 − 𝑦̅)2 = ∑(𝑦𝑡 − 𝑦^𝑡 )2 + ∑ (𝑦^𝑡 − 𝑦̅)2 + 2 ∑ (𝑦𝑡 − 𝑦^𝑡 )(𝑦^𝑡 − 𝑦̅)
= ∑ 𝜀𝑡 𝑦^𝑡 = ∑ 𝜀𝑡 (𝛼^ 0 + 𝛼^ 1 𝑥𝑡 ) = 𝛼^ 0 ∑ 𝜀𝑡 + 𝛼^ 1 ∑ 𝑥 𝑡 𝜀𝑡 = 0
A/ Conséquences :
= ∑(−𝛼^ (𝑥 − 𝑥̅))2 = 𝛼^ 2
∑(𝑥 − 𝑥̅)2𝑎=^𝟏 𝟐𝐒𝐱𝐱
1 𝑡 1
2
∎ 𝜎^𝜀 2 = ∑ 𝑡 = 𝑆𝐶𝑅 SCT − SCE
𝑛−2 𝑛− = 𝑛−2
2
2. Le coefficient de détermination :
1
Il exprime la part de la variable endogène expliqué par la régression. La régression est
d’autant plus meilleure que 𝑹² soit proche de 1.
2
3. Tableau d’analyse de la variance :
Pour résumer les éléments, étant permis la décomposition de la variance, on dresse un
tableau qui prend la forme suivant :
𝐻0 : 𝛼𝑗 = 𝑏
𝐻1 : 𝛼𝑗 ≠ 𝑏
On utilise la statistique de student :
2
𝛼^𝑗 − 𝛼𝑗
𝘑 (𝛼^ ) = ↝➚
𝑐 𝑗 (𝑁−2)
𝜎^(𝛼
^𝑗 )
2
Pour un seuil critique α (généralement 5%) :
Si |𝘑𝑐 (𝛼^𝑗 )| > ➚(𝑁−2) alors on rejette H0 et on accepte H1 .
Remarque :
𝐻0 : 𝛼𝑗 = 0
𝐻1: 𝛼𝑗 ≠ 0 ⟹ hypothèse de significativité
Remarque :
𝐻0: 𝛼𝑗 = 𝑏
Si le réel 𝑏 ∈ 𝐼𝐶 95% (𝛼𝑗 ) alors on décide sinon on accepte H1.
𝐻1: 𝛼𝑗 ≠ 𝑏 H0
2
V. Prévision :
On admettant la stabilité des paramètres du modèle et ces hypothèses. Si on se donne une
valeur futur 𝑋𝑇+ℎ pour la variable exogène, alors la valeur prévue correspondante à la valeur
endogène sera 𝑌^𝑇+ℎ = 𝛼^ 0 + 𝛼^ 1 𝑋 𝑇+ℎ .
La valeur théorique de la variable endogène à cette date est : 𝑌𝑇+ℎ = 𝛼0 + 𝛼1𝑋𝑇+ℎ + 𝜀𝑇+ℎ
L’erreur de prévision 𝑒 𝑇+ℎ = 𝑌𝑇+ℎ − 𝑌^𝑇+ℎ = 𝜀 𝑇+ℎ − (𝛼^ 0 − 𝛼0 ) − 𝑋 𝑇+ℎ (𝛼^1 − 𝛼1 ).
Cela prouve que l’estimateur 𝑌^𝑇+ℎ est un estimateur sans biais de 𝑌𝑇+ℎ .
1
= 𝜎² + 𝜎² [ 𝑥
2 𝜎² 𝜎²
𝑇+ ] + 𝑋2 𝑇+ℎ − 2𝑋𝑇+ℎ 𝑋
∑( 𝑥𝑖 − )2 ∑( 𝑥𝑖 − ) 2 ∑( 𝑥𝑖 − 𝑥)2
𝑥 𝑥
1 𝑋𝑇+ℎ − 𝑋
= 𝜎² [1 + + ]
𝑇 𝑇 ∑(𝑥𝑖 − 𝑥 )2
𝒆𝑻+𝒉 − 𝟎
𝒆
𝝈𝟐 ↝ 𝑵(𝟎 ; )⟹ ↝➚
𝑻+𝒉 (𝒆𝑻+𝒉) (𝑵−𝒏𝒃𝒔.𝒑𝒂𝒓𝒂𝒎è𝒕𝒓𝒆𝒔 )
𝝈(𝒆𝑻+𝒉)
2
B. Application 2 :
2
2
2
23
Chapitre 2 : le Modèle de
Régression Multiple
24
La dimension de la matrice X est donc de n lignes et k+1 colonnes (k étant le nombre de
variables explicatives réelles).
2
1. Hypothèses et propriétés des estimateurs :
Le modèle est linéaire en X (ou sur ces coefficients) et nous distinguons les hypothèses
stochastiques (liées à l’erreur 𝜀) des hypothèses structurelles.
a) Hypothèses stochastiques :
b) Hypothèses structurelles :
Considérons les propriétés de l’estimateur (3). Le modèle sous forme matricielle peut
s’écrire, comme pour le modèle de régression simple, de différentes manières :
2
Remarque :
2
III. Analyse de la variance et qualité d’ajustement :
2
IV. Application :
2
3
3
3
Chapitre 3 : problèmes de
violation des hypothèses
classiques
3
3
3
3
3
3
3
4
4
4