Vous êtes sur la page 1sur 21

Khalil Mhadhbi Initiation à l’Économétrie

Introduction Générale

1. Démarche statistique

Pour mieux comprendre l’objectif et la démarche de la statistique, en tant que discipline, il convient
d’abord de la définir. À ce niveau, il faut remarquer que le mot statistique peut couvrir plusieurs
définitions, selon l’utilisation au singulier ou au pluriel, sous forme définie ou indéfinie. Il faut donc faire la
distinction entre les statistiques, une statistique et la statistique.
 Les statistiques constituent l’ensemble des données ou observations.
 Une statistique est une caractéristique calculée sur un échantillon, et qui sera utilisée pour estimer
les caractéristiques de toute la population appelées paramètres.
 La statistique comme science renferme les méthodes visant, d’une part à collecter, à présenter et
à synthétiser l’ensemble des données, et d’autre part à tirer des conclusions relatives à toute la
population à partir des mesures calculées sur un échantillon. La démarche statistique comporte
donc, essentiellement et au premier vu, deux étapes qui sont dans l’ordre: le calcul des mesures sur
un échantillon (statistique descriptive) et la généralisation à toute la population (la statistique
inductive).
Plus précisément, la statistique descriptive consiste, d’une part à collecter les données, à les regrouper
et à les présenter dans des tableaux et des graphiques, et d’autre part à décrire et à résumer ou synthétiser
les données statistiques par des mesures comme celles de tendance centrale, de dispersion et de forme.
La statistique inductive ou mathématique a pour objectif de tirer des conclusions sur une population
à partir des résultats calculés sur un échantillon, tiré aléatoirement, de cette population. La mesure calculée
sur un échantillon sera appelée statistique ou estimateur et servira à apporter des informations sur la
mesure relative à la population (paramétré). Si le paramétré est complètement inconnu, alors l’opération
d’inférence est appelée« estimation ». Toutefois, si on dispose d’une information sur le paramétré et nous
voulons juste vérifier la véracité de cette information, alors l’opération d’inférence sera appelée« tests
d’hypothèses»
À ce niveau trois, trois remarques s’imposent :
- D’abord, il faut remarquer que l’opération d’inférence consiste à tirer des conclusions sur une
population à partir d’une mesure calculée sur un échantillon choisi aléatoirement à partir de toute
la population implique que l’on ne peut pas être absolument certain de l’exactitude des conclusions
qu’on peut tirer. Ainsi, puisqu’on ne peut espérer des conclusions d’une exactitude certaine, il faut
absolument être en mesure de calculer les probabilités d’erreur reliées à ces conclusions et essayer
de faire en sorte que ces probabilités soient les plus faibles possibles.
Le calcul de probabilité est alors une étape importante dans la démarche statistique. Evidemment, elle
doit précéder l’étape de la statistique inductive.
- Ensuite, il faut remarquer aussi que le choix d’un échantillon représentatif de la population est une
étape primordiale pour la réussite de l’opération de l’inférence statistique car la qualité de la
mesure qu’on veut calculer dépendra énormément de l’échantillon, qui dépendra lui aussi, de la
technique utilisée pour le choix d’un tel échantillon; la partie de la statistique qui s’intéresse à la
présentation de ces techniques est appelée « Techniques de Sondage ».

1
Khalil Mhadhbi Initiation à l’Économétrie
- Enfin, il est important de signaler que grâce aussi à l’apport des probabilités et à l’algèbre linéaire,
la statistique est devenue aujourd’hui un outil de prévision économique. La méthode statistique qui
vise cette objectif est appelée « économétrie ».

Tenant compte des objectifs retenus, la démarche statistique effective comporte donc cinq étape (et non pas
deux) qui sont dans l’ordre : les techniques de sondage, la statistique descriptive, les calculs de probabilité,
la statistique inductive ou mathématique et l’économétrie.

2. Modèle économique

Les économistes et les financiers cherchent à expliquer et à établir les relations entre les variables
économiques qui décrivent les phénomènes et les comportements qu’ils étudient.
Les études économiques peuvent être décomposées en deux catégories :
- Les études théoriques : il s’agit de comprendre et de développer une théorie économique ;
- Les études empiriques : il s’agit de l’utilisation des données et d’outils mathématiques tels que
l’économétrie et la recherche opérationnelle.
La construction d’un modèle est un processus de création qui s’effectue en deux étapes :
- Elimination des variables dont l’importance est négligeable ou faible ;
- Reconnaissance explicite et structuration logique des relations entre les variables choisies.
Exemples
- Au niveau micro-économique, on peut citer :
La fonction de production : y = f (K, L)
L’équation de la demande : Q = f (P, R)
- Au niveau macro-économique, on peut citer :
La fonction de consommation : C = f (R)
La demande de la monnaie : Md = f (I, R)

3. Étude économétrique

Pour pouvoir comprendre ce qu’est l’économétrie et quelle peut être son importance pour l’étudiant
chercheur, il est indispensable de définir cette discipline.
3.1. Définition

L’économétrie se définit par l’application des méthodes mathématiques et statistiques afin d’analyser les
phénomènes économiques et financiers dans le but de donner un contenu empirique afin de vérifier ou de
réfuter.
L’objectif d’une étude économétrique est :
- Estimation des relations économiques et financières : fonction de consommation, d’offre de
demande etc.…..

2
Khalil Mhadhbi Initiation à l’Économétrie
- Tester des hypothèses : vérifier le signe des coefficients, effectuer un test sur un ou plusieurs
paramètres etc.…..
- Prévision et prise de décision.
3.2. Pourquoi étudier l’économétrie ?

L'économétrie est fondamentale pour la mesure économique. Cependant, son importance va bien au-delà
de la discipline de l'économie. L'économétrie est un ensemble d'outils de recherche également utilisés dans
les disciplines commerciales de la comptabilité, de la finance, du marketing et de la gestion. Il est utilisé par
les spécialistes des sciences sociales, en particulier les chercheurs en histoire, en sciences politiques et en
sociologie. L'économétrie joue un rôle important dans des domaines aussi divers que la foresterie et
l'économie agricole. Cet intérêt pour l'économétrie découle en partie du fait que l'économie est le
fondement de l'analyse commerciale et constitue le noyau des sciences sociales. Ainsi, les méthodes de
recherche employées par les économistes, qui incluent le domaine de l'économétrie, sont utiles à un large
éventail d'individus.

L'économétrie joue un rôle particulier dans la formation des économistes. En tant qu’étudiant en économie,
vous apprenez à «penser comme un économiste». Vous apprenez des concepts économiques tels que le coût
d’opportunité, la rareté et l’avantage comparatif. Vous travaillez avec des modèles économiques d'offre et
de demande, de comportement macroéconomique et de commerce international. Grâce à cette formation,
vous devenez une personne qui comprend mieux le monde dans lequel nous vivons; vous devenez quelqu'un
qui comprend le fonctionnement des marchés et la manière dont les politiques gouvernementales affectent
le marché.

Si l'économie est votre domaine d'études majeur ou mineur, un large éventail de possibilités s'offre à vous
après l'obtention de votre diplôme. Si vous souhaitez entrer dans le monde des affaires, votre employeur
voudra connaître la réponse à la question «Que pouvez-vous faire pour moi?» Les étudiants qui suivent un
programme d'études d'économie traditionnel répondent: «Je peux penser comme un économiste. «Bien
que nous puissions considérer qu'une telle réponse est puissante, elle n'est pas très spécifique et peut ne pas
être très satisfaisante pour un employeur qui ne comprend pas l'économie.

Le problème, c’est qu’il y a un écart entre ce que vous avez appris en tant qu’étudiant en économie et ce
que font les économistes réellement. Très peu d’économistes gagnent leur vie en étudiant uniquement la
théorie économique, et ceux qui le font sont généralement employés par les universités. La plupart des
économistes, qu’ils travaillent dans le monde des affaires ou pour le gouvernement, ou qu’ils enseignent
dans les universités, effectuent des analyses économiques qui sont en partie « empiriques ». Nous entendons
par là qu’ils utilisent les données économiques pour estimer les relations économiques, tester les hypothèses
économiques et prédire les résultats économiques.

L’étude de l’économétrie remplit l’écart entre « un étudiant en économie » et « un économiste en


exercice ». Grâce aux compétences en économétrie que vous apprendrez de ce cours, y compris la façon de
travailler avec un logiciel économétrique, vous serez en mesure d’élaborer votre réponse à la question de
l’employeur ci-dessus en disant « Je peux prédire les ventes de votre produit. ’’

'' Je peux estimer l'effet sur vos ventes si votre concurrence baisse son prix de 1 dinars l'unité. '' Je peux
tester si votre nouvelle campagne publicitaire augmente réellement vos ventes. '' Ces réponses sont une
musique pour les oreilles d'un employeur, parce qu'ils reflètent votre capacité à penser comme un
économiste et à analyser des données économiques. Ces informations sont essentielles à de bonnes décisions

3
Khalil Mhadhbi Initiation à l’Économétrie
commerciales. Être en mesure de fournir à votre employeur des informations utiles fera de vous un
employé précieux et augmentera vos chances d'obtenir un emploi souhaitable.

3.3. Étapes d’une étude économétrique

Étape 1 : Définition des variables : en économétrie, on distingue 2 types de variables :


- Les variables endogènes où encore à expliqués ;
- Les variables exogènes où encore explicatives qui sont déterminées à l’intérieur du modèle.
Les variables endogènes peuvent être des variables explicatives.
Étape 2 : Détermination de la relation : il s’agit de déterminer la nature de la relation à retenir. D’une
façon générale il existe trois types de relations économétriques :
- Le modèle à une seule équation ;
- Le modèle à plusieurs équations ;
- Les modèles à équation simultanés. Ce type de modèle peut expliquer des modèles macro-
économiques.
Étape 3 : Détermination de la relation fonctionnelle : il s’agit d’expliciter la fonction ‘f’. on peut citer
les relations suivantes :
- Relation linéaire : y = ax+ b ;
- Relation semi log : y = constante + log (x).
Étape 4 : Sélection des données : les données qu’on peut observer sont de trois types :
- Les données individuelles ou encore les données en coupe transversale (Cross section) : il s’agit
d’observation sur des individus à une date bien déterminé ;
- Les données des séries temporelles (Time series) : il s’agit d’observer le même individu pour
différentes périodes ;
- Les données de panel (panel data) : il s’agit de données temporelles et individuelles. Observer n
individus pendant T périodes.
Étape 5 : Estimation : il s’agit d’estimer les relations par une méthode d’estimation adéquate tel que la
méthode des moindres carrés ordinaires (MCO), la méthode du maximum de vraisemblance (MV),
la méthode des Moindres Carrés Généralisés (MCG), la méthode des moments, la méthode des moments
généralisés etc.
Étape 6 : Application des tests d’hypothèses : il s’agit d’appliquer des tests d’hypothèses sur un ou
plusieurs paramètres, vérifier le signe des coefficients estimés.
Étape 7 : Prise de décision et prévision : après avoir spécifié le modèle, collecté les données, estimé les
coefficients et effectué les tests statistiques, on passe à l’objectif essentiel de l’économétrie à savoir la
prévision.

4
Khalil Mhadhbi Initiation à l’Économétrie

Chapitre 1
Modèle de régression linéaire simple

1. Introduction

En économie, on essaye souvent d’établir une relation entre deux ou plusieurs variables. On peut avoir
comme soucis par exemple de comprendre l’impact de l’éducation sur le salaire, la sensibilité de
l’investissement aux taux d’intérêt ou encore l’inflation et l’emploi.
La théorie de la régression fourni une série d’outil pour estimer ses relations. Dans une analyse de
régression, nous cherchons à expliquer une variable (variable endogène) à l’aide d’une ou plusieurs autres
variables (variables exogènes). Dans le cas de régression linéaire simple, on s’intéresse à expliquer une
variable endogène en fonction d’une seule variable exogène et éventuellement d’une constante.

2. Le modèle linéaire simple

On dispose d’une série d’observations sur la variable " y ' " :

yt : t = 1,2,........, T
et d’une série d’observations sur la variable " x" :

xt : t = 1,2,........, T
Ce modèle linéaire simple s’écrit : yt = β 0 + β1 xt ∀t = 1,2,.........., T

Si la relation linéaire entre ses deux variables est exacte alors les points de coordonnés ( xt ; yt ) se trouvent
sur une même droite.
En pratique, les relations ne sont pas exactes. Par conséquent, tous les points ne sont pas situé sur la même
droite (quelques points sont alignés et d’autres ne sont pas).

Pour tenir compte de cette différence, on fait intervenir dans la relation un terme d’erreur noté ε t , le
modèle devient yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T

ε t est
un terme d’erreur appelé terme aléatoire ou perturbation. ε t est une variable aléatoire non
observable.

- ε t mesure la différence entre les valeurs réellement observées de y et les valeurs qui auraient dû
être observé si la relation était exacte ;
- ε t permet de résumer toute l'information qui n'est pas prise en compte dans la relation linéaire.
Parmi les sources des erreurs ε t , on cite :
- Le comportement humain qui peut être tout simplement non déterministe ;
- L’omission volontaire ou non volontaire d’autres variables explicatives ;
5
Khalil Mhadhbi Initiation à l’Économétrie
- Erreur de mesure au niveau des variables ;
- Erreur d’approximation de la relation linéaire utilisée.

Le modèle proposé yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T n’est qu’une représentation simplifié du


mécanisme étudié. Mais le problème majeur dans ceci est que la réalité observée ne se conformera jamais et
exactement au modèle spécifié. Pour mieux comprendre, représentons sur un graphique le nuage des points
observés {( xt , yt )t = 1,2,..........., T } et traçons « à main levée », une droite yˆ t = βˆ0 + βˆ 1xt qui passe à
travers ce nuage.

y
valeur observée yˆ t = βˆ0 + βˆ1 xt
yt

εˆt

ŷt
valeur fournit par le mod èle

Si la relation représenté parfaitement et intégralement la réalité, alors tous les points


{(xt , yt )t = 1,2,..........., T } seront situés exactement sur yˆ t = βˆ0 + βˆ 1xt . Mais en fait, il n’en est rien,
puisque pour une valeur donnée xt de x, un certain écart intervient entre la valeur observée yt et la
valeur yˆ t = βˆ0 + βˆ 1xt . Cet écart, noté εˆt et appelé résidu, est défini par :

εˆt = yt − yˆ t , t = 1,2,...............T

3. Hypothèses

Compte tenu de ces considérations, la spécification complété du modèle envisagé, appelé modèle de
régression linéaire simple, s’écrit :

yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T
Les hypothèses de base sont les suivantes :
- Hypothèse 1

On suppose que le modèle est linéaire : yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T

6
Khalil Mhadhbi Initiation à l’Économétrie
- Hypothèse 2

E (ε t ) = 0; ∀ t = 1,2,......., T : L’espérance mathématique de l’erreur est nulle. En moyenne, le modèle


est bien spécifié et donc l’erreur moyenne est nulle.
- Hypothèse 3

( ) ( )
Var (ε t ) = E [ε t − E (ε t )] = E ε t2 − E (ε t ) = E ε t2 = σ ε2 ; t = 1,2,..................T
2 2

La variance de l’erreur est constante. On dit que les erreurs ε t sont homoscédastiques.
- Hypothèse 4

Cov(ε t , ε t ' ) = E[(ε t − E (ε t ))(ε t ' − E (ε t ' ))] = E (ε t ε t ' ) = 0∀t ≠ t '
Les erreurs ne sont pas auto corrélées (ou encore elles sont indépendantes).

Remarque : si les hypothèses 2, 3, 4 sont vérifiées, l’erreur ε t est un bruit blanc(Wihte Noise).
- Hypothèse 5

Cov(xt ; ε t ) = 0 , l’erreur est indépendante de la variable explicative.


- Hypothèse 6
Les erreurs sont distribuées selon une loi normale : ε t (
→ N 0, σ ε2 )
- Hypothèse7
On suppose que la variable explicative est non stochastique tel que :
1 T
lim
t → +∞ T

t =1
xt = µ cons tan te ( finie)

1 T
lim
t → +∞ T
∑ ( xt − µ ) = S 2 ( finie)
2

t =1

Cette hypothèse7 est utile pour étudier les propriétés asymptotiques.

4. Estimation du modèle
4.1. Estimateur des Moindres Carrés Ordinaires (MCO)

L’estimateur des MCO est dérivé de la minimisation de la somme des carrés des résidus.

( )
T T T
Min ∑ εˆt2 = Min ∑ y t − βˆ0 − βˆ1 xt = Min ∑ S
2

β 0 ; β1 β 0 ; β1 β 0 ; β1
t =1 t =1 t =1

- Condition du premier ordre :


 ∂S
 =0
∂β β
 0 0 1
ˆ ; βˆ
 ∂S
 =0
 ∂β1 βˆ0 ; βˆ1

7
Khalil Mhadhbi Initiation à l’Économétrie
∂S
( )
T
= −2∑ y t − βˆ0 − βˆ1 xt
∂βˆ0 t =1

∂S
( )
T
= −2∑ y t − βˆ0 − βˆ1 xt xt
∂βˆ1 t =1

∂S
( )
T
= 0 ⇔ ∑ yt − βˆ0 − βˆ1 xt = 0 (1)
∂β 0 βˆ0 ; βˆ1 t =1

∂S
( )
T
= 0 ⇔ ∑ yt − βˆ0 − βˆ1 xt xt = 0 (2)
∂β1 β 0 ; β1
ˆ ˆ t =1

La résolution des équations (1) et (2) donne :


T T T
1 T T
(1) ⇒ ∑ yt − ∑ βˆ0 − ∑ βˆ1 xt = 0 et on a y= ∑ t ∑y ⇒ y t = Ty de même
t =1 t =1 t =1 T t =1 t =1
T T T
1
x= ∑ t ∑
T t =1
x ⇒
t =1
xt = Tx et ∑ βˆ
t =1
0 = Tβˆ0

donc (1) ⇒ Ty − Tβˆ0 − βˆ1Tx = 0 ⇒ y − βˆ0 − βˆ1 x = 0 en fin, βˆ0 = y − βˆ1 x


T T T T T
(2) ⇒ ∑ xt yt − βˆ0 ∑ xt − βˆ1 ∑ xt2 = 0 ⇒ ∑ xt yt − βˆ0Tx − βˆ1 ∑ xt2 = 0 en remplaçant β̂ 0 par son
t =1 t =1 t =1 t =1 t =1

( )
t T
valeur, on obtient : ∑x y
t =1
t t − y − βˆ1 x Tx − βˆ1 ∑ xt2 = 0
t =1

T T T  
⇒ ∑ xt y t − Tx y + βˆ1Tx 2 − βˆ1 ∑ xt2 = 0 ⇒ ∑ xt y t − Tx y = βˆ1  ∑ xt2 − Tx 2 
t =1 t =1 t =1  
T T T

∑ (x − x )( yt − y ) ∑ (x − x )( yt − y )
1
∑x y t t − Tx y t
m xy T
t
Cov( x; y )
En fin, βˆ1 = t =1
= t =1
= = t =1
=
T T T
Var ( x )
∑ (x − x) ∑ (x − x)
1
∑x
m xx
− Tx 2
2 2 2
t t t
t =1 t =1 T t =1

βˆ0 = y − βˆ1 x
- Condition du second ordre :

 ∂2S ∂2S 
 2 
∂ β ∂β 0∂β1 
H = 2 0 0
 ∂ S ∂2S 
 
 ∂β1∂β 0 ∂ 2 β1  βˆ ; βˆ
0 1

 H 1,1 H 1, 2 
H =  
H
 2,1 H 2 , 2  βˆ ; βˆ
0 1

∂2S
H 1,1 = = 2T  0
∂2β0
8
Khalil Mhadhbi Initiation à l’Économétrie
∂2S T
H 1, 2 = = 2∑ xt = 2Tx
∂β 0 ∂β1 t =1

∂2S T
H 2,1 = = 2∑ xt = 2Tx
∂β1∂β 0 t =1

∂2S T
H 2, 2 =
∂ β1
2
= 2 ∑
t =1
xt2

T
 T   T 2
H = dét (H ) = 4T ∑ xt2 − 4T 2 x 2 = 4T  ∑ xt2 − Tx 2  = 4T  ∑ (xt − x )   0 et on a H 11  0
t =1  t =1   t =1 
⇒ βˆ0 etβˆ1 minimisent bien la quantité S .
Remarques
- Pour un échantillon d’observation donné, la droite d’ajustement des moindres carrés ordinaires est
unique. Cette droite est alors donnée par : yˆ t = βˆ0 + βˆ 1xt
- La droite d’ajustement des moindres carrés ordinaires passe par le point moyen
(x; y ); y = βˆ0 + βˆ1 x
- yt = β 0 + β1 xt + εt

partie déter min iste partie stochastique

4.2. Estimateurs de maximum des vraisemblances (MV)

Cette méthode s’appuie sur l’hypothèse de normalité du terme d’erreurs, ε t (


→ N 0; σ ε2 )
La densité de probabilité (ddp) est donc :

 1 
f (ε t ) =
1
exp − 2 ε t2 
2Πσ 2  2σ 

f ( yt ) = ( yt − β 0 − β1 xt )2
1 1
exp−
2Π σ 2 2σ 2

La fonction de vraisemblance est définit par :


T
   1   1 
( )
T T T T
l (ε 1 , ε 2 ,......, ε T ) = ∏ f (ε t ) = 
1
∑ε ∑ε

 exp − 2 2
 = 2Πσ 2 2 exp − 2 2


 2σ  2σ
t t
 2Πσ   
2
t =1 t =1 t =1

( 2Πσ )
T

( )
− T

∑ (y − β 0 − β1 xt )
1
l y1 , y 2 ,......, yT , β 0 , β1 , σ 2 = exp−
2 2 2

2σ 2 t
t =1

(
max Logl = max2 log l y1 , y 2 ,.........., yT , β 0 , β1 ,σ 2
β 0 , β1 ,σ
)
( )
T

∑ (y − β 0− β1 xt )
T 1
Logl = − Log 2Πσ 2 − 2
2


t
2 t =1

9
Khalil Mhadhbi Initiation à l’Économétrie

( )
T
Log (2Π ) − Log σ 2 − 2 ∑ (y − β 0− β1 xt ) = S
T T 1
Logl = −
2


t
2 2 t =1

On pose σ 2 = θ
T
Log (2Π ) − Log (θ ) − ∑ (y − β 0− β1 xt )
T T 1
S=−
2


t
2 2 t =1

- Condition du premier ordre :



 ∂S
=0
 ∂β 0 βˆ0 ; βˆ1 ; θˆ

 ∂S
 =0
 ∂β1 βˆ0 ; βˆ1 ; θˆ
 ∂S
 =0
 ∂θ βˆ0 ; βˆ1 ; θˆ

∂S −1 T
( ) ( )
T
= −2 ∑ yt − βˆ0 − βˆ1 xt = 0 ⇒ ∑ yt − βˆ0 − βˆ1 xt = 0
∂β 0 βˆ0 ; βˆ1 ; θˆ 2θˆ t =0 t =1

⇒ βˆ0 MV = βˆ0 MCO = y − βˆ1 x


∂S −1 T
( ) ( )
T
= −2 ∑ yt − βˆ0 − βˆ1 xt xt = 0 ⇒ ∑ yt − βˆ0 − βˆ1 xt xt = 0
∂β1 βˆ0 ; βˆ1 ; θˆ 2θˆ t =0 t =1

⇒ βˆ1MV = βˆ1MCO

( )
T
− Tθˆ + ∑ yt − βˆ0 − βˆ1 xt
2

∑ (y )
∂S T 1 T 2
=− + 2 − βˆ0 − βˆ1 xt =0⇒ t =1
=0
2θˆ 2θˆ 2θˆ 2
t
∂β1 βˆ0 ; βˆ1 ; θˆ t =0

( )
2
1 T 1 T 2
⇒ θˆ MV = ∑ yt − βˆ0 − βˆ1 xt = ∑ εˆt = σˆ 2
T t =1 T t =1
Remarques

- ε t = yt − β 0 − β1 xt : erreur.
- εˆt = yt − βˆ0 − βˆ1 xt : résidu.
- εˆt = yt − βˆ0 − βˆ1 xt = β 0 + β1 xt + ε t − βˆ0 − βˆ1 xt
ε ( ) (
ˆt = ε t + β 0 − βˆ0 + β1 − βˆ1 xt
 
)
Résidu Erreur Erreur de spécification

- β 0 et β1 sont appelés paramètres du modèle.


- β 0 est appelé constante du modèle.
- β1 est appelé coefficient de réaction.

10
Khalil Mhadhbi Initiation à l’Économétrie
- On appelle spécification le fait de transformer un modèle purement théorique sous une forme qui
pourra donner lieu à une estimation et à une vérification empirique (il faut notamment choisir la
forme de la relation à estimer, les variables jugées pertinentes, la période d’estimation…)

5. Propriétés des estimateurs


5.1. β̂1 est sans biais

Soit α̂ un estimateur de α on dit que α̂ est sans biais si et seulement si E (αˆ ) = α


T T

∑ (xt − x )( yt − y ) ∑ (xt − x )yt


β̂1 = t =1
T
= t =1
T

∑ (x − x) ∑ (x − x)
2 2
t t
t =1 t =1

T T T T
Nous avons ∑ (xt − x )yt = ∑ (xt yt − xyt ) = ∑ xt yt − x ∑ yt = ∑ xt yt − Txy
t =1 t =1 t =1 t =1 t =1

1 T T
On a z = ∑t ∑
T t =1
z ⇔
t =1
z t = Tz

(x − x ) T
On pose wt = T t donc β̂1 = ∑w y t t

∑ (xt − x ) t =1
2

t =1

T T T T
βˆ1 = ∑ wt (β 0 + β1 xt + ε t ) = β 0 ∑ wt + β1 ∑ wt xt + ∑ wt ε t
t =1 t =1 t =1 t =1

Or
  T T T

T

 ( xt − x )
T

=
∑ (x t − x) ∑x −∑x t
Tx − Tx
∑ wt = ∑  T 
t =1
T
= t =1
T
t =1
= T
= 0 et
 ∑ ( xt − x ) ∑ (x − x) ∑ (x − x) ∑ (x − x)
t =1 t =1 2 2 2 2
 t t t
 t =1  t =1 t =1 t =1

T T T

∑ (xt − x )xt ∑ (xt − x )(xt − x ) ∑ (xt − x )


2
T

∑w x t t = t =1
T
= t =1
T
= t =1
T
=1
t =1
∑ (x − x) ∑ (x − x) ∑ (x − x)
2 2 2
t t t
t =1 t =1 t =1

t
⇒ βˆ1 = β1 + ∑ wt ε t
t =1

( )
E βˆ1 = β1 + ∑ wt E (ε t ) = β1 car wt est une variable non stochastique et E (ε t ) = 0 (Hypothèse 2), β̂1
T

t =1

est un estimateur sans biais de β1 .

11
Khalil Mhadhbi Initiation à l’Économétrie
5.2. β̂ 0 est sans biais
T
βˆ0 = y − βˆ1 x et on a β̂1 = ∑ wt yt
t =1

T
1 T T t
1  T 1 
β̂ 0 = y − x ∑ wt y t = ∑ y t − x ∑ w t y t = ∑  y t − w t x y t  = ∑ y t  − x wt 
t =1 T t =1 t =1 t =1  T  t =1  T 
1
On pose d t = − x wt donc
T
T T T T T
βˆ0 = ∑ d t yt = ∑ d t (β 0 + β1 xt + ε t ) = β 0 ∑ d t + β1 ∑ d t xt + ∑ d t ε t
t =1 t =1 t =1 t =1 t =1

T T
1  T T
Or ∑ t ∑ 
d = − x wt = 1 − x ∑ wt = 1 car nous avons montré que ∑w t =0
t =1 t =1  T  t =1 t =1

T T
1  1 T T
1 T

t =1
d x
t t = ∑ 
t =1  T
− x wt t

x = ∑t ∑
T t =1
x − x
t =1
w x
t t = ∑ xt − x = x − x = 0 car nous avons montré que
T t =1
T

∑w x
t =1
t t =1

T
En fin, βˆ0 = β 0 + ∑d ε
t =1
t t

( )
T T
E βˆ0 = β 0 + ∑ E (d t ε t ) = β 0 + ∑ d t E (ε t )
t =1 t =1

( )
Donc E βˆ0 = β 0 car E (ε t ) = 0 (hypothèse 2). β̂ 0 est un estimateur sans biais de β0 .
5.3. Théorème de Gauss-Markov

Les estimateurs β̂ 0 et β̂1 sont les meilleurs estimateurs dans la place des estimateurs linéaire et sans biais
dont les sens qu’ils admettent les variances minimales. On dit qu’ils sont BLUE (Best Linear Unbaised
Estimator).

( )
V βˆ1 = T
σ ε2
est minimale.
∑ (x − x)
2
t
t =1

 
1 
( )
2
x
V βˆ0 = σ ε2  + 
T 2
T

 ∑ (xt − x ) 
t =1 

12
Khalil Mhadhbi Initiation à l’Économétrie
5.4. Matrice variance-covariance des estimateurs

Remarque
X  E ( X )
W =   ⇒ E (W ) =  
Y   E (Y ) 
( X − E ( X ))
V (W ) = E[W − E (W )][W − E (W )] = E  [( X − E ( X )); (Y − E (Y ))]
'

 (Y − E (Y )) 


V (W ) = 
( X − E ( X ))2 ( X − E ( X ))(Y − E (Y )) =  V ( X ) Cov( X ; Y )
 
( X − E ( X ))(Y − E (Y )) (Y − E (Y ))2  Cov( X ; Y ) V (Y ) 

 ˆ  
Soit βˆ =  β 0  ⇒ V βˆ =  V β 0
ˆ
() ( ) ( )
Cov βˆ0 ; βˆ1 
 βˆ 
 1 Cov β 0 ; β1
ˆ ˆ ( ) ( )
V βˆ1


Avec
 
1 
( )
V βˆ0 = σ ε2  +
x2

T 2
T

 ∑ (xt − x ) 
t =1 

( )
V βˆ1 = T
σ ε2

∑ (x − x)
2
t
t =1

(
Cov βˆ0 ; βˆ1 = σ ε2 ) T
−x

∑ (x − x)
2
t
t =1

1 x2 −x 
T + T T 
β
 
 ∑ ( xt − x )
2
∑ ( xt − x )2

V 0  = σ ε2  t =1 t =1 
β
 1  −x 1 
 T T 
 ∑ (xt − x )2 ∑ (xt − x ) 
2

 t =1 t =1 

5.5. Estimateur de la variance de l'erreur σ ε2

La méthode de Maximum de Vraisemblance (MV) nous fournit un estimateur de la variance de l’erreur


σ ε2 définit par :

( )
T T T

∑ εˆt2 = ∑ ( yt − yˆ t ) = ∑ yt − βˆ0 − βˆ1 xt


2
SCR
avec SCR =
2
σˆ 2
ε ( MV ) =
T t =1 t =1 t =1

avec SCR :Somme des Carrés des Résidus (Sum of Squared Residuals)

13
Khalil Mhadhbi Initiation à l’Économétrie
SCR
( (T − 2) σ 2 ≠ σ 2 , donc σˆ 2
)
σ ε2( MV ) = ⇒ E σˆ ε2( MV ) = ε ε ε ( MV ) est biaisé. L’estimateur sans biais de
T T
SCR Tσˆ ε ( MV )
2

σ ε est donné donc par : σˆ =


2
=
2
ε
T −2 T −2

6. Estimation par Intervalle de confiance


 Pour β0
Soit β̂ 0 un estimateur ponctuel de β 0 , sous l’hypothèse de normalité des erreurs on peut écrire :
 
(
βˆ0 → N β 0 ; V βˆ0 ( )) ( )

avec V βˆ0 = σ ε2  1 + x 2 

2
T
T

 ∑ (xt − x ) 
t =1 

βˆ0 − β 0
donc Z = → N (0,1)
( )
V βˆ0

Si la variance de l’erreur σ ε2 est connue donc β 0 ∈  βˆ0 ± Z α V βˆ0 


1−

( )
 2 
Si la variance de l’erreur σ ε2 est inconnue et la taille de l’échantillon est supérieure à 30, alors on l’estime
 
1 
 
( ) ( )
2
x
par σˆ ε2 = SCR donc β 0 ∈  βˆ 0 ± t α Vˆ βˆ 0  avec Vˆ βˆ0 = σˆ ε  + T 
T −2 2

 2
T −2  2 

T
∑ (xt − x ) 
t =1 

 Pour β1
Soit β̂1 un estimateur ponctuel de β1 , sous l’hypothèse de normalité des erreurs on peut écrire :

( ( ))
βˆ1 → N β1 ; V βˆ1 avec V (βˆ1 ) = T
σ ε2

∑ (x − x)
2
t
t =1

βˆ1 − β1
donc Z = → N (0,1)
Vβ ( )
ˆ
1

Si la variance de l’erreur
 
σ ε2 est connue donc β1 ∈  βˆ1 ± Z α V βˆ1 
1−
( )
 2 
Si la variance de l’erreur σ ε2 est inconnue et la taille de l’échantillon est supérieure à 30 , alors on l’estime

par σˆ ε2 = SCR donc β1 ∈  βˆ1 ± t α
T −2
T −2

Vˆ βˆ1  avec V βˆ1 = ( ) ( ) T
σˆ ε2
 2  ∑ (x t − x)
2

t =1

14
Khalil Mhadhbi Initiation à l’Économétrie
7. Test d’hypothèses sur les paramètres ( σ ε2 inconnue)
 Pour β0
 H 0 : β 0 = b0

 H 1 : β 0 ≠ b0

c
≤ T −2 βˆ0 − b0
On accepte H0 si t t α avec
c
=
( )
t
2 Vˆ βˆ0


En effet, β 0 ∈  βˆ0 ± t α ( ) 
V βˆ0 
 2 

( ) ( ) βˆ − b
⇒ βˆ0 − t αT −2 Vˆ βˆ0 ≤ b0 ≤ βˆ0 + t αT −2 Vˆ βˆ0 ⇒ t αT −2 ≤ 0 0 ≤ t αT −2 ⇒ βˆ0 − b0 ≤ t αT −2
2 2 2 Vˆ βˆ0 2( ) Vˆ (βˆ 0 ) 2

 Pour β1
 H 0 : β1 = b1

 H 1 : β1 ≠ b1

βˆ1 − b1
On accepte H0 si t c ≤ t αT − 2 avec t =
c

2 ( )
Vˆ βˆ1


En effet, β1 ∈  βˆ1 ± Z
1−
α ( ) 
V βˆ1 
 2 

( ) ( ) βˆ − b
⇒ βˆ1 − t αT − 2 Vˆ βˆ1 ≤ b1 ≤ βˆ1 + t αT − 2 Vˆ βˆ1 ⇒ t αT − 2 ≤ 1 1 ≤ t αT − 2 ⇒ βˆ1 − b1 ≤ t αT −2
2 2 2 Vˆ βˆ1( )
2 Vˆ (βˆ1 ) 2

Remarque
Test de significativité
H 0 : β i = 0
 ∀i = 0 ou 1
 H1 : β i ≠ 0

Si on accepte H 0 alors on dit que β i est non significative ou encore significativement égale à zéro.

Si on rejette H 0 alors on dit que β i est significative ou encore significativement diffèrent de zéro.

8. Qualité de l’ajustement linéaire


8.1. Analyse de la variance : Tableau ANOVA

Soit yt = β 0 + β1 xt + ε t un modèle de régression, l’estimation par les MCO fournit l’ajustement linéaire
suivant : yˆ t = βˆ0 + βˆ1 xt . Une fois l’estimation est réalisée deux questions peuvent se poser :

15
Khalil Mhadhbi Initiation à l’Économétrie
- x explique-t-elle l’évolution de y ?
- La relation entre x et y est-elle linéaire ?
Pour répondre à ces questions, on utilise l’équation de l’analyse de la variance.
Nous avons
T T T T T

∑ ( yt − y ) = ∑ [( yt − yˆ t ) + ( yˆ t − y )] = ∑ [yt − yˆ t ] + ∑ [yˆ t − y ] +2∑ ( yt − yˆ t ) ( yˆ t − y )


2 2 2 2

t =1 t =1 t =1 t =1 t =1 (1) (2 )

( yˆ t − y ) = (βˆ0 + βˆ1 xt )− (βˆ0 + βˆ1 x ) = βˆ1 (xt − x )


(2 )

( yt − yˆ t ) = ( yt − y ) − ( yˆ t − y ) = ( yt − y ) − βˆ1 (xt − x )
(1)

[
(1) × (2) = βˆ1 (xt − x ) × ( yt − y ) − βˆ1 (xt − x ) ][ ]
ˆ  [(x − x )( y − y )] − βˆ 2
T T T

∑ (1) × ( 2 ) = β 1 ∑ t t 1 ∑ ( xt − x ) 
t =1  t =1 t =1 
T

∑ (x t − x )( yt − y ) T T
Or βˆ1 = t =1
⇒ βˆ1 ∑ ( xt − x ) = ∑ ( xt − x )( yt − y )
2
T

∑ (x − x) t =1 t =1
2
t
t =1

ˆ  [( x − x )( y − y )] − ( x − x )( y − y ) = 0
T T
D’où ∑ (1) × ( 2 ) = β1 ∑ t t ∑ t t
t =1  t =1 
T T T

∑ ( yt − y ) = ∑ ( yt − yˆ t ) + ∑ ( yˆ t − y )
2 2 2
Donc
t =1 t =1 t =1

Somme des carrées Totale (SCT) =Somme des Carrés des Résidus (SCR)+Somme des Carrés Expliquée (SCE).

SCT : désigne la variation totale. Elle représente graphiquement la dispersion du nuage des points.
T
SCT = ∑ ( y t − y )
2

t =1

SCE : indique la variation des expliqués par la modèle .

( ) = ∑ ( yˆ ( ( ))
T T T 2 T
SCE = ∑ yˆ t − yˆ − y) = ∑ = βˆ12 ∑ (xt − x )
2
t
2
βˆ0 + βˆ1 xt − βˆ0 + βˆ1 x 2

t =1 t =1 t =1 t =1

SCR : indique la variation résiduelle.

( )
T T T
SCR = ∑ εˆt2 = ∑ ( y t − yˆ t ) = ∑ y t − βˆ0 − βˆ1 xt
2 2

t =1 t =1 t =1

On déduit ainsi le tableau de la variance appelé aussi ANOVA

16
Khalil Mhadhbi Initiation à l’Économétrie
Tableau ANOVA

Source de variation La somme des carrées Degré de liberté Carré moyen

T t

∑ ( yˆ t − y ) = βˆ12 ∑ (xt − x )
2 2 SCE
Modèle : SCE 1
t =1 t =1
1

∑ εˆ 2 SCR
Résidu : SCR T-2
t =1
t
T −2

∑ (y − y)
2 SCT
Total : SCT T-1
t =1
t
T −1

Degré de liberté= nombre des observations –nombre des paramètres à estimer


8.2. Coefficient de détermination

La qualité de l’ajustement linéaire peut être mesurée par le coefficient de détermination noté R 2 et définit
par :
Cov(x; y )
R 2 = (ζ xy ) avec ζ xy le coefficient de corrélation entre x et y définit par ζ xy =
2

σ xσ y

avec − 1 ≤ ζ xy ≤ 1 donc 0 ≤ R = ζ xy ≤ 1
2 2

2
1 T
 ∑ (xt − x )( yt − y )
Cov ( x; y ) m xy2
R 2 = (ζ xy )  T t =1 
2
= = =
2

V ( x )V ( y )  1 T 2  1
( yt − y )2  m xx m yy
T

T ∑ ( x t − x )  T ∑
 t =1   t =1 

Or, on sait que βˆ1 = xy ⇒ βˆ1m xx = m xy ⇒ R 2 = β1 m xx = β1 m xx


m ˆ2 2 ˆ2
m xx m xx m yy m yy

Et que yˆ t − y = βˆ1 ( xt − x ) avec y = y


ˆ
T T
Donc ( yˆ t − y ) = βˆ1 (xt − x ) ⇒ ∑ ( yˆ t − y ) = βˆ1 ∑ ( xt − x )
2 2 2 2 2 2

t =1 t =1

m ˆˆ
Donc m yˆyˆ = βˆ12 mxx ⇒ R 2 = yy
m yy

1 T
∑ ( yˆt − y )2
T Variance Expliquée VE
R 2 = t T=1 = =
1
∑ ( y t − y )2 Variance Totale VT
T t =1

On sait aussi que SCR = m yy − β̂12 m xx donc SCR = m yy − m yˆyˆ

17
Khalil Mhadhbi Initiation à l’Économétrie
m yy − SCE SCR
Donc R 2 = = 1−
m yy SCT

1 T
T
∑ (
εˆt − εˆ
2
) Variance Rèsiduelle VR
R 2 = 1 − tT=1 = 1− = 1−
1
∑ ( yt − y )2 Variance Totale VT
T t =1

Si VR = 0 ⇒ yt = yˆ t ∀t donc R 2 = 1 :cas d’un meilleur ajustement linéaire.


Si VR = VT ⇒ R 2 = 0 : ajustement linéaire de mauvaise qualité.
Remarques
L’introduction de variable explicative supplémentaire dans le modèle ne peut qu’augmenter la valeur de R 2 .

yt = β 0 + β1 x1t + ε t ⇒ R12

yt = β 0 + β1 x1t + β 2 x2t + ε t ⇒ R22


2 2
Donc R1  R2
R2
Afin d’éviter ce problème on utilisera le coefficient de détermination corrigé (ajusté) noté définit par :
SCR SCR
R = 1−
2 dl = 1− T −2
SCT SCT
dl T −1

9. Prévision
9.1. Prévision ponctuelle

On considère le modèle linéaire suivant : yt = β 0 + β1 xt + ε t ∀t = 1,2,....T , on désire prévoir la valeur


y pour une date p  T . Sous l’hypothèse de stabilité de la relation : yˆ = βˆ + βˆ x .
p 0 1 p

9.2. Prévision par intervalle de confiance


On note e p : l’erreur de prévision, avec e p = y p − y
ˆ p donc :

( ) ( )
e p = y p − yˆ p = β 0 + β1 x p + ε p − βˆ0 − βˆ1 x p = β 0 − βˆ0 + β1 − βˆ1 x p + ε p

( ( )) ( ( ) )
⇒ E (e p ) = β 0 − E βˆ0 + β 1− E βˆ1 x p + E (ε p ) = (β 0 − β 0 ) + (β1 − β1 )x p = 0 , car β̂ 0 et β̂1 sont
deux estimateurs sans biais et E (ε ) = 0 (hypothèse 2).
p

18
Khalil Mhadhbi Initiation à l’Économétrie
( ) ( )
V (e p ) = V β 0 − βˆ0 + β1 x p − βˆ1 x p + ε p = V ε p − βˆ0 − βˆ1 x p
= V (βˆ ) + V (βˆ x ) + V (ε ) − 2 cov(ε ; βˆ ) − 2 cov(ε ; βˆ x ) + 2 cov(βˆ ; βˆ x )
0 1 p p p 0 p 1 p 0 1 p

1 x 2x x 
+ σ + 2 x cov(βˆ ; βˆ ) = σ  +
1 x  2 2 2 2
x x
= σ  +2
 + σ 2 p 2
+ +1−  2 p p
ε ε εT m p 0
m 
1 ε
T m  m xx  xx m  xx xx xx 
 1 x + x − 2x p x  2 2

= σ ε2 1 + +  p
 T m 
 xx 
 1 (x p − x ) 
2

V (e p ) = σ ε 1 + +
 2
 T m xx 

Sous l’hypothèse de normalité des erreurs, on déduit que e p → N (0; V (e p ) ) , donc
ep y p − yˆ p
= → N (0;1) .
V (e p ) V (e p )


( )
En déduire que y p ∈  yˆ p ± Z α V e p  si σ ε2 la variance de l’erreur est connue.
1−
 2 
 
si σ ε2 la variance de l’erreur est inconnue y p ∈  yˆ p ± t T −α2 Vˆ (e p )
1−
 2 
 1 (x p − x ) 
2

avec V (e p ) = σˆ ε 1 + +
2
ˆ et σˆ ε2 = SCR
 T m  T −2
 xx 
10. Logiciel Eviews
Eviews est un logiciel de statistique et d’économétrie largement utilisé par les étudiants, chercheurs et
enseignant chercheurs. C’est l’un des logiciels les plus complets de fonctions statistiques, graphiques et de
gestion de données.
10.1. Exemple
On considère les données suivantes :

Années 2001 2002 2003 2004 2005


yt 2 4 5 7 10
xt 1 2 3 4 5

Soit la régression suivante : yt = β 0 + β1 xt + ε t

Où ε t vérifient les hypothèses classiques :


1. Estimer les paramètres β 0 et β1 par la méthode des MCO.
2. Donner un estimateur sans biais de la variance des erreurs σ ε .
2

3. Etablir le tableau ANOVA.

19
Khalil Mhadhbi Initiation à l’Économétrie
4. Calculer et interpréter le coefficient de détermination R 2 .
5. Tester la significativité des coefficients.
6. Construire un intervalle de confiance pour β 0 et pour β1 .
7. Etablir une prévision ponctuelle de y 2006 sachant que x2006 = 6 .
8. Etablir une prévision par intervalle de confiance de y 2006 .
9. Tester la stabilité de la relation sachant que la valeur de y en 2006 est égal à 11,2.
Les résultats d’estimation par Eviews de ce modèle sont les suivants :
1. La droite de régression de y en x

2. Résultat de l'estimation du modèle par les MCO.


Dependent Variable: Y
Method: Least Squares
Date: 07/05/17 Time: 22:19
Sample: 2001 2005
Included observations: 5 (1) (2) (3) (4)

Variable Coefficient Std. Error t-Statistic Prob.

C -0.100000 0.635085 -0.157459 0.8849


X 1.900000 0.191485 9.922426 0.0022

R-squared (5) 0.970430 Mean dependent var (12) 5.600000


Adjusted R-squared (6) 0.960573 S.D. dependent var (13) 3.049590
S.E. of regression (7) 0.605530 Akaike info criterion (14) 2.123749
Sum squared resid (8) 1.100000 Schwarz criterion (15) 1.967524
Log likelihood (9) -3.309373 Hannan-Quinn criter. (16) 1.704457
F-statistic (10) 98.45455 Durbin-Watson stat (17) 1.854545
Prob(F-statistic) (11) 0.002178

(1) : Coefficients estimés β̂ i

(2) : Estimateurs des écart-types des coefficients estimés (Std. Error) S * β̂ i .( )


(3) : Valeur de t de student calculé. t βc = βˆi .
i
( )
S * βˆi

20
Khalil Mhadhbi Initiation à l’Économétrie
(4) :Probabilité critique (p-value) du test de nullité des coefficients. Pour un risque de 5%, si prob<
0.05, on rejette l’hypothèseH0 de la nullité du coefficient et conclut que le coefficient est significatif.
(5) : Coefficient de détermination ( R 2 ).
(6) : Coefficient de déterminationajusté ( R 2 ).
(7) : Estimateur de l’écart-type des résidus de la régression (Standard Error of regrssion) σ̂ .

(8) : Somme des carrés des résidus (SCR ) .


(9) : log vraisemblance.
(10) : Valeur du Ficher empirique.
(11) : Probabilité critique du Fisher empirique utilisée pour tester la nullité conjointe des coefficients.
(12) : Moyenne de la variable dépendante.
(13) : Ècart-type de la variable dépendante.
(14) : Critère d’Akaike.
(15) : Critère de Schwarz.
(16) : Critère Hannan-Quinn.
(17) : Statistique de Durbin-Watson.

21

Vous aimerez peut-être aussi