Académique Documents
Professionnel Documents
Culture Documents
Introduction Générale
1. Démarche statistique
Pour mieux comprendre l’objectif et la démarche de la statistique, en tant que discipline, il convient
d’abord de la définir. À ce niveau, il faut remarquer que le mot statistique peut couvrir plusieurs
définitions, selon l’utilisation au singulier ou au pluriel, sous forme définie ou indéfinie. Il faut donc faire la
distinction entre les statistiques, une statistique et la statistique.
Les statistiques constituent l’ensemble des données ou observations.
Une statistique est une caractéristique calculée sur un échantillon, et qui sera utilisée pour estimer
les caractéristiques de toute la population appelées paramètres.
La statistique comme science renferme les méthodes visant, d’une part à collecter, à présenter et
à synthétiser l’ensemble des données, et d’autre part à tirer des conclusions relatives à toute la
population à partir des mesures calculées sur un échantillon. La démarche statistique comporte
donc, essentiellement et au premier vu, deux étapes qui sont dans l’ordre: le calcul des mesures sur
un échantillon (statistique descriptive) et la généralisation à toute la population (la statistique
inductive).
Plus précisément, la statistique descriptive consiste, d’une part à collecter les données, à les regrouper
et à les présenter dans des tableaux et des graphiques, et d’autre part à décrire et à résumer ou synthétiser
les données statistiques par des mesures comme celles de tendance centrale, de dispersion et de forme.
La statistique inductive ou mathématique a pour objectif de tirer des conclusions sur une population
à partir des résultats calculés sur un échantillon, tiré aléatoirement, de cette population. La mesure calculée
sur un échantillon sera appelée statistique ou estimateur et servira à apporter des informations sur la
mesure relative à la population (paramétré). Si le paramétré est complètement inconnu, alors l’opération
d’inférence est appelée« estimation ». Toutefois, si on dispose d’une information sur le paramétré et nous
voulons juste vérifier la véracité de cette information, alors l’opération d’inférence sera appelée« tests
d’hypothèses»
À ce niveau trois, trois remarques s’imposent :
- D’abord, il faut remarquer que l’opération d’inférence consiste à tirer des conclusions sur une
population à partir d’une mesure calculée sur un échantillon choisi aléatoirement à partir de toute
la population implique que l’on ne peut pas être absolument certain de l’exactitude des conclusions
qu’on peut tirer. Ainsi, puisqu’on ne peut espérer des conclusions d’une exactitude certaine, il faut
absolument être en mesure de calculer les probabilités d’erreur reliées à ces conclusions et essayer
de faire en sorte que ces probabilités soient les plus faibles possibles.
Le calcul de probabilité est alors une étape importante dans la démarche statistique. Evidemment, elle
doit précéder l’étape de la statistique inductive.
- Ensuite, il faut remarquer aussi que le choix d’un échantillon représentatif de la population est une
étape primordiale pour la réussite de l’opération de l’inférence statistique car la qualité de la
mesure qu’on veut calculer dépendra énormément de l’échantillon, qui dépendra lui aussi, de la
technique utilisée pour le choix d’un tel échantillon; la partie de la statistique qui s’intéresse à la
présentation de ces techniques est appelée « Techniques de Sondage ».
1
Khalil Mhadhbi Initiation à l’Économétrie
- Enfin, il est important de signaler que grâce aussi à l’apport des probabilités et à l’algèbre linéaire,
la statistique est devenue aujourd’hui un outil de prévision économique. La méthode statistique qui
vise cette objectif est appelée « économétrie ».
Tenant compte des objectifs retenus, la démarche statistique effective comporte donc cinq étape (et non pas
deux) qui sont dans l’ordre : les techniques de sondage, la statistique descriptive, les calculs de probabilité,
la statistique inductive ou mathématique et l’économétrie.
2. Modèle économique
Les économistes et les financiers cherchent à expliquer et à établir les relations entre les variables
économiques qui décrivent les phénomènes et les comportements qu’ils étudient.
Les études économiques peuvent être décomposées en deux catégories :
- Les études théoriques : il s’agit de comprendre et de développer une théorie économique ;
- Les études empiriques : il s’agit de l’utilisation des données et d’outils mathématiques tels que
l’économétrie et la recherche opérationnelle.
La construction d’un modèle est un processus de création qui s’effectue en deux étapes :
- Elimination des variables dont l’importance est négligeable ou faible ;
- Reconnaissance explicite et structuration logique des relations entre les variables choisies.
Exemples
- Au niveau micro-économique, on peut citer :
La fonction de production : y = f (K, L)
L’équation de la demande : Q = f (P, R)
- Au niveau macro-économique, on peut citer :
La fonction de consommation : C = f (R)
La demande de la monnaie : Md = f (I, R)
3. Étude économétrique
Pour pouvoir comprendre ce qu’est l’économétrie et quelle peut être son importance pour l’étudiant
chercheur, il est indispensable de définir cette discipline.
3.1. Définition
L’économétrie se définit par l’application des méthodes mathématiques et statistiques afin d’analyser les
phénomènes économiques et financiers dans le but de donner un contenu empirique afin de vérifier ou de
réfuter.
L’objectif d’une étude économétrique est :
- Estimation des relations économiques et financières : fonction de consommation, d’offre de
demande etc.…..
2
Khalil Mhadhbi Initiation à l’Économétrie
- Tester des hypothèses : vérifier le signe des coefficients, effectuer un test sur un ou plusieurs
paramètres etc.…..
- Prévision et prise de décision.
3.2. Pourquoi étudier l’économétrie ?
L'économétrie est fondamentale pour la mesure économique. Cependant, son importance va bien au-delà
de la discipline de l'économie. L'économétrie est un ensemble d'outils de recherche également utilisés dans
les disciplines commerciales de la comptabilité, de la finance, du marketing et de la gestion. Il est utilisé par
les spécialistes des sciences sociales, en particulier les chercheurs en histoire, en sciences politiques et en
sociologie. L'économétrie joue un rôle important dans des domaines aussi divers que la foresterie et
l'économie agricole. Cet intérêt pour l'économétrie découle en partie du fait que l'économie est le
fondement de l'analyse commerciale et constitue le noyau des sciences sociales. Ainsi, les méthodes de
recherche employées par les économistes, qui incluent le domaine de l'économétrie, sont utiles à un large
éventail d'individus.
L'économétrie joue un rôle particulier dans la formation des économistes. En tant qu’étudiant en économie,
vous apprenez à «penser comme un économiste». Vous apprenez des concepts économiques tels que le coût
d’opportunité, la rareté et l’avantage comparatif. Vous travaillez avec des modèles économiques d'offre et
de demande, de comportement macroéconomique et de commerce international. Grâce à cette formation,
vous devenez une personne qui comprend mieux le monde dans lequel nous vivons; vous devenez quelqu'un
qui comprend le fonctionnement des marchés et la manière dont les politiques gouvernementales affectent
le marché.
Si l'économie est votre domaine d'études majeur ou mineur, un large éventail de possibilités s'offre à vous
après l'obtention de votre diplôme. Si vous souhaitez entrer dans le monde des affaires, votre employeur
voudra connaître la réponse à la question «Que pouvez-vous faire pour moi?» Les étudiants qui suivent un
programme d'études d'économie traditionnel répondent: «Je peux penser comme un économiste. «Bien
que nous puissions considérer qu'une telle réponse est puissante, elle n'est pas très spécifique et peut ne pas
être très satisfaisante pour un employeur qui ne comprend pas l'économie.
Le problème, c’est qu’il y a un écart entre ce que vous avez appris en tant qu’étudiant en économie et ce
que font les économistes réellement. Très peu d’économistes gagnent leur vie en étudiant uniquement la
théorie économique, et ceux qui le font sont généralement employés par les universités. La plupart des
économistes, qu’ils travaillent dans le monde des affaires ou pour le gouvernement, ou qu’ils enseignent
dans les universités, effectuent des analyses économiques qui sont en partie « empiriques ». Nous entendons
par là qu’ils utilisent les données économiques pour estimer les relations économiques, tester les hypothèses
économiques et prédire les résultats économiques.
'' Je peux estimer l'effet sur vos ventes si votre concurrence baisse son prix de 1 dinars l'unité. '' Je peux
tester si votre nouvelle campagne publicitaire augmente réellement vos ventes. '' Ces réponses sont une
musique pour les oreilles d'un employeur, parce qu'ils reflètent votre capacité à penser comme un
économiste et à analyser des données économiques. Ces informations sont essentielles à de bonnes décisions
3
Khalil Mhadhbi Initiation à l’Économétrie
commerciales. Être en mesure de fournir à votre employeur des informations utiles fera de vous un
employé précieux et augmentera vos chances d'obtenir un emploi souhaitable.
4
Khalil Mhadhbi Initiation à l’Économétrie
Chapitre 1
Modèle de régression linéaire simple
1. Introduction
En économie, on essaye souvent d’établir une relation entre deux ou plusieurs variables. On peut avoir
comme soucis par exemple de comprendre l’impact de l’éducation sur le salaire, la sensibilité de
l’investissement aux taux d’intérêt ou encore l’inflation et l’emploi.
La théorie de la régression fourni une série d’outil pour estimer ses relations. Dans une analyse de
régression, nous cherchons à expliquer une variable (variable endogène) à l’aide d’une ou plusieurs autres
variables (variables exogènes). Dans le cas de régression linéaire simple, on s’intéresse à expliquer une
variable endogène en fonction d’une seule variable exogène et éventuellement d’une constante.
yt : t = 1,2,........, T
et d’une série d’observations sur la variable " x" :
xt : t = 1,2,........, T
Ce modèle linéaire simple s’écrit : yt = β 0 + β1 xt ∀t = 1,2,.........., T
Si la relation linéaire entre ses deux variables est exacte alors les points de coordonnés ( xt ; yt ) se trouvent
sur une même droite.
En pratique, les relations ne sont pas exactes. Par conséquent, tous les points ne sont pas situé sur la même
droite (quelques points sont alignés et d’autres ne sont pas).
Pour tenir compte de cette différence, on fait intervenir dans la relation un terme d’erreur noté ε t , le
modèle devient yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T
ε t est
un terme d’erreur appelé terme aléatoire ou perturbation. ε t est une variable aléatoire non
observable.
- ε t mesure la différence entre les valeurs réellement observées de y et les valeurs qui auraient dû
être observé si la relation était exacte ;
- ε t permet de résumer toute l'information qui n'est pas prise en compte dans la relation linéaire.
Parmi les sources des erreurs ε t , on cite :
- Le comportement humain qui peut être tout simplement non déterministe ;
- L’omission volontaire ou non volontaire d’autres variables explicatives ;
5
Khalil Mhadhbi Initiation à l’Économétrie
- Erreur de mesure au niveau des variables ;
- Erreur d’approximation de la relation linéaire utilisée.
y
valeur observée yˆ t = βˆ0 + βˆ1 xt
yt
εˆt
ŷt
valeur fournit par le mod èle
εˆt = yt − yˆ t , t = 1,2,...............T
3. Hypothèses
Compte tenu de ces considérations, la spécification complété du modèle envisagé, appelé modèle de
régression linéaire simple, s’écrit :
yt = β 0 + β1 xt + ε t ∀t = 1,2,.........., T
Les hypothèses de base sont les suivantes :
- Hypothèse 1
6
Khalil Mhadhbi Initiation à l’Économétrie
- Hypothèse 2
( ) ( )
Var (ε t ) = E [ε t − E (ε t )] = E ε t2 − E (ε t ) = E ε t2 = σ ε2 ; t = 1,2,..................T
2 2
La variance de l’erreur est constante. On dit que les erreurs ε t sont homoscédastiques.
- Hypothèse 4
Cov(ε t , ε t ' ) = E[(ε t − E (ε t ))(ε t ' − E (ε t ' ))] = E (ε t ε t ' ) = 0∀t ≠ t '
Les erreurs ne sont pas auto corrélées (ou encore elles sont indépendantes).
Remarque : si les hypothèses 2, 3, 4 sont vérifiées, l’erreur ε t est un bruit blanc(Wihte Noise).
- Hypothèse 5
1 T
lim
t → +∞ T
∑ ( xt − µ ) = S 2 ( finie)
2
t =1
4. Estimation du modèle
4.1. Estimateur des Moindres Carrés Ordinaires (MCO)
L’estimateur des MCO est dérivé de la minimisation de la somme des carrés des résidus.
( )
T T T
Min ∑ εˆt2 = Min ∑ y t − βˆ0 − βˆ1 xt = Min ∑ S
2
β 0 ; β1 β 0 ; β1 β 0 ; β1
t =1 t =1 t =1
7
Khalil Mhadhbi Initiation à l’Économétrie
∂S
( )
T
= −2∑ y t − βˆ0 − βˆ1 xt
∂βˆ0 t =1
∂S
( )
T
= −2∑ y t − βˆ0 − βˆ1 xt xt
∂βˆ1 t =1
∂S
( )
T
= 0 ⇔ ∑ yt − βˆ0 − βˆ1 xt = 0 (1)
∂β 0 βˆ0 ; βˆ1 t =1
∂S
( )
T
= 0 ⇔ ∑ yt − βˆ0 − βˆ1 xt xt = 0 (2)
∂β1 β 0 ; β1
ˆ ˆ t =1
( )
t T
valeur, on obtient : ∑x y
t =1
t t − y − βˆ1 x Tx − βˆ1 ∑ xt2 = 0
t =1
T T T
⇒ ∑ xt y t − Tx y + βˆ1Tx 2 − βˆ1 ∑ xt2 = 0 ⇒ ∑ xt y t − Tx y = βˆ1 ∑ xt2 − Tx 2
t =1 t =1 t =1
T T T
∑ (x − x )( yt − y ) ∑ (x − x )( yt − y )
1
∑x y t t − Tx y t
m xy T
t
Cov( x; y )
En fin, βˆ1 = t =1
= t =1
= = t =1
=
T T T
Var ( x )
∑ (x − x) ∑ (x − x)
1
∑x
m xx
− Tx 2
2 2 2
t t t
t =1 t =1 T t =1
βˆ0 = y − βˆ1 x
- Condition du second ordre :
∂2S ∂2S
2
∂ β ∂β 0∂β1
H = 2 0 0
∂ S ∂2S
∂β1∂β 0 ∂ 2 β1 βˆ ; βˆ
0 1
H 1,1 H 1, 2
H =
H
2,1 H 2 , 2 βˆ ; βˆ
0 1
∂2S
H 1,1 = = 2T 0
∂2β0
8
Khalil Mhadhbi Initiation à l’Économétrie
∂2S T
H 1, 2 = = 2∑ xt = 2Tx
∂β 0 ∂β1 t =1
∂2S T
H 2,1 = = 2∑ xt = 2Tx
∂β1∂β 0 t =1
∂2S T
H 2, 2 =
∂ β1
2
= 2 ∑
t =1
xt2
T
T T 2
H = dét (H ) = 4T ∑ xt2 − 4T 2 x 2 = 4T ∑ xt2 − Tx 2 = 4T ∑ (xt − x ) 0 et on a H 11 0
t =1 t =1 t =1
⇒ βˆ0 etβˆ1 minimisent bien la quantité S .
Remarques
- Pour un échantillon d’observation donné, la droite d’ajustement des moindres carrés ordinaires est
unique. Cette droite est alors donnée par : yˆ t = βˆ0 + βˆ 1xt
- La droite d’ajustement des moindres carrés ordinaires passe par le point moyen
(x; y ); y = βˆ0 + βˆ1 x
- yt = β 0 + β1 xt + εt
partie déter min iste partie stochastique
1
f (ε t ) =
1
exp − 2 ε t2
2Πσ 2 2σ
f ( yt ) = ( yt − β 0 − β1 xt )2
1 1
exp−
2Π σ 2 2σ 2
( 2Πσ )
T
( )
− T
∑ (y − β 0 − β1 xt )
1
l y1 , y 2 ,......, yT , β 0 , β1 , σ 2 = exp−
2 2 2
2σ 2 t
t =1
(
max Logl = max2 log l y1 , y 2 ,.........., yT , β 0 , β1 ,σ 2
β 0 , β1 ,σ
)
( )
T
∑ (y − β 0− β1 xt )
T 1
Logl = − Log 2Πσ 2 − 2
2
2σ
t
2 t =1
9
Khalil Mhadhbi Initiation à l’Économétrie
( )
T
Log (2Π ) − Log σ 2 − 2 ∑ (y − β 0− β1 xt ) = S
T T 1
Logl = −
2
2σ
t
2 2 t =1
On pose σ 2 = θ
T
Log (2Π ) − Log (θ ) − ∑ (y − β 0− β1 xt )
T T 1
S=−
2
2θ
t
2 2 t =1
⇒ βˆ1MV = βˆ1MCO
( )
T
− Tθˆ + ∑ yt − βˆ0 − βˆ1 xt
2
∑ (y )
∂S T 1 T 2
=− + 2 − βˆ0 − βˆ1 xt =0⇒ t =1
=0
2θˆ 2θˆ 2θˆ 2
t
∂β1 βˆ0 ; βˆ1 ; θˆ t =0
( )
2
1 T 1 T 2
⇒ θˆ MV = ∑ yt − βˆ0 − βˆ1 xt = ∑ εˆt = σˆ 2
T t =1 T t =1
Remarques
- ε t = yt − β 0 − β1 xt : erreur.
- εˆt = yt − βˆ0 − βˆ1 xt : résidu.
- εˆt = yt − βˆ0 − βˆ1 xt = β 0 + β1 xt + ε t − βˆ0 − βˆ1 xt
ε ( ) (
ˆt = ε t + β 0 − βˆ0 + β1 − βˆ1 xt
)
Résidu Erreur Erreur de spécification
10
Khalil Mhadhbi Initiation à l’Économétrie
- On appelle spécification le fait de transformer un modèle purement théorique sous une forme qui
pourra donner lieu à une estimation et à une vérification empirique (il faut notamment choisir la
forme de la relation à estimer, les variables jugées pertinentes, la période d’estimation…)
∑ (x − x) ∑ (x − x)
2 2
t t
t =1 t =1
T T T T
Nous avons ∑ (xt − x )yt = ∑ (xt yt − xyt ) = ∑ xt yt − x ∑ yt = ∑ xt yt − Txy
t =1 t =1 t =1 t =1 t =1
1 T T
On a z = ∑t ∑
T t =1
z ⇔
t =1
z t = Tz
(x − x ) T
On pose wt = T t donc β̂1 = ∑w y t t
∑ (xt − x ) t =1
2
t =1
T T T T
βˆ1 = ∑ wt (β 0 + β1 xt + ε t ) = β 0 ∑ wt + β1 ∑ wt xt + ∑ wt ε t
t =1 t =1 t =1 t =1
Or
T T T
T
( xt − x )
T
=
∑ (x t − x) ∑x −∑x t
Tx − Tx
∑ wt = ∑ T
t =1
T
= t =1
T
t =1
= T
= 0 et
∑ ( xt − x ) ∑ (x − x) ∑ (x − x) ∑ (x − x)
t =1 t =1 2 2 2 2
t t t
t =1 t =1 t =1 t =1
T T T
∑w x t t = t =1
T
= t =1
T
= t =1
T
=1
t =1
∑ (x − x) ∑ (x − x) ∑ (x − x)
2 2 2
t t t
t =1 t =1 t =1
t
⇒ βˆ1 = β1 + ∑ wt ε t
t =1
( )
E βˆ1 = β1 + ∑ wt E (ε t ) = β1 car wt est une variable non stochastique et E (ε t ) = 0 (Hypothèse 2), β̂1
T
t =1
11
Khalil Mhadhbi Initiation à l’Économétrie
5.2. β̂ 0 est sans biais
T
βˆ0 = y − βˆ1 x et on a β̂1 = ∑ wt yt
t =1
T
1 T T t
1 T 1
β̂ 0 = y − x ∑ wt y t = ∑ y t − x ∑ w t y t = ∑ y t − w t x y t = ∑ y t − x wt
t =1 T t =1 t =1 t =1 T t =1 T
1
On pose d t = − x wt donc
T
T T T T T
βˆ0 = ∑ d t yt = ∑ d t (β 0 + β1 xt + ε t ) = β 0 ∑ d t + β1 ∑ d t xt + ∑ d t ε t
t =1 t =1 t =1 t =1 t =1
T T
1 T T
Or ∑ t ∑
d = − x wt = 1 − x ∑ wt = 1 car nous avons montré que ∑w t =0
t =1 t =1 T t =1 t =1
T T
1 1 T T
1 T
∑
t =1
d x
t t = ∑
t =1 T
− x wt t
x = ∑t ∑
T t =1
x − x
t =1
w x
t t = ∑ xt − x = x − x = 0 car nous avons montré que
T t =1
T
∑w x
t =1
t t =1
T
En fin, βˆ0 = β 0 + ∑d ε
t =1
t t
( )
T T
E βˆ0 = β 0 + ∑ E (d t ε t ) = β 0 + ∑ d t E (ε t )
t =1 t =1
( )
Donc E βˆ0 = β 0 car E (ε t ) = 0 (hypothèse 2). β̂ 0 est un estimateur sans biais de β0 .
5.3. Théorème de Gauss-Markov
Les estimateurs β̂ 0 et β̂1 sont les meilleurs estimateurs dans la place des estimateurs linéaire et sans biais
dont les sens qu’ils admettent les variances minimales. On dit qu’ils sont BLUE (Best Linear Unbaised
Estimator).
( )
V βˆ1 = T
σ ε2
est minimale.
∑ (x − x)
2
t
t =1
1
( )
2
x
V βˆ0 = σ ε2 +
T 2
T
∑ (xt − x )
t =1
12
Khalil Mhadhbi Initiation à l’Économétrie
5.4. Matrice variance-covariance des estimateurs
Remarque
X E ( X )
W = ⇒ E (W ) =
Y E (Y )
( X − E ( X ))
V (W ) = E[W − E (W )][W − E (W )] = E [( X − E ( X )); (Y − E (Y ))]
'
(Y − E (Y ))
V (W ) =
( X − E ( X ))2 ( X − E ( X ))(Y − E (Y )) = V ( X ) Cov( X ; Y )
( X − E ( X ))(Y − E (Y )) (Y − E (Y ))2 Cov( X ; Y ) V (Y )
ˆ
Soit βˆ = β 0 ⇒ V βˆ = V β 0
ˆ
() ( ) ( )
Cov βˆ0 ; βˆ1
βˆ
1 Cov β 0 ; β1
ˆ ˆ ( ) ( )
V βˆ1
Avec
1
( )
V βˆ0 = σ ε2 +
x2
T 2
T
∑ (xt − x )
t =1
( )
V βˆ1 = T
σ ε2
∑ (x − x)
2
t
t =1
(
Cov βˆ0 ; βˆ1 = σ ε2 ) T
−x
∑ (x − x)
2
t
t =1
1 x2 −x
T + T T
β
∑ ( xt − x )
2
∑ ( xt − x )2
V 0 = σ ε2 t =1 t =1
β
1 −x 1
T T
∑ (xt − x )2 ∑ (xt − x )
2
t =1 t =1
( )
T T T
avec SCR :Somme des Carrés des Résidus (Sum of Squared Residuals)
13
Khalil Mhadhbi Initiation à l’Économétrie
SCR
( (T − 2) σ 2 ≠ σ 2 , donc σˆ 2
)
σ ε2( MV ) = ⇒ E σˆ ε2( MV ) = ε ε ε ( MV ) est biaisé. L’estimateur sans biais de
T T
SCR Tσˆ ε ( MV )
2
∑ (xt − x )
t =1
βˆ0 − β 0
donc Z = → N (0,1)
( )
V βˆ0
2
T −2 2
T
∑ (xt − x )
t =1
Pour β1
Soit β̂1 un estimateur ponctuel de β1 , sous l’hypothèse de normalité des erreurs on peut écrire :
( ( ))
βˆ1 → N β1 ; V βˆ1 avec V (βˆ1 ) = T
σ ε2
∑ (x − x)
2
t
t =1
βˆ1 − β1
donc Z = → N (0,1)
Vβ ( )
ˆ
1
Si la variance de l’erreur
σ ε2 est connue donc β1 ∈ βˆ1 ± Z α V βˆ1
1−
( )
2
Si la variance de l’erreur σ ε2 est inconnue et la taille de l’échantillon est supérieure à 30 , alors on l’estime
par σˆ ε2 = SCR donc β1 ∈ βˆ1 ± t α
T −2
T −2
Vˆ βˆ1 avec V βˆ1 = ( ) ( ) T
σˆ ε2
2 ∑ (x t − x)
2
t =1
14
Khalil Mhadhbi Initiation à l’Économétrie
7. Test d’hypothèses sur les paramètres ( σ ε2 inconnue)
Pour β0
H 0 : β 0 = b0
H 1 : β 0 ≠ b0
c
≤ T −2 βˆ0 − b0
On accepte H0 si t t α avec
c
=
( )
t
2 Vˆ βˆ0
En effet, β 0 ∈ βˆ0 ± t α ( )
V βˆ0
2
( ) ( ) βˆ − b
⇒ βˆ0 − t αT −2 Vˆ βˆ0 ≤ b0 ≤ βˆ0 + t αT −2 Vˆ βˆ0 ⇒ t αT −2 ≤ 0 0 ≤ t αT −2 ⇒ βˆ0 − b0 ≤ t αT −2
2 2 2 Vˆ βˆ0 2( ) Vˆ (βˆ 0 ) 2
Pour β1
H 0 : β1 = b1
H 1 : β1 ≠ b1
βˆ1 − b1
On accepte H0 si t c ≤ t αT − 2 avec t =
c
2 ( )
Vˆ βˆ1
En effet, β1 ∈ βˆ1 ± Z
1−
α ( )
V βˆ1
2
( ) ( ) βˆ − b
⇒ βˆ1 − t αT − 2 Vˆ βˆ1 ≤ b1 ≤ βˆ1 + t αT − 2 Vˆ βˆ1 ⇒ t αT − 2 ≤ 1 1 ≤ t αT − 2 ⇒ βˆ1 − b1 ≤ t αT −2
2 2 2 Vˆ βˆ1( )
2 Vˆ (βˆ1 ) 2
Remarque
Test de significativité
H 0 : β i = 0
∀i = 0 ou 1
H1 : β i ≠ 0
Si on accepte H 0 alors on dit que β i est non significative ou encore significativement égale à zéro.
Si on rejette H 0 alors on dit que β i est significative ou encore significativement diffèrent de zéro.
Soit yt = β 0 + β1 xt + ε t un modèle de régression, l’estimation par les MCO fournit l’ajustement linéaire
suivant : yˆ t = βˆ0 + βˆ1 xt . Une fois l’estimation est réalisée deux questions peuvent se poser :
15
Khalil Mhadhbi Initiation à l’Économétrie
- x explique-t-elle l’évolution de y ?
- La relation entre x et y est-elle linéaire ?
Pour répondre à ces questions, on utilise l’équation de l’analyse de la variance.
Nous avons
T T T T T
t =1 t =1 t =1 t =1 t =1 (1) (2 )
( yt − yˆ t ) = ( yt − y ) − ( yˆ t − y ) = ( yt − y ) − βˆ1 (xt − x )
(1)
[
(1) × (2) = βˆ1 (xt − x ) × ( yt − y ) − βˆ1 (xt − x ) ][ ]
ˆ [(x − x )( y − y )] − βˆ 2
T T T
∑ (1) × ( 2 ) = β 1 ∑ t t 1 ∑ ( xt − x )
t =1 t =1 t =1
T
∑ (x t − x )( yt − y ) T T
Or βˆ1 = t =1
⇒ βˆ1 ∑ ( xt − x ) = ∑ ( xt − x )( yt − y )
2
T
∑ (x − x) t =1 t =1
2
t
t =1
ˆ [( x − x )( y − y )] − ( x − x )( y − y ) = 0
T T
D’où ∑ (1) × ( 2 ) = β1 ∑ t t ∑ t t
t =1 t =1
T T T
∑ ( yt − y ) = ∑ ( yt − yˆ t ) + ∑ ( yˆ t − y )
2 2 2
Donc
t =1 t =1 t =1
Somme des carrées Totale (SCT) =Somme des Carrés des Résidus (SCR)+Somme des Carrés Expliquée (SCE).
SCT : désigne la variation totale. Elle représente graphiquement la dispersion du nuage des points.
T
SCT = ∑ ( y t − y )
2
t =1
( ) = ∑ ( yˆ ( ( ))
T T T 2 T
SCE = ∑ yˆ t − yˆ − y) = ∑ = βˆ12 ∑ (xt − x )
2
t
2
βˆ0 + βˆ1 xt − βˆ0 + βˆ1 x 2
t =1 t =1 t =1 t =1
( )
T T T
SCR = ∑ εˆt2 = ∑ ( y t − yˆ t ) = ∑ y t − βˆ0 − βˆ1 xt
2 2
t =1 t =1 t =1
16
Khalil Mhadhbi Initiation à l’Économétrie
Tableau ANOVA
T t
∑ ( yˆ t − y ) = βˆ12 ∑ (xt − x )
2 2 SCE
Modèle : SCE 1
t =1 t =1
1
∑ εˆ 2 SCR
Résidu : SCR T-2
t =1
t
T −2
∑ (y − y)
2 SCT
Total : SCT T-1
t =1
t
T −1
La qualité de l’ajustement linéaire peut être mesurée par le coefficient de détermination noté R 2 et définit
par :
Cov(x; y )
R 2 = (ζ xy ) avec ζ xy le coefficient de corrélation entre x et y définit par ζ xy =
2
σ xσ y
avec − 1 ≤ ζ xy ≤ 1 donc 0 ≤ R = ζ xy ≤ 1
2 2
2
1 T
∑ (xt − x )( yt − y )
Cov ( x; y ) m xy2
R 2 = (ζ xy ) T t =1
2
= = =
2
V ( x )V ( y ) 1 T 2 1
( yt − y )2 m xx m yy
T
T ∑ ( x t − x ) T ∑
t =1 t =1
t =1 t =1
m ˆˆ
Donc m yˆyˆ = βˆ12 mxx ⇒ R 2 = yy
m yy
1 T
∑ ( yˆt − y )2
T Variance Expliquée VE
R 2 = t T=1 = =
1
∑ ( y t − y )2 Variance Totale VT
T t =1
17
Khalil Mhadhbi Initiation à l’Économétrie
m yy − SCE SCR
Donc R 2 = = 1−
m yy SCT
1 T
T
∑ (
εˆt − εˆ
2
) Variance Rèsiduelle VR
R 2 = 1 − tT=1 = 1− = 1−
1
∑ ( yt − y )2 Variance Totale VT
T t =1
yt = β 0 + β1 x1t + ε t ⇒ R12
9. Prévision
9.1. Prévision ponctuelle
( ) ( )
e p = y p − yˆ p = β 0 + β1 x p + ε p − βˆ0 − βˆ1 x p = β 0 − βˆ0 + β1 − βˆ1 x p + ε p
( ( )) ( ( ) )
⇒ E (e p ) = β 0 − E βˆ0 + β 1− E βˆ1 x p + E (ε p ) = (β 0 − β 0 ) + (β1 − β1 )x p = 0 , car β̂ 0 et β̂1 sont
deux estimateurs sans biais et E (ε ) = 0 (hypothèse 2).
p
18
Khalil Mhadhbi Initiation à l’Économétrie
( ) ( )
V (e p ) = V β 0 − βˆ0 + β1 x p − βˆ1 x p + ε p = V ε p − βˆ0 − βˆ1 x p
= V (βˆ ) + V (βˆ x ) + V (ε ) − 2 cov(ε ; βˆ ) − 2 cov(ε ; βˆ x ) + 2 cov(βˆ ; βˆ x )
0 1 p p p 0 p 1 p 0 1 p
1 x 2x x
+ σ + 2 x cov(βˆ ; βˆ ) = σ +
1 x 2 2 2 2
x x
= σ +2
+ σ 2 p 2
+ +1− 2 p p
ε ε εT m p 0
m
1 ε
T m m xx xx m xx xx xx
1 x + x − 2x p x 2 2
= σ ε2 1 + + p
T m
xx
1 (x p − x )
2
V (e p ) = σ ε 1 + +
2
T m xx
Sous l’hypothèse de normalité des erreurs, on déduit que e p → N (0; V (e p ) ) , donc
ep y p − yˆ p
= → N (0;1) .
V (e p ) V (e p )
( )
En déduire que y p ∈ yˆ p ± Z α V e p si σ ε2 la variance de l’erreur est connue.
1−
2
si σ ε2 la variance de l’erreur est inconnue y p ∈ yˆ p ± t T −α2 Vˆ (e p )
1−
2
1 (x p − x )
2
avec V (e p ) = σˆ ε 1 + +
2
ˆ et σˆ ε2 = SCR
T m T −2
xx
10. Logiciel Eviews
Eviews est un logiciel de statistique et d’économétrie largement utilisé par les étudiants, chercheurs et
enseignant chercheurs. C’est l’un des logiciels les plus complets de fonctions statistiques, graphiques et de
gestion de données.
10.1. Exemple
On considère les données suivantes :
19
Khalil Mhadhbi Initiation à l’Économétrie
4. Calculer et interpréter le coefficient de détermination R 2 .
5. Tester la significativité des coefficients.
6. Construire un intervalle de confiance pour β 0 et pour β1 .
7. Etablir une prévision ponctuelle de y 2006 sachant que x2006 = 6 .
8. Etablir une prévision par intervalle de confiance de y 2006 .
9. Tester la stabilité de la relation sachant que la valeur de y en 2006 est égal à 11,2.
Les résultats d’estimation par Eviews de ce modèle sont les suivants :
1. La droite de régression de y en x
20
Khalil Mhadhbi Initiation à l’Économétrie
(4) :Probabilité critique (p-value) du test de nullité des coefficients. Pour un risque de 5%, si prob<
0.05, on rejette l’hypothèseH0 de la nullité du coefficient et conclut que le coefficient est significatif.
(5) : Coefficient de détermination ( R 2 ).
(6) : Coefficient de déterminationajusté ( R 2 ).
(7) : Estimateur de l’écart-type des résidus de la régression (Standard Error of regrssion) σ̂ .
21