Académique Documents
Professionnel Documents
Culture Documents
avec
y : la variable endogène (la variable expliquée) elle est déterminée par le modèle
ɛ : un aléa
Exemple1 :
Dans la pratique, on ne dispose pas des observations sur toute la population estudiantine mais
il est possible de constituer un échantillon de cette population afin d’évaluer la relation entre
les deux variables. Pour une valeur fixée de la variable revenu des parents, on observe dans
l’échantillon une dépense de consommation.
A partir des données observées (les données de l’échantillon) il est possible d’estimer
la relation (1). Soient et les valeurs estimées des paramètres β0 et β1, la droite de
régression de l’échantillon est donnée par
= + xi i= 1,……, N
et ei le résidu d’estimation, ei = yi- , mesure pour chaque individu l’écart entre la valeur
observée yi et la valeur estimée . La valeur estimée est aussi appelée la valeur ajustée ou
prédiction.
E(yi/xi)=β0+ β1 xi
La méthode d’estimation de base des paramètres du modèle (1) est la méthode des
Moindres Carrée Ordinaires (MCO). Dans cette section sont présentés les hypothèses
du modèle, l’estimateur des (MCO), les caractéristiques et les propriétés de cet
estimateur.
et - (1.6)
= i= 1,…………..N (1.7)
= +
=0
Par conséquent =
=0
= + (1.8)
Au facteur (1/N) près, la variance totale de la variable endogène est la somme de la variance
expliquée par le modèle et la variance résiduelle. Le coefficient de détermination qui
mesure le rapport entre la variance expliquée par le modèle et la variance totale est un
indicateur de la qualité de l’ajustement. Il donne le pourcentage de la variance totale de y
expliquée par le modèle de régression
=1- (1.9)
Théorème de Gauss-Morkov
Sous les hypothèses 1, 2, 3 et 4, l'estimateur des MCO est Best Linear Unbiaised Estimator
(BLUE).
Autrement dit, l'estimateur des MCO est
• une fonction linéaire de y
• non biaisé: E ( ˆ1 ) 1 et E ( ˆ 2 ) 2
• efficace : parmi les estimateurs linéaires non biaisés des paramètres 1 , et 2 du modèle,
l'estimateur des MCO a la variance la plus faible. La matrice de variance-covariance des
paramètres est donnée par
var(ˆ1 cov(ˆ1 , ˆ 2 )
cov(ˆ , ˆ ) var(ˆ
1 2 2
2 x 2
i
N
i 1
(1.11)
(x
N
i x) 2
i 1
La matrice de variance-covariance des paramètres ne peut pas être calculée car la valeur de
2 n'est pas connue. Pour déterminer cette matrice de variance-covariance, il faut déterminer
un estimateur ̂ non biaisé de la variance des aléas. On montre que :
2
N
E ei2 ( N 2) 2 (1.14)
i 1
d'où
1
̂ 2 N (1.15)
N 2 ei2
i 1
ˆ 2 xi2 ˆ
2 x 2
i
ˆ 2ˆ N
i 1
ˆ 2ˆ N
i 1
(1.17)
(x (x
1
N 2
N
i x) 2
i x) 2
i 1 i 1
ˆ 2
cov(ˆ , ˆ 2 ) x N
(x
i 1
i x) 2
4. INTERVALLES DE CONFIANCE ET TEST DE SIGNIFICATIVITÉ DES
PARAMÈTRES
Afin de déterminer les intervalles de confiance des paramètres du modèle, il faut déterminer la
distribution statistique des valeurs estimées ̂ , . ̂ 2
Les principales distributions statistiques utilisées en économétrie appliquée sont la
2
distribution Normale (N ) , la distribution du Chi-deux ( x ) , la distribution de Fisher-
Snédécor (F) et la distribution de Student ( ).
Soient z1 , z 2,..., z r une suite de variables normales centrées réduites indépendantes, la variable
N
X 2 z i2
i 1
2
est distribuée suivant une loi du Chi-deux à r degrés de liberté X (r ) . Si ces variables ne
sont pas indépendantes mais liées entre elles par p (p < r), relations linéaires distinctes, alors
la variable X est distribuée suivant une loi à r - p degrés de liberté X (r p)
2 2
2
La variable F (r, m), rapport d'une variable distribuée suivant un X (r) et d'une variable
2
distribuée suivant un X (m)
X 2 (r ) /
F ( r , m)
X 2 ( m) / m
est distribuée suivant une loi de Fisher-Snédecor à r et m degrés de liberté.
Enfin la variable (r ) rapport d'une variable normale centrée réduite et de la racine carrée
2
d'un X (r ) / r
N (0,1)
r (r )
X 2 (r ) / r
est distribuée suivant une loi de Student à r degrés de liberté.
Pour déterminer la distribution statistique puis les intervalles de confiance des
paramètres on pose une hypothèse supplémentaire
Hypothèse 5
Les aléas sont distribués de manière identique et indépendante selon une loi normale
i N (0, 2 ) i 1,....N (1.18)
La variable endogène y , étant une fonction linéaire des aléas, est aussi distribuée selon une loi
normale
yi N (1 2 xi , 2 ) i 1,....N (1.19)
Les yi sont distribués de manière indépendante mais ils ne sont pas distribués de manière
identique car ils n'ont pas la même espérance.
La valeur estimée des paramètres dépend de l'échantillon de données, c'est une variable
aléatoire linéaire par rapport aux yi On en déduit que
ˆ1
N 1 , ˆ
2
1
, ˆ 2
N 2 , 2ˆ 2 (1.20)
ˆ 1 ˆ 2
D’où (1.21)
1 2
On ne peut pas en déduire directement les intervalles de confiance des paramètres car on ne
peut pas calculer les écarts type 1 et 2 On utilise pour cela ̂ 2 l'estimateur non biaisé de
2 et dont la distribution est un X 2 àN 2 degré de liberté -
ˆ 2 x 2 ( N 2)
(1.22)
2 N 2
Ainsi on obtient
(1.23)
Pr
ˆ K ˆ ˆ / 2( N 2) K ˆ K ˆ ˆ / 2 ( N 2)
K K
(1.24)
1 ............K 1,2
H0 : K 0
K 1,2 (1.25)
H1 : K 0
On calcule la statistique
ˆ K
t cal (1.26)
ˆ ˆ
K
c'est une variable aléatoire. En utilisant les hypothèses 1, 2, 3 on montre que l'espérance et la
variance de l'erreur de prévision sont données par