Académique Documents
Professionnel Documents
Culture Documents
0cours - Fondemenrtde Base Econom - Chaabita PDF
0cours - Fondemenrtde Base Econom - Chaabita PDF
FONDEMENTS DE BASE
DE L’ECONOMETRIE
Compléments du cours
1
Chapitre introductif
Typologie des modèles
La section I de ce chapitre présente les caractéristiques d’un modèle. Elle en définit les
constituants (variables, équations, paramètres...)
La section II présentée ci-après traite des modèles de politique économique. Elle reprend les
constituants qui leur sont propres.
i = 1,2,…….,m
Exemple :
MACRO
i=1 : Dépense publique globale.
i=2 : Taux d’impôt indirect.
i=3 : Taux de réserves obligatoires.
i=4 : Taux de salaire dans la fonction publique ou le SMIG.
MICRO
Exemple :
MACRO
2
MICRO
De manière générale les instruments n’agissent pas directement sur les objectifs:
Exemple :
Dans les modèles qui prennent en compte cet aspect, on trouvera donc des variables
intermédiaires.
Il s’agit de variables endogènes situées entre l’instrument et l’objectif.
Soit Zk : Quantité de la variable intermédiaire endogène k.
On distingue enfin les variables prédéterminées. Elle se trouve aussi entre l’instrument et
l’objectif, mais leur valeur est fixée en dehors du modèle.
Soit Vk : Quantité de la variable prédéterminée k.
Dans les modèles de politique économique, on trouve d’abord les relations ordinaires (de
comportement), mais on trouve aussi des relations propres à ces modèles.
Exemple :
dY1
µj1 = : efficacité marginale de i vis à vis de j.
dX1
si l’on tient compte du fait que les instruments n’agissent pas directement, on notera :
X1 Zk Yj
3
Exemple :
X1 : Dépenses publiques.
Zk : investissement privé.
Yj : Croissance du PIB.
Fj : Est la fonction de production reliant le PIB et l’investissement privé.
Ce sont des « planchers » ou des « plafonds » que ne peuvent raisonnablement dépasser les
variables de politique économique.
Exemple :
X ³ X’ : Plancher de production.
L ³ L’ : Plancher d’emploi de la main d’œuvre.
P ³ P’ : Plafond des prix.
G £ a.Y : Plafond des dépenses publiques par rapport au revenu national.
G – F £ D’ : Plafond du déficit budgétaire (F étant les recettes fiscales).
Comme Leur nom l’indique, les modèles de politique économique permettent la mise au point
de celle-ci (du macro et micro), or on sait que le décideur agit sur l’activité économique avec
une visée plus au moins volontariste.
Ainsi, tantôt ces modèles vont permettre la « simple » prévision, tantôt, ils seront utilisés pour
la décision.
a) L’utilisation prévisionnelle :
M . S : Modèle de simulation.
4
Ici, l’optique du « possible » est privilégiée. La valeur des objectif est fournie par le calcul ;
elle n’est pas fixée à priori. Cependant on peut introduire des variantes en modifiant la valeur
donnée aux X (instruments).
b) L’utilisation décisionnelle :
Ici, les objectifs sont fixés à priori. C’est la démarche qui prévaut la planification.
Ce sont les niveaux requis, désirés des objectifs qui déterminent les montants des instruments.
D’un autre côté, les objectifs ne peuvent atteindre n’importe quelles valeurs car la
manipulation des instruments admet des limites. Les X ne peuvent prendre toutes les valeurs
dictées par Y fixés (cf. Plafond et plancher).
La politique doit non seulement être ambitieuse et cohérente, mais aussi réaliste.
L’utilisation mixte ou alternative du MS permet d’approcher cette réalité.
v Première méthode :
Certains objectifs seront traités en variables exogènes, les autres le seront en variables
endogènes.
Réciproquement, les instruments les plus rigides (les plus proches de leur limite plafond ou
plancher) seront traités en variables exogènes. Les plus souples restent endogènes.
v Deuxième méthode :
Les objectifs prioritaires et les instruments souples sont aussi, tantôt, endogènes, tantôt,
exogènes.
5
Première étape :
Deuxième étape :
( V) M.O (X,Y,Z)
Seules les variables prédéterminées V sont exogènes.
A l’aide d’un MO, on calcule les montants des instruments, des objectifs et des variables
intermédiaires.
Il faut en outre disposer d’une part de contraintes (analogues à celle des MS) et d’autre part
d’une fonction de préférence ou d’utilité.
6
On souligne que le sens des ‘‘flèches’’ n’est pas unique dans la mesure où le travail de
l’économétrie est un travail itératif.
(MRS) :
I - PRESENTATION GENERALE :
Soit Y i = aX i + b + U i
Y : variable endogène.
X : variable exogène.
U : Variable aléatoire appelée résidu, elle est une mesure de l’ignorance.
On dispose de “n” observations sur Y et X (i=1,2,…,n). Nous avons donc “n” couples
(Y i , X i ) qui sont des réalisations des variables Y et X.
a et b sont des paramètres réels et inconnus que l’on se propose d’estimer à l’aide des
observations y i et x i .
2ème étape : Meilleure prise en compte de l’urbanisation : écriture d’un modèle pour chaque
7
type d’agglomération.
Y i 1 = a1 log X i 1 + b1 + U i 1 i=1....n 2
Y i 2 = a2 log X i 2 + b 2 + U i 2 i=1....n 2
Yi3 = a3 log X i 3 + b3 + U i 3 i=1....n 3
Remarque :
Généralement, la régression par le Logarithme présente deux avantages. Elle permet de
rendre linéaire une relation non linéaire. Elle fait aussi apparaître les coefficients de la droite
de régression comme des coefficients d’élasticité.
E (Y i ) = a E (X i ) + b
Hypothèse 3 : L’homoscédasticité
Hypothèse 3 reprend l’hypothèse 2 mais elle est plus forte. Si H3 n’est pas réalisée, on parle
d’hétéroscédasticité.
Cov (U i ,U j ) = 0 "i ¹ j.
Plus tard, on utilisera le test de DURBIN & WASTON pour savoir s’il faut ou non refuser
l’hypothèse 4.
8
Hypothèse 5 : Hypothèse de normalité :
Ils peuvent prendre n’importe quelle valeur réelle positive, négative ou nulle.
Avant la clôture de cette partie réservée aux hypothèses classiques pour les M.R.S on met en
exergue un concepts important :
- la variabilité : ‘‘ On étudie pas la variabilité de quelque chose qui ne varie pas’’. Autrement
Ù
dit, il faut que å (X i - X )2 soit différente de 0.
Exemple : L’investissement en période ‘t’( I t ) d’une entreprise est fonction du taux d’intérêt
( i t ) du profit de la période t-1 ( p t-1 ) et du taux de l’impôt sur la société ( IS )
I t =f(i t ,p t-1 ,IS)
Le taux de l’IS ne change pas d’une année à l’autre, en plus de la corrélation de la variable
(IS) avec la constante on a un problème de la non variabilité.
Ù
III DETERMINATION DE â et b PAR LES MOINDRES CARRES
ORDINAIRES : (M.C.O)
Ù n Ù
Il s’agit de déterminer â et b qui minimisent l’expression å (Y i -Y i )2
i =1
n Ù Ù Ù
Soit å (Y i - aX
i =1
i - b ) 2 lorsqu’on remplace Y i par sa formule.
Ù Ù n Ù Ù
Cela revient à minimiser la fonction F ( a , b )= å (Y i - aX i - b ) 2
i =1
Ù 2
(donc on minimise E = åU i
)
¶F
Ù
= 0 (1)
¶a
¶F
Ù
= 0 (2)
¶b
9
¶F Ù Ù
Ù
= 0 Û -2å X i (Y i - a X i - b ) = 0 (1)
¶a
¶F Ù Ù
Ù
= 0 Û -2å (Y i - a X i - b ) = 0 (2)
¶b
Ù
Ces deux dérivées sont nulles en â et b donc on aura :
L’équation ( 2) donne :
Ù Ù
åY i - aå X i - åb = 0
En divisant le tout par n on aura :
Ù
åY i
-a
å X i - åb = 0
Ù
n n n
on aura donc
Ù Ù Ù Ù
Y - a X -b = 0 Þ b =Y - a X
Ù
On remplace b par sa valeur dans l’équation (1) et on obtient :
Ù
å X i (Y i -Y ) - a å X i (X i - X ) = 0
D’où a =
Ù
å X (Y i i -Y )
å X i (X i -X )
Ù
a=
å X (Y i i -Y ) - å X (Y i -Y )
å X (X i i - X ) - å X (X i - X )
Ù
a=
å (X - X )(Y -Y ) i i
å (X - X ) i
2
Remarque : â est une variable aléatoire puisque fonction de Yi elle même aléatoire. Idem pour
Ù
b.
Ù Ù Ù
Il faut ajouter les conditions de second ordre pour que F( a , b ) soit minimale en â et b .
Ù
IV ETUDE DES PROPRIETES DE â ET b :
10
Y i -Y = Y i - ( aX + b + U )
= ( aX i + b + U i ) - ( aX + b + U )
= a (X i - X ) + (U i -U )
d’où
Ù
a=
å (X i - X )[a (X i - X ) + (U i -U ) ]
å (X i - X ) 2
Ù a å (X i - X )(X i - X ) å (X - X )(U -U )
a= + i i
å (X i - X ) 2
å (X - X )i
2
Ù
a =a+
å (X - X )(U -U )i i
å (X - X ) i
2
Ù
a =a+
å (X - X )U -U å (X
i i i -X )
å (X - X ) i
2
E (â) = a
Ù
2°) Calcul de E ( b ) :
Ù Ù
On sait que b =Y - a X
Ù Ù
or Y = a X + b et Y = aX + b + U
Ù Ù
donc b - b = U - X (a - a )
Ù Ù
soit b = b + U - X (a - a )
Ù Ù
d’où E (b ) = E (b ) + E (U ) - X E (a - a )
Ù Ù
E (b ) = b + E (U ) - X E (a - a )
11
or E (U ) = E (
åU i
)=
å E (U i )
=0
n n
Ù Ù
E (a - a ) = E (a ) - E (a ) = a - a = 0
Ù
Donc E (b ) = b .
Ù
b est un estimateur sans biais de b.
Ù
3°) Moment de 2ème ordre de â et b :
a- Variance de â :
Ù Ù
V (a ) = E ((a - a ) 2 )
å (X - X ) i
2
car
Ù
a =a+
å (X - X )U -U å (X i i i -X )
et å (X -X ) =0
å (X - X ) 2 i
i
Ù é (å (X i - X )U i ) 2 ù
donc V (a ) = E ê 2 2 ú
ëê (å (X i - X ) ) ûú
Ù 1
V (a ) = E (å (X i - X )U i ) 2
(å ( X i - X ) )
2 2
Comme E (å (X i - X )U i ) 2 = å (X i - X ) 2U i 2 + å i å j (X i - X )(X j - X )U iU j
Ù 1
2 2 ëå
V (a ) = é (X i - X )E (U i 2 ) + (X i - X )(X j - X )E (U iU j ) ù
(å ( X i - X ) ) û
E (U i ) = 0
V (U i ) = E [U i - E (U i ) ] = E (U i 2 ) Quantité finie.
2
E (U iU j ) = Cov (U iU j ) = 0
Car cov(U iU j ) = E éë(U i - E (U i )(U j - E (U j ) ùû avec E (U i ) = E (U j ) = 0
Ù d j2 å (X i - X ) 2
V (a ) =
(å ( X i - X ) 2 ) 2
Ù du2
et V (a ) =
(å ( X i - X ) 2
12
Ù
b) Variance de b :
Ù
é Ù ù é Ù 2ù
V (b ) = E ê(b - E (b ) ) 2 ú = E êë(b - b ) úû
ë û
Ù
Calculons ( b -b)
Ù Ù
Ù Ù
b - b = U - X (a - a )
Ù Ù
b = b + U - X (a - a )
Ù
é 2 Ù 2 Ù ù
V (b ) = E êU - 2X U (a - a ) + X (a - a ) 2 ú
ë û
Donc
2 é Ù ù Ù
= E(U )-2X.E ê U( a -a) ú +X 2 .E( a -a) 2
ë û
Ù Ù
On rappelle que E (a - a ) 2 =V (a )
Ù 2 Ù 2 é Ù ù
Donc V (b ) = X V . (a ) + E (U ) - 2X .E ê(a - a )U ú
ë û
2
Comme les quantités V(â) et E (U ) sont connues :
Ù du 2
V (a ) =
å (X i - X )2
2
2 éU + U 2 + ... + U n ù
E (U ) = E ê 1 úû
ë n
å E (U
2
2 i ) du2
E (U )= =
n2 n2
é Ù ù Ù
Il reste à déterminer E ê(a - a )U ú pour connaître V (b ) .
ë û
On sait que :
Ù
a- a =
å (X i - X )U i
å (X i - X )2
Donc :
é Ù ù é å (X i - X )U i U ù
E ê(a - a )U ú = E ê ú
ë û êë å (X i - X )
2
úû
13
é (U U i ) ù
E (U i U ) = E ê i ú
ë n û
Ù 2 Ù du2
V (b ) = X .V (a ) +
n
Ù d 2
2 du2
V (b ) = ( u
X +
å ((X i - X )2 ) n
Ù é1 X
2
ù
V (b ) = d ê + ( 2
ú
å (X i - X )2 úû
u
n
ëê
Remarques :
En vertu de l’hypothèse 6, X tend vers une valeur finie quand n tend vers l’infini.
Ù
2
V (a )X tend vers 0 quand n tend vers l’infini.
du2 Ù
Idem pour . Donc b est un estimateur convergent
n
Si l’hypothèse d’indépendance des résidus n’est pas satisfaite (H 4 non satisfaite), la formule
Ù
a
de V(â) sous-estime celle-ci (donc surestime le T de Student pouvant nous amener à
d Ù
a
conclure hâtivement que la variable explicative Xi est satisfaisante).
« Le lecteur constate qu’il est faux de dire, comme on le fait souvent, que l’estimateur par les
moindres carres suppose une distribution normale des aléas U i . En fait, la normalité des
aléas est nécessaire seulement pour la justification de certains tests associés à la méthode des
moindres carrés et non pour des formules des estimations.
2
V DETERMINATION D’UN ESTIMATEUR SANS BIAIS DE du
V (U i ) = du2 est en général inconnue. Il est nécessaire de l’estimer pour avoir les variances
Ù
estimées de â et b .
Ù
Soit u i le résidu de l’estimation tel que :
Ù Ù Ù
u i = y i - a x i -b
Ù Ù Ù
= (a- a )x i +(b- b )+u i on montre que E( u i)=0
Ù Ù Ù
u i diffère de u i pour les termes (a - a )x i et (b- b ) qui dépendent des résidus de
l’estimation.
14
Ù Ù
Comme a ¾¾¾
prob
®a (converge en probabilité vers a) et b ¾¾¾
prob
® b alors la distribution des
Ù
ui
Ù2
n : le nombre d’observation.
n-2 : le nombre de degré de liberté.
2 : le nombre des paramètres ( a et b).
Rappel :
Ù Ù
Y i =Y i + u i
Ù Ù Ù
åu i = 0 Þ å Yi =å Yi Þ Y =Y
Ù Ù Ù
Y i -Y i =Y i -Y + u i
Revenons aux Y i observés :
2
Ù Ù
é Ù Ù
ù
(3) å (Y i -Y ) 2 = å (Y i -Y ) 2 + å µ i + 2 êå (Y i -Y ) µi ú avec
ë û
Ù
å (Y -Y ) = 0 et å µi = 0
Ù
Divisons les 2 membres par n et rappelons que Y =Y
On remarque ainsi que variance empirique des Yi est égale à la somme de la variance
Ù Ù
empirique des Y i et de la variance empirique des u i .
Ù
La variance empirique de Y est souvent appelée variance expliquée par la relation linéaire.
Ù
Celle des u i est la variance résiduelle.
Il semble alors naturel de mesurer la qualité de la liaison linéaire par le rapport de la variance
Ù
empirique des Y i à celle des Y i . Ce rapport sera noté R 2 .
R 2
=
å (Y i -Y ) 2
=
variation expliquée
å (Y i -Y ) 2
variation totale
15
Exemple : si l’on obtient R 2 =0.78 cela voudrait dire que le modèle permet d’expliquer 78%
de la variabilité de Y.
R 2 est appelé coefficient de détermination (carré du coefficient de corrélation).
On souligne que la logique du carré du coefficient de corrélation ( r 2 ) étudié en statistique
descriptive n’est pas la même ici du fait qu’il y a ‘‘l’hypothèse de causalité’’ entre X et Y.
Ce sont les X qui ont des effets de causalité sur Y, d’où la prise en considération de
Ù Ù
(Y i -Y ) et pas (X i - X ) .
Ù
La logique du r en économétrie fait la différence entre Y et Y .
å (Y
2
En divisant les termes de l’égalité (3) par i -Y ) :
Ù2
1= R 2 +
åu i
å (Y i -Y ) 2
Ù2
R 2 = 1-
åu i
å (Y i -Y ) 2
16
expliquer Y. Cependant, on peut être amener à tester ‘‘a’’ par rapport à une quantité donnée
différente de zéro.
Exemple : soit le modèle suivant :
C r = a0 + a1D + a2 I r + a3IG + e r
C r cours de l’action d’une entreprise. D : Dividende. I r : L’investissement de cette
entreprise.
IG : L’indice générale de la bourse.
Ici, on cherchera pas forcément à tester a1 , a2 et a3 par rapport à zéro mais par rapport à une
autre quantité donnée.
2°)Construction du test :
Ù
a- 0
Ù
åu i
T =
å (X i - X )2
Ù
ui
å (d 2
)
u
n -2
Le numérateur est une variable normale centrée et réduite. Le dénominateur est une variable
de Khi-Deux divisée par son nombre de d.d.I (n-2). Test donc par définition une variable de
STUDENT à (n-2) d.d.I.
Ù
Dès lors, l’intervalle de confiance pour a s’écrit :
é Ù2 Ù2 ù
ê
Sous H 0 P ê0 - t a
å ui Ù
< a < 0 + ta
å ui ú = 0.95
2ú
(n - 2)å (X i - X ) 2
(n - 2)å (X i - X )
êë úû
Soit : P [ -t a < T < +t a ] = 0.95
17
2ème étape : Solution du test :
Deux cas possibles
Ù
* a appartient à l’intervalle non rejet de H 0 .
Ù
* a n’appartient pas à cet intervalle, on rejette H 0 .
Remarque et exemple :
Ù Ù
Y t = 4X t + 6 a =4 et b =6
(0.6) (0.8) (..) écarts-types estimés des estimateurs
Section I- PRESENTATION :
Les modèles linéaires sont fiables à court et moyen terme car le domaine de variation des
variables est dans ce cas relativement restreint. La fiabilité de ces modèles (modèles linéaires)
sera plus ou moins réduite dans le temps et ce en fonction de la rapidité avec laquelle les
variables prises en compte subissent des transformations.
Les M.R.M. sont du type :
(1) Y t = a1X 1t + a2 X 2t + ... + a p X pt + U t
Y t : Variable endogène, aléatoire à cause de l’introduction de U t .
X 1t ...X pt Sont les observations à chaque période t des variables exogènes X 1...X p .
a1X 1t + ... + a p X Est la partie déterministe ou systématique ou explicative du modèle.
pt
Ù Ù
A partir des coefficients estimés a1 ... a p et en utilisant les différents tests, on peut apprécier
parmi les variables du vecteur X celles qui sont les plus significatives.
18
Hypothèse 2 : Les Y t et les X it sont des grandeurs numériques observées sans
erreur.
E (U t ) = 0 quelque soient X it , et pour i=1,...,p .
X(n,p) est de rang p (avec n>p) cela veut dire que (X ' X ) -1 existe.
Avec n : ligne, p : colonne.
Ù
Cette hypothèse est utile pour l’étude des propriétés de a .
Quand n tend vers l’infini, (X ' X ) -1 reste non singulière.
Hypothèse 7 : On n’introduit pas de restriction sur les estimateurs. Ils peuvent être positifs,
négatifs ou nuls.
RECAPITULONS :
*X pt = 1 pour tout t permet d’introduire une constante dans le M.R.M . L’exclusion d’une
constante dans un MLRM donne souvent un R 2 incorrect.
*Les p vecteurs X 1...X p -1 et E ne sont pas colinéaires.
Ces vecteurs forment une variété linéaire non dégénérée à p dimensions dans R n qu’on
appellera plan de régression.
La matrice X (n , p ) = (X 1t , X 2t ,..., X p -1t , E ) pour t variant de 1 à n est de rang p.
*Ecriture matricielle :
s’écrit pour chaque t et pour t = 1…n
Y t = X .a + U t (2)
Enfin, on aura :
Y = X .a + U
19
Ù Ù Ù Ù
Y = X a et U =Y- Y (3)
Ù Ù
D’où U =Y-X.a (4)
Ù Ù
Avec Y = X a
Ù
La méthode consiste à chercher les paramètres a i tels que :
n Ù
å (u t )2 soit minimum.
i =1
Ù
Revenons à (4), le vecteur U des écarts est orthogonal au plan de régression. Les équations
normales s’écrivent alors :
Ù Ù Ù Ù Ù
X 1' U = X 2' U = ... = X j' U = ... = X '
p -1 U = E 'U = 0
Elles expriment l’orthogonalité de û et des p vecteurs lignes X 1' , X 2' ,..., X '
p -1 et E '
Ces équations peuvent s’écrire :
Ù
X '.U = 0 ® le vecteur de la matrice X'.
X'= transposé de la matrice X.
En tenant compte de (4), on aura :
Ù
X '.(Y - X a ) = 0
Ù
(X '.Y ) - (X ' X . a ) = 0
Ù
X '.Y = X '.X a
Ù
(X ' X ) -1 X 'Y = (X ' X ) -1 (X ' X ) a
Ù
a = (X ' X ) -1.X 'Y
2°) Propriétés de â :
Nous allons démontrer que par les MCO, â est l’estimateur efficace dans l’ensemble des
estimateurs linéaires et sans biais de a. â sera dit BLUE (Best linear unbiased estimators)
Ù
Calcul de E (a ) :
Ù
a = (X ' X ) -1 X 'Y
or Y = X a + U
Donc
20
Ù
a = (X ' X ) -1 X '(X a + U )
Ù
a = (X ' X ) -1 (X ' X a + X 'U )
Ù
a = (X ' X ) -1 (X ' X ).a + (X ' X ).X 'U
Ù
a = a + (X ' X ) -1 X 'U
Ù
E (a ) = E éëa + (X ' X ) -1 X 'U ùû
Ù
E (a ) = E (a ) + (X ' X ) -1 X ' E (U ) ; E(U) étant egal à 0
Ù
E (a ) = a donc a est un estimateur sans biais de a.
Ù
*Calcul de V (a ) :
Ù
é Ù Ù
ù
V (a ) = E ê(a - a ) (a - a )'ú
ë ( p ´1) (1´ p ) û
Ù
Or (a - a ) = (X ' X ) -1 X 'U
Ù
où (a - a ) ' = U ' X (X ' X ) -1 , car X'X est symétrique
Ù Ù
donc ( a -a)( a -a)'=(X'X)-1X'.UU'.X(X'X)-1
Ù
V( a )=E éë(X'X)-1.X'.UU'.X.(X'X)-1 ùû
Ù
Le seul terme aléatoire dans l’expression de V (a ) est UU’
Ù
donc : V (a ) = (X ' X )X .E (UU ').X (X ' X )
on rappelle H3 V (U t ) = du2
Ù
Enfin V (a ) = (X ' X ) -1 X du2 I n X (X ' X ) -1
= du2 (X ' X ) -1 X '.I n X (X ' X ) -1
Ù
d’où V (a ) = du2 (X ' X ) -1 (6)
On montre qu’une condition nécessaire et suffisante pour que â soit un estimateur convergent
de a est que les vecteurs variables exogènes ne tendent pas à être colinéaires quand n tend vers
l’infini.
Autrement dit H6 reste valable quand n tend vers l’infini.
â est efficace dans la classe des estimateurs de a sans biais et linéaires en Y. Ce théorème de
Gauss Markov justifie l’utilisation des M.C.O pour effectuer une estimation.
*
1- on va définir un estimateur linéaire a sans biais de a et à variance minimale
*
2- on va montrer que a est en fait équivalent à â.
Démonstration
21
*
1- soit a un estimateur de a linéaire en Y
*
a =a + LY .
( p ´1) (p ´1) (n ´1)
L(p,n) matrice quelconque
*
• a doit être sans biais
* Ù
E( a ) = E (a ) + L .E (Y )
= a+L.E(Xa+U)
= a+L.E(Xa)
L.X=0
*
a ne sera sans biais que si L.X=0
*
• Matrice des variances co-variances de a
*
é * ù
V (a ) = E ê(a - a )(a - a ) 'ú
ë û
* Ù
a - a = a + LY - a
Ù
Or = a -a+L.(Xa+U)
Ù
= a -a+L.Xa+LU
or L.Xa=0
* Ù
donc a -a= a -a+LU
= (X'X)-1X'U+LU
*
enfin V( a )= éë E(X'X)-1X'U+LU ùû éë(X'X) -1X'U+LU ùû '
On rappelle que E (UU ') = du2
*
d’où V (a ) = du2 éë(X'X)-1X'+L ùû éë X(X'X) -1 + L 'ùû
*
Comme L .X = 0 car a est sans biais
Alors X ' L ' = 0 et
*
V (a ) = du2 (X ' X ) -1 + du2 L ' L
* Ù
d’où V (a ) =V (a ) + du2 L ' L
et finalement,sauf si L = 0 , LL ' est une matrice semi-définie positive en d’autres termes
* Ù
V (a ) >V (a ) .
â est un estimateur convergent.
22
On montre la convergence de â en moyenne quadratique et cela implique sa convergence en
probabilité.
Rappel :
Ù
1-Expression de u :
Ù Ù
On sait que Y=Xa+u et Y =X a
Ù Ù Ù Ù
Y =Y + u ou u =Y -Y (7)
Ù Ù
d’ou u = Xa+U-X a
=U+Xa-X éëa+(X'X)-1X 'U ùû
=U-X(X'X)-1X'U (8)
= éë I n -X(X'X)-1X 'ùû .U
Ù
µ = M .U
23
On dit que A est idempotente si A 2 =A, A n =A "n or M 2 =M de M est idempotente
Ù2
2-Expression de åu t
Ù2 Ù Ù
å u t = u 'u
Ù Ù
d’après (8) u 'u =U'M'MU=U'MU
soit u ij l’élément de la matrice M situé à l’intersection de la ligne i et de la colonne j
Ù2
åu t =åu ijUi2 +2å i å j u ijU iU j
et E éë å (U t ) 2 ùû = trace M
æ Ù2 ö
car on a E ç å u i ÷ = 0 quelque soit i et E(U i U j )=E(U i )E(U j )=0 avec i ¹ j
è ø
3-Trace de M :
donc trM=n-p
Ù Ù é Ù2 ù
on avait E( u 'u ) = E êd (å u t ) ú = du2 (n - p )
ë û
Ù
u
et E ( t ) = dt2trM = du2 (n - p )
n-p
Ù2
enfin S 2 =
åu t
n-p
24
I . LE COEFFICIENT DE CORRELATION MULTIPLE
1°) Formulation :
å (Y
t=1
t -Y ) 2
2°) Interprétation :
n
Au numérateur å (Y
t=1
t -Y ) 2 est l’imprécision de M1 (la variance totale)
n Ù
å (Y
t=1
t - X t a ) 2 la mesure de l’imprécision de M2 (variance résiduelle). Plus cette dernière
sera élevée, plus elle se rapproche de la variance totale ........d’où l’inutilité d’adopter M2
plutôt que M1 On remarque que 0<R<1.
Comme R < 1 alors R2 est proche de 1 cela signifie que R est encore plus proche de un, R2
proche de 1 n’est pas une preuve de causalité totale. De même R 2 proche de 0 ne signifie pas
absence de lien entre la variable expliquée et variables explicatives, mais peut être la forme de
liaison n’est pas vérifiée.
Bref, il faut être prudent durant l’interprétation de tout résultat.
25
Ù
a = (X ' X ) -1 X 'Y = a + (X ' X ) -1 X 'U
de même si on prend P = X (X ' X ) -1 X ' , on aura
Ù
Y = P .Y (2)
Ù
et u = M .U (3) avec M=I n -P
Sous l’hypothèse de normalité de la distribution des U (aléas)
Ù Ù Ù
On déduit que Y , a , Y et u suivent des lois normales dont on peut déterminer les
paramètres.
a- Construction de test :
Dire que a = 0 , c’est dire que les variables retenues ne sont pas explicatives donc si H 0 est
vérifiée c’est-à-dire si a = 0 , on peut écrire :
Ù Ù
Y = P .Y et u = M .U
Ù Ù
u 'u suit une loi khi-deux (n-p)
Ù Ù
Si a = 0 Y 'Y suit la loi khi-deux p. Ces deux khi-deux sont indépendants en probabilité. Or,
on sait que le rapport de 2 khi-deux est un F de FISHER. Donc, pour établir le test de a = 0 ,
on construit la variable F qui suit une loi de Fisher.
Ù Ù
Y 'Y Ù Ù
p Y 'Y n-p
F= Ù Ù = ´ Ù Ù tend vers un Fp;n-p d.d.l
u 'u p u 'u
n-p
.
b- Solution du Test :
26
Et 2,71 au seuil de 5% et 4,10 au seuil de 1%
Nous allons rejeter H 0 au seuil de 5% ( car 3>2,71) mais on ne pourra pas la rejeter au seuil
de 1% ( car 3<4,10)..
Remarque : Ce qui importe, c’est de tester la portée explicative l’influence des « vraies
variables exogènes » . Ce qu’il faut tester c’est la nullité du vecteur formé par les (p-1)
premières composantes de a. On a toujours :
Ù Ù
µ' µ khi deux à (n-p) d.d.I si les (p-1) premières sont nulles
Ù Ù
Y'Y khi deux à p-1 ddl
donc on rejette H 0 : les variables exogènes peuvent être considérées comme explicatives dans
l’ensemble.
c- Généralisation :
On pose n>q>p
Faut-il refuser H 0 qui considère M 2 comme meilleur ; cela veut dire : dans M1 les ( q-p )
variables ne sont-elles pas en trop ?
Pour répondre à cette question, on définit un F qui suit une loi de probabilité donnée ;
Ù Ù
u =Y - X a
Ù* * Ù*
u =Y - X a
Ù Ù Ù* Ù*
u ' u - u 'u Ù Ù Ù* Ù*
q-p u ' u - u 'u n - p
F= = ´ * * .
Ù* Ù* q-p Ù Ù
u 'u u 'u
n-p
27
Ù Ù Ù* Ù*
u 'u - u 'u n-p
F= ´
Ù* Ù* q-p
u 'u
Ce test permet en fait d’apprécier la portée explicative de chaque variable exogène retenue.
Soit le modèle : Y = X a + U
S2 =
åu t est un estimateur sans biais de la variance de u
n-p
Ù Ù
Ù Ù u 'u
En outre, u 'u ® d c u
2 2
n-p donc suit un Khi Deux à (n-p) ddI .
V (U )
Ù Ù
u 'u
Comme la distribution de est indépendante de celle de L on a par définition : la
V (U )
variable
Ù
a k -a k
Ù
du Vk a k -a k
T= = suit une loi de STUDENT à (n-p) ddI
Ù Ù Ù Ù
u 'u Vk .u 'u
d n-p n-p
Ù Ù
Ù
Vk .u 'u
On remarque que la quantité est une estimation De l’écart-type de a k
n-p
28
Lorsque on teste l’hypothèse a k =0 , cela revient :
Ù
à partir du fait que a k ® N(a k ,d Vk )
à poser a k =0 et à déterminer une variable de STUDENT T (dans la formule ci-dessus cela
revient à remplacer a k par 0).
Solution du test :
ê d ak ú
ë û
é Ù Ù Ù
ù
ou encore P ê-t a .d ak < a k <+t a .d ak ú =0.95
ë û
2 cas possibles :
Ù
é Ù Ù
ù
* a k appartient à l’intervalle ê-ta .d ak , +t a .d ak ú alors on ne refuse pas H0
ë û
Ù
* a k n’appartient pas à cet intervalle alors on refuse H0 .
Remarque :
Nous avons utilisé le constat que la variable de Student T à (n-p) ddI converge en loi vers une
loi normale centrée réduite quand (n-p) augmente. On peut sans commettre d’erreur notable
utiliser l’approximation normale quand l’échantillon est grand.
15 2.131
20 2.086
30 2.042
40 2.020
60 2.000
La table de la loi normale donne une valeur de 1.96 ; donc, en faisant une approximation,
l’hypothèse de nullité d’un coefficient (ou son égalité à une quantité donnée) sera rejetée pour
un T > 2 .
Exemple :
M t = e + aI t + bC t +U t
M t = 15.8 + 3.07I t + 1.92C t
pour n = 22, on a
(10.53) (0.81) (1.25)
29
15.8
* T = suit une loi de Student à 19 ddI,
10.53
le t lu sur la table à 95% est 2.093. T appartient à [-22.093,2.093] donc non rejet de H0 .
3.07
* T = > 2 donc le coefficient est différent de 0 l’investissement
0.81
explique le niveau des importations.
1.92
* T = < 2 donc selon l’échantillon, la consommation n’explique
1.25
pas le niveau des importations.
Il y a autocorrélation des résidus quand le modèle est mal spécifié. On peut préciser que le
risque d’autocorrélation des résidus augmente surtout dans les modèles estimés sur des séries
chronologique. Elle sera d’ailleurs d’autant plus grande que la périodicité est courte.
Dans le cas de l’omission d’une variable significative ou l’inclusion d’une variable non
significative, les résidus ne sont plus distribués de façon aléatoire autour du Y mais reflètent
le comportement des variables omis ou inclus.
A - Principe d’estimation :
Il existe plusieurs procédures d’estimation. On suppose par exemple que les résidus Ut sont
corrélés selon un schéma autorégressif de 1er ordre. Soit donc :
On démontre que dans le cas d’autocorrélation des erreurs, l’estimateur â est sans biais et il
reste convergent.
Mais, cela ne signifie pas qu’il a la variance minimum. La variance étant forte, l’estimation
peut s’éloigner de son espérance mathématique avec une forte probabilité.
Reprenons le modèle initial :
Yt =a1X1t +a 2 X 2t +...+a p X pt +U t (1)
Ù Ù Ù
Soit a obtenu par les MCO et Y =X a
30
Ù Ù Ù
Pour une période, u t =Y t -Y t Ces résidus dépendent aussi bien de la suite des erreurs u t
mais également de la suite des X t .
Ù
Considérons la variable aléatoire d définie comme suit :
Ù Ù
Ù
d=
å (u - u t t -1 )2
(2)
Ù2
åu t
Ù Ù Ù Ù Ù Ù
d est fonction de u t donc d = f (u t ) = f (Y t -Y t ) . Or, u t ® N (0, du2 ) donc la limite
Ù
en probabilité de d varie entre 2 valeurs 0 et 4.
Ù Ù
On démontre que d ® 2(1 - f )
En effet, de la formule (2), on peut déduire :
Ù Ù
Ù
d = 2-2
å (u u t t -1 )
Ù
åu t
2
Cette statistique de D.W est utilisé pour donner la nature de la corrélation des résidus.
* Quand il y a corrélation positive parfaite,
Ù Ù
f = 1 ; U t = fU t -1 + e t ® d = 0
Ù Ù
* Quand f = -1 ® d = 4 , il y a autocorrélation négative parfaite.
Ù Ù
* Il y a indépendance lorsque f = 0 dans ce cas d = 2
Tableau de décisions :
Ù
d =0 di d2 4-d 2 4-d i 4
----------------------------------------------------------------------------------------------------
! ! ! ! ! !
! AUTOCORR ! DOUTE ! INDEPENDACE ! DOUTE !AUTOCOR !
!ELATION ! ! ! !RELATION !
POSITIVE ! ! ! ! NEGATIVE !
Ù
Les programmes de calcul donnent la valeur de d .
31
Ù
* d < d1 on rejette H0
Ù
* d1 < d <d2 doute
Ù
d >d2 non rejet H0 , absence d’autocorrélation des résidus.
Remarques :
* Dans le cas d’autocorrélation des aléas, il y a lieu d’opérer sur le modèle initial la
transformation de COCHRANE ORCUTT.
Exemple :
32
Bibliographie
Ø Ouvrages
« Méthodes statistiques de l’économétrie » Edmond MALINVAUD - Dunod /
« Introduction à l’économétrie » C. Labrousse – Dunod /
« Méthodes économétriques pour l’analyse économique et l’aide à la
décision » Kamal HADADJ – Walada / 1994
« Introduction à l’économétrie » Dormont B – Montchrestien (1999)
« Métodes Econométriques », Tome 1 et 2, J.Johnston, Economica, 1985
« Econométrie », Jean-François Brun, Jean Louis Combes et Claudio Araujo,
Bréal, 2004
« The theory and practice of econometrics » édition Wiley 1985
Exercices Pedagogiques de statistiques et économetrie » Claude Mouchot,
Economice 1979
« Limted dependent and qualitative varaibles in econometrics » G.S.Madala
, Cambrigde university Press, 1977.
« A Guide to Econometrics » Peter Kenned , Third Edition , 1992
« Econométrie appliquée », sous la direction de Claude Montmarquette,
Economica, 1997
Ø Revues
• Problèmes économiques
• Revue d’Économie du développement
• Revue d’économie politique
• Economie et prévision
• American Economic Review (AER)
• Journal of Political Economy
• World Bank Economic Review
Ø Journaux
§ Le Monde ( du Mardi)
§ Figaro ( Samedi/ les pages saumon)
33