Vous êtes sur la page 1sur 33

UNIVERSITE HASSAN II

FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET SOCIALES


CASABLANCA

FONDEMENTS DE BASE
DE L’ECONOMETRIE
Compléments du cours

1
Chapitre introductif
Typologie des modèles
La section I de ce chapitre présente les caractéristiques d’un modèle. Elle en définit les
constituants (variables, équations, paramètres...)
La section II présentée ci-après traite des modèles de politique économique. Elle reprend les
constituants qui leur sont propres.

SECTION I : PRESENTATION DES MODELES :


a) Les variables :
On trouve ici les objets de la décision propre à la politique économique (micro ou macro).

Xi : Quantité de l’instrument de politique économique, numéro (i) utilisée par le décideur.

i = 1,2,…….,m

Exemple :
MACRO
i=1 : Dépense publique globale.
i=2 : Taux d’impôt indirect.
i=3 : Taux de réserves obligatoires.
i=4 : Taux de salaire dans la fonction publique ou le SMIG.

MICRO

i=1 : Le prix pratiqué par l’entreprise.


i=2 : Investissement (stock, outil).
i=3 : Dépenses publicitaires.
i=4 : Taux de salaire directs et indirects

Yj : quantité de l’objectif ( j ) visée par le décideur.


j= 1,2,…………,n.

Exemple :
MACRO

j=1 : Volume de l’emploi de la main d’œuvre


j=2 : Solde de la balance commerciale.
j=3 : Taux de croissance du PIB.

2
MICRO

j=1 : Part de marché.


j=2 : Chiffre d’affaire.
j=3 : Productivité.

De manière générale les instruments n’agissent pas directement sur les objectifs:

Exemple :

Dépenses publiques Distribution des revenus

Consommation privée Production Emploi

Dans les modèles qui prennent en compte cet aspect, on trouvera donc des variables
intermédiaires.
Il s’agit de variables endogènes situées entre l’instrument et l’objectif.
Soit Zk : Quantité de la variable intermédiaire endogène k.

On distingue enfin les variables prédéterminées. Elle se trouve aussi entre l’instrument et
l’objectif, mais leur valeur est fixée en dehors du modèle.
Soit Vk : Quantité de la variable prédéterminée k.

b) Les relations entre les variables :

Dans les modèles de politique économique, on trouve d’abord les relations ordinaires (de
comportement), mais on trouve aussi des relations propres à ces modèles.

v Les contraintes ou fonctions instrumentales :


Elles relient les objectifs aux instruments. Ceux sont des sortes de fonctions de production
d’objectifs (output) à partir des instruments (input).

Exemple :

Yj= fj (x1 , x2 , .........., xn): fonction de production de j.

dY1
µj1 = : efficacité marginale de i vis à vis de j.
dX1
si l’on tient compte du fait que les instruments n’agissent pas directement, on notera :

X1 Zk Yj

D’où Zk = g ( X1 ,….., X1………, Xn)


Yj = fj (Z1 ……., Zk ….)

3
Exemple :

X1 : Dépenses publiques.
Zk : investissement privé.
Yj : Croissance du PIB.
Fj : Est la fonction de production reliant le PIB et l’investissement privé.

Donc on aura : Yj = Fj [……….gk ( X1 ,….., X1………)…………]

f : est donc une fonction de fonctions ( ou fonction composée ).

v Les contraintes spécifiques sur les objectifs et sur les


instruments :

Ce sont des « planchers » ou des « plafonds » que ne peuvent raisonnablement dépasser les
variables de politique économique.

Exemple :

X ³ X’ : Plancher de production.
L ³ L’ : Plancher d’emploi de la main d’œuvre.
P ³ P’ : Plafond des prix.
G £ a.Y : Plafond des dépenses publiques par rapport au revenu national.
G – F £ D’ : Plafond du déficit budgétaire (F étant les recettes fiscales).

SECTION II : UTILISATION DES MODELES DE


POLITIQUE ECONOMIQUE :

Comme Leur nom l’indique, les modèles de politique économique permettent la mise au point
de celle-ci (du macro et micro), or on sait que le décideur agit sur l’activité économique avec
une visée plus au moins volontariste.

Ainsi, tantôt ces modèles vont permettre la « simple » prévision, tantôt, ils seront utilisés pour
la décision.

a) L’utilisation prévisionnelle :

(X,V) M.S (Y,Z)

M . S : Modèle de simulation.

Le schéma sur lequel est fondée cette démarche est probabiliste.


A partir des valeurs jugées possibles des X (instruments), et des V (variables
prédéterminées), le modèle permet de connaître les valeurs endogènes des variables Z
(intermédiaires) et Y (objectifs).

4
Ici, l’optique du « possible » est privilégiée. La valeur des objectif est fournie par le calcul ;
elle n’est pas fixée à priori. Cependant on peut introduire des variantes en modifiant la valeur
donnée aux X (instruments).

b) L’utilisation décisionnelle :
Ici, les objectifs sont fixés à priori. C’est la démarche qui prévaut la planification.

La démarche se résume comme suit :

(Y,V) M.S (X,Z)

ici, Y (Objectifs ) et V (Valeurs prédéterminées) sont exogènes.

Le MS permet le calcul des variables endogènes X (instruments) et Z (Variables


intermédiaires).

La démarche est plus volontariste, normative. Le souhaitable est privilégié au détriment du


probable.

Ce sont les niveaux requis, désirés des objectifs qui déterminent les montants des instruments.

c) La combinaison des deux méthodes s’impose :


En pratique la simple prévision est insuffisante pour parler de politique économique visant
des objectifs précis.

D’un autre côté, les objectifs ne peuvent atteindre n’importe quelles valeurs car la
manipulation des instruments admet des limites. Les X ne peuvent prendre toutes les valeurs
dictées par Y fixés (cf. Plafond et plancher).

La politique doit non seulement être ambitieuse et cohérente, mais aussi réaliste.
L’utilisation mixte ou alternative du MS permet d’approcher cette réalité.

v Première méthode :

Certains objectifs seront traités en variables exogènes, les autres le seront en variables
endogènes.

Réciproquement, les instruments les plus rigides (les plus proches de leur limite plafond ou
plancher) seront traités en variables exogènes. Les plus souples restent endogènes.

Ainsi, le modèle est mi-décisionnel, mi-prévisionnel.

v Deuxième méthode :

Les objectifs prioritaires et les instruments souples sont aussi, tantôt, endogènes, tantôt,
exogènes.

5
Première étape :

Utiliser le modèle dans l’optique décisionnelle.

Il s’agit de fixer Y et de calculer le montant de X nécessaire pour atteindre le niveau de Y


fixé. Si certains niveaux de X semblent irréalistes (forte pression fiscale par exemple), on les
réduira à des niveaux plus réalistes.

Deuxième étape :

On utilise le modèle dans une optique prévisionnelle. On recalcule les objectifs.


Par itérations (Vas et vient), on ira du souhaitable vers le possible en gagnant à chaque
itération un peu du coté du souhaitable en s’approchant le plus près du possible.
Cette méthode est utilisée dans la pratique mais elle présente l’inconvénient d’être lourde.

d) Les modèles d’optimisation :


Il s’agit en fait de modèles décisionnels à objectifs flexible.
Ici, les objectifs Y et les instruments X sont des variables endogènes. Leur valeur numérique,
inconnue au départ, découle de la maximisation (ou minimisation) d’une fonction de
préférence sous certaines contraintes.

La démarche se résume comme suit :

( V) M.O (X,Y,Z)
Seules les variables prédéterminées V sont exogènes.
A l’aide d’un MO, on calcule les montants des instruments, des objectifs et des variables
intermédiaires.
Il faut en outre disposer d’une part de contraintes (analogues à celle des MS) et d’autre part
d’une fonction de préférence ou d’utilité.

CHAPITRE I. MODELE LINEAIRE DE REGRESSION


SIMPLE (MRS) :
Les principales phases de la modélisation en économétrie sont au nombre de quatre
le schéma suivant les résume:

Spécification Estimation Validation Utilisation

On cherchera à répondre à deux questions principales au niveau de chaque phase :


1- En quoi elle consiste ?
2- Comment y procéder ?

6
On souligne que le sens des ‘‘flèches’’ n’est pas unique dans la mesure où le travail de
l’économétrie est un travail itératif.

SECTION I . MODELE LINEAIRE DE REGRESSION SIMPLE

(MRS) :

I - PRESENTATION GENERALE :

Soit Y i = aX i + b + U i

Y : variable endogène.
X : variable exogène.
U : Variable aléatoire appelée résidu, elle est une mesure de l’ignorance.
On dispose de “n” observations sur Y et X (i=1,2,…,n). Nous avons donc “n” couples
(Y i , X i ) qui sont des réalisations des variables Y et X.

a et b sont des paramètres réels et inconnus que l’on se propose d’estimer à l’aide des
observations y i et x i .

II. HYPOTHESES « CLASSIQUES » POUR LE M.R.S. :

Hypothèse 1 : Le modèle est correctement spécifié.


Il y a une mauvaise spécification lorsqu’on effectue un mauvais choix des variables, la forme
de la liaison entre la variable endogène et la variable exogène n’est pas correctement établie
ou bien la définition des variables ( Niveau, Variation, Indice,…etc.) ne correspond pas au
problème traité.
Autrement dit, il faut que la variable explicative retenue soit la « meilleure » sans omission
d’autres variables, la vraie relation soit une relation linéaire dans ou par rapport aux
paramètres à estimer et enfin la variable aléatoire intervienne de manière additive.

Remarque : Une mauvaise spécification peut aussi provenir des tautologies.


Expliquer les recettes touristiques en prenant le nombre des touristes comme variable
explicative est une tautologie.

Exemple : Consommation des produits laitiers :


1ère étape : Y ij : consommation de produits laitiers du ménages i dans l’agglomération du
type j
X ij : revenu du ménage i dans l’agglomération de type j
Y ij = a log X ij + b + U ij vraie pour i = 1 et pour j= 1,2 ,3.

j=1 commune de taille <10000 habitants.


j=2 10000 < taille <100000 habitants.
j=3 +de 100000 habitants.

2ème étape : Meilleure prise en compte de l’urbanisation : écriture d’un modèle pour chaque

7
type d’agglomération.

Y i 1 = a1 log X i 1 + b1 + U i 1 i=1....n 2
Y i 2 = a2 log X i 2 + b 2 + U i 2 i=1....n 2
Yi3 = a3 log X i 3 + b3 + U i 3 i=1....n 3

Remarque :
Généralement, la régression par le Logarithme présente deux avantages. Elle permet de
rendre linéaire une relation non linéaire. Elle fait aussi apparaître les coefficients de la droite
de régression comme des coefficients d’élasticité.

Hypothèse 2 : Les Y i et X i sont des grandeurs numériques observées sans


erreur.

Y est une variable aléatoire par l’introduction de U .


E (U i ) = 0 quelque soit X i (i = 1...n ).
Ce qui importe est que l’espérance athématique de U i soit nulle ou la même pour tout i. Cette
hypothèse est une hypothèse de permanence structurelle.

La prise en considération de cette hypothèse de permanence structurelle rend compte de


l’élimination de l’effet des fluctuations dans le cas d’un modèle estimé sur séries
chronologiques.
Dans le cadre d’un modèle estimé sur données individuelles, cette hypothèse rend compte de
la représentativité de la population étudiée ainsi que de la stabilité des ‘‘comportements’’.
La permanence structurelle doit être prise en considération dans le temps et dans l’espace.

E (Y i ) = a E (X i ) + b

Hypothèse 3 : L’homoscédasticité

U i est distribuée selon une loi de probabilité indépendante de “i” et de X i .

V (U i ) = E (U i2 ) = du2 Quantité finie

Hypothèse 3 reprend l’hypothèse 2 mais elle est plus forte. Si H3 n’est pas réalisée, on parle
d’hétéroscédasticité.

Hypothèse 4 : Hypothèse d’indépendance des erreurs (ou résidus)


On suppose que le U i et les U j erreurs relatives à 2 observations différentes sont
indépendantes entre elles c’est-à-dire

Cov (U i ,U j ) = 0 "i ¹ j.

Plus tard, on utilisera le test de DURBIN & WASTON pour savoir s’il faut ou non refuser
l’hypothèse 4.

8
Hypothèse 5 : Hypothèse de normalité :

On suppose que les U i sont distribuées selon une loi normale.

Hypothèse 6 : Hypothèse concerne la variable exogène

Lorsque n tend vers l’infini, la suite des Xi est telle que


åX i
= X tend vers X 0 .
n
å (X i - X ) 2

tend vers S2 avec X 0 et S2 des quantités finies.


n
Ù Ù
Cette hypothèse est utile pour l’étude des propriétés des estimateurs de a et b. a et b sont des
estimateurs convergents.

Hypothèse 7 : On ne dispose d’aucune information (restriction) sur les


paramètres a et b à estimer.

Ils peuvent prendre n’importe quelle valeur réelle positive, négative ou nulle.
Avant la clôture de cette partie réservée aux hypothèses classiques pour les M.R.S on met en
exergue un concepts important :

- la variabilité : ‘‘ On étudie pas la variabilité de quelque chose qui ne varie pas’’. Autrement
Ù
dit, il faut que å (X i - X )2 soit différente de 0.
Exemple : L’investissement en période ‘t’( I t ) d’une entreprise est fonction du taux d’intérêt
( i t ) du profit de la période t-1 ( p t-1 ) et du taux de l’impôt sur la société ( IS )
I t =f(i t ,p t-1 ,IS)
Le taux de l’IS ne change pas d’une année à l’autre, en plus de la corrélation de la variable
(IS) avec la constante on a un problème de la non variabilité.
Ù
III DETERMINATION DE â et b PAR LES MOINDRES CARRES
ORDINAIRES : (M.C.O)

Ù n Ù
Il s’agit de déterminer â et b qui minimisent l’expression å (Y i -Y i )2
i =1
n Ù Ù Ù
Soit å (Y i - aX
i =1
i - b ) 2 lorsqu’on remplace Y i par sa formule.
Ù Ù n Ù Ù
Cela revient à minimiser la fonction F ( a , b )= å (Y i - aX i - b ) 2
i =1
Ù 2
(donc on minimise E = åU i
)
¶F
Ù
= 0 (1)
¶a
¶F
Ù
= 0 (2)
¶b

9
¶F Ù Ù

Ù
= 0 Û -2å X i (Y i - a X i - b ) = 0 (1)
¶a

¶F Ù Ù

Ù
= 0 Û -2å (Y i - a X i - b ) = 0 (2)
¶b
Ù
Ces deux dérivées sont nulles en â et b donc on aura :
L’équation ( 2) donne :
Ù Ù
åY i - aå X i - åb = 0
En divisant le tout par n on aura :
Ù
åY i
-a
å X i - åb = 0
Ù

n n n
on aura donc

Ù Ù Ù Ù
Y - a X -b = 0 Þ b =Y - a X

Ù
On remplace b par sa valeur dans l’équation (1) et on obtient :
Ù
å X i (Y i -Y ) - a å X i (X i - X ) = 0

D’où a =
Ù
å X (Y i i -Y )
å X i (X i -X )

En rappelant que å (Y i -Y ) = 0 ( å (Y i -Y ) = åY i - åY = N Y - N Y = 0 ),de même que


å (X i - X ) = 0 on a :

Ù
a=
å X (Y i i -Y ) - å X (Y i -Y )
å X (X i i - X ) - å X (X i - X )

Ù
a=
å (X - X )(Y -Y ) i i

å (X - X ) i
2

Remarque : â est une variable aléatoire puisque fonction de Yi elle même aléatoire. Idem pour
Ù
b.
Ù Ù Ù
Il faut ajouter les conditions de second ordre pour que F( a , b ) soit minimale en â et b .

Ù
IV ETUDE DES PROPRIETES DE â ET b :

1°) Calcul de E (â) :

10
Y i -Y = Y i - ( aX + b + U )
= ( aX i + b + U i ) - ( aX + b + U )
= a (X i - X ) + (U i -U )

d’où
Ù
a=
å (X i - X )[a (X i - X ) + (U i -U ) ]
å (X i - X ) 2

Ù a å (X i - X )(X i - X ) å (X - X )(U -U )
a= + i i

å (X i - X ) 2
å (X - X )i
2

Ù
a =a+
å (X - X )(U -U )i i

å (X - X ) i
2

Ù
a =a+
å (X - X )U -U å (X
i i i -X )
å (X - X ) i
2

comme å (X i - X ) = 0 , on aura donc :


Ù é å (X i - X )U i ù
d’où E (a ) = E (a ) + E ê 2 ú
êë å (X i - X ) úû
Ù 1
E (a ) = E (a ) + E é å (X i - X )E (U i ) ùû
å (X i - X ) 2 ë
Comme E (a ) = a et E(U i ) = 0 , on aura donc :

E (â) = a

â est donc un estimateur sans biais de a

Ù
2°) Calcul de E ( b ) :

Ù Ù
On sait que b =Y - a X
Ù Ù
or Y = a X + b et Y = aX + b + U
Ù Ù
donc b - b = U - X (a - a )
Ù Ù
soit b = b + U - X (a - a )
Ù Ù
d’où E (b ) = E (b ) + E (U ) - X E (a - a )
Ù Ù
E (b ) = b + E (U ) - X E (a - a )

11
or E (U ) = E (
åU i
)=
å E (U i )
=0
n n
Ù Ù
E (a - a ) = E (a ) - E (a ) = a - a = 0

Ù
Donc E (b ) = b .
Ù
b est un estimateur sans biais de b.

Ù
3°) Moment de 2ème ordre de â et b :

a- Variance de â :

Ù Ù
V (a ) = E ((a - a ) 2 )

Nous savons que a - a =


Ù
å (X - X )U i i

å (X - X ) i
2

car
Ù
a =a+
å (X - X )U -U å (X i i i -X )
et å (X -X ) =0
å (X - X ) 2 i
i

Ù é (å (X i - X )U i ) 2 ù
donc V (a ) = E ê 2 2 ú
ëê (å (X i - X ) ) ûú
Ù 1
V (a ) = E (å (X i - X )U i ) 2
(å ( X i - X ) )
2 2

Comme E (å (X i - X )U i ) 2 = å (X i - X ) 2U i 2 + å i å j (X i - X )(X j - X )U iU j

Ù 1
2 2 ëå
V (a ) = é (X i - X )E (U i 2 ) + (X i - X )(X j - X )E (U iU j ) ù
(å ( X i - X ) ) û
E (U i ) = 0
V (U i ) = E [U i - E (U i ) ] = E (U i 2 ) Quantité finie.
2

E (U iU j ) = Cov (U iU j ) = 0
Car cov(U iU j ) = E éë(U i - E (U i )(U j - E (U j ) ùû avec E (U i ) = E (U j ) = 0

Ù d j2 å (X i - X ) 2
V (a ) =
(å ( X i - X ) 2 ) 2

Ù du2
et V (a ) =
(å ( X i - X ) 2

12
Ù
b) Variance de b :

Ù
é Ù ù é Ù 2ù
V (b ) = E ê(b - E (b ) ) 2 ú = E êë(b - b ) úû
ë û
Ù
Calculons ( b -b)

Ù Ù

On sait que : b =Y - a X et Y=aX+b+U et b=Y-aX-U

Ù Ù
b - b = U - X (a - a )

Ù Ù
b = b + U - X (a - a )

Ù
é 2 Ù 2 Ù ù
V (b ) = E êU - 2X U (a - a ) + X (a - a ) 2 ú
ë û
Donc
2 é Ù ù Ù
= E(U )-2X.E ê U( a -a) ú +X 2 .E( a -a) 2
ë û
Ù Ù
On rappelle que E (a - a ) 2 =V (a )
Ù 2 Ù 2 é Ù ù
Donc V (b ) = X V . (a ) + E (U ) - 2X .E ê(a - a )U ú
ë û
2
Comme les quantités V(â) et E (U ) sont connues :
Ù du 2
V (a ) =
å (X i - X )2
2
2 éU + U 2 + ... + U n ù
E (U ) = E ê 1 úû
ë n

å E (U
2
2 i ) du2
E (U )= =
n2 n2

é Ù ù Ù
Il reste à déterminer E ê(a - a )U ú pour connaître V (b ) .
ë û
On sait que :
Ù
a- a =
å (X i - X )U i
å (X i - X )2
Donc :

é Ù ù é å (X i - X )U i U ù
E ê(a - a )U ú = E ê ú
ë û êë å (X i - X )
2
úû

13
é (U U i ) ù
E (U i U ) = E ê i ú
ë n û
Ù 2 Ù du2
V (b ) = X .V (a ) +
n
Ù d 2
2 du2
V (b ) = ( u
X +
å ((X i - X )2 ) n
Ù é1 X
2
ù
V (b ) = d ê + ( 2
ú
å (X i - X )2 úû
u
n
ëê

Remarques :

En vertu de l’hypothèse 6, X tend vers une valeur finie quand n tend vers l’infini.
Ù
2
V (a )X tend vers 0 quand n tend vers l’infini.
du2 Ù
Idem pour . Donc b est un estimateur convergent
n

Si l’hypothèse d’indépendance des résidus n’est pas satisfaite (H 4 non satisfaite), la formule
Ù
a
de V(â) sous-estime celle-ci (donc surestime le T de Student pouvant nous amener à
d Ù
a
conclure hâtivement que la variable explicative Xi est satisfaisante).
« Le lecteur constate qu’il est faux de dire, comme on le fait souvent, que l’estimateur par les
moindres carres suppose une distribution normale des aléas U i . En fait, la normalité des
aléas est nécessaire seulement pour la justification de certains tests associés à la méthode des
moindres carrés et non pour des formules des estimations.

2
V DETERMINATION D’UN ESTIMATEUR SANS BIAIS DE du

V (U i ) = du2 est en général inconnue. Il est nécessaire de l’estimer pour avoir les variances
Ù
estimées de â et b .

Ù
Soit u i le résidu de l’estimation tel que :
Ù Ù Ù
u i = y i - a x i -b
Ù Ù Ù
= (a- a )x i +(b- b )+u i on montre que E( u i)=0

Ù Ù Ù
u i diffère de u i pour les termes (a - a )x i et (b- b ) qui dépendent des résidus de
l’estimation.

14
Ù Ù
Comme a ¾¾¾
prob
®a (converge en probabilité vers a) et b ¾¾¾
prob
® b alors la distribution des
Ù
ui
Ù2

converge en probabilité vers celle du u i et la valeur S 2 =


åu i
estimateur de la variance
n -2
des résidus.

n : le nombre d’observation.
n-2 : le nombre de degré de liberté.
2 : le nombre des paramètres ( a et b).

VI COEFFICIENT DE DETERMINATION : (Validation du modèle)

Le principe de validation d’un modèle consiste à s’interroger sur l’égalité de


Ù Ù
Y et Y (Y º Y)
Ù
On dit que le modèle reproduit bien la réalité si Y º Y , la différence s’explique par d’autres
variables (X).
On ne peut pas dire qu’une variable ( X i ) explique un modèle, mais la variation de ( X i )
explique la variation de Y.

Rappel :
Ù Ù
Y i =Y i + u i
Ù Ù Ù
åu i = 0 Þ å Yi =å Yi Þ Y =Y
Ù Ù Ù
Y i -Y i =Y i -Y + u i
Revenons aux Y i observés :
2
Ù Ù
é Ù Ù
ù
(3) å (Y i -Y ) 2 = å (Y i -Y ) 2 + å µ i + 2 êå (Y i -Y ) µi ú avec
ë û
Ù
å (Y -Y ) = 0 et å µi = 0
Ù
Divisons les 2 membres par n et rappelons que Y =Y
On remarque ainsi que variance empirique des Yi est égale à la somme de la variance
Ù Ù
empirique des Y i et de la variance empirique des u i .
Ù
La variance empirique de Y est souvent appelée variance expliquée par la relation linéaire.
Ù
Celle des u i est la variance résiduelle.
Il semble alors naturel de mesurer la qualité de la liaison linéaire par le rapport de la variance
Ù
empirique des Y i à celle des Y i . Ce rapport sera noté R 2 .

R 2
=
å (Y i -Y ) 2
=
variation expliquée
å (Y i -Y ) 2
variation totale

15
Exemple : si l’on obtient R 2 =0.78 cela voudrait dire que le modèle permet d’expliquer 78%
de la variabilité de Y.
R 2 est appelé coefficient de détermination (carré du coefficient de corrélation).
On souligne que la logique du carré du coefficient de corrélation ( r 2 ) étudié en statistique
descriptive n’est pas la même ici du fait qu’il y a ‘‘l’hypothèse de causalité’’ entre X et Y.
Ce sont les X qui ont des effets de causalité sur Y, d’où la prise en considération de
Ù Ù
(Y i -Y ) et pas (X i - X ) .
Ù
La logique du r en économétrie fait la différence entre Y et Y .

å (Y
2
En divisant les termes de l’égalité (3) par i -Y ) :
Ù2

1= R 2 +
åu i
å (Y i -Y ) 2
Ù2

R 2 = 1-
åu i
å (Y i -Y ) 2

Nous verrons plus en détail dans la section 2 la signification et l’interprétation du R 2 . R 2


Ù
mesure la qualité de la liaison entre les Y i observées et les Y i estimés ou calculés par le
modèle.

VII BREVE PRESENTATION DES TESTS DANS LE M.R.S. :

1°) Enoncé du problème :


Deux types de problème :
Ù Ù Ù
1er type : Y i = a log X i + b i=1...n

* Faut-il refuser l’hypothèse a=k ?


2 réponses possibles :
*il faut refuser a=0
*il ne faut pas refuser a=0
*Les hypothèses classiques sont nécessaires à la construction des tests et à la possibilité de
répondre à la question posée.

2ème type : 1er modèle : Y 1i = a1 log X 1i + b1 + U 1i i=1.....n1


2 modèle : Y 2i = a2 log X 2i + b 2 + U 2i
ème
i=1.....n 2
*Faut-il refuser a1 = a2 ?
*Faut-il refuser b1 = b2 ?
*Faut-il refuser simultanément a1 = a2 et b1 = b2 ?

Remarque : On cherche toujours à tester a = k et pas â=k, cependant on utilise â pour la


commodité des calculs du fait que ‘‘a’’ est inconnu.
L’Intérêt de tester a=0 est pour savoir la pertinence de la variable X et sa capacité à

16
expliquer Y. Cependant, on peut être amener à tester ‘‘a’’ par rapport à une quantité donnée
différente de zéro.
Exemple : soit le modèle suivant :
C r = a0 + a1D + a2 I r + a3IG + e r
C r cours de l’action d’une entreprise. D : Dividende. I r : L’investissement de cette
entreprise.
IG : L’indice générale de la bourse.
Ici, on cherchera pas forcément à tester a1 , a2 et a3 par rapport à zéro mais par rapport à une
autre quantité donnée.

2°)Construction du test :

1er étape : Ecriture du test :


Ù
On suppose que a = 0 . Cela a des conséquences sur a .
Nous avons sous les hypothèses et en appliquant les M.C.O :
Ù du2
a ® N (a , )
å (X i - X )2
Donc si a = 0 , on aura :
Ù du2
a ® N (0, )
å (X i - X ) 2
On ne peut pas construire l’intervalle de confiance car du2 est inconnue. On recourt à une
« astuce » statistique. On cherche une variable aléatoire T telle que :
* T soit fonction de â
* T suit une loi de probabilité connue
On va retenir :

Ù
a- 0
Ù
åu i

T =
å (X i - X )2
Ù
ui
å (d 2
)
u
n -2

Le numérateur est une variable normale centrée et réduite. Le dénominateur est une variable
de Khi-Deux divisée par son nombre de d.d.I (n-2). Test donc par définition une variable de
STUDENT à (n-2) d.d.I.
Ù
Dès lors, l’intervalle de confiance pour a s’écrit :
é Ù2 Ù2 ù
ê
Sous H 0 P ê0 - t a
å ui Ù
< a < 0 + ta
å ui ú = 0.95

(n - 2)å (X i - X ) 2
(n - 2)å (X i - X )
êë úû
Soit : P [ -t a < T < +t a ] = 0.95

17
2ème étape : Solution du test :
Deux cas possibles
Ù
* a appartient à l’intervalle non rejet de H 0 .
Ù
* a n’appartient pas à cet intervalle, on rejette H 0 .

Remarque et exemple :
Ù Ù
Y t = 4X t + 6 a =4 et b =6
(0.6) (0.8) (..) écarts-types estimés des estimateurs

“4” n’appartient pas à l’intervalle, on rejette l’hypothèse de nullité de a.


X explique donc Y.
Souvent, on effectue une approximation : elle consiste à rapporter l’estimateur à son écart-
type estimé. Si ce rapport est supérieur à 2, on rejette H 0 . S’il est inférieur à 2, on ne rejette
pas H 0 .

CHAPITRE II : MODELE LINEAIRE DE REGRESSION


MULTIPLE (M.R.M)

Section I- PRESENTATION :

Les modèles linéaires sont fiables à court et moyen terme car le domaine de variation des
variables est dans ce cas relativement restreint. La fiabilité de ces modèles (modèles linéaires)

sera plus ou moins réduite dans le temps et ce en fonction de la rapidité avec laquelle les
variables prises en compte subissent des transformations.
Les M.R.M. sont du type :
(1) Y t = a1X 1t + a2 X 2t + ... + a p X pt + U t
Y t : Variable endogène, aléatoire à cause de l’introduction de U t .
X 1t ...X pt Sont les observations à chaque période t des variables exogènes X 1...X p .
a1X 1t + ... + a p X Est la partie déterministe ou systématique ou explicative du modèle.
pt

Ut est la partie aléatoire du modèle.

Ù Ù
A partir des coefficients estimés a1 ... a p et en utilisant les différents tests, on peut apprécier
parmi les variables du vecteur X celles qui sont les plus significatives.

Remarque : Des hypothèses sont nécessaires pour justifier l’utilisation au MCO

Section II- HYPOTHESES DANS LE M.R.M :

Hypothèse 1 : Ccf section 1 paragraphe II.

18
Hypothèse 2 : Les Y t et les X it sont des grandeurs numériques observées sans
erreur.
E (U t ) = 0 quelque soient X it , et pour i=1,...,p .

Hypothèse 3 : Hypothèse d’homoscédasticité


U t est distribuée selon une loi indépendante de t et des X it , pour t=1,…n et i = 1,....p
V (U t ) = E (U t2 ) = du2 est une quantité finie.

Hypothèse 4 : Indépendance des erreurs Cov (Ut ,U t ' ) = 0

Hypothèse 5 : La loi de distribution de l’aléa est une loi gaussienne de moyenne


nulle et l’écart-type fini.

Hypothèse 6 : Hypothèse sur les variables exogènes:


Absence de colinéarité des variables X 1...X p -1 et E (vecteur unité).
* *
Soit le modèle suivant : I t =f(i t , PIB , C ) où I t est l’investissement public, i t est le taux
* *
d’intérêt, PIB la variation du PIB et enfin C la variation de la consommation.
* *
Ici, on a une forte colinéarité entre PIB et C dans la mesure où PIB=C+I+X-M .
On souligne l’importance de la statistique descriptive où l’étude de la covariance des variables
deux à deux est un outil pertinent pour soulever ce problème.

X(n,p) est de rang p (avec n>p) cela veut dire que (X ' X ) -1 existe.
Avec n : ligne, p : colonne.
Ù
Cette hypothèse est utile pour l’étude des propriétés de a .
Quand n tend vers l’infini, (X ' X ) -1 reste non singulière.

Hypothèse 7 : On n’introduit pas de restriction sur les estimateurs. Ils peuvent être positifs,
négatifs ou nuls.

RECAPITULONS :

*X pt = 1 pour tout t permet d’introduire une constante dans le M.R.M . L’exclusion d’une
constante dans un MLRM donne souvent un R 2 incorrect.
*Les p vecteurs X 1...X p -1 et E ne sont pas colinéaires.
Ces vecteurs forment une variété linéaire non dégénérée à p dimensions dans R n qu’on
appellera plan de régression.
La matrice X (n , p ) = (X 1t , X 2t ,..., X p -1t , E ) pour t variant de 1 à n est de rang p.

*Ecriture matricielle :
s’écrit pour chaque t et pour t = 1…n
Y t = X .a + U t (2)
Enfin, on aura :
Y = X .a + U

19
Ù Ù Ù Ù
Y = X a et U =Y- Y (3)
Ù Ù
D’où U =Y-X.a (4)
Ù Ù
Avec Y = X a

Section III : DETERMINATION ET PROPRIETES DES


ESTIMATEURS :

1°) calcul de â par les M.C.O :

Ù
La méthode consiste à chercher les paramètres a i tels que :

n Ù
å (u t )2 soit minimum.
i =1
Ù
Revenons à (4), le vecteur U des écarts est orthogonal au plan de régression. Les équations
normales s’écrivent alors :
Ù Ù Ù Ù Ù
X 1' U = X 2' U = ... = X j' U = ... = X '
p -1 U = E 'U = 0
Elles expriment l’orthogonalité de û et des p vecteurs lignes X 1' , X 2' ,..., X '
p -1 et E '
Ces équations peuvent s’écrire :
Ù
X '.U = 0 ® le vecteur de la matrice X'.
X'= transposé de la matrice X.
En tenant compte de (4), on aura :
Ù
X '.(Y - X a ) = 0
Ù
(X '.Y ) - (X ' X . a ) = 0
Ù
X '.Y = X '.X a
Ù
(X ' X ) -1 X 'Y = (X ' X ) -1 (X ' X ) a
Ù
a = (X ' X ) -1.X 'Y

2°) Propriétés de â :

Nous allons démontrer que par les MCO, â est l’estimateur efficace dans l’ensemble des
estimateurs linéaires et sans biais de a. â sera dit BLUE (Best linear unbiased estimators)

Ù
Calcul de E (a ) :
Ù
a = (X ' X ) -1 X 'Y
or Y = X a + U
Donc

20
Ù
a = (X ' X ) -1 X '(X a + U )
Ù
a = (X ' X ) -1 (X ' X a + X 'U )
Ù
a = (X ' X ) -1 (X ' X ).a + (X ' X ).X 'U
Ù
a = a + (X ' X ) -1 X 'U
Ù
E (a ) = E éëa + (X ' X ) -1 X 'U ùû
Ù
E (a ) = E (a ) + (X ' X ) -1 X ' E (U ) ; E(U) étant egal à 0
Ù
E (a ) = a donc a est un estimateur sans biais de a.

Ù
*Calcul de V (a ) :
Ù
é Ù Ù
ù
V (a ) = E ê(a - a ) (a - a )'ú
ë ( p ´1) (1´ p ) û

Ù
Or (a - a ) = (X ' X ) -1 X 'U
Ù
où (a - a ) ' = U ' X (X ' X ) -1 , car X'X est symétrique
Ù Ù
donc ( a -a)( a -a)'=(X'X)-1X'.UU'.X(X'X)-1
Ù
V( a )=E éë(X'X)-1.X'.UU'.X.(X'X)-1 ùû

Ù
Le seul terme aléatoire dans l’expression de V (a ) est UU’
Ù
donc : V (a ) = (X ' X )X .E (UU ').X (X ' X )
on rappelle H3 V (U t ) = du2
Ù
Enfin V (a ) = (X ' X ) -1 X du2 I n X (X ' X ) -1
= du2 (X ' X ) -1 X '.I n X (X ' X ) -1
Ù
d’où V (a ) = du2 (X ' X ) -1 (6)

On montre qu’une condition nécessaire et suffisante pour que â soit un estimateur convergent
de a est que les vecteurs variables exogènes ne tendent pas à être colinéaires quand n tend vers
l’infini.
Autrement dit H6 reste valable quand n tend vers l’infini.

3°) â est BLUE

â est efficace dans la classe des estimateurs de a sans biais et linéaires en Y. Ce théorème de
Gauss Markov justifie l’utilisation des M.C.O pour effectuer une estimation.
*
1- on va définir un estimateur linéaire a sans biais de a et à variance minimale
*
2- on va montrer que a est en fait équivalent à â.

Démonstration
21
*
1- soit a un estimateur de a linéaire en Y
*
a =a + LY .
( p ´1) (p ´1) (n ´1)
L(p,n) matrice quelconque
*
• a doit être sans biais
* Ù
E( a ) = E (a ) + L .E (Y )
= a+L.E(Xa+U)
= a+L.E(Xa)
L.X=0
*
a ne sera sans biais que si L.X=0

*
• Matrice des variances co-variances de a

*
é * ù
V (a ) = E ê(a - a )(a - a ) 'ú
ë û
* Ù
a - a = a + LY - a
Ù
Or = a -a+L.(Xa+U)
Ù
= a -a+L.Xa+LU
or L.Xa=0
* Ù
donc a -a= a -a+LU

Remplaçons â par sa valeur


Ù
a =a+(X'X)-1X'U
*

donc a -a=a+(X'X) X 'U + L .U


-1

= (X'X)-1X'U+LU
*
enfin V( a )= éë E(X'X)-1X'U+LU ùû éë(X'X) -1X'U+LU ùû '
On rappelle que E (UU ') = du2
*
d’où V (a ) = du2 éë(X'X)-1X'+L ùû éë X(X'X) -1 + L 'ùû
*
Comme L .X = 0 car a est sans biais
Alors X ' L ' = 0 et
*
V (a ) = du2 (X ' X ) -1 + du2 L ' L
* Ù
d’où V (a ) =V (a ) + du2 L ' L
et finalement,sauf si L = 0 , LL ' est une matrice semi-définie positive en d’autres termes
* Ù
V (a ) >V (a ) .
â est un estimateur convergent.

22
On montre la convergence de â en moyenne quadratique et cela implique sa convergence en
probabilité.

Rappel :

Soit une suite ordonnée de variables aléatoires X 1 , X 2 ,..., X p


*
La variable aléatoire X p converge en moyenne quadratique vers le nombre certain X si
*
E(X p ) tend vers X et si V(X p ) tend vers 0 lorsque n tend vers l’infini.
Si a est une matrice symétrique et X est un vecteur de dimension n, l’expression X'AX qui est
un scalaire est dite forme quadratique en X, si X'AX>0 quelque soit X ¹ 0 ; la forme
quadratique et sa matrice sont dites semi définies positives.
Pour que A(n,n) soit définie positive, la condition nécessaire et suffisante est que ses valeurs
propres hi soient toutes strictement positives.

Remarques : La taille de l’échantillon n’intervient pas dans le calcul de â donc de


Ù
E( a )=a "n Lorsque n tend vers l’infini (1° condition)
Ù
Or V (a ) = du2 (X ' X ) -1
-1
éI ù
or n (X ' X ) -1 = ê X ' X ú
ën û
-1
éI ù -1 -1
êë n X ' X úû tend vers Q quand n tend vers l’infini ( Q quantité finie)
Q-1
tend vers 0 quand n tend vers l’infini
n
Ù
Donc V (a ) tend vers 0 quand n tend vers l’infini

4°) Détermination de S2 estimateur de du2

Ù
1-Expression de u :

Ù Ù
On sait que Y=Xa+u et Y =X a
Ù Ù Ù Ù
Y =Y + u ou u =Y -Y (7)
Ù Ù
d’ou u = Xa+U-X a
=U+Xa-X éëa+(X'X)-1X 'U ùû
=U-X(X'X)-1X'U (8)
= éë I n -X(X'X)-1X 'ùû .U
Ù
µ = M .U

avec M=I n -X(X'X)-1X ' M est de format n.n


M=M' signifie que M est une matrice symétrique

23
On dit que A est idempotente si A 2 =A, A n =A "n or M 2 =M de M est idempotente
Ù2
2-Expression de åu t
Ù2 Ù Ù
å u t = u 'u
Ù Ù
d’après (8) u 'u =U'M'MU=U'MU
soit u ij l’élément de la matrice M situé à l’intersection de la ligne i et de la colonne j
Ù2
åu t =åu ijUi2 +2å i å j u ijU iU j
et E éë å (U t ) 2 ùû = trace M
æ Ù2 ö
car on a E ç å u i ÷ = 0 quelque soit i et E(U i U j )=E(U i )E(U j )=0 avec i ¹ j
è ø

3-Trace de M :

trM= trI n -X(X'X)-1X'


= trI n -tr éë X(X'X)-1X'ùû avec trI n =n
= n-tr éë X(X'X)-1X'ùû
tr éë X(X'X)-1X'ùû = tr éë X'X(X'X)-1 ùû
or = trI p
=p

donc trM=n-p
Ù Ù é Ù2 ù
on avait E( u 'u ) = E êd (å u t ) ú = du2 (n - p )
ë û
Ù
u
et E ( t ) = dt2trM = du2 (n - p )
n-p
Ù2

enfin S 2 =
åu t
n-p

s 2 est un estimateur sans biais de du2


p est le nombre de paramètres à estimer
n est le nombre d’observations

SECTION IV : TESTS DANS LE MODELE LINEAIRE DE


REGRESSION MULTIPLE
Pour apprécier ou valider un modèle, on dispose d’indicateurs fournis par l’économétrie. Ils
permettent de juger la qualité du modèle dans son ensemble, des paramètres obtenus par la
régression et de chacune des variables explicatives retenues. Ils permettent également de
tester certaines hypothèses économiques.

24
I . LE COEFFICIENT DE CORRELATION MULTIPLE

1°) Formulation :

Soit un modèle simple M1 de la forme : Y t = b + U t


Soit un modèle plus sophistiqué de la forme :
Y t = a1 + X 1t + a2 X 2t + ... + a p X pt + U t
Ù
Pour M 1:Y = b M1 rend compte de la réalité avec une incertitude mesurée par (Y t -Y t )
Ù n
ou (Yt - b ) . Si l’on considère l’ensemble des observations on aura å (Y
t=1
t -Y ) 2 cela revient

à considérer la variation totale du phénomène Y.


Pour M2 : on a pour une observation donnée
Y t = X t a +U t .
Ù Ù
Y t =Xta
L’imprécision ou l’incertitude au niveau de M2 sera mesurée par
n Ù
å (Y
t=1
t - X t a )2

Il s’agit ici de distinguer entre les deus modèles M1 et M2


Le coefficient de détermination R 2 d’un modèle représente le carré du coefficient de
corrélation multiple R ; il mesure la qualité de l’ajustement des Y t par la méthode des M.C.O.
Ici, il mesure le gain relatif de précision quand on utilise M2 au lieu de M1
n n Ù
å (Y t -Y )2 - å (Y t - X t a )2
R2 = t=1
n
t=1

å (Y
t=1
t -Y ) 2

2°) Interprétation :
n
Au numérateur å (Y
t=1
t -Y ) 2 est l’imprécision de M1 (la variance totale)
n Ù
å (Y
t=1
t - X t a ) 2 la mesure de l’imprécision de M2 (variance résiduelle). Plus cette dernière

sera élevée, plus elle se rapproche de la variance totale ........d’où l’inutilité d’adopter M2
plutôt que M1 On remarque que 0<R<1.
Comme R < 1 alors R2 est proche de 1 cela signifie que R est encore plus proche de un, R2
proche de 1 n’est pas une preuve de causalité totale. De même R 2 proche de 0 ne signifie pas
absence de lien entre la variable expliquée et variables explicatives, mais peut être la forme de
liaison n’est pas vérifiée.
Bref, il faut être prudent durant l’interprétation de tout résultat.

II- Tests d’hypothèses dans le M.R.M :

A partir de Y = X a + U (1), nous avons établi :

25
Ù
a = (X ' X ) -1 X 'Y = a + (X ' X ) -1 X 'U
de même si on prend P = X (X ' X ) -1 X ' , on aura
Ù
Y = P .Y (2)
Ù
et u = M .U (3) avec M=I n -P
Sous l’hypothèse de normalité de la distribution des U (aléas)

Ù Ù Ù
On déduit que Y , a , Y et u suivent des lois normales dont on peut déterminer les
paramètres.

1°) Test de l’hypothèse a = 0 :

a- Construction de test :

Dire que a = 0 , c’est dire que les variables retenues ne sont pas explicatives donc si H 0 est
vérifiée c’est-à-dire si a = 0 , on peut écrire :

Ù Ù
Y = P .Y et u = M .U
Ù Ù
u 'u suit une loi khi-deux (n-p)
Ù Ù
Si a = 0 Y 'Y suit la loi khi-deux p. Ces deux khi-deux sont indépendants en probabilité. Or,
on sait que le rapport de 2 khi-deux est un F de FISHER. Donc, pour établir le test de a = 0 ,
on construit la variable F qui suit une loi de Fisher.

Ù Ù
Y 'Y Ù Ù
p Y 'Y n-p
F= Ù Ù = ´ Ù Ù tend vers un Fp;n-p d.d.l
u 'u p u 'u
n-p
.
b- Solution du Test :

On compare le F théorique càd le F lu sur la table de distribution de Fisher et le F calculé à


partir de nos observations

2 cas peuvent se présenter :


* F calculé > F théorique ; on rejette H 0 . Cela veut dire que les variables retenues sont
explicatives.
* F calculé < F théorique ; non rejet de H 0 .

Exemple : Soit un modèle à 5 variables exogènes ( y compris la constante) et suppose qu’il a


été estimé sur 25 observations. Supposons enfin que le résultat obtenu est :
Ù Ù
Y ' Y 20
´ Ù Ù = 3.0
5 u 'u
La valeur lue sur la table du F de Fisher pour 5 et 20 d.d.l

26
Et 2,71 au seuil de 5% et 4,10 au seuil de 1%
Nous allons rejeter H 0 au seuil de 5% ( car 3>2,71) mais on ne pourra pas la rejeter au seuil
de 1% ( car 3<4,10)..

Remarque : Ce qui importe, c’est de tester la portée explicative l’influence des « vraies
variables exogènes » . Ce qu’il faut tester c’est la nullité du vecteur formé par les (p-1)
premières composantes de a. On a toujours :
Ù Ù
µ' µ khi deux à (n-p) d.d.I si les (p-1) premières sont nulles
Ù Ù
Y'Y khi deux à p-1 ddl

Le rapport des 2khi deux sera donc un Fp-1;n-p

Exemple : Au Maroc les importations sont fonction de la consommation, de la FBCF et des


exportations.
M = f (C , FBCF , X )
log M t = 0.469 log(C t ) + 0.034 log(FBCFt ) + 0.471log(X t ) - 0.993
n=14 ; R 2 =0.82
Fc = 15.649
n - p = 10 p-1=3 Ft =6.55

donc on rejette H 0 : les variables exogènes peuvent être considérées comme explicatives dans
l’ensemble.

c- Généralisation :

Soient 2 modèles M1 et M2 tels que :


* * * * *
M1: Y= X a + U avec X (n,q) , a (q,1)
*
Y ( n ,1) et U (n,1) .
M 2 : Y=Xa+U avec X (n,p) , a (p,1) , Y(n,1) et U (n,1) .

On pose n>q>p
Faut-il refuser H 0 qui considère M 2 comme meilleur ; cela veut dire : dans M1 les ( q-p )
variables ne sont-elles pas en trop ?
Pour répondre à cette question, on définit un F qui suit une loi de probabilité donnée ;

Ù Ù
u =Y - X a
Ù* * Ù*
u =Y - X a
Ù Ù Ù* Ù*
u ' u - u 'u Ù Ù Ù* Ù*
q-p u ' u - u 'u n - p
F= = ´ * * .
Ù* Ù* q-p Ù Ù
u 'u u 'u
n-p

27
Ù Ù Ù* Ù*
u 'u - u 'u n-p
F= ´
Ù* Ù* q-p
u 'u

Ce rapport suit une loi de FISHER à ( q-p ) et ( n - p ) d.d.l


Ensuite, on compare le F calculé ( Fc ) et le F théorique ( Ft ). Si Fc >Ft , on rejette H 0 .

2°) Test Student : Significativité de chaque composante du vecteur a :

Ce test permet en fait d’apprécier la portée explicative de chaque variable exogène retenue.
Soit le modèle : Y = X a + U

Supposons que l’on s’intéresse à un coefficient déterminé a k du modèle. Nous avons


Ù Ù Ù
démontré que E (a ) = a ou encore que E( a k )=a k ; nous avons montré que V( a )=du2 (X'X)-1 .

Soit Vk le Kième terme de la diagonale principale de (X'X)-1 , la variance d’un coefficient


quelconque de régression s’écrit
Ù Ù
V( a k ) =du2 Vk et a k suit une loi normale de moyenne a k et d’écart-type du2 Vk
Ù
a k -a k
La quantité P= ® N (0,1)
du Vk

Mais on ne connaît pas la variance de U . II convient de l’estimer. nous savons que :


Ù2

S2 =
åu t est un estimateur sans biais de la variance de u
n-p

Ù Ù
Ù Ù u 'u
En outre, u 'u ® d c u
2 2
n-p donc suit un Khi Deux à (n-p) ddI .
V (U )

Ù Ù
u 'u
Comme la distribution de est indépendante de celle de L on a par définition : la
V (U )
variable

Ù
a k -a k
Ù
du Vk a k -a k
T= = suit une loi de STUDENT à (n-p) ddI
Ù Ù Ù Ù
u 'u Vk .u 'u
d n-p n-p

Ù Ù
Ù
Vk .u 'u
On remarque que la quantité est une estimation De l’écart-type de a k
n-p

28
Lorsque on teste l’hypothèse a k =0 , cela revient :
Ù
à partir du fait que a k ® N(a k ,d Vk )
à poser a k =0 et à déterminer une variable de STUDENT T (dans la formule ci-dessus cela
revient à remplacer a k par 0).

Solution du test :

On écrit que P [ -t<T<t ] =0.95


é Ù
ù
a
P ê-t a < Ù <+t a ú =0.95
k

ê d ak ú
ë û
é Ù Ù Ù
ù
ou encore P ê-t a .d ak < a k <+t a .d ak ú =0.95
ë û
2 cas possibles :

Ù
é Ù Ù
ù
* a k appartient à l’intervalle ê-ta .d ak , +t a .d ak ú alors on ne refuse pas H0
ë û
Ù
* a k n’appartient pas à cet intervalle alors on refuse H0 .

Remarque :

Nous avons utilisé le constat que la variable de Student T à (n-p) ddI converge en loi vers une
loi normale centrée réduite quand (n-p) augmente. On peut sans commettre d’erreur notable
utiliser l’approximation normale quand l’échantillon est grand.

T de Student ddI 95%

15 2.131
20 2.086
30 2.042
40 2.020
60 2.000

La table de la loi normale donne une valeur de 1.96 ; donc, en faisant une approximation,
l’hypothèse de nullité d’un coefficient (ou son égalité à une quantité donnée) sera rejetée pour
un T > 2 .

Exemple :
M t = e + aI t + bC t +U t
M t = 15.8 + 3.07I t + 1.92C t
pour n = 22, on a
(10.53) (0.81) (1.25)

29
15.8
* T = suit une loi de Student à 19 ddI,
10.53
le t lu sur la table à 95% est 2.093. T appartient à [-22.093,2.093] donc non rejet de H0 .
3.07
* T = > 2 donc le coefficient est différent de 0 l’investissement
0.81
explique le niveau des importations.

1.92
* T = < 2 donc selon l’échantillon, la consommation n’explique
1.25
pas le niveau des importations.

3°) Test de DURBIN & WATSON : Problème de l’autocorrélation des


résidus

Il y a autocorrélation des résidus quand le modèle est mal spécifié. On peut préciser que le
risque d’autocorrélation des résidus augmente surtout dans les modèles estimés sur des séries
chronologique. Elle sera d’ailleurs d’autant plus grande que la périodicité est courte.

Dans le cas de l’omission d’une variable significative ou l’inclusion d’une variable non
significative, les résidus ne sont plus distribués de façon aléatoire autour du Y mais reflètent
le comportement des variables omis ou inclus.

Lorsqu’on a autocorrélation des aléas, on a tendance à sous-estimer les écart-types des


coefficients ; en d’autres termes on surestime le T de Student. Dès lors, on risque de conclure
« hâtivement » à la pertinence d’une variable proposée et testée.
Donc, les causes d’un mauvais DW sont de deux genres, économique et statistique.
Pour s’assurer du risque d’autocorrélation des erreurs, on procède au test de Durbin &
Watson.

A - Principe d’estimation :

Il existe plusieurs procédures d’estimation. On suppose par exemple que les résidus Ut sont
corrélés selon un schéma autorégressif de 1er ordre. Soit donc :

U t = fU t -1 + e t avec f ® N (0,1) et E(e t , e t ' ) = 0 "t ¹ t'


On aura donc U t -1 = fU t - 2 + e t -1
d’où : U t = f 2U t - 2 + fe t -1 + e t
enfin U t = å f k et -k

On démontre que dans le cas d’autocorrélation des erreurs, l’estimateur â est sans biais et il
reste convergent.
Mais, cela ne signifie pas qu’il a la variance minimum. La variance étant forte, l’estimation
peut s’éloigner de son espérance mathématique avec une forte probabilité.
Reprenons le modèle initial :
Yt =a1X1t +a 2 X 2t +...+a p X pt +U t (1)
Ù Ù Ù
Soit a obtenu par les MCO et Y =X a

30
Ù Ù Ù
Pour une période, u t =Y t -Y t Ces résidus dépendent aussi bien de la suite des erreurs u t
mais également de la suite des X t .

Ù
Considérons la variable aléatoire d définie comme suit :

Ù Ù
Ù
d=
å (u - u t t -1 )2
(2)
Ù2
åu t

Ù Ù Ù Ù Ù Ù
d est fonction de u t donc d = f (u t ) = f (Y t -Y t ) . Or, u t ® N (0, du2 ) donc la limite
Ù
en probabilité de d varie entre 2 valeurs 0 et 4.

Ù Ù
On démontre que d ® 2(1 - f )
En effet, de la formule (2), on peut déduire :
Ù Ù
Ù
d = 2-2
å (u u t t -1 )
Ù

åu t
2

Cette statistique de D.W est utilisé pour donner la nature de la corrélation des résidus.
* Quand il y a corrélation positive parfaite,
Ù Ù
f = 1 ; U t = fU t -1 + e t ® d = 0
Ù Ù
* Quand f = -1 ® d = 4 , il y a autocorrélation négative parfaite.
Ù Ù
* Il y a indépendance lorsque f = 0 dans ce cas d = 2

Tableau de décisions :

Ù
d =0 di d2 4-d 2 4-d i 4
----------------------------------------------------------------------------------------------------
! ! ! ! ! !
! AUTOCORR ! DOUTE ! INDEPENDACE ! DOUTE !AUTOCOR !
!ELATION ! ! ! !RELATION !
POSITIVE ! ! ! ! NEGATIVE !

Ù
Les programmes de calcul donnent la valeur de d .

B) Utilisation de la table de DURBIN & WASTON :

Nous allons tester l’hypothèse H 0 : f = 0 contre l’hypothèse H1: f ¹ 0 à un seuil de


signification a .
Durbin & Watson ont déterminé 2 valeurs d1 et d2 fonction de n et de p.
Ù
Donc on calcule d à partir de sa formule et donner résultats de l’estimation ; ensuite, nous
serons face à plusieurs éventualités :

31
Ù
* d < d1 on rejette H0
Ù
* d1 < d <d2 doute
Ù
d >d2 non rejet H0 , absence d’autocorrélation des résidus.

n p=2 p=3 p=4


d1 d2 d1 d2 d1 d2
----------------------------------------------------------------------------------------------------
15 1.08 1.36 0.95 1.54 0.82 1.75
20 1.20 1.41 1.10 1.54 1.00 1.68
30 1.35 1.49 1.28 1.57 1.21 1.65
50 1.50 1.59 1.46 1.63 1.42 1.67
100 1.65 1.69 1.63 1.72 1.61 1.74

Remarques :

* La statistique de DW appliquée à un modèle contenant des variables endogènes retardées est


biaisée vers 2 ce qui laisserait supposer que les erreurs sont moins souvent corrélées dans un
processus autorégressif que dans un processus ordinaire.

* Dans le cas d’autocorrélation des aléas, il y a lieu d’opérer sur le modèle initial la
transformation de COCHRANE ORCUTT.

Exemple :

Log Mt = 0.469 Log Ct + 0.034 Log FBCFt + 0.471 Log Xt - 0.993


^DW = 1.414 n = 15 et p = 4 d1=0.82 et
d2=1.75
donc 0.82 < ^DW < 1.75 il y a doute

32
Bibliographie
Ø Ouvrages
« Méthodes statistiques de l’économétrie » Edmond MALINVAUD - Dunod /
« Introduction à l’économétrie » C. Labrousse – Dunod /
« Méthodes économétriques pour l’analyse économique et l’aide à la
décision » Kamal HADADJ – Walada / 1994
« Introduction à l’économétrie » Dormont B – Montchrestien (1999)
« Métodes Econométriques », Tome 1 et 2, J.Johnston, Economica, 1985
« Econométrie », Jean-François Brun, Jean Louis Combes et Claudio Araujo,
Bréal, 2004
« The theory and practice of econometrics » édition Wiley 1985
Exercices Pedagogiques de statistiques et économetrie » Claude Mouchot,
Economice 1979
« Limted dependent and qualitative varaibles in econometrics » G.S.Madala
, Cambrigde university Press, 1977.
« A Guide to Econometrics » Peter Kenned , Third Edition , 1992
« Econométrie appliquée », sous la direction de Claude Montmarquette,
Economica, 1997

Ø Revues

• Problèmes économiques
• Revue d’Économie du développement
• Revue d’économie politique
• Economie et prévision
• American Economic Review (AER)
• Journal of Political Economy
• World Bank Economic Review

Ø Journaux
§ Le Monde ( du Mardi)
§ Figaro ( Samedi/ les pages saumon)

33

Vous aimerez peut-être aussi