D’IVOIRE
COURS D’ECONOMETRIE
LICENCE 3 ECONOMIE
Chapitre I Introduction
1.1 Le domaine de l’analyse économique
1.2 La théorie économique et l’économétrie
1.3 Définition, objectifs et nécessité de l’économétrie
1.4 Méthodologie de la recherche économétrique
1.5 La construction de modèle économique
1.6 Le terme de l’erreur
1.7 Définitions et concepts utilisés en économétrie
1.8 Notions simples de statistique
Bibliographie
J. Johnston (1985) « Méthodes économétriques » traduit et présenté par Bernard
GUERRIEN et F. VERGARA. Economica, 3ème édition.
Régis BOURBONNAIS (2007) «Econométrie, Manuel et exercices corrigés » Dunod,
6ème édition
2
Chapitre I Introduction
L’économie est une science sociale, elle étudie le problème des choix dans une société
d’un point de vue scientifique, à partir d’une exploration systématique de ce problème.
Cette exploration systématique passe aussi bien par la formulation de théorie que par
l’examen de données empiriques. Une théorie est fondée sur une série d’hypothèses et
de conclusion découlant de ces hypothèses. Les théories sont des exercices logiques :
si les hypothèses sont correctes, alors les résultats se vérifient nécessairement.
La science économique a défini des théories pour formaliser les relations entre les
variables dans leurs interrelations. Ainsi par exemples : La théorie de la production
nous enseigne entre autres que la production (Y) d’un bien ou service est fonction d’un
ensemble de facteurs de production entre autres le capital (K) et le travail (L) :
Y=f(K,L) ; La théorie du consommateur nous instruit quant à elle que la demande
d’un bien X par un consommateur est fonction du revenu de ce consommateur R, du
prix du bien Px et du prix des autres biens Py : Q = f(R, Px, Py…), etc.
Le rôle de l’économétrie est de tester les propositions théoriques qui fondent ces
relations entre variables, d’obtenir des estimations numériques des coefficients de
ces relations, de faire des prévisions par rapport à leurs valeurs futures et de
faire des recommandations pertinentes à même d’aider à la prise de décision.
L’économie comme nous l’avons souligné plus haut est une science sociale. Son objet
d’étude est la société, et le comportement des institutions et des ménages qui la
composent. La théorie économique essaie d’expliquer les relations entre variables
économiques et utilise les informations obtenues dans un cadre théorique général pour
expliquer l’affectation des ressources, la production et la décision de répartition au
sein d’un système qui doit fonctionner dans un contexte de rareté.
L’économétrie essaie quant à elle, à partir de l’analyse statistique de données limitées,
de tirer des conclusions relatives au monde réel. Ainsi, la théorie économique tout
comme l’économétrie essaye de produire une série d’information pour améliorer la
prise de décision.
a. Définition
Au sens littéral, l’économétrie signifie « mesure de l’économie ». Bien que la mesure
soit une part importante de l’économétrie, le domaine de cette discipline est plus
vaste ; les citations suivantes en témoignent :
L’économétrie consiste à appliquer les mathématiques statistiques aux données
économiques pour fournir une base empirique aux modèles construits par
l’économie mathématique et obtenir des résultats mesurés.
3
L’économétrie peut être définie comme l’application de méthodes statistique et
mathématique à l’analyse de statistiques économiques en vue de donner un
contenu empirique aux théories économiques et de les vérifier ou de les réfuter.
b. Objectifs de l’économétrie
L’économétrie à trois objectifs essentiels :
1. l’analyse, c'est-à-dire le test de la théorie ;
2. l’aide à la prise de décision, c'est-à-dire fournir des estimateurs numériques aux
coefficients des relations économiques ;
3. la prévision, les estimations numériques des coefficients sont utilisées dans
l’optique de donner une prévision des valeurs futures.
Afin d’atteindre les trois objectifs cités plus haut, l’économètre doit de façon
systématique conduire sa recherche en adoptant une approche logique qui comprend
cinq phases :
4
Par exemple : le modèle économique de l’offre et de la demande cherche
traditionnellement à expliquer la relation prix-quantité sur un marché particulier. Ce
modèle comprendra trois (3) équations :
a. l’équation de la demande
QD 0 1 P1 2Yd (1 - 1)
b. l’équation de l’offre
QD 0 1 P1 2 R2 (1 - 2)
c. l’équation d’équilibre de marché
QD QO (1 - 3)
Avec QD = Quantité de biens demandée ; QO = Quantité de biens offerte
P1 = Prix du bien ; R2 = Prix moyen des facteurs ; Yd = Revenu disponible
Les modèles plus compliqués peuvent tenter d’expliquer le comportement de plusieurs
variables. Disons cependant que les modèles économiques qui relèvent de la
microéconomie ou de la macroéconomie qui s’adressent à l’économie d’un pays ou à
une industrie, à une firme ou à un marché particulier ont des caractéristiques en
commun.
En effet, les modèles sont d’abord formulés sur la base de comportement des variables
économiques et sont déterminées par l’opération simultanée d’un certain nombre
d’opérations économiques. Ensuite, celui qui construit le modèle part d’un principe,
même si les modèles sont une signification du monde réel des plus complexes, ils
retiendront des aspects importants du secteur économique ou du système économique
étudié. Enfin, le constructeur du modèle a la conviction que les informations et le
degré de compréhension fournit par les modèles permettront de prédire le
comportement du système dans le futur et probablement de contrôler le comportement
afin d’améliorer le fonctionnement du système économique.
Avant de traduire les propositions que nous venons de faire en langage mathématique,
il est essentielle de résoudre le problème de spécification, la nature des relations entre
les variables endogènes que sont la consommation, l’investissement et le revenu
national d’une part et les variables exogènes tels que l’impôt, les dépenses
gouvernementales et le taux d’intérêt d’autre part. Ces relations devront être linéaires
ou non linéaires ? Si elles sont non linéaires, devront elles avoir une forme quadratique
ou même avoir une forme de degré ≥ 2. Par ailleurs, on devrait se poser la question de
5
savoir si cet investissement est aussi fonction des périodes antérieures T-2 ; T-3 et les
profits antérieurs ou anticipés. Pour simplifier notre modèle, nous formulerons de la
façon suivante :
Ct 0 1 (Yt Tt ) (1- 4) Equation de comportement
I t 1Yt 1 2 Rt (1- 5) Equation de comportement
Yt Ct I t Gt (1- 6)
Avec les restrictions 0<α1<1 ; β1>0 ; β2<0
Et Ct = Consommation de la période t
It = Investissement de la période t
Yt = Revenu national de la période t
Gt = Dépenses gouvernementales de la période t
Tt = Impôts sur le revenu de la période t
Rt = Taux d’intérêt de la période t
Notre modèle ainsi formulé comprend deux équations de comportement et une identité
qui est l’équation (1 – 6).
Les variables Ct, It et Gt sont définies comme des variables endogènes de la période t.
Quant aux variables Rt, Yt, Tt elles sont classifiées comme variables exogènes de la
période t. Yt-1 qui était une variable endogène, l’année antérieure à l’année t est
considérée comme variable exogène de la période t.
Les équations (1-4), (1-5), (1-6) présentent le modèle sous sa forme structurelle. Quant
à la forme réduite, elle présentera le modèle de sorte que les variables endogènes
soient uniquement fonction des variables aux valeurs prédéterminées c'est-à-dire les
variables exogènes.
La forme réduite de notre modèle s’obtiendra en substituant les équations (1-5), (1-6)
dans l’équation (1-4) et nous obtiendrons :
Ct 0 1 (Ct 1Yt 1 2 Rt Gt Tt )
Ct 0 1Ct 11Yt 1 1 2 Rt 1Gt 1Tt
0
Ct 1 1 Yt 1 1 2 Rt 1 Gt 1 Tt (1-7)
1 1 1 1 1 1 1 1 1 1
L’équation (1-7) représente la forme réduite de la fonction de consommation avec
0<α1<1, quant à la fonction d’investissement, elle demeure inchangée :
I t 1Yt 1 2 Rt (1-8) parce qu’elle est déjà sous la forme réduite.
En effet, l’équation de l’investissement est uniquement exprimée en fonction des
variables exogènes à la période t. Pour obtenir la forme réduite de l’équation (1-6),
nous allons écrire que :
Yt 0 1 1 Yt 1 1 2 Rt 1 Gt 1 Tt 1Yt 1 2 Rt Gt
1 1 1 1 1 1 1 1 1 1
I t (18)
Ct (1 7)
0 G
Yt 1 Yt 1 2 Rt t 1 Tt (1-9)
1 1 1 1 1 1 1 1 1 1
(1-9) représente la forme réduite de la fonction du revenu national.
Le système d’équation (1-7), (1-8) et (1-9) représente la forme réduite de notre modèle
macroéconomique initial représenté par les équations (1-4), (1-5) et (1-6).
6
1.6 Le terme de l’erreur (variable résiduelle)
Pour mieux fixer les idées, supposons que nous avons des données en provenance
d’une enquête sur les ménages, Yd est le revenu disponible et Ct leurs dépenses de
consommation. Il est clair que la dépense d’un ménage dépend, en plus de son revenu,
de toute une série d’autres facteurs, tels sa taille, sa composition. Supposons donc que
nous étudions la relation entre Ct et Ydt pour les ménages ayant « même taille et même
composition ». Malgré cela il ne serait pas réaliste de s’attendre à ce que tous les
ménages avec un revenu Ydt aient la consommation (α0+ α1Ydt).
Une deuxième raison pour ajouter le terme aléatoire à notre équation est qu’il y a peut
être un élément de hasard, fondamental et imprévisible, dans le comportement humain.
Ce sont là deux raisons suffisantes pour introduire une variable aléatoire, leurs effets
conjugués se répercutant au niveau de sa variance. La variable εt est souvent appelée
élément de perturbation ou erreur de l’équation. On ne peut pas prédire la valeur de εt
pour une quelconque observation, mais on peut proposer des hypothèses concernant
les caractéristiques principales de sa loi de probabilité.
a. Variable aléatoire
Une variable aléatoire est une variable dont la valeur est inconnue jusqu’à ce quelle
fasse l’objet d’une observation. La valeur d’une variable aléatoire résulte d’une
expérimentation.
7
b. Variables aléatoires discrètes et continues
- Une variable aléatoire est dite discrète si elle ne peut prendre qu’un nombre
fini de valeur que l’on peut compter en utilisant des nombres entiers. Exemple :
le nombre de fille dans un ménage : 1, 2, 3, …
- Une variable est dite continue si elle peut prendre toute valeur réelle dans au
moins un intervalle des nombres réels.
e. Equation technique : c’est une expression qui montre comment les variables
sont combinées pour donner naissance à une autre variable économique.
Exemple : fonction de production Q AX 1b1 X 2b2 où X1 et X 2 sont des inputs
qui sont combinés pour donner Q qui est l’output ou le produit.
f. Variable économique
C’est une grandeur économique qui peut prendre des valeurs différentes d’une
observation à une autre pour un problème économique donné. La variable économique
peut être systématique, aléatoire, endogène ou exogène.
- La variable économique sera dite systématique si sa valeur peut être connue
avec certitude selon des relations spécifiques
- Elle sera dite aléatoire lorsque la détermination de sa valeur ne découle pas
d’un modèle prévisible avec certitude.
- Une variable économique est endogène lorsque sa valeur est déterminée par la
structure économique considérée dans l’étude.
- Une variable économique exogène est celle dont la valeur économique est
déterminée et connue à l’avance.
g. une série chronologique : une série chronologique est une série statistique
dans laquelle les valeurs du caractère sont fonction du temps. Une série
chronologique est encore appelée chronique ou série temporelle
k. Constante : une constante est une magnitude qui ne change pas en par
conséquent représente l’antithèse de la variable
8
l. Coefficient : Quand une constante est jointe à une variable, on l’appelle
coefficient de cette variable. Exemple : Si l’on a l’expression 5R dans un
modèle, alors 5 serait un coefficient et non pas une constante.
n n n
Si x et y sont deux variables aléatoires, alors : ( xi yi ) xi yi
i 1 i 1 i 1
(ax by ) a x b y
i 1
i i
i 1
i
i 1
i
( x x ) 0 en effet,
i
( xi x ) xi x or x
i 1 i 1 i 1
xi
n i 1
i 1
( x x ) nx x nx nx 0
i
i 1
9
Si X est une variable aléatoire discrète qui prend les valeurs x1 , x2 , , xn avec des
densités de probabilité dont les valeurs sont : f ( x1 ), f ( x2 ), , f ( xn ) , l’espérance
mathématique de X est donnée par :
E ( X ) x1 f ( x1 ) x2 f ( x2 ) xn f ( xn )
n
E ( X ) xi f ( xi )
i 1
Var ( X ) E ( X 2 ) 2 E ( X ) E ( X ) [ E ( X )]2
Var ( X ) E ( X 2 ) 2[ E ( X )]2 [ E ( X )]2
Var ( X ) E ( X 2 ) [ E ( X )]2
NB : LA racine carrée de la variance est appelée écart type.
Propriétés de la variance
Var ( X Y ) E ( X Y ) E ( X ) E (Y )
2
Var ( X Y ) E ( X E ( X )) (Y E (Y ))
2
10
Var ( X Y ) Var ( X ) 2 cov( XY ) Var (Y )
de même :
Var ( X Y ) Var ( X ) 2 cov( XY ) Var (Y )
Ainsi si X et Y sont deux variables aléatoires indépendantes :
C ov( XY ) 0 alors :
Var(X+Y) Var(X-Y)
Var(X+Y) Var ( X ) Var (Y )
11
CHAPITRE II LE MODELE DE REGRESSION LINEAIRE SIMPLE
II.1 Introduction
Dans le chapitre précédent, nous avons essayé de situer l’économétrie par rapport à la
théorie économique, de définir ce qu’est l’économétrie et de définir son objectif. Nous
avons ensuite présenté la méthodologie de recherche économétrique. La révision de
quelques concepts statistiques à clos ce chapitre.
Dans le présent chapitre, nous nous attèlerons à présenter le modèle de régression
linéaire simple, les hypothèses qui sous tendent ce modèle et l’estimation de ses
paramètres.
Le modèle de régression linéaire à deux variables est un modèle qui lie deux variables
entre elles à savoir :
Yt 0 1 X t t ; t = 1,2, …,n (2-1)
Où : Yt = variable dépendante ou expliquée
Xt = variable indépendante ou explicative
εt = variable aléatoire ou terme de l’erreur
β0 et β1 sont des paramètres constants inconnus que l’on se propose d’estimer à l’aide
des observations. On dispose de n observations sur Yt et Xt ; c'est-à-dire de n couples
(Yt ;Xt) qui sont les réalisations de X et Y.
E(Yt ) 0 1 X t
Y1
Y2
X
X1 X2
Comme la droite Yˆt passe par les points moyens, il va se trouver que des points seront
au dessus et en dessous de cette dernière. Ainsi, les observations qui sont au dessus de
la ligne donnent des valeurs positives de εt et les observations en dessous donneront
12
des valeurs négatives de εt. Et comme la ligne représentée par Yˆt passe par les points
moyens, les valeurs négatives et positives de qui sont εt s’annuleront mutuellement
de sorte que la sommation des erreurs sera nulle c'est-à-dire i 0 .
Estimer le modèle présenté dans l’équation (2-1) implique la détermination des valeurs
numériques des paramètres β0 et β1. Pour cela, il est nécessaire de connaitre Xt, Yt et
εt. Les deux premières sont observables (Xt, Yt) et ne pose pas de problème. Là où il y
a problème, c’est avec εt car l’erreur n’est pas observable. Ainsi, le mieux que nous
pouvons faire afin de déterminer les valeurs numériques de β0 et β1 est d’émettre des
hypothèses sur εt. Ces hypothèses sont les suivantes :
Les valeurs possibles de εt ne sont pas connues d’avance, elles peuvent être positives,
négatives, ou nulles. Toutes fois, quelque soit la valeur de εt, cette dernière a une
certaine probabilité de réalisation.
Quoique εt puisse prendre des valeurs aussi bien positives, négatives ou nulles, ces
valeurs n’annulent mutuellement. En d’autres termes la moyenne des erreurs est nulle :
E ( t ) 0 (2-2)
Hypothèse 4 (H4) : Homoscédasticité
Limite supérieure
a2
b2
a1
b1 Limite inférieure
X1 X2 X
13
Hypothèse 5 (H5) : Normalité
Nous faisons l’hypothèse que εt suit une loi normale avec comme moyenne zéro (0) et
variance 2 : t N (0, 2 ) (2-4)
L’implication de la normalité est que la plupart des observations sont concentrées dans
le voisinage immédiat de la ligne de régression.
Il n’ya pas d’association linéaire entre en εt et Xt par conséquent cov(εt ,Xt ) = 0 (2-5)
En clair la variable résiduelle εt est indépendante des n variables explicatives Xt
Preuve :
Cov( t , X t ) E[( t E ( t ))( X t E ( X t ))]
Cov( t , X t ) E[ t ( X t E ( X t )] car E ( t ) 0
Cov( t , X t ) E[ t X t t E ( X t )] or Xt est non stochastique E ( X t ) X t
Cov( t , X t ) X t E ( t ) X t E ( t ) 0
Cov ( t , X t ) 0
Cov( t , s ) E ( t , s ) 0 t s
Deux erreurs relatives à deux observations différentes (t) et (s) sont non corrélées ou
indépendantes entre elles.
Il faut qu’il y ait au moins autant d’observations que de paramètres à estimer c'est-à-
dire N>k, où k est le nombre de paramètres à estimer et N le nombre d’observations.
Il existe plusieurs méthodes économétriques que l’on peut utiliser pour déterminer les
valeurs numériques des paramètres de l’équation (2-1). Toutes-fois nous allons
focaliser notre étude sur la méthode dite des moindres carrés ordinaires pour des
raisons suivantes :
Elle est simple comparée aux autres méthodes ;
Les paramètres obtenus à partir de cette méthode ont des propriétés optimales ;
Elle est très utilisée et demeure de loin la plus utilisée dans l’estimation des
modèles économétriques ;
Les principes qui sous tendent la méthode des MCO sont simples à comprendre
14
Le critère de la méthode des MCO peut se décomposer en deux parties : La première
exige que la ligne de régression passe par les points moyens du nuage de points de
sorte que les déviations positives ou négatives s’annulent mutuellement c'est-à-
dire t 0 . La deuxième partie du critère exige que la somme des carrés des erreurs
soit minimale. Ainsi, si on écrit l’équation (2-1) on a :
Yt 0 1 X t t
Notons ̂ , ˆ les paramètres estimés de et de sorte que l’on ait :
0 1 0 1
La condition nécessaire pour un minimum exige que les dérivées premières soient
égales à zéro, ceci nous permet de déterminer ̂0 et ˆ1 .
ˆt2
ˆ 0
0
ˆt
2
ˆ 0
1
ˆt2
2 (Yt ˆ0 ˆ1 X t ) 0 (2-10)
ˆ
0
ˆt2
2 (Yt ˆ0 ˆ1 X t ) X t 0 (2-11)
ˆ 1
En réarrangeant les termes des équations (2-10) et (2-11) nous obtenons les deux
équations normales :
Yt nˆ0 ˆ1 X t (2-12)
Les équations normales
X Y t t ˆ0 X t ˆ1 X t 2 (2-13)
En divisant l’équation (2-12) par « n » ensuite la multiplier par X nous obtenons :
XY ˆ0 X ˆ1 X 2 (2-14)
Divisons ensuite l’équation (2-13) par « n » pour ensuite lui soustraire l’équation (2-
14) :
15
X Y t t
ˆ
X t
ˆ
X t
2
(2-15)
0 1
n n n
X tYt XY ˆ1 (
X t X 2 ) et nous obtenons :
2
n n
ˆ1 t 2t
X Y nXY
(2-16)
X t nX 2
ˆ1 peut s’écrire encore :
ˆ1
( X t X )(Yt Y )
(2-17)
(X t X )2
Et comme ˆ0 Y ˆ1 X on a :
ˆ0 Y X
( X t X )(Yt Y )
(2-18)
( X t X )
2
Représentation des variables par les écarts : xt X t X et yt Yt Y
ˆ1
xt yt
(2-19)
x t
2
Et une fois ˆ1 obtenue selon l’équation (2-19) nous pouvons avoir :
ˆ Y ˆ X (2-20)
0 1
16
EXERCICE D’ECONOMETRIE
1) Estimez par la méthode des MCO la droite de régression liant le coût annuel de
maintenance à la durée annuelle d’utilisation de la machine et interprétez la valeur
des coefficients. (Yt = a + bXt +Ɛt).
2) Rappelez les formules définissant les estimateurs sans biais des variances et
covariances 2 , 2 , 2 , cov(a, b) et calculez au fur et à mesure leur valeur
a b
numérique respective.
3) Dressez le tableau d’analyse de la variance et testez au seuil de 5% la signification
d’ensemble (globale) de la régression estimée.
4) Calculez le coefficient de détermination non ajouté R2 et interprétez le résultat.
17
II–5 Régression linéaire et forme fonctionnelle
Une spécification (modèle) est dite linéaire lorsque Y (variable expliquée) ou une
quelconque transformation de Y peut être exprimée comme une fonction linéaire de X
(variable explicative) ou d’une quelconque transformation de X.
On notera aussi qu’un modèle de régression peut-être linéaire dans les variables ou
dans les paramètres ou à la fois dans les variables et dans les paramètres.
Exemples :
- le modèle de régression Yt = a0 + a1 X1t + εt est linéaire à la fois dans les
paramètres et dans les variables.
- Le modèle Yt = a0 + a1² Xt + εt est linéaire dans les variables mais pas dans les
paramètres.
Les transformations suivantes, suivant les modèles ci-après sont nécessaires pour
pouvoir utiliser la méthode MCO et obtenir les estimateurs sans biais des
paramètres.
- Yt b0 X tb1e t . Ces modèles ont de la forme double log ou log – log : LogY =
logb0 + b1logX + ε dans la mesure où le modèle nécessite le log à la fois de X
et de Y
18
CHAP. III Evaluation du Modèle de Régression Linéaire
III – 1 Introduction
Ici nous voulons voir si les estimateurs obtenus par la méthode du MCO ont des
propriétés désirables. Les propriétés désirables sont : être linéaire, être sans biais et
avoir la plus petite variance.
ˆ1 ( X X )Y Y ( X X )
( X t X )(Yt Y )
t t t
(X t X) 2
(X X ) (X X )
t
2
t
2
0
On pose que
(Xt X )
wt , et on note que wt est une quantité exogène parce que dépendant de
( X t X )2
Xt et donc peut être traité comme une constante.
ˆ1 est un estimateur sans biais de β1 si et seulement si E( ˆ1 ) = β1. En d’autres termes
ˆ1 est sans biais si sa moyenne est égale à sa vraie valeur.
Montrons que β1 est sans biais.
ˆ1 wtY t et Yt 0 1 X t t
ˆ1 wt ( 0 1 X t t )
ˆ1 0 wt 1 wt X t wt t
or w
(X X ) t
0 car (X X) 0
(X X )
t 2 t
t
19
Notons aussi que
wt ( Xt X )2 t 1
(X X )X
t
car (X t X ) X t ( X 2t XX t ) X 2t X X t
(X t X ) X t X 2t nX 2 ( X t X ) 2
ˆ1 1 wt t
E ( ˆ1 ) 1 wt E ( t ) comme E( t ) 0 ; on a :
E ( ˆ1 ) 1
ˆ1 est un estimateur sans biais de 1
t t ,
1
Var ( ˆ ) w E ( ) 2 w w E ( )
2
t
2 ,
t ,
t t t t
t t ,
Or, d’après les hypothèses :
E ( t2 ) 2 ;
E ( t t , ) 0 si t t ,
Var ( ˆ1 ) w2t 2 2 w2t
(Xt X ) ( X t X )2
Or wt w 2
( X t X )2 ( X t X )2 ( X t X )2
t
2
Var ( ˆ1 )
(X t X )2
Lorsque
n alors (X t X ) 2 tend également vers , d'où Var(ˆ1 ) tend vers 0
ˆ1 est convergent.
20
on sait que ˆ0 Y ˆ1 X et que ˆ1
( X t X )Yt
( X t X )2
ˆ0 Y
( X t X )Yt X
(X X ) t
2
ˆ0
Y X ( X X )Y
t t t
n (X X ) t
2
Yt X ( X t X )Yt
ˆ0
n ( X t X )2
1 X (Xt X )
ˆ0 Yt
n ( X t X )2
1 X (Xt X )
Posons : t (gamma) qui est une quantité exogène parce que
n ( X t X )2
dépendant de Xt et donc peut être traité comme une constante.
ˆ0 tY t 1Y1 2Y2 ... k Yk
̂0 est une fonction linéaire en Yt
1 X (Xt X )
(1) 2
n ( X t X )
t
n X (Xt X ) (X X )
n ( X t X )2
or t
0
(X X )
t 2
t
n
t
n
1
1 X (Xt X )
(2) X n X t
( X t X )2
t t
X n
X X ( X t X )X t
t
(X X )2
t t
t
On sait que :
(X X )X t t
1 d’où :
(X X ) t
2
21
X n X X X 0
X t
t t
X 0 t t
ˆ
0 0 t t
E ( ˆ ) E ( )
0 0 t t
0
E ( ˆ0 ) 0
̂0 est un estimateur sans biais de 0
2
t ?
1 X (Xt X )
t
n ( X t X )2
2
1 X ( X t X )2 2 X (Xt X )
2
2
n ( X t X ) ( X t X ) n ( X t X )2
t 2 2
X (Xt X ) 1 X (Xt X )
2 2
1
2
n ( X t X )2 ( X t X )2
2 2
n (Xt X )
t
0
2
1 X
2
t
n ( X t X )2
Var ( ˆ0 ) 2 2t
2 1 X
2
2
Var ( ˆ
)
1 X
t n
0 2
2
n ( X X )
( X t X )2
t
1
Lorque n ; 0 et ( X t X ) 2 tend vers , d'où Var(ˆ0 ) tend vers 0
n
ˆ
est donc convergent ou converge en probabilité vers .
0 0
Nota Bene :
22
Calcul de Covariance ( ˆ0 )( ˆ1 ) : cov(ˆ0 , ˆ1 )
X 2
On démontre que Cov( ˆ0 , ˆ1 )
( X t X )2
Dans les formules de Var ( ˆ0 ) , Var ( ˆ1 ) et Cov( ˆ0 , ˆ1 ) , nous avons la variance des
résidus 2 qui est inconnue. Il faut donc lui trouver un estimateur sans biais ˆ 2 . On
ˆt2
démontre que E .
2
n 2
n2
Ce résultat peut être généralisé dans le cas du modèle à k variables explicatives, pour
donner : ˆ2
ˆt2
nk
Lorsque leurs phénomènes ont une évolution commune, nous disons qu’ils sont
« corrélés ». La corrélation simple mesure le degré de liaison existant entre ces deux
phénomènes représentés par des variables. Si nous cherchons une relation entre trois
variables ou plus, nous ferons appel alors à la notion de corrélation multiple.
Nous pouvons distinguer la corrélation linéaire, lorsque tous les points du couple de
valeurs (x, y) des deux variables semblent alignés sur une droite, de la corrélation non
linéaire lorsque le couple de valeurs se trouve sur une même courbe d’allure
quelconque.
- Non corrélées, il n’y a aucune relation entre les variations des valeurs de l’une
des variables et les valeurs de l’autre.
23
Tableau 3-1 : Linéarité et corrélation
Graphe 1
Graphe 2
Graphe 3 Graphe 4
Graphe 5
24
" x , y rx , y
Cov( x, y )
xy
(X t X )(Yt Y )
x y x y (X t X )2 (Y Y )
t
2
Avec
Cov (x, y) ; бxy = Covariance entre x et y ;
бx et бy = écart type de x et écart type de y
Après avoir estimé les valeurs des paramètres sur la base de l’échantillon, après avoir
aussi calculé les différentes variances de ces estimateurs, il serait souhaitable que nous
puissions déterminer le degré du pouvoir explicatif de la variable ou des variables
indépendantes du modèle de régression. En d’autres termes, nous voudrions savoir
dans quelles mesures les variations de la variable dépendante Y sont expliquées par
l’estimation linéaire de la relation entre Y et X .
Le coefficient de détermination
Yt 0 1 X t t
ˆ ˆ ˆ Yt ˆ0 ˆ1 X t ˆt Yt Yˆt ˆt
Yt 0 1 X t Yˆt
Posons :
Yt Yt
Yt Y Yt Y
Yt Y Yt Y Yˆt Yˆt (Yt Yˆ ) (Yˆt Y )
(Y Y ) (Y Yˆ ) (Yˆ Y )
t t t t
(Yt Y ) peut être assimilé à l’écart totale entre yt et sa moyenne y . C’est cet écart que
le modèle de régression essaie d’expliquer.
(Yˆt Y ) représente l’écart entre la valeur d’estimation Yˆt et la moyenne Y . C’est cet
écart qui est expliqué par le modèle de régression.
(Yt Yˆt ) représente l’écart entre l’observation Yt et sa valeur estimée Yˆ . C’est l’écart
qui demeure inexpliquée par le modèle de régression. Il représente le terme de l’erreur
t .
Etant donné que l’explication de l’écart entre l’observation et sa moyenne est notre
objectif principal, nous devions tenir compte du fait que :
25
Yt Y 0 ; Yt Y 0 ou Yt Y 0 , c’est pourquoi on écrit que :
(Y Yˆ )(Yˆ Y ) 0
t t t
(Y Y ) (Yˆ Y ) (Y Yˆ )
2 2 2
t t t t
(Y Y )
2
t = Variation totale de Yt ou somme totale des Carrés (STC)
(Yˆ Y )
2
t = Variation de Yt expliquée (par Xt) ou Somme des Carrés de la
Régression (SCR)
(Y Yˆ )
2
t t = Variation inexpliquée ou somme des Carrés des erreurs (SCE)
R
2
1
(Yt Y ) (Yt Y )
2 2
(Y Y ) (Y Yˆ )
2 2
R 2
t t t
(Y Y )
2
t
26
- Si R² = 1 ou 100% , l’équation de régression explique 100% des variations de
la variable dépendante Yt
- Si R² = 0, cela signifie que l’équation de régression n’explique aucune
variation de la variable dépendante Yt
- Si R² є ]0 ; 1[ ou 0 < R² < 1
Entreprendre une estimation ponctuelle est une démarche que l’on peut considérer
comme relativement naturelle : si l’on se trouve placé face à un phénomène aléatoire
dépendant d’un paramètre inconnu, il est logique de chercher à disposer d’une valeur
numérique de ce paramètre. Il existe cependant de nombreuses situations où une telle
estimation ponctuelle n’est pas, en elle-même, d’un grand intérêt.
Certes, elle donne une idée des résultats du scrutin, mais suffirait-elle à vous rassurer ?
Ne préfériez-vous pas voir affirmer qu’il y a de très fortes chances pour que la
27
proportion des votants favorables à votre liste soit comprise par exemple entre 50,2%
et 50,7%.
Nous avons ici une situation où une estimation ponctuelle est peu intéressante.
Manifestement, les dirigeants de votre entreprise préféreraient qu’on puisse leur
donner une fourchette de valeurs, dans laquelle la consommation moyenne ait toute
chance de situer.
X m
Pr ob n 99%
0 / n
L’évènement
X m
n
0 / n
est équivalent successivement, aux évènements suivants :
0 X n m 0
n n
Xn 0 m Xn 0
n n
28
0 0
Donc, si on appelle An la statistique X n et Bn la statistique X n on
n n
obtient, par construction : Prob {An ≤ m ≤ Bn} = 99%
L’intervalle [An ; Bn], dont les bornes sont aléatoires est appelé intervalle de Confiance
pour le paramètre m. On dit qu’il est construit au niveau de confiance 99%.
Si l’écart type 0 , supposé connu, est égal à 0,10 litre, on peut calculer numériquement
la réalisation de [An ; Bn].
0,1
Bn = 0,23 – 2,5758 0,243
20
Ce résultat, qui est une estimation de m par intervalle de confiance, invite votre
entreprise à pénétrer le marché burkinabé en exportant directement à de la C.I puisque
la réalisation [0,217 ; 0,243] est inclus dans l’intervalle [0,20 litre ; 0,40 litre]
29
Intervalle de confiance pour les paramètres
Etant donné Yt = a + bxt +εt, déterminer un intervalle de confiance pour b par exemple,
c’est trouver un intervalle [bmin ; bmax] tel que Prob [bmin ≤ b ≤ bmax] = P = 1 – α
bˆ b
loi de student à n-2 ddl tc
ˆ bˆ
Pr ob tn/22 tc tn/22 1
bˆ b /2
tn/22 tn 2
ˆ bˆ
ˆ bˆtn/22 bˆ b ˆ bˆtn/22
bˆ ˆ bˆtn/22 b bˆ ˆ bˆtn/22
bˆ ˆ bˆtn/22 b bˆ ˆ bˆtn/22
ˆ 2
Théorème : La quantité (n 2) 2 une loi de 2 (khi-deux) et on peut donc trouver
dans la table de cette loi les valeurs 12 ayant la probabilité 1-α/2 d’être dépassées et
2 2 ayant la probabilité α/2 d’être dépassées et l’on a :
ˆ 2
Pr ob 2 (1 /2)( n 2) (n 2) 2 (2 /2)( n 2) 1
(n 2)ˆ 2
( n 2)ˆ 2
2 2
( /2)( n 2)
2
(1 /2)( n 2)
3 - 5 - 2 Le test d’Hypothèses
Au vue de ce tableau, l’erreur qui consiste à rejeter l’Hypothèse nulle Ho alors qu’elle
est vraie est une erreur de première espèce ; la probabilité de commettre une erreur de
première espèce appelée α est généralement appelée "Niveau ou seuil significatif".
30
L’erreur consistant à accepter Ho alors qu’elle est fausse est appelée erreur de seconde
espèce.
a) L’Hypothèse nulle
L’Hypothèse nulle ou Hypothèse de base noté Ho, spécifie ou attribue une valeur à un
paramètre.
Soit une fonction de demande quelconque de la forme suivante Qt = βo + β1 Pt + β2 Yt
+ εt, une hypothèse nulle peut être définie par : Ho : β2 = 0
Le terme zéro ici indique que notre hypothèse est correcte, alors Yt a un effet nul sur
Qt.
Ainsi l’hypothèse nulle est ce à quoi nous croyons jusqu’à ce que l’on vous prouve le
contraire. Si on arrivait à nous prouver le contraire alors on rejetterait l’Hypothèse
nulle.
b) L’Hypothèse alternative
Celle-ci est une hypothèse logique, noté H1 que nous acceptons si l’hypothèse nulle H0
est rejetée. L’hypothèse alternative est flexible et dépend dans une certaine mesure de
la théorie économique.
Si dans le cadre de l’analyse d’une régression simple (une seule variable dépendante)
nous sommes amenés à tester ces hypothèses suivantes au seuil α.
α pouvant être égal à 0,01 ; 0,05 ou 0,10 nous procéderons de la manière suivante :
31
H 0 : 1 1
H1 : 1 1
ˆ
tc 1 1 student (n 2) (tn 2 )
ˆ ˆ
1
Le test est dit unilatéral à droite si la zone de H0 est d’un seul tenant et se situe à
l’extrémité droite de la distribution de la loi de densité.
H 0 : 1 1
H1 : 1 1
ˆ
tc 1 1 student (n 2) (tn 2 )
ˆ ˆ
1
Test bilatéral
32
Ce test peut être formulé de la manière suivante : existe-t-il au moins une variable
explicative significative ?
NB : Nous ne testons pas le cas où le terme constant β0 est nul, car seules nous
intéressent les variables explicatives. Un modèle dans lequel seul le terme constant est
significatif n’a aucun sens économique.
Le cas où l’hypothèse H0 est acceptée signifie qu’il n’existe aucune relation linéaire
significative entre la variable à expliquer et les variables explicatives.
ˆ (Yˆ Y ) ˆ Yˆ ˆ Y
t t t t t
ˆ (Yˆ Y ) ˆ Yˆ Y ˆ
t t t t t
ˆ (Yˆ Y ) ˆ ˆ ˆ X Y ˆ
t t t 0 1 t t
ˆ (Yˆ Y ) ˆ ˆ ˆ ˆ X Y ˆ
t t 0 t 1 t t t
0 0 0
(Y Y ) (Y Yˆ ) (Yˆ Y )
t
2
t t
2
t
2
33
ˆ (Y Yˆ )
t t
2
Yˆt Y ˆ1 ( X t X )
(Yˆt Y ) ˆ1 ( X t X )
(Yˆ Y ) ˆ ( X X )
2 2 2
t 1 t
(Y Y ) ˆ ( X X ) (Y Yˆ )
2 2 2 2
t 1 t t t
(Y Y ) ˆ ( X X ) ˆ
2 2 2 2
t 1 t t
ˆ (Y Y ) ˆ ( X X )
2 2 2 2
t t 1 t
(Y Y ) (Yˆ Y ) (Y Yˆ )
t
2
t
2
t t
2
Degré de liberté
Par exemple : Si l’on cherche deux nombres dont la somme est 12, aucun des deux
nombres ne doit être déterminé par l’équation : x + Y = 12
X peut être choisi arbitrairement, mais alors pour y il n’y a alors plus de choix.
Il y a donc deux variables aléatoires (x, y), mais un seul degré de liberté.
On a donc
(n – k) ddl pour (Yt Yˆt ) 2 puisque pour chaque coefficient estimé, nous
perdons k observations sur l’ensemble des données.
34
(n – 1) ddl pour (Yt Y ) 2 , nous avons n observations et en estimant la
moyenne de Yt nous perdons une observation.
Les éléments ci-dessus peuvent être rangés dans un tableau que nous appellerons
tableau de l’analyse de la variance. Cette dernière se présente comme suit :
S12
Fc 2 la loi de Fischer (F(1;n 2) )
S2
Fc F (k 1);(n k )ddl
SCR SCR
(k 1) 1
Fc F(1;n-2)
SCE SCE
(n k ) n2
La prévision en économétrie, c’est non seulement prévoir une valeur dans le futur mais
aussi simuler le passé si nous sommes dans le cas de série temporelle et prédire des
valeurs au cas où l’on se situerait dans le cadre de données en coupe instantanée.
Prévision ponctuelle
Qu’il s’agisse de prévoir une valeur dans le futur ou simuler le passé (cas des séries
temporelles) ou qu’il s’agisse de prédire des valeurs (cas des données en coupe
35
instantanée), la valeur ponctuelle qui est attribuée à la variable expliquée inconnue
lorsque là un les valeurs explicatives sont sens cfées être connues est appelée prévision
ponctuelle (par opposition à la prévision par intervalle).
Erreur de prévision
On va étudier les propriétés de ∆0 , c'est-à-dire que nous allons calculer son espérance
mathématique et sa variance.
36
V ( 0 ) E 0 E ( 0 )
2
or E( 0 ) 0
V ( 0 ) E 0
2
0 ( ˆ0 0 ) ( ˆ1 1 ) X 0 0
0 ( ˆ0 0 ) 0 ( ˆ1 1 ) X 0
2
2 0 ( ˆ0 0 ) 0 ( ˆ1 1 ) 2 X 20 2 ( ˆ0 0 ) 0 ( ˆ1 1 ) X 0
1 X (Xt X )
t
n ( X t X )2
( ˆ0 0 ) 0 t t 0
E ( ˆ0 0 ) 0 t E ( t 0 ) 0 voir hypothèse
(Xt X )
wt
( X t X )2
( ˆ1 1 ) 0 wt t 0
E ( ˆ0 0 ) 0 wt E ( t 0 ) 0
E ( ˆ0 0 ) 0 0 (2)
37
Var ( 0 ) E ( 0 ) 2 E 0 E ˆ0 0 E ˆ1 1 X 02 2 X 0 E ( ˆ0 0 )( ˆ1 1 )
2 2 2
2
Var ( ˆ1 )
(X t X )2
2
Cov(ˆ0 , ˆ1 ) XVar ( ˆ1 )
(X t X )2
1 X
2
X 02 2 2 X 0 X 2
Var ( 0 )
2 2
n ( X t X ) ( X t X ) ( X t X )
2 2 2
1 X
2
X 02 2X0 X
Var ( 0 ) 1
2
n ( X t X ) ( X t X ) ( X t X )
2 2 2
1 ( X 0 X )2
Var ( 0 ) 2 1 2
n ( X t X )
0
loi de student
ˆ 0
Pr ob tn/22 tc tn/22 1
tn/22 tc tn/22
Yˆ Y
tn/22 0 0 tn/22
ˆ 0
ˆ 0 tn/22 Yˆ0 Y0 ˆ 0 tn/22
Yˆ0 ˆ bˆtn/22 Y0 Yˆ0 ˆ bˆtn/22
38
CHAPITRE IV. MODELE LINEAIRE GENERAL OU MODELE DE
REGRESSION SIMPLE
Introduction
Le modèle linéaire général est une extension du modèle de régression simple abordé
dans les chapitres précédents. Après avoir présenté le modèle linéaire au niveau du
chapitre paragraphe I, nous envisageons présenter les estimateurs du vecteur A au
paragraphe II. Les différentes propriétés des estimateurs sont proposées en III et le
paragraphe IV est consacré à l’inférence dans le modèle linéaire général. En V, nous
présentons la prévision.
Présentation
Lors de chapitres précédents, nous avons considéré qu’une variable endogène est
expliquée à l’aide d’une seule variable exogène. Cependant, il est extrêmement rare
qu’un phénomène économique ou social puisse être appréhendé par une variable. le
modèle linéaire général est une généralisation du modèle de régression simple dans
lequel figurent plusieurs variables explicatives. Pour sa présentation, on peut formuler
quatre (4) formes différentes mais mutuellement équivalentes :
Première formulation
Yt a1 X t1 a2 X t 2 ak X tk U t
Où Yt est la variable à expliquer
Xt1, Xt2, … Xtk, sont k variables explicatives.
Ut est une erreur aléatoire inconnue.
Le modèle comporte n informations ou observations.
Deuxième formulation
Yt a1 X t1 a2 X t 2 ak X tk U t
Y1 X 11 X 12 X 1k a1 U1
Y X X
X 2 k a2 U 2
2 21 22
Yn X n1 X n 2 X nk ak U n
39
Y1 X 11 X 12 X 1k a1 U1
Y X X
X 2 k a2 U 2
2 21 22
Yn X n1 X n 2 X nk ak U n
Y X A U
Y X A U
( n1) ( nk ) ( k 1) ( n1)
Quatrième formulation
Yn X n' A U n
L’écriture sous forme matricielle rend plus aisée la manipulation du modèle linéaire
général, c’est pourquoi nous l’adoptons par la suite.
Hypothèse 2 : Les variables explicatives sont des quantités connues non aléatoires
40
U1 U12 U1U 2 U1U n
U 2
U n 2 1
UU U U 2U n
UU 2 U1U 2
' 2
U n U nU1 U nU 2 U n2
E (U nU1 ) E (U nU 2 ) E (U n2 )
U2 0 0
0 U2 0
E (UU )
'
0 0 U2
1 0 0
0 1 0
2
E (UU ) U
'
U2 I n U
0 0 1
In
41
U U (2 AX Y ) ( AX XA)
0
A A A
U U
2 X Y 2 X XA 0
A
U U
2 X Y 2 X XAˆ 0
A ˆ
U U
X Y X XAˆ 0
Aˆ
X XAˆ X Y équation normale
( X X ) 1 ( X X ) Aˆ ( X X ) 1 X Y
Aˆ ( X X ) 1 X Y
Aˆ ( X X ) 1 X Y
 est ou serait sans biais si E ( Aˆ ) A
On sait que Y = XA + U
Aˆ ( X X ) 1 X Y
Aˆ ( X X ) 1 X ( XA U )
Aˆ ( X X ) 1 X ( XA) ( X X ) 1 X U
Aˆ ( X X ) 1 ( X X ) A ( X X ) 1 X U
Aˆ A ( X X ) 1 X U
E ( Aˆ ) A ( X X ) 1 X E (U ) or E (U ) 0
d’où E ( Aˆ ) A => Â est un estimateur sans biais de A
42
4-4-3 L’estimateur  est convergent
Var ( Aˆ ) ( X X ) 1 X 2 I X ( X X ) 1
Aˆ U n
Var ( Aˆ ) Aˆ U2 ( X X ) 1 ( X X )( X X ) 1
On sait aussi que :
X X
( X X ) 1 ( X X ) 1 et donc :
X X
Var ( Aˆ ) Aˆ U2 ( X X ) 1
43
c. Convergence de Â
On a montré que :
Var ( Aˆ ) Aˆ U2 ( X X ) 1
Uˆ Uˆ
et ˆU2
nk
Uˆ Uˆ
donc Var ( Aˆ ) ˆU2 ( X X )1 ( X X )1
nk
ˆ ˆ
U U est une somme de carrés finis ;
Par ailleurs en vertu de l’hypothèse 3 ( X X ) 1 existe et donc n’est pas finie.
Par conséquent :
Uˆ Uˆ
Var ( Aˆ ) ˆU2 ( X X )1 ( X X )1 tend vers zéro (0) quand n
nk
=> Â est un estimateur convergent de A.
A A ( X X ) X U CXA CU
* 1
E ( A* ) A ( X X ) 1 X E (U ) CXA C E (U )
0 0
E ( A ) A CXA
*
On remarque que A*est biaisé. Pour qu’il soit sans biais pour toutes les valeurs de A,
nous devons avoir : CX = 0
A* A ( X X ) 1 X U CU
A* A ( X X ) 1 X C U
A* A ( X X ) 1 X C U
44
Var ( A* ) E ( A* A)( A* A)
Aˆ A ( X X ) 1 X U
E ( Aˆ ) A
Var ( Aˆ ) U2 ( X X ) 1
Aˆ N ( A, 2 ( X X ) 1 )
U
aˆi ai
N (0,1)
ˆ aiˆ
aˆi ai
student (n k )
ˆ aiˆ
H 0 : ai ai
H1 : ai ai
Règle de décision :
Si tc > tlu alors on rejette H0 (tc > tα(n-k))
aˆ a
tc i i
ˆ aˆi
H 0 : ai ai
H1 : ai ai
45
Règle de décision :
Si tc < - tlu alors on rejette H0 (tc < - tα(n-k))
aˆ a
tc i i
ˆ aˆi
H 0 : ai ai
H1 : ai ai
Si tc t(n/2 k ) on rejette H0
aˆ a
tc i i
ˆ aˆi
2 2
(1 )( n k ) 1 ( )( n k )
2
2
(n k )ˆ U
2
U 2 (n k )ˆU 2
(n k )ˆU 2 (n k )ˆU 2
U 2
2 2
( )( n k ) (1 )( n k )
2 2
aˆi ai
tc student (n k )
ˆ aˆi
Pr ob tn/2k tc tn/2k 1
tn/2k tc tn/2k
aˆ a
tn/2k i i tn/2k
ˆ aˆi
ˆ aˆi tn/2k aˆi ai ˆ aˆi tn/2k
aˆi ˆ aˆi tn/2k ai aˆi ˆ aˆi tn/2k
46
aˆi ˆ aˆi tn/2k ai aˆi ˆ aˆi tn/2k
Preuve : X Uˆ 0?
Uˆ Y XAˆ
Uˆ Y X ( X X ) X Y
1
Aˆ ( X X ) X Y
1
X Uˆ X Y X X ( X X ) 1 X Y
X Uˆ X Y X Y
X Uˆ 0
donc X Uˆ 0
Y Y Aˆ X XAˆ Uˆ Uˆ
Y Y Yˆ Yˆ Uˆ Uˆ
47
Uˆ Uˆ est la somme des carrés des erreurs (SCE) et représente la portion de la
STC qui n’est pas expliquée par le modèle de régression linéaire. Uˆ Uˆ est aussi
appelée Somme des Carrés des Résidus.
Y Y nY 2 Aˆ X XAˆ nY 2 Uˆ Uˆ
STC SCR SCE
STC SCR SCE
STC STC STC
Si on pose que :
SCR SCE
R2 1
STC STC
Yˆ Yˆ nY 2 Uˆ Uˆ
R
2
1
Y Y nY 2 Y Y nY 2
Aˆ X XAˆ nY 2
R2
Y Y nY 2
48
( Aˆ X XAˆ nY 2 ) / (k 1)
Fc F (k 1, n k )
Uˆ Uˆ / (n k )
4. 5 Prévision
4. 5.1 Définition
Au sens large, la prévision c’est d’une part prévoir une valeur dans le futur, et d’autre
part de faire une simulation du passé dans le cas de séries temporelles et prédire des
valeurs dans le cadre de données en coupe instantanées.
Qu’il s’agisse de l’une ou l’autre de ces situations, le problème reviens à déterminer la
valeur qui doit être attribuée à la variable expliquée lorsque l’on connaît les valeurs
des variables explicatives.
l’estimateur de X A .
Pour des valeurs données de X , la valeur chiffrée de X Aˆ donc de Yˆ est appelée
prévision ponctuelle.
49
Yˆ Y Y X Aˆ Y
X Aˆ X A U
X ( Aˆ A) U
( k ) ( k 1) ( 1)
Il en est ainsi parce que  qui est l’estimateur MCO obtenu à partir d’observations
passées et U le vecteur des perturbateurs futurs ne sont pas corrélés. Les aˆ i éléments
de  ne dépendent que de U t éléments du vecteur U et on note que t=1,2,…,n alors
que n , par conséquent :
Cov( ) V ar( ) E[(Yˆ Y )(Yˆ Y )' ]
Cov( ) X E[( Aˆ A)( Aˆ A)' ] X ' E[U U ' ]
Dans cette expression on sait que :
E[( Aˆ A)( Aˆ A)' ] U2 ( X X ) 1 Var ( Aˆ )
Il reste à déterminer E[U U ' ] . Supposons que t h avec h=1,2,3
50
U t 1
E (U U ) E U t 2 U t 1U t 2U t 3
'
U
t 3
(13)
(31)
U 2t 1 U t 1U t 2 U t 1U t 3
E (U U ' ) E U t 2U t 1 U 2t 2 U t 2U t 3
U t 3U t 1 U t 3U t 2 U 2t 3
u2 0 0 0 0 0
E (U U ' ) 0 2
u
2
0 u 0 0 0
0 0 u2 0 0 0
I
D’où :
E (U U ' ) u2 I
Cov( ) X U2 ( X X ) 1 X ' u2 I
Cov( ) U2 [ X ( X X ) 1 X ' I ] la covariance de l'erreur de prévision
Uˆ Uˆ (Y XA ˆ )' (Y XA
ˆ)
ˆU2 suit une loi de student à n-k degré de liberté.
nk nk
On peut donc construire un intervalle de prévision pour Y . Si nous notons par t /2 la
valeur qui a la probabilité d’être excédée par cette statistique t c , on peut estimer
2
que l’on a une probabilité 1 d’avoir la relation aléatoire suivante :
51
Yˆ Y
t 1
t
2 2
(ˆ [ X ( X X ) X 1])
2
U
1 ' 2
52
ECONOMETRIE ECONOMIE RURALE
MASTER 2 ECONOMIE RURALE Exercice de cours
Dans le cadre d’un mémoire de fin de stage, vous avez à charge de trouver les
principaux déterminants des importations d’un pays donné. A cet effet, vous envisagez
le modèle de régression multiple Y1 = a0 + a1Xt1 + a2 Xt2 + Ut où Yt représente les
importations annuelles en volume : Xt1, la consommation des ménages (exprimée en
milliards de francs CFA) ; Xt2, la production intérieure brute (exprimée en milliards de
francs CFA) ; Ut, le terme de l’erreur. Le tableau ci-après donne un aperçu chiffré de
l’évolution des variables du modèle.
2004 2005 2006 2007 2008
Y1 2 2,8 4 4 3,7
Xt1 2 3 5 4 3
Xt2 5 6 6 5 6
1) La forme compacte du modèle étant Y = XA + U, formez en explicitant autant que
possible les matrices Y, X, A et U 2) Calculez les matrices-produits Y’Y, X’X et X’Y.
3) Ecrire sous forme numérique le système des équations normales. 4) Les hypothèses
d’application de la méthode des MCO étant supposées vérifiées, déterminez Â, le
vecteur des estimateurs des paramètres. 5) Interprétez â0, â1, â2. 6) Trouvez les
valeurs respectives des différentes composantes de l’équation de la variance. 7)
Calculez le coefficient de détermination non ajusté R2 et interprétez la valeur trouvée.
8) Testez au seuil = 5% la signification du coefficient de détermination non ajusté
R2 . 9) Sachant que :
26,3571 0, 0714 4, 7143
X X 0, 0714 0, 2143 0,1429
1
53