Académique Documents
Professionnel Documents
Culture Documents
MENDY ; Coord et Rp : Awa TRAORE DIAW UNIVERSITE CHEIKH ANTA DIOP DE DAKAR Année académique 2019/2020
Licence 3 Gestion FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION
DEPARTEMENT ECONOMIE
Correction TD d’Econométrie
NB : Chers Collègues, ceci est un corrigé indicatif, prière de vérifier les calculs. SVP.
Régression Linéaire
Exercice 1
40
30
20
10
0
0 20 40 60 80
Le graphique du nuage de points semble aligné et identique et témoigne de l’existence d’une association
linéaire positive presque parfaite entre la variable à expliquer ( yt ) et la variable explicative xt , ce qui autorise
l’estimation de la relation les liant par les MCO.
cov(x, y )
(x t x)( y t y ) n x t y t x t y t
xy t 1
t 1 t 1 t 1
x y t n t n t n t n
(x
t 1
t x) 2 (y
t 1
t y) 2 n x t2 ( x t ) 2 n y t2 ( y t ) 2
t 1 t 1
Avec : xt et yt : valeurs des deux historiques à l’instant t , cov ( xt , y t ) : covariance entre xt et y t variable
explicative ou variable exogène, x et y : moyenne de x et de y , n : nombre d’observations.
Nous présenterons le tableau ci-dessus, le calcul d’un coefficient de corrélation.
Le coefficient de corrélation empirique (c'est-à-dire calculé à partir des observations empiriques connues)
est égal à :
t n
(cov x, y )
(x t x)( y t y )
157,00
xy t 1
0,62
x y t n t n
274,25 230,67
( x t x)
t 1
2
( y t y)
t 1
2
Le test d’hypothèses porte sur le coefficient de corrélation rxy théorique (inconnu), il est le suivant :
1
H 0 : rxy 0 contre H 0 : rxy 0
Pour savoir si le coefficient de corrélation est significativement différent de 0, il convient de calculer la t
statistique :
xy
t*
(1 xy
2
)
n2
Si t t n 2 lu dans une table de Student pour un seuil de % et à n 2 degrés de liberté (si le nombre de
*
degrés de liberté est supérieur à 30, on peut approximer la loi de Student par une loi normale), nous rejetons
l’hypothèse H 0 , le coefficient de corrélation linéaire est significativement différent de 0 ; dans le cas
contraire, l’hypothèse H 0 d’un coefficient de corrélation linéaire nul est acceptée H 0 .
Soit : 0,62 .
t* 2,53 t10
0 , 05
2,228
(1 0,62 2 )
12 2
Nous rejetons l’hypothèse H 0 , le coefficient de corrélation est significativement, au seuil de 5%, différent
de 0.
24,3
Moyenne 61,8 Somme 157,00 230,67 274,25
2. Le terme d’erreur t représente tout ce qui n’est pas expliqué par le modèle (la variable explicative).
Afin d’obtenir des estimateurs de a 0 et a1 sans biais et convergents, nous faisons des hypothèses
sur l’erreur t .
- L’espérance mathématique de l’erreur nulle : E( t ) 0
La variance de l’erreur est constante : Var ( t )
2
-
2
- L’indépendance des erreurs : Cov ( t , t ' ) E( t , t ) 0 pour t t '
- L’indépendance entre l’erreur et les valeurs de x t : Cov ( t , t ' ) 0
On note que l’erreur t est i.i.d (indépendamment et identiquement distribué).
Afin de construire une théorie des tests statistiques et faire référence à des lois de probabilité,
nous faisons l’hypothèse supplémentaire que l’erreur suit une loi normale. On note alors que
l’erreur t est n.i.d (normalement et identiquement distribué).
Soit à estimer les paramètres du modèle : yt a0 a1 xt t
Le modèle est spécifié en série temporelle car les observations t 1,.......n représente
l’évolution dans le temps des variables yt et xt .
L’estimateur des moindres carrés ordinaires sans biais est convergent est donnée par :
t n
^ (y
t 1
t y t )( x t x t )
157,00
a1 t n
0,572
274,25
(x
t 1
t xt )2
La série ajustée, notée ŷt à l’aide des paramètres estimés s’écrit donc :
yˆ t aˆ0 aˆ1 x t
Nous en déduisons le résidu noté et qu’il ne faut confondre avec le terme t qui est et
restera inconnu :
^ e 2
t
140,79
3. La variance résiduelle est donc donnée par : 2 t 1
14,079
n2 12 2
NB : Il ne faut pas confondre la variance résiduelle et la variance de l’erreur qui est et restera
inconnue.
3
2
14,079 61,8 2
^
1 x 1
2 2
196,92
n 274,25
^
n
12
(x
a0
t x) 2
t 1
^
2 14,079
2 ^
n
0,0513
274,25
(x
a1
t x) 2
t 1
^ ^
^ 14,03 ^ 0,226
a0 a1
Exercice 2
1- L’estimateur des moindres carrés ordinaires sans biais et convergent est donné par :
n n
^ (y
i 1
i y )( x i x ) y
t 1
i xi n y x
250 102 * 6,86 * 0,49
a1 0,97
n n
120 102 * 0,49 * 0,49
(x x
2
i x) 2 2
t nx
i 1 i 1
^
^ ^
a 0 y a1 x 6,86 0,97 * 0,49 7,34
n n
En effet :
x
i 1
i
50 et
y i
700
x 0,49 y i 1
6,86
n 102 n 102
( y y
2
SCT i y) 2
i ny 10000 102 * 6,86 2 5199,92
i 1 i 1
Or SCR 180 , on en déduit, d’après l’équation fondamentale d’analyse de la variance, la somme des
carrés expliqués : SCE SCT SCR 5199,92 180 5019,92
^ e 2
t
180
2 i 1
1,80
n2 102 2
D’où ^
2 1,8
2 0,0188
120 102 * 0,49 * 0,49
^
n
(x
a1
t x) 2
i 1
4- a) H 0 : a1 0 Contre l’hypothèse H 1 : a1 0
4
^
Sous H 0 (a1 0) le ratio de Student a 0 suit une loi Student à n 2 100 degrés de liberté. Soit
^
2 ^
a1
^
a
0,97 , nous rejetons l’hypothèse H 0 , le coefficient théorique et
t* ^
7,08 t 0, 05 1,96
0,137
2
^
a1
inconnu a1 est donc significativement différent de 0. La probabilité critique du test est donné par
t c 7,08 c 0,0 . Nous avons 0% de risque de nous tromper en rejetant l’hypothèse H 0 .
b) H 0 : a1 1 contre l’hypothèse H 1 : a1 1
Sous H 0 (a1 1) le ratio de Student a 1 suit une loi Student à n 2 100 degrés de liberté.
^
2 ^
a1
^
a 1
Soit 0,97 1 , nous rejetons l’hypothèse H 0 , le coefficient
t* ^
0,20 t 0, 05 1,96
0,137
2
^
a1
^
a 0,5
0,97 0,5 (attention le test est unilatéral !), nous rejetons
t* ^
3,44 t 0, 05 1,65
0,137
2
^
a1
Régression Multiple
Exercice 3
Soit le modèle suivant :
y a bx1 cx2 u
qui une fois estimé par les MCO fournit les résultats suivants :
5
2 29 0 0
y 4 0. 4 x1 0. 9 x2 ; R2 , u' u 520 ;
15 X ' X 0 50 10
0 10 80
1
avec X e, x1 , x2 où e
1
1. Calculer la matrice de variance-covariance estimée de ̂
Vˆ ˆ ˆ 2 X ' X
1
avec ˆ 2 SCR
n p
1
X 'X com X ' X
1
det( X ' X )
Calculons le déterminant de X ' X :
det( X ' X ) 29*50*80 0*10*0 0*0*10 0*50*0 10*10* 29 80*0*0 11600 2900 113100
6
Le test est de la forme :
H 0 : b 0
contre
H a : (b 0)
La statistique du test est :
ˆ
b 0.4 0.4
0
tbcal 0.62
ˆ
Vˆ b 0.41 0.64
ici au seuil =5% on a t0.025 26 2.060 . Il est clair que nous ne sommes pas dans la zone de rejet. On
ne rejette donc pas au seuil de 5% l’hypothèse nulle H 0 : b 0 . En d’autres termes, au seuil de 5% b n’est
pas significativement différent de 0.
Au seuil =10% on a t0.05 26 1.706 . Il est clair que nous ne sommes pas dans la zone de rejet. On
ne rejette donc pas au seuil de 10% l’hypothèse nulle H 0 : b 0 . En d’autres termes, au seuil de 10% b
n’est pas significativement différent de 0.
3. Testez l'hypothèse
H0:(b+c=1)
Contre Ha:(b+c 1)
aux seuils de 5 %.
4. Testez l'hypothèse
b 0
H0 :
c 0
contre
b 0
Ha :
0
c
aux seuils de 5 %.
Remarquons que nous sommes ici dans le cas particulier d’un test de nullité jointe de tous les coefficients
sauf la constante. La statistique du test est dans ce cas particulier de la forme :
R2 n p 2 /15 26
W '' . 2
1 R p 1 13 /15 2
2
7
Il est claire que nous ne sommes pas dans la zone de rejet. On ne rejette donc pas au seuil de 5% l’hypothèse
b 0
nulle H 0 : .
c 0
N’ayant pas la table au seuil de 10% on se limite ici au seul test au seuil de 5%
Exercice 4
1. La somme des carrés due à la régression pour l’ensemble des trois variables est égale à :
SC reg 1300,989
R2 0,746 ou encore 74,60%
SCtot 1743,281
3. Pour répondre à cette question, il faudrait s’assurer que les trois hypothèses du modèle sont vérifiées.
Par contre, nous ne pourrons pas le faire ici puisque nous ne connaissons pas les valeurs des
observations. Donc nous allons supposer que les trois hypothèses sont vérifiées mais dans la pratique,
il faudrait vérifier absolument.
Pour conclure que dans l’ensemble, les trois variables ont un effet significatif sur le niveau d’anxiété, il faut
faire un test de Fisher. Le modèle est :
Y 0 1 X 1 2 X 2 3 X 3
Où est la variable résiduelle sur laquelle les trois hypothèses sont faites.
L’hypothèse nulle :
H 0 : 1 2 3 0
H 1 : j 1, 2, ou 3, j 0
Le quantile de la loi de Fisher critique lu dans la table des quantiles de la loi de Fisher à 95% est égal à :
Fc ,3,18 3,159908
La statistique du test de Fisher observée est plus grande que le quantile de la loi de Fisher critique, à 95%.
Donc nous sommes dans la zone de rejet de l’hypothèse nulle H 0 . Donc nous décidons de refuser
l’hypothèse nulle H 0 et par conséquent d »accepter l’hypothèse alternative H 1 , c'est-à-dire :
j 1, 2, ou 3, j 0
8
4.
a- Le modèle est :
Y 0 1 X 1
L’hypothèse nulle
H 0 : 1 0
Contre l’hypothèse alternative
H 1 : 1 0
Calculons la statistique du test de Fisher observée qui est égale à :
Le quantile de la loi de Fisher critique lu dans la table des quantiles de la loi de Fisher à 95% est égal à :
Fc ,1, 20 4,351244
La statistique du test de Fisher observée est plus grande que le quantile de la loi de Fisher critique. Donc
nous sommes dans la zone de rejet de l »hypothèse nulle H 0 . Donc nous décidons de refuser l’hypothèse
nulle H 0 et par conséquent d’accepter l’hypothèse alternative H 1 , c'est-à-dire : 1 0
b- Le modèle est :
Y 0 1 X 1 2 X 2
L’hypothèse nulle
H0 : 2 0
Contre l’hypothèse alternative
H1 : 2 0
c-
Y 0 1 X 1 2 X 2 3 X 3
9
Fobs 5.267 et Fc,1,18 4,41
6.La valeur du coefficient associée à l’estimation du modèle spécifié est égale :
7. Le modèle qui semble le mieux adapté est le modèle (5c), car la valeur du coefficient de corrélation est
plus élevée.
Exercice 5
La FIFA veut analyser la relation du poids en fonction de celle de la taille et de l’âge des buteurs dans les
différents championnats Européens de Football. On suppose que les résidus sont indépendants et suivent
une loi N(0;σ2). On estime ce modèle par les moindres carrés ordinaires et le site de la FIFA nous donne
des informations sur une période bien définie, T =23.
1. Rappelez les hypothèses que doit vérifier le terme résiduel pour appliquer les MCO
23
R²=0,937 ; (Y Y )
t 1
t t
2
317 . 46 ; (.) sont les écarts-types
uˆ
2
SCR 2
i i Yˆi 317.46
i 1 i 1
10
Pour déterminer la SCT il suffit de remarquer que
SCR SCR SCR 317.46 317.46
R2 1 1 R é SCT 5039.05
SCT SCT 1 R 2 1 0.937 0.063
Calculez 2 .
SCR 317.46
ˆ 2 15.88
n p 23 3
ˆ1 0.51
t cal 28.49
V (ˆ1 ) 0.0179
ici au seuil =5% on a tα lue sur table de Student est égale à 2.086.
On rejette au seuil de 5% l’hypothèse nulle H0. En d’autres termes, au seuil de 5% α1 est significativement
différent de 0.
- Test de significativité sur le coefficient α2 :
Le test est de la forme :
H0:( α2=0)
vs
H1:( α2≠0)
La statistique du test est :
ˆ 2 0.35
t cal 6.25
V (
ˆ2 ) 0.056
ici au seuil =5% on a tα lue sur table de Student est égale à 2.086.
On rejette au seuil de 5% l’hypothèse nulle H0. En d’autres termes, au seuil de 5% α2 est significativement
différent de 0.
- Test de significativité sur le coefficient α3 :
Le test est de la forme :
H0:( α3=0)
vs
H1:( α3≠0)
La statistique du test est :
ˆ 3 27.3
t cal 22.75
V (ˆ 3 ) 1.2
ici au seuil =5% on a tα lue sur table de Student est égale à 2.086.
On rejette au seuil de 5% l’hypothèse nulle H0. En d’autres termes, au seuil de 5% α3 est significativement
différent de 0.
4. Testez la significativité du modèle au seuil de 5%
H0:( α1 =α2 =α3=0)
vs
H1:( α1 =α2 =α3≠0)
11
R2 n k 1
F( k ,nk 1)
1 R2 k
0.937 23 2 1
Fcal 148.730
1 0.937 2
ici au seuil =5% on a tα lue sur table de Fisher est égale à 3.49.
On rejette au seuil de 5% l’hypothèse nulle H0. En d’autres termes, au seuil de 5% α3 le modèle est
globalement significatif.
5. On s'intéresse à présent au modèle (2) suivant :
Yt 1Wt 2 Rt 3 vt (2)
avec Rt 2 Zt 3Wt 2
a) Donnez les valeurs estimées de 1 , 2 et 3 en fonction de 1 , 2 et 3 . Déduisez-en
les valeurs de 1 , 2 et 3
Yt 1Wt 2 Rt 3 vt 1Wt 2 2Z t 3Wt 2 3 vt
1 3 2 Wt 2 2 Z t 3 2 2 vt
En identifiant variable par variable on en déduit que :
1 1 3 2
2 2 2
2
3 3 2
12