Vous êtes sur la page 1sur 8

UNIVERSITE DE PARIS 11

TD dconomtrie

Anne Plunket
Heteroscdasticit

1 Problme 1
Pour ce problme, il vous ait demand de travailler partir du fichier hetdat2.dta"
Cette base de donnes comprend des informations sur les niveaux de PIB (GDP) et les
population de 40 pays de lOCDE :
1. Ouvrez le fichier hetdat2.dta dans Stata et fates un graphique de la production manufacturire (manuf) en fonction du PIB - GDP -. Pour obtenir le nom des pays sur le graphique,
utilisez la commande suivante :
twoway (scatter manuf gdp, mlabel(country)), ytitle(manuf) xtitle(gdp)
2. Fates la rgression de la production manufacturire sur le PIB, sauvegardez les rsidus et
proposez un graphique des rsidus en fonction du PIB
. regress

manuf gdp

Source |
SS
df
MS
-------------+-----------------------------Model | 1.1600e+11
1 1.1600e+11
Residual | 1.4312e+10
26
550464875
-------------+-----------------------------Total | 1.3031e+11
27 4.8264e+09

Number of obs
F( 1,
26)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

28
210.73
0.0000
0.8902
0.8859
23462

-----------------------------------------------------------------------------manuf |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------gdp |
.1936932
.0133428
14.52
0.000
.1662666
.2211197
_cons |
603.8754
5699.688
0.11
0.916
-11112
12319.75
-----------------------------------------------------------------------------. predict res, resid
. scatter res gdp
. twoway (scatter res gdp, mlabel(country)), yline(0) ytitle(residuals) xtitle (gdp)

3. Que vous apprend laspect des rsidus ?


On constate que les rsidus augmentent avec la valeur du PIB, avec une exc eption qui est
la France. Le rsultat est donc quelque peu ambigu quant lexistence ou non dhtroscdasticit
4. On vous propose le test de Breush et Pagan suivant quen dduisez-vous ?

. estat hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of manuf
chi2(1)
Prob > chi2

=
=

12.77
0.0004

Le test de Breusch et Pagan rejette trs largement lhypothse dhomoscdasticit avec


une pvaleur infrieure 1%
5. Supposons que lon ne sache pas sil y a htroscdasticit. Appliquez une procdure
robuste aux erreurs de la rgression. Y a t-il une diffrence avec la rgression des MCO
prcdente et y a t-il un risque appliquer une procdure robuste dans ce cas.
. quietly regress

manuf gdp

. estimates store model1sansrobuste


. regress

manuf gdp, robust

Linear regression

Number of obs =
F( 1,
26) =
Prob > F
=
R-squared
=
Root MSE
=

28
116.39
0.0000
0.8902
23462

-----------------------------------------------------------------------------|
Robust
manuf |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------gdp |
.1936932
.0179542
10.79
0.000
.1567879
.2305985
_cons |
603.8754
3542.399
0.17
0.866
-6677.629
7885.38
-----------------------------------------------------------------------------. estimates store model1robust
. estimates table model1sansrobuste

model1robust, star(.05 .01 .001) style(oneline)

---------------------------------------------Variable | model1sansr~e
model1robust
-------------+-------------------------------gdp | .19369316***
.19369316***
_cons | 603.87543
603.87543
---------------------------------------------legend: * p<.05; ** p<.01; *** p<.001
. estimates table model1sansrobuste

model1robust, se style(oneline)

---------------------------------------Variable | model1sa~e
model1ro~t
-------------+-------------------------gdp | .19369316
.19369316
|
.0133428
.01795416
_cons | 603.87543
603.87543

|
5699.688
3542.3987
---------------------------------------legend: b/se

Il ne semble pas y avoir de diffrences importantes. En revanche, il peut tre risqu dutiliser une procdure robuste pour un si petit chantillon On constate malgr tout que les
cart-types sont un peu plus grands et par consquent les tsont plus faibles et les intervals
de confiance plus larges. La procdure robuste nest valable que de manire asymptotique
donc pour de grands chantillons, il se peut que les cart-types ajusts soient tout aussi
faux que ceux de la procdure par les MCO.

2 Problme 2
Le fichier CRIME.dta contient des donnes sur les arrestations de lannes 1986 ainsi que
dautres informations sur 2725 hommes ns en 1960 ou 1961 en Californie. Chaque homme de
lchantillon a t arrt au moins une fois avant lanne 1986.
les variables sont les suivantes :
narr86 "# times arrested, 1986"
nfarr86 "# felony arrests, 1986"
nparr86 "# property crme arr., 1986"
pcnv "proportion of prior convictions"
avgsen "avg sentence length, mos."
tottime "time in prison since 18 (mos.)"
ptime86 "mos. in prison during 1986"
qemp86 "# quarters employed, 1986"
inc86 "legal income, 1986, $100s"
durat "recent unemp duration"
black "=1 if black"
hispan "=1 if Hispanic"
born60 "=1 if born in 1960"

pcnvsq "pcnv2"

pt86sq "ptime862"

inc86sq "inc862"
1. Lire le fichier CRIME1.dta
2. Pour chacune des variables, tentez de donner limpact attendu (positif ou ngatif) sur la
variable narr86
3. Proposez une rgression des MCO et une rgression robuste de lquation suivante :
narr86 = f( narr86 pcnv avgsen avgsen2 ptime86 qemp86 inc86 black hispan).
. gen avgsen2 = avgsen*avgsen
. reg narr86 pcnv avgsen avgsen2

ptime86 qemp86 inc86 black hispan

Source |
SS
df
MS
-------------+------------------------------

Number of obs =
F( 8, 2716) =

2725
26.66

Model | 146.349121
8 18.2936401
Residual | 1863.99804 2716 .686302664
-------------+-----------------------------Total | 2010.34716 2724 .738012906

Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=

0.0000
0.0728
0.0701
.82843

-----------------------------------------------------------------------------narr86 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pcnv | -.1355954
.0403699
-3.36
0.001
-.2147542
-.0564366
avgsen |
.0178411
.009696
1.84
0.066
-.0011713
.0368534
avgsen2 | -.0005163
.000297
-1.74
0.082
-.0010987
.0000661
ptime86 |
-.03936
.0086935
-4.53
0.000
-.0564065
-.0223134
qemp86 | -.0505072
.0144345
-3.50
0.000
-.0788109
-.0222034
inc86 | -.0014797
.0003405
-4.35
0.000
-.0021474
-.0008119
black |
.3246024
.0454188
7.15
0.000
.2355435
.4136614
hispan |
.19338
.0397035
4.87
0.000
.115528
.2712321
_cons |
.5670128
.0360573
15.73
0.000
.4963102
.6377154
-----------------------------------------------------------------------------. estimates store MCO
. reg narr86 pcnv avgsen avgsen2

ptime86 qemp86 inc86 black hispan, robust

Linear regression

Number of obs
F( 8, 2716)
Prob > F
R-squared
Root MSE

=
=
=
=
=

2725
29.84
0.0000
0.0728
.82843

-----------------------------------------------------------------------------|
Robust
narr86 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pcnv | -.1355954
.0336218
-4.03
0.000
-.2015223
-.0696685
avgsen |
.0178411
.0101233
1.76
0.078
-.0020091
.0376913
avgsen2 | -.0005163
.0002077
-2.49
0.013
-.0009236
-.0001091
ptime86 |
-.03936
.0062236
-6.32
0.000
-.0515634
-.0271566
qemp86 | -.0505072
.0142015
-3.56
0.000
-.078354
-.0226603
inc86 | -.0014797
.0002295
-6.45
0.000
-.0019297
-.0010296
black |
.3246024
.0585135
5.55
0.000
.2098669
.439338
hispan |
.19338
.0402983
4.80
0.000
.1143616
.2723985
_cons |
.5670128
.0402756
14.08
0.000
.4880389
.6459867
-----------------------------------------------------------------------------. estimates store robust
. estimates table MCO

robust, se style(oneline)

---------------------------------------Variable |
MCO
robust
-------------+-------------------------pcnv | -.13559539
-.13559539
| .04036988
.03362179
avgsen | .01784106
.01784106
| .00969602
.01012332

avgsen2 | -.00051633
-.00051633
| .00029702
.00020769
ptime86 | -.03935998
-.03935998
|
.0086935
.00622356
qemp86 | -.05050717
-.05050717
| .01443452
.01420152
inc86 | -.00147966
-.00147966
| .00034053
.00022951
black | .32460243
.32460243
| .04541881
.05851354
hispan | .19338004
.19338004
| .03970348
.0402983
_cons | .56701278
.56701278
| .03605733
.04027557
----------------------------------------

4. Commentez vos rsultats (signes attendus, cart-types...)


Les grandes diffrences proviennent de avgsen et avgsen2 qui ont des cart-types robustes
plus faibles et donc des t plus levs, les coefficients sont plus significatifs. Dans la mesure
o limpact de la variable avgsen sur narr86 est quadratique, il importe de comprendre
partir de quel point la relation se retourne. La dure de la sentence a un impact positif sur
le nombre de fois que lindividu a t arrt mais au del dune certaine dure limpact
devient ngatif. Quelle est ce point ? Pour calculer le point, il faut diviser le coefficient de
avgen par 2 fois la valeur du coefficient au carr
. di _b[avgsen]/(2*_b[avgsen2])
-17.276862
Le point de retournement est donc .0178/[2*0,00052] soit 17,12 ; cela signifie que le
nombre darrestations est reli de manire positive la dure moyenne de la sentence
lorsque cette dure est infrieure 17 mois ; au del, la dure moyenne de la sentence a
bien un effet ngatif sur le nombre darrestations.
5. Fates le tes de Breusch et Pagan dexistence dhtroscdasticit partir du carr des
rsidus. Quelle statistique utilisez-vous ? Quen dduisez-vous ?
. reg narr86 pcnv avgsen avgsen2

ptime86 qemp86 inc86 black hispan

Source |
SS
df
MS
-------------+-----------------------------Model | 146.349121
8 18.2936401
Residual | 1863.99804 2716 .686302664
-------------+-----------------------------Total | 2010.34716 2724 .738012906

Number of obs
F( 8, 2716)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

2725
26.66
0.0000
0.0728
0.0701
.82843

-----------------------------------------------------------------------------narr86 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pcnv | -.1355954
.0403699
-3.36
0.001
-.2147542
-.0564366
avgsen |
.0178411
.009696
1.84
0.066
-.0011713
.0368534
avgsen2 | -.0005163
.000297
-1.74
0.082
-.0010987
.0000661
ptime86 |
-.03936
.0086935
-4.53
0.000
-.0564065
-.0223134
qemp86 | -.0505072
.0144345
-3.50
0.000
-.0788109
-.0222034
inc86 | -.0014797
.0003405
-4.35
0.000
-.0021474
-.0008119

black |
.3246024
.0454188
7.15
0.000
.2355435
.4136614
hispan |
.19338
.0397035
4.87
0.000
.115528
.2712321
_cons |
.5670128
.0360573
15.73
0.000
.4963102
.6377154
-----------------------------------------------------------------------------. predict res, resid
. gen res2 = res*res
. reg res2 pcnv avgsen avgsen2

ptime86 qemp86 inc86 black hispan

Source |
SS
df
MS
-------------+-----------------------------Model | 738.907487
8 92.3634359
Residual | 40686.1478 2716 14.9801723
-------------+-----------------------------Total | 41425.0553 2724 15.2074359

Number of obs
F( 8, 2716)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

2725
6.17
0.0000
0.0178
0.0149
3.8704

-----------------------------------------------------------------------------res2 |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pcnv |
.0172283
.1886071
0.09
0.927
-.3525997
.3870562
avgsen |
.000862
.0452996
0.02
0.985
-.0879631
.0896871
avgsen2 | -.0002494
.0013877
-0.18
0.857
-.0029704
.0024716
ptime86 | -.0797674
.0406158
-1.96
0.050
-.1594084
-.0001264
qemp86 | -.2254136
.0674377
-3.34
0.001
-.357648
-.0931792
inc86 |
-.001374
.001591
-0.86
0.388
-.0044936
.0017456
black |
.7024677
.2121956
3.31
0.001
.2863865
1.118549
hispan |
.344285
.1854937
1.86
0.064
-.019438
.708008
_cons |
1.119298
.168459
6.64
0.000
.7889776
1.449619
-----------------------------------------------------------------------------* PB LM statisti
. display 2725*0.0178
48.505
ou
. display e(N)*e(r2)
et la pvaleur est
display chi2tail(8,48.505)
7.563e-08
. display invchi2(8, 0.95)
15.507313

On rejette lhypothse nulle, il y a de lhtroscdasticit

3 Problme 3.
Pour ce dernier problme, nous allons tudier le comportement des pargnants. Nous disposons du fichier SAVING.RAW qui contient des donnes sur 100 personnes pour lanne 1970.
Les variables du modle sont les suivantes :
sav annual savings, $ (1970)
inc annual income, $ (1970)
size family size
educ years education, household head
age age of household head
black =1 if household head is black
cons annual consumption, $ (1970)
1. A partir du fichier saving.raw et des noms de variables donnes ci-dessous, entrez les
donnes, associez leur une dfinition laide de la commande variable label
. infile sav inc size educ age black cons using "C:\SAVING.RAW"
(100 observations read)
2. Compte tenu des variables du modles, pensez vous quelles peuvent crer de lhtroscdasticit, expliquez pourquoi ?
3. On vous propose la rgression et le test suivants ? Quen dduisez-vous quant lhtroscdasticit ?
. reg sav inc
Source |
SS
df
MS
-------------+-----------------------------Model |
66368437
1
66368437
Residual | 1.0019e+09
98 10223460.8
-------------+-----------------------------Total | 1.0683e+09
99 10790581.8

Number of obs
F( 1,
98)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

100
6.49
0.0124
0.0621
0.0526
3197.4

-----------------------------------------------------------------------------sav |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------inc |
.1466283
.0575488
2.55
0.012
.0324247
.260832
_cons |
124.8424
655.3931
0.19
0.849
-1175.764
1425.449
-----------------------------------------------------------------------------. estat hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of sav
chi2(1)

14.22

Le tes de Breusch et Pagan montre quil y a de lhtroscdasticit. Il nest pas possible


daccepter lhypothse nulle. La valeur critique du chi2(1) = 3,84
. display invchi2(1,.95) 3.8414588
7

4. Proposez une rgression des Moindres Carrs Quasi Gnraliss. Expliquez


. reg sav inc [aw = 1/inc]
(sum of wgt is
1.3877e-02)
Source |
SS
df
MS
-------------+-----------------------------Model | 58142339.8
1 58142339.8
Residual |
623432468
98
6361555.8
-------------+-----------------------------Total |
681574808
99 6884594.02

Number of obs
F( 1,
98)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

100
9.14
0.0032
0.0853
0.0760
2522.2

-----------------------------------------------------------------------------sav |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------inc |
.1717555
.0568128
3.02
0.003
.0590124
.2844986
_cons | -124.9528
480.8606
-0.26
0.796
-1079.205
829.2994
------------------------------------------------------------------------------