Vous êtes sur la page 1sur 9

Ingeniería Comercial

Econometría I
COM – 05223

Práctica Nº 6

6.1 ¿Cuál de las siguientes opciones es consecuencia de la heterocedasticidad?


i) Los estimadores de MCO, 𝛽̂ j, son inconsistentes.
ii) El estadístico F usual ya no tiene una distribución F.
iii) Los estimadores de MCO ya no son MELI.

6.2 Considere un modelo lineal para explicar el consumo mensual de cerveza (beer):
beer = β0 + β1 inc + β2 price + β3educ + β4 female + u
E(u|inc,price,educ, female) = 0
Var(u|inc,price,educ, female) = σ2inc2.
Escriba la ecuación transformada que tiene un término de error homocedástico.

6.3 Verdadero o falso: MCP se prefiere a MCO cuando se ha omitido una variable
importante del modelo.
FALSO o VERDADERO

6.4 Usando los datos del archivo GPA3.WF1 se estimó la siguiente ecuación para los
estudiantes que en otoño están en el segundo semestre:
trmgpa = -2.12 + .900 crsgpa + .193 cumgpa + .0014 tothrs
(.55) (.175) (.064) (.0012)
[.55] [.166] [.074] [.0012]
+ .0018 sat + .0039 hsperc + .351 female - .157 season
(.0002) (.0018) (.085) (.098)
[.0002] [.0019] [.079] [.080]
n = 269, R2 = .465.

Aquí trmgpa es el promedio general de calificaciones (GPA) del semestre actual, crsgpa es
un promedio ponderado de calificaciones de los cursos que se están tomando, cumgpa es
el promedio general de calificaciones antes del semestre presente, tothrs es el total de
horas crédito antes de este semestre, sat es la puntuación en la prueba SAT de admisión a
la universidad, hsperc es el percentil que ocupó el alumno entre los graduados del
bachillerato, female es una variable binaria para el género femenino, y season es una
variable binaria que es igual a uno si el deporte del estudiante se practica en otoño. Entre
paréntesis y entre corchetes se dan, respectivamente, los errores estándar usuales y los
errores estándar robustos a la heterocedasticidad.
i) ¿Tienen las variables crsgpa, cumgpa y tothrs los efectos estimados
esperados? ¿Cuáles de estas variables son estadísticamente significativas al
nivel de 5%? ¿Importa qué error estándar se use?
Estas variables tienen los signos anticipados. Si un estudiante toma cursos donde las
calificaciones son, en promedio, más altas, como lo refleja un mayor crsgpa, entonces sus
calificaciones serán más altas. Cuanto mejor ha sido el estudiante en el pasado, como lo mide
cumgpa, mejor lo hace (en promedio) en el semestre actual. Finalmente, esto es una medida
de la experiencia, y su coeficiente indica un retorno creciente a la experiencia. La estadística t
para crsgpa es muy grande, más de cinco usando el error estándar habitual (que es el mayor
de los dos). Usando el robusto error estándar para cumgpa, su estadística t es de
aproximadamente 2.61, lo que también es significativo al nivel del 5%. La estadística t para
tothrs es solo de aproximadamente 1.17 utilizando cualquiera de los errores estándar, por lo
que no es significativo al nivel del 5%.

ii) ¿Por qué es razonable la hipótesis H0: βcrsgpa = 1? Pruebe esta hipótesis contra
la alternativa de dos colas al nivel de 5%, usando los dos errores estándar.
Describa sus conclusiones.

Esto es más fácil de ver sin otras variables explicativas en el modelo. Si crsgpa fuera la única variable
explicativa, H0: crsgpaβ = 1 significa que, sin ningún tipo de información sobre el estudiante, el mejor
predictor del GPA de término es el GPA promedio en los cursos de los estudiantes; esto se mantiene
esencialmente por definición. (La intersección sería cero en este caso). Con variables explicativas
adicionales, no es necesariamente cierto que crsgpaβ = 1 porque crsgpa podría estar correlacionado con las
características del estudiante. (Por ejemplo, tal vez los cursos que toman los estudiantes estén
influenciados por la capacidad, medida por los puntajes de las pruebas, y el desempeño universitario
anterior). Pero todavía es interesante probar esta hipótesis.
La estadística t que utiliza el error estándar habitual es t = (.900 - 1) /. 175 ≈ −.57; el uso del error estándar
robusto de heteroesquedasticidad da t ≈ −.60. En cualquier caso, no rechazamos H0: crsgpaβ = 1 en ningún
nivel de significación razonable, incluido el 5%.

iii) Pruebe si el hecho de que el deporte del estudiante se practique en otoño


tiene efecto sobre el GPA del semestre, usando ambos errores estándar. ¿El
nivel de significancia al que se puede rechazar la prueba depende de cual error
estándar se emplee?

El efecto en la temporada viene dado por el coeficiente de la temporada, lo que implica que, en igualdad de
condiciones, el promedio de un atleta es aproximadamente .16 puntos más bajo cuando su deporte
compite. La estadística t que utiliza el error estándar habitual es aproximadamente –1.60, mientras que
usar el error estándar robusto es aproximadamente –1.96. Contra una alternativa de dos lados, el
estadístico t que usa el robusto error estándar es solo significativo al nivel del 5% (el valor crítico normal
estándar es 1.96), mientras que al usar el error estándar usual, el estadístico t no es muy significativo al
10%. Nivel% (cv ≈ 1.65). Así que el error estándar utilizado hace una diferencia en este caso. Este ejemplo es
algo inusual, ya que el error estándar robusto es más a menudo el mayor de los dos.

6.5 La variable smokes es una variable binaria igual a uno si la persona fuma e igual a cero
si no es así. Utilizando los datos del archivo SMOKE.WF1, se estima un modelo de
probabilidad lineal para smokes:
̂ = .656 + .069 log(cigpric) + .012 log(income) - .029 educ
𝑠𝑚𝑜𝑘𝑒𝑠
(.855) (.204) (.026) (.006)
[.856] [.207] [.026] [.006]
+ .020 age + .00026 age2 + .101 restaurn + .026 white
(.006) (.00006) (.039) (.052)
[.005] [.00006] [.038] [.050]
n = 807, R2 = .062.
La variable white es igual a uno si el entrevistado es blanco e igual a cero si no es así; las
demás variables independientes fueron definidas en el ejemplo 8.7. Se dan tanto los
errores estándar usuales como los errores estándar robustos a la heterocedasticidad.
Dependent Variable: SMOKES
Method: Least Squares
Date: 05/05/17 Time: 22:51
Sample: 1 807
Included observations: 807

Variable Coefficient Std. Error t-Statistic Prob.

C 0.656062 0.854962 0.767359 0.4431


LOG(CIGPRIC) -0.068926 0.204109 -0.337692 0.7357
LOG(INCOME) 0.012162 0.025724 0.472781 0.6365
EDUC -0.028880 0.005901 -4.894278 0.0000
AGE 0.019816 0.005666 3.497311 0.0005
AGESQ -0.000260 6.17E-05 -4.210195 0.0000
RESTAURN -0.100762 0.039443 -2.554610 0.0108
WHITE -0.025680 0.051517 -0.498476 0.6183

R-squared 0.061996 Mean dependent var 0.384139


Adjusted R-squared 0.053778 S.D. dependent var 0.486693
S.E. of regression 0.473425 Akaike info criterion 1.352217
Sum squared resid 179.0809 Schwarz criterion 1.398743
Log likelihood -537.6197 Hannan-Quinn criter. 1.370083
F-statistic 7.544124 Durbin-Watson stat 2.114204
Prob(F-statistic) 0.000000

i) ¿Hay alguna diferencia importante entre los dos conjuntos de errores


estándar?
No hay ninguna diferencia entre los errores estándar
ii) Permaneciendo todos los demás factores constantes, si la educación aumenta
cuatro años, ¿qué ocurre con la probabilidad estimada de fumar?
iii) Remplazando los 4 años y aplicando valor absoluto. El efecto es = - .029 educ
iv) ¿En qué punto un año más de edad reduce la probabilidad de fumar?
El efecto es = - .101restaurn
v) Interprete el coeficiente de la variable binaria restaurn (una variable que es
igual a uno si la persona vive en un lugar en el que hay restricciones para
fumar en los restaurantes).
Simplemente insertamos los valores de las variables independientes en la línea

vi) La persona número 206 de la base de datos tiene las características siguientes:
cigpric = 67.44, income = 6,500, educ = 16, age = 77, restaurn = 0, white = 0 y
smokes = 0. Calcule la probabilidad predicha de que esta persona fume.
Comente sobre el resultado.

EJERCICIOS EN COMPUTADORA
6.6 Considere el modelo siguiente para explicar el comportamiento del sueño:
sleep = β0 + β1totwrk + β2educ + β3age + β4age2 + β5yngkid + β6male + u.
i) Dé un modelo que permita que la varianza de u difiera entre hombres (male) y
mujeres. La varianza no debe depender de otros factores.
ii) Emplee los datos del archivo SLEEP75.WF1 para estimar los parámetros de la
ecuación de heterocedasticidad. (Tiene que estimar la ecuación para sleep
primero mediante MCO para obtener los residuales de MCO.) ¿Es la varianza
estimada de u mayor para los hombres o para las mujeres?
iii) ¿Es la varianza de u diferente estadísticamente para hombres y para mujeres?

6.7 i) Emplee los datos del archivo HPRICE1.WF1 para obtener errores estándar
robustos a la heterocedasticidad para la ecuación (8.17). Analice cualquier
diferencia importante con los errores estándar usuales.

Dependent Variable: PRICE


Method: Least Squares
Date: 05/01/18 Time: 09:57
Sample: 1 88
Included observations: 88

Variable Coefficient Std. Error t-Statistic Prob.

C -21.77031 29.47504 -0.738601 0.4622


LOTSIZE 0.002068 0.000642 3.220096 0.0018
SQRFT 0.122778 0.013237 9.275093 0.0000
BDRMS 13.85252 9.010145 1.537436 0.1279

R-squared 0.672362 Mean dependent var 293.5460


Adjusted R-squared 0.660661 S.D. dependent var 102.7134
S.E. of regression 59.83348 Akaike info criterion 11.06540
Sum squared resid 300723.8 Schwarz criterion 11.17800
Log likelihood -482.8775 Hannan-Quinn criter. 11.11076
F-statistic 57.46023 Durbin-Watson stat 2.109796
Prob(F-statistic) 0.000000

ii) Repita el inciso i) para la ecuación (8.18).


Method: Least Squares
Date: 05/03/17 Time: 10:23
Sample: 1 88
Included observations: 88

Variable Coefficient Std. Error t-Statistic Prob.

C -1.297042 0.651284 -1.991517 0.0497


LOG(LOTSIZE) 0.167967 0.038281 4.387714 0.0000
LOG(SQRFT) 0.700232 0.092865 7.540306 0.0000
BDRMS 0.036958 0.027531 1.342415 0.1831

R-squared 0.642965 Mean dependent var 5.633180


Adjusted R-squared 0.630214 S.D. dependent var 0.303573
S.E. of regression 0.184603 Akaike info criterion -0.496833
Sum squared resid 2.862563 Schwarz criterion -0.384227
Log likelihood 25.86066 Hannan-Quinn criter. -0.451467
F-statistic 50.42374 Durbin-Watson stat 2.088996
Prob(F-statistic) 0.000000
iii) ¿Qué indican estos ejemplos acerca de la heterocedasticidad y de la
transformación usada para la variable dependiente?

6.8 Para este ejercicio emplee el archivo VOTE1.WF1.


i) Estime un modelo en el que voteA sea la variable dependiente y prtystrA,
democA, log(expendA) y log(expendB) sean las variables independientes.
Obtenga los residuales de MCO, 𝑢̂𝑖 , y regrese estos sobre todas las variables
independientes. Explique por qué obtiene R2 = 0.

Dependent Variable: VOTEA


Method: Least Squares
Date: 05/03/17 Time: 11:53
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.

C 37.66142 4.736036 7.952097 0.0000


PRTYSTRA 0.251918 0.071293 3.533575 0.0005
DEMOCA 3.792943 1.406520 2.696687 0.0077
LOG(EXPENDA) 5.779294 0.391820 14.74988 0.0000
LOG(EXPENDB) -6.237836 0.397460 -15.69427 0.0000

R-squared 0.801163 Mean dependent var 50.50289


Adjusted R-squared 0.796429 S.D. dependent var 16.78476
S.E. of regression 7.573085 Akaike info criterion 6.915554
Sum squared resid 9635.071 Schwarz criterion 7.006690
Log likelihood -593.1954 Hannan-Quinn criter. 6.952527
F-statistic 169.2288 Durbin-Watson stat 1.524816
Prob(F-statistic) 0.000000

i) Ahora calcule la prueba de Breusch-Pagan para heterocedasticidad. Emplee la


versión del estadístico F y del valor-p.

Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 2.330113 Prob. F(4,168) 0.0581


Obs*R-squared 9.093356 Prob. Chi-Square(4) 0.0588
Scaled explained SS 9.354395 Prob. Chi-Square(4) 0.0528

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/17 Time: 12:47
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.

C 113.9635 50.81503 2.242712 0.0262


PRTYSTRA -0.299264 0.764929 -0.391231 0.6961
DEMOCA 15.61921 15.09118 1.034990 0.3022
LOG(EXPENDA) -10.30573 4.204008 -2.451405 0.0153
LOG(EXPENDB) -0.051404 4.264520 -0.012054 0.9904

R-squared 0.052563 Mean dependent var 55.69405


Adjusted R-squared 0.030005 S.D. dependent var 82.50214
S.E. of regression 81.25499 Akaike info criterion 11.66154
Sum squared resid 1109199. Schwarz criterion 11.75267
Log likelihood -1003.723 Hannan-Quinn criter. 11.69851
F-statistic 2.330113 Durbin-Watson stat 1.912911
Prob(F-statistic) 0.058058

ii) Calcule el caso especial de la prueba de White para heterocedasticidad,


usando de nuevo la forma del estadístico F. ¿Qué tan fuerte es ahora la
evidencia de heterocedasticidad?
Heteroskedasticity Test: White

F-statistic 1.447472 Prob. F(4,168) 0.2206


Obs*R-squared 5.763573 Prob. Chi-Square(4) 0.2175
Scaled explained SS 5.929025 Prob. Chi-Square(4) 0.2045

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/17 Time: 16:53
Sample: 1 173
Included observations: 173

Variable Coefficient Std. Error t-Statistic Prob.

C 95.11817 31.35934 3.033169 0.0028


PRTYSTRA^2 -0.007030 0.007807 -0.900423 0.3692
DEMOCA^2 8.637002 15.36130 0.562257 0.5747
LOG(EXPENDA)^2 -0.739623 0.522725 -1.414938 0.1589
LOG(EXPENDB)^2 -0.206295 0.505968 -0.407723 0.6840

R-squared 0.033315 Mean dependent var 55.69405


Adjusted R-squared 0.010299 S.D. dependent var 82.50214
S.E. of regression 82.07619 Akaike info criterion 11.68165
Sum squared resid 1131732. Schwarz criterion 11.77278
Log likelihood -1005.463 Hannan-Quinn criter. 11.71862
F-statistic 1.447472 Durbin-Watson stat 1.961412
Prob(F-statistic) 0.220563

6.9 Para este ejercicio emplee los datos del archivo PNTSPRD.WF1.
i) La variable sprdcvr es una variable binaria que es igual a uno si en un partido
de baloncesto universitario se cubrió la diferencia de puntos predicha en Las
Vegas. El valor esperado para sprdcvr, por ejemplo µ, es la probabilidad de que
la diferencia sea cubierta en un partido seleccionado al azar. Pruebe H0: µ = .5
contra H1: µ ≠ .5 al nivel de significancia de 10% y analice sus hallazgos.
(Sugerencia: esto puede hacerse fácilmente usando una prueba t en la
regresión de sprdcvr sobre solo un intercepto.)
ii) Dependent Variable: SPRDCVR
Method: Least Squares
Date: 05/03/17 Time: 18:25
Sample: 1 553
Included observations: 553

Variable Coefficient Std. Error t-Statistic Prob.


C 0.515371 0.021271 24.22839 0.0000

R-squared 0.000000 Mean dependent var 0.515371


Adjusted R-squared 0.000000 S.D. dependent var 0.500216
S.E. of regression 0.500216 Akaike info criterion 1.454254
Sum squared resid 138.1193 Schwarz criterion 1.462057
Log likelihood -401.1012 Hannan-Quinn criter. 1.457303
Durbin-Watson stat 2.048953

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

t-statistic 0.722601 552 0.4702


F-statistic 0.522152 (1, 552) 0.4702
Chi-square 0.522152 1 0.4699

Null Hypothesis: C(1)=0.5


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

-0.5 + C(1) 0.015371 0.021271

iii) ¿Cuántos de los 553 partidos se jugaron en un campo neutral?


iv) Estime el modelo de probabilidad lineal
sprdcvr = β0 + β1favhome + β2neutral + β3fav25 + β4und25 + u
y reporte los resultados en la forma habitual. (De los errores estándar usuales
de MCO y los errores estándar robustos a la heterocedasticidad.) ¿Qué
variable es más significativa tanto estadística como prácticamente?
i) Explique por qué bajo la hipótesis nula H0: β1 = β2 = β3 = β4 = 0, no hay
heterocedasticidad en el modelo.
ii) Emplee el estadístico F usual para probar la hipótesis del inciso iv). ¿Qué
concluye usted?
iii) Dado el análisis previo, ¿diría que es posible predecir de manera sistemática si
la diferencia de puntos predicha en Las Vegas se lograra usando la información
disponible antes del partido?

6.10 Para este ejercicio emplee los datos del archivo GPA1.WF1.
i) Emplee MCO para estimar un modelo que relacione colGPA con hsGPA, ACT,
skipped y PC. Obtenga los residuales de MCO.
ii) Calcule el caso especial de la prueba de White para heterocedasticidad. En la
̂ , 𝑐𝑜𝑙𝐺𝑃𝐴
regresión de 𝑢̂𝑖2 sobre 𝑐𝑜𝑙𝐺𝑃𝐴𝑖 ̂ 𝑖2 , obtenga los valores ajustados, es
decir ℎ̂𝑖 .
iii) Verifique que los valores ajustados del inciso ii) sean todos estrictamente
positivos. Después obtenga las estimaciones de mínimos cuadrados
ponderados usando como ponderadores 1/ℎ̂𝑖 . Compare las estimaciones de
minimos cuadrados ponderados con las correspondientes estimaciones de
MCO para el efecto del número de clases perdidas por semana (skipped) y el
efecto de poseer una computadora (PC). ¿Qué puede decir de su significancia
estadística?.
iv) En la estimación por MCP del inciso iii), obtenga los errores estándar robustos
a la heterocedasticidad. En otras palabras, considere la posibilidad de que la
función de varianza estimada en el inciso ii) pueda estar mal especificada.
¿Varían mucho los errores estándar de los del inciso iii)?

6.11 Para esta pregunta utilice los datos del archivo 401KSUBS.WF1, restringiendo la
muestra a fsize = 1.
i) Al modelo estimado en la tabla 8.1, agregue el termino de interacción,
e401k*inc. Estime esta ecuación por MCO y obtenga los errores estándar
usuales y robustos. ¿Qué concluye acerca de la significancia estadística del
término de interacción?
ii) Ahora estime el modelo más general por MCP empleando los mismos
ponderadores, 1/inci, que en la tabla 8.1. Calcule los errores estándar usuales y
robustos para los estimadores de MCP. Usando los errores estándar robustos,
¿es el término de interacción estadísticamente significativo?
iii) En el modelo más general, analice el coeficiente de MCP de e401k. ¿Es este
coeficiente de mucho interés en sí mismo? Explique.
iv) Vuelva a estimar el modelo por MCP, pero use el termino de interacción
e401k*(inc-30); el ingreso promedio en la muestra es aproximadamente 29.44.
Interprete ahora el coeficiente de e401k.

Guías para las respuestas


6.6 (ii) û2 = 189,359.2 – 28,849.6 male + residual
(20,546.4) (27,296.5)
n = 706, R2 = .0016.
̂ = −21.77 + .00207 lotsize + .123 sqrft + 13.85 bdrms
6.7 (i) price
(29.48) (.00064) (.013) (9.01)
[36.28] [.00122] [.017] [8.28]
n = 88, R2 = .672
̂ ) = 5.61 + .168 log(lotsize) + .700 log(sqrft) + .037 bdrms
(ii) log(price
(0.65) (.038) (.093) (.028)
[0.76] [.041] [.101] [.030]
n = 88, R2 = .643.
̂
6.8 (i) voteA = 37.66 + .252 prtystrA + 3.793 democA + 5.779 log(expendA)
(4.74) (.071) (1.407) (0.392)

− 6.238 log(expendB) + ˆu
(0.397)
̅2 = .796.
n = 173, R2 = .801, R
(ii) F(4,168)=2.33
(iii) F(2,170)=2.79
6.9 (i) μ
̂≈.515. t≈0.71 ii)35
̂ = .490 + .035 favhome + .118 neutral − .023 fav25 + .018 und25
(iii) sprdcvr
(.045) (.050) (.095) (.050) (.092)
2
n = 553, R = .0034.
(v) F(4,548)= 0.47
̂ =1.36 + .412 hsGPA + .013 ACT − .071 skipped + .124 PC
6.10 (i) colGPA
(.33) (.092) (.010) (.026) (.057)
̅2=.23
n = 141, R2 = .259, R
(ii) F(2,138)=3.58
̂ =.40 + .402 hsGPA + .013 ACT − .076 skipped + .126 PC
(iii) colGPA
(.30) (.083) (.010) (.022) (.056)
2 ̅ 2
n = 141, R = .306, R =2.28
̂ =1.40 + .402 hsGPA + .013 ACT − .076 skipped + .126 PC
(iv) colGPA
(.31) (.086) (.010) (.021) (.059)
2
n = 141, R = .306, R ̅ =2.28
2

̂ =−17.20 + .628 inc− .0251(age-25)2 + 2.54male − 3.83e401k −.343


6.11 (i) nettfa
e401k*inc
(2.82) (.080) (.0026) (2.04) (4.40) (.124)
[3.23] [.098] [.0044] [2.06] [6.25] [.220]
2
n = 2,017, R = .131
̂ =−14.09 +.619 inc + .0175(age − 25)2 + 1.78 male − 2.17 e401k + .295
(ii) nettfa
e401k⋅inc
(2.27) (.084) (.0019) (1.56) (3.66) (.130)
[2.53] [.091] [.0026] [1.31] [3.51] [.160]
n = 2,017, R2 = .114

Vous aimerez peut-être aussi