Académique Documents
Professionnel Documents
Culture Documents
Econometría I
COM – 05223
Práctica Nº 6
6.2 Considere un modelo lineal para explicar el consumo mensual de cerveza (beer):
beer = β0 + β1 inc + β2 price + β3educ + β4 female + u
E(u|inc,price,educ, female) = 0
Var(u|inc,price,educ, female) = σ2inc2.
Escriba la ecuación transformada que tiene un término de error homocedástico.
6.3 Verdadero o falso: MCP se prefiere a MCO cuando se ha omitido una variable
importante del modelo.
FALSO o VERDADERO
6.4 Usando los datos del archivo GPA3.WF1 se estimó la siguiente ecuación para los
estudiantes que en otoño están en el segundo semestre:
trmgpa = -2.12 + .900 crsgpa + .193 cumgpa + .0014 tothrs
(.55) (.175) (.064) (.0012)
[.55] [.166] [.074] [.0012]
+ .0018 sat + .0039 hsperc + .351 female - .157 season
(.0002) (.0018) (.085) (.098)
[.0002] [.0019] [.079] [.080]
n = 269, R2 = .465.
Aquí trmgpa es el promedio general de calificaciones (GPA) del semestre actual, crsgpa es
un promedio ponderado de calificaciones de los cursos que se están tomando, cumgpa es
el promedio general de calificaciones antes del semestre presente, tothrs es el total de
horas crédito antes de este semestre, sat es la puntuación en la prueba SAT de admisión a
la universidad, hsperc es el percentil que ocupó el alumno entre los graduados del
bachillerato, female es una variable binaria para el género femenino, y season es una
variable binaria que es igual a uno si el deporte del estudiante se practica en otoño. Entre
paréntesis y entre corchetes se dan, respectivamente, los errores estándar usuales y los
errores estándar robustos a la heterocedasticidad.
i) ¿Tienen las variables crsgpa, cumgpa y tothrs los efectos estimados
esperados? ¿Cuáles de estas variables son estadísticamente significativas al
nivel de 5%? ¿Importa qué error estándar se use?
Estas variables tienen los signos anticipados. Si un estudiante toma cursos donde las
calificaciones son, en promedio, más altas, como lo refleja un mayor crsgpa, entonces sus
calificaciones serán más altas. Cuanto mejor ha sido el estudiante en el pasado, como lo mide
cumgpa, mejor lo hace (en promedio) en el semestre actual. Finalmente, esto es una medida
de la experiencia, y su coeficiente indica un retorno creciente a la experiencia. La estadística t
para crsgpa es muy grande, más de cinco usando el error estándar habitual (que es el mayor
de los dos). Usando el robusto error estándar para cumgpa, su estadística t es de
aproximadamente 2.61, lo que también es significativo al nivel del 5%. La estadística t para
tothrs es solo de aproximadamente 1.17 utilizando cualquiera de los errores estándar, por lo
que no es significativo al nivel del 5%.
ii) ¿Por qué es razonable la hipótesis H0: βcrsgpa = 1? Pruebe esta hipótesis contra
la alternativa de dos colas al nivel de 5%, usando los dos errores estándar.
Describa sus conclusiones.
Esto es más fácil de ver sin otras variables explicativas en el modelo. Si crsgpa fuera la única variable
explicativa, H0: crsgpaβ = 1 significa que, sin ningún tipo de información sobre el estudiante, el mejor
predictor del GPA de término es el GPA promedio en los cursos de los estudiantes; esto se mantiene
esencialmente por definición. (La intersección sería cero en este caso). Con variables explicativas
adicionales, no es necesariamente cierto que crsgpaβ = 1 porque crsgpa podría estar correlacionado con las
características del estudiante. (Por ejemplo, tal vez los cursos que toman los estudiantes estén
influenciados por la capacidad, medida por los puntajes de las pruebas, y el desempeño universitario
anterior). Pero todavía es interesante probar esta hipótesis.
La estadística t que utiliza el error estándar habitual es t = (.900 - 1) /. 175 ≈ −.57; el uso del error estándar
robusto de heteroesquedasticidad da t ≈ −.60. En cualquier caso, no rechazamos H0: crsgpaβ = 1 en ningún
nivel de significación razonable, incluido el 5%.
El efecto en la temporada viene dado por el coeficiente de la temporada, lo que implica que, en igualdad de
condiciones, el promedio de un atleta es aproximadamente .16 puntos más bajo cuando su deporte
compite. La estadística t que utiliza el error estándar habitual es aproximadamente –1.60, mientras que
usar el error estándar robusto es aproximadamente –1.96. Contra una alternativa de dos lados, el
estadístico t que usa el robusto error estándar es solo significativo al nivel del 5% (el valor crítico normal
estándar es 1.96), mientras que al usar el error estándar usual, el estadístico t no es muy significativo al
10%. Nivel% (cv ≈ 1.65). Así que el error estándar utilizado hace una diferencia en este caso. Este ejemplo es
algo inusual, ya que el error estándar robusto es más a menudo el mayor de los dos.
6.5 La variable smokes es una variable binaria igual a uno si la persona fuma e igual a cero
si no es así. Utilizando los datos del archivo SMOKE.WF1, se estima un modelo de
probabilidad lineal para smokes:
̂ = .656 + .069 log(cigpric) + .012 log(income) - .029 educ
𝑠𝑚𝑜𝑘𝑒𝑠
(.855) (.204) (.026) (.006)
[.856] [.207] [.026] [.006]
+ .020 age + .00026 age2 + .101 restaurn + .026 white
(.006) (.00006) (.039) (.052)
[.005] [.00006] [.038] [.050]
n = 807, R2 = .062.
La variable white es igual a uno si el entrevistado es blanco e igual a cero si no es así; las
demás variables independientes fueron definidas en el ejemplo 8.7. Se dan tanto los
errores estándar usuales como los errores estándar robustos a la heterocedasticidad.
Dependent Variable: SMOKES
Method: Least Squares
Date: 05/05/17 Time: 22:51
Sample: 1 807
Included observations: 807
vi) La persona número 206 de la base de datos tiene las características siguientes:
cigpric = 67.44, income = 6,500, educ = 16, age = 77, restaurn = 0, white = 0 y
smokes = 0. Calcule la probabilidad predicha de que esta persona fume.
Comente sobre el resultado.
EJERCICIOS EN COMPUTADORA
6.6 Considere el modelo siguiente para explicar el comportamiento del sueño:
sleep = β0 + β1totwrk + β2educ + β3age + β4age2 + β5yngkid + β6male + u.
i) Dé un modelo que permita que la varianza de u difiera entre hombres (male) y
mujeres. La varianza no debe depender de otros factores.
ii) Emplee los datos del archivo SLEEP75.WF1 para estimar los parámetros de la
ecuación de heterocedasticidad. (Tiene que estimar la ecuación para sleep
primero mediante MCO para obtener los residuales de MCO.) ¿Es la varianza
estimada de u mayor para los hombres o para las mujeres?
iii) ¿Es la varianza de u diferente estadísticamente para hombres y para mujeres?
6.7 i) Emplee los datos del archivo HPRICE1.WF1 para obtener errores estándar
robustos a la heterocedasticidad para la ecuación (8.17). Analice cualquier
diferencia importante con los errores estándar usuales.
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/17 Time: 12:47
Sample: 1 173
Included observations: 173
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/17 Time: 16:53
Sample: 1 173
Included observations: 173
6.9 Para este ejercicio emplee los datos del archivo PNTSPRD.WF1.
i) La variable sprdcvr es una variable binaria que es igual a uno si en un partido
de baloncesto universitario se cubrió la diferencia de puntos predicha en Las
Vegas. El valor esperado para sprdcvr, por ejemplo µ, es la probabilidad de que
la diferencia sea cubierta en un partido seleccionado al azar. Pruebe H0: µ = .5
contra H1: µ ≠ .5 al nivel de significancia de 10% y analice sus hallazgos.
(Sugerencia: esto puede hacerse fácilmente usando una prueba t en la
regresión de sprdcvr sobre solo un intercepto.)
ii) Dependent Variable: SPRDCVR
Method: Least Squares
Date: 05/03/17 Time: 18:25
Sample: 1 553
Included observations: 553
Wald Test:
Equation: Untitled
6.10 Para este ejercicio emplee los datos del archivo GPA1.WF1.
i) Emplee MCO para estimar un modelo que relacione colGPA con hsGPA, ACT,
skipped y PC. Obtenga los residuales de MCO.
ii) Calcule el caso especial de la prueba de White para heterocedasticidad. En la
̂ , 𝑐𝑜𝑙𝐺𝑃𝐴
regresión de 𝑢̂𝑖2 sobre 𝑐𝑜𝑙𝐺𝑃𝐴𝑖 ̂ 𝑖2 , obtenga los valores ajustados, es
decir ℎ̂𝑖 .
iii) Verifique que los valores ajustados del inciso ii) sean todos estrictamente
positivos. Después obtenga las estimaciones de mínimos cuadrados
ponderados usando como ponderadores 1/ℎ̂𝑖 . Compare las estimaciones de
minimos cuadrados ponderados con las correspondientes estimaciones de
MCO para el efecto del número de clases perdidas por semana (skipped) y el
efecto de poseer una computadora (PC). ¿Qué puede decir de su significancia
estadística?.
iv) En la estimación por MCP del inciso iii), obtenga los errores estándar robustos
a la heterocedasticidad. En otras palabras, considere la posibilidad de que la
función de varianza estimada en el inciso ii) pueda estar mal especificada.
¿Varían mucho los errores estándar de los del inciso iii)?
6.11 Para esta pregunta utilice los datos del archivo 401KSUBS.WF1, restringiendo la
muestra a fsize = 1.
i) Al modelo estimado en la tabla 8.1, agregue el termino de interacción,
e401k*inc. Estime esta ecuación por MCO y obtenga los errores estándar
usuales y robustos. ¿Qué concluye acerca de la significancia estadística del
término de interacción?
ii) Ahora estime el modelo más general por MCP empleando los mismos
ponderadores, 1/inci, que en la tabla 8.1. Calcule los errores estándar usuales y
robustos para los estimadores de MCP. Usando los errores estándar robustos,
¿es el término de interacción estadísticamente significativo?
iii) En el modelo más general, analice el coeficiente de MCP de e401k. ¿Es este
coeficiente de mucho interés en sí mismo? Explique.
iv) Vuelva a estimar el modelo por MCP, pero use el termino de interacción
e401k*(inc-30); el ingreso promedio en la muestra es aproximadamente 29.44.
Interprete ahora el coeficiente de e401k.
− 6.238 log(expendB) + ˆu
(0.397)
̅2 = .796.
n = 173, R2 = .801, R
(ii) F(4,168)=2.33
(iii) F(2,170)=2.79
6.9 (i) μ
̂≈.515. t≈0.71 ii)35
̂ = .490 + .035 favhome + .118 neutral − .023 fav25 + .018 und25
(iii) sprdcvr
(.045) (.050) (.095) (.050) (.092)
2
n = 553, R = .0034.
(v) F(4,548)= 0.47
̂ =1.36 + .412 hsGPA + .013 ACT − .071 skipped + .124 PC
6.10 (i) colGPA
(.33) (.092) (.010) (.026) (.057)
̅2=.23
n = 141, R2 = .259, R
(ii) F(2,138)=3.58
̂ =.40 + .402 hsGPA + .013 ACT − .076 skipped + .126 PC
(iii) colGPA
(.30) (.083) (.010) (.022) (.056)
2 ̅ 2
n = 141, R = .306, R =2.28
̂ =1.40 + .402 hsGPA + .013 ACT − .076 skipped + .126 PC
(iv) colGPA
(.31) (.086) (.010) (.021) (.059)
2
n = 141, R = .306, R ̅ =2.28
2