Académique Documents
Professionnel Documents
Culture Documents
Curso 2012-13
Ejercicios del Tema 9
Soluciones
1 cigs
2 log(f aminc)
3 parity
4 male
5 white
+u
donde bwght es el peso del beb al nacer en onzas, cigs es el nmero de cigarrillos diarios que consumi
la madre durante el embarazo, f aminc es la renta de la familia en miles de dlares, parity es el orden
de nacimiento del nio, male es una variable cticia que vale 1 si el beb es un varn, white es otra
variable cticia que vale 1 si el beb es de raza blanca.
Utilizando los datos sobre 1388 nacimientos del chero BWGHT del libro de Wooldridge se ha
estimado el modelo obtenindose los siguientes resultados:
\
log(bwght)
=
4:66
(0:022)
(0:00085)
(0:0059)
(0:0056)
n = 1388;
(0:013)
R = 0:047
a) Manteniendo todos los dems factores constantes Cul es el efecto de fumar 10 cigarrillos
ms al da sobre el peso del beb al nacer?
b) Manteniendo todos los dems factores constantes Pesan ms en promedio los bebs de
raza blanca que los de raza no blanca? Cunto ms? Es esa diferencia estadsticamente signicativa?
c) Manteniendo todos los dems factores constantes Pesan ms en promedio los nios que
las nias? Cunto ms? Es esa diferencia estadsticamente signicativa?
d) Manteniendo todos los dems factores constantes Qu diferencia hay en promedio entre
el peso de los varones de raza blanca y de las hembras de raza no blanca?
Solucin:
a) Puesto que la variable dependiente est en logaritmos, fumar 10 cigarrillos ms al da,
manteniendo todos los dems factores constantes, supone en promedio una disminucin del peso del
beb al nacer del 4:4% (100 0:0044 10 = 4:4).
b) Puesto que el coeciente de la variable white es positivo, manteniendo constantes el resto
de los factores, los bebs de raza blanca pesan ms en promedio que los de raza no blanca, en concreto
pesan en promedio un 5:5% ms. Para ver si esa diferencia es signicativa tenemos que contrastar
H0 :
=0
H1 :
6= 0
se( b 5 )
t1382
Bajo H0
Para esta muestra t = 0:055=0:013 = 4:23 y el p-valor es prcticamente cero. Por tanto, la diferencia
es estadsticamente signicativa a cualquier nivel de signicacin razonable.
H0 :
=0
H1 :
6= 0
se( b 4 )
t1382
Bajo H0
Para esta muestra t = 0:027=0:010 = 2:7 y el p-valor es 0:0082. Por tanto, la diferencia es estadsticamente
signicativa al 1%.
d) Como 100 (0:027 + 0:055) = 8:2, tenemos que segn estos resultados los varones de raza
blanca pesan en promedio al nacer un 8:2% ms que las hembras de raza no blanca.
2.- Para analizar el salario de los profesores universitarios se utiliza el modelo:
salario =
1 Homb
2 Blanco
3 Homb
Blanco +
4 exper
+u
donde salario es el salario anual del profesor en miles de dlares, exper son los aos de experiencia
docente, Homb es una variable binaria que vale 1 si el profesor es hombre y Blanco es otra variable
binaria que vale 1 si el profesor es de raza blanca.
a) Determine el salario medio para:
a1) Hombres de raza blanca.
a2) Mujeres de raza blanca.
a3) Hombres de raza no blanca.
a4) Mujeres de raza no blanca.
b) Cul es la diferencia en el salario medio entre
b1) hombres blancos y mujeres blancas con la misma experiencia laboral?
b2) hombres blancos y hombres no blancos con la misma experiencia laboral?
b3) mujeres blancas y mujeres no blancas con la misma experiencia laboral?
b4) hombres no blancos y mujeres no blancas con la misma experiencia laboral?
c) Cmo contrastara la hiptesis La diferencia en el salario medio entre blancos y no blancos
con la misma experiencia laboral es la misma para hombres y mujeres?.
Solucin:
a1)
E(salario j Homb = 1; Blanco = 1; exper) =
4 exper
4 exper
4 exper
a2)
a3)
a4)
4 exper
b1)
E(salario j Homb = 1; Blanco = 1; exper)
=
b2)
E(salario j Homb = 1; Blanco = 1; exper)
=
b3)
E(salario j Homb = 0; Blanco = 1; exper)
=
b4)
E(salario j Homb = 1; Blanco = 0; exper)
=
c) Acabamos de ver que la diferencia en el salario medio entre blancos y no blancos con la
misma experiencia laboral es 2 + 3 para los hombres y 2 para las mujeres, y por tanto, la diferencia
ser idntica para hombres y mujeres si 3 = 0; y tendramos que contrastar
El estadstico de contraste es
t=
Rechazaremos H0 a nivel
si jtj > tn
H0 :
=0
H1 :
6= 0
se b 3
tn
Bajo H0
5; =2 :
3.- Supongamos que se rene informacin sobre salarios, educacin, experiencia y sexo a partir de
una encuesta. Adems, se pregunta sobre el consumo de marihuana. La pregunta se formula as: En
cuntas ocasiones fumaste marihuana el mes pasado?
a) Escriba un modelo que permita estimar los efectos del consumo de marihuana en el salario,
teniendo en cuenta los efectos de otros factores. El objetivo es poder realizar armaciones del tipo "si
se consume una vez ms marihuana al mes, el salario variar en promedio un x%".
b) Especique un modelo que permita contrastar si el consumo de esta droga tiene distintos
efectos en los salarios de hombres y mujeres. Cmo contrastara que el efecto de esta droga es el
mismo para hombres y mujeres?
c) Supongamos que se considera preferible medir el consumo de marihuana clasicando a
la gente en cuatro categoras: no consumidor, consumidor ocasional (de una a cinco veces al mes),
consumidor moderado (de seis a diez) y consumidor habitual (ms de diez veces al mes). Utilizando
esta clasicacin, escriba un modelo que permita estimar los efectos de esta droga sobre el salario.
d) Usando el modelo del apartado c), explique cmo contrastar la hiptesis nula de que el
consumo de marihuana no afecta al salario. La respuesta debe indicar la hiptesis nula y alternativa,
y el estadstico de contraste, la distribucin del estadstico bajo la nula y cul sera la regin crtica.
Solucin:
1 educ
2 exper
3 M uj
4 Cons_mar
+u
donde Cons_mar es el nmero de veces al mes que el individuo consume marihuana. En este modelo
100 4 es la variacin porcentual media en el salario cuando el consumo de marihuana aumenta en una
vez ms al mes, manteniendo constante los aos de educacin, la experiencia laboral y el sexo. En este
modelo el efecto del consumo de marihuana sobre el salario es idntico para hombres y para mujeres.
b) Para permitir que el consumo de marihuana tenga distinto efecto sobre el salario dependiendo
del sexo del individuo tendramos que considerar el modelo:
log(salario) =
1 educ
5 M uj
2 exper
3 M uj
4 Cons_mar
Cons_mar + u
En este modelo 100 4 es la variacin porcentual media en el salario de los hombres cuando el consumo
de marihuana aumenta en una vez ms al mes, manteniendo constante los aos de educacin, la
experiencia laboral y 100 ( 4 + 5 ) es la variacin porcentual media en el salario de las mujeres
cuando el consumo de marihuana aumenta en una vez ms al mes, manteniendo constante los aos
de educacin, la experiencia laboral. Para contrastar si existen diferencias entre hombres y mujeres
en el efecto del consumo de marihuana sobre los salarios, tenemos que contrastar H0 : 5 = 0 frente a
H1 : 5 6= 0:
c) Denimos el modelo
log(salario) =
1 educ
6 Hab
2 exper
3 M uj
4 Ocas
5 M od
(1)
+u
Ocas =
M od =
Hab =
1
0
1
0
(SCRr SCRnr ) =3
SCRnr =(n 7)
F3;n
bajo H0
si F > F3;n
7;
4.- Para contrastar la efectividad de un programa de formacin laboral sobre los salarios posteriores
de los trabajadores, especicamos el modelo
log(wage) =
1 train
2 educ
3 exper
+u
donde train es una variable binaria con valor 1 si el trabajador particip en el programa. Pensemos
que el trmino de error contiene caractersticas no observables del trabajador. Si los trabajadores
menos hbiles tienen mayores posibilidades de ser seleccionados para el programa, y se usa un anlisis
MCO, qu se puede decir sobre el sesgo probable en el estimador MCO de 1 ?
Solucin:
En el tema 2 vimos cmo determinar el signo del sesgo cuando omitimos una variable relevante,
en este caso la "habilidad" de los trabajadores. Si los trabajadores menos hbiles tienen mayores
posibilidades de ser seleccionados para el programa, u y train estarn negativamente correlacionadas,
y cmo la habilidad tiene un efecto positivo sobre el salario, el estimador MCO de 1 tendr un sesgo
negativo. Adems, puesto que cabe esperar que 1 > 0; es probable que concluyamos que el programa
es menos efectivo de lo que realmente es.
5.- Supongamos que estamos interesados en analizar las posibles diferencias en el consumo de
cerveza segn el sexo. Para ello especicamos el modelo
cerv =
1 Renta
2 M uj
3 M ujRenta
+u
donde cerv es el gasto anual en cerveza en euros, Renta es la renta anual en miles de euros, M uj es
una dummy que vale 1 para las mujeres y M ujRenta = M uj Renta. En base a una muestra de 34
individuos se ha obtenido el siguiente modelo estimado:
cerv
d = 186:47 + 2:3 Renta
(45:67)
n = 34;
126:0 M uj
(0:9)
1:3 M ujRenta
(57:01)
(1:0)
R2 = 0:5055
1 Renta
3 M ujRenta
+u
1 Renta
2 M uj
+u
1 Renta
+u
1 25
+(
3 )25
=0
H1 :
6= 0 y/o
6= 0
1 Renta
+u
y comparar el R-cuadrado de este modelo restringido, Rr2 ;con el R-cuadrado del modelo no restringido,
2 ; mediante el estadstico
Rnr
F =
2
Rnr
Rr2 =2
2 ) =30
(1 Rnr
F2;30
Bajo H0
(0:5055 0:1355) =2
= 11:22
(1 0:5055) =30
y el p-valor es P rob(F2;30 > 11:2) = 0:00023. Por tanto, podemos rechazar la hiptesis nula a
cualquier nivel de signicacin razonable y concluir que existen diferencias en el consumo de cerveza
entre hombres y mujeres.
b2) La propensin marginal al consumo de cerveza para los hombres es:
@cerv
=
@renta
^
t=
H0 :
=0
H1 :
<0
se ^ 3
t30
Bajo H0
Para esta muestra t = 1:3=1:0 = 1:3 y el p-valor es 0:1018: Por tanto, no podemos rechazar H0 al
10%; es decir, no existe suciente evidencia para armar que la propensin marginal al consumo de
cerveza es mayor para los hombres que para las mujeres.
6.- Considere el siguiente modelo
sat =
1 hsize
2 hsize
3 f emale
4 black
5 f emale
black + u
donde sat es la puntuacin en el test SAT de aptitud escolar, hsize es el nmero de alumnos en la
promocin de bachillerato (en centenares), f emale es una variable cticia que vale 1 si el individuo es
mujer, black es otra variable cticia que vale 1 si el individuo es de raza negra.
6
Utilizando los datos del chero GPA2 del libro de Wooldridge se ha estimado este modelo obtenindose
los siguientes resultados:
c = 1028:1 + 19:3 hsize
sat
(6:29)
2:19 hsize2
(3:83)
(0:527)
45:09f emale
(4:29)
(12:71)
n = 4137;
(18:15)
R = 0:0858
a) Hay evidencia fuerte de que hsize2 debera incluirse en el modelo? De acuerdo con esta
ecuacin, cul sera el tamao ptimo de la promocin?
b) Manteniendo jo hsize, cul es la diferencia estimada en sat entre las mujeres no negras
y los hombres no negros? Hasta qu punto es estadsticamente signicativa esta diferencia?
c) Manteniendo jo hsize, cul es la diferencia estimada de puntuacin SAT entre hombres
negros y hombres que no lo son? Es esa diferencia estadsticamente signicativa?
d) Manteniendo jo hsize, cul es la diferencia estimada de puntuacin SAT entre mujeres
negras y mujeres que no lo son? Qu se necesitara hacer para contrastar la hiptesis de que la
diferencia es estadsticamente signicativa?
Solucin:
a) Para ver si hay evidencia de que hsize2 debera incluirse en el modelo tenemos que
contrastar
H0 :
=0
H1 :
6= 0
se( b 2 )
t4131
Bajo H0
Para esta muestra t = 2:19=0:527 = 4:16 y el p-valor es 0:000032. Por tanto, hsize2 es estadsticamente
signicativa a cualquier nivel de signicacin razonable y hay una fuerte evidencia de que debemos
incluir hsize2 en el modelo.
El efecto marginal de hsize sobre sat es
@sat
=
@hsize
+2
2 hsize
H0 :
=0
H1 :
6= 0
se( b 3 )
t4131
Bajo H0
Para esta muestra t = 45:09=4:29 = 10:51 y el p-valor es cero. Por tanto, la diferencia es
estadsticamente signicativa a cualquier nivel de signicacin razonable.
7
c) Manteniendo jo hsize, los hombres negros obtienen en media 169:8 puntos menos en sat
que los hombres no negros. Para ver si esa diferencia es signicativa tenemos que contrastar
H0 :
=0
H1 :
6= 0
t4131
se( b 4 )
Bajo H0
Para esta muestra t = 169:8=12:71 = 13:36 y el p-valor es cero. Por tanto, la diferencia es
estadsticamente signicativa a cualquier nivel de signicacin razonable.
d) Manteniendo jo hsize, las mujeres negras obtienen en media 107:5 ( 169:8 + 62:3 =
107:5) puntos menos en sat que las mujeres no negras. Para ver si esa diferencia es signicativa
tenemos que contrastar
H0 :
=0
H1 :
6= 0
Para hacer el contraste podemos utilizar la dummy de ser hombre en lugar de la de ser mujer, as
especicaramos el modelo
sat =
1 hsize
2 hsize
3 male
4 black
5 male
black + u
En este modelo 4 mide la diferencia en sat entre mujeres negras y mujeres no negras, de forma que
en este modelo tendramos que contrastar
H0 :
=0
H1 :
6= 0
1 log(sales)
2 f inance
3 consprod
4 utility
+u
donde salary es el salario anual del director general de la empresa en miles de dlares, sales son
las ventas anuales de la empresa en millones de dlares, y f inance, consprod y utility son variables
binarias que indican el sector en el que opera la empresa (sector nanciero, sector de bienes consumo
y sector servicios). El sector omitido es el sector industrial.
a) Estime el modelo utilizando los datos del chero CEOSAL1 del libro de Wooldridge y
presente los resultados en forma de ecuacin.
b) Contraste si el salario de los directores generales depende del sector en el que opera la
empresa.
c) Manteniendo jas las ventas, calcule la diferencia porcentual promedio en el salario estimado
entre los sectores servicios e industrial Es esta diferencia estadsticamente signicativa al 1 por ciento?
d) Manteniendo jas las ventas, cul es en promedio la diferencia porcentual en el salario
estimado entre el sector de bienes de consumo y el sector nanciero? Contraste si la diferencia es
estadsticamente signicativa.
Solucin:
a) Los resultados de la estimacin son
\
log(salary)
=
(0:275)
(0:032)
(0:089)
0:353 utility
(0:097)
n = 209;
R2 = 0:336;
8
SCR = 44:33320
(0:083)
b) Tenemos que contrastar si los coecientes de las dummies sectoriales son signicativos
conjuntamente. Es decir tenemos que contrastar:
H0 :
H0 :
6= 0 y/o
=0
4
3
6= 0 y/o
6= 0
1 log(sales)
+u
(SCRr SCRnr ) =3
SCRnr =(209 4 1)
F3;204 bajo H0
(52:65600 44:33320) =3
= 12:77
44:33320=204
Como el p-valor del contraste es prcticamente cero, podemos rechazar H0 a cualquier nivel de
signicacin razonable y concluir que el salario de los directores generales depende del sector en el que
opera la empresa.
c) El salario es en promedio un 35:3% menor en el sector servicios que en el sector industrial.
Para ver si esa diferencia es estadsticamente signicativa tenemos que contrastar
H0 :
=0
H1 :
6= 0
se( b 4 )
t204
Bajo H0
(0:277)
(0:032)
(0:089)
(0:089)
0:477 utility
(0:104)
n = 209;
R2 = 0:336;
SCR = 44:33320
1 hsize
2 hsize
3 hsperc
4 sat
5 f emale
6 athlete
+u
calicaciones de los alumnos del instituto que se graduaron el mismo ao (denido de forma que, por
ejemplo, hsperc = 5 se reere al cinco por ciento de los mejores alumnos que se gradan), sat es la
puntuacin en el test SAT de aptitud escolar, f emale es una variable cticia que vale 1 si el estudiante
es mujer, athlete es otra variable cticia que vale 1 si el estudiante es atleta.
a) Estime el modelo utilizando los datos del chero GPA2 del libro de Wooldridge y presente
los resultados en forma de ecuacin. Cul es la diferencia estimada en la nota media de la universidad
entre los atletas y los que no lo son? Es esta diferencia estadsticamente signicativa?
b) Suprima sat del modelo y vuelva a estimar la ecuacin. Cul es ahora la diferencia
estimada por ser atleta? Explique por qu la estimacin es diferente de la obtenida en el apartado a.
c) Considere ahora un modelo que permita que el efecto de ser atleta sobre la nota media
diera en funcin del sexo del alumno y contraste la hiptesis nula de que, manteniendo constantes los
restantes factores, la diferencia en la nota media entre atletas y no atletas es la misma para hombres
y mujeres (incluya tambin sat en la ecuacin).
d) Considere ahora un modelo que permita que el efecto de sat sobre la nota de la universidad
pueda ser distinto para hombres y mujeres hay evidencia suciente para armar que el efecto de sat
sobre la nota de la universidad diere por sexos?.
Solucin:
a) Los resultados de la estimacin son
\ =
colgpa
1:24
(0:079)
0:0569hsize + 0:0047hsize2
(0:0164)
(0:0022)
(0:00057)
(0:000069)
(0:042)
n = 4137;
R = 0:293
Manteniendo los otros factores jos, los atletas obtienen, en media, 0:169 puntos ms de nota que
los no atletas. Para ver si esa diferencia es estadsticamente signicativa tenemos que contrastar
H0 :
=0
H1 :
6= 0
t4130
se( b 6 )
Bajo H0
1 hsize
5 f emale
2 hsize
6 athlete
10
3 hsperc
7 f emale
4 sat
athlete + u
1:24
(0:080)
0:0568hsize + 0:0047hsize2
(0:0164)
(0:0023)
(0:00057)
(0:000067)
(0:048)
(0:096)
n = 4137;
R = 0:293
La hiptesis que tenemos que contrastar para ver si la diferencia en la nota media entre atletas y no
atletas es la misma para hombres y mujeres es
H0 :
=0
H1 :
6= 0
b7
se(b 7 )
t4129
Bajo H0
Para esta muestra t = 0:08 y el p-valor es 0:94, no podemos rechazar la hiptesis nula a ningn nivel
de signicacin razonable, y por tanto concluimos que la diferencia en la nota media entre atletas y
no atletas es la misma para hombres y mujeres.
d) Para permitir que el efecto de sat sobre la nota de la universidad pueda ser distinto para
hombres y mujeres tenemos que interaccionar la variable cticia de ser mujer con sat, es decir tenemos
que considerar el modelo
colgpa =
1 hsize
3 hsperc
6 athlete
7 f emale
+ 5 f emale +
2 hsize
4 sat
sat + u
1:26
(0:097)
0:0569hsize + 0:0047hsize2
(0:0164)
(0:0022)
(0:00057)
(0:000085)
n = 4137;
(0:043)
(0:00013)
R = 0:293
La hiptesis que tenemos que contrastar para ver si el efecto de sat sobre la nota de la universidad
diere por sexos es
b7
H0 :
=0
H1 :
6= 0
se(b7 )
t4129
Bajo H0
Para esta muestra t = 0:40 y el p-valor es 0:69, no podemos rechazar la hiptesis nula a ningn nivel
de signicacin razonable, y por tanto concluimos que el efecto de sat sobre la nota de la universidad
es el mismo para hombres y mujeres.
9.- Considere el siguiente modelo que relaciona el tiempo dedicado a dormir y el dedicado a
trabajar, junto a otros factores que afectan el sueo:
sleeph =
1 totwrkh
2 educ
11
3 age
4 age
5 yngkid
+u
donde el tiempo dedicado a dormir (sleeph) y el tiempo total de trabajo (totwrkh) se miden en horas
por semana (tenga en cuenta que las variables que aparecen en el chero son sleep y totwrk; ambas
medidas en minutos por semana, y por tanto tiene que generar sleeph y totwrkh antes de estimar
el modelo). El nivel de educacin (educ) y la edad (age) se miden en aos y yngkid es una variable
binaria que toma el valor 1 si el individuo tiene hijos menores de 3 aos.
a) Estime esta ecuacin por separado para hombres y mujeres utilizando los datos del chero
SLEEP75 del libro de Wooldridge y presente los resultados en forma de ecuacin. Existen grandes
diferencias entre las dos ecuaciones estimadas?
b) Calcule el test de Chow para la igualdad de los parmetros de la ecuacin de las mujeres y
la de los hombres. Cules son los grados de libertad relevantes para este test? Se debera rechazar
H0 al 5%?
c) Estime el modelo que incluye todas las variables, la dummy de ser hombre (o la de ser
mujer), y las interacciones entre todas las variables y la dummy de ser hombre (o la de ser mujer) y
compruebe que la SCR de este modelo coincide con la suma de las SCR de las ecuaciones estimadas
para hombres y mujeres por separado que obtuvo en el apartado a.
d) Permitiendo que los trminos constantes sean distintos para hombres y mujeres, contraste
ahora si hay diferencias en las pendientes.
Solucin:
a) La ecuacin estimada para hombres es:
\ =
sleeph
60:8
(5:17)
0:182 totwrkh
(0:024)
2
n = 400;
R = 0:156;
(0:124)
(0:239)
(0:0028)
(0:984)
SCR = 17712:22
70:65
(384:89)
n = 306;
0:140 totwrkh
0:170 educ
(0:027)
(0:160)
(0:309)
R2 = 0:098;
SCR = 15913:49
(0:0037)
1:97 yngkid
(1:55)
Las ecuaciones estimadas son muy distintas. Tener hijos pequeos disminuye el tiempo dedicado
a dormir para las mujeres (en unas 2 horas a la semana) y aumenta el tiempo dedicado a dormir para
los hombres (en aproximadamente 1 hora a la semana). El efecto de la edad sobre el tiempo dedicado
a dormir tambin es muy distinto, la relacin para hombres tiene forma de U invertida mientras que
para mujeres tiene forma de U.
b) El estadstico de Chow es
F =
F6;694 bajo H0
donde SCR1 y SCR2 son las SCR que hemos obtenido en el apartado a estimando el modelo por
separado para hombres y mujeres, y SCRr es la SCR obtenida estimando el modelo con todas las
observaciones.
El valor del estadstico en la muestra es
(34240:96 (17712:22 + 15913:49)) =6
F =
= 2:12
(17712:22 + 15913:49) =(706 2 6)
y el p-valor es 0:049 por lo que podemos rechazar H0 al 5%:
c) Tenemos que estimar ahora el modelo
sleeph =
0 male
+ 3 male age
y tenemos que la SRC de este modelo es SCR = 33625:71 que coincide con SCR1 + SCR2 =
17712:22 + 15913:49:
d) El modelo restringido es ahora
sleeph =
0 male
1 totwrkh
2 educ
3 age
4 age
5 yngkid
+u
(SCRr SCRnr ) =5
SCRnr =(706 2 6)
F5;694 bajo H0
(33929:94 33625:71) =5
= 1:26
33625:71=(706 2 6)
y el p-valor es 0:28 por lo que no podemos rechazar H0 a ningn nivel de signicacin razonable
y concluimos que no hay evidencia para armar que, una vez que permitimos distintos trminos
constantes para hombres y mujeres, las pendientes sean distintas para estos dos grupos. Este es un
ejemplo en el que hay diferencias muy importantes entre los coecientes pero dichas diferencias no son
estadsticamente signicativas, seguramente porque el tamao muestral no es muy grande.
13