Vous êtes sur la page 1sur 13

Estadstica e Introduccin a la Econometra

Curso 2012-13
Ejercicios del Tema 9
Soluciones

1.- Considere el siguiente modelo para el peso de un beb al nacer


log(bwght) =

1 cigs

2 log(f aminc)

3 parity

4 male

5 white

+u

donde bwght es el peso del beb al nacer en onzas, cigs es el nmero de cigarrillos diarios que consumi
la madre durante el embarazo, f aminc es la renta de la familia en miles de dlares, parity es el orden
de nacimiento del nio, male es una variable cticia que vale 1 si el beb es un varn, white es otra
variable cticia que vale 1 si el beb es de raza blanca.
Utilizando los datos sobre 1388 nacimientos del chero BWGHT del libro de Wooldridge se ha
estimado el modelo obtenindose los siguientes resultados:
\
log(bwght)
=

4:66

(0:022)

0:0044 cigs + 0:0093 log(f aminc) + 0:016 parity

(0:00085)

(0:0059)

(0:0056)

+0:027 male + 0:055 white


(0:010)

n = 1388;

(0:013)

R = 0:047

a) Manteniendo todos los dems factores constantes Cul es el efecto de fumar 10 cigarrillos
ms al da sobre el peso del beb al nacer?
b) Manteniendo todos los dems factores constantes Pesan ms en promedio los bebs de
raza blanca que los de raza no blanca? Cunto ms? Es esa diferencia estadsticamente signicativa?
c) Manteniendo todos los dems factores constantes Pesan ms en promedio los nios que
las nias? Cunto ms? Es esa diferencia estadsticamente signicativa?
d) Manteniendo todos los dems factores constantes Qu diferencia hay en promedio entre
el peso de los varones de raza blanca y de las hembras de raza no blanca?
Solucin:
a) Puesto que la variable dependiente est en logaritmos, fumar 10 cigarrillos ms al da,
manteniendo todos los dems factores constantes, supone en promedio una disminucin del peso del
beb al nacer del 4:4% (100 0:0044 10 = 4:4).
b) Puesto que el coeciente de la variable white es positivo, manteniendo constantes el resto
de los factores, los bebs de raza blanca pesan ms en promedio que los de raza no blanca, en concreto
pesan en promedio un 5:5% ms. Para ver si esa diferencia es signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

se( b 5 )

t1382

Bajo H0

Para esta muestra t = 0:055=0:013 = 4:23 y el p-valor es prcticamente cero. Por tanto, la diferencia
es estadsticamente signicativa a cualquier nivel de signicacin razonable.

c) Puesto que el coeciente de la variable male es positivo, manteniendo constantes el resto


de los factores, los nios pesan ms en promedio al nacer que las nias, en concreto pesan en promedio
un 2:7% ms. Para ver si esa diferencia es signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

se( b 4 )

t1382

Bajo H0

Para esta muestra t = 0:027=0:010 = 2:7 y el p-valor es 0:0082. Por tanto, la diferencia es estadsticamente
signicativa al 1%.
d) Como 100 (0:027 + 0:055) = 8:2, tenemos que segn estos resultados los varones de raza
blanca pesan en promedio al nacer un 8:2% ms que las hembras de raza no blanca.
2.- Para analizar el salario de los profesores universitarios se utiliza el modelo:
salario =

1 Homb

2 Blanco

3 Homb

Blanco +

4 exper

+u

donde salario es el salario anual del profesor en miles de dlares, exper son los aos de experiencia
docente, Homb es una variable binaria que vale 1 si el profesor es hombre y Blanco es otra variable
binaria que vale 1 si el profesor es de raza blanca.
a) Determine el salario medio para:
a1) Hombres de raza blanca.
a2) Mujeres de raza blanca.
a3) Hombres de raza no blanca.
a4) Mujeres de raza no blanca.
b) Cul es la diferencia en el salario medio entre
b1) hombres blancos y mujeres blancas con la misma experiencia laboral?
b2) hombres blancos y hombres no blancos con la misma experiencia laboral?
b3) mujeres blancas y mujeres no blancas con la misma experiencia laboral?
b4) hombres no blancos y mujeres no blancas con la misma experiencia laboral?
c) Cmo contrastara la hiptesis La diferencia en el salario medio entre blancos y no blancos
con la misma experiencia laboral es la misma para hombres y mujeres?.
Solucin:
a1)
E(salario j Homb = 1; Blanco = 1; exper) =

E(salario j Homb = 0; Blanco = 1; exper) =

4 exper

E(salario j Homb = 1; Blanco = 0; exper) =

4 exper

E(salario j Homb = 0; Blanco = 0; exper) =

4 exper

a2)

a3)

a4)

4 exper

b1)
E(salario j Homb = 1; Blanco = 1; exper)
=

E(salario j Homb = 0; Blanco = 1; exper)

b2)
E(salario j Homb = 1; Blanco = 1; exper)
=

E(salario j Homb = 1; Blanco = 0; exper)

b3)
E(salario j Homb = 0; Blanco = 1; exper)
=

E(salario j Homb = 0; Blanco = 0; exper)

b4)
E(salario j Homb = 1; Blanco = 0; exper)
=

E(salario j Homb = 0; Blanco = 0; exper)

c) Acabamos de ver que la diferencia en el salario medio entre blancos y no blancos con la
misma experiencia laboral es 2 + 3 para los hombres y 2 para las mujeres, y por tanto, la diferencia
ser idntica para hombres y mujeres si 3 = 0; y tendramos que contrastar

El estadstico de contraste es
t=
Rechazaremos H0 a nivel

si jtj > tn

H0 :

=0

H1 :

6= 0

se b 3

tn

Bajo H0

5; =2 :

3.- Supongamos que se rene informacin sobre salarios, educacin, experiencia y sexo a partir de
una encuesta. Adems, se pregunta sobre el consumo de marihuana. La pregunta se formula as: En
cuntas ocasiones fumaste marihuana el mes pasado?
a) Escriba un modelo que permita estimar los efectos del consumo de marihuana en el salario,
teniendo en cuenta los efectos de otros factores. El objetivo es poder realizar armaciones del tipo "si
se consume una vez ms marihuana al mes, el salario variar en promedio un x%".
b) Especique un modelo que permita contrastar si el consumo de esta droga tiene distintos
efectos en los salarios de hombres y mujeres. Cmo contrastara que el efecto de esta droga es el
mismo para hombres y mujeres?
c) Supongamos que se considera preferible medir el consumo de marihuana clasicando a
la gente en cuatro categoras: no consumidor, consumidor ocasional (de una a cinco veces al mes),
consumidor moderado (de seis a diez) y consumidor habitual (ms de diez veces al mes). Utilizando
esta clasicacin, escriba un modelo que permita estimar los efectos de esta droga sobre el salario.
d) Usando el modelo del apartado c), explique cmo contrastar la hiptesis nula de que el
consumo de marihuana no afecta al salario. La respuesta debe indicar la hiptesis nula y alternativa,
y el estadstico de contraste, la distribucin del estadstico bajo la nula y cul sera la regin crtica.
Solucin:

a) El modelo que tenemos que considerar es


log(salario) =

1 educ

2 exper

3 M uj

4 Cons_mar

+u

donde Cons_mar es el nmero de veces al mes que el individuo consume marihuana. En este modelo
100 4 es la variacin porcentual media en el salario cuando el consumo de marihuana aumenta en una
vez ms al mes, manteniendo constante los aos de educacin, la experiencia laboral y el sexo. En este
modelo el efecto del consumo de marihuana sobre el salario es idntico para hombres y para mujeres.
b) Para permitir que el consumo de marihuana tenga distinto efecto sobre el salario dependiendo
del sexo del individuo tendramos que considerar el modelo:
log(salario) =

1 educ

5 M uj

2 exper

3 M uj

4 Cons_mar

Cons_mar + u

En este modelo 100 4 es la variacin porcentual media en el salario de los hombres cuando el consumo
de marihuana aumenta en una vez ms al mes, manteniendo constante los aos de educacin, la
experiencia laboral y 100 ( 4 + 5 ) es la variacin porcentual media en el salario de las mujeres
cuando el consumo de marihuana aumenta en una vez ms al mes, manteniendo constante los aos
de educacin, la experiencia laboral. Para contrastar si existen diferencias entre hombres y mujeres
en el efecto del consumo de marihuana sobre los salarios, tenemos que contrastar H0 : 5 = 0 frente a
H1 : 5 6= 0:
c) Denimos el modelo
log(salario) =

1 educ

6 Hab

2 exper

3 M uj

4 Ocas

5 M od

(1)

+u

donde la categora omitida es no consumir marihuana y


1
0

Ocas =

M od =
Hab =

1
0
1
0

si consume marihuana de 1 a 5 veces al mes


en caso contrario
si consume marihuana de 6 a 10 veces al mes
en caso contrario
si consume marihuana ms de 10 veces al mes
en caso contrario

d) En el modelo del apartado c) la hiptesis nula de que el consumo de marihuana no afecta


al salario es H0 : 4 = 5 = 6 = 0. Para contrastar esta hiptesis tendramos que estimar el modelo
restringido
log(salario) = 0 + 1 educ + 2 exper + 3 M uj + u
(2)
y comparar la suma cuadrtica residual de este modelo restringido (2), SCRr ;con la suma cuadrtica
residual del modelo no restringido (1), SCRnr ; mediante el estadstico F
F =

(SCRr SCRnr ) =3
SCRnr =(n 7)

F3;n

Una vez calculado el estadstico F , rechazaramos H0 a nivel

bajo H0
si F > F3;n

7;

4.- Para contrastar la efectividad de un programa de formacin laboral sobre los salarios posteriores
de los trabajadores, especicamos el modelo
log(wage) =

1 train

2 educ

3 exper

+u

donde train es una variable binaria con valor 1 si el trabajador particip en el programa. Pensemos
que el trmino de error contiene caractersticas no observables del trabajador. Si los trabajadores
menos hbiles tienen mayores posibilidades de ser seleccionados para el programa, y se usa un anlisis
MCO, qu se puede decir sobre el sesgo probable en el estimador MCO de 1 ?
Solucin:
En el tema 2 vimos cmo determinar el signo del sesgo cuando omitimos una variable relevante,
en este caso la "habilidad" de los trabajadores. Si los trabajadores menos hbiles tienen mayores
posibilidades de ser seleccionados para el programa, u y train estarn negativamente correlacionadas,
y cmo la habilidad tiene un efecto positivo sobre el salario, el estimador MCO de 1 tendr un sesgo
negativo. Adems, puesto que cabe esperar que 1 > 0; es probable que concluyamos que el programa
es menos efectivo de lo que realmente es.
5.- Supongamos que estamos interesados en analizar las posibles diferencias en el consumo de
cerveza segn el sexo. Para ello especicamos el modelo
cerv =

1 Renta

2 M uj

3 M ujRenta

+u

donde cerv es el gasto anual en cerveza en euros, Renta es la renta anual en miles de euros, M uj es
una dummy que vale 1 para las mujeres y M ujRenta = M uj Renta. En base a una muestra de 34
individuos se ha obtenido el siguiente modelo estimado:
cerv
d = 186:47 + 2:3 Renta
(45:67)

n = 34;

126:0 M uj

(0:9)

1:3 M ujRenta

(57:01)

(1:0)

R2 = 0:5055

Adems, utilizando la misma muestra se ha estimado el modelo


cerv =

1 Renta

3 M ujRenta

+u

obtenindose que el R-cuadrado es 0:3445; se ha estimado el modelo


cerv =

1 Renta

2 M uj

+u

obtenindose que el R-cuadrado es 0:2903; y se ha estimado el modelo


cerv =

1 Renta

+u

obtenindose que el R-cuadrado es 0:1355:


a) Cul es la diferencia estimada en el gasto medio anual en cerveza entre hombres y mujeres
con renta 25000 euros al ao?.
b) Suponiendo que los errores son normales, contraste las siguientes armaciones
b1) Controlando por renta, no existen diferencias en el consumo de cerveza segn el sexo.
b2) Controlando por renta, la propensin marginal al consumo de cerveza es mayor para
los hombres que para las mujeres.
Solucin:
a) El consumo medio de cerveza es:
E(cerv j M uj = 0; Renta = 25) =

1 25

para los hombres con renta 25000 euros, y


E(cerv j M uj = 1; Renta = 25) =
5

+(

3 )25

para las mujeres con renta 25000 euros.


Por tanto, puesto que 126 + 1:3 25 = 158:5; se estima que los hombres con con renta 25000 euros
gastan en media 158:5 euros ms al ao en cerveza que las mujeres con la misma renta.
b1) Tenemos que contrastar
H0 :

=0

H1 :

6= 0 y/o

6= 0

Para hacer el contraste hay que considerar el modelo restringido


cerv =

1 Renta

+u

y comparar el R-cuadrado de este modelo restringido, Rr2 ;con el R-cuadrado del modelo no restringido,
2 ; mediante el estadstico
Rnr
F =

2
Rnr
Rr2 =2
2 ) =30
(1 Rnr

F2;30

Bajo H0

El valor del estadstico en la muestra es


F =

(0:5055 0:1355) =2
= 11:22
(1 0:5055) =30

y el p-valor es P rob(F2;30 > 11:2) = 0:00023. Por tanto, podemos rechazar la hiptesis nula a
cualquier nivel de signicacin razonable y concluir que existen diferencias en el consumo de cerveza
entre hombres y mujeres.
b2) La propensin marginal al consumo de cerveza para los hombres es:
@cerv
=
@renta

mientras que para las mujeres es:


@cerv
=
@renta

Por tanto, tenemos que contrastar

El estadstico de contraste es:

^
t=

H0 :

=0

H1 :

<0

se ^ 3

t30

Bajo H0

Para esta muestra t = 1:3=1:0 = 1:3 y el p-valor es 0:1018: Por tanto, no podemos rechazar H0 al
10%; es decir, no existe suciente evidencia para armar que la propensin marginal al consumo de
cerveza es mayor para los hombres que para las mujeres.
6.- Considere el siguiente modelo
sat =

1 hsize

2 hsize

3 f emale

4 black

5 f emale

black + u

donde sat es la puntuacin en el test SAT de aptitud escolar, hsize es el nmero de alumnos en la
promocin de bachillerato (en centenares), f emale es una variable cticia que vale 1 si el individuo es
mujer, black es otra variable cticia que vale 1 si el individuo es de raza negra.
6

Utilizando los datos del chero GPA2 del libro de Wooldridge se ha estimado este modelo obtenindose
los siguientes resultados:
c = 1028:1 + 19:3 hsize
sat
(6:29)

2:19 hsize2

(3:83)

(0:527)

45:09f emale
(4:29)

169:8 black + 62:30 f emale black

(12:71)

n = 4137;

(18:15)

R = 0:0858

a) Hay evidencia fuerte de que hsize2 debera incluirse en el modelo? De acuerdo con esta
ecuacin, cul sera el tamao ptimo de la promocin?
b) Manteniendo jo hsize, cul es la diferencia estimada en sat entre las mujeres no negras
y los hombres no negros? Hasta qu punto es estadsticamente signicativa esta diferencia?
c) Manteniendo jo hsize, cul es la diferencia estimada de puntuacin SAT entre hombres
negros y hombres que no lo son? Es esa diferencia estadsticamente signicativa?
d) Manteniendo jo hsize, cul es la diferencia estimada de puntuacin SAT entre mujeres
negras y mujeres que no lo son? Qu se necesitara hacer para contrastar la hiptesis de que la
diferencia es estadsticamente signicativa?
Solucin:
a) Para ver si hay evidencia de que hsize2 debera incluirse en el modelo tenemos que
contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

se( b 2 )

t4131

Bajo H0

Para esta muestra t = 2:19=0:527 = 4:16 y el p-valor es 0:000032. Por tanto, hsize2 es estadsticamente
signicativa a cualquier nivel de signicacin razonable y hay una fuerte evidencia de que debemos
incluir hsize2 en el modelo.
El efecto marginal de hsize sobre sat es
@sat
=
@hsize

+2

2 hsize

El tamao ptimo se alcanza cuando 1 + 2 2 hsize = 0; es decir cuando hsize = 2 1 : Se estima


2
que el tamao ptimo es 219:3
2:19 = 4:41; y como la variable hsize esta medida en cientos de alumnos,
el tamao ptimo estimado es 441 alumnos. Este resultado es similar al que obtuvimos en el ejercicio
8 del tema 3 sin controlar por el sexo y la raza.
b) Manteniendo jo hsize, las mujeres no negras obtienen en media 45:1 puntos menos en sat
que los hombres no negros. Para ver si esa diferencia es signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

se( b 3 )

t4131

Bajo H0

Para esta muestra t = 45:09=4:29 = 10:51 y el p-valor es cero. Por tanto, la diferencia es
estadsticamente signicativa a cualquier nivel de signicacin razonable.
7

c) Manteniendo jo hsize, los hombres negros obtienen en media 169:8 puntos menos en sat
que los hombres no negros. Para ver si esa diferencia es signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

t4131

se( b 4 )

Bajo H0

Para esta muestra t = 169:8=12:71 = 13:36 y el p-valor es cero. Por tanto, la diferencia es
estadsticamente signicativa a cualquier nivel de signicacin razonable.
d) Manteniendo jo hsize, las mujeres negras obtienen en media 107:5 ( 169:8 + 62:3 =
107:5) puntos menos en sat que las mujeres no negras. Para ver si esa diferencia es signicativa
tenemos que contrastar
H0 :

=0

H1 :

6= 0

Para hacer el contraste podemos utilizar la dummy de ser hombre en lugar de la de ser mujer, as
especicaramos el modelo
sat =

1 hsize

2 hsize

3 male

4 black

5 male

black + u

En este modelo 4 mide la diferencia en sat entre mujeres negras y mujeres no negras, de forma que
en este modelo tendramos que contrastar
H0 :

=0

H1 :

6= 0

7.- Considere el siguiente modelo


log(salary) =

1 log(sales)

2 f inance

3 consprod

4 utility

+u

donde salary es el salario anual del director general de la empresa en miles de dlares, sales son
las ventas anuales de la empresa en millones de dlares, y f inance, consprod y utility son variables
binarias que indican el sector en el que opera la empresa (sector nanciero, sector de bienes consumo
y sector servicios). El sector omitido es el sector industrial.
a) Estime el modelo utilizando los datos del chero CEOSAL1 del libro de Wooldridge y
presente los resultados en forma de ecuacin.
b) Contraste si el salario de los directores generales depende del sector en el que opera la
empresa.
c) Manteniendo jas las ventas, calcule la diferencia porcentual promedio en el salario estimado
entre los sectores servicios e industrial Es esta diferencia estadsticamente signicativa al 1 por ciento?
d) Manteniendo jas las ventas, cul es en promedio la diferencia porcentual en el salario
estimado entre el sector de bienes de consumo y el sector nanciero? Contraste si la diferencia es
estadsticamente signicativa.
Solucin:
a) Los resultados de la estimacin son
\
log(salary)
=

4:89 + 0:244 log(sales) + 0:124 f inance + 0:239 consprod

(0:275)

(0:032)

(0:089)

0:353 utility

(0:097)

n = 209;

R2 = 0:336;
8

SCR = 44:33320

(0:083)

b) Tenemos que contrastar si los coecientes de las dummies sectoriales son signicativos
conjuntamente. Es decir tenemos que contrastar:
H0 :

H0 :

6= 0 y/o

=0

4
3

6= 0 y/o

6= 0

Para contrastar esta hiptesis tenemos que estimar el modelo restringido


log(salary) =

1 log(sales)

+u

y calcular la suma cuadrtica residual, SCRr = 52:65600:


El estadstico de contraste es
F =

(SCRr SCRnr ) =3
SCRnr =(209 4 1)

F3;204 bajo H0

y puesto que SCRnr = 44:33320 y SCRr = 52:65600; tenemos que


F =

(52:65600 44:33320) =3
= 12:77
44:33320=204

Como el p-valor del contraste es prcticamente cero, podemos rechazar H0 a cualquier nivel de
signicacin razonable y concluir que el salario de los directores generales depende del sector en el que
opera la empresa.
c) El salario es en promedio un 35:3% menor en el sector servicios que en el sector industrial.
Para ver si esa diferencia es estadsticamente signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

se( b 4 )

t204

Bajo H0

Para esta muestra t = 3:648 y el p-valor es 0.003. La diferencia es estadsticamente signicativa


al 1%.
d) Como 100 (0:239 0:124) = 11:5; el salario es en promedio un 11:5% mayor en el sector
de bienes de consumo que en el sector nanciero. Para contrastar si esta diferencia es estadsticamente
signicativa tenemos que incluir en el modelo la dummy del sector industrial y excluir la del sector
nanciero. Los resultados de la estimacin son
\
log(salary)
=

5:01 + 0:244 log(sales)

(0:277)

(0:032)

0:124 industry + 0:114 consprod

(0:089)

(0:089)

0:477 utility

(0:104)

n = 209;

R2 = 0:336;

SCR = 44:33320

La diferencia no es estadsticamente signicativa ya que el p-valor del contraste de signicatividad


individual de la variable consprod es 0:2121:
8.- Considere el modelo
colgpa =

1 hsize

2 hsize

3 hsperc

4 sat

5 f emale

6 athlete

+u

donde colgpa es la calicacin media acumulada en la universidad, hsize es el nmero de alumnos en


la promocin de bachillerato (en centenares), hsperc es el percentil que ocupa en la distribucin de
9

calicaciones de los alumnos del instituto que se graduaron el mismo ao (denido de forma que, por
ejemplo, hsperc = 5 se reere al cinco por ciento de los mejores alumnos que se gradan), sat es la
puntuacin en el test SAT de aptitud escolar, f emale es una variable cticia que vale 1 si el estudiante
es mujer, athlete es otra variable cticia que vale 1 si el estudiante es atleta.
a) Estime el modelo utilizando los datos del chero GPA2 del libro de Wooldridge y presente
los resultados en forma de ecuacin. Cul es la diferencia estimada en la nota media de la universidad
entre los atletas y los que no lo son? Es esta diferencia estadsticamente signicativa?
b) Suprima sat del modelo y vuelva a estimar la ecuacin. Cul es ahora la diferencia
estimada por ser atleta? Explique por qu la estimacin es diferente de la obtenida en el apartado a.
c) Considere ahora un modelo que permita que el efecto de ser atleta sobre la nota media
diera en funcin del sexo del alumno y contraste la hiptesis nula de que, manteniendo constantes los
restantes factores, la diferencia en la nota media entre atletas y no atletas es la misma para hombres
y mujeres (incluya tambin sat en la ecuacin).
d) Considere ahora un modelo que permita que el efecto de sat sobre la nota de la universidad
pueda ser distinto para hombres y mujeres hay evidencia suciente para armar que el efecto de sat
sobre la nota de la universidad diere por sexos?.
Solucin:
a) Los resultados de la estimacin son
\ =
colgpa

1:24

(0:079)

0:0569hsize + 0:0047hsize2
(0:0164)

(0:0022)

0:0132 hsperc + 0:0016 sat

(0:00057)

(0:000069)

+0:155 f emale + 0:169 athlete


(0:018)

(0:042)

n = 4137;

R = 0:293

Manteniendo los otros factores jos, los atletas obtienen, en media, 0:169 puntos ms de nota que
los no atletas. Para ver si esa diferencia es estadsticamente signicativa tenemos que contrastar

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

t4130

se( b 6 )

Bajo H0

Para esta muestra t = 3:998 y el p-valor es prcticamente cero. La diferencia es estadsticamente


signicativa a cualquier nivel de signicacin razonable.
b) Cuando suprimimos sat de la ecuacin, el coeciente estimado de athlete pasa a ser 0:0054
y el error estndar es 0:045. Al suprimir sat; athlete no es signicativa y adems su efecto es muy
pequeo desde el punto de vista econmico. La estimacin es diferente ya que la media de sat es menor
para atletas que para no atletas (la correlacin entre athlete y sat es negativa) y el efecto de sat sobre
colgpa es positivo, por tanto cuando no controlamos por sat el coeciente estimado de athlete tiene
sesgo negativo.
c) Para permitir que el efecto de ser atleta diera en funcin del sexo del alumno tenemos
que introducir en el modelo la interaccin entre athlete y f emale. Es decir tenemos que considerar el
modelo
colgpa =

1 hsize

5 f emale

2 hsize

6 athlete

10

3 hsperc
7 f emale

4 sat

athlete + u

Los resultados de la estimacin de este modelo son


\ =
colgpa

1:24

(0:080)

0:0568hsize + 0:0047hsize2
(0:0164)

0:0132 hsperc + 0:0016 sat

(0:0023)

(0:00057)

(0:000067)

+0:155 f emale + 0:167 athlete + 0:0077f emale athlete


(0:018)

(0:048)

(0:096)

n = 4137;

R = 0:293

La hiptesis que tenemos que contrastar para ver si la diferencia en la nota media entre atletas y no
atletas es la misma para hombres y mujeres es

El estadstico de contraste es:


t=

H0 :

=0

H1 :

6= 0

b7
se(b 7 )

t4129

Bajo H0

Para esta muestra t = 0:08 y el p-valor es 0:94, no podemos rechazar la hiptesis nula a ningn nivel
de signicacin razonable, y por tanto concluimos que la diferencia en la nota media entre atletas y
no atletas es la misma para hombres y mujeres.
d) Para permitir que el efecto de sat sobre la nota de la universidad pueda ser distinto para
hombres y mujeres tenemos que interaccionar la variable cticia de ser mujer con sat, es decir tenemos
que considerar el modelo
colgpa =

1 hsize

3 hsperc

6 athlete

7 f emale

+ 5 f emale +

2 hsize

4 sat

sat + u

Los resultados de la estimacin de este modelo son


\ =
colgpa

1:26

(0:097)

0:0569hsize + 0:0047hsize2
(0:0164)

0:0132 hsperc + 0:0016 sat

(0:0022)

(0:00057)

(0:000085)

+0:102 f emale + 0:167 athlete + 0:000051f emale sat


(0:134)

n = 4137;

(0:043)

(0:00013)

R = 0:293

La hiptesis que tenemos que contrastar para ver si el efecto de sat sobre la nota de la universidad
diere por sexos es

El estadstico de contraste es:


t=

b7

H0 :

=0

H1 :

6= 0

se(b7 )

t4129

Bajo H0

Para esta muestra t = 0:40 y el p-valor es 0:69, no podemos rechazar la hiptesis nula a ningn nivel
de signicacin razonable, y por tanto concluimos que el efecto de sat sobre la nota de la universidad
es el mismo para hombres y mujeres.
9.- Considere el siguiente modelo que relaciona el tiempo dedicado a dormir y el dedicado a
trabajar, junto a otros factores que afectan el sueo:
sleeph =

1 totwrkh

2 educ

11

3 age

4 age

5 yngkid

+u

donde el tiempo dedicado a dormir (sleeph) y el tiempo total de trabajo (totwrkh) se miden en horas
por semana (tenga en cuenta que las variables que aparecen en el chero son sleep y totwrk; ambas
medidas en minutos por semana, y por tanto tiene que generar sleeph y totwrkh antes de estimar
el modelo). El nivel de educacin (educ) y la edad (age) se miden en aos y yngkid es una variable
binaria que toma el valor 1 si el individuo tiene hijos menores de 3 aos.
a) Estime esta ecuacin por separado para hombres y mujeres utilizando los datos del chero
SLEEP75 del libro de Wooldridge y presente los resultados en forma de ecuacin. Existen grandes
diferencias entre las dos ecuaciones estimadas?
b) Calcule el test de Chow para la igualdad de los parmetros de la ecuacin de las mujeres y
la de los hombres. Cules son los grados de libertad relevantes para este test? Se debera rechazar
H0 al 5%?
c) Estime el modelo que incluye todas las variables, la dummy de ser hombre (o la de ser
mujer), y las interacciones entre todas las variables y la dummy de ser hombre (o la de ser mujer) y
compruebe que la SCR de este modelo coincide con la suma de las SCR de las ecuaciones estimadas
para hombres y mujeres por separado que obtuvo en el apartado a.
d) Permitiendo que los trminos constantes sean distintos para hombres y mujeres, contraste
ahora si hay diferencias en las pendientes.
Solucin:
a) La ecuacin estimada para hombres es:
\ =
sleeph

60:8

(5:17)

0:182 totwrkh

(0:024)
2

n = 400;

R = 0:156;

0:218 educ + 0:119 age

(0:124)

(0:239)

00075 age2 + 1:006 yngkid

(0:0028)

(0:984)

SCR = 17712:22

y para mujeres es:


\ =
sleeph

70:65

(384:89)

n = 306;

0:140 totwrkh

0:170 educ

0:506 age + 0:0061age2

(0:027)

(0:160)

(0:309)

R2 = 0:098;

SCR = 15913:49

(0:0037)

1:97 yngkid

(1:55)

Las ecuaciones estimadas son muy distintas. Tener hijos pequeos disminuye el tiempo dedicado
a dormir para las mujeres (en unas 2 horas a la semana) y aumenta el tiempo dedicado a dormir para
los hombres (en aproximadamente 1 hora a la semana). El efecto de la edad sobre el tiempo dedicado
a dormir tambin es muy distinto, la relacin para hombres tiene forma de U invertida mientras que
para mujeres tiene forma de U.
b) El estadstico de Chow es
F =

(SCRr (SCR1 + SCR2 )) =6


(SCR1 + SCR2 ) =(706 2 6)

F6;694 bajo H0

donde SCR1 y SCR2 son las SCR que hemos obtenido en el apartado a estimando el modelo por
separado para hombres y mujeres, y SCRr es la SCR obtenida estimando el modelo con todas las
observaciones.
El valor del estadstico en la muestra es
(34240:96 (17712:22 + 15913:49)) =6
F =
= 2:12
(17712:22 + 15913:49) =(706 2 6)
y el p-valor es 0:049 por lo que podemos rechazar H0 al 5%:
c) Tenemos que estimar ahora el modelo
sleeph =

0 male

+ 3 male age

1 totwrkh + 1 male totwrkh + 2 educ + 2 male educ + 3 age


+ 4 age2 + 4 male age2 + 5 yngkid + 5 male yngkid + u

Los resultados de la estimacin aparecen en la siguiente tabla


12

MCO, usando las observaciones 1-706


Variable dependiente: sleeph
Coeficiente Desv. Tpica Estadstico t Valor p
---------------------------------------------------------------const
70.6455
6.13087
11.52
3.11e-028 ***
male
-9.84202
8.14653
-1.208
0.2274
totwrkh
-0.139950 0.0264349
-5.294
1.61e-07 ***
maletotwrkh -0.0421737 0.0366740
-1.150
0.2506
educ
-0.170086 0.152739
-1.114
0.2658
maleeduc -0.0474541 0.199466
-0.2379 0.8120
age
-0.505943 0.295175
-1.714
0.0870 *
maleage
0.625219 0.385389
1.622
0.1052
agesq
0.00613234 0.00355753
1.724
0.0852 *
maleagesq -0.00687847 0.00459856
-1.496
0.1352
yngkid
-1.97138
1.48436
-1.328
0.1846
maleyngkid 2.97771
1.80175
1.653
0.0988 *
Media de la vble. dep. 54.43926 D.T. de la vble. dep. 7.406891
Suma de cuad. residuos 33625.71 D.T. de la regresin 6.960749
R-cuadrado
0.130618 R-cuadrado corregido 0.116839
F(11, 694)
9.478958 Valor p (de F)
4.95e-16

y tenemos que la SRC de este modelo es SCR = 33625:71 que coincide con SCR1 + SCR2 =
17712:22 + 15913:49:
d) El modelo restringido es ahora
sleeph =

0 male

1 totwrkh

2 educ

3 age

4 age

5 yngkid

+u

y estimando este modelo con toda la muestra obtenemos SRC = 33929:94:


El estadstico de contraste es
F =

(SCRr SCRnr ) =5
SCRnr =(706 2 6)

F5;694 bajo H0

El valor del estadstico en la muestra es


F =

(33929:94 33625:71) =5
= 1:26
33625:71=(706 2 6)

y el p-valor es 0:28 por lo que no podemos rechazar H0 a ningn nivel de signicacin razonable
y concluimos que no hay evidencia para armar que, una vez que permitimos distintos trminos
constantes para hombres y mujeres, las pendientes sean distintas para estos dos grupos. Este es un
ejemplo en el que hay diferencias muy importantes entre los coecientes pero dichas diferencias no son
estadsticamente signicativas, seguramente porque el tamao muestral no es muy grande.

13

Vous aimerez peut-être aussi