Vous êtes sur la page 1sur 51

UNIVERSIDAD DE LOS ANDES

FACULTAD DE ECONOMA
MICROECONOMETRA
TALLER 1

Sergio Gmez 200611490


Oscar Rojas
201528478
Ejercicio 1

valo r i= 0 + 1 are alotei + 2 are acasai+ 3 habitacione s i+ ui

(1)

ln(valo r i)= 0 + 1 ln(arealot ei )+ 2 ln( areacas ai)+ 3 habitacione si + i

(2)

a.
Para el primer modelo se tiene:

Para el segundo modelo:

b.
Se esperara que los signos de las variables fueran positivos ya que, para el caso del rea
tanto del lote como de la casa, entre mayor sea sta, mayor va a ser el valor. De igual
manera se cumple con el nmero de habitaciones, se esperara que, a mayor nmero de
habitaciones, el precio de la vivienda aumente positivamente.
Para el primer modelo:

Variable

arealotei ,
^ 1
es positivo y su interpretacin es que, si se mantiene todo lo

El signo del estimador

dems constante, en promedio, un incremento en un pie cuadrado en el rea del lote


significa un incremento en el precio de la vivienda en un factor de 0.0020677.
Con

=0.05

el

Pvalor<

( 0.002<0,05 ) y se rechazara la prueba de

significancia individual ( 1=0 ). Se concluye que existe evidencia estadstica para


afirmar que

arealotei es relevante a ese nivel

de significancia.

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 88, en 95 de ellas el verdadero valor de 1 estara dentro de
Para el intervalo de confianza con

0.0007908 y 0.0033446.

Variable

areacasai ,

^ 2
es positivo y su interpretacin es que, si se mantiene todo lo

El signo del estimador

dems constante, en promedio, un incremento en un pie cuadrado en el rea de la casa


significa un incremento en el precio de la vivienda en un factor de 0.1227782.
Con

=0.05

Pvalor<

el

( 0.000<0,05 ) y se rechazara la prueba de

significancia individual ( 2=0 ). Se concluye que existe evidencia estadstica para


afirmar que

areacasai es relevante a ese nivel

de significancia.

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 88, en 95 de ellas el verdadero valor de 2 estara dentro de
Para el intervalo de confianza con

0.0964541 y 0.1491022.

Variable

habitaciones i ,
^ 3
es positivo y su interpretacin es que, si se mantiene todo lo

El signo del estimador

dems constante, en promedio, un incremento en una habitacin en la vivienda significa


un incremento en el precio de la vivienda en un factor de 13.85252.
Con

=0.05

Pvalor>

el

( 0.128>0,05 ) y no se rechazara la prueba de

significancia individual ( 3=0 ). Se concluye que no existe evidencia estadstica para


afirmar que

habitaciones i

sea relevante a ese nivel

de significancia para el

modelo.

Significancia global:

Con un

=0,05

el

Pvalor<

( 0.0000<0,05 ) se rechaza la hiptesis nula (

1= 2= 3=0 ), es decir, que existe evidencia estadstica para afirmar que al menos
una de las variables independientes explica la variable dependiente ( valor i ).

Bondad de ajuste

El valor de
precio

de

R2
la

es de 0.6724 y su interpretacin es que el 67,24% de la variacin del


vivienda

est

habitaciones i ,area casai y arealotei .

Para el segundo modelo:

siendo

explicada

por

la

variacin

de

Variable

arealotei

La interpretacin del coeficiente

^ 1=0.1679667

que acompaa a esta variable indica

que, manteniendo todo lo dems constante, un incremento de 1% en el rea del lote,


incrementa en promedio el precio de la vivienda en 0.1679667%.

=0.05

Con un nivel de significancia

el

Pvalor<

( 0.000<0,05 ) se

rechazara la prueba de significancia individual ( 1=0 ) optando por la alterna (

1 0 ). Se concluye que existe evidencia estadstica para afirmar que


relevante para el modelo a ese nivel

arealotei

es

de significancia.

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 88, en 95 de ellas el verdadero valor de 1 estara entre
Para el intervalo de confianza con

0.0918404 y 0.244093.

Variable

areacasai

La interpretacin del coeficiente

^ 2=0.7002324

que acompaa a esta variable es que,

manteniendo todo lo dems constante, un incremento de 1% en el rea de la casa,


incrementa en promedio el precio de la vivienda en 0.7002324 %.
Con un nivel de significancia

=0.05

el

Pvalor<

( 0.000<0,05 ) se

rechazara la prueba de significancia individual ( 2=0 ) optando por la alterna (

2 0 ). Se concluye que existe evidencia estadstica para afirmar que


relevante para el modelo a ese nivel de significancia.

areacasai

es

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 88, en 95 de ellas el verdadero valor de 2 estara dentro de
Para el intervalo de confianza con

0.5155597 y 0.8849051.

Variable

habitaciones i

La interpretacin del coeficiente

^ 3=0.0369584

que acompaa a esta variable es que,

manteniendo todo lo dems constante, un incremento de una habitacin, incrementa en


promedio el precio de la vivienda en 3.69584%.
Con un nivel de significancia

=0.05

el

Pvalor>

( 0.183>0,05 ) no se

rechazara la prueba de significancia individual ( 3=0 ). Se concluye que existe


evidencia estadstica para afirmar que

habitaciones i

no es relevante a ese nivel

de significancia para el modelo.

Significancia global:

Con un

=0,05

el

Pvalor<

( 0.0000<0,05 ) se rechaza la hiptesis nula (

1= 2= 3=0 ), es decir, que existe evidencia estadstica para afirmar que al menos
una de las variables independientes explica la variable dependiente

valor i .

Bondad de ajuste

El valor de

es de 0.6430 y su interpretacin es que el 64,30% de la variacin del

logaritmo del precio de la vivienda est siendo explicada por la variacin del logaritmo de
las variables independientes.

c.
Al realizar la prueba RESET de Ramsey para el modelo dado en la ecuacin (1) se
obtiene:

Donde para un nivel de significancia del 5%, el


hiptesis nula

H0

Pvalor< , por lo tanto se rechaza la

que dice que el modelo no tiene variables omitidas (no hay error de

especificacin del modelo).


Se concluye que existe evidencia estadstica para afirmar que hay error de especificacin
en el modelo dado en la ecuacin (1).

d.
Para la prueba J Davidson-McKinnon primero se estima el modelo dado en la ecuacin (1)
y se obtiene

^y A

y se incorpora en el modelo dado en la ecuacin (2) como regresor

adicional.
Luego se estima el modelo dado en la ecuacin (2) y se obtiene

^y B

y se incorpora en

el modelo dado en la ecuacin (1) como regresor adicional.


Posteriormente se mira si los coeficientes que acompaan tanto a

^y A

como

^y B

son

estadsticamente diferentes de cero y se mira cul de los dos modelos es incorrecto (o si


los dos son incorrectos).

De esta forma, estimando el primer modelo e incorporndolo en el segundo modelo,


queda:

ln ( valor i ) = 0 + 1 ln ( arealotei) + 2 ln ( areacasai ) + 3 habitacione s i + ^y A + i


Luego se realiza la regresin sobre este modelo y se obtiene:

Enseguida se realiza la prueba t para

H 0 : =0
Ha: 0
En este caso a un nivel de significancia del 5%, el

Pvalor> , por lo tanto, no se

rechaza la hiptesis nula, existe evidencia estadstica para afirmar que el segundo modelo
no presenta sesgo de especificacin.

Ahora, estimando el segundo modelo e incorporndolo en el primero, queda:

valo r i= 0 + 1 are alotei + 2 are acasai+ 3 habitacione s i+ ^y B + i

Luego se realiza la regresin sobre este modelo y se obtiene:

Enseguida se realiza la prueba t para

H 0 : =0
H a : 0
En este caso a un nivel de significancia del 5%, el

Pvalor> , por lo tanto, no se

rechaza la hiptesis nula y existe evidencia estadstica para afirmar que el segundo
modelo no presenta sesgo de especificacin. En conclusin, los dos modelos estn
correctamente especificados.

e.
valo r i= 0 + 1 arealot e i + 2 areacas a i+ i

(3)

ln (valo r i)= 0 + 1 ln (arealot ei )+ 2 ln (areacas ai)+ ei

(4)

Prueba del Multiplicador de Lagrange Modelo (3):

Se estima el modelo y se obtiene

^ y luego se estima la siguiente regresin auxiliar:

^ i =0 + 1 arealot ei + 2 area cas a i+ 3 habitacione si + i


Siendo

habitacione s i la variable que se presume que est omitida.

La prueba de hiptesis es:

H 0 : 3=0
H 0 : 3 0
Y se usa el multiplicador de Lagrange

LM =n Raux q

donde

es el nmero de

variables extras o restricciones.


Si

LM > 21 , q se rechaza

H 0 hay correlacin entre habitacione s i y


^ .

Realizando en Stata este procedimiento se tiene:

De la anterior salida para niveles de significancia del 1%, 5% y 10%, no se rechaza la


hiptesis nula de que

3 =0 . Por lo tanto, se concluye que hay evidencia estadstica

para afirmar que el modelo no presenta variable omitida.

Prueba del Multiplicador de Lagrange Modelo (4):

Se estima el modelo y se obtiene

e^

y luego se estima la siguiente regresin auxiliar:

e^ i=0 +1 ln( arealot e i)+2 ln ( areacas ai)+ 3 hatiacione s i+ i


Siendo

habitacione s i la variable que se presume omitida.

La prueba de hiptesis es:

H 0 : 3=0
H 0 : 3 0
Y se usa el multiplicador de Lagrange

LM =n R2aux 2q

donde

es el nmero de

variables extras o restricciones.


Si

LM > 1 , q se rechaza

H 0 hay correlacin entre habitacione s i y


^ .

Realizando en Stata este procedimiento se tiene:

De la anterior salida para niveles de significancia del 1%, 5% y 10%, no se rechaza la


hiptesis nula de que

3=0 . Por lo tanto, se concluye que hay evidencia estadstica

para afirmar que el modelo no presenta variable omitida por lo tanto est bien
especificado.

Ejercicio 2

wk d i= 0 + 1 ln(wag ei )+ 2 e d i+ 3 unioni + 4 fe mi + i
a.
Intuitivamente incluir el salario puede explicar en cierta medida el nmero de horas que
los jefes de hogar tienen que trabajar. Se podra pensar que a mayor salario menos
semanas de trabajo requeridas para poder cumplir con el pago de los gastos diarios del
hogar.
A medida que los aos de escolaridad aumentan, es posible que la persona tenga ms
conocimientos y por ende un mejor trabajo que le permitir disfrutar de ms semanas para
el ocio.
Si el jefe de hogar tiene un contrato escrito es posible que tenga que cumplir un horario de
trabajo y sus horas de semanas trabajadas sea menor en comparacin con una persona
que no tiene un contrato escrito firmado y se vea en la obligacin de tener que trabajar
ms tiempo para poder cumplir con sus obligaciones con el hogar.
Por ltimo, si la persona siendo jefe de hogar, es mujer, va a tener que trabajar menos
horas a la semana en comparacin con los hombres jefes de hogar ya que es posible que
sus obligaciones las compartan con sus esposos o que se vean obligadas a dedicar ms
tiempo en el cuidado de los hijos. Tambin es posible que los hombres jefes de hogar
prefieran que sus esposas se dediquen al cuidado del hogar y por eso mayor va a ser el
nmero de semanas trabajadas en comparacin con las mujeres.
b.
Es posible que se requiera incluir otras variables de control como lo es la experiencia que
se relaciona con el salario y puede tener cierta incidencia en el nmero de semanas
trabajadas.
Tambin se podra incluir la variable dictoma que asume el valor de 1 si la persona es
blanca y cero de lo contrario, ya que si hay cierta discriminacin puede que las personas
de tez negra estn obligadas a trabajar mayor nmero de semanas en comparacin con
las que no.
Otra variable que se podra incluir es si la persona es un trabajador de baja jerarqua (en
ingls lo llaman blue collar occupation) ya que lo ms probable es que estas personas
tengan que trabajar mayor nmero de semanas en comparacin de las que no.
Otras variables que se podra incluir son las que hacen referencia al lugar de residencia
(rea rural o urbana), el sector donde se labora.
Dado que el estudio es realizado en Estados Unidos y los datos son tomados de la
poblacin de este pas, se puede incluir una variable dictoma que asume el valor de 1 si

la persona es americana y cero si es inmigrante, dado que las personas inmigrantes


laboran ms tiempo que las personas netamente americanas.
c.
Al estimar el modelo por MCO se obtiene:

d.

Variable

wag e i

La interpretacin del coeficiente

^ 1=0.738114

que acompaa a esta variable es que,

manteniendo todo lo dems constante, un incremento de 1% en el salario, incrementa en


promedio el nmero de semanas trabajadas en 0.00738114.
Con un nivel de significancia

=0.05

el

Pvalor<

( 0.000<0,05 ) se

rechazara la prueba de significancia individual ( 1=0 ) optando por la alterna (

1 0 ). Se concluye que existe evidencia estadstica para afirmar que


relevante a ese nivel

wag e i

es

de significancia.

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 4156, en 95 de ellas el verdadero valor de 1 estara dentro de
Para el intervalo de confianza con

0.3511924 y 1.125036.

Variable

ed i

La interpretacin del coeficiente

^ 2=0.1524285

que acompaa a esta variable es

que, manteniendo todo lo dems constante, un incremento de un ao de escolaridad,


disminuye en promedio el nmero de semanas trabajadas en 0.1524285.

Con un nivel de significancia

=0.05

el

Pvalor<

( 0.000<0,05 )se rechazara

la prueba de significancia individual ( 2=0 ) optando por la alterna ( 2 0 ). Se


concluye que existe evidencia estadstica para afirmar que

ed i

es relevante a ese nivel

de significancia.

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 4156, en 95 de ellas el verdadero valor de 2 estara dentro de
Para el intervalo de confianza con

-0.2153127 y

Variable

-0.0895443.

La interpretacin del coeficiente

^ 3=1.99073

que acompaa a esta variable es que,

manteniendo todo lo dems constante, si existe un contrato firmado, en promedio, el


nmero de semanas trabajadas por un jefe de hogar es menor en 1.99073 en
comparacin con los jefes de hogar que no tienen un contrato firmado.

=0.05

Con un nivel de significancia

el

Pvalor<

( 0.000<0,05 ) se

rechazara la prueba de significancia individual ( 3=0 ) optando por la alterna (

3 0 ). Se concluye que existe evidencia estadstica para afirmar que


relevante a ese nivel de significancia.

es

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 4156, en 95 de ellas el verdadero valor de 3 estara dentro de
Para el intervalo de confianza con

-2.32447 y

Variable

-1.656989.

fem i

La interpretacin del coeficiente

^ 4=1.40769

que acompaa a esta variable es que,

manteniendo todo lo dems constante, en promedio, una mujer jefa de hogar tiene que
trabajar 1.40769 semanas menos en comparacin con un hombre jefes de hogar.

Con un nivel de significancia

=0.05

el

Pvalor<

( 0.000<0,05 ) se

rechazara la prueba de significancia individual ( 4=0 ) optando por la alterna (

4 0 ). Se concluye que existe evidencia estadstica para afirmar que


relevante para el modelo a ese nivel de significancia.

es

=0.05 , se concluye que, si se tomaran 100


muestras de tamao 4156, en 95 de ellas el verdadero valor de 4 estara dentro de
Para el intervalo de confianza con

-1.928516 y

-0.8868637.

Significancia global:

Con un

=0,05

el

Pvalor<

( 0.0000<0,05 ) se rechaza la hiptesis nula (

1= 2= 3= 4 =0 ), es decir, que existe evidencia estadstica para afirmar que al


menos una de las variables independientes explica la variable dependiente

wk d i

en el

modelo.

Bondad de ajuste

El valor de

R2

es de 0.0408 y su interpretacin es que el 4.08% de la variacin del

nmero de semanas trabajadas por parte de los jefes de hogar est siendo explicada por
la variacin de las variables independientes.
e.
La variable

di

puede ser un buen instrumento porque se podra pensar que a mayor

edad que se tenga menor va a ser la participacin en la industria manufacturera, puede


ser visto como un trabajo ms para gente joven y de alta exigencia respecto a la parte
fsica.
La variable

sms ai , puede ser vista como que las personas jvenes buscan estar cerca

de las urbes ya que desean progresar econmicamente y en las ciudades es donde se


presentan ms oportunidades laborales. En cambio, las personas mayores prefieren ms
tranquilidad y por eso su eleccin de vivienda puede estar orientada hacia las zonas
ms calmadas como lo son las rurales.
Otra variable que podra ser considerada como un buen instrumento es la experiencia ya
que para obtener experiencia se requiere de tiempo y el tiempo constituye el paso de los

aos (aumento de la edad). Por lo tanto, entre ms aos de experiencia tenga una
persona, mayor puede ser su edad.
f.
Se realiza la estimacin por MC2E:

g.
En la primera etapa se puede ver que el instrumento

di

es relevante a 5% de

significancia. Tambin se puede ver que el instrumento no es dbil debido al valor de la


prueba F global es mayor que 10 en la primera etapa.
En la segunda etapa se ve que se han cambiado los valores de las variables y que la
nica que no es relevante es

fe mi

cuyo

Pvalor=0.538 . De resto para las dems

variables existe evidencia estadstica para afirmar que su valor es distinto de cero.
h.
Estimando por MC2E el modelo considerando las variables
instrumentos de

ln (wag e i) :

ind i

sms ai

como

i.
En la primera etapa se puede ver que los dos instrumentos son relevantes al 5% de
significancia. El valor de la prueba F global es mayor que 10 por lo tanto los instrumentos
no son dbiles.
En la segunda etapa se aprecia el cambio en el valor de los coeficientes de los
parmetros y todas las variables son significativas al 5% excepto la variable

fe mi

cuyo

Pvalor=0.493 .
j.
Para el test de Hausman, primero se estima el modelo original y se guardan los resultados
con el nombre de

bmco :

Luego se estima el modelo corrigiendo el problema por endogeneidad y se guardan los


resultados con el nombre de

biv :

Por ltimo, se utiliza el comando de Hausman para realizar la prueba:

Como el

Pvalor

arrojado por el test es 0.0038, a un nivel de significancia del 5%, se

rechaza la hiptesis nula de que no existen problemas de endogeneidad.


Por lo tanto, se concluye que existe evidencia estadstica para afirmar que el modelo tiene
problemas de endogeneidad y se prefieren los estimadores de las variables
instrumentales debido al sesgo que presentan los de MCO.
k.
Despus de estimar el modelo por MC2E se obtienen los residuales del modelo:

Luego se utiliza el multiplicador de Lagrange:

LM =n R2aux 2q
En este caso

es el nmero de instrumentos extra (dos en este caso). Por lo tanto:

Como el

Pvalor>

(asumiendo un nivel de significancia del 5%), no se rechaza la

hiptesis nula de que los instrumentos son exgenos. Se concluye que hay evidencia
estadstica para afirmar que los instrumentos son vlidos (son exgenos).
Ejercicio 3

smoke r i= 0+ 1 edu c i + 2 ag ei + 3 incom e i + 4 pcigs 79i + 5 ag e2i


a.

Estimacin modelo MPL con errores estndar robustos

Estimacin modelo LOGIT y efectos marginales

Estimacin modelo PROBIT y efectos marginales

Ahora se realiza una tabla para mostrar los valores predichos

Se puede apreciar que el valor medio es similar (aproximadamente 0.38), la desviacin


estndar tambin es muy parecida en los tres modelos (entre 0.124 y 0.125), pero resalta
el hecho de que el MPL tiene valores predichos negativos mientras que los otros dos
modelos si tienen sus predicciones en el rango

[ 0.1 ] .

b.
2

smoke r i= 0+ 1 edu c i + 2 ag ei + 3 incom e i + 4 pcigs 79i + 5 ag ei

Para saber si la edad tiene efectos marginales decrecientes se debe mirar los signos de
los coeficientes que acompaan a las variables
coeficiente

2> 0

y el coeficiente

age

ag e 2 . En este caso el

5< 0 . El procedimiento de prueba de hiptesis

para determinar si el efecto marginal de la edad es decreciente es:

Prueba de hiptesis para el coeficiente

Planteamiento de la hiptesis:

H o : 2 0

H a : 2 >0

En este caso se desea mirar si es posible rechazar la hiptesis nula para saber si el
trmino lineal de la edad es mayor a cero.
Nivel de significancia:
Se elige un nivel de significancia del 5% ( =0.05
Estadstico calculado o de prueba:
Para el modelo MPL se utiliza un estadstico
es:

cuyo valor (segn la salida de Stata)

5.20

Para el modelo LOGIT y PROBIT se emplea el estadstico


Stata) es:

Z LOGIT =5.12
Z PROBIT =5.12
Estadstico de contraste:

cuyo valor (segn

Con un

=0.05

el estadstico de contraste para la distribucin

son

respectivamente:

t tablas =1.646135109
Z tablas =1.644853627

Conclusin:
Dado que en los tres modelos el estadstico calculado se encuentra en la zona de
rechazo ( estadstico calculado>estadstico de contraste ), por lo tanto, no se acepta
la hiptesis nula de que el coeficiente que acompaa a la variable

edad

es menor o

igual a cero y se opta por la alterna, es decir, existe evidencia estadstica para afirmar
que

2> 0 .

Prueba de hiptesis para el coeficiente

Planteamiento de la hiptesis:

H o : 5 0

H a : 5 <0

En este caso se desea mirar si es posible rechazar la hiptesis nula para saber si la
edad tiene efectos marginales decrecientes.
Nivel de significancia:
Se elige un nivel de significancia del 5% ( =0.05
Estadstico calculado o de prueba:
Para el modelo MPL se utiliza un estadstico
es:

cuyo valor (segn la salida de Stata)

-6.69

Para el modelo LOGIT y PROBIT se emplea el estadstico


Stata) es:

Z LOGIT =6.00

cuyo valor (segn

Z PROBIT =6.05
Estadstico de contraste:
Con un

=0.05

el estadstico de contraste para la distribucin

son

respectivamente:

t tablas =1.646135109
Z tablas =1.644853627
Conclusin:
Dado que en los tres modelos el estadstico calculado se encuentra en la zona de
rechazo ( estadstico calculado<estadstico de contraste ), por lo tanto, se rechaza la

eda d 2 es positivo y
se opta por la alterna, es decir, existe evidencia estadstica para afirmar que 5< 0 .
hiptesis nula de que el coeficiente que acompaa a la variable

Al realizar las pruebas de hiptesis para el coeficiente que acompaa la variable


y para el coeficiente que acompaa a la variable
existe evidencia estadstica para afirmar que

edad

eda d 2 se lleg a la conclusin de que


2> 0 y 5< 0 . Por esta razn, la

variable edad tiene efectos marginales decrecientes.


c.
2

smoke r i= 0+ 1 edu c i + 2 ag ei + 3 incom e i + 4 pcigs 79i + 5 ag ei

El procedimiento de prueba de hiptesis para determinar si el efecto marginal del ingreso


es superior a 0.10 es:

Planteamiento de la hiptesis:

H o : 3 0.10

H a : 3 >0.10

En este caso se busca ver si se rechaza la hiptesis nula para saber si el efecto marginal
del ingreso es superior a 0.10.

Nivel de significancia:

Se elige un nivel de significancia del 5% ( =0.05

Estadstico calculado o de prueba:

Para el modelo MPL se utiliza un estadstico

cuyo valor es:

^
06

( 3) 1.59 10 0.10
=
=59172.538
se ( ^ 3)
1.69 1006
t=
Para el modelo LOGIT y PROBIT se emplea el estadstico

cuyo valor es:

^
( 3) 1.711006 0.10
=
60241,99
1.66 1006
se ( ^ 3)
Z LOGIT =
^
06

( 3) 1.87 10 0.10
=
60242,09
06
se ( ^ 3)
1.66 10
Z PROBIT =

Estadstico de contraste:

Con un

=0.05

el estadstico de contraste para la distribucin

son

respectivamente:

t tablas =1.646135109
Z tablas =1.96

Conclusin:

Dado que en los tres modelos el estadstico calculado se encuentra en la zona de no


rechazo, se acepta la hiptesis nula de que los efectos marginales de la variable

ingres o i son menores o igual a 0.10.

De hecho, si se mira el reporte de Stata de los efectos marginales el

Pvalor

que

arroja es mayor al 0.1 por lo tanto no se rechaza la hiptesis nula de la prueba de


significancia individual de que el coeficiente que acompaa a la variable
estadsticamente igual a cero.

ingres o i

es

MPL:

Efectos marginales LOGIT:

Efectos marginales PROBIT:

d.
Todos los intervalos de confianza se calculan con la siguiente ecuacin:

IC= ^ 1 t

1 , nk1
2

se ( ^ 1)

Intervalo de confianza MPL- escolaridad

I C superior =0.0249299+1.961960.0046031
I C superior 0.01589
I C inferiror=0.02492991.961960.0046031
I C inferiror 0.033961

Intervalo de confianza Logit- escolaridad (marginal)

I C superior =0.0273688+1.960.00508
I C superior 0.017412
I C inferiror=0.02736881.960.00508
I C inferiror 0.0373256

Intervalo de confianza Probit-escolaridad (marginal)

I C superior =0.0266452+1.960.00492

I C superior 0.017002
I C inferiror=0.02664521.960.00492
I C inferiror 0.0362884

e.

smoke r i= 0+ 1 edu c i + 2 ag ei + 3 incom e i + 4 pcigs 79i + 5 ag e2i


El procedimiento de prueba de hiptesis en los tres modelos con el fin de determinar la
validez de la restriccin de que

escolaridad = precio cigarrillo=0

para los tres modelos es:

Modelo MPL:
Planteamiento de la hiptesis:

H 0 : 1= 4 =0

H a : Al menosun i 0 i=1,4

Nivel de significancia:
Se elige un nivel de significancia

del 0.05 (5%)

Estadstico calculado:
Para hallar el estadstico calculado se necesita evaluar el modelo con las restricciones
y sin las restricciones y se obtienen las sumas del cuadrado de los errores para los
dos modelos. A continuacin, se muestran los resultados:

Ahora se encuentra el estadstico de contraste con ayuda de la siguiente expresin:

SC E R SC ENR
q
Fc =
SC E NR
nk1

En este caso

es el nmero de estricciones (en este caso son 2),

de observaciones y

el nmero

el nmero de variables explicativas del modelo sin

restriccin.
Reemplazando valores queda:

270.56818263.51143
2
Fc =
15.934
263.51143
119651

Estadstico de contraste:
El estadstico de contraste es un

F q ; nk 1 F2,1190

cuyo valor es

3.003286469 .
Conclusin:
Como

Fc > F 1 ;2 ;1190

se rechaza la hiptesis nula de que

1= 4=0

y por lo

tanto existe evidencia estadstica para afirmar que al menos uno de los dos betas es
diferente de cero.
De igual manera, con el comando testparm se comprueba el resultado:

Y, por lo tanto, como el

Pvalor<

la conclusin es la misma.

Modelo LOGIT:
Planteamiento de la hiptesis:

H 0 : 1= 4 =0

H a : Al menosun i 0 i=1,4

Nivel de significancia:

Se elige un nivel de significancia

del 0.05 (5%)

Estadstico calculado:
Para hallar el estadstico calculado se necesita evaluar el modelo con las restricciones
y sin las restricciones y se obtienen los

log likelihood

para ambos modelos. A

continuacin, se muestran los resultados:

Ahora se encuentra el estadstico de razn de verosimilitud con ayuda de la siguiente


expresin:

ERV =2 [ ln LSR ln LCR ]


En este caso
el

ln LSR

log likelihood

es el

log likelihood

del modelo sin restriccin y ln LCR

es

del modelo con restriccin.

Reemplazando valores queda:

ERV =2 [ 750.84796(767.26131) ] =32.8267


Estadstico de contraste:
El estadstico de contraste es una Chi-cuadrado con

restricciones cuyo valor es

5.991464547 .
Conclusin:
Como

ERV > 22 se rechaza la hiptesis nula de que

1= 4=0 . Existe evidencia

estadstica para afirmar que al menos uno de los dos betas es diferente de cero.
De igual manera, con el comando testparm se comprueba el resultado:

Pvalor<

Y, por lo tanto, como el

la conclusin es la misma.

Modelo PROBIT:
Planteamiento de la hiptesis:

H 0 : 1= 4 =0

H a : Al menosun i 0 i=1,4

Nivel de significancia:
Se elige un nivel de significancia

del 0.05 (5%)

Estadstico calculado:
Para hallar el estadstico calculado se necesita evaluar el modelo con las restricciones
y sin las restricciones y se obtienen los

log likelihood

para ambos modelos. A

continuacin, se muestran los resultados:

Ahora se encuentra el estadstico de razn de verosimilitud con ayuda de la siguiente


expresin:

ERV =2 [ ln LSR ln LCR ]


En este caso
el

ln LSR

log likelihood

es el

log likelihood

del modelo sin restriccin y ln LCR

del modelo con restriccin.

Reemplazando valores queda:

ERV =2 [ 750.81585(766.89794) ]=32.16418

es

Estadstico de contraste:
El estadstico de contraste es una Chi-cuadrado con

restricciones cuyo valor es

5.991464547 .
Conclusin:
Como

ERV > 22 se rechaza la hiptesis nula de que

1= 4=0 . Existe evidencia

estadstica para afirmar que al menos uno de los dos betas es diferente de cero.
De igual manera, con el comando testparm se comprueba el resultado:

Y, por lo tanto, como el

Pvalor<

la conclusin es la misma.

f.
El procedimiento de prueba de hiptesis con el fin de determinar que el valor esperado de
la probabilidad de fumar es igual a 0.42 es el siguiente:

Planteamiento de la hiptesis:

+ pcigs 79= pcigs


79+ag e2= ag e2 ) = 0 + 1 educ+

E P ( smoker=1|educ= educ+
age=age+income=
income
Por lo tanto, la hiptesis es:

H 0 : 0 + 1 educ+
2 age+
3 income+
4 pcigs79+
5 ag e 2=0.42

H 0 : 0 + 1 educ+
2 age+
3 income+
4 pcigs79+
5 ag e 2 0.42

Nivel de significancia:

Se elige un nivel de significancia de 0.05

Estadstico calculado:

El estadstico sigue una distribucin

para el MPL y una distribucin

para LOGIT

y PROBIT y su valor se calcula de la siguiente forma:

t c , Z c=

( 0 + 1 educ+
2 age+
3 income+
4 pcigs79+
5 ag e 2)0.42

Donde

' S (X X )
2

[]

educ

age
5 1=

income

pcigs79
ag e2

'

'1 6 = 1 educ
age
income

79 ag e2
pcigs

1
S 2 ( X ' X ) var cov ( ^ )

Estadstico de contraste

El estadstico de contraste sera el

t=1.961959484

z=1.96

Conclusin

Si el estadstico calculado es mayor al de contraste se rechaza la hiptesis nula de que el


valor esperado de la probabilidad de fumar es igual a 0.42, cuando las variables
independientes toman sus valores medios. Si sucede lo contrario se acepta la hiptesis
nula, es decir, existe evidencia estadstica para afirmar que la probabilidad de fumar es
0.42, cuando las variables independientes toman sus valores medio.
g.

R2 para el modelo MPL se obtiene:

El
2

R=

SCR 18.3907393
=
=0.06523802
SCT 281.902174

Este valor concuerda con el arrojado por Stata.


El Pseudo

R2 se calcula para los modelos PROBIT y LOGIT de la siguiente manera:

Pseudo R 2=1

En este caso

ln LSR
ln LCR

ln LCR

es la funcin logaritmo de verosimilitud restringida para la cual

slo se incluye el intercepto en el modelo tanto para LOGIT como PROBIT:

Reemplazando valores se obtiene:

Pseudo R 2LOGIT =1

750.84796
=0.0549
794.47478

Pseudo R PROBIT =1

750.81585
=0.0550
794.47478

Los anteriores valores concuerdan con los arrojados por Stata.


Otra medida de ajuste comparativamente simple es la cuenta

R2 , que se define

Como:

Cuenta R2=

predicciones correctas
total de observaciones

Para poder obtener los valores de la

cuenta R 2 , a continuacin, se muestran las tablas

de las predicciones para cada uno de los modelos:

Reemplazando valores se obtiene:


2

Cuenta RMPL =

678+74
0.6288
1196

Cuenta R2LOGIT =

667+ 92
0.6342
1196

Cuenta R2PROBIT =

672+ 89
0.6363
1196

Ejercicio 4

Addo ni = 0+ 1 Ag e i + 2 Educatio ni + 3 Marrie di + 4 Kid s i+ i


DocVisit si= 0 + 1 Ag e i+ 2 Education i+ 3 Incom e i + 4 Femal ei + 1 ^
Addoni+ v i
a.
Al estimar el LOGIT del modelo de la ecuacin 6 se obtiene:

(6)
(7)

Luego se obtienen los efectos marginales:

Se puede apreciar que el efecto de una persona casada no es significativo al 1%, 5% y


10%. De igual manera sucede con la edad y el nmero de nios menores de 16 en la
casa.
Por otra parte, la educacin si es significativa al 5% y su interpretacin es que,
manteniendo los dems factores constantes, un incremento en un ao en educacin,
aumenta la probabilidad de comprar un seguro privado complementario en 0.4 puntos
porcentuales.

De igual manera se tiene que la interpretacin del coeficiente que acompaa a la variable
edad es que manteniendo los dems factores constantes, un aumento en un ao de edad,
aumenta la probabilidad de comprar un seguro privado complementario en 0.04 puntos
porcentuales.
Para el nmero de nios menores de 16 en la casa su interpretacin es que manteniendo
los dems factores constantes un aumento en el nmero de nios en una unidad,
disminuye la probabilidad de comprar un seguro privado complementario en 0.3 puntos
porcentuales.
Por ltimo, el cambio en la probabilidad de comprar un seguro privado complementario
cuando una persona pasa de estar soltera a estar casada se aumenta en 0.6 puntos
porcentuales.
b.
Al estimar el modelo de la ecuacin (7) se obtiene:

Los efectos marginales son:

De los efectos marginales se puede ver que todas las variables excepto
significativas al 1%, 5% y 10%.

^
addoni

son

^
addoni solamente es significativa al 10%.

Las interpretaciones de los coeficientes que acompaan a las variables son:

Un aumento en un ao de edad incrementa el nmero de visitas al doctor en 0.04


veces

ceteris paribus .

Un aumento en un ao de educacin disminuye el nmero de visitas en 0.106 veces

Un aumento en el ingreso en un franco alemn disminuye el nmero de visitas al

ceteris paribus .
doctor en 0.0002 veces

El nmero de visitas al doctor es mayor en 0.45 veces en las mujeres en comparacin


con los hombres

ceteris paribus .

ceteris paribus .

Un aumento en la probabilidad en un punto porcentual de comprar un seguro privado


complementario, aumenta el nmero de visitas al doctor en 10.77 veces.

c.

Prueba de dependencia global


Planteamiento de la hiptesis:

H 0 : 1= 2= 3= 4 ==0
H a : Al menos o un i 0 i=1,2,3,4
Nivel de significancia:

Se elige un nivel de significancia del 5%.


Estadstico de prueba:
El estadstico de prueba es el

ERV =2 [ ln LSR ln LCR ] q

donde

es el nmero

de restricciones (5 en este caso).


En este caso

ln LCR

es la funcin logaritmo de verosimilitud restringida para la cual

slo se incluye el intercepto en el modelo. Teniendo esto presente, a continuacin, se


muestra la regresin incluyendo solo el intercepto:

Remplazando se obtiene el

ERV :

ERV =2 [ 15859.171(16398.154 ) ]=1077.966

Estadstico de contrate:
El

25 es 11.07049769

Conclusiones
Como

ERV > 5 (1077.966>11.07049769) , se rechaza la nula. Existe evidencia

estadstica para afirmar que al menos uno de los coeficientes que acompaan a las
variables del modelo de la ecuacin (7) es diferente de cero.

Prueba de significancia individual para la variable


Planteamiento de la hiptesis

Age

H 0 : 1=0
H a : 1 0
Nivel de significancia
Se elige un nivel de significancia del 5%
Estadstico de prueba
El estadstico de prueba es un

Z c=

^ 0.0175220
=
12.948566
se ( ^ ) 0.0013532

Estadstico de contrate

Z =1.96

El estadstico de contrate es un
Conclusiones

Como la prueba es de dos colas se mira

12.948566>1.96

|Z c|> Z tablas

en este caso

y por lo tanto se rechaza la nula. A 5% de significancia existe

evidencia estadstica para afirmar que la variable

Age

Prueba de significancia individual para la variable

Education

Planteamiento de la hiptesis

H 0 : 2=0
H a : 2 0
Nivel de significancia
Se elige un nivel de significancia del 5%
Estadstico de prueba
El estadstico de prueba es un

Z :

es diferente de 0.

Z c=

^ 0.03857660
=
3.0219183
0.0127656
se ( ^ )

Estadstico de contrate

Z =1.96

El estadstico de contrate es un
Conclusiones

Como la prueba es de dos colas se mira

3.0219183>1.96

|Z c|> Z tablas

en este caso

y por lo tanto se rechaza la nula. A 5% de significancia existe

evidencia estadstica para afirmar que la variable

Educ ation es diferente de 0.

Prueba de significancia individual para la variable

Income

Planteamiento de la hiptesis

H 0 : 3=0
H a : 3 0
Nivel de significancia
Se elige un nivel de significancia del 5%
Estadstico de prueba
El estadstico de prueba es un

Z c=

Z :

^ 0.00008030
=
12.685624
se ( ^ ) 6.33 1006

Estadstico de contrate
El estadstico de contrate es un
Conclusiones

Z =1.96

Como la prueba es de dos colas se mira

12.685624>1.96

|Z c|> Z tablas

en este caso

y por lo tanto se rechaza la nula. A 5% de significancia existe

evidencia estadstica para afirmar que la variable

Income es diferente de 0.

Prueba de significancia individual para la variable

Female

Planteamiento de la hiptesis

H 0 : 4 =0
Ha: 4 0
Nivel de significancia
Se elige un nivel de significancia del 5%
Estadstico de prueba
El estadstico de prueba es un

Z c=

Z :

^ 0.16408680
=
9.0986964
0.0180341
se ( ^ )

Estadstico de contrate
El estadstico de contrate es un

Z =1.96

Conclusiones
Como la prueba es de dos colas se mira

9.0986964>1.96

Prueba de significancia individual para la variable


Planteamiento de la hiptesis

H 0 : =0
Ha: 0

en este caso

y por lo tanto se rechaza la nula. A 5% de significancia existe

evidencia estadstica para afirmar que la variable

|Z c|> Z tablas

Female es diferente de 0.
^
Addon

Nivel de significancia
Se elige un nivel de significancia del 5%
Estadstico de prueba
El estadstico de prueba es un

Z c=

Z :

^ 3.9113990
=
1.8806403
2.079823
se ( ^ )

Estadstico de contrate
El estadstico de contrate es un

Z =1.96

Conclusiones
Como la prueba es de dos colas se mira

1.8806403<1.96

|Z c|> Z tablas

en este caso

y por lo tanto si se acepta la nula. A 5% de significancia existe

evidencia estadstica para afirmar que la variable

^
Addon

es igual a 0.

d.
La prueba de hiptesis para determinar si estadsticamente el efecto marginal de

Femal ei

es superior a 0.1

Planteamiento de la hiptesis

H 0 : 4 0.1

H a : 4>0.1

Nivel de significancia

Se elige un nivel de significancia del 5%

Estadstico de prueba

El estadstico de prueba es un

Z c=

Z :

^ .45374380.1
=
=7.0791235
0.04997
se ( ^ )

Estadstico de contraste

El estadstico de contraste es 1.644853627 ya que es una prueba de una sola cola.

Conclusiones

Como

Z c > Ztablas (7.0791235>1.6444853627)

se rechaza la hiptesis nula. Existe

evidencia estadstica para afirmar que el efecto marginal de la variable

female

es

superior a 0.1.
Ejercicio 5

es
l
loginvp cit = 0+ 1 ing tran sit + 2 desemp t it + 3 tasa it + 4 desplazamient o it + 5 H coc ait + i
a.
Se podra esperar que los coeficientes que acompaan a las variables

es
desemp t it

ing tran sit

seas positivos, a mayores transferencias del gobierno central y mejores

ndices, mayor va a ser el logaritmo de la inversin per cpita municipal.


En cuanto a las variables

l
tasa it

desplazamient o it

se esperara un signo

negativo, se supone que mayores tasas de homicidio y mayor nmero de personas


desplazadas hacen que el logaritmo la inversin municipal per cpita sea menor.
Y, para la variable

H coc ait , se espera un signo negativo, el hecho de que en el

municipio haya cultivos de coca en un ao especfico puede hacer que el logaritmo la


inversin municipal per cpita sea menor.
Ahora se estima el modelo por MCO (como un pool de datos):

Se puede apreciar que las variables

desplazamiento

tasa homicidios

no son

significativas a los niveles convencionales de significancia. Las otras variables si son


relevantes tanto al 1% como el 5% y 10%.
Los signos de las variables

desplazamiento

tasa homicidios

son contrario a lo

esperado, esta diferencia se podra atribuir a que se supuso que los efectos individuales
no observados son cero.
b.
Primero se muestra los resultados de la regresin por efectos fijos:

De la regresin se puede observar que de la prueba de hiptesis para ver si los efectos
individuales no observados son cero ( H 0 : todos los
al menos un

ai=0 ) se rechaza y por lo tanto

ai 0 , esto quiere decir que correr el modelo por MCO no es lo correcto.

Ahora se muestra la regresin por efecto aleatorios:

En este caso se est asumiendo que la correlacin de


En ambas regresiones la variable

desplazamiento

ai

con

X it

es igual a cero.

no es relevante al 1%, 5% y 10% y

los signos de todas las regresoras si concuerdan con lo esperado.


Por otra parte, la variable

H coca

es relevante para efectos aleatorios al 5% mientras

que para efectos fijos no. Las otras variables si son relevantes a los niveles
convencionales de significancia.
La diferencia de los resultados se debe a que efectos fijos se basa en que

cov (a i , X it )0

mientras que efectos aleatorios se basa en que

cov ( ai , X it ) =0 .

c.
Al realizar la prueba de Hausman para comparar los estimadores de efectos fijos vs los de
efectos aleatorios se obtiene:

Para un nivel de significancia

del 5% se tiene que como el

Pvalor<0.05

se

rechaza la hiptesis nula de que no hay endogeneidad. Existe evidencia estadstica para
afirmar que la regresin por efectos aleatorios presenta problemas de endogeneidad y por
lo tanto se prefiere efectos fijos.
d.
Para comparar los estimadores de pool vs los de efectos aleatorios se realiza el Contraste
Breusch-Pagan. A continuacin, se muestra los resultados obtenidos:

En este caso la hiptesis nula establece que la varianza del componente individual es
cero. Para un nivel de significancia

=0.05

el

Pvalor<

concluye que existe evidencia estadstica para afirmar que

se rechaza

H 0 , se

2a > 0 y por lo tanto prefiero

efectos aleatorios en vez de pool


e.
La prueba estadstica para comparar los estimadores de efectos fijos vs los de pool es el
contraste de significancia de seccin cruzada.
Esta prueba se puede realizar por medio de la ltima lnea en la regresin del modelo por
efectos fijos. Para este caso la salida es la siguiente:

H 0 : a1=a 2==ai=0

H a : al menosun ai 0

Se puede apreciar que asumiendo un nivel de significancia

=0.05

el

Pvalor<

y por lo tanto rechazo la hiptesis nula.


Se concluye que existe evidencia estadstica para afirmar que al menos uno de los
efectos individuales no observados es diferente de cero y por lo tanto se prefiere la
estimacin por efectos fijos.