Vous êtes sur la page 1sur 10

Tarea 2

Aplicaciones de Probabilidades y
Estadstica en Gestin.

Integrantes: Josefa Cerda.


Delphine Faller.
Moiss Hernndez.
Luis Meza.

Profesor: Rolando De La Cruz

Fecha: 5 de Julio de 2013

Pregunta 1.

Parte A.
Para realizar una estimacin del modelo requerido a travs de MCO en el
programa STATA se utiliza el comando reg, que es el de regresin lineal, y se le
dan como argumento las variables que se quieren estimar en el modelo, en
primer lugar la variable dependiente, en este casi cigs, luego las variables
explicativas como sigue: reg cigs lincome lcigpric educ age age 2
(age_2) restaurn, con lo que se busca obtener una estimacin de la siguiente
forma

^ s t= ^1 + ^
2lincom et + ^
3lcigpric t + ^
4edu ct + ^
5ag e t + ^6ag e t +
2
cig

^
7restaurn

Con los datos entregados se obtienen los siguientes valores para la estimacin.

. reg cigs lincome lcigpric educ age age_2 restaurn

Source SS df MS Number of obs = 807


F( 6, 800) = 7.42
Model 8003.02506 6 1333.83751 Prob > F = 0.0000
Residual 143750.658 800 179.688322 R-squared = 0.0527
Adj R-squared = 0.0456
Total 151753.683 806 188.280003 Root MSE = 13.405

cigs Coef. Std. Err. t P>|t| [95% Conf. Interval]

lincome .8802689 .7277838 1.21 0.227 -.5483223 2.30886


lcigpric -.7508498 5.773343 -0.13 0.897 -12.08354 10.58184
educ -.5014982 .1670772 -3.00 0.003 -.8294597 -.1735368
age .7706936 .1601223 4.81 0.000 .456384 1.085003
age_2 -.0090228 .001743 -5.18 0.000 -.0124443 -.0056013
restaurn -2.825085 1.111794 -2.54 0.011 -5.007462 -.6427079
_cons -3.639884 24.07866 -0.15 0.880 -50.9047 43.62493

La estimacin da como resultado la siguiente regresin:

^
cig s t=3,64+ 0,88lincom et 0,75lcigpri ct 0,5edu c t + 0,77ag e t

0,01ag e 2t 2,82restaur nt

Parte B.

Para realizar un contraste de WHITE en STATA se utiliza el comando imtest,


White, este comando estima la misma regresin anterior, pero la diferencia es
que no sigue el supuesto de que la varianza de los errores es homocedstica,
por lo que ocupa la varianza de White, con lo que se puede usar MCO para
estimar esta regresin aunque la varianza de los errores no sea
homocedstica. El constraste de White tiene las siguientes hiptesis:

H 0=Homocedasticidad

H 1=Heterodasticidad

El resultado del contraste de White se puede ver a continuacin:

White's test for Ho: homoskedasticity


against Ha: unrestricted heteroskedasticity

chi2(25) = 52.17
Prob > chi2 = 0.0011

Cameron & Trivedi's decomposition of IM-test

Source chi2 df p

Heteroskedasticity 52.17 25 0.0011


Skewness 58.59 6 0.0000
Kurtosis 7.24 1 0.0071

Total 117.99 32 0.0000

EL contraste dice que el p-valor del test de White es de 0.001, y al 95% de

confianza se tiene evidencia estadstica para rechazar


H0 a favor de
H1 ,

por lo cual el modelo presenta heterocedasticidad.

El contraste Breush-Pagan se utiliza para ver si la varianza estimada de los


residuos de una regresin depende de los valores de las variables explicativas.
El test de hiptesis esta dado por:
H 0=Homocedasticidad

H 1=Heterocedasticidad

Para realizar el contraste Breush-Pagan en STATA se utiliza el comando hettest


y como argumento van las variables explicativas usadas en la estimacin del
primer modelo estimado (en la parte A), el comando se usa de la siguiente
manera: hettest lincome lcigpric educ age age_2 restaurn, el resultado es
el que se detalla a continuacin.

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: lincome lcigpric educ age age_2 restaurn

chi2(6) = 69.26
Prob > chi2 = 0.0000
Como resultado se obtuvo un p-valor=0.0, por lo que al 95% de confianza se
rechaza la hiptesis nula a favor de la alternativa de homocedasticidad, por lo
que al menos una de las variables explicativas del modelo tiene influencia en la
varianza de los residuos.

Parte C.

Como en la parte B se rechaz que el supuesto de homocedasticidad de los los


errores por medio de dos contraste diferentes ya no se puede estimar una
regresin lineal por MCO, pues no se cumple un supuesto, lo que se puede
hacer es estimar una regresin lineal robusta, con la cual se evita el problema
de que los errores no sean homocedsticos.
Para realizar una regresin lineal robusta se ocupa el siguiente comando en
STATA:
reg cigs lincome lcigpric educ age age_2 restaurn, robust
Con el cual se obtienen los siguientes valores para la regresin:

Linear regression Number of obs = 807


F( 6, 800) = 10.81
Prob > F = 0.0000
R-squared = 0.0527
Root MSE = 13.405

Robust
cigs Coef. Std. Err. t P>|t| [95% Conf. Interval]

lincome .8802689 .5960118 1.48 0.140 -.2896627 2.050201


lcigpric -.7508498 6.035403 -0.12 0.901 -12.59795 11.09625
educ -.5014982 .1623935 -3.09 0.002 -.8202659 -.1827305
age .7706936 .1382841 5.57 0.000 .499251 1.042136
age_2 -.0090228 .0014622 -6.17 0.000 -.011893 -.0061526
restaurn -2.825085 1.008033 -2.80 0.005 -4.803786 -.8463838
_cons -3.639884 25.61647 -0.14 0.887 -53.92331 46.64354

Se puede observar que en este caso los estimadores de los coeficientes no


cambian, por lo que se tiene la misma regresin estimada que en la parte A.

^
cig s t=3,64+ 0,88lincom et 0,75lcigpri ct 0,5edu c t + 0,77ag e t

0,01ag e 2t 2,82restaur nt

Donde se observa que hay una variacin con respecto a la primera regresin
lineal es en los errores estndar de los estimadores, como se observa a
continuacin
Variable Error Estndar Error Estndar
Robusto
Lincome 0.727 0.596
Lcigpric 5.773 6.035
Educ 0.167 0.162
Age 0.160 0.138
Age_2 0.0017 0.0014
Restaurn 1.111 1.001
constante 24.078 25.616

FALTA COMENTARIO

FALTA PARTE D.

Pregunta 2.

Parte A.

Para estimar un modelo de regresin lineal por medio de MCO en STATA, como
el que se pide en el enunciado, se ocupa el comando reg, y como argumento
se le dan la variable dependiente seguido por las variables independientes, y
con los datos se obtiene la siguiente regresin.

Source SS df MS Number of obs = 24


F( 4, 19) = 121.96
Model 1059.17325 4 264.793312 Prob > F = 0.0000
Residual 41.2528936 19 2.17120493 R-squared = 0.9625
Adj R-squared = 0.9546
Total 1100.42614 23 47.8446149 Root MSE = 1.4735

ingpub Coef. Std. Err. t P>|t| [95% Conf. Interval]

log_pib 7.24667 .6722685 10.78 0.000 5.839596 8.653744


log_ahorro 3.476032 7.766046 0.45 0.660 -12.77849 19.73055
log_imp -1.517759 4.015198 -0.38 0.710 -9.921665 6.886147
log_exp -1.57932 3.510536 -0.45 0.658 -8.926956 5.768317
_cons 9.873847 29.38071 0.34 0.741 -51.62069 71.36839

Con lo que se obtiene el siguiente modelo estimado:


expt
^
ingpubt =9,87 +7,24log ( pi bt ) +3,47log ( ahorr o t ) 1,51log ( p t )1,57log

Para testear la significancia individual de las variables se puede ver con el


intervalo de confianza que nos entrega la tabla, este mtodo dice que si en el
intervalo de confianza de la variable se encuentra el 0, entonces la variable no
es significativa, a travs de este mtodo se tiene que la nica variable
significativa es log(pib), pues en todas las dems variables el 0 est en su
intervalo de confianza.

El parmetro asociado a la variable ahorro indica que si se aumenta en un 1%


el ahorro el ingreso pblico aumenta en 3,47 millones de euros.

Parte B.

En este caso se tiene que el valor de los residuos disminuye a medida que
aumenta el tiempo desde el ao 1985 hasta el ao 1995, luego desde este
ao, 1995, el valor de los residuos comienza a aumentar, por lo que se podra
deber a un cambio estructural en los datos, y tambin se aprecia una
disminucin de la dispersin a medida que aumenta el tiempo desde 1995-
2010.
Se aprecia que medida que aumenta el ahorro (log(ahorro)) aumenta la
dispersin de los residuos, por lo que puede haber presencia de
heterocedasticidad.

Este grfico es muy similar al de residuos vs tiempo, por lo que a medida que
aumenta el pib, desde los 7,8 hasta 9,4 millones aproximadamente, el valor
de los residuos disminuye, y desde los 9,5 hasta los 11 millones
aproximadamente el valor de los residuos aumenta, pero la dispersin de los
datos en este tramo disminuye, por lo que puede haber heterocedasticidad y
tambin un cambio estructural en los datos.

Se aprecia que la dispersin de los datos disminuye hasta los 2,8 millones y
luego desde este punto comienza a aumentar la dispersin, por lo que puede
haber heterocedasticidad.
Se aprecia que la dispersin de los datos disminuye a medida que aumentan
las exportaciones, por lo que puede haber presencia de heterocedasticidad en
los datos.

Parte E.

Para ver la presencia de un proceso autoregresivo en los datos se ocupa el test


de Durbin-Watson, en STATA, es el comando dwstat, para poder utilizar este
comando primero hay que obtener la serie de tiempo, que en este caso son los
aos, y esto se obtiene con el comando tsset, y como argumento se le pasa la
variable obs que contiene los aos, por lo que el comando es tsset obs, luego
se ocupa el comando dwstat, para esto se tiene que haber realizado la
regresin lineal de la parte a de esta pregunta. Al calcular el estadstico de
Durbin-Watson se obtiene lo siguiente:
Durbin-Watson d-statistic( 5, 24) = .5726298
Por lo que el valor del estadstico es de 0,57, y el lmite inferior (d L) del
estadstico DW terico al 5% de significancia con 5 variables y 24
observaciones es de 0,95 aproximadamente, por lo que se tiene en este caso
que el proceso es autoregresivo posivo, >0.
Adicionalmente se puede realizar un test de Durbin-Watson alternativo en
STATA, que es un test de hiptesis, el cual dice si se aprueba o rechaza la
hiptesis nula, la cual es que no existe autocorrelacin en los datos, el
comando es estat durbina, en este caso este test da:

Durbin's alternative test for autocorrelation

lags(p) chi2 df Prob > chi2

1 14.712 1 0.0001

H0: no serial correlation


Por lo que al 5% de significancia se rechaza la hiptesis nula de no correlacin,
pues el p-valor es de 0,001<0,05.

Parte G.

Se realiza la regresin pedida, para esto se crea la variable dummy=1 si el ao


es mayor a 1995, y dummy=0 si el ao es menos o igual a 1995, y luego se
realiza el modelo ocupando el comando reg en STATA y como argumento la
variable dependiente, ingpub, y las variables independiente ms la variable
dummy y la ueva variable, d*log(pib), con los datos se obtiene la siguiente
regresin.

Source SS df MS Number of obs = 24


F( 6, 17) = 883.88
Model 1096.90992 6 182.81832 Prob > F = 0.0000
Residual 3.51622074 17 .206836514 R-squared = 0.9968
Adj R-squared = 0.9957
Total 1100.42614 23 47.8446149 Root MSE = .45479

ingpub Coef. Std. Err. t P>|t| [95% Conf. Interval]

log_ahorro -9.038253 2.68738 -3.36 0.004 -14.70813 -3.368377


log_pib 3.166008 .3814084 8.30 0.000 2.361306 3.970709
log_exp 1.771452 1.29575 1.37 0.189 -.9623415 4.505245
log_imp -4.29254 1.281931 -3.35 0.004 -6.997178 -1.587901
d -53.3826 3.973154 -13.44 0.000 -61.76522 -44.99998
newlog_pib 5.718794 .4234274 13.51 0.000 4.82544 6.612148
_cons 82.44508 10.55368 7.81 0.000 60.17876 104.7114

Parte I.

Para realizar el test de Breush-Pagan en STATA se ocupa el comando hettest y


como argumento la variable que se quiere analizar si es la causante de la
heterocedasticidad, en este caso es log(ahorro), y como resultado se obtiene lo
siguiente:

. hettest log_ahorro

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: log_ahorro

chi2(1) = 1.60
Prob > chi2 = 0.2053

Da que el p-valor es de 0,20 y al 5% de significancia se tiene que p-


valor=0,2>0,05, por lo que se no se pude rechazar la hiptesis nula de
homocedasticidad.

Vous aimerez peut-être aussi