Vous êtes sur la page 1sur 11

Universidad Santo Toms Facultad de Administracin Escuela de Ingeniera Comercial Econometra

Tarea N 2: Caso multivariable

Alumnos: Ivn Pinto Constanza Zamora Matas Albi Jos Simpson

Profesor: Luis Chanc

21/06/2013

Tarea N 2: Caso multivariable


Anlisis de Excel.

Econometra

Al realizar la primera regresin, con todos los regresores especificados en la pauta de este trabajo, nos encontramos con el problema de que la regresin no calculaba los betas del regresor edad, esto lo podemos ver en la siguiente tabla:
Estadsticas de la regresin Coeficiente de0,44232583 correlacin mltiple Coeficiente de0,19565214 determinacin R^2 R^2 ajustado 0,18548668 Error tpico 0,7350604 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadradosF Valor crtico de F Regresin 6 64,9252606 10,82087677 24,0324277 5,5325E-25 Residuos 494 266,915012 0,54031379 Total 500 331,840273 Coeficientes 6,20921438 0,01883143 0 -0,00017689 0,09981432 -0,3469747 0,20879125 Error tpico 0,30817346 0,01670425 0 0,00017502 0,01887668 0,07695944 0,07430675 Estadstico t Probabilidad Inferior 95% Superior 95%Inferior 95,0% Superior 95,0% 20,14843977 2,4218E-66 5,60372203 6,81470674 5,60372203 6,81470674 1,127343789 0,26014442 -0,0139887 0,05165156 -0,0139887 0,05165156 65535 #NUM! 0 0 0 0 -1,010734043 0,31263853 -0,00052076 0,00016697 -0,00052076 0,00016697 5,287703867 1,8634E-07 0,06272583 0,13690281 0,06272583 0,13690281 -4,508539993 8,161E-06 -0,49818289 -0,19576651 -0,49818289 -0,19576651 2,809855905 0,00515299 0,06279501 0,35478749 0,06279501 0,35478749

Intercepcin EXP_PT edad EDADC esc Mujer RM

Para ver el problema que se presenta en la regresin anterior, analizaremos los datos. Lo primero que haremos ser ver los coeficientes de correlacin entre las variables:

EXP_PT EXP_PT edad EDADC esc Mujer RM 1 0,95875593 0,94708121 -0,50468624 -0,10367929 0,00848761

edad

EDADC

esc

Mujer

RM

1 0,98665471 1 -0,23849379 -0,239138286 1 -0,09635571 -0,095993441 0,06158152 1 0,02039824 0,016656094 0,03295621 0,00319613

En la tabla anterior, se puede observar que existe una fuerte correlacin entre los represores, edad - experiencia, edadc - experiencia, y a la misma vez edad - edadc. La ltima relacin indicada en el prrafo anterior no nos genera tanto problema, ya que no tienen una relacin lineal, sino que estn cuadrticamente relacionadas. Por lo que analizaremos ms profundamente a la experiencia ya que es la variable que genera altos grados de correlacin en otros dos regresores, y es la nica variable creada por nosotros.

Tarea N 2: Caso multivariable

Econometra

Realizaremos la regresin auxiliar de la experiencia con todos los dems regresores para ver el Rj2 :

Estadsticas de la regresin Coeficiente de correlacin 1 mltiple Coeficiente de determinacin 1 R^2 R^2 ajustado 1 Error tpico 3,7124E-15 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadradosF Valor crtico de F Regresin 5 92513,848 18502,7696 1,3425E+33 0 Residuos 494 6,8082E-27 1,37818E-29 Total 499 92513,848 Coeficientes Intercepcin -6 edad 1 EDADC 0 esc -1 Mujer 7,314E-16 RM -4,8843E-16 Error tpico 2,0268E-15 8,4364E-17 8,8391E-19 4,302E-17 3,8868E-16 3,7528E-16 Estadstico t Probabilidad Inferior 95% Superior 95% -2,9603E+15 0 -6 -6 1,18534E+16 0 1 1 0 1 -1,7367E-18 1,7367E-18 -2,32451E+16 0 -1 -1 1,88175137 0,06045747 -3,2271E-17 1,4951E-15 -1,301486205 0,19369871 -1,2258E-15 2,4892E-16

Entonces como resultado, obtuvimos que el Rj2 es igual a 1, por lo que para calcular el FIV, se indeterminara la ecuacin pues:

FIV =

1 1- Rj2

Entonces como conclusin y por lo que hemos visto en clases, mientras el Rj2 tienda a 1, podemos decir que se presenta Multicolinealidad y por lo tanto podemos decir que la varianza de los estimadores tendern a infinito, sin afectar el insesgamiento de los parmetros calculados. Por lo tanto para seguir con el anlisis de los datos eliminaremos el regresor de la experiencia, por lo que ahora presentamos nuestra regresin sin el parmetro mencionado:

Tarea N 2: Caso multivariable

Econometra

Estadsticas de la regresin Coeficiente de correlacin 0,44232583 mltiple Coeficiente de determinacin 0,19565214 R^2 R^2 ajustado 0,18751097 Error tpico 0,7350604 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 64,9252606 12,9850521 24,0324277 0,000000 Residuos 494 266,915012 0,54031379 Total 499 331,840273 Coeficientes Error tpico Estadstico t Probabilidad 6,09623 0,40131 15,19063 0,00000 0,01883 0,01670 1,12734 0,26014 -0,00018 0,00018 -1,01073 0,31264 0,08098 0,00852 9,50724 0,00000 -0,34697 0,07696 -4,50854 0,00001 0,20879 0,07431 2,80986 0,00515 Inferior 95% 5,30773 -0,01399 -0,00052 0,06425 -0,49818 0,06280 Superior 95% 6,88472 0,05165 0,00017 0,09772 -0,19577 0,35479

Intercepcin edad EDADC esc Mujer RM

Entonces para continuar con nuestro anlisis, interpretaremos cada parmetro calculado. Primero analizaremos el intercepto, sin olvidar que nuestra variable dependiente se encuentra en logaritmo natural (ln). Por lo tanto para encontrar el valor real del intercepto debemos encontrar el valor exponencial de 6,09623 que equivale 444. Este valor se interpreta como el ingreso mnimo por hora requerido, es la base de ingreso mnimo por hora cuando los regresores edad, edadc, esc son 0 y el individuo en cuestin es hombre y vive fuera de la regin metropolitana. Para continuar, la interpretacin del parmetro de la edad se puede explicar cmo: si el individuo envejece un ao, se espera que el ingreso por hora vari en un 1,8%, manteniendo todas las dems variables constantes. La interpretacin del parmetro de la edadc se puede explicar cmo: si la edad al cuadrado aumenta en un ao, se espera que el ingreso disminuya en un 0,018%, es decir mientras ms viejo ms pondera la edad al cuadrado, por lo que al ser ms viejo generara

Tarea N 2: Caso multivariable

Econometra

una mayor disminucin en el ingreso por hora, manteniendo todas las dems variables constantes. La interpretacin del parmetro de la escolaridad se explica como: Se espera que por cada ao de escolaridad que tenga un individuo el ingreso por hora vari en un 8%, manteniendo todas las dems variables constantes. La interpretacin del parmetro de sexo se explica como: Si el individuo es mujer se espera que el ingreso por hora disminuya en un 30%, manteniendo todas las dems variables constantes. La interpretacin del parmetro r.m: si el individuo vive en la regin metropolitana se espera que el ingreso por hora aumente en un 20%, manteniendo todas las dems variables constantes.

Heteroscedasticidad

Segn las pruebas informales, para verificar la heteroscedasticidad, consta solo de observar el comportamiento que tienen los errores sobre los regresores, como este modelos es multivariable, tomamos la variable dependiente estimada para analizar los errores. Como vemos en el grfico, los errores estn concentrados entre las Y estimadas de 6,5 y 8, pero estos no poseen un patrn sistemtico que nos d evidencia que existe heteroscedasticidad.

Tarea N 2: Caso multivariable


Test de Goldfeld y Quandt

Econometra

Los anlisis de varianza de cada muestra se presentan en las siguientes tablas: Muestra 1

ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 3,02431167 0,60486233 3,56962784 0,00400752 Residuos 219 37,1088688 0,16944689 Total 224 40,1331805
Muestra 2

ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 16,1988078 3,23976155 11,1135228 1,4849E-09 Residuos 219 63,8418434 0,29151527 Total 224 80,0406512

Luego de esto para calcular nuestro observado, tenemos que realizar la divisin siguiente:

SCR 2 / g.l SCR 1 /g.l

Esto nos da como resultado:

= 1,72039314
Adems, para seguir con el anlisis debemos calcular nuestro F crtico, con un 95% de confianza, y 219 grados de libertad, ya que es el n de cada submuestra menos la cantidad de parmetros estimados:

F critico

1,24954711

Por lo tanto como nuestro observado es mayor al F critico calculado, podemos rechazar la hiptesis nula de que existe Homoscedasticidad, Por lo que existe prueba estadstica de que el modelo presenta Heteroscedasticidad.

Tarea N 2: Caso multivariable

Econometra

Anlisis de Stata. Multicolinealidad

Primero presentaremos los Rj2 de cada regresor, a travs de las regresiones auxiliares de un regresor, con todos los dems regresores como variables independientes. Reg edad R-squared = 0.9735 FIV = 37.754922 Reg edadc R-squared = 0.9735 FIV = 37.756725 Reg esc R-squared = 0.0603 FIV = 1.064175 Reg Mujer R-squared = 0.0109 FIV = 1.011019 Reg rm R-squared = 0.0024 FIV = 1.002366

Calculando el FIV a travs del comando de STATA, se obtiene lo siguiente:


Variable edadc edad esc mujer rm Mean VIF VIF 37.76 37.75 1.06 1.01 1.00 15.72 1/VIF 0.026485 0.026487 0.939695 0.989101 0.997640

Como la edad y la edadc presentan un RJ2 cercano a uno, los FIV de estos tienden al infinito lo que significa que presentan una mayor colinealidad. Los otros tres regresores a diferencia de los dos primeros, tienen un RJ2 muy lejano a uno por lo que los FIV de estos tienden a uno y deducimos que no hay colinealidad. En base a esto STATA nos arroja un 6

Tarea N 2: Caso multivariable

Econometra

promedio de los FIV que es relativamente alto por lo que podemos decir que la regresin en cuestin est influenciada mayormente por los regresores edad y edadc lo que causa que est regresin presente multicolinealidad. Como la Varianza es directamente proporcional a los Rj2, mientras ms cercano a 1 sea este la Varianza tendera a infinito, por lo que generara que lo parmetros calculados, no sean totalmente eficientes.

Heterocedasticidad:

A continuacin les presentamos el modelo de regresin robusta.

Linear regression

Number of obs F( 5, 494) Prob > F R-squared Root MSE Robust Std. Err. .0206144 .0002324 .0097535 .0807796 .0750896 .4534484

= = = = =

500 18.78 0.0000 0.1957 .73506

lnylabh edad edadc esc mujer rm _cons

Coef. .0188314 -.0001769 .0809829 -.3469747 .2087913 6.096226

t 0.91 -0.76 8.30 -4.30 2.78 13.44

P>|t| 0.361 0.447 0.000 0.000 0.006 0.000

[95% Conf. Interval] -.0216713 -.0006335 .0618194 -.5056886 .0612569 5.2053 .0593342 .0002797 .1001464 -.1882608 .3563257 6.987151

En esta regresin, podemos ver que nuestros errores estndar son ligeramente mayores, esto es ya que para el clculo de la varianza del parmetro se utiliza la varianza poblacional y como esta no es conocida, realizamos los modelos robustos, que en cambio en vez de la varianza se utiliza errores estimados al cuadrado. Con esto logramos que nuestros errores estndar y a la vez la varianza de cada uno de uno de nuestros parmetros calculados sean consistente con la Heteroscedasticidad de White.

Test de White.

Para ver si nuestro modelo es heteroscedastico, podemos realizar el Test de White, adicional al test de Goldfeld Quandt. El clculo se realiz en STATA, y presentamos ahora los nR2 y el chi cuadrado con 17 grados de libertad y 95% de confianza: . nr2 = 40.180654 . Chi- cuadrado = 8.6717602

Tarea N 2: Caso multivariable

Econometra

Por lo tanto, como nuestro nR2 es mayor a nuestro valor crtico chi-cuadrado, se rechaza nuestra hiptesis nula de que existe homocedasticidad, por lo que existe suficiente evidencia estadstica, al 955 de confianza de que nuestro modelo es heteroscedastico.

Especificacin Variable relevante Omitida

Para esto realizamos, una regresin entre el logaritmo natural del ingreso con la edad y la experiencia y luego otra regresin entre el logaritmo natural del ingreso con la edad. Esto se presenta en las siguientes tablas:

Source Model Residual Total lnylabh esc _cons

SS 48.294846 283.545384 331.84023 Coef. .0780656 6.565247

df 1 498 499

MS 48.294846 .569368241 .665010481 t 9.21 70.64 P>|t| 0.000 0.000

Number of obs F( 1, 498) Prob > F R-squared Adj R-squared Root MSE

= = = = = =

500 84.82 0.0000 0.1455 0.1438 .75456

Std. Err. .0084763 .0929367

[95% Conf. Interval] .0614119 6.38265 .0947193 6.747843

Source Model Residual Total lnylabh exp_pt esc _cons

SS 49.1324879 282.707742 331.84023 Coef. .0034855 .0840759 6.397371

df

MS

2 24.5662439 497 .568828455 499 .665010481 Std. Err. .0028723 .0098138 .1666348 t 1.21 8.57 38.39 P>|t| 0.226 0.000 0.000

Number of obs F( 2, 497) Prob > F R-squared Adj R-squared Root MSE

= = = = = =

500 43.19 0.0000 0.1481 0.1446 .75421

[95% Conf. Interval] -.0021578 .0647943 6.069975 .0091288 .1033576 6.724766

Con esto nos damos cuenta de que tenemos un problema de incluir una variable irrelevante, puesto que la Variable experiencia, presenta problema de multicolinealidad, debido a que la experiencia tambin est calculada con base a la escolaridad. Esto hace que nuestros errores estndar, al incluir el regresor experiencia, sean mayores que al no incluir esta variable.

Tarea N 2: Caso multivariable

Econometra

No linealidad

Para esto llevaremos a cabo el test de Ramsey RESET, este evala si los coeficientes asociados a las variables son cero, para saber si existe colinealidad. Por lo tanto si se rechaza Ho es que no hay linealidad en el modelo. Que no haya linealidad puede implicar que: Los estimadores son sesgados y su varianza se calcula mal. La varianza residual se calcula mal y los contrastes individuales de la t no son vlidos. Las predicciones del modelo son malas, sobre todo fuera del rango de valores de las observaciones. Por lo tanto, nuestro test nos arroja que:

Ramsey RESET test using powers of the fitted values of lnylabh Ho: model has no omitted variables F(3, 491) = 14.70 Prob > F = 0.0000

Por lo tanto no se rechaza Ho, por lo que podemos decir que nuestro modelo es lineal.

Seleccin de modelos anidados

El test de bic y akaike, nos da una mtrica para saber cul de todos los modelos es el que presenta la informacin, pero con la menor cantidad de regresores posibles, Para esto hay que decidir entre el modelo que tenga el menor AIC o el mayor BIC. reg lnylabh edad edadc esc mujer rm
Model . Obs 500 ll(null) -606.9806 ll(model) -552.5498 df 6 AIC 1117.1 BIC 1142.387

reg lnylabh edad edadc esc mujer

Tarea N 2: Caso multivariable

Econometra
BIC 1144.101

Model .

Obs 500

ll(null) -606.9806

ll(model) -556.5138

df 5

AIC 1123.028

reg lnylabh edad edadc esc


Model . Obs 500 ll(null) -606.9806 ll(model) -566.3964 df 4 AIC 1140.793 BIC 1157.651

reg lnylabh edad edadc


Model . Obs 500 ll(null) -606.9806 ll(model) -605.8704 df 3 AIC 1217.741 BIC 1230.385

reg lnylabh edad


Model . Obs 500 ll(null) -606.9806 ll(model) -606.5352 df 2 AIC 1217.07 BIC 1225.5

Por lo tanto elegiremos el primer modelo, pues es el modelo que presenta menor AIC Y BIC, por lo que las variables que se indican en el primer modelo de la regresion se encuentran bien. Si hubisemos calculado el modelo con la experiencia, nos hubiese dado un aic y bic mayor, porque sin esa variable explica mejor el modelo.

10

Vous aimerez peut-être aussi