Académique Documents
Professionnel Documents
Culture Documents
21/06/2013
Econometra
Al realizar la primera regresin, con todos los regresores especificados en la pauta de este trabajo, nos encontramos con el problema de que la regresin no calculaba los betas del regresor edad, esto lo podemos ver en la siguiente tabla:
Estadsticas de la regresin Coeficiente de0,44232583 correlacin mltiple Coeficiente de0,19565214 determinacin R^2 R^2 ajustado 0,18548668 Error tpico 0,7350604 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadradosF Valor crtico de F Regresin 6 64,9252606 10,82087677 24,0324277 5,5325E-25 Residuos 494 266,915012 0,54031379 Total 500 331,840273 Coeficientes 6,20921438 0,01883143 0 -0,00017689 0,09981432 -0,3469747 0,20879125 Error tpico 0,30817346 0,01670425 0 0,00017502 0,01887668 0,07695944 0,07430675 Estadstico t Probabilidad Inferior 95% Superior 95%Inferior 95,0% Superior 95,0% 20,14843977 2,4218E-66 5,60372203 6,81470674 5,60372203 6,81470674 1,127343789 0,26014442 -0,0139887 0,05165156 -0,0139887 0,05165156 65535 #NUM! 0 0 0 0 -1,010734043 0,31263853 -0,00052076 0,00016697 -0,00052076 0,00016697 5,287703867 1,8634E-07 0,06272583 0,13690281 0,06272583 0,13690281 -4,508539993 8,161E-06 -0,49818289 -0,19576651 -0,49818289 -0,19576651 2,809855905 0,00515299 0,06279501 0,35478749 0,06279501 0,35478749
Para ver el problema que se presenta en la regresin anterior, analizaremos los datos. Lo primero que haremos ser ver los coeficientes de correlacin entre las variables:
EXP_PT EXP_PT edad EDADC esc Mujer RM 1 0,95875593 0,94708121 -0,50468624 -0,10367929 0,00848761
edad
EDADC
esc
Mujer
RM
1 0,98665471 1 -0,23849379 -0,239138286 1 -0,09635571 -0,095993441 0,06158152 1 0,02039824 0,016656094 0,03295621 0,00319613
En la tabla anterior, se puede observar que existe una fuerte correlacin entre los represores, edad - experiencia, edadc - experiencia, y a la misma vez edad - edadc. La ltima relacin indicada en el prrafo anterior no nos genera tanto problema, ya que no tienen una relacin lineal, sino que estn cuadrticamente relacionadas. Por lo que analizaremos ms profundamente a la experiencia ya que es la variable que genera altos grados de correlacin en otros dos regresores, y es la nica variable creada por nosotros.
Econometra
Realizaremos la regresin auxiliar de la experiencia con todos los dems regresores para ver el Rj2 :
Estadsticas de la regresin Coeficiente de correlacin 1 mltiple Coeficiente de determinacin 1 R^2 R^2 ajustado 1 Error tpico 3,7124E-15 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadradosF Valor crtico de F Regresin 5 92513,848 18502,7696 1,3425E+33 0 Residuos 494 6,8082E-27 1,37818E-29 Total 499 92513,848 Coeficientes Intercepcin -6 edad 1 EDADC 0 esc -1 Mujer 7,314E-16 RM -4,8843E-16 Error tpico 2,0268E-15 8,4364E-17 8,8391E-19 4,302E-17 3,8868E-16 3,7528E-16 Estadstico t Probabilidad Inferior 95% Superior 95% -2,9603E+15 0 -6 -6 1,18534E+16 0 1 1 0 1 -1,7367E-18 1,7367E-18 -2,32451E+16 0 -1 -1 1,88175137 0,06045747 -3,2271E-17 1,4951E-15 -1,301486205 0,19369871 -1,2258E-15 2,4892E-16
Entonces como resultado, obtuvimos que el Rj2 es igual a 1, por lo que para calcular el FIV, se indeterminara la ecuacin pues:
FIV =
1 1- Rj2
Entonces como conclusin y por lo que hemos visto en clases, mientras el Rj2 tienda a 1, podemos decir que se presenta Multicolinealidad y por lo tanto podemos decir que la varianza de los estimadores tendern a infinito, sin afectar el insesgamiento de los parmetros calculados. Por lo tanto para seguir con el anlisis de los datos eliminaremos el regresor de la experiencia, por lo que ahora presentamos nuestra regresin sin el parmetro mencionado:
Econometra
Estadsticas de la regresin Coeficiente de correlacin 0,44232583 mltiple Coeficiente de determinacin 0,19565214 R^2 R^2 ajustado 0,18751097 Error tpico 0,7350604 Observaciones 500 ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 64,9252606 12,9850521 24,0324277 0,000000 Residuos 494 266,915012 0,54031379 Total 499 331,840273 Coeficientes Error tpico Estadstico t Probabilidad 6,09623 0,40131 15,19063 0,00000 0,01883 0,01670 1,12734 0,26014 -0,00018 0,00018 -1,01073 0,31264 0,08098 0,00852 9,50724 0,00000 -0,34697 0,07696 -4,50854 0,00001 0,20879 0,07431 2,80986 0,00515 Inferior 95% 5,30773 -0,01399 -0,00052 0,06425 -0,49818 0,06280 Superior 95% 6,88472 0,05165 0,00017 0,09772 -0,19577 0,35479
Entonces para continuar con nuestro anlisis, interpretaremos cada parmetro calculado. Primero analizaremos el intercepto, sin olvidar que nuestra variable dependiente se encuentra en logaritmo natural (ln). Por lo tanto para encontrar el valor real del intercepto debemos encontrar el valor exponencial de 6,09623 que equivale 444. Este valor se interpreta como el ingreso mnimo por hora requerido, es la base de ingreso mnimo por hora cuando los regresores edad, edadc, esc son 0 y el individuo en cuestin es hombre y vive fuera de la regin metropolitana. Para continuar, la interpretacin del parmetro de la edad se puede explicar cmo: si el individuo envejece un ao, se espera que el ingreso por hora vari en un 1,8%, manteniendo todas las dems variables constantes. La interpretacin del parmetro de la edadc se puede explicar cmo: si la edad al cuadrado aumenta en un ao, se espera que el ingreso disminuya en un 0,018%, es decir mientras ms viejo ms pondera la edad al cuadrado, por lo que al ser ms viejo generara
Econometra
una mayor disminucin en el ingreso por hora, manteniendo todas las dems variables constantes. La interpretacin del parmetro de la escolaridad se explica como: Se espera que por cada ao de escolaridad que tenga un individuo el ingreso por hora vari en un 8%, manteniendo todas las dems variables constantes. La interpretacin del parmetro de sexo se explica como: Si el individuo es mujer se espera que el ingreso por hora disminuya en un 30%, manteniendo todas las dems variables constantes. La interpretacin del parmetro r.m: si el individuo vive en la regin metropolitana se espera que el ingreso por hora aumente en un 20%, manteniendo todas las dems variables constantes.
Heteroscedasticidad
Segn las pruebas informales, para verificar la heteroscedasticidad, consta solo de observar el comportamiento que tienen los errores sobre los regresores, como este modelos es multivariable, tomamos la variable dependiente estimada para analizar los errores. Como vemos en el grfico, los errores estn concentrados entre las Y estimadas de 6,5 y 8, pero estos no poseen un patrn sistemtico que nos d evidencia que existe heteroscedasticidad.
Econometra
Los anlisis de varianza de cada muestra se presentan en las siguientes tablas: Muestra 1
ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 3,02431167 0,60486233 3,56962784 0,00400752 Residuos 219 37,1088688 0,16944689 Total 224 40,1331805
Muestra 2
ANLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F Regresin 5 16,1988078 3,23976155 11,1135228 1,4849E-09 Residuos 219 63,8418434 0,29151527 Total 224 80,0406512
Luego de esto para calcular nuestro observado, tenemos que realizar la divisin siguiente:
= 1,72039314
Adems, para seguir con el anlisis debemos calcular nuestro F crtico, con un 95% de confianza, y 219 grados de libertad, ya que es el n de cada submuestra menos la cantidad de parmetros estimados:
F critico
1,24954711
Por lo tanto como nuestro observado es mayor al F critico calculado, podemos rechazar la hiptesis nula de que existe Homoscedasticidad, Por lo que existe prueba estadstica de que el modelo presenta Heteroscedasticidad.
Econometra
Primero presentaremos los Rj2 de cada regresor, a travs de las regresiones auxiliares de un regresor, con todos los dems regresores como variables independientes. Reg edad R-squared = 0.9735 FIV = 37.754922 Reg edadc R-squared = 0.9735 FIV = 37.756725 Reg esc R-squared = 0.0603 FIV = 1.064175 Reg Mujer R-squared = 0.0109 FIV = 1.011019 Reg rm R-squared = 0.0024 FIV = 1.002366
Como la edad y la edadc presentan un RJ2 cercano a uno, los FIV de estos tienden al infinito lo que significa que presentan una mayor colinealidad. Los otros tres regresores a diferencia de los dos primeros, tienen un RJ2 muy lejano a uno por lo que los FIV de estos tienden a uno y deducimos que no hay colinealidad. En base a esto STATA nos arroja un 6
Econometra
promedio de los FIV que es relativamente alto por lo que podemos decir que la regresin en cuestin est influenciada mayormente por los regresores edad y edadc lo que causa que est regresin presente multicolinealidad. Como la Varianza es directamente proporcional a los Rj2, mientras ms cercano a 1 sea este la Varianza tendera a infinito, por lo que generara que lo parmetros calculados, no sean totalmente eficientes.
Heterocedasticidad:
Linear regression
Number of obs F( 5, 494) Prob > F R-squared Root MSE Robust Std. Err. .0206144 .0002324 .0097535 .0807796 .0750896 .4534484
= = = = =
[95% Conf. Interval] -.0216713 -.0006335 .0618194 -.5056886 .0612569 5.2053 .0593342 .0002797 .1001464 -.1882608 .3563257 6.987151
En esta regresin, podemos ver que nuestros errores estndar son ligeramente mayores, esto es ya que para el clculo de la varianza del parmetro se utiliza la varianza poblacional y como esta no es conocida, realizamos los modelos robustos, que en cambio en vez de la varianza se utiliza errores estimados al cuadrado. Con esto logramos que nuestros errores estndar y a la vez la varianza de cada uno de uno de nuestros parmetros calculados sean consistente con la Heteroscedasticidad de White.
Test de White.
Para ver si nuestro modelo es heteroscedastico, podemos realizar el Test de White, adicional al test de Goldfeld Quandt. El clculo se realiz en STATA, y presentamos ahora los nR2 y el chi cuadrado con 17 grados de libertad y 95% de confianza: . nr2 = 40.180654 . Chi- cuadrado = 8.6717602
Econometra
Por lo tanto, como nuestro nR2 es mayor a nuestro valor crtico chi-cuadrado, se rechaza nuestra hiptesis nula de que existe homocedasticidad, por lo que existe suficiente evidencia estadstica, al 955 de confianza de que nuestro modelo es heteroscedastico.
Para esto realizamos, una regresin entre el logaritmo natural del ingreso con la edad y la experiencia y luego otra regresin entre el logaritmo natural del ingreso con la edad. Esto se presenta en las siguientes tablas:
df 1 498 499
Number of obs F( 1, 498) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
df
MS
2 24.5662439 497 .568828455 499 .665010481 Std. Err. .0028723 .0098138 .1666348 t 1.21 8.57 38.39 P>|t| 0.226 0.000 0.000
Number of obs F( 2, 497) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
Con esto nos damos cuenta de que tenemos un problema de incluir una variable irrelevante, puesto que la Variable experiencia, presenta problema de multicolinealidad, debido a que la experiencia tambin est calculada con base a la escolaridad. Esto hace que nuestros errores estndar, al incluir el regresor experiencia, sean mayores que al no incluir esta variable.
Econometra
No linealidad
Para esto llevaremos a cabo el test de Ramsey RESET, este evala si los coeficientes asociados a las variables son cero, para saber si existe colinealidad. Por lo tanto si se rechaza Ho es que no hay linealidad en el modelo. Que no haya linealidad puede implicar que: Los estimadores son sesgados y su varianza se calcula mal. La varianza residual se calcula mal y los contrastes individuales de la t no son vlidos. Las predicciones del modelo son malas, sobre todo fuera del rango de valores de las observaciones. Por lo tanto, nuestro test nos arroja que:
Ramsey RESET test using powers of the fitted values of lnylabh Ho: model has no omitted variables F(3, 491) = 14.70 Prob > F = 0.0000
Por lo tanto no se rechaza Ho, por lo que podemos decir que nuestro modelo es lineal.
El test de bic y akaike, nos da una mtrica para saber cul de todos los modelos es el que presenta la informacin, pero con la menor cantidad de regresores posibles, Para esto hay que decidir entre el modelo que tenga el menor AIC o el mayor BIC. reg lnylabh edad edadc esc mujer rm
Model . Obs 500 ll(null) -606.9806 ll(model) -552.5498 df 6 AIC 1117.1 BIC 1142.387
Econometra
BIC 1144.101
Model .
Obs 500
ll(null) -606.9806
ll(model) -556.5138
df 5
AIC 1123.028
Por lo tanto elegiremos el primer modelo, pues es el modelo que presenta menor AIC Y BIC, por lo que las variables que se indican en el primer modelo de la regresion se encuentran bien. Si hubisemos calculado el modelo con la experiencia, nos hubiese dado un aic y bic mayor, porque sin esa variable explica mejor el modelo.
10