Académique Documents
Professionnel Documents
Culture Documents
DOCENTE:
Dr. IPANAQUE CENTENO, ENRIQUE
CURSO:
ECONOMETRÍA
CICLO:
IX
TEMA:
LABORATORIO I
INTEGRANTES:
ESPINOLA MARIÑOS, KEVIN
LOZANO GODOS, DIEGO
SANDOVAL BARRETO, LEYLA
2018
PRÁCTICA 1
75.5
75.0
74.5
74.0
73.5
73.0
3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 11.0
TPFLCM
58.0
TDCM
56.0
54.0
52.0
50.0
3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
TPFLCF
75.5
75.0
74.5
74.0
73.5
73.0
7.50 7.60 7.70 7.80 7.90 8.00 8.10 8.20 8.30
IPH82
56.0
55.0
54.0
53.0
52.0
51.0
7.50 7.60 7.70 7.80 7.90 8.00 8.10 8.20 8.30
IPH82
Existe una relación asimétrica entre las dos variables para hombres y mujeres. Los
varones responden positivamente al aumento de salarios, mientras que las hembras
responden negativamente. Esto puede parecer desconcertante. Es posible que el
aumento de los ingresos para las mujeres, como resultado de mayores salarios pueda
inducir a los hombres a retirarse de la fuerza laboral, lo que acaso sea posible para las
parejas casadas. Pero hay que tener cuidado. Se está haciendo simples regresiones
bivariadas aquí. Cuando se estudie el análisis de regresión múltiple, las conclusiones
anteriores pueden cambiar.
2) La tabla proporciona datos sobre los índices de producción por hora (X) y la
compensación real por hora (Y) de los negocios y sectores no agrícolas de la economía de
Estados Unidos de 1960 a 2005. El año base para los índices es 1992 = 100; además, los
índices se ajustan por estacionalidad.
120
100
80
60
40
50 60 70 80 90 100 110 120 130
500.00
400.00
300.00
200.00
100.00
0.00
0.0 50.0 100.0 150.0 200.0 250.0
6000.00
4000.00
2000.00
0.00
0.0 50.0 100.0 150.0 200.0 250.0
-2000.00
La regresión que mejor se ajusta es la del índice BVNY en función del IPC.
4) La tabla proporciona datos sobre el producto interno bruto (PIB) de Estados Unidos de
1959 a 2005.
12000.0
10000.0
8000.0
6000.0
4000.0
2000.0
0.0
1955 1965 1975 1985 1995 2005
PIBN PIBR
PIBN
14000.0 y = 252.58x - 1723.2
12000.0 R² = 0.926
10000.0
8000.0
6000.0
4000.0
2000.0
0.0
-2000.0 0 10 20 30 40 50
-4000.0
PIBR
12000.0 y = 180.26x + 1620.4
R² = 0.9718
10000.0
8000.0
6000.0
4000.0
2000.0
0.0
0 10 20 30 40 50
c) ¿Cómo interpretaría β2?
d) Si existiera una diferencia entre el valor estimado de β2 para el PIB en dólares actuales
y el estimado para el PIB en dólares constantes, ¿qué la explicaría?
e) Con base en sus resultados, ¿qué puede decir sobre la naturaleza de la inflación en
Estados Unidos en el período de muestra?
El PIB nominal ha crecido más rápido que el PIB real a causa de la inflación.
PRÁCTICA 2
1) Considere los siguientes resultados de regresión (las razones t están entre
paréntesis):
Y: horas de trabajo anuales deseadas por la esposa, calculadas como horas normales de
trabajo al año, más las semanas invertidas en buscar trabajo.
X3: ingresos anuales reales después de impuestos del esposo en el año anterior.
X6: variable de actitud; 1 si la entrevista considera correcto que una mujer trabaje si así lo
desea y su esposo está de acuerdo; 0 en cualquier otro caso.
a) ¿Los signos de los coeficientes de las diversas regresoras no dicótomas tienen algún
sentido económico?
Según el modelo indica que las variables no son influyentes ya que para el trabajo para
las mujeres no se necesita de mucha fuerza laboral y tampoco considera necesario la
escolaridad, por ello no son significativos.
2) Con base en datos anuales para el periodo 1972-1979, William Nordhaus estimo el
siguiente modelo para explicar el comportamiento del precio del petróleo de la
OPEP:
Ŷt = 0.3X1t + 5.22X2t
ee = (0.03) (0.50)
Y: Diferencia entre el precio del año en curso y el año anterior (dólares por barril)
X1: Diferencia entre el precio para entrega inmediata del año en curso y el precio de la
OPEP en el año anterior
X2: 1 para el año 1972 y 0 en caso contrario
Y = α1 + α2 Di + βXi + ui
a) D = 1 si es hombre y 0 si es mujer
b) D = 1 si es mujer y 0 si es hombre
c) D= 1 si es mujer y -1 si es hombre
Los resultados serán los mismos, la única diferencia que los valores de las variables
dicótomas son diferentes y también la categoría base, es preferible utilizar tan solo un
método ya que igual el modelo tiene una explicación concreta con respecto a las
variables indicadas.
4) Consulte la regresión:
Ŷt = 1222.1250 + 245.3750D2t + 347.6250D3t – 62.1250D4t
t = (20.3720) (2.8922) (4.0974) (-0.7322) R2 = 0.5318
¿Cómo probaría la hipótesis de que los coeficientes de D2 y D3 son iguales? ¿Y que los
coeficientes D2 y D4 son iguales? Si el coeficiente de D3 es estadísticamente distinto
del D2 y el coeficiente de D4 es diferente del D2 ¿Significa que los coeficientes D3 y D4
son también distintos?
Sugerencia: VAR (A±B) VAR(A) + VAR(B) ± 2COV(A, B)
PRUEBA DE ESTABILIDAD:
HO: B2= B3 = 0
H1: Bj ≠ 0 ; al menos un parámetro es diferente de cero
La prueba de Chow no establece de manera explícita cuál coeficiente, intercepto o
pendiente es distinto, ni si ambos son diferentes en los dos periodos (como en el
ejemplo anterior). Es decir, se puede tener una prueba de Chow significativa debido a
que sólo la pendiente es diferente o a que sólo el intercepto es distinto, o porque ambos
lo son. En otras palabras, no se puede saber, mediante la prueba de Chow, cuál de las
cuatro posibilidades esquematizadas en la fi gura 9.3 es la que se tiene en una
determinada instancia. Al respecto, el método de la variable dicótoma tiene una clara
ventaja, pues no sólo indica si los dos periodos son distintos, sino que también destaca
la(s) causa(s) de la diferencia: si se debe al intercepto, a la pendiente o a las dos. En la
práctica, saber si dos regresiones difieren en uno u otro coeficiente resulta tan
importante, si no más, que sólo saber que son distintas.
5) Considere los siguientes resultados de una regresión. (Los datos reales se
proporcionan en la tabla)
Tasa de Tasa de
Tasa de Tasa de
Año y puestos Año y puestos
Desempleo D DV Desempleo D DV
Trimestre vacantes Trimestre vacantes
TD% TD%
V% V%
1958 - IV 1.915 0.510 0 0 1965 - I 1.201 0.997 0 0
1959 - I 1.876 0.541 0 0 - II 1.192 1.035 0 0
- II 1.842 0.541 0 0 - III 1.259 1.040 0 0
- III 1.750 0.690 0 0 - IV 1.192 1.086 0 0
- IV 1.648 0.771 0 0 1966 - I 1.089 1.101 0 0
1960 - I 1.450 0.836 0 0 - II 1.101 1.058 0 0
- II 1.393 0.908 0 0 - III 1.243 0.987 0 0
- III 1.322 0.968 0 0 - IV 1.623 0.819 1 0.819
- IV 1.260 0.998 0 0 1967 - I 1.821 0.740 1 0.74
1961 - I 1.171 0.968 0 0 - II 1.990 0.661 1 0.661
- II 1.182 0.964 0 0 - III 2.114 0.660 1 0.66
- III 1.221 0.952 0 0 - IV 2.115 0.698 1 0.698
- IV 1.340 0.849 0 0 1968 - I 2.150 0.695 1 0.695
1962 - I 1.411 0.748 0 0 - II 2.141 0.732 1 0.732
- II 1.600 0.658 0 0 - III 2.167 0.749 1 0.749
- III 1.780 0.562 0 0 - IV 2.107 0.800 1 0.8
- IV 1.941 0.510 0 0 1969 - I 2.104 0.783 1 0.783
1963 - I 2.170 0.510 0 0 - II 2.056 0.800 1 0.8
- II 2.067 0.544 0 0 - III 2.170 0.794 1 0.794
- III 1.942 0.568 0 0 - IV 2.161 0.790 1 0.79
- IV 1.764 0.677 0 0 1970 - I 2.225 0.757 1 0.757
1964 - I 1.532 0.794 0 0 - II 2.241 0.746 1 0.746
- II 1.155 0.838 0 0 - III 2.366 0.739 1 0.739
- III 1.409 0.885 0 0 - IV 2.324 0.707 1 0.707
- IV 1.296 0.970 0 0 1971 - I 2.516 0.583 1 0.583
- II 2.909 0.524 1 0.524
Si tomamos como categoría base al periodo anterior al cuarto trimestre la tasa promedio
de desempleo seria de un 0.94551%. Según el modelo la variable dicótoma es
estadísticamente significativo. Co respecto al periodo anterior del cuarto trimestre del
año 1966.
b) ¿Las pendientes para el periodo anterior y posterior al cuarto trimestre de 1966 son
estadísticamente significativas distintas?
Para el periodo anterior y posterior del cuarto trimestre del año 1966 son significativos
debido al valor t que nos brinda el modelo, lo cual influye en la explicación del modelo
econométrico que explica la tasa de desempleo.
c) ¿Se puede concluir con toda seguridad, a partir de ese estudio, que los generosos
beneficios del desempleo propician tasas más altas de vacantes? ¿lo anterior tiene algún
sentido económico?
Según la variabilidad del modelo y aportes de las variables V y la variable dicótoma, que
explica la tasa de desempleo podemos concluir que los generosos beneficios del
desempleo generan tasas altas de vacantes para las distintas personas, lo cual tiene un
sentido económico ya que el modelo explica de manera concreta lo que se quiere lograr
en el estudio.
LnŶ=2.41+0.3674LnX1+0.2217LnX2+0.0803LnX3-0.1755D1+0.2799D2+0.5634D3-0.2572D4
R2=0.766
Antes se trabajó con un modelo lineal pero lo que se obtuvo y se trabajo fue con un
modelo logarítmico lo que ahora tenemos no son las horas-hombre del examinador
FDIC, sino la mediana de las horas-hombre del examinador FDIC; por lo que no se tuvo
problemas para trabajar este modelo econométrico.
8) Determinantes del precio por onza de cola. Cathy Schaefer, alumna del autor, estimó
la siguiente regresión con base en datos transversales de 77 observaciones:
Di = 1 si ln Xi > 7, y Di = 0 de lo contrario.
Nota: Cuando ln Xi = 7, X = $1 097 (aproximadamente).
c) ¿Cuál puede ser la razón para introducir la regresora Di (ln Xi − 7)? ¿Cómo
explica esta regresora? ¿Y cómo interpreta el coeficiente −3.36 de esta
regresora? (Sugerencia: regresión lineal por tramos.)
Este regresor se introduce para capturar el efecto del incremento de los
niveles de ingreso per cápita por encima del valor umbral de $ 1097 en la
esperanza de vida. Este regresor proporciona el número de años adicionales
que uno puede esperar vivir ya que el ingreso de uno va por encima del valor
umbral. Sin embargo, el valor del coeficiente estimado no es
estadísticamente significativo, ya que el valor p del coeficiente estimado es
de aproximadamente 0.168.
d) Si suponemos un ingreso per cápita de $1 097 como línea divisoria entre los
países más pobres y los más ricos, ¿cómo derivaría la regresión para países
cuyo ingreso per cápita es menor que $1 097 y la regresión para países cuyo
ingreso per cápita es mayor que $1 097?
La ecuación de regresión para países cuyo ingreso per cápita es menor a
1097$ sería:
-2.40 + 9.39 ln(Xi)
La ecuación de regresión para países cuyo ingreso per cápita es mayor a
1097$ sería:
-2.40 + (9.39-3.36) ln(Xi)+ 3.36(7), simplificando
21.12 + 6.03 ln(Xi)
e) ¿Qué conclusiones generales obtiene del resultado de la regresión de este
problema?
Aunque numéricamente las dos regresiones parecen diferentes,
estadísticamente no lo son, porque el coeficiente del último término de la
ecuación es una diferencia estadísticamente discernible en la esperanza de
vida entre países pobres y ricos, si suponemos que los países con un ingreso
per cápita superior a $ 1097 son países más ricos.
Yi = β1 + β2Di + ui
Se nos dice que la covarianza entre los dos estimadores es -15. Al juntar
todos estos números, obtenemos:
Var(B1 + B2) = 15 + 25 + 2(-15) = 10
11) En el modelo Yi = B1 + B2(Di) + ui, sea Di = 0 para las primeras 40 observaciones y Di
= 1 para las restantes 60 observaciones. Sabe que ui tiene media cero y varianza 100.
¿Cuáles son los valores medios y las varianzas para los dos conjuntos de
observaciones?
E( Y/ Di = 0) = B1
E( Y/ Di = 1) = B1+ B2
Var (B1) =
1 60
Var (B1)= 100 (24) 100 = 2.5
Var (B2) =
100
Var(B2)= ( ) = 4.17
24
14) Para evaluar la factibilidad de un salario anual garantizado (impuesto sobre la renta
negativo), Rand Corporation valoro un estudio de la respuesta de la oferta de trabajo
(horas promedio de trabajo) ante un incremento de los salarios por hora. Los datos
del estudio se obtuvieron de una muestra nacional de 6000 familias cuyo jefe (varón)
ganaba menos de 15000 dólares al año. Los datos se dividieron en 39 grupos
demográficos para su análisis. Estos datos se proporcionan en la tabla. En vista de
que para 4 grupos demográficos había datos faltantes respecto de algunas variables
los datos de la tabla se refieren solo a 35 de esos grupos.
a) Realice la regresión de las horas promedio trabajadas durante un año sobre las
demás variables suministradas en la tabla e interprete su regresión.
b) ¿Existe evidencia de multicolinealidad en los datos? ¿Cómo sabe?
c) Si existe un problema de multicolinealidad ¿Qué acciones correctivas, si acaso hay
alguna, tomaría?
d) ¿Qué sugiere este estudio sobre la viabilidad de un impuesto sobre la renta
negativo?
15) La tabla presenta información sobre la razón ventas/efectivo en las industrias
manufactureras de Estados Unidos, clasificadas por tamaño de activos del
establecimiento de 1971 - I a 1973 – IV. (Información Trimestral). La razón ventas
efectivo puede considerarse una medida de la velocidad del ingreso en el sector
empresarial, es decir, el número de veces que circula un dólar.
SOFTWARE: RSTUDIO
w <- matrix(0,7,2)
w[1,1]<- mean(data[,1])
w[1,2]<- sd(data[,1])
for(i in 2:7) w[i,1]<- mean(data[,i])
for(i in 2:7) w[i,2]<- sd(data[,i])
w<- data.frame(w)
r <- c("1-10","10-25","25-50","50-100","100-250","250-1000","1000 a mas")
w <- cbind(r,w)
colnames(w)<- c("Activos","Media","Desviacion Estandar")
w
Activos Media Desviacion Estandar
1 1-10 7.025833 0.6213923
2 10-25 7.265417 0.8025794
3 25-50 7.299333 0.4627164
4 50-100 7.358500 0.6441816
5 100-250 7.663583 0.4673892
6 250-1000 7.370000 0.2563332
7 1000 a mas 6.989833 0.3651692
b) Grafique el valor de la media frente a las desviaciones estándar obtenidas en “a”,
con el tamaño de activos como unidad de observación.
library(ggplot2)
ggplot(w,aes(w$Media,w$`Desviacion Estandar`))+ geom_point()+labs(x
="MEDIA",y="DESVIACION ESTANDAR", title="MEDIA VS DESVIACION
ESTANDAR")+
theme(plot.title = element_text(size = rel(1), colour = "blue"))
Errores estándar correctos. Errores estándar de una matriz consistentes, es decir que
ya convergen probabilidad al verdadero valor poblacional cuando la muestra es muy
grande. Esta matriz corrige el problema de Heteroscedasticidad.
e) Si se establece heteroscedasticidad, ¿cómo puede transformar los datos de
manera que en los datos transformados la varianza del error sea homoscedástica?
Muestre los cálculos necesarios.
17) La tabla presenta información acerca de los precios de acciones (Y) y los precios al
consumidor (X) expresado en cambios porcentuales anuales para un corte
transversal de 20 paises.
PAIS Y X
AUSTRALIA 5 4,3
AUSTRIA 11,1 4,6
BELGICA 3,2 2,4
CANADA 7,9 2,4
CHILE 25,5 26,4
DINAMARCA 3,8 4,2
FINLANDIA 11,1 5,5
FRANCIA 9,9 4,7
ALEMANIA 13,3 2,2
INDIA 1,5 4
IRLANDA 6,4 4
ISRAEL 8,9 8,4
ITALIA 8,1 3,3
JAPON 13,5 4,7
MEXICO 4,7 5,2
PAISES BAJOS 7,5 3,6
NUEVA ZELANDA 4,7 3,6
SUECIA 8 4
REINO UNIDO 7,5 3,9
ESTADOS UNIDOS 9 2,1
a) Graficar el diagrama de dispersión:
GRAFICO DE DISPERSIÓN
30
25
TASA DE CRECIMIENTO
20
15
10
0
0 5 10 15 20 25
PRECIO DE COMSUMIDOR
>normalidad
$multivariateNormality
Test Statistic p value Result
1 Mardia Skewness 46.2593356725039 2.17502490411763e-09 NO
2 Mardia Kurtosis 5.909776016039 3.4257321424036e-09 NO
3 MVN <NA> <NA> NO
$univariateNormality
Test Variable Statistic p value Normality
1 Shapiro-Wilk Y 0.8448 0.0044 NO
2 Shapiro-Wilk X 0.4634 <0.001 NO
$Descriptives
n Mean Std.Dev Median Min Max 25th 75th Skew Kurtosis
Y 20 8.530 5.131954 7.95 1.5 25.5 4.925 10.2 1.620914 3.38019
X 20 5.175 5.188335 4.00 2.1 26.4 3.525 4.7 3.391702 11.03352
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,76575478
Coeficiente de
determinación R^2 0,58638038
R^2 ajustado 0,56340152
Error típico 3,39096908
Observaciones 20
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 293,425917 293,425917 25,5182456 8,305E-05
Residuos 18 206,976083 11,4986713
Total 19 500,402
Estadístico
Coeficientes Error típico t Probabilidad
Intercepción 4,61028209 1,08490551 4,249478 0,00048222
PRECIO DE
COMSUMIDOR (X) 0,75743341 0,14994053 5,05155873 8,305E-05
2
Residuos
0
0 5 10 15 20 25 30
-2
-4
-6
-8
PRECIO DE COMSUMIDOR
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 1,82712879 1,82712879 0,15893191 0,69510459
Residuos 17 195,437082 11,4962989
Total 18 197,264211
2
Residuos
0
0 1 2 3 4 5 6 7 8 9
-2
-4
-6
-8
PRECIO DE COMSUMIDOR
18) La tabla proporciona cifras sobre importaciones, PIB e índice de precios al
consumidor (IPC) de Estados Unidos de 1975 a 2005. Se le pide considerar el
siguiente modelo: ln(importaciones)= B1 + B2ln(PIB) + B3ln(IPC) + ui
$univariateNormality
Test Variable Statistic p value Normality
1 Shapiro-Wilk IPC 0.9578 0.2548 YES
2 Shapiro-Wilk PIB 0.9504 0.1598 YES
3 Shapiro-Wilk IMPORTACION 0.9102 0.0131 NO
$Descriptives
n Mean Std.Dev Median Min Max 25th
IPC 31 127.4613 42.21477 130.7 53.8 195.3 98.05
PIB 31 6126.4645 3178.39942 5803.1 1638.3 12455.8 3380.85
IMPORTACION 31 621722.2903 430278.44869 491020.0 98185.0 1677371.0
266984.00
75th Skew Kurtosis
IPC 161.75 -0.1740569 -1.2154059
PIB 8525.65 0.3336856 -1.1423856
IMPORTACION 896786.50 0.7649175 -0.5403296
$Descriptives
n Mean Std.Dev Median Min Max 2
5th
IPC 31 4.785357 0.3762516 4.872905 3.985273 5.274537 4.585
353
PIB 31 8.569425 0.5863841 8.666148 7.401414 9.429942 8.124
819
IMPORTACION 31 13.084723 0.7620917 13.104240 11.494609 14.332738 12.494
918
75th Skew Kurtosis
IPC 5.086022 -0.6498241 -0.7421814
PIB 9.050497 -0.3650152 -1.0667320
IMPORTACION 13.706316 -0.2293984 -0.9714986
Residuals:
Min 1Q Median 3Q Max
-0.127318 -0.038567 -0.009161 0.032512 0.191544
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4431 0.2689 5.366 1.02e-05 ***
IPC -0.8384 0.2833 -2.959 0.00621 **
PIB 1.8267 0.1818 10.049 8.65e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
MULTICOLINIALIDAD:SPSS
Coeficientesa
Coeficie
ntes
Coeficientes no estandar Estadísticas de
estandarizados izados Correlaciones colinealidad
1 (Constante
1,443 ,269 5,366 ,000
)
x1 -,838 ,283 -,414 -2,959 ,006 ,981 -,488 -,050 ,015 67,658
x2 1,827 ,182 1,406 10,049 ,000 ,995 ,885 ,171 ,015 67,658
a. Variable dependiente: y
EN LENGUAJE R:
vif(M1)
IPC PIB
67.65765 67.65765
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0,98117459
Coeficiente de
determinación R^2 0,96270357
R^2 ajustado 0,96141748
Error típico 0,14969335
Observaciones 31
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 16,7736782 16,7736782 748,554249 2,91E-22
Residuos 29 0,64983489 0,0224081
Total 30 17,4235131
ln(importaciones)= B1 + B2ln(IPC)
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0,99467097
Coeficiente de
determinación R^2 0,98937034
R^2 ajustado 0,98900379
Error típico 0,07991506
Observaciones 31
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 17,238307 17,238307 2699,21394 3,5785E-30
Residuos 29 0,18520611 0,00638642
Total 30 17,4235131
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0,99258234
Coeficiente de
determinación R^2 0,98521971
R^2 ajustado 0,98471004
Error típico 0,0725079
Observaciones 31
ANÁLISIS DE VARIANZA
Valor
Grados de Suma de Promedio de los crítico de
libertad cuadrados cuadrados F F
Regresión 1 10,1629248 10,1629248 1933,0719 4,27E-28
Residuos 29 0,15246449 0,0052574
Total 30 10,3153893
Variables:
En este problema se pide correr un modelo tomando como variable dependiente la variable
Horas y probar el supuesto de multicolinealidad y corregir encaso el modelo presente este
problema.
$`multivariateNormality`
Test Statistic p value Result
1 Mardia Skewness 552.038093228281 3.12307179683722e-43 NO
2 Mardia Kurtosis 11.5872756014375 0 NO
3 MVN <NA> <NA> NO
$univariateNormality
Test Variable Statistic p value Normality
1 Shapiro-Wilk Horas 0.2884 <0.001 NO
2 Shapiro-Wilk Tasa 0.9476 0.0956 YES
3 Shapiro-Wilk IAPE 0.7946 <0.001 NO
4 Shapiro-Wilk IAPO 0.8515 2e-04 NO
5 Shapiro-Wilk IPAN 0.9450 0.0796 YES
6 Shapiro-Wilk Valores 0.9472 0.0928 YES
7 Shapiro-Wilk Edad 0.5311 <0.001 NO
8 Shapiro-Wilk DEP 0.8569 3e-04 NO
9 Shapiro-Wilk Escolaridad 0.9373 0.0464 NO
Mediante el test de Mardia se concluye que los datos a trabajar no siguen una
distribución multivariante, pero como el numero de observaciones es mayor a 30 se
asume la normalidad por el teorema del límite central.
ii. Modelo de regresión tomando con V. dependiente “Horas”
Call:
lm(formula = Horas ~ Tasa + IAPE + IAPO + IPAN + Valores + Edad +
DEP + Escolaridad, data = base)
Residuals:
Min 1Q Median 3Q Max
-1343.5 -480.0 -269.1 77.4 5969.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2201.6626 12041.5449 -0.183 0.856
Tasa 399.0205 2253.3689 0.177 0.861
IAPE -1.3089 1.8284 -0.716 0.480
IAPO -7.9023 4.6812 -1.688 0.103
IPAN -13.0918 24.6824 -0.530 0.600
Valores 0.5875 1.2143 0.484 0.633
Edad 161.9583 177.9146 0.910 0.371
DEP -48.8081 806.8286 -0.060 0.952
Escolaridad 181.1534 1083.3185 0.167 0.868
data: residuals(modelo)
X-squared = 307.41, df = 2, p-value < 2.2e-16
Matriz de correlaciones
Por observar que varias de las variables exógenas son muy colineales
Según el test las variables a seleccionar son las variables Tasa y Valores
Se corrió el modelo con las variables seleccionadas, adicionalmente se
transformó sacando la raíz cuadrada a todas las variables involucradas en
el modelo.
Call:
lm(formula = sqrt(Horas) ~ sqrt(Tasa) + sqrt(Valores), data = base)
Residuals:
Min 1Q Median 3Q Max
-5.460 -3.271 -2.716 -1.187 40.615
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 31.12179 25.92365 1.201 0.239
sqrt(Tasa) 8.89610 20.44102 0.435 0.666
sqrt(Valores) 0.03875 0.14703 0.264 0.794
sqrt(Tasa) sqrt(Valores)
2.676557 2.676557
GRAFICO:
data: modelo4
BP = 0.93808, df = 2, p-value = 0.6256
Test de White:
t test of coefficients:
Se confirma la Homocedasticidad
vi. Autocorrelacion:
Durbin-Watson test
Test de Breusch-Godfrey
data: modelo4
LM test = 8.5437, df = 1, p-value = 0.003467
Variables:
Residuals:
Min 1Q Median 3Q Max
-6.0545 -3.0994 -0.0611 1.7366 12.5469
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 189.76458 23.79049 7.976 1.13e-11 ***
VM -1.27879 0.24617 -5.195 1.63e-06 ***
CF 0.38974 0.08052 4.840 6.53e-06 ***
PS -1.86462 0.19591 -9.518 1.21e-14 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
No Cross Terms
H0: Homoskedasticity
H1: Heteroskedasticity
Test Statistic:
31.8520
Degrees of Freedom:
12
P-value:
0.0015
No Cross Terms
H0: Homoskedasticity
H1: Heteroskedasticity
Test Statistic:
38.8648
Degrees of Freedom:
12
P-value:
0.0001
No Cross Terms
H0: Homoskedasticity
H1: Heteroskedasticity
Test Statistic:
41.4251
Degrees of Freedom:
12
P-value:
0.0000
t test of coefficients:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 189.76458 23.79049 7.976 1.13e-11 ***
VM -1.27879 0.24617 -5.195 1.63e-06 ***
CF 0.38974 0.08052 4.840 6.53e-06 ***
PS -1.86462 0.19591 -9.518 1.21e-14 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
data: residuals(modelo)
X-squared = 32.796, df = 2, p-value = 7.56e-08
vi. Autocorrelación:
data: MPG ~ VM + CF + PS
DW = 1.0975, p-value = 2.926e-06
alternative hypothesis: true autocorrelation is greater than 0
vii. Multicolinealidad:
VM CF PS
70.44093 123.28540 14.91713
22)
Variables:
Residuals:
Min 1Q Median 3Q Max
-0.23624 -0.06926 0.03014 0.07209 0.22490
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.500441 1.003020 -1.496 0.147192
log(I) 0.467509 0.165987 2.817 0.009340 **
log(L) 0.279443 0.114726 2.436 0.022328 *
log(H) -0.005152 0.142947 -0.036 0.971538
log(A) 0.441449 0.106508 4.145 0.000341 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Durbin-Watson test
Variables:
VENTAS
INVENTARIOS
RAZON
i. MODELO DE REGRESION
Call:
lm(formula = INVENTARIOS ~ VENTAS, data = base)
Residuals:
Min 1Q Median 3Q Max
-54733 -29795 -873 25538 51798
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.667e+04 1.090e+04 6.119 3.54e-07 ***
VENTAS 1.184e+00 4.662e-02 25.396 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Durbin-Watson test
METODO DE COCHRAN
Cochrane-orcutt estimation for first order autocorrelation
Call:
lm(formula = INVENTARIOS ~ VENTAS, data = base)
number of interaction: 17
rho 0.922185
Durbin-Watson statistic
(original): 0.12555 , p-value: 1.008e-22
(transformed): 1.89272 , p-value: 3.24e-01
coefficients:
(Intercept) VENTAS
84453.140476 1.124692
> summary(mcor1)
Call:
lm(formula = INVENTARIOS ~ VENTAS, data = base)
Durbin-Watson statistic
(original): 0.12555 , p-value: 1.008e-22
(transformed): 1.89272 , p-value: 3.24e-01
24) Suponga que el “verdadero” modelo es Yi = β1 + β2X2i + ut …(1) pero añadimos una
variable “irrelevante”, X3, al modelo (irrelevante en el sentido de que el verdadero
coeficiente β3 que acompaña a la variable X3 es cero) y estime Yi = β1 + β2X2i + β3X3i +
vi …(2)
a) ¿R2 y R2 ajustada para el modelo (2) serían más grandes que las del modelo (1)?
Recordando la fórmula:
2 2
𝑟12 + 𝑟13 − 2𝑟12 𝑟13 𝑟23
𝑅2 = 2
1 − 𝑟23
Como X3 es irrelevante, 𝑟13 = 0, que reduce la fórmula anterior a:
2
𝑟12
𝑅2 = 2
1 − 𝑟23
Normalmente, la adición de una variable X3 aumentaría el valor de 𝑅 2; sin embargo, si
𝑟23 es cero, el valor 𝑅 2 permanecerá sin cambios.
Sí, son insesgadas. Esto puede demostrarse fácilmente a partir de las fórmulas de
regresión múltiple señalando que β3 es cero.