Académique Documents
Professionnel Documents
Culture Documents
4
Para el ajuste con regresión múltiple de los datos de rendimiento de gasolina en el problema 3.5.
a) Trazar una gráfica de probabilidad normal de los residuales. ¿Parece haber algún problema con la
suposición de normalidad?
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.
c) Trazar e interpretar las gráficas de regresión parcial para este modelo.
d) Calcular los residuales estudentizados y los residuales R de student para este modelo. ¿Qué
información aportan esos residuales escalados?
TABLA B.3 Rendimiento de la gasolina para 32 automóviles
Automóvil Y X1 X6
Apollo 18.90 350 4
Omega 17.00 350 4
Nova 20.00 250 1
Monarch 18.25 351 2
Duster 20.07 225 1
Jenson Conv 11.20 440 4
Skyhawk 22.12 231 2
Monza 21.47 262 2
Scirocco 34.70 89.7 2
Corolla SR-5 30.40 96.9 2
Camaro 16.50 350 4
Datsun B210 36.50 85.3 2
Capri II 21.50 171 2
Pacer 19.70 258 1
Babcat 20.30 140 2
Granada 17.80 302 2
Eldorado 14.39 500 4
Imperial 14.89 440 4
Nova I.N 17.80 350 4
Valiant 16.41 318 2
Stalfire 23.54 231 2
Cordoba 21.47 360 2
Trans AM 16.59 400 4
Corolla E-5 31.90 96.9 2
Astre 29.40 140 2
Mark IV 13.27 460 4
Celica GT 23.90 133.6 2
Charger SE 19.73 318 2
Cougar 13.90 351 2
Elite 13.27 351 2
Matador 13.77 360 4
Corvette 16.50 350 4
y= milla/galon
X1= Cilindrada(pulgadas cubicas)
X6= Carburador(gargantas)
DESARROLLO
a) Trazar una gráfica de probabilidad normal de los residuales. ¿Parece haber algún problema con la
suposición de normalidad?
Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Error estándar Beta t Sig.
1 (Constante) 32.910 1.541 21.357 .000
X1 -.053 .006 -.982 -8.628 .000
X6 .929 .670 .158 1.387 .176
a. Variable dependiente: Y
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized
.094 32 ,200* .981 32 .825
Residual
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
b)
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los F Valor crítico
libertad cuadrados cuadrados de F
Regresión 1 955.34035 955.34035 101.558579 3.82E-11
Residuos 30 282.203737 9.40679125
Total 31 1237.54409
Ŷ/X1 ei
12.85899493 2.03
17.12754032 1.77
17.12754032 -0.13 17.12754032 0.67
21.87036852 -1.87 18.64524534 -2.24
17.08011203 1.17 22.77150588 0.77
23.05607557 -2.99 16.6532575 4.82
12.85899493 -1.66 14.75612621 1.83
22.77150588 -0.65
29.1316385 2.77
21.30122914 0.17
29.47312213 5.23 27.08747955 2.31
29.1316385 1.27 11.91042929 1.36
17.12754032 -0.63 27.39102055 -3.49
29.68180657 6.82 18.64524534 1.08
25.6172028 -4.12 17.08011203 -3.18
21.49094226 -1.79
17.08011203 -3.81
27.08747955 -6.79
19.40409785 -1.60 16.6532575 -2.88
10.01329801 4.38 17.12754032 -0.63
GRÁFICO DE REGRESIÓN PARCIAL PARA X1
8.00
6.00
4.00
2.00
0.00
0 5 10 15 20 25 30 35
-2.00
-4.00
-6.00
-8.00
ANÁLISIS DE VARIANZA
Grados de Suma de cuadrados Promedio de los cuadrados F Valor crítico de
libertad F
Regresión 1 293.503667 293.503667 9.32704768 0.00470288
Residuos 30 944.04042 31.468014
Total 31 1237.54409
15.00
10.00
5.00
0.00
0 5 10 15 20 25 30
-5.00
-10.00
d) Calcular los residuales estudentizados y los residuales R de student para este modelo. ¿Qué
información aportan esos residuales escalados?
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized
.093 36 ,200* .971 36 .452
Residual
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.
c) En ese problema (3.12) se pidió ajustar un modelo. Calcular la estadística PRESS para ambos modelos.
Con base en esa estadística, ¿Cuál modelo producirá, probablemente, mejores predicciones con nuevos
datos?
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
estandarizados
B Error estándar Beta
1 (Constante) 25.087 2.258 11.108 .000
X1 294.894 83.238 .519 3.543 .001
a. Variable dependiente: Y
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
estandarizados
B Error estándar Beta
1 (Constante) 18.749 2.574 7.284 .000
X2 .098 .018 .684 5.465 .000
a. Variable dependiente: Y
ei ei^2 ei ei^2
-17.59 309.2899065 -12.23 149.486324
-10.09 101.7403065 -8.63 74.5542449
-3.09 9.52734649 -5.05 25.5430171
3.51 12.34369849 -0.90 0.80374811
6.51 42.42385849 -0.83 0.68482245
8.91 79.44798649 -1.36 1.84568527
9.91 98.27470649 -3.29 10.8213366 R^2 pred 0.26962429 26.962429
10.41 108.4380665 -5.72 32.7252644 R^2 pred 0.4676161 46.761612
11.41 130.2647865 -7.65 58.5472886
13.41 179.9182265 -8.58 73.6617094
-12.79 163.4981625 -7.43 55.1523081 Por teoría sabemos que es preferible tomar el
-7.09 50.22046649 -3.68 13.5458594 modelo con el valor más pequeño de PRESS
-4.29 18.37528249 -4.01 16.0551675 (2535.11), ya que es el que indica lo bien que
0.61 0.37621049 -1.84 3.3948431 funciona el modelo de regresión para predecir
7.41 54.95790649 -0.90 0.8182107 nuevos datos, con un 46.76% de explicación de
8.91 79.44798649 -5.27 27.7369702 la variabilidad del modelo cuando se predigan
9.91 98.27470649 -10.13 102.589146 nuevas observaciones.
-16.58 275.0463036 -5.33 28.3711761
-11.98 143.6287196 -2.68 7.18491942
-4.58 21.01782363 1.79 3.19876802
-2.48 6.17283963 0.96 0.9167871
-1.98 3.93831963 -1.47 2.17129066
4.02 16.12407963 -4.27 18.2037902
-15.88 252.3179756 -6.58 43.3025854
-4.58 21.01782363 1.79 3.19876802
-3.98 15.87639963 -3.47 12.0654107
-1.98 3.93831963 -4.40 19.4000607
-18.83 354.6189896 0.30 0.08793597
-12.53 157.0342316 4.64 21.552992
8.67 75.14583957 17.05 290.684086
10.57 111.6967856 13.09 171.280562
12.67 160.4951996 9.33 86.9627121
-5.43 29.49934557 9.79 95.814928
6.67 44.47115957 18.96 359.386427
10.17 103.4018496 19.53 381.283031
12.07 145.6527956 18.50 342.081671
PRESS 3477.914411 PRESS 2535.11385
EJERCICIO 12.27
TABLA 12.8
Y X Ŷ û
281.4 1956 261.4208 19.9791
288.1 1957 276.6026 11.4973
Y= Gasto de consumo personal, miles de millones de
290 1958 291.7844 -1.7844
dolares de 1958
307.3 1959 306.9661 0.3338 Tiempo
X=
316.1 1960 322.1479 -6.0479 Y estimado
Ŷ=
322.5 1961 337.3297 -14.8297 û= Residuos
338.4 1962 352.5115 -14.1115
353.3 1963 367.6933 -14.3933
373.7 1964 382.8751 -9.1751
397.7 1965 398.0569 -0.3569
418.1 1966 413.2386 4.8613
430.1 1967 428.4206 1.6795
452.7 1968 443.6022 9.0977
469.1 1969 458.784 10.3159
476.9 1970 473.9658 2.9341
DESARROLLO
a) Verifique que el d de Durbin-Watson es igual a 0.4148
CONCLUSIÓN:
A partir de las 15 observaciones y una variable explicativa, con
nivel de significancia de 0.05, teniendo 0 < 0.4148 < 1.077,
rechazamos la Ho, lo que indica una correlación serial positiva
en los residuos.