Vous êtes sur la page 1sur 11

EJERCICIO 4.

4
Para el ajuste con regresión múltiple de los datos de rendimiento de gasolina en el problema 3.5.
a) Trazar una gráfica de probabilidad normal de los residuales. ¿Parece haber algún problema con la
suposición de normalidad?
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.
c) Trazar e interpretar las gráficas de regresión parcial para este modelo.
d) Calcular los residuales estudentizados y los residuales R de student para este modelo. ¿Qué
información aportan esos residuales escalados?
TABLA B.3 Rendimiento de la gasolina para 32 automóviles
Automóvil Y X1 X6
Apollo 18.90 350 4
Omega 17.00 350 4
Nova 20.00 250 1
Monarch 18.25 351 2
Duster 20.07 225 1
Jenson Conv 11.20 440 4
Skyhawk 22.12 231 2
Monza 21.47 262 2
Scirocco 34.70 89.7 2
Corolla SR-5 30.40 96.9 2
Camaro 16.50 350 4
Datsun B210 36.50 85.3 2
Capri II 21.50 171 2
Pacer 19.70 258 1
Babcat 20.30 140 2
Granada 17.80 302 2
Eldorado 14.39 500 4
Imperial 14.89 440 4
Nova I.N 17.80 350 4
Valiant 16.41 318 2
Stalfire 23.54 231 2
Cordoba 21.47 360 2
Trans AM 16.59 400 4
Corolla E-5 31.90 96.9 2
Astre 29.40 140 2
Mark IV 13.27 460 4
Celica GT 23.90 133.6 2
Charger SE 19.73 318 2
Cougar 13.90 351 2
Elite 13.27 351 2
Matador 13.77 360 4
Corvette 16.50 350 4

y= milla/galon
X1= Cilindrada(pulgadas cubicas)
X6= Carburador(gargantas)
DESARROLLO

a) Trazar una gráfica de probabilidad normal de los residuales. ¿Parece haber algún problema con la
suposición de normalidad?
Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Error estándar Beta t Sig.
1 (Constante) 32.910 1.541 21.357 .000
X1 -.053 .006 -.982 -8.628 .000
X6 .929 .670 .158 1.387 .176
a. Variable dependiente: Y

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized
.094 32 ,200* .981 32 .825
Residual
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors

b)
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.

c) Trazar e interpretar las gráficas de regresión parcial para este modelo

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los F Valor crítico
libertad cuadrados cuadrados de F
Regresión 1 955.34035 955.34035 101.558579 3.82E-11
Residuos 30 282.203737 9.40679125
Total 31 1237.54409

Coeficientes Error Estadístico Probabilidad Inferior 95% Superior Inferior Superior


típico t 95% 95.0% 95.0%
Intercepción 33.72743903 1.44555877 23.3317661 8.7015E-21 30.7752142 36.6796639 30.7752142 36.6796639
x1 -0.047428282 0.00470629 -10.0776276 3.82E-11 -0.05703982 -0.03781675 -0.05703982 -0.03781675

Ŷ/X1 ei
12.85899493 2.03
17.12754032 1.77
17.12754032 -0.13 17.12754032 0.67
21.87036852 -1.87 18.64524534 -2.24
17.08011203 1.17 22.77150588 0.77
23.05607557 -2.99 16.6532575 4.82
12.85899493 -1.66 14.75612621 1.83
22.77150588 -0.65
29.1316385 2.77
21.30122914 0.17
29.47312213 5.23 27.08747955 2.31
29.1316385 1.27 11.91042929 1.36
17.12754032 -0.63 27.39102055 -3.49
29.68180657 6.82 18.64524534 1.08
25.6172028 -4.12 17.08011203 -3.18
21.49094226 -1.79
17.08011203 -3.81
27.08747955 -6.79
19.40409785 -1.60 16.6532575 -2.88
10.01329801 4.38 17.12754032 -0.63
GRÁFICO DE REGRESIÓN PARCIAL PARA X1
8.00

6.00

4.00

2.00

0.00
0 5 10 15 20 25 30 35
-2.00

-4.00

-6.00

-8.00

ANÁLISIS DE VARIANZA
Grados de Suma de cuadrados Promedio de los cuadrados F Valor crítico de
libertad F
Regresión 1 293.503667 293.503667 9.32704768 0.00470288
Residuos 30 944.04042 31.468014
Total 31 1237.54409

Coeficientes Error Estadístico t Probabilidad Inferior Superior Inferior Superior


típico 95% 95% 95.0% 95.0%
Intercepción 27.65822397 2.62874472 10.5214568 1.3822E-11 22.289611 33.0268369 22.289611 33.0268369
x6 -2.866544182 0.93861295 -3.05402156 0.00470288 -4.78344755 -0.94964081 -4.78344755 -0.94964081

Ŷ/X6 ei 16.19204724 -1.30


16.19204724 2.71
16.19204724 1.61
16.19204724 0.81
21.92513561 -5.52
24.79167979 -4.79
21.92513561 -3.68 21.92513561 1.61
24.79167979 -4.72 21.92513561 -0.46
16.19204724 -4.99 16.19204724 0.40
21.92513561 0.19 21.92513561 9.97
21.92513561 -0.46 21.92513561 7.47
21.92513561 12.77
16.19204724 -2.92
21.92513561 8.47
16.19204724 0.31 21.92513561 1.97
21.92513561 14.57 21.92513561 -2.20
21.92513561 -0.43 21.92513561 -8.03
24.79167979 -5.09 21.92513561 -8.66
21.92513561 -1.63 16.19204724 -2.42
21.92513561 -4.13
16.19204724 0.31
16.19204724 -1.80
GRÁFICO DE LA REGRESIÓN PARCIAL PARA X6
20.00

15.00

10.00

5.00

0.00
0 5 10 15 20 25 30

-5.00

-10.00

d) Calcular los residuales estudentizados y los residuales R de student para este modelo. ¿Qué
información aportan esos residuales escalados?

RESIDUOS ESTUDENTIZADOS (ri) RESIDUOS R DE STUDENT (ti)


0.28852 0.28391
-0.37145 -0.36587
-0.20685 -0.2034
0.72621 0.72016
-0.64695 -0.64033
-0.73134 -0.72534
-0.13537 -0.13305
0.20079 0.19743
1.67064 1.72677
0.27271 0.26831
-0.54513 -0.53842
2.23635 2.4156
-1.43624 -1.4643
-0.16332 -0.16056
-2.43737 -2.68583
-0.32555 -0.32047
1.52661 1.56423
0.55548 0.54875
-0.09357 -0.09196
-0.51251 -0.50589
0.3448 0.3395
2.01864 2.13953
0.40609 0.40017
0.80461 0.79959
0.71072 0.70452
0.36252 0.35702
-1.31339 -1.33073
0.62399 0.6173
-0.78337 -0.77802
-1.002 -1.00207
-1.30742 -1.32431
-0.54513 -0.53842
EJERCICIO 4.16
En el problema 3.12 se pidió ajustar un modelo para los datos de formación de catrato de la tabla B.8 del
apéndice.
a) Trazar una gráfica de probabilidad normal de los residuales del modelo completo. ¿Parece haber algún
problema con la suposición de normalidad?
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada
c) En ese problema (3.12) se pidió ajustar un modelo. Calcular la estadística PRESS para ambos modelos.
Con base en esa estadística, ¿Cuál modelo producirá, probablemente, mejores predicciones con nuevos
datos?
TABLA B.8 Datos de información de catratos
Y X1 X2 Ŷ y= Formación de catrato (% en masa)
7.5 0 10 12.17632456 X1= Cantidad de surfactante (% en masa)
15 0 50 16.53370131
X2= Tiempo (minutos)
22 0 85 20.34640596
28.6 0 110 23.06976642
31.6 0 140 26.33779898
34 0 170 29.60583154
35 0 200 32.8738641
35.5 0 230 36.14189666
36.5 0 260 39.40992922
38.5 0 290 42.67796177
12.3 0 10 12.17632456
18 0 30 14.35501293
20.8 0 62 17.84091433
25.7 0 90 20.89107805
32.5 0 150 27.42714317
34 0 210 33.96320828
35 0 270 40.4992734
14.4 0.02 10 19.17870947
19 0.02 30 21.35739785
26.4 0.02 60 24.62543041
28.5 0.02 90 27.89346296
29 0.02 120 31.16149552
35 0.02 210 40.9655932
15.1 0.02 30 21.35739785
26.4 0.02 60 24.62543041
27 0.02 120 31.16149552
29 0.02 150 34.42952808
21 0.05 20 30.77163103
27.3 0.05 40 32.9503194
48.5 0.05 130 42.75441708
50.4 0.05 190 49.2904822
52.5 0.05 250 55.82654731
34.4 0.05 60 35.12900778
46.5 0.05 90 38.39704034
50 0.05 120 41.66507289
51.9 0.05 150 44.93310545
DESARROLLO
a) Trazar una gráfica de probabilidad normal de los residuales del modelo completo. ¿Parece haber algún
problema con la suposición de normalidad?
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
estandarizados
B Error estándar Beta
1 (Constante) 11.087 1.669 6.642 .000
X1 350.119 39.683 .616 8.823 .000
X2 .109 .010 .762 10.912 .000
a. Variable dependiente: Y

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized
.093 36 ,200* .971 36 .452
Residual
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
b) Trazar e interpretar una gráfica de los residuales en función de la respuesta pronosticada.

c) En ese problema (3.12) se pidió ajustar un modelo. Calcular la estadística PRESS para ambos modelos.
Con base en esa estadística, ¿Cuál modelo producirá, probablemente, mejores predicciones con nuevos
datos?

Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
estandarizados
B Error estándar Beta
1 (Constante) 25.087 2.258 11.108 .000
X1 294.894 83.238 .519 3.543 .001
a. Variable dependiente: Y

Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes t Sig.
estandarizados
B Error estándar Beta
1 (Constante) 18.749 2.574 7.284 .000
X2 .098 .018 .684 5.465 .000
a. Variable dependiente: Y
ei ei^2 ei ei^2
-17.59 309.2899065 -12.23 149.486324
-10.09 101.7403065 -8.63 74.5542449
-3.09 9.52734649 -5.05 25.5430171
3.51 12.34369849 -0.90 0.80374811
6.51 42.42385849 -0.83 0.68482245
8.91 79.44798649 -1.36 1.84568527
9.91 98.27470649 -3.29 10.8213366 R^2 pred 0.26962429 26.962429
10.41 108.4380665 -5.72 32.7252644 R^2 pred 0.4676161 46.761612
11.41 130.2647865 -7.65 58.5472886
13.41 179.9182265 -8.58 73.6617094
-12.79 163.4981625 -7.43 55.1523081 Por teoría sabemos que es preferible tomar el
-7.09 50.22046649 -3.68 13.5458594 modelo con el valor más pequeño de PRESS
-4.29 18.37528249 -4.01 16.0551675 (2535.11), ya que es el que indica lo bien que
0.61 0.37621049 -1.84 3.3948431 funciona el modelo de regresión para predecir
7.41 54.95790649 -0.90 0.8182107 nuevos datos, con un 46.76% de explicación de
8.91 79.44798649 -5.27 27.7369702 la variabilidad del modelo cuando se predigan
9.91 98.27470649 -10.13 102.589146 nuevas observaciones.
-16.58 275.0463036 -5.33 28.3711761
-11.98 143.6287196 -2.68 7.18491942
-4.58 21.01782363 1.79 3.19876802
-2.48 6.17283963 0.96 0.9167871
-1.98 3.93831963 -1.47 2.17129066
4.02 16.12407963 -4.27 18.2037902
-15.88 252.3179756 -6.58 43.3025854
-4.58 21.01782363 1.79 3.19876802
-3.98 15.87639963 -3.47 12.0654107
-1.98 3.93831963 -4.40 19.4000607
-18.83 354.6189896 0.30 0.08793597
-12.53 157.0342316 4.64 21.552992
8.67 75.14583957 17.05 290.684086
10.57 111.6967856 13.09 171.280562
12.67 160.4951996 9.33 86.9627121
-5.43 29.49934557 9.79 95.814928
6.67 44.47115957 18.96 359.386427
10.17 103.4018496 19.53 381.283031
12.07 145.6527956 18.50 342.081671
PRESS 3477.914411 PRESS 2535.11385
EJERCICIO 12.27

Se proporciona los datos de la tabla 12.8


a) Verifique que el d de Durbin-Watson es igual a 0.4148
b) ¿Hay correlación serial positiva en las perturbaciones?
c) De ser así, estime p mediante el:
i) Método de Theil-Nagar
ii) Procedimiento de dos pasos de Durbin
iii) Método de Cochrane-Orcutt

TABLA 12.8

Y X Ŷ û
281.4 1956 261.4208 19.9791
288.1 1957 276.6026 11.4973
Y= Gasto de consumo personal, miles de millones de
290 1958 291.7844 -1.7844
dolares de 1958
307.3 1959 306.9661 0.3338 Tiempo
X=
316.1 1960 322.1479 -6.0479 Y estimado
Ŷ=
322.5 1961 337.3297 -14.8297 û= Residuos
338.4 1962 352.5115 -14.1115
353.3 1963 367.6933 -14.3933
373.7 1964 382.8751 -9.1751
397.7 1965 398.0569 -0.3569
418.1 1966 413.2386 4.8613
430.1 1967 428.4206 1.6795
452.7 1968 443.6022 9.0977
469.1 1969 458.784 10.3159
476.9 1970 473.9658 2.9341

DESARROLLO
a) Verifique que el d de Durbin-Watson es igual a 0.4148

û (ût - ût-1)^2 û^2


19.9791 399.164
11.4973 71.9409 132.188
-1.7844 176.4036 3.184
0.3338 4.4868 0.111
-6.0479 40.7261 36.577
-14.8297 77.1200 219.920
-14.1115 0.5158 199.134 d= 0.4148
-14.3933 0.0794 207.167
-9.1751 27.2296 84.182
-0.3569 77.7607 0.127
4.8613 27.2296 23.632
1.6795 10.1239 2.821
9.0977 55.0297 82.768
10.3159 1.4840 106.418
2.9341 54.4910 8.609
TOTAL 624.6210 1506.004
b) ¿Hay correlación serial positiva en las perturbaciones?

Tablas estadísticas (Durbin- Watson)


n= 15 dL= 1.077
k= 1 du= 1.361
α= 0.05

HIPOTESIS NULA DECISÍON si ( < d < )


No hay auto correlación + Rechazar 0 1.077
No hay auto correlación + Sin decisión 1.077 1.361
No hay correlación - Rechazar 2.923 4
No hay correlación - Sin decisión 2.639 2.923
No hay auto correlación,+ o - No rechazar 1.361 2.639

CONCLUSIÓN:
A partir de las 15 observaciones y una variable explicativa, con
nivel de significancia de 0.05, teniendo 0 < 0.4148 < 1.077,
rechazamos la Ho, lo que indica una correlación serial positiva
en los residuos.

Vous aimerez peut-être aussi