Vous êtes sur la page 1sur 39

Agregados

Análisis Multivariado
Datos/Variables:
rcompa
tmax
tmaxnom
pea
psss
pen
abs
iapla
ialar
pus
puc
vas
vac
trit
desg

Existen 60 casos completos a utilizarse en los cálculos.

El StatAdvisor
Este procedimiento está diseñado para resumir varias columnas de
datos cuantitativos. Calculará varios estadísticos, incluyendo
correlaciones, covarianzas y correlaciones parciales. En el
procedimiento también están incluidas una serie de gráficas
multivariadas, que proporcionan vistas interesantes de los datos. Use
los íconos de Opciones Tabulares y de Opciones Gráficas en la barra
de herramientas para análisis, para acceder a estos diferentes
procedimientos.

Después de este procedimiento, tal vez quiera seleccionar otro para


construir un modelo estadístico de sus datos. Dependiendo de sus
objetivos, uno de varios procedimientos podría ser apropiado. A
continuación se presenta una lista de objetivos con una indicación del
procedimiento que podría ser apropiado:

OBJETIVO: Construir un modelo para predecir una variable dados los


valores de una ó más variables.
PROCEDIMIENTO: Relacionar - Varios Factores - Regresión Múltiple

OBJETIVO: Agrupar filas de datos con características similares.


PROCEDIMIENTO: Describir - Métodos Multivariados - Análisis de
Conglomerados

OBJETIVO: Desarrollar un métodos para predecir a cuál de varios


grupos pertenencen nuevas filas.
PROCEDIMIENTO: Relacionar - Métodos de Clasificación - Análisis
Discriminante

OBJETIVO: Reducir el número de columnas a un conjunto más


pequeño de medidas significativas.
PROCEDIMIENTO: Describir - Métodos Multivariados - Análisis
Factorial

OBJETIVO: Determina que combinación de columnas contribuyen con


la mayor variabilidad en los datos.
PROCEDIMIENTO: Describir - Métodos Multivariados - Componentes
Principales

OBJETIVO: Encontrar combinaciones de las columnas que están


fuertemente asociadas entre sí.
PROCEDIMIENTO: Describir - Métodos Multivariados - Correlaciones
Canónicas
rcompa
tmax
tmaxnom
pea
psss
pen
abs
iapla
ialar
pus
puc
v as
v ac
trit
desg

Resumen Estadístico
rcompa tmax tmaxno pea psss pen
m
Recuento 60 60 60 60 60 60
Promedio 334.14 3.2735 3.4078 2.4915 2.5448 2.6315
4 3 3
Desviación 106.87 1.0560 0.5957 0.1478 0.1491 0.1571
Estándar 6 59 87 16 55
Coeficiente de 31.983 32.260 17.482 5.9356 5.8595 5.9720
Variación 4% 9% 1% 7% 6% 7%
Mínimo 158.96 1.5 2.54 1.91 1.97 2.02
Máximo 669.52 5.08 3.81 2.69 2.75 2.86
Rango 510.56 3.58 1.27 0.78 0.78 0.84
Sesgo 3.3877 - - - - -
Estandarizado 1 3.1066 2.5569 8.9318 9.0255 9.0370
3 8 8 6 8
Curtosis 2.6383 - - 14.871 15.126 15.467
Estandarizada 0.9039 2.2037 7 8
35 9

abs iapla ialar pus puc vas


Recuento 60 60 60 60 60 60
Promedio 2.213 23.524 27.296 1342.8 1545.4 43.992
2 2 7 3
Desviación 0.5830 5.9476 6.3950 29.594 35.616 4.8368
Estándar 09 8 5 7 3 2
Coeficiente de 26.344 25.283 23.428 2.2039 2.3045 10.994
Variación 7% 4% 4% 3% 6% 7%
Mínimo 0.94 13.32 18.37 1276.4 1452.4 22.81
2 5
Máximo 3.7 39.91 42.54 1435.8 1617.3 49.7
5 6
Rango 2.76 26.59 24.17 159.43 164.91 26.89
Sesgo - 2.4444 2.3959 0.8776 0.0993 -
Estandarizado 0.3675 1 43 155 5.8270
86 4
Curtosis 1.3563 0.8272 - 1.9481 - 7.7809
Estandarizada 2 58 0.8547 5 0.2589 3
99 64

vac trit desg


Recuento 60 60 60
Promedio 38.017 26.731 28.193
8 7 3
Desviación 3.2935 1.7698 1.0384
Estándar 3
Coeficiente de 8.6631 6.6206 3.6831
Variación 1% 2% 4%
Mínimo 22.81 22.98 26.15
Máximo 42.59 29.76 31.75
Rango 19.78 6.78 5.6
Sesgo - - 1.6999
Estandarizado 10.390 2.0804 5
8 2
Curtosis 22.446 - 2.3360
Estandarizada 8 0.6072 7
68
El StatAdvisor
Esta tabla muestra el resumen estadístico para cada una de las
variables seleccionadas. Incluye medidas de tendencia central, de
variabilidad, y de forma. De particular interés aquí es el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden usarse
para determinar si la muestra proviene de una distribución normal.
Valores de estos estadísticos fuera del rango de -2 a +2 indican
desviaciones significativas de la normalidad, las cuales tenderían a
invalidar muchos de los procedimientos estadísticos que se aplican
habitualmente a estos datos. en este caso, las siguientes variables
muestran valores de sesgo estandarizado y de curtosis estandarizada
fuera del rango esperado:
rcompa
tmax
tmaxnom
pea
psss
pen
iapla
ialar
vas
vac
trit
Las siguientes variables muestran curtosis estandarizada fuera del
rango esperado:
rcompa
tmaxnom
pea
psss
pen
vas
vac
desg
Para hacer las variables más normales, podría intentar una
transformación tal como LOG(Y), RAÍZ(Y), ó 1/Y.
Correlaciones Parciales
Rcom tmax tmaxn pea psss pen abs iapla ialar
pa om
rcomp 0.329 0.136 0.214 - - 0.104 0.241 0.442
a 8 7 8 0.135 0.025 5 3 8
9 4
(60) (60) (60) (60) (60) (60) (60) (60)
0.023 0.359 0.147 0.362 0.865 0.484 0.102 0.001
6 5 1 5 5 4 3 8
tmax 0.329 0.181 - - 0.109 0.027 0.136 0.031
8 2 0.005 0.042 9 1 6 8
8 4
(60) (60) (60) (60) (60) (60) (60) (60)
0.023 0.222 0.968 0.777 0.462 0.856 0.359 0.832
6 8 9 2 0 6 9 2
tmaxn 0.136 0.181 - 0.286 - - - -
om 7 2 0.238 1 0.063 0.170 0.294 0.308
1 4 2 2 7
(60) (60) (60) (60) (60) (60) (60) (60)
0.359 0.222 0.107 0.051 0.672 0.252 0.044 0.034
5 8 0 2 1 8 7 8
pea 0.214 - - 0.798 0.309 - - -
8 0.005 0.238 1 6 0.772 0.273 0.219
8 1 2 4 0
(60) (60) (60) (60) (60) (60) (60) (60)
0.147 0.968 0.107 0.000 0.034 0.000 0.063 0.139
1 9 0 0 2 0 0 1
psss - - 0.286 0.798 0.295 0.381 0.356 0.318
0.135 0.042 1 1 6 6 5 6
9 4
(60) (60) (60) (60) (60) (60) (60) (60)
0.362 0.777 0.051 0.000 0.043 0.008 0.013 0.029
5 2 2 0 7 1 9 1
pen - 0.109 - 0.309 0.295 0.625 - -
0.025 9 0.063 6 6 6 0.184 0.282
4 4 4 5
(60) (60) (60) (60) (60) (60) (60) (60)
0.865 0.462 0.672 0.034 0.043 0.000 0.214 0.054
5 0 1 2 7 0 8 3
abs 0.104 0.027 - - 0.381 0.625 - 0.008
5 1 0.170 0.772 6 6 0.274 1
2 2 3
(60) (60) (60) (60) (60) (60) (60) (60)
0.484 0.856 0.252 0.000 0.008 0.000 0.062 0.957
4 6 8 0 1 0 1 0
iapla 0.241 0.136 - - 0.356 - - -
3 6 0.294 0.273 5 0.184
0.274 0.309
2 4 4 3 8
(60) (60) (60) (60) (60) (60)(60) (60)
0.102 0.359 0.044 0.063 0.013 0.214
0.062 0.034
3 9 7 0 9 8 1 1
ialar 0.442 0.031 - - 0.318 - 0.008 -
8 8 0.308 0.219 6 0.282
1 0.309
7 0 5 8
(60) (60) (60) (60) (60) (60)(60) (60)
0.001 0.832 0.034 0.139 0.029 0.054
0.957 0.034
8 2 8 1 1 3 0 1
pus - 0.604 - 0.084 - 0.120
- 0.126 0.116
0.337 0 0.072 9 0.141 8 0.016 4 5
8 4 8 0
(60) (60) (60) (60) (60) (60) (60) (60) (60)
0.020 0.000 0.628 0.570 0.341 0.418 0.914 0.397 0.435
2 0 6 6 8 7 8 3 5
puc 0.093 - 0.050 0.191 - 0.039 0.080 0.026 0.124
6 0.654 3 3 0.126 7 9 1 5
3 4
(60) (60) (60) (60) (60) (60) (60) (60) (60)
0.531 0.000 0.737 0.197 0.397 0.791 0.588 0.861 0.404
6 0 2 8 2 3 7 7 2
vas - 0.962 - 0.056 0.006 - 0.027 - -
0.363 8 0.086 7 2 0.138 4 0.080 0.014
0 7 6 1 5
(60) (60) (60) (60) (60) (60) (60) (60) (60)
0.012 0.000 0.562 0.705 0.967 0.352 0.854 0.592 0.922
2 0 2 3 2 7 8 7 7
vac 0.183 - 0.129 0.125 - 0.099 0.087 0.150 0.216
2 0.847 6 4 0.090 5 1 4 7
2 6
(60) (60)(60) (60) (60) (60) (60) (60) (60)
0.217 0.000
0.385 0.401 0.544 0.505 0.560 0.312 0.143
6 0 2 0 8 6 7 9 4
trit 0.028 0.165
- - 0.297 - - - -
1 2 0.152 0.200 8 0.181 0.151 0.402 0.299
3 7 6 0 0 3
(60) (60) (60) (60) (60) (60) (60) (60) (60)
0.851 0.267 0.306 0.176 0.042 0.221 0.311 0.005 0.041
2 2 7 2 1 9 0 1 0
desg 0.026 0.213 - - 0.253 0.088 - - -
6 6 0.180 0.361 3 9 0.228 0.043 0.136
0 6 0 4 5
(60) (60) (60) (60) (60) (60) (60) (60) (60)
0.858 0.149 0.226 0.012 0.085 0.552 0.123 0.771 0.360
9 4 1 5 8 5 1 9 3

pus puc vas vac trit desg


rcomp - 0.093 - 0.183 0.028 0.026
a 0.337 6 0.363 2 1 6
8 0
(60) (60) (60) (60) (60) (60)
0.020 0.531 0.012 0.217 0.851 0.858
2 6 2 6 2 9
tmax 0.604 - 0.962 - 0.165 0.213
0 0.654 8 0.847 2 6
3 2
(60) (60) (60) (60) (60) (60)
0.000 0.000 0.000 0.000 0.267 0.149
0 0 0 0 2 4
tmaxn - 0.050 - 0.129 - -
om 0.072 3 0.086 6 0.152 0.180
4 7 3 0
(60) (60) (60) (60) (60) (60)
0.628 0.737 0.562 0.385 0.306 0.226
6 2 2 2 7 1
pea 0.084 0.191 0.056 0.125 - -
9 3 7 4 0.200 0.361
7 6
(60) (60) (60) (60) (60) (60)
0.570 0.197 0.705
0.401 0.176 0.012
6 8 3 0 2 5
psss - - 0.006
- 0.297 0.253
0.141 0.126 2 0.090 8 3
8 4 6
(60) (60)(60) (60) (60) (60)
0.341 0.397
0.967 0.544 0.042 0.085
8 2 2 8 1 8
pen 0.120 0.039
- 0.099 - 0.088
8 7 0.138 5 0.181 9
6 6
(60) (60) (60) (60) (60) (60)
0.418 0.791 0.352 0.505 0.221 0.552
7 3 7 6 9 5
abs - 0.080 0.027 0.087 - -
0.016 9 4 1 0.151 0.228
0 0 0
(60) (60) (60) (60) (60) (60)
0.914 0.588 0.854 0.560 0.311 0.123
8 7 8 7 0 1
iapla 0.126 0.026 - 0.150 - -
4 1 0.080 4 0.402 0.043
1 0 4
(60) (60) (60) (60) (60) (60)
0.397 0.861 0.592 0.312 0.005 0.771
3 7 7 9 1 9
ialar 0.116 0.124 - 0.216 - -
5 5 0.014 7 0.299 0.136
5 3 5
(60) (60) (60) (60) (60) (60)
0.435 0.404 0.922 0.143 0.041 0.360
5 2 7 4 0 3
pus 0.583 - 0.504 - -
0 0.597 6 0.059 0.117
8 9 7
(60) (60) (60) (60) (60)
0.000 0.000 0.000 0.689 0.430
0 0 3 4 6
puc 0.583 0.653 - 0.106 0.339
0 0 0.780 7 2
2
(60) (60) (60) (60) (60)
0.000 0.000 0.000 0.475 0.019
0 0 0 2 7
vas - 0.653 0.872 - -
0.597 0 0 0.136 0.182
8 6 8
(60) (60) (60) (60) (60)
0.000 0.000 0.000 0.359 0.218
0 0 0 9 9
vac 0.504 - 0.872 0.201 0.318
6 0.780 0 4 1
2
(60) (60) (60) (60) (60)
0.000 0.000 0.000 0.174 0.029
3 0 0 6 3
trit - 0.106 - 0.201 -
0.059 7 0.136 4 0.206
9 6 8
(60) (60) (60) (60) (60)
0.689 0.475 0.359 0.174 0.163
4 2 9 6 2
desg - 0.339 - 0.318 -
0.117 2 0.182 1 0.206
7 8 8
(60) (60) (60) (60) (60)
0.430 0.019 0.218 0.029 0.163
6 7 9 3 2
Correlación
(Tamaño de Muestra)
Valor-P

El StatAdvisor
Esta tabla muestra los coeficientes de correlación parcial entre cada
par de variables. Las correlaciones parciales miden la fuerza de la
relación lineal entre las variables, considerando primero el ajuste por
su relación con las otras variables de la tabla. Ayudan a juzgar que
tan útil sería una variable para mejorar las predicciones de la segunda
variable, dada la información de todas las otras variables que ya han
sido consideradas. También se muestra, entre paréntesis, el número
de pares de datos utilizados para calcular cada coeficiente. El tercer
número en cada bloque de la tabla es un valor-P que prueba la
significancia estadística de las correlaciones estimadas. Valores-P
abajo de 0.05 indican correlaciones significativamente diferentes de
cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
rcompa y tmax
rcompa y ialar
rcompa y pus
rcompa y vas
tmax y pus
tmax y puc
tmax y vas
tmax y vac
tmaxnom y iapla
tmaxnom y ialar
pea y psss
pea y pen
pea y abs
pea y desg
psss y pen
psss y abs
psss y iapla
psss y ialar
psss y trit
pen y abs
iapla y ialar
iapla y trit
ialar y trit
pus y puc
pus y vas
pus y vac
puc y vas
puc y vac
puc y desg
vas y vac
vac y desg

Regresión Múltiple - rcompa


Variable dependiente: rcompa
Variables independientes:
tmax
tmaxnom
pea
psss
pen
abs
iapla
ialar
pus
puc
vas
vac
trit
desg
Error Estadís
tico
Parámetro Estimac Estánd T Valor-P
ión ar
CONSTA 556.72 544.3 1.0228 0.3110
NTE 5 3
tmax 63.587 21.811 2.9152 0.0052
4 7 9
pea 677.66 143.24 4.7309 0.0000
3 7
ialar 7.9146 1.8882 4.1915 0.0001
1 3 5
pus - 0.4680 - 0.0156
1.1684 63 2.4964
9 4
vas - 5.4192 - 0.0022
17.414 3 3.2134
5 6

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 251803. 5 50360.6 6.44 0.0001
Residuo 422053. 54 7815.79
Total 673856. 59
(Corr.)
R-cuadrada = 37.3675 porciento
R-cuadrado (ajustado para g.l.) = 31.5682 porciento
Error estándar del est. = 88.407
Error absoluto medio = 63.4102
Estadístico Durbin-Watson = 2.15798 (P=0.6437)
Autocorrelación de residuos en retraso 1 = -0.0844096

Regresión por Pasos


Método: Selección Hacia Atrás
Alpha a introducir: 0.05
Alpha a cambiar: 0.05

Modelo Final seleccionado.

El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre rcompa y 14 variables
independientes. La ecuación del modelo ajustado es

rcompa = 556.725 + 63.5874*tmax + 677.663*pea + 7.91461*ialar -


1.16849*pus - 17.4145*vas

Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe


una relación estadísticamente significativa entre las variables con un
nivel de confianza del 95.0%.

El estadístico R-Cuadrada indica que el modelo así ajustado explica


37.3675% de la variabilidad en rcompa. El estadístico R-Cuadrada
ajustada, que es más apropiada para comparar modelos con diferente
número de variables independientes, es 31.5682%. El error estándar
del estimado muestra que la desviación estándar de los residuos es
88.407. Este valor puede usarse para construir límites para nuevas
observaciones, seleccionando la opción de Reportes del menú de
texto. El error absoluto medio (MAE) de 63.4102 es el valor promedio
de los residuos. El estadístico de Durbin-Watson (DW) examina los
residuos para determinar si hay alguna correlación significativa basada
en el orden en el que se presentan en el archivo de datos. Puesto que
el valor-P es mayor que 0.05, no hay indicación de una autocorrelación
serial en los residuos con un nivel de confianza del 95.0%.
Para determinar si el modelo puede simplificarse, note que el valor-P
más alto de las variables independientes es 0.0156, que corresponde
a pus. Puesto que el valor-P es menor que 0.05, ese término es
estadísticamente significativo con un nivel de confianza del 95.0%.
Consecuentemente, probablemente no quisiera eliminar ninguna
variable del modelo.
Gráfico de rcompa

800

600
observado

400

200

0
0 200 400 600 800
predicho

Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
19 243. 431.6 - -2.33
25 64 188.4
14
21 662. 456.1 206.2 2.60
38 73 07
51 568. 348.8 219.4 2.66
25 45 05
El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de rcompa del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
3 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.

Gráfico de Residuos

2
Rediduo Estudentizado

-1

-2

-3
0 200 400 600 800
predicho rcompa
Aceros

Análisis Multivariado
Datos/Variables:
consumo
pr.tbc
pr.cc
pr.ca
pr.galv1
pr.galv2
pr.pint

Existen 117 casos completos a utilizarse en los cálculos.

El StatAdvisor
Este procedimiento está diseñado para resumir varias columnas de
datos cuantitativos. Calculará varios estadísticos, incluyendo
correlaciones, covarianzas y correlaciones parciales. En el
procedimiento también están incluidas una serie de gráficas
multivariadas, que proporcionan vistas interesantes de los datos. Use
los íconos de Opciones Tabulares y de Opciones Gráficas en la barra
de herramientas para análisis, para acceder a estos diferentes
procedimientos.

Después de este procedimiento, tal vez quiera seleccionar otro para


construir un modelo estadístico de sus datos. Dependiendo de sus
objetivos, uno de varios procedimientos podría ser apropiado. A
continuación se presenta una lista de objetivos con una indicación del
procedimiento que podría ser apropiado:

OBJETIVO: Construir un modelo para predecir una variable dados los


valores de una ó más variables.
PROCEDIMIENTO: Relacionar - Varios Factores - Regresión Múltiple

OBJETIVO: Agrupar filas de datos con características similares.


PROCEDIMIENTO: Describir - Métodos Multivariados - Análisis de
Conglomerados

OBJETIVO: Desarrollar un métodos para predecir a cuál de varios


grupos pertenencen nuevas filas.
PROCEDIMIENTO: Relacionar - Métodos de Clasificación - Análisis
Discriminante

OBJETIVO: Reducir el número de columnas a un conjunto más


pequeño de medidas significativas.
PROCEDIMIENTO: Describir - Métodos Multivariados - Análisis
Factorial

OBJETIVO: Determina que combinación de columnas contribuyen con


la mayor variabilidad en los datos.
PROCEDIMIENTO: Describir - Métodos Multivariados - Componentes
Principales

OBJETIVO: Encontrar combinaciones de las columnas que están


fuertemente asociadas entre sí.
PROCEDIMIENTO: Describir - Métodos Multivariados - Correlaciones
Canónicas
consumo

pr.tbc

pr.cc

pr.ca

pr.galv 1

pr.galv 2

pr.pint

Resumen Estadístico
consu pr.tbc pr.cc
pr.galv pr.ca pr.galv
mo 1 2
Recuento 117 117 117 117 117 117
Promedio 139.45 7567.8 295.53 124.47 402.80 1159.7
6 2 9 3 2
Desviación 55.185 3002.7 358.61 161.99 334.92 577.79
Estándar 3 9 1 9 2
Coeficiente de 39.571 39.677 121.34 130.13 83.149 49.821
Variación 7% 3% 8% 5% 5% 7%
Mínimo 17.5 0 0 0 0 0
Máximo 290.72 10979. 1204.0 677.0 982.0 1963.0
0
Rango 273.22 10979. 1204.0 677.0 982.0 1963.0
0
Sesgo 0.0143 - 3.6508 5.2759 - -
Estandarizado 235 5.5639 8 2 0.0259 4.1927
56 3
Curtosis - 1.4528 - 1.6279 - -
Estandarizada 0.7630 6 1.4794 4 3.3772 0.6944
92 4 8 49
pr.pint
Recuento 117
Promedio 188.55
6
Desviación 289.44
Estándar 6
Coeficiente de 153.50
Variación 7%
Mínimo 0
Máximo 898.0
Rango 898.0
Sesgo 5.0538
Estandarizado 5
Curtosis -
Estandarizada 0.6926

El StatAdvisor
Esta tabla muestra el resumen estadístico para cada una de las
variables seleccionadas. Incluye medidas de tendencia central, de
variabilidad, y de forma. De particular interés aquí es el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden usarse
para determinar si la muestra proviene de una distribución normal.
Valores de estos estadísticos fuera del rango de -2 a +2 indican
desviaciones significativas de la normalidad, las cuales tenderían a
invalidar muchos de los procedimientos estadísticos que se aplican
habitualmente a estos datos. en este caso, las siguientes variables
muestran valores de sesgo estandarizado y de curtosis estandarizada
fuera del rango esperado:
pr.tbc
pr.cc
pr.ca
pr.galv2
pr.pint
Las siguientes variables muestran curtosis estandarizada fuera del
rango esperado:
pr.galv1
Para hacer las variables más normales, podría intentar una
transformación tal como LOG(Y), RAÍZ(Y), ó 1/Y.
Correlaciones Parciales
consu pr.tbc pr.cc pr.ca pr.galv pr.galv pr.pin
mo 1 2 t
consu 0.791 0.289 0.010 0.445 0.260 0.089
mo 6 0 9 0 3 5
(117) (117) (117) (117) (117) (117)
0.000 0.002 0.908 0.000 0.005 0.348
0 0 8 0 6 0
pr.tbc 0.791 - - - - -
6 0.147 0.013 0.335 0.150 0.102
9 2 4 8 0
(117) (117) (117) (117) (117) (117)
0.000 0.119 0.890 0.000 0.112 0.284
0 6 0 3 6 7
pr.cc 0.289 - - 0.090 - 0.156
0 0.147 0.208 0 0.060 8
9 5 1
(117) (117) (117) (117) (117) (117)
0.002 0.119 0.027 0.345 0.529 0.098
0 6 4 2 2 8
pr.ca 0.010 - - 0.129 - -
9 0.013 0.208 2 0.077 0.008
2 5 3 3
(117) (117) (117) (117) (117) (117)
0.908 0.890 0.027 0.174 0.417 0.931
8 0 4 5 7 1
pr.gal 0.445 - 0.090 0.129 - 0.172
v1 0 0.335 0 2 0.094 5
4 0
(117) (117) (117) (117) (117) (117)
0.000 0.000 0.345 0.174 0.324 0.069
0 3 2 5 2 0
pr.gal 0.260 - - - - 0.028
v2 3 0.150 0.060 0.077 0.094 8
8 1 3 0
(117) (117) (117) (117) (117) (117)
0.005 0.112 0.529 0.417 0.324 0.763
6 6 2 7 2 3
pr.pint 0.089 - 0.156 - 0.172 0.028
5 0.102 8 0.008 5 8
0 3
(117) (117) (117) (117) (117) (117)
0.348 0.284 0.098 0.931 0.069 0.763
0 7 8 1 0 3

Correlación
(Tamaño de Muestra)
Valor-P

El StatAdvisor
Esta tabla muestra los coeficientes de correlación parcial entre cada
par de variables. Las correlaciones parciales miden la fuerza de la
relación lineal entre las variables, considerando primero el ajuste por
su relación con las otras variables de la tabla. Ayudan a juzgar que
tan útil sería una variable para mejorar las predicciones de la segunda
variable, dada la información de todas las otras variables que ya han
sido consideradas. También se muestra, entre paréntesis, el número
de pares de datos utilizados para calcular cada coeficiente. El tercer
número en cada bloque de la tabla es un valor-P que prueba la
significancia estadística de las correlaciones estimadas. Valores-P
abajo de 0.05 indican correlaciones significativamente diferentes de
cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
consumo y pr.tbc
consumo y pr.cc
consumo y pr.galv1
consumo y pr.galv2
pr.tbc y pr.galv1
pr.cc y pr.ca

Regresión Múltiple - consumo


Variable dependiente: consumo
Variables independientes:
pr.tbc
pr.cc
pr.ca
pr.galv1
pr.galv2
pr.pint

Error Estadís
tico
Parámetro Estimac Estándar T Valor-P
ión
CONSTA 1.0040 9.15098 0.1097 0.9128
NTE 8 24
pr.tbc 0.0125 0.00091 13.623 0.0000
182 8892 2
pr.cc 0.0279 0.00802 3.4888 0.0007
882 216 6
pr.galv1 0.0485 0.00850 5.7084 0.0000
234 023 8
pr.galv2 0.0137 0.00473 2.8976 0.0045
101 142 8

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 257566. 4 64391.6 75.36 0.0000
Residuo 95701.6 11 854.479
2
Total 353268. 11
(Corr.) 6

R-cuadrada = 72.9096 porciento


R-cuadrado (ajustado para g.l.) = 71.9421 porciento
Error estándar del est. = 29.2315
Error absoluto medio = 21.8524
Estadístico Durbin-Watson = 1.16381 (P=0.0000)
Autocorrelación de residuos en retraso 1 = 0.404076

Regresión por Pasos


Método: Selección Hacia Atrás
Alpha a introducir: 0.05
Alpha a cambiar: 0.05
Modelo Final seleccionado.

El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre consumo y 6 variables
independientes. La ecuación del modelo ajustado es

consumo = 1.00408 + 0.0125182*pr.tbc + 0.0279882*pr.cc +


0.0485234*pr.galv1 + 0.0137101*pr.galv2

Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe


una relación estadísticamente significativa entre las variables con un
nivel de confianza del 95.0%.

El estadístico R-Cuadrada indica que el modelo así ajustado explica


72.9096% de la variabilidad en consumo. El estadístico R-Cuadrada
ajustada, que es más apropiada para comparar modelos con diferente
número de variables independientes, es 71.9421%. El error estándar
del estimado muestra que la desviación estándar de los residuos es
29.2315. Este valor puede usarse para construir límites para nuevas
observaciones, seleccionando la opción de Reportes del menú de
texto. El error absoluto medio (MAE) de 21.8524 es el valor promedio
de los residuos. El estadístico de Durbin-Watson (DW) examina los
residuos para determinar si hay alguna correlación significativa basada
en el orden en el que se presentan en el archivo de datos. Puesto que
el valor-P es menor que 0.05, hay indicación de una posible
correlación serial con un nivel de confianza del 95.0%. Grafique los
residuos versus el número de fila para ver si hay algún patrón que
pueda detectarse.

Para determinar si el modelo puede simplificarse, note que el valor-P


más alto de las variables independientes es 0.0045, que corresponde
a pr.galv2. Puesto que el valor-P es menor que 0.05, ese término es
estadísticamente significativo con un nivel de confianza del 95.0%.
Consecuentemente, probablemente no quisiera eliminar ninguna
variable del modelo.
Gráfico de consumo

300

250

200
observado

150

100

50

0
0 50 100 150 200 250 300
predicho

Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
4 90.4 148.3 - -2.06
6 82 57.92
16
5 120. 187.5 - -2.43
04 83 67.54
29
13 57.8 123.4 - -2.32
4 95 65.65
51
88 290. 212.0 78.69 2.83
72 25 51
10 222. 130.9 91.88 3.39
7 88 91 92
11 113. 172.8 - -2.08
3 75 36 59.08
64
El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de consumo del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
6 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.
Es conveniente examinar detenidamente las observaciones con
residuos mayores a 3 para determinar si son valores aberrantes que
debieran ser eliminados del modelo y tratados por separado.

Gráfico de Residuos

4
Rediduo Estudentizado

-2

-4
0 50 100 150 200 250 300
predicho consumo

Selección del Modelo de Regresión - consumo


Variable dependiente: consumo
Variables independientes:
A=pr.tbc
B=pr.cc
C=pr.ca
D=pr.galv1
E=pr.galv2
F=pr.pint

Número de casos completos: 117


Número de modelos ajustados: 57

Resultados de los Modelos


R- Variab
Cuadra les
da
CME R- Ajustad Cp Incluid
Cuadra a as
da
3045. 0.0 0.0 294.3
41 7
1374. 55.2487 54.8595 70.19 A
71 84
2615. 14.8483 14.1079 235.5 B
77 85
3045. 0.86206 0.0 295.5 C
41 9 54
2577. 16.1013 15.3717 230.4 D
28 56
2893. 5.79553 4.97637 272.6 E
86 45
2956. 3.74751 2.91053 281.0 F
77 29
1153. 62.7653 62.112 41.42 AB
84 77
1386. 55.2709 54.4862 72.10 AC
08 74
1000. 67.7003 67.1337 21.22 AD
92 51
1301. 57.9913 57.2543 60.97 AE
78 11
1273. 58.8972 58.1761 57.26 AF
71 23
2636. 14.9349 13.4425 237.2 BC
03 31
2360. 23.8137 22.4771 200.8 BD
89 84
2496. 19.4232 18.0095 218.8 BE
95 57
2611. 15.7261 14.2476 233.9 BF
51 92
2580. 16.712 15.2508 229.9 CD
96 56
2917. 5.85401 4.20232 274.4 CE
43 05
2977. 3.90274 2.21682 282.3 CF
9 93
2448. 20.9894 19.6032 212.4 DE
41 46
2581. 16.6854 15.2237 230.0 DF
79 65
2822. 8.91128 7.31323 261.8 EF
69 9
1159. 62.9023 61.9174 42.86 ABC
77 69
910.4 70.8787 70.1055 10.21 ABD
09 39
1093. 65.0276 64.0991 34.16 ABE
33 66
1118. 64.2364 63.2869 37.40 ABF
06 54
1003. 67.9059 67.0538 22.38 ACD
35 36
1313. 57.9914 56.8762 62.97 ACE
3 04
1284. 58.9068 57.8158 59.22 ACF
68 33
938.9 69.9654 69.1681 13.95 ADE
6 25
985.0 68.4897 67.6532 19.99 ADF
95 36
1212. 61.2104 60.1806 49.79 AEF
67 3
2381. 23.8379 21.8159 202.7 BCD
03 85
2512. 19.6277 17.4939 220.0 BCE
65 2
2632. 15.7993 13.5639 235.6 BCF
34 92
2250. 28.0191 26.1081 185.6 BDE
31 68
2380. 23.8646 21.8433 202.6 BDF
19 75
2498. 20.093 17.9716 218.1 BEF
1 15
2459. 21.3318 19.2433 213.0 CDE
37 44
2587. 17.2341 15.0368 229.8 CDF
48 19
2846. 8.95321 6.53604 263.7 CEF
36 18
2457. 21.3875 19.3005 212.8 DEF
63 16
918.4 70.882 69.8421 12.20 ABCD
34 04
1095. 65.2585 64.0177 35.22 ABCE
81 12
1124. 64.3519 63.0788 38.93 ABCF
4 25
854.4 72.9096 71.9421 3.899 ABDE
79 85
909.2 71.1734 70.1439 11.00 ABDF
41 73
1063. 66.2926 65.0887 30.98 ABEF
19 8
944.0 70.0713 69.0025 15.51 ACDE
03 89
988.7 68.6534 67.5339 21.32 ACDF
26 34
1223. 61.211 59.8256 51.79 ACEF
48 07
927.3 70.5982 69.5481 13.36 ADEF
85 22
2270. 28.0191 25.4484 187.6 BCDE
4 68
2400. 23.8881 21.1698 204.5 BCDF
71 79
2514. 20.2763 17.429 219.3 BCEF
63 65
2269. 28.0341 25.4639 187.6 BDEF
93 07
2469. 21.6951 18.8985 213.5 CDEF
87 56

El StatAdvisor
Esta tabla muestra los resultados de ajustar varios modelos de
regresión múltiple para describir la relación entre consumo y 6
variables predictoras. Los modelos se han ajustado conteniendo todas
las combinaciones desde 0 hasta 4 variables. Las estadísticas
tabuladas incluyen el cuadrado medio del error (CME), los valores de
R-Cuadrada ajustada y sin ajustar, y el estadístico Cp de Mallows.
Para determinar cuales modelos son mejores de acuerdo a estos
diferentes criterios, seleccione una de las Opciones Tabulares.

Gráfica de R-Cuadrada Aj ustada para consumo

80
R-Cuadrada ajustada

60

40

20

0
0 1 2 3 4 5 6
Número de Coeficientes

Modelos con Mayor R-Cuadrada Ajustada


R- Variab
Cuadra les
da
CME R- Ajustad Cp Incluid
Cuadra a as
da
854.4 72.9096 71.9421 3.899 ABDE
79 85
909.2 71.1734 70.1439 11.00 ABDF
41 73
910.4 70.8787 70.1055 10.21 ABD
09 39
918.4 70.882 69.8421 12.20 ABCD
34 04
927.3 70.5982 69.5481 13.36 ADEF
85 22
938.9 69.9654 69.1681 13.95 ADE
6 25
944.0 70.0713 69.0025 15.51 ACDE
03 89
985.0 68.4897 67.6532 19.99 ADF
95 36
1000. 67.7003 67.1337 21.22 AD
92 51
1003. 67.9059 67.0538 22.38 ACD
35 36
1093. 65.0276 64.0991 34.16 ABE
33 66
1153. 62.7653 62.112 41.42 AB
84 77
1273. 58.8972 58.1761 57.26 AF
71 23
1301. 57.9913 57.2543 60.97 AE
78 11
1374. 55.2487 54.8595 70.19 A
71 84
1386. 55.2709 54.4862 72.10 AC
08 74
2577. 16.1013 15.3717 230.4 D
28 56
2615. 14.8483 14.1079 235.5 B
77 85
2893. 5.79553 4.97637 272.6 E
86 45
2956. 3.74751 2.91053 281.0 F
77 29
3045. 0.0 0.0 294.3
41 7

El StatAdvisor
Esta tabla muestra los modelos que dan los valores más altos de R-
Cuadrada ajustada. El estadístico de R-Cuadrada ajustada mide la
proporción de variabilidad en consumo que es explicada por el
modelo. Valores grandes de R-Cuadrada ajustada corresponden a
valores pequeños de cuadrado medio del error (CME). Se muestran
hasta 5 modelos en cada subconjunto de entre 0 y 4 variables. El
mejor modelo contiene 4 variables, pr.tbc, pr.cc, pr.galv1, y pr.galv2.

Modelos con Menor Cp


R- Variab
Cuadra les
da
CME R- Ajustad Cp Incluid
Cuadra a as
da
854.4 72.9096 71.9421 3.899 ABDE
79 85
910.4 70.8787 70.1055 10.21 ABD
09 39
909.2 71.1734 70.1439 11.00 ABDF
41 73
918.4 70.882 69.8421 12.20 ABCD
34 04
927.3 70.5982 69.5481 13.36 ADEF
85 22
938.9 69.9654 69.1681 13.95 ADE
6 25
944.0 70.0713 69.0025 15.51 ACDE
03 89
985.0 68.4897 67.6532 19.99 ADF
95 36
1000. 67.7003 67.1337 21.22 AD
92 51
1003. 67.9059 67.0538 22.38 ACD
35 36
1093. 65.0276 64.0991 34.16 ABE
33 66
1153. 62.7653 62.112 41.42 AB
84 77
1273. 58.8972 58.1761 57.26 AF
71 23
1301. 57.9913 57.2543 60.97 AE
78 11
1374. 55.2487 54.8595 70.19 A
71 84
1386. 55.2709 54.4862 72.10 AC
08 74
2577. 16.1013 15.3717 230.4 D
28 56
2615. 14.8483 14.1079 235.5 B
77 85
2893. 5.79553 4.97637 272.6 E
86 45
2956. 3.74751 2.91053 281.0 F
77 29
3045. 0.0 0.0 294.3
41 7

El StatAdvisor
Esta tabla muestra los modelos que dan los valores más pequeños del
estadístico Cp de Mallows. Cp es una medida del bias (sesgo) en el
modelo, basada en la comparación entre el cuadrado medio del error
total y la varianza del error verdadero. Modelos sin bias tienen un
valor esperado de aproximadamente p, en donde p es el número de
coeficientes en el modelo ajustado (incluyendo la constante). Debe
buscar modelos con valores de Cp cercanos a p. La gráfica de Cp,
disponible de la lista de Opciones Gráficas, contiene una línea igual a
p para ayudarle a seleccionar los mejores modelos.

}
Modelos con el mejor criterio de información
MSE Coeficie AIC HQC SBIC Variables
ntes incluidas
854.4 5 6.8359 6.8838 6.954 ABDE
79 6 8
910.4 4 6.8822 6.9206 6.976 ABD
09 7 1 7
909.2 5 6.8980 6.946 7.016 ABDF
41 8 12
918.4 5 6.9081 6.9560 7.026 ABCD
34 4 6 18
938.9 4 6.9131 6.9514 7.007 ADE
6 5 9 58
927.3 5 6.9178 6.9657 7.035 ADEF
85 4 6 88
944.0 5 6.9356 6.9835 7.053 ACDE
03 2 64
1000. 3 6.9599 6.9887 7.030 AD
92 5 1 78
985.0 4 6.9611 6.9994 7.055 ADF
95 1 5 55
1003. 4 6.9794 7.0178 7.073 ACD
35 7 1 91
1093. 4 7.0653 7.1037 7.159 ABE
33 6 79
1153. 3 7.1021 7.1308 7.172 AB
84 4 9 96
1273. 3 7.2009 7.2297 7.271 AF
71 7 2 8
1301. 3 7.2227 7.2515 7.293 AE
78 7 3 6
1374. 2 7.2601 7.2793 7.307 A
71 9 6 4
1386. 3 7.2855 7.3142 7.356 AC
08 2 7 34
2577. 2 7.8886 7.9078 7.935 D
28 8 5 89
2615. 2 7.9035 7.9226 7.950 B
77 7 72
2893. 2 8.0045 8.0237 8.051 E
86 4 75
2956. 2 8.0260 8.0452 8.073 F
77 4 1 26
3045. 1 8.0384 8.0480 8.062
41 9 7 09

El StatAdvisor
Esta tabla ordena los modelos de regresión de acuerdo al valor del
criterio de información de Akaike (AIC). el criterio de información se
basa en el error cuadrático medio residual con una penalización que
crece con el crecimiento del número de coeficientes del modelo. la
meta es seleccinar un modelo con el mínimo error residual y con tan
pocos coeficientes como sea posible. El mejor modelo es el que
minimiza el criterio de información. A menudo, el mejor modelo
depende del criterio de información seleccionado, cada uno de los
cuales utiliza una fórmula diferente para la penalización.

Regresión Múltiple - consumo


Variable dependiente: consumo
Variables independientes:
pr.tbc
pr.cc
pr.galv1
pr.galv2

Error Estadís
tico
Parámetro Estimac Estándar T Valor-P
ión
CONSTA 1.0040 9.15098 0.1097 0.9128
NTE 8 24
pr.tbc 0.0125 0.00091 13.623 0.0000
182 8892 2
pr.cc 0.0279 0.00802 3.4888 0.0007
882 216 6
pr.galv1 0.0485 0.00850 5.7084 0.0000
234 023 8
pr.galv2 0.0137 0.00473 2.8976 0.0045
101 142 8

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 257566. 4 64391.6 75.36 0.0000
Residuo 95701.6 11 854.479
2
Total 353268. 11
(Corr.) 6

R-cuadrada = 72.9096 porciento


R-cuadrado (ajustado para g.l.) = 71.9421 porciento
Error estándar del est. = 29.2315
Error absoluto medio = 21.8524
Estadístico Durbin-Watson = 1.16381 (P=0.0000)
Autocorrelación de residuos en retraso 1 = 0.404076

El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre consumo y 4 variables
independientes. La ecuación del modelo ajustado es

consumo = 1.00408 + 0.0125182*pr.tbc + 0.0279882*pr.cc +


0.0485234*pr.galv1 + 0.0137101*pr.galv2

Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe


una relación estadísticamente significativa entre las variables con un
nivel de confianza del 95.0%.

El estadístico R-Cuadrada indica que el modelo así ajustado explica


72.9096% de la variabilidad en consumo. El estadístico R-Cuadrada
ajustada, que es más apropiada para comparar modelos con diferente
número de variables independientes, es 71.9421%. El error estándar
del estimado muestra que la desviación estándar de los residuos es
29.2315. Este valor puede usarse para construir límites para nuevas
observaciones, seleccionando la opción de Reportes del menú de
texto. El error absoluto medio (MAE) de 21.8524 es el valor promedio
de los residuos. El estadístico de Durbin-Watson (DW) examina los
residuos para determinar si hay alguna correlación significativa basada
en el orden en el que se presentan en el archivo de datos. Puesto que
el valor-P es menor que 0.05, hay indicación de una posible
correlación serial con un nivel de confianza del 95.0%. Grafique los
residuos versus el número de fila para ver si hay algún patrón que
pueda detectarse.

Para determinar si el modelo puede simplificarse, note que el valor-P


más alto de las variables independientes es 0.0045, que corresponde
a pr.galv2. Puesto que el valor-P es menor que 0.05, ese término es
estadísticamente significativo con un nivel de confianza del 95.0%.
Consecuentemente, probablemente no quisiera eliminar ninguna
variable del modelo.

Gráfico de consumo

300

250

200
observado

150

100

50

0
0 50 100 150 200 250 300
predicho

Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
4 90.4 148.3 - -2.06
6 82 57.92
16
5 120. 187.5 - -2.43
04 83 67.54
29
13 57.8 123.4 - -2.32
4 95 65.65
51
88 290. 212.0 78.69 2.83
72 25 51
10 222. 130.9 91.88 3.39
7 88 91 92
11 113. 172.8 - -2.08
3 75 36 59.08
64

El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de consumo del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
6 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.
Es conveniente examinar detenidamente las observaciones con
residuos mayores a 3 para determinar si son valores aberrantes que
debieran ser eliminados del modelo y tratados por separado.

Gráfico de Residuos

4
Rediduo Estudentizado

-2

-4
0 50 100 150 200 250 300
predicho consumo

Vous aimerez peut-être aussi