Académique Documents
Professionnel Documents
Culture Documents
Análisis Multivariado
Datos/Variables:
rcompa
tmax
tmaxnom
pea
psss
pen
abs
iapla
ialar
pus
puc
vas
vac
trit
desg
El StatAdvisor
Este procedimiento está diseñado para resumir varias columnas de
datos cuantitativos. Calculará varios estadísticos, incluyendo
correlaciones, covarianzas y correlaciones parciales. En el
procedimiento también están incluidas una serie de gráficas
multivariadas, que proporcionan vistas interesantes de los datos. Use
los íconos de Opciones Tabulares y de Opciones Gráficas en la barra
de herramientas para análisis, para acceder a estos diferentes
procedimientos.
Resumen Estadístico
rcompa tmax tmaxno pea psss pen
m
Recuento 60 60 60 60 60 60
Promedio 334.14 3.2735 3.4078 2.4915 2.5448 2.6315
4 3 3
Desviación 106.87 1.0560 0.5957 0.1478 0.1491 0.1571
Estándar 6 59 87 16 55
Coeficiente de 31.983 32.260 17.482 5.9356 5.8595 5.9720
Variación 4% 9% 1% 7% 6% 7%
Mínimo 158.96 1.5 2.54 1.91 1.97 2.02
Máximo 669.52 5.08 3.81 2.69 2.75 2.86
Rango 510.56 3.58 1.27 0.78 0.78 0.84
Sesgo 3.3877 - - - - -
Estandarizado 1 3.1066 2.5569 8.9318 9.0255 9.0370
3 8 8 6 8
Curtosis 2.6383 - - 14.871 15.126 15.467
Estandarizada 0.9039 2.2037 7 8
35 9
El StatAdvisor
Esta tabla muestra los coeficientes de correlación parcial entre cada
par de variables. Las correlaciones parciales miden la fuerza de la
relación lineal entre las variables, considerando primero el ajuste por
su relación con las otras variables de la tabla. Ayudan a juzgar que
tan útil sería una variable para mejorar las predicciones de la segunda
variable, dada la información de todas las otras variables que ya han
sido consideradas. También se muestra, entre paréntesis, el número
de pares de datos utilizados para calcular cada coeficiente. El tercer
número en cada bloque de la tabla es un valor-P que prueba la
significancia estadística de las correlaciones estimadas. Valores-P
abajo de 0.05 indican correlaciones significativamente diferentes de
cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
rcompa y tmax
rcompa y ialar
rcompa y pus
rcompa y vas
tmax y pus
tmax y puc
tmax y vas
tmax y vac
tmaxnom y iapla
tmaxnom y ialar
pea y psss
pea y pen
pea y abs
pea y desg
psss y pen
psss y abs
psss y iapla
psss y ialar
psss y trit
pen y abs
iapla y ialar
iapla y trit
ialar y trit
pus y puc
pus y vas
pus y vac
puc y vas
puc y vac
puc y desg
vas y vac
vac y desg
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 251803. 5 50360.6 6.44 0.0001
Residuo 422053. 54 7815.79
Total 673856. 59
(Corr.)
R-cuadrada = 37.3675 porciento
R-cuadrado (ajustado para g.l.) = 31.5682 porciento
Error estándar del est. = 88.407
Error absoluto medio = 63.4102
Estadístico Durbin-Watson = 2.15798 (P=0.6437)
Autocorrelación de residuos en retraso 1 = -0.0844096
El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre rcompa y 14 variables
independientes. La ecuación del modelo ajustado es
800
600
observado
400
200
0
0 200 400 600 800
predicho
Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
19 243. 431.6 - -2.33
25 64 188.4
14
21 662. 456.1 206.2 2.60
38 73 07
51 568. 348.8 219.4 2.66
25 45 05
El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de rcompa del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
3 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.
Gráfico de Residuos
2
Rediduo Estudentizado
-1
-2
-3
0 200 400 600 800
predicho rcompa
Aceros
Análisis Multivariado
Datos/Variables:
consumo
pr.tbc
pr.cc
pr.ca
pr.galv1
pr.galv2
pr.pint
El StatAdvisor
Este procedimiento está diseñado para resumir varias columnas de
datos cuantitativos. Calculará varios estadísticos, incluyendo
correlaciones, covarianzas y correlaciones parciales. En el
procedimiento también están incluidas una serie de gráficas
multivariadas, que proporcionan vistas interesantes de los datos. Use
los íconos de Opciones Tabulares y de Opciones Gráficas en la barra
de herramientas para análisis, para acceder a estos diferentes
procedimientos.
pr.tbc
pr.cc
pr.ca
pr.galv 1
pr.galv 2
pr.pint
Resumen Estadístico
consu pr.tbc pr.cc
pr.galv pr.ca pr.galv
mo 1 2
Recuento 117 117 117 117 117 117
Promedio 139.45 7567.8 295.53 124.47 402.80 1159.7
6 2 9 3 2
Desviación 55.185 3002.7 358.61 161.99 334.92 577.79
Estándar 3 9 1 9 2
Coeficiente de 39.571 39.677 121.34 130.13 83.149 49.821
Variación 7% 3% 8% 5% 5% 7%
Mínimo 17.5 0 0 0 0 0
Máximo 290.72 10979. 1204.0 677.0 982.0 1963.0
0
Rango 273.22 10979. 1204.0 677.0 982.0 1963.0
0
Sesgo 0.0143 - 3.6508 5.2759 - -
Estandarizado 235 5.5639 8 2 0.0259 4.1927
56 3
Curtosis - 1.4528 - 1.6279 - -
Estandarizada 0.7630 6 1.4794 4 3.3772 0.6944
92 4 8 49
pr.pint
Recuento 117
Promedio 188.55
6
Desviación 289.44
Estándar 6
Coeficiente de 153.50
Variación 7%
Mínimo 0
Máximo 898.0
Rango 898.0
Sesgo 5.0538
Estandarizado 5
Curtosis -
Estandarizada 0.6926
El StatAdvisor
Esta tabla muestra el resumen estadístico para cada una de las
variables seleccionadas. Incluye medidas de tendencia central, de
variabilidad, y de forma. De particular interés aquí es el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden usarse
para determinar si la muestra proviene de una distribución normal.
Valores de estos estadísticos fuera del rango de -2 a +2 indican
desviaciones significativas de la normalidad, las cuales tenderían a
invalidar muchos de los procedimientos estadísticos que se aplican
habitualmente a estos datos. en este caso, las siguientes variables
muestran valores de sesgo estandarizado y de curtosis estandarizada
fuera del rango esperado:
pr.tbc
pr.cc
pr.ca
pr.galv2
pr.pint
Las siguientes variables muestran curtosis estandarizada fuera del
rango esperado:
pr.galv1
Para hacer las variables más normales, podría intentar una
transformación tal como LOG(Y), RAÍZ(Y), ó 1/Y.
Correlaciones Parciales
consu pr.tbc pr.cc pr.ca pr.galv pr.galv pr.pin
mo 1 2 t
consu 0.791 0.289 0.010 0.445 0.260 0.089
mo 6 0 9 0 3 5
(117) (117) (117) (117) (117) (117)
0.000 0.002 0.908 0.000 0.005 0.348
0 0 8 0 6 0
pr.tbc 0.791 - - - - -
6 0.147 0.013 0.335 0.150 0.102
9 2 4 8 0
(117) (117) (117) (117) (117) (117)
0.000 0.119 0.890 0.000 0.112 0.284
0 6 0 3 6 7
pr.cc 0.289 - - 0.090 - 0.156
0 0.147 0.208 0 0.060 8
9 5 1
(117) (117) (117) (117) (117) (117)
0.002 0.119 0.027 0.345 0.529 0.098
0 6 4 2 2 8
pr.ca 0.010 - - 0.129 - -
9 0.013 0.208 2 0.077 0.008
2 5 3 3
(117) (117) (117) (117) (117) (117)
0.908 0.890 0.027 0.174 0.417 0.931
8 0 4 5 7 1
pr.gal 0.445 - 0.090 0.129 - 0.172
v1 0 0.335 0 2 0.094 5
4 0
(117) (117) (117) (117) (117) (117)
0.000 0.000 0.345 0.174 0.324 0.069
0 3 2 5 2 0
pr.gal 0.260 - - - - 0.028
v2 3 0.150 0.060 0.077 0.094 8
8 1 3 0
(117) (117) (117) (117) (117) (117)
0.005 0.112 0.529 0.417 0.324 0.763
6 6 2 7 2 3
pr.pint 0.089 - 0.156 - 0.172 0.028
5 0.102 8 0.008 5 8
0 3
(117) (117) (117) (117) (117) (117)
0.348 0.284 0.098 0.931 0.069 0.763
0 7 8 1 0 3
Correlación
(Tamaño de Muestra)
Valor-P
El StatAdvisor
Esta tabla muestra los coeficientes de correlación parcial entre cada
par de variables. Las correlaciones parciales miden la fuerza de la
relación lineal entre las variables, considerando primero el ajuste por
su relación con las otras variables de la tabla. Ayudan a juzgar que
tan útil sería una variable para mejorar las predicciones de la segunda
variable, dada la información de todas las otras variables que ya han
sido consideradas. También se muestra, entre paréntesis, el número
de pares de datos utilizados para calcular cada coeficiente. El tercer
número en cada bloque de la tabla es un valor-P que prueba la
significancia estadística de las correlaciones estimadas. Valores-P
abajo de 0.05 indican correlaciones significativamente diferentes de
cero, con un nivel de confianza del 95.0%. Los siguientes pares de
variables tienen valores-P por debajo de 0.05:
consumo y pr.tbc
consumo y pr.cc
consumo y pr.galv1
consumo y pr.galv2
pr.tbc y pr.galv1
pr.cc y pr.ca
Error Estadís
tico
Parámetro Estimac Estándar T Valor-P
ión
CONSTA 1.0040 9.15098 0.1097 0.9128
NTE 8 24
pr.tbc 0.0125 0.00091 13.623 0.0000
182 8892 2
pr.cc 0.0279 0.00802 3.4888 0.0007
882 216 6
pr.galv1 0.0485 0.00850 5.7084 0.0000
234 023 8
pr.galv2 0.0137 0.00473 2.8976 0.0045
101 142 8
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 257566. 4 64391.6 75.36 0.0000
Residuo 95701.6 11 854.479
2
Total 353268. 11
(Corr.) 6
El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre consumo y 6 variables
independientes. La ecuación del modelo ajustado es
300
250
200
observado
150
100
50
0
0 50 100 150 200 250 300
predicho
Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
4 90.4 148.3 - -2.06
6 82 57.92
16
5 120. 187.5 - -2.43
04 83 67.54
29
13 57.8 123.4 - -2.32
4 95 65.65
51
88 290. 212.0 78.69 2.83
72 25 51
10 222. 130.9 91.88 3.39
7 88 91 92
11 113. 172.8 - -2.08
3 75 36 59.08
64
El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de consumo del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
6 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.
Es conveniente examinar detenidamente las observaciones con
residuos mayores a 3 para determinar si son valores aberrantes que
debieran ser eliminados del modelo y tratados por separado.
Gráfico de Residuos
4
Rediduo Estudentizado
-2
-4
0 50 100 150 200 250 300
predicho consumo
El StatAdvisor
Esta tabla muestra los resultados de ajustar varios modelos de
regresión múltiple para describir la relación entre consumo y 6
variables predictoras. Los modelos se han ajustado conteniendo todas
las combinaciones desde 0 hasta 4 variables. Las estadísticas
tabuladas incluyen el cuadrado medio del error (CME), los valores de
R-Cuadrada ajustada y sin ajustar, y el estadístico Cp de Mallows.
Para determinar cuales modelos son mejores de acuerdo a estos
diferentes criterios, seleccione una de las Opciones Tabulares.
80
R-Cuadrada ajustada
60
40
20
0
0 1 2 3 4 5 6
Número de Coeficientes
El StatAdvisor
Esta tabla muestra los modelos que dan los valores más altos de R-
Cuadrada ajustada. El estadístico de R-Cuadrada ajustada mide la
proporción de variabilidad en consumo que es explicada por el
modelo. Valores grandes de R-Cuadrada ajustada corresponden a
valores pequeños de cuadrado medio del error (CME). Se muestran
hasta 5 modelos en cada subconjunto de entre 0 y 4 variables. El
mejor modelo contiene 4 variables, pr.tbc, pr.cc, pr.galv1, y pr.galv2.
El StatAdvisor
Esta tabla muestra los modelos que dan los valores más pequeños del
estadístico Cp de Mallows. Cp es una medida del bias (sesgo) en el
modelo, basada en la comparación entre el cuadrado medio del error
total y la varianza del error verdadero. Modelos sin bias tienen un
valor esperado de aproximadamente p, en donde p es el número de
coeficientes en el modelo ajustado (incluyendo la constante). Debe
buscar modelos con valores de Cp cercanos a p. La gráfica de Cp,
disponible de la lista de Opciones Gráficas, contiene una línea igual a
p para ayudarle a seleccionar los mejores modelos.
}
Modelos con el mejor criterio de información
MSE Coeficie AIC HQC SBIC Variables
ntes incluidas
854.4 5 6.8359 6.8838 6.954 ABDE
79 6 8
910.4 4 6.8822 6.9206 6.976 ABD
09 7 1 7
909.2 5 6.8980 6.946 7.016 ABDF
41 8 12
918.4 5 6.9081 6.9560 7.026 ABCD
34 4 6 18
938.9 4 6.9131 6.9514 7.007 ADE
6 5 9 58
927.3 5 6.9178 6.9657 7.035 ADEF
85 4 6 88
944.0 5 6.9356 6.9835 7.053 ACDE
03 2 64
1000. 3 6.9599 6.9887 7.030 AD
92 5 1 78
985.0 4 6.9611 6.9994 7.055 ADF
95 1 5 55
1003. 4 6.9794 7.0178 7.073 ACD
35 7 1 91
1093. 4 7.0653 7.1037 7.159 ABE
33 6 79
1153. 3 7.1021 7.1308 7.172 AB
84 4 9 96
1273. 3 7.2009 7.2297 7.271 AF
71 7 2 8
1301. 3 7.2227 7.2515 7.293 AE
78 7 3 6
1374. 2 7.2601 7.2793 7.307 A
71 9 6 4
1386. 3 7.2855 7.3142 7.356 AC
08 2 7 34
2577. 2 7.8886 7.9078 7.935 D
28 8 5 89
2615. 2 7.9035 7.9226 7.950 B
77 7 72
2893. 2 8.0045 8.0237 8.051 E
86 4 75
2956. 2 8.0260 8.0452 8.073 F
77 4 1 26
3045. 1 8.0384 8.0480 8.062
41 9 7 09
El StatAdvisor
Esta tabla ordena los modelos de regresión de acuerdo al valor del
criterio de información de Akaike (AIC). el criterio de información se
basa en el error cuadrático medio residual con una penalización que
crece con el crecimiento del número de coeficientes del modelo. la
meta es seleccinar un modelo con el mínimo error residual y con tan
pocos coeficientes como sea posible. El mejor modelo es el que
minimiza el criterio de información. A menudo, el mejor modelo
depende del criterio de información seleccionado, cada uno de los
cuales utiliza una fórmula diferente para la penalización.
Error Estadís
tico
Parámetro Estimac Estándar T Valor-P
ión
CONSTA 1.0040 9.15098 0.1097 0.9128
NTE 8 24
pr.tbc 0.0125 0.00091 13.623 0.0000
182 8892 2
pr.cc 0.0279 0.00802 3.4888 0.0007
882 216 6
pr.galv1 0.0485 0.00850 5.7084 0.0000
234 023 8
pr.galv2 0.0137 0.00473 2.8976 0.0045
101 142 8
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón Valor-P
Cuadrados Medio -F
Modelo 257566. 4 64391.6 75.36 0.0000
Residuo 95701.6 11 854.479
2
Total 353268. 11
(Corr.) 6
El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión
lineal múltiple para describir la relación entre consumo y 4 variables
independientes. La ecuación del modelo ajustado es
Gráfico de consumo
300
250
200
observado
150
100
50
0
0 50 100 150 200 250 300
predicho
Residuos Atípicos
Y Residuo
Fil Y Predic Resid Estudenti
a ha uo zado
4 90.4 148.3 - -2.06
6 82 57.92
16
5 120. 187.5 - -2.43
04 83 67.54
29
13 57.8 123.4 - -2.32
4 95 65.65
51
88 290. 212.0 78.69 2.83
72 25 51
10 222. 130.9 91.88 3.39
7 88 91 92
11 113. 172.8 - -2.08
3 75 36 59.08
64
El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que
tienen residuos Estudentizados mayores a 2, en valor absoluto. Los
residuos Estudentizados miden cuántas desviaciones estándar se
desvía cada valor observado de consumo del modelo ajustado,
utilizando todos los datos excepto esa observación. En este caso, hay
6 residuos Estudentizados mayores que 2, pero ninguno mayor que 3.
Es conveniente examinar detenidamente las observaciones con
residuos mayores a 3 para determinar si son valores aberrantes que
debieran ser eliminados del modelo y tratados por separado.
Gráfico de Residuos
4
Rediduo Estudentizado
-2
-4
0 50 100 150 200 250 300
predicho consumo