Académique Documents
Professionnel Documents
Culture Documents
Principales en R Commander
Google+1
Telegram
0.2 Ejemplo:
2.6.1 Referencias
2.6.2 Relacionado
Tipos de datos
individuos.
Distribucin normal multivariante
Ejemplo:
Para nuestro ejemplo de Anlisis de Componentes Principales
tomamos 8 variables numricas a 14 recin nacidos con poco peso
(descargar datos):
V1 = edad de la madre (aos)
V2 = nmero de cigarrillos fumados por la madre al da
V3 = altura de la madre (pulgadas)
V4 = peso de la madre (libras)
V5 = edad del padre (aos)
V6 = nivel de estudios del padre
V7 = nmero de cigarrillos fumados por el padre al da
V8 = altura del padre (pulgadas)
Se puede reducir el nmero de variables agrupando la mayor
variacin posible?
Como los datos del ejemplo tienen diferentes escalas y medidas (aos, alturas,
pesos, etc), tenemos que Estandarizar seleccionando Analizar la matriz de
correlaciones.
>
+
+
+
+
+
+
+
+
local({
.PC <- princomp(~V1+V2+V3+V4+V5+V6+V7+V8, cor=TRUE, data=Datos)
cat("nComponent loadings:n")
print(unclass(loadings(.PC)))
cat("nComponent variances:n")
print(.PC$sd^2)
cat("n")
print(summary(.PC))
})
Component loadings:
Comp.1
Comp.2
Comp.3
Comp.4
Comp.5
Comp.6
Comp.7
Comp.8
V1 0.45927632 -0.3300700 0.42221491 -0.06912846 0.014058950 0.09484631
-0.08936572 0.692744662
V2 -0.42975751 -0.2662236 0.08772638 -0.32688585 0.445127021 -0.45333765
0.43955233 0.181724713
V3 -0.06900791 -0.6387247 -0.16726543 0.11575498 -0.186804457 0.52531263
0.45973313 -0.153908871
V4 0.03880912 -0.5597814 -0.41999034 0.27503283 0.007091408 -0.44997788
-0.48008663 -0.009493601
V5 0.48981256 -0.1997337 0.44528178 -0.07725784 0.091430449 -0.27164575
0.10749267 -0.649799865
V6 0.38390014 0.1163544 -0.37150886 0.14717175 0.782395703 0.24418386
0.08728867 0.003984449
V7 -0.43872101 -0.1867023 0.42200008 0.02548362 0.378383648 0.38241113
-0.52162403 -0.180079334
V8 -0.13540205 0.1027849 0.30869124 0.87809277 0.055148344 -0.16553023
0.25632827 0.092836342
mayores que 1.
Los autovalores de cada componente principal se pueden visualizar grficamente. El
nombre que recibe este grfico se denomina grfico de desmoronamiento o de
sedimentacin (scree diagram). En R Commander:
elevados de sus coeficientes son los presentes en V1, V2, V5 y V7. Esto
significa que esas variables son las que agrupan esa variacin en mayor
medida. En nuestro ejemplo, esas variables se corresponden con la Edad de
los padres y Nmeros de cigarrillos fumados diariamente por ellos. Por lo
tanto, parece que tienen relacin con que los nios nazcan con poco peso.
El componente 2 agrupa un 23.3% de la variacin, y los valores absolutos
>
+
+
+
+
+
+
+
+
local({
.PC <- princomp(~V1+V2+V3+V4+V5+V6+V7+V8, cor=TRUE, data=Datos)
cat("nComponent loadings:n")
print(unclass(loadings(.PC)))
cat("nComponent variances:n")
print(.PC$sd^2)
cat("n")
print(summary(.PC))
})
coeficientes ms altos obtenidos en el punto 2.4 para ese componente. Por otro lado,
el Componente Principal 2 presenta dos variables (V3 y V4) con mayor longitud, que
se corresponden nuevamente con las dos variables escogidas en el punto 2.4.
Si queris obtener grficos ms elaborados, hacer click en la siguiente imagen, que os
llevar a una entrada fabulosa donde se explica otro modo de generar estos grficos.
Por lo tanto, nos quedaramos exclusivamente con las variables V1, V3, V5 y V8.
Viva el Software Libre!
Referencias