Vous êtes sur la page 1sur 21

ANÁLISIS

MULTIVARIADO

Análisis de Factores
Ing. Estadística Informática

Morales Fabricio
El Análisis Factorial: Parte de un conjunto amplio de variables
que presentan interrelaciones importantes. De las cuales se
asume que las relaciones existen porque las variables son
manifestaciones comunes de factores no "observables" de
forma directa...y se pretende llegar a un cálculo de esos
factores:
a) Resumiendo información
b) Clarificando las relaciones entre ellas sin pérdida excesiva de
información.
Las variables dependen de factores inobservables.
El objetivo es analizar si hay factores (menos que variables) que
expliquen dichas variables.
Análisis factorial y componentes principales

El análisis factorial y el análisis de componentes


principales están muy relacionados entre sí, pero
existen varias diferencias:

 Mientras que el análisis de componentes principales


busca hallar combinaciones lineales de las variables
originales que expliquen la mayor parte de la varianza total,
el análisis factorial pretende hallar un nuevo conjunto de
variables no observables, menor en número que las
variables originales, que exprese la mayor parte de la
varianza común.

3
ANÁLISIS FACTORIAL
Modelo Factorial
 X1 
  µ = EX
Sea X =    con
X  ∑ = VX
 p
 F1 
 
Factores comunes: F =  
F 
 m  ε1 
 
Factores específicos o errores: ε =  
ε 
 m
 l11 l12  l1m 
 
 l21 l22  l2 m  Nota:
Matriz de cargas: L =  l =carga de X
ij i
   
  sobre F j

l l p2  l pm 
 p1  pxmm≤ p

4
ANÁLISIS FACTORIAL
Matricialmente, el modelo factorial es: X − µ = LF + ε
Escribiéndolo de forma desarrollada, quedaría

X 1 − µ1 = l11 F1 + l12 F2 +  + l1m Fm + ε 1


X 2 − µ 2 = l21 F1 + l22 F2 +  + l2 m Fm + ε 2
     
X p − µ p = l p1 F1 + l p 2 F2 +  + l pm Fm + ε p

5
ANÁLISIS FACTORIAL
Supuestos

(i ) E ( F ) = 0 y V ( F ) = E ( FF ' ) = I
ψ 1 0 
 
(ii ) E (ε ) = 0 y V (ε ) = E (εε ' ) =   =Ψ
0 ψ 
 m
(iii ) ε y F son incorrelados :
Eε ' F = EFε ' = 0 = cov(ε , F )

Si se cumplen estas tres condiciones se dice que


el modelo es factorial ortogonal.

6
ANÁLISIS FACTORIAL
Observaciones:

Comunalidad (hi2)

∑ = LL '+ Ψ Especificidad

σ ii = l + l +  + l +ψ i = h +ψ i
2
i1
2
i2
2
im i
2

La variabilidad de la variable i se descompone en parte común (se


puede medir) y la específica (no se puede medir).

cov( X , F ) = L

No siempre existe un modelo factorial ortogonal.

Si existe modelo factorial no siempre es único


(si tiene más de un factor, no es único). 7
ANÁLISIS FACTORIAL
Construcción del modelo factorial:
método de componentes principales

 X1 
  µ = EX
Sea X =   y ; X − µ = LF + ε .
X  ∑ = VX
 p
Si Σ tiene los siguientes autovalores y autovectores,
(λ 1, e1 ), , (λ p , e p ) con λ 1≥  ≥ λ p ≥ 0
la descomposición exacta de Σ es

∑ = λ 1e1e1 '+ λ 2 e2 e2 '+  + λ p e p e p ' =


 λ 1 e1 
 
= ( λ 1 e1  )
λ p e p    = LL'.
 
 λ p ep 
8
ANÁLISIS FACTORIAL
Por Teorema Espectral

La descomposición de Σ es:

 λ 1 e1  ψ 1 0 
   
∑ pxp ≈ ( λ 1 e1  )
λ m em pxm    +   
  0 
 λ e
m m  ψ p
mxp
donde ψ i = σ ii − hi2

Entonces ∑ − LL' ≈ Ψ

9
ANÁLISIS FACTORIAL
Ejercicio 10.6 Realizar un análisis factorial sobre el conjunto de
datos de EE.UU... del numero de delitos en 50 estados
descritos en la Tabla A.18 y hacer una estimación de análisis
factorial con tres factores .

Estas mediciones en 50 estados se las realizo en el año de


1985 clasificándolas de acuerdo a 7 categorías
Categorías
X1= Asesinato
X2= Violación
X3= Robo sin violencia
X4= Robo agravado
X5= Robo de viviendas
X6= Hurto
X7= Robo de Autos
Robo Robo de Robo de
Estados Asesinato Violación Robo Agravado viviendas Hurto Autos
ME 1,5 7 12,6 62 562 1055 146
NH 2 6 12,1 36 566 929 172
VT 1,3 10,3 7,6 55 731 969 124
MA 3,5 12 99,5 88 1134 1531 878
RI 3,2 3,6 78,3 120 1019 2186 859
CT 3,5 9,1 70,4 87 1084 1751 484
NY 7,9 15,5 443,3 209 1414 2025 682
NJ 5,7 12,9 169,4 90 1041 1689 557
PA 5,3 11,3 106 90 594 11 340
OH 6,6 16 145,9 116 854 1944 493
IN 4,8 17,9 107,5 95 860 1791 429
IL 9,6 20,4 251,1 187 765 2028 518
MI 9,4 27,1 346,6 193 1571 2897 464
WI 2 6,7 33,1 44 539 1860 218
Estimador de la Matriz de Varianza y Covarianza

14,81 14,7 104,16 213,15 140,05 209,27 84,36


14,7 54 321,91 348,61 1257 3193,74 646,41
104,16 321,91 8297,9 3373,6 15670,5 27496,7 10544,8
S= 213,15 348,61 3373,6 4647,1 8501,5 16178,7 4495,6
140,05 1257 15670,5 8501,5 133644 174445 38905
209,27 3193,74 27496,7 16178,7 174445 558883 78886
84,36 646,41 10544,8 4495,6 38905 78886 39844

l1= 0.000

l2= 0,0002

l3= 0,0252
Valores Propios
l4= 0,0627

l5= 0,2605

l6= 0,7414

l7= 6,3638
Matriz de Correlación

1,00 0,52 0,30 0,81 0,10 0,07 0,11


0,52 1,00 0,48 0,70 0,47 0,58 0,44
0,30 0,48 1,00 0,54 0,47 0,40 0,58
R= 0,81 0,70 0,54 1,00 0,34 0,32 0,33
0,10 0,47 0,47 0,34 1,00 0,64 0,53
0,07 0,58 0,40 0,32 0,64 1,00 0,53
0,11 0,44 0,58 0,33 0,53 0,53 1,00

l1= 0.1244

l2= 0,2507

l3= 0,3619
Valores Propios
l4= 0,4206

l5= 0,6716 λ3
l6= 1,4807 λ2
l7= 3,6902 λ1
-0,5747 -0,3034 -0,2994 -0,0668 0,04 -0,6303 0,2908
-0,1439 0,6859 0,2465 0,3489 0,3457 -0,13 0,4359
-0,1775 -0,0489 0,587 -0,2135 -0,647 0,0684 0,3908
Vectores Propios 0,7829 -0,1135 -0,0428 -0,0931 -0,0109 -0,4389 0,4135
-0,0592 0,2074 -0,3234 -0,7318 0,209 0,3677 0,3667
-0,0267 -0,6156 0,2598 0,2216 0,4781 0,3739 0,3678
0,0194 0,0157 -0,5754 0,4847 -0,4335 0,3369 0,3633

Por Teorema de descomposición Espectral

 λ 1 e1  ψ 1 0 
   
∑ pxp ≈ ( λ 1 e1  )
λ m em pxm    +   
   
 λ m em  mxp  0 ψp
0,04
0,2908 -0,6303
0,3457
0,4359 -0,13
0,3908 -0,647
0,0684
=1.9209 0,4135 2 2 =1.2168 -0,4389 3 3 =0.8195 -0,0109
0,3667 0,209
0,3677
0,3678
0,3739 0,4781
0,3633
0,3369 -0,4335
Al trabajar con tres factores nuestra matriz
de carga nos queda de la siguiente
manera.

Matriz de Carga

0,5587 -0,767 0,0328

0,8373 -0,1582 0,2833

=
0,7507 0,0832 -0,5302

0,7943 -0,5341 -0,009

0,7044 0,4474 0,1713

0,7066 0,455 0,3918

0,6979 0,4099 -0,3552


Estimador de la Matriz de Correlación

0,9015 0,5984 0,3382 0,8531 0,056 0,0586 0,0638


0,5984 0,8063 0,4652 0,747 0,5675 0,6307 0,4188
0,3382 0,4652 0,8516 0,5566 0,4752 0,3606 0,7464
λλ`= 0,8531 0,747 0,5566 0,9162 0,319 0,3148 0,3386
0,056 0,5675 0,4752 0,319 0,7257 0,7684 0,6142
0,0586 0,6307 0,3606 0,3148 0,7684 0,8598 0,5404
0,0638 0,4188 0,7464 0,3386 0,6142 0,5404 0,7813

Matriz de Correlación

1,00 0,52 0,30 0,81 0,10 0,07 0,11


0,52 1,00 0,48 0,70 0,47 0,58 0,44
0,30 0,48 1,00 0,54 0,47 0,40 0,58
R= 0,81 0,70 0,54 1,00 0,34 0,32 0,33
0,10 0,47 0,47 0,34 1,00 0,64 0,53
0,07 0,58 0,40 0,32 0,64 1,00 0,53
0,11 0,44 0,58 0,33 0,53 0,53 1,00
Ahora encontraremos Ψ

Ψ = R - λλ`
0,0985 0 0 0 0 0 0
0 0,1937 0 0 0 0 0
0 0 0,1484 0 0 0 0

Ψ= 0
0
0
0
0
0
0,0838
0
0
0,2743
0
0
0
0
0 0 0 0 0 0,1402 0
0 0 0 0 0 0 0,2187
Modelo
X- µ = λF + ε

X1 6,858 0,5587 -0,767 0,0328 ε1

X2 15,616 0,8373 -0,1582 0,2833


ε2
97,55 0,7507 0,0832 -0,5302
F1 ε3
X3

X4 - 135,42
= 0,7943 -0,5341 -0,009
F2
F3
+ ε4
X5 891,4 0,7044 0,4474 0,1713 ε5
X6 1922,58 0,7066 0,455 0,3918 ε6
X7 367,86 0,6979 0,4099 -0,3552
ε7
Del Modelo obtenido….

El Factor “F1” seria un factor general que


comprendería todas las variables.

El segundo factor “F2” La variable x1 “Asesinato”


y “Robo agravado” tienen gran influencia

El tercer factor “F3” La variable x3 “robo” tiene


mayor influencia y en menor significancia X6
“hurto”

GRACIAS
El fin….

Vous aimerez peut-être aussi