Académique Documents
Professionnel Documents
Culture Documents
ANLISIS MULTIVARIADO
PLAN DE ESTUDIOS:
1. Introduccin.
2. Anlisis exploratorio multivariado.
3. La distribucin normal multivariada.
4. Anlisis de componentes principales.
5. Anlisis de cmulos.
6. Escalamiento multidimensional.
7. Anlisis de factores.
8. Anlisis discriminante.
9. Solucin de problemas prcticos.
REFERENCIA BSICA:
Johnson, D. E. (2000). Mtodos multivariados aplicados. ITP International
Thomson Editores: Mxico.
2
Mdulo 6: Anlisis Multivariado
REFERENCIAS ADICIONALES:
3
Mdulo 6: Anlisis Multivariado
1. Introduccin
Los datos multivariados surgen en distintas reas o ramas de la ciencia.
Ejemplos:
1) Investigacin de mercados: Identificar caractersticas de los individuos
para determinar qu tipo de personas compran determinado producto.
2) Agricultura: Resistencia de determinado tipo de cosechas a daos por
plagas y sequas.
3) Psicologa: Relacin entre el comportamiento de adolescentes y
actitudes de los padres.
En qu situaciones surgen los datos multivariados?
Cuando a un mismo individuo se le mide ms de una caracterstica de
inters.
Un individuo puede ser un objeto o concepto que se puede medir. Ms
generalmente, los individuos son llamados unidades experimentales.
Ejemplos de objetos: personas, animales, terrenos, compaas, pases, etc.
Ejemplos de conceptos: amor, amistad, noviazgo, etc.
4
Mdulo 6: Anlisis Multivariado
Tipos de variables
Numricas
Continuas
Categricas
Discretas
Ordenadas
No ordenadas
5
Mdulo 6: Anlisis Multivariado
6
Mdulo 6: Anlisis Multivariado
7
Mdulo 6: Anlisis Multivariado
Variables.
NOMBRE: Nombre
POB: Poblacin total
SUPERF: Superficie
DENSP: Densidad
ANALF: Porcentaje de poblacin mayor de 15 aos analfabeta
S/PRI: Porcentaje de poblacin mayor de 15 aos sin primaria completa
S/EXC: Porcentaje de ocupantes en viviendas sin drenaje ni excusado
S/ELE: Porcentaje de ocupantes en viviendas sin energa elctrica
S/AGU: Porcentaje de ocupantes en viviendas sin agua entubada
HACIN: Porcentaje de viviendas con hacinamiento
PISOT: Porcentaje de ocupantes en viviendas con piso de tierra
L5000: Porcentaje de poblacin en localidades con menos de 5,000
habitantes
INGRE: Porcentaje de poblacin ocupada con ingreso menor de 2 salarios
mnimos
INDICE: Indice de marginacin
GRADO: Grado de marginacin
8
Mdulo 6: Anlisis Multivariado
9
Mdulo 6: Anlisis Multivariado
Matriz de datos:
x11
x 21
x
x
n1
x12
x 22
x n2
x1p
x 2p
x np
Vectores de datos:
x i1
x i2
xi
x
ip
10
Mdulo 6: Anlisis Multivariado
X1
X2
X
X
p
Media:
E (X1 ) 1
E
(
X
)
2 2
E (X)
E (X )
p p
Varianzas-Covarianzas:
Var(X) Cov(X, X) E X X
'
X 2 2
E
X
,
X
,...,
X
1
1
2
2
p
p
X p p
1
1
X 2 X1 1
E 2
X X
p
1
1
p
X1 1 X 2 2
X 2 2 2
X p p X 2 2
X1 1 X p p
X 2 2 X p p
X p p 2
11
Mdulo 6: Anlisis Multivariado
21 22
p1 p 2
donde,
1p
2p
pp
Correlaciones:
1 12
21 1
Corr (X)
p1 p 2
donde, kj Corr (X k , X j )
kj
kk jj
1p
2p
, para kj=1,2,...,p
Cometarios:
12
Mdulo 6: Anlisis Multivariado
13
Mdulo 6: Anlisis Multivariado
i=1,...,n,
X i1
X
i2
.
Xi
X
ip
X 21
X
X
n1
X12
X 22
Xn2
X1p
X 2p
.
X np
14
Mdulo 6: Anlisis Multivariado
MEDIA MUESTRAL:
1 n
Xi ,
n i1
2 1 X12
X n 2
.
X
X
p
np
1p
Esto implica que, para j=1,...,p
j
1 n
X ij .
n i1
Propiedades: E .
Splus: mean
VARIANZA MUESTRAL:
n
1 X i X i ' ,
n 1 i1
21 22
p1 p 2
donde,
1p
2 p
pp
1 n
X ij j 2 , para j=1,2,...,p, y
jj
n 1 i1
kj
1 n
X ik k X ij j , para kj=1,2,...,p.
n 1 i1
15
Mdulo 6: Anlisis Multivariado
Propiedades: E .
R: var
CORRELACIN MUESTRAL:
r21
R
r
p1
donde, rkj
kj
kk jj
r12
1
rp 2
r1p
r2 p
, para kj=1,2,...,p.
Propiedades:
1) -1 rkj 1
2) ER .
R: cor
CUARTILES MUESTRALES: Estas estadsticas de orden se obtienen como en
16
Mdulo 6: Anlisis Multivariado
17
Mdulo 6: Anlisis Multivariado
ancho vertical del ojo, la segunda con el ancho horizontal, la tercera con el
tamao del iris, y las otras se podran asociar con el espaciamiento de los
ojos, la altura de los ojos, la longitud de la nariz, en ancho de la nariz, la
longitud de las cejas, el ancho de las cejas. La inclinacin de las cejas, el
ancho de las orejas, la longitud de las orejas, la abertura de la boca, la
sonrisa, etc.
R: faces, faces2
DIAGRAMA DE ESTRELLAS (multidimensional)
Este tipo de diagrama se aplica cuando todas las variables toman valores
positivos y consisten en graficar rayos o ejes que parten de un punto
central. La longitud del rayo corresponde al valor de la variable y se tiene
un rayo para cada variable. Por ejemplo, vectores de datos con 5 variables
requerirn 5 rayos separados entre s por un ngulo de 72 grados.
La primera variable generalmente corresponde con el rayo que apunta
hacia el norte y las otras variables se representan sobre los otros rayos en el
orden del sentido del movimiento de las manecillas del reloj.
R: stars
DIAGRAMA DE ANDREWS (multidimensional)
f i (t )
x i1
x i 2 sen ( t ) x i 3 cos( t ) x i 4sen (2 t ) x i 5 cos(2 t )
2
18
Mdulo 6: Anlisis Multivariado
19
Mdulo 6: Anlisis Multivariado
normal multivariada.
Existen varias
DEFINICIONES
multivariada:
Definicin
(Simple):
Se
dice
que
un
vector
aleatorio
j1
X
p
tiene una distribucin normal univariada para todos los posibles valores del
vector a.
20
Mdulo 6: Anlisis Multivariado
f X x; ,
1
( 2 ) p / 2
1/ 2
1
'
exp x 1 x , para x p
Notacin: X Np(, )
12
.
1 y 11
2
21
22
Recuerda que 12
12
11 22
PUNTUAL:
22
Mdulo 6: Anlisis Multivariado
X11
1
X n1
2 1 X12
X n 2
1 n
X i
,
n
n i1
X
X
p
np
1p
11 12
1 n
21 22
'
X
X
i
i
n 1 i1
p1 p 2
1
r21
R
r
p1
r12
1
rp 2
1p
2 p
,
pp
r1p
r2 p
,
23
Mdulo 6: Anlisis Multivariado
donde,
jj
1 n
X ij j 2 , para j=1,2,...,p,
n 1 i1
1 n
kj
X ik k X ij j , para kj=1,2,...,p, y
n 1 i1
rkj
kj
kk jj
, para kj=1,2,...,p.
n 1
El estimador no es el EMV , sino
.
n
Propiedades: E , E y ER .
H 0 : jk 0 vs. H1 : jk 0
La estadstica de prueba es:
T
rjk n 2
1
rjk2
24
Mdulo 6: Anlisis Multivariado
t : t t
/2
( n 2 )
INTERVALOS
DE CONFIANZA:
25
Mdulo 6: Anlisis Multivariado
26
Mdulo 6: Anlisis Multivariado
11 12
21 22
p1 p 2
1p
2p
.
pp
27
Mdulo 6: Anlisis Multivariado
12
entonces 11 22 12 21 .
Si 11
21
22
Ejemplo numrico:
6 2
.
Sea
2
3
(4.1)
Propiedades:
p
tr j ,
j1
j .
j1
Ejemplo numrico:
6 2
.
Sea
2
3
0 .
2
3
w 11 2w 21 .
2 w 11 3w 21 7 w 21
2 3 w 21 w 21
Existen muchos vectores que satisfacen la condicin w 11 2w 21 , pero el
5 ,1 5 .
w '2 1 5 , 2
5 .
29
Mdulo 6: Anlisis Multivariado
negativos.
NOTA: Las matrices de varianzas-covarianzas y de correlaciones tanto
componentes
principales
es
determinar
nuevas
variables
no
30
Mdulo 6: Anlisis Multivariado
con
matriz
de
varianzas-covarianzas
con
eigenvalores
Y1 a 1' X a 11X1 a 12 X 2 a 1p X p
Y2 a '2 X a 21X1 a 22 X 2 a 2 p X p
Yp a 'p X a p1X1 a p 2 X 2 a pp X p
Las componentes principales son aquellas combinaciones lineales
Y1,Y2,...,Yp no correlacionadas, cuyas varianzas son tan grandes como sea
posible.
31
Mdulo 6: Anlisis Multivariado
COMPONENTES:
32
Mdulo 6: Anlisis Multivariado
INTERPRETACIN de k :
total de las variables originales. Por otro lado, VarYk Var a 'k X k ,
k=1,...,p. Por lo tanto, la variabilidad total de las variables componentes
principales tr 1 2 p es igual a la variabilidad total de las
variables originales.
Proporcin de la variabilidad
k
,
1
2
p
k=1,2,...,p
Corr Yk , X j
k
a kj
jj
para j,k=1,,p
CUNTOS componentes principales son suficientes?
33
Mdulo 6: Anlisis Multivariado
O MARCADORES
34
Mdulo 6: Anlisis Multivariado
Z1
X1 1 ,
11
Z2
X 2 2 , ... ,
22
Zp
X p p
pp
En notacin matricial, Z 1/ 2 X .
variables
estandarizadas
Z ' Z1 , Z 2 ,..., Z p
se
del conjunto de
obtienen
de
los
Corr Yk* , Z j *k
1/ 2 *
a kj ,
para j,k=1,...,p.
NOTA: Los componentes principales obtenidos a partir de la matriz son,
35
Mdulo 6: Anlisis Multivariado