Vous êtes sur la page 1sur 22

M ETODOS M ULTIVARIADOS C OORDENADAS P RINCIPALES

Rodrigo Jimenez Morales

Martes, 5 de Junio de 2012

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

1 / 15

Origen de la Tecnica: Escalamiento Multidimencional


Psicologa Experimental : Similaridad entre estmulos aplicados a distintos individuos, anos 50.

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

2 / 15

Origen de la Tecnica: Escalamiento Multidimencional


Psicologa Experimental : Similaridad entre estmulos aplicados a distintos individuos, anos 50. Adolf Quetelet (1796-1874): Astronomo y Estadstico belga, impulsor de la aplicacion de la estadstica a las ciencias sociales.

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

2 / 15

Origen de la Tecnica: Escalamiento Multidimencional


Psicologa Experimental : Similaridad entre estmulos aplicados a distintos individuos, anos 50. Adolf Quetelet (1796-1874): Astronomo y Estadstico belga, impulsor de la aplicacion de la estadstica a las ciencias sociales. ((teora de las regularidades de los fenomenos sociales)) se puede observar regularidades, que pueden medirse mediante tecnicas estadsticas de analisis. ((Fsica social)) transicion estadstica descriptiva al empleo de los datos cuantitativos empricos, para establecer las regularidades de la vida social.(Kovaliova, 1989:130).

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

2 / 15

Escalamiento Multidimencional...

Los Metodos existentes se dividen en: Metricos: Matriz de Distancia. No Metricos: Matriz de Similaridad.

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

3 / 15

Resultados Previos
1 Dada la Matriz X, Obtenemos X = P X, P = (I n 11 ) y podemos contruir: Matriz de Covariaza S = 1 X X n

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

4 / 15

Resultados Previos
1 Dada la Matriz X, Obtenemos X = P X, P = (I n 11 ) y podemos contruir: Matriz de Covariaza S = 1 X X n

Matriz de productos cruzados Q = X X , con elementos qij = xi xj , xi la de la matriz X, Q matriz de similitud

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

4 / 15

Resultados Previos
1 Dada la Matriz X, Obtenemos X = P X, P = (I n 11 ) y podemos contruir: Matriz de Covariaza S = 1 X X n

Matriz de productos cruzados Q = X X , con elementos qij = xi xj , xi la de la matriz X, Q matriz de similitud La distancia entre observaciones la obtenemos de Q, mediante:
p

d2 ij

=
s=1 p

(xis xjs )2
p p

=
s=1

x2 is

+
s=1

x2 js

2
s=1

xis xjs (1)

d2 ij

= qii + qjj 2qij

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

4 / 15

Coordenadas Principales

Hasta aqui: XQD

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

5 / 15

Coordenadas Principales

Hasta aqui: XQD El problema a abordar es el inverso DQX

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

5 / 15

Coordenadas Principales... Obtencion de Q


No hay perdidad de generalidad al suponer que las variables tienen media cero.
p p

d2 ij

=
s=1

(xis xjs ) =
s=1

{(xis xs ) (xjs xs )}2

Luego, X 1 = 0 Q1 = 0 es decir las las y columnas de Q suman cero,de(1) tenemos.


n n

d2 = ij
i=1 n i=1 n

qii + nqjj = t + nqjj qjj + nqii = t + nqii


j=1 n n

(2) (3)

d2 = ij
j=1

d2 = 2nt ij
Rodrigo Jimenez Morales ()

(4)
Martes, 5 de Junio de 2012 6 / 15

i=1 j=1 C OORDENADAS P RINCIPALES

Coordenadas Principales... Obtencion de Q


d2 ij haciendo d2 i =
1 n

i=1 n 2 , d2 j i=1 dij

1 = n

d2 ij

t 1 2 + n n
1 n

d2 2qij ij d2 =
1 n2 n i=1 n 2 j=1 dij

j=1 n 2 y j=1 dij

d2 = d2 + d2 d2 2qij ij i j

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

7 / 15

Coordenadas Principales... Obtencion de Q


d2 ij haciendo d2 i =
1 n

i=1 n 2 , d2 j i=1 dij

1 = n

d2 ij

t 1 2 + n n
1 n

d2 2qij ij d2 =
1 n2 n i=1 n 2 j=1 dij

j=1 n 2 y j=1 dij

1 d2 = d2 + d2 d2 2qij qij = (d2 d2 d2 + d2 ) ij i j i j 2 ij

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

7 / 15

Coordenadas Principales... Obtencion de Q


d2 ij haciendo d2 i =
1 n

i=1 n 2 , d2 j i=1 dij

1 = n

d2 ij

t 1 2 + n n
1 n

d2 2qij ij d2 =
1 n2 n i=1 n 2 j=1 dij

j=1 n 2 y j=1 dij

1 d2 = d2 + d2 d2 2qij qij = (d2 d2 d2 + d2 ) ij i j i j 2 ij Q = 1 1 1 1 D 11D D11 + 2 11D11 2 n n n 1 1 1 = (I 11)D(I 11) 2 n n 1 = P DP 2


C OORDENADAS P RINCIPALES Martes, 5 de Junio de 2012 7 / 15

Rodrigo Jimenez Morales ()

Coordenadas Principales... Obtencion de X

Suponiendo Q denida positiva de rango p usamos su descomposicion espectral. Q = V V = (V 1/2 )(1/2 V ) Obtenemos Ynp = V 1/2 , de p variables incorrelacionadas que reproducen la metrica inicial.

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

8 / 15

Coordenadas Principales... Observaciones

Si partiendo de X calculamos D, y luego aplicamos el metodo, no obtenemos X, si no sus componentes principales, pues: Las distancias no varian si modicamos las medias de las variables, Las distancias no varian si rotamos los puntos. D = D(Q); Q = X X = XA XA , A matriz ortogonal. Es decir, cualquier rotacion conserva las distancias cualquier rotacion puede ser solucion.

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

9 / 15

En resumen
Teniendo D,
1 2

Calcular Q = 1 P DP , 2 Obtener los r valores propios de Q, escogidos segun que los n r restantes sean aprox. cero, Aproximar Q (Vr r )(r Vr ), Tomar como coordenadas Yr = Vr r
1/2 1/2 1/2

3 4

El grados de Bondad de ajuste lo obtenemos por (segun Mardia) m1,p = 100


p i=1 i n i=1 |i | p 2 i=1 i n 2 i=1 i

m2,p = 100

Mardia, Kent y Bibby


Rodrigo Jimenez Morales () C OORDENADAS P RINCIPALES Martes, 5 de Junio de 2012 10 / 15

Ejemplo

Consideremos las distancias de algunas ciudades europeas: Mad. Par. Brus. Amst. Berl. Roma Lisb. Mad. 0 1260 1556 1735 2360 2066 644 Par. 0 296 475 1100 1437 1792 Brus. 0 198 789 1545 2088 Amst. 0 685 1766 2267 Ber. 0 1529 2892 Roma 0 2730 Lis. 0 Lon. La matriz D se obtiene al elevar al cuadrado cada distancia.

Lon. 1725 465 374 344 996 1902 2257 0

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

11 / 15

Ejemplo...
1 Obtenemos Q = 2 P DP , dividimos cada entrada por el factor 107

0,141 0,0108 0,0433 0,0599 0,141 0,0408 0,206 0,0517

0,0108 0,0433 0,0599 0,141 0,0408 0,0042 0,0005 0,0065 0,0038 0,0034 0,0005 0,0139 0,0249 0,0422 0,0104 0,0065 0,0249 0,0397 0,0628 0,0341 0,0038 0,0422 0,0628 0,132 0,0514 0,0034 0,0104 0,0341 0,0514 0,203 0,0058 0,0541 0,0802 0,194 0,113 0,0134 0,0263 0,0403 0,0431 0,0526

0,206 0,0058 0,0541 0,0802 0,194 0,113 0,313 0,0715

Valores Propios: 0.6761, 0.1738, 0.0504, 0.0132, 0.0043, -0.0007 -0.0080, -0.0098 0,6761 + 0,1738 m1,2 = 100 0,6761 + 0,1738 + 0,0504 + 0,0132 + 0,0043 + 0,0007 + 0,0 = 90,78 %
Rodrigo Jimenez Morales () C OORDENADAS P RINCIPALES Martes, 5 de Junio de 2012 12 / 15

Ejemplo...

1/2 2

V2 =

0,6761 0 0,1738 0 0,4434 0,2687 0,0225 0,0032 0,1303 0,0801 0,2006 0,0143 0,4283 0,2015 0,2827 0,9234 0,6691 0,1004 0,1859 0,1334
1/2

Y2 = V2 2

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

13 / 15

Ejemplo...

Figura: Representacion de las coordenadas de las ciudades

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

14 / 15

Ejemplo...

Figura: Mapa de Europa

Rodrigo Jimenez Morales ()

C OORDENADAS P RINCIPALES

Martes, 5 de Junio de 2012

15 / 15

Vous aimerez peut-être aussi