Académique Documents
Professionnel Documents
Culture Documents
REVISIN DE CONCEPTOS DE
LGEBRA
1 Departamento de Estadstica 3
Temario:
Introduccin
Revisin de conceptos de lgebra
Definicin de Anlisis Multivariado
Anlisis de Componentes Principales
Anlisis Factorial de Correspondencias
Anlisis de Coordenadas Principales
Anlisis de Cluster
2 4
1
29/03/2017
5 7
6 8
2
29/03/2017
INTRODUCCIN
DEFINICIN
En numerosas situaciones reales es necesario utilizar un gran nmero de
caractersticas para describir adecuadamente a los individuos.
Caracterizacin de ciudades de acuerdo a indicadores de calidad de naturaleza multivariada, es decir, en los que cada
ambiental observacin est constituida por los valores de varias
Identificar factores que describen a los organismos vivos.
variables interrelacionadas. (Romero Villafranca, 1995)
Estudio de la variabilidad entre diferentes especies o razas.
Anlisis de datos de encuestas
10 12
3
29/03/2017
Longitud mazorca
16,48 Estadstica descriptiva
16,98 Variable n Media D.E. Mn Mx Mediana Q1 Q3
16,07 LMZ 49 16,58 1,04 13,65 18,60 16,65 16,08 17,35
16,75
16,38
16,25 2
n
xi
16,07
15,28 n SCx
xi (xi x )
n n
xi2 i=1n
16,8 2
15,53
15,63 x = i =1 S 2 ( x) = i =1 = i =1
VARIABLES CUANTITATIVAS 16,13
16,65
n n 1 n 1
15,25
13 16,2
16,57
xx
16,98
15,07 Estandarizacin z=
18,38 S (x) 15
.
17,49
20,8
LMZ
16,13
14,76
5,2
0,0 13,40
12,00 13,00 14,00 15,00 16,00 17,00 18,00 19,00 20,00
LMZ
14 16
4
29/03/2017
n
Signo de la Covariancia
TRATAMIENTO DE VARIABLES CUANTITATIVAS ( x x ).( y y)
i =1
i i
S xy =
Estadstica descriptiva n 1
Variable n Media D.E. Mn Mx Mediana Q1 Q3
ALTPL 49 226,60 17,86 189,5 271,63 225,25 212,75 240,88
(x x )>0
18,85
y
17,49
(y y )>0
y
LMZ
16,13
(y y )< 0
14,76
x x
13,40
17
(x x )< 0 19
(x x ) (y )
TRATAMIENTO DE VARIABLES CUANTITATIVAS n
i i y
37,91
S xy = Cov( x, y ) = i =1
n 1
n n
35,09
n x y i i
y xi yi i =1
n
i =1
SPxy
GRHIL
= i =1
=
32,26
n 1 n 1
29,44
x
Cov( x, y ) SPxy
r= = 1 r 1
(x x ) (y )
n
i i y S ( x) S ( y ) SCx SCy
18 20
S xy = Cov( x, y ) = i =1
n 1
5
29/03/2017
Para valores de X por encima de la media Para los valores de X mayores que la media le
tenemos valores de Y por encima y por corresponden valores de Y mayores tambin.
debajo en cantidades similares. No existe
relacin lineal Para los valores de X menores que la media le
corresponden valores de Y menores tambin.
Datos cuantitativos: Los datos multivariados se presentan en matrices nxp de individuos por
variables:
(x x jk )
p
d ij =
2
Distancia Eucldea: ik variables
k =1
6
29/03/2017
T = tr ( S ) = si2
xn1 x1 xn2 x2 L xnp x p i =1
Varianza generalizada:
x11 x1 x12 x 2 x1 p x p
K
Matriz S ( x1 ) S ( x2 ) S (xp ) Es una medida del rea (para p = 2), volumen (para p = 3) o
x x1 x22 x 2 x2 p x p hipervolumen (para p > 3) ocupado por el conjunto de datos.
estandarizada 21 K
X st = S ( x1 ) S ( x2 ) S (xp )
M M VG = S
xn1 x1 xn 2 x 2 xnp x p
L
S ( x1 ) S ( x2 ) S ( x p ) 25 27
Matriz de varianzas-covarianzas
s12 s12 K s1 p
s s 2 K s2 p 1 '
S = 21 2 = X X
M M n c c
2
s p1 s p 2 L s p
Matriz de correlacin
1 r12 K r1 p
r 1 K r2 p 1 '
R= = X X
21
M M n st st
rp1 rp2 L 1 26 28
7
29/03/2017
VARIABLES:
29 31
8
29/03/2017
33 35
34 36
9
29/03/2017
xi
Hi
u
O
r r r
u = 1 u ` u =1
ANLISIS DE COMPONENTES
PRINCIPALES Criterio de Ajuste: Minimizar la SC de los desvos:
37
n 2
xi H i
39
i =1
Fijo
38 Minimizar MAXIMIZAR 40
X1 38
10
29/03/2017
11
29/03/2017
45 47
V2
-1 1
C1
V1
La proporcin de variabilidad explicada por un componente es el
V3
cociente entre su varianza (autovalor) y la suma de los valores propios
de la matriz.
-1
46 48
12
29/03/2017
49 51
Interpretaciones: Datos:
Los individuos se representan como puntos en el plano.
13
29/03/2017
53 55
Porcentaje de
variabilidad
explicada por
los dos primeros
ejes
Direcciones
54 56
14
29/03/2017
T-Mort 0,626 1
Mort-Inf 0,944 0,788 1
5,00 Esp-H -0,907 -0,828 -0,968 1
Esp-M -0,930 -0,812 -0,979 0,993 1
PNB -0,636 -0,352 -0,605 0,651 0,652 1
5,00
2,50 PNB
Suiza
Finlandia
Malawi Noruega
T-Mort
Gambia Japn
Reino Unido Singapur
Somalia 2,50
CP 2 (11,3%)
CP 2 (11,3%)
Swaziland Mort-Inf
Mongolia Argentina
Chile 0,00
Jordania Tailandia Venezuela T-Nat Esp-H
Esp-M
-2,50
-2,50
-5,00
-5,00 -2,50 0,00 2,50 5,00 -5,00
CP 1 (82,6%)
57 -5,00 -2,50 0,00 2,50 5,00 59
CP 1 (82,6%)
Variables: Biplot::
Biplot
5,00
5,00 PNB
PNB
T-Mort
T-Mort
2,50
2,50 Suiza
Finlandia
Malawi Noruega
Gambia Japn
Reino Unido Singapur
Somalia
CP 2 (11,3%)
Mort-Inf
CP 2 (11,3%)
Bolivia Mort-Inf Holanda
Hungra
Austria
0,00 Mozambique Sudan Arabia Saudita Portugal Espaa
T-Nat Esp-H 0,00 Sudfrica Rumania Hong Kong
T-Nat Brasil
Esp-M Swaziland Ucrania Esp-M
Argentina Esp-H
Mongolia
Chile
Jordania Tailandia Venezuela
-2,50
-2,50
-5,00
-5,00 -2,50 0,00 2,50 5,00
CP 1 (82,6%) -5,00
-5,00 -2,50 0,00 2,50 5,00
CP 1 (82,6%)
58 60
15
29/03/2017
Gradientes: Biplot::
Biplot
Autovectores
Variables e1 e2 5,00
CP 2 (11,3%)
Bolivia Mort-Inf Holanda
Hungra
Austria
Mozambique Sudan Arabia Saudita Portugal Espaa
0,00 Sudfrica
T-Nat Rumania Hong Kong
Brasil Esp-M
Swaziland Ucrania
Se observa el primer autovector y se selecciona la carga ms alta (positiva Mongolia Argentina Esp-H
Chile
Jordania Tailandia Venezuela
o negativa). Todas las cargas cuyo valor absoluto es mayor a 2/3 de la
-2,50
mayor carga se consideran contributivas a la formacin del primer eje.
Lo mismo con el segundo, etc. 2
0,4462 = 0,2975
3
-5,00
2
0,8087 = 0,5391
-5,00 -2,50 0,00 2,50 5,00
CP 1 (82,6%)
3 61 63
Gradientes:
Autovectores
Variables e1 e2
2
T-Nat -0,4202 -0,1116 0,4462 = 0,2975
T-Mort -0,3666 0,5638 3
Mort-Inf -0,4403 0,0869 2
0,8087 = 0,5391
Esp-H 0,4443 -0,0712 3
Esp-M 0,4462 -0,0545
PNB 0,3141 0,8087
16