Vous êtes sur la page 1sur 44

El Fundamento

Anlisis de
Componentes Principales
Omar A. Barriga
Guillermo Henrquez
Departamento de Sociologa
Universidad de Concepcin

Operacionalmente, esto implicaba examinar


3 indicadores especficos:
Esperanza de vida como una operacionalizacin
de una vida sana;
Alfabetizacin adulta como una
operacionalizacin de conocimientos
necesarios;
PIB per cpita como una operacionalizacin de
ingresos suficientes.

Los Datos
CORR
1
2
3
4
5
6
7
8
9
10

PAS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE

EV
71
54
65
65
72
66
67
63
71
70

AL
96
75
78
88
98
83
88
85
95
87

En 1990, las Naciones Unidas public el


primer Informe de Desarrollo Humano.
En l se planteaba que el desarrollo
humano, como constructo terico, se deba
entender como la ampliacin de las
capacidades de las personas.
Conceptualmente, esto implicaba examinar
3 variables: vida sana, conocimientos
necesarios e ingresos suficientes.

El Problema
Quisiera ver si los tres indicadores
identificados por el PNUD logran captar la
esencia del desarrollo humano en el caso
de los 10 pases principales de Amrica del
Sur.
Extraje los valores para esos 3 indicadores
para los 10 pases del mismo informe del
PNUD de 1990.

El Abordaje
PB
4647
1380
4307
3524
4862
2687
2603
3129
5063
4306

El anlisis de esta tabla de datos se puede


pensar de dos formas anlogas:
estudiar las relaciones entre casos; es
decir, examinar las semejanzas y
diferencias entre los casos
estudiar las relaciones entre indicadores;
es decir, examinar las semejanzas y
diferencias entre los indicadores

El Beneficio

El Objetivo
Si logro identificar ciertas semejanzas y
diferencias entre diferentes casos, puedo
lograr agrupaciones de casos y posiblemente
lograr captar la esencia de tipos latentes.
Si logro identificar ciertas semejanzas y
diferencias entre indicadores, puedo lograr
agrupaciones de indicadores y posiblemente
lograr captar la esencia de variables latentes.

Tabla de n p

k1

k2

k3

c1

x11

x12

x13

c2
c3

x21
x31

x22
x32

x23
x33

c4

x41

x42

x43

c5

x51

x52

x53

c6
c7

x61
x71

x62
x72

x63
x73

c8

x81

x82

x83

c9

x91

x92

x93

c10

x101

x102

x103

Si logro establecer tipologas de casos e


identificar variables latentes, lo que estoy
haciendo es reducir complejidad.
El PNUD hace eso al establecer:
el IDH como variable construida en funcin de
los 3 indicadores sealados, y
clases de pases de alto, medio y bajo DH

Al fin y al cabo, el inters del cientfico


social pasa por ah y no por los indicadores
en s.

La informacin en la matriz se puede


entender como un conjunto de vectores,
cada uno representando a un caso.
Cada vector (xi1, xi2, xi3) se puede entender
como la coordenada de ese i-simo caso en
un espacio de tres dimensiones
3 [p en el caso de p indicadores]

Donde cada dimensin refleja un indicador.

Semejanzas entre casos

Las Semejanzas
La tabla de datos original, de n casos por p
indicadores, se puede estudiar de las
siguientes formas:
Por un lado examinar las semejanzas entre
casos, para lo cual se genera una tabla de n n
donde cada celda incorpora una medida de
similitud entre casos.
Por el otro lado, examinar las semejanzas entre
indicadores, para lo cual se genera una tabla de
p p donde cada celda incorpora una medida de
similitud entre indicadores.

c1
c2
c3
c4
c5
c6
c7
c8
c9
c10

c1
s1,1
s2,1
s3,1
s4,1
s5 ,1
s6 ,1
s7 ,1
s8,1
s9 ,1
s10,1

c2
s1, 2
s2 , 2
s3, 2
s4 , 2
s5, 2
s6, 2
s7 , 2
s8, 2
s9, 2
s10 , 2

c3
s1,3
s2 ,3
s3,3
s4 ,3
s5, 3
s6 ,3
s7 ,3
s8,3
s9, 3
s10 ,3

c4
s1, 4
s2 , 4
s3, 4
s4 , 4
s5, 4
s6, 4
s7 , 4
s8, 4
s9, 4
s10 , 4

c5
s1,5
s2 ,5
s3,5
s4 ,5
s5, 5
s6 ,5
s7 ,5
s8,5
s9, 5
s10 ,5

c6
s1, 6
s2, 6
s3, 6
s4, 6
s5, 6
s6, 6
s7 , 6
s8, 6
s9 , 6
s10, 6

c7
s1, 7
s2 , 7
s3, 7
s4 , 7
s5, 7
s6 , 7
s7 , 7
s8, 7
s9, 7
s10 , 7

c8
s1,8
s2,8
s3,8
s4,8
s5,8
s6 ,8
s7 ,8
s8,8
s9 ,8
s10 ,8

c9
s1,9
s2 ,9
s3,9
s4 ,9
s5, 9
s6 ,9
s7 ,9
s8,9
s9, 9
s10 , 9

c10
s1,10
s2 ,10
s3,10
s4 ,10
s5,10
s6 ,10
s7 ,10
s8,10
s9,10
s10 ,10

Semejanzas entre indicadores


Semejanzas entre casos?

k1
s1,1
s2,1
s3,1

k1
k2
k3

k2
s1, 2
s2 , 2
s3, 2

k3
s1, 3
s2 , 3
s3, 3

En el caso de las semejanzas entre casos,


podemos aprovecharnos de la
representacin de los casos en un espacio
cartesiano y definir las semejanzas como
distancias.

Pas
1000

2000

3000

4000

5000

6000

VE
Matriz de distancias entre paises para indicador Esperanza de Vida

UY

Producto interno bruto per-capita (1987)

PY
PE
70

72

74

76

78

80

82

84

86

88

90

92

94

96

98

100

EC
CO

Alfabetizacin (% poblacin adulta, 1985)

CL
BR
BO
50

52

54

56

58

60

62

64

66

68

70

72

74

76

78

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE

1:AR
0
17
6
6
1
5
4
8
0
1

2:BO
17
0
11
11
18
12
13
9
17
16

3:BR
6
11
0
0
7
1
2
2
6
5

4:CO
6
11
0
0
7
1
2
2
6
5

Distancia eucldea
5:CL
6:EC
1
5
18
12
7
1
7
1
0
6
6
0
5
1
9
3
1
5
2
4

7:PY
4
13
2
2
5
1
0
4
4
3

8:PE
8
9
2
2
9
3
4
0
8
7

9:UY
0
17
6
6
1
5
4
8
0
1

10:VE
1
16
5
5
2
4
3
7
1
0

9:UY
416
3683
756
1539
201
2376
2460
1934
0
757

10:VE
341
2926
1
782
556
1619
1703
1177
757
0

Esta es una matriz de disimilaridades

80
AR

Esperanza de vida (1987)

Matriz de distancias entre paises para indicador Alfabetismo

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE

1:AR
0
21
18
8
2
13
8
11
1
9

2:BO
21
0
3
13
23
8
13
10
20
12

3:BR
18
3
0
10
20
5
10
7
17
9

Esta es una matriz de disimilaridades

4:CO
8
13
10
0
10
5
0
3
7
1

Distancia eucldea
5:CL
6:EC
2
13
23
8
20
5
10
5
0
15
15
0
10
5
13
2
3
12
11
4

7:PY
8
13
10
0
10
5
0
3
7
1

8:PE
11
10
7
3
13
2
3
0
10
2

Matriz de distancias entre paises para indicador PIB per cpita

9:UY
1
20
17
7
3
12
7
10
0
8

10:VE
9
12
9
1
11
4
1
2
8
0

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE

1:AR
0
3267
340
1123
215
1960
2044
1518
416
341

2:BO
3267
0
2927
2144
3482
1307
1223
1749
3683
2926

3:BR
340
2927
0
783
555
1620
1704
1178
756
1

4:CO
1123
2144
783
0
1338
837
921
395
1539
782

Distancia eucldea
5:CL
6:EC
215
1960
3482
1307
555
1620
1338
837
0
2175
2175
0
2259
84
1733
442
201
2376
556
1619

7:PY
2044
1223
1704
921
2259
84
0
526
2460
1703

8:PE
1518
1749
1178
395
1733
442
526
0
1934
1177

Esta es una matriz de disimilaridades

Estadsticos descriptivos

Esperanza de
vida (1987)
10
54
72
66.40
5.337
28.489
-1.401
.687
2.607
1.334

N
Mnimo
Mximo
Media
Desv. tp.
Varianza
Asimetra
Curtosis

Alfabetizacin
(% poblacin
adulta, 1985)
10
75
98
87.30
7.543
56.900
-.135
.687
-.760
1.334

PAS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE
CG

Producto interno
bruto per-capita
(1987)
10
1380
5063
3650.80
1191.884
1420588.400
-.636
.687
-.422
1.334

Esta varianza, al igual que la desviacin estndar, supone una muestra,


por ende el denominador es (n-1).

EV
71
54
65
65
72
66
67
63
71
70
66.4

AL
96
75
78
88
98
83
88
85
95
87
87.3

PB
4647
1380
4307
3524
4862
2687
2603
3129
5063
4306
3650.8

3650.8

Pas
1000

2000

3000

4000

5000

6000

87.3

PY
PE

70

72

74

76

78

80

82

84

86

88

90

92

94

96

98

100

EC
CO

Alfabetizacin (% poblacin adulta, 1985)

CL

66.4
BR
BO
50

52

54

56

58

60

62

64

66

Datos Centrados

VE
UY

Producto interno bruto per-capita (1987)

68

70

72

74

76

78

80

Ahora puedo re-presentar esa informacin


en trminos de distancia desde ese caso
tipo, el Centro de Gravedad.
cEVi = EVi - EVCG
cALi = ALi - ALCG
cPBi = PBi - PBCG

AR

Esperanza de vida (1987)

PAS EV
AL
PB
cEV cAL
cPB
71
96
4647
4.6
8.7
996
AR
54
75
1380 -12.4 -12.3
-2271
BO
65
78
4307 -1.4 -9.3
656
BR
65
88
3524 -1.4
0.7
-127
CO
72
98
4862
5.6 10.7
1211
CL
66
83
2687 -0.4 -4.3
-964
EC
67
88
2603
0.6
0.7
-1048
PY
63
85
3129 -3.4 -2.3
-522
PE
71
95
5063
4.6
7.7
1412
UY
70
87
4306
3.6 -0.3
655
VE
66.4 87.3
3650.8
0.0
0.0
0.0
CG
VarP 25.6 51.2 1278529.6 25.6 51.2 1278529.6
7.2
1130.7
5.1
7.2
1130.7
D.E.P. 5.1

Pas
VE
-3000

-2000

-1000

1000

2000

UY
PY

PB Centrada

PE
EC
-20

-15

-10

-5

10

15

20

CO
CL

AL Centrada

BR
BO
AR
-20

-15

-10

-5

10

EV Centrada

Matriz de distancias entre paises y el pais tipo (Centro de Gravedad) para el indicador Esperanza de Vida
Centrado

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
0
17
6
6
1
5
4
8
0
1
5

2:BO
17
0
11
11
18
12
13
9
17
16
12

3:BR
6
11
0
0
7
1
2
2
6
5
1

4:CO
6
11
0
0
7
1
2
2
6
5
1

Distancia eucldea
5:CL
6:EC
7:PY
1
5
4
18
12
13
7
1
2
7
1
2
0
6
5
6
0
1
5
1
0
9
3
4
1
5
4
2
4
3
6
0
1

8:PE
8
9
2
2
9
3
4
0
8
7
3

9:UY
0
17
6
6
1
5
4
8
0
1
5

10:VE
1
16
5
5
2
4
3
7
1
0
4

11:CG
5
12
1
1
6
0
1
3
5
4
0

Matriz de distancias entre paises y el pais tipo (Centro de Gravedad) para el indicador Alfabetismo Centrado

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
0
21
18
8
2
13
8
11
1
9
9

2:BO
21
0
3
13
23
8
13
10
20
12
12

3:BR
18
3
0
10
20
5
10
7
17
9
9

4:CO
8
13
10
0
10
5
0
3
7
1
1

Distancia eucldea
5:CL
6:EC
7:PY
2
13
8
23
8
13
20
5
10
10
5
0
0
15
10
15
0
5
10
5
0
13
2
3
3
12
7
11
4
1
11
4
1

8:PE
11
10
7
3
13
2
3
0
10
2
2

9:UY
1
20
17
7
3
12
7
10
0
8
8

10:VE
9
12
9
1
11
4
1
2
8
0
0

11:CG
9
12
9
1
11
4
1
2
8
0
0

Esta es una matriz de disimilaridades

Esta es una matriz de disimilaridades

El promedio de distancias para cada pais se puede calcular. Al hacerlo, uno se percata que las
distancias promedio entre el pais tipo y todos los dems es la ms baja. Ese es una propiedad
de la media, la media es el punto de referencia que minimiza la distancia promedio.

Centrar
Matriz de distancias entre paises y el pais tipo (Centro de Gravedad) para el indicador PIB/cap Centrado

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
0
3267
340
1123
215
1960
2044
1518
416
341
996

2:BO
3267
0
2927
2144
3482
1307
1223
1749
3683
2926
2271

3:BR
340
2927
0
783
555
1620
1704
1178
756
1
656

4:CO
1123
2144
783
0
1338
837
921
395
1539
782
127

Distancia eucldea
5:CL
6:EC
7:PY
215
1960
2044
3482
1307
1223
555
1620
1704
1338
837
921
0
2175
2259
2175
0
84
2259
84
0
1733
442
526
201
2376
2460
556
1619
1703
1211
964
1048

8:PE
1518
1749
1178
395
1733
442
526
0
1934
1177
522

9:UY
416
3683
756
1539
201
2376
2460
1934
0
757
1412

10:VE
341
2926
1
782
556
1619
1703
1177
757
0
655

11:CG
996
2271
656
127
1211
964
1048
522
1412
655
0

Esta es una matriz de disimilaridades

Reducir
La forma ms simple de establecer
compatibilidad entre escalas de medicin,
una vez centrada la variable, es reducirla
dividiendo el valor centrado por la
desviacin estndar de la variable.

XX
= zX
sx

Al centrar un indicador (restarle la media de


la distribucin observada), todos los valores
pasan a reflejar una distancia de un caso
tipo en vez de una distancia del origen.
CX = X X
Esta traslacin no altera en absoluto las
relaciones entre los casos.
Sin embargo, las escalas de medicin de
cada indicador no son comparables.

PAS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE
CG
VarP
D.E.P

EV
71
54
65
65
72
66
67
63
71
70
66.4
28.5
5.3

AL
PB
96
4647
75
1380
78
4307
88
3524
98
4862
83
2687
88
2603
85
3129
95
5063
87
4306
87.3
3651
56.9 1420588
7.5
1192

zEV
0.91
-2.45
-0.28
-0.28
1.11
-0.08
0.12
-0.67
0.91
0.71
0.00
1.00
1.00

zAL
1.22
-1.72
-1.30
0.10
1.50
-0.60
0.10
-0.32
1.08
-0.04
0.00
1.00
1.00

zPB
0.88
-2.01
0.58
-0.11
1.07
-0.85
-0.93
-0.46
1.25
0.58
0.00
1.00
1.00

50

52

54

56

58

60

62

64

66

68

70

72

74

76

78

80

Esperanza de vida (1987)

-20

-15

-10

-2.0

52

54

56

58

60

62

64

66

68

70

72

74

76

78

80

Esperanza de vida (1987)

-5

10

EV Centrada

-2.5

50

-20

-15

-10

-5

10

EV Centrada

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

EV Centrada y Reducida (puntaje z)

-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

EV Centrada y Reducida (puntaje z)

Noten que al centrar, la escala se mantiene; pero, al


reducir, se extiende (podra tambin reducirse).

Pas
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

VE
UY

PB Centrada y Reducida (puntaje z)

Comparemos las distribuciones sobre una


medida estandarizada. . .

PY
PE
EC
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5
CO

AL Centrada y Reducida (puntaje z)

CL
BR
BO

-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5
AR

EV Centrada y Reducida (puntaje z)

Matriz de distancias en zEV entre paises

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
.00
3.36
1.19
1.19
.20
.99
.79
1.58
.00
.20
.91

2:BO
3.36
.00
2.17
2.17
3.56
2.37
2.57
1.78
3.36
3.16
2.45

3:BR
1.19
2.17
.00
.00
1.39
.20
.40
.39
1.19
.99
.28

Esta es una matriz de disimilaridades

4:CO
1.19
2.17
.00
.00
1.39
.20
.40
.39
1.19
.99
.28

Distancia eucldea
5:CL
6:EC
7:PY
.20
.99
.79
3.56
2.37
2.57
1.39
.20
.40
1.39
.20
.40
.00
1.19
.99
1.19
.00
.20
.99
.20
.00
1.78
.59
.79
.20
.99
.79
.40
.79
.59
1.11 8.E-02
.12

8:PE
1.58
1.78
.39
.39
1.78
.59
.79
.00
1.58
1.38
.67

Matriz de distancias en zAL entre paises

9:UY
.00
3.36
1.19
1.19
.20
.99
.79
1.58
.00
.20
.91

10:VE
.20
3.16
.99
.99
.40
.79
.59
1.38
.20
.00
.71

11:CG
.91
2.45
.28
.28
1.11
8.E-02
.12
.67
.91
.71
.00

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
.00
2.94
2.52
1.12
.28
1.82
1.12
1.54
.14
1.26
1.22

2:BO
2.94
.00
.42
1.82
3.22
1.12
1.82
1.40
2.80
1.68
1.72

3:BR
2.52
.42
.00
1.40
2.80
.70
1.40
.98
2.38
1.26
1.30

4:CO
1.12
1.82
1.40
.00
1.40
.70
.00
.42
.98
.14
.10

Distancia eucldea
5:CL
6:EC
7:PY
.28
1.82
1.12
3.22
1.12
1.82
2.80
.70
1.40
1.40
.70
.00
.00
2.10
1.40
2.10
.00
.70
1.40
.70
.00
1.82
.28
.42
.42
1.68
.98
1.54
.56
.14
1.50
.60
.10

8:PE
1.54
1.40
.98
.42
1.82
.28
.42
.00
1.40
.28
.32

9:UY
.14
2.80
2.38
.98
.42
1.68
.98
1.40
.00
1.12
1.08

10:VE
1.26
1.68
1.26
.14
1.54
.56
.14
.28
1.12
.00
4.E-02

11:CG
1.22
1.72
1.30
.10
1.50
.60
.10
.32
1.08
4.E-02
.00

Esta es una matriz de disimilaridades

Matriz de distancias enzPB entre paises

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
.00
2.89
.30
.99
.19
1.73
1.81
1.34
.37
.30
.88

2:BO
2.89
.00
2.59
1.90
3.08
1.16
1.08
1.55
3.26
2.59
2.01

3:BR
.30
2.59
.00
.69
.49
1.43
1.51
1.04
.67
.00
.58

4:CO
.99
1.90
.69
.00
1.18
.74
.82
.35
1.36
.69
.11

Distancia eucldea
5:CL
6:EC
7:PY
.19
1.73
1.81
3.08
1.16
1.08
.49
1.43
1.51
1.18
.74
.82
.00
1.92
2.00
1.92
.00 8.E-02
2.00 8.E-02
.00
1.53
.39
.47
.18
2.10
2.18
.49
1.43
1.51
1.07
.85
.93

8:PE
1.34
1.55
1.04
.35
1.53
.39
.47
.00
1.71
1.04
.46

9:UY
.37
3.26
.67
1.36
.18
2.10
2.18
1.71
.00
.67
1.25

10:VE
.30
2.59
.00
.69
.49
1.43
1.51
1.04
.67
.00
.58

Noten, por favor, que las distancias son


tales que parecen haber agrupaciones
(conglomerados o clusters, si prefieren)
naturales de los casos.

11:CG
.88
2.01
.58
.11
1.07
.85
.93
.46
1.25
.58
.00

Esta es una matriz de disimilaridades

Pas
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

UY

PB Centrada y Reducida (puntaje z)

PY
PE
EC
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5
CO

AL Centrada y Reducida (puntaje z)

CL
BR
BO

-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5
AR

EV Centrada y Reducida (puntaje z)

PIB per cpita

VE

Al examinar las distribucin de los 10 casos


en cuanto a PIB per cpita, nos percatamos
de la existencia de 3 agrupaciones bsicas:
la primera de bajo PIB/cap, incluyendo slo a
Bolivia;
la segunda de niveles medios de PIB/cap,
incluyendo Paraguay, Ecuador, Per, Colombia;
la tercera de niveles altos de PIB/cap,
incluyendo Brasil, Venezuela, Argentina, Chile,
Uruguay.

Alfabetismo

Esperanza de Vida

Al examinar las distribucin de los 10 casos


en cuanto a alfabetismo, nos percatamos de
la existencia de 3 agrupaciones bsicas:

Al examinar las distribucin de los 10 casos


en cuanto a EV, nos percatamos de la
existencia de 3 agrupaciones bsicas:

la primera de bajo alfabetismo, incluyendo a


Bolivia y Brasil;
la segunda de niveles medios de alfabetismo,
incluyendo Ecuador, Per, Venezuela,
Colombia y Paraguay;
la tercera de niveles altos de alfabetismo,
incluyendo Uruguay, Argentina y Chile.

la primera de bajo EV, incluyendo a Bolivia;


la segunda de niveles medios de EV,
incluyendo Per, Brasil, Colombia, Ecuador y
Paraguay;
la tercera de niveles altos de EV, incluyendo
Venezuela, Uruguay, Argentina y Chile.

En conjunto
Al examinar las 3 distribuciones
simultneamente y, ms especficamente,
las agrupaciones, nos percatamos que:
Bolivia siempre est en el grupo bajo;
Paraguay, Ecuador, Per y Colombia siempre
estn en el grupo medio;
Uruguay, Argentina y Chile siempre estn en el
grupo alto.
Brasil y Venezuela son menos consistente

Es decir. . .
Existe algn fenmeno no directamente
observado que puede explicar estas
regularidades en los indicadores
observados.
A ese fenmeno, identificado mediante
tcnicas estadsticas, se le debe otorgar
sentido utilizando la teora.
EL IDH es un constructo terico.

En conjunto
Esto es lo que podemos llamar estructura
latente.
De acuerdo al DRALE
Estructura = Distribucin de las partes del
cuerpo o de otra cosa
Latente = Oculto, escondido o
aparentemente inactivo

La estructura latente. . .
. . . parece indicarnos que la forma en que se
agrupan estos 10 pases sobre 3
dimensiones observadas (mediante los
indicadores) refleja algn fenmeno latente,
un constructo terico, que hemos
denominado Desarrollo Humano.
Con fundamentacin terica!!!

Complejicemos
Como podrn apreciar, examinar 10 casos
sobre 3 indicadores uno por uno no es
demasiado difcil. . .
Pero qu pasa si tenemos muchos ms
casos con muchos ms indicadores?
Abordmoslo de a poquito.
Si bien venimos examinando cada variable
por su cuenta, examinemos dos a la vez.

Nuestra aproximacin tradicional. . .

Resumen del modelo

Modelo
1

R
.852a

80

R cuadrado
corregida
.692

R cuadrado
.726

Error tp. de la
estimacin
2.962

a. Variables predictoras: (Constante), Alfabetizacin (%


poblacin adulta, 1985)

Suma de
cuadrados
186.209
70.191
256.400

Regresin
Residual
Total

Media
cuadrtica
186.209
8.774

gl
1
8
9

F
21.223

Sig.
.002a

a. Variables predictoras: (Constante), Alfabetizacin (% poblacin adulta, 1985)


b. Variable dependiente: Esperanza de vida (1987)

Coeficientesa

Modelo
1

Coeficientes no
estandarizados
B
Error tp.
13.757
11.465

(Constante)
Alfabetizacin (%
poblacin adulta, 1985)

.603

AR

CL

70

Esperanza de vida (1987)

Modelo
1

UY

VE

ANOVAb

Coeficientes
estandarizados
Beta

.131

.852

t
1.200

Sig.
.264

4.607

.002

EC

BR

PY

CG
PE

CO

60

BO

50
70

80

90

100

a. Variable dependiente: Esperanza de vida (1987)

Alfabetizacin (% poblacin adulta, 1985)

2.5

2.5

2.0

2.0
1.5

EV Centrada y Reducida (Puntaje z)

EV Centrada y Reducida (Puntaje z)

1.5
CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

CL
1.0
.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

AL Centrada y Reducida (Puntaje z)

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

2.5

2.5

2.0

2.0
1.5

EV Centrada y Reducida (Puntaje z)

1.5

EV Centrada y Reducida (Puntaje z)

UY AR

VE

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

AL Centrada y Reducida (Puntaje z)

1.0

1.5

2.0

2.5

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

AL Centrada y Reducida (Puntaje z)

2.5
2.0
1.5

EV Centrada y Reducida (Puntaje z)

A esta raya verde, se le denomina el Primer


Componente Principal.
Capta la direccin de mxima longitud (y,
por ende, de variabilidad) de la nube de
puntos.
Y como es un vector que pasa por el origen,
podemos usar Pitgoras para proyectar la
coordenada de cada caso sobre ese 1erCP.

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

EC=-0.48

VE=0.47
PY=0.15

BR=-1.11B

VE
EC
CG
PY

PE

AR

CL

CO

BO

BO=-2.95

UY

PE=-0.70
CO=-0.13

UY=1.40
AR=1.50
CL=1.84

Tengan presente que an no me pronuncio


sobre cmo llegu a esas coordenadas sobre
el 1erCP.
Solo quiero que reconozcan que se pueden
calcular, despus veremos el cmo.

Estas puntuaciones pueden considerarse valores estandarizados


sobre la variable latente, en este caso, Desarrollo Humano.

Basta?
El Primer Componente Principal es el mejor
resumen unidimensional de la informacin
contenida en los dos indicadores originales.
Sin embargo, tambin hay variabilidad
residual, variabilidad no captada por el
1erCP.
Que hago?

Busco un segundo vector, o un segundo


componente principal, que me pueda
resumir la mayor cantidad de variabilidad
restante.
Como tengo dos variables originales, con
dos componentes principales basta.
De hecho, el ACP siempre arroja un nmero
de componentes principales igual al nmero
de variables originales.
La gran restriccin es que el 2CP sea
independiente de (u ortogonal a) el 1erCP.

10

2.5

2.5

2.0

2.0
1.5

EV Centrada y Reducida (Puntaje z)

EV Centrada y Reducida (Puntaje z)

1.5
CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

CL
UY AR

VE

.5
CG

EC

0.0

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

AL Centrada y Reducida (Puntaje z)

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

2.5

2.5

2.0

2.0
1.5

EV Centrada y Reducida (Puntaje z)

1.5

EV Centrada y Reducida (Puntaje z)

Mxima
Variabilidad

1.0

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0

Mnima
Variabilidad

-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

CL
1.0

UY AR

VE

.5
CG

EC

0.0

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

AL Centrada y Reducida (Puntaje z)

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

AL Centrada y Reducida (Puntaje z)

2.5
2.0

EV Centrada y Reducida (Puntaje z)

1.5
CL
1.0

UY AR

VE

BR

.5
EC

0.0

CG

CG

BR
PE

CO

PE

-.5

BO

-1.0
-1.5
-2.0

VE

EC

PY

CO

PY

UY

AR

CL

BR= 0.72
VE= 0.53
EC= 0.37
PY= 0.01
UY= -0.12
AR= -0.22
PE= -0.25
CO= -0.26
CL= -0.28
BO= -0.52

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

11

2.5
2.0
BO

1.5
1.0

Segundo Componente Principal

Qu tipo de variable latente podra estar


por detrs de la estructura del segundo
componente principal?

PE

CO

AR

CL

.5
CG

UY

0.0
PY
-.5
EC
-1.0
VE
-1.5
BR
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

Primer Componente Principal

2.5
2.0
BO

1.5

Segundo Componente Principal

1.0

PE

CO

AR

CL

Noten que el 1erCP (eje horizontal) capta


esa linealidad de los 3 grupos.
Sin embargo, los casos no consistentes
tienden a agruparse en un extremo del
segundo CP y, a la vez, al otro lado de
Bolivia sobre ese segundo CP.
Hmmmmmm?!?!?!?!?!?

.5
CG

UY

0.0
PY
-.5
EC
-1.0
VE
-1.5
BR
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

Primer Componente Principal

2.5
2.0

Cambio de Base

BO

1.5

Segundo Componente Principal

1.0

PE

CO

AR

CL

.5
CG

UY

0.0
PY
-.5
EC
-1.0
VE
-1.5
BR
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

En estricto rigor, lo que he hecho es


transformado la base del sistema cartesiano
original, donde X = Alfabetismo e Y =
Esperanza de Vida, a un nuevo sistema
cartesiano donde la base es X = CP1 e Y =
CP2.
Sin prdida de informacin, entendida sta
como similitudes (distancias entre los casos).

Primer Componente Principal

12

S he ganado en un sentido muy importante.


La variabilidad total original, la suma de las
varianzas estandarizadas (= 2), repartida en
50% en EV y 50% en AL, ahora se ha
redistribuido de la siguiente forma:

Juguemos un poco con esta nocin de


variabilidad. . .

CP1 retiene 1.85 (o 92.6%) de la variabilidad total


CP2 retiene 0.15 (o 7.4%) de la variabilidad total

93% de la variabilidad en estos 10 casos sobre


2 indicadores puede atribuirse a ese concepto
latente de Desarrollo Humano.

Medidas de Variabilidad
Con datos
intervalares o de
razn, la forma ms
comn de medir la
variabilidad de un
indicador es la
varianza.

(x x )

sx =
2

x =
2

n 1
2
(x )
N

20

La Varianza es un promedio de la distancia


al cuadrado entre cada caso y la media.
Es un promedio de distancias al cuadrado
entre cada caso y el caso tipo o Centro de
Gravedad.
Tratemos de llevar este planteamiento al
plano en dos dimensiones.

Pitgoras

10

c 2 = a 2 + b2
d ( ALBO , ALCG ) = 12.3

(d ( BO, CG ))2 = ( EVBO EVCG )2 + ( ALBO ALCG )2

EV Centrada

d ( BO, CG ) = ( EVBO EVCG ) 2 + ( ALBO ALCG ) 2


d ( EVBO , EVCG ) = 12.4

-10

= ( 12.4) 2 + (12.3) 2

BO
-20
-20

AL Centrada

= ( 12.4 0) 2 + ( 12.3 0) 2

-10

10

20

Cunto es est distancia?


d ( BO, CG ) ?

= 153.76 + 151.29 = 305.05


= 17.5

13

20

Bolivia est a 17.5 unidades del Centro de


Gravedad.

10

Pero 17.5 qu?


Esa distancia tiene una mtrica que es la
raz cuadrada del producto de aos (de EV)
y puntos porcentuales (de AL).

EV Centrada

-10

Por ende, esa mtrica, si bien es factible


matemticamente, es carente de un sentido
intuitivo.

BO
-20
-20

-10

10

20

17.5

AL Centrada

2.5
2.0

Ms vale trabajar con distancias


estandarizadas. . .

EV Centrada y Reducida (Puntaje z)

1.5

. . . con puntajes z.

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

2.5

Pitgoras

2.0

EV Centrada y Reducida (Puntaje z)

1.5

c2 = a 2 + b2

1.0
.5

(d z ( BO, CG ))2 = ( zEVBO zEVCG )2 + ( zALBO zALCG ) 2

-1.6

d z ( BO, CG ) = ( zEVBO zEVCG ) 2 + ( zALBO zALCG ) 2

0.0
-.5

= (2.3 0) 2 + (1.6 0) 2

-1.0

Y esta distancia?

-1.5

= (2.3) 2 + (1.6) 2

d z ( BO , CG ) ?

-2.0
-2.5
-2.5

= 5.29 + 2.56 = 7.85

-2.3

BO
-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

= 2.84

AL Centrada y Reducida (Puntaje z)

14

2.5
2.0

EV Centrada y Reducida (Puntaje z)

1.5
1.0

Puedo repetir este procedimiento para cada


uno de los puntos. . .

.5
CG

0.0
-.5
-1.0

2.84 unidades z

-1.5
-2.0
-2.5
-2.5

BO
-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

d z ( AR, CG ) = ( zEVAR zEVCG ) 2 + ( zALAr zALCG ) 2 = 1.52


d z ( BO, CG ) = ( zEVBO zEVCG ) 2 + ( zALBO zALCG ) 2 = 2.99
d z ( BR, CG ) = ( zEVBR zEVCG ) 2 + ( zALBR zALCG ) 2 = 1.33
d z (CL, CG ) = ( zEVCL zEVCG ) 2 + ( zALCL zALCG ) 2 = 1.86

Estos valores son las distancias, en unidades de


desviacin estndar (puntaje z), desde cada punto
ubicado en el plano y el Centro de Gravedad (la
media bidimensional).

d z (CO, CG ) = ( zEVCO zEVCG ) 2 + ( zALCO zALCG ) 2 = 0.29


d z ( EC , CG ) = ( zEVEC zEVCG ) 2 + ( zALEC zALCG ) 2 = 0.61
d z ( PY , CG ) = ( zEVPY zEVCG ) 2 + ( zALPY zALCG ) 2 = 0.15

d z (i, CG ) = ( zEVi zEVCG ) 2 + ( zALi zALCG ) 2

d z ( PE , CG ) = ( zEVPE zEVCG ) 2 + ( zALPE zALCG ) 2 = 0.74


d z (UY , CG ) = ( zEVUY zEVCG ) 2 + ( zALUY zALCG ) 2 = 1.41
d z (VE , CG ) = ( zEVVE zEVCG ) 2 + ( zALVE zALCG ) 2 = 0.71

d z ( AR, CG ) = 1.52
d z ( BO, CG ) = 2.99
d z ( BR, CG ) = 1.33
d z (CL, CG ) = 1.86
d z (CO, CG ) = 0.29
d z ( EC , CG ) = 0.61
d z ( PY , CG ) = 0.15
d z ( PE , CG ) = 0.74

Esta informacin, como resumen, es


interesante pero insuficiente para
comprender la forma de nuestros datos.
Si bien podemos poner el Centro de
Gravedad en el origen de un plano
cartesiano definido por 2 ejes que tienen
mtrica de puntaje z, eso no basta.

d z (UY , CG ) = 1.41
d z (VE , CG ) = 0.71

15

Para poder arreglar los 10 pases en el plano


usando solamente distancias, sin
coordenadas, necesito algo ms que las
distancias entre los casos y el Centro de
Gravedad. . .
. . . necesito las distancias entre todos los
casos entre si. . .
. . . necesito una matriz de distancias de
n n.
Me explico. . .

BR-CG

1.33

CL-CG

1.86

BO-CG

2.99

Si yo le digo que BO est a 2.99 del CG y


CL est a 1.86 y BR est a 1.33, hay una
infinidad de formas en que esas distancias
se pueden arreglar en torno a ese CG.

CL
BR
BO

CL

CL
BR

Sin embargo, si yo agrego que la distancia


entre BO y CL es 4.79, la forma deja de ser
tan al lote y comienza a emerger una
forma en que esos pases se pueden
organizar en el plano. . .

BR
BO
BO

BR-CG

1.33

CL-CG

1.86

BO-CG

2.99

BO-CL

4.79

CL
BR
BO

Ahora Chile, Bolivia y el Centro de


Gravedad estn ordenados correctamente,
pero Brasil sigue dando vueltas. . .

CL

CL
BR

BR
BO
BO

16

BR-CG

1.33

CL-CG

1.86

BO-CG

2.99

BO-CL

4.79

CL
BR

Si agrego a nuestra informacin que la


distancia entre Brasil y Chile es 3.11 y que
la distancia entre Brasil y Bolivia es 2.20 ...

BO

BR

CL

CL
BR
BO

BO

2.5

1.33

CL-CG

1.86

BO-CG

2.99

BO-CL

4.79

BR-CL

3.11

BO-BR

2.20

CL

2.0
1.5

BR

EV Centrada y Reducida (Puntaje z)

BR-CG

BO

CL
CL
BR

BR

CG

BO

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

BO
AL Centrada y Reducida (Puntaje z)

A medida que vayamos agregando pases y


las distancias entre pases, podemos ir
armando una representacin de la estructura
(la forma) que toman estos datos.

Matriz de distancias entre pases (incluyendo el Centro de Gravedad) en el Espacio bidimensional (zEV,zAL)

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE
11:CG

1:AR
.00
4.46
2.79
1.63
.34
2.07
1.37
2.21
.14
1.28
1.52

2:BO
4.46
.00
2.21
2.83
4.80
2.62
3.15
2.26
4.37
3.58
2.99

3:BR
2.79
2.21
.00
1.40
3.13
.73
1.46
1.05
2.66
1.60
1.33

4:CO
1.63
2.83
1.40
.00
1.97
.73
.40
.57
1.54
1.00
.30

Distancia eucldea
5:CL
6:EC
7:PY
.34
2.07
1.37
4.80
2.62
3.15
3.13
.73
1.46
1.97
.73
.40
.00
2.41
1.71
2.41
.00
.73
1.71
.73
.00
2.55
.65
.89
.47
1.95
1.26
1.59
.97
.61
1.87
.61
.16

8:PE
2.21
2.26
1.05
.57
2.55
.65
.89
.00
2.11
1.41
.74

9:UY
.14
4.37
2.66
1.54
.47
1.95
1.26
2.11
.00
1.14
1.41

10:VE
1.28
3.58
1.60
1.00
1.59
.97
.61
1.41
1.14
.00
.71

11:CG
1.52
2.99
1.33
.30
1.87
.61
.16
.74
1.41
.71
.00

Esta es una matriz de disimilaridades

17

2.5
2.0

Los elementos sociales, que en el caso de


nuestro anlisis representan 10 pases, se
distribuyen en un espacio asumiendo una
forma definida por el conjunto de distancias
entre estos elementos.

EV Centrada y Reducida (Puntaje z)

1.5
1.0
.5
0.0
-.5

Este es un ejemplo en el cual estos 10 pases


asumen una forma dentro de este espacio
social.

-1.0
-1.5
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

La naturaleza misma de este espacio


social es un tema que nos ha preocupado
bastante recientemente; sin embargo, para
nuestros propsitos no es necesario
abordarlo ahora.

Y, desde la teora cientfica, vivimos en un


mundo ordenado.
Por lo tanto. . .

2.5
2.0

EV Centrada y Reducida (Puntaje z)

1.5

Podemos pensar que esa forma, en la


medida que refleja alguna estructura real,
puede ser observada mediante un
conjunto de indicadores indirectos (teniendo
en cuenta que lo que estoy analizando es
similitudes entre pases, en cuanto a un
concepto terico latente, Desarrollo
Humano).

1.0
.5
0.0
-.5
-1.0
-1.5
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

18

2.5
2.0
1.5

EV Centrada y Reducida (Puntaje z)

De hecho, lo que estamos haciendo, es


utilizar un conjunto de indicadores
operacionalizados para detectar una variable
latente y despus estamos tratando de
cambiar nuestro sistema referencial
basado en observaciones concretas por uno
basado en un constructo terico.

1.0
.5
0.0
-.5
-1.0
-1.5
-2.0
-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

Esta forma, en este hiperespacio no


definido (o mejor dicho, definido
tericamente), asume su forma en la medida
que los casos se diferencian entre s, a lo
largo de dimensiones tericas.
Es decir, reconocemos que lo que le da
forma a nuestro Objeto de Estudio son las
diferencias entre los casos en relacin a
estos aspectos tericos abstractos.

Esto significa definir un conjunto de


dimensiones y procedimientos concretos
que me permitan aprehender esas
dimensiones latentes.
Dimensin latente, Desarrollo Humano.
Indicadores
Esperanza de Vida

Sin embargo, como investigador lo que


quiero llevar a cabo es una aproximacin
concreta mediante la observacin de
dimensiones de nuestro casos de acuerdo a
procedimientos que sean vlidos y
confiables.
Quiero observar mi Objeto de la mejor
forma posible.

El ACP es un procedimiento apropiado para


hacer eso cuando mis observaciones (y, por
ende, mis indicadores) tienen ciertas
caractersticas. . . Se pueden representar con
valores numricos y la distribucin es
normal multivariada.

Alfabetismo
PIB / cap (an no incorporado al anlisis)

19

Volviendo a esta nocin de forma. . .


Ya hemos visto que la varianza, el
promedio de distancias cuadradas de los
casos al promedio (caso tipo), es una buena
medida de la forma de una distribucin,
suponiendo normalidad (o cercana a la
normalidad).

Si supongo lo mismo de mis dos variables


estudiadas (es decir, que sean normal
bivariada), podr establecer un promedio
de distancias cuadradas al CG en este
espacio bidimensional?
S, y se le denomina inercia.

La Inercia

La Inercia

1n

(zEVi zEVCG )2 +(zALi zALCG )2


N i =1
1n
2
2
I 2 = (zEVi ) +( zALi )
N i =1

Como la varianza de cualquier variable

I2 =

I2 =

1
N

[ (zEV ) + (zAL ) ]
2

estandarizada es 1, por definicin,


en nuestro caso. . .

( zEVi )2 (zALi )2
I2 =

+
N
N

I2 = 1+1 = 2

I 2 = Var ( zEV ) + Var ( zAL)

PAS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE
SUMA

Si

d(i,CG) (d(i,CG))^2
1.52
2.30
2.99
8.95
1.33
1.77
0.29
0.09
1.86
3.46
0.61
0.37
0.15
0.02
0.74
0.55
1.41
1.98
0.71
0.51
11.62

20.00

(d )

i , CG

= 20

y
N = 10
entonces

(d )
=

i , CG

20
=2
10

20

Si recuerdan, la varianza a menudo se


descompone en una parte atribuible a algn
tipo de factor (lo explicado) y otra parte
atribuible a error o residuo (lo no
explicado).

Por ende, lo que podemos intentar, es


identificar cuanta de nuestra inercia es
explicable por cada componente
principal.
Y, luego, tratar de interpretar cada uno de
esos Componentes Principales dentro de
nuestro marco referencial.

Ahora, entonces, tengo que abordar la


manera en que se relacionan los indicadores
entre si. . .

La Inercia, entendido como un resumen de


la forma de nuestro objeto, se puede
descomponer en una parte explicada y
otra no explicada; o, por decirlo de otra
forma, en una parte que refleja la
estructura de nuestro objeto y otra parte
que refleja ruido.

Si lo logramos interpretar tericamente,


entonces podemos decir que nuestro
constructo terico puede explicar tal
porcentaje de la variacin total en mis
datos, la que le da la forma a mi Objeto.

Volvamos a la Tabla de n p. . .

Es decir, debo examinar la tabla de


semejanzas entre indicadores de p p.

21

Tabla de n p

k1

k2

k3

c1

x11

x12

x13

c2
c3

x21
x31

x22
x32

x23
x33

c4

x41

x42

x43

c5

x51

x52

x53

c6
c7

x61
x71

x62
x72

x63
x73
x83

c8

x81

x82

c9

x91

x92

x93

c10

x101

x102

x103

Y recordemos que . . .

La informacin en la matriz se puede


entender como un conjunto de vectores,
cada uno representando a un caso.

Desde el punto de vista matemtico, la


interpretacin en la otra direccin se
puede hacer de forma anloga.

Cada vector-fila (xi1, xi2, xi3) se puede


entender como la coordenada de ese i-simo
caso en un espacio de tres dimensiones

Se puede plantear en trminos de las


coordenadas de los indicadores en un
espacio de individuos.

3 [p en el caso de p indicadores]

Donde cada dimensin refleja un indicador.

k1

Tabla de n p

k2

Pero como los vectores ahora representan


dimensiones (direcciones) insertas en una
nube de puntos, las mtricas son un poco
diferentes.

k3

c1

x11

x12

x13

c2
c3

x21
x31

x22
x32

x23
x33

c4

x41

x42

x43

c5

x51

x52

x53

c6
c7

x61
x71

x62
x72

x63
x73

c8

x81

x82

x83

c9

x91

x92

x93

c10

x101

x102

x103

La informacin en la matriz se puede


entender como un conjunto de vectores,
cada uno representando a un indicador.
Cada vector-columna
(x1k, x2k , x3k , x4k , x5k , x6k , x7k , x8k , x9k , x10k)
se puede entender como la coordenada de
ese k-simo indicador en un espacio de 10
dimensiones
10 [n en el caso de n individuos]

22

Donde cada dimensin refleja un


caso (individuo).
En el caso de vectores-columna, su
ubicacin se puede representar como
una distancia y una direccin.
Este es un sistema de coordenadas
utilizadas en la geometra esfrica, a
veces conocidas como coordenadas
polares.

Las coordenadas polares representan


un vector utilizando el largo del vector
(usualmente denominado r de radio,
pero nosotros usaremos d) y el ngulo
que ese vector forma con una direccin
de referencia.
Las coordenadas polares normalmente
toman la forma de (d,?).

90

d
?
180

0.2

0.4

0.6

0.8

Las coordenada polares y las cartesianas no


son cosas diferentes, son dos formas de
presentar la misma informacin. . .

270

(x,y)

0
0

23

x = d cos
y = d sen
. . . y, de hecho, la conversin de una a otra
es bastante simple.

d = x2 + y2
x
d
y
sen =
d

cos =

(x,y)
2

d
?

0
0

d = 6 2 + 2 2 = 36 + 4 = 40 = 6.32
Si (x,y) es igual a (6,2), entonces. . .

cos =

1
6
x
=
= 0.95 cos

= 18.4o
d 6.32

sen =

1
y
2
=
= 0.32 sen

= 18.4o
d 6.32

Suponiendo datos centrados y reducidos. . .


La Distancia del origen a la cabeza del vector que
define la direccin de un indicador se denomina

la norma del vector y se calcula as :


4

Cartesiano
(6,2)
Polar
(6.32, 18.4)

d = indicador k =
=

indicador k

1
N (X )

ik

i =1

0
0

(X )

ik

i =1

24

CORR PAS
1
AR
2
BO
3
BR
4
CO
5
CL
6
EC
7
PY
8
PE
9
UY
10
VE
SC
SC/N
norma

zEV
0.91
-2.45
-0.28
-0.28
1.11
-0.08
0.12
-0.67
0.91
0.71
10
1
1

zAL
1.22
-1.72
-1.30
0.10
1.50
-0.60
0.10
-0.32
1.08
-0.04
10
1
1

Cada vector, tiene como norma, la


unidad. . .
. . .y la nube de variables est
repartida sobre una (hiper)esfera de
radio unidad (Escofier y Pags, p.12)

Cos(0) = 1.000
Cos(30) = 0.866
Cos(45) = 0.707
Cos(60) = 0.500
Cos(90) = 0.000
Cos(135) = -0.707
Cos(180) = -1.000
Cos(225) = -0.707
Cos(270) = 0.000
Cos(315) = 0.707

Como podrn ver, al centrar y reducir


el vector de ubicacin de cada
indicador en el espacio de los
individuos, logramos establecer que el
largo de cada vector es siempre 1.

El grado de semejanza entre dos vectores,


que por definicin todos van a tener norma
1, radica en el grado de separacin angular
que presentan esos dos vectores.
El coseno es una buena medida de esa
separacin dado que. . .

Como podrn ver, es una medida que vara


entre 1 y +1, donde
(+1) significa que apuntan en
exactamente la misma direccin,
0 significa que son ortogonales, es decir,
que no tienen ninguna relacin y apuntan
en ngulos rectos, y
(1) significa que apuntan en
exactamente la direccin opuesta.

25

El coseno del ngulo formado por


dos vectores unitarios es :

Les recuerda a algo?

cos(k , k ' ) =
i =1

1
(zX ik )(zX ik ' )
N

1 N
= ( zX ik )(zX ik ' )
N i =1

Afortunadamente, esta frmula tambin


es la frmula para el coeficiente de
correlacin de Pearson :

rk , k '

1 N
= ( zX ik )( zX ik ' ) = cos(k , k ' )
N i =1

r(k , k ' ) =

grado en el cual k y k ' varian conjuntamente


grado en el cual k y k ' varan individualmente
covariabilidad de k y k '
variabilidad de k y k ' por separado

(k k )(k 'k ')


=

(k k ) (k k ')
2

sk , k '
s k sk '

Que, al fin y al cabo, no es ms


que una covarianza estandarizada :
rk , k ' =

cov (k,k')
sk s k '

donde

cov (k,k') =

(k k )(k 'k ')


N

Conclusin, podemos examinar el


grado de semejanza entre un conjunto
de indicadores mediante una medida ya
conocida como es el coeficiente de
correlacin de Pearson (rk,k).
Y esa medida tiene una interpretacin
directa desde un punto de vista
geomtrico.

26

Semejanzas entre indicadores

k1
k2

k1
s1,1
s2,1

k2
s1, 2
s2, 2

k3
s1, 3
s2 , 3

k3

s3,1

s3, 2

s3, 3

La Matriz de Correlaciones

k1
k2

k1
1
r2,1

k2
r1, 2
1

k3
r1,3
r2, 3

k3

r3,1

r3, 2

La Matriz de Correlaciones

k1
k2

k1 k2
r1,1 r1, 2
r2,1 r2 , 2

k3
r1,3
r2, 3

k3

r3,1

r3,3

r3, 2

En el caso de nuestro ejercicio

EV
AL
PB

EV
1

AL
PB
0.852 0.859

0.852
1
0.725
0.859 0.725
1

Pero como venimos trabajando


slo EV y AL. . .

EV
AL

EV
AL
1
0.852
0.852
1

Cranlo o no, esta matriz de correlaciones


entre indicadores logra resumir la
informacin de la tabla original de la misma
manera en que la matriz de distancias entre
casos lograba resumir la informacin.
De hecho, toda la inercia original (=2) est
contenida en esta matriz de correlaciones.

27

La matriz de correlaciones es una forma


estandarizada de la matriz de varianzacovarianza, donde:

Var (k ) =

(k

kCG )

Cov( k , k ' ) =

(k

kCG )(ki kCG )

(ki kCG )(k 'i k 'CG )

(k

Cov ( k , k ) =

(k

kCG )(ki kCG )


N

k2

kCG )

= Var ( k )

Como la varianza de una variable


estandarizada es uno. . .

k3

k1 Var (1,1) Cov (1,2) Cov(1,3)


k2 Cov( 2,1) Var ( 2,2) Cov (2,3)
k3

Cov ( k , k ) =

La Matriz de
Varianza-Covarianza
k1

Obviamente, la Covarianza de un indicador


consigo mismo es igual a la Varianza.

. . . y la covarianza entre variables


estandarizadas es el coeficiente de
correlacin. . .

Cov(3,1) Cov (3,2) Var (3,3)

. . . la diagonal de la matriz de correlaciones


es el aporte de cada indicador a la inercia
(I2) . . .
. . . y los elementos fuera de la diagonal son
el coseno del ngulo entre los dos
indicadores. . .

zEV

zEV
2
I zEV

zAL
cos ?zEV,zAL

zAL

cos ?zEV,zAL

2
I zAL

28

Volviendo a nuestra matriz. . .

La Inercia total (como resumen de la forma)


es la suma de los elementos en la diagonal
principal (lo que se llama la traza) y
representa la variacin total en cuanto a los
dos indicadores (zEV y zAL). . .

EV
AL
1
0.852
0.852
1

EV
AL

Y la correlacin de 0.852, como coseno del


ngulo creado al cruzar zEV y zAL, indica
que esos dos ejes generan un ngulo de
31.57 grados (utilizando cos-1 en mi
calculadora).

90

Conclusin, el grfico tradicional que


presentamos usando ejes perpendiculares
(con cos = 0) implica independencia entre
los dos vectores.
Sin embargo, los vectores estn fuertemente
relacionados:
r = 0.852 = cos ?
? 32
Por lo tanto. . .

zEV

180

0.2

0.4

0.6

0.8

zAL

270

2.5

2.5

2.0

2.0
1.5

EV Centrada y Reducida (Puntaje z)

EV Centrada y Reducida (Puntaje z)

1.5
CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

AL Centrada y Reducida (Puntaje z)

1.0

1.5

2.0

2.5

CL
1.0

UY AR

VE

.5
EC

0.0

CG

PY

BR
CO

PE

-.5
-1.0
-1.5
-2.0

BO

-2.5
-2.5

-2.0

-1.5

-1.0

-.5

0.0

.5

1.0

1.5

2.0

2.5

AL Centrada y Reducida (Puntaje z)

29

zEV

Una mejor representacin sera. . .

zAL

De hecho, esta es una ms fiel


representacin de la tabla de datos que la
representacin tradicional.
Esta forma es la que queremos examinar
dado que tenemos que tener en cuenta las
relaciones entre los casos Y entre las
variables, de forma simultanea.

CP2

CP1

A modo de resumen conceptual. . .

30

El Fundamento del ACP (a)

ACP busca. . .

Espacio Nuevo

Espacio Original

Examinar la forma que asumen los casos


distribuidos en el espacio original de los
indicadores buscando una nuevo sistema de
ejes (un nuevo espacio) que reduzca la
complejidad de las p dimensiones.

c1

k1
x11

k2
x12

k3
x13

c2
c3

x21
x31

x22
x32

x23
x33

c4
c5

x41
x51

x42
x52

x43
x53

c6
c7

x61
x71

x62
x72

x63
x73

c8

x81

x82

x83

c9
c10

x91
x101

x92
x102

x93
x103

CP1 CP2
z11 z12
z21 z22
z31 z32
z41 z42
z51 z52
z61 z62
z71 z72
z81 z82
z91 z92
z101 z102

c1
c2
c3
c4
c5
c6
c7
c8
c9
c10

CP3
z13
z23
z33
z43
z53
z63
z73
z83
z93
z103

Matriz de distancias entre paises en el espacio bidimensional definido por zEV y zAL

Al hacer eso, la forma que asumen los


casos en el espacio original (una vez
estandarizados todos los indicadores) se
puede establecer mediante las distancias
entre cada par de casos.
Esta forma se mantiene en el nuevo espacio
en la medida que las distancias entre cada
par de casos se mantiene.

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE

1:AR
.00
4.46
2.79
1.63
.34
2.07
1.37
2.21
.14
1.28

2:BO
4.46
.00
2.21
2.83
4.80
2.62
3.15
2.26
4.37
3.58

3:BR
2.79
2.21
.00
1.40
3.13
.73
1.46
1.05
2.66
1.60

4:CO
1.63
2.83
1.40
.00
1.97
.73
.40
.57
1.54
1.00

Distancia eucldea
5:CL
6:EC
.34
2.07
4.80
2.62
3.13
.73
1.97
.73
.00
2.41
2.41
.00
1.71
.73
2.55
.65
.47
1.95
1.59
.97

7:PY
1.37
3.15
1.46
.40
1.71
.73
.00
.89
1.26
.61

8:PE
2.21
2.26
1.05
.57
2.55
.65
.89
.00
2.11
1.41

9:UY
.14
4.37
2.66
1.54
.47
1.95
1.26
2.11
.00
1.14

10:VE
1.28
3.58
1.60
1.00
1.59
.97
.61
1.41
1.14
.00

El
Fundamento
del ACP
(b)

Esta es una matriz de disimilaridades

Espacio Original

Espacio Nuevo

Matriz de distancias entre paises en el espacio bidimensional definido por CP1 y CP2

1:AR
2:BO
3:BR
4:CO
5:CL
6:EC
7:PY
8:PE
9:UY
10:VE

1:AR
.00
4.46
2.77
1.63
.35
2.07
1.37
2.20
.14
1.27

2:BO
4.46
.00
2.22
2.83
4.80
2.63
3.14
2.27
4.37
3.58

3:BR
2.77
2.22
.00
1.39
3.11
.72
1.45
1.05
2.65
1.59

4:CO
1.63
2.83
1.39
.00
1.97
.72
.39
.57
1.54
.99

Distancia eucldea
5:CL
6:EC
.35
2.07
4.80
2.63
3.11
.72
1.97
.72
.00
2.41
2.41
.00
1.71
.73
2.54
.66
.47
1.94
1.59
.96

7:PY
1.37
3.14
1.45
.39
1.71
.73
.00
.89
1.26
.61

8:PE
2.20
2.27
1.05
.57
2.54
.66
.89
.00
2.10
1.41

9:UY
.14
4.37
2.65
1.54
.47
1.94
1.26
2.10
.00
1.13

10:VE
1.27
3.58
1.59
.99
1.59
.96
.61
1.41
1.13
.00

Esta es una matriz de disimilaridades

Examinar la forma que asumen los casos en


el nuevo espacio, con un adecuado
sustento terico, se puede entender como
un cambio desde un espacio original de
indicadores (dimensiones directamente
observables) a un nuevo espacio definido
ahora por variables (dimensiones latentes,
no directamente observables).
Es decir,
Espacio emprico Espacio terico

El Fundamento del ACP (c)


Espacio Original

Espacio Nuevo

Indicadores

Variables

(Dimensiones Observadas)

(Dimensiones Latentes)

31

El Fundamento del ACP (d)

El cambio de espacios toma en cuenta el


grado de semejanza que puede existir entre
los indicadores y trata de establecer
variables que sean independientes entre si.
Ms an, jerarquiza las variables (CPs) de
tal forma que la primera es la que abarca la
mayor parte de la variabilidad total original,
la segunda es la que abarca la mayor parte
de la variabilidad restante, etc., etc., etc..

Las variables (CPs) son combinaciones


lineales de los indicadores.
Donde cada indicador se multiplica por un
coeficiente y este producto se suma sobre
cada uno de los indicadores.

Espacio Original
EV

AL

EV

AL

0.852

PB

0.859 0.725

CP1

PB

0.852 0.859
1

Espacio Nuevo

CP1 maxI 2

CP 2

CP3

0.725

CP 2

midI 2

CP 3

minI 2

*La diagonal representa la inercia.

El Fundamento del ACP (e)


CP1 = EV,1 (zEV ) + AL,1 (zAL ) + PB,1(zPB)
CP 2 = EV,2 (zEV ) + AL,2 ( zAL ) + PB,2(zPB)
CP 2 = EV,3 (zEV ) + AL,3 (zAL ) + PB,3(zPB)

Como hago todo esto?


Con una caja de herramientas matemticas
denominada lgebra matricial.
Los sustratos matemticos del ACP quedan
para ms adelante.
Volvamos a nuestro ejemplo bi-dimensional
para ver como esto opera en la prctica.
Utilizaremos el programa SPADwin v.3.5.

Utilic el programa para analizar la Tabla


de Datos de 10 2, donde el 10 representa
los 10 pases y el 2 representa los dos
indicadores que venimos trabajando, EV y
AL.
Noten por favor que los datos son
ingresados en su forma bruta; la
normalizacin la hace el programa.
Al solicitar el anlisis, el programa me
arroj los siguientes resultados . . .

32

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

El nmero de casos efectivos. . . N.

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

El peso asignado a cada variable. . .por defecto = (1/N)*100.

La media de cada variable.

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

La desviacin estndar poblacional de cada variable.

El valor mnimo de cada variable.

33

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
+-------------------------------------------------------+----------------------+----------------------+

El valor mximo de cada variable.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

La traza de la matriz de correlaciones.


La suma de los elementos diagonales.
La Inercia Total.
La Variabilidad Total.
1+1=2

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

Los valores propios. De suma utilidad (y de hecho el


fundamento) para los clculos matriciales. Para
nuestros propsitos interpretativos son la cantidad de la
Inercia retenida en cada CP.

MATRICE DES CORRELATIONS


|
EV
AL
-----+-------------EV
|
1.00
AL
|
0.85
1.00
-----+-------------|
EV
AL
MATRICE DES VALEURS-TESTS
|
EV
AL
-----+-------------EV
| 99.99
Valor test = to
AL
|
4.00 99.99
-----+-------------|
EV
AL

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

El nmero de los componentes


principales extrados. Como haban 2
indicadores originales, el
procedimiento gener 2 CPs.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

Los valores propios expresados como un porcentaje de


la Inercia total. Si el CP1 retiene 1.85 de la Inercia
total, que es 2, eso se puede expresar en trminos
porcentuales como 92.61%.

34

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

Los porcentajes de Inercia acumulados. El 92.61%


retenido por el CP1 ms el 7.39% retenido por el CP2
suman 100%. Los dos CPs retienen el total de la
variabilidad originalmente en los datos pero distribuida
de forma diferente.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

La suma de los valores propios. Como los valores


propios representan la redistribucin de la Inercia
original a lo largo de los 2 CPs, la suma debera ser
igual a la traza de la matriz de correlaciones.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0000
SOMME DES VALEURS PROPRES ....
2.0000
HISTOGRAMME DES 2 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+---------------------------------+
|
1
|
1.8522
|
92.61 |
92.61 | ********************************|
|
2
|
0.1478
|
7.39 | 100.00 | **
|
+--------+------------+----------+----------+---------------------------------+

Los tamaos relativos de los valores propios


expresados grficamente.

COORDONNEES DES VARIABLES SUR LES AXES 1 A 2


VARIABLES ACTIVES
----------------------------+----------------+---------------+---------------+
VARIABLES
|
CORDONNEES
| CORR. VAR-FAC | ANC AXES UNIT |
----------------------------+----------------+---------------+---------------+
IDEN - LIBELLE COURT
|
1
2
|
1
2
|
1
2
|
----------------------------+----------------+-------------------------------+
EV
- Esperanza de Vida
| 0.962 0.272 | 0.96 0.27
| 0.71 0.71
|
AL
- Alfabetismo adulto
| 0.962 -0.272 | 0.96 -0.27
| 0.71 -0.71
|
----------------------------+----------------+-------------------------------+

Variables activas son los indicadores que se utilizaron


para definir las CPs. Tambin existen variables
ilustrativas que no entran en el clculo de las CPs pero
se puede examinar cmo se relacionan con las CPs.

COORDONNEES DES VARIABLES SUR LES AXES 1 A 2


VARIABLES ACTIVES
----------------------------+----------------+---------------+---------------+
VARIABLES
|
CORDONNEES
| CORR. VAR-FAC | ANC AXES UNIT |
----------------------------+----------------+---------------+---------------+
IDEN - LIBELLE COURT
|
1
2
|
1
2
|
1
2
|
----------------------------+----------------+-------------------------------+
EV
- Esperanza de Vida
| 0.962 0.272 | 0.96 0.27
| 0.71 0.71
|
AL
- Alfabetismo adulto
| 0.962 -0.272 | 0.96 -0.27
| 0.71 -0.71
|
----------------------------+----------------+-------------------------------+

Las coordenadas que tiene el vector original de zEV en


el nuevo espacio de las CPs.

35

En el caso de 2 dimensiones,
el CP1 es la bisectrz del ngulo
entre los dos indicadores.

0.962

0.272

0.272

0.962

0.962

-0.272

COORDONNEES DES VARIABLES SUR LES AXES 1 A 2


VARIABLES ACTIVES
----------------------------+----------------+---------------+---------------+
VARIABLES
|
CORDONNEES
| CORR. VAR-FAC | ANC AXES UNIT |
----------------------------+----------------+---------------+---------------+
IDEN - LIBELLE COURT
|
1
2
|
1
2
|
1
2
|
----------------------------+----------------+-------------------------------+
EV
- Esperanza de Vida
| 0.962 0.272 | 0.96 0.27
| 0.71 0.71
|
AL
- Alfabetismo adulto
| 0.962 -0.272 | 0.96 -0.27
| 0.71 -0.71
|
----------------------------+----------------+-------------------------------+

La correlacin entre cada CP y el indicador original.


Cuando los datos son normados, es igual a la
coordenada. Tambin es igual al coseno del ngulo
entre cada indicador y el CP correspondiente.

36

d=

(0.962)2 + (0.272)2

= 0.925 + 0.074 = 0.999 1


=1

0.272

0.272

?
0.962

0.962

cos =

x 0.962
=
= r( zEV , CP1)
d
1

Representacin

Representacin

Estas correlaciones entre indicador (zX) y


variable (CP) se interpretan como la calidad
de la representacin del indicador original
sobre el nuevo CP.
El largo original del indicador (en este caso
igual a 1) se descompone en un largo de
0.962 a lo largo de CP1 y un largo de 0.272
a lo largo de CP2 (Pitgoras).

Mientras ms cercano a 1 (a una correlacin


perfecta), mejor es la representacin de ese
indicador sobre esa variable.
Mientras ms cercano a 0 (a una correlacin
nula), peor es al representacin de ese
indicador sobre esa variable.
Noten que calidad de representacin utiliza
el valor de r, no el signo.

COORDONNEES DES VARIABLES SUR LES AXES 1 A 2


VARIABLES ACTIVES
----------------------------+----------------+---------------+---------------+
VARIABLES
|
CORDONNEES
| CORR. VAR-FAC | ANC AXES UNIT |
----------------------------+----------------+---------------+---------------+
IDEN - LIBELLE COURT
|
1
2
|
1
2
|
1
2
|
----------------------------+----------------+-------------------------------+
EV
- Esperanza de Vida
| 0.962 0.272 | 0.96 0.27
| 0.71 0.71
|
AL
- Alfabetismo adulto
| 0.962 -0.272 | 0.96 -0.27
| 0.71 -0.71
|
----------------------------+----------------+-------------------------------+

Los antiguos ejes unitarios los dejaremos para el


momento en que veamos la matemtica que hay por
detrs de estos procedimientos.

37

Interpretacin
Lo fundamental aqu es la interpretacin
que se le de a estos CPs.
Noten que ambos indicadores estn bien
representados en el CP1 pero no tan bien
representados en la segunda variable.

Ambos indicadores se correlacionan


positivamente sobre el CP1.
A mayor zEV, mayor CP1
A mayor zAL, mayor CP1

El CP1 al correlacionarse fuerte y


directamente con ambos indicadores apoya
nuestro constructo terico.
Por ende, se puede interpretar el CP1 como
una variable latente que refleja el nivel de
Desarrollo Humano de estos 10 pases.

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

Sin embargo, habiendo establecido que 93%


de la variabilidad se puede atribuir a este
constructo terico (Desarrollo Humano),
que pasa con el 7% restante?
Ambos indicadores se correlacionan con el
CP2, pero en direcciones opuestas:
a mayor zEV (y menor zAL), mayor CP2
a mayor zAL (y menor zEV), menor CP2

Que variable latente podra estar por detrs


de esta estructura?

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

El peso relativo de cada caso.


Su calculo es p.r. = (1 / N)*100.
Este peso es importante en los clculos matriciales y
cuando los casos se ponderan diferencialmente; para
nuestros propsitos, no son tan importantes.

38

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

La distancia al origen para cada pas expresada en


distancia euclidea al cuadrado. Se puede interpretar
como una medida de similitud al caso tipo.

Las coordenadas de cada pas sobre los CPs, en


unidades de desviacin estndar. Se puede interpretar
como el valor en puntaje z de un pas sobre la variable
latente.

Tratando de mantener homogeneidad de escalas


para que la visualizacin sea lo ms correcta
posible.

Ampliando la escala visual del CP2


para que la visualizacin sea lo ms fcil
posible.

0.72

-1.11

39

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

La contribucin relativa que aporta cada caso a la


definicin del CP. La suma de cada columna debe ser
100. Bolivia, Chile, Argentina y Uruguay son los
pases que aportan mayoritariamente a la definicin del
CP1; Brasil, Venezuela y Bolivia son los que ms
aportan a la definicin del CP2.

Los cosenos cuadrados (tambin conocidos como


comunalidades [h2]) son una medida de la distancia
desde el caso al origen proyectada a lo largo de cada
CP y se utiliza como una medida de calidad de
representacin para cada caso sobre cada CP. Noten
que la suma horizontal es igual a 1.

x2
= r2
2
d
1.112
cos2 ?BR , CP1 =
1.77
1.23
=
1.77
= 0.6949 0.70
cos2 ? =

cos2 ?BR , CP1 = 0.70 = r 2 BR ,CP1


cos2 ?BR , CP 2 = 0.30 = r 2 BR ,CP 2

Como todo r2, su interpretacin es en


trminos de variabilidad compartida o, en este
caso, como calidad de la representacin.
El 70% del aporte de Brasil a la variabilidad
total (entendido como una distancia al CG) se
ve reflejada en el CP1. Es decir, la
proyeccin de la distancia desde el CG a BR
sobre el CP1 es de un 70% de la distancia.
El 30% restante de esa distancia se capta en el
CP2.

1.77 = (1.11) 2 + (0.72) 2


1.77 = 1.21 + 0.52
1.21
0.70 = 70%
1.77
0.52
0.30 = 30%
1.77

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 2
+----------------------------------+-------------+-----------+-----------+
|
INDIVIDUS
| COORDONNEES | CONTRIB. | COS CARRES|
|----------------------------------+-------------+-----------+-----------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
|
1
2 |
1
2 |
+----------------------------------+-------------+-----------+-----------+
| AR
10.00
2.30 | 1.50 -0.22 | 12.2 3.2 | 0.98 0.02 |
| BO
10.00
8.95 | -2.95 -0.52 | 46.9 18.0 | 0.97 0.03 |
| BR
10.00
1.77 | -1.11 0.72 | 6.7 35.4 | 0.70 0.30 |
| CO
10.00
0.09 | -0.13 -0.26 | 0.1 4.7 | 0.19 0.81 |
| CL
10.00
3.46 | 1.84 -0.28 | 18.3 5.1 | 0.98 0.02 |
| EC
10.00
0.37 | -0.48 0.37 | 1.2 9.2 | 0.63 0.37 |
| PY
10.00
0.02 | 0.15 0.01 | 0.1 0.0 | 0.99 0.01 |
| PE
10.00
0.55 | -0.70 -0.25 | 2.7 4.1 | 0.89 0.11 |
| UY
10.00
1.98 | 1.40 -0.12 | 10.6 0.9 | 0.99 0.01 |
| VE
10.00
0.51 | 0.47 0.53 | 1.2 19.2 | 0.44 0.56 |
+----------------------------------+-------------+-----------+-----------+

40

Tratemos de examinar los dos espacios a la


misma vez.
OJO!!!

Todo esto usando 2 de los 3 indicadores


identificados por el PNUD como relevantes
para la medicin del Desarrollo Humano.
Obviamente, una representacin plana de un
objeto (nube de puntos) que ya era plano no es
gran cosa.
Veamos que pasa cuando incorporo PIB al
anlisis.

ANALYSE EN COMPOSANTES PRINCIPALES


STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES
EFFECTIF TOTAL :
10
POIDS TOTAL
:
10.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
|
3 . PB
- PIB/cpita
10
10.00 |
3650.80
1130.72 |
1380.00
5063.00 |
+-------------------------------------------------------+----------------------+----------------------+

Los Datos
CORR
1
2
3
4
5
6
7
8
9
10

PAS
AR
BO
BR
CO
CL
EC
PY
PE
UY
VE

EV
71
54
65
65
72
66
67
63
71
70

AL
96
75
78
88
98
83
88
85
95
87

PB
4647
1380
4307
3524
4862
2687
2603
3129
5063
4306

MATRICE DES CORRELATIONS


|
EV
AL
PB
-----+--------------------EV
|
1.00
AL
|
0.85
1.00
PB
|
0.86
0.72
1.00
-----+--------------------|
EV
AL
PB
MATRICE DES VALEURS-TESTS
|
EV
AL
PB
-----+--------------------EV
| 99.99
AL
|
4.00 99.99
PB
|
4.07
2.90 99.99
-----+--------------------|
EV
AL
PB

41

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
3.0000
SOMME DES VALEURS PROPRES ....
3.0000
HISTOGRAMME DES 3 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+------------------------------------------+
|
1
|
2.6254
|
87.51 |
87.51 | **************************************** |
|
2
|
0.2752
|
9.17 |
96.69 | ***
|
|
3
|
0.0994
|
3.31 | 100.00 | *
|
+--------+------------+----------+----------+------------------------------------------+

COORDONNEES DES VARIABLES SUR LES AXES 1 A 3


VARIABLES ACTIVES
----------------------------+----------------------+-------------------+-----------------VARIABLES
|
COORDONNEES
|
CORRS VAR-FAC
|
ANC AXES UNIT
----------------------------+----------------------+-------------------+-----------------IDEN - LIBELLE COURT
|
1
2
3
|
1
2
3 |
1
2
3
----------------------------+----------------------+-------------------+-----------------EV
- Esperanza de Vida
| -0.97
0.01 -0.25 | -0.97 0.01 -0.25 | -0.60 0.02 -0.80
AL
- Alfabetismo adulto
| -0.92 -0.38
0.13 | -0.92 -0.38 0.13 | -0.57 -0.72 0.41
PB
- PIB/cpita
| -0.92
0.37
0.14 | -0.92 0.37 0.14 | -0.57 0.70 0.44
----------------------------+----------------------+-------------------+------------------

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 3
+---------------------------------+-------------------+----------------+----------------+
|
INDIVIDUS
|
COORDONNEES
| CONTRIBUTIONS | COSINUS CARRES |
|---------------------------------+-------------------+----------------+----------------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
3
|
1
2
3 |
1
2
3 |
+---------------------------------+-------------------+----------------+----------------+
| AR
10.00
3.08 | -1.73 -0.24 0.15 | 11.4 2.1 2.3 | 0.97 0.02 0.01 |
| BO
10.00 12.98 | 3.58 -0.21 0.39 | 48.7 1.6 15.0 | 0.99 0.00 0.01 |
| BR
10.00
2.10 | 0.57 1.33 -0.05 | 1.2 64.4 0.3 | 0.16 0.84 0.00 |
| CO
10.00
0.10 | 0.17 -0.15 0.21 | 0.1 0.8 4.5 | 0.30 0.24 0.46 |
| CL
10.00
4.61 | -2.12 -0.31 0.19 | 17.0 3.4 3.6 | 0.97 0.02 0.01 |
| EC
10.00
1.09 | 0.87 -0.17 -0.55 | 2.9 1.0 30.9 | 0.69 0.02 0.28 |
| PY
10.00
0.88 | 0.40 -0.71 -0.46 | 0.6 18.5 21.3 | 0.18 0.58 0.24 |
| PE
10.00
0.77 | 0.85 -0.10 0.21 | 2.7 0.4 4.3 | 0.93 0.01 0.06 |
| UY
10.00
3.54 | -1.86 0.11 0.26 | 13.2 0.5 6.6 | 0.98 0.00 0.02 |
| VE
10.00
0.84 | -0.73 0.45 -0.33 | 2.0 7.2 11.2 | 0.63 0.24 0.13 |
+---------------------------------+-------------------+----------------+----------------+

42

Suplementos
Agregando elementos ilustrativos o
suplementarios.
No afectan los clculos pero se ubican
donde le corresponde al usar los factores de
transformacin.
Pueden ser indicadores o casos.

IDH
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LIBELLE
EFFECTIF
POIDS | MOYENNE ECART-TYPE |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . EV
- Esperanza de Vida
10
10.00 |
66.40
5.06 |
54.00
72.00 |
|
2 . AL
- Alfabetismo adulto
10
10.00 |
87.30
7.16 |
75.00
98.00 |
|
3 . PB
- PIB/cpita
10
10.00 |
3650.80
1130.72 |
1380.00
5063.00 |
|-------------------------------------------------------|----------------------|----------------------|
4 . IDH - Indice de Desarrollo
10
10.00 |
0.80
0.11 |
0.55
0.93 |
+-------------------------------------------------------+----------------------+----------------------+

VARIABLES ILLUSTRATIVES
----------------------------+----------------------+-------------------+
VARIABLES
|
COORDONNEES
|
CORRS VAR-FAC
|
----------------------------+----------------------+-------------------+
IDEN - LIBELLE COURT
|
1
2
3
|
1
2
3 |
----------------------------+----------------------+-------------------+
IDH - ndice de Desarrollo | -0.99
0.05 -0.07 | -0.99 0.05 -0.07 |
----------------------------+----------------------+-------------------+

AR = 0.910; BO = 0.548; BR = 0.784; CO = 0.801; CL = 0.931


EC = 0.758; PY = 0.784; PE = 0.753; UY = 0.916; VE = 0.861

43

Mxico
INDIVIDUS ILLUSTRATIFS (AXES 1 A 3)
+---------------------------------------+-------------------+----------------+
|
INDIVIDUS
|
COORDONNEES
| COSINUS CARRES |
|---------------------------------------+-------------------+----------------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
3
|
1
2
3 |
+---------------------------------------+-------------------+----------------+
| MX
10.00
1.15 | -1.01 0.34 0.12 | 0.89 0.10 0.01 |
+---------------------------------------+-------------------+----------------+

EV = 69; AL = 90; PB = 4624; IDH = 0.876

44

Vous aimerez peut-être aussi