Académique Documents
Professionnel Documents
Culture Documents
QU ES EL ANLISIS MULTIVARIANTE?
Es el conjunto de mtodos estadsticos cuya finalidad es
analizar
simultneamente
conjuntos
de
datos
multivariantes en el sentido de que hay varias variables
medidas para cada individuo objeto estudiado.
Su razn de ser radica en un mejor entendimiento del
fenmeno objeto de estudio obteniendo informacin que
los mtodos estadsticos univariantes y bivariantes no
pueden proporcionar.
sofisticada,
mucho ms potente, que utiliza los mtodos
del
lgebra
lineal,
matricial,
clculo
numrico, geometra lineal, entre otras.
2) Mtodos de interdependencia
Estos mtodos no distinguen entre variables dependientes e
independientes y su objetivo consiste en identificar qu variables
estn relacionadas, cmo lo estn y por qu.
3) Mtodos estructurales
Suponen que las variables estn divididas en dos grupos: el de
las variables dependientes y el de las independientes. El objetivo
de estos mtodos es anlizar, no slo como las variables
independientes afectan a las variables dependientes, sino
tambin cmo estn relacionadas las variables de los dos grupos
entre s.
Interdependencia.
La estructura de la
relacin es entre:
Dependencia
Varias Variables
dependientes
Mtricas.
Manova.
Correlacin
Cannica.
una Variable
dependiente
Mtrica.
Regresin
Mltiple.
Anlisis de
supervivencia.
Variables.
C.P.
Anlisis Factorial
Modelos loglineal.
No mtrica.
Anlisis Discriminante.
Modelos de Regresin
Logstica.
Anlisis Conjunto.
Casos.
Anlisis Cluster
Objetos.
Escalamiento
multidimensional.
Anlisis de
Corresponden
-cias
Biologa:
Se miden diferentes variables biomtricas
Las
observaciones
de
p
variables
biomtricas
representativas
de
los
individuos de una especie, se obtienen para
estudiar la variabilidad entre diferentes
especies o razas geogrficas (Anlisis
Cannicos).
Sociologa:
Con referencia a determinadas caractersticas sociales,
polticas y geogrficas se mide la similaridad de un
grupo de naciones. (Escalamiento Multdimensional).
Psicologa:
Los resultados de un test de inteligencia de n tems
basados en una muestra. Para detectar los factores de la
inteligencia (Anlisis Factorial).
Investigacin de Mercados:
1.Se
quiere
determinar
los
beneficios
subyacentes que buscan los consumidores en
la compra de una pasta dental. (Anlisis
Factorial).
2. Para el anlisis de percepciones y
preferencias del consumidor (Escalamiento
Multidimensional).
TAREA
El estudiante realizar un resumen
sobre las clases de variable y los tipos
de escala de medida, con sus
respectivos ejemplos.
MATRIZ DE DATOS
Llamaremos X a la matriz de datos y xij a su elemento genrico
que representa el valor de la variable j sobre el individuo i.
donde i = 1, ..., n y j = 1, ..., p.
La matriz de datos X tendr dimensiones n p y puede
representarse de dos formas distintas. Por filas como:
x11
x12
..........
x21
.
x n1
x22
........... x 2p
........... .
........... x np
.
x n2
x1p
X1'
'
X 2
.
'
Xn
X = X1
X2
....... Xp
ESTADSTICOS MULTIVARIADOS
Vector de Medias muestral
Es la medida de centralizacin ms utilizada para
describir datos multivariantes, tiene dimensin p y
recoge las medias de cada una de las p variables.
Se calcula fcilmente mediante:
X1
X 2
1 '
X X1
.
n
X p
n
Media
Mediana
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
6
11,00
PUNTAJE DE
PROTAGONISMO
Y PARTICIPACIN
6
7,67
PUNTAJE DE
DIVERSIDAD
CULTURAL Y
LINGSTICA EN
LOS PROCESOS
PEDAGGICOS
6
6,67
11,00
8,00
5,50
PUNTAJE DE
RECURSOS
INSUMO Y
ESPACIOS
6
21,17
PUNTAJE DE
ACTITUDES
EN SU
LABOR
COTIDIANA
6
13,67
PUNTAJE DE
CAPACIDADES
DE
COMUNICACIN
6
11,00
PUNTAJE DE
EMPATA Y
RESOLUCIN
DE
PROBLEMAS
6
8,00
21,50
14,50
11,00
8,00
s12
s21
2
2
s p1
s p2
..........
s1p
........... s 2p
........... .
........... s 2p
Se calcula:
'
1 n
S Xi - X Xi - X
n i 1
EJEMPLO:
MATRIZ DE VARIANZAS-COVARIANZAS
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
PUNTAJE DE
PROTAGONISMO
Y
PARTICIPACIN
PUNTAJE DE
DIVERSIDAD
CULTURAL Y
LINGSTICA
EN LOS
PROCESOS
PEDAGGICOS
PUNTAJE DE
RECURSOS
INSUMO Y
ESPACIOS
PUNTAJE DE
ACTITUDES
EN SU
LABOR
COTIDIANA
PUNTAJE DE
CAPACIDADES
DE
COMUNICACIN
PUNTAJE DE
EMPATA Y
RESOLUCIN
DE
PROBLEMAS
PUNTAJE DE ESTRATEGIAS
METODOLGICAS
9,200
9,000
8,000
14,000
10,800
8,000
5,200
PUNTAJE DE PROTAGONISMO Y
PARTICIPACIN
9,000
10,667
6,867
14,067
12,867
7,000
6,800
8,000
6,867
10,267
15,667
11,667
7,600
5,800
14,000
14,067
15,667
31,367
27,667
13,800
10,000
10,800
8,000
5,200
12,867
7,000
6,800
11,667
7,600
5,800
27,667
13,800
10,000
28,267
10,000
9,600
10,000
8,000
3,600
9,600
3,600
6,400
VT tr (S) s 2j
j 1
Ejemplos
7
VT tr (S) s 2j 104.168
j 1
p
1
S 2 s 2j 14.88
p i 1
3) Varianza Generalizada
VG S
Cuando p =2
s12
S
r12 s1s2
r12 s1s2
s22
Interpretacin geomtrica:
( Area ) 2
S
s12 s22 (1 r122 )
(n 1)
La varianza generalizada en p
Volumen 2
S
(n 1) p 1
Observacin:
No es til para comparar conjuntos de datos con diferentes
nmeros de variables.
Debido a que la VG se incrementa o decrece montonamente
al incrementar el nmero de variables.
VE VG
DE VG
1/ p
1/ 2 p
1/ p
1/ 2 p
EJEMPLO
MATRIZ DE VARIANZAS-COVARIANZAS
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
PUNTAJE DE
DIVERSIDAD
CULTURAL Y
LINGSTICA EN
PUNTAJE DE
LOS
PROTAGONISMO
PROCESOS
Y PARTICIPACIN PEDAGGICOS
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
9,200
9,000
8,000
PUNTAJE DE
PROTAGONISMO Y
PARTICIPACIN
9,000
10,667
6,867
PUNTAJE DE DIVERSIDAD
CULTURAL Y
LINGSTICA EN LOS
PROCESOS
PEDAGGICOS
8,000
6,867
10,267
VT 30.1340
VM 10.0447
VG 48.2671
VE = 3.6410
DE =1.9081
Variabilidad y Distancias
Dados dos vectores xk , xl p , la funcin d es una
distancia o mtrica con las siguientes propiedades:
i) d: p x p + ; es decir d(xk , xl )0
ii) d(xk , xk )= 0
iii) d(xk , xl ) = d(xl , xk )
iv) d(xk , xl ) = d(xk , xm ) + d(xm , xl ) (desigualdad
triangular)
xy
d ( x, y) x y
x
(r )
kl
(x
j 1
r 2d
(2)
kl
1/ r
xlj )
kj
(x
j 1
kj
1/ 2
xlj )
Proximity Matrix
1
1
2
3
4
5
6
2
12,530
,000
10,050
16,155
26,134
22,605
,000
12,530
6,928
7,483
14,000
11,576
Euclidean Distance
3
4
6,928
7,483
10,050
16,155
,000
8,602
8,602
,000
17,664
12,884
15,362
11,136
5
14,000
26,134
17,664
12,884
,000
8,124
6
11,576
22,605
15,362
11,136
8,124
,000
(2)
kl
( x k xl ) M ( x k xl )
'
1/ 2
1/ 2
i 1, 2,...n
EJEMPLO:
Consideremos las primeras cuatro variables de las PEC
MATRIZ DE VARIANZAS-COVARIANZAS
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
PUNTAJE DE
DIVERSIDAD
CULTURAL Y
PUNTAJE DE
LINGSTICA EN
PROTAGONISMO
LOS
Y
PROCESOS
PARTICIPACIN PEDAGGICOS
PUNTAJE DE
RECURSOS
INSUMO Y
ESPACIOS
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
9,200
9,000
8,000
14,000
PUNTAJE DE
PROTAGONISMO Y
PARTICIPACIN
9,000
10,667
6,867
14,067
PUNTAJE DE DIVERSIDAD
CULTURAL Y
LINGSTICA EN LOS
PROCESOS
PEDAGGICOS
8,000
6,867
10,267
15,667
PUNTAJE DE RECURSOS
INSUMO Y ESPACIOS
14,000
14,067
15,667
31,367
VT 61.5
VM 15.3750
VG 249.3765
VE = 3.9739
DE = 1.9935
d1 = 1,3128
d2 =1,7670
d3 = 1,9849
d4 =1,9535
d5=1,8501
d6 =1,9939
1 r12
r21 1
R
M M
rp1 rp 2
L
L
O
L
r1 p
r2 p
,
rjk
s jk
s
2
j
2
k
1 rjk 1
Ejemplo:
MATRIZ DE CORRELACIONES
PUNTAJE DE
ESTRATEGIAS
METODOLGICAS
1
,909
,823
,824
PUNTAJE DE
DIVERSIDAD
CULTURAL Y
PUNTAJE DE
LINGSTICA EN
PROTAGONISMO LOS PROCESOS
Y PARTICIPACIN PEDAGGICOS
,909
,823
1
,656
,656
1
,769
,873
PUNTAJE DE
RECURSOS
INSUMO Y
ESPACIOS
,824
,769
,873
1
Rj 1
s jj s jj
R1 = 0.9584
R2 =0.9379
R3 = 0.9263
R4=0.9139
s jk
s jj s kk
(1) D (S1 )
1 / 2
D (S )
EJEMPLO:
P
0.6339 -0.5526 -1.0000 0.6946
1 / 2
CDE 1 R p
1
p 1
ij
ij
s 2
sr (i )
1
ii
s 2
sr (i )
rij .R
s ij
s ii s jj
Ejemplo:
1.3353
-0.8560
S 1
-0.6068
0.0909
-0.8560
0.7787
0.4040
-0.1689
-0.6068
0.4040
0.6863
-0.2531
0.0909
-0.1689
-0.2531
0.1935
Bibliografa
Textos de Consulta:
[1] DALLAS E. JOHNSON. 2000. Mtodos Multivariados Aplicados al
Anlisis de Datos. International Thomson Editores.
[2] HAIR J., ANDERSON R., TATHAM R., BLACK W. 2001. Anlisis
Multivariante. Prentice Hall.