Vous êtes sur la page 1sur 66

Anlisis Multivariante

El Anlisis Multivariante (Cuadras, 1981) es la rama de


la Estadstica y del anlisis de datos, que estudia,
interpreta y elabora el material estadstico sobre un
conjunto de n>1 de variables, que pueden ser
cuantitativas, cualitativas o una mezcla.
DEFINICIN:
OBJETIVOS:
1. Resumir los datos mediante un pequeo conjunto de
nuevas variables con la mnima prdida de informacin.
2. Encontrar grupos en los datos, si existen.
3. Clasificar nuevas observaciones en grupos definidos.
4. Relacionar dos conjuntos de variables
Anlisis de dependencia tratan de explicar la variable
considerada independiente a travs de otras consideradas
independientes o explicativas
Anlisis de interdependencia otorgan la misma
consideracin a todas las variables, tienden a descubrir
las interrelaciones y estructura subyacente entre ellas.
Son tcnicas de clasificacin
Otras tcnicas Intentan superar el enfoque monocriterio
de las anteriores intentando explicar procesos complejos
Anlisis multivariante
Las diferentes tcnicas de anlisis multivariante cabe
agruparlas en tres categoras:
Escalas de medicin
No mtricas nominal y ordinal
Diferencias en tipo de clase.- Indican presencia o
ausencia de una caracterstica o propiedad

Atributos.- caractersticas o propiedades que identifican
o describen un objeto

Mtricas intervalo y razn
Diferencian en grado o cantidad
Reflejan cantidades relativas o grado
Escalas de medicin
Escala de Guttman
Se basa en la posibilidad de ordenar un conjunto de items u
objetos, en base a una sola caracterstica, de forma que se
presentan los estmulos desde lo mas sencillo a lo mas complejo.
Ejemplo
Seale los estudios que ha cursado o la titulacin mxima a
alcanzada.
Ninguno
Ninguno, sabe leer
Ninguno, sabe leer y escribir
Primaria
Secundaria
Superior
Post-grado

La respuesta implica que el encuestado a alcanzado todos los
valores anteriores


Escala de Lickert
Se usa para medir actitudes hacia objetos, hechos o ideas. Se le
presenta al individuo una serie de opciones tanto positivas
como negativas y se le pide que muestre su grado de acuerdo o
desacuerdo de una de ellas. Una vez asignado los valores a las
distintas declaraciones habr que sumar las puntuaciones que
se han dado en total de todas las declaraciones.
Ejemplo
Indique su grado de acuerdo o desacuerdo respecto a las
siguiente informacin.
Totalmente de acuerdo 5
De acuerdo 4
Indiferente 3
En descuerdo 2
Totalmente en desacuerdo 1
Matriz de datos y vector de medias
Matriz de covarianzas
Matriz de correlaciones
CONCEPTO DE PROXIMIDAD
La proximidad expresa la mayor o menor semejanza, que
existe entre dos individuos o variables o entre grupos de
variables o grupos de individuos. Para medir la proximidad se
tiene dos medidas: distancias y similitudes.
La distancia d
AB
entre los puntos A y B, que pertenecen a
un mismo conjunto E, es toda medida que verifique los
siguientes axiomas:
Axioma del Signo:


Axioma de Simetra:


Axioma de Desigualdad Triangular:
DISTANCIAS
> = . e
AB AA
d 0; d 0 A B E
= . e
AB BA
d d A B E
s + = = e
AB AC CB
d d d A B C E
TIPOS DE DISTANCIA
Distancia euclidiana
=
(
=

1
p
2 2
AB Aj Bj
j 1
d (X X )
donde X
Aj
y X
Bj
son las coordenadas respectivas de los puntos A y B en la
dimensin j.
Distancia de Minkowski
Es una distancia de orden n, es decir cuando la distancia entre los
puntos A y B se mide sobre sus coordenadas en n ejes ortogonales.
=
(
= >

1
p
n n
AB Aj Bj
j 1
d (X X ) n 1
DISTANCIA DE LA _
2
=
(
=
(

2
p
Aj Bj
2
AB
j 1
* j A* B*
n n
1
d
P n n
Es una distancia que se calcula sobre la matriz de frecuencias absolutas.
donde:
n
Aj
: Nmero de asociaciones de la variable j a A
n
Bj
: Nmero de asociaciones de la variable j a B
P
*j
: Porcentaje total de asociaciones a la variable j
DISTANCIA DE MAHALANOBIS

=
2 1
AB A B A B
d (X X )' W (X X )
Esta distancia permite situar varias poblaciones en un
espacio de p dimensiones y determinar en que medida estas
poblaciones pueden ser diferenciadas unas de otras.
donde W es la Matriz de Covarianzas
SIMILITUDES
Los ndices de similitud se utilizan para comparar los elementos
de un conjunto estudiados, los cuales a la inversa que las
distancias se consideran con mayor similitud cuanto mas
pequea sea su distancia.
Los ndices de similitud se utilizan para comparar los elementos
de un conjunto estudiados, los cuales a la inversa que las
distancias se consideran con mayor similitud cuanto mas
pequea sea su distancia.
Axiomas que poseen los ndices de similitud:
Axioma del Signo:
= . e
AB BA
S S A B E
Axioma de Simetra:
= > = e
AA BB AB
S S S A B E
ANLISIS DE CONGLOMERADOS
El anlisis de conglomerados (en ingls, cluster analysis) es una tcnica
multivariante que permite agrupar los casos o variables de un archivo de datos en
funcin de la proximidad o similitud existente entre ellos.
Existen de dos tipos:
- Mtodos Jerrquicos.
- Mtodos no Jerrquicos.
Mtodos Jerrquicos
Los mtodos jerrquicos forman grupos de casos o variables en pasos sucesivos
y pueden analizar en cada paso las distancias entre los grupos formados.
Se pueden distinguir dos clases:
1. Los mtodos Aglomerativos.- Estos mtodos comienzan el anlisis con
tantos grupos como casos y van formando grupos en pasos sucesivos.
En el primer paso, se agrupan los dos casos ms cercanos, los que tienen menor
distancia, o las variables ms prximas, las que tiene mayor similitud
(coeficiente de correlacin de Pearson), en el paso siguiente, los casos
agrupados en el primer paso se consideran como un grupo ms, se vuelven a
calcular las distancias o similaridades entre los grupos, agrupando los dos ms
prximos, y as sucesivamente, hasta formar un solo grupo.
2. Los mtodos Disociativos.- Estos mtodos comienzan el anlisis con un solo
grupo, formado por todos los casos. En pasos sucesivos, se van formando
grupos hasta terminar en tantos grupos como casos.
Mtodos Aglomerativos
Primeramente se escoge un enlace, una distancia entre las diferentes que
existen entre los cluster:
-La del vecino ms cercano.
-La del vecino ms lejano.
-La de la distancia promedio.
Diferentes tipos de enlaces:


















Vecino ms cercano
Vecino ms lejano
Distancia promedio
Se puede considerar el siguiente algoritmo bsico. Dados N objetos o
individuos:
1. Empezar con N clusters y una matriz N x N de distancias o similitudes.
D=[d
ij
]
2. Dentro de la matriz de distancias, buscar aquella entre los clusters U y V
(ms prximos, ms distantes o en media ms prximos)que sea la menor
entre todas, d
uv
.
3. Juntar los clusters U y V en uno solo. Actualizar la matriz de distancias:
i) Borrando las filas y columnas de los clusters U y V.
ii) Formando la fila y columna de las distancias del nuevo cluster (UV) al
resto de cluster.
4. Repetir los pasos 2 y 3 (N-1) veces.

Algoritmo Bsico
Al final, todos los objetos estn en un solo cluster cuando termina el algoritmo.
Adems, se guarda la identificacin de los clusters que se van uniendo en cada
etapa, as como las distancias a las que se unen. Finalmente se construye un
dendograma.
Algoritmo Bsico
NMERO PTIMO DE GRUPOS:
Para determinar el nmero apropiado de conglomerados se puede
utilizar los coeficientes de conglomeracin (que se presentan el la
tabla del historial de conglomeracin). Con estos valores se calculan
los cambios porcentuales, si la mayor variacin porcentual, por
ejemplo, se produce en la etapa q y se tienen n casos, entonces el
nmero ptimo de grupos ser: n q.
Tambin se puede usar el dendograma, observando como es la
formacin natural de los grupos.
Caso: Actitud hacia las compras

Se realiz un estudio de mercado en una muestra de consumidores para medir la
actitud que tienen cuando salen de compras. De acuerdo con la investigacin, se
identificaron seis variables de actitud y se pidi a los entrevistados que expresaran
su grado de acuerdo con las afirmaciones siguientes, con base en una escala de siete
puntos (1= en desacuerdo, 7= de acuerdo). Las variables son las siguientes:

X1 = "Salir de compras es divertido".
X2 = "Salir de compras afecta el presupuesto".
X3 = "Combino la salida de compras con la comida fuera de casa".
X4 = "Cuando salgo de compras, trato de hacer las mejores".
X5 = "No me importa salir de compras".
X6 = "Puede ahora ahorrar mucho dinero si comparo los precios".

Los datos obtenidos de una muestra de prueba a 20 consumidores se encuentra en
el archivo actitud.sav.
Se desea clasificar a los consumidores de acuerdo a su actitud hacia las compras.
Responda lo siguiente:
Obtenga la tabla que refleja el historial de aglomeracin y responda:
Qu ocurre en la etapa o paso 3?
En el paso 15, cuntos clusters se han formado y qu consumidores pertenecen a
cada uno de ellos?
Obtenga el diagrama de tmpanos y determine cuntos consumidores forman el
grupo ms grande, si se desea formar 4 grupos?
Utilizando el mtodo de variacin del coeficiente de conglomeracin, determine
cuntos conglomerados son adecuados?
En base al nmero adecuado de conglomerados, obtener e interpretar el perfil de
medias (tabla y grfico de lneas) para los grupos formados y asigne un nombre
adecuado a cada grupo formado.
Mtodos no Jerrquicos
Se usan para agrupar objetos, pero no variables, en un conjunto de k
clusters ya predeterminado. No se tiene que especificar una matriz de
distancias ni se tienen que almacenar las iteraciones. Todo esto permite
trabajar con un nmero de datos mayor que en el caso de los mtodos
jerrquicos.
Se parte de un conjunto inicial de cluster elegidos al azar, luego los
objetos se van reasignando a cada cluster en forma iterativa. Se usa
habitualmente el mtodo de las k-medias.
Mtodo de las k-medias:
Es un mtodo que permite asignar a cada observacin al cluster que se
encuentra ms prximo en trminos del centroide (media), En general
la distancia empleada es la euclideana.
Pasos:
1. Se toman al azar k cluster iniciales.
2. Para el conjunto de observaciones, se vuelve a calcular las
distancias a los centroides de los clusters y se reasignan a los
que estn ms prximos. Se vuelven a recalcular los centroides
de los k clusters despus de las reasignaciones de los elementos.
3. Se repite el paso anterior hasta que no se produzca ninguna
reasignacin.
Se desea conocer la Percepcin de la calidad de los servicios de transporte urbano
de los usuarios y se desea clasificar a las personas en 2 grupos (clusters). Los
datos del estudio se encuentran en el archivo transporte.sav.
a) Utilizando el mtodo de clasificacin K medias responda lo siguiente:
a.1) Indique el nmero de personas que conforman cada uno de los grupos
a.2) Con 1% de significacin, qu variable(s) no es (son) significativa(s) en
la conformacin de los grupos?
b) Utilizando el mtodo de clasificacin que empieza con la ubicacin de los casos
ms cercanos, responda lo siguiente:
b.1) Indique el nmero de vendedores que conforman cada uno de los grupos:
b.2) Qu ocurre en el paso 18 del Historial de conglomeracin?


Caso: Percepcin de calidad de los servicios de transporte
ANLISIS DISCRIMINANTE

Es una tcnica multivariante de clasificacin de individuos en grupos
sistemticamente distintos, utilizando tambin diversas tcnicas factoriales.
Se parte de dos o ms grupos de objetos o individuos, de los que conocemos
los valores de p variables, basado en la normalidad multivariante de las
variables consideradas.

Objetivo:
Obtener un modelo matemtico discriminante contra el cual sea contrastado
el perl de un nuevo individuo cuyo grupo se desconoce para, en funcin de
un resultado numrico, ser asignado al grupo ms probable.


El Anlisis discriminante ayuda a identificar las caractersticas que
diferencian (discriminan) a dos o ms grupos, y a crear una funcin
capaz de distinguir con la mayor precisin posible a los miembros de
uno u otro grupo.
La pertenencia a los grupos, conocida de antemano, se utiliza como
variable dependiente (una variable categrica con tantos valores
discretos como grupos). Las variables en las que suponemos que se
diferencian los grupos se utilizan como variables independientes o
variables de clasificacin (tambin llamadas variables discriminantes)
deben ser variables cuantitativas continuas.

Puede aplicarse para:
Describir: Explicar la diferencia entre los distintos tipos de objetos.
Hacer Inferencia: Contrastar diferencias significativas entre
poblaciones.
Tomar de decisiones: Decidir donde clasificar un objeto.

1) Anlisis Discriminante Descriptivo: Analizar si existen
diferencias entre los grupos en cuanto a su comportamiento con
respecto a las variables consideradas y averiguar en qu sentido
se dan dichas diferencias.
2) Anlisis Discriminante Predictivo: Elaborar procedimientos
de clasificacin sistemtica de individuos de origen
desconocido, en uno de los grupos analizados.
El anlisis discriminante permite explicar la pertenencia de cada
individuo a un grupo (variable categrica) segn la variable aleatoria
p-dimensional del objeto (variable explicativa).
El anlisis discriminante permite predecir a qu grupo pertenece un
individuo nuevo, del que conocemos el valor de la variable p
dimensional clasificadora o explicativa.
Supuestos y restricciones del anlisis discriminante
Cuando se tiene una variable categrica y el resto de variables son de
intervalo o de razn y son independientes respecto de ella.
Es necesario que existan al menos dos grupos y para cada grupo se
necesitan dos o ms casos.
Si p es el nmero de variables discriminantes y n es el nmero de
objetos entonces se debe cumplir : p < n 2.
Ninguna variable discriminante puede ser combinacin lineal de otras
variables discriminantes.
Los grupos deben diferir significativamente en las medias
poblacionales (vectores de medias poblacionales diferentes)
Las matrices de varianzas y covarianzas poblacionales de los grupos
deben ser iguales.
Debe existir normalidad en las variables clasificadoras.

Caso 3: Discriminacin con dos grupos y una variable
clasificadora:
En un banco se tiene informacin acerca de 16 clientes a los que se les concedi
un prstamo por un importe de 1 milln de dlares cada uno. Pasados 3 aos de
la concesin de los prstamos haba 8 clientes que fueron clasificados como
fallidos, mientras que los otros 8 clientes son cumplidores, ya que reintegraron el
prstamo.
Para cada uno de los clientes se dispone de informacin sobre su patrimonio neto
y deudas pendientes que corresponden al momento de la solicitud.
Fallidos No fallidos
Cliente
Patrimonio
neto
Deuda
pendiente
Cliente
Patrimonio
neto
Deuda
pendiente
1
2
3
4
5
6
7
8
1.3
3.7
5.0
5.9
7.1
4.0
7.9
5.1
4.1
6.9
3.0
6.5
5.4
2.7
7.6
3.8
9
10
11
12
13
14
15
16
5.2
9.8
9.0
12.0
6.3
8.7
11.1
9.9
1.0
4.2
4.8
2.0
5.2
1.1
4.1
1.6
Total 40.0 40.0 Total 72.0 24.0
Media 5.0 5.0 Media 9.0 3.0
En este caso, por lo tanto, existen 2 posibles variables clasificadoras, Se pueden usar las dos
juntas o de una en una ( p = 2 1) y dos grupos a discriminar (q = 2). El tamao de la
muestra es n = 16 con n
1
= 8 y n
2
= 8.
Suponemos que existen 2 poblaciones o grupos, a los que denominamos I y
II, y una sola variable clasificadora, a la que se denomina X.
Para nuestro ejemplo escogeremos a la variable Patrimonio Neto como
variable clasificadora.
El grupo de clientes fallidos ser el I y el grupo de clientes no fallidos ser
el II.
Se tiene que las medias muestrales de cada grupo son:
9 ; 5 = =
II I
X X
Se calcula un punto de corte:


Este punto de corte se utilizar para clasificar a los clientes a los que se
les ha concedido el prstamo en el banco:
Si X < 7 se clasifica en el grupo I (cliente fallido)
Si X > 7 se clasifica en el grupo II (cliente no fallido)
7
2
9 5
2
=
+
=
+
=
II I
X X
C
Segn esta regla de clasificacin en nuestro ejemplo tenemos:
Grupo real: Fallidos Grupo real: No fallidos
Cliente
Patrimonio
neto
Clasificado
como :
Cliente
Patrimonio
neto
Clasificado
como:
1
2
3
4
5
6
7
8
1.3
3.7
5.0
5.9
7.1
4.0
7.9
5.1
Fallido
Fallido
Fallido
Fallido
No fallido
Fallido
No fallido
Fallido
9
10
11
12
13
14
15
16
5.2
9.8
9.0
12.0
6.3
8.7
11.1
9.9
Fallido
No fallido
No fallido
No fallido
Fallido
No fallido
No fallido
No fallido
Se puede observar que 4 clientes han sido mal clasificados segn la
regla utilizada.
Porcentaje de clasificaciones correctas e incorrectas:
Situacin
real
Clasificados como Total
Fallidos No fallidos
Fallidos 6 (75%) 2 (25%) 8 (100%)
No fallidos 2 (25%) 6 (75%) 8 (100%)
Del total de 16 casos, 4 han sido incorrectamente clasificados.
Los pasos en el SPSS son los siguientes, ingresar los datos y seguir la secuencia
mostrada:
Se ingresa la variable dependiente (categrica) o variable de agrupacin, que
contiene los cdigos de los grupos, se define el rango de valores, y como
variables independientes (cuantitativas continuas) se ingresan las variables
discriminantes, en este caso Patrimonio. Se selecciona Usar mtodo de inclusin
por pasos.
Luego se completan los datos como se muestra a continuacin:
Caso 4: Discriminacin con dos grupos y dos
variables clasificadoras:
En este caso utilizaremos las variables Patrimonio Neto y
Deuda Pendiente como clasificadoras.

Para esto introduciremos las notaciones y definiciones
necesarias.
CLCULO DE LAS FUNCIONES DISCRIMINANTES
En este caso utilizaremos las variables Patrimonio Neto y Deuda
Pendiente como clasificadoras.
Para esto introduciremos las notaciones y definiciones necesarias.
La discriminacin entre los q grupos se realiza mediante el clculo de
unas funciones matemticas denominadas funciones discriminantes.
Existen varios procedimientos para calcularlas, veamos el
procedimiento de Fisher.
Considera como funciones discriminantes, a combinaciones
lineales de las funciones clasificadoras, es decir:
Procedimiento Discriminante de Fisher
D = u
1
X
1
+ u
2
X
2
+ ... + u
p
X
p
= uX
Para cada uno de los n individuos se puede calcular el valor de
la puntuacin discriminante haciendo:
Di = u
1
X
1i
+ u
2
X
2i
+ ... + u
p
X
pi

CRITERIO PARA LA OBTENCIN DE LA
FUNCIN DISCRIMINANTE DE FISHER:
Wu u
Bu u
Maximizar
grupos ra ad Variabilid
grupos entre ad Variabilid
Maximizar
'
'
int
=

Se quiere calcular r funciones discriminantes con varianza 1, y


que sean incorrelacionadas entre s, es decir, que verifiquen que
u
i
Wu
j
= I
ij
; i, j =1,,r, estas se obtienen como soluciones los r
auto vectores de W
-1
B asociados a los r mayores auto valores de
esta matriz,
1

r
> 0. A las funciones D
i
= u
i
X ,i=1,,r,
se les llama funciones discriminantes cannicas o funciones
discriminantes de Fisher.
Los valores propios
i
; i=1,...,r miden el poder de
discriminacin de la i-sima variable discriminante de forma
que si
i
=0, la variable discriminante no tiene ningn poder
discriminante.
Dado que el rango de la matriz W
-1
B es a lo ms min {q-1,
p}, el nmero mximo de funciones discriminantes que se
podrn calcular ser igual a min {q - 1, p}.
Si tuviramos que discriminar en dos grupos, calculamos los
centros de gravedad o centroides:

(
(
(
(
(

=
(
(
(
(
(

=
II p
II
II
II
I p
I
I
I
X
X
X
X
X
X
X
X
,
, 2
, 1
,
, 2
, 1

Sustituyendo en la funcin discriminante los elementos de
los centroides tenemos:
I p p I I
X u X u D
, , 1 1
...+ + =
II p p II II
X u X u D
, , 1 1
...+ + =
Luego el punto de corte sera:
2
II I
D D
C
+
=
El criterio para clasificar al individuo i es el siguiente:
Si D
i
< C, clasificar al individuo i en el grupo I.
Si D
i
> C, clasificar al individuo i en el grupo II.

El criterio anterior es equivalente a:
Si D
i
C < 0, clasificar al individuo i en el grupo I.
Si D
i
C > 0, clasificar al individuo i en el grupo II.
Para el ejemplo tenemos los centroides
(

=
(

=
(

=
(

=
3
9
5
5
, 2
, 1
, 2
, 1
II
II
II
I
I
I
X
X
X
X
X
X
La funcin de clasificacin lineal que se obtiene aplicando el
mtodo de Fisher es la siguiente:
D =1.036 X1-0.932 X
2

Sustituyendo los valores de los centroides y calculando el punto
de corte tenemos :

Luego la funcin D-C est dada por
D C =1.036 X
1
-0.932 X
2
3.52
Los pasos en el SPSS son los siguientes
Ahora ingresamos las dos variables clasificadoras: Patrimonio y
Deuda.
Se completan los datos como aparece a continuacin:
El programa SPSS no nos proporciona la funcin D-C, pero
nos ofrece las funciones llamadas Funciones Discriminantes
Lineales de Fisher:
Coeficientes de la funcin de clasificacin

Grupo
1 2
Patrimonio .777 1.813
Deuda 1.296 .364
(Constante) -5.876 -9.396
Funciones discriminantes lineales de Fisher
396 . 9 364 . 0 813 . 1
876 . 5 296 . 1 777 . 0
2 1 2
2 1 1
+ =
+ =
X X F
X X F
Se puede comprobar que los coeficientes de la segunda columna
menos los de la primera columna producen los coeficientes de la
funcin D C.
Para el ejemplo
D C = (1.813-0.777)X
1
+(0.364-1.296)X
2
+(-9.396)-(-5.876)
= 1.036 X
1
-0.932 X
2
-3.52
Con las funciones lineales discriminantes de Fisher tambin se
puede clasificar a un individuo:
Se calculan las puntuaciones para el caso nuevo, en cada
funcin discriminante lineal de Fisher, y se clasifica el caso en
el grupo para el cual obtiene la mayor puntuacin.
Este mtodo se puede generalizar a ms de dos grupos a
clasificar
Por ejemplo para un cliente que tiene un patrimonio neto de 1.5 y
una deuda pendiente de 3.5 se tendra: X
1
=1.5 y X
2
=3.5
F
1
= 0.777 (1.5) + 1.296 (3.5) 5.876 = -0.1745
F
2
= 1.813 (1.5) +0.364 (3.5) 9.396 = -5.4025

Entonces este cliente sera clasificado como miembro del grupo 1
o sea fallido.
Prueba de la funcin discriminante
Hiptesis:
H
o
: La funcin discriminante no es significativa
H
1
: La funcin discriminante es significativa
Criterio de decisin:
Se rechaza H
0
si P-valor < .
El p-valor se encuentra el la tabla Lambda de Wilks (Sig.)



Para nuestro ejemplo P-valor = 0.002 < 0.05 entonces se
debe rechazar Ho.
Conclusin: La funcin discriminante es significativa.
Correlacin Cannica
La correlacin cannica viene dada por:

q
+
=
1
Es una medida de asociacin entre las puntuaciones
discriminantes y el grupo. Mide la calidad de la funcin
discriminante.
Toma valores entre 0 y 1 de forma que, cuanto ms cerca de 1
est su valor, mayor es el poder discriminante de funcin
discriminante.
Resumen de las funciones cannicas discriminantes
En la tabla se muestra el valor de
1
= 1.716 y de la correlacin cannica = 0.795
obtenidos mediante el programa SPSS. Como este valor es cercano a 1 la calidad de
discriminacin de la funcin discriminante es muy buena.
I) Prueba para comparar las medias:

1. Hiptesis:
H
0
:No existe diferencia entre las medias de la variable X
i
en
los grupos de referencia.
H
1
: Existe diferencia entre las medias de la variable X
i
en los
grupos de referencia.
2. Estadstico de prueba: F
0

3. Criterio de decisin: Si p-value < se rechaza H
0.
Los p-values se obtienen en la salida del SPSS en la tabla de
igualdad de medias de grupos. Para nuestro ejemplo tenemos la
siguiente tabla:
II) PRUEBA DE BARTLETT-BOX (M DE BOX)
Se plantean las hiptesis:
H
0
:
1
=
2
(Las matrices de covarianzas son iguales)
H
1
:
1

2
(Las matrices de covarianzas no son iguales)
A continuacin se presentan los resultados del SPSS para
verificar que se cumpla el supuesto de varianzas iguales.
Resultados de la prueba
M de Box .951
F Aprox. .268
gl1 3
gl2 35280.000
Sig. .849
Contrasta la hiptesis nula de que las
matrices de covarianzas poblacionales son
iguales.
Como el P-value = 0.849, en conclusin no se puede rechazar
la hiptesis nula, entonces se cumple la condicin de matrices
de covarianza iguales.
Matriz de Estructura
Es una matriz p*r que contiene, por filas, los coeficientes de
correlacin de las funciones discriminantes con las variables
originales. De esta forma es posible interpretar el significado de
las mismas utilizando, para cada una de ellas, aqullas variables
con las que est ms correlacionada. De cara a facilitar dicha
interpretacin se suelen realizar rotaciones ortogonales del
espacio de discriminacin similares a las utilizadas por el
Anlisis Factorial.

Analizando la matriz de estructura de la funcin discriminante
se observa que la correlacin de dicha funcin con la
variable Patrimonio, 0.748, es mayor, en valor absoluto,
que la correlacin con la variable Deuda , -0.452. Por lo tanto la
variable Patrimonio contribuye ms en la formacin de la
funcin discriminante.

Matriz de estructura

Funcin
1
Patrimonio .748
Deuda -.452
Correlaciones intra-grupo combinadas entre las
variables discriminantes y las funciones
discriminantes cannicas tipificadas
Variables ordenadas por el tamao de la
correlacin con la funcin.
EL SPSS nos proporciona adems las probabilidades de pertenencia de los casos a
cada grupo como Dis1_2 y Dis2_2:
Un individuo ser clasificado al grupo para el cual tenga una
mayor probabilidad, la clasificacin se puede encontrar en la
columna Dis_1.
Gracias
Prof: Marco Zavaleta
pcmamzav@upc.edu.pe

Vous aimerez peut-être aussi