Santiago de La Fuente Fernández Santiago de La Fuente Fernández

Anlisis Discriminante
Santiago de la Fuente Fernndez

Santiago de la Fuente Fernndez
ANLISIS DISCRIMINANTE
El Anlisis Discriminante es una tcnica estadstica multivariante cuya finalidad
es analizar si existen diferencias significativas entre grupos de objetos respecto
a un conjunto de variables medidas sobre los mismos para, en el caso de que
existan, explicar en qu sentido se dan y facilitar procedimientos de clasificacin
sistemtica de nuevas observaciones de origen desconocido en uno de los
grupos analizados.
Se puede predecir si una empresa va a entrar en bancarrota?
Es posible predecir con antelacin si un cliente que solicita un prstamo a
un banco va a ser un cliente moroso?
Existe discriminacin por razones de sexo o de raza en una empresa o en

un colegio?
El Anlisis Discriminante se puede considerar como un anlisis de regresin

donde la variable dependiente es categrica y tiene como categoras la etiqueta
de cada uno de los grupos, mientras que las variables independientes son
continuas y determinan a qu grupos pertenecen los objetos.
Se pretende encontrar relaciones lineales entre las variables continuas que

mejor discriminen en los grupos dados a los objetos.
Construir una regla de decisin que asigne un objeto nuevo con un cierto
grado de riesgo, cuya clasificacin previa se desconoce, a uno de los grupos
prefijados.
Para efectuar el anlisis es necesario considerar una serie de supuestos:

(a)
Se tiene una variable categrica y el resto de variables son de intervalo o

de razn y son independientes respecto de ella.
(b)
Se necesitan al menos dos grupos, y para cada grupo se necesitan dos o

ms casos.
(c)
El nmero de variables discriminantes debe ser menor que el nmero de

objetos menos 2, es decir, (x1 ,x2 ,,xp ) donde p <(n2) siendo n nmero
de objetos.
(d)
Ninguna variable discriminante puede ser combinacin lineal de otras

variables discriminantes.
(e)
El nmero mximo de funciones discriminantes es el mnimo [nmero de

variables, nmero de grupos menos 1] con q grupos, (q1) funciones
discriminantes .
(f)
Las matrices de covarianzas dentro de cada grupo deben de ser

aproximadamente iguales.
Santiago
de
la
Fuente
Fernndez
(g)
Las variables continuas deben seguir una distribucin normal

multivariante.
MODELO MATEMTICO
Partiendo de q grupos donde se asignan a una serie de objetos y de p
variables medidas sobre ellos (x1 ,x2 ,,xp ), se trata de obtener para cada objeto
una serie de puntuaciones que indican el grupo al que pertenecen (y1 , y2 ,, ym
), de modo que sean funciones lineales de (x1 , x2 ,, xp ):
y1 = w11 x1 +w12 x2 ++w1p xp +w10
m =mn[q1,p]
ym = wm1 x1 +wm2 x2 ++wmp xp +w10

tales que discriminen o separen lo mximo posible a los q grupos.
Estas combinaciones lineales de las p variables deben maximizar la varianza
entre los grupos y minimizar la varianza dentro de los grupos.
DESCOMPOSICIN DE LA VARIANZA: La variabilidad total de la muestra se
puede descomponer en variabilidad dentro de los grupos y entre los grupos. Para
ello, se parte:
Cov(x j ,x j') =
n
(x
ij
x j ) (xij' x j')
i=1
se puede considerar la media de la variable x j en cada uno de los grupos (I1 ,I2
,,Iq ), es decir,
1
xk j
x
nk
ij
para k =1,,q.
iIk
De esta forma, la media total de la variable x j se puede expresar como funcin

de las medias dentro de cada grupo: nk xk j =xij
iIk
con lo cual, x j =
n
Santiago
i=1
q
ij
n
de
ij
k=1 iIk
n
=
xk j = xk j
k=1
la
k=1
n
Fuente
Fernndez
1
As,
Cov(x j ,x j') =
n
(x
ij
x j )(xij' x j')
k=1 iIk
(xij x j ) =(xij xk j )+(xk j x j )
Poniendo en cada uno de los trminos: se obtiene,

(xi j' x j') =(xi j' xk j')+(xk j' x j')
1
Cov(x j , x j') =
x j') =
(x x )(x ' x
ij
)=
j'
(x x )(x ' x ')+
covarianza total
covarianza dentro grupos
k=1 iIk
k=1
covarianza entre grupos
= v(xj ,xj')+ f(xj ,xj')

T = V +F
t(xj ,xj') =
(xk j x j)(xk j'
v(xj ,xj')
n
MATRICIALMENTE

+
f(xj ,xj')
La covarianza total es igual a la covarianza dentro de los grupos ms la

covarianza entre grupos.
EXTRACCIN FUNCIONES DISCRIMINANTES
La idea bsica del Anlisis Discriminante consiste en extraer a partir de (x1 ,
x2 ,, xp ) variables observadas en k grupos, m funciones (y1 , y2 ,, ym ) de

forma que: yi = wi1 x1 +wi2 x2 ++wip xp +wi0 donde m =mn(q1,p), tales
que corre(yi ,y j ) = 0 i j
Si las variables (x1 , x2 ,, xp ) estn tipificadas, las funciones (yi = wi1 x1 +wi2 x2
++wip xp ) para (i =1,,m) se denominan discriminantes cannicas.
Las funciones (y1 , y2 ,, ym ) se extraen de modo que:
y1 sea la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la mayor

discriminacin posible entre los grupos.
y2 sea la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la mayor

discriminacin posible entre los grupos, despus de y1 , tal que corre(y1 ,y2 )
=0
Santiago
de
la
Fuente
Fernndez
En general, yi es la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la

mayor discriminacin posible entre los grupos, despus de yi1 , tal que
corre(yi ,y j) = 0 para
j=1,,(i1)
MATRICIALMENTE: Se busca una funcin lineal de (x1 , x2 ,, xp ): Y = w'X
Se sabe que La covarianza total es igual a la covarianza dentro de los grupos
ms la covarianza entre MATRICIALMENTE
grupos:
T =F+ V
.
De modo que, Var(y)= w'Tw = w'Fw+w'Vw
Se maximiza la variabilidad entre los grupos para discriminarlos mejor, es decir,
se maximiza la
w'Fw
varianza entre grupos en relacin con el total de la varianza: mx
w'Tw
w'Fw
Considerando la funcin f(w)=
es decir,
se observa que es una funcin homognea,
w'Tw
w'Fw
f(w)= f(w) R . El hecho de que sea homognea implica que calcular mx
equivale w'Tw a calcular mx[w'Fw] tal que w'Tw =1
Como es el esquema habitual de los multiplicadores de Lagrange, se define:

L
L = w'Fw(w'Tw1)
=2Fw2Tw = 0 Fw =Tw (T1F)w =w
w
En consecuencia, el autovector asociado a la primera funcin discriminante lo es

de la matriz (T1F) , que en general no es simtrica.
Como Fw =Tw , se tiene w'Fw =w'Tw =
Santiago
de
la
Fuente
Fernndez
Por tanto, tomando el vector asociado al mximo autovalor se obtendr la

funcin que recoge el mximo poder discriminante.
El autovalor asociado a la funcin discriminante indica la proporcin de
varianza total explicada por las m funciones discriminantes que recoge la
variable yi
Para obtener ms funciones discriminantes se siguen sacando los
autovectores de la matriz
w'2 w'2X = Y2
(T1F) asociados a los autovalores elegidos en orden decreciente:
wm' wm' X = Ym
m =mn(q1,p).
Estos vectores son linealmente independientes y dan lugar a funciones
incorreladas entre s.
m
La suma de todos los autovalores

queda explicada, o se
es la proporcin de varianza total que
i=1
conserva, al considerar slo los ejes o funciones discriminantes.

Como consecuencia, el porcentaje explicado por la variable yi del total de
varianza explicada por las funciones (y1 , y2 ,, ym ) es:
100%
i=1
ANLISIS DISCRIMINANTE: OBJETO

Clasificar las observaciones de la muestra en grupos, a partir de la
informacin suministrada por un conjunto de variables.
Un conjunto de variables
Una variable categrica explicativas
o criterio sealando los grupos
Variables clasificadoras
Santiago
de
la
Variable dependiente
Fuente
Fernndez
ANLISIDISCRIMINANTE
(A.D) CRITERID CLASIFICACI
S
. : O
E N
Hiptesis:
Lasdistribuciones
slosediferencian
porsulocalizacin
(igualformay varianza)
Setratademinimizar
loserroresdeclasificacin
Sixi <C seclasifica
enel grupoI
Sixi >C seclasifica
enel grupoII
El puntoC sedenomina
puntodecortediscriminante
:C=
Santiago
de
la
XI +XII
2
Fuente
Fernndez
Santiago
de
la
Fuente
Fernndez
ENFOQUES DE ANLISIS
Basado en la obtencin de funciones discriminantes de clculo similar a las

ecuaciones de regresin lineal mltiple. Consiste en conseguir, a partir de las
variables explicativas, unas funciones lineales de stas con capacidad para
clasificar a otros individuos. A cada nuevo caso se aplican dichas ecuaciones
y la funcin de mayor valor define el grupo al que pertenece.
Basado en tcnicas de correlacin cannica y de componentes principales

(Anlisis Factorial) denominado Anlisis Discriminante Cannico.
CLASIFICACIN EN DOS GRUPOS
Se estudia la aplicacin del Anlisis Discriminante (AD) a la clasificacin de

individuos en el caso de que se puedan asignar solamente a dos grupos a
partir de k variables discriminadoras.
Fisher resuelve el problema mediante su funcin discriminante: D = w1 X1

+w2 X2 ++wk Xk
Las puntuaciones discriminantes son los valores que se obtienen al dar

valores a (X1 ,X2 ,,Xk) en la ecuacin anterior.
Se trata de obtener los coeficientes de ponderacin wj

Si se consideran N observaciones La funcin discriminante Di = w1 X1i +w2
X2i ++wk Xki para i=1,,N.
(Di) es la puntuacin discriminante correspondiente a la observacin i

sima.
D1 X11 X21 Xk1 w1
X22
D La
Xk2 w2
funcin discriminante en forma matricial: 2

X 12
X
2N

=
XkN
DN
X1N
wk
Expresando el modelo en funcin de las desviaciones a la media, resulta:

D1 d1 X11 X21 Xk1 w1
Santiago
de
la
Fuente
Fernndez
D2 d2 X12 X22 Xk2 w2
es decir,
=

X 2N
XkN wk
DN dN
X1N
d= Xw (funcin discriminante en diferencias)
La variabilidad de la funcin discriminante (suma de cuadrados de las

desviaciones de las variables discriminantes con respecto a su media) se
expresa:
Suma de cuadrados explicada por esta
funcin:
d'd= w'X'X
w
X'X es una matriz simtrica que expresa las desviaciones cuadrticas con
respecto a la media de las variables (suma de cuadrados total).
Se puede descomponer en suma de cuadrados entre grupos F y suma de
cuadrados dentro de los grupos V:
T = X'X (matriz de suma de cuadrados y
productos cruzados (varianzascovarianzas)
para el conjunto de observaciones.
con lo cual,
T = X'X =F+
V
d'd= w'X'X w = w'(F+ V)w =

w'Fw+w'V w
Los ejes discriminantes vienen dados por los vectores propios asociados a
los valores propios de la matriz (V1 F) ordenados de mayor a menor.
Las puntuaciones discriminantes se corresponden con los valores obtenidos

al proyectar cada punto del espacio kdimensional de las variables originales
sobre el eje discriminante.
Los coeficientes w se obtienen: Mx = w'Fw = separacin entre grupos

w'V w separacin dentro grupos
Santiago
de
la
Fuente
Fernndez
CLASIFICACIN
Se obtienen las puntuaciones discriminantes di para cada observacin,
introduciendo los correspondientes valores de las k variables en la funcin
discriminante.
Se aplica el criterio de clasificacin:
di < C (di C < 0) pertenece al grupo I
di > C (di C > 0) pertenece al grupo II
Otro camino: funciones discriminantes para cada grupo se clasifica la
observacin en el grupo en que la funcin correspondiente arroja mayor
valor.
HIPTESIS
Las variables son independientes y se distribuyen normalmente
problemas en la estimacin.
Las matrices de las varianzas y covarianzas son iguales en todos los grupos
afecta a la clasificacin.
No multicolinealidad entre las variables clasificadoras.
Las relaciones son lineales.
No existen valores anmalos (outliers).
CENTROIDES PARA CADA GRUPO (GRUPO I, GRUPO II)
X1I

X2I 2II
X1II
XI = XII = Los subndices I y II indican a qu grupo pertenece la variable.

XkI XkII
DI = w1 X1I +w2 X2I ++wk XkI
PARA CADA GRUPO
DII = w1 X1II +w2 X2II ++wk XkII

Santiago
10
de
la
Fuente
Fernndez
Si Di < C se clasifica al individuo i en

el grupo I Si Di >C se clasifica al
individuo i en el grupo II
D+D
A
UO
C: punto de corte discriminante C =

2
II
EN GENERAL:
{DC = w
X1 +w2 X2 ++wk XK C} se clasifica dependiendo si (DC) es

positivo o negativo.
1
INFERENCIAS Y CLCULO DE PROBABILIDADES

La obtencin de la funcin discriminante la realiz Fisher aplicando un enfoque
puramente descriptivo. Cuando en el anlisis discriminante se desean abordar
cuestiones de carcter inferencial y otros relativos al modelo poblacional se
requiere la formulacin previa de hiptesis estadsticas.
Las cuestiones de tipo inferencial se refieren a diversos contrastes de
significacin sobre el modelo, as como contrastes utilizados en el proceso de
seleccin de variables cuando el nmero de stas es muy grande y no se conoce
a priori las variables que son relevantes en el anlisis.
Por otra parte, el clculo de probabilidad de pertenencia a un grupo requiere que
previamente se haya postulado algn modelo probabilstico de la poblacin.
Las hiptesis estadsticas que se adoptan, anlogas a las postuladas en el
anlisis multivariante de la varianza, se refieren tanto a la poblacin como al
proceso de obtencin de la muestra.
Las hiptesis estadsticas sobre la poblacin:

(a) La matriz de covarianzas de todos los grupos es igual a (hiptesis de
homocedasticidad).
(b)Cada uno de los grupos tiene una distribucin normal multivariante.
Santiago
11
de
la
Fuente
Fernndez
Las hiptesis implican que xg N(g ,)
Las hiptesis sobre el proceso de obtencin de la muestra: Facilitan la

realizacin del proceso de inferencia a partir de la informacin disponible:
<<Se supone que se ha extrado una muestra aleatoria multivariante
independiente en cada uno de los G grupos>>.
Bajo las hiptesis citadas, la funcin discriminante obtenida por Fisher es
ptima. La hiptesis xg N(g ,) exige que las variables clasificadoras sigan
una distribucin normal. Sin embargo, no
sera razonable postular est hiptesis respecto a variables categricas, utilizadas
frecuentemente en el anlisis discriminante como variables clasificadoras.
Sealar que, cuando se utilizan variables de este tipo, la funcin discriminante
lineal de Fisher no tiene el carcter de ptima.
Contrastes de significacin y evaluacin de la bondad de ajuste

Con los contrastes de significacin que se realizan en el anlisis discriminante
con dos grupos se trata de dar respuesta a tres tipos de cuestiones diferentes:
(a)
(b)
(c)
Se cumple la hiptesis de homocedasticidad del modelo?

Se cumplen las hiptesis de normalidad?
Difieren significativamente las medias poblacionales de los dos grupos?
Para el contraste de homocedasticidad (si la matriz de covarianzas es la misma

para los distintos grupos) se utiliza el estadstico de BarlettBox:
K
(ng1)/ 2
En el numerador aparecen los determinantes de

las estimaciones de la matriz de covarianzas para cada
M=
(nK)/ 2
grupo.
S
En el denominador, el determinante de la
estimacin global de la matriz de covarianzas.
g=1
Cuando el numerador sea muy superior al denominador, ser indicativo de que

existe heteroscedasticidad (no existe homogeneidad entre las matrices de
covarianzas de cada grupo).
G
V
Vg
donde:
Sg =
(n
1)S
S
g=1
variables ng 1
g=1
= =
nG nG
La matriz Sg es una estimacin de la matriz de covarianzas correspondiente a la

celda gsima g,
Santiago
12
de
la
Fuente
Fernndez
S es una estimacin de la matriz de covarianzas global .

La respuesta a la pregunta Difieren significativamente las medias
poblacionales de los dos grupos? es decisiva para la realizacin del anlisis
discriminante. En caso de que la respuesta fuera negativa carecera de inters
continuar con el anlisis, ya que significara que las variables introducidas no
tienen capacidad discriminante significativa.
H0:1 = 2
Las hiptesis nula y alternativa para dar respuesta a la cuestin, en el caso de
dos grupos
H1:1 2
El contraste de la hiptesis se puede realizar especficamente mediante el
estadstico T2 de Hotelling:
)
T2 =(y1 y2 ' S
(y1 y2) n
n 2
+ n 2
donde S =
V 1+ V 2
n1 + n2 2
La matriz S es un estimador insesgado de la matriz de covarianzas poblacional ,

obtenido bajo el supuesto de que la matriz de covarianzas poblacional es la
misma en los dos grupos.
Bajo la hiptesis nula, el estadstico T2 de Hotelling se distribuye:
2
K1 T
n1 +n2
FK,n
1 +n2 K1
n1 +n2 2
Existen otros estadsticos para realizar el contraste, diseados para el caso

general de G grupos, tales como el estadstico de Rao o el estadstico V de
Barlett (estos dos ltimos estadsticos estn construidos a partir de la de
Wilks).
En el caso de que se rechace la hiptesis nula H0:1 =2 , se puede aplicar el
anlisis univariante de la varianza para contrastar la hiptesis de igualdad de
medias para cada una de las variables clasificadoras por separado.
Como medida de evaluacin de la bondad de ajuste se utiliza el coeficiente eta
cuadrado (2), que es el coeficiente de determinacin obtenido al realizar la
regresin entre la variable dicotmica, que indica la pertenencia al grupo, y las
puntuaciones discriminantes. A la raz cuadrado de este coeficiente se le
denomina correlacin cannica.
Santiago
13
de
la
Fuente
Fernndez
1+
(correlacin
can
nic
a)
'
w1 Fw1 = separacin entre

grupos ratio que se obtiene al maximizar Mx = '
w1 V w1
separacin dentro grupos
Clculo de probabilidades de pertenencia a una poblacin

D = w1 X1 +w2 X2 ++wk Xk
Las funciones discriminantes del tipo clasifican a los diferentes
C
DC = w1 X1 +w2 X2 ++wk Xk
individuos en uno u otro grupo, pero no ofrecen ms informacin acerca de los
individuos investigados.
En muchas ocasiones es conveniente tener informacin complementaria a las
puntuaciones discriminantes. Si bien con estas puntuaciones se puede clasificar
a cada individuo, tambin es interesante disponer de informacin sobre la
probabilidad de su pertenencia a cada grupo, pues con este dato se puede
realizar anlisis ms matizados, e incluir otras informaciones tales como la
informacin a priori o los costes que implica una informacin errnea.
Para realizar este tipo de clculos se suelen asumir las hiptesis estadsticas
sobre la poblacin:
(c) La matriz de covarianzas de todos los grupos es igual a (hiptesis de
homocedasticidad).
(d)Cada uno de los grupos tiene una distribucin normal multivariante.
Las hiptesis implican que xg N(g , ), considerando adems que se conocen
los parmetros poblacionales.
El clculo de probabilidades se realiza en el contexto de la teora de la decisin,
que permite tener en cuenta la probabilidad de pertenencia a un grupo, como los
costes de una clasificacin errnea.
La clasificacin de los individuos se realiza utilizando el teorema de Bayes. La
aplicacin del teorema de Bayes permite el clculo de las probabilidades a
Santiago
14
de
la
Fuente
Fernndez
posteriori a partir de estas probabilidades a priori y de la informacin muestral

contenida en las puntuaciones discriminantes.
En el caso general de G grupos, el teorema de Bayes establece que la
probabilidad a posteriori de pertenencia a un grupo g con una puntuacin
discriminante D, con probabilidades a priori g es:
g Prob(D/g)
Prob(g/D)= G
Prob(D/i)
i
i=1
La probabilidad condicionada Prob(D/g) se obtiene calculando la probabilidad de

la puntuacin observada suponiendo la pertenencia a un grupo g.
G
Dado que el denominador

forma equivalente:
Prob(D/i) es una constante, se utiliza tambin la

i
i=1
Prob(g/D)g Prob(D/g) proporcionalidad

La clasificacin de cada individuo se puede realizar mediante la comparacin de
las probabilidades a posteriori. As, se asignar un individuo al grupo para el cual
sea mayor su probabilidad a posteriori.
Se presenta el clculo de probabilidades en el caso de dos grupos, de forma que
sea fcilmente generalizable al caso de G grupos.
El clculo de probabilidades se realiza bajo tres supuestos diferentes: (a) Clculo
de probabilidades sin informacin a priori. (b) Clculo de probabilidades con
informacin a priori. (c) Clculo de probabilidades con informacin a priori
considerando los costes.
Clculo de probabilidades a posteriori sin informacin a priori
En el clculo de estas probabilidades se considera que no existe conocimiento
previo de las probabilidades de pertenencia a cada grupo. Cuando no existe
dicha informacin, se adopta el supuesto de que la probabilidad de pertenencia
a ambos grupos es la misma, es decir, se adopta el supuesto de que I =II . Esto
implica que estas probabilidades a priori no afectan a los clculos de las
probabilidades a posteriori.
Bajo las hiptesis estadsticas sobre la poblacin, la probabilidad de pertenencia
a cada grupo, dada la puntuacin discriminante obtenida, viene dada por la
expresin:
Fg
e
Prob(g/ D) = FI FII
e +e
Santiago
15
de
FI y FII son las funciones definidas.

g =I,II
la
Fuente
Fernndez
Un individuo se clasifica en el grupo para el que la probabilidad sea mayor. Este

criterio implica que un individuo se clasificar en el grupo I si FI >FII
Aplicando la frmula de probabilidad a posteriori se llega a los mismos
resultados que aplicando la frmula discriminante de Fisher. Esto implica que el
punto de corte C es el mismo:
C=
DI +DII
2
Clculo de probabilidades a posteriori con informacin a priori

En ocasiones se dispone de informacin de la probabilidad a priori sobre
pertenencia de un individuo a cada uno de los grupos. Por ejemplo, se puede
tener informacin de que los prstamos fallidos suponen un 10% del total de los
prstamos concedidos a lo largo de cinco aos. Para tener en cuenta este tipo de
informacin se introducen probabilidades a priori en el anlisis.
Cuando se utilizan probabilidades a priori los individuos se clasifican en el grupo
para el que la probabilidad a posteriori sea mayor.
Fg
FI y FII son las funciones definidas.
e
Prob(g/ D) = FI I
F
I e +II e II
g =I,II
Con este criterio, un individuo se clasifica en el grupo I si:
FI lnI >FII lnII .
La aplicacin implica que el punto de corte discriminante C vendr dado por la

expresin:
C=
p
DI +DII
II
ln
2
I
La ratio de probabilidades a priori debe establecerse de forma que el punto de

corte se desplace hacia el grupo con menor probabilidad a priori. Al desplazarse
el punto de corte de esta forma, se tender a clasificar una proporcin menor de
individuos en el grupo con menor probabilidad a priori.
Clculo de probabilidades a posteriori con informacin a priori y

considerando costes
Hasta ahora no se ha considerado el coste que una clasificacin errnea puede
tener. En muchas ocasiones el coste de clasificacin errnea puede diferir para
cada uno de los grupos. Por ejemplo, en la concesin de prstamos, clasificar
como fallido a un cliente cumplidor y clasificar como cumplidor a un fallido, no es
lo mismo para la entidad bancaria. En la primera de las posibilidades, el coste
Santiago
16
de
la
Fuente
Fernndez
para el banco es dejar de percibir los intereses del prstamo y la posible prdida
de un cliente que en realidad es cumplidor. Por el contrario, en la segunda
posibilidad el coste para el banco es la prdida de la cantidad prestada, ya que
el cliente clasificado como cumplidor es realmente fallido. En principio, y bajo el
criterio de una prudente administracin financiera, parece que el segundo tipo
de coste es superior al primero.
Cuando se introducen costes de clasificacin no puede hablarse ya de clculo de
probabilidades a posteriori. No obstante se puede obtener un criterio para
clasificar minimizando el coste total de clasificacin errnea. Este total viene
dado por la expresin:
I Prob(II/I) Coste(II/I)+II Prob(I/II) Coste(I/II)
Cada probabilidad se encuentra multiplicada por el coste en que se incurre. Al
minimizar la expresin, bajo las hiptesis estadsticas sobre la poblacin, el
punto de corte discriminante Cp,c se obtiene con la expresin:
DI + DII ln II Coste(I/II)
Cp,c =
2
I Coste(II/I)
En los desarrollos anteriores se ha supuesto que las probabilidades son
conocidas. En la prctica, se utilizan estadsticos muestrales en su lugar. El
empleo de estadsticos muestrales tiene como consecuencia que se subestime la
probabilidad de clasificacin errnea, cometindose por lo tanto sesgos
sistemticos en la clasificacin. Para disminuir estos sesgos se han propuesto,
entre otros, dos procedimientos alternativos.
Un procedimiento consiste en dividir la muestra total en dos submuestras,

utilizando la primera muestra para estimar la funcin discriminante, mientras
que la segunda se utiliza para su validacin. As, la potencia discriminante de
la funcin vendr determinada por el porcentaje de individuos clasificados en
esta segunda muestra.
El segundo procedimiento consiste en excluir un individuo del grupo I,

calcular la funcin discriminante, y clasificar despus al individuo que se ha
excluido. Haciendo lo mismo con el resto de individuos del grupo I, se estima
la Prob(II/I) con el porcentaje de individuos que han sido clasificados en el
grupo II. Procediendo anlogamente con los individuos del grupo II, se estima
la Prob(I/II). A este segundo procedimiento se le conoce con la denominacin
jacknife.
Se adjunta una tabla resumen del Ejercicio 1, donde se acompaa las

puntuaciones discriminantes para los 16 clientes.
Client
e
1
2
Santiago
17
Grupo
pertenen
cia
I
I
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
4,1
6,9
de
la
Puntuacin
discriminant
e
5,9957
6,1213
Grupo
clasificad
o
I
I
Fuente
Fernndez
3
4
5
6
7
8
9
10
11
12
13
14
15
16
I
I
I
I
I
I
II
II
II
II
II
II
II
II
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
1,141
3,4715
1,2043
1,8964
2,4267
1,7831
0,93
2,7086
1,3214
7,036
1,8459
4,4593
4,1473
5,2353
I
I
I
I
I
I
II
II
II
II
I
II
II
II
En la tabla siguiente (resultados de la clasificacin) se refleja el resumen de la

clasificacin de la tabla de arriba. A veces se utiliza en el anlisis discriminante
la expresin de matriz de confusin para referirse a la tabla siguiente:
En la tabla que sigue se han calculado las probabilidades a posteriori (sin

incorporar informacin a priori ni considerar gastos) de pertenencia a cada
grupo utilizando la frmula:
Fg
e
Prob(g/D)=
FI FII
g =I,II
e +e
Como puede observarse, las probabilidades de pertenencia al propio grupo son
elevadas, excepto en el cliente cumplidor 13 que se clasifica errneamente en el
grupo de fallidos y que por aadidura tiene una probabilidad muy baja (0,1367)
de pertenencia al grupo de los cumplidores.
Client
e
1
2
3
4
5
6
7
8
Fallidos
Prob(I/D)
0,9975
0,9978
0,7575
0,9698
0,7687
0,8693
0,9185
0,8558
Prob(II/D)
Cliente
0,0025
0,0022
0,2425
0,0302
0,2313
0,1307
0,0815
0,1442
9
10
11
12
13
14
15
16
No Fallidos
Prob(I/D
Prob(II/D)
)
0,2826
0,7174
0,0622
0,9378
0,2100
0,7900
0,0009
0,9991
0,1367
0,8633
0,0114
0,9886
0,0155
0,9845
0,0053
0,9947
Como segunda aplicacin, se realiza la clasificacin incorporando

informacin a priori.
Santiago
18
de
la
Fuente
Fernndez
DI + DII ln II
Para clasificar a los clientes se va a utilizar el punto de corte Cp =
2
I
Si se establece que 1 = 0,10 y 2 = 0,90 , el valor que
se obtiene:
Cp =
=3,5202,1972=1,323
con lo que la funcin discriminante de Fisher ser:
DC =1,035.Patrimonio_Neto0,932.Deuda_Pendiente
1,323 resultando:
Client
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Grupo
pertenen
cia
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
4,1
6,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
Puntuacin
discriminant
e
3,7987
3,9243
1,056
1,2745
0,9927
0,3006
0,2297
0,4139
3,127
4,9056
3,5184
9,233
0,3511
6,6563
6,3443
7,4323
Grupo
clasificad
o
I
I
I
I
I
I
I
I
II
II
II
II
I
II
II
II
Los clientes 3, 5, 6 y 8, que antes estaban clasificados como fallidos, se

clasifican ahora como cumplidores, ya que su puntuacin discriminante ha
pasado de negativa a positiva. Lo mismo ocurre con el cliente 13 que
anteriormente estaba clasificado errneamente como fallido cuando era
cumplidor.
Ahora se calcula el punto de corte teniendo en cuenta la informacin a
priori e incorporando tambin los costes de la clasificacin errnea. Como
respecto al coste, se adopta el criterio de clasificar como cumplidor a un
cliente fallido es 20 veces superior al coste de clasificar como fallido a
Coste(II/I)
un cliente cumplidor. Es decir, se establece que, la ratio: =20
Coste(I/II)
El punto de corte discriminante ser:
Santiago
19
de
la
Fuente
Fernndez
DI + DII ln II Coste(I/II) = 0,518+6,522 ln

Cp,c =
2 I Coste(II/I) 2
0,1.20
0,9 = 4,319
La incorporacin de los costes ha determinado que el nuevo punto de corte

discriminante Cp,c est situado a la derecha del punto C, a diferencia de lo que
ocurra cuando solamente se tenan en cuenta las probabilidades a priori.
con lo que la funcin discriminante de Fisher ser:
DC =1,035.Patrimonio_Neto0,932.Deuda_Pendiente
4,319 resultando:
Client
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Grupo
pertenen
cia
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
4,1
6,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
Puntuacin
discriminant
e
6,7947
6,9203
1,94
4,2705
2,0033
2,6954
3,2257
2,5821
0,131
1,9096
0,5224
6,237
2,6449
3,6603
3,3483
4,4363
Grupo
clasificad
o
I
I
I
I
I
I
I
I
II
II
II
II
I
II
II
II
Se comprueba que no altera la clasificacin de ningn cliente respecto a la

utilizacin del punto de corte inicial C. Es decir, la incorporacin de los costes de
clasificacin errnea ha compensado, ms o menos, la menor probabilidad a
priori de ser un cliente fallido.
CLASIFICACIN EN MS DE DOS GRUPOS: ANLISIS DISCRIMINANTE
MLTIPLE
Nmero mximo de ejes discriminantes mn(G1,k) , donde G es el

nmero de categoras. Se obtienen (G1) ejes discriminantes si el nmero de
variables explicativas es mayor o igual que (G1) generalmente, este
hecho suele ser cierto .
Cada una de las funciones discriminantes Di se obtiene como funcin lineal

de las k variables explicativas: Di = wi1 X1 +wi2 X2 ++wik Xk i=1,,G1
Los (G1) ejes vienen definidos respectivamente por los vectores (w1 ,w2
,,wG1)
Santiago
20
de
la
Fuente
Fernndez
w11
w12
w21

w22
w2 =
w1 =
, ,
,
w2k

w1k
wG1,1
wG1,2
wG1 =
wG1,k
Para la obtencin del primer eje discriminante se maximiza la ratio variabilidad

variabilidad
dentrogrupos,
esdecir:
'
w Fw
separacin
entregrupos
(criterioobtencin
delprimerejediscriminante)
Mx1 = '1 1 =
w1 V w1 separacin
dentrogrupos
Derivando
la ratioe igualando
a cero:
1
=0 , conlo cual:
w1
entre grupos entre

1 = 2Fw1 (w1' Vw1' )2V2w1 (w1' Fw1) = 0 2Fw1 (w1' Vw1)2Vw1 (w'1 Fw1)= 0
w1
( w1 Vw1)
'
2Fw =1 (w' Fw1) =1 Fw1 = Vw1 1

operando con la expresin, resulta:
1
2Vw1
(w1
Vw1
1 w1 = V1
Fw1
siendo, por tanto,

La obtencin del vector w1 resulta un problema de clculo de un vector
caracterstico asociado a la matriz no simtrica (V1 F). De las races
caractersticas que se obtienen al resolver la ecuacin
w1 = V1 Fw1 se retiene la mayor, ya que 1 es la ratio que se pretende

maximizar y w1 es el vector caracterstico asociado a dicha raz caracterstica.
1
Como 1 es la ratio
discriminante. El resto
'
w1' Fw1
medir el poder discriminante del primer eje
w1 V w1
de los ejes discriminantes son otros vectores caractersticos de la matriz (V1 F),
ordenados segn el orden decreciente de las races caractersticas. As, el
Santiago
21
de
la
Fuente
Fernndez
segundo eje discriminante tendr menor poder discriminante que el primero,

pero ms que cualquiera de los restantes.
Puesto que la matriz (V1 F) no es simtrica, en general, esto implicar que los
ejes discriminantes no sern ortogonales, es decir, no sern perpendiculares
entre s.
Contrastes de significacin
En el anlisis discriminante mltiple se plantean contrastes especficos para
determinar si cada uno de los valores i es estadsticamente significativo, es
decir, para determinar si cada uno de los valores i contribuye o no a la
discriminacin entre los diferentes grupos.
Este tipo de contrastes se realiza a partir del estadstico V de Barlett. El
estadstico V es una funcin de la de Wilks y se aproxima a una chicuadrado,
tiene inters en el anlisis discriminante por su
descomponibilidad.
Estadstico V de
K variables categricas
Barlett: V
K+G
V =n1
(ln)
2
Este estadstico se utiliza en el anlisis
G grupos
H : = ==
0
multivariante para contrastar las hiptesis H1 :No todas las g son iguales
En el anlisis multivariante de la varianza con un factor se contrasta esta

hiptesis para determinar si el factor (variable categrica con G grupos)
explica la variabilidad del vector de variables dependientes de forma
significativa.
En el anlisis discriminante mltiple la hiptesis a contrastar sigue siendo
la misma, aunque los papeles se han invertido. Ahora se realiza el contraste
para tratar de dar respuesta a la pregunta: Las K variables clasificadoras
contribuyen significativamente a discriminar entre los G grupos?
Si no se rechaza la hiptesis nula citada, no se debera continuar el anlisis,

puesto que las variables clasificadoras utilizadas en la investigacin no tienen
ningn poder discriminante significativo.
Para examinar el poder discriminante de cada uno de los ejes que se
construyen en el anlisis discriminante, se descompone el estadstico V en
productos a partir de la descomposicin de la de Wilks. De acuerdo con su
definicin, el recproco de se puede descomponer:
1
1
1 T
1
1
= =V T =V T =V T = V
V
Santiago
22
de
la
(F+ V)
Fuente
= I+ V1 F
Fernndez
teniendo en cuenta que el determinante de una matriz es igual al producto

de sus races
caractersticas, se obtiene que:
=I+ V1 F= (1+1) (1+2) (1+G1)
sustituyendo en el estadstico V de Barlett, se obtiene la expresin
alternativa del estadstico:
K+G
G1
Estadstico V de Barlett: V =n1 2
g=1
ln(1+g)
Si se rechaza la hiptesis nula, significa que al menor uno de los ejes

discriminantes es
estadsticamente significativo. Esto implica a su vez que el primer eje
discriminante es
estadsticamente significativo, debido a que es precisamente el que tiene
mayor poder
discriminante.
En caso de que se acepte la hiptesis de que el primer eje discriminante es
significativo, se pasa a
contrastar la significacin conjunta del resto de los
ejes discriminantes, utilizando el estadstico:
K+G G1
V =n1 2
g=2
ln(1+g)
De forma general, se puede establecer la expresin de contrastacin

secuencial mediante el
estadstico:
K+G
G1
Estadstico V de Barlett: Vj =n1 2 g

0,1,2,,G2
=j+1
ln(1+g) donde
j=
As, en el proceso secuencial se van eliminando del estadstico V las races

caractersticas que van
resultando significativas, deteniendo el proceso
cuando se acepte la hiptesis nula de no
significatividad de los ejes
discriminantes que queden por contrastar.
Santiago
23
de
la
Fuente
Fernndez
PRSTAMOSRIESGO
Cuando una entidad financiera concede un prstamo personal a un cliente se
enfrenta a la doble posibilidad de que sea reintegrado o de que no lo sea. En
este ltimo caso el prstamo ser finalmente clasificado como fallido.
Obviamente, si la entidad financiera conociera de antemano que una persona va
a resultar fallida no le concedera el prstamo en ningn caso. En esta lnea,
puede utilizar la informacin existente en la entidad sobre prstamos concedidos
en el pasado para la concesin de prstamos futuros de forma que se evite, o al
menos, se reduzca la posibilidad de conceder prstamos que despus fueran
fallidos.
En los archivos de la entidad financiera existe informacin de las caractersticas
de las personas a las que se les ha concedido un prstamo, ya que el cliente en
el momento de solicitar el prstamo ha facilitado datos acerca de cuestiones
tales como ingresos, edad, sexo, situacin familiar, antigedad en el puesto de
trabajo, rgimen de tenencia de la vivienda, etc. Es muy posible que los clientes
cumplidores tengan unas caractersticas distintas a los clientes fallidos.
Utilizando estas caractersticas se trata de establecer unas funciones que
clasifiquen lo ms correctamente posible a los clientes a los que se les ha
concedido un prstamo en cumplidores y fallidos (finalidad explicativa).
Posteriormente, estas funciones se emplearn, en el caso de que se haya
realizado adecuadamente dicha clasificacin, para determinar si se conceden o
no los prstamos futuros a futuros solicitantes (finalidad predictiva).
ANLISIS DISCRIMINANTE CON SPSS
La tabla adjunta contiene informacin de 16 clientes de una entidad financiera a
los que se les concedi un prstamo. Pasados 3 aos desde la concesin del
prstamo, de los 16 clientes, haba 8 que fueron clasificados como fallidos
(grupo 1) mientras que los otros 8 clientes fueron cumplidores (grupo 2), ya que
reintegraron el prstamo.
Para cada uno de los 16 clientes se dispone de informacin sobre X1 = 'su
patrimonio neto' y
X2 ='sus deudas pendientes', en el momento de la solicitud. Con esta informacin
se pretende
construir una funcin discriminante que separe/diferencie lo ms posible a los
dos grupos y que permita clasificar, con los menores errores posibles, a los
distintos clientes en los dos grupos.
Cliente
Santiago
24
de
Prsta
mo
Patrimonio
Neto
la
Deuda
Pendiente
Fuente
Fernndez
1
1
1,3
4,1
2
1
3,7
6,9
3
1
5,0
3,0
4
1
5,9
6,5
5
1
7,1
5,4
6
1
4,0
2,7
7
1
7,9
7,6
8
1
5,1
3,8
9
2
5,2
1,0
10
2
9,8
4,2
11
2
9,0
4,8
12
2
12,0
2,0
13
2
6,3
5,2
14
2
8,7
1,1
15
2
11,1
4,1
16
2
9,9
1,6
El director de la entidad financiera tiene dos nuevas solicitudes de un prstamo
instantneo. El primer solicitante dispone de un patrimonio neto de 10,1, con
unas deudas pendientes de 6,8. Para el segundo solicitante los valores de estas
variables son 9,7 y 2,2 respectivamente. Qu decisin debe tomar?
(Nota. Las unidades monetarias se expresan en 100.000 euros)
Para hacer un Anlisis Discriminante, se selecciona sucesivamente del men
principal:
Analizar Clasificar
Discriminante
En primer lugar, hay que elegir cul es la Variable de Agrupacin, es decir,

qu variable juega el papel de variable categrica dependiente cuyas categoras
definen los posibles grupos de pertenencia de los individuos. En este caso, la
variable es Prstamo. Adems, en el botn con el nombre Definir Rango, es
necesario especificar cules son los valores Mnimo y Mximo de esta variable.
Se introducen los valores correspondientes: Mnimo: 1 y Mximo: 2.
Santiago
25
de
la
Fuente
Fernndez
Las otras dos variables, X1 = 'Patrimonio_ Neto' y X2 ='Deuda_Pendiente', se

eligen como variables
independientes, cuyos valores se
utilizan para construir la funcin discriminante. Estas variables pueden
introducirse en el modelo simultneamente o por etapas
SPSS ofrece en los distintos botones activados del cuadro de dilogo:
'Seleccionar', 'Estadsticos', 'Clasificar', 'Guardar'. El botn 'Mtodo' slo se
activa si previamente se ha elegido Introducir las variables con un Mtodo por
pasos.
Seleccionar: Permite reducir el anlisis a un subgrupo de la muestra total,
subgrupo que vendr definido por una variable de seleccin. Este no es el caso,
no se elige esta opcin.
ESTADSTICOS UTILIZADOS:
F de Snedecor: Se compara para cada variable las desviaciones de las
medias de cada uno de los grupos a la media total, entre las desviaciones a
la media dentro de cada grupo.
Si F es grande para cada variable, entonces las medias de cada grupo
estn muy separadas y
la variable discrimina bien.
Si F es pequea para cada variable, la variable discrimina poco, ya que
habr poca
homogeneidad en los grupos y stos estarn muy
prximos.
de Wilks: Se consideran las variables de modo individual, la es el cociente
entre la suma de cuadrados dentro de los grupos y la suma de cuadrados
total (sin distinguir grupos). Esto equivale a las desviaciones a la media
dentro de cada grupo, entre las desviaciones a la media total sin distinguir
grupos.
Si es pequeo la variable discrimina mucho: la variabilidad total se
debe a las diferencias
entre grupos, no a las diferencias dentro de
grupos.
VARIABLES ORIGINALES QUE SE CONSIDERAN: La idea del anlisis discriminante
es construir funciones lineales de las variables originales que discriminen entre
los distintos grupos. Sin embargo, no todas las variables discriminan de la misma
forma o tienen los mismos valores de la F de Snedecor o de la de Wilks. Por
ello, a la hora de construir las funciones lineales, no es necesario incluir a todas
las variables iniciales en la funcin.
Como criterio general para seleccionar una variable se emplea la seleccin del
valor de la de Wilks o, de modo equivalente, del valor de su F asociada.
Se utilizan fundamentalmente dos mtodos de seleccin de variables: el mtodo
directo ( Introducir independientes juntas) y el mtodo stepwise (Usar mtodo de
seleccin por pasos). En el mtodo directo se consideran todas las variables
originales que verifiquen un criterio de seleccin.
Santiago
26
de
la
Fuente
Fernndez
El mtodo stepwise funciona con varios pasos:

(a)
Se incluye en el anlisis la variable que tenga el mayor valor real aceptable

para el criterio de seleccin o de entrada.
(b)
Se evala el criterio de seleccin para las variables no seleccionadas. La

variable que presenta el valor ms alto para el criterio se selecciona (siempre
que se encuentre dentro de un lmite).
(c)
Se examinan las variables seleccionadas segn un criterio de salida y se

examinan tambin las variables no seleccionadas, para ver si cumplen el
criterio de entrada. Se excluyen o se incluyen variables segn cumplan los
criterios de entrada y salida.
(d)
Se repite el proceso hasta que ninguna variable ms pueda ser

seleccionada o eliminada.
Adems de todo lo expuesto, en el SPSS se considera un nmero mximo de

pasos, dado que una variable puede ser incluida y eliminada en ms de una
ocasin. Se toma el doble del nmero de variables originales como nmero
mximo de pasos del mtodo stepwise.
En SPSS se considera tambin para cada variable la tolerancia asociada: Se
define para un conjunto de p variables, Ri coeficiente de correlacin mltiple,
que expresa el porcentaje de variabilidad de la variable (xi i=1,,p) recogida por
el resto de (p1) variables. R2i coeficiente de determinacin.
La tolerancia se define como (1R2i ). Cuanto mayor sea la tolerancia de una
variable, ms informacin independiente del resto de variables recoger.
De este modo, si en una iteracin dada del
procedimiento stepwise la variable
seleccionada verifica que su tolerancia con
respecto a las variables ya incluidas en la
funcin discriminante es muy pequea
entonces la variable no se incluye en dicha
etapa. As, se evita la redundancia de
informacin.
La opcin [Estadsticos] se encuentra
dividida en tres grandes reas: Descriptivos, Coeficientes de la funcin y
Matrices.
DESCRIPTIVOS:
Medias: Proporciona el vector de medias (los centroides) y desviaciones tpicas
de cada variable para cada grupo.
Univariante ANOVA: Contrasta igualdad de medias entre los grupos para cada
variable.
Santiago
27
de
la
Fuente
Fernndez
M de Box: Contrasta la hiptesis nula de que las matrices de varianzas

covarianzas poblacionales son iguales en los distintos grupos.
COEFICIENTES DE LA FUNCIN:
De Fisher: Coeficientes de la funcin de clasificacin bajo Normalidad
No tipificados: Coeficientes de la funcin discriminante cannica de Fisher
'centrados'
MATRICES:
Covarianza de grupos separados: Proporciona la matriz de varianzas y
covarianzas de cada grupo, es decir, las matrices S1 y S2 , donde:
nk

Sk = n
i=1
i=1
i=1
i=1
k =1,2
2
nk
Covarianza intragrupos: Proporciona la matriz de varianzas y covarianzas

'combinada', obtenida como media ponderada de las dos anteriores, es decir:
(n1 1)S1 +(n2 1)S
S=
n1 +n2 2
Covarianza Total: Proporciona la matriz de varianzas y covarianzas de (X1,
X2) para todos los n + n = 16 individuos de la poblacin, sin distincin de
grupo.
1
COMPROBACIN SUPUESTOS PARAMTRICOS: La funcin discriminante minimiza

la probabilidad de equivocarse al clasificar a los individuos en cada grupo. Para
ello, las variables originales se deben distribuir como una normal multivariante y
las matrices de covarianzas deben de ser iguales en todos los grupos. En la
prctica es una tcnica robusta y funciona bien aunque las dos restricciones
anteriores no se verifiquen.
Si un conjunto de variables se distribuye como una normal multivariante,
entonces cualquier combinacin lineal de ellas se distribuye como una
Santiago
28
de
la
Fuente
Fernndez
normal multivariante. Por ello, si alguna de las variables originales no se

distribuye como una normal, entonces es seguro que todas las variables
conjuntamente no se distribuirn como una normal multivariante.
La segunda restriccin se ocupa de la igualdad entre las matrices de
covarianzas de los grupos. Para comprobar esto, se puede utilizar la Prueba
M de Box, que tiene como hiptesis nula que las matrices de covarianzas son
iguales. Se basa en el clculo de los determinantes de las matrices de
covarianzas de cada grupo. El valor obtenido se aproxima por una F de
Snedecor. Si el p_valor < 0,05 se rechaza la igualdad entre las matrices de
covarianzas.
El test de M de Box es sensible a la falta de normalidad multivariante, es
decir, matrices iguales pueden aparecer como significativamente diferentes
si no existe normalidad. Por otra parte, si las muestras son grandes, pierde
efectividad (es ms fcil rechazar la
hiptesis nula).
En este caso, se dejan las opciones que

vienen por defecto en SPSS.
Lambda de Wilks: Estadstico que mide el poder discriminante de un conjunto
de variables
V
V
1
=
=min(q1, p)
T V +F
(1+I)
(0 1)
i=1
Cuanto ms cerca de 0 mayor es el poder discriminante de las variables

consideradas, y cuanto
ms cerca de 1 menor es el poder discriminante.
Estadsticos asociados: F de Rao; 2 de Barlett (tests sobre las diferencias de
medias en ambos grupos)
La isima correlacin cannica viene dada por: CRi =
i
1+i
Mide, en trminos relativos, el poder discriminante de la isima funcin

discriminante, ya que es el porcentaje de la variacin total en dicha funcin
Santiago
29
de
la
Fuente
Fernndez
que es explicada por la

diferencia entre los grupos, 0
CRi 1, cuanto ms cerca de 1
est su valor, mayor es la
potencia discriminante de la i
sima funcin discriminante.
Una opcin interesante en la
opcin [Clasificacin] es la de
'Reemplazar los valores perdidos con la media'. En ms de una investigacin,
por algn motivo en la base de datos hay valores perdidos, y para que estos no
afecten los resultados finales, existe sta opcin de reemplazo, que se
recomienda utilizar.
PROBABILIDADES PREVIAS:
Son las probabilidades a priori para cada grupo. En este caso seran p1 =
p(pertenecer al grupo 1) , p2 = p(pertenecer al grupo 2). Estos valores se
utilizan, por ejemplo, en la regla de clasificacin de la mxima verosimilitud
bajo el supuesto de normalidad.
Todos los grupos iguales: p1 = p(pertenecer al grupo 1) = p2 = p(pertenecer al
grupo 2) =
USAR MATRIZ DE COVARIANZA:
Intragrupos: De esta manera se especifica que cuando se obtengan los
autovectores de la matriz
(V1 F), que son precisamente los coeficientes de las distintas funciones
discriminantes, se utilice la restriccin aSa=1, utilizando la matriz de varianzas
entre grupos 'combinada' S.
MOSTRAR:
Resultados para cada caso: Muestra el proceso de clasificacin paso a paso para
cada uno de los 16 individuos de la poblacin, con las probabilidades a posteriori
para cada uno de ellos, calculadas a partir de las puntuaciones discriminantes.
Tabla de resumen: Proporciona la matriz de confusin, es decir la matriz de
clasificacin para los propios 16 individuos de la muestra para los que
conocemos de antemano su adscripcin.
Clasificacin dejando uno fuera: Proporciona la matriz de clasificacin pero
obtenida con el mtodo Jacknife, que obtiene, en general una estimacin de la
proporcin de clasificaciones errneas ms fiable.
GRFICOS:
Santiago
30
de
la
Fuente
Fernndez
Grupos combinados: Representa las puntuaciones discriminantes o valores de

la(s) funcion(es) discriminante(s), para los 16 individuos de la muestra (8 de
cada grupo) todos juntos en un grfico, junto con sus centroides.
Como slo hay una funcin discriminante este grfico no se hace (si se
selecciona, luego no aparece).
Grupos separados: Representa un grfico como el anterior pero para cada grupo.
En este caso, representara en el primer grfico nicamente los 8 individuos del
El Visorderesultados
deSPSSmuestra:
grupo 1 y en el segundo slo los 8 del grupo 2.

Mapa territorial: Con una nica funcin discriminante no lo hace .
Si se desea que el anlisis sea 'Guardado' se procede a dar un clic en el botn
de la opcin [Anlisis discriminante].
Se muestran los estadsticos descriptivos: media y desviacin tpica total de

(X1, X2) sobre los n = n1 + n2 = 16 individuos y para los dos grupos: Media y
desviacin tpica de (X1, X2) para los n1= 8 clientes del grupo 1, y media y
desviacin tpica de (X1, X2) para los n2 = 8 clientes del grupo 2.
Se observa que el punto de corte discriminante de los dos grupos
para la variable X1 = 'Patrimonio_Neto' se encuentra en el valor 7:
X1,I + X1,II
X1,I = 5
X1,II =9
5+9
C1 = =
2
=7
El punto de corte se toma como referencia para clasificar a un individuo en uno u

otro grupo ( fallido, cumplidores): Si el Patrimonio_Neto es menor que 7 se
clasifica al cliente como fallido (grupo 1) , mientras que se clasifica como
cumplidor (grupo 2) si el Patrimonio_Neto es mayor que esa cifra.
Por otra parte, el punto de corte discriminante de los dos grupos para la variable
X2 = 'Deuda_Pendiente' de los dos grupos ser:
Santiago
31
de
la
Fuente
Fernndez
X2,I + X2,II
X2,I = 5 X2,II =3
C1 = =
2
2
5+3
=4
Si las deudas pendientes son mayores que 4 se clasifica al cliente como fallido
(grupo 1), mientras que se clasifica como cumplidor (grupo 2) si las deudas
pendientes son menores que esa cifra.
Los contrastes de igualdad de
medias entre los dos grupos para
cada variable (en ambos casos
se rechaza la hiptesis nula, p_valor < 0,05, es decir, los dos grupos, en media
son diferentes).
La informacin de esta tabla de ANOVAs univariados suele utilizarse como
prueba preliminar para detectar si los grupos difieren en las variables de
clasificacin seleccionadas; sin embargo, hay que considerar que una variable no
significativa a nivel univariante podra aportar informacin discriminativa a nivel
multivariante.
La salida de la matriz de covarianzas proporciona:

4,289
1,824
5,240
0,177
8,713
S1 =1,824 3,474 , S2 =0,177 3,043 , Stotal
=1,199
4,108
1,199
Por otra parte, la media ponderada de S1 y S2 debe de coincidir con la matriz

'intragrupos combinada', denominada S. Es decir, debe verificarse que:
4,764
0,177
S =1,001
3,043
Santiago
32
1,001 (n1 1)S1 +(n2 1)S2
3,259=
de
7 4,289
n1 +n2 2 = 14 1,824
la
1,824
7 5,240
3,474+ 14 0,177
Fuente
Fernndez
Aparece despus la Prueba de Box para el contraste de la hiptesis nula de

igualdad de las matrices de varianzascovarianzas poblacionales. Uno de los
supuestos del anlisis discriminante es que todos los grupos proceden de la
misma poblacin y, ms concretamente, que las matrices de
varianzascovarianzas poblacionales correspondientes a cada grupo son iguales
entre s.
Elestadstico
M deBoxtomalaforma:M =(ng) logS (nj 1) logSj
j=1
DondeSeslamatrizdevarianzas
covarianzas
combinada,
Sj eslamatrizdevarianzas
covarianzas
del grupo jsimo, n es el nmero total de casos y g el nmero de grupos. El
estadstico M carece de distribucin muestral conocida, pero puede
transformarse en un estadstico F e interpretarse como tal (muchos
investigadores critican este estadstico por ser demasiado sensible a pequeas
desviaciones de la normalidad multivariante y a tamaos muestrales grandes,
tendiendo a ser conservador).
Se observa que la primera tabla ofrece los logaritmos de los determinantes de
todas las matrices utilizadas en el clculo del estadstico M. Dado que el
estadstico es multivariante, la tabla permite comprobar qu grupos (cuando hay
ms de dos) difieren ms.
La tabla (Resultados de la prueba) ofrece la prueba M de Box y su
transformacin en un estadstico F.
El resultado de la prueba hace que no se rechace la igualdad de matrices de
varianzascovarianzas (Sig=0,849 > 0,05), concluyendo que los dos grupos
tienen la misma matriz de varianzascovarianzas (no hay un grupo ms variable
que otro).
A continuacin aparecen los resultados del anlisis discriminante (estadsticos
por pasos):
Santiago
33
de
la
Fuente
Fernndez
Las variables son introducidas/eliminadas del modelo en la medida en que

tengan asociado un menor valor del estadstico de Wilks.
Como hay g=2 grupos y p=2 variables, slo hay q=min (k, g1)=1 funcin
discriminante, o equivalentemente, la matriz (V1 F) tiene rango q=min (k, g
1)=1 y slo hay un autovalor distinto de cero, =1,716, que es el que aparece
en la tabla.
1
El autovalor de una funcin se interpreta como la parte de variabilidad total de la

nube de puntos proyectada sobre el conjunto de todas las funciones atribuible a
la funcin. Si su valor es grande, la funcin discriminar mucho.
1 1,716
Adems, se refleja el coeficiente eta o correlacin cannica: = =
= 0,795
1 +1
1 + 1,716
Las correlaciones cannicas, miden las desviaciones de las puntuaciones
discriminantes entre grupos respecto a las desviaciones totales sin distinguir
grupos. Si su valor es grande (prximo a 1) la dispersin ser debida a las
diferencias entre grupos, y en consecuencia, la funcin discriminar mucho.
1
1
El estadstico del contraste de significacin global Lambda de Wilks: =
=
= 0,368 1+1
1+1,716
Santiago
34
de
la
Fuente
Fernndez
que conduce a rechazar la hiptesis nula de igualdad de medias [pvalor = 0,02

< 0,05], lo que indica la conveniencia de extraer una (la nica posible) funcin
discriminante, o lo que es lo mismo, que dicha funcin sea significativa.
Interpretacin de las funciones discriminantes: a la vista de los valores de (X
,y), y (X ,y), parece
1 2 que la
variable que ms contribuye a la discriminacin es X1 = 'Patrimonio_Neto'
COEFICIENTES ESTANDARIZADOS: Aparecen los coeficientes de la funcin

discriminante cannica estandarizados, estos coeficientes aparecen cuando se
tipifican o estandarizan cada una de las variables clasificadoras para que tengan
media 0 y desviacin tpica 1. De esta forma se evitan los problemas de escala
que pudieran existir entre las variables y, consecuentemente, la magnitud de los
coeficientes estandarizados son un indicador de la importancia que tiene cada
variable en el clculo de la funcin discriminante. En esta lnea, se observa que
la variable Patrimonio_Neto (X1) tiene una influencia que es casi un 50%
superior a la ejercida por la variable Deuda_Pendiente (X2).
MATRIZ DE ESTRUCTURA: Es conveniente conocer cules son las variables que
tienen mayor poder discriminante en orden a clasificar a un individuo en uno de
los grupos (fallidos, cumplidores). Una forma de medir ese poder discriminante
es calculando el coeficiente de correlacin entre cada una de las variables y la
funcin discriminante. Esta es precisamente la informacin que se da en la tabla
(Matriz de estructura), en este caso, la correlacin de la funcin discriminante
con la variable Patrimonio_Neto (0,748) es mayor en valor absoluto que con la
variable Deuda_Pendiente (0,452). Las comparaciones deben hacerse siempre
en valor absoluto. En el programa SPSS las variables aparecen ordenadas de
acuerdo con el valor absoluto de los coeficientes de correlacin.
Los Coeficientes de las funciones discriminantes cannicas de Fisher son:
Santiago
35
de
la
Fuente
Fernndez
En la tabla aparece informacin de los coeficientes de la funcin discriminante

cannica no estandarizados. Los coeficientes de esta funcin son estrictamente
proporcionales a los coeficientes de la funcin discriminante de Fisher (DC). En
este caso, el factor de proporcionalidad es 0 ,408; esto es, cada coeficiente es
igual a 0,408 multiplicado por el coeficiente de la funcin discriminante de
Fisher. Estos coeficientes no estandarizados se obtienen utilizando la regla de
normalizacin de
w'V w =1, as pues, se toma como norma el denominador de la variacin dentro
de los grupos:
w'Fw variacin entre grupos
Los coeficientes w se obtienen: Mx =
=
w'V w
variacin dentro grupos
Centroides de cada grupo (media de la funcin discriminante en cada grupo):

Con los resultados obtenidos, el punto de corte
discriminante ser el punto medio de las
funciones en los
D +D
1,225+1,225
centroides de los grupos: C =
=
=0
2
Estadsticos de clasificacin:
Probabilidades a priori de
pertenencia a los grupos (se supone p1 = p2 = 1 / 2)
Coeficientes de la funcin de clasificacin: Aqu se muestran los coeficientes de

las funciones de clasificacin que se obtendran bajo el supuesto de Normalidad
bivariante para (X1, X2) en ambas poblaciones, utilizando el criterio de la mxima
verosimilitud y probabilidades (p1 = p2 = 1/2) a priori iguales.
Las funciones de clasificacin son:
FI = 0,777.Patrimonio_Neto+1,296.Deuda_Pendiente5,876
Santiago
36
de
la
Fuente
Fernndez
FII
=1,813.Patrimonio_Neto+0,364.Deuda_Pendiente9,396
1
Para el grupo 1, la funcin de clasificacin es de la forma: d I(x)= x1' S1 x

x1 '
S1 x1 +ln(p1)
2
Los centros de
gravedad o
centroides de los
Matriz intra
xI =
grupo dos
X2,I
grupos sern:
combinada:
X1,I 5
=5
S =
xII =X2,II=3
dI(x)=[5
X1,II 9
4,764
1,001
1,001
3,259
5 41,,001764 13,,259001 XX12 12 [5
5 41,,001764 13,,259001 55 +ln(0,5)=
X1
X
= 0,777.Patrimonio_Neto+1,296.Deuda_Pendiente5,876
2
1
Para el grupo 2, la funcin de clasificacin es de la forma: dII(x)= x2' S1 x x2' S1
x2 +ln (p2) 2
dII(x)=[9 3 41,,001764
13,,2590011 XX12 21 [9
3 41,,001764 13,,2590011 93 +ln(0,5)=
X1
X
=1,813.Patrimonio_Neto+0,364.Deuda_Pendiente9,396
2
Santiago
37
de
la
Fuente
Fernndez
Cada sujeto ser asignado al grupo en el que obtenga un mayor valor de estas
funciones.
La funcin discriminante de Fisher [DC =FII FI]:

DC =1,035.Patrimonio_Neto0,932.Deuda_Pendiente3,520
El programa SPSS no ofrece la funcin discriminante de Fisher.
Estadsticos por casos: Para cada caso, se muestran las puntuaciones
discriminantes, las distancias de Mahalanobis de dichas puntuaciones al
centroide de cada grupo y las probabilidades a posteriori obtenidas a partir de
esas distancias.
En este caso solo se ha encontrado un caso mal clasificado segn la funcin

lineal discriminante, se trata del grupo 2 (caso 13 en la tabla de estadsticos de
clasificacin) que ha sido incluido errneamente dentro del grupo 1.
Como puede verse

los dos centros de
gravedad equidistan
de la recta
delimitadora.
Santiago
38
de
la
Fuente
Fernndez
El director de la entidad financiera clasifica a las dos solicitudes de prstamos.

Para ello, basta sustituir, en la funcin discriminante de Fisher, los valores de
Patrimonio_Neto y Deuda_Pendiente:
DC =1,035.Patrimonio_Neto0,932.Deuda_Pendiente3,520
Primer solicitante: DC =1,035.(10,1)0,932.(6,8)3,520 = 0,5959
Segundo solicitante: DC =1,035.(9,7)0,932.(2,2)3,520 = 4,469
Como la puntuacin es positiva en ambos casos, se clasifican a los dos
solicitantes en el grupo de los cumplidores, si bien hay que hacer notar que el
segundo solicitante tiene una puntuacin discriminante mucho ms elevada.
CRITERIOS ALTERNATIVOS DE CLASIFICACIN: Existen otros muchos criterios de
clasificacin. Entre ellos, destacar el anlisis de regresin y la aplicacin de la
distancia de Mahalanobis. A continuacin se indican sus rasgos bsicos, as
como su relacin con el anlisis discriminante de Fisher.
ANLISIS DE REGRESIN: La relacin entre el anlisis discriminante y el anlisis
de regresin es muy estrecha. Si se realiza una ajuste por mnimos cuadrados,
tomando como variable dependiente la variable dicotmica que define la
pertenencia a uno u otro grupo y como variables explicativas a las variables
clasificadoras, se obtienen unos coeficientes que tienen una estricta
proporcionalidad con los coeficientes de la funcin discriminante de Fisher,
A partir del coeficiente de determinacin, que se calcula en el anlisis de
regresin, se puede pasar con facilidad a la distancia de Mahalanobis entre los
dos centroides de los dos grupos.
DISTANCIA DE MAHALANOBIS (1936): Es una generalizacin de la distancia
eucldea, que tiene en cuenta la matriz de covarianzas intragrupos. El
cuadrado de la distancia de Mahalanobis
(DM2ij) entre los grupos i y j en un espacio de p dimensiones, siendo (Vw) la
matriz de covarianzas intragrupos, viene definida de forma: DM2ij =(xi xj)'
Vw1 (xi xj)
donde los vectores xi y xj representan dos puntos en el espacio p dimensional.
En la terminologa usual para designar esta distancia se prescinde de la M
(introducida para evitar confusiones con las puntuaciones discriminantes a las
que se ha designado por D).
El cuadrado de la distancia eucldea d2ij entre los puntos (i, j) viene dado por la
expresin:
p
d
h=1
La distancia eucldea es el caso particular de la distancia de Mahalanobis en la

que (Vw =I). Es decir, la distancia eucldea no tiene en cuenta la dispersin de
las variables y las relaciones existentes entre ellas, mientras que en la
Santiago
39
de
la
Fuente
Fernndez
distancia de Mahalanobis s que se descuentan estos factores al introducir en la

expresin DM2ij =(xi xj)' Vw1 (xi xj) la inversa de la matriz de covarianzas intra
grupos.
Con el criterio de Mahalanobis, aplicando DM2ij =(xi xj)' Vw1 (xi xj), se calcula la
distancia entre cada punto y los dos centroides.
DMi2,I =(xi xI)' Vw1 (xi xI)
As, para el punto isimo se obtienen estas dos distancias:

DM2i,II =(xi xII)' Vw1 (xi xII)
La aplicacin de este criterio consiste en asignar cada individuo al grupo para

el que la distancia de Mahalanobis es menor.
La distancia de Mahalanobis clasifica a los individuos exactamente igual que lo
hace la funcin discriminante de Fisher. La diferencia entre uno y otro tipo de
procedimiento es que, mientras la distancia de Mahalanobis se calcula en el
espacio de las variables originales, en el criterio de Fisher se sintetizan todas
las variables en la funcin discriminante, que es la utilizada para realizar la
clasificacin.
En el fichero (prestamoriesgo.sav) se han guardado las columnas: Dis_1 (Grupo
pronosticado para el anlisis 1), Dis1_1 (Puntuacin discriminante de la funcin
1 para el anlisis 1), Dis1_2 (Probabilidades de pertenencia al grupo 1 para el
anlisis 1) y Dis2_2 (Probabilidades de pertenencia al grupo 2 para el anlisis 1)
Santiago
40
de
la
Fuente
Fernndez
CONCESIN PRSTAMOS RIESGO

Un banco realiza un estudio con el objetivo de identificar con la mayor precisin
posible aquellas solicitudes de prstamos que probablemente puedan llegar a
convertirse en morosos o fallidos en el caso que se concedieran. Para ello,
dispone de la informacin reflejada en la tabla adjunta, relativa a 25 clientes y a
las variables que se analizan:
Cumplimiento: Grado de cumplimiento del cliente en el reintegro del

prstamo. Toma el valor 1 si el cliente es cumplidor, 2 si es moroso y 3 si es
fallido.
Ingresos: Ingresos anuales del cliente, en miles de euros.
Patrimonio Neto: Patrimonio neto del cliente en miles de euros.
Vivienda: Variable dicotmica que toma el valor 1 si el cliente es
propietario; 0 en caso contrario. Casado: Variable dicotmica que toma el
valor 1 si est casado; 0 en otro caso.
Contrato Trabajo: Variable dicotmica que toma el valor 1 si el cliente es
asalariado con contrato fijo; 0 en otro caso.
Client Cumplimien Ingreso Patrimonio

Viviend Casad Contrato
e
to
s
neto
a
o
trabajo
1
1
32,7
336
1
1
0
2
1
18,6
204
1
0
1
3
1
24,6
138
0
1
1
4
1
37,2
270
1
0
1
5
1
23,7
114
1
1
1
6
1
7,5
132
1
1
1
7
1
29,4
90
0
1
1
8
1
53,4
228
1
1
1
9
1
20,1
324
0
1
1
10
1
31,2
480
1
1
0
11
1
17,1
108
1
1
1
12
1
39
132
1
1
1
13
1
45,6
216
1
1
1
14
2
26,1
234
1
1
0
15
2
8,1
48
0
1
1
16
2
12,6
114
0
0
1
17
2
8,7
150
1
0
1
18
2
38,4
24
0
1
1
19
2
22,8
114
1
1
0
20
2
14,7
60
0
1
1
21
3
19,8
42
0
1
0
22
3
5,1
72
0
1
0
23
3
7,2
30
1
1
1
24
3
11,1
36
1
0
0
25
3
15,9
150
0
0
0
Se trata de un Anlisis discriminante mltiple, ya que el banco ha clasificado a
los clientes en tres grandes grupos, habr que construir funciones discriminantes
Santiago
41
de
la
Fuente
Fernndez
que permitan clasificar, con los menores errores posibles, a los clientes en los
diferentes grupos. Si se obtienen buenos resultados, estas funciones
discriminantes se podrn utilizar para analizar si se concede un prstamo o no a
un futuro cliente peticionario.
Santiago
42
de
la
Fuente
Fernndez
Seselecciona
Cumplimiento
comovariable
de
agrupacin
(cuyorangoes1 y 3)y lasotrascinco
variables
comoindependientes.
El mtododeinclusin
porpasos.
Santiago
43
de
la
Fuente
Fernndez
Lasmedias
de
lascinco
Anlisis
Discriminante
variables
introducidas
como
independientes
enel anlisis
sonmayores
enla categora
de
cumplidores
queenlasotras
categoras.
As,losclientes
cumplidores,
en
relacin
conlosotrosdos
grupos(morosos,
fallidos),
tienenmayores
ingresos,
un
mayorpatrimonio,
son
propietarios
dela vivienda
que
habitanestncasados
y son
asalariados
concontrato
fijo.
LasANOVAsindicanquenoseobservan
diferencias
significativas
entreloscumplidores,
morosos
y fallidos,
encuantoal hechodeser
propietario
o nodela vivienda
(Vivienda
) y el
estarcasado
o no(Casado
).
El Visor de resultados de SPSS muestra:
En consecuencia, las variables (Vivienda) y (Casado) no deberan tener una gran

influencia a la hora de clasificar a los clientes en uno u otro grupo. Obsrvese
que en ambos casos, p_valor > 0,05, se acepta la hiptesis nula, es decir, los
grupos en media son iguales.
En la siguiente tabla se observa el contraste de la Prueba de Box para
determinar si es aceptable o no la hiptesis de homocedasticidad. Primero
aparece el logaritmo del determinante de las matrices de
V g covarianzas
de los residuos de cada celda, calculadas segn la expresin S g =
(la
matriz Sg es ng 1 una estimacin de la matriz de covarianzas correspondiente
a la celda gsima g), y la matriz de
G
V (n
g
Santiago
44
de
G
g
1)Sg
la
Fuente
Fernndez
covarianzas global, calculada segn la expresin S
g=1
g=1
= = (donde
S es una estimacin
nG nG
de la matriz de covarianzas global ), as como el rango de cada una de estas
matrices.
Las matrices son de orden 5x5, ya que existen cinco variables clasificadoras.
Si las matrices son no singulares (tienen inversa) su rango debe de ser 5. Se
observa, en este caso, que la matriz correspondiente al grupo 3 (cliente fallido)
no se calcula porque existen muy pocos casos para ser no singular, en efecto se
puede observar que el nmero de individuos que pertenecen al grupo 3 (clientes
fallidos) es justamente 5 y con este tamao la matriz de covarianzas de los
residuos es necesariamente singular.
Debido a que la matriz del grupo 3 (fallidos) es singular, SPSS contrasta la

igualdad de las matrices de covarianzas poblacionales en los grupos 1 y 2,
respectivamente, cliente cumplidores y morosos, estimando la matriz de
covarianzas global con los datos de estos dos grupos. El nivel de significacin
crtico que se obtiene en este contraste es 0,048, con lo que se acepta la
hiptesis nula para un nivel de significacin del 1% (0,048 > 0,01), pero no para
un nivel del 5% (0,048 < 0,05, rechazndose la hiptesis nula).
En la tabla de Lambda de Wilks se aplica el contraste de significacin para el

conjunto de los dos ejes discriminantes. El contraste V de Barlett que se aplica
es:
K+G
G1
Vj =n1 2
Santiago
45
de
=j+1
ln(1+g) donde
la
j= 0,1
Fuente
Fernndez
[ln(1+ )+ln(1+ )]=251 2+2

[ln(1+2,264)+ln(1+0,043)]=26,343
V0 =n1 K+2G
Los grados de libertad de la chicuadrado son K(G1)=2(31)= 4 y el nivel de

significacin crtico es
0,000 < 0,05 rechazando, por tanto, la hiptesis nula, lo que significa que al
menos uno de los ejes discriminantes es significativo, es decir, el primer eje
discriminante es significativo (es el que tiene mayor poder discriminante).
Advirtase que si no se rechaza la hiptesis nula no debera continuar el anlisis.
Obsrvese que se cumple la relacin entre la landa de Wilks y las races
caractersticas ( autovalores ):
=
= 0,294
Una vez determinada la significatividad del primer eje discriminante, se

contrasta la significatividad de los restantes, en este caso, del segundo eje
discriminante. El contraste a aplicar es el siguiente:
K+G
[ln(1+ )]=251 2+2

2
3
[ln(1+0,043)]= 0,909
V1 =n1 2
Los grados de libertad de la chicuadrado son (K1)(G11)=(21)

(311)=1(en el anlisis no entran 3 variables clasificadoras) y el nivel de
significacin crtico es 0,340 > 0,05, aceptando la hiptesis nula, lo que significa
que el segundo eje discriminante no es significativamente distinto de 0 para
cualquiera de los niveles de significacin usuales.
La relacin entre la landa de Wilks (obtenida despus de excluir la primera
funcin discriminante) y la segunda raz caracterstica (segundo autovalor) es la
siguiente:
1 =
= 0,959
Como informacin complementaria, se calcula la correlacin cannica de cada

funcin discriminante con la variable categrica que define los grupos,
obtenindose:
Santiago
46
de
la
Fuente
Fernndez
1 = 2,264 = 0,833
1 =
1+1
1+2,264
2 = 1 =
0,043 = 0,203
1+1 1+0,043
Los resultados obtenidos confirman que la capacidad explicativa de la segunda

funcin discriminante es muy inferior a la primera. Una confirmacin final de
esta conclusin es que el porcentaje de varianza explicada con la primera
funcin discriminante es del 98,1%, mientras que la varianza explicada con la
segunda funcin discriminante es del 1,9%. Con lo que a efectos prcticos se
podra prescindir de la segunda funcin discriminante, sin que afectase de forma
importante a los resultados de la clasificacin.
COEFICIENTES ESTANDARIZADOS: Aparecen los coeficientes de la funcin

discriminante cannica estandarizados (media 0 y desviacin tpica 1), de esta
forma se evitan los problemas de escala que pudieran existir entre las variables
y, en consecuencia, la magnitud de los coeficientes estandarizados son un
indicador de la importancia que tiene esta variable en el clculo de la funcin
discriminante.
MATRIZ DE ESTRUCTURA: Conviene conocer cules son las variables que tienen
mayor poder discriminante en orden a clasificar a un individuo en uno de los
grupos (cumplidor, moroso, fallido). Una forma de medir ese poder discriminante
es calculando el coeficiente de correlacin entre cada una de las variables y la
funcin discriminante. Con un asterisco se indica el coeficiente ms grande (en
valor absoluto) que tiene cada variable.
As, la variable Casado tienen su mayor coeficiente con la funcin discriminante
1, mientras que las variables Contrato_Trabajo e Ingresos lo tienen con la funcin
discriminante 2.
Santiago
47
de
la
Fuente
Fernndez
Aparecen las puntuaciones de los centroides de los grupos (Patrimonio_Neto,

Contrato_Trabajo) con respecto a las funciones discriminantes (conviene darse
cuenta que en este caso no hay un punto de corte discriminante, pues el
conjunto de datos se encuentra separado en tres grupos).
Ahora falta calcular el valor de tres funciones de clasificacin, y se clasificar a
cada individuo en aqul grupo cuya funcin discriminante resulte tomar el mayor
valor.
De esta forma, las funciones de clasificacin son:
FI =
0,063.Patrimonio_Neto+13,721.Contrato_Trabajo13,590
FII =
(cliente
cumplidor)
(cliente
moroso)
(cliente fallido)
FIII =
1
Para su aplicacin, se calcula la puntuacin de cada individuo en cada uno de los

grupos, utilizando las funciones clasificadoras. Finalmente, un individuo se
clasifica en el grupo en el que ha alcanzado la puntuacin ms elevada.
El mapa territorial sirve para ver cmo quedan la clasificacin en funcin de las
dos funciones lineales discriminantes:
Santiago
48
de
la
Fuente
Fernndez
El mapa territorial delimita, en el plano de las dos funciones discriminantes (no

estandarizadas), las reas que se asignan a cada grupo. El rea situada en la
parte derecha de la funcin discriminante 1 es la correspondiente al grupo 1,
mientras que el rea de la izquierda corresponde al grupo 3. Se clasifican en el
grupo 2 los individuos con puntuaciones discriminantes cannicas situadas en el
tringulo de la parte central.
La salida de SPSS recoge el clculo de probabilidades a posteriori, puntuaciones
discriminantes y resultados de la clasificacin. En este caso, no aparece la
columna etiquetada con (valores faltantes) donde se refleja casos o individuos
para los que no se dispone de informacin completa. Aparece la columna Grupo
real de pertenencia y Grupo pronosticado, que cuando aparece con un asterisco
refleja que el individuo a que corresponda se le clasifica de forma errnea.
Las columnas siguientes son relativas al clculo de probabilidades. Las
probabilidades a posteriori P(G/D) se calculan para cada grupo con la frmula:
Santiago
49
de
la
Fuente
Fernndez
I I e
Fg
II
g =I,II g grupo
(extendida a tres variables)
Prob(g/D)=I eF +II eF i probabilidad a priori

Con este criterio se clasifica a un individuo en el grupo I si: FI lnI >FII lnII .
La aplicacin de este criterio implica que el punto de corte discriminante Cp viene
definido por:
Punto de corte con informacin a priori:
C=
p
DI +DII
II
ln
2
I
En la salida del SPSS se indica la probabilidad a posteriori ms alta con

indicacin al grupo a que corresponde y la segunda probabilidad ms alta con
indicacin del grupo. Junto a la probabilidad ms alta aparece la probabilidad de
la puntuacin discriminante P(D/G), que no tiene inters especial en el anlisis.
Las dos ltimas columnas se refieren a las puntuaciones discriminantes. Cada
una de ellas corresponde a una funcin discriminante. En SPSS estas
puntuaciones se calculan utilizando los coeficientes de las funciones
discriminantes cannicas no estandarizadas.
Estadsticos por caso: Para cada caso, se muestran las puntuaciones

discriminantes, las distancias de Mahalanobis de dichas puntuaciones al
centroide de cada grupo y las probabilidades a posteriori obtenidas a partir de
esas distancias.
Se observa que hay seis casos mal clasificados, comprobndose como las
probabilidades de pertenencia son mayores para la pertenencia al grupo mayor,
Santiago
50
de
la
Fuente
Fernndez
y tambin que las puntuaciones discriminantes son las que sitan a cada caso
en el mapa territorial.
Los resultados de la investigacin son satisfactorios, ya que contiene un
porcentaje elevado de clientes clasificados satisfactoriamente (76%), si bien
preocupa el caso de un cliente moroso ( cliente
17) que ha sido calificado como cumplidor. Este tipo de error de clasificacin
tiene mucha importancia, el banco se preocupa sobre todo que un cliente
moroso o fallido pueda ser considerado como cumplidor, pues el coste de una
clasificacin errnea de este tipo es elevado para la entidad.
Santiago
51
de
la
Fuente
Fernndez
Santiago
52
de
la
Fuente
Fernndez

Santiago de La Fuente Fernández Santiago de La Fuente Fernández

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Santiago de La Fuente Fernández Santiago de La Fuente Fernández

Transféré par

Droits d'auteur :

Formats disponibles

Anlisis Discriminante

Santiago de la Fuente Fernndez

Existe discriminacin por razones de sexo o de raza en una empresa o en

El Anlisis Discriminante se puede considerar como un anlisis de regresin

Se pretende encontrar relaciones lineales entre las variables continuas que

Para efectuar el anlisis es necesario considerar una serie de supuestos:

Se tiene una variable categrica y el resto de variables son de intervalo o

Se necesitan al menos dos grupos, y para cada grupo se necesitan dos o

El nmero de variables discriminantes debe ser menor que el nmero de

Ninguna variable discriminante puede ser combinacin lineal de otras

El nmero mximo de funciones discriminantes es el mnimo [nmero de

Las matrices de covarianzas dentro de cada grupo deben de ser

Las variables continuas deben seguir una distribucin normal

ym = wm1 x1 +wm2 x2 ++wmp xp +w10

De esta forma, la media total de la variable x j se puede expresar como funcin

(xij x j ) =(xij xk j )+(xk j x j )

Poniendo en cada uno de los trminos: se obtiene,

(x x )(x ' x ')+

covarianza dentro grupos

= v(xj ,xj')+ f(xj ,xj')

(xk j x j)(xk j'

La covarianza total es igual a la covarianza dentro de los grupos ms la

x2 ,, xp ) variables observadas en k grupos, m funciones (y1 , y2 ,, ym ) de

y1 sea la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la mayor

y2 sea la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la mayor

En general, yi es la combinacin lineal de (x1 , x2 ,, xp ) que proporciona la

se observa que es una funcin homognea,

Como es el esquema habitual de los multiplicadores de Lagrange, se define:

En consecuencia, el autovector asociado a la primera funcin discriminante lo es

Por tanto, tomando el vector asociado al mximo autovalor se obtendr la

La suma de todos los autovalores

es la proporcin de varianza total que

conserva, al considerar slo los ejes o funciones discriminantes.

ANLISIS DISCRIMINANTE: OBJETO

Basado en la obtencin de funciones discriminantes de clculo similar a las

Basado en tcnicas de correlacin cannica y de componentes principales

CLASIFICACIN EN DOS GRUPOS

Se estudia la aplicacin del Anlisis Discriminante (AD) a la clasificacin de

Fisher resuelve el problema mediante su funcin discriminante: D = w1 X1

Las puntuaciones discriminantes son los valores que se obtienen al dar

Se trata de obtener los coeficientes de ponderacin wj

(Di) es la puntuacin discriminante correspondiente a la observacin i

Expresando el modelo en funcin de las desviaciones a la media, resulta:

D2 d2 X12 X22 Xk2 w2

d= Xw (funcin discriminante en diferencias)

La variabilidad de la funcin discriminante (suma de cuadrados de las

d'd= w'X'X w = w'(F+ V)w =

Las puntuaciones discriminantes se corresponden con los valores obtenidos

Los coeficientes w se obtienen: Mx = w'Fw = separacin entre grupos

XI = XII = Los subndices I y II indican a qu grupo pertenece la variable.

DI = w1 X1I +w2 X2I ++wk XkI

PARA CADA GRUPO

DII = w1 X1II +w2 X2II ++wk XkII

Si Di < C se clasifica al individuo i en

C: punto de corte discriminante C =

X1 +w2 X2 ++wk XK C} se clasifica dependiendo si (DC) es

INFERENCIAS Y CLCULO DE PROBABILIDADES

Las hiptesis estadsticas sobre la poblacin:

Las hiptesis implican que xg N(g ,)

Las hiptesis sobre el proceso de obtencin de la muestra: Facilitan la

Contrastes de significacin y evaluacin de la bondad de ajuste

Se cumple la hiptesis de homocedasticidad del modelo?

Para el contraste de homocedasticidad (si la matriz de covarianzas es la misma