Académique Documents
Professionnel Documents
Culture Documents
Anlisis Discriminante
ANLISIS DISCRIMINANTE
El Anlisis Discriminante es una tcnica estadstica multivariante cuya finalidad
es analizar si existen diferencias significativas entre grupos de objetos respecto
a un conjunto de variables medidas sobre los mismos para, en el caso de que
existan, explicar en qu sentido se dan y facilitar procedimientos de clasificacin
sistemtica de nuevas observaciones de origen desconocido en uno de los
grupos analizados.
Se puede predecir si una empresa va a entrar en bancarrota?
Es posible predecir con antelacin si un cliente que solicita un prstamo a
un banco va a ser un cliente moroso?
Construir una regla de decisin que asigne un objeto nuevo con un cierto
grado de riesgo, cuya clasificacin previa se desconoce, a uno de los grupos
prefijados.
(b)
(c)
(d)
(e)
(f)
Santiago
de
la
Fuente
Fernndez
Anlisis Discriminante
(g)
m =mn[q1,p]
Cov(x j ,x j') =
n
(x
ij
x j ) (xij' x j')
i=1
se puede considerar la media de la variable x j en cada uno de los grupos (I1 ,I2
,,Iq ), es decir,
1
xk j
x
nk
ij
para k =1,,q.
iIk
con lo cual, x j =
n
Santiago
i=1
q
ij
n
de
ij
k=1 iIk
n
=
xk j = xk j
k=1
la
k=1
n
Fuente
Fernndez
Anlisis Discriminante
1
As,
Cov(x j ,x j') =
n
(x
ij
x j )(xij' x j')
k=1 iIk
Cov(x j , x j') =
x j') =
(x x )(x ' x
ij
)=
j'
covarianza total
k=1 iIk
k=1
covarianza entre grupos
t(xj ,xj') =
v(xj ,xj')
n
MATRICIALMENTE
+
f(xj ,xj')
Santiago
de
la
Fuente
Fernndez
Anlisis Discriminante
j=1,,(i1)
MATRICIALMENTE: Se busca una funcin lineal de (x1 , x2 ,, xp ): Y = w'X
Se sabe que La covarianza total es igual a la covarianza dentro de los grupos
ms la covarianza entre MATRICIALMENTE
grupos:
T =F+ V
.
De modo que, Var(y)= w'Tw = w'Fw+w'Vw
Se maximiza la variabilidad entre los grupos para discriminarlos mejor, es decir,
se maximiza la
w'Fw
varianza entre grupos en relacin con el total de la varianza: mx
w'Tw
w'Fw
Considerando la funcin f(w)=
es decir,
w'Tw
w'Fw
f(w)= f(w) R . El hecho de que sea homognea implica que calcular mx
equivale w'Tw a calcular mx[w'Fw] tal que w'Tw =1
L = w'Fw(w'Tw1)
=2Fw2Tw = 0 Fw =Tw (T1F)w =w
w
de
la
Fuente
Fernndez
Anlisis Discriminante
wm' wm' X = Ym
m =mn(q1,p).
Estos vectores son linealmente independientes y dan lugar a funciones
incorreladas entre s.
m
i=1
100%
i=1
Variables clasificadoras
Santiago
de
la
Variable dependiente
Fuente
Fernndez
Anlisis Discriminante
ANLISIDISCRIMINANTE
(A.D) CRITERID CLASIFICACI
S
. : O
E N
Hiptesis:
Lasdistribuciones
slosediferencian
porsulocalizacin
(igualformay varianza)
Setratademinimizar
loserroresdeclasificacin
Sixi <C seclasifica
enel grupoI
Sixi >C seclasifica
enel grupoII
El puntoC sedenomina
puntodecortediscriminante
:C=
Santiago
de
la
XI +XII
2
Fuente
Fernndez
Anlisis Discriminante
Santiago
de
la
Fuente
Fernndez
Anlisis Discriminante
ENFOQUES DE ANLISIS
X22
D La
Xk2 w2
funcin discriminante en forma matricial: 2
X 12
X
2N
=
XkN
DN
X1N
wk
Santiago
de
la
Fuente
Fernndez
Anlisis Discriminante
es decir,
=
X 2N
XkN wk
DN dN
X1N
d'd= w'X'X
w
X'X es una matriz simtrica que expresa las desviaciones cuadrticas con
respecto a la media de las variables (suma de cuadrados total).
Se puede descomponer en suma de cuadrados entre grupos F y suma de
cuadrados dentro de los grupos V:
T = X'X (matriz de suma de cuadrados y
productos cruzados (varianzascovarianzas)
para el conjunto de observaciones.
con lo cual,
T = X'X =F+
V
Los ejes discriminantes vienen dados por los vectores propios asociados a
los valores propios de la matriz (V1 F) ordenados de mayor a menor.
Santiago
de
la
Fuente
Fernndez
Anlisis Discriminante
CLASIFICACIN
Se obtienen las puntuaciones discriminantes di para cada observacin,
introduciendo los correspondientes valores de las k variables en la funcin
discriminante.
Se aplica el criterio de clasificacin:
di < C (di C < 0) pertenece al grupo I
di > C (di C > 0) pertenece al grupo II
Otro camino: funciones discriminantes para cada grupo se clasifica la
observacin en el grupo en que la funcin correspondiente arroja mayor
valor.
HIPTESIS
Las variables son independientes y se distribuyen normalmente
problemas en la estimacin.
Las matrices de las varianzas y covarianzas son iguales en todos los grupos
afecta a la clasificacin.
No multicolinealidad entre las variables clasificadoras.
Las relaciones son lineales.
No existen valores anmalos (outliers).
CENTROIDES PARA CADA GRUPO (GRUPO I, GRUPO II)
X1I
X2I 2II
X1II
XkI XkII
10
de
la
Fuente
Fernndez
Anlisis Discriminante
D+D
A
UO
II
EN GENERAL:
{DC = w
11
de
la
Fuente
Fernndez
Anlisis Discriminante
(ng1)/ 2
En el denominador, el determinante de la
estimacin global de la matriz de covarianzas.
g=1
V
Vg
donde:
Sg =
(n
1)S
S
g=1
variables ng 1
g=1
= =
nG nG
12
de
la
Fuente
Fernndez
Anlisis Discriminante
T2 =(y1 y2 ' S
(y1 y2) n
n 2
+ n 2
donde S =
V 1+ V 2
n1 + n2 2
K1 T
n1 +n2
FK,n
1 +n2 K1
n1 +n2 2
13
de
la
Fuente
Fernndez
Anlisis Discriminante
1+
(correlacin
can
nic
a)
'
DC = w1 X1 +w2 X2 ++wk Xk
individuos en uno u otro grupo, pero no ofrecen ms informacin acerca de los
individuos investigados.
En muchas ocasiones es conveniente tener informacin complementaria a las
puntuaciones discriminantes. Si bien con estas puntuaciones se puede clasificar
a cada individuo, tambin es interesante disponer de informacin sobre la
probabilidad de su pertenencia a cada grupo, pues con este dato se puede
realizar anlisis ms matizados, e incluir otras informaciones tales como la
informacin a priori o los costes que implica una informacin errnea.
Para realizar este tipo de clculos se suelen asumir las hiptesis estadsticas
sobre la poblacin:
(c) La matriz de covarianzas de todos los grupos es igual a (hiptesis de
homocedasticidad).
(d)Cada uno de los grupos tiene una distribucin normal multivariante.
Las hiptesis implican que xg N(g , ), considerando adems que se conocen
los parmetros poblacionales.
El clculo de probabilidades se realiza en el contexto de la teora de la decisin,
que permite tener en cuenta la probabilidad de pertenencia a un grupo, como los
costes de una clasificacin errnea.
La clasificacin de los individuos se realiza utilizando el teorema de Bayes. La
aplicacin del teorema de Bayes permite el clculo de las probabilidades a
Santiago
14
de
la
Fuente
Fernndez
Anlisis Discriminante
Prob(D/i)
i
i=1
i=1
e
Prob(g/ D) = FI FII
e +e
Santiago
15
de
Fuente
Fernndez
Anlisis Discriminante
C=
DI +DII
2
e
Prob(g/ D) = FI I
F
I e +II e II
g =I,II
DI +DII
II
ln
2
I
16
de
la
Fuente
Fernndez
Anlisis Discriminante
para el banco es dejar de percibir los intereses del prstamo y la posible prdida
de un cliente que en realidad es cumplidor. Por el contrario, en la segunda
posibilidad el coste para el banco es la prdida de la cantidad prestada, ya que
el cliente clasificado como cumplidor es realmente fallido. En principio, y bajo el
criterio de una prudente administracin financiera, parece que el segundo tipo
de coste es superior al primero.
Cuando se introducen costes de clasificacin no puede hablarse ya de clculo de
probabilidades a posteriori. No obstante se puede obtener un criterio para
clasificar minimizando el coste total de clasificacin errnea. Este total viene
dado por la expresin:
I Prob(II/I) Coste(II/I)+II Prob(I/II) Coste(I/II)
Cada probabilidad se encuentra multiplicada por el coste en que se incurre. Al
minimizar la expresin, bajo las hiptesis estadsticas sobre la poblacin, el
punto de corte discriminante Cp,c se obtiene con la expresin:
DI + DII ln II Coste(I/II)
Cp,c =
2
I Coste(II/I)
En los desarrollos anteriores se ha supuesto que las probabilidades son
conocidas. En la prctica, se utilizan estadsticos muestrales en su lugar. El
empleo de estadsticos muestrales tiene como consecuencia que se subestime la
probabilidad de clasificacin errnea, cometindose por lo tanto sesgos
sistemticos en la clasificacin. Para disminuir estos sesgos se han propuesto,
entre otros, dos procedimientos alternativos.
17
Grupo
pertenen
cia
I
I
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
4,1
6,9
de
la
Puntuacin
discriminant
e
5,9957
6,1213
Grupo
clasificad
o
I
I
Fuente
Fernndez
Anlisis Discriminante
3
4
5
6
7
8
9
10
11
12
13
14
15
16
I
I
I
I
I
I
II
II
II
II
II
II
II
II
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
1,141
3,4715
1,2043
1,8964
2,4267
1,7831
0,93
2,7086
1,3214
7,036
1,8459
4,4593
4,1473
5,2353
I
I
I
I
I
I
II
II
II
II
I
II
II
II
e
Prob(g/D)=
FI FII
g =I,II
e +e
Como puede observarse, las probabilidades de pertenencia al propio grupo son
elevadas, excepto en el cliente cumplidor 13 que se clasifica errneamente en el
grupo de fallidos y que por aadidura tiene una probabilidad muy baja (0,1367)
de pertenencia al grupo de los cumplidores.
Client
e
1
2
3
4
5
6
7
8
Fallidos
Prob(I/D)
0,9975
0,9978
0,7575
0,9698
0,7687
0,8693
0,9185
0,8558
Prob(II/D)
Cliente
0,0025
0,0022
0,2425
0,0302
0,2313
0,1307
0,0815
0,1442
9
10
11
12
13
14
15
16
No Fallidos
Prob(I/D
Prob(II/D)
)
0,2826
0,7174
0,0622
0,9378
0,2100
0,7900
0,0009
0,9991
0,1367
0,8633
0,0114
0,9886
0,0155
0,9845
0,0053
0,9947
18
de
la
Fuente
Fernndez
Anlisis Discriminante
DI + DII ln II
Para clasificar a los clientes se va a utilizar el punto de corte Cp =
2
I
Si se establece que 1 = 0,10 y 2 = 0,90 , el valor que
se obtiene:
Cp =
=3,5202,1972=1,323
con lo que la funcin discriminante de Fisher ser:
DC =1,035.Patrimonio_Neto0,932.Deuda_Pendiente
1,323 resultando:
Client
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Grupo
pertenen
cia
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
4,1
6,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
Puntuacin
discriminant
e
3,7987
3,9243
1,056
1,2745
0,9927
0,3006
0,2297
0,4139
3,127
4,9056
3,5184
9,233
0,3511
6,6563
6,3443
7,4323
Grupo
clasificad
o
I
I
I
I
I
I
I
I
II
II
II
II
I
II
II
II
Coste(I/II)
El punto de corte discriminante ser:
Santiago
19
de
la
Fuente
Fernndez
Anlisis Discriminante
0,9 = 4,319
Grupo
pertenen
cia
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
Patrimoni
o Neto
Deuda
Pendiente
1,3
3,7
5
5,9
7,1
4
7,9
5,1
5,2
9,8
9
12
6,3
8,7
11,1
9,9
4,1
6,9
3
6,5
5,4
2,7
7,6
3,8
1
4,2
4,8
2
5,2
1,1
4,1
1,6
Puntuacin
discriminant
e
6,7947
6,9203
1,94
4,2705
2,0033
2,6954
3,2257
2,5821
0,131
1,9096
0,5224
6,237
2,6449
3,6603
3,3483
4,4363
Grupo
clasificad
o
I
I
I
I
I
I
I
I
II
II
II
II
I
II
II
II
Los (G1) ejes vienen definidos respectivamente por los vectores (w1 ,w2
,,wG1)
Santiago
20
de
la
Fuente
Fernndez
Anlisis Discriminante
w11
w12
w21
w22
w2 =
w1 =
, ,
,
w2k
w1k
wG1,1
wG1,2
wG1 =
wG1,k
w Fw
separacin
entregrupos
(criterioobtencin
delprimerejediscriminante)
Mx1 = '1 1 =
w1 V w1 separacin
dentrogrupos
Derivando
la ratioe igualando
a cero:
1
=0 , conlo cual:
w1
w1
( w1 Vw1)
'
2Vw1
(w1
Vw1
1 w1 = V1
Fw1
Como 1 es la ratio
discriminante. El resto
'
w1' Fw1
w1 V w1
de los ejes discriminantes son otros vectores caractersticos de la matriz (V1 F),
ordenados segn el orden decreciente de las races caractersticas. As, el
Santiago
21
de
la
Fuente
Fernndez
Anlisis Discriminante
Puesto que la matriz (V1 F) no es simtrica, en general, esto implicar que los
ejes discriminantes no sern ortogonales, es decir, no sern perpendiculares
entre s.
Contrastes de significacin
En el anlisis discriminante mltiple se plantean contrastes especficos para
determinar si cada uno de los valores i es estadsticamente significativo, es
decir, para determinar si cada uno de los valores i contribuye o no a la
discriminacin entre los diferentes grupos.
Este tipo de contrastes se realiza a partir del estadstico V de Barlett. El
estadstico V es una funcin de la de Wilks y se aproxima a una chicuadrado,
tiene inters en el anlisis discriminante por su
descomponibilidad.
Estadstico V de
K variables categricas
Barlett: V
K+G
V =n1
(ln)
2
G grupos
H : = ==
0
multivariante para contrastar las hiptesis H1 :No todas las g son iguales
1
1 T
1
1
= =V T =V T =V T = V
V
Santiago
22
de
la
(F+ V)
Fuente
= I+ V1 F
Fernndez
Anlisis Discriminante
K+G
G1
g=1
ln(1+g)
g=2
ln(1+g)
K+G
G1
=j+1
ln(1+g) donde
j=
Santiago
23
de
la
Fuente
Fernndez
Anlisis Discriminante
PRSTAMOSRIESGO
Cuando una entidad financiera concede un prstamo personal a un cliente se
enfrenta a la doble posibilidad de que sea reintegrado o de que no lo sea. En
este ltimo caso el prstamo ser finalmente clasificado como fallido.
Obviamente, si la entidad financiera conociera de antemano que una persona va
a resultar fallida no le concedera el prstamo en ningn caso. En esta lnea,
puede utilizar la informacin existente en la entidad sobre prstamos concedidos
en el pasado para la concesin de prstamos futuros de forma que se evite, o al
menos, se reduzca la posibilidad de conceder prstamos que despus fueran
fallidos.
En los archivos de la entidad financiera existe informacin de las caractersticas
de las personas a las que se les ha concedido un prstamo, ya que el cliente en
el momento de solicitar el prstamo ha facilitado datos acerca de cuestiones
tales como ingresos, edad, sexo, situacin familiar, antigedad en el puesto de
trabajo, rgimen de tenencia de la vivienda, etc. Es muy posible que los clientes
cumplidores tengan unas caractersticas distintas a los clientes fallidos.
Utilizando estas caractersticas se trata de establecer unas funciones que
clasifiquen lo ms correctamente posible a los clientes a los que se les ha
concedido un prstamo en cumplidores y fallidos (finalidad explicativa).
Posteriormente, estas funciones se emplearn, en el caso de que se haya
realizado adecuadamente dicha clasificacin, para determinar si se conceden o
no los prstamos futuros a futuros solicitantes (finalidad predictiva).
ANLISIS DISCRIMINANTE CON SPSS
La tabla adjunta contiene informacin de 16 clientes de una entidad financiera a
los que se les concedi un prstamo. Pasados 3 aos desde la concesin del
prstamo, de los 16 clientes, haba 8 que fueron clasificados como fallidos
(grupo 1) mientras que los otros 8 clientes fueron cumplidores (grupo 2), ya que
reintegraron el prstamo.
Para cada uno de los 16 clientes se dispone de informacin sobre X1 = 'su
patrimonio neto' y
X2 ='sus deudas pendientes', en el momento de la solicitud. Con esta informacin
se pretende
construir una funcin discriminante que separe/diferencie lo ms posible a los
dos grupos y que permita clasificar, con los menores errores posibles, a los
distintos clientes en los dos grupos.
Cliente
Santiago
24
de
Prsta
mo
Patrimonio
Neto
la
Deuda
Pendiente
Fuente
Fernndez
Anlisis Discriminante
1
1
1,3
4,1
2
1
3,7
6,9
3
1
5,0
3,0
4
1
5,9
6,5
5
1
7,1
5,4
6
1
4,0
2,7
7
1
7,9
7,6
8
1
5,1
3,8
9
2
5,2
1,0
10
2
9,8
4,2
11
2
9,0
4,8
12
2
12,0
2,0
13
2
6,3
5,2
14
2
8,7
1,1
15
2
11,1
4,1
16
2
9,9
1,6
El director de la entidad financiera tiene dos nuevas solicitudes de un prstamo
instantneo. El primer solicitante dispone de un patrimonio neto de 10,1, con
unas deudas pendientes de 6,8. Para el segundo solicitante los valores de estas
variables son 9,7 y 2,2 respectivamente. Qu decisin debe tomar?
(Nota. Las unidades monetarias se expresan en 100.000 euros)
Para hacer un Anlisis Discriminante, se selecciona sucesivamente del men
principal:
Analizar Clasificar
Discriminante
25
de
la
Fuente
Fernndez
Anlisis Discriminante
26
de
la
Fuente
Fernndez
Anlisis Discriminante
(b)
(c)
(d)
DESCRIPTIVOS:
Medias: Proporciona el vector de medias (los centroides) y desviaciones tpicas
de cada variable para cada grupo.
Univariante ANOVA: Contrasta igualdad de medias entre los grupos para cada
variable.
Santiago
27
de
la
Fuente
Fernndez
Anlisis Discriminante
nk
Sk = n
i=1
i=1
i=1
i=1
k =1,2
2
nk
n1 +n2 2
Covarianza Total: Proporciona la matriz de varianzas y covarianzas de (X1,
X2) para todos los n + n = 16 individuos de la poblacin, sin distincin de
grupo.
1
28
de
la
Fuente
Fernndez
Anlisis Discriminante
de variables
V
V
1
=
=min(q1, p)
T V +F
(1+I)
(0 1)
i=1
i
1+i
29
de
la
Fuente
Fernndez
Anlisis Discriminante
Santiago
30
de
la
Fuente
Fernndez
Anlisis Discriminante
X1,I = 5
X1,II =9
5+9
C1 = =
2
=7
31
de
la
Fuente
Fernndez
Anlisis Discriminante
X2,I + X2,II
X2,I = 5 X2,II =3
C1 = =
2
2
5+3
=4
Si las deudas pendientes son mayores que 4 se clasifica al cliente como fallido
(grupo 1), mientras que se clasifica como cumplidor (grupo 2) si las deudas
pendientes son menores que esa cifra.
Los contrastes de igualdad de
medias entre los dos grupos para
cada variable (en ambos casos
se rechaza la hiptesis nula, p_valor < 0,05, es decir, los dos grupos, en media
son diferentes).
La informacin de esta tabla de ANOVAs univariados suele utilizarse como
prueba preliminar para detectar si los grupos difieren en las variables de
clasificacin seleccionadas; sin embargo, hay que considerar que una variable no
significativa a nivel univariante podra aportar informacin discriminativa a nivel
multivariante.
1,199
S =1,001
3,043
Santiago
32
3,259=
de
7 4,289
n1 +n2 2 = 14 1,824
la
1,824
7 5,240
3,474+ 14 0,177
Fuente
Fernndez
Anlisis Discriminante
Elestadstico
M deBoxtomalaforma:M =(ng) logS (nj 1) logSj
j=1
DondeSeslamatrizdevarianzas
covarianzas
combinada,
Sj eslamatrizdevarianzas
covarianzas
del grupo jsimo, n es el nmero total de casos y g el nmero de grupos. El
estadstico M carece de distribucin muestral conocida, pero puede
transformarse en un estadstico F e interpretarse como tal (muchos
investigadores critican este estadstico por ser demasiado sensible a pequeas
desviaciones de la normalidad multivariante y a tamaos muestrales grandes,
tendiendo a ser conservador).
Se observa que la primera tabla ofrece los logaritmos de los determinantes de
todas las matrices utilizadas en el clculo del estadstico M. Dado que el
estadstico es multivariante, la tabla permite comprobar qu grupos (cuando hay
ms de dos) difieren ms.
La tabla (Resultados de la prueba) ofrece la prueba M de Box y su
transformacin en un estadstico F.
El resultado de la prueba hace que no se rechace la igualdad de matrices de
varianzascovarianzas (Sig=0,849 > 0,05), concluyendo que los dos grupos
tienen la misma matriz de varianzascovarianzas (no hay un grupo ms variable
que otro).
A continuacin aparecen los resultados del anlisis discriminante (estadsticos
por pasos):
Santiago
33
de
la
Fuente
Fernndez
Anlisis Discriminante
Como hay g=2 grupos y p=2 variables, slo hay q=min (k, g1)=1 funcin
discriminante, o equivalentemente, la matriz (V1 F) tiene rango q=min (k, g
1)=1 y slo hay un autovalor distinto de cero, =1,716, que es el que aparece
en la tabla.
1
1
1
El estadstico del contraste de significacin global Lambda de Wilks: =
=
= 0,368 1+1
1+1,716
Santiago
34
de
la
Fuente
Fernndez
Anlisis Discriminante
Santiago
35
de
la
Fuente
Fernndez
Anlisis Discriminante
Probabilidades a priori de
pertenencia a los grupos (se supone p1 = p2 = 1 / 2)
Santiago
36
de
la
Fuente
Fernndez
Anlisis Discriminante
FII
=1,813.Patrimonio_Neto+0,364.Deuda_Pendiente9,396
1
S =
xII =X2,II=3
dI(x)=[5
X1,II 9
4,764
1,001
1,001
3,259
X1
X
= 0,777.Patrimonio_Neto+1,296.Deuda_Pendiente5,876
2
1
Para el grupo 2, la funcin de clasificacin es de la forma: dII(x)= x2' S1 x x2' S1
x2 +ln (p2) 2
dII(x)=[9 3 41,,001764
13,,2590011 XX12 21 [9
X1
X
=1,813.Patrimonio_Neto+0,364.Deuda_Pendiente9,396
2
Santiago
37
de
la
Fuente
Fernndez
Anlisis Discriminante
Cada sujeto ser asignado al grupo en el que obtenga un mayor valor de estas
funciones.
Santiago
38
de
la
Fuente
Fernndez
Anlisis Discriminante
d
h=1
39
de
la
Fuente
Fernndez
Anlisis Discriminante
Santiago
40
de
la
Fuente
Fernndez
Anlisis Discriminante
41
de
la
Fuente
Fernndez
Anlisis Discriminante
que permitan clasificar, con los menores errores posibles, a los clientes en los
diferentes grupos. Si se obtienen buenos resultados, estas funciones
discriminantes se podrn utilizar para analizar si se concede un prstamo o no a
un futuro cliente peticionario.
Santiago
42
de
la
Fuente
Fernndez
Anlisis Discriminante
Seselecciona
Cumplimiento
comovariable
de
agrupacin
(cuyorangoes1 y 3)y lasotrascinco
variables
comoindependientes.
El mtododeinclusin
porpasos.
Santiago
43
de
la
Fuente
Fernndez
Lasmedias
de
lascinco
Anlisis
Discriminante
variables
introducidas
como
independientes
enel anlisis
sonmayores
enla categora
de
cumplidores
queenlasotras
categoras.
As,losclientes
cumplidores,
en
relacin
conlosotrosdos
grupos(morosos,
fallidos),
tienenmayores
ingresos,
un
mayorpatrimonio,
son
propietarios
dela vivienda
que
habitanestncasados
y son
asalariados
concontrato
fijo.
LasANOVAsindicanquenoseobservan
diferencias
significativas
entreloscumplidores,
morosos
y fallidos,
encuantoal hechodeser
propietario
o nodela vivienda
(Vivienda
) y el
estarcasado
o no(Casado
).
V (n
g
Santiago
44
de
G
g
1)Sg
la
Fuente
Fernndez
Anlisis Discriminante
g=1
g=1
= = (donde
S es una estimacin
nG nG
de la matriz de covarianzas global ), as como el rango de cada una de estas
matrices.
Las matrices son de orden 5x5, ya que existen cinco variables clasificadoras.
Si las matrices son no singulares (tienen inversa) su rango debe de ser 5. Se
observa, en este caso, que la matriz correspondiente al grupo 3 (cliente fallido)
no se calcula porque existen muy pocos casos para ser no singular, en efecto se
puede observar que el nmero de individuos que pertenecen al grupo 3 (clientes
fallidos) es justamente 5 y con este tamao la matriz de covarianzas de los
residuos es necesariamente singular.
K+G
G1
Vj =n1 2
Santiago
45
de
=j+1
ln(1+g) donde
la
j= 0,1
Fuente
Fernndez
Anlisis Discriminante
= 0,294
K+G
3
[ln(1+0,043)]= 0,909
V1 =n1 2
= 0,959
Santiago
46
de
la
Fuente
Fernndez
Anlisis Discriminante
1 = 2,264 = 0,833
1 =
1+1
1+2,264
2 = 1 =
0,043 = 0,203
1+1 1+0,043
Santiago
47
de
la
Fuente
Fernndez
Anlisis Discriminante
FI =
0,063.Patrimonio_Neto+13,721.Contrato_Trabajo13,590
FII =
0,039.Patrimonio_Neto+9,604.Contrato_Trabajo6,607
(cliente
cumplidor)
(cliente
moroso)
(cliente fallido)
FIII =
0,018.Patrimonio_Neto+3,662.Contrato_Trabajo2,05
1
Santiago
48
de
la
Fuente
Fernndez
Anlisis Discriminante
49
de
la
Fuente
Fernndez
Anlisis Discriminante
I I e
Fg
II
g =I,II g grupo
C=
p
DI +DII
II
ln
2
I
50
de
la
Fuente
Fernndez
Anlisis Discriminante
y tambin que las puntuaciones discriminantes son las que sitan a cada caso
en el mapa territorial.
Los resultados de la investigacin son satisfactorios, ya que contiene un
porcentaje elevado de clientes clasificados satisfactoriamente (76%), si bien
preocupa el caso de un cliente moroso ( cliente
17) que ha sido calificado como cumplidor. Este tipo de error de clasificacin
tiene mucha importancia, el banco se preocupa sobre todo que un cliente
moroso o fallido pueda ser considerado como cumplidor, pues el coste de una
clasificacin errnea de este tipo es elevado para la entidad.
Santiago
51
de
la
Fuente
Fernndez
Anlisis Discriminante
Santiago
52
de
la
Fuente
Fernndez