Vous êtes sur la page 1sur 6

Tema 6: Anlisis discriminante

ndice
1. Introduccin
2. Puntuaciones discriminantes
3. Teorema de Bayes
4. Funciones de Fisher
5. Distancias de Mahalanobis

1. Introduccin

Praa ilustrar la utilidad bsica de esta tcnica de anlisis supongamos que disponemos de datos de una
muestra de individuos, ms concretamente, imaginemos que conocemos que los integrantes de una muestra
pueden clasificarse en "p" grupos en funcin de cierto criterio.

Adems contamos con un conjunto de medidas relativas a R variables mtricas. En esta situacin, el objetivo
consiste en encontrar una pauta de relacin entre la pertenencia a los "p"grupos y las respuestas a las R
variables mtricas de modo tal que pueda desarrollarse una regla de prediccin de la pertenencia a dichos
grupos a partir del conocimineto de las R medidas independientes.
Por ser un poco ms explcitos, veamos un caso tpico de marketing. En esta ocasin supongamos que
contamos con datos de una muestra de compradores de cierta categora de producto. Conociendo qu marca
compran habitualmente estos compradores y quimportancia le conceden, por ejemplo, a cierto nmero de
atributos, podemos emplear esta tcnica para desarrollar una regla de prediccin de la marca comprada por
cada consumidor a partir del conocimiento de la importancia concedida a los atributos considerados.

En resumen, el objetivo fundamental de Anlisis discriminante es identificar que variables independientes


mtricas tienen un mayor poder discriminante entre los grupos, es decir, cual o cuales son capaces de
ofrecernos una mejor indicacin de la pertenencia de cierto caso a determinado grupo.

Podemos identificar dos modeles fundamentales de anlisis discriminante en funcin del nmero de grupos o
categoras determinados por la variable dependiente nominal.
Un modelo de anlisis discriminante simple es aquel en el que la variable dependiente categrica da
lugar a la formacin de 2 grupos
Un modelo de anlisis discrimiante mltiple es aquel en el que la variable dependiente categrica da
lugar a la formacin de 3 o ms grupos
Existen cuatro mtodos complementarios para llevar a cabo un anlisis discriminante diferenciados por el
procedimiento empleado para clasificar los casos en cada uno de los grupos determinados por la variable
dependiente.

Mtodos de clasificacin de casos:


Clasificacin basada en las puntuaciones discriminantes
Clasificacin basada en el teorema de Bayes
Clasificacin basada en las puntuaciones lineales de Fisher
Clasificacin basada en las distancias de Mahalanobis

En realidad, lo habitual es aplicar alguno de los dos primeros procedimientos y emplear los dos resultantes
como reglas de comprobacin o validacin de sus resultados.

Por esta razn, centraremos la atencin en el estudio de los dos primeros procedimientos.

2. Puntuaciones discriminantes
En el procedimiento de clasificacin basado en las puntuaciones discriminantes el objetivo consiste en
encontrar una funcin, la funcin discriminante, combinacin lineal de las variables independientes tal que
se maximicen las diferencias existentes entre los grupos respecto a las puntuaciones discriminantes D ki ,es
decir, que se maximice la ratio suma de cuadrados explicados partido suma de cuadrado residuales
(SCE/SCR mximo).

Existen dos mtodos alternativos para llegar a dicha funcin discriminante:


Directo o simultneo
La estimacin de la funcin discriminante se produce a partir de la inclusin de todas las variables
independientes disponibles simultneamente
Por pasos ( o indirecto)
La estimacin de la funcin discriminante se produce a partir de la inclusin de una variable
independiente en cada paso. En cada paso se incluye aquella variable independiente que provoca una
mayor mejora en el poder discriminante de la funcin.

Tambin cabe emplear un procedimiento inverso en el que en cada paso del proceso seguira excluyendo de
la funcin discriminate aquella variable independiente que posee una menor capacidad discriminante.

Sea cual sea el procedimineto empleado, de inclusin o exclusin sucesiva de variables independientes,
podemos optar entre cuatro criterios alternativos de inclusin y exclusin de las variables:
Lamda de Wilks: en cada paso se incluye aquella variable con menor valor de lambda de Wilks
Distancia de Mahalanobis al cuadrado: en cada paso se incluye aquella variable que produce una
mayor separacin entre grupos (2 a 2)
V de Rao: en cada paso se incluye en la funcin discriminate aquella variable que produce una
mayor separacin global entre los grupos
Ratio F entre grupos: variantes del mtodo de la distancia de Mahalanobis que pondera los grupos en
funcin de su tamao.
Clasificacin de los casos a partir de la funcin dicriminate

Una vez calculada la funcin discriminante, a travs de cualquiera de los mtodos comentados ,directo o por
pasos, y empleando en este ltimo caso cualquiera de los 4 criterios enumerados procederemos del modo
siguiente:
Primero calculamos las puntuaciones discriminantes D i para cada cao, a partir de las puntuaciones
respectop a las r variables independientes
En segundo lugar, calcularemos las puntuaciones discriminantes D i para los centroides de los grupos
que vendrn dados por los valores medios de las puntuaciones discriminantes de sus integrantes
En tercer lugar calcularemos los puntos de corte
Y en cuarto, clasificaremos los casos a partir de sus puntuaciones discriminantes D i

Veamos con un poco ms de profundidad estas dos ltimas etapas del proceso.

Para dos grupos, una funcin discriminante

En el caso de un anlisis discriminante simple, es decir, cuando la variable dependiente da lugar a la


formacin de dos grupos habra que calcular una nica funcin discriminante. Las puntuaciones
discriminantes de los centroides de los dos grupos sern iguales a las medias de las puntuaciones
discriminantes de sus integrantes.

El punto de corte en este caso, ser el punto equidistante de ambos centroides y conincidir con aquel punto
en el que la probabilidad de un caso de pertenecer a cierto grupo dada su puntuacin discriminante es igual a
la de pertener al grupo contrario. A partir de aqu, cualquier caso con puntuacin discriminante sea mayor a
la del punto de corte se clasificar dentro del grupo de la derecha. En cualquier caso cuya puntuacin
discriminante sea menor que la del punto de corte, se clasificar dentro del grupo de la izquierda.
En el caso de una variable dependiente con 3 categoras ser necesario contar con 3 funciones discriminantes
que darn lugar a un plano y por tanto necesitaremos contar con lneas de corte en vez de puntos. Estas lneas
determinan la pertenencia de cada caso a uno de los tres grupos en funcin de la puntuacin en cada una de
las dos funciones discriminantes, es decir, de sus coordenadas en relacin con el plano determinadas por las
mismas.

3. Teorema de Bayes
Por otra parte, el sistema de clasificacin del Teorema de Bayes consiste en clasificar cada caso en base a:

Segn este teorema, la probabilidad de pertenecer a un grupo k condicionado a cierta puntuacin


discriminante, ser igual al producto de la probabilidad de obtener cierta puntuacin discriminante
condicionada a la pertenencia a dicho grupo k por la probabilidad a priori de pertenecer a dicho grupo k
dividido entre la suma de estos productos de probabilidades para los p grupos determinados por la variable
dependiente.

A partir de esta expresin, clasificaremos cada caso dentro de aquel grupo en el que dicha probabilidad sea
mayor.
4. Funciones de Fisher
El mtodo de clasificacin basado en las funciones lineales de Fisher, consiste en calcular un conjunto de
funciones lineales, tantas como grupos queden definidos por la variable dependiente. A partir de aqu, cada
caso ser clasificado dentro de aquel grupo para el que el valor de estas funciones sea mayor.

5. Distancias de Mahalanobis
El mtodo de clasificacin basado en la distancia de Mahalanobis consiste en clasificar cada caso dentro de
aquel grupo cuyo centroide se encuentre a una menor distancia, medida sta a partir de la definicin de
distancia de Mahalanobis.

Esta definicin de distancia, al contrario que la distancia eucldea, toma en consideracin la correlacin
existente entre las funciones discriminantes.

Vous aimerez peut-être aussi