Académique Documents
Professionnel Documents
Culture Documents
Anlisis Discriminante
1.1 Introduccin
1
Ordenar objetos u observaciones en dos o ms clases conocidas. Se hace
nfasis en derivar una regla que pueda ser usada para asignar
ptimamente un nuevo individuo a las clases previamente determinadas.
2
Las reglas de clasificacin obtenidas no proporcionan un mtodo de asignacin
perfecto (sin error); esto significa, que no se puede hacer una distincin clara
entre las mediciones de caractersticas de las poblaciones. Esto es, pueden
solaparse. Es posible, por ejemplo, clasificar un objeto como perteneciente a
2 cuando realmente pertenece a 1 o viceversa. Un buen procedimiento de
clasificacin debera dar como resultado pocas clasificaciones erradas; esto es,
que la probabilidad de mala clasificacin sea pequea.
P(1\2) = P(xR1\2) = f
R1
2 ( x)dx
Suponga un objeto, el cual es una observacin que pertenece a una de las dos
poblaciones 1 o 2. La clasificacin de una observacin depende de un vector de
medidas x = (x1, x2, x3,....., xp) de un objeto. Se fija una regla de decisin que
indica si un objeto caracterizado por ciertos valores de x1, x2, x3,xp, ser
clasificado como perteneciente a 1, o en caso contrario se considerar
perteneciente a 2 [2,6].
3
En cualquier estudio que requiera la clasificacin ptima de observaciones, se
debe tener en consideracin el costo esperado de clasificacin errnea, el cual
debe ser mnimo. En la obtencin del costo esperado de clasificacin errnea se
debe tomar en cuenta el conocimiento o desconocicmiento de la distribucin de las
probabilidades a priori de las poblaciones. Por ejemplo, en el caso de dos
poblaciones y conociendo las probabilidades a priori, el procedimiento que
minimiza el costo esperado de clasificacin errnea (CE), es el procedimiento de
Bayes, y la expresin del costo esperado de clasificacin errnea est dada por la
siguiente expresin:
ECM = C (2 | 1) P(2 | 1) P(1) + C (1 | 2) P(1 | 2) P(2)
4
son funciones sencillas y manejables. En este enfoque no se asume que las
poblaciones sean normales, se asume que las matrices de covarianzas
poblacionales son iguales, y se usa la matriz de covarianzas conjunta estimada Sp.
Una combinacin lineal fija de las x, toma valores y11, y12,, y1n1 para las
observaciones de la primera poblacin y los valores y21,y22,,y2n2 para las
observaciones de la segunda poblacin. La separacin de esos dos conjuntos
univariantes y1 y y2, se evala en trminos de la diferencia entre las medias
y1 y y 2 expresada en unidades de de desviacin estndar. Esto es:
n1 n2
y1 y 2 (y1i y1 ) 2 + (y 2i y 2 ) 2
Separacin = donde S 2y = i=1 i =1
es la varianza
Sy n1 + n2 2
conjunta estimada.
En resumen, para dos poblaciones, la separacin mxima relativa que puede ser
obtenida mediante la consideracin de combinaciones lineales de observaciones
5
multivariantes es igual a la distancia D2. Naturalmente, una separacin significativa
no implica una buena clasificacin.
Para este caso, Fisher propone una extensin del caso de dos poblaciones. La
motivacin inicial de Fisher es la necesidad de obtener una representacin
razonable de las poblaciones, que involucre slo unas pocas combinaciones
lineales de las observaciones, como por ejemplo l1x, l2 x y l3 x . Este enfoque
6
- Representacin conveniente de g poblaciones. Reduce la dimensin de un
gran nmero de caractersticas a unas pocas combinaciones lineales.
- Graficar las medias de las dos o tres primeras combinaciones lineales
discriminantes, ayuda a mostrar las relaciones y posibles agrupamientos de
las poblaciones.
- Realizar grficos de los valores muestrales de los dos primeros discriminantes,
es til para detectar observaciones atpicas u otras anomalas de la data.
1 g
= i
g i =1
y sea B0 la matriz de productos entre grupos (suma entre grupos) tal que:
g
B0 = ( i )( i ) .
i =1
7
Sumas de Cuadrados de las distancias de las poblacione s a la media total de Y
=
Varianza de Y
g g g
( iy y ) 2
(l i l )
2
l ( i )( i ) l
i =1
= i =1 =
i =1 = l B 0 l
y 2
l l l l l l
l B 0 l
coeficientes que maximiza la razn est dada por l 1 = e 1 , donde B 0 representa la
l W l
matriz de productos entre grupos y W la matriz de productos dentro de los grupos. La
combinacin lineal l 1 x es denominada primer discriminante muestral, l 2 x el segundo
[ ] [ ]
2 2
(y y kj ) = l j (x x k ) l j ( x xi ) para todo i k
r r
j
j =1 j =1
Otros procedimientos han sido desarrollados, entre las que se puede mencionar
las funciones discriminantes de coeficientes estandarizados y no estandarizados y
8
la funcin cuadrtica discriminante. Estas funciones se describen brevemente a
continuacin:
9
Cuando las matrices de covarianzas son iguales (1=2=....=g) algunos de los
trminos de la expresin anterior se simplifican para dar origen a una funcin
discriminante lineal [6].
10
Ejemplo 1. Iris Data
Ahora deben compararse todas las parejas de vectores de medias para determinar
cules son las variables o caractersticas (componentes del vector) que deben
usarse para realizar la discriminacin, o en otras palabras, cules son las variables
11
o caractersticas que permiten la mxima separacin de las tres especies de lirios.
Para ello se utiliza el estadstico T2 de Hotelling, y tal como se muestra a
continuacin existen diferencias entre los tres pares de medias.
12
A continuacin se presentan las funciones lineales discriminantes
Constantes:
G1 G2 G3
-82.48466 -72.76768 -105.755
Coeficientes Lineales:
G1 G2 G3
Lsepalo.1 21.56111 15.53092 13.50605
Asepalo.1 23.18804 6.15912 2.29309
Lpetalo.1 -14.02648 5.89742 12.36328
Apetalo.1 -16.84849 7.22780 22.14920
Estadstico Probabilidad
Lsepalo.1 0.0421896 0.9522367
Asepalo.1 0.0808214 0.2810337
Lpetalo.1 0.0487090 0.8688033
Apetalo.1 0.0484453 0.8729878
13
G1 G2 G3
7
4.0 6
3.5 5
4
3.0
3
Lpetalo.1
Asepalo.1
2.5 2
2.0 1
0.5 1.0 1.5 2.0 2.5 0.5 1.0 1.5 2.0 2.5
Apetalo.1 Apetalo.1
14
Iris Setosa
Iris Versicolor
15
Iris Virgnica
16