Vous êtes sur la page 1sur 14

FUNCION DISCRIMINANTE PARA MLTIPLES GRUPOS

Cuando es posible identificar ms de dos grupos, puede estimarse ms de una funcin discriminante similares a

Por ejemplo cuando se tienen tres grupos, puede estimarse

1) una funcin para discriminar entre grupo 1 y grupos 2 y 3 combinados, y 2) otra funcin para discriminar entre grupo 2 y grupo 3.

FUNCION DISCRIMINANTE PARA MLTIPLES GRUPOS

FUNCION DISCRIMINANTE PARA MLTIPLES GRUPOS


En la prctica, cuando se realiza un anlisis discriminante entre varios grupos, no debe especificarse cmo combinar los grupos para formar las diferentes funciones.

El paquete computacional que se emplee, automticamente las conforma de manera que la primera es la que ofrece la mayor discriminacin como un todo entre grupos, la segunda provee una menor y as sucesivamente. Las funciones son independientes.

SIGNIFICANCIA DE LA FUNCIN DISCRIMINANTE PARA MULTIPLES GRUPOS


El nmero de variables que agregan significancia a la discriminacin entre grupo , es decir que sean estadsticamente significativas deben ser usadas para interpretar, las no significativas deben ignorarse.

Cuando se interpretan funciones discriminantes mltiples, que surgen del anlisis con ms de dos grupos y ms de una variable, se puede probar primero la significancia estadstica de las diferentes funciones, y considerar solo las ms significativas

Se observan los coeficientes b estandarizados para cada variable para cada funcin significativa. Cuanto mayores sean ms alta es la contribucin a la discriminacin especificada por la respectiva funcin.

Finalmente, pueden verse las medias para las funciones discriminantes significativas para determinar entre cules grupos discrimina la respectiva funcin.

SUPUESTOS IMPLCITOS EN EL ANLISIS DISCRIMINANTE


DISTRIBUCIN NORMAL
Se asume que los datos para las variables representan una muestra proveniente de una distribucin normal multivariable. No obstante, el no cumplimiento de este supuesto no es problema para el anlisis.

HOMOGENEIDAD DE VARIANCIAS Y COVARIANCIAS


Se supone que las matrices de variancias y covariancias son homogneas entre grupos; de nuevo, si no se cumple tampoco se generan problemas.

SUPUESTOS IMPLCITOS EN EL ANLISIS DISCRIMINANTE


CORRELACIONES ENTRE MEDIAS Y VARIANCIAS

El principal obstculo para la validez de las pruebas de significancia se presenta cuando la media de las variables entre grupos estn correlacionadas con las variancias.

Si hay gran variabilidad en un grupo con alta media en algunas variables, entonces esas medias grandes no son confiables. Sin embargo, la prueba de significancia global est basada en variancias ponderadas, es decir en variancias promedio entre todos los grupos. La prueba de significancia de las medias relativamente grandes (con grandes variancias) estar basada en variancias ponderadas relativamente menores, resultando errneamente en significancia estadstica. Esto ocurre cuando un grupo tiene unos pocos valores extremos que afectan mucho la media y aumentan la variabilidad.

SUPUESTOS IMPLCITOS EN EL ANLISIS DISCRIMINANTE


TOLERANCIA

Se define para un conjunto de m variables, , el coeficiente de correlacin mltiple que expresa el porcentaje de variabilidad de la variable (i = 1, . . . , m) recogida por el resto de (m 1) variables. Si se eleva al cuadrado se obtiene el coeficiente de determinacin.

Entonces, la tolerancia se define como 1 . As, cuanto mayor sea la tolerancia de una variable, ms informacin independiente del resto de variables recoger.

De este modo, si en una iteracin dada del procedimiento stepwise la variable seleccionada verifica que su tolerancia con respecto a las variables ya incluidas en la funcin discriminante es muy pequea entonces la variable no se incluye en dicha etapa. As, se evita la redundancia de informacin.

FUNCIN DE CLASIFICACIN

FUNCIN DE CLASIFICACIN

Otro propsito importante de la funcin discriminante es en cuanto a aspectos de predecir la clasificacin de nuevos casos, en el sentido de que una vez que se ha construido el modelo, qu tan bien se puede predecir la pertenencia al grupo de un caso particular.

El anlisis discriminante calcula una funcin de clasificacin. Hay tantas funciones de clasificacin como grupos, cada una permite calcular los puntajes de clasificacin para cada caso en cada grupo con la siguiente frmula:

*subndice i denota el grupo respectivo .*nmeros 1,...,m las variables; * es una constante para el i-simo grupo, *wij es el ponderador para la j-sima variable en el clculo del puntaje de clasificacin para el i-simo grupo, *xj es el valor observado para el respectivo caso para la jsima variable.* Es el puntaje de clasificacin resultante.

PASOS PARA RESOLVER EL PROBLEMA DE LA DISCRIMINACIN


1. Conocer las densidades de probabilidad P1(y)...Pn(y) para clasificar las variables y en n grupos o poblaciones diferentes.
2. Conocer las probabilidades a priori 1...n de que una unidad estadstica pertenezca a alguna de las poblaciones, las cuales son frecuencias relativas de unidades estadsticas de las n poblaciones.

3. Especificar valores rij que representen la prdida por identificar una variable y en el grupo i cuando en realidad pertenece a la poblacin j.

A las variables y se les asocia un puntaje S que consiste en un promedio ponderado de las probabilidades de que cada variable muestre los atributos que definen a una poblacin en particular. Es decir:

La variable yi se asigna a la poblacin para la cual su puntaje discriminante es el ms alto.

CASO DE QUE LAS VARIABLES SEAN NORMALES (para 2 poblaciones)


La Distribucin Normal multivariada para cada poblacin

Las dos poblaciones P1(y) y P2(y) siguen las distribuciones normales multivariadas Np(y1,1) y Np(y2,2),adems tienen igual matriz de covarianza 1=2 =.

El puntaje discriminante se puede calcular como:


La regla de decisin para la asignacin de una unidad estadstica en un grupo o en el otro dada por la diferencia de dos puntajes discriminantes: S1-S2. En trminos de la verosimilitud normal, la diferencia de los discriminantes sera:

S1-S2.=
L(Y) c

La regla de decisin que aplica el anlisis discriminante es la siguiente: asigne la i-sima observacin al grupo 1 si L(Y)>c , al contrario, al grupo 2 si L(Y)<c. Si se tiene un caso nuevo, se aplica la frmula y se obtiene su puntaje de clasificacin: se dice que ste pertenece al grupo para el cual presenta el mayor puntaje de clasificacin.

Vous aimerez peut-être aussi