Académique Documents
Professionnel Documents
Culture Documents
Cuando es posible identificar ms de dos grupos, puede estimarse ms de una funcin discriminante similares a
1) una funcin para discriminar entre grupo 1 y grupos 2 y 3 combinados, y 2) otra funcin para discriminar entre grupo 2 y grupo 3.
El paquete computacional que se emplee, automticamente las conforma de manera que la primera es la que ofrece la mayor discriminacin como un todo entre grupos, la segunda provee una menor y as sucesivamente. Las funciones son independientes.
Cuando se interpretan funciones discriminantes mltiples, que surgen del anlisis con ms de dos grupos y ms de una variable, se puede probar primero la significancia estadstica de las diferentes funciones, y considerar solo las ms significativas
Se observan los coeficientes b estandarizados para cada variable para cada funcin significativa. Cuanto mayores sean ms alta es la contribucin a la discriminacin especificada por la respectiva funcin.
Finalmente, pueden verse las medias para las funciones discriminantes significativas para determinar entre cules grupos discrimina la respectiva funcin.
El principal obstculo para la validez de las pruebas de significancia se presenta cuando la media de las variables entre grupos estn correlacionadas con las variancias.
Si hay gran variabilidad en un grupo con alta media en algunas variables, entonces esas medias grandes no son confiables. Sin embargo, la prueba de significancia global est basada en variancias ponderadas, es decir en variancias promedio entre todos los grupos. La prueba de significancia de las medias relativamente grandes (con grandes variancias) estar basada en variancias ponderadas relativamente menores, resultando errneamente en significancia estadstica. Esto ocurre cuando un grupo tiene unos pocos valores extremos que afectan mucho la media y aumentan la variabilidad.
Se define para un conjunto de m variables, , el coeficiente de correlacin mltiple que expresa el porcentaje de variabilidad de la variable (i = 1, . . . , m) recogida por el resto de (m 1) variables. Si se eleva al cuadrado se obtiene el coeficiente de determinacin.
Entonces, la tolerancia se define como 1 . As, cuanto mayor sea la tolerancia de una variable, ms informacin independiente del resto de variables recoger.
De este modo, si en una iteracin dada del procedimiento stepwise la variable seleccionada verifica que su tolerancia con respecto a las variables ya incluidas en la funcin discriminante es muy pequea entonces la variable no se incluye en dicha etapa. As, se evita la redundancia de informacin.
FUNCIN DE CLASIFICACIN
FUNCIN DE CLASIFICACIN
Otro propsito importante de la funcin discriminante es en cuanto a aspectos de predecir la clasificacin de nuevos casos, en el sentido de que una vez que se ha construido el modelo, qu tan bien se puede predecir la pertenencia al grupo de un caso particular.
El anlisis discriminante calcula una funcin de clasificacin. Hay tantas funciones de clasificacin como grupos, cada una permite calcular los puntajes de clasificacin para cada caso en cada grupo con la siguiente frmula:
*subndice i denota el grupo respectivo .*nmeros 1,...,m las variables; * es una constante para el i-simo grupo, *wij es el ponderador para la j-sima variable en el clculo del puntaje de clasificacin para el i-simo grupo, *xj es el valor observado para el respectivo caso para la jsima variable.* Es el puntaje de clasificacin resultante.
3. Especificar valores rij que representen la prdida por identificar una variable y en el grupo i cuando en realidad pertenece a la poblacin j.
A las variables y se les asocia un puntaje S que consiste en un promedio ponderado de las probabilidades de que cada variable muestre los atributos que definen a una poblacin en particular. Es decir:
Las dos poblaciones P1(y) y P2(y) siguen las distribuciones normales multivariadas Np(y1,1) y Np(y2,2),adems tienen igual matriz de covarianza 1=2 =.
S1-S2.=
L(Y) c
La regla de decisin que aplica el anlisis discriminante es la siguiente: asigne la i-sima observacin al grupo 1 si L(Y)>c , al contrario, al grupo 2 si L(Y)<c. Si se tiene un caso nuevo, se aplica la frmula y se obtiene su puntaje de clasificacin: se dice que ste pertenece al grupo para el cual presenta el mayor puntaje de clasificacin.