Vous êtes sur la page 1sur 5

Anlisis Discriminnte Iris

1. Como podemos apreciar en la salida computacional de R las probabilidades a priori de


los grupos era de 0,333 para cada grupo. Tambin podemos observar una tabla (Group
means) la cual presenta la matriz de medias de la Variable Species. Despues de la
matriz de medias podemos ver los coeficientes de los dos discriminantes que calcifican
los datos. LD1 se expresa como :
1 = 0.8293776. + 1.5344731.
2.2012117. 2.8104603.
y LD2 :
20.02410215. + 2.16452123.
0.93192121. + 2.83918785.
Por ltimo tenemos la salida Proportion of trace, lo que nos dice que LD1 se llema un
mayor porcentaje de los datos, lo cual concluimos que LD1 es el mejor discriminante

2. Realizamos un M-Box test para ver homogeneidad de varianzas, donde las hiptesis son:
0: 1 = = 1 : ,
Realizamos en test en R y se tiene que el p-valor es de 2.21016, y utilizamos un nivel
de significacin del 5%, en este caso, la hiptesis nula se rechaza cuando el p-valor es
menor que nuestro nivel de significancia, por lo tanto, rechazamos 0 , es decir hay al
menos una covarianza que es distinta.

3. En este c aso realizamos el anlisis de discriminante lineal con un muestra


entrenamiento de 75 en el cual tena una varianza parecida al caso anterior cuya
funciono a priori es igual al caso anterior (1/3),(marcado con el rectngulo rojo) ,
como vemos en los resultados la agrupacin de los grupos sigue siendo muy parecida,
por lo que el primer grupo abarca en su totalidad los datos para la muestra de
entrenamiento, estos se encuentran en el rectngulo amarillo y esto quiere decir que
la proporcin de LD1 es del 99,69 % y que la de LD2 es de 0,031 % dejando en claro
que LD1 discrimina mejor los datos
Los discriminantes quedaran de la siguiente forma:
LD1 = LARGO.SEPALO*0.95264+ANCHO.SEPALO*1.17297+LARGO.PETALO*-
2.2007731+ANCHO.PETALO*-2.708126

LD2 = LARGO.SEPALO*-0.301133+ANCHO.SEPALO*2.8876396+LARGO.PETALO*-
0.073330+ANCHO.PETALO*1.241255

Setosa Versicolor Virginica


Setosa 25(100%) 0 0
Versicolor 0 24(96%) 1(4%)
Virginica 0 2(8%) 23(92%)
En la tabla anterior podemos observar que los grupos formados con la muestra de entrenamiento,
de acuerdo a la especie de la planta, se pueden ver claramente, sin embargo podemos ver que se
produjo un error de agrupamiento, ya que 3 elementos se agruparon mal, que es el caso de la
especie versicolor y virginica, esto va asociado con una probabilidad de error de 4% y el 8%
respectivamente.

Grafico anlisis de discriminante lineal 1


Grafico anlisis de discriminante lineal 1

Scatterplot

Conclusin

Con los datos obtenidos a lo largo del estudio podemos darnos cuentas que las plantas se
separan de manera diferente, y esto tiene que ver de la forma de discriminar los datos, esto
tiene que ver como los queremos separar en este caso se uso una probabilidad a priori de
1/3 para separar los datos pero nos dimos cuentas que para este caso en particular R lo hacia
por defecto, adems de esto pudimos apreciar que al seleccionar una muestra de
entrenamiento la discriminacin de los grupos era ms grande para el primer grupo, para
concluir a travs de los grficos se puede apreciar mejor la conducta del agrupamiento de los
datos dejan en evidencia la distribucin que tienen respecto a los valores de la funcin de
discriminacin.