Vous êtes sur la page 1sur 6

Inteligencia de Negocios

Sesión 04: Clustering

I. OBJETIVOS

- Conocer los fundamentos del clustering


- Utilizar las herramientas que permitan realizar la segmentación

II. TEMAS A TRATAR

• Clustering

III. MARCO TEORICO

Clustering
Forma parte del aprendizaje No Supervisado, el objetivo del clustering es encontrar
agrupamientos de tal forma que los objetos de un grupo sean similares entre sí y diferentes de
los de un grupo sean similares entre sí y diferentes de los objetos de otros grupos.
No exista un criterio objetivo para la selección del número de Clusters, existen
implementaciones de diferentes métodos que ayudan a elegir el número apropiado de Clusters
para agrupar los datos; como son, el método del codo (elbow method), el criterio de Calinsky, el
Affinity Propagation (AP), el Gap (también con su versión estadística), Dendrogramas, etc.

Método del codo (Elbow Method)


Este método utiliza los valores de la inercia obtenidos tras aplicar el K-means a diferente
número de Clusters (desde 1 a N Clusters), siendo la inercia la suma de las distancias al
cuadrado de cada objeto del Cluster a su centroide:

IV. ACTIVIDADES (La práctica tiene una duración de 2 horas)

1. Descargue el archivo Mall_Customers.csv al disco secundario.

2. Abra la aplicación Spyder.

José Sulla Torres


Inteligencia de Negocios

3. Para realizar la tarea de clustering, escriba el siguiente código para cargar el conjunto de
datos.

4. Aplique el clustering k-mean, para encontrar el número óptimo de Clusters utilice el método
Elbow.

5. Luego escriba el código para visualizar los resultados de los cluster obtenidos.

6. Revise los parámetros de KMeans

José Sulla Torres


Inteligencia de Negocios

7. Ejecute la aplicación. Visualice el resultado en la ventana del terminal

Clustering con Weka

1. Cargue la aplicación Weka

José Sulla Torres


Inteligencia de Negocios

2. Presione el botón Explorer, en la pestaña Preprocess seleccione el botón Open file… y elija
el archivo Mall_Customers.csv.
3. En la pestaña Cluster presione el botón Choose y seleccione weka / clusterers /
SimpleKMeans
4. En la caja de texto donde se encuentra el nombre de SimpleKMeans dele botón derecho y
elija la opción Show Properties…

5. Personalice las opciones de iteraciones = 300, numCluster = 5, similar a lo de Python.

José Sulla Torres


Inteligencia de Negocios

6. Presione el botón Start. Y examine los resultados.

7. Presione la pestaña Visualize y elija El cuadrante de CustomerID con Speding Score

José Sulla Torres


Inteligencia de Negocios

V. Ejercicios

1. En Weka, pruebe con los otros algoritmos de clustering y observe los resultados. ¿A qué
conclusiones llega?
2. Pruebe las otras técnicas de Clustering para los datos de su proyecto. Realice una tabla
comparativa y seleccione el que mejor resultado genera. Tome como modelo las referencias.

VI. Cuestionario

1. ¿Cuál es el objetivo del Clustering?


2. ¿Cuáles son los pasos para realizar el Clustering?

VII. Bibliografía y referencias

1. http://www.sciencedirect.com/science/article/pii/S0167923605000114
2. http://www.cs.ust.hk/~qyang/Teaching/537/Papers/huang98extensions.pdf

José Sulla Torres