Vous êtes sur la page 1sur 11

Sesión : Clustering

1. Descargue el archivo Mall_Customers.csv al disco secundario.

2. Abra la aplicación Spyder

3. Para realizar la tarea de clustering, escriba el siguiente código para cargar el conjunto de
datos.
4. Aplique el clustering k-mean, para encontrar el número óptimo de Clusters utilice el
método Elbow.

5. Luego escriba el código para visualizar los resultados de los cluster obtenidos.

6. Revise los parámetros de KMeans


7. Ejecute la aplicación. Visualice el resultado en la ventana del terminal
Clustering con Weka

1. Cargue la aplicación Weka


2. Presione el botón Explorer, en la pestaña Preprocess seleccione el botón Open
file… y elija el archivo Mall_Customers.csv.

3. En la pestaña Cluster presione el botón Choose y seleccione weka / clusterers /


SimpleKMeans

4. En la caja de texto donde se encuentra el nombre de SimpleKMeans dele botón


derecho y elija la opción Show Properties…
5. Personalice las opciones de iteraciones = 300, numCluster = 5, similar a lo de
Python.
6. Presione el botón Start. Y examine los resultados.

7. Presione la pestaña Visualize y elija El cuadrante de CustomerID con Speding


Score
Ejercicios

1. En Weka, pruebe con los otros algoritmos de clustering y observe los resultados. ¿A
qué conclusiones llega?

 CANOPY

 FarthestFirst
 FilteredClusterer

Conclusiones:

Dependiendo de algoritmo a utilizar los resultados serán más óptimos, siendo generalmente
el K-Means el más utilizado para grandes cantidades de datos sin embargo los demás
algoritmos son más eficientes que este.
Cuestionario

1. ¿Cuál es el objetivo del Clustering?


Objetivos más habituales relacionados con el Negocio:
 Tener o querer targets comunes. Gracias a la agrupación de las empresas
pueden aumentar la probabilidad de venta y disminuir la competencia en el
mercado.
 Acceder a mercados comunes, principalmente internacionales o de difícil
acceso. Al unir fuerzas, las empresas pueden acceder a mercados con mayor
rapidez o que serían inviables si entraran individualmente.
 Compartir actividades y costes promocionales
 Reducir costes, gracias a la posibilidad de compartir recursos, capacidades y
conocimientos.
 Aumentar ventas. Gracias a la unión, pueden abarcar proyectos de mayor
envergadura y acceder a algunos que de otra manera no sería posible.
Objetivos más habituales relacionados con la I+D+I:
 Compartir recursos (conocimiento, tiempo, dinero, personas,
instrumentos…) y optimizarlos para poder desarrollar productos y
servicios que sólo con sus capacidades individuales sería inviable.
 Compartir conocimientos y experiencias.
 Actuar conjuntamente ante administradores, clientes u
otros stakeholders, con el propósito de solicitar ayudas, u otro tipo de
recursos y de facilitadores.

2. ¿Cuáles son los pasos para realizar el Clustering?

Seleccionar una base de datos


Abrir una aplicación adecuada para el tratamiento
Cargar los datos en la aplicación elegida
Escoger un determinado algoritmo a usar
Realizar la ejecución del algoritmo
Visualizar los resultados

Vous aimerez peut-être aussi