Vous êtes sur la page 1sur 1

Année 2020/2021

TD/TP n° 3 : Modules "Datamining" (M2-IL) & " Fouille & Extraction de données " (M2-ISIA)

Weka & "Clustering"

Exercice 1 : Rappelez l'objectif du clustering.


Exercice 2 : Qu'est ce qu'un cluster ? Comment est-il construit ?.
Exercice 3 : La classification basée sur le clustering est-elle supervisée ou non supervisée ?. Expliquez.
Exercice 4 : Comment juge-t-on la qualité d'un clustering ?.
Exercice 5 : On dispose de 8 données (A1, A2, A3, A4, A5, A6, A7, A8) représentées chacune par un point sur le plan .

Point Coordonnées
A1 2, 10
A2 2, 5
A3 8, 4
A4 5, 8
A5 7, 5
A6 6, 4
A7 1, 2
A8 4, 9

5.1/ Appliquez l'algorithme de clustering KMeans, en choisissant k=3, et A1, A4 et A7 comme centres
initiaux.
5.2/ Même question, mais en choisissant k=3, et A2, A6 et A8 comme centres initiaux. Que peut-on conclure
?.
5.3/ Exécuter le programme SimpleKmeans de Weka sur les mêmes données. Décrivez et commentez votre
expérimentation.

Exercice 6 : On reprend les données "weather" de Quinlan. Exécuter le programme SimpleKmeans de Weka avec
k=2. Décrivez et commentez votre expérimentation.

4/6

Vous aimerez peut-être aussi