Académique Documents
Professionnel Documents
Culture Documents
Mejdi Chebbi M1 K Means
Mejdi Chebbi M1 K Means
Elaboré par :
CHEBBI MEJDI
X_norm = (x-min(x))/(max(x)-min(x))
Appliquons cette formule aux données de poids et de prix pour les normaliser :
Exemple :
X1_poids=(0.1-0.1)/(1.8-0.1)= 0
Poids Prix
A 0.00 0.92
D 1.00 0.0000
E 0.89 0.2857
B 0.47 0.2857
C 0.06 1.0000
Maintenant que les données sont normalisées, nous pouvons utiliser l’algorithme K-means pour créer
des clusters. Supposons que nous choisissons K=2 pour commencer.
Nous choisissons deux points de départ au hasard, qui peuvent être n’importe quelles observations
de données. Disons que nous choisissons les observations A et D comme points de départ.
Nous calculons ensuite les distances euclidiennes entre ces deux points de départ et toutes les autres
observations de données normalisées. Les distances son ensuite utilisées pour affecter chaque
observation au cluster le plus proche.
Ensuite, nous calculons les moyennes des données normalisées pour chaque cluster et utilisons ces
moyennes comme nouveaux points de départ pour la prochaine itération. Nous continuons ce
processus jusqu’ à ce que les points de départ ne changent plus de manière significative.
2. itération 1 :
Distance euclidienne
U1 =A et U2 = D
A B C D E
U1 0 1.05 0.83 1.38 1.2
U2 1.3 1.1 1.39 0 0.62
- Cluster 2: D, E
- Nouveaux point de départ : moyenne des données normalisées pour chaque cluster
3.Itération 2 :
- Cluster 1 : A, B, C ; Cluster 2 : D, E
Les points de départ ne changent plus de manière significative, nous pouvons donc conclure que
nous avons convergé vers une solution. Le cluster 1 contient les articles A, B et C, tandisque le cluster
2 contient les articles D et E.