Vous êtes sur la page 1sur 14

Comparaisons des

algorithmes de clustering

Présenté par:
NOUPOUE SILATCHOU MERVEILLE

Sous la supervision de :
Mr WAFFO AUSTIN
Contenu
Introduction Comparaisons
01 Définition de la notion 04 avec l’AFC
de Clustering

Algorithmes Conclusion
02 Les algorithmes de 05
Clustering recensés

Comparaisons Bibliographie
03 Divergences et cas 06
d’utilisation
01 Introduction

Méthode de classification non


supervisée qui rassemble un
01 ensemble d’algorithmes
d’apprentissages

Clustering

Le but est de regrouper entre

02 elles des données non


étiquetées présentant des
propriétés similaires.
02 Algorithmes recensés
02
K-Means 01 Mean shift

03 04
Clustering Gaussien Mixture
hiérarchique Algorithmes de models
clustering

05 06
Algorithme
DBSCAN
spectral
K-Means

Parmi les différents algorithmes de clustering, le K-means


est l'un des plus populaires. Il partitionne les données en k
clusters en minimisant la variance intra-cluster. C'est un
algorithme itératif qui attribue chaque point à un cluster en
fonction de la distance par rapport aux centres de ces
clusters, appelés centroïdes.
Clustering hiérarchique

Une autre approche courante est le clustering hiérarchique,


qui crée une hiérarchie de clusters en regroupant les
données de manière ascendante ou descendante. Cela
permet d'observer la structure des données à différentes
échelles et de visualiser les relations entre les clusters.
DBSCAN

DBSCAN est un algorithme de clustering basé sur la


densité des points dans l'espace. Il identifie les clusters en
considérant les régions de haute densité comme des
clusters et les points isolés comme du bruit. Cela lui
permet de détecter des clusters de formes complexes et de
tailles variables.
Mean shift

Mean Shift est un autre algorithme de clustering qui


identifie les clusters en déplaçant itérativement les points
vers les régions de densité maximale. Il est efficace pour
détecter des clusters de formes non linéaires et peut
s'adapter à différentes distributions de données.
Gaussien Mixture Models

Les Gaussian Mixture Models (GMM) sont des modèles


probabilistes utilisés pour le clustering. Ils supposent que
les données sont générées à partir d'un mélange de
distributions gaussiennes, ce qui permet de modéliser des
clusters de formes variées et d'estimer la probabilité
d'appartenance d'un point à un cluster.
Clustering spectral

le Spectral Clustering est une approche qui utilise les


valeurs propres et vecteurs propres d'une matrice de
similarité pour regrouper les données. Cela permet de
capturer les relations complexes entre les points et de
détecter des clusters non linéaires ou de forme irrégulière.
03 Comparaison

K-means, DBSCAN (efficace pour les


Scalabilité grandes quantités de données)

Hiérarchique, k-means,
Robustesse spectral(sensible aux valeurs
aberrantes)

Points de Hiérarchique, k-means (clusters


Interprétabilité
comparaison faciles à interpréter)

Spérique, variée, arbitraire


Forme de clusters fct densités, non linéaires et
complexes
04 Comparaison avec l’AFC

AFC Clustering
● Vise à identifier les concepts et les ● Vise à regrouper les observations
relations à partir des tableaux similaires en cluster
● Utiliser dans l’analyse des textes, la Vs ● Utiliser dans l’apprentissage
fouille de données automatique, le marketing
● Repose sur les concepts mathématiques ● Utilise les mesures de similarité ou de
tels que la théorie des ensembles. distance pour regrouper les
observations
Conclusion

L’Analyse Formelle des Concepts et les algorithmes de


clustering sont deux approches d'analyse des données
complémentaires qui peuvent être utilisées en fonction des
objectifs de l'analyse et du type de données disponibles. Il
est important de choisir la méthode la plus appropriée en
fonction du contexte spécifique de l'étude.
Merci pour votre attention

Vous aimerez peut-être aussi