Vous êtes sur la page 1sur 14

01

QQOQCP
clustering hiérarchique :
Clustering

QUOI
Le clustering hiérarchique est une méthode de clustering qui
permet de regrouper des données similaires en formant une
hiérarchie de clusters. Cette méthode consiste à diviser les données
en sous-groupes (ou clusters) selon leur similarité, en utilisant des
mesures de distance telles que la distance euclidienne ou la
distance de Manhattan. Ensuite, les sous-groupes sont regroupés
les uns avec les autres en formant des clusters plus grands, jusqu'à
ce que toutes les données soient incluses dans un seul et même
cluster.
Clustering

QUI

Cette méthode est utilisée en statistique, en


exploration de données et en machine learning.
Clustering


Le clustering hiérarchique est applicable dans de
nombreux domaines tels que la biologie,
l'économie, la reconnaissance de formes, etc.
Clustering

QUAND

Le clustering hiérarchique est utilisé lorsque l'on


souhaite visualiser la structure des clusters de
données.
Clustering

Pourquoi

Le clustering hiérarchique est utilisé lorsque l'on


souhaite visualiser la structure des clusters de
données.
Clustering

Comment

Le clustering hiérarchique peut être réalisé en utilisant


différentes méthodes, telles que la méthode de liaison
simple, la méthode de liaison complète ou la méthode de
liaison moyenne. Chaque méthode utilise une mesure de
distance différente pour évaluer la similarité entre les
clusters.
02
QQOQCP
DBSCAN :
Clustering

QUOI
Est un algorithme de clustering non-paramétrique qui permet de
regrouper les données similaires en identifiant des zones de haute
densité. Cette méthode consiste à trouver des zones dans l'espace
des données où les points sont densément regroupés, et à les
regrouper en clusters. Les points qui ne sont pas inclus dans ces
zones sont considérés comme du bruit et ne font pas partie d'un
cluster.
Clustering

QUOI
Cette méthode est utilisée en statistique, en
exploration de données et en machine learning.
Clustering


Le DBSCAN est applicable dans de nombreux
domaines tels que la biologie, l'économie, la
reconnaissance de formes, etc.
Clustering

QUAND

Le DBSCAN est utilisé lorsque l'on souhaite


identifier des zones de haute densité dans des
données.
Clustering

Pourquoi

Le DBSCAN permet de découvrir des clusters de


formes arbitraires et de détecter les points
aberrants.
Clustering

Comment
Le DBSCAN utilise deux paramètres clés : le rayon de voisinage
(epsilon) et le nombre minimum de points dans un cluster (minPts).
Les points qui sont à une distance inférieure ou égale à epsilon les
uns des autres sont considérés comme faisant partie du même
cluster. Un cluster doit comporter au moins minPts points pour être
valide. Les points qui ne font pas partie d'un cluster sont considérés
comme du bruit.

Vous aimerez peut-être aussi