Académique Documents
Professionnel Documents
Culture Documents
❑ Deux paramètres :
❑ 𝜀 rayon du voisinage
❑ MinPts nombre minimal de points voisins
DBSCAN (Density-Based Spatial Clustering of Applications with Noise )
DBSCAN divise les points en trois types :
1. Point intérieur (core point) : un point est un point intérieur s’il a au
moins un nombre minimal (Minpts) de Points voisins dans le rayon𝜀.
✓ Le point lui-même est compté.
✓ Ces points forment l’intérieure de la région dense.
DBSCAN (Density-Based Spatial Clustering of Applications with Noise )
PI
MinPts=3
DBSCAN
PI : Point Intérieur
PB : Point Bordure
BA : Point Aberrant s et r sont connectés par densité
PB PB
PI
PI
PI
PI
MinPts=3
DBSCAN
Entrées :
• Les données D
• Le rayon 𝜀
• Le seuil Minpts
DBSCAN
Début :
1. Marquer tous les points comme non visité
2. Faire
1. Sélectionner aléatoirement un point 𝑝 non visité
2. Marquer p comme visité
3. Si 𝑁𝜀 𝑝 ≥ 𝑀𝑖𝑛𝑝𝑡𝑠
1. Créer un nouveau cluster C et ajouter 𝑝 à C
2. Soit N un ensemble contenant les points de 𝑁𝜀 𝑝 , 𝑁 = 𝑁𝜀 𝑝
3. Pour chaque point 𝑝’ dans 𝑁
1. Si 𝑝’ n’est pas encore visité
1. Marquer p’ comme visité
2. Si 𝑁𝜀 𝑝′ ≥ 𝑀𝑖𝑛𝑝𝑡𝑠
1. Ajouter ces points à 𝑁 (𝑁 = 𝑁 ∪ 𝑁𝜀 𝑝′ )
2. si 𝑝’ n’est pas encore attribué à un cluster
1. Ajouter p’ à C
4. Fin pour
5. Ajouter C à la liste des clusters
4. Sinon
1. Marquer 𝑝 comme bruit
3. Jusqu’à ce que tous les points soient visités
DBSCAN
Caractéristiques de DBSCAN
❑ Avantages :
❑ Pas besoin de fixer le nombre de cluster
❑ Peut déterminer des clusters de différentes formes
❑ Robuste au bruit et anomalies
❑ Inconvénients :
❑ Paramètres à déterminer
❑ Fixer la taille du voisinage
❑ Fixer le rayon 𝜀
❑ Problèmes avec des données de densité variable
Caractéristiques de DBSCAN