Académique Documents
Professionnel Documents
Culture Documents
La normalisation égalise le poids de chaque dimension dans le but d'éviter que les variables ayant de
grandes valeurs soient considérées plus importantes que les variables ayant des valeurs moins
grandes, d'où l'importance de l'application au préalable de certains algorithmes de clustering.
La normalisation est une méthode de prétraitement des données qui permet de réduire la
complexité des modèles. C’est également un préalable à l’application de certains algorithmes.
car elle égalise le poids de chaque dimension, c’est-à-dire de chaque descripteur. A l’inverse, elle
est à proscrire pour l’utilisation d’autres algorithmes, par exemple l’analyse en composantes
principales (PCA), justement fondée sur l’importance relative de chaque dimension. Enfin la
normalisation n’a pas d’utilité pour certains algorithmes basés sur des seuils comme les arbres de
décisions car elle ne modifie pas le résultat.
travail est de proposer plusieurs mesures de dispersion d'une variable décrite par des intervalles.
On pourra en particulier utiliser ces mesures de dispersion pour normaliser le tableau de
données intervalles ou encore de manière équivalente la distance utilisée dans l'algorithme de
classification. MOTS-C ES : Données symboliques intervalles, standardisation, distance
normalisée, classification.
Le poids de chaque dimension de l’ensemble de données est différent de l’autre, chaque dimension
se trouve dans un intervalle différent. Par conséquent, les attributs ayants des grandes valeur
devienne plus considérable que les attributs ayant des valeurs plus petite.
Égaliser le poids des variables pour assurer l’indépendance par rapport aux unités de mesures
grands jusqu'à ce que tous les objets soient finalement regroupés dans un seul cluster ou jusqu'à ce
que des circonstances de fin spécifiées soient remplies.
jusqu'à ce que tous les objets se trouvent finalement dans un seul cluster ou jusqu'à ce que certaines
conditions de fin soient satisfaites
, jusqu’à ce que tous les objets se trouvent finalement dans un seul groupe ou autrement jusqu’à ce
que certaines conditions de terminaison soient remplies