Académique Documents
Professionnel Documents
Culture Documents
Iskandar KESKES
iskandarkeskes@gmail.com
Université de Gabès
Institut supérieur de Gestion de Gabès
Comment procède-t-on?
Exemple : parmi les dix objets suivants quels sont les
deux les plus ressemblants?
Exemples d’application :
Identifier des groupes d’individus ou de
ménages ayant un comportement homogène
vis-à-vis de :
la consommation de différents produits,
la consommation de différentes marques ou
variétés,
l’attitude par rapport à un produit,
...
Données analysées :
Un tableau individus-variables :
n individus (objets) décrits par p variables
(descripteurs) ;
un tableau à valeurs numériques
continues (valeur de la variable j pour
l’individu i) ;
un tableau de contingence (croisant deux
partitions d’une même population) ;
un tableau de présence–absence (valeur
0 ou 1).
Un tableau carré symétrique de
similarités ou de distances.
Objectifs :
Constituer des groupes d’objets
homogènes et différenciés tels que :
les objets soient les plus similaires possibles
au sein d’un groupe (critère de compacité) ;
les groupes soient aussi dissemblables que
possible (critère de séparabilité).
Hypothèse :
On suppose qu’une structure de
classes existe au sein de la
population étudiée.
Représentations :
La représentation synthétique peut
être :
une typologie ;
une partition ;
une hiérarchie de partitions (arbre
hiérarchique) ;
une hiérarchie de recouvrements
(pyramide).
Évaluation de la ressemblance
En résumé:
Un dendrogramme
Première observation :
La stratégie intuitive utilisé pour passer d’une partition
Pi à la suivante Pi+1 ne remet pas en cause les
regroupements.
Si deux individus sont réunis dans une classe, ils
restent ensemble tout le temps.
Les partitions ainsi construites sont emboîtées de la
plus fine à la plus grossière.
On obtient une hiérarchie de partitions qu’on peut
représenter par un dendrogramme.
Deuxième observation :
Mesures de distance :
La plupart des techniques de classification font appel à des
mesures de distance, appelé aussi métrique.
Types de dissimilarité :
Selon la nature des données, on distinguent quatre
groupes de critères de dissimilarité entre individus :
6,7
5,29