Vous êtes sur la page 1sur 2

Analyse des Données

Analyse Typologique

Quand doit-on utiliser une analyse typologique selon la méthode de la classification hiérarchique ?
On choisit la méthode de classification hiérarchique quand on n’a pas une connaissance préalable du
nombre de classes souhaitées et aussi quand la taille de l’échantillon étudié est inférieure à 100.

Une ACP comme une AT permet de mettre en évidence la formation de groupe d’individus. En quoi
ces deux méthodes diffèrent-elles ?
L’ACP permet de synthétiser les variables et les réduire afin d’obtenir de nouvelles variables
artificielles qui nous permettrons de mieux expliquer les variables initiales. Par contre, le but de l’AT
est de former des groupements d’individus, les individus qui appartiennent au même groupe doivent
se ressembler au maximum, mais les différents groupes formés doivent être les plus hétérogènes
possibles.

Comment doit-on fixer le nombre de groupes dans une analyse hiérarchique ?


Pour fixer le nbre de groupes dans une analyse hiérarchique, on cherche le nœud où on a effectué
l’agrégation entre les individus les plus éloignés (là où on a effectué le saut important) et on découpe
à ce niveau là. Pour toucher le nbre de groups, on compte le nombre d’agrégations restante on
ajoute 1.

Quels sont les objectifs d’une AT ?


Construire des groupes homogènes à partir de variables définies à priori.
Construire des groupes où les individus se ressemblent au maximum et où les groupes sont différents
entre eux.

Dicter les principales différences entre la classification hiérarchique et non hiérarchique ?


La classification hiérarchique permet de fusionner ou de dissocier successivement un groupe
d’individus, chaque individu est affecté à un groupe d’une manière irrévocable, c-à-d on ne peut pas
le dissocier et l’intégrer à un autre groupe.
Par contre, l’analyse non hiérarchique affecte l’individu de manière révocable, il peut chaque fois
changer de classe jusqu’à ce qu’il se stabilise. En plus, cette méthode requiert la connaissance
préalable du nombre de classes d’affectations. Il faut aussi signaler que si on dispose de plus de 100
individus, la classification hiérarchique n’est plus valable.

Comment valide-t-on les résultats d’une analyse typologique ?


- Des méthodes différentes doivent aboutir à des résultats semblables.
- Si on partage l’échantillon en 2 moitiés, on doit aboutir aux mêmes résultats.
- En utilisant une analyse discriminante
- Les distributions des groupes sur les variables de classification ne se chevauchent pas

Quelle procédure de calcul utilise-t-on en classification non hiérarchique ?


- Choisir les k centres de classes, où k est le nombre de classes désiré.
- Assigner chaque individu à la classe qui lui est la plus proche.
- Réassigner chaque individu à l’une des k classes selon une règle prédéterminée
- S’arrêter s’il n’y a plus d’observations à assigner.

La matrice de proximité est composée à partir des variables métriques (distance euclidienne) quand il
s’agit d’une variable quantitative et à partir de la dis-similarité quand c’est une variable qualitative.

=>Variable métrique : distance euclidienne


Variable nominale : indice de similarité ou de dis-similarité.
Un indice de similarité est un descripteur statistique de la similitude de deux échantillons ou
individus représentés par plusieurs variables. Un indice de similarité prend une valeur comprise entre
0 (différence totale) et 1 ou 100% (similitude totale)
Un indice de dis-similarité est le complément de l’indice de similarité (dis= 1-sim). Sa valeur est
comprise entre 100% (différence totale) et 0 (similitude totale)
Tous les indices de similarités/ dis-similarité peuvent servir à construire des matrices de distance.

Vous aimerez peut-être aussi