Vous êtes sur la page 1sur 51

Analyse des

Correspondances Multiples
ACM

1
Introduction
L’analyse des correspondances multiples (ACM), est considérée comme l’application la plus
féconde de l’analyse des correspondances et dont les fichiers d’enquêtes socio-économiques
constituent le champ d’application privilégié ; elle est l’application de l’analyse factorielle des
correspondances à l’étude des tableaux logiques.
L’analyse factorielle des correspondances multiples (ACM ou AFCM) est la généralisation de
l’analyse des correspondances multiples au cas de plusieurs variables. Elle consiste donc à
représenter les modalités de variables qualitatives dans un espace euclidien dans lequel les
distances du 2 entre deux modalités d’une même variable sont préservées au mieux. On
considère donc dans cette section p variables qualitatives observées simultanément sur n
individus de poids identiques 1/n.
Cette analyse très simple est non plus adaptée aux tableaux de contingence de l'AFC,
mais aux tableaux disjonctifs complets. Ces tableaux sont des tableaux logiques pour des
variables codées. Les propriétés de tels tableaux font de l'ACM une méthode spécifique aux
règles d'interprétation des représentations simples. Elle permet donc l'étude des liaisons entre
plus de deux variables qualitatives, ce qui étend le spectre d'étude de l'AFC.
L'ACM est donc très bien adaptée au traitement d'enquêtes lorsque les variables sont
qualitatives (ou rendues qualitatives). Il est également possible de n'appliquer cette méthode
plusieurs fois en ne prenant en compte que quelques variables

Exemple - Considérons le jeu données de la Table 1 dans lequel on caractérise différentes


races de chien en fonction de 7 variables portant sur des caractéristiques de physique, sur des
points de caractère et une variable d’utilité. 2
Table 1 – Caractéristiques (physique, caractère, utilité) de différentes races de chien
3
Définitions et notations
Tableau disjonctif complet
Il est difficile de travailler directement avec un tableau de données comme celui de l’utilité des
races de chien. En effet, on ne peut pas considérer ces données comme des données
quantitatives. Par exemple, ça n’a pas de sens de considérer qu’il y a une distance équivalente
entre les classes - et + de la variable Poids et de la variable Intelligence. En conséquence, il est
d’usage de recoder les données et de construire le tableau disjonctif complet.
Le tableau disjonctif complet est tel que chaque ligne correspond à un individu et chaque
colonne à une modalité. On note K le nombre total de modalités. Et les observations xij sont
codées 1 si l’individu i a la modalité j et 0 sinon. Notons X le tableau disjonctif complet.
Dans l’exemple, on obtient alors le tableau de la Table 2.
Tableau de Burt

4
Table 2 – tableau disjonctif complet des caractéristiques (physique, caractère, utilité) de
5
différentes races de chien.
Remarque : si on considère les données du tableau disjonctif X comme des observations de
variables qualitatives, alors le tableau de Burt représente la variance de X à un facteur près.
Dans l’exemple des chiens, le tableau de Burt prend la forme suivante. On observe que la
diagonale représente les profils (ou distribution en effectif) des différentes variables tandis
que les termes extra diagonaux donnent les effectifs croisés entre deux modalités.

6
L’Analyse Factorielle des Correspondances Multiples des variables x1;…; xp est l’analyse
factorielle des correspondances du tableau disjonctif complet ou du tableau de Burt.

Une autre différence avec l’AFC subsiste néanmoins ; elle est inhérente au nombre de
facteurs : l’inertie du premier plan factoriel dans une ACM est nécessairement faible car
plus le nombre de dimensions de l’espace de départ est élevé(c’est-à-dire plus il y a de
modalités descriptives des individus), plus la projection de cet espace sur un plan(espace à
deux dimensions) entraîne une perte d’informations. Cela a des conséquences sur la qualité
de la projection de l’espace, mais la méthode de l’analyse factorielle permet néanmoins de
garder les traits les plus saillants de la structure des données, lesquels permettront une
interprétation.

Les données
L'ACM permet l'étude de tableaux décrivant une population de I individus et J variables
qualitatives. Une variable qualitative (ou nominale) peut être décrite par une application de
l'ensembles des I individus dans un ensemble ni non structuré, par exemple non ordonné.
Ces variables qualitatives peuvent être codées par un codage condensé qui attribue une
valeur à chaque modalité. Par exemple les modalités pour la couleur des cheveux peuvent
être 1 pour le marron, 2 pour le blond et 3 pour le roux. Les données peuvent donc être
représentées sous la forme d'une matrice X décrite par le tableau , où I représente à la fois
le nombre d'individus et l'ensemble des individus I = {1; ….; I}, J représente à la fois le
nombre de variables et l'ensemble des variables J = {1; ….; J} et xij est le codage condensé
de l'individu i pour la variable j.
7
Les xij représentant une codification, en prendre la moyenne n'a aucun sens. Ces données ne
peuvent donc pas être traitées par l'ACP ou l'AFC précédemment étudiées.
Ce tableau présente donc des spécificités dont l'analyse factorielle doit tenir compte par
une méthode spécifique.
Les objectifs
Les objectifs que cette méthode spécifique, l'ACM, doit remplir sont les mêmes que ceux de
l'ACP ou de l'AFC. Il s'agit d'obtenir une typologie des lignes et des colonnes et relier ces deux
typologies. Nous aurons ici trois familles d'éléments à étudier, les individus, les variables et les
modalités des variables. Cette étude se fait par la définition de ressemblances et liaisons pour
ces trois familles . Afin d'établir un bilan des ressemblances entre individus, comme en ACP
nous cherchons à répondre à des questions du type :
- Quels sont les individus qui se ressemblent ?
- Quelles sont ceux qui sont différents ?
- Existe-t-il des groupes homogènes d'individus ?
- Est-il possible de mettre en évidence une typologie des individus ?
Les mêmes types de questions se posent pour les variables et les modalités.

Principe de l'ACM
Le principe de base de l'ACM repose dans un premier temps sur une transformation
des données du tableau pour modifier la codification en nombres binaires. L'analyse
applique ensuite le même principe que l'AFC, en transformant ce tableau disjonctif complet
ainsi obtenu en profils-lignes et en profils-colonnes. La distance du χ2 est également
employée pour définir les liaisons. 8
Exemple:
Analyser un tableau de données – Variables toutes qualitatives

Extrait des données «races canines»

N={ i , ,1:…..}

Individus actifs

Questions :
1) Quelles sont les chiens qui se ressemblent ? (proximité entre les individus)
2) Sur quelles caractéristiques sont fondées les ressemblances / dissemblances
3) Quelles sont les relations entre les modalités (distance)
4) Quelles sont les relations entre les variables 9
Tableau de données –Codage disjonctif complet

10
11
Travailler sur les profils lignes
Distance du χ² entre les individus –Distance à l’origine

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Ces relations quasi-barycentriques donnent trois modes de représentation simultanée des
individus et des modalités :
1. la première relation dans se lit : Les coordonnées factorielle de l'individu i sur l'axe h est égale,
a près, a la moyenne arithmétique simple des coordonnées des modalités qu'il possède.

Première possibilité de représentation simultanée : les individus au barycentre des


modalités.
2. la seconde relation se lit : Les coordonnées factorielle de la modalité sur l'axe h est égale, a
près, à la moyenne arithmétique simple des coordonnées des individus qui la possèdent.

Seconde possibilité de représentation simultanée : les modalités au barycentre des


individus.
3. Une troisième représentation simultanée des individus et des modalités consiste à représenter
sur un même graphique les moyennes arithmétiques dilatées par
Sur ces graphiques, à près :

les individus sont au centre des modalités qu'ils ont choisis,


les modalités sont au centre des individus qui les ont choisis.

41
42
43
44
45
46
47
48
49
50
51

Vous aimerez peut-être aussi