Vous êtes sur la page 1sur 19

Analyse des correspondance multiples

L’ACM est une méthode descriptive qui


permet d’étudier les liaisons entre plusieurs
variables qualitatives. Elle généralise l’AFC qui
est limitée à l’analyse des liens entre deux
variables qualitatives. Elle est souvent utilisée
pour interpréter les résultats d’une enquête
d’opinion.

Pr. TRABELSI MOHAMED ALI, FSEGT 1


Analyse des correspondance multiples
Cas pratique

Une étude a été réalisée afin de déterminer les


réponses de 20 individus sur leurs sexe (M=1, F=2),
opinion politique (Extrême Gauche=1, Gauche=2,
Centre=3, Droite=4, Extrême Droite=5), catégorie
socioprofessionnelle (Agriculteur=1, Employé=2,
Ouvrier=3, Cadre Moyen=4, Cadre Supérieur=5,
Patron=6, Autre=7) et activité (En activité=1,
Chômeur=2, En retraite=3).
Les données sont représentées dans le tableau
suivant:

Pr. TRABELSI MOHAMED ALI, FSEGT 2


Analyse des correspondance multiples
Individu Sexe Opinion Politique CSP Activité

1 1 2 5 1
2 2 1 5 1
3 1 4 5 1
4 2 4 5 1
5 2 2 4 1
6 2 4 7 3
7 2 3 3 1
8 1 4 4 1
9 2 3 1 1
10 1 4 1 1
11 1 5 6 3
12 2 4 6 3
13 1 3 2 2
14 2 2 2 2
15 1 3 3 1
16 2 3 4 1
17 2 3 2 1
18 1 3 3 1
19 1 1 3 1
20 2 3 7 1
Pr. TRABELSI MOHAMED ALI, FSEGT 3
Analyse des correspondance multiples
Méthodologie
La méthodologie consiste à analyser le tableau
disjonctif complet: à chaque modalité est associée
une variable indicatrice prenant comme valeur 1 ou 0
suivant que l’unité statistique vérifie ou non cette
modalité. Le tableau disjonctif complet est défini par
l’ensemble des variables indicatrices. Leur nombre
est égal au nombre total de modalités.
NB: Le nombre d’unités statistiques doit être
suffisant par rapport au nombre total de modalités et
non au nombre de variables qualitatives.

Pr. TRABELSI MOHAMED ALI, FSEGT 4


Analyse des correspondance multiples
Méthodologie
Le tableau disjonctif est composé par les coefficients
1 𝑠𝑖 l’individu i possède la modalité m
𝑘𝑖𝑚 = ቊ
0 𝑠𝑖𝑛𝑜𝑛
Ce tableau possède les propriétés suivantes:
• La somme des termes d’une ligne est égale au
nombre de variables qualitatives (q).
• La somme des termes d’une colonne est le nombre
d’unités statistiques possédant la modalité
caractérisée par la variable indicatrice correspondante
(l’effectif de ce groupe), noté par 𝑛𝑚 .
Pr. TRABELSI MOHAMED ALI, FSEGT 5
Analyse des correspondance multiples
Méthodologie
• Le nombre total de variables indicatrices est égal au
nombre total des modalités.
• Le nombre de personnes interrogés devrait être au
moins 5 fois plus que le nombre total des modalités.
• La matrice est d’ordre nq
• La matrice des fréquences est composé par:
𝑘𝑖𝑚 1/𝑛𝑞 𝑠𝑖 l’individu i possède la modalité m
𝑓𝑖𝑚 = =ቊ
𝑛𝑞 0 𝑠𝑖𝑛𝑜𝑛
• Le poids des lignes (individus) est constant = 1/𝑛
𝑛𝑚
• Le poids des colonnes (modalités) vaut
𝑛𝑞

Pr. TRABELSI MOHAMED ALI, FSEGT 6


Analyse des correspondance multiples
Tableau disjonctif complet
Sexe Opinion Politique CSP Activité
M F EG G C D ED AG EM OU CM CS P A ACT CHÔ RET
1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0
2 0 1 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0
3 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
4 0 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
5 0 1 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0
6 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1
7 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
8 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0
9 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0
10 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0
11 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1
12 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1
13 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0
14 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0
15 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
16 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0
17 0 1 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0
18 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
19 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0
20 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0
Pr. TRABELSI MOHAMED ALI, FSEGT 7
Analyse des correspondance multiples
Tableau de Burt
Le tableau de Burt est une matrice carrée nxn (n
représente le nombre total de modalités),
constituée de p² sous-matrices. Chacune des p
sous-matrices diagonales est relative à l'une des p
variables. La jieme d'entre elles est carrée d'ordre nj ,
matrice diagonale, et comporte sur la diagonale les
effectifs marginaux de la variable Xj. La sous-matrice
figurant dans le bloc d'indice (j; j’); j ≠ j’, est la table
de contingence construite en mettant Xj en lignes et
Xj’ en colonnes. Le tableau de Burt est donc
symétrique.
Pr. TRABELSI MOHAMED ALI, FSEGT 8
Analyse des correspondance multiples
Tableau de Burt (ou contingence généralisé)
M F EG G C D ED AG EM OU CM CS P A ACT CHÔ RET
M 9 0 1 1 3 3 1 1 1 3 1 2 1 0 7 1 1

F 0 11 1 2 5 3 0 1 2 1 2 2 1 2 8 1 2

EG 1 1 2 0 0 0 0 0 0 1 0 1 0 0 2 0 0

G 1 2 0 3 0 0 0 0 1 0 1 1 0 0 2 1 0

C 3 5 0 0 8 0 0 1 2 2 1 0 0 1 7 1 0

D 3 3 0 0 0 6 0 1 0 0 1 2 1 1 4 0 2

ED 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1

AG 1 1 0 0 1 1 0 2 0 0 0 0 0 0 2 0 0

EM 1 2 0 1 2 0 0 0 3 0 0 0 0 0 1 2 0

OU 3 1 1 0 2 0 0 0 0 4 0 0 0 0 4 0 0

CM 1 2 0 1 1 1 0 0 0 0 3 0 0 0 3 0 0

CS 2 1 1 0 2 0 0 0 0 0 4 0 0 4 0 0

P 1 1 0 0 0 1 1 0 0 0 0 0 2 0 0 0 2

A 0 2 0 0 1 1 0 0 0 0 0 0 0 2 1 0 1

ACT 7 8 2 2 7 4 0 2 1 4 3 4 0 1 15 0 0

CHÔ 1 1 0 1 1 0 0 0 2 0 0 0 0 0 0 2 0

RET 1 2 0 0 0 2 1 0 0 0 0 0 2 1 0 0 3

Pr. TRABELSI MOHAMED ALI, FSEGT 9


Analyse des correspondance multiples
Principe de la méthode
Il s'agit d‘étudier les liaisons pouvant exister entre
les p variables considérées. En fait, dans la mesure
ou les données se présentent sous forme d'un
tableau de Burt, juxtaposition de tables de
contingence, seules les liaisons entre variables
prises deux a deux sont considérées (il s'agit de ce
que l'on appelle en statistique, les interactions
d'ordre deux). Pour étudier ces liaisons, la
démarche sera de même nature qu'en A.F.C.

Pr. TRABELSI MOHAMED ALI, FSEGT 10


Analyse des correspondance multiples
Présentation de la méthode
Notion de distance: Pour mesurer la distance entre
deux unités statistiques (ou entre deux variables
indicatrices), on compare les termes de même rang à
travers la statistique de 𝜒 2 et ce, par analogie avec
l’AFC.
𝑓𝑖𝑚 𝑘𝑖𝑚
• Le profil ligne est défini par = = 𝑃𝑗𝑖 où q est
𝑓𝑖. 𝑞
le nombre de variables qualitatives. Deux unités
statistiques qui diffèrent suivant une modalité donnée
sont d’autant plus éloignées que cette modalité est
rarement observé.
𝑗 𝑓𝑖𝑚 𝑘𝑖𝑚
• Le profil colonne est défini par 𝑃𝑖 = = où 𝑛𝑗
𝑓.𝑗 𝑛𝑗
est la somme de la colonne j.
Pr. TRABELSI MOHAMED ALI, FSEGT 11
Analyse des correspondance multiples
Présentation de la méthode
Ainsi, nous pouvons définir les tableaux des carrés
des distances du 𝜒 2 entre les profils lignes (deux
individus) et les profils colonnes (deux modalités).
2
𝑘𝑖𝑗 𝑘𝑖′ 𝑗
− 2
𝑞 𝑞 𝑛 1
d²(i, i’) = σ𝑗 = σ𝑗 𝑘𝑖𝑗 − 𝑘𝑖 ′ 𝑗
𝑓.𝑗 𝑞 𝑛𝑗

2
𝑘𝑖𝑗 𝑘𝑖𝑗′
− 2
𝑛𝑗 𝑛𝑗 ′ 𝑘𝑖𝑗 𝑘𝑖𝑗′
d²(j, j’) = σ𝑗 = 𝑛 σ𝑖 −
𝑓𝑖. 𝑛𝑗 𝑛𝑗 ′

Pr. TRABELSI MOHAMED ALI, FSEGT 12


Analyse des correspondance multiples
Inertie totale et Valeur propre
• En AFC, on pouvait interpréter statistiquement
l’inertie des nuages de points (profil-lignes et
colonnes) en terme de χ²/n mesurant l’indépendance
entre les deux variables qualitatives. En ACM ce n’est
𝑚
plus le cas puisque l’on a : 𝐼 = − 1
𝑝
𝑚
On a donc l’inertie qui dépend de , le nombre
𝑝
moyen de modalités par variable.
• Le nombre de valeurs propres est égal à Inf(n-1; m-q)

Pr. TRABELSI MOHAMED ALI, FSEGT 13


Analyse des correspondance multiples
Notion de contribution
En ACM la contribution d’un individu i et la contribution d’une
modalité m à l’inertie de l’axe k s’écrivent :
2
1 𝑥𝑖𝑘
• 𝐶𝑜𝑛𝑡𝑟𝑘 𝑖 =
𝑛 𝜆𝑘
2
𝑛𝑗 𝑦𝑗𝑘
• 𝐶𝑜𝑛𝑡𝑟𝑘 𝑗 =
𝑛𝑝 𝜆𝑘
La contribution d’une variable qualitative j à un axe k donne une
idée de la liaison entre cette variable et la composante
principale xk.
On utilise ces contributions pour représenter graphiquement les
variables qualitatives de l’analyse sur un plan factoriel (k, k’). On
représente en abscisse les contributions des variables à l’axe k
et en ordonnée les contributions des variables à l’axe k’.
Pr. TRABELSI MOHAMED ALI, FSEGT 14
Analyse des correspondance multiples

Interprétation des résultats

Variance expliquée
Alpha de
Dimension Cronbach Total (valeur Inertie Pourcentage
propre) de variance
expliquée
1 0,744 3,332 0,196 19,600

2 0,670 2,709 0,159 15,938

Total 6,041 0,355

Moyenne 0,711 3,021 0,178 17,769

Pr. TRABELSI MOHAMED ALI, FSEGT 15


Analyse des correspondance multiples
Interprétation des résultats
Coordonnées des objets Mesures de discrimination
Numéro de Dimension Dimension Moyenn
l'observation 1 2 1 2 e
1 -0,429 -0,525 Masculin 0,002 0,325 0,163
2 -0,555 -0,416 Feminin 0,002 0,325 0,163
3 -0,152 -1,213 Extrême gauche 0,051 0,076 0,063
4 -0,101 -0,369 Gauche 0,003 0,147 0,075
5 -0,404 0,650 Centre 0,189 0,113 0,151
6 1,593 0,343 Droite 0,122 0,130 0,126
7 -0,786 0,201 Extrême droite 0,418 0,061 0,240
8 -0,177 -0,882 Agriculteur 0,017 0,016 0,017
9 -0,610 0,310 Employé 0,000 0,594 0,297
10 -0,165 -1,079 Ouvrier 0,165 0,084 0,125
11 2,819 -1,078 Cadre moyen 0,028 0,001 0,015
12 2,208 -0,107 Cadre supérieur 0,024 0,099 0,062
13 0,153 1,627 Patron 0,702 0,039 0,371
14 0,422 2,614 Autre 0,049 0,029 0,039
15 -0,837 -0,643 En activité 0,690 0,154 0,422
16 -0,622 0,507 Chômeur 0,009 0,499 0,254
17 -0,468 1,266 Retraité 0,859 0,014 0,437
18 -0,837 -0,643 Total actif 3,332 2,709 3,021
19 -0,795 -1,236 Pourcentage de
19,600 15,938 17,769
20 -0,258 0,676 variance expliquée

Pr. TRABELSI MOHAMED ALI, FSEGT 16


Analyse des correspondance multiples
Interprétation graphique

Pr. TRABELSI MOHAMED ALI, FSEGT 17


Analyse des correspondance multiples
Interprétation graphique

Pr. TRABELSI MOHAMED ALI, FSEGT 18


Références
• Bastin Ch. et Benzecri J.P., (1980), Pratique de l’analyse des données : études de cas,
Dunod, Paris.
• Benzecri J.P., (1973), L’Analyse des données, Dunod, Paris.
• Benzecri J.P., (1980), Pratique de l’analyse des données, Dunod, Paris.
• Bouroche J.M. et Saporta.J., (1994), L’analyse des données, Série Que sais-je ?, Presses
Universitaires de France.
• Carricano M., Poujol F. et Bertrandias L., (2010), Analyse de données avec SPSS, Pearson,
Paris.
• Casin Ph., (2013), Exercices d’économétrie et d’analyse de données, Technip, Paris.
• Ghewy P., (2010), Guide pratique de l’analyse des données, De Boeck, Bruxelles.
• Fenneteau H., Analyse statistique des données : Applications et cas en marketing.
• Foucart T., (1991), Introduction aux tests statistiques. Enseignement assisté par
ordinateur, Technip, Paris.
• Foucart T., (1997), L’analyse des données, PUR, France.
• Saporta G., (2011), Probabilités, Analyse des données et statistique, Technip, Paris.
• Zouhhad R., Viviani J-L., Bouffard F., (2005), Mathématiques appliqués : Manuel et
applications, Dunod, Paris.

Pr. TRABELSI MOHAMED ALI, FSEGT 19