Académique Documents
Professionnel Documents
Culture Documents
Analyse Des Correspondances Multiples
Analyse Des Correspondances Multiples
CORRESPONDANCES
MULTIPLES
L’Analyse des correspondances multiples
est une méthode permettant d’étudier
les liaisons entre plusieurs variables
qualitatives ou quantitatives,
c’est donc une généralisation de l’AFC.
Elle s’applique en particulier pour les
sondages
1 Nature des données étudiées
1.1 Données initiales
Codage :
Q1 : Masc = 1 et Fem = 2
Q2 : EG =1 ; G =2 ; C =3 ; D =4 ; ED =5
Q3 : AGRI =1 ; EMP = 2 ; OUV = 3 ; CM = 4 ; CS
=5 ; PIC = 6 ; AUT = 7
Q4 : ACT = 1 ; CHO = 2 ; RET = 3
1.2 Tableau disjonctif complet
On associe à chaque modalité une variable
appelée variable indicatrice ne prenant que
les valeurs 1 et 0 selon que la modalité est
vérifiée ou non.
Xj: variable indicatrice de la modalité j
(de j=1 à m1 pour la première modalité, de
j=m1+1 à m1+m2 pour la deuxième...)
Xj(k): valeur (0 ou 1) de la variable indicatrice
Xj pour l’individu k
Individus Q1 Q2 Q3
3
TABLEAU DISJONCTIF COMPLET
Rang Sexe Opinion Politique C. S. P Activité
M F EG G C D ED A E O CM CS P A A C R
1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0
2 0 1 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0
3 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
4 0 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
5 0 1 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0
6 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1
7 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
8 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0
9 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0
10 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0
11 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1
12 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1
13 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0
14 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0
15 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
16 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0
17 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
18 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
19 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0
20 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0
Remarques:
La somme des termes de chaque ligne est égale à q.
La somme des termes de la colonne associée à la variable Xj
est notée nj.
La fréquence associée, appelée fréquence marginale est
notée pj.
pj =nj/nq
Une ACM n’est intéressante que si le nombre d’individus
est très grand ainsi que le nombre de modalités
Les individus doivent être répartis assez régulièrement.
FREQUENCES MARGINALES
M F EG G C D ED A E O CM CS P A A C R
effectifs 9 11 2 3 8 6 1 2 3 4 3 4 2 2 15 2 3
fréq 11,2 13,8 2,5 3,8 10 7,5 1,3 2,5 3,8 5 3,8 5 2,5 2,5 18,9 2,5 3,8
1. 3 Eléments supplémentaires
On peut introduire des éléments supplémentaires
par opposition aux données actives sur
lesquelles portent l’Analyse mathématique.
Colonnes: variables indicatrices de variables
dont on ne tient pas compte, variables
explicatives (âge, sexe, lieu...)...
Lignes: individus ne faisant pas partie de la
population étudiée, individus moyenne d’un
groupe (dans ce cas les valeurs sont des
fréquences, la somme est encore égale à q)
TABLEAU DES VARIABLES
Variables actives
Variables supplémentaires
1 1 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0
2 0 1 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 0
3 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
4 0 1 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
5 0 1 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0
6 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 1
7 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
8 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
9 0 1 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0
10 1 0 0 0 1 0 0 1 1 0 0 0 0 1 0 1 0 0
11 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1
12 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 1
13 1 0 0 1 0 1 0 0 0 1 0 0 1 0 0 0 1 0
14 0 1 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0
15 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 0
16 0 1 0 1 0 0 1 0 1 0 0 0 1 0 0 1 0 0
17 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
18 1 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
19 1 0 1 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0
20 0 1 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0
2. Description de la méthode
La méthode est basée, comme en AFC sur l’étude
des distances entre PFL et PFC et sur l’analyse
des proximités et des éloignements.
Attention: Contrairement à l’AFC, il ne s’agit pas
de s’intéresser à l’indépendance.
2.1 Notion de distance
On définit une distance du χ2:
Pour les individus:
X j (i) X j (l )
m
q q m X (i) X (l )
d (i; l )
2 j j
j pj q j pj
Pour les modalités
X j (i ) X l (i )
n n
nl n X j (i ) X l (i )
d ( j; l ) n
j
2
i
i n j nl
n
Remarque
Plus la modalité est de fréquence faible,
plus les individus sont éloignés
Plus l’effectif d’une modalité est faible,
plus la distance entre les modalités est
grande.
→ Notion de « prime à la rareté »
D’où la nécessité de regrouper certaines
modalités
Distance du χ2 entre les profils
colonnes
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA
MASC 0,00 4,04 4,44 3,06 2,54 2,54 3,17 4,07 1,48 4,44
FEM 4,04 0,00 3,64 2,05 3,12 3,12 2,60 2,73 1,21 3,64
GAU 4,44 3,64 0,00 6,50 6,86 4,57 3,43 7,33 3,20 6,40
CEN 3,06 2,05 6,50 0,00 5,36 1,79 4,64 4,17 1,50 5,50
DRO 2,54 3,12 6,86 5,36 0,00 5,71 3,27 2,38 2,67 3,43
O-E 2,54 3,12 4,57 1,79 5,71 0,00 5,71 6,19 2,29 4,57
CAD 3,17 2,60 3,43 4,64 3,27 5,71 0,00 6,19 1,52 6,86
DIV 4,07 2,73 7,33 4,17 2,38 6,19 6,19 0,00 3,33 3,33
ACT 1,48 1,21 3,20 1,50 2,67 2,29 1,52 3,33 0,00 5,33
INA 4,44 3,64 6,40 5,50 3,43 4,57 6,86 3,33 5,33 0,00
2.2 Analyse Mathématique
axe 1 29,3%
axe 2 24,7%
axe 3 18,4%
axe 4 16,6%
axe 5 7,2%
axe 6 3,8%
axe 7 0,0%
axe 8 0,0%
axe 9 0,0%
COMPOSANTES PRINCIPALES
SUR LES AXES 1, 2 & 3
Axe 1 1 Axe 2 1&2 Axe 3 1&2&3
VARIABLES coord qlt cr cum. coord. qlt cr cum. coord. qlt cr cum.
MASC -0,060 0,003 0,001 0,003 0,036 0,001 0,000 0,004 -1,078 0,951 0,474 0,955
FEM 0,049 0,001 -0,029 0,000 0,882 0,388
0,003 0,003 0,001 0,004 0,951 0,955
GAU -0,779 0,086 0,693 0,081 0,169 0,006
0,202 0,202 0,160 0,363 0,009 0,372
CEN -0,431 0,042 -0,925 0,230 0,218 0,017
0,124 0,124 0,570 0,694 0,032 0,726
DRO 1,049 0,219 0,562 0,074 -0,370 0,043
0,592 0,592 0,170 0,762 0,074 0,836
O-E -0,641 0,082 -0,987 0,230 -0,359 0,041
0,221 0,221 0,524 0,745 0,070 0,815
CAD -0,440 0,038 1,169 0,322 0,098 0,003
0,104 0,104 0,735 0,840 0,005 0,845
DIV 1,261 0,271 -0,212 0,009 0,306 0,025
0,681 0,681 0,019 0,701 0,040 0,741
ACT -0,391 0,065 0,162 0,013 0,023 0,000
0,459 0,459 0,078 0,537 0,002 0,539
INACT 1,173 0,195 -0,485 0,040 -0,070 0,001
0,459 0,459 0,078 0,537 0,002 0,539
Axe 1 1 Axe 2 1&2 Axe 3 1&2&3
INDIVIDUS coord. qlt cr cum. coord qlt cr cum. coord. qlt cr cum.
L1 -0,629 0,247 0,045 0,247 0,845 0,445 0,096 0,692 -0,375 0,088 0,026 0,780
L2 -0,588 0,231 0,039 0,231 0,818 0,446 0,090 0,676 0,558 0,207 0,056 0,884
L3 0,060 0,003 0,000 0,003 0,791 0,475 0,084 0,478 -0,632 0,303 0,072 0,781
L4 0,100 0,008 0,001 0,008 0,765 0,480 0,079 0,489 0,301 0,075 0,016 0,563
L5 -0,588 0,231 0,039 0,231 0,818 0,446 0,090 0,676 0,558 0,207 0,056 0,884
L6 1,331 0,884 0,201 0,884 -0,067 0,002 0,001 0,887 0,356 0,063 0,023 0,950
L7 -0,533 0,252 0,032 0,252 -0,730 0,473 0,072 0,725 0,364 0,117 0,024 0,842
L8 0,060 0,003 0,000 0,003 0,791 0,475 0,084 0,478 -0,632 0,303 0,072 0,781
L9 0,184 0,027 0,004 0,027 -0,412 0,136 0,023 0,164 0,680 0,371 0,084 0,535
L10 0,700 0,341 0,056 0,341 0,224 0,035 0,007 0,376 -0,533 0,198 0,052 0,574
L11 1,290 0,791 0,189 0,791 -0,041 0,001 0,000 0,792 -0,577 0,158 0,060 0,950
L12 1,331 0,884 0,201 0,884 -0,067 0,002 0,001 0,887 0,356 0,063 0,023 0,950
L13 0,016 0,000 0,000 0,000 -0,969 0,495 0,126 0,495 -0,613 0,199 0,068 0,694
L14 -0,075 0,003 0,001 0,003 -0,331 0,051 0,015 0,053 0,296 0,040 0,016 0,094
L15 -0,573 0,268 0,037 0,268 -0,704 0,403 0,067 0,671 -0,569 0,264 0,059 0,935
L16 -0,457 0,185 0,024 0,185 0,154 0,021 0,003 0,206 0,581 0,300 0,061 0,506
L17 -0,533 0,252 0,032 0,252 -0,730 0,473 0,072 0,725 0,364 0,117 0,024 0,842
L18 -0,573 0,268 0,037 0,268 -0,704 0,403 0,067 0,671 -0,569 0,264 0,059 0,935
L19 -0,705 0,310 0,056 0,310 -0,039 0,001 0,000 0,311 -0,593 0,219 0,064 0,530
L20 0,184 0,027 0,004 0,027 -0,412 0,136 0,023 0,164 0,680 0,371 0,084 0,535
REPRESENTATIONS
GRAPHIQUES
axe 2 ; 24,7%
1,5
CAD
L1 1,0
L5 L3
L8
L4
GAUGAU
EXGAU L2 DRO
DRO
0,5
L10
ACT
L16
L19 0,0 MASC
FEM L11
L12
L6 EXDRO
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5
DIV
L14
L20
-0,5 L9 INACT
L15
L18
L17
L7
-1,5
axe 1 ; 29,3%
axe 3 ; 18,3%
1,0
FEM
L20
L9
L5 L16
0,5
L2
L17
L7 L12
L6
GAU L14 L4 DIV
CEN
GAU
CAD
ACT 0,0
EXGAU INACT
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5
L1 DRO
CHO
O-E DRO
-0,5 L10
L19 L15
L18
L13
L8
L3
L11
-1,0
MASC EXDRO
-1,5
axe 1 ; 29,3%
axe 3 ; 18,3%
1,0
FEM
L20
L9
L16 L5
0,5
L2
L17
L7 L12
L6
L14 DIV GAU
L4
CEN
GAU
CAD
0,0 ACT
INACT EXGAU
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
DRO L1
CHO
O-E DRO
-0,5 L10
L18
L15 L11
L19
L13 L8
L3
-1,0
MASC
EXDRO
-1,5
axe 2 ; 24,7%
2.3 Tableau de BURT
MASC 9 0 2 3 4 4 3 2 7 2
FEM 0 11 3 5 3 3 4 4 8 3
GAU 2 3 5 0 0 2 3 0 4 1
CEN 3 5 0 8 0 5 1 2 7 1
DRO 4 3 0 0 7 0 3 4 4 3
O-E 4 3 2 5 0 7 0 0 5 2
CAD 3 4 3 1 3 0 7 0 7 0
DIV 2 4 0 2 4 0 0 6 3 3
ACT 7 8 4 7 4 5 7 3 15 0
INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS
DIAGONAUX
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA
MASC 9 0 2 3 4 4 3 2 7 2
FEM 0 11 3 5 3 3 4 4 8 3
GAU 2 3 5 0 0 2 3 0 4 1
CEN 3 5 0 8 0 5 1 2 7 1
DRO 4 3 0 0 7 0 3 4 4 3
O-E 4 3 2 5 0 7 0 0 5 2
CAD 3 4 3 1 3 0 7 0 7 0
DIV 2 4 0 2 4 0 0 6 3 3
ACT 7 8 4 7 4 5 7 3 15 0
INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES LIGNES
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA
MASC 9 0 2 3 4 4 3 2 7 2
FEM 0 11 3 5 3 3 4 4 8 3
GAU 2 3 5 0 0 2 3 0 4 1
CEN 3 5 0 8 0 5 1 2 7 1
DRO 4 3 0 0 7 0 3 4 4 3
O-E 4 3 2 5 0 7 0 0 5 2
CAD 3 4 3 1 3 0 7 0 7 0
DIV 2 4 0 2 4 0 0 6 3 3
ACT 7 8 4 7 4 5 7 3 15 0
INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES COLONNES
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA
MASC 9 0 2 3 4 4 3 2 7 2
FEM 0 11 3 5 3 3 4 4 8 3
GAU 2 3 5 0 0 2 3 0 4 1
CEN 3 5 0 8 0 5 1 2 7 1
DRO 4 3 0 0 7 0 3 4 4 3
O-E 4 3 2 5 0 7 0 0 5 2
CAD 3 4 3 1 3 0 7 0 7 0
DIV 2 4 0 2 4 0 0 6 3 3
ACT 7 8 4 7 4 5 7 3 15 0
INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS
SOUS-DIAGONAUX
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA
MASC 9 0 2 3 4 4 3 2 7 2
FEM 0 11 3 5 3 3 4 4 8 3
GAU 2 3 5 0 0 2 3 0 4 1
CEN 3 5 0 8 0 5 1 2 7 1
DRO 4 3 0 0 7 0 3 4 4 3
O-E 4 3 2 5 0 7 0 0 5 2
CAD 3 4 3 1 3 0 7 0 7 0
DIV 2 4 0 2 4 0 0 6 3 3
ACT 7 8 4 7 4 5 7 3 15 0
INA 2 3 1 1 3 2 0 3 0 5
Propriétés du tableau de BURT