Vous êtes sur la page 1sur 35

ANALYSE DES

CORRESPONDANCES
MULTIPLES
L’Analyse des correspondances multiples
est une méthode permettant d’étudier
les liaisons entre plusieurs variables
qualitatives ou quantitatives,
c’est donc une généralisation de l’AFC.
Elle s’applique en particulier pour les
sondages
1 Nature des données étudiées
1.1 Données initiales

Rang des individus Q1 Q2 Q3


1 Q1(1) Q2(1)
2 Q1(2)
3
ETUDE D’UNE
ENQUETE SUR LES
OPINIONS, LES
ACTIVITES ET LE
SEXE
DONNEES INITIALES
Rang Sexe Opinion Politique C. S. P Activité
1 1 2 5 1
2 2 1 5 1
3 1 4 5 1
4 2 4 5 1
5 2 2 4 1
6 2 4 7 3
7 2 3 3 1
8 1 4 4 1
9 2 3 1 1
10 1 4 1 1
11 1 5 6 3
12 2 4 6 3
13 1 3 2 2
14 2 2 2 2
15 1 3 3 1
16 2 3 4 1
17 2 3 2 1
18 1 3 3 1
19 1 1 3 1
20 2 3 7 1
Notations utilisées:
Qi : variable i
Qi(j): valeur de la variable Qi pour l’individu j
n: nombre d’individus (20)
q: nombre de variables (q=4)
mk: nombre de modalités de la variable Qk
m: nombre total de modalités (m=17)
CODAGE DES DONNEES

Codage :
Q1 : Masc = 1 et Fem = 2
Q2 : EG =1 ; G =2 ; C =3 ; D =4 ; ED =5
Q3 : AGRI =1 ; EMP = 2 ; OUV = 3 ; CM = 4 ; CS
=5 ; PIC = 6 ; AUT = 7
Q4 : ACT = 1 ; CHO = 2 ; RET = 3
1.2 Tableau disjonctif complet
On associe à chaque modalité une variable
appelée variable indicatrice ne prenant que
les valeurs 1 et 0 selon que la modalité est
vérifiée ou non.
 Xj: variable indicatrice de la modalité j
(de j=1 à m1 pour la première modalité, de
j=m1+1 à m1+m2 pour la deuxième...)
Xj(k): valeur (0 ou 1) de la variable indicatrice
Xj pour l’individu k
Individus Q1 Q2 Q3

X1 X2........................ Xm1 Xm1+1...................... Xm2


Xm1
1 X1(1)X2(2).....Xm1(1)

3
TABLEAU DISJONCTIF COMPLET
Rang Sexe Opinion Politique C. S. P Activité
M F EG G C D ED A E O CM CS P A A C R

1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0
2 0 1 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0
3 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
4 0 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0
5 0 1 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0
6 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1
7 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
8 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0
9 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0
10 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0
11 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1
12 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1
13 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0
14 0 1 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0
15 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
16 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0
17 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
18 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0
19 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0
20 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0
Remarques:
 La somme des termes de chaque ligne est égale à q.
 La somme des termes de la colonne associée à la variable Xj
est notée nj.
 La fréquence associée, appelée fréquence marginale est
notée pj.
 pj =nj/nq
 Une ACM n’est intéressante que si le nombre d’individus
est très grand ainsi que le nombre de modalités
 Les individus doivent être répartis assez régulièrement.
FREQUENCES MARGINALES
M F EG G C D ED A E O CM CS P A A C R

effectifs 9 11 2 3 8 6 1 2 3 4 3 4 2 2 15 2 3
fréq 11,2 13,8 2,5 3,8 10 7,5 1,3 2,5 3,8 5 3,8 5 2,5 2,5 18,9 2,5 3,8
1. 3 Eléments supplémentaires
On peut introduire des éléments supplémentaires
par opposition aux données actives sur
lesquelles portent l’Analyse mathématique.
Colonnes: variables indicatrices de variables
dont on ne tient pas compte, variables
explicatives (âge, sexe, lieu...)...
Lignes: individus ne faisant pas partie de la
population étudiée, individus moyenne d’un
groupe (dans ce cas les valeurs sont des
fréquences, la somme est encore égale à q)
TABLEAU DES VARIABLES
Variables actives
Variables supplémentaires

Rang Sexe Op Pol C. S. P Act Op Pol Activité


M F G C D O-E CAD DIV A IN EG G C D ED A C R

1 1 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0
2 0 1 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 0
3 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
4 0 1 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
5 0 1 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0
6 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 1
7 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
8 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 1 0 0
9 0 1 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0
10 1 0 0 0 1 0 0 1 1 0 0 0 0 1 0 1 0 0
11 1 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 1
12 0 1 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 1
13 1 0 0 1 0 1 0 0 0 1 0 0 1 0 0 0 1 0
14 0 1 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0
15 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 0
16 0 1 0 1 0 0 1 0 1 0 0 0 1 0 0 1 0 0
17 0 1 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
18 1 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0
19 1 0 1 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0
20 0 1 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0
2. Description de la méthode
La méthode est basée, comme en AFC sur l’étude
des distances entre PFL et PFC et sur l’analyse
des proximités et des éloignements.
Attention: Contrairement à l’AFC, il ne s’agit pas
de s’intéresser à l’indépendance.
2.1 Notion de distance
On définit une distance du χ2:
Pour les individus:

 X j (i) X j (l ) 
  
m
 q q   m X (i)  X (l )

d (i; l )     
2 j j

j  pj q j  pj
Pour les modalités


 X j (i ) X l (i ) 
  
n  n  
 nl  n  X j (i ) X l (i ) 
d ( j; l )   n  
j
2

i   
i   n j nl 
n
Remarque
Plus la modalité est de fréquence faible,
plus les individus sont éloignés
Plus l’effectif d’une modalité est faible,
plus la distance entre les modalités est
grande.
→ Notion de « prime à la rareté »
D’où la nécessité de regrouper certaines
modalités
Distance du χ2 entre les profils
colonnes
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 0,00 4,04 4,44 3,06 2,54 2,54 3,17 4,07 1,48 4,44

FEM 4,04 0,00 3,64 2,05 3,12 3,12 2,60 2,73 1,21 3,64

GAU 4,44 3,64 0,00 6,50 6,86 4,57 3,43 7,33 3,20 6,40

CEN 3,06 2,05 6,50 0,00 5,36 1,79 4,64 4,17 1,50 5,50

DRO 2,54 3,12 6,86 5,36 0,00 5,71 3,27 2,38 2,67 3,43

O-E 2,54 3,12 4,57 1,79 5,71 0,00 5,71 6,19 2,29 4,57

CAD 3,17 2,60 3,43 4,64 3,27 5,71 0,00 6,19 1,52 6,86

DIV 4,07 2,73 7,33 4,17 2,38 6,19 6,19 0,00 3,33 3,33

ACT 1,48 1,21 3,20 1,50 2,67 2,29 1,52 3,33 0,00 5,33

INA 4,44 3,64 6,40 5,50 3,43 4,57 6,86 3,33 5,33 0,00
2.2 Analyse Mathématique

L’Analyse mathématique se traite de la


même manière qu’en AFC.
En particulier en ce qui concerne les
valeurs propres.
m
L’inertie totale est égale à  .
q
Valeurs propres de l’AFC du tableau
disjonctif complet
λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9

0,440 0,371 0,276 0,248 0,108 0,056 0,000 0,000 0,000

diagram m e en bâtons de l'inertie totale


-10,0% 0,0% 10,0% 20,0% 30,0% 40,0%

axe 1 29,3%
axe 2 24,7%
axe 3 18,4%
axe 4 16,6%
axe 5 7,2%
axe 6 3,8%
axe 7 0,0%
axe 8 0,0%
axe 9 0,0%
COMPOSANTES PRINCIPALES
SUR LES AXES 1, 2 & 3
Axe 1 1 Axe 2 1&2 Axe 3 1&2&3

VARIABLES coord qlt cr cum. coord. qlt cr cum. coord. qlt cr cum.
MASC -0,060 0,003 0,001 0,003 0,036 0,001 0,000 0,004 -1,078 0,951 0,474 0,955
FEM 0,049 0,001 -0,029 0,000 0,882 0,388
0,003 0,003 0,001 0,004 0,951 0,955
GAU -0,779 0,086 0,693 0,081 0,169 0,006
0,202 0,202 0,160 0,363 0,009 0,372
CEN -0,431 0,042 -0,925 0,230 0,218 0,017
0,124 0,124 0,570 0,694 0,032 0,726
DRO 1,049 0,219 0,562 0,074 -0,370 0,043
0,592 0,592 0,170 0,762 0,074 0,836
O-E -0,641 0,082 -0,987 0,230 -0,359 0,041
0,221 0,221 0,524 0,745 0,070 0,815
CAD -0,440 0,038 1,169 0,322 0,098 0,003
0,104 0,104 0,735 0,840 0,005 0,845
DIV 1,261 0,271 -0,212 0,009 0,306 0,025
0,681 0,681 0,019 0,701 0,040 0,741
ACT -0,391 0,065 0,162 0,013 0,023 0,000
0,459 0,459 0,078 0,537 0,002 0,539
INACT 1,173 0,195 -0,485 0,040 -0,070 0,001
0,459 0,459 0,078 0,537 0,002 0,539
Axe 1 1 Axe 2 1&2 Axe 3 1&2&3
INDIVIDUS coord. qlt cr cum. coord qlt cr cum. coord. qlt cr cum.
L1 -0,629 0,247 0,045 0,247 0,845 0,445 0,096 0,692 -0,375 0,088 0,026 0,780
L2 -0,588 0,231 0,039 0,231 0,818 0,446 0,090 0,676 0,558 0,207 0,056 0,884
L3 0,060 0,003 0,000 0,003 0,791 0,475 0,084 0,478 -0,632 0,303 0,072 0,781
L4 0,100 0,008 0,001 0,008 0,765 0,480 0,079 0,489 0,301 0,075 0,016 0,563
L5 -0,588 0,231 0,039 0,231 0,818 0,446 0,090 0,676 0,558 0,207 0,056 0,884
L6 1,331 0,884 0,201 0,884 -0,067 0,002 0,001 0,887 0,356 0,063 0,023 0,950
L7 -0,533 0,252 0,032 0,252 -0,730 0,473 0,072 0,725 0,364 0,117 0,024 0,842
L8 0,060 0,003 0,000 0,003 0,791 0,475 0,084 0,478 -0,632 0,303 0,072 0,781
L9 0,184 0,027 0,004 0,027 -0,412 0,136 0,023 0,164 0,680 0,371 0,084 0,535
L10 0,700 0,341 0,056 0,341 0,224 0,035 0,007 0,376 -0,533 0,198 0,052 0,574
L11 1,290 0,791 0,189 0,791 -0,041 0,001 0,000 0,792 -0,577 0,158 0,060 0,950
L12 1,331 0,884 0,201 0,884 -0,067 0,002 0,001 0,887 0,356 0,063 0,023 0,950
L13 0,016 0,000 0,000 0,000 -0,969 0,495 0,126 0,495 -0,613 0,199 0,068 0,694
L14 -0,075 0,003 0,001 0,003 -0,331 0,051 0,015 0,053 0,296 0,040 0,016 0,094
L15 -0,573 0,268 0,037 0,268 -0,704 0,403 0,067 0,671 -0,569 0,264 0,059 0,935
L16 -0,457 0,185 0,024 0,185 0,154 0,021 0,003 0,206 0,581 0,300 0,061 0,506
L17 -0,533 0,252 0,032 0,252 -0,730 0,473 0,072 0,725 0,364 0,117 0,024 0,842
L18 -0,573 0,268 0,037 0,268 -0,704 0,403 0,067 0,671 -0,569 0,264 0,059 0,935
L19 -0,705 0,310 0,056 0,310 -0,039 0,001 0,000 0,311 -0,593 0,219 0,064 0,530
L20 0,184 0,027 0,004 0,027 -0,412 0,136 0,023 0,164 0,680 0,371 0,084 0,535
REPRESENTATIONS
GRAPHIQUES
axe 2 ; 24,7%
1,5

CAD
L1 1,0
L5 L3
L8
L4
GAUGAU
EXGAU L2 DRO
DRO
0,5

L10
ACT
L16
L19 0,0 MASC
FEM L11
L12
L6 EXDRO
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5
DIV
L14
L20
-0,5 L9 INACT
L15
L18
L17
L7

O-E CEN -1,0 L13


CHO

-1,5
axe 1 ; 29,3%
axe 3 ; 18,3%
1,0
FEM

L20
L9
L5 L16
0,5
L2
L17
L7 L12
L6
GAU L14 L4 DIV
CEN
GAU
CAD
ACT 0,0
EXGAU INACT
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5
L1 DRO
CHO
O-E DRO
-0,5 L10
L19 L15
L18
L13
L8
L3
L11

-1,0
MASC EXDRO

-1,5
axe 1 ; 29,3%
axe 3 ; 18,3%
1,0
FEM

L20
L9
L16 L5
0,5
L2
L17
L7 L12
L6
L14 DIV GAU
L4
CEN
GAU
CAD
0,0 ACT
INACT EXGAU
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
DRO L1
CHO
O-E DRO
-0,5 L10
L18
L15 L11
L19
L13 L8
L3

-1,0
MASC
EXDRO

-1,5
axe 2 ; 24,7%
2.3 Tableau de BURT

Une autre méthode consiste à réaliser


l’AFC du tableau croisé, appelé tableau
de BURT obtenu en croisant les diverses
modalités.
TABLEAU DE BURT
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 9 0 2 3 4 4 3 2 7 2

FEM 0 11 3 5 3 3 4 4 8 3

GAU 2 3 5 0 0 2 3 0 4 1

CEN 3 5 0 8 0 5 1 2 7 1

DRO 4 3 0 0 7 0 3 4 4 3

O-E 4 3 2 5 0 7 0 0 5 2

CAD 3 4 3 1 3 0 7 0 7 0

DIV 2 4 0 2 4 0 0 6 3 3

ACT 7 8 4 7 4 5 7 3 15 0

INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS
DIAGONAUX
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 9 0 2 3 4 4 3 2 7 2

FEM 0 11 3 5 3 3 4 4 8 3

GAU 2 3 5 0 0 2 3 0 4 1

CEN 3 5 0 8 0 5 1 2 7 1

DRO 4 3 0 0 7 0 3 4 4 3

O-E 4 3 2 5 0 7 0 0 5 2

CAD 3 4 3 1 3 0 7 0 7 0

DIV 2 4 0 2 4 0 0 6 3 3

ACT 7 8 4 7 4 5 7 3 15 0

INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES LIGNES
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 9 0 2 3 4 4 3 2 7 2

FEM 0 11 3 5 3 3 4 4 8 3

GAU 2 3 5 0 0 2 3 0 4 1

CEN 3 5 0 8 0 5 1 2 7 1

DRO 4 3 0 0 7 0 3 4 4 3

O-E 4 3 2 5 0 7 0 0 5 2

CAD 3 4 3 1 3 0 7 0 7 0

DIV 2 4 0 2 4 0 0 6 3 3

ACT 7 8 4 7 4 5 7 3 15 0

INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES COLONNES
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 9 0 2 3 4 4 3 2 7 2

FEM 0 11 3 5 3 3 4 4 8 3

GAU 2 3 5 0 0 2 3 0 4 1

CEN 3 5 0 8 0 5 1 2 7 1

DRO 4 3 0 0 7 0 3 4 4 3

O-E 4 3 2 5 0 7 0 0 5 2

CAD 3 4 3 1 3 0 7 0 7 0

DIV 2 4 0 2 4 0 0 6 3 3

ACT 7 8 4 7 4 5 7 3 15 0

INA 2 3 1 1 3 2 0 3 0 5
PROPRIETE DES BLOCS
SOUS-DIAGONAUX
MASC FEM GAU CEN DRO O-E CAD DIV ACT INA

MASC 9 0 2 3 4 4 3 2 7 2

FEM 0 11 3 5 3 3 4 4 8 3

GAU 2 3 5 0 0 2 3 0 4 1

CEN 3 5 0 8 0 5 1 2 7 1

DRO 4 3 0 0 7 0 3 4 4 3

O-E 4 3 2 5 0 7 0 0 5 2

CAD 3 4 3 1 3 0 7 0 7 0

DIV 2 4 0 2 4 0 0 6 3 3

ACT 7 8 4 7 4 5 7 3 15 0

INA 2 3 1 1 3 2 0 3 0 5
Propriétés du tableau de BURT

Les valeurs propres de l’AFC du tableau


de BURT sont les carrés des valeurs
propres de l’AFC du tableau disjonctif
complet (TDC).
Les composantes principales des
modalités sont celles du TDC multipliées
par la racine carrée de la valeur propre
correspondante dans l’AFC du TDC.
Propriétés des individus

Les individus n’apparaissent pas dans cette


méthode mais on peut les faire apparaître
en éléments supplémentaires.
Les composantes principales des
individus sont les mêmes que dans l’AFC
du TDC.
Les points modalités sont les
isobarycentres des points individus
vérifiant la modalité.
Comparaison des valeurs propres
λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9 TDC
0,44 0,371 0,276 0,248 0,108 0,056 0 0 0 1,499

29,4 24,7 18,4 16,5 7,2 3,7 0,0 0,0 0,0 %


λ1 λ2 λ3 λ4 λ5 λ6 λ7 λ8 λ9 BURT
0,194 0,138 0,076 0,062 0,012 0,003 0,000 0,000 0,000 0,484
40,0 28,5 15,7 12,7 2,4 0,6 0,0 0,0 0,0 %

Vous aimerez peut-être aussi