Vous êtes sur la page 1sur 15

V{tÑ|àÜx G

\ÇàÜÉwâvà|ÉÇ :
• l’ ACM (Analyse des Correspondances Multiples) est
une extension de l’AFC à plus de deux variables
qualitatives.
• l’ ACM est une application particulière de l’AFC à des
tableaux croisant des individus et leurs réponses à
plusieurs variables qualitatives.
• l’ ACM est le plus souvent utilisée pour le traitement
de données d’enquêtes , où chaque question représente
une variable qualitative et la réponse de l’individu est
une modalité de cette variable

1
\ÇàÜÉwâvà|ÉÇ :
• On peut présenter les mêmes données par plusieurs
tableaux de différents types.

W|yy°ÜxÇàá gçÑxá
Wx gtuÄxtâå

2
1- Tableau observé :
Ind X Var
Sexe Revenu Préférence
s1 F M A
s2 F M A
s3 F E B
s4 F E C
s5 F E C
s6 H E C
s7 H E B
s8 H M B
s9 H M B
s10 H M A

2- Tableau d’effectifs ou
tableau des patrons de réponses
Sexe Revenu Preference Effectif
F M A 2
F E B 1
F E C 2
H E C 1
H E B 1
H M B 2
6
H M A 1

3
3- Tableau disjonctif complet
(TDC)
• Dans ce Tableau, les lignes représentent les
Individus et les colonnes représentent les
Modalités des Variables.

• LA DISJONCTION EST UNE CODIFICATION EN DONNEES BINAIRES :

• l’Individu i prend la valeur 1 une seule fois (Complet) pour


la modalité de la variable j qu’il vérifie et 0 pour les autres
modalités de la même variable (Disjonctif). De ce fait, la
somme des valeurs sur la ième ligne vaut p :

Tableaudisjonctif complet
(TDC)
Sex:F Sex:H Rev:M Rev:E Pref:A Pref:B Pref:C

s1 1 0 1 0 1 0 0
s2 1 0 1 0 1 0 0
s3 1 0 0 1 0 1 0
s4 1 0 0 1 0 0 1
s5 1 0 0 1 0 0 1
s6 0 1 0 1 0 0 1
s7 0 1 0 1 0 1 0
s8 0 1 1 0 0 1 0
s9 0 1 1 0 0 1 0
s108 0 1 1 0 1 0 0

4
• Dans l’exemple, on dispose de n = 10 Individus
étudiés selon p = 3 Variables:
– X1 (Sexe) admet k1=2 Modalités (F:femme ; H:homme).
– X2 (Revenu) admet k2=2 Modalités (E:élevé ; M:moyen)
– X3 (Préférence) admet k3=3 Modalités (A ; B ; C).

K= nb total de modalité = 7


K =  
 =1

SEXE REVENU PREFERENCE


4- Le tableau de BURT F H M E A B C

1 0 1 0 1 0 0
Si X =TDC 1 0 1 0 1 0 0
La Matrice de BURT est X’X 1 0 0 1 0 1 0
1 0 0 1 0 0 1
X 1 0 0 1 0 0 1
0 1 0 1 0 0 1

X’ X’ X
0
0
1
1
0
1
1
0
0
0
1
1
0
0
0 1 1 0 0 1 0
0 1 1 0 1 0 0
Sex:F 1 1 1 1 1 0 0 0 0 0 5 0 2 3 2 1 2
Sex:H 0 0 0 0 0 1 1 1 1 1 0 5 3 2 1 3 1
Rev:M 1 1 0 0 0 0 0 1 1 1 2 3 5 0 3 2 0
Rev:E 0 0 1 1 1 1 1 0 0 0 3 2 0 5 0 2 3
Pref:A 1 1 0 0 0 0 0 0 0 1 2 1 3 0 3 0 0
Pref:B 0 0 1 0 0 0 1 1 1 0 1 3 2 2 0 4 0
10
Pref:C 0 0 0 1 1 1 0 0 0 0 2 1 0 3 0 0 3

5
Tableau de Burt
C’est le résultat du produit t(TDC)x(TDC)
SEXE REVENU PREFERENCE

F H M E A B C
F
5 0 2 3 2 1 2
SEXE

H
0 5 3 2 1 3 1
PREFERENCE REVENU

M
2 3 5 0 3 2 0
E
3 2 0 5 0 2 3
A
2 1 3 0 3 0 0
B
1 3 2 2 0 4 0
C
11 2 1 0 3 0 0 3

Lecture du Tableau X’X:

1. Il y a 5 sujets parmi 10 de sexe Féminin. De même


pour les Hommes.

2. Parmi les10 sujets, il y a 2 Femmes touchants un


Revenu Moyen…etc

3. Le Tableau de BURT est une juxtaposition des


tableaux de Contingences

6
Propriétés du Tableau :

1. La somme de tous les nombres du Tableau est


égale à n x p2.

2. La somme des nombres de chaque Tableau jaune


est égale à l’effectif total : n

3. La somme de la ligne modalité j est égale à la


somme de toutes les lignes des individus
présentant la même modalité j du tableau X.

Analyse des correspondances multiples


Effectuer l'analyse des correspondances
multiples, cela revient à effectuer une analyse
factorielle des correspondances du tableau
disjonctif complet où le nombre xij (à l’intérieur
du tableau) correspond à l’effectif de la
modalité j présentée par l’individu i.
D’où les éléments de l’ACM seront les mêmes
que ceux de l’AFC, soit les individus comme
profils-lignes (colonnes) et l’inertie totale Φ2.
14

7
L’ACM nous fournit trois graphiques :

1.Le graphique des individus

2.Le graphique des modalités

3.Le graphique des variables

15

Commençons par présenter la forme générale d’un TDC (X) :


VARIABLES
X1 Xp
Xj
x1 ...... ... ..... ...... ....... .. x .. ....... ...... .... xK
k Marge
p
p
.
xik p
i

.
p
p
Marge n1 .... ..... .... .... ..nk .. .... .... ....nK np
  = 1 ⋁ 0


 =
=
16

8
Lancement de l’ Analyse

Une fois qu’on a défini les éléments


d’une analyse factorielle (les profils lignes et
colonnes, les marges (poids) et la distance ),
on peut lancer l’étude en calculant l’Inertie et
en la projetant sur une succession d’axes
orthogonaux et d’inertie maximale.

17

Espace des Individus :


1- Le choix de la métrique :
    2
 2  ,   =   − 
  

1 
=    −  2
 


ù     !"  ′  $ % "é'


Modalite rare eloigne i

' ' é  ∶  =   
=1
18

9
Espace des Individus :
2- métrique: Lien entre L’AFC et L’ACM
On retrouve la distance de χ2 (vu en AFC),
en notant :

. ) =  ) = 
  , ∙ 

)  = ⇒ =1 1
 -
0
 1
,) ∙ =  )  = =
+  
=1

1 )  ) 2 1 2
⇒ 2  ,  =   −  =  2) − ) 3
  
)∙ ) ∙ )∙ )∙
 
= 4 2 2) ; ) 3
2   
19

10
Espace des Modalités :
1- métrique: Lien entre L’AFC et L’ACM
De même que pour les individus, on
retrouve la distance de χ2 (vu en AFC), en notant

1 )  ) ℎ 2
4 2 2
8) ; )ℎ 9 =   − 
) ∙ )∙ )∙ℎ

1 2
=  8) − )ℎ 9

) ∙

21

Rem :  2 2 8) ; F9 =  1 )  − )  =  − 1
Espace des Modalités :
2

4 
) ∙ )∙ ∙


   1 
Inertie de la modalité k/g est
:8) 9 = 4 2 2 8) ; F9 =  − 1 = 21 − 3
    
L’inertie d’une question est d’autant plus forte que la question
comporte un plus grand nombre de modalités.

∑1 
0
Inertie de la Variable Xj est
@AB

0
1> E 0 − 1
:8; 9 =  :8) 9 = 0 − 
D= 
=  
=1
22
< C

11
Espace des Modalités :

Inertie Totale est donc :


 
1 0
:G =  :8; 9 = 80 − 19 = − 1
 
 =1  =1

Rem : 1- cette inertie ne dépend que de la


structure du questionnaire.
2- Elle est égale au nombre moyen de modalités
par variable – 1.
3- si toutes les modalités ont même nombre, m,
de 23modalités, IT = m-1

Résultats produits par l’ACM sur le tableau suivant :


Sexe Revenu Préférence
s1 F M A
s2 F M A
s3 F E B
s4 F E C
s5 F E C
s6 H E C
s7 H E B
s8 H M B
s9 H M B
s10 H M A
24

12
K − p Nombre de modalités − Nombre de questions
Φ2 = =
p Nombre de questions

0 7
H 2 = :G = − 1 = − 1 = 1.333 =  L
 3

Elle est égale au nb moyen de modalité-1

Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4
Variance 0.603 0.464 0.203 0.064
% of var. 45.213 34.778 15.222 4.787 =K/P -1 = 1.33
Cumulative % of var. 45.213 79.991 95.213 100.000
Individuals
Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
s1 | -0.712 8.405 0.351 | 0.955 19.650 0.631 | -0.162 1.294 0.018 |
s2 | -0.712 8.405 0.351 | 0.955 19.650 0.631 | -0.162 1.294 0.018 |
s3 | 0.454 3.414 0.176 | -0.175 0.660 0.026 | -0.946 44.127 0.768 | PEU IMPORTANT
s4 | 1.089 19.687 0.822 | 0.474 4.853 0.156 | 0.048 0.114 0.002 |
s5 | 1.089 19.687 0.822 | 0.474 4.853 0.156 | 0.048 0.114 0.002 |
s6 | 0.822 11.210 0.468 | -0.297 1.903 0.061 | 0.820 33.095 0.465 |
s7 | 0.186 0.576 0.030 | -0.946 19.314 0.768 | -0.175 1.507 0.026 |
s8 | -0.619 6.356 0.328 | -0.811 14.196 0.564 | -0.040 0.078 0.001 |
s9 | -0.619 6.356 0.328 | -0.811 14.196 0.564 | -0.040 0.078 0.001 |
s10 | -0.979 15.905 0.664 | 0.183 0.723 0.023 | 0.609 18.298 0.257 |
λ =Moyenne(eta2-Dim1)
1
Categories
Dim.1 ctr cos2 v.test Dim.2 ctr cos2 v.test Dim.3 ctr cos2 v.test
F | 0.311 2.681 0.097 0.934 | 0.788 22.319 0.621 2.364 | -0.521 22.319 0.272 -1.564 |
H | -0.311 2.681 0.097 -0.934 | -0.788 22.319 0.621 -2.364 | 0.521 22.319 0.272 1.564 |
E | 0.938 24.317 0.880 2.814 | -0.138 0.683 0.019 -0.414 | -0.091 0.683 0.008 -0.274 |
M | -0.938 24.317 0.880 -2.814 | 0.138 0.683 0.019 0.414 | 0.091 0.683 0.008 0.274 |
A | -1.032 17.652 0.456 -2.026 | 1.024 22.620 0.450 2.011 | 0.211 2.195 0.019 0.415 |
B | -0.193 0.820 0.025 -0.472 | -1.007 29.180 0.677 -2.468 | -0.666 29.180 0.296 -1.632 |
C | 1.288 27.533 0.711 2.530 | 0.319 2.195 0.044 0.627 | 0.678 22.620 0.197 1.331 |
Categorical variables (eta2)
Dim.1 Dim.2 Dim.3
Sexe
Revenu
| 0.097 0.621
| 0.880 0.019
0.272 |
0.008 | IMPORTANT
Preference | 0.832 0.751 0.329 |

13
PEU IMPORTANT

MCA factor map


1.0

s1
s2
0.5

s4
s5
Dim 2 (34.78%)

s10
0.0

s3
s6
-0.5

s8 s9
-1.0

s7

-1.0 -0.5 0.0 0.5 1.0 1.5

Dim 1 (45.21%)

14
IND-MODA

A
1.0

s2
s1
F
0.5

s5
s4
C
Dim 2 (34.78%)

s10
M
0.0

s3 E

s6
-0.5

s9
s8 H
-1.0

s7
B

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

Dim 1 (45.21%)

15

Vous aimerez peut-être aussi