Vous êtes sur la page 1sur 19

Analyse Factorielle

des
Correspondances
R.Freyburger

1
AFC

Application :
 Croissement de variables qualitatives

 Croissement de variables quantitatives

regroupées en classes
 Croissement de variables qualitatives avec

des variables quantitatives regroupées en


classes.

2
AFC

Objectifs:
 rassembler la plus grande partie de

l’information initiale en s’attachant non pas


aux valeurs absolues mais aux valeurs
relatives.
 Montrer des correspondances ou liens

logiques entres les variables


 Représenter graphiquement ces

correspondances
3
AFC

Deux types d’AFC :

 AFC simple : croissement de deux variables

 AFC multiple : plus de deux variables

4
Les données
Tableau de contingence
= Croisement de deux variables qualitatives X et Y

Y
1 … j … p
1 k11 k1j k1p
: :
X i ki1 … kij … kip ki.
: :
n kn1 knj knp
k.j k

Tableau des effectifs kij

5
Exemple

Secteur Primaire Secondaire Tertiaire Total = effectif


marginal
Région

A 10 20 40 70
B 60 30 30 120
C 20 60 30 110
D 70 30 100 200
Total = effectif 160 140 200 500
marginal

k1 3 = 40 k.2 = 140 k3. = 200

6
2. Le test du khi-deux
d’indépendance
Test : H0 : Les variables X et Y sont indépendantes
H1 : Les variables X et Y sont liées entre elles
Statistique utilisée :
k ij = Effectif observé
k i.k. j
= Effectif attendu sous l'hypothèse d'indépendance
k
k i.k . j
k ij −
k = Résidu standardisé (moyenne 0, écart-type 1)
k i.k . j
k
k i.k . j
n p (k ij − )2
χ2 = ∑∑
i =1 j=1
k
k i.k . j
k

7
Le test du khi-deux d’indépendance

Décision :
On rejette H0 au risque α de se tromper si χ 2
obs ≥ χ 2
th

Ddl = (l-1)(c-1)
Exemple précédent :
Résultats : χ 2obs = 87,64
Ddl = 6 α = 0,001
χ 2th = 22,457

Conclusion : On rejette H0

8
Tableau F des fréquences fij :
Secteur Primaire Secondaire Tertiaire fréquence
marginale = fi.
Région

A 0.02 0.04 0.08 0.14


B 0.12 0.06 0.06 0.24
C 0.04 0.12 0.06 0.22
D 0.14 0.06 0.20 0.40
fréquence
marginale = f.j
0.32 0.28 0.40 1

f13 = 0.04 f.2 = 0.28 (poids relatif du secteur 2)


f3. =0.40 (poids relatif de la région 3)
9
Tableau PL des profils lignes fj/i
=Secteur
fij/fi.Primaire
: Secondaire Tertiaire fi.= poids des
profils lignes
Région

A 1/7 2/7 4/7 0.14


B 2/4 1/4 1/4 0.24
C 2/11 6/11 3/11 0.22
D 7/20 3/20 10/20 0.40
f.j = profil ligne 0.32 0.28 0.40 1
moyen

f13 = 0.04 f.2 = 0.28 (poids relatif du secteur 2)


f3. =0.40 (poids relatif de la région 3)
10
Histogrammes des profils
lignes
A B A
C D B D

0,6 0,6 0,6 0,6

0,5 0,5 0,5 0,5

0,4
0,4 0,4 0,4

0,3 D
0,3 0,3 B 0,3 C
A

0,2
0,2 0,2 0,2

0,1
0,1 0,1
0,1

0
0 0
0 1 2 3
1 2 3 1 2 3 C
1 2 3

f.j =profil ligne moyen

0,45

0,4

0,35

0,3

Profil moyen : 0,25


f.j =profil ligne moyen
0,2

0,15

0,1

0,05

0
1 2 3

11
Tableau PL des profils colonnes fi/j
= Secteur
fij/f.j Primaire
: Secondaire Tertiaire fi.= profil
colonne moyen
Région

A 1/16 =0.06 2/14=0.14 4/20=0.20 0.14


B 6/16 =0.37 3/14=0.21 3/20=0.15 0.24
C 2/16=0.13 6/14=0.43 3/20=0.15 0.22
D 7/16=0.44 3/14=0.21 10/20=0.5 0.40
f.j = poids des 0.32 0.28 0.40 1
profils colonnes

12
Histogrammes des
profilscolonnes
P S T

0,6
0,5 0,5

0,45 0,45
0,5
0,4 0,4

0,35 0,35 0,4

0,3 0,3

0,3 T
0,25 P 0,25 S

0,2 0,2
0,2

0,15 0,15

0,1 0,1 0,1

0,05 0,05
0
0 0 1 2 3 4
1 2 3 4 1 2 3 4

P rofil moyen

0,45

0,4

0,35

0,3

0,25
P rofil moyen
0,2

0,15

0,1

0,05

0
1 2 3 4

13
Représentation des points profils
lignes

Origine = profil moyen = centre de gravité 14


Représentation des points profils
colonnes

Origine = profil moyen = centre de gravité 15


Interprétation
 La distance entre 2 points est d’autant plus faible
qu’ils correspondents à des profils voisins
 inertie d’un point P:
inertie = d(P,G) x poids
 Inertie totale = somme des inerties
 Les deux nuages de points ont même inertie totale
(dans l’exemple I = 0,17527)
 Propriété I = Khi-deux obs/effectif total
 Chaque axe factoriel représente une part de cette
inertie

16
Carte factorielle
(superposition des deux
précédents)

17
Carte factorielle

18
Analyse factorielle des
correspondances multiples
(ACM)
 Même principe que l’AFC mais en croisant
plus de 2 variables qualitatives
 Même interprétation des cartes factorielles

19