Vous êtes sur la page 1sur 14

Chapitre II

Analyse factorielle des


correspondances ”AFC”

Lamia JAAFAR Belaid Analyse 2


Analyse factorielle des
correspondances
Contenu du chapitre 2: 4 semaines
Introduction au problème: données en AFC et nuages de
points
Liaison entre variables: notion d’indépendance
Nuages et ajustement: représentation géométrique et
principe de projection
Interprétation: représentation simultanée des
lignes/colonnes et indicateurs sur la reconstruction

Lamia JAAFAR Belaid Analyse 2


Introduction

Lamia JAAFAR Belaid Analyse 2


AFC
Problématique

L’AFC est une méthode factorielle de statistique descriptive


multidimensionnelle.
L’AFC concerne les tableaux de contingence ⇒ étude des
liaisons entre deux variables qualitatives ou quantitatives.

Un tableau de contingence est un tableau d’effectifs obtenus en


croisant les modalités de deux variables X , Y nominales sur
une même population de n individus.

Ne pas confondre variable et modalité ⇒ X est à I


modalités et Y est à J modalités!
L’AFC convient parfaitement aux sondages appliqués à
deux variables qualitatives.
L’AFC peut s’appliquer d̀es tableaux individus-variables si
les variables quantitatives sont homogènes ⇒ individus ≡
variables.
Lamia JAAFAR Belaid Analyse 2
ACP
Exemples d’application

1 Sondages d’opinion, questionnaires d’enquêtes.


2 Traitement de données textuelles.
3 Etudes statistiques sur diverses données: compétitions
sportives, prix internationaux, répartitions de groupes,
cause de mortalité, ect.
4 Applications en écologie: étude de diversité

Soit un ensemble de données représenté par un tableau


d’effectifs {zij }, 1 ≤ i ≤ I, 1 ≤ j ≤ J. Les lignes définissent la
variable X sous ses modalités xi et les colonnes la variable Y
sous ses modalités yj ⇒ tableau de dépendance!

Lamia JAAFAR Belaid Analyse 2


Objectifs de l’AFC

Faire un bilan des ressemblances entre lignes, entre colonnes


et aussi entre les deux:
trouver les lignes qui se ressemblent ou sont différentes en
comparant les profils lignes entre eux,
trouver les colonnes qui se ressemblent ou sont différentes
en comparant les profils colonnes entre eux,
trouver une certaine correspondance entre les deux
modalités et visualiser les associations entre les modalités
des deux variables,
interpréter les ”proximités” entre les lignes et les colonnes.

La ressemblance entre lignes/colonnes se fait-t-elle


pareillement que pour une ACP?

Lamia JAAFAR Belaid Analyse 2


Tableau de contingence des effectifs
H Y
HH
HH y1 . yj . . yJ Somme
X H
x1 . . . . . . .
. . . . . . . .
J
X
xi . . zij . . . zi• = zij
j=1
. . . . . . . .
xI . . . . . . .
X I X J
I X
Somme . . z•j = zij . . . zij = n
i=1 i=1 j=1

zij = effectif du couple (xi , yj ) = nombre individus:


X = xi , Y = Yj .
n est le nombre total d’individus.
zi• (resp. z•j ) est l’effectif marginal de xi (resp. de yj ).
Lamia JAAFAR Belaid Analyse 2
Tableau de contingence des fréquences
xi et yj jouent des rôles parfaitement symétriques!
Le tableau de contingence des fréquences (probabilités!)
associé est défini par:

H Y
HH
HH y1 . yj . . yJ Somme
X H
x1 . . . . . . .
. . . . . . . .
J
zij X
xi . . fij = . . . fi• = fij
n
j=1
. . . . . . . .
xI . . . . . . .
X I
Somme . . f•j = fij . . . 1
i=1

Lamia JAAFAR Belaid Analyse 2


Propriétés
J I
X zi• X z•j
fi• = fij = et f•j = fij = .
n n
j=1 i=1
I X
X J
zij = n.
i=1 j=1
I X
X J
fij = 1.
i=1 j=1
I
X J
X
zi• = z•j = n.
i=1 j=1
I
X J
X
fi• = f•j = 1.
i=1 j=1

fi• (resp. f•j ) est dite la fréquence marginale de xi (resp. de yj ).

Lamia JAAFAR Belaid Analyse 2


AFC sur un exemple: L. Lebart et
al, Statistique exploratoire
multidimensionnelle, Dunod,
1995.

Lamia JAAFAR Belaid Analyse 2


On cherche à analyser certaines liaisons: correspondances
couleur yeux/cheveux sur une étude portant sur 592 femmes ⇒
Tableaux de contingence des effectifs et des fréquences:
XX
XXX Cheveux
XXX Brun Chatain Blond Roux Somme
XX
Yeux X
Marron 68 119 7 26 220
Noisette 15 54 10 14 93
Vert 5 29 16 14 64
Bleu 20 84 94 17 215
Somme 108 286 127 71 592
XX
XX XXCheveux Brun Chatain Blond Roux Somme
XX X
Yeux XX
Marron 11.5% 20.1% 1.2% 4.4% 37.2%
Noisette 2.5% 9.1% 1.7% 2.4% 15.7%
Vert 0.8% 4.9% 2.7% 2.4% 10.8%
Bleu 3.4% 14.2% 15.9% 2.9% 36.4%
Somme 18.2% 48.3% 21.5% 12% ' 100%

Lamia JAAFAR Belaid Analyse 2


Deux lectures sont possibles: tableau de contingence des
effectifs vu en lignes ou tableau de contingence des effectifs vu
colonnes!

Deux lectures ⇒ Distribution conditionnelle de Y sachant


X = xi ou distribution conditionnelle de X sachant Y = yj ⇒ On
définit donc pour une lecture en lignes (resp. en colonnes) une
probabilité conditionnelle fj/i (resp. fi/j ).

fij zij fij zij


On a ∀i, j, fj/i = = et fi/j = = .
fi• zi• f•j z•j

Lamia JAAFAR Belaid Analyse 2


On donne le tableau de contingence des fréquences
conditionnelles f /i ⇒ Profil ligne i :
XX
XX XXCheveux Brun Chatain Blond Roux Somme
XX X
Yeux XX
Marron 30.9% 54.1% 3.2% 11.8% ' 100%
Noisette 16.1% 58.1% 10.7% 15% ' 100%
Vert 7.8% 45.3% 25% 21.9% ' 100%
Bleu 9.3% 39% 43.7% 7.9% ' 100%
Marge ligne 18.2% 48.3% 21.5% 12% ' 100%
PJ
∀i = 1, .., I, j=1 fj/i = 1.
∀i = 1, .., I, on a un profil ligne
 t
f /i = (f1/i , .., fJ/i )t = ffi•i1 , .., ffi•iJ ∈ RJ ⇒ nuage de
profil-lignes de I points dans RJ ⇒ NI = {f /i, i = 1, .., I}.
Si f /i a un poids fi• ⇒ le centre de gravité de NI
(barycentre du nuage) est (f•j )j . On le notera par (fjl )j .

Lamia JAAFAR Belaid Analyse 2


On donne le tableau de contingence des fréquences
conditionnelles f /j ⇒ Profil colonne j :
XX
XXX Cheveux
XX
XXX Brun Chatain Blond Roux Marge col.
Yeux X
Marron 63% 41.6% 5.5% 36.6% 37.2%
Noisette 13.9% 18.9% 7.9% 19.7% 15.7%
Vert 4.6% 10.1% 12.6% 19.7% 10.8%
Bleu 18.5% 29.4% 74% 23.9% 36.4%
Somme ' 100% ' 100% ' 100% ' 100% 100%
PI
On a: ∀j = 1, .., J, i=1 fi/j = 1.
∀j = 1, .., J, on a un profil colonne ⇒ nuage N(J) de
profil-colonnes dans RI par NJ = {f /j, j = 1, ..J}, avec
 t
f f
f /j = (f1/j , .., fI/j )t = f•j1j , .., f•jIj ∈ RI .
Si f /j est a un poids f•j ⇒ le centre de gravité de NJ est
(fi• )i noté (fic )i .

Lamia JAAFAR Belaid Analyse 2

Vous aimerez peut-être aussi