Vous êtes sur la page 1sur 9

Chapitre II : Analyse Factorielle des Correspondances (AFC)

I) Présentation de l’AFC :

L’AFC est une méthode de description statistique sur tableaux de contingence qui s’applique
à deux variables qualitatives. Elle sert à décrire et à hiérarchiser les relations statistiques qui
peuvent exister entre des individus et des variables dans un tableau rectangulaire de données.
son principe, à l’instar des autres méthodes factorielles est de réduire l’information.

Alors, l’AFC ou l’analyse des correspondances simples est une méthode exploratoire
d’analyse des tableaux de contingence.

Tableau de contingence : est une méthode de représentation de données issues


d’un comptage permettant d’estimer la dépendance entre deux caractères. Elle
consiste à croiser deux caractères d’une population (par exemple classe d’âge et
score)

L’AFC considérée comme une ACP particulière dotée de la métrique du Khi2 (χ2). L’analyse
permet dans le plan des deux premiers factoriels une représentation simultanée des
ressemblances entre les colonnes ou les lignes du tableau et de la proximité entre les lignes et
les colonnes.
Les données sur lesquelles on travaille sont constituées de n individus et deux variables
qualitatives.
L’exemple le plus classique est celui d’une enquête. Nous disposons de n personnes
interrogées et ces personnes nous avons posé deux questions choix multiple.
V1 V2

L i j

Dans ce tableau de données, l’individu L possède la modalité i pour la variable V1 et la


modalité j pour la variable V2 (i V1 et j V2)

1
II) Exemple Introductif
Ce cours sera expliqué à travers un exemple afin de mieux le cerner.
De fait les données qui vont nous servir à illustrer notre présentation de l’analyse
factorielle des correspondances. Ce sont des données historiques issues d’une enquête. En
effet, il s’agit d’une ancienne enquête publiée en 1974.
Dans cette enquête 1724 femmes ont interrogées et nous avons sélectionné dans le
questionnaire deux questions relatives à l’attitude de ces femmes à l’égard du travail féminin.
la première question (V1) : la famille idéale est celle où : on aura trois modalités de
réponse ( ; ; )
Les deux conjoints travaillent également (261)
Le mari a un métier plus absorbant que celui de sa femme (555)
Seul le mari travaille (908)

la deuxième question (V2) : quelle est selon vous l’activité convenant à une mère de
famille quand les enfants vont à l’école. On aura trois modalités ( ; ; )
Rester au foyer (284)
Travailler à mi-temps (1123)
Travailler à plein temps (317)

Le tableau suivant récapitule les résultats bruts :


1ère question (V1) 2ème question ((V2)
: 261 (15,14%) : 284 (16,47%)
: 555 (32,19%) : 1123 (65,13%)
: 908 (52,66%) : 317 (18,38%)
Total : 1724 (100%) Total : 1724 (100%)

Donc par rapport aux réponses à la première question, il s’avère qu’à cette époque la majorité
des femmes était hostile au travail féminin.
Cependant les réponses à la deuxième question s’avèrent contradictoires aux réponses la 1ère
question.
En effet, travailler mi-temps a obtenu 1123 des suffrages qui est largement majoritaire. Ainsi,
on pourra conclure qu’à cette époque les femmes étaient favorables au travail féminin pas à
plein temps mais tout de même favorables au travail féminin.
Ces deux questions semblent apporter des réponses un peu contradictoires. On se pose donc la
question : quel lien existe-t-il entre ces deux variables qualitatives.
Ainsi, afin d’étudier cette relation on construit d’abord le tableau de contingence (tableau
croisé)
III) Tableau de contingence (tableau croisé)
[car il met en correspondance deux ensembles lignes et colonnes]. Le tableau de contingence
est appelé aussi tableau croisé dans la pratique des enquêtes. Dans ce tableau on met en regard
les modalités de la 1ère variable (V1)à en lignes et les modalités de la 2ème variable (V2) en
colonnes.

2
À l’intersection entre une ligne et une colonne on trouve qui est le nombre de personnes
qui ont répondu à la modalité i de V1 et à la modalité j de V2

1 j J

1
est le nombre d’individus possédant la
modalité i de V1 et la modalité j de V2.

i La somme de tous les termes nous donne


petit n

I n

Donc ce tableau contient la distribution de n individus. Dans notre cas ce sont les n personnes
interrogées dans les I*J cases du tableau. Ainsi voici le résumé des réponses.
Q1 : famille Q2 : l’activité convenant une mère de famille Marge colonne
idéale est celle : Rester au : Travailler à : Travailler à
où : foyer mi-temps plein temps
: les deux 13 142 106 261
conjoints
travaillent
également
: Le mari a un 30 408 117 555
métier plus
absorbant que
celui de sa
femme
: Seul le mari 241 573 94 908
travaille
Marge ligne 284 1123 317 1724

Afin de déterminer les liaisons entre V1 et V2, le tableau a été complété par ce qu’on appelle
des « marges ». ainsi on a des marges lignes et des marges colonnes.

IV) Du tableau de contingence au tableau de probabilité :


L’AFC travaille sur le tableau de probabilité ex : l’effectif ( )
= la probabilité est obtenu à partir de l’effectif ) sur l’effectif total n. c’est de
cette manière qu’on remplie le tableau de probabilité.

3
: est la probabilité conjointe de posséder la modalité i de V1 et la modalité j de V2

1 j J
Σ

1 .
Où . =∑

Où .
i .

Σ .
1

Quand on fait la somme de tout ces termes on obtient 1 (la somme de toutes les probabilités
égale à 1). Ce tableau est complété par marge colonne et marge ligne.
Le tableau de probabilité
Q1 : famille Q2 : l’activité convenant une mère de famille Marge colonne
idéale est celle : Rester au : Travailler à : Travailler à
où : foyer mi-temps plein temps
: les deux 13 0.082 0.0614 0.1513
= 0,0075
conjoints 1724
travaillent
également
: Le mari a un 0.0174 0.2366 0.067 0.3219
métier plus
absorbant que
celui de sa
femme
: Seul le mari 0.1397 0.3323 0.0545 0.5266
travaille
Marge ligne 0.1647 0.6513 0.1838 1

4
V) Le modèle d’indépendance :
L’objet de l’AFC est de regarder la liaison entre V1 et V2 (Q1 et Q2). C'est-à-dire quel est
l’écart entre les donnée observées et de détecter les situations d’indépendance.
Commençons par rappeler le modèle d’indépendance pour deux évènements.
• Deux évènements indépendants : ( !" #) = ( ) ∗ (#)
• Deux variables qualitatives indépendantes : ⍱ , ⍱ , = . ∗ . la probabilité
conjointe= produit des probabilités marginales.
Il existe une autre écriture du modèle d’indépendance : probabilité conditionnelle
& &
. = . =
&. &.

Quelle est la probabilité j sachant i quelle est la probabilité de réaliser i sachant j

V.1) L’AFC et le modèle d’indépendance :


On va d’abord adopter une analyse par ligne
&
On se réfère donc au modèle d’indépendance suivant : . =
&.
Pour cela dans le tableau on divise chaque élément par sa marge. On obtient donc un profil
ligne1i j J
Σ
1 Profil ligne i : dans cette ligne on a la
distribution des réponses pour la variable
V2 sachant qu’on possède la modalité i
de V1

/ .
i 1

Profil ligne moyen= distribution


marginale de V2. Profil de l’ensemble
I des individus étudiés

GI . 1

On adopte une analyse par colonne


&
Pour ce faire on se réfère au modèle d’indépendance suivant : . =
&.

5
1 j J
GJ
1 Profil colonne moyen GJ = distribution
marginale de V2. Profil de l’ensemble
des individus étudiés

.
/ .
i
Comparaison des profils
colonnes au profil moyen

1 1
Profil colonne j : dans cette colonne on a
la distribution des réponses pour la
variable V1 sachant qu’on possède la
modalité j de V2

Application sur l’exemple :


Q1 : famille Q2 : l’activité convenant une mère de famille Profil moyen
idéale est celle : Rester au : Travailler à : Travailler à .
où : foyer mi-temps plein temps
: les deux 4.55 12.60 33.40 15.13%
conjoints
travaillent
également
: Le mari a un 10,56 36.33 36.45 32.19%
métier plus
absorbant que
celui de sa
femme
: Seul le mari 84.82 51.02 29.65 52.66%
travaille
total 100 100 100 100

Prenant : 12.60 est le pourcentage des femmes qui ont répondu favorable au travail mi-temps
et les deux conjoints travaillent également et le comparer à 15,13% qui est le pourcentage du
profil moyen. Donc cette comparaison consiste à répondre la question suivante : les femmes
qui ont répondu « travailler à mi-temps » répondent-elles de façon particulière à la question
sur la famille idéale.

6
VI) Les nuages de points et leur ajustement :
Pour présenter l’AFC nous allons raisonner essentiellement et géométriquement en
construisant les nuages de points pour les profils lignes et les profils colonnes
VI.1) Les nuages de points pour les profils lignes :
1 j J
1

i / .

GI . 1

Le profil ligne est un grand point dans l’espace Rj donc chaque élément (dimension) de cet
espace correspond à une modalité j de V2 ainsi le profil ligne i a coordonnées
&
si l’on considère l’ensemble des profils ligne i on obtient le nuage des profils ligne qu’on
&.
note Ni. Dans ce nuage on peut situer le profil moyen GI qui a comme coordonnées pour la
jème dimension . . Ce profil moyen on l’appelle G comme centre de gravité.
Dans cet espace ce qui nous intéresse est de comparer la position du profil ligne i au profil
moyen.
Dans cet espace il faut savoir calculer la distance, cette dernière est utilisée en AFC et appelé
distance de χ2
& &.̀
• Distance entre deux profils : ()* ( , +̀) = ∑ ∗(&. − )
&. &.̀.

&
• Distance profil moyen GI : ()* ( , /0 ) = ∑ ∗(&. − . )
&.

7
VI.2) Les nuages de points pour les profils colonnes :

1 j J
GJ
1

.
/ .
i

1
1

& & 3̀
• Distance entre deux profils : ()* ( , 1̀) = ∑ ∗( – )
&. &. & 3̀
&
• Distance profil moyen GJ : ()* 4 , / 5 = ∑ ∗( − .)
&. &.

VI.3) Présentation du nuage des lignes et colonnes (données de l’exemple)

L’AFC projette le nuage de points sur une suite d’axes orthogonaux.

8
On a un graphique plan où se trouvent les lignes et les colonnes. Les lignes en bleu et les
colonnes en rouge.
Quelles sont les règles d’interprétation ?
Un point très essentiel c’est la distance au centre de gravité. Par exemple travailler mi-temps
est très proche du centre de gravité.

Rester au foyer : Travailler à Travailler à GJ


mi-temps plein temps
12.60 15.13%
Très proche
La proximité de la modalité travailler à mi-temps du profil moyen suggère que cette modalité
est neutre à la différence de l’autre modalité (plutôt favorable au travail féminin).

Vous aimerez peut-être aussi