Académique Documents
Professionnel Documents
Culture Documents
L’algorithme de détermination des axes factoriels s’applique au tableau des données une
fois exprimées en pourcentage en rapportant chaque effectif Kij à l’effectif total K.
Le problème de l’AFC est d’évaluer la proximité des lignes et les profils des colonnes :
c’est ainsi qu’est apprécié la liaison – la correspondance – entre les deux variables.
Il s’agit par conséquent d’analyser la forme des liaisons et non leur intensité. C’est
pourquoi l’AFC utilise pour mesurer les écarts entre profils la distance X2 (khi –deux) qui offre
de ce point de vue deux avantages importants :
- Parce qu’elle est pondérée, elle gomme les effets de taille liés aux mesures des Kij : la
détermination des axes factoriels ne subit pas (comme cela peut être le cas en ACP)
l’influence déformante des différences importantes entre les valeurs Kij ;
- Parce qu’elle présente la propriété de l’équivalence distributionnelle, elle permet de
réduire les données en regroupant les colonnes (ou lignes) qui présentent un profil
équivalent sans pour autant modifier les distances mutuelles entre les lignes (ou
colonnes).
Rappelons enfin que dans la mesure où les lignes et les colonnes ont même statut, leur
représentation graphique simultanée ne soulève en AFC aucune restriction : sont ainsi mises en
évidence non seulement les proximités de profils de lignes comme de colonnes, mais aussi les
relations privilégiées pouvant exister entre lignes et colonnes, c'est-à-dire entre les deux
variables croisées.
On définit une correspondance entre deux ensembles finis I et J par la donnée d’une loi
de probabilité PIJ sur le produit I × J. Dans une application pratique, on ne dispose pas de PIJ
mais seulement de la distribution des fréquences empiriques fIJ observée sur une population
concrète E.
1- Généralités
Considérons donc une population E d’effectif K répartie selon les deux caractères
qualitatifs I et J, possédant respectivement N et K modalités (N et K finis). Nous noterons KIJ
le tableau de contingence qui donne la ventilation de E selon le croisement I × J des deux
caractères ; c’est un tableau à N lignes et K colonnes, de terme courant Kij.
Il s’agit de ramener le tableau des effectifs à un tableau des fréquences. Les fréquences
sont calculées par :
L’analyse factorielle d’un tel nuage de points nécessite que l’on diagonalise la matrice
V, appelée matrice des variance-covariance.
Le tableau de valeur dont on recherche les valeurs propres et vecteurs propres est un
objet mathématiques "compliqué", qui ne possède pas de signification intuitive immédiate. De
𝑓𝑓𝑓𝑓𝑓𝑓
fait, on part de la X dont le terme à l’intersection de la ligne i et de la colonne j vaut : et
�𝑓𝑓𝑓𝑓.𝑓𝑓.𝑗𝑗
on calcule des produits scalaires entre lignes (ou entre colonnes) de cette matrice.
V = X’X
Reste à identifier les valeurs propres et les vecteurs propres de V, et à projeter les points Xi
sur les vecteurs propres
4- Diagonalisation
Le calcul des valeurs propres, des vecteurs propres et des vecteurs propres normés se fait
de la même manière que pour une analyse des composantes principales (voir chapitre I).
Le nombre de valeurs propres produites par la recherche des facteurs principaux est égal
au minimum du nombre de colonnes du tableau de contingence. La première valeur propre est
systématiquement égale à 1 et n’est pas mentionnée dans les résultats. Les autres valeurs
propres sont des nombres positifs inférieurs à 1 et leur somme est égale à la trace de V.
Avec :
fij : Intersection de la colonne i avec la ligne i sur le tableau des données réduites à l’unité.
fi • : Total de la ligne i
Ujk : Vecteurs propres normés
f • j: Total de la colonne j