Vous êtes sur la page 1sur 36

Chapitre4

Analyse Factorielle des Correspondances Multiple


Prof. Sokaina EL KHAMLICHI

Ecole des Sciences de l’Information

sel-khamlichi@esi.ac.ma
Introduction
• L'Analyse des Correspondances Multiple (ACM) est une extension de
L'Analyse des Correspondances simple (AFC), permettant de décrire
les relations entre p (p > 2) variables qualitatives.
• Elle s'agit d'une analyse des correspondances simple réalisée sur un
tableau disjonctif complet avec des observations en ligne et des
catégories de variables en colonnes.
• L'ACM est une méthode qui permet donc l'étude des liaisons entre
plus de deux variables qualitatives, ce qui étend le spectre d'étude de
l'AFC.
• L'ACM est donc très bien adaptée au traitement d'enquêtes lorsque
les variables sont qualitatives (ou rendues qualitatives). Il est
également possible d'appliquer cette méthode plusieurs fois en ne
prenant en compte que quelques variables.
Introduction
• L'ACM permet l'étude de tableaux de données décrivant une
population de n individus et p variables qualitatives. Ces variables
qualitatives peuvent être transformées en suivant un codage
condensé qui attribue une valeur à chaque modalité. Par exemple, les
modalités pour la variable "Genre d'une personne" peuvent être 1
pour Homme et 2 pour Femme.
• Les données peuvent être donc représentées sous la forme d’une
matrice X dont les éléments sont :
Xij qui est le codage condensé de l'individu i pour la variable j
• Les Xij représentant une codification, en prendre la moyenne n’a
aucun sens. Ces données ne peuvent donc pas être traitées par l'ACP
ou l'AFC précédemment étudiées. Ce tableau présente donc des
spécificités dont l'analyse factorielle doit tenir compte par une
méthode spécifique (l'ACM).
Les objectifs de l'ACM
• Les objectifs que l'ACM doit remplir sont les mêmes que ceux de
l'ACP ou de l'AFC. Il s'agit d'obtenir une typologie des lignes et des
colonnes et relier ces deux typologies.
• On aura ici trois familles d'éléments à étudier, les individus, les
variables et les modalités des variables. Cette étude se fait par la
définition de ressemblances et liaisons pour ces trois familles.
• Afin d'établir un bilan des ressemblances entre individus, comme en
ACP on cherche à répondre à des questions du type :
Quels sont les individus qui se ressemblent ?
Quelles sont ceux qui sont différents ?
Existe-t-il des groupes homogènes d'individus ?
Est-il possible de mettre en évidence une typologie des individus ?
Les mêmes types de questions se posent pour les variables et les
modalités.
Principe de l'ACM
• Le principe de base de l'ACM repose dans un premier temps sur une
transformation des données du tableau, décrivant une population de n
individus et p variables qualitatives, pour modifier la codification en
nombres binaires.

• L'analyse applique ensuite le même principe que l'AFC, en transformant


ce tableau disjonctif complet ainsi obtenu en profils-lignes et en profils-
colonnes. La distance du Khi2 est également employée pour définir les
liaisons.
Principe de l'ACM : Le tableau de données disjonctif complet

Pour ce tableau l'expression de la Distance du Khi2 (χ2)


devient
Interprétation des résultats de l'ACM
• On note que deux individus se ressemblent lorsqu'ils présentent
globalement les mêmes modalités. Cette ressemblance se traduit par
une proximité des individus dans l'espace ou en pratique dans
l'espace de projection choisi pour la représentation simultanée.
• De même si deux modalités d'une même variable sont proches dans
l'espace de projection, ceci se traduit par une ressemblance entre les
groupes d'individus qui les ont choisies.
 La proximité de deux modalités de variables différentes
s'interprète en terme d'association. Ainsi deux modalités de
variables différentes s'associent si elles concernent globalement les
mêmes individus.
Interprétation des résultats de l'ACM
• Pour mesurer la qualité de représentation, il est important de faire
recours à des indicateurs pour l'interprétation de l'ACM qui sont les
mêmes que ceux de l'ACP et de l'AFC, ici pour les individus et les
modalités.
• Ainsi, on peut étudier la qualité de représentation de chaque individu
et de chaque modalité par un axe ou par un plan. La contribution d'un
individu ou d'une modalité à l'inertie d'un axe ou d'un plan doit aussi
être considérée.
• La notion de variable doit être également prise en compte. En effet, la
contribution d'une variable à l'inertie d'un axe peut être obtenue en
sommant les contributions des modalités de cette variable à l'inertie
du même axe. On obtient ainsi un indicateur de liaison entre la
variable et le facteur.
Interprétation des résultats de l'ACM
• Supposons qu'on dispose de p variables qualitatives avec K est le
nombre total des modalités en considérant toutes ces variables. Pour
mesurer la qualité de la représentation avec l'ACM, on utilise les
critères suivants :
• Inertie total du nuage de points:

Avec K est le nombre total des modalités en considérant toutes les


variables et p est le nombre de variables utilisées dans l'analyse.
Ainsi, les taux d'inertie sont souvent faibles en ACM et conduisent à une
estimation pessimiste de la part d'information expliquée.
Interprétation des résultats de l'ACM
• Inertie d'une modalité :

où n.j est l’effectif de la modalité.


L'inertie d'une modalité est une fonction décroissante de l’effectif de la
modalité. Le maximum 1/p est obtenu pour une modalité d’effectif nul. Il sera
donc nécessaire en pratique d'éviter les modalités à effectifs faibles.
• Inertie d'une variable :

où Jq nombre de modalités de la variable q.


 L'inertie d'une variable est une fonction croissante de nombre de ces
modalités. D'où la nécessité d'équilibrer le nombre de modalités.
Cas des variables quantitatives
• Initialement prévue pour les variables qualitatives, l'ACM peut traiter
également les variables quantitatives, sous condition qu'elles soient
rendues qualitatives.
• Pour se faire, il suffit de découper l'intervalle de variation en sous-
intervalles qui définissent autant de modalités.
• Ainsi, diminuer le nombre de classes, c'est regrouper des individus de
plus en plus différents et augmenter le nombre de classes, c’est obtenir
des classes plus nombreuses et à faible effectif. Il est préférable de
garder un nombre inférieur à huit classes pour pouvoir espérer analyser
ces classes correctement. Bien souvent quatre ou cinq classes suffisent.
• Il faut également choisir correctement les classes, par exemple en
regardant s'il n'existe pas de seuils pour la variable mesurée,
déterminés par exemple par l'histogramme.
Démarche à suivre lors de la réalisation de l'ACM
• Afin de ne rien oublier pour l'interprétation des résultats, on peut suivre le
plan suivant :
1. Définir le nombre de modalités des variables quantitatives, s'il y a des
variables quantitatives intéressantes pour l'étude.
2. Choisir le nombre d'axes de projection. Ce choix se fait toujours de la
même façon que pour l'ACP ou l'AFC.
3. Etudier les valeurs propres qui représentent l'inertie de chaque axe.
4. Etudier la contribution des lignes et des modalités de la même façon
que l'ACP.
5. Etudier la contribution des variables en sommant les contributions
des modalités d'une variable pour un facteur donné.
6. Etudier les coordonnées des modalités et des individus actifs.
Autre présentation de l’ACM: Tableau de Burt

• Il existe une autre façon de présenter les


données lorsque l'on est face à un
ensemble de variables qualitatives , c'est
le tableau de Burt.
• Ce tableau consiste à calculer pour chaque
couple de variables, le tableau de leur
croisement. chaque rectangle est un
tableau croisé ou tableau de contingence
entre 2 variables. Les lignes et les
colonnes d'un tableau de contingence
sont les modalités. Il récapitule l'ensemble
des liaisons entre les variables prises 2 à 2.
Autre présentation de l’ACM: Tableau de Burt
• Afin d’analyser le tableau de Burt, il faut appliquer l’AFC à ce tableau. Les
facteurs obtenus par cette méthode sont exactement les mêmes facteurs
obtenus par l’application de l’ACM au tableau disjonctif complet mais
avec des valeurs propres différentes.
Les valeurs propres de Burt = au carré des valeurs propres du tableau
disjonctif complet.

 Une AFC sur un tableau de Burt équivaut à une ACM sur un tableau
disjonctif complet
Mise en œuvre de l’ACM sous SPSS: Table de données
Pour la mise en œuvre avec SPSS d'une ACM, on va utiliser les données
de la table "Salaire" contenant des informations sur les 474 employés
d'une entreprise. Ces informations sont représentées par les huits
variables suivantes :
• Salaire_act (Quant) : salaire brut actuel (en $/an)
• Salaire_init (Quant) : Salaire brut de départ (en $/an)
• Ancienneté (Quant) : Nombre de mois de travail depuis l'entrée dans
l'entreprise
• Ancienneté_avant (Quant) : Nombre de mois de travail avant l'entrée
dans l'entreprise
• Education (Quant) : Nombre d'années d'études
• Catégorie (Quali) : Catégorie de travail (1=ouvrier, 2=emploi
intermédiaire, 3=Cadre)
Table de données
Table de données
Lors de l'utilisation de SPSS pour la mise en œuvre d'une ACM, les
transformations suivantes sont réalisées sur les données utilisées dans
l'analyse :
• Les variables de type "chaîne" sont toujours converties en nombres
entiers positifs par ordre croissant alphanumérique.

• Les valeurs manquantes définies par l'utilisateur, les valeurs


manquantes par défaut et les valeurs inférieures à 1 sont
considérées comme manquantes.

On doit donc recoder ou ajouter une constante aux variables


contenant des valeurs inférieures à 1 pour les définir comme non
manquantes. C'est le cas, par exemple, de la variable "Sexe" où il
faut recoder la valeur 0.
Table de données
Réalisation d’une ACM avec SPSS
Réalisation d’une ACM avec SPSS

Il faut choisir les variables à utiliser dans l’ACM


Réalisation d’une ACM avec SPSS

Il faut choisir le nombre de dimensions (axes factorielles) à retenir.


Par défaut, on choisit 2 dimensions
Réalisation d’une ACM avec SPSS

L’ACM s’utilise avec des variables catégorielles. Il faut donc commencer par discrétiser
les variables quantitatives. C’est le cas des variables: « Salaire_act », « Salaire_init»,
« Ancienneté», « Ancienneté_avant » et « Education»
Réalisation d’une ACM avec : Discrétisation des variables quantitatives
Réalisation d’une ACM avec : Discrétisation des variables quantitatives

• La boîte de dialogue Discrétiser permet de choisir une méthode de


recodage des variables.
• Les valeurs fractionnées sont regroupées en sept modalités (ou en
nombre de valeurs distinctes de variables si le nombre est inférieur à
sept) avec une distribution normale approximative, à moins qu'une autre
configuration ne soit spécifiée.
• Les variables chaîne sont toujours converties en nombres entiers positifs
en affectant des indicateurs de modalités selon l'ordre croissant
alphanumérique.
• La discrétisation des variables chaîne s'applique à ces nombres entiers.
Par défaut, d'autres variables sont laissées inutilisées. Les variables
discrétisées sont ensuite utilisées dans l'analyse.
Réalisation d’une ACM avec : Discrétisation des variables quantitatives

Les options de la boîte de dialogue Discrétiser sont :


Méthode: trois méthodes de discrétisation sont disponibles :
• Regroupement: permet de recoder la variable en un nombre spécifié de
modalités ou par intervalle.
• Rang: la variable est discrétisée via le rang des observations.
• Multiplier: Les valeurs courantes de la variable sont standardisées, multipliées
par 10 et arrondies (la valeur discrétisée la plus faible est égale à 1).
Pour la méthode Regroupement, on dispose des options suivantes
• Nombre de modalités : permet d'indiquer le nombre de modalités et de définir
si les valeurs de la variable doivent être approximées par une distribution
gaussienne ou uniforme entre ces modalités.
• Intervalles égaux : les variables sont recodées en modalités définies par des
intervalles de taille égale. N'oubliez pas de spécifier la longueur des intervalles.
Réalisation d’une ACM avec : Discrétisation des variables quantitatives

On a choisi de discrétiser les


variables quantitatives par
regroupement en 7 classes en se
basant sur la distribution
Normale
Réalisation d’une ACM avec : Options de l’ACM
• Lors de la réalisation de l'ACM avec SPSS, il y a moyen de spécifier les
options suivantes à travers la boîte de dialogue Options

• La sélection de la configuration initiale,

• La spécification des itérations et des critères de convergence,

• La sélection de la méthode de standardisation des coordonnées des objets


(individus) et des variables,

• La sélection de la méthode d'étiquetage des diagrammes,

• La spécification des objets (individus) supplémentaires.


Réalisation d’une ACM avec : Options de l’ACM
Réalisation d’une ACM avec : Options de l’ACM
Pour la méthode de standardisation des coordonnées des objets (individus) et
des variables, on peut choisir une des cinq méthodes disponibles :
• Variable principale : Cette option optimise l'association entre les variables.
Les coordonnées des variables dans l'espace individus correspondent aux
corrélations entre composantes et variables initiales. Cela est utile si on
est avant tout intéressé par les corrélations entre variables.
• Objet principal : Cette option optimise les distances entre les individus.
Cela est utile si on est avant tout intéressé par les différences ou
similitudes entre individus.
• Symétrique : Cette option est utilisée si on est avant tout intéressé par la
relation entre les individus et les variables.
• Indépendant : Cette option est utilisée si on souhaite examiner les
distances entre les individus ainsi que les corrélations entre variables
séparément.
Réalisation d’une ACM avec : Résultats de l’ACM
• Lors de la réalisation de l'ACM avec SPSS, on peut spécifier les
résultats qu'on désire obtenir à travers la boîte de dialogue Résultat
qui permet de:
• créer des tableaux pour les coordonnées des individus,
• les mesures de discrimination,
• l'historique des itérations,
• les corrélations des variables d'origine et des variables
transformées,
• les quantifications des modalités et statistiques descriptives des
variables sélectionnées.
Réalisation d’une ACM avec : Résultats de l’ACM
Réalisation d’une ACM avec : Tracés d’objets
Réalisation d’une ACM avec : Tracés de variables
Réalisation d’une ACM avec : Résultats de l’ACM
Parmi les choix des résultats à obtenir qui sont disponibles dans la boîte de
dialogue Résultat on a
• Scores d’objets : permet d'afficher les coordonnées des objets, y compris
la masse, l'inertie et les contributions,
• Mesures de discrimination : permet d'afficher les mesures de
discrimination par variable et par dimension.
• Corrélations des variables transformées : permet d'afficher la matrice de
corrélation des variables transformées (codées de façon optimale) ainsi
que les valeurs propres de cette matrice.
• Valeurs affectées aux modalités et contributions. : permet d'indiquer les
valeurs affectées aux modalités (coordonnées), y compris la masse,
l'inertie et les contributions pour chaque dimension de la ou des
variables sélectionnées.
Réalisation d’une ACM avec : L’option enregistrer de l’ACM
Réalisation d’une ACM avec : L’option enregistrer de l’ACM

• La boîte de dialogue Enregistrer permet d'enregistrer les données


discrétisées, les coordonnées des individus et les valeurs
transformées dans un fichier de données SPSS ou un ensemble de
données.

• On peut également enregistrer les valeurs transformées et les


coordonnées des individus dans l'ensemble de données actif.

Vous aimerez peut-être aussi