Académique Documents
Professionnel Documents
Culture Documents
L’ANALYSE FACTORIELLE
MULTIPLE
MASTER
ECONOMIE APPLIQUEE
Présenté par :
AOURRAZ Soulaimane
BOUACHRA Monsif
RAMAH Ahmed
OUELD BEN TAYEB Badr
Encadré par :
Dr. ANOUALIGH Jamaa
L’analyse des données est un domaine issu du monde des statistiques qui vise
à faire le lien entre les différentes données statistiques pour les classer, les décrire et
les analyser de manière succincte.
Parmi les méthodes de l’analyse des données, l’analyse factorielle tient une
place primordiale Elle est utilisée soit seule, soit conjointement avec des méthodes
de classification. Qui essaie d'identifier des variables sous-jacentes, ou facteurs, qui
permettent d'expliquer le motif des corrélations à l'intérieur d'un ensemble de
variables observées.
Il existe essentiellement deux types des méthodes d’analyse factoriel, soit des
méthodes classiques qui comprend Analyse en Composantes Principales, Analyse
Factorielle des Correspondances, Analyse des Correspondances Multiples, soit des
méthodes avancées comme Analyse Factorielle Multiple, Analyse Factorielle
Multiple Hiérarchique, Analyse Proustienne Généralisée.
L'AFM est réalisée en deux étapes. Tout d’abord, une analyse en composantes
principales (ACP) est effectuée sur chaque ensemble de données qui est ensuite «
normalisé » en divisant tous ses éléments par la racine carrée de la première valeur
propre obtenue à partir de son ACP. Ensuite, les ensembles de données normalisés
sont fusionnés pour former une matrice unique et un ACP global est effectuée sur
cette matrice. Les ensembles de données individuels sont ensuite projetés sur
l'analyse globale pour analyser les points communs et les écarts.
2. Quand l'utiliser
L'AFM est utilisée pour analyser un ensemble d'observations décrites par
plusieurs groupes de variables. Le nombre de variables dans chaque groupe peut
différer et la nature des variables (nominales ou quantitatives) peut varier d'un
groupe à l'autre mais les variables doivent être de même nature dans un groupe
donné. L'analyse déduit une image intégrée des observations et des relations entre
les groupes de variables.
3. L’idée principale
L'objectif de l'AFM est d'intégrer différents groupes de variables décrivant les
mêmes observations. Pour ce faire, la première étape consiste à rendre ces groupes
de variables comparables. Une telle étape est nécessaire car l'analyse simple obtenue
en concaténant toutes les variables serait dominée par le groupe avec la structure la
plus forte.
Un problème similaire peut se produire dans un ACP non normalisé : sans
normalisation, la structure est dominée par les variables avec la plus grande
variance. Pour l'ACP, la solution consiste à normaliser (c'est-à-dire à utiliser des
scores Z) chaque variable en la divisant par son écart type.
La solution proposée par AFM est similaire : pour comparer des groupes de
variables, chaque groupe est normalisé en divisant tous ses éléments par une
quantité appelée sa première valeur singulière qui est l'équivalent matriciel de l'écart
type. Pratiquement, cette étape est mise en œuvre en effectuant un ACP sur chaque
groupe de variables. La première valeur singulière est la racine carrée de la première
valeur propre de l'ACP. Après normalisation, les tables de données sont
concaténées dans une table de données qui est soumis à ACP.
II : Méthodologie de l’AFM
a Analyses factorielles de tableaux juxtaposés et AFM
Pour fixer les idées, nous considérons le cas d’une suite de J tableaux, dans
lesquels les mêmes Kg variables quantitatives sont mesurées sur les mêmes I
individus, indicée par le temps. L’ACP usuelle offre deux voies pour décrire
l’évolution des données
Figure 1.1
Le groupe qui compte : celui qui concentre l’inertie sur la première dimension.
Principe de la pondération en AFM :
Il faut essayer de redonner plus d'importance aux groupes dont l'inertie
globale est répartie sur plusieurs axes.
Plus l’inertie d’un groupe est « diluée » sur un nombre important d’axes, moins
l’inertie du premier axe est important.
On choisit la première valeur propre comme mesure de la structuration de
l’inertie du groupe
Le Poids d’une variable d'un groupe =1/l où l’est l'inertie du 1er axe de l'ACP
de ce groupe
Chaque individu partiel= les individus décrit par les variables d’un seul groupe
En AFM, cette représentation bénéficie d’une propriété importante : chaque
point moyen i est au barycentre de ses J points partiels i j. Cette propriété est
obtenue en dilatant le nuage N j I par une homothétie de rapport J. En AFMH,
cette propriété est étendue de la façon suivante : le point i n (individu i considéré
du point de vue des variables incluses dans le nœud n) est au barycentre des
individus partiels associés aux groupes de variables rassemblés par le nœud n.
Notre travail porte sur une évaluation sensorielle des vins par différents juges
en utilisant l’analyse factorielle multiple AFM dont l’objectif est :
• Pour une dimension donnée, les variables les plus corrélées à la dimension
sont proches de la dimension
Les variables les plus corrélées à la deuxième dimension sont : i) Spice before
shaking et Odor intensity before shaking pour le groupe odor ; ii) Spice, Plant et
Odor intensity pour le groupe odor after shaking et iii) Bitterness pour le groupe
taste.
En résume les variables qui contribuent le plus à l’axe 1 et à l’axe 2 sont les plus
importantes pour expliquer la variabilité dans le jeu de données.
• Les variables quantitatives les plus contributives :
La catégorie Env4 présente des coordonnées élevées sur le deuxième axe lié à
T1 et T2.
La catégorie “Reference” est connue pour être liée à un excellent sol viticole.
Comme prévu, notre analyse démontre que la catégorie “Reference” a des
coordonnées élevées sur le premier axe, corrélée positivement avec l’intensité et
l’harmonie des vins.
Le graphique des axes partiels montre la relation entre les axes principaux de
l’AFM et ceux obtenus lors de l’analyse de chaque groupe en utilisant soit une ACP
(pour les groupes de variables continues) soit une ACM (pour les variables
qualitatives).
IV. Résumé (récapitulatif)
La représentation des variables montre que la plupart des variables sont
fortement corrélées à la première dimension, quel que soit le groupe auquel elles
appartiennent. Cette dimension représente “intensité” et “harmonie”, des notions
positives communément utilisées en parlant de vins. Les variables les plus corrélées
à la deuxième dimension sont Spice before shaking et Odor intensity before
shaking du groupe odor, Spice, Plant et Odor intensity du groupe odor after
shaking et Bitterness du groupe taste. Cette dimension représente une
caractéristique épicée, végétale, essentiellement due à l’olfaction.
Les coordonnées des individus et modalités peuvent être liées à cette
interprétation des deux premières composantes principales via l’observation du
deuxième graphique. Le vin 1DAM a été évalué comme le plus “intense” et
“harmonieux” contrairement aux vins 1VAU et 2ING qui sont les moins “intenses
”et “harmonieux”. Le deuxième axe est essentiellement dû aux vins T1 et T2. Ces
deux vins étant en fait le même évalué deux fois par les juges, la deuxième
dimension sera désignée comme le “cas particulier du vin T”. La plupart des
modalités sont proches de l’origine du plan factoriel, ce qui signifie que ces
modalités ne sont pas reliées à l’“intensité”, l’“harmonie” ou au “vin T”. La
modalité Env4 possède des coordonnées élevées sur le deuxième axe mais
uniquement en lien avec T1 et T2. La modalité Reference, a priori en relation avec
un sol réputé pour la qualité des vins qu’il produit, possède des coordonnées
élevées sur le premier axe et est donc positivement corrélée aux notions “intensit”
et “harmonie”, ce qui confirme l’a priori.
Tous les groupes ont à peu près la même vision des modalités sauf pour la
modalité Env4, ce qui reprend l’interprétation de la représentation des individus.
Les quatre groupes actifs ont des coordonnées rapprochées sur la première
dimension ce qui signifie que leur contribution à la première composante principale
est à peu près la même. Cela signifie également que la première composante
principale de l’AFM est commune à tous les groupes. Quant à la deuxième
dimension, ce sont les groupes d’olfaction qui y ont les coordonnées les plus
élevées. Ces deux groupes contribuent le plus à la deuxième composante principale
interprétation de la représentation des individus.