Académique Documents
Professionnel Documents
Culture Documents
Analyses Factorielle
Analyses Factorielle
Remerciement
LENOVO 3
Introduction générale
Les méthodes d’analyse factorielle sont incontestablement des outils fondamentaux de
l’analyse des tableaux de données qui ne présentent pas de structure particulière. Elles
visent essentiellement un but descriptif, en condensant l’information contenue dans un
tableau, constitué souvent d’un nombre élevé de lignes et de colonnes, en quelques
représentations graphiques à deux dimensions, accompagnées de tableaux reprenant les
valeurs numériques de caractéristiques destinées à aider l’utilisateur lors de
l’interprétation. L’analyse en composantes principales et l’analyse factorielle des
correspondances sont sans doute les deux méthodes factorielles les plus couramment
utilisées, mais d’autres méthodes peuvent encore être envisagées.
L’objectif de cette note est de décrire de façon simple et d’illustrer par des exemples
élémentaires, les principes de base de ces deux méthodes. La bonne compréhension de ces
principes devrait permettre aux utilisateurs d’interpréter correctement les documents
imprimés fournis par les logiciels statistiques. Une attention plus particulière est accordée
à l’analyse des correspondances, car l’analyse en composantes principales présente moins
de difficultés et est en outre exposée de faèon claire et simple par Dagnelie [1982]. En
particulier, pour cette dernière méthode nous ne présentons pas de documents imprimés
fournis par les logiciels. Pour l’analyse des correspondances, par contre, nous
reproduisons plusieurs figures obtenues par la procédure CORRESP du logiciel SAS. Des
informations relatives à cette procédure sont données dans le manuel d’utilisation de ce
logiciel [X, 1990]. L’analyse en composantes principales et l’analyse des correspondances
présentent un certain nombre de points communs et peuvent être considérées comme des
applications particulières d’une méthode générale dont nous exposons les principes au
paragraphe 2. Nous examinons ensuite l’analyse en composantes principales (paragraphe
3) et l’analyse des correspondances (paragraphe 4), puis nous terminons par quelques
informations complémentaires (paragraphe 5). Dans cette note, nous nous limitons à une
présentation relativement élémentaire des méthodes. En particulier, aucune démonstration
mathématique n’est donnée. Le lecteur souhaitant approfondir ces méthodes trouvera des
informations plus détaillées dans l’abondante littérature consacrée à ce sujet, par exemple
dans Benzécri et Benzécri [1980], Bouroche et Saporta [1980], Cibois [1983], Fénelon
[1981], Greenacre [1984], Jackson [1991] et Lebart et al. [1979].
LENOVO 4
Table de matière
LENOVO 5
Liste de figure
LENOVO 6
Liste des tableaux
LENOVO 7
Chapitre 1 : Analyse factorielle
I. L’analyse de données
1. Définition et objectifs
L’analyse des données (ADD) : l’ensemble de méthodes descriptives ayant pour objectif
de résumer et visualiser l’information contenue dans un grand tableau de données
➔ « l’analyse des données est un ensemble de techniques pour découvrir la structure,
éventuellement compliquée, d’un tableau de nombres à plusieurs dimensions et de traduire
par une structure plus simple et qui la résume au mieux. Cette structure peut le plus
souvent, être représentée graphiquement’» (J-P. Fénelon)
Les données primaires sont spécialement collectées pour répondre à une étude
statistique précise.
Les données secondaires: sont des données qui existent déjà (Ex: statistiques
officielles…)
Les méthodes d’analyse
On distingue plusieurs méthodes selon deux critères :
L’objectif de la méthode
Type de mesure
LENOVO 9
Mesure nominale :
On utilise des chiffres sans aucune relation d’ordre, ni de distance, ni d’origine:
EX :
Sexe: Femme, Homme
Situation matrimoniale: marié, célibataire...
Les méthodes utilisées :
Analyse Factorielle des Correspondance
Mesure ordinale :
Les chiffres qui identifient la relation d’ordre entre les propriétés d’objet sans aucune
relation de distance
EX :
Classement des goûts des clients selon un critère classe d’âge (15- 25), ( 26- 35)….
Les méthodes utilisées :
Analyse Factorielle des Correspondances
Mesure métrique :
Variable quantitative dont les valeurs ont une relation d’ordre et de distance
EX :
Le nombre de points de vente d’une marque
La valeur d’investissement dans une ville
Les méthodes utilisées :
Analyse en Composantes Principales
Remarque :
Notre projet se concentre sur l'étude et l'application des différentes techniques d'analyse
factorielle.
3. Définition :
L’analyse factorielle est une méthode statistique utilisée pour explorer la structure des
données en identifiant les relations sous-jacentes entre un ensemble de variables
observées. Son objectif principal est de réduire la complexité des données en les résumant
en un nombre plus restreint de facteurs, tout en conservant autant que possible
l'information contenue dans les données d'origine.
4. Les avantages de l’analyse factorielle
L’analyse factorielle est très utile pour les enquêtes et études qui génèrent un nombre très
important de données complexes. Même pour le plus expérimenté des analystes, traiter un
grand volume de données complexes peut s’avérer difficile. Elle permet notamment de :
Condenser des variables
Découvrir des rassemblements de données
LENOVO 10
Simplifier la compréhension
L’analyse factorielle permet également de dresser une représentation graphique de
données multiples et complexes sous forme de matrice afin de simplifier leur
compréhension et les observations. En effet, dans certaines études complexes, présenter
les données en lignes et en colonnes dans un tableau peut ne pas être très parlant.
Observation X1 X2 … Xd
o1 … … … …
o2 … … … …
… … … … …
on … … … …
LENOVO 11