Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 11

LENOVO 2

Remerciement

LENOVO 3
Introduction générale
Les méthodes d’analyse factorielle sont incontestablement des outils fondamentaux de
l’analyse des tableaux de données qui ne présentent pas de structure particulière. Elles
visent essentiellement un but descriptif, en condensant l’information contenue dans un
tableau, constitué souvent d’un nombre élevé de lignes et de colonnes, en quelques
représentations graphiques à deux dimensions, accompagnées de tableaux reprenant les
valeurs numériques de caractéristiques destinées à aider l’utilisateur lors de
l’interprétation. L’analyse en composantes principales et l’analyse factorielle des
correspondances sont sans doute les deux méthodes factorielles les plus couramment
utilisées, mais d’autres méthodes peuvent encore être envisagées.
L’objectif de cette note est de décrire de façon simple et d’illustrer par des exemples
élémentaires, les principes de base de ces deux méthodes. La bonne compréhension de ces
principes devrait permettre aux utilisateurs d’interpréter correctement les documents
imprimés fournis par les logiciels statistiques. Une attention plus particulière est accordée
à l’analyse des correspondances, car l’analyse en composantes principales présente moins
de difficultés et est en outre exposée de faèon claire et simple par Dagnelie [1982]. En
particulier, pour cette dernière méthode nous ne présentons pas de documents imprimés
fournis par les logiciels. Pour l’analyse des correspondances, par contre, nous
reproduisons plusieurs figures obtenues par la procédure CORRESP du logiciel SAS. Des
informations relatives à cette procédure sont données dans le manuel d’utilisation de ce
logiciel [X, 1990]. L’analyse en composantes principales et l’analyse des correspondances
présentent un certain nombre de points communs et peuvent être considérées comme des
applications particulières d’une méthode générale dont nous exposons les principes au
paragraphe 2. Nous examinons ensuite l’analyse en composantes principales (paragraphe
3) et l’analyse des correspondances (paragraphe 4), puis nous terminons par quelques
informations complémentaires (paragraphe 5). Dans cette note, nous nous limitons à une
présentation relativement élémentaire des méthodes. En particulier, aucune démonstration
mathématique n’est donnée. Le lecteur souhaitant approfondir ces méthodes trouvera des
informations plus détaillées dans l’abondante littérature consacrée à ce sujet, par exemple
dans Benzécri et Benzécri [1980], Bouroche et Saporta [1980], Cibois [1983], Fénelon
[1981], Greenacre [1984], Jackson [1991] et Lebart et al. [1979].

LENOVO 4
Table de matière

LENOVO 5
Liste de figure

LENOVO 6
Liste des tableaux

LENOVO 7
Chapitre 1 : Analyse factorielle
I. L’analyse de données

1. Définition et objectifs
L’analyse des données (ADD) : l’ensemble de méthodes descriptives ayant pour objectif
de résumer et visualiser l’information contenue dans un grand tableau de données
➔ « l’analyse des données est un ensemble de techniques pour découvrir la structure,
éventuellement compliquée, d’un tableau de nombres à plusieurs dimensions et de traduire
par une structure plus simple et qui la résume au mieux. Cette structure peut le plus
souvent, être représentée graphiquement’» (J-P. Fénelon)

Les principaux objectifs de l’Analyse des données :

 Répondre aux problèmes posés par des tableaux de grandes dimensions


 Résumer les informations contenues dans un grand tableau sous forme d’une
matrice
 Organiser et visualiser les informations
2. Le processus d’analyse de données :
Les principales étapes du processus d'analyse :

Figure 1:Processus d'analyse de données


LENOVO 8
 Collecte de données

On distingue deux types des données :

 Les données primaires sont spécialement collectées pour répondre à une étude
statistique précise.
 Les données secondaires: sont des données qui existent déjà (Ex: statistiques
officielles…)
 Les méthodes d’analyse
On distingue plusieurs méthodes selon deux critères :

1 : Selon l’objectif de la méthode

L’objectif de la méthode

Méthodes explicatives Méthodes descriptives

Les méthodes explicatives :


Consiste à expliquer une variable au moyen d’une ou plusieurs variables:
Exemple des méthodes utilisées :
 Problèmes de régression et de corrélation
 Analyse de la variance
 Analyse discriminatoire
 Régression logistique
 Corrélation canonique
Les méthodes descriptives :
Consiste à résumer, visualiser et synthétiser les informations.
Là on besoin de l’analyse factorielle
Exemple des méthodes utilisées :
 Analyse Factorielle des Correspondances
 Analyse en Composantes Principales
 Classification Ascendante Hiérarchique

2 : Selon type de mesure

Type de mesure

Mesure nominale Mesure ordinale Mesure métrique

LENOVO 9
Mesure nominale :
On utilise des chiffres sans aucune relation d’ordre, ni de distance, ni d’origine:
EX :
Sexe: Femme, Homme
Situation matrimoniale: marié, célibataire...
Les méthodes utilisées :
 Analyse Factorielle des Correspondance
Mesure ordinale :
Les chiffres qui identifient la relation d’ordre entre les propriétés d’objet sans aucune
relation de distance
EX :
Classement des goûts des clients selon un critère classe d’âge (15- 25), ( 26- 35)….
Les méthodes utilisées :
 Analyse Factorielle des Correspondances
Mesure métrique :
Variable quantitative dont les valeurs ont une relation d’ordre et de distance
EX :
Le nombre de points de vente d’une marque
La valeur d’investissement dans une ville
Les méthodes utilisées :
 Analyse en Composantes Principales

Remarque :

Notre projet se concentre sur l'étude et l'application des différentes techniques d'analyse
factorielle.

II. Qu’est-ce que l’analyse factorielle ?

3. Définition :
L’analyse factorielle est une méthode statistique utilisée pour explorer la structure des
données en identifiant les relations sous-jacentes entre un ensemble de variables
observées. Son objectif principal est de réduire la complexité des données en les résumant
en un nombre plus restreint de facteurs, tout en conservant autant que possible
l'information contenue dans les données d'origine.
4. Les avantages de l’analyse factorielle
L’analyse factorielle est très utile pour les enquêtes et études qui génèrent un nombre très
important de données complexes. Même pour le plus expérimenté des analystes, traiter un
grand volume de données complexes peut s’avérer difficile. Elle permet notamment de :
 Condenser des variables
 Découvrir des rassemblements de données

LENOVO 10
 Simplifier la compréhension
L’analyse factorielle permet également de dresser une représentation graphique de
données multiples et complexes sous forme de matrice afin de simplifier leur
compréhension et les observations. En effet, dans certaines études complexes, présenter
les données en lignes et en colonnes dans un tableau peut ne pas être très parlant.

III. Méthodes d’analyse factorielle :

Données : tableau de n observations décrites par d variables

Observation X1 X2 … Xd
o1 … … … …
o2 … … … …
… … … … …
on … … … …

Objectif général : recherche de « facteurs » (variables dérivées) permettant de résumer les


(caractéristiques des) données
 Améliorer la « lisibilité » des données
** Mettre en évidence des relations entre (groupes de) variables
** Permettre une visualisation informative
 Réduire le nombre de variables en conservant au mieux l’information utile
** Réduire la redondance présente dans l’ensemble de variables initiales
** Choisir un sous-espace de description plus pertinent

LENOVO 11

Vous aimerez peut-être aussi