Chapitre 3 Analyse en Composantes Principales - ACP

Cours : Analyse des données 2ème LNSG
Chapitre 3 : Analyse en composantes principales (ACP)
Introduction
L’analyse en composantes principales s’intègre dans le cadre des analyses factorielles
exploratoires (AFE). Cette analyse multivariée est utile dans la mesure où elle résume les
informations en partant d’un ensemble de variables directement observables pour générer à
postériori quelques composantes principales synthétiques. Ainsi, ce chapitre s’attache à
présenter les principes de cette analyse, ses objectifs, ses étapes et les conditions de son
opérationnalisation (Paragraphes 1, 2, 3, 4) avant d’exposer un exemple illustratif d’une ACP
avec des démonstrations sur le logiciel SPSS (Paragraphe 5).
I. Le principe de l’analyse en composantes principales

L’analyse en composantes principales permet la description synthétique des tableaux de
données qui se composent des observations (appelées aussi individus) en ligne et des variables
quantitatives (ou métriques) en colonnes. Les individus sont décrits par les variables
quantitatives multiples. Cette méthode d’extraction est une déclinaison des analyses
factorielles (Védrine, 1991). Selon Carricano et Poujol (2009), l’analyse factorielle sert à
identifier les dimensions de la structure et à déterminer dans quelle mesure chaque variable
peut expliquer chaque dimension. Elle se présente comme indiqué par Martin (2009) :
Figure 1 : L’analyse factorielle et la génération des facteurs
Analyse
Variables issues de l’enquête factorielle Nouvelles variables = facteurs
(Questions, recodages, (Moins nombreuses et
indicateurs synthétiques) indépendantes)
Source : Martin, (2009), page 106.

L’ACP est une analyse aussi bien exploratoire et descriptive : descriptive car elle se base sur
l’étude simultanée des variables métriques sans la recherche des liens de cause à effet entre
ces variables, et exploratoire car elle aboutit à la découverte des variables synthétiques
permettant de résumer les informations à partir des données initiales (C'est-à-dire des tableaux
indiquant des individus /variables quantitatives). En effet, selon Ghewy (2010), l’ACP crée
des nouvelles variables à partir des variables initiales ayant certaines caractéristiques :
1
-Le nombre de variables nouvelles (ou synthétiques) est inférieur aux variables initiales et
donc ces nouvelles variables permettent une meilleure lecture du tableau des données.
-Les nouvelles variables sont des combinaisons linéaires. L’analyse génère autant de
composantes que de variables initiales. Chaque composante créée est composée d’une part de
l’information de l’ensemble des variables initiales, mais avec des proportions différentes.
Sachant que :
Ci = a1V1 + a2V2 + a3V3 + … + akVk
Avec : a1, a2, ak = Coefficients de pondération des variables initiales.
V1, V2, Vk = Variables initiales. Ci : Composante i.
-Les nouvelles composantes retenues sont sélectionnées en se basant sur la quantité
d’informations qu’elles résument.
Ainsi, l’analyse en composantes principales permet de réduire l’information en transformant
les variables descriptives (directement observables) en facteurs synthétiques, comme elle
permet de positionner les individus par rapport à ces composantes principales (Védrine, 1991)
en illustrant graphiquement les interrelations. On présente ci-dessous un aperçu sur ce tableau
des données :
Tableau 1 : Exemple illustratif d’un tableau (individus/variables quantitatives) de l’ACP
Variables
Variable 1 Variable 2 … Variable n
Individus
Individu 1
Individu 2
…
Individu m
Ce tableau permet de détecter des similarités et des différences entre les individus d’une part
et entre les variables d’autres part (en identifiant les variables similaires et les variables
différentes).
La relation entre les variables observables est mesurée par le coefficient de corrélation qui
varie entre 0 et 1 (avec 0 : absence de relation entre deux variables directement observables et
1 corrélation parfaite entre ces variables). A partir de l’étude de la relation entre les variables,
on cherche à identifier des variables synthétiques (appelées aussi facteurs ou variables
latentes) en se basant sur l’ensemble des données.
Les individus et les variables peuvent être représentés par un nuage de points
multidimensionnel. L’ACP permet de résumer les données (centrées et réduites), à travers la
simplification du nuage de point des individus en se conformant au maximum au nuage de
points d’origine. Une meilleure représentation graphique des individus consiste à maximiser
2
la dispersion entre les points de ce nuage. L’inertie sera alors une notion importante
permettant de spécifier la qualité du nuage étudié. Ainsi, l’identification des axes (ou facteurs)
se base sur la maximisation de l’inertie. Notons que l’inertie totale est égale à la somme des
valeurs propres ( I = å l a ) et que la contribution de chaque axe principal à l’inertie totale est
a Îa
déterminée par le pourcentage d’inertie ( CTR = l a ).

I
Concernant l’étude de la corrélation entre les variables observables et les facteurs, il s’agit de
trouver le facteur qui maximise la corrélation avec les variables directement observables
moyennant le repérage des axes orthogonaux qui permettent de bien représenter les variables.
Il est à noter que les variables directement observables seront bien projetées sur les axes
lorsqu’elles se rapprochent de la valeur 1.
La qualité de représentation d’une variable se base sur le Cosinus au carré (Cos2) de l’angle
entre une variable et son projeté sur un axe.
La contribution d’une variable à la construction de l’axe est le carré de la corrélation entre la
variable et l'axe, divisé par la somme des carrés des corrélations entre les variables et l’axe.
En conclusion, la représentation des variables et la représentation des individus sur les axes
synthétiques (ou facteurs) est la même. Pour cette raison, la représentation graphique permet
d’étudier aussi bien les individus et les variables.
II. Les objectifs de l’analyse factorielle exploratoire de type ACP

On distingue trois objectifs principaux de l’analyse factorielle exploratoire en composantes
principales (Vedrine, 1991 ; Jolibert et Jourdan, 2006) :
- Identifier un ensemble de dimensions latentes (non directement observables) à partir
d’un ensemble plus grand des variables initiales observables. Il s’agit de trouver une
structure sous-jacente.
- Réduire le nombre de variables en un ensemble plus restreint, destiné à se substituer aux
précédentes et qui pourra être dans d’autres analyses statistiques. L’ACP est utilisée par
exemple pour la construction d’échelles permettant de mesurer les caractéristiques
individuelles de consommateurs ou d’entreprises.
- Positionner les individus par rapport à ces composantes de sorte qu’il sera possible de
mettre en évidence des typologies d’individus ainsi que des variables qui ont amené à la
création de ces types.
3
III. Les étapes de réalisation d’une analyse en composantes principales

L’ACP s’effectue en plusieurs étapes. Stafford et Bodson (2006) proposent une démarche en
huit étapes permettant de pratiquer une ACP. Ces étapes sont :
1. La recherche des variables similaires ; celles-ci doivent faire partie d’un même ensemble :
mesure de la satisfaction, de l’intérêt, etc.
2. La détermination de la matrice des corrélations entre les variables choisies.
3. La diagonalisation de la matrice D1, D2, … Dn.
4. La présentation de la matrice des saturations, qui permet de dégager les facteurs.
5. La rotation, qui désigne les facteurs les plus importants selon leur degré d’inertie (de
variance expliquée).
6. La définition « littéraire » des facteurs.
7. La lecture des tests les plus importants.
8. L’interprétation des résultats au plan des décisions et de l’action.
IV. Les conditions de la pratique d’une analyse en composantes principales

Certaines conditions sont incontournables à la réalisation d’une analyse factorielle
exploratoire et en particulier l’ACP. Ces conditions seront exposées ci-après.
1. La taille nécessaire de l’échantillon

La taille de l’échantillon dépend du nombre d’items soumis à une analyse factorielle (de type
ACP). Il faut un minimum de cinq observations par item (un ratio de 10 pour 1 est préférable).
Le nombre total d’observations doit être d’au moins 50 et il est souhaitable d’interroger au
moins 100 individus.
2. La vérification de la pertinence d’une ACP

Il importe de vérifier à priori la pertinence des résultats d’une ACP avant d’adopter ses
résultats. Pour cette raison, certains indicateurs permettent de s’assurer que les données
aboutissent à une solution factorielle acceptable. Ces données doivent être capables de
constituer un ensemble cohérent pour pouvoir trouver des dimensions communes qui aient un
sens et qui ne soient pas des artefacts statistiques (Evrard et al., 2003). Ainsi, il faut avoir un
nombre suffisant de corrélations en vue de réaliser une ACP. De plus, le test de sphéricité de
Bartlett et l’indice de Kaiser, Meyer et Olkin (KMO) permettent de valider une ACP.
- Le test de sphéricité de Bartlett vérifie la matrice des corrélations dans son
intégralité et fournit la probabilité de l’hypothèse H0 selon laquelle toutes les corrélations sont
nulles. Il permet d’examiner si la matrice de corrélation est statistiquement différente d’une
4
matrice identité (la diagonale de cette matrice est constituée de 1 avec une valeur de 0 de part
et d’autre de la diagonale). Si l’hypothèse nulle est adoptée, alors la matrice de corrélations
dispose d’une structure aléatoire. Au contraire, le rejet de cette hypothèse indique la
possibilité de recourir à une ACP sur la base de la matrice des corrélations.
- L’indice KMO ou MSA (Measure of Sampling Adequacy) indique dans quelle
proportion les variables retenues forment un ensemble cohérent et mesurent de manière
adéquate un concept. Cet indicateur s’appuie sur la moyenne des coefficients de corrélation
situés dans la diagonale de la matrice anti-image. Il permet de vérifier si les corrélations
partielles entre les variables sont faibles. Sa formule se présente comme suit1 :
åår 2
ij
KMO = i ¹1
år +åa
i¹ j
2
ij
i¹ j
2
ij
(Avec rij : Corrélation simple et aij : Corrélation partielle)

L’indice KMO varie entre 0 et 1 et il est interprétable de la manière suivante:
– 0,90 et plus = très grande validité ;
– 0,89 à 0,80 = grande validité ;
– 0,79 à 0,70 = validité moyenne ;
– 0,69 à 0,60 = validité faible ;
– 0,59 à 0,50 = validité au seuil limite ;
– 0,49 et moins = invalide.
L’indice KMO augmente de valeur lorsque2 :
-La taille de l’échantillon est de plus en plus importance.
-Les corrélations inter-items sont élevées.
-Le nombre de variables observables est important.
-Le nombre de facteurs (dimensions) diminue.
3. Le choix du nombre de facteurs

Il n’existe pas de base quantitative exacte pour déterminer le nombre de facteurs à extraire.
Les critères sont souvent choisis sur la part de la variance de chaque item qu’un facteur
permet d’expliquer. On distingue le test de Cattell (appelé Scree Test), le critère de Kaiser et
le pourcentage de variance expliquée (Jolibert et Jourdan, 2006 ; Carricano et Poujol, 2009).
1
Norusis M., (1992), SPSS for Windows Professional Statistics, Chicago, SPSS.
2
Yergeau, E. et Poirier, M. (2013). SPSS à l'UdeS.,
http://spss.espaceweb.usherbrooke.ca/pages/interdependance/analyse-en-composantes-principales.php.
5
- Le critère du pourcentage de variance expliquée : Cette méthode consiste à examiner le

rapport 100/n, où n est le nombre de variables, et à ne retenir que les facteurs qui ont un
pourcentage de variance expliquée supérieur à ce rapport.
- Le Scree Test ou test du coude ou de l’éboulis (Test de Cattell) : Ce test se fonde sur les
valeurs propres des facteurs mais dans une perspective relative et non absolue. Étant donné
que chaque facteur est extrait d’une matrice qui représente le résidu de l’extraction
précédente, la quantité d’informations contenue dans les facteurs successifs décroît. Lorsque
la décroissance en termes d’informations devient faible ou nulle entre deux facteurs, on peut
estimer que le dernier facteur ne contient pas suffisamment d’informations pour être retenu.
Exemple de Scree Test :
Figure 2: Test de Cattell appliqué à l’exemple des opinions des consommateurs à l’égard
des courses en magasin (graphique des valeurs propres)
Source : Jolibert et Jourdan (2006), page 306.
- Le critère de Kaiser, l’«eigenvalue», ou règle des valeurs propres > 1: Une valeur propre
représente la quantité d’informations capturée par un facteur. Un facteur qui aurait une valeur
propre inférieure à 1 représenterait moins d’informations qu’un simple item.
4. La sélection de la méthode de rotation

La rotation assure une meilleure représentation graphique des résultats sur les axes factoriels,
comme elle facilite l’interprétation des facteurs. En effet, la rotation permet d’identifier des
6
groupes de variables fortement liées les unes aux autres. La rotation fait en sorte que chaque
variable observable ne soit fortement liée qu’à un seul facteur.
Il existe plusieurs méthodes de rotation parmi lesquelles on distingue :
• Varimax : C’est une rotation orthogonale qui minimise le nombre de variables ayant de
fortes corrélations sur chaque facteur. Elle simplifie l’interprétation des facteurs.
• Oblimin direct : Il s’agit d’une rotation oblique, c’est-à-dire dans laquelle les axes se
positionnent en fonction des items et ne sont donc pas orthogonaux.
• Quartimax : Cette méthode minimise le nombre des facteurs requis pour expliquer chaque
variable. Elle simplifie l’interprétation des variables observées.
• Equamax : C’est une méthode de rotation qui minimise à la fois le nombre de variables qui
pèsent fortement sur un facteur et le nombre de facteurs requis pour expliquer une variable
(combinaison des méthodes Varimax et Quartimax).
NB : Lorsque les axes constituent un angle de 90 degrés, on parle de rotation orthogonale.
V. Exemple illustratif des résultats interprétés d’une analyse factorielle

exploratoire
Le paragraphe suivant consiste à partir d’un exemple illustratif afin de présenter la procédure
de la mise en œuvre d’une ACP et d’expliquer ses résultats.
1. Présentation de l’exemple de l’ACP et procédure de mise en œuvre sur les

logiciels
Dans le cadre d’une enquête en ligne, on a demandé à un échantillon de 20 répondants
d’exprimer leur perception envers la qualité d’un robot multifonctions. Chacun a été soumis à
une batterie de six items (indicateurs de mesures) afin d’attribuer une note allant de 1 à 5
(avec 1 : pas du tout d’accord et 5 : tout à fait d’accord). Le recours à une ACP permet de
regrouper les items qui ont fondamentalement la même signification et donc de repérer les
composantes fondamentales en se basant sur les variables directement observables. Le
positionnement des répondants (les individus) par rapport aux composantes principales
permettra la segmentation de la population en termes d’indicateurs de qualité perçue envers
les robots multifonctions. Le tableau des données se présente comme suit :
7
Tableau 3 : Présentation des données de l’enquête

Q01 Q02 Q03 Q04 Q05 Q06
4 4 3 3 4 3
5 5 4 3 2 4
5 5 5 5 5 5
3 1 3 2 3 3
4 2 4 4 2 4
4 5 4 5 4 2
2 4 2 2 5 1
4 4 4 3 5 1
5 4 3 3 2 4
3 2 3 4 2 4
4 1 3 3 2 2
4 4 3 3 4 1
4 4 4 4 1 4
4 4 4 4 4 2
4 4 3 2 5 1
3 5 3 3 3 3
4 2 2 2 2 4
4 3 3 3 4 2
3 2 3 3 2 3
3 3 2 2 3 5
Les indicateurs de mesures concernant la qualité perçue se présentent comme suit :

Q01 : Design
Q02 : Economie d'énergie
Q03 : Puissance
Q04 : Accessoires fournis
Q05 : Entretien et réparation
Q06 : Réclamations
Par ailleurs, les logiciels de traitement des données permettent de faciliter la procédure de
réalisation d’une ACP. Le cours suivant présente la procédure sur le logiciel SPSS.
La démarche est indiquée au niveau de l’annexe 1 de ce chapitre.
2. Présentation et explication des résultats de l’ACP

Les premiers résultats générés de l’ACP sont la moyenne (paramètre de position) et l’écart-
type (paramètre de dispersion). Ils se présentent comme suit :
8
Tableau 4 : Statistiques descriptives
Moyenne Ecart-type n analyse
Design 3,8000 ,76777 20

Economie d'énergie 3,4000 1,31389 20
Puissance 3,2500 ,78640 20
Accessoires fournis 3,1500 ,93330 20
Entretien et réparation 3,2000 1,28145 20
Réclamations 2,9000 1,33377 20
Selon Desbois (1998), les expressions de la moyenne et de l’écart-type se présentent comme

suit :
La moyenne : x = åm
iÎI
i ´ xi
L’écart type : s x = åm
iÎI
i ´ ( xi - x ) 2
La matrice de corrélation donne un aperçu sur la relation entre les différents indicateurs de
mesures de la qualité perçue utilisés dans l’étude. « Dans l'ACP normée (i.e. sur données
centrées réduites), la matrice des corrélations constitue l'opérateur d'inertie qui sera
diagonalisé (i.e. extraction des valeurs propres) » (Desbois, 1998).
a
Tableau 5 : Matrice de corrélation
Economie Accessoires Entretien et

Design d'energie Puissance fournis réparation Réclamations
Corrélation Design 1,000 ,344 ,610 ,411 -,064 ,236
Economie d'énergie ,344 1,000 ,408 ,335 ,450 -,096
Puissance ,610 ,408 1,000 ,807 ,104 ,125
Accessoires fournis ,411 ,335 ,807 1,000 -,026 ,224
Entretien et
-,064 ,450 ,104 -,026 1,000 -,573
réparation
Réclamations ,236 -,096 ,125 ,224 -,573 1,000

a. Déterminant = ,072
L’indice KMO (Kaiser-Meyer-Olkin) est l’un des indicateurs qui permet de s’assurer de la
pertinence des résultats de l’ACP. Il est valide lorsqu’il est supérieur ou égal à 0,5. Dans cet
exemple, l’indice KMO est de 0,576 et donc il permet d’aboutir à une solution factorielle
acceptable (bien que sa valeur est au seuil limite). Le test de sphéricité de Bartlett contribue à
son tour à la validation des résultats de l’ACP. Dans ce cas, ce test est significatif au risque de
5% et montre que la matrice de corrélation diffère de la matrice identité.
9
Tableau 6 : Indice KMO et test de Bartlett
Mesure de précision de l'échantillonnage de Kaiser-Meyer- ,576

Olkin.
Test de sphéricité de Khi-deux approximé 42,513
Bartlett ddl 15
Signification de Bartlett ,000
Le tableau 7 présente la qualité de représentation des indicateurs de la qualité perçue sur les
deux facteurs principaux retenus par l’ACP. Le total des extractions reflète, dans notre cas,
l’inertie des deux premières composantes. Un indicateur est retenu (et non purifié de
l’analyse) lorsque la valeur de l’extraction est supérieure ou égale à 0,5. D’après cet exemple,
tous les indicateurs de la qualité perçue disposent d’une bonne qualité de représentation.
Tableau 7 : Qualité de représentation
Initial Extraction
Design 1,000 ,589

Economie d'énergie 1,000 ,625
Puissance 1,000 ,845
Accessoires fournis 1,000 ,722
Entretien et réparation 1,000 ,835
Réclamations 1,000 ,713
Méthode d'extraction : Analyse en composantes

principales.
Le tableau 8 indique la contribution de chaque axe principal à l’inertie totale. Selon le critère
de Kaiser, les deux premiers axes sont retenus étant donné que la valeur propre de chacun des
axes est supérieure à 1. Le pourcentage cumulé de l’inertie indique que les facteurs retenus
restituent 72,141% de l’information totale.
Tableau 8 : Variance totale expliquée
Composante Extraction Sommes des carrés des Somme des carrés des facteurs
Valeurs propres initiales facteurs retenus retenus pour la rotation
% de la % % de la % de la %
Total variance cumulés Total variance % cumulés Total variance cumulés
1 2,550 42,495 42,495 2,550 42,495 42,495 2,548 42,472 42,472
2 1,779 29,647 72,141 1,779 29,647 72,141 1,780 29,670 72,141
dimen 3 ,663 11,055 83,197
sion0 4 ,558 9,299 92,496
5 ,313 5,217 97,713
6 ,137 2,287 100,000
Méthode d'extraction : Analyse en composantes principales.
10
Le graphique des valeurs propres (Scree Test) permet également de choisir le nombre d’axes à
adopter dans l’analyse. D’après ce graphique, il est pertinent de choisir uniquement les deux
premiers axes.
Figure 2 : Graphique des valeurs propres
Les coordonnées factorielles des variables du tableau sont indiquées par la matrice des
composantes (matrice de corrélations entre les variables et les facteurs 1 et 2). Il est alors
possible d’identifier de quelles variables observables se compose un facteur. Pour une
meilleure illustration des résultats, la matrice des composantes après rotation Varimax donne
des résultats plus pertinents en matière d’affectation des indicateurs aux axes.
a
Tableau 9 : Matrice des composantes Tableau 10 : Matrice des composantes après rotationa
Composante Composante
1 2 1 2
Design ,751 -,157 Design ,757 -,125

Economie d'énergie ,607 ,507 Economie d'énergie ,585 ,532
Puissance ,919 ,007 Puissance ,918 ,046
Accessoires fournis ,841 -,122 Accessoires fournis ,845 -,087
Entretien et réparation ,106 ,908 Entretien et réparation ,068 ,911
Réclamations ,234 -,812 Réclamations ,268 -,801
Méthode d'extraction : Analyse en composantes Méthode d'extraction : Analyse en composantes
principales. principales.
a. 2 composantes extraites. Méthode de rotation : Varimax avec normalisation
de Kaiser.
a. La rotation a convergé en 3 itérations.
11
D’après le tableau 10, il est évident que la puissance, les accessoires fournis ainsi que le
design du robot multifonctions contribuent à la constitution de l’axe 1. Ce facteur exprime la
qualité de produit. Alors que l’axe 2 est représenté par les variables observables entretien et
réparation ainsi que les réclamations. Ce facteur exprime la qualité des services. Bien que la
rétention d’un indicateur nécessite une valeur supérieure ou égale à 0,5 on remarque que la
variable économie d’énergie est présente dans les deux axes en même temps avec une valeur
supérieure à 0,5. Dans cette condition, il serait pertinent d’éliminer cet indicateur de l’analyse.
La figure 3 présente le diagramme de composantes dans un espace bidimensionnel après une
rotation Varimax.
Figure 3 : Diagramme des composantes dans l’espace après rotation
Le diagramme montre bien que les variables de la qualité Q01 (Design), Q03 (Puissance) et
Q04 (Accessoires fournis) représentent bien la composante 1 qui exprime la qualité perçue du
produit sachant que Q3 et Q4 sont les plus représentés sur cet axe (très proches de 1). De plus,
l’évaluation de la qualité du robot multifonctions sur la base de ces critères évolue dans le
même sens par les répondants. Par contre, l’axe 2 qui exprime la qualité perçue des services
oppose Q05 (Entretien et réparation) de Q06 (Réclamations). C'est-à-dire que les individus
12
qui ont une perception favorable de la qualité de l’entretien et réparation sont ceux qui ont une
mauvaise perception de la qualité des réclamations (et vice versa).
Finalement, le tableau 11 se rapporte aux résultats des individus. Selon Desbois (1998), la
matrice des vecteurs propres (coordonnées des vecteurs propres dans la base des variables
d'origine) peut être obtenue en se basant sur la matrice des coefficients factoriels.
Tableau 11 : Matrice des coefficients des
coordonnées des composantes
Composante
1 2
Design ,298 -,075

Economie d'énergie ,226 ,295
Puissance ,360 ,019
Accessoires fournis ,332 -,055
Entretien et réparation ,020 ,512
Réclamations ,111 -,452
Méthode d'extraction : Analyse en composantes
principales.
Méthode de rotation : Varimax avec normalisation de
Kaiser.
Scores composante.
Le calcul basé sur des données centrées et réduites de la base (tableau 3), et pondérées par les
données de la matrice des coefficients des coordonnées des composantes, donnera les valeurs
de Fact_1 et Fact_2 qui seront présentées dans la base de données SPSS.
Conclusion
Le présent chapitre a permis de montrer l’importance de l’ACP dans la transformation des
données brutes en développant des facteurs synthétiques. En revanche, il importe de noter
aussi que l’ACP peut être un point de départ vers d’autres analyses ultérieures. Par exemple,
les coordonnées factorielles issues des ACP peuvent servir afin de réaliser des régressions
linéaires. De plus, l’ACP s’intègre dans le cadre des AFE (Analyses factorielles exploratoires)
et permet de purifier les données afin de réaliser à postériori des analyses confirmatoires. Il
est à noter que dans certaines conditions pratiques, des tests de fiabilité peuvent être utilisés
afin de s’assurer de la cohérence des indicateurs de mesures (les variables directement
observables) qui constituent les facteurs générés par une ACP.
13
Bibliographie
Carricano, M., Poujol, F., (2009), Analyse de données avec SPSS, Pearson Education, France.
Desbois D., (1998), « Une introduction à l'Analyse en Composantes Principales avec SPSS
pour Windows », Modulad, N°20, pp 57-74.
Evrard Y., Pras B., Roux E., (2003), Market Etudes et recherches en Marketing, 3ème édition,
DUNOD, PARIS.
Ghewy P., (2010), Guide pratique de l’analyse de données avec applications sous IBM SPSS
Statistics et EXCEL. Questionnez, analysez… et décidez !, De Boeck, Belgique.
Jolibert A., Jourdan P., (2006), Marketing Research : Méthodes de recherche et études en
marketing, Dunod, Paris.
Martin O., (2009), L’enquête et ses méthodes : L’analyse de données quantitatives, 2ème
édition, Armand Colin, Paris.
McDonald R.P., (1999), Test theory: A unified treatment, Mahwah, Laurence Erlbaum.
Norusis M., (1992), SPSS for Windows Professional Statistics, Chicago, SPSS.
Stafford J., Bodson P., (2006), L’analyse multivariée avec SPSS, Presses de l’Université du
Québec, Canada.
Vedrine, J-P., (1991), Le traitement des données en marketing, Editions d’Organisation,

France.
Yergeau, E. et Poirier, M. (2013). SPSS à l'UdeS.,

http://spss.espaceweb.usherbrooke.ca/pages/interdependance/analyse-en-composantes-
principales.php.
14
Annexe 1 : Procédure de réalisation des ACP sur SPSS
15

Chapitre 3 Analyse en Composantes Principales - ACP

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 3 Analyse en Composantes Principales - ACP

Transféré par

Droits d'auteur :

Formats disponibles

Cours : Analyse des données 2ème LNSG

Chapitre 3 : Analyse en composantes principales (ACP)

I. Le principe de l’analyse en composantes principales

Source : Martin, (2009), page 106.

déterminée par le pourcentage d’inertie ( CTR = l a ).

II. Les objectifs de l’analyse factorielle exploratoire de type ACP

III. Les étapes de réalisation d’une analyse en composantes principales

IV. Les conditions de la pratique d’une analyse en composantes principales

1. La taille nécessaire de l’échantillon

2. La vérification de la pertinence d’une ACP

(Avec rij : Corrélation simple et aij : Corrélation partielle)

3. Le choix du nombre de facteurs

- Le critère du pourcentage de variance expliquée : Cette méthode consiste à examiner le

Source : Jolibert et Jourdan (2006), page 306.

4. La sélection de la méthode de rotation

V. Exemple illustratif des résultats interprétés d’une analyse factorielle

1. Présentation de l’exemple de l’ACP et procédure de mise en œuvre sur les

Tableau 3 : Présentation des données de l’enquête

Les indicateurs de mesures concernant la qualité perçue se présentent comme suit :

2. Présentation et explication des résultats de l’ACP

Tableau 4 : Statistiques descriptives

Moyenne Ecart-type n analyse

Design 3,8000 ,76777 20

Selon Desbois (1998), les expressions de la moyenne et de l’écart-type se présentent comme

Economie Accessoires Entretien et

Corrélation Design 1,000 ,344 ,610 ,411 -,064 ,236

Economie d'énergie ,344 1,000 ,408 ,335 ,450 -,096

Puissance ,610 ,408 1,000 ,807 ,104 ,125

Accessoires fournis ,411 ,335 ,807 1,000 -,026 ,224

Réclamations ,236 -,096 ,125 ,224 -,573 1,000

Tableau 6 : Indice KMO et test de Bartlett

Mesure de précision de l'échantillonnage de Kaiser-Meyer- ,576

Signification de Bartlett ,000

Tableau 7 : Qualité de représentation

Design 1,000 ,589

Méthode d'extraction : Analyse en composantes

Total variance cumulés Total variance % cumulés Total variance cumulés

1 2,550 42,495 42,495 2,550 42,495 42,495 2,548 42,472 42,472

2 1,779 29,647 72,141 1,779 29,647 72,141 1,780 29,670 72,141

dimen 3 ,663 11,055 83,197

sion0 4 ,558 9,299 92,496

5 ,313 5,217 97,713

6 ,137 2,287 100,000

Méthode d'extraction : Analyse en composantes principales.

Design ,751 -,157 Design ,757 -,125

Figure 3 : Diagramme des composantes dans l’espace après rotation

Design ,298 -,075

Vedrine, J-P., (1991), Le traitement des données en marketing, Editions d’Organisation,

Yergeau, E. et Poirier, M. (2013). SPSS à l'UdeS.,

Annexe 1 : Procédure de réalisation des ACP sur SPSS

Vous aimerez peut-être aussi