Vous êtes sur la page 1sur 45

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


7.2. ACP
7.3. AFC
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

1
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Principe et historique :
Lanalyse factorielle est une mthode descriptive (par opposition aux
mthodes explicatives que nous avons vu auparavant). Il ny a plus de
variables explicatives et expliquer. On tudie lensemble des
corrlations entre variables quantitatives pour lACP et qualitatives
pour lAFC.
Historiquement, il sagit de lun des + anciennes mthodes danalyse des
donnes (Spearman, dbut 20me). Mais les applications informatiques
ont considrablement modifi les conditions et modalits dapplication,
en rendant notamment possible le traitement dun trs grand nombre de
donnes. Cest enfin la mthode la plus connue et la plus utilise en
2
sciences sociales.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Exemples dutilisation marketing de lanalyse factorielle :
Dans la segmentation de march, pour identifier les variables
fondamentales partir desquelles seront forms des groupes de clients.
Par exemple, les acheteurs de voitures neuves seront ainsi regroups en 5
segments selon leur sensibilit au prix, la commodit, la performance,
au confort et au luxe.
En recherche produit, pour dterminer les caractristiques d1 marque
qui influencent le choix des consommateurs. Les marques de dentifrice
peuvent par exemple tre values selon des critres de protection contre
les caries, la blancheur des dents, de got, de rafrachissement dhaleine
ou de prix.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

3
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Lors dtudes publicitaires, pour comprendre dans le march cible les
habitudes du consommateur moyen. Ceux qui achtent des plats surgels
peuvent aussi tre de grands amateurs de tlvision par cble, regarder
beaucoup la tlvision, etc.
Lors dtudes de prix, pour identifier les caractristiques de sensibilit
au prix des consommateurs, ces derniers pouvant tre ordonns ,
conomes ou tourns vers le foyer .

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

4
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Objectifs et conditions dutilisation :
Lobjectif principal est la structuration des variables, cest--dire la
rduction des colonnes de la matrices des donnes : on veut rsumer
linformation.
Pour ce faire, on remplace les variables initiales par un nombre plus
restreint de variables dites composites (ou facteurs ), obtenues par
regroupement des variables initiales les plus corrles entre elles.
Cela ncessite :
1. Un nombre dindividu suprieur 15
2. Quil y ait plus dindividus que de variables
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

5
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Exemple : on mesure 40 variables dattitudes sur 800 mnagres. Faut-il
vraiment garder les 32 000 valeurs de la BDD ou ne peut-on pas
rsumer cette information par 1, 2 ou 3 variables de synthse ? Ny-a-t-il
pas redondances entre certaines variables initiales ? Ne peut-on pas en
liminer certaines qui napportent qu1 information marginale et peu
intressante ?
Avoir moins de variables permet de faciliter linterprtation et
pouvoir dgager des implications managriales concrtes.
Lanalyse factorielle peut aussi servir de phase intermdiaire de
calcul avant dutiliser dautres mthodes.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

6
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Une autre utilisation frquente de lanalyse factorielle concerne la
dmarche psychomtrique de mesure de concepts non observables.
Par exemple, si lon souhaite dvelopper, ou mme reprendre une chelle
de mesure dattitude ou une chelle mesurant un trait de personnalit en
particulier, il est en toute rigueur ncessaire de sassurer de la validit et
de la fiabilit de cet instrument. On ralise pour cela une analyse
factorielle.
Sil sagit dune chelle de mesure que lon a cre, on mnera une
analyse factorielle exploratoire , sil sagit dune chelle de mesure
que lon reprend de la littrature (qui a dj fait lobjet de validations
antrieures), on mnera une analyse factorielle confirmatoire .
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

7
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Exemple danalyse factorielle exploratoire : limage dun magasin a t
value par un chantillon dindividus partir dune srie ditems sur
une chelle smantique. On va analyser et regrouper ces items pour faire
ressortir les facteurs fondamentaux.

Exemple danalyse factorielle confirmatoire : sassurer des bonnes


qualits de lchelle dattitude en 4 items que lon a repris de la
littrature.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

8
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Approche R et Q de lACP :
Lorsque lon part dune matrice de donnes (individus/variables), 2
types danalyse factorielle peuvent tre mens :
lapproche R (celle que nous allons traiter) : les facteurs sont des
combinaisons linaires de variables initiales
lapproche Q (rare) : les facteurs sont des combinaisons linaires
dindividus. Cela permet de regrouper les individus qui ont des rponses
analogues sur les variables sur lesquelles portent lanalyse.
Dans les 2 cas, les techniques de calcul sont identiques.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

9
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Types de variables de lACP :
LACP consiste regrouper des variables quantitatives (ge en annes,
salaire en euros, etc. ou en marketing, chelles de proportion ou
dintervalle). Ces variables sont :
Au moins centres : dans ce cas lanalyse factorielle repose sur la
matrice des variances-covariances on accordera alors beaucoup
dimportance aux variables les plus disperses
Ou centres-rduites : dans ce cas lanalyse factorielle repose sur la
matrice des corrlations r entre variables
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

10
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Dans le cas particulier de variables toutes mesures sur des chelles
mme nombre dchelon, les donnes sont utilises telles quelles .
Lanalyse factorielle reposera alors sur la matrice des corrlations,
comme si les donnes taient centres-rduites.
Remarque :
En marketing, on ralise beaucoup dACP avec des BDD mesurant des
scores. Pour ces chelles (dintervalle ou de ratio), seules des variables
mesures sur un mme nombre dchellons peuvent tre analyses
simultanment, sinon, il faut au pralable centrer et rduire les donnes.
Dans tous les cas, avec lACP, les donnes sont au moins centres.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

11
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Les variables sont-elles factorisables ?
Avant de raliser une analyse factorielle, il faut sinterroger sur sa
pertinence, dun point de vue thorique bien sr, mais ensuite dun point
de vue statistique. Statistiquement, on peut, de manire assez peu
formelle, vrifier laide de la matrice des corrlations que les
coefficients sont assez levs dans lensemble. On peut galement mener
une dmarche plus rigoureuse, laide de 2 tests, disponibles sous SPSS
le test de sphricit de Barlett.
le test MSA (Measure of Sampling Adequacy - appel aussi test de
Kaiser, Meyer et Olkin) qui peut tre effectu pour chaque variable ou
directement pour lensemble.
12
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Lanalyse en composante principale (ACP) consiste
rsumer linformation contenue dans un tableau 2 entres,
gnralement les individus en lignes et les variables
(quantitatives) en colonnes, en remplaant les variables
initiales par 1 plus petit nombre de nouvelles variables.
Lanalyse factorielle des correspondances (AFC) est une
gnralisation de lA.C.P. adapte au traitement de donnes
qualitatives qui se prsentent sous la forme dun tableau de
contingence (dont on peut sommer les effectifs en lignes et en
colonne). Elle permet de visualiser les relations pouvant exister
entre les modalits de 2 caractres (par exemple, la couleur des
yeux et des cheveux).
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

13
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Prsentation des BDD utilises, pour lACP : en ligne, les individus et
en colonne, les variables
A chaque case du tableau correspond
le score d1 individu sur 1 variable.
Variables
1

In d iv id u s o u o b je ts

1
2
3

xij
Score
individu i
sur var. j

n
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

14
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


Prsentation des BDD utilises, pour lAFC :
Soient X et Y deux variables qualitatives ayant respectivement xn et ym
modalits. Exemple : X : boissons consommes et Y : rgion dhabitation
Le tableau de contingence K form partir de ces deux variables aura
autant :
de lignes que la variable X a de modalits (n) (exemple : coca, jus de
fruit, bire, vin, whisky, etc)
et autant de colonnes que la variable Y a de modalits (m) (exemple :
Ile-de-France, Bretagne, etc.).
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

15
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.1. Principe et conditions dapplication


y1

x1

K x
i
( n ,m )

xn

ym

ki , j

X possde
n modalits
(types de boissons)
M2 Marketing

yj

Y possde
m modalits
(les rgions)

Nombre
dindividus
qui consomment la
boisson xi et qui
habitent la rgion yi.

Les individus napparraissent quau


travers de leurs effectifs. Chaque chiffre
correspond 1 individu.

Universit Paris 1 Panthon-Sorbonne

16
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Pour simplifier la dmarche, nous pouvons la dcomposer en 4 tapes
(aprs avoir supprim de lanalyse les ventuelles donnes aberrantes) :
1. Formulation du problme
2. Vrification des corrlations
3. Dtermination du nombre daxes retenir
4. Interprtation des axes factoriels

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

17
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Etape 1 : Formuler le problme
Il sagit de dterminer les objectifs de lanalyse factorielle qui va tre
mene. Les variables considres pour lanalyse doivent tre choisies sur
la base de recherches pralables (tre justifies, que ce soit par la
littrature ou par une phase qualitative par exemple). On utilise des
donnes quantitatives brutes ou des chelles dintervalles ou de ratio
(ayant mme nombre dchelons ou tant standardises). Le nombre
dindividus est gnralement 4 5 fois + grand que le nombre de
variables. Si lchantillon est petit, ce rapport est + faible et les rsultats
doivent tre interprts avec prudence.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

18
Cours de M. Eric

Exemple : BDD SPSS caractristiques des dentifrices


Il sagit d1 tude qui porte sur les avantages fondamentaux recherchs
par les consommateurs lors de lacaht dun dentifrice. Le sondage est
ralis dans 1 centre commercial auprs d1 chantillon de 30 personnes,
qui ont donn leur avis sur les affirmations suivantes, sur 1 chelle de 1
(en total dsaccord) 7 (entirement daccord) mme nombre
dchelons
V1 : Il est important dutiliser 1 dentifrice qui prvient la formation des
caries.
V2 : Un dentifrice doit rendre les dents brillantes.
V3 : Un dentifrice doit renforcer les gencives.
V4 : Un dentifrice doit raffrachir lhaleine.
V5 : La prvention des caries nest pas un avantage important du
dentifrice (sic).
19

V6 : Un dentifrice doit avant tout donner de belles dents

Chapitre 7 : Analyse factorielle

7.2. ACP
Etape 2 : Vrification des corrlations
Le processus de lACP repose sur une matrice des corrlations (ou des
covariances, selon que les donnes sont rduites ou non). Pour que
lanalyse soit pertinente, il est ncessaire que les variables soient
corrles. Des variables qui sont fortement corrles avec le(s) mme(s)
facteur(s) sont supposes tre galement fortement corrles entre elles.
Une premire mthode consiste examiner la matrice des corrlations.
Analyse Factorisation Analyse factorielle
Puis menu caractristiques cliquez sur matrice des corrlations
coefficients
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

20
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Matrice de corrlation

Corrlation

caries
brillance
gencives
haleine
prvention caries
belles dents

caries
1,000
-,053
,873
-,086
-,858
,004

brillance
-,053
1,000
-,155
,572
,020
,640

gencives
,873
-,155
1,000
-,248
-,778
-,018

haleine
-,086
,572
-,248
1,000
-,007
,640

prvention
caries
-,858
,020
-,778
-,007
1,000
-,136

belles dents
,004
,640
-,018
,640
-,136
1,000

De nombreux coefficients de corrlation (r) sont assez forts (>0,4 en v.a.)


ce qui laisse supposer que lanalyse est pertinente.
Les corrlations entre V1, V2, V3 et V5 sont relativement fortes : on
peut sattendre ce que ces variables soient corrles aux mmes
groupes de facteurs. Il en est de mme pour V2, V4 et V6.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

21
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Pour tre + rigoureux, il est utile de raliser un test de sphricit de
Barlett et une mesure de lindice dadquation de Kaiser-Meyer-Olkin.
Dans le mme menu caractristiques cliquez sur matrice des
corrlations indice KMO et test de Barlett
Indice KMO et test de Bartlett
Mesure de prcision de l'chantillonnage de
Kaiser-Meyer-Olkin.
Test de sphricit de
Bartlett

M2 Marketing

Khi-deux approch
ddl
Signification

Universit Paris 1 Panthon-Sorbonne

,660
111,314
15
,000
22
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Le test de sphricit de Barlett teste lhypothse nulle H0 selon laquelle
les variables ne sont pas corrles dans la population ( est-il possible
de mener 1 ACP ?). Dans une matrice identit, tous les termes de la
diagonales sont gaux 1, et tous les autres 0. CE test sappuie sur 1
transformation du khi-2 du dterminant de la matrice des corrlations.
Une valeur leve au vu du nombre de ddl (ou plus simplement 1
probabilits associe faible c-a-d < 5%) permet de rejeter H0.
Dans le tableau prcdent, la valeur du khi-2 est de 111,314 pour 15
ddl, soit une probabilit derreur de 0,000 H0 est rejete, il est
pertinent de poursuivre lanalyse.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

23
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Le test de Kaiser-Meyer-Olkin (KMO) compare les grandeurs des
coefficients de corrlation observs aux grandeurs des coefficients de
corrlation partielle. De petites valeurs de cet indice indiquent que les
corrlations entre paires de variables ne peuvent pas tre expliques par
dautres variables et que lanalyse factorielle peut ne pas tre pertinente
( est-il intressant de mener 1 ACP ?).
On estime gnralement quune valeur > 0,5 est satisfaisante. La
valeur du test KMO que nous avons obtenue est de 0,660, ce qui est
suffisament lev. Lanalyse factorielle apparat donc bien
approprie pour lanalyse de la matrice des corrlations (mme
nombre dchelons pour chaque chelle).
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

24
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Etape 3 : Dtermination du nombre daxes retenir
Il est possible de calculer autant de composantes principales (ou axes
ou facteurs ) quil y a de variables, mais dans ce cas nous
naboutirions aucune synthse de linformation. Rappel : le but est
rsumer linformation. Un petit nombre de facteurs doit donc tre
extrait. + on retient daxes, plus la variance restitue est importante, mais
moins lanalyse est synthtique et donc dlicate interprte. En outre,
le premier facteur est celui qui restitue le maximum de la variance totale
des variables originales (ce qui fonde la diffrence entre les individus).
Le deuxime facteur est celui qui restitue le maximum de variance
restante, etc. Rapidement, lajout dun axe supplmentaire prsente un
intrt limit en terme dapport dinformation.
25
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Rotation des axes factoriels (1/3) :


Avant de poursuivre la dmarche de dtermination du nombre optimal
daxes retenir (et lancer lanalyse), prcisons quil est prfrable de
raliser une rotation des axes factoriels. Cette rotation naffecte ni les
communalits, ni le pourcentage de la variance totale explique, mais
modifie le % de variance correspondant chaque facteur (et donc les
valeurs propres).
Le tableau des corrlations entre variables et facteurs (la matrice
factorielle ou matrice des composantes) est au cur de lanalyse
factorielle. Il prsente des coefficients qui expriment les variables
centres standardises en fonction des facteurs. Ces coefficients (ou
poids factoriels ou loadings) reprsentent les corrlations existantes entre
les facteurs et les variables. Un coefficient lev (en v.a.) indique que le
facteur et la variable sont troitement corrls, ou encore que la variable
apporte beaucoup de sens au facteur. Or, cette matrice factorielle, sans
rotation, permet rarement daboutir des facteurs pouvant tre
26
interprts, puisquils son corrls avec plusieurs variables.

Rotation des axes factoriels (2/3) :


Matrice des composantesa

caries
brillance
gencives
haleine
prvention caries
belles dents

Composante
1
2
,928
,253
-,301
,795
,936
,131
-,342
,789
-,869
-,351
-,177
,871

Par exemple, si lon retient 2


facteurs, il ressort que le
facteur 1 est corrl avec 5
variables (v.a. > 0,3) et le
facteur 2 avec 4. Il serait trs
difficile avec 1 telle matrice
dinterprter les rsultats

Mthode d'extraction : Analyse en composantes principales.


a. 2 composantes extraites.

La rotation permet de transformer la matrice factorielle en une matrice +


simple et + facile interprter. Lobjectif est que les facteurs aient 1
coefficient non nul ou significatif pour quelques variables. Dans le mme
temps, on voudrait que chaque variable ait une corrlation non nulle ou
significative avec seulement quelques facteurs (1 seul si possible). La
rotation maximise les saturations les plus fortes et minimise les plus
faibles. 2 grans types sont utiliss en sciences sociales :
27

Rotation des axes factoriels (3/3) :


- La rotation orthogonale (dont les plus frquemment employes sont
VARIMAX et QUARTIMAX ) est utilise lorsque lon pense dterminer
des facteurs indpendants les uns des autres. Cette solution est prfrable
car elle indique que chaque facteur apporte une information unique, non
partage par un autre facteur. Cependant, cette solution est rarement
possible en Sciences Sociales, car il existe gnralement des liens
conceptuels entre les facteurs.
-La rotation oblique (OBLIMIN) permet une corrlation entre les
facteurs. Comme elle correspond mieux la ralit, cest elle qui est
gnralement utilise en Sciences Sociales. Cest aussi celle que nous
avons retenue pour notre exemple.
Sous SPSS, menu rotation choisir Oblimin directe, avec delta = 0

28

Chapitre 7 : Analyse factorielle

7.2. ACP
Pour savoir combien daxes retenir, plusieurs mthodes existent et sont
complmentaires :
La dtermination a priori : il arrive que le charg dtude sache
lavance combien daxes retenir, sil sagit par exemple dune tude trs
classique .
Dans ce cas l, sous SPSS, dans le menu extraction , on peut spcifier
directement le nombre daxes retenir.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

29
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Lexamen des valeurs propres : si le nuage de points initial navait
pratiquement aucune direction privilgie, la variance restitue par le
premier facteur serait denviron 100/p (o p est le nombre initial de
variables). Pour conserver un facteur, il faut que la variance quil restitue
soit nettement suprieure cette restitution au hasard . Le seuil
communment admis pour retenir un facteur est de deux fois la quantit
100/p. Le point de dpart de lanalyse tant la matrice des corrlations,
les facteurs retenus sont ceux dont les valeurs propres sont suprieures
1. Cette rgle de dcision est galement appele rgle de Kaiser .
Cependant, cette mthode nest pas satisfaisante lorsque le nombre de
variables est infrieur 20 (comme ici). La valeur 1 est plus un seuil
en dessous duquel il ne faut pas descendre, mais qui ne signifie pas
quune fois franchit laxe ne doit ncessairement tre retenu.
30
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Variance explique totale

Composante
1
2
3
4
5
6

Valeurs propres initiales


% de la
Total
variance == % cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Sommes des carrs charges


% de la
Total
variance == % cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508

Mthode d'extraction : Analyse des principaux composants.


a. Lorsque les composantes sont corrles, les sommes des carrs chargs ne peuvent pas tre
additionns pour obtenir une variance totale.

Dans notre exemple, si lon retient les valeurs propres > 1, alors nous
devons retenir 2 axes factoriels.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

31
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Lexamen de la courbe des valeurs propres : la variance restitue par
chaque facteur va en diminuant. Cette rgle de dcision consiste
chercher le premier facteur dont llimination consiste une perte
dinformation minimum. Lexamen de la courbe des valeurs propres
(fournie par SPSS) conduit la recherche dun point dinflexion et
llimination des facteurs situs aprs ce point. Il est dmontr de faon
exprimentale que le point o commence le changement de concavit est
rvlateur du nombre de facteurs.
Cette mthode peut aboutir retenir + de facteurs quavec la mthode
des valeurs propres.
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

32
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Graphique des valeurs propres
3,0

2,5

Le test de coude montre un net


dcrochement partir de 3
facteurs. Il inciterait donc
retenir 3 axes factoriels.

2,0

Valeur propre

1,5

1,0

,5
0,0
1

Numro de composant

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

33
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Le minimum de variance totale restitue : le chercheur fixe lavance
un seuil de variance quil veut restituer. Il retient ensuite le nombre
daxes ncessaires pour atteindre ce seuil. Si, dans les sciences dures
un seuil de 95 % est fix, un seuil de 60 % est gnralement accept en
marketing et plus largement en sciences sociales.
Variance explique totale

Composante
1
2
3
4
5
6

Valeurs propres initiales


% de la
Total
variance ==
% cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Sommes des carrs charges


% de la
Total
variance == % cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Mthode d'extraction : Analyse des principaux composants.


a. Lorsque les composantes sont corrles, les sommes des carrs chargs ne peuvent pas tre
additionns pour obtenir une variance totale.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508

2 facteurs
= 82,488%
de variance
restitue

34
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Le minimum de variance totale restitue : le chercheur fixe lavance
un seuil de variance quil veut restituer. Il retient ensuite le nombre
daxes ncessaires pour atteindre ce seuil. Si, dans les sciences dures
un seuil de 95 % est fix, un seuil de 60 % est gnralement accept en
marketing et plus largement en sciences sociales.
Variance explique totale

Composante
1
2
3
4
5
6

Valeurs propres initiales


% de la
Total
variance ==
% cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Sommes des carrs charges


% de la
Total
variance == % cumuls
2,731
45,520
45,520
2,218
36,969
82,488
,442
7,360
89,848
,341
5,688
95,536
,183
3,044
98,580
8,521E-02
1,420
100,000

Mthode d'extraction : Analyse des principaux composants.


a. Lorsque les composantes sont corrles, les sommes des carrs chargs ne peuvent pas tre
additionns pour obtenir une variance totale.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508

2 facteurs
= 82,488%
de variance
restitue

35
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Etape 4 : Interprtation des axes factoriels
Une fois les vrifications pralables opres, le choix de rotation ralis
(oblimin) et le nombre daxes factoriels dtermin (2), il reste
interprter les axes factoriels. Ces variables composites sont les
dimensions latentes du phnomne tudi. Pour linterprtation, il est
ncessaire de revenir aux items initiaux et de dterminer leur importance
dans la formation des facteurs (et ventuellement de supprimer certains
items de lanalyse). Les deux indicateurs utiliss sont les coefficients de
corrlation et les communalits.
Il est parfois ncessaire ce stade de fixer sous SPSS le nombre daxes
factoriels (2) que lon souhaite retenir, sil ne sagit pas de la solution
propose par dfaut par le logiciel.
36
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Les coefficients de corrlation entre variables initiales et facteurs
(galement appels poids factoriels ou loadings) : plus la corrlation
entre 1 variable et 1 facteur est leve, plus ctte variable apporte du sens
au facteur. Idalement pour linterprtation, une variable contribue
fortement un facteur (valeur > 0,5 ou 0,6 en v.a.) et faiblement aux
autres facteurs (valeurs < 0,3 en v.a).
Remarque : puisquune rotation a t effectue, on sintresse
maintenant directement aux poids factoriels aprs rotation.
Sous SPSS : matrice des types

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

37
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Matrice des typesa

caries
brillance
gencives
haleine
prvention caries
belles dents

Composante
1
2
,962 8,529E-05
-3,37E-02
,848
,931
-,120
-7,47E-02
,852
-,937
-,110
,108
,888

Le
facteur
1
oppose
caries/gencives prvention
caries (qui est code dans
lautre sens).

Le facteur 2 est reprsent par


Mthode d'extraction : Analyse en composantes principales.
les variables brillance, haleine
Mthode de rotation : Oblimin avec normalisation de Kaiser.
et belles dents.
a. La rotation a converg en 3 itrations.

Un dentifrice semble a priori tre achet pour 2 raisons principales :


soit sant (caries/gencives) soit pour des attentes plus sociales
(brilance/belles dents ou haleine frache).
38
M2 Marketing

Universit Paris 1 Panthon-Sorbonne

Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Les communalits : elles valuent la qualit de reprsentation des
variables par les facteurs ( les variables sont-elles bien reprsentes
dans la solution factorielle retenue ?). Les variables qui prsentent des
communalits faibles (moins de 0,5) sont supprimes de lanalyse (cest-dire que moins de la moiti de la variance initiale de la variable est
conserve par la solution factorielle).
Qualit de reprsentation
caries
brillance
gencives
haleine
prvention caries
belles dents

Initial
1,000
1,000
1,000
1,000
1,000
1,000

Extraction
,926
,723
,894
,739
,878
,790

Les diffrentes variables sont


bien reprsentes par les
facteurs.

Mthode d'extraction : Analyse des principaux composants.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

39
Cours de M. Eric

Chapitre 7 : Analyse factorielle

7.2. ACP
Il est frquent, lorsque lon mne 1 ACP de faire un tri dans les variables.
On limine celles qui ne rpondent pas aux critres de corrlation et de
qualit de reprsentation. On les supprime dans ce cas 1 par 1, en refaisant tourner lanalyse chaque fois, jusqu obtention d1 solution
satisfaisante.
Lanalyse peut tre complte par 1 reprsentation graphique des
diffrentes variables.

M2 Marketing

Universit Paris 1 Panthon-Sorbonne

40
Cours de M. Eric

Reprsentation graphique des variables :


Diagramme de composantes dans l'espace aprs
rs rotation
1,0

belles dents
haleine
brillance

,5

caries
gencives

Composante 2

0,0
prvention
caries

-,5

-1,0
-1,0

-,5

Composante 1

0,0

,5

1,0

41

En plus du simple diagramme permettant dinterprter les axes factoriels,


il est possible de reprsenter graphiquement les individus (colonne 1).
Cration de 2 nouvelles variables partir des facteurs :
Analyse > Factorisation > Analyse Factorielle
Facteurs > Enregistrer dans les variables
Cration du graphe de dispersion :
Graphes > Diagramme de dispersion > Dfinir
REGR Factor Score 1 vers laxe X
REGR Factor Score 2 vers laxe Y
N dindividu vers Etiqueter les observations par
Options : Afficher le diagramme avec les tiquettes
42

2,0
18,00
13,00
8,00
3,00
11,001,00
6,00
27,00
25,00
16,00
17,00
22,00

REGR factor score 1 for analysis

1,5

1,0

7,00

,5

4,00
14,00

29,00
24,00
26,00

0,0

20,00
-,5

28,00

-1,0
5,00

9,00 23,00
19,00
12,00
2,00
21,00
15,00
30,00

10,00

-1,5
-2

-1

REGR factor score 2 for analysis

3
43

Dans notre exemple, ceci prsente peu dintrt. Cependant, si lon avait
t renseign sur la marque consomme par ces diffrents individus, ce
graph complmentaire aurait t beaucoup plus intressant. Ajoutons 1
colonne conso cense reprsente la marque de dentifrice
consomme par lindividu interroge. On code (affichage des variables
valeurs)
1:Sanogyl
2:parogencyl
3:fluocaril
4:tonigencil
5:colgate
6:signal

On ralise un nouveau graph, mais cette fois


on va tiqueter les observations par marque
consomme.
Remarque : on peut de la mme manire faire
apparatre les variables de notre choix sur la
graph.

7:rembrandt
8:ultrabrite

44

2,0
rembrandt
rembrandt rembrandt
rembrandt
rembrandt
Marques rembrandt
rembrandt
ultrabrite
ultrabrite
sociales
ultrabrite
ultrabrite ultrabrite

REGR factor score 1 for analysis

1,5

1,0

ultrabrite

,5

sanogyl
parogencyl
sanogyl
parogencyl
fuocaril

0,0

Marques
gnralistes

-,5

-1,0
signal

fuocaril
tonigencil

colgate
colgate
colgate
colgate
signal colgate
signal
signal

Marques
sant

tonigencil

-1,5
-2

-1

REGR factor score 2 for analysis

3
45