Académique Documents
Professionnel Documents
Culture Documents
1
Cours de M. Eric
Cours de M. Eric
3
Cours de M. Eric
M2 Marketing
4
Cours de M. Eric
5
Cours de M. Eric
6
Cours de M. Eric
7
Cours de M. Eric
8
Cours de M. Eric
9
Cours de M. Eric
10
Cours de M. Eric
11
Cours de M. Eric
Cours de M. Eric
13
Cours de M. Eric
In d iv id u s o u o b je ts
1
2
3
xij
Score
individu i
sur var. j
n
M2 Marketing
14
Cours de M. Eric
15
Cours de M. Eric
x1
K x
i
( n ,m )
xn
ym
ki , j
X possde
n modalits
(types de boissons)
M2 Marketing
yj
Y possde
m modalits
(les rgions)
Nombre
dindividus
qui consomment la
boisson xi et qui
habitent la rgion yi.
16
Cours de M. Eric
7.2. ACP
Pour simplifier la dmarche, nous pouvons la dcomposer en 4 tapes
(aprs avoir supprim de lanalyse les ventuelles donnes aberrantes) :
1. Formulation du problme
2. Vrification des corrlations
3. Dtermination du nombre daxes retenir
4. Interprtation des axes factoriels
M2 Marketing
17
Cours de M. Eric
7.2. ACP
Etape 1 : Formuler le problme
Il sagit de dterminer les objectifs de lanalyse factorielle qui va tre
mene. Les variables considres pour lanalyse doivent tre choisies sur
la base de recherches pralables (tre justifies, que ce soit par la
littrature ou par une phase qualitative par exemple). On utilise des
donnes quantitatives brutes ou des chelles dintervalles ou de ratio
(ayant mme nombre dchelons ou tant standardises). Le nombre
dindividus est gnralement 4 5 fois + grand que le nombre de
variables. Si lchantillon est petit, ce rapport est + faible et les rsultats
doivent tre interprts avec prudence.
M2 Marketing
18
Cours de M. Eric
7.2. ACP
Etape 2 : Vrification des corrlations
Le processus de lACP repose sur une matrice des corrlations (ou des
covariances, selon que les donnes sont rduites ou non). Pour que
lanalyse soit pertinente, il est ncessaire que les variables soient
corrles. Des variables qui sont fortement corrles avec le(s) mme(s)
facteur(s) sont supposes tre galement fortement corrles entre elles.
Une premire mthode consiste examiner la matrice des corrlations.
Analyse Factorisation Analyse factorielle
Puis menu caractristiques cliquez sur matrice des corrlations
coefficients
M2 Marketing
20
Cours de M. Eric
7.2. ACP
Matrice de corrlation
Corrlation
caries
brillance
gencives
haleine
prvention caries
belles dents
caries
1,000
-,053
,873
-,086
-,858
,004
brillance
-,053
1,000
-,155
,572
,020
,640
gencives
,873
-,155
1,000
-,248
-,778
-,018
haleine
-,086
,572
-,248
1,000
-,007
,640
prvention
caries
-,858
,020
-,778
-,007
1,000
-,136
belles dents
,004
,640
-,018
,640
-,136
1,000
21
Cours de M. Eric
7.2. ACP
Pour tre + rigoureux, il est utile de raliser un test de sphricit de
Barlett et une mesure de lindice dadquation de Kaiser-Meyer-Olkin.
Dans le mme menu caractristiques cliquez sur matrice des
corrlations indice KMO et test de Barlett
Indice KMO et test de Bartlett
Mesure de prcision de l'chantillonnage de
Kaiser-Meyer-Olkin.
Test de sphricit de
Bartlett
M2 Marketing
Khi-deux approch
ddl
Signification
,660
111,314
15
,000
22
Cours de M. Eric
7.2. ACP
Le test de sphricit de Barlett teste lhypothse nulle H0 selon laquelle
les variables ne sont pas corrles dans la population ( est-il possible
de mener 1 ACP ?). Dans une matrice identit, tous les termes de la
diagonales sont gaux 1, et tous les autres 0. CE test sappuie sur 1
transformation du khi-2 du dterminant de la matrice des corrlations.
Une valeur leve au vu du nombre de ddl (ou plus simplement 1
probabilits associe faible c-a-d < 5%) permet de rejeter H0.
Dans le tableau prcdent, la valeur du khi-2 est de 111,314 pour 15
ddl, soit une probabilit derreur de 0,000 H0 est rejete, il est
pertinent de poursuivre lanalyse.
M2 Marketing
23
Cours de M. Eric
7.2. ACP
Le test de Kaiser-Meyer-Olkin (KMO) compare les grandeurs des
coefficients de corrlation observs aux grandeurs des coefficients de
corrlation partielle. De petites valeurs de cet indice indiquent que les
corrlations entre paires de variables ne peuvent pas tre expliques par
dautres variables et que lanalyse factorielle peut ne pas tre pertinente
( est-il intressant de mener 1 ACP ?).
On estime gnralement quune valeur > 0,5 est satisfaisante. La
valeur du test KMO que nous avons obtenue est de 0,660, ce qui est
suffisament lev. Lanalyse factorielle apparat donc bien
approprie pour lanalyse de la matrice des corrlations (mme
nombre dchelons pour chaque chelle).
M2 Marketing
24
Cours de M. Eric
7.2. ACP
Etape 3 : Dtermination du nombre daxes retenir
Il est possible de calculer autant de composantes principales (ou axes
ou facteurs ) quil y a de variables, mais dans ce cas nous
naboutirions aucune synthse de linformation. Rappel : le but est
rsumer linformation. Un petit nombre de facteurs doit donc tre
extrait. + on retient daxes, plus la variance restitue est importante, mais
moins lanalyse est synthtique et donc dlicate interprte. En outre,
le premier facteur est celui qui restitue le maximum de la variance totale
des variables originales (ce qui fonde la diffrence entre les individus).
Le deuxime facteur est celui qui restitue le maximum de variance
restante, etc. Rapidement, lajout dun axe supplmentaire prsente un
intrt limit en terme dapport dinformation.
25
M2 Marketing
Cours de M. Eric
caries
brillance
gencives
haleine
prvention caries
belles dents
Composante
1
2
,928
,253
-,301
,795
,936
,131
-,342
,789
-,869
-,351
-,177
,871
28
7.2. ACP
Pour savoir combien daxes retenir, plusieurs mthodes existent et sont
complmentaires :
La dtermination a priori : il arrive que le charg dtude sache
lavance combien daxes retenir, sil sagit par exemple dune tude trs
classique .
Dans ce cas l, sous SPSS, dans le menu extraction , on peut spcifier
directement le nombre daxes retenir.
M2 Marketing
29
Cours de M. Eric
7.2. ACP
Lexamen des valeurs propres : si le nuage de points initial navait
pratiquement aucune direction privilgie, la variance restitue par le
premier facteur serait denviron 100/p (o p est le nombre initial de
variables). Pour conserver un facteur, il faut que la variance quil restitue
soit nettement suprieure cette restitution au hasard . Le seuil
communment admis pour retenir un facteur est de deux fois la quantit
100/p. Le point de dpart de lanalyse tant la matrice des corrlations,
les facteurs retenus sont ceux dont les valeurs propres sont suprieures
1. Cette rgle de dcision est galement appele rgle de Kaiser .
Cependant, cette mthode nest pas satisfaisante lorsque le nombre de
variables est infrieur 20 (comme ici). La valeur 1 est plus un seuil
en dessous duquel il ne faut pas descendre, mais qui ne signifie pas
quune fois franchit laxe ne doit ncessairement tre retenu.
30
M2 Marketing
Cours de M. Eric
7.2. ACP
Variance explique totale
Composante
1
2
3
4
5
6
Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508
Dans notre exemple, si lon retient les valeurs propres > 1, alors nous
devons retenir 2 axes factoriels.
M2 Marketing
31
Cours de M. Eric
7.2. ACP
Lexamen de la courbe des valeurs propres : la variance restitue par
chaque facteur va en diminuant. Cette rgle de dcision consiste
chercher le premier facteur dont llimination consiste une perte
dinformation minimum. Lexamen de la courbe des valeurs propres
(fournie par SPSS) conduit la recherche dun point dinflexion et
llimination des facteurs situs aprs ce point. Il est dmontr de faon
exprimentale que le point o commence le changement de concavit est
rvlateur du nombre de facteurs.
Cette mthode peut aboutir retenir + de facteurs quavec la mthode
des valeurs propres.
M2 Marketing
32
Cours de M. Eric
7.2. ACP
Graphique des valeurs propres
3,0
2,5
2,0
Valeur propre
1,5
1,0
,5
0,0
1
Numro de composant
M2 Marketing
33
Cours de M. Eric
7.2. ACP
Le minimum de variance totale restitue : le chercheur fixe lavance
un seuil de variance quil veut restituer. Il retient ensuite le nombre
daxes ncessaires pour atteindre ce seuil. Si, dans les sciences dures
un seuil de 95 % est fix, un seuil de 60 % est gnralement accept en
marketing et plus largement en sciences sociales.
Variance explique totale
Composante
1
2
3
4
5
6
M2 Marketing
Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508
2 facteurs
= 82,488%
de variance
restitue
34
Cours de M. Eric
7.2. ACP
Le minimum de variance totale restitue : le chercheur fixe lavance
un seuil de variance quil veut restituer. Il retient ensuite le nombre
daxes ncessaires pour atteindre ce seuil. Si, dans les sciences dures
un seuil de 95 % est fix, un seuil de 60 % est gnralement accept en
marketing et plus largement en sciences sociales.
Variance explique totale
Composante
1
2
3
4
5
6
M2 Marketing
Somme
des
carrs
Total
pour
la
2,453
a
rotation
1,765
1,806
1,839
2,360
2,508
2 facteurs
= 82,488%
de variance
restitue
35
Cours de M. Eric
7.2. ACP
Etape 4 : Interprtation des axes factoriels
Une fois les vrifications pralables opres, le choix de rotation ralis
(oblimin) et le nombre daxes factoriels dtermin (2), il reste
interprter les axes factoriels. Ces variables composites sont les
dimensions latentes du phnomne tudi. Pour linterprtation, il est
ncessaire de revenir aux items initiaux et de dterminer leur importance
dans la formation des facteurs (et ventuellement de supprimer certains
items de lanalyse). Les deux indicateurs utiliss sont les coefficients de
corrlation et les communalits.
Il est parfois ncessaire ce stade de fixer sous SPSS le nombre daxes
factoriels (2) que lon souhaite retenir, sil ne sagit pas de la solution
propose par dfaut par le logiciel.
36
M2 Marketing
Cours de M. Eric
7.2. ACP
Les coefficients de corrlation entre variables initiales et facteurs
(galement appels poids factoriels ou loadings) : plus la corrlation
entre 1 variable et 1 facteur est leve, plus ctte variable apporte du sens
au facteur. Idalement pour linterprtation, une variable contribue
fortement un facteur (valeur > 0,5 ou 0,6 en v.a.) et faiblement aux
autres facteurs (valeurs < 0,3 en v.a).
Remarque : puisquune rotation a t effectue, on sintresse
maintenant directement aux poids factoriels aprs rotation.
Sous SPSS : matrice des types
M2 Marketing
37
Cours de M. Eric
7.2. ACP
Matrice des typesa
caries
brillance
gencives
haleine
prvention caries
belles dents
Composante
1
2
,962 8,529E-05
-3,37E-02
,848
,931
-,120
-7,47E-02
,852
-,937
-,110
,108
,888
Le
facteur
1
oppose
caries/gencives prvention
caries (qui est code dans
lautre sens).
Cours de M. Eric
7.2. ACP
Les communalits : elles valuent la qualit de reprsentation des
variables par les facteurs ( les variables sont-elles bien reprsentes
dans la solution factorielle retenue ?). Les variables qui prsentent des
communalits faibles (moins de 0,5) sont supprimes de lanalyse (cest-dire que moins de la moiti de la variance initiale de la variable est
conserve par la solution factorielle).
Qualit de reprsentation
caries
brillance
gencives
haleine
prvention caries
belles dents
Initial
1,000
1,000
1,000
1,000
1,000
1,000
Extraction
,926
,723
,894
,739
,878
,790
M2 Marketing
39
Cours de M. Eric
7.2. ACP
Il est frquent, lorsque lon mne 1 ACP de faire un tri dans les variables.
On limine celles qui ne rpondent pas aux critres de corrlation et de
qualit de reprsentation. On les supprime dans ce cas 1 par 1, en refaisant tourner lanalyse chaque fois, jusqu obtention d1 solution
satisfaisante.
Lanalyse peut tre complte par 1 reprsentation graphique des
diffrentes variables.
M2 Marketing
40
Cours de M. Eric
belles dents
haleine
brillance
,5
caries
gencives
Composante 2
0,0
prvention
caries
-,5
-1,0
-1,0
-,5
Composante 1
0,0
,5
1,0
41
2,0
18,00
13,00
8,00
3,00
11,001,00
6,00
27,00
25,00
16,00
17,00
22,00
1,5
1,0
7,00
,5
4,00
14,00
29,00
24,00
26,00
0,0
20,00
-,5
28,00
-1,0
5,00
9,00 23,00
19,00
12,00
2,00
21,00
15,00
30,00
10,00
-1,5
-2
-1
3
43
Dans notre exemple, ceci prsente peu dintrt. Cependant, si lon avait
t renseign sur la marque consomme par ces diffrents individus, ce
graph complmentaire aurait t beaucoup plus intressant. Ajoutons 1
colonne conso cense reprsente la marque de dentifrice
consomme par lindividu interroge. On code (affichage des variables
valeurs)
1:Sanogyl
2:parogencyl
3:fluocaril
4:tonigencil
5:colgate
6:signal
7:rembrandt
8:ultrabrite
44
2,0
rembrandt
rembrandt rembrandt
rembrandt
rembrandt
Marques rembrandt
rembrandt
ultrabrite
ultrabrite
sociales
ultrabrite
ultrabrite ultrabrite
1,5
1,0
ultrabrite
,5
sanogyl
parogencyl
sanogyl
parogencyl
fuocaril
0,0
Marques
gnralistes
-,5
-1,0
signal
fuocaril
tonigencil
colgate
colgate
colgate
colgate
signal colgate
signal
signal
Marques
sant
tonigencil
-1,5
-2
-1
3
45