Vous êtes sur la page 1sur 77

Analyse Factorielle Exploratoire

Michel Tenenhaus

1.

Les donnes de Kendall

48 candidats un certain poste sont valus sur 15 variables :

(1)

Form of letter of application

(9)

Experience

(2)

Appearance

(10) Drive

(3)

Academic ability

(11) Ambition

(4)

Likeability

(12) Grasp

(5)

Self-confidence

(13) Potential

(6)

Lucidity

(14) Keeness to join

(7)

Honesty

(15) Suitability

(8)

Salesmanship
2

S
u m

X
X
X
X
1
X
2
X
3
X
4
X
X
5
X
X
6
X
7
X
8
1
X
9
1
X
1
1
0
1
1
2
3
4
5
1
6
7
2
5
8
7
8
8
3
8
9
7
5
1
7
0
2
1
9
5
1
0
8
9
1
0
9
5
0
9
9
8
8
1
8
0
3
7
8
3
6
9
8
9
7
4
9
9
8
6
1
8
0
4
5
6
8
5
6
5
9
2
8
4
5
8
7
6
5
5
6
8
8
8
4
4
9
2
8
5
5
8
8
7
7
6
7
7
7
6
8
1
7
5
0
9
6
5
8
6
6
6
7
9
9
8
8
8
8
8
1
8
1
8
0
8
0
9
1
8
0
8
9
9
9
8
9
9
8
1
8
1
9
0
9
0
9
1
9
0
9
9
9
7
8
8
8
8
5
9
8
9
8
8
1
8
0
1
0
4
1
7
1
2
1
0
1
0
7
0
1
3
1
0
1
0
0
9
1
0
3
0
1
1
4
1
7
1
0
0
8
0
3
9
5
1
9
1
8
0
2
0
5
1
2
4
1
7
1
4
1
0
0
7
0
8
2
8
1
8
1
0
3
0
7
1
3
6
9
1
8
5
0
4
9
4
4
4
5
4
7
6
8
1
4
8
9
8
9
6
3
8
2
5
2
6
6
7
5
6
1
5
4
8
8
7
5
1
4
2
0
7
5
3
6
6
4
6
1
6
6
9
6
7
8
9
8
9
8
8
7
6
8
1
6
0
1
7
8
7
7
7
9
5
8
6
6
7
8
6
6
7
8
1
8
6
8
8
4
8
8
6
4
3
3
6
7
2
6
4
1
9
6
7
8
4
7
8
5
4
4
2
6
8
3
5
4
2
0
4
8
7
8
8
1
9
5
0
2
6
7
9
8
8
9
2
1
3
8
6
8
8
1
8
5
0
3
6
7
8
8
5
8
2
2
9
8
7
8
1
9
1
1
0
1
0
3
0
1
8
0
1
8
0
8
0
2
3
1
7
7
0
9
9
1
9
1
0
3
0
9
1
9
1
9
0
8
0
2
4
9
8
1
7
1
8
1
0
1
0
0
2
0
9
7
9
1
9
8
0
2
5
6
9
7
7
4
5
9
3
2
4
4
4
4
5
4
2
6
7
8
7
8
5
4
8
2
3
4
5
6
5
5
6
2
7
1
2
7
0
9
8
1
9
5
0
3
5
6
7
6
4
5
2
8
6
3
5
3
5
3
5
0
0
3
3
0
0
5
0
2
9
4
3
4
3
3
0
0
0
0
4
4
0
0
5
0
3
0
4
6
5
6
9
1
4
3
0
1
3
3
2
2
7
3
3
1
5
5
4
7
8
1
4
3
0
2
5
5
3
4
8
3
3
2
3
3
5
7
7
1
9
3
0
2
5
3
7
5
5
2
3
3
2
3
5
7
7
1
9
3
0
2
2
3
6
4
5
2
3
4
3
4
6
4
3
3
8
1
1
3
3
3
2
5
2
3
5
6
7
4
3
3
0
9
0
1
0
2
3
1
5
3
3
6
9
8
5
5
6
6
8
2
2
2
4
5
6
6
3
3
7
4
9
6
1
4
8
0
8
9
1
3
9
7
5
3
2
3
8
4
9
6
6
9
9
7
9
1
1
2
8
0
5
5
2
3
9
1
6
1
0
9
1
9
1
0
1
1
0
1
0
0
0
1
8
0
1
1
1
0
0
0
0
4
0
1
6
1
0
9
1
9
1
0
1
1
0
1
0
1
0
0
1
0
1
0
1
1
0
0
0
0
4
1
1
7
0
8
0
2
1
2
1
0
2
0
0
3
0
1
0
0
4
2
1
3
0
8
0
1
1
0
1
0
0
0
0
0
0
1
0
0
4
3
3
4
9
8
2
4
5
3
6
2
1
3
3
3
8
4
4
7
7
7
6
9
8
8
6
8
1
8
8
0
8
6
5
4
5
9
1
6
9
0
7
1
7
2
0
1
5
5
7
8
4
5
4
6
9
1
8
1
0
7
1
0
9
3
0
1
5
7
9
9
4
4
4
7
0
1
7
3
0
5
1
0
0
0
0
2
2
0
0
0
0
4
8
0
1
6
1
0
5
1
0
0
0
0
2
2
0
0
0
0

Tableau des corrlations

i
o

e
l
a
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
1
2
3
1
4
1
5
1
6
1
7
1
8
1
9
X
1
6
0
6
9
8
4
6
2
8
7
9
8
6
5
8
7
7
6
X
2
0
9
8
0
8
3
0
1
1
4
7
1
1
0
6
7
4
4
X
3
9
4
2
3
4
0
2
1
7
0
6
6
4
4
8
0
3
0
X
4
0
6
8
0
2
2
0
2
3
5
7
1
3
7
3
6
5
7
X
5
7
2
8
1
5
1
2
0
8
0
6
5
4
2
1
2
2
0
X
6
7
8
2
1
1
7
3
8
0
6
6
7
8
8
3
7
7
6
X
7
1
7
4
4
0
0
5
0
6
0
1
6
0
5
6
6
8
3
X
8
3
9
4
7
4
6
7
6
6
1
0
3
1
0
6
5
9
8
X
9
4
8
1
1
9
6
1
5
7
6
3
0
7
5
9
8
5
3
X
1
8
6
1
1
2
4
3
4
8
0
1
7
0
0
4
8
3
3
X
1
6
5
4
0
3
4
7
2
8
5
0
5
0
0
4
9
7
5
X
1
7
8
4
6
2
8
3
1
3
6
6
9
4
4
0
6
9
8
X
1
0
7
3
7
7
0
6
2
7
6
5
8
8
9
6
0
9
4
X
1
3
7
0
4
9
3
5
2
7
8
9
5
3
7
9
9
0
6
X
1
7
6
9
4
0
0
7
0
6
3
8
3
3
5
8
4
6
0

One of the questions of interest here is how the variables cluster,


in the sense that some of the qualities may be correlated or
confused in the judges mind. (There was no purpose in clustering
the candidates - only one was to be chosen).

2. Classification Ascendante Hirarchique des variables


* * * H I E R A R C H I C A L

C L U S T E R

A N A L Y S I S * * *

Dendrogram using Complete Linkage (Mthode des voisins les plus loigns)
Rescaled Distance Cluster Combine
C A S E
Label
Num
X6
X12
X8
X11
X5
X10
X13
X2
X4
X14
X7
X9
X15
X1
X3

6
12
8
11
5
10
13
2
4
14
7
9
15
1
3

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Interprtation des blocs


Bloc 1 : Qualits humaines favorables au poste
(Appearance), Self-confidence, Lucidity, Salesmanship,
Drive, Ambition, Grasp, Potential
Bloc 2 : Qualits de franchise et de communication
Likeability, Honesty, Keenness to join

Bloc 3 : Exprience
Form of letter of application, Experience, Suitability
Bloc 4 : Diplme
Academic ability
6

3. Uni-dimensionabilit dun bloc de variables


Question :
Un bloc de variables Xj est-il essentiellement
unidimensionnel ?
Rponse :
1) La premire valeur propre 1 de lanalyse en
composante principale du bloc est suprieure 1,
les autres sont infrieures 1.
2) Chaque variable est plus corrle la premire
composante principale quaux autres composantes
principales.
3) Chaque variable Xj a une corrlation suprieure
0.5, en valeur absolue, avec la premire composante.
7

Application : ACP de chaque bloc


Bloc 1

c
e

g
e
p
1
C
X
7
1
6
6
X
7
2
1
8
X
0
3
8
6
X
2
4
6
3
X
5
5
9
1
X
2
6
7
8
X
1
7
9
7
X
9
8
3
0

Bloc 1 unidimensionnel
8

Application
Bloc 2

Bloc 3

c
c

C
C
1
0
2
2
1
2
6
3
6
2
3
4
4
0
3

E
E

1
X
1
X
1
X
1
X
7
X
3
X
8

4.

Fiabilit de linstrument de mesure

Mesure globale de lhomognit dun bloc de


variables positivement corrles entre elles :
LAlpha de Cronbach

Question :
Comment mesurer globalement la fiabilit de
linstrument de mesure ?
Cest dire le niveau dhomognit dun bloc
de variables xi positivement corrles entre elles ?

Rponse :
Utilisation du Alpha de Cronbach
10

Le modle
xi ei , i 1,..., p

o :

vraie mesure
xi item n i

ei erreur de mesure
avec les ei et indpendants.

11

Dfinition du de Cronbach
p

Score H xi
i 1

de Cronbach = Cor 2 ( H , )

Formule de calcul du de Cronbach

Cov( x , x )
i j

Var ( H )

Var ( xi )
p

i

1

1
Var ( H )

1, et = 1 lorsque toutes les corrlations entre les xi sont gales 1


12
et toutes les variances des xi sont gales.

de Cronbach pour items centrs-rduits


On a la dcomposition suivante :
p

i 1

i 1

Var ( xi ) Var ( xi ) Cov( x j , xk )


j k

Si les variables sont centres-rduites on obtient :

Var ( H ) p Cor ( x j , xk )
j k

Un bloc de variables positivement corrles entre elles est


homogne si la corrlation moyenne
1
r
Cor ( x j , xk )

p ( p 1) j k
est grande.

13

de Cronbach pour items centres-rduites


Le rapport

devient :

Cov( x , x )
i j

Var ( H )

1
Cor ( xi , x j )

pr
2 p ( p 1) i j
p

Var ( H )
1 ( p 1)r

Un bloc est considr comme homogne si :


- 0.6 pour des recherches exploratoires
- 0.7 pour des recherches confirmatoires
14

Application : de Cronbach de chaque bloc


Bloc 1

e
l
X
X
X
X
X
X
1
1
1
2
1
5
6
8
X
1
1
7
1
0
6
7
X
0
8
6
4
2
1
2
X
8
0
6
8
8
3
7
X
6
6
0
1
0
6
5
X
4
8
1
0
0
4
8
X
2
8
0
0
0
4
9
X
1
3
6
4
4
0
6
X
2
7
5
8
9
6
0

Les corrlations sont toutes positives.


15

Bloc 1
R E L I A B I L I T Y

A N A L Y S I S

S C A L E

(A L P H A)

Item-total Statistics

X2
X5
X6
X8
X10
X11
X12
X13

Scale
Mean
if Item
Deleted

Scale
Variance
if Item
Deleted

41.2708
41.4167
42.0417
43.5625
43.0417
42.3750
42.1042
42.6667

364.1591
327.0142
300.9344
289.2726
312.5940
305.6011
303.3293
301.1206

Reliability Coefficients
Alpha =

.9503

Corrected
ItemTotal
Correlation
.5052
.8356
.8633
.8883
.8122
.8937
.8834
.8570

Squared
Multiple
Correlation

Alpha
if Item
Deleted

.4435
.7957
.8823
.8530
.7783
.8493
.8853
.8345

.9599
.9435
.9404
.9391
.9438
.9384
.9390
.9409

8 items
Standardized item alpha =

Scale = Somme des variables

.9489

16

Bloc 2

l
1
4
7
X
X
X

Item-total Statistics

X4
X7
X14

Scale
Mean
if Item
Deleted

Scale
Variance
if Item
Deleted

13.6042
11.7083
14.1875

19.5208
25.1472
23.4747

Reliability Coefficients
Alpha =

.8153

Corrected
ItemTotal
Correlation
.7823
.5986
.6312

Squared
Multiple
Correlation

Alpha
if Item
Deleted

.6127
.4166
.4695

.6185
.8125
.7820

3 items
Standardized item alpha =

.8138

17

Bloc 3

l
1
1
9
X
X
X

Item-total Statistics

X1
X9
X15

Scale
Mean
if Item
Deleted

Scale
Variance
if Item
Deleted

10.1875
11.9583
10.2292

36.9641
28.3812
27.7974

Reliability Coefficients
Alpha =

.8223

Corrected
ItemTotal
Correlation
.6165
.7043
.7318

Squared
Multiple
Correlation

Alpha
if Item
Deleted

.3824
.5107
.5405

.8184
.7287
.6981

3 items
Standardized item alpha =

.8237

18

5.

ACP des donnes de Kendall


c

g
oe
f
V
o
u
V
o
l
C
a
a
t
l a
a
t
a
r
t
o
a
1
9
9
9
6
6
9
6
6
2
1
1
8
7
3
8
7
3
3
5
6
2
0
2
2
0
2
4
4
1
7
9
1
7
9
1
5
9
8
9
6
3
5
4
7
1
2
6
8
0
6
2
9
6
6
8
1
0
8
2
9
1
1
9
5
4
1
2
3
0
5
1
3
5
4
8
1
4
4
9
8
1
5
5
2
0
E

19

ACP des donnes de Kendall

p
o
1
2
3
4
X
2
X
8
X
1
X
3
X
5
X
4
X
9
X
0
0
6
5 X
X
6
5
X
3
5 X
8 X
6 X
X
0
E
a
4

Les corrlations infrieures 0.5 en valeur absolue ne sont pas montres.

20

ACP + Rotation Varimax

a
p
o

p
o
1
2
3
4
X
8
X
7
X
7
X
3
X
6
X
8
X
1
X
6
2 X
0 X
7 X
X
2
X
3
X
8
X
8
E
R
a
R

Seules sont montres les corrlations maximum en valeur absolue sur


chaque ligne.

21

6.

Analyse Factorielle orthogonale

6.1. Les donnes


p variables alatoires X1,, Xp, en gnral centres-rduites.

6.2. Le modle
X1 = 11Y1 + + 1mYm + e1
..
.
Xi = i1Y1 + + imYm + ei
..
.
Xp = p1Y1 + + pmYm + ep
o :

Yj = facteurs communs centrs-rduits


ei = facteurs spcifiques centrs et de variance i

Les facteurs Y1,, Ym, e1,, em sont tous non corrls entre eux.

22

6.3. Analyse Factorielle


(Option analyse en composantes principales)
Les donnes

p variables X1,, Xp centres-rduites.


Estimation des facteurs Y1, , Ym

Les m premires composantes principales rduites.


Choix de m

Nombre de valeurs propres suprieures 1.

23

Application Kendall

g
oe
f
V
o
u
V
o
l
C
a
a
t
l a
a
t
a
r
t
1
9
9
6
6
9
6
6
2
1
8
7
3
8
7
3
3
6
2
0
2
2
0
2
4
1
7
9
1
7
9
1
5
9
8
9
6
3
5
4
7
1
2
6
8
0
6
2
9
6
6
8
1
0
8
2
9
1
1
9
5
4
1
2
3
0
5
1
3
5
4
8
1
4
4
9
8
1
5
5
2
0
E

24

Calcul des saturations (loadings) ij


Les loadings ij sont les coefficients de rgression des Yj

dans la rgression de Xi sur les facteurs Y1,, Ym.


Les facteurs tant orthogonaux (= non corrls) on a :
ij = Cor(Xi, Yj)
Calcul des communauts (communalities) hi2
m

h R (X i ; Y1 ,..., Ym ) cor (X i , Yj ) ij2


2
i

j1

j1

25

Application Kendall
Matrice des corrlations entre les variables et les

ij

a
u
facteurs
e
n
i

p
o
a
c
1
2
3
4 X
2
X
8
2
9
X
6
X
8
7
9
X
2
X
0
0
0
X
3
X
0
5
1
X
6
X
8
5
8
X
2
X
8
2
0
X
1
X
6
1
8
X
3
X
6
5
0
X
0
X
5
9
0
X
8
X
7
0
5
X
9
X
8
6
6
X
1
X
1
5
2
X
X
5
5
8
3
X
X
4
0
4
5
X
5
3
8
X
5

E
E
a
.
4
P

26

Calcul des spcificits i

Var(X i ) 1

ij

j1

hi2 =
communaut

Var(ei) =
spcificit

Qualit de la dcomposition
p

Var(Xi ) p
i 1

Variance
totale

i1 ...
i

Variance
explique
par Y1 ( = 1)

im

Variance
explique
par Ym ( = m)

Variance
rsiduelle
27

Application Kendall avec m = 4

Communaut

p
o
m
1
2
3
4
2
2
X
5
8
2
9
i
ij
X
3
8
7
9
j1
X
9
0
0
0
X
6
0
5
1
X
9
8
5
8
X
5
8
2
0
X
3
6
1
8
X
1
6
5
0
X
5
5
9
0
X
4
7
0
5
X
3
8
6
6
X
8
1
5
2
X
2
5
8
3
X
0
4
0
4
X
6
5
3
8

Variance
explique

j ij2
i 1

28

6.4. Dcomposition de R en AF orthogonale


Modle : Xi = i1Y1 + + imYm + ei

Formules de dcomposition :
2
Var(Xi ) 1 i12 + ... + im
+ i

i1

im
i

im

i1

Cor(X i , X k ) Cov(X i , X k ) i1 k1 ... im km

i1

k1

im


km

29

Formule gnrale
1 Cor(X1 , X 2 )

11 12

22
21

p1 p2

Cor(X1 , X p )
Cor(X 2 , X p )

1m 11
2m 12

pm 1m

21
22
2m

p1 1
p2 0



pm 0

'

0
0

R = +
30

6.5. Les objectifs de lAF orthogonale


Lanalyse factorielle orthogonale consiste rechercher
une dcomposition de la matrice des corrlations R de
la forme :

R = +
Les ij sont les saturations et les i les spcificits.
Mthodes usuelles dextraction des saturations :
-

Analyse en composantes principales


Mthodes des facteurs principaux
Mthodes des moindres carrs
Mthodes des moindres carrs pondrs
Maximum de vraisemblance

31

Application Kendall
R=

t i
o

r e
l
a
X
X
X
X
X
X
X
X
X
X
X
X
X
X
1
X
2
3
4
5
1
6
1
7
1
8
1
9
1
1
0
X
1
4
0
4
9
8
4
3
6
6
2
6
8
8
7
9
8
6
5
8
7
7
6
X
2
4
9
4
0
5
3
0
0
0
1
8
1
8
4
7
1
1
0
6
7
4
4
X
3
6
4
9
3
4
0
9
2
9
1
2
7
4
0
6
6
4
4
8
0
3
0
X
4
4
6
9
0
4
2
0
0
0
2
8
3
2
5
7
1
3
7
3
6
5
7
X
5
1
2
0
1
4
1
2
2
7
0
8
8
5
0
6
5
4
2
1
2
2
0
X
6
4
8
9
1
5
7
8
3
7
8
2
0
1
6
6
7
8
8
3
7
7
6
X
7
5
7
8
4
1
0
8
5
1
0
4
6
0
0
1
6
0
5
6
6
8
3
X
8
3
9
1
7
6
6
6
7
3
6
4
6
4
1
0
3
1
0
6
5
9
8
X
9
0
8
3
1
9
6
9
1
4
5
1
7
9
6
3
0
7
5
9
8
5
3
X
1
3
6
0
1
8
4
1
3
8
4
1
8
2
0
1
7
0
0
4
8
3
3
X
1
9
5
8
0
0
4
8
7
6
2
4
8
3
5
0
5
0
0
4
9
7
5
X
1
9
8
1
6
8
8
0
3
7
1
4
3
2
6
6
9
4
4
0
6
9
8
X
1
4
7
8
7
6
0
7
6
0
2
3
7
7
6
5
8
8
9
6
0
9
4
X
1
1
7
1
4
4
3
4
5
3
2
0
7
9
8
9
5
3
7
9
9
0
6
X
1
9
6
2
4
3
0
2
7
7
0
9
6
0
3
8
3
3
5
8
4
6
0

32

m=4

p
o
1
2
3
4
X
5
8
2
9
X
3
8
7
9
X
9
0
0
0
X
6
0
5
1
X
9
8
5
8
X
5
8
2
0
X
3
6
1
8
X
1
6
5
0
X
5
5
9
0
X
4
7
0
5
X
3
8
6
6
X
8
1
5
2
X
2
5
8
3
X
0
4
0
4
X
6
5
3
8

rik i1 k1 ... i4 k 4
= Corrlation reproduite l'aide du modle

33

Corrlations reproduites R et rsidus R R

X
X
X
X
X
1
X
2
X
3
X
X
4
X
X
5
X
6
X
7
X
1
8
X
1
9
1
1
1
0
1
1
2
3
b
R
X
e
1
p
r o
2
8
0
1
2
3
.2
6
4
2
.3
4
1
9
.3
8
2
.4
9
4
.7
8
6
0
0
5
2
2
4
7
2
8
8
0
7
4
3
2
3
b
X
2
4
2
4
6
4
6
.4
1
3
9
.5
4
9
6
.5
0
1
.3
5
2
.3
9
7
5
6
5
4
6
5
9
3
4
5
3
9
0
3
2
8
b
X
3
0
6
0
8
0
2
.0
3
1
2
.2
0
7
1
.3
1
2
.4
3
5
.2
1
4
5
2
4
1
2
6
0
0
0
0
0
3
1
2
8
5
b
X
4
4
6
7
2
3
7
.3
1
2
4
.5
4
3
2
.5
4
5
.6
2
3
.3
6
3
0
6
3
0
2
9
8
4
9
3
3
3
0
8
5
8
b
X
5
8
3
3
1
8
2
.8
0
8
6
.7
7
2
7
.7
6
4
.4
3
3
.2
3
6
2
5
4
6
6
8
0
5
8
6
7
5
0
2
5
4
b
X
6
8
9
3
7
8
3
.8
1
2
0
.8
7
2
6
.7
8
2
.5
3
6
.4
4
5
6
2
3
6
0
4
8
3
5
5
2
4
9
2
0
9
b
X
7
3
0
8
1
2
4
.2
2
6
2
.4
2
8
4
.4
5
1
.4
2
0
.0
3
6
2
6
5
1
0
3
4
3
7
6
4
0
4
3
0
4
b
X
8
8
5
2
3
8
2
.8
2
3
4
.8
8
3
5
.7
2
6
.5
9
9
.5
3
8
2
4
8
3
1
3
7
6
4
0
1
5
4
2
9
7
b
X
9
1
9
2
1
2
6
.2
7
3
2
.2
3
4
3
.3
3
0
.2
3
4
.7
8
5
4
3
0
3
9
6
6
0
0
7
2
0
9
8
7
5
b
X
1
0
7
5
2
5
8
0
.8
3
2
8
.7
7
6
5
.7
2
0
.5
2
3
.5
4
6
8
5
0
6
8
0
6
7
8
8
9
7
1
3
8
3
b
X
1
1
8
5
2
4
8
3
.8
2
4
7
.8
8
3
9
.7
5
3
.5
8
3
.4
0
5
0
4
7
0
1
5
6
0
3
7
8
9
1
9
6
4
b
X
1
2
8
6
4
2
8
2
.8
2
6
4
.8
7
0
0
.8
0
1
.5
1
0
.5
9
0
8
9
1
4
5
4
5
9
5
1
5
1
1
7
1
1
b
X
1
3
7
9
4
0
7
8
.7
3
0
3
.8
7
8
3
.8
4
2
.5
7
8
.5
6
2
6
2
6
3
5
2
8
8
5
3
9
9
7
5
0
6
b
X
1
4
5
4
4
0
5
9
.5
2
8
2
.5
5
5
2
.5
7
8
.8
4
5
.4
0
5
8
0
3
0
5
9
5
7
8
8
5
6
1
0
5
4
X
1
5
4
3
0
0
5
3
.4
7
7
3
.5
5
2
8
.5
4
5
.4
1
8
.7
2
4
9
9
8
4
5
7
9
5
5
3
9
4
1
6
4
5b
a
R
X
e
1
s
i
d
0
5
0
5
0
2
.0
1
4
.0
0
1
0
.0
2
6
.0
2
7
.1
3
6
6
8
2
4
1
5
0
3
1
3
1
7
4
6
4
7
X
2
1
0
3
0
8
.0
0
0
0
.0
1
2
.0
5
7
.0
2
3
.0
5
6
1
5
9
0
5
3
8
2
5
4
4
1
3
6
8
6
X
3
0
3
0
0
2
.0
0
1
6
.0
0
0
7
.0
1
.0
1
6
.0
4
5
4
5
0
9
2
0
1
5
8
4
6
1
3
1
4
5
X
4
0
8
0
2
0
.0
0
2
7
.0
0
4
3
.0
9
6
.0
1
.0
2
0
1
6
1
4
1
8
1
3
0
0
1
3
7
8
9
1
X
5
0
0
0
1
0
2
.0
0
6
.0
0
1
6
.0
4
5
.0
2
0
.0
5
2
7
0
4
3
1
3
0
0
1
2
3
9
0
2
4
X
6
2
0
0
0
4
.0
0
1
8
.0
0
5
.0
3
5
.0
0
6
.0
0
7
6
7
0
7
8
0
4
2
7
1
7
4
4
3
2
X
7
0
5
1
0
9
.0
0
4
4
.0
0
3
0
.0
9
.0
0
4
.0
7
4
5
0
3
1
8
2
7
2
5
4
5
8
7
2
7
X
8
0
2
0
1
1
.0
0
2
5
.0
0
0
3
.0
0
0
.0
8
.0
0
1
0
8
2
8
4
3
4
0
9
3
5
8
7
0
2
X
9
0
5
0
4
0
2
.0
5
3
.0
0
0
2
.0
7
5
.0
0
3
.0
0
0
4
0
7
0
4
1
0
9
3
5
0
9
8
2
X
1
0
0
1
0
4
0
1
.0
0
2
3
.0
6
4
.0
5
4
.0
0
0
.0
0
1
7
2
5
6
9
2
9
2
3
7
6
5
5
0
X
1
1
0
9
0
0
0
1
0
0
7
.0
0
7
1
.0
3
1
.0
2
3
.0
0
3
2
7
5
2
5
0
5
1
7
4
7
0
1
9
X
1
2
0
5
0
2
0
1
.0
0
3
4
0
7
3
.0
1
3
.0
4
7
.0
0
9
6
4
2
8
8
1
0
0
6
2
7
9
1
3
X
1
3
0
8
0
1
0
1
.0
0
3
6
.0
0
0
6
2
1
.0
3
8
.0
1
0
2
4
0
7
1
7
9
1
5
2
0
9
0
3
X
1
4
0
5
0
8
0
0
.0
0
0
4
.0
0
2
8
.0
2
4
0
9
.0
0
2
2
3
1
2
0
0
8
5
5
1
1
0
8
X
1
5
0
4
0
6
0
1
.0
0
2
7
.0
0
1
6
.0
4
5
.0
3
1
3
4
3
2
4
7
2
2
2
2
5
0
9
3
3
8

E x
tr a
a
.
R
es
i
d

b
.
R
epr o

34

6.6.

Les mthodes de rotation

Formule de dcomposition (p = 3, m = 2) :

1 Cor(X1 , X 2 ) Cor(X1 , X 3 )
R
1
Cor(X 2 , X 3 )

1
11 12
11

21 22
12

31 32
1 0
TT '

0 1

21
22

1 0
31
0 2

32
0
0

0
0
3

35

Les mthodes de rotation


Matrice de rotation dun angle :

x ' cos() sin() x


y ' sin() cos() y

y
cos

A
*

*
-sin
cos

sin

T
X

Matrice de rotation T :

TT = T T= I

x
x = Proj(A) sur laxe X
y = Proj(A) sur laxe Y

X
36

Indtermination de la dcomposition
1 Cor(X1 , X 2 ) Cor(X1 , X 3 )
R
1
Cor(X 2 , X 3 )

Var(X 3 )
11 12
1 0
11 21 31

21 22 TT '
0 2

12 22 32 0
31 32
0

0
0
3

I
Nouvelle matrice des saturations aprs rotation :

11
21
31

12 11 12
cos() sin(

22 21 22

sin(

)
cos(

32 31 32

37

Les mthodes de rotation VARIMAX et QUARTIMAX

11

21
31

12 11 12

22 21 22 T
32 31 32

Objectifs :
(1)

Pour chaque colonne de les |ij| sont proches de 0 ou 1 :


==> Facteurs bien typs. Cest lobjectif de VARIMAX.

(2)

Sur chaque ligne de il y a un |ij| proche 1 et tous


les autres proches de 0 :
==> Typologie des variables. Cest lobjectif de QUARTIMAX.
38

Exemple avec les blocs 2 et 3

e
l
X
X
X
X
1
1
1
9
4
7
X
8
6
6
7
7
X
0
3
1
6
5
X
3
0
7
3
6
X
1
7
0
5
5
X
6
3
5
0
8
X
5
6
5
8
0

2
e

R (Xj;Y1,Y2)

p
o
c
1
2
X
X
0
5
X
X
3
4
X
X
7
2
X
X
0
8
X
4
6
X
X
0
5
X

Seulement dans
loption ACP

a
2

39

Exemple avec les blocs 2 et 3


Component Plot
1.0
x7
x4
.5

x14

Component 2

0.0

x1
x15
-.5

x9

-1.0
-1.0

Component 1

-.5

0.0

.5

1.0

40

Utilisation de la rotation Varimax

a
n

p
o
1
2
C
1
2
1
X
5
2
X
4
E
X
2
R
X
8
X
6
X
5

T ( TT = I )

a
2

a
p

p
o
1
2
X
4
7
X
6
4
X
7
5
X
8
3
X
3
5
X
1
3

==

E
R
41
a
R

Utilisation de la rotation varimax


Component Plot in Rotated Space
1.0

x4

x7

x14

.5
x15
x1
x9

Component 2

0.0

-.5

-1.0
-1.0

Component 1

-.5

0.0

.5

1.0

42

Exemple Kendall complet


Application (ACP + Varimax)

a
p
o

p
o
1
2
3
4
X
6
0
8
6
X
6
2
1
8
X
1
8
7
8
X
6
5
2
2
X
8
4
6
2
X
3
9
9
4
X
6
2
3
1
X
7
6
7
1
X
3
2
2
2
X
8
2
1
9
X
7
2
6
8
X
6
7
8
6
X
1
9
9
7
X
7
4
8
2
X
1
7
7
5
E
R
a
R

43

Application (ACP + Varimax)


Prsentation amliore

a
p
o

p
o
1
2
3
4
X
8
X
7
X
7
X
3
X
6
X
8
X
1
9
X
6
1
2 X
0 X
7 X
X
2
X
3
X
7
8
2
X
8
E
R
a
R

Corrlations infrieures 0.4 en valeur absolue non montres

44

6.7.

Estimation des facteurs communs


(AF orthogonale)

On recherche une variable (ou score)

a X ... a X
Y
j
j1 1
jp p
aussi proche que possible de Yj.
La rgression de Yj sur X1,, Xp donne :
1

a j (X'X) X'Yj ( ' ) j


1

est la j-ime colonne de


.
o
j
45

Application (ACP + Varimax)


Coefficients appliqus aux variables centres-rduites

p
o
1
2
3
4
X
7
2
3
1
X
6
9
7
9
X
0
2
4
7
X
8
0
8
8
X
9
1
1
8
X
4
5
1
1
X
3
8
0
9
X
4
6
5
2
X
3
2
0
0
X
4
5
6
0
X
6
8
1
8
X
6
4
9
8
X
8
2
9
4
X
6
6
6
1
X
3
1
5
0
E
R
46
C

Estimation des facteurs

a
m

c
c
t
t
t
e
t
e
e
e
u
u
u
1
1
8
8
4
8
1
2
1
8
6
7
4
9
3
0
7
6
6
8
6
4
5
2
9
8
7
9
5
1
6
0
5
1
9
6
5
9
5
1
7
0
7
6
0
3
0
7
7
8
1
5
9
7
1
1
9
6
4
5
2
9
5
1
0
5
0
6
4
9
2
1
1
9
7
7
4
5
1
1
2
1
8
4
2
6
0
1
3
5
3
1
9
5
7
1
4
1
0
4
0
6
0
1
5
4
0
1
3
8
7
1
6
7
0
3
1
5
3
1
7
5
2
4
1
3
5
1
8
7
5
9
9
5
5
1
9
2
8
1
3
9
0
2
0
7
3
5
1
8
5
a
L

.
i

47

7. Test de sphricit de Bartlett


Test : H0 : R = Identit
(aucune corrlation entre les X)
On rejette H0 au risque de se tromper si

2p 5
(n 1
) ln | R |
6

2p 5
(n 1
) rik2
6 ik

est suprieur au seuil

2
1-

p(p 1)
2
48

Application

K
A

0
5
0

B
A
S
d
S

49

8. Kaiser-Meyer-Olkin Measure
of Sampling Adequacy
La corrlation partielle
Xi = i0 + i1Y1 + + imYm + i

Xk = k0 + k1Y1 + + kmYm + k
==>

Cor(Xi, Xk / Y1, , Ym) = Cor(i, k)

Pour un modle factoriel :


Xi = i1Y1 + + imYm + ei
==> Cor(Xi, Xk / Y1, , Ym) = Cor(ei, ek) = 0

Les facteurs
spcifiques sont
non corrls entre
eux.

Anti-image correlation -aik :


Si le modle factoriel est vrai les aik = cor(Xi, Xk/ Autres X)
sont faibles en valeur absolue.

50

Application Kendall

ge

e
C
X1
X2
X3
X4
X5
X6
X1
X7
X1
X8
X1
X9
X1
X1
X1
0
1
a
X1
2
7
7
3
1
9
1
3
7
2
1
9
4
1
0
3
4
6
4
4
0
2
5
7
a
X2
2
8
1
4
8
2
6
6
8
4
4
3
0
9
4
7
9
0
0
1
7
1
4
4
a
X3
2
2
1
5
6
7
4
4
0
9
6
8
2
4
0
5
4
1
6
6
7
0
0
2
a
X4
1
5
7
8
8
0
0
3
3
1
1
4
6
6
0
7
8
8
5
3
5
0
6
5
a
X5
1
3
1
2
4
4
6
0
1
3
2
2
9
2
3
4
0
3
8
2
7
3
5
9
a
X6
0
3
4
9
0
2
2
8
6
9
9
8
5
3
4
8
1
5
0
2
5
3
9
2
a
X7
1
6
0
6
4
8
0
0
0
7
3
4
4
1
3
4
6
4
8
9
1
0
0
5
a
X8
3
9
4
7
9
6
4
7
8
0
0
3
1
0
6
1
2
0
0
4
7
2
8
6
a
X9
5
7
6
6
0
1
1
1
8
5
3
6
5
5
4
1
0
5
1
7
4
4
0
0
a
X1
4
6
4
1
0
4
6
3
5
2
8
9
0
5
8
2
0
1
3
2
8
9
5
6
a
X1
2
7
4
1
1
3
6
2
3
8
2
8
2
6
9
5
4
7
2
0
6
1
3
9
a
X1
1
0
0
5
7
2
7
8
5
9
7
4
5
9
1
6
7
4
8
6
7
4
4
8
a
X1
0
3
2
6
1
9
0
8
0
4
3
8
3
7
0
0
2
4
9
1
4
2
2
3
a
X1
2
0
5
5
4
5
0
6
6
9
5
7
9
2
0
2
8
0
5
3
4
2
1
7
X1
7
1
7
1
4
2
2
5
5
6
9
0
2
2
5
5
6
0
6
9
8
3
7
5 a
a
.
M

51

Kaiser-Meyer-Olkin Measure of Sampling Adequacy


Comparaison entre les corrlations rik et les corrlations
partielles aik :

r
KMO
r a
ik

ik
2
ik

2
ik

ik

2
ik

KMO

Qualit espre de
l'analyse factorielle

.90

Marvelous

.80

Meritorious

.70

Middling

.60

Mediocre

.50

Miserable

<.50

Unacceptable
52

9.

CONCLUSION (!!!!)

we find ourselves in sympathy with the growing group of


statisticians who doubt if FA is worth using except in a few
particular types of application. For example Hills (1977) has
said that FA is not worth the time necessary to understand it
and carry it out . He goes on to say that he regards FA as an
elaborate way of doing something which can only be crude,
namely picking out clusters of inter-related variables, and
then finding some sort of average of the variables in a cluster
in spite of the fact that the variables may be measured on
different scales.
C. Chatfield & A.J. Collins, 1980

53

10. Autres mthodes dextraction des


saturations
- Mthodes des facteurs principaux

- Mthodes des moindres carrs


- Mthodes des moindres carrs pondrs

- Maximum de vraisemblance
54

10.1 La matrice des saturations


Modle : Xi = i1Y1 + + imYm + ei
Les ij sont les saturations (ou loadings)
Matrice des saturations

11

i1

p1

1m

im

pm

dans SPSS
- Yj = Composantes principales
rduites :
Component Matrix
- Yj orthogonaux :
Factor Matrix
- Yj corrls :
Pattern Matrix

Si les Yj sont orthogonaux : ij = Cor(Xi, Yj).


Si les Yj sont corrls, les Cor(Xi, Yj) sont donnes dans la Structure Matrix
55 .

10.2 Communaut et spcificit en AF orthogonale


Modle : Xi = i1Y1 + + imYm + ei
Dcomposition de la variance :

Var(X i ) 1

ij
j1

hi 2 =
communaut

i
Var(ei) =
spcificit

Communaut initiale et finale :

2
i

2
cor
(Xi , Yj )
j1

= R 2 (Xi ; Y1 ,..., Ym ) = communaut finale (extraction)


R 2 (Xi ; Autres X) = communaut initiale
(option autre que lACP)

56

10.3 Qualit de la dcomposition en AF orthogonale


Modle : Xi = i1Y1 + + imYm + ei
Dcomposition de la variance :
De

2
Var(Xi ) 1 i12 + ... + im
+ i

On dduit :
p

Var(Xi ) p
i 1

i1 ...
i

Variance
totale

Variance
explique
par Y1

im
i

Variance
explique
par Ym

Variance
rsiduelle
57

10.4 Mthodes des facteurs principaux


Modle : Xi = i1Y1 + + imYm + ei

Utilisation des formules de dcomposition :

Var(X i ) - i = h i2 =

Cor(Xi , X k ) =

i1

i1

i1

im


im

k1

im


km
58

Mthode des facteurs principaux


Exemple p=3 et m=2
1 0
R 0 2
0
0
h12

1 1 Cor(X1 , X 2 ) Cor(X1 , X 3 )

Cor(X
,
X
)
2
2
3

3
1 3
0
0

Cor(X1 , X 2 ) Cor(X1 , X 3 ) 11 12
11

2
h2
Cor(X 2 , X 3 ) 21 22
12

h3
31 32

21
22

Algorithme itratif : on part des communauts initiales, on estime


les saturations, puis on recalcule les communauts laide des
saturations. On itre jusqu convergence des communauts.

31
32

59

Application Kendall

a
u
r n
M

a
t
c
i
a
a
c
X
1
1
1
2
3
4
X
2
0
4
0
X
2
4
X
6
9
1
0
X
3
8
X
1
5
9
6
X
4
0
X
9
5
5
7
X
5
6
X
8
4
2
0
X
6
5
X
2
2
1
4
X
7
8
X
2
1
3
6
X
8
1
X
9
2
5
9
X
9
9
X
1
0
6
2
X
1
X
5
6
7
8
7
X
X
1
8
6
2
7
3
X
0
0
4
1
X
1
3
X
2
6
4
0
X
1
0
X
9
6
8
9
X
1
9
X
1
2
8
7
X
1
6

E
a
4

60

Application Kendall
ACP

Facteurs
principaux

Facteur principaux
+ rotation varimax

c e

o
o
g
f
f
e
S
S
n
T
V
o
u
V
o
l
u
a
F
a
o
l
t
a
a
l
a
t
a
r
a
t
a
a
t
r
i
t
1
3
7
9
4
6
4
6
0
7
7
1
1
1
2
3
8
8
2
7
6
3
0
9
6
4
4
5
3
3
1
2
0
0
6
2
0
1
7
0
1
5
4
2
1
7
6
9
2
1
8
0
7
4
1
7
5
9
8
9
6
3
5
4
7
1
2
6
8
0
6
2
9
6
6
8
1 0
8
2
9
1 1
9
5
4
1 2
3
0
5
1 3
5
4
8
1 4
4
9
8
1 5
5
2
0
E

61

Application Kendall

a
c

c
r
1
2
3
4
1
2
3
4
F
X
2
1
X
9
2
X
0
3
X
4
4
X
3
E
X
1
R
X
6
X
8
9 X
1
4 X
5 X
X
3
2
X
6
X
2
X
5
9
7

E
R
a
R

62

10.5 Mthode des moindres carres


2

Minimiser (rik rik )


ik

ik

rij i1 k1 ... im km
= Corrlation reproduite l'aide du modle

63

Application Kendall

a
n

a
t
c
i
3
1X
8
4X
2
1X
3
8X
8
6X
0
5X
1
9X
7
1X
3
9X
8
5X
0
3X
2
3X
4
0X
1
7X
5
6X

E
a
O
1
s
o
64

10.6 Mthodes des moindres carrs gnralise


Modle : Xi = i1Y1 + + imYm + ei, Var(ei) = i

(rik rik )2
Minimiser
ik
i
k

ik
o

rij i1 k1 ... im km
= Corrlation reproduite l'aide du modle

et

rik rik
Cor(Xi , X k | Y1 ,..., Ym ) Cor(ei , e k )
i
k

calcul sur les donnes.

65

10.7 Mthode du maximum de vraisemblance


Modle : Xi = i1Y1 + + imYm + ei , Var(ei) = i
Hypothse :
Les variables Xj suivent une loi multinormale de
moyenne et de matrice de covariance .

Notations :
S = matrice de covariances observe sur un chantillon de taille n
'
matrice de covariance reconstitue par le modle
C

Maximisation :
On recherche les saturations et les spcificits estimes
maximisant le logarithme de la vraisemblance des donnes :
1
1
1
L( S , C ) cste (n p 2) ln | S | (n 1) ln | C | (n 1) Tr C 1S
2
2
2
66

10.8 Test de validit du modle m facteurs


On rejette le modle m facteurs au risque de se tromper
si :
1
2 |C|

2 n 1 (2p 5) m Ln
12 ( )
6
3
|S|

o C est calcule par maximum de vraisemblance


1
et = (p m) 2 p m .
2

Remarque :
2
o

1
2 (sik cik )2

n 1 (2p 5) m
i
k
6
3 ik

sik cik
est une estimation de cor(Xi , X k | Y1,..., Ym )
i
k

67

Application aux donnes de Kendall

m=4

i
q
g

m=5

i
q
g

m =q
6
g

Ce test est connu pour rejeter trop facilement le modle.


68

11. Analyse Factorielle oblique


11.1. Les donnes
p variables alatoires X1,, Xp, en gnral centres-rduites.

11.2. Le modle
X1 = 11Y1 + + 1mYm + e1
..
.
Xi = i1Y1 + + imYm + ei
..
.
Xp = p1Y1 + + pmYm + ep
o :
- Les facteurs communs Yj peuvent tre corrls entre eux.
- Les facteurs spcifiques ei ,, em sont tous non corrls entre eux
et avec les facteurs communs.

69

Le modle

X1 = 11Y1 + + 1mYm + e1
..
.
Xi = i1Y1 + + imYm + ei
..
.
Xp = p1Y1 + + pmYm + ep

scrit aussi

X 1 11


X p p1

1m Y1 e1


pm Ym em

X = Y + e
70

Le modle de lanalyse factorielle oblique :


X = Y + e
E (YY ')
matrice des corrlations entre les facteurs communs
E (ee ')
matrice de covariance des facteurs spcifiques

E (XX') = E[(Y + e)(Y + e) ']


E (YY ') ' E (ee ')

'

71

12.3. Les mthodes de rotation oblique


Formule de dcomposition (p = 3, m = 2) :

1 Cor(X1 , X 2 ) Cor(X1 , X 3 )
R
1
Cor(X 2 , X 3 )

1
11 12
11

21 22
12

31 32

TT'

21
22

1 0
31
0 2

32
0
0

0
0
3

o = (TT)-1 est une matrice


de corrlation

72

Options SPSS
Direct Oblimin Method
A method for oblique (nonorthogonal) rotation. When delta
equals 0 (the default), solutions are most oblique. As delta
becomes more negative, the factors become less oblique.
To override the default delta of 0, enter a number less than or
equal to -0.8.
Promax Rotation
An oblique rotation, which allows factors to be correlated.
This rotation can be calculated more quickly than a direct
oblimin rotation, so it is useful for large datasets.
73

Application aux donnes de Kendall

Matrice des corrlations entre les facteurs

Component Correlation Matrix


Component
1
2
3
4

1
1.000
.325
.452
.046

2
.325
1.000
.156
.074

3
.452
.156
1.000
-.021

4
.046
.074
-.021
1.000

Extraction Method: Principal Component Analysis.


Rotation Method: Oblimin with Kaiser Normalization.

74

Matrice des saturations ih


Pattern Matrixa

x5
x11
x8
x6
x10
x12
x13
x9
x1
x15
x7
x4
x2
x3
x14

1
.999
.968
.967
.871
.787
.750
.637
-.049
-.038
.263
.026
-.056
.332
.000
.291

Component
2
3
-.259
-.015
.020
-.087
.068
-.110
-.041
.096
.237
-.007
.126
.195
.206
.298
.870
-.094
.853
.066
.767
-.018
-.304
.911
.209
.903
.071
.349
.085
.016
.321
.472

4
-.054
-.037
-.053
.010
-.052
.150
.232
.191
-.153
.069
.027
-.067
.236
.929
-.519

Extraction Method: Principal Component Analysis.


Rotation Method: Oblimin with Kaiser Normalization.
a. Rotation converged in 8 iterations.

Difficile interprter car les facteurs sont corrles entre eux.


75

Matrice des Cor(Xi, Yj)


Structure Matrix

x8
x11
x5
x6
x12
x10
x13
x2
x15
x9
x1
x4
x7
x14
x3

1
.937
.934
.906
.902
.886
.858
.849
.523
.507
.200
.261
.417
.339
.585
.078

Component
2
3
.361
.339
.318
.354
.059
.398
.257
.483
.411
.550
.488
.386
.477
.613
.251
.505
.855
.219
.853
.016
.839
.185
.326
.912
-.152
.874
.451
.665
.157
.010

4
.000
.011
-.027
.045
.190
.002
.270
.249
.138
.255
-.093
-.072
-.013
-.492
.935

Extraction Method: Principal Component Analysis.


Rotation Method: Oblimin with Kaiser Normalization.

Cette matrice est plus naturelle interprter.

76

Matrice des Cor(Xi, Yj) amliore


Structure Matrix

x8
x11
x5
x6
x12
x10
x13
x2
x15
x9
x1
x4
x7
x14
x3

1
.937
.934
.906
.902
.886
.858
.849
.523
.507

.585

Component
2
3

.550
.613
.505
.855
.853
.839
.912
.874
.665
.935

Extraction Method: Principal Component Analysis.


Rotation Method: Oblimin with Kaiser Normalization.

Cette matrice est encore plus facile interprter.

77