Académique Documents
Professionnel Documents
Culture Documents
Master en GIE
El kettani Moummou
Les composantes principales CP's peuvent aussi êtres obtenues pour les variables
centrées réduites. Soient
X1 − µ1 X2 − µ2 Xp − µp
Z1 = √ , Z2 = √ , . . . , Zp = √
σ11 σ22 σpp
"p" variables telles que E (Zi ) = µi et VAR(Zi ) = σii pour "i = 1, 2, . . . , p "
Forme matricièlle
1 1 1
Z = V − 2 (X − µ) avec COV (Z ) = V − 2 ΣV − 2
Ou on a
√
σ11 0 ··· 0
..
1 0 . ... 0
V 2 =
. . .. .
. . .
. . . .
√
0 0 ··· σpp
⋆ Resulta3
La i-ème composante principale des variables standards Z = (Z1 , Z2 , . . . , Zp ) avec
matrice de covariance COV (Z ) = ρ est donnée par
1
Yi = ξi′ Z = ξi′ V − 2 (X − µ) i = 1, 2, . . . , p
De plus, on a
p
X p
X
VAR(Yi ) = VAR(Zi ) = p
i=1 i=1
et
Coecients de corrélation
p
ρYi ,Zk = ξik λi i = 1, 2, . . . , p
Dans ce cas, "(λi , ξi ); i = 1, 2, . . . , p " sont les valeurs et les vecteurs propres de
la matrice ρ ( on suppose que λ1 ≥ λ2 ≥ . . . . ≥ λp ≥ 0)
Proportion de λk
= ; k = 1, 2, . . . , p
la k-ième CP p
• Exemple :Comparaison entre les CP's obtenues à partir des deux matrices, de
Covariances et de corrélations.
Considérer la matrice de covariance suivante
1 4
Σ=
4 100
♦ Rappel
Pour toute combinaison linéaire
on a
Test de corrélations
Pour savoir si les variables "X1 , X2 , . . . , Xp " sont corrélées, on peut calculer la matrice de corrélation en appliquant
ensuite un test qui évalue si le modèle obtenu est signicatif dans son ensemble.
1 Test KMO
Le test KMO (Kaiser, Meyer et Olkin) relie les coecients de corrélation "rij " , observés entre les variables xi
et xj, de telle sorte que plus la valeur du test KMO est proche de 1, plus la relation entre les variables sera
élevée .
KMO≥ 0.9 KMO≥ 0.8 KMO≥ 0.7 KMO≥ 0.6 KMO≤ 0.5
le test est le test est le test est le test est le test est
très bon bon moyen faible très faible
2 Test de Bartlett
Le test de sphéricité de Bartlett évalue également l'applicabilité de l'analyse pour les variables étudiées. Le
test est basé sur le fait que plus la corrélation entre les variables est faible, plus le nuage de points associé
aux données considérées est sphérique. Ainsi, le modèle est signicatif (on accepte l'hypothèse nulle H0 )
quant à l'adéquation de l'application des composantes principales, selon le critère suivant :
1 si Sig.(p-valeur)< 0.05. Nous acceptons l'hypothèse nulle : il est logique d'appliquer l'analyse des
CP's
2 si Sig.(p-valeur)> 0.05. Nous rejetons l'hypothèse nulle : il n y a n'a pas de sens d'appliquer l'analyse
du CP's
La principale question dans l'analyse factorielle est de savoir si les données sont
conformes à une structure prescrite.
Xi = µi + αi 1 F1 + αi 2 F2 + . . . + αim Fm + ϵi ; i = 1, 2, . . . , p
Forme matricièlle
X − µ = LF + ϵ (1)
ou ona
µ = (µ1 , µ2 , . . . , µp )′ ; L = (αij )i=1,2,...,p et ϵ = (ϵ1 , ϵ2 , . . . , ϵp )′
j=1,2,...,m
Quelques nomenclatures :
1 µi : la moyenne de la variable Xi
2 αij : les coecients de pondérations(ou de charge)de la variable i sur le
facteur j
3 L : la matrice de pondérations
Pour faciliter notre tache, on va supposer ( des hypothèses qui peuvent être
vériées) que :
E (F ) = 0; Cov (F ) = E (FF ′ ) = I
E (ϵ) = 0; Cov (ϵ) = E (ϵϵ′ ) = ψ = Diag (ψi )i=1,...,p
1. Comme le souligne Maxwell [1977], dans de nombreuses enquêtes, les ϵ ; ont tendance à être des combinaisons
d'erreur de mesure et des facteurs qui sont uniquement associés aux variables individuelles.
El kettani Moummou L'Analyse des Données pour la GIE 13 / 22
Analyse Factorièlle
Le Modèle Factoriel Orthogonal
2. le cas ou les facteurs F présenent une corrélation de sorte que Cov (F) ne soit pas diagonal donne le modèle à
facteurs obliques. Le modèle oblique présente quelques dicultés d'estimation supplémentaires et ne sera pas abordé
dans notre cours
El kettani Moummou L'Analyse des Données pour la GIE 14 / 22
Analyse Factorièlle
Le Modèle Factoriel Orthogonal : Structure de la covariance
1 Cov (X ) = LL′ + ψ
ou bien
Var (Xi ) = αi21 + αi22 + . . . + αim 2 +ψ
i
Cov (Xi , Xk ) = αi 1 αk 1 + αi 2 αk 2 + . . . + αim αkm
2 Cov (X , F ) = L
ou bien
Cov (Xi , Fj ) = αij
♦Noter bien
En cas où le nombre de facteurs m est bien inférieur à p la plupart des matrices
de covariance ne peuvent pas être factorisées comme LL′ + ψ (Malheureusement
pour l'analyste factoriel).
•Exemple
Considérer X1 , X2 , X3 trois variables observables, de matrice de covariance
(dénie positive)
1 0.9 0.7
Σ = 0.9 1 0.4
0.7 0.4 1
♦Noter bien
Procédure
L'analyse du modèle factoriel se réalise en imposant des conditions qui permettent
d'estimer de manière unique les matrices L et ψ
Est ce que le modèle factoriel (1) représente-t-il adéquatement les données, avec
un petit nombre de facteurs ?
Considérer une matrice de covariance Σ avec les variables et les vecteurs propres
respectives (λ1 , ξ1 ), (λ2 , ξ2 ), . . . , (λp , ξp ) tels que λ1 ≥ λ2 ≥ . . . ≥ λp , alors la
décomposition spectrale nous ore une décomposition de la matrice Σ:
√. . . ′
λ2 ξ2
√ √
. . .
= λ1 ξ1 .. λ2 ξ2 )....... λp ξp
p ...
.
.
.
p. . . ′
λ p ξp
Cela correspond à la structure de covariance prescrite pour le modèle d'analyse
factorielle ayant autant de facteurs que de variables (m = p) et des variances
spéciques ψi = 0 pour tout i : Σ = LL′ + ψ
El kettani Moummou L'Analyse des Données pour la GIE 19 / 22
Analyse Factorièlle
Le Modèle Factoriel Orthogonal :Méthodes d'éstimation
• Approche
Lorsque les dernières p − m valeurs propres sont petites en valeurs , alors une
de stechniques consiste à négliger la contribution de
′ ′ ′
λm+1 ξm+1 ξm+ 1 + λm+2 ξm+2 ξm+2 + . . . + λp ξp ξp
√
λ1 ξ1′
√. . . ′
p λ 2 ξ2
.p . .p
. . . ...
Σ= λ1 ξ1 . λ2 ξ2 )..... λm ξm = LL′ (2)
.
.
.
√... ′
λ m ξm
• Noter bien
Cette approximation (2)prend les ϵ de la relation (1) comme facteurs
spéciques d'importance mineure et peuvent également être ignorés dans la
factorisation de Σ Par contre si des facteurs spéciques sont inclus dans le
modèle, leurs variances peuvent être prises comme les éléments de la diagonal de
Σ − LL′ . Par suite on aura la relation :
Σ = LL′ + ψ √
λ1 ξ1′
√. . . ′
ψ1 0 ... 0
λ 2 ξ2
√ .√ . .√
0 ψ2 0 0
= λ1 ξ1 .. λ2 ξ2 )....... λm ξm ... + ..
.. .
.
. . ... . .
.
.
0 0 ... ψp
√... ′
λ m ξm
avec
m
αij2 i = 1, 2, . . . , p
X
ψi = σii −
j=1
El kettani Moummou L'Analyse des Données pour la GIE 21 / 22
Analyse Factorièlle
Le Modèle Factoriel Orthogonal :Méthodes d'éstimation
′ xj 1 − x¯1 xj 2 − x¯2 xjp − x¯p
zj = √ , √ ,..., √ , j = 1, 2, . . . , n
s11 s22 spp