Vous êtes sur la page 1sur 27

Bienvenue

Analyse factorielle en composantes principales


Introduction

Les analyses factorielles sont des méthodes de


factorisation analysant les relations entre les
variables afin de mettre en évidence leur proximité
ou leur indépendance.

Double objectif :
• Résumer et condenser l’information initiale
• Organiser et structurer les liens qui existent entre
groupes de variables
Niveau conceptuel des données

Item 1 (X1)
Item 2 (X2)
… Variable Hypothèse 1
OUTPUT Y
Item i (X3) latente X


Item k (Xk)
Exemple de variable latente

Questionnaire

Variable latente : INTENTION D'AGIR Echelle de Likert


Item Libellé 1 2 3 4 5
Item 1 Je veux bien prendre des mesures (changer de comportement et de mode de vie)
x
pour réduire mon impact individuel sur le changement climatique
Item 2 Je veux bien changer mes habitudes de conduite en voiture pour réduire ma
x
contribution au changement climatique
Item 3 Je veux bien sacrifier un certain niveau de confort personnel (par exemple - régler
x
le thermostat à un niveau inférieur) pour aider à atténuer le changement climatique
Item 4 Je veux bien soutenir les mesures de politique liées à la réglementation sur le
changement climatique
Item 5 Je veux bien accepter les stratégies de changement climatique x
Item 6 Je veux bien mettre plus de temps et d'effort physique en faveur de ce qui pourrait
x
atténuer le changement climatique
Item 7 Je veux bien sacrifier certaines activités de loisirs pour réduire mon impact sur le
x
changement climatique
Exemple de variable latente

Données
Principe de l’ACP

n variables
2 variables 3 variables

?
Conditions d’application de l’ACP

• Nombre de variables : >= 5

• Type de variable :
« au moins échelle d‘intervalle ».

• Nombre d’observations :
> 10*nb. de variables

• « Singularité »
(pas de variables prédites par d’autres)
Les étapes de l’ACP

• Vérifier si les conditions d’application sont respectées


• Extraction des facteurs (diagonalisation/saturation)
• La rotation des facteurs
• La définition des facteurs
• L’interprétation des résultats du point de vue
décisionnel
Exemple d’application

Sept téléphones portables nommés T1, T2, …, T7 ont été comparés en


Téléphones PRIX VOLUME POIDS
observant les caractéristiques suivantes : le prix - PRIX (€), leAUTOV
volume - AUTOC
VOLUME (mmT1 3), le poids 159
- POIDS (g), l’autonomie92en veille - 450
85050 AUTOV 4,0
(heures) et l’autonomie
T2 en 299
communication
54277 - AUTOC 91(heures). Les
348 noms en3,5
italique représentent
T3 les libellés
399 des items.
94529 115 288 3,5
T4 89 80496 91 300 3,0
T5 399 98980 125 300 3,0
T6 399 80370 115 220 3,0
T7 449 75871 115 204 2,8
Conditions d’application de l’ACP

• Taille de l’échantillon : 7
• Type de variable : métrique
• Transformation en variables centrées réduites

Téléphone zPRIX zVOLUME zPOIDS zAUTOV zAUTOC


T1 -1,11554 0,25383 -0,98997 1,80724 1,75325
T2 -0,10329 -1,86732 -1,05927 0,56650 0,57318
T3 0,61974 0,90720 0,60388 -0,16335 0,57318
T4 -1,62166 -0,06008 -1,05927 -0,01738 -0,60689
T5 0,61974 1,21400 1,29686 -0,01738 -0,60689
T6 0,61974 -0,06876 0,60388 -0,99051 -0,60689
T7 0,98126 -0,37887 0,60388 -1,18514 -1,07892
Validation de la cohérence de
l’ensemble des variables
• Choix des variables

• Pertinence (S’assurer que les variables cohérentes les unes avec les autres)
• Exhaustivité (S’assurer que toutes les informations nécessaires pour l’étude du problème ont bien été
introduites)

• Matrice des corrélations /significativité

• « Singularité » des variables (liées mais non prédites)

• Test de sphéricité de Bartlett


Le principe du test est simple : l’hypothèse H0 statue la matrice de corrélation = matrice d’identité (c'est-à-
dire que toutes les corrélations sont nulles).

• Indice KMO (>0,5)


l’indice permet de vérifier si les liens spécifiques entre paires de variables (les corrélations partielles) sont
significativement faibles en mesurant la différence d’amplitude entre les coefficients de corrélation et les
corrélations partielles.
Méthodes d’extraction des facteurs

• Composantes principales (AFCP)


• Moindre carrés non pondérés
• Moindre carrés généralisés
• Maximum de vraisemblance
• Factorisation en axes principaux
• Alpha-maximisation
• Factorisation en projections
Matrice des composantes (facteurs)

Matrices des composantes ou (corrélations Facteurs – Variables ou coefficients factoriels)


Facteur1 Facteur 2 Facteur 3 Facteur 4 Facteur 5
zPOIDS 0,917 0,366 0,123 0,087 -0,040
zAUTOV -0,885 0,394 0,126 0,212 0,009
zPRIX 0,836 0,032 0,546 0,013 0,031
zAUTOC -0,786 0,423 0,424 -0,152 -0,015
zVOLUME 0,369 0,864 -0,338 -0,060 0,019

Les carrés des coefficients factoriels (variance « expliquée »)


Facteur 1 Facteur 2 Facteur 3 Facteur 4 Facteur 5 Total
zPOIDS 0,842 0,134 0,015 0,008 0,002 1,000
zAUTOV 0,784 0,155 0,016 0,045 0,000 1,000
zPRIX 0,699 0,001 0,298 0,000 0,001 1,000
zAUTOC 0,618 0,179 0,180 0,023 0,000 1,000
zVOLUME 0,136 0,746 0,114 0,004 0,000 1,000
Valeurs propres : 3,079 1,215 0,624 0,080 0,003 5,000
Variance expl. % : 61,57 24,30 12,48 1,59 0,06 100,00
Le nombre de facteurs à retenir

3,5

2,5
Valeurs propores

1,5

0,5

-0,5
1 2 3 4 5
Facteurs
La qualité de représentation
(communautés)

Matrice des saturations = facteurs significatifs de la matrices des composantes


Variables Facteur 1 Facteur 2
zPOIDS 0,917 0,366
zAUTOV - 0,885 0,394
zPRIX 0,836 0,032
zAUTOC - 0,786 0,423
zVOLUME 0,369 0,864

La qualité de représentation (= somme des carrés des coefficients factoriels ci-dessus)


Variables Initial (5 facteurs) Extraction (2 facteurs)
zPOIDS 1,000 0,976
zAUTOV 1,000 0,939
zPRIX 1,000 0,700
zAUTOC 1,000 0,797
zVOLUME 1,000 0,882
Total 4,294
Significativité des saturations

Taille d’échantillon Saturations


350 0,30
250 0,35
200 0,40
150 0,45
120 0,50
100 0,55
85 0,60
70 0,65
60 0,70
50 0,75
Rotation des facteurs
F2
F2

X3
F1
X1

X2

F1

X4
X5
Décider d’effectuer une rotation
Les saturations après la rotation « varimax »
Facteurs
Variables
1 2
zAUTOV 0,968 -0,047
zAUTOC 0,892 0,024
zPRIX -0,733 0,404
zVOLUME 0,059 0,937
zPOIDS -0,655 0,740

Les carrés des coefficients factoriels (variance « expliquée »)


Facteurs
Variables
1 2
zAUTOV 0,937 0,002
zAUTOC 0,796 0,001
zPRIX 0,537 0,163
zVOLUME 0,003 0,878
zPOIDS 0,429 0,548
 Contribution² : 2,702 1,592
Variance totale « expliquée » (en %) 54,050 31,831
Interpréter les facteurs

• Affecter les variables aux facteurs


• Dénommer les facteurs
• Identifier et interpréter les variables « ambivalentes »
Affectation d’une variable à un
facteur
Facteurs
Variables
1 2

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831


Dénommer les facteurs

Facteurs
Variables
1 2

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831


Variables « ambivalentes »

Facteurs
Variables
1 2

zAUTOV 0,937 0,002

zAUTOC 0,796 0,001

zPRIX 0,537 0,163

zVOLUME 0,003 0,878

zPOIDS 0,429 0,548

Contribution : 2,702 1,592

Variance totale « expliquée » (en %) 54,050 31,831


Eviter les interprétations abusives

Les variables introduites dans l’analyse doivent être justifiées en


regard de la problématique traitée et s’appuyer éventuellement sur
des concepts théoriques ou, sur des hypothèses liant le choix des
variables au problème à étudier.
Les scores factoriels

• Les méthodes de calcul


• Simples
• Somme des valeurs initiales
• Somme des valeurs initiales au dessus d’un seuil
(cut-off value)
• Somme pondérée des coefficients factoriels

• Elaborées
• Méthode de Regression
• Facteurs de Bartlett
• Méthode d'Anderson-Rubin
… et au niveau conceptuel

Item 1
Item 2
Facteur 1
Item 4
Item 6
OUTPUT

Item 3
Facteur
Item 2
2
Item 7
Les cartes perceptuelles

Projection des variables dans l’espace des facteurs après rotation


Les cartes perceptuelles

Nuage de points des téléphones dans l'espace des scores factoriels

Vous aimerez peut-être aussi