Vous êtes sur la page 1sur 49

« l’Analyse en Composantes

Principales (ACP) » : Aperçu


théorique et pratique

Abdelaziz BAHOUSSA
• D éfinition, objet et principe de l’A C P
• P rincipales étapes de l’A C P
• A pplications (sur logiciels)
Introduction

P rocessus de m ise en œ uvre d’une recherche com m erciale


Recherche et collecte
des données

Statistiques
à U ne, deux Présentation et analyse
des résultats
O u plusieurs
D im ensions
Synthèse et interprétation

ACP
Recommandation/Décision
Définition, objet de l’ACP

L ’analyse en com posantes principales (A C P ) est


es
m éthode d’analyse de données, qui a pour
de ob
décrire et de résum les
er inform ations
quantitatives
relatives à l’observationP caractères
de m esurés sur un
échantillon de
n individus, afin de com prendre com m e
les effets de phénom ènes a priori
isolésse com binent.
Principe de l’ACP

 Réduire le nombre de variables initiales à une, deux


ou trois au maximum, afin de pouvoir présenter les
individus dans un espace à une , deux ou trois dimensions
pour nous en faciliter la perception et l’interprétation.

 Le rôle de l’ACP est de déterminer ces deux ou trois


axes qui expliquent le mieux la dispersion des points
disponibles.
Principales étapes de l’ACP

• Définir les objectifs de l’analyse;


• Préparer et vérifier les données:
calculer la moyenne, l’écart- type, corrélation

• Traitement:
Présenter le nouveau tableau

Calculer la matrice de corrélation

Logiciels Calcul Rechercher un espace de représentation

Projection et mesure de la qualité d’ajustement:


1- Transformation du tableau

Prenons le tableau suivant, correspondant à p caractères mesurés sur


un échantillon de n individus
X11 X12 … … X
. … 1p

..

..Xij
M= Xi1 Xi2
..
Xip

..

Xnj .
Xn1 Xn2 Xnp
.
1- Transformation du tableau

On centre et on réduit les variables si les


variables ont des unités et des échelles de
mesures très disparates. Signalons aussi qu’il
est utile, notamment pour le calcul direct de
la matrice des corrélations, de diviser chacun
des termes Xij par racine carrée de n .

Avec ces transformations, on est donc passé


d’un tableau initial M, au tableau M’
déterminé comme suit :
M’= (Xij - Xj)/ n
2- Calculer la matrice de corrélation

• Une fois la matrice M transformée en M’, il


suffit de la multiplier par sa transposée pour
obtenir la matrice de corrélation (puisqu’on a
réduit la matrice initiale) :

La matrice de corrélation V = M’. Mt

• Cette matrice de corrélation est carrée,


symétrique et réelle. Elle est donc
diagonalisable.
3- Rechercher un espace de représentation

choix des axes factoriels 


:
P our déterm iner l'espace de projection à inertie expliquée m axim al
déterm iner ses k axes. L e prem ier est l'axe à inertie expliquée m et
axim
pour le déterm iner il suffit chercher
de l'axe associé au prem ier vecteur pr
de la m atrice. V
O n désignera par U 1 le vecteur associé à la plus grande valeur propre
« L im bda1 ». L 'inertie expliquée par cet axe est égale à sa valeur propre.
% d’inf restitué par U1=

Si nous nous intéressons à ce stade aux résultats fournis par les logiciels
d'analyse de données nous remarquerons que dans les sorties de l'ACP
la liste des p valeurs propres est triée selon l'ordre décroissant
Évaluer la variance expliqué et apprécier la qualité
de représentation

Va ria n c e e x p liq u é e to ta le

Va le u rs p ro p re s in itia le s S o m m e s d e s c a rré s c h a rg é e s
% d e la % d e la
C o m p o s a n te To ta l va ria n ce = = % cu m u lé s To ta l va ria n ce = = % cu m u lé s
1 3 ,7 0 1 5 2 ,8 6 7 5 2 ,8 6 7 3 ,7 0 1 5 2 ,8 6 7 5 2 ,8 6 7
2 1 ,9 0 4 2 7 ,1 9 6 8 0 ,0 6 3 1 ,9 0 4 2 7 ,1 9 6 8 0 ,0 6 3
3 ,6 3 0 9 ,0 0 4 8 9 ,0 6 7
4 ,5 2 9 7 ,5 6 4 9 6 ,6 3 0
5 ,1 9 7 2 ,8 1 4 9 9 ,4 4 4
6 3 ,1 8 1 E -0 2 ,4 5 4 9 9 ,8 9 9
7 7 ,0 7 7 E -0 3 ,1 0 1 1 0 0 ,0 0 0
M é th o d e d 'e x tra ctio n : A n a lyse d e s p rin cip a u x co m p o s a n ts .
4- Projection et mesure de la qualité
d’ajustement
la qualité de la représentation d’un point sur un axe: C'est le carré du cosinus de l'angle
formé par l'axe U1 et le point Xi. Nous avons d'ailleurs la relation:

Un individu donné est d’autant mieux représenté sur un


axe, que son cosinus carré est proche de 1 ; il est
d’autant mal représenté que son cosinus carré est
proche de 0
1- Conditions
à l ’exécution d ’une analyse
factorielle
KMO : Nous renseigne si la distribution des
valeurs est adéquate pour exécuter une analyse
factorielle:

– > 0,9 merveilleux !


– > 0,8 méritoire (idéal)
– > 0,7 moyen (acceptable)
– > 0,6 médiocre
– > 0,5 misérable L’analyse factorielle ne
– < 0,5 merdique ! peut être conduite
Conditions … suite!

Test Bartlett de la sphéricité


– Mesure de la normalité de la
distribution
– Critère: significatif < 0,05
Conditions … suite!

Matrice des corrélations:


Nous permet de savoir si les variables
actives sont elles factorisables ou pas
2- Extraction des facteurs

1ère étape: SPSS sélectionne la combinaison d ’énoncés


intercorrélés et qui expliquent le plus grand % de variance.

2ème étape: SPSS extrait une autre combinaison


d ’énoncés intercorrélés et qui expliquent le plus grand %
de variance qui reste.

Ainsi de suite pour les autres facteurs… (SPSS calcule


autant de combinaisons qu’il y a d’énoncés).
3- Sélection des facteurs

Problème:facteurs pas tous signifiants


Critères de sélection:
– valeur propre > 1
– % variance expliquée: minimum 60%
– variance au niveau de la valeur propre doit être importante
 le
« scree plot » permet de bien visualiser les écarts entre le
valeurs propres

« Scree plot »
– courbe illustrant la variance entre les valeurs propres de chaque
combinaison d ’énoncés (facteurs)
Choix des composantes principales

Graphique des valeurs propres


4

3
propre

1
Va le u r

0
1 2 3 4 5 6 7

Numérodecomposant
Rotation
Structure factorielle originale est adéquate mais
difficile à interpréter.
Rotations orthogonales: VARIMAX
F1 F1 F2

* * * *
*
* * * * *
* * *
* * * *
*
F2
* * *
* * * *
* * * * * *
* * *
* * *
*
Applications

P résentation, traitem ent et interprétation des résul


résu
d’une A C P : utilisation des logiciels
4- Interprétation des composantes principales:

Matrice des composantes a

Composante
1 2
Nombre d'entreprises ,975
Nombre de lignes
,972
téléphoniques
Poupulation en milliers ,960
Superficie (en Km2) ,685 ,323
Nombre de brevts
,571 ,416
déposés
Popo.Active/Pop.tot -,145 ,932
Taux de chômage(%) ,261 -,865
Méthode d'extraction : Analyse en composantes principales.
a. 2 composantes extraites.
L’Analyse en composantes principales (ACP)

corrélations entre les variables et les composantes


1,0 popo.active/pop.tot
A c t iv i t é E c o n o m iq u e A c t u e lle

,5 nombre de brevts dép


superficie (en km2)

nombre d'entreprises
0,0 nombre de lignes
poupulation tél
en milli

-,5

taux de chômage(%)

-1,0
-1,0 -,5 0,0 ,5 1,0

Potentiel de développement
Etape8 : Visualisation des individus sur les composantes principales:

2 Rhône Alpes

Alsace
Centre
Chapagne Ardenne
1
A c tiv ité e c o n o m iq u e a c tu e lle

Bourgogne
Franche
LimousinComté Midi-Pyrénnées
Basse-Normandie Pays de Loire
Auvergne
0 Aquitaine
Bretagne
Poitou Charentes
Haute Normandie
Loraine
Provence - Côte d'Az
Pircadie
-1

-2 Lauguedoc Rousillon
Nord Pas de calais

-3
-2 -1 0 1 2 3

potentiel de développement économique


La qualité de représentation

Qualité de représentation

Initial Extraction
Poupulation en milliers 1,000 ,927
Popo.Active/Pop.tot 1,000 ,890
Superficie (en Km2) 1,000 ,573
Nombre d'entreprises 1,000 ,950
Nombre de brevts
1,000 ,499
déposés
Taux de chômage(%) 1,000 ,817
Nombre de lignes
1,000 ,948
téléphoniques
Méthode d'extraction : Analyse des principaux composants.
Application SPSS

Démonstration
R a c c o u rc i v e rs s p s s w in .ln k
Démarrer SPSS: Ouvrir une source de données
Saisir les variables: Affichage des variables
R a c c o u rc i v e rs s p s s w in .ln k
Saisir les données: Affichage des données
R a c c o u rc i v e rs s p s s w in .ln k
Application ACP: Procédure de traitement
R a c c o u rc i v e rs s p s s w in .ln k

2 3
Introduction des variables actives
R a c c o u rc i v e rs s p s s w in .ln k

4
R a c c o u rc i v e rs s p s s w in .ln k

5
R a c c o u rc i v e rs s p s s w in .ln k

6
Raccourci vers spsswin.lnk

7
R a c c o u rc i v e rs s p s s w in .ln k

8
Raccourci vers spsswin.lnk

9
R a c c o u rc i v e rs s p s s w in .ln k Validation de l’analyse

10
Analyse en composantes
principales (ACP):

Implantation d’Acima
sur Settat
Tableau de contributions

Axe 1 Axe 2
(+ 7 0 .8 % ) (+ 2 2 .4 % )

C O N T R IB U T IO N S d ive rs ité d e c h o ix + 2 7 ,0 % p ro x im ité + 7 5 ,0 %


P O S IT IV E S
d isp o n ib ilité d e s p ro d u its + 2 5 ,0 % q u a lité d e s e rv ic e + 1 5 ,0 %
p rix + 2 2 ,0 % d is p o n ib ilité d e s p ro d u its + 3 ,0 %

C O N T R IB U T IO N S p ro x im ité -2 ,0 % p rix -5 ,0 %
N E G AT IV E S
Nomination des axes

• Pour la nomination des axes, il a été question de retenir


les variables dont la contribution à l’explication de
l’axe est supérieure à (1/5) %.
• Ainsi pour les contributions positives, nous avons
retenu la DIVERSITE DE CHOIX, la DISPONIBILITE
DES PRODUITS, et le PRIX que nous avons regroupé
sous la dénomination l’OFFRE et ceci concernant le
premier axe.
• Pour le deuxième axe, nous avons retenu, seulement, la
PROXIMITE concernant les contributions positives.
Nous avons donc retenu le même nom pour la
dénomination de l’axe, soit PROXIMITE.
Diagramme de corrélations 

proximité

disponibilité des produits


0,96
qualité de service 0,75
0,89 0,60
prix 0,80
0,95
diversité de choix

coef.>0,85

0,85>coef.>0,70

0,70>coef.>0,50
Variables corrélées entre elles
• D’après ce diagramme, la qualité de service est expliquée
par la disponibilité des produits recherchés par les
clients représentant une corrélation de 96% on peut dire
alors que la perception des clients du service offert par
un magasin est liée par la disponibilité des produits.
• Une corrélation de (90%) entre la diversité de choix et le
prix. Les interviewés considèrent donc qu’un magasin
qui procure une large diversité de choix, offre
simultanément une meilleur politique prix
• I l existe également une corrélation positive et linéaire
entre «  diversité de choix  » et «  disponibilité des
produits  », ainsi les répondants jugent que,
généralement, les enseignes qui offrent une grande variété
de choix, connaissent moins de rupture de stocks.
Cercle de corrélations 

proximité

qualité de service

disponibilité des produits

diversité de choix

prix
Proximité

acima

label vie aswak assa


super sol marjane Offre

metro
Positionnement des marques

     Pour l’enseigne Marjane : on remarque qu’elle est très bien placée


en terme « D’offre » puisque, en effet, la majorité des répondants lui
confère la diversité, la disponibilité des produits et les prix
accessibles. Tandis que le critère « Proximité » représente un point
faible pour cette enseigne qui se caractérise par sa grande taille,
l’obligeant ainsi à se placer dans les périphéries de la ville.
 
     Concernant « Acima » et Asswak Assalam : Etant moyenne, leur
surface ne leur permet pas d’afficher une aussi grande panoplie de
produits que Marjane, ce qui explique leur position sur la carte pour
l’axe « Offre ». Par contre, elle leur permet d’avoir un avantage
concurrentiel en terme de « Proximité » car toutes les deux sont
jugées les plus proches du client.
 
Positionnement des marques

• L’enseigne Métro : Etant positionnée dans le cadran délimité


par la partie négative de l’axe « Proximité » et la partie
positive de l’axe «Offre » -prés de l’origine-, Métro est perçue
comme une surface difficilement accessible pour les clients et
jouissant d’une offre très modeste.
 
     Enfin les deux enseignes Label vie et Super sol : elles sont
mal positionnées en terme d’ «Offre ». La majorité des
répondants leur reproche la rupture des stocks fréquente, et
l’absence de la diversité de produits. Cependant, ils leur
confère, comme même, un positionnement assez bien pour
« la proximité » du fait qu’elles se caractérisent par une taille
moyenne en terme de surface.
Classification Typologique :
Subdivision de la population en classes

Proximité Disponibilité Qualité de s Prix(Acima) Diversité de


CLASSIFICATION11 (Acima) des produit ervice(Acim choix(Acim
s(Acima) a) a)

Classe n° 1 7,19 5,38 5,50 5,13 5,50


Classe n° 2 7,73 7,70 7,53 7,93 7,91
Classe n° 3 2,50 7,75 7,25 7,25 9,00
TOTAL 7,27 7,30 7,16 7,41 7,54
Proximité (Acima)

Classe n° 2

Prix(Acima)
Qualité de service(Acima)

Classe n° 1 Disponibilité des produits(Acima)

Diversité de choix(Acima)

Classe n° 3
Spécificités des classes
    La classe 1  : elle est constituée des personnes
insatisfaites de la qualité de l’offre de ACIMA,
notamment la diversité et la disponibilité des produits.

    La classe 2 : ce sont essentiellement les personnes


satisfaites de tous les attributs que cela soit en terme
de proximité ou en terme de qualité de l’offre.
 
    La classe 3  : c’est une classe insatisfaite beaucoup
plus de l’emplacement d’ACIMA, alors qu’elle lui
confère la qualité de service, diversité et disponibilité de
produits ainsi que les prix abordables.

Vous aimerez peut-être aussi