Vous êtes sur la page 1sur 33

L’Analyse en Composantes Principales :

A.C.P.

El Mostafa ATOUBI
22/11/2020 1
L’Analyse en Composantes Principales : A.C.P.

 Le simple fait de savoir comment utiliser un


logiciel n’est pas une garantie d ’une analyse
statistique valide.

 Une bonne connaissance de la statistique


est nécessaire pour savoir quelle méthode
choisir, pourquoi et comment interpréter
les résultats.

22/11/2020 2
L’Analyse en Composantes Principales : A.C.P.

Le programme:

 Analyse en composantes principales

 Analyse typologique

 Analyse factorielle des correspondances

ADD R.JAHIDI 22/11/2020 3


L’Analyse en Composantes
Principales : A.C.P.
Objectif :
Réduction des dimensions au niveau des
variables
Visualisation des individus

22/11/2020

4
sold ndec mdec nbpr nemp memp vadd depo retr
2305 7 2,3 0 1 8,5 -2 3,1 0,7
15259 0 0 3 1 25 9 500 0
1236 10 5,4 1 0 0 3 6 2
8241 1 0,1 6 4 210 4 32 36
6210 2 0,3 5 3 113 3 150 80,5
6871 1 3 6 4 200 3 125 98
1580 9 6,1 2 1 8 2 6,5 5,5
9630 1 4 5 3 111 4 225,2 110,5
4230 3 2,7 2 0 0 1 5,1 20
3620 5 9,8 1 1 81 -3 7,2 3,1
10258 0 0 6 4 310 5 251,7 253,7
23698 1 2,9 2 0 0 12 523,2 2
3698 0 0 1 1 5 -2 1,5 3,2
231 12 8,9 1 0 0 -1 0,5 0,1
501 0 0 1 1 0 -3 10,2 10,1
3693 0 0 2 0 0 2 1,2 21,5
963 1 0,9 1 0 8,5 -1 105,1 5,1
15802 0 0 2 0 250,7 10 610,6 0,1
502 6 3 2 2 0 1 61,2 0,8
7896 1 6 6 3 0 3 187,5 98,1
23698 0 0 3 0 155 12 916,2 8,1
27896 1 2,3 3 0 15 15 523,2 0
5687 1 3,6 5 3 25 3 261 110
1269 0 0 1 2 0 -1 51,3 5,1
3687 3 0,6 2 1 0 -2 0,1 52
9631 0 0 2 0 111,1 9 655,7 0
75632 0 0 3 0 125,1 13 889,3 0
5523 1 1,2 5 4 0 5 110,2 110,5
6984 2 0,3 4 4 30 3 130,5 85,1
85214 0 0 3 0 0 9 632,7 1
22/11/2020 5
L’Analyse en Composantes Principales : A.C.P.

L’ACP appliquée en Marketing:


Cette méthode trouve de nombreuses applications dans le
domaine des études marketing:

 Segmentation du marché;
 Etudes de positionnement;
 En recherche produit;
 Etudes publicitaires;
 Etudes prix…
L’Analyse en Composantes Principales : A.C.P.
Pré-requis
L’Analyse en Composantes Principales : A.C.P.
Pré-requis
L’Analyse en Composantes Principales : A.C.P.
Pré-requis
L’Analyse en Composantes Principales : A.C.P.

Définition
L'ACP permet une analyse des diverses variables statistiques
définies sur les caractères étudiés.
Elle permet de construire des variables artificielles ( car non
mesurées mais calculées à partir des données) qui "expliquent "
l'ensemble des variables statistiques prises en compte dans l'ACP.

On
obtient

22/11/2020 10
L’Analyse en Composantes Principales : A.C.P.

On obtient ainsi un ensemble de nouvelles


variables, en plus petit nombre que les
variables initiales.

Chacune de ces variables initiales est liée à


l'ensemble des variables artificielles retenues.

22/11/2020 11
L’Analyse en Composantes Principales : A.C.P.

Enfin,
Ces variables statistiques artificielles peuvent être
interprétées (subjectivement),
ce qui peut amener à mettre en évidence des
phénomènes "latents", cachés dans les données
initiales.
Des aides à l'interprétation doivent donc être définies de
manière à valider proprement ces interprétations.

R.JAHIDI 22/11/2020 12
L’Analyse en Composantes Principales : A.C.P.

L'ACP fournit une méthode de représentation d'une population afin :


 de repérer des groupes d'individus, homogènes vis à vis de l'ensemble
des caractères.

 de révéler des différences entre individus ou groupes d'individus,


relativement à l'ensemble des caractères.

R.JAHIDI 22/11/2020 13
L’Analyse en Composantes Principales : A.C.P.

L'ACP fournit une méthode de représentation d'une


population afin :
 de réduire l'information qui permet de décrire la position d'un
individu dans l'ensemble de la population.

 de mettre en évidence des individus au comportement


atypique.

22/11/2020 14
L’Analyse en Composantes Principales : A.C.P.
F2(i) i
Visualisation des données *

X1 … Xp F1 F2 0 F1(i)
1

Le plan factoriel
i x1i … xpi  F1i F2i …

 Cor(Xj,F2) Xj
n

0 Cor(Xj,F1)
Facteurs centrés-réduits
Tableau
résumant les données
des données
La carte des variables

22/11/2020 15

ADD R.JAHIDI
L’Analyse en Composantes Principales : A.C.P.

Tableau des données


Variables Quantitatives
X1 X2 X3 ... Xp
O1
O2
Objets
ou O3
Individus ..
.
On

ADD R.JAHIDI 22/11/2020 16


L’Analyse en Composantes Principales : A.C.P.

Evaluation de la qualité des données


Les données sont-elles appropriées pour une
analyse en composantes principales?

Quelques règles empiriques ...

ADD R.JAHIDI 22/11/2020 17


L’Analyse en Composantes Principales : A.C.P.

1- Examen de la matrice de corrélations

Plus les variables présentent de fortes corrélations plus


elles peuvent être regroupées en dimensions
homogènes.

Dans le cas contraire, les variables sont hétérogènes.

ADD R.JAHIDI 22/11/2020 18


L’Analyse en Composantes Principales : A.C.P.

Matrice de corrélation

SOLD NDEC MDEC NBPR NEMP MEMP VADD DEPO RETR


Corrélation SOLD 1,000 -,331 -,277 ,111 -,290 ,109 ,652 ,729 -,163
NDEC -,331 1,000 ,722 -,393 -,179 -,319 -,395 -,467 -,241
MDEC -,277 ,722 1,000 -,123 -,048 -,241 -,306 -,357 -,063
NBPR ,111 -,393 -,123 1,000 ,775 ,503 ,297 ,140 ,766
NEMP -,290 -,179 -,048 ,775 1,000 ,333 -,211 -,331 ,774
MEMP ,109 -,319 -,241 ,503 ,333 1,000 ,323 ,344 ,457
VADD ,652 -,395 -,306 ,297 -,211 ,323 1,000 ,890 -,055
DEPO ,729 -,467 -,357 ,140 -,331 ,344 ,890 1,000 -,140
RETR -,163 -,241 -,063 ,766 ,774 ,457 -,055 -,140 1,000

ADD R.JAHIDI 22/11/2020 19


L’Analyse en Composantes Principales : A.C.P.

2- La Mesure de précision de l’échantillonnage de


Kaiser-Meyer-Olkin (KMO)

ADD R.JAHIDI 22/11/2020 20


L’Analyse en Composantes Principales : A.C.P.

Le KMO est un réel compris entre 0 et 1.


Un KMO assez élevé (> 0.5) est indispensable
pour obtenir une ACP intéressante.
Dans la négative, il peut être nécessaire de
supprimer certaines variables.

ADD R.JAHIDI 22/11/2020 21


L’Analyse en Composantes Principales : A.C.P.

3-Le test de sphéricité de Barlett


 H0 : indépendance entre les variables vs H1:
association entre les variables
 Doit être significatif (p<0.10, p<0.05, p<0.01,
p<0.001) pour exprimer le fait que les variables
sont corrélées entre elles.

ADD R.JAHIDI 22/11/2020 22


L’Analyse en Composantes Principales : A.C.P.

Exemple:

Indice KMO et test de Bartlett

Mesure de précision de l'échantillonnage de


Kaiser-Meyer-Olkin. ,645

Test de sphéricité de Khi-deux approché 185,606


Bartlett ddl 36
Signification ,000

ADD R.JAHIDI 22/11/2020 23


L’Analyse en Composantes Principales : A.C.P.

Espace de représentation des


individus

ADD R.JAHIDI 22/11/2020 24


L’Analyse en Composantes Principales : A.C.P.

 A chaque individu on associe l’ensemble des caractéristiques de


cet individu.

 Chaque individu peut être représenté par un point défini par p


coordonnées et être considéré comme un élément d’un espace F
appelé espace des individus. L’ensemble des n individus est alors
un nuage de points de F noté N

ADD R.JAHIDI 22/11/2020 25


L’Analyse en Composantes Principales : A.C.P.

 La dispersion du nuage autour de son centre de gravité est mesurée


par l’inertie du nuage qui correspond à la somme des variances des
variables initiales.

 Afin de donner aux variables la même importance on centre et on


réduit les variables initiales.

ADD R.JAHIDI 22/11/2020 26


L’Analyse en Composantes Principales : A.C.P.

 Dorénavant on travaillera sur des données centrées réduites.

 Notre nuage est donc de centre de gravité l’origine et d’inertie p

 On cherche à obtenir une représentation approchée de ce nuage dans un espace de


dimension plus faible.

La question est de savoir comment passer d’un espace de


dimension supérieure ou égale à 3 à un espace de dimension
plus restreinte
ADD R.JAHIDI 22/11/2020 27
L’Analyse en Composantes Principales : A.C.P.

Intuitivement, il s'agit de trouver un sous espace


F tel que la distance entre points - individus soit
conservée dans le processus de projection sur ce
sous-espace.

ADD R.JAHIDI 22/11/2020 28


L’Analyse en Composantes Principales : A.C.P.
 Ainsi, la ressemblance entre individus est conservée dans cette
opération de projection.
 L’inertie du nuage projeté est donc maximale.

ADD R.JAHIDI 22/11/2020 29


L’Analyse en Composantes Principales : A.C.P.
Principe de l’ACP
Réduction de l’espace de représentation
des individus par la définition de
nouvelles variables « synthétiques » pour
lesquelles la variance (inertie) est
maximale :
Les composantes principales.

ADD R.JAHIDI 22/11/2020 30


L’Analyse en Composantes Principales : A.C.P.
 La première composante principale est celle pour laquelle la
variance des individus est maximale.

 La deuxième composante est cherchée sous deux conditions :

1. Avoir une corrélation nulle avec la première composant

2. Exprimer a son tour la plus grande variance des individus

 Le processus se déroule jusqu’à l’obtention des p composantes

ADD R.JAHIDI 22/11/2020 31


L’Analyse en Composantes Principales : A.C.P.

Recherche du premier axe principal et


de la première composante principale

ADD R.JAHIDI 22/11/2020 32


L’Analyse en Composantes Principales : A.C.P.

Premier axe principal D1


 La droite D1 passe par l’origine O et est engendrée par le
vecteur u1 vecteur propre normé de la matrice de corrélation R
associée à la plus grande valeur propre l1.

 La droite D1 maximise l’inertie des points du nuage projetés sur


D1 qui vaut l1

ADD R.JAHIDI 22/11/2020 33

Vous aimerez peut-être aussi