Vous êtes sur la page 1sur 10

Analyse multivariée

L’Analyse en Composantes Principales


Présentation

SCIENCES
TECHNOLOGIES
SANTÉ
Les (bonnes) raisons de faire une ACP

Explorer les données


Extraire l’information
Enlever le bruit
Réduire les dimensions

Modèle ACP
La corrélation entre variables est une
information
Un problème d’espace ... vectoriel

Espace des variables 3 variables Espace des individus


Dimension 3 Dimension 15

15 individus
1ère composante
X principale (PC1)

x3 x2

x1

Nuage de 15 points individus Nuage de 3 points variables

1ère composante : direction de plus grande variabilité du nuage de


points (individus ou variables)
La mécanique de l’ACP
dans l’espace des variables

T1 T2
1,62 0,24
0,71 -0,35
-1,98 0,18
1,31 0,39
0,56 0,52
-1,04 0,76
T=
1,11 0,59
0,95 0,76
Espace des variables

-2,28 0,81
0,83 0,00
……. …….
-3,00 -0,34

Contraintes Coordonnées
Factorielles
1. Direction de dispersion 2. Orthogonalité PC1 et PC2 « scores »
maximale des individus

5
Les Poids Factoriels « loadings »

Combinaisons linéaires
PC1 = p11 X1 + p21 X2 + p31 X3
PC2 = p12 X1 + p22 X2 + p32 X3

• PC1 : composante principale n°1 ou 1ère variable latente (= p1)


• pij : poids factoriels (« loadings »)

Exemple p1 p2
Espace des variables

-0,05 1,00
P= 0,71 0,00
0,70 0,07

PC1 = -0,05 X1 + 0,71 X2 + 0,70 X3


PC2 = 1,00 X1 + 0,00 X2 + 0,07 X3

6
Un exemple
X : Analyse sensorielle confitures de framboise

Information sur les individus Information sur les variables


PC2 PC2
Espace des variables

PC1 PC1

« Scores » T « Loadings P »


La mécanique de l’ACP
dans l’espace des individus

1ère composante
principale (PC1)
PC1
PC2 x3 x2
x3 x2

x1
x1

x1 l1 l2
Espace des individus

-0,28 0,96
3 vecteurs normés x3 L= 0,98 0,12
X1,X2,X3
x2 0,98 0,15

Contraintes Coordonnées
Factorielles
1. Direction de dispersion 2. Orthogonalité PC1 et PC2 des variables
maximale

8
Pour résumer

ACP

Matrice X de départ Matrice T réduite


1. Information sur les individus 1. Information sur les individus
(coordonnées cartésiennes) (scores)
2. Information sur les Variables 2. Information sur les variables
3. Bruits (erreurs) (loadings)
4. Variables corrélées 3. Pas de bruit
(non orthogonales) 4. Orthogonalité PC1-PC2
5. Visualisation des données ? 5. Exploration graphique des
données

9
Questions de synthèse

Citer 4 raisons de faire une ACP ;


Qu’est-ce que la dimension d’un espace ?
Qu’est-ce que le rang d’une matrice ?
Quel est le but de l’ACP ?
Définir une « Composante Principale »
Qu’est-ce que les « scores » ?
Qu’est-ce que les « loadings » ?
Quel nombre maximum de composantes principales pour
une matrice n x m ?

Vous aimerez peut-être aussi