Vous êtes sur la page 1sur 15

Espace de représentation

des individus

ADD R.JAHIDI 18/11/2020 1


 A chaque individu on associe l’ensemble des
caractéristiques de cet individu.
 Chaque individu peut être représenté par un
point défini par p coordonnées et être considéré
comme un élément d’un espace F appelé espace
des individus. L’ensemble des n individus est
alors un nuage de points de F noté N

ADD R.JAHIDI 18/11/2020 2


Espace de représentation

V3 Individu i

Nuage N

V2
Vp

V1
Notion d’inertie
d’un nuage de
points
Information et inertie

 Le centre de gravite G du nuage N est


le point de coordonnées
(m(V1), m(V2),…,m(Vp))
 La dispersion du nuage autour de son
centre de gravité est mesurée par
l’inertie du nuage qui correspond à la
somme des variances des variables
initiales et traduit la quantité
d’information disponible :
I(N,G)= var(V1)+var(V2)+…+var(Vp)
ADD R.JAHIDI 18/11/2020 5
 Afin de donner aux variables la même
importance on centre et on réduit les
variables initiales :
Zi = (zij) avec

ADD R.JAHIDI 18/11/2020 6


 Dorénavant on travaillera sur des données
centrées réduites.
 Notre nuage est donc de centre de gravité
l’origine et d’inertie p
 On cherche à obtenir une représentation
approchée de ce nuage dans un espace de
dimension plus faible.
La question est de savoir comment passer
d’un espace de dimension supérieure ou
égale à 3 à un espace de dimension plus
restreinte.
Intuitivement, il s'agit de trouver un sous
espace F tel que la distance entre points -
individus soit conservée dans le processus
de projection sur ce sous-espace.

ADD R.JAHIDI 18/11/2020 8


 Ainsi,la ressemblance
entre individus est
conservée dans cette
opération de
projection.
 L’inertiedu nuage
projeté est donc
maximale.

ADD R.JAHIDI 18/11/2020 9


On cherche la direction qui
sépare au mieux les
Variable 3
individus en projection.

Son orientation est telle


que, en suivant cet axe d’un
bout à l’autre, de plus en Variable 2

plus d’individus différents


moyenne (individu “typique”)
sont rencontrés. Ce qui
traduit une inertie
maximale.
Variable 1

10
Principe de l’ACP
Réduction de l’espace de
représentation des individus par la
définition de nouvelles variables
« synthétiques » pour lesquelles la
variance (inertie) est maximale : les
composantes principales.

ADD R.JAHIDI 18/11/2020 11


 La première composante principale est celle
pour laquelle la variance des individus est
maximale.
 La deuxième composante est cherchée sous
deux conditions :
 Avoirune corrélation nulle avec la
première composant
 Exprimer à son tour la plus grande
variance des individus
 Le processus se déroule jusqu’à l’obtention
des p composantes
ADD R.JAHIDI 18/11/2020 12
ACP : REDUCTION DE L’ESPACE DE REPRESENTATION
Représentation la plus fidèle possible du nuage des points
dans un sous-espace de faible dimension (1,2 ou plus)
V3 Sous-espace à 1 dimension: Droite D1
Rp

I1 Droite de projection qui va donner l’image


la plus « réelle » du nuage de point,
I'1
Droite de projection qui va conserver au
I2 mieux les distances entre les individus
(distance euclidienne),
V1
Droite d’étirement maximum du nuage
Vp
V2
des points projetés,
Droite de variance (d’inertie) maximum
du nuage des points projetés,
13
ACP : REDUCTION DE L’ESPACE DE REPRESENTATION
V2

V2

x
x
x
D2
x x Vj
x x x
x
x x x x xxxx x x x
x x x x Vj x xx xx
x x
x x x xx xx x x x
x xx x x x
Gx x xx x x
x x G x xxx x
x x
x
xx x x x x
x
x x x x
xx x x x
x x x
x
x x x V3 V1
x xx
V3 V1
x x

Vp D1
Vp D1

espace à 1 dimensions le espace à 2 dimensions


plus explicatif le plus explicatif

14
ACP : REDUCTION DE L’ESPACE DE REPRESENTATION
PC 2
Plan principal PC 1

Variable 3

D2 D1

Variable 2 PC 2

moyenne (individu “typique”)

PC 1
Variable 1

Composantes
principales PC1 et PC2
15

Vous aimerez peut-être aussi