Académique Documents
Professionnel Documents
Culture Documents
principales
Révisions
Sébastien Gadat
www.lsp.ups-tlse.fr/gadat
Première partie I
Motivations
Objectifs :
Représenter graphiquement l’observation de p > 3 variables.
Recherche de résumés pertinents (nuages de point) dans le plan
ou l’espace, respectant :
les distances entre individus
la structure des corrélations entre variables.
Statistiques élémentaires
Statistiques élémentaires
♣Quelques questions...
0.6
MATH
PHYS
0.2
Axe 2
−0.2
ANGL
−0.6
FRAN
Axe 1
3
2
andr brig
1
jean didi
Axe 2
alan
−1 0 moni
anni evel
pier
−3
−3 −1 0 1 2 3
Axe 1
Notations
p variables statistiques réelles observées sur n individus de poids pi .
On synthétise les données en une matrice
x1j x1p
1
x1 ... ...
.. .. ..
.
. ... ... .
X = x1 ..
xij xip
i ... .
. .. .. ..
.. ... . . .
xn1 ... xij ... xnp
Statistiques élémentaires
g=
Y=
♣ Matrice de Variance/Covariance :
V=
Intertie et corrélations
Ig =
On montre que
Ig = =
On mesure la distance entre 2 variables via D :
< xj , xk >D =
Inertie et corrélations
< xj , xk >D
cos θj,k = =
kxj kkxk k
Présentation de la méthode
Objectifs :
Représentation graphique “optimale” des individus et des
variables.
Réduction de dimension (compression).
Le principe est d’obtenir un sous-espace de dimension faible sur
lequel la projection ressemble le plus au nuage initial.
Modèle
P = a(a0 Ma)−1 a0 M
a0 MVMa
Iproj =
a0 Ma
Estimation
ci = Xui
Formules de reconstiturion
p
X
X= cj u0j M −1
j=1
p
X
VM = λj aj a0j M
j=1
γik =
γi =
Représentations graphiques
♣ Qualité de représentation des variables sur Fk :
rk =
♣Part d’inertie :
♣Règle de Kaiser :
♣Éboulis des valeurs propres :
1.0 1.0
0.5 0.5
A A
x x
e 0.0 e 0.0
2 3
-0.5 -0.5
-1.0 -1.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
Axe 1 Axe 2
Représentation simultanée :
−10 −5 0 5 10 15 20
0.6
20
bres
15
0.4
10
biar
renn
0.2
Comp.2
roue
janv
dece nant
ange lill
5
toul
fevr
ajac
nove ango limo stqu
mars
octo tourorle
0.0
pari reim
0
nice bord
sept avri tlse clervich
perp mai nanc
besa
−5
juin
aout
juilmont
−0.2
mars dijoembr
gren
nime lyon stra
−10
−0.2 0.0 0.2 0.4 0.6
Comp.1
Interprétation :
PCTVAR
1.0
0.8
0.6
0.4
0.2
0.0
0 1 2 3 4 5 6 7 8 9 1 1 1
0 1 2
K