Académique Documents
Professionnel Documents
Culture Documents
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Septembre 2008
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Introduction
Soit X un tableau contenant p variables mesurees sur n individus.
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Enonce (1)
Deux variables x et y sont mesurees sur n individus.
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Enonce (2)
1.5
0.5
0.5
1.5
i=1
o`
u
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Nuage centre ?
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Demonstration
Soient deux droites D et D 0 parall`eles, la premi`ere passant par le
point moyen et la deuxi`eme ne passant pas par ce point moyen.
2
k Mi mi0 k
= k Mi + mi mi mi0 k
>
n
1X
k Mi mi k2 + k w k2
n
i=1
n
1X
k Mi mi k2
n
i=1
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Inertie Totale
Rappel :
1. X est une matrice `a n lignes et p colonnes : X = [xij ].
2. Chaque point a un poids
1
n
(ponderation uniforme).
i=1 j =1
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Exemple en dimension 2
La droite passe par le point moyen. Donc on place lorigine au
centre de gravite en utilisant les nouvelles coordonnees centrees :
Xi = xi m(x)
Yi = yi m(y)
IT
n
1X
Xi2 + Yi2
n
n
1 X
(xi m(x))2 + (yi m(y))2
n
n
n
1X
1X
2
(xi m(x)) +
(yi m(y))2
n
n
i=1
i=1
i=1
i=1
= v (x) + v (y)
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
IT =
i=1
IS (u)
+ IM (u)
| {z }
| {z }
`a maximiser `a minimiser
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
x1 m(x) y1 m(y)
..
..
X=
.
.
xn m(x) yn m(y)
Le vecteur
u recherche est unitaire. On lecrit sous la forme
a
u=
avec a 2 + b 2 = 1.
b
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
v (x) c(x, y)
est dite matrice de
c(x, y) v (y)
variance-covariance des deux variables. On la note
La matrice
C=
1 T
X X
n
Anne B Dufour
catacteristique secrit :
= 2 (v (x) + v (y))c 2 (x, y)
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
1 + 2 = v (x) + v (y)
1 2 = v (x) v (y) + c 2 (x, y)
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
IS (u) = uT Cu
u11 u21
1 0
u11 u12
a
= [a b]
u12 u22
0 2
u21 u22
b
1 0
= [ ]
0 2
= 1 2 + 2 2 1 2 + 1 2 = 1
vecteurs propres.
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Linertie
ne peut
depasser la premi`ere valeur propre et latteint
1
pour
=
, donc le premier vecteur propre.
0
Conclusion dans le cas de 2 variables :
Laxe principal dun nuage bivari
e est le premier vecteur
propre de la matrice de variance-covariance des deux
variables.
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Generalisation `a p variables
C = UUT admet une base de p vecteurs propres orthonormes.
I
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Pp
l1k
hM1 |uk i
j =1 (x1j xj )ujk
..
..
lk = ... =
=
.
.
Pp
lnk
hMn |uk i
j =1 (xnj xj )ujk
soit en ecriture matricielle : lk = Xuk .
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
p
n
n
1 XX
1X
lik =
(xij xj )ujk
n
n
i=1
p
X
ujk
j =1
v (lk ) =
=
i=1 j =1
1
n
n
X
(xij xj ) = 0
i=1
n
1X 2
1
lik = (Xuk )T Xuk = uT
k Cuk
n
n
i=1
k uT
k uk
= k
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
j =
j =1
p
X
v (xj )
j =1
o`
u xj est la variable j du tableau X.
Le graphe des valeurs propres exprime la mani`ere dont la variabilite
des donnees se repartit dans lespace.
Cest une representation en batons avec k sur laxe horizontal et
k sur laxe vertical . En anglais, on parle de screeplot.
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
La carte factorielle
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
Enonce (1)
On vient detudier la projection dun nuage de n points sur des
axes qui maximisent linertie projetee (situation A).
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
Enonce (2)
Le point de vue de cette analyse a ete propose par Hotelling
(1933) dans le cas o`
u les donnees sont centrees reduites.
Soit y une variable quelconque. On peut calculer sa correlation
avec chacune des variables de depart xj (j = 1, p). Le lien entre y
et X peut se mesurer par la relation :
L (y, X) =
p
X
r 2 y, xj
j =1
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
Enonce (3)
r 2 y, xk est :
I
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
1 T
X X = UUT et L = X U
n
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
L (y, X) =
p
X
r 2 y, xk = 1hy|xk i2
k =1
L (y, X) =
1 T
X y
n
T
1 T
X y
n
=
1 T
y X XT
y
n2
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
1
n
Pn 1 2
2 peut s
yi
.
e
crire
=
y
i=1 i
i=1
n
Pn
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
Vecteurs propres de S
SL =
1
X XT
X U = X RU = X U = L
n
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Retour `
a l
enonc
e
Recherche du vecteur y norm
e
1
1 T
X L1/2 = XT
X U1/2 = RU1/2 = U1/2
n
n
Anne B Dufour
Introduction
Repr
esentation des individus
Repr
esentation des variables
Conclusion
Conclusion
LAnalyse en Composantes
Principales dite A.C.P. est letude du
triplet X, Ip , n1 In .
I
Anne B Dufour