Académique Documents
Professionnel Documents
Culture Documents
Introduction:
• L’analyse des données est une des branches
les plus vivantes de la statistique.
• Les principales méthodes de l’analyse des
données se séparent en deux groupes:
– Les méthodes de classification,
– Les méthodes factorielles.
http:\\elmerouani.jimdo.com 1
25/03/2014
http:\\elmerouani.jimdo.com 2
25/03/2014
http:\\elmerouani.jimdo.com 3
25/03/2014
L’ACP
• L’ACP (Hotelling, 1933) a pour objectif de réduire le
nombre de données, souvent très élevé, d’un tableau
de données représenté, algébriquement, comme une
matrice et, géométriquement comme un nuage de
points.
• L’ACP consiste en l’étude des projections des points de
ce nuage sur un axe (axe factoriel ou principal), un plan
ou un hyperplan judicieusement déterminé.
• Mathématiquement, on obtiendrait le meilleur
ajustement du nuage par des sous-espaces vectoriels.
http:\\elmerouani.jimdo.com 4
25/03/2014
L’ACP
• Algébriquement, il s’agit de chercher les
valeurs propres maximales de la matrice des
données et par conséquent ses vecteurs
propres associés qui représenteront ces sous-
espaces vectoriels (axes factoriels ou
principales).
http:\\elmerouani.jimdo.com 5
25/03/2014
Procédure de l’ACP:
• On cherche X’ la transposée de la matrice X.
• On détermine les valeurs propres de la
matrice symétrique X’X.
• Soient λ1, λ2, …, λq ces valeurs propres.
• On les classe λ1>λ2>λ3> λ4>….
• Alors X’X=AΛA-1 où λ1 0 L 0
0 λ2 O M
Λ=
M O O 0
0 L 0 λ
q
Procédure de l’ACP:
• D’après les propriétés de la trace des matrices;
on a:
( ) ( )
tr ( X ' X ) = tr AΛA−1 = tr AA−1Λ = trΛ
• Soit tr ( X ' X ) = λ1 + λ2 + L + λq
• En raison des valeurs numériques
décroissantes de λ1, λ2, …, la somme des
premiers valeurs propres représente, souvent,
une proportion importante de la trace de X’X.
http:\\elmerouani.jimdo.com 6
25/03/2014
Procédure de l’ACP:
• Ainsi, dans la pratique on peut se limiter à
trouver les premiers valeurs propres λ1, λ2, …,
λs avec s assez inférieur à q.
• L’information perdue est alors relativement
faible.
• On pratique s=3 (trois premiers valeurs
propres les plus grands)
Procédure de l’ACP:
• Les valeurs propres trouvés étant simples, les
espaces propres associés aux vecteurs propres
seront des droites vectorielles (on les appelles
des axes factoriels ou des facteurs).
• D’un point de vue général, L’ACP nous a permit
de traiter un très grand nombre de données
(matrice) pour identifier un nombre
relativement restreint de données (axes
factoriels)
http:\\elmerouani.jimdo.com 7
25/03/2014
L’ACP géométriquement:
• Lors de la projection, le
nuage peut être
déformé est donc serait
différent de réel, alors
les méthodes
d’ajustement consistent
en minimiser cette
possible déformation et
ce en maximisant les
distances projetées.
http:\\elmerouani.jimdo.com 8
25/03/2014
∑ (x mj − xnj )
q
d (Lm , Ln ) =
2
j =1
http:\\elmerouani.jimdo.com 9
25/03/2014
L’ACP normé:
• On s’intéresse à étudier la matrice des
variances-covariances V au lieu de la matrice
X de départ.
• La matrice V est une matrice de type carrée
d’ordre q de terme général vkl égal à:
1 p 1 p
vkl = ∑ ( yik − yk )( yil − yl ) = ∑ ( xik − xk )( xil − xl )
p i =1 p i =1
1 p
v kl = ∑ (x ik x il − x k x l )
p i =1
http:\\elmerouani.jimdo.com 10
25/03/2014
∑x
(xij − x j )2
ij
1 p
xj = i =1
p
; σj = ∑
p i =1
http:\\elmerouani.jimdo.com 11
25/03/2014
http:\\elmerouani.jimdo.com 12
25/03/2014
http:\\elmerouani.jimdo.com 13
25/03/2014
http:\\elmerouani.jimdo.com 14
25/03/2014
L’AFC
• L’AFC a pour objet le traitement de l’information
contenue dans un tableau appelé de contingence
ou de dépendance, relatif à deux ensembles de
nature quelconque, en relation par moyen d’un
processus naturel ou expérimental plus ou moins
bien connu.
• Les données sont ici pondérées. Les fréquences
de répétitions s’interprète facilement en termes
de probabilités.
L’AFC
• Le tableau de dépendance peut être ainsi
représenté dans un espace approprié par un
nuage de points affectés de probabilités.
http:\\elmerouani.jimdo.com 15
25/03/2014
Ensemble J
(paramèttres)
1 …. J … m
Ensemble I
(individus)
1 x11 … x1j … x1m
∑∑ x
i =1 j =1
ij
http:\\elmerouani.jimdo.com 16
25/03/2014
J 1 …. j … m Total
I
1 p11 … p1j … p1m p1.
M
n
p• j = ∑p i =1
ij avec j = 1, L , m
∑p i =1
i• = 1 et ∑p j =1
•j =1
http:\\elmerouani.jimdo.com 17
25/03/2014
35
Indépendance?
• Probabilités conditionnelles, dans ce cas:
pij pij
= p⋅ j ⇔ = pi⋅
pi⋅ p⋅ j
• Formule d’indépendance:
pij = pi⋅ × p⋅ j
36
http:\\elmerouani.jimdo.com 18
25/03/2014
Distance du χ2
• Pour deux individus quelconques i et i’:
2
1 pij pi ' j
d 2 (Li , Li ' ) = ∑ −
j p⋅ j pi⋅ pi '⋅
• Pourquoi une telle distance?
38
http:\\elmerouani.jimdo.com 19
25/03/2014
40
http:\\elmerouani.jimdo.com 20
25/03/2014
M i = (β i1 , β i 2 ,L , β ij ,L , β im )
• Avec pij
β ij =
pi⋅ p⋅ j
• pi ⋅ étant toujours la pondération
42
http:\\elmerouani.jimdo.com 21
25/03/2014
B(I ) = {M i ; pi⋅ }
43
d 2
(M i , M i ' ) = ∑ (β ij − β i ′j )
2
44
http:\\elmerouani.jimdo.com 22
25/03/2014
http:\\elmerouani.jimdo.com 23
25/03/2014
(
v jj = ∑ pi⋅ β ij − p⋅ j )2
i
• La covariance vjk est
( )(
v jk = ∑ pi⋅ β ij − p⋅ j β ik − p⋅k )
'
47
pi⋅ p⋅k
48
http:\\elmerouani.jimdo.com 24
25/03/2014
(r )
ij 1≤i ≤ n
1≤ j ≤ m
=R
W = R' R
où R’ est la transposée de R.
• Maximiser u’Wu revient à maximiser u’R’Ru
sous la condition u’u=1, c’est-à-dire déterminer
les vecteurs propres associés aux valeurs propres
de la matrice R’R. 49
VB = tr (W ) = ∑ v jj
j
50
http:\\elmerouani.jimdo.com 25
25/03/2014
51
52
http:\\elmerouani.jimdo.com 26
25/03/2014
53
http:\\elmerouani.jimdo.com 27
25/03/2014
56
http:\\elmerouani.jimdo.com 28