Académique Documents
Professionnel Documents
Culture Documents
Cours ADD - ACP - SUP MTI - P2 - Ouazza
Cours ADD - ACP - SUP MTI - P2 - Ouazza
Ouazza Ahmed
2022-2023
1 / 53
Plan
1 Introduction
4 Méthodes de classification
2 / 53
Introduction
3 / 53
Introduction
Tableau de données: (Individu × Variable)
X1 ... Xj ... Xp
I1 x11 ... x1j ... x1p
. . ... . ... .
. . ... . ... .
. . ... . ... .
Ii xi1 ... xij ... xip
. . ... . ... .
. . ... . ... .
. . ... . ... .
In xn1 ... xnj ... xnp
4 / 53
Introduction
5 / 53
Introduction
Tableau de données: (Variable × Variable)
7 / 53
ACP
8 / 53
ACP
Objectifs:
• L’ACP permet de réduire la dimension de l’espace des variables avec le
minimum de perte d’information.(c-à-d on passe de X1 , · · · , Xp à F1 , · · · , Fk
avec k << p, généralement k = 2 ou 3)
• Visualiser le positionnement des individus les uns par rapport aux autres
(ressemblance) ⇒ Notion de distance entre individus.
• Visualiser les corrélations entre les variables.
• Donner une interprétation aux facteurs (axes).
9 / 53
ACP
Les données:
Les données pour l’ACP sont généralement présentées sous la forme du
tableau décrit dans les pages 4 et 5:
x11 · · · x1j · · · x1p
.. ..
. .
X= xi1 · · · xij · · · xip
.. ..
. .
xn1 · · · xnj · · · xnp
11 / 53
ACP
Le cas le plus fréquent est de considérer que tous les individus ont la même
importance c-à-d : pi = n1
12 / 53
ACP
De la même manière, on peut définir des poids pour les variables, en affectant
à chaque variable Xj un poids mj reflétant son importance par rapport aux
autres.
Le cas le plus fréquent est de considérer que tous les variables ont la même
importance c-à-d : mj = p1
13 / 53
Notion de ressemblance: Critère de la distance Euclidienne
Définition 0.1
Deux individus se ressemblent s’ils possèdent des valeurs proches pour
l’ensemble des variables.
Donc on parle d’une notion de proximité qui se traduit par une distance.
Ainsi, nous définissons la distance euclidienne entre deux individus Ii et Ij
par :
p
X
d2 (Ii , Ij ) = (xik − xjk )2
k=1
14 / 53
Notion de ressemblance: Critère de la distance Euclidienne
Exemple:
Définition 0.2
Deux variables sont liées si elles ont un fort coefficient de corrélation linéaire.
n
Cov(Xj , Xk ) 1X xij − xj xik − xk
Corr(Xj , Xk ) = =
Sj Sk n Sj Sk
i=1
Exemple:
Corr(M ath, Stat) = 0.982
Corr(M ath, F ran) = 0.019
16 / 53
ACP
Xj − xj
Xj? =
Sj
avec xj et Sj sont respectivement la moyenne empirique et l’écart-type de la
variable Xj .
17 / 53
ACP
Tableau centré-réduit:
18 / 53
ACP
Tableau centré-réduit:
. ··· . ··· .
.. .. ..
. . .
? ?
xij −xj
. · · ·
X = (X1 , ..., Xp ) = Sj ··· .
. .. ..
.. . .
. ··· . ··· .
19 / 53
ACP
Matrice de Covariance:
20 / 53
ACP
Matrice de Corrélation:
21 / 53
ACP
Inertie totale:
22 / 53
ACP
Inertie totale:
L’inertie est aussi égale à la somme des variances des variables étudiées:
p
X p
X
IG = V ar(Xj ) = Sj2 = T race(V )
j=1 j=1
IG = T race(V ) = p
23 / 53
ACP
Nuages de points:
24 / 53
ACP
25 / 53
ACP
H0 : R = matrice identité
⇒ c-à-d les variables sont deux à deux indépendantes
Où R est la matrice de corrélation
Remarque:
◦ Si |R| = 1, les variables sont deux à deux orthogonales ⇒ ACP inutile
◦ Si |R| = 0, il y a une colinéarité parfaite ⇒ Le premier facteur explique
100% de l’inertie totale
26 / 53
ACP
• Statistique de test:
2p + 5
T =− n−1− ln(|R|)
6
p(p−1)
La statistique de test suit une loi du khi-deux χ2 à 2 degrés de liberté.
27 / 53
ACP
• Règle de décision:
Si T ≥ Tc alors on rejette l’hypothèse nulle H0 au seuil α. Sinon on accepte
H0 au seuil α.
avec Tc = χ21−α ( p(p−1)
2 ) est le quantile d’ordre (1 − α) d’une loi de χ2 à
p(p−1)
2 degrés de liberté.
Remarque:
Une deuxième manière de prendre la décision est de comparer
p − value = ”sgnif ication” avec le seuil α:
Si p − value < α alors on rejette H0 , sinon on accepte H0 .
Exemple: (voir SPSS)
28 / 53
ACP
29 / 53
ACP
30 / 53
ACP
• Corrélation partielle
On peut définir la corrélation partielle à partir de la matrice corrélation
comme suit:
Soit R−1 = (vij ) (i, j ∈ {1, · · · , p}) la matrice inverse de la matrice de
corrélation R = (rij ), alors la matrice de corrélation partielle est Rp = (aij )
(i, j ∈ {1, · · · , p}) tel que:
vij
aij = − √
vii × vjj
31 / 53
ACP
33 / 53
Nuage des individus NI
Chaque individu Ii , i ∈ {1, 2, ..., n} est un élément de Rp
35 / 53
Nuage des individus NI
36 / 53
On a :
d2 (O, Ii ) = d2 (O, Hi ) + d2 (Hi , Ii )
On déduit:
n n n
1X 2 1X 2 1X 2
d (O, Ii ) = d (O, Hi ) + d (Hi , Ii )
n n n
i=1 i=1 i=1
37 / 53
Ajustement du nuage des individus sur un plan P :
Objectif:
Pn 2
Trouver un plan P tel que i=1 OHi soit maximum.
Avec u1 ⊥ u2
P ⇒ Plan d’inertie maximum.
38 / 53
Cas général: Ajustement du nuage des individus sur un éspace FK de
dimension K:
Objectif:
Trouver une suite d’axes {us , s = 1, ..., K} orthogonaux d’inertie maximum.
Avec us est un vecteur unitaire de l’axe de rang s.
Soit His la projection de Ii sur us
Donc on cherche us tel que ni=1 (OHis )2 soit maximum.
P
39 / 53
Définition 0.3
Les K axes factoriels {us , s = 1, ..., K} sont appelées les facteurs
principaux.
40 / 53
Exemple:
Pour K = 1 ⇒ Ajustement du nuage sur une droite F1 = U1
Dans ce cas, on a:
• L’axe U1 passe par le centre de gravité G = O du nuage de points NI .
• L’axe U1 est engendré par le vecteur normé u1 , vecteur propre de la matrice
des corrélations R associé à la plus grande valeur propre λ1 .
• L’inertie expliquée par l’axe U1 est égal à λ1 .
λ1
• La part d’inertie expliquée par le premier axe principal U1 est égal à p .
Remarquons que p est aussi égal à la somme des valeurs propes de la matrice
de corrélation R.
41 / 53
Pour K = 2 ⇒ Ajustement du nuage sur un plan F2 = P = (U1 × U2 )
42 / 53
Nuage des variables Nv
43 / 53
Nuage des variables Nv
On peut envisager le problème de la représentation des variables de façon
complètement symétrique de celui des individus.
Ainsi, chaque variable Xj , j ∈ {1, 2, ..., p} est un élément de Rn .
La représentation du nuage Nv des variables se situe dans un espace à n
dimensions, chaque dimension représentant un individu de la population
totale.
45 / 53
Choix de nombre d’axe
46 / 53
Choix de nombre d’axe
Éboulis des valeurs propres:
47 / 53
Qualité de représentation
(OHis )2
QLTs (Ii ) = (1)
(OIi )2
Si QLTs (Ii ) est proche de 1, alors l’individu Ii est bien représentée
sur l’axe s.
Si QLTs (Ii ) est proche de 0, alors l’individu Ii est mal représentée
sur l’axe s.
48 / 53
Qualité de représentation
(OHjs )2
QLTs (Xj ) = = cor(Xj , vs )2
(OXj )2
Si QLTs (Xj ) est proche de 1, alors la variable Xj est bien représentée sur
l’axe s.
Si QLTs (Xj ) est proche de 0, alors la variable Xj est mal représentée sur
l’axe s.
49 / 53
Interprétation
Dans la suite, on va définir quelques règles pour interpréter les résultats d’une
ACP:
• Pour tout k et l tel que k 6= l, la projection du nuage NI sur le plan principal
engendré (uk , ul ) est appelée carte des individus.
• Pour tout k et l tel que k 6= l, la projection du nuage Nv sur le plan principal
engendré par (vk , vl ) est appelée carte des variables.
• Un individu sera du côté des variables pour lesquelles il a de fortes valeurs,
inversement il sera du côté opposé des variables pour lesquelles il a de faibles
valeurs.
• Plus les valeurs d’un individu sont fortes pour une variable plus il sera
éloigné de l’origine suivant l’axe factoriel décrivant le mieux cette variable.
• Deux individus à une même extrémité d’un axe (c-à-d éloignés de l’origine)
sont proches (se ressemblent).
• Deux variables très corrélées positivement sont du même côté sur un axe.
50 / 53
Exemple
51 / 53
Exemple
52 / 53
Exemple
Carte des individus:
53 / 53