Vous êtes sur la page 1sur 5

Analyse en composantes principales

(résumé)
Lorsqu’on projette les données sur un plan, on obtient un graphique déformé de la réalité. Le rôle de
l’ACP est de trouver des espaces de dimensions plus petites minimisant ces déformations.

L’ACP est une méthode descriptive. Partant d’un ensemble de points appelé nuage d’individus contenus
dans un tableau de données quantitatif, le but de l’ACP est de passer à une représentation la plus fidèle
possible du nuage initial en le projetant sur un espace de dimension réduite appelé espace factoriel. Pour
ce faire l’ACP transforme les p variables quantitatives, initiales en nouvelles variables non corrélées,
appelées composantes principales (ou facteurs).

Les champs d'application de l’ACP sont aujourd'hui multiples, allant de la biologie à la recherche
économique et sociale, et plus récemment le traitement d'images.

L’ACP regroupe un ensemble d’étapes pouvant être regroupées en deux grandes phases.

- Réduction de données
- Ajustement de nuage
- Représentation graphique

L’ACP en résumé comprend les étapes suivantes :

1. Réduction de données

1.1. Tableau de données

L’ACP s’applique sur des données contenues dans une matrice de valeurs quantitatives X de n lignes
appelées individus et p colonnes appelées variables.

1.2. Calcul de la moyenne de chaque colonne


𝑛
1
𝑥𝑗 = 𝑥𝑖𝑗
𝑛
𝑖=1

C’est une étape intermédiaire nécessaire pour le calcul de la matrice centrée.

1.3. Calcul de l’écart-type de chaque colonne

𝑛
1
𝜎𝑗 = (𝑥𝑖𝑗 − 𝑥𝑗 )²
𝑛
𝑖=1

En statistiques, l’écart-type mesure la variabilité ou la dispersion d'un ensemble de valeurs autour de la


moyenne de ces mêmes valeurs. Le calcul des écarts-type des colonnes est une étape intermédiaire aussi
nécessaire pour le calcul de la matrice centrée-réduite.

Abderrahmane KEFALI | kefali@labged.net 1


1.4. Calcul des valeurs de la matrice centrée, centrée-réduite

Le centrage permet de déplacer le repère constitué par les variables jusqu'au centre de gravité du nuage
de points. Le centre de gravité est défini par les moyennes des xj.

La matrice XC des valeurs centrées et réduites et obtenues comme suit :

𝑥𝑐𝑖𝑗 = 𝑥𝑖𝑗 − 𝑥𝑗

La réduction permet de rendre les variables sans dimensions (lorsqu’ils sont dans des unités différentes).

La matrice Y des valeurs centrées et réduites et obtenues comme suit :

𝑥𝑖𝑗 − 𝑥𝑗
𝑦𝑖𝑗 =
𝜎𝑗

2. Ajustement du nuage

Comme nous avons dit, l’objectif de l’ACP est de représenter les données dans un espace de dimension
réduite appelé espace factoriel ou plan factoriel lorsqu’il s’agit d’un espace de deux dimensions.

Le plan factoriel est donc le plan formé par les deux composantes principales ou facteurs. La première
composante principale doit "capturer" le maximum d’inertie du tableau des données et la deuxième
composante principale est perpendiculaire à lui.

Pour trouver l’inertie maximale et par la suite le plan factoriel, l’ACP procède comme suit :

2.1. La matrice de covariance ou de corrélation

La covariance et la corrélation mesurent le degré de dépendance entre deux variables, plus la covariance
et la corrélation sont grandes plus elle que les deux variables concernées sont dépendant l'une de l'autre.
La corrélation possède l’avantage qu’elle est normalisée entre -1 et 1.

La matrice de covariance et la matrice de corrélation sont des matrices de p lignes et p colonnes et


représentent le degré de dépendance entre tous paire de variables dans le tableau des données.

Abderrahmane KEFALI | kefali@labged.net 2


La matrice de covariance C est calculée comme suit :
𝑛

𝑐𝑗𝑗 ′ = 𝑥𝑖𝑗 − 𝑥𝑗 (𝑥𝑖𝑗 ` − 𝑥𝑗 `)


𝑖=1

La matrice de corrélation R est calculée comme suit :

𝑗′
𝑐𝑗𝑗 ′ 𝑛
𝑖=1 𝑥𝑖𝑗 − 𝑥𝑗 (𝑥𝑖𝑗 ` − 𝑥𝑗 ` )
𝑟𝑗 = =
𝜎𝑗 𝜎𝑗 ` 𝜎𝑗 𝜎𝑗 `

La matrice de covariance et la matrice de corrélation peuvent être obtenues en utilisant la forme


matricielle :
1 1
𝐶 = 𝑛 𝑋𝑐 𝑇 𝑋𝑐 et 𝑅 = 𝑛 𝑌 𝑇 𝑌

Diagonalisation (rappel)

Diagonaliser une matrice A consiste à trouver une matrice de passage P et une matrice diagonale D tel
que : A=PDPT. Les colonnes de la matrice P sont dites les vecteurs propres et les éléments de D les
valeurs propres associées.

On dit que v est un vecteur propre de A associé à la valeur propre λ ssi :

(A- λI)v=0 ici I est la matrice identité.

2.2. Calcul de l’inertie

L’inertie est une grandeur physique mesurant la dispersion des points par rapport au centre de gravité.
Pour notre cas, l’inertie du nuage I est la moyenne des carrées de p(p-1)/2 distances différentes entre les
p points du nuage. Une inertie nulle signifie que les individus sont identiques et confondue avec le
centre de gravité.
𝑛
1
𝐼= 𝑑²(𝐺, 𝑀𝑖 )
𝑛
𝑖

Avec G est le centre de gravité et Mi est un point du nuage.

Il été démontré (voir le cours) que l’inertie peut être calculée à partir de la matrice des vecteurs propres
V et le vecteur des valeurs propres Λ résultants de la diagonalisation de la matrice de corrélation.

RV= ΛV.

2.3. Trouver le plan factoriel

Les vecteurs propres fournissent les axes et les valeurs propres représentent les inerties expliquées par
ces axes.

Pour trouver le plan factoriel, nous trions les valeurs propres et les vecteurs propres associés dans
l’ordre décroissant. Le plan factoriel sera donc constitué par les deux axes représentant les deux plus
grandes valeurs propres (inerties). L’axe avec la plus grande inertie (valeur propre) est la première

Abderrahmane KEFALI | kefali@labged.net 3


composante principale. La deuxième composante principale est l’axe avec la deuxième plus grande
valeur propre et elle est perpendiculaire à la première.

Exemple

Ce tableau signifie que le premier axe (F1) permet d’expliquer 63,66% de la variance totale du nuage de
points, que le second axe (F2) permet d’expliquer 23,51% de la variance totale. En projetant donc
chaque individu sur un plan F1 F2, on conserve donc 63,66+23,51 soit 87,17% de la variance totale (on
a donc une bonne qualité de représentation). Le plan factoriel est constitué donc par les deux axes F1et
F2.

2.5. Représentation des individus dans le plan factoriel

Pour représenter les individus dans le plan factoriel (nouvel espace de dimension =2) nous devons tout
d’abord calculer les coordonnées des individus.

2.5.1. Matrice des coordonnées des individus Ψ :

Ψ=Y*V
Les coordonnées des projections du nuage de points dans le plan factoriel sont donc les deux premières
colonnes de la matrice Ψ.

2.6. Représentation des variables dans un cercle de corrélation

Un cercle de corrélation est un cercle de rayon 1 et dont le centre est l’origine du plan factoriel.

2.6.1. Calcul des coefficients de corrélation linéaire.

La matrice des coefficients de corrélation linéaire L est calculée en vu de savoir si les anciens variables
sont bien représentés par le plan factoriel ou non. Les coefficients de corrélation linéaire sont donc
calculés entre les anciens variables et les nouveaux variables (facteurs). Ils peuvent être calculées par :

𝐿(𝑗, 𝑖) = Λ(𝑖) ∗ 𝑉(𝑗, 𝑖)

2.6.2. Qu’est ce que représente le cercle de corrélation ?

Dans le nouveau plan, la coordonnée d’un variable sur un axe factoriel est une mesure de la corrélation
entre cette variable et le facteur (l’axe principal). Elle prend des valeurs entre 0 (pas corrélé du tout) et 1
(fortement corrélé). Si cette valeur est proche de 1, alors le point est bien représenté sur l'axe.

Si un variable est très proche du bord du cercle, cela signifie que le variable est bien représenté par le
plan factoriel, c’est-à-dire que la variable est bien corrélée avec les deux facteurs constituant ce plan.

Abderrahmane KEFALI | kefali@labged.net 4


Les points situés près du centre sont donc généralement mal représentés par le plan factoriel. Leur
interprétation ne peut donc pas être effectuée avec confiance.

Les points proches d'un des axes, et assez loin de l'origine sont bien corrélés avec cet axe et sont les
points explicatifs pour l'axe : Ce sont les points les plus “parlants” ; leur “vraie distance” de l'origine est
bien représentée sur le plan factoriel.

Si deux points sont proches l'un de l'autre, il est probable que les réponses des individus qu'ils
représentent soient très similaires.

L’angle entre 2 variables, mesuré par son cosinus, est égal au coefficient de corrélation linéaire entre les
2 variables: cos(angle) = r(v1,v2)

- si les points sont très proches (angle proche de 0) : cos(angle) = r(v1,v2) = 1 donc v1 et v2 sont
très fortement corrélés positivement
- si a est égal à 90°, cos(angle) = r(v1,v2) = 0 alors pas de corrélation linéaire entre les deux
variables
- si les points sont opposés, a vaut 180°, cos(angle) = r(v1,v2) = -1 : v1 et v2 sont très fortement
corrélés négativement

Abderrahmane KEFALI | kefali@labged.net 5

Vous aimerez peut-être aussi