Vous êtes sur la page 1sur 19

ACP

Analyse en Composantes
Principales

28/02/21 Groupe TT6 - KikiTeam 1


Description multidimensionnelle de
données numériques

Dans la plupart des applications, on travaille non pas


avec une seule variable, mais avec un nombre de
variable souvent élevé.
L’étude séparée de chacune de ces variables n’est
pas suffisante.
->Il faut donc analyser les données en tenant compte de
leur caractère multidimensionnel

28/02/21 Groupe TT6 - KikiTeam 2


Les méthodes multifactorielles
d'Analyse des Données
 ACP : Analyse en Composantes Principales, pour les tableaux de
variables quantitatives.
 AFTD : Analyse Factorielle d'un Tableau de Distances, pour les
tableaux de distances.
 AFC : Analyse Factorielle des Correspondances, pour les tableaux
de contingence.
 ACM : Analyse des Correspondances Multiples, pour les tableaux
de variables qualitatives.
 STATIS : Structuration des Tableaux A Trois Indices de la
Statistique
 AFM : Analyse Factorielle Multiple
 DACP : Double Analyse en Composante Principale
 La liste n'est pas exhaustive.

28/02/21 Groupe TT6 - KikiTeam 3


Présentation générale de l'ACP
L'étude séparée de chacune de ces variables donne
quelques informations mais est insuffisante car elle laisse
de côté les liaisons entre elles, ce qui est pourtant souvent
ce que l'on veut étudier.
C'est le rôle de la statistique multifactorielle, que
d'analyser les données dans leur ensemble, en prenant en
compte toutes les variables.
L'Analyse en Composantes Principales est alors une
bonne méthode pour étudier les données
multidimensionnelles, lorsque toutes les variables
observées sont de type numérique, de préférence dans
les mêmes unités, et que l'on veut voir s’il y a des liens
entre ces variables.

28/02/21 Groupe TT6 - KikiTeam 4


Le principe d’ACP
La mise en oeuvre mathématique de l'ACP peut être
divisée en 6 étapes principales :
 1. Préparer les données pour le traitement
 2. Calculer la matrice des coefficients de
corrélations des variables
 3. Extraire les valeurs et vecteurs propres de cette
matrice
 4. Classer les vecteurs propres dans l'ordre
décroissant des valeurs propres associées
 5. Calculer la matrice des composantes principales

28/02/21 Groupe TT6 - KikiTeam 5


Le principe d’ACP -

1 - Préparer les données pour le traitement


Les observations de p variables sur n individus sont rassemblées
dans uns matrice X à n lignes et p colonnes.

28/02/21 Groupe TT6 - KikiTeam 6


Le principe d’ACP
 Le problème est que si on analyse directement la
matrice X, les résultats seraient faussés par les valeurs
relatives des variables (Par exemple si les valeurs ont
été mesurées dans des unités différentes). Préparer les
données pour le traitement consiste donc à transformer
le tableau de données pour réduire ces effets.

 On peut alors travailler sur une version centrée-réduite


Xcr de la matrice X.

 Pour centrer la matrice X, on soustrait à chacune des


valeurs la moyenne de sa variable.
Pour réduire la matrice centrée, on divise chacune des
valeurs par l'écart-type de sa variable.

28/02/21 Groupe TT6 - KikiTeam 7


Le principe d’ACP

 5. Matrice des composantes principales


    La matrice appelée matrice des composantes principales
est celle qui contient les coordonnées des individus dans
l'espace formé par les composantes principales.
    Soit CP la matrice des composantes principales. On a
alors :
CP = Xrc . u

28/02/21 Groupe TT6 - KikiTeam 8


ACP - Avantages
 Simplicité mathématique : Sur le plan mathématique, l'ACP est donc
une méthode simple à mettre en oeuvre. Les seuls véritables outils
mathématiques utilisés dans l'ACP sont le calcul des
valeurs/vecteurs propres d'une matrice, et les changements de
base.

 Simplicité des résultats : Grâce aux graphiques qu'elle fournit, l‘ACP


permet d'appréhender une grande partie de ses résultats d'un
simple coup d'oeil.

 Puissance : L'ACP a beau être simple. Elle offre, en quelques


opérations seulement, un résumé et une vue complète des relations
existant entre les variables quantitatives d'une population d'étude.

 Flexibilité : L'ACP est une méthode très souple, puisqu'elle


s'applique sur un ensemble de données de contenu et de taille
quelconques.

28/02/21 Groupe TT6 - KikiTeam 9


Projet
 Le but du projet - Compresser une image
noire blanche

 Le programme prend en entrée une image


et à la sortie on obtiendra un certain
nombre des coefficients qui présentent les
niveaux de gris les plus importants dans
l'image.

28/02/21 Groupe TT6 - KikiTeam 10


Projet - Réalisation
 0 - Choix du format d'image :
 Pour la raison de la simplicité de lecture et écriture d'une
image, on choisit le format pgm qui est représenté par
un fichier texte.
 Exemple: une image Pgm de taille 4x4 :
P2
44
255
125 156 100 80
16 150 255 20
154 123 120 20
125 123 255 80

28/02/21 Groupe TT6 - KikiTeam 11


Projet - Réalisation
1 - Preparer les données pour algorithme ACP

Comme on a vu dans la partie de principe d'ACP,


ACP prend en entrée un tableau dont chaque ligne est un
individu et chaque colonne est une variable.

Dans notre cas, le tableau aura une seule ligne (cas


on a une seule image en entrée) et les variables seront
les niveau de gris, donc il y a 256 variables qui
correspondent aux 256 niveaux de gris d'une image noire
et blanche. La valeur de chaque variable est donc le
nombre de fois que le niveau de gris apparaît dans
l'image.

28/02/21 Groupe TT6 - KikiTeam 12


Projet - Réalisation
 2. Calculer la matrice des coefficients de corrélations des
variables

 3. Extraire les valeurs et vecteurs propres de cette


matrice

 4. Classer les vecteurs propres dans l'ordre décroissant


des valeurs propres associées

 5. Calculer la matrice des composantes principales

28/02/21 Groupe TT6 - KikiTeam 13


Projet - Réalisation
 Exemple : on reprend l’image dans l'exemple ci-
dessous

28/02/21 Groupe TT6 - KikiTeam 14


Projet - Résultats
 L'image en entrée

28/02/21 Groupe TT6 - KikiTeam 15


Projet - Résultats
 En fonction de nombre de coefficient, on obtient les résultats
suivants:
Pour 9 coefficients:

28/02/21 Groupe TT6 - KikiTeam 16


Projet - Résultats
Pour 20 coefficients:

28/02/21 Groupe TT6 - KikiTeam 17


Projet - Résultats
Pour 50 coefficients:

28/02/21 Groupe TT6 - KikiTeam 18


Projet - Résultats
Pour 100 coefficients:

28/02/21 Groupe TT6 - KikiTeam 19

Vous aimerez peut-être aussi