Vous êtes sur la page 1sur 13

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE


SCIENTIFIQUE

l’Analyse en Composantes
Principales (ACP)

présenté par:
FERRAOUN RAFIK
BENSALEM Ouail
2017/2018
Sommaire

• Introduction
• Définitions
• Procédé d’application de l’ACP
• Objectifs de l’ACP
• CONCLUSION
Introduction

• L’Analyse en Composante Principale (ACP) est une


méthode d’analyse des données dite méthode factorielle.
Cette méthode permet la présentation géométrique d’un
tableau rectangulaire composé de p variables et de n
individus.
Définitions

• L’Analyse en Composantes Principales (ACP) ou méthode


factorielle est définie comme étant une méthode descriptive
multidimensionnelle. Elle permet à partir d’un tableau
rectangulaire de données comportant m variables et n
observations d’obtenir des représentations géométriques de ces
variables et observations.
Définition algébrique

• L’analyse en composantes principales se fait sur une matrice


de P variables et N individus. Cette dernière est dite matrice
de données,
• Une fois qu’on a calculé ces paramètres statistiques, on remplace la
matrice de données [X] par une nouvelle matrice définie par le
croisement (individus x CP).
Avec : CP, composantes principales.
• Calculer les composantes principales notées
Cj revient à déterminer P relations linéaires
entre les variables Xj :
Définition géométrique

• L’Analyse en Composantes Principales est puissante par son support


géométrique : la méthode consiste à rechercher un premier axe qui
soit le plus prés possible de tous les points au sens des moindres
carrés : tel que la somme des moindres carrés des distances des N
points à cet axe soit minimale, ou encore la projection de ces derniers
sur cet axe ait une dispersion maximale. Cet axe est appelé « axe
factoriel ».
• Un second axe est obtenu après projection des N points sur un
hyperplan orthogonal au premier axe, tel que la dispersion des
projections des N points sur celui-ci soit toujours maximale, et le
processus se réitère P fois.
Recherche du premier axe
• la contribution maximale est donnée par le premier axe principal,
nous devons donc maximiser la variance relative à celui-ci.
Recherche du second axe
• Nous cherchons à déterminer le vecteur unitaire V2 tel que la
composante C2 soit de variance maximale et non corrélée à C1.
Procédé d’application de l’ACP

• 1. Formation de la matrice des données brutes [X] (composée par le croisement de N


individus x P variables).
• 2. Calcul des paramètres statistiques :(moyenne, écart type).
• 3. Calcul des variables centrées réduites :

• 4. Calcul des coefficients de corrélation :

• 5. Calcul des valeurs propres et des vecteurs propres de la matrice de corrélation


obtenue.
• 6. Calcul des composantes principales, avec :
CP = matrice des variables centrées réduites (NxP) x matrice des vecteurs
propres (NxN).
• 7. Calcul des composantes principales centrées réduites

• 8. Calcul de la matrice de corrélation entre CP ’et XCR (cor(CP’, XCR)).


• 9. Tracé des cercles de corrélation.
Résultats d’application

• L’Analyse en composantes principales met à notre disposition trois


résultats nécessaires à notre interprétation, et qui sont :
Un tableau de vecteurs et valeurs propres.
Un tableau de corrélation des individus avec les axes factoriels.
Un tableau de corrélation des variables avec les axes principaux.
Objectifs

• L’Analyse en Composantes Principales a pour objectifs :


Avoir une corrélation entre les variables grâce à une représentation
des données brutes et fournir des outils simples et lisibles.
Essayer d’examiner les liens existants entre les variables afin de
faciliter leur interprétation.
Essayer de réduire au maximum le nombre de dimensions étudiées
tout en gardant l’ensemble original et en utilisant les relations détectées entre
les variables.
Filtrage des données
CONCLUSION

• L’analyse en composantes principales est une méthode


factorielle d’analyse des données, elle permet d’étudier les
corrélations entre les variables d’un tableau de données, tout en
cherchant la réduction de sa taille, en remplaçant les variables
originales par des nouvelles variables appelées composantes
principales.

Vous aimerez peut-être aussi