Vous êtes sur la page 1sur 2

Analyse en Composantes Principales (ACP)

Votre Nom
September 23, 2023

1 Introduction
L’Analyse en Composantes Principales (ACP) est une technique essentielle en
statistique et en analyse de données. Elle permet de réduire la dimensionnalité
des données tout en préservant l’essentiel de l’information. Dans cette introduc-
tion, nous allons explorer les concepts mathématiques clés de l’ACP.

2 Matrice de Données
Supposons que nous ayons un ensemble de données avec n observations et p
variables. Nous pouvons représenter ces données sous forme de matrice X où
chaque ligne correspond à une observation et chaque colonne à une variable :
 
x11 x12 · · · x1p
 x21 x22 · · · x2p 
X= .
 
.. .. .. 
 .. . . . 
xn1 xn2 ··· xnp

3 Calcul des Composantes Principales


Pour calculer les composantes principales, nous devons d’abord centrer les données
en soustrayant la moyenne de chaque variable. La matrice centrée est définie
comme suit :

Xc = X − X̄
où X̄ est la matrice des moyennes.
Ensuite, nous calculons la matrice de covariance des données centrées :
1
S= X T Xc
n−1 c
Nous pouvons ensuite diagonaliser la matrice de covariance pour obtenir
les vecteurs propres (composantes principales) et les valeurs propres correspon-
dantes.

1
4 Réduction de Dimension
Pour réduire la dimension des données, nous pouvons sélectionner les k premières
composantes principales qui capturent la majeure partie de la variance. Les
nouvelles données projetées sur ces composantes sont données par :

Y = Xc V
où V est la matrice des vecteurs propres sélectionnés.

5 Conclusion
L’Analyse en Composantes Principales est une technique puissante pour réduire
la dimensionnalité des données tout en conservant l’information importante. Ce
document a introduit les concepts mathématiques de base de l’ACP, mais il
existe de nombreuses variantes et applications avancées à explorer.

Vous aimerez peut-être aussi