Vous êtes sur la page 1sur 5

École Nationale Polytechnique

Département du Génie Industriel

Analyse des données

Compte rendu sur


L'analyse en composantes principales

Rédigé par :

Kadi Mohamed

Hadjaz Ramzi

1
1 Introduction

L'Analyse en Composantes Principales (ACP) est une méthode d'analyse de données. Elle
cherche à synthétiser l'information contenue dans un tableau croisant des individus et des variables
quantitatives. Produire un résumé d'information au sens de l'ACP c'est établir une similarité entre
les individus, chercher des groupes d'individus homogènes, mettre en évidence une typologie d'in-
dividus. Quant aux variables c'est mettre en évidence des bilans de liaisons entre elles, moyennant
des variables synthétiques et mettre en évidence une typologie de variables. L'ACP cherche d'une
façon générale `a établir des liaisons entre ces deux typologies.
2 Les données

L'ensemble des données peut être schématiser par une matrice X à n lignes et p colonnes.

3 L'analyse en composante principales

En théorie pour eectuer une ACP normée on passe par les étapes suivantes :
 On calcule la matrice centrée et réduite.
 On détermine la matrice des variances (corrélations) S = X X
1 t

 Calcul des valeurs propres. n

 Calcul des taux d'inertie an de mieux choisir les axes à représenter I = P λi

 Ensuite on réalise une projection des variable sur le cercle de corrélations.


λi

 Pour conclure on fait une projection des individus sur les axes pour pouvoir interpréter les
résultats obtenus.

2
4 Énoncé du TP :

Il s'agit de faire une ACP sur le tableau des données suivant :

5 L'ACP sur le tableau des données :

5.1 Tableau des valeurs propres :

5.2 Représentation des valeurs propres :

3
En se référant du tableau et de la représentation on remarque que le nombre d'axes
à retenir pour la projection est 2 axes car la variabilité du 1er axe est de 61.6% et celle su 2ème
Remarque :

est de 26.1% ce qui donne une assez bonne qualité de représentation de 88% .On peut conrmer
ce résultat par la méthode du coude qui casse.
5.3 Corrélation entre les variables et qualité de représentation :

la corrélation entre les variables est représentée par le cercle des corrélations suivant :

Le tableau suivant montre la qualité de représentation par rapport aux axes (contribution) :

5.3.1 Interprétation :

Du cercle on remarque que les variables (viandes,volailles,fruits) sont corrélées positivement


entre elles et sont liées négativement au vin. Le pin et le lait ne sont pas vraiment liés avec les
autres variables par contre ils sont corrélées positivement entre elles.Les légumes ont une faible
liaison avec (viandes,volailles fruits).
En ce qui concerne la qualité de représentation les variables (viandes,volailles,fruits) elle sont bien
représenté sur le premier axe c'est le cas aussi des légume mais les variable(pain ,lait,vin) sont mal
représenter sur cet axe.
Pour le deuxième axe les variables (pain,lait,vin) ont une importante contribution ce qui n'est pas
le cas pour le reste des variables.
4
5.4 Projection des variables :

Le graphe suivant représente la projection des variables sur le paln de l'ACP :

Le tableau des contributions pour les observations :

5.4.1 Interprétation :

Le groupe (CA ,CA ,CA ) qui sont les cadres est caractérisé par une consommation assez élevé
des légumes viandes volailles fruits et faible pour le vin. Ce qui n'est pas le cas pour les agents de
4 2 3

maintenance et les employés cette catégories consomme de façon moyenne le pain ,le lait et le vin.
On note que pour les observations (CA ,EM ) ne sont pas bien représenté donc on ne peut rien
conclure (Tableau de contribution).
1 3

Vous aimerez peut-être aussi