Vous êtes sur la page 1sur 15

Compte rendu du TP1

Analyse des données et classification


ACP
EXERCICE2 :
I) Partie théorique :
Question1 :
a) La matrice de corrélation des 8 variables :
Xcoor=Ds-1*V* Ds-1
Avec V =Xct*P*Xc et Xc= X-G*E
et E la matrice colonne des 1 de taille (15,1)

et G représente le centre de gravité des individus


̅𝑋̅𝚥 Pi ∗ xij
𝑖=1
=∑15

b) Le couple des variables qui sont les plus corrélées entre elles c’est-
à-dire l’indice du couple qui contient la plus grande valeur dans la
matrice de corrélation, donc pour ce fait on cherche le max dans
les variables de la matrice et la même chose pour les variables
moins corrélées mais dans ce cas en cherche le min ,et pour les
variables opposées on cherche les indices des variables ayant des
signes différents.
Question2 :

a) La matrice des données centré réduite :


Xcr=Xc* Ds-1
b) Pour chercher les valeurs propres de la matrice Xcr on fait la
diagonalisation on utilisant l’équation caractéristique

Les valeurs propres de M sont les racines de son polynôme


caractéristique :
λ valeur propre de M ⇔ det(M – λ Id) = 0

c) Pour faire une représentation en histogramme des valeurs propres


, on calcule l’inertie en pourcentage qui égale les valeurs propres
de Xcr .Les composants principaux qu’il faut retenir sont laquelle ayant
un pourcentage d’inertie grand qui est supérieur à l’inertie moyenne
(dans ce cas on obtient deux composants ayant des inerties (28.42% et
24.74%)
d) Inertie totale=
53.16% Question3 :
a) Les composantes principales :
C=Xcr*vectpropre
b) Pour faire la représentation des individus dans le premier plan
principale (C1 et C2), on représente ces deux vecteurs C(i,1), C(i,2)
ou i est l’indice d’individus.
c) La qualité des individus aux 5 premiers facteurs :

avec

d) La contribution des individus dans la première


composante principale :

on remarque que les individus panasonic et sagem ont des


contribution supérieur à la contribution moyenne donc ils sont les
individus qui déterminant le plus la première composante
Question4 :
a) La corrélation entre les 5 premiers facteurs et les variables,
premièrement on sélectionne les 5 premiers composants
principales et on calcule la matrice de corrélation
Xcoor=Xcrt*P*Ci tel que i=1…5
b) Le cercle des corrélations représente les variables dans le
premier plan factoriel
c) Les variables qui déterminent la première composante
principale sont les variables ayant une contribution supérieur à
la contribution moyenne ('COMMODITE', 'TPSCHARGE',
'AUTOVIELLE', 'AUTOCONV','PUIGSM','SENSIGSM','SENSIDCS').
II) Partie pratique
Question1 :
a)
b)

2) a)

b)
c)
3) a)

b)
Interprétation du graphe des individus :
D’après ce graphe, on remarque que par exemple les individus siemens
S35i et Nokia 210 sont très proche et donc ils forment la même classe,
ainsi pour Sony et atrium, par contre par exemple Panasonic est loin des
autres individus c’est-à-dire ils ne ressemblent pas aux autres.
Les individus qui contribuant plus a la formation de premier axes sont
alcatel304 et Panasonic, et les individus qui contribuant à la formation de
2 -ème axes sont nokia3310, Motorola, ericsson2628, Philips..
c)
d)
4) a)

b)
Interprétation de graphe des variables :
On remarque d’après cet graphe que les variables sensigsm et
sensidcs,tpscharge sont bien représentées ,mais la variable autovielle est
mal représenté,ainsi que que les variables sensigsm et sensidcs sont non
corrélés avec la variable puigs et mommodite.

Vous aimerez peut-être aussi