Académique Documents
Professionnel Documents
Culture Documents
TP1 Licence
TP1 Licence
Étude de cas
Analyse en composantes principales (ACP) avec FactoMineR sur les
données relatives à la qualité de la vie dans 18 grandes métropoles
américaines.
1
1 V _ USA <- read . table ( " / Users / pro / Documents / Exemple _ ACP / VilleUSA . csv "
, header = TRUE , sep = " ; " , dec = " . " , row . names =1 , check . names = FALSE ,
2 fileEncoding = " latin1 " , s t r i n g s A s F a c t o r s = TRUE )
1 summary ( V _ USA )
2
Pour imprimer les résultats dans un fichier :
• Indiquer l’emplacement ou vous voulez enregistrer ce fichier
1 summary ( res _ USA , file = " / Users / pro / Documents / Exemple _ ACP / Result . txt "
)
Si on veut afficher les coordonnées des variables sur les axes principaux
3
1 library ( " factoextra " ) # si c ’ est pas deja activee
2 fviz _ eig ( res _ USA , addlabels = TRUE , ylim = c (0 ,35) )
1 plot ( res _ USA , choix = " var " , axes = 1:2 , new . plot = F )
1 plot ( res _ USA , choix = " ind " , habillage = 11 , axes = 1:2 , new . plot =
F , cex = 0.5)
Qualité de la représentation
Visualiser la qualité de la représentation avec Corrplot.
1 library ( corrplot )
2 corrplot ( res _ USA $ var $ cos2 , is . corr = FALSE )
Qualité des individus: Total cos2 des individus pour Dim.1 et Dim.2
1 fviz _ cos2 ( res _ USA , choice = " ind " , axes = 1:2)
1 fviz _ pca _ var ( res _ USA , col . var = " cos2 " , gradient . cols = c ( " #00 AFBB " ,
" # E7B800 " , " # FC4E07 " ) , # du bleu ( cos2 faible ) au rouge ( fort )
en passant par le jaune ( moyen ) select . var =
2 list ( cos2 = 0.6) , # Pour visualiser les variables avec cos2 >= 0.6
repel = TRUE ) # Avoid text overlapping
4
Coloration des individus en fonction de leur qualité de la représentation
.
1 fviz _ pca _ ind ( res _ USA , col . ind = " cos2 " , gradient . cols = c ( " #00 AFBB " ,
" # E7B800 " , " # FC4E07 " ) , select . ind = list ( cos2 = 0.5) , # Pour
visualiser les individus avec cos2 >= 0.5
2 repel = TRUE ) # Avoid text overlapping ( slow if many points )
1 fviz _ pca _ ind ( res _ USA , pointsize = " cos2 " , pointshape = 21 , # 22 =
carre , 24 = triangle , etc . fill = "# E7B800 " ,
2 repel = TRUE ) # Avoid text overlapping ( slow if many points )
1 fviz _ contrib ( res _ USA , choice = " var " , axes = 1:2 , top = 10) # ## les 10
variables les plus contributives
1 fviz _ contrib ( res _ USA , choice = " ind " , axes = 1:2)
5
1 fviz _ pca _ ind ( res _ USA , col . ind = " cos2 " , pointsize = " contrib " ,
2 gradient . cols = c ( " #00 AFBB " , " # E7B800 " , " # FC4E07 " ) , axes = c (2 ,8) , #
faire varier les axes pour voir repel = TRUE )
3 # Avoid text overlapping ( slow if many points )
1 fviz _ pca _ biplot ( res . villeUS . pca , repel = TRUE , col . var =
2 " #2 E9FDF " , col . ind = " #696969 " )
Travail à réaliser.
• Téléchargez le fichier VilleUSA.csv sur votre disque dur.
• Faire l’ACP en utilisant les commandes ci-dessus et commenter les
diffrentes sorties graphiques et numériques.