Vous êtes sur la page 1sur 2

TP - ACP (Decathlon)

Ce TP est articulé autour du jeu de données: les performances des athlètes de décathlon (JO
2004/ Décastar 2004).

Travaillez sur le jeu de données decathlon du package FactoMineR. Le but est de réaliser une
ACP à partir de performances d’athlètes et d’en dégager des informations (e.g., corrélations).

1. Charger les données.


2. Expliquer les données.
3. Standardisation : l’ACP fonctionne sur un tableau de variables quantitatives. Il est
d’usage de centrer-normer chacune de ces variables avant de réaliser une
ACP. Pourquoi ?
4. Réaliser l’ACP pour les 10 premières colonnes du jeu de données qui correspondent
aux performances des athlètes pour les dix épreuves du décathlon.
5. Représenter les valeurs propres en utilisant des diagrammes de bâton.
6. Combien d’axe doit-on conserver ? justifier.
7. Représenter graphiquement les individus dans le plan des axes factoriels 1 et 3.

Vous pouvez utiliser le package factoextra pour rendre les sorties


de FactoMineR plus agréable et adaptables. Voici quelques commandes.

# scree plot = percentage of variances explained


fviz_screeplot(res_pca, ncp=10)
# variable graph
fviz_pca_var(res_pca, axes=c(1,3), repel = TRUE)
# individual graph
fviz_pca_ind(res_pca, repel = TRUE)
# biplot
fviz_pca_biplot(res_pca, repel = TRUE)
# contrib of individual for first dimension
fviz_contrib(res_pca, choice = "ind", axes = 1)
# contrib of variable for the 1st dimension
fviz_contrib(res_pca, choice = "var", axes = 1)
Interprétation :
8. Déterminer quelle est la contribution de chaque variable sur chaque composante ou
leur corrélation. Quelle est la part d’inertie associée aux deux premiers axes factoriels.
9. Étudier le graphique des individus. Dans le plan des deux premières composantes
principales axes=c(1,2), que pouvez-vous dire de
o Bourguignon et Karpov ?
o Barras et Qi ?
o Casarsa ?
o Serble et Clay ?

10. Comment interpréter ces deux premières composantes principales axes=c(1,2).


11. Étudier le graphique des variables. Savez-vous justifier pourquoi le cercle est centré
sur l’origine 0 et de rayon 1 ?
12. Que peut-on dire sur les scores des épreuves du 110m haie et les épreuves du 100m.
13. Qu'en est-il de ces scores par rapport au saut en longueur ?
14. Que peut-on dire sur les scores de l’épreuve du javelot ou du saut à la perche ?
15. Qu’est-ce que le 3ème axe factoriel semble représenter ?

Vous aimerez peut-être aussi