Vous êtes sur la page 1sur 3

TD5 : Performance des athlètes au décathlon

1 Performances des athlètes au décathlon en 2004


On étudie les performances des athlètes ayant participé en 2004 au épreuves de décathlon des Jeux Olym-
piques et du Décastar. Dans les données reproduites ci-dessous, les dix premières colonnes correspondent aux
performances des athlètes pour les dix épreuves du décathlon : course sur 100 m (c100), saut en longueur (long),
lancer de poids (poids), saut en hauteur (haut), course sur 400 m (c400), course de haies sur 110 m (c110),
lancer de disque (disq), saut à la perche (perch), lancer de javelot (javel) et course sur 1500 m (c1500) ; les
résultats des épreuves de course sont en secondes, alors que pour les autre, on mesure des distances en mètres.
Les colonnes 11 et 12 correspondent respectivement au rang (RANG) et au nombre de points obtenus (POINTS).
La dernière colonne correspond au nom de la compétition (Jeux Olympiques ou Décastar).
Attention ! Les noms des participants sont en majuscules pour le Décastar, afin de permettre de différencier
les participations d’un même athlète aux deux épreuves (exemple : SERBLE/Serble).
c100 long poids haut c400 c110 disq perche javel c1500 RANG POINTS COMPET
SEBRLE 11.04 7.58 14.83 2.07 49.81 14.69 43.75 5.02 63.19 291.70 1 8217 Decastar
CLAY 10.76 7.40 14.26 1.86 49.37 14.05 50.72 4.92 60.15 301.50 2 8122 Decastar
KARPOV 11.02 7.30 14.77 2.04 48.37 14.09 48.95 4.92 50.31 300.20 3 8099 Decastar
BERNARD 11.02 7.23 14.25 1.92 48.93 14.99 40.87 5.32 62.77 280.10 4 8067 Decastar
YURKOV 11.34 7.09 15.19 2.10 50.42 15.31 46.26 4.72 63.44 276.40 5 8036 Decastar
WARNERS 11.11 7.60 14.31 1.98 48.68 14.23 41.10 4.92 51.77 278.10 6 8030 Decastar
ZSIVOCZKY 11.13 7.30 13.48 2.01 48.62 14.17 45.67 4.42 55.37 268.00 7 8004 Decastar
McMULLEN 10.83 7.31 13.76 2.13 49.91 14.38 44.41 4.42 56.37 285.10 8 7995 Decastar
MARTINEAU 11.64 6.81 14.57 1.95 50.14 14.93 47.60 4.92 52.33 262.10 9 7802 Decastar
HERNU 11.37 7.56 14.41 1.86 51.10 15.06 44.99 4.82 57.19 285.10 10 7733 Decastar
BARRAS 11.33 6.97 14.09 1.95 49.48 14.48 42.10 4.72 55.40 282.00 11 7708 Decastar
NOOL 11.33 7.27 12.68 1.98 49.20 15.29 37.92 4.62 57.44 266.60 12 7651 Decastar
BOURGUIGNON 11.36 6.80 13.46 1.86 51.16 15.67 40.49 5.02 54.68 291.70 13 7313 Decastar
Sebrle 10.85 7.84 16.36 2.12 48.36 14.05 48.72 5.00 70.52 280.01 1 8893 OlympicG
Clay 10.44 7.96 15.23 2.06 49.19 14.13 50.11 4.90 69.71 282.00 2 8820 OlympicG
Karpov 10.50 7.81 15.93 2.09 46.81 13.97 51.65 4.60 55.54 278.11 3 8725 OlympicG
Macey 10.89 7.47 15.73 2.15 48.97 14.56 48.34 4.40 58.46 265.42 4 8414 OlympicG
Warners 10.62 7.74 14.48 1.97 47.97 14.01 43.73 4.90 55.39 278.05 5 8343 OlympicG
Zsivoczky 10.91 7.14 15.31 2.12 49.40 14.95 45.62 4.70 63.45 269.54 6 8287 OlympicG
Hernu 10.97 7.19 14.65 2.03 48.73 14.25 44.72 4.80 57.76 264.35 7 8237 OlympicG
Nool 10.80 7.53 14.26 1.88 48.81 14.80 42.05 5.40 61.33 276.33 8 8235 OlympicG
Bernard 10.69 7.48 14.80 2.12 49.13 14.17 44.75 4.40 55.27 276.31 9 8225 OlympicG
Schwarzl 10.98 7.49 14.01 1.94 49.76 14.25 42.43 5.10 56.32 273.56 10 8102 OlympicG
Pogorelov 10.95 7.31 15.10 2.06 50.79 14.21 44.60 5.00 53.45 287.63 11 8084 OlympicG
Schoenbeck 10.90 7.30 14.77 1.88 50.30 14.34 44.41 5.00 60.89 278.82 12 8077 OlympicG
Barras 11.14 6.99 14.91 1.94 49.41 14.37 44.83 4.60 64.55 267.09 13 8067 OlympicG
Smith 10.85 6.81 15.24 1.91 49.27 14.01 49.02 4.20 61.52 272.74 14 8023 OlympicG
Averyanov 10.55 7.34 14.44 1.94 49.72 14.39 39.88 4.80 54.51 271.02 15 8021 OlympicG
Ojaniemi 10.68 7.50 14.97 1.94 49.12 15.01 40.35 4.60 59.26 275.71 16 8006 OlympicG
Smirnov 10.89 7.07 13.88 1.94 49.11 14.77 42.47 4.70 60.88 263.31 17 7993 OlympicG
Qi 11.06 7.34 13.55 1.97 49.65 14.78 45.13 4.50 60.79 272.63 18 7934 OlympicG
Drews 10.87 7.38 13.07 1.88 48.51 14.01 40.11 5.00 51.53 274.21 19 7926 OlympicG
Parkhomenko 11.14 6.61 15.69 2.03 51.04 14.88 41.90 4.80 65.82 277.94 20 7918 OlympicG
Terek 10.92 6.94 15.15 1.94 49.56 15.12 45.62 5.30 50.62 290.36 21 7893 OlympicG
Gomez 11.08 7.26 14.57 1.85 48.61 14.41 40.95 4.40 60.71 269.70 22 7865 OlympicG
Turi 11.08 6.91 13.62 2.03 51.67 14.26 39.83 4.80 59.34 290.01 23 7708 OlympicG
Lorenzo 11.10 7.03 13.22 1.85 49.34 15.38 40.22 4.50 58.36 263.08 24 7592 OlympicG
Karlivans 11.33 7.26 13.30 1.97 50.54 14.98 43.34 4.50 52.92 278.67 25 7583 OlympicG
Korkizoglou 10.86 7.07 14.81 1.94 51.16 14.96 46.07 4.70 53.05 317.00 26 7573 OlympicG
Uldal 11.23 6.99 13.53 1.85 50.95 15.09 43.01 4.50 60.00 281.70 27 7495 OlympicG
Casarsa 11.36 6.68 14.92 1.94 53.20 15.39 48.66 4.40 58.62 296.12 28 7404 OlympicG

J.-M. Lasgouttes — Cours d’analyse de données 2015-2016 — Université Paris I Panthéon–Sorbonne 1


1.1 Analyse rapide des variables
On donne ci-dessous la matrice de corrélation des variables quantitatives.
c100 long poids haut c400 c110 disq perche javel c1500 RANG POINTS
c100 1.00 -0.60 -0.36 -0.25 0.52 0.58 -0.22 -0.08 -0.16 -0.06 0.30 -0.68
long -0.60 1.00 0.18 0.29 -0.60 -0.51 0.19 0.20 0.12 -0.03 -0.60 0.73
poids -0.36 0.18 1.00 0.49 -0.14 -0.25 0.62 0.06 0.37 0.12 -0.37 0.63
haut -0.25 0.29 0.49 1.00 -0.19 -0.28 0.37 -0.16 0.17 -0.04 -0.49 0.58
c400 0.52 -0.60 -0.14 -0.19 1.00 0.55 -0.12 -0.08 0.00 0.41 0.56 -0.67
c110 0.58 -0.51 -0.25 -0.28 0.55 1.00 -0.33 0.00 0.01 0.04 0.44 -0.64
disq -0.22 0.19 0.62 0.37 -0.12 -0.33 1.00 -0.15 0.16 0.26 -0.39 0.48
perche -0.08 0.20 0.06 -0.16 -0.08 0.00 -0.15 1.00 -0.03 0.25 -0.32 0.20
javel -0.16 0.12 0.37 0.17 0.00 0.01 0.16 -0.03 1.00 -0.18 -0.21 0.42
c1500 -0.06 -0.03 0.12 -0.04 0.41 0.04 0.26 0.25 -0.18 1.00 0.09 -0.19
RANG 0.30 -0.60 -0.37 -0.49 0.56 0.44 -0.39 -0.32 -0.21 0.09 1.00 -0.74
POINTS -0.68 0.73 0.63 0.58 -0.67 -0.64 0.48 0.20 0.42 -0.19 -0.74 1.00

Question 1: Quelles sont les couples de variables les plus corrélées, les moins corrélées, les plus opposées ?

Question 2: Comment se groupent les variables du point de vue des signes de corrélation ? Expliquez pourquoi.

1.2 Analyse des composantes principales


On procède à une analyse en composantes principales des performances centrées-réduites, en mettant de coté
pour l’instant les variables RANG, POINTS et COMPET. On donne ci-après les parts d’inertie suivantes associées
aux 5 premiers axes, puis, pour les trois premiers axes seulement, les corrélations des variables, les coordonnées
des individus, les contributions des individus aux axes et les qualités de représentation des individus par les
premiers espaces principaux (ces deux derniers tableaux en 10000èmes). Les tableaux concernant les individus
sont tous coupés en deux pour des raisons de hauteur.
Axis1 Axis2 Axis3 Axis1 Axis2 Axis3
SEBRLE -0.79 -0.77 -0.83 Bernard -1.91 0.09 0.76
Décomposition de l’inertie CLAY -1.23 -0.57 -2.14 Schwarzl -0.08 1.35 -0.82
KARPOV -1.36 -0.48 -1.96 Pogorelov -0.54 -0.77 -1.35
[1] 3.27 1.74 1.40 1.06 0.68 BERNARD 0.61 0.87 -0.89 Schoenbeck -0.11 0.04 -0.74
YURKOV 0.59 -2.13 1.23 Barras 0.00 -0.36 1.57
Corrélation variables/axes WARNERS -0.36 1.68 -0.77 Smith -0.87 -1.06 1.64
ZSIVOCZKY -0.27 1.09 1.28 Averyanov -0.35 1.56 -0.28
Comp1 Comp2 Comp3 McMULLEN -0.59 -0.23 0.42 Ojaniemi -0.38 0.77 0.37
c100 0.77 -0.19 0.18 MARTINEAU 2.00 -0.56 0.73 Smirnov 0.48 1.06 1.23
long -0.74 0.35 -0.18 HERNU 1.55 -0.49 -0.84 Qi 0.43 0.33 1.07
poids -0.62 -0.60 0.02 BARRAS 1.34 0.31 0.00 Drews 0.25 3.08 -1.05
haut -0.57 -0.35 0.26 NOOL 2.34 1.97 1.34 Parkhomenko 1.07 -2.09 1.00
c400 0.68 -0.57 -0.13 BOURGUIGNON 3.98 -0.20 -1.33 Terek 0.68 -0.54 -2.21
c110 0.75 -0.23 0.09 Sebrle -4.04 -1.37 0.29 Gomez 0.29 1.20 1.31
disq -0.55 -0.61 -0.04 Clay -3.92 -0.84 -0.23 Turi 1.54 -0.43 -0.51
perche -0.05 0.18 -0.69 Karpov -4.62 -0.04 0.04 Lorenzo 2.41 1.58 1.50
javel -0.28 -0.32 0.39 Macey -2.23 -1.04 1.86 Karlivans 1.99 0.29 0.34
c1500 0.06 -0.47 -0.78 Warners -2.17 1.80 -0.85 Korkizoglou 0.96 -2.07 -2.59
Zsivoczky -0.93 -1.17 1.48 Uldal 2.56 -0.25 0.42
Hernu -0.89 0.62 0.90 Casarsa 2.86 -3.80 -0.03
Nool -0.30 1.55 -1.36

Axis1 Axis2 Axis3 Axis1 Axis2 Axis3 Axis1 Axis2 Axis3 Axis1 Axis2 Axis3
SEBRLE 47 84 119 Bernard 271 1 100 SEBRLE 1117 2178 3396 Bernard 4546 4556 5273
CLAY 114 46 796 Schwarzl 0 257 117 CLAY 1240 1509 5236 Schwarzl 17 4733 6475
KARPOV 138 33 664 Pogorelov 22 83 315 KARPOV 1599 1802 5120 Pogorelov 513 1559 4758
BERNARD 28 107 137 Schoenbeck 1 0 95 BERNARD 487 1489 2527 Schoenbeck 41 45 1743
YURKOV 26 638 261 Barras 0 18 428 YURKOV 377 5363 7011 Barras 0 263 5244
WARNERS 9 399 102 Smith 56 158 469 WARNERS 216 5033 6029 Smith 606 1503 3663
ZSIVOCZKY 6 168 286 Averyanov 9 341 14 ZSIVOCZKY 112 1933 4438 Averyanov 192 4015 4141
McMULLEN 26 7 30 Ojaniemi 11 84 24 McMULLEN 526 607 873 Ojaniemi 264 1356 1608
MARTINEAU 297 44 93 Smirnov 17 158 262 MARTINEAU 2843 3068 3448 Smirnov 575 3328 7022
HERNU 178 33 123 Qi 14 15 199 HERNU 3061 3366 4272 Qi 606 948 4624
BARRAS 134 14 0 Drews 5 1333 193 BARRAS 4725 4978 4978 Drews 53 8160 9110
NOOL 410 543 310 Parkhomenko 85 615 174 NOOL 3943 6716 7997 Parkhomenko 941 4547 5370
BOURGUIGNON 1180 6 305 Terek 35 40 847 BOURGUIGNON 8568 8590 9542 Terek 432 698 5228
Sebrle 1216 262 15 Gomez 6 201 296 Sebrle 6954 7750 7785 Gomez 123 2221 4721
Clay 1145 98 9 Turi 177 26 46 Clay 7112 7436 7461 Turi 2525 2718 2999
Karpov 1591 0 0 Lorenzo 432 352 392 Karpov 8518 8518 8519 Lorenzo 4708 6742 8573
Macey 372 152 603 Karlivans 297 12 20 Macey 4230 5151 8099 Karlivans 5439 5557 5718
Warners 351 457 126 Korkizoglou 68 600 1161 Warners 5299 8964 9780 Korkizoglou 581 3283 7517
Zsivoczky 64 192 379 Uldal 489 8 30 Zsivoczky 1300 3374 6690 Uldal 7566 7635 7838
Hernu 59 54 140 Casarsa 609 2025 0 Hernu 2375 3524 5949 Casarsa 3371 9328 9328
Nool 7 335 319 Nool 91 2580 4493

J.-M. Lasgouttes — Cours d’analyse de données 2015-2016 — Université Paris I Panthéon–Sorbonne 2


Question 3: Si la première valeur propre (ici 3.27) était manquante, comment auriez-vous pu la retrouver à
partir des données disponibles ?

Question 4: Combien d’axes doit-on garder pour l’analyse ? Quelle part d’inertie totale sera alors représentée ?

Question 5: Quelles sont les variables qui déterminent les trois premières composantes principales (précisez les
critères utilisés) ?

Question 6: Expliquez comment les données peuvent être modifiées pour faire apparaı̂tre un effet de taille.

Question 7: Comment peut-on interpréter les axes principaux qu’on a décidé de garder en question 4 ? Est-ce
que cela remet en question ce choix d’axes ?

Question 8: Quels sont les individus qui déterminent les trois premiers axes principaux ? (précisez les critères
utilisés)

Question 9: Quels sont les 5 individus les moins bien représentés par le sous espace qu’on a décidé de conserver
en question 4 ? On expliquera la signification de la qualité de la représentation des individus par un sous-espace.

1.3 Variables supplémentaires


On se tourne maintenant vers les variables qui ont été laissées de côté dans l’analyse de la section précédente.
On donne ci-dessous, sur les 3 premiers axes, les corrélations des variables RANG et POINTS avec les composantes
principales
Comp1 Comp2 Comp3
RANG 0.66 -0.05 0.06
POINTS -0.94 0.02 0.07

Question 10: [question supprimée]

Question 11: Commentez la manière dont les variables RANG et POINTS sont corrélées avec les axes principaux.
Est-ce que cela nous apprend quelque chose ?

2 ACP sur un tableau à 2 colonnes


On se place dans le cadre de l’ACP sur 2 variables centrées réduites avec n individus. C’est bien sûr un cas
où l’ACP a peu d’intérêt, mais les calculs peuvent être faits explicitement. On suppose un poids uniforme n1
pour les individus eton note ρi` la corrélation entre les variables zi et z` . La matrice de corrélation s’écrit donc
1 ρ12
ici R = .
ρ21 1
   
1 1
Question 12: Montrer que les vecteurs et sont vecteurs propres de R associés aux valeurs propres
1 −1
1 + ρ12 et 1 − ρ12 .

Question 13: Donner en fonction du signe de ρ12 l’expression des facteurs principaux u1 et u2 et des valeurs
propres λ1 et λ2 . Calculez la part d’inertie totale portée par le premier axe principal.

Question 14: On rappelle que la corrélation entre la variable zj et la composante principale ck est égale à

λk ukj . En déduire les conditions sous lesquelles l’ACP présente un effet de taille.

J.-M. Lasgouttes — Cours d’analyse de données 2015-2016 — Université Paris I Panthéon–Sorbonne 3

Vous aimerez peut-être aussi