Vous êtes sur la page 1sur 2

TP1 : Familiarisation avec le langage R

S. Zertal

Exercice 1: Tableaux de données (Data frame)


On considère le fichier “athlete.csv” en annexe comme source de données.
On vous demande de :

1. Créer les vecteurs de donnéees contenant le poids, la taille et le genre


(Homme/Femme) des athlètes V poids, V taille et V genre

2. Créer un tableau de données (Data frame) composé de N lignes cor-


respondant aux différents athlètes et 3 colonnes associées aux 3 vari-
ables :

• La première colonne contient la variable genre des athlètes.


• La deuxième colonne contient la variable poids des athlètes.
• La troisième colonne contient la variable taille des athlètes.

3. Quel est le poids de l’athlète le plus mince parmi les hommes et celui
du plus mince parmi les femmes. Quel sont les indices de ces athlètes
les plus minces : homme et femme

4. Faites de même pour la taille et déterminez les athlètes les plus grands
parmi les hommes et parmi les femmes ainsi que leurs indices respectifs
dans la population considérée.

5. Donnez le résumé statistique pour ces variables (avec summary)

Exercice 2 : Graphisme
On souhaite continuer notre étude sur la population des athlètes, mais de
manière graphique, et on utilise le tableau de données crée dans l’exercice
précédent.

1
1. Représenter par une boite à moustaches les données statistiques prin-
cipales pour le poids des athlètes par genre sur le même graphe.

2. Faites de même pour la taille.

3. Réprésentez avec un histogramme le poids moyen des athlètes pour les


10 sports pratiqués par les athletes les plus forts.

4. Réprésentez avec un histogramme le poids moyen des athlètes pour les


10 sports pratiqués par les athletes les plus minces.

5. Les diagrammes circulaires (camemberts ou pies) ne sont représentatifs


que pour un nombre restreint de catégories. On ne considére donc
pour cette étude que les 5 sports les plus populaires pour représenter
la part ou proportion de chacun dans cet ensemble. Pour cela :

(a) Calculez le nombre d’occurrence de chaque sport par table selon


l’exemple :
occ < −table(X$var)
occ contiendra le nombre d’occurence de chaque modalité de la
variable var dans le tableaux de données X
(b) Triez cette table d’occurence de manière descendante avec sort
en précisant le sens du tri par decreasing = T RU E. Vous oblien-
drez les sports avec leurs effectifs respectifs, classés par ordre de
poplarité.
(c) Utilisez la commande donnée en cours pour terminer le tracé du
diagramme circulaire.

Vous aimerez peut-être aussi