Vous êtes sur la page 1sur 2

ISA BTP

Première année
Statistiques Descriptives

TP1 : Tableur numérique

Alexandre CLOT
alexandre.clot@ens-paris-saclay.fr

9 mai 2023
L’objectif de cette séance est d’appliquer les notions vues en cours sur un tableur, comme Excel
ou Google Sheet. Le sujet est découpé en 2 parties, qui étudieront chacune une série statistique. Le
fichier de travail sera demandé à la fin de la séance, merci de respecter la nomenclature suivante :
NOM1_NOM2_TP1_SD.xls.

1 Répartition de la couleur des yeux d’un groupe


On demande à 500 personnes dans la rue la couleur de leurs yeux. Les réponses sont données
dans le fichier eye_color.txt.
1. Donner la population et le caractère étudié
2. Après avoir rapidement regardé les réponses, donner le type de caractère.
Pour traiter ces données, on utilisera un tableur comme Excel, LibreOffice Calc ou Google
Shett. La première étape consiste à importer les données dans le logiciel :
3. Ouvrir le fichier données et copier les données (Ctrl+A, Ctrl+C)
4. Dans le tableur, Clic droit, coller
Remarque : Dans certains cas, coller les données ne suffira pas pour les importer dans un tableur.
Dans ce cas, il faudra effectuer un collage spécial et spécifier le délimiteur des colonnes. Cette option
n’existe pas par défaut dans Google Sheet.
On va réaliser le tableau statistique lié à la série. Pour compter les effectifs des modalités, on
utilisera la fonction NB.SI(plage;condition). Cette fonction compte le nombre d’éléments dans
une plage de données qui vérifient la condition. Par exemple, NB.SI(A1:A10;"oui") renvoie le
nombre de cellules comprises entre A1 et A10 qui contiennent le mot "oui".
5. Lister les modalités
6. Calculer les effectifs de chacune à l’aide de NB.SI
7. Vérifier que la somme des effectifs correspond à la taille de la population
8. Calculer les fréquences
On veut visualiser la répartition des couleurs des yeux.
9. Donner 2 représentations graphiques possibles de cette série
10. Réaliser ces 2 représentations graphiques.

2 Essai de compression
On cherche à vérifier les performances d’un matériau. Pour cela, on réalise des échantillons que
l’on va passer à la presse et mesurer l’effort maximal de compression qu’ils peuvent supporter. Les
résultats sont donnés dans le fichier carac_ech.txt en kN.
1. Donner la population et le caractère étudié
2. Après avoir rapidement regardé les données, donner le type de caractère.
3. Importer les données dans un tableur
4. Donner les valeurs extrêmes de la série
5. Proposer une répartition en 5 classes de même amplitude
La formule de Huntsberger appliqué à la taille de la population nous indique d’utiliser une
répartition en 10 classes. Pour les prochaines questions, on considèrera les classes suivantes :
[540, 551] kN, ]551, 563] kN, ]563, 574] kN, ]574, 586] kN, ]586, 597] kN,
]597, 609] kN, ]609, 620] kN, ]620, 632] kN, ]632, 643] kN, ]643, 655] kN
La fonction précédemment introduit ne permet pas de prendre plusieurs conditions. On utili-
sera à la place la fonction NB.SI.ENS(plage1 ; condition1 ; plage2 ; condition2 ; ...).
Par exemple, la fonction NB.SI.ENS(A1:D125;"<="&C7;A1:D125;">="&B7) compte le nombre de
valeur dans la plage (A1:D125) qui ont une valeur inférieure ou égale à la valeur dans la cellule C7
et supérieure ou égale à la cellule B7.
6. Réaliser le tableau statistique de la série.
7. Calculer les fréquences cumulées croissantes
8. Tracer la fonction de répartition
9. Est-il possible de réaliser un histogramme ?
10. Refaire les questions 6 à 8 en considérant cette fois 7 classes de même effectif

Vous aimerez peut-être aussi