Vous êtes sur la page 1sur 2

Thème 2 :

CORRECTION Données

Objectifs :
Télécharger un fichier de données à partir d’un site open data.
Exploiter ce fichier de données à l’aide de filtres et de tris dans un tableur.

Partie A - importer des données ouvertes,


Accéder au site data.gouv.fr à partir de chrome ou firefox.
Télécharger les données ouvertes sur les prénoms en France, hors Mayotte en suivant la procédure suivante :
1- Dans la barre de recherche, saisissez les mots prénoms France .
2- Dans la liste, sélectionnez fichier des prénoms de 1900 à 2018 .
3- Télécharger le fichier France hors Mayotte (voir image ci-dessous). Vous l’enregistrerez dans votre
dossier « documents/SNT ».

Partie B – Accéder aux métadonnées


1. Faites un clic droit sur le fichier nat2018_csv.zip, puis extraire tout . Un fichier nat2018.csv va être créé.
2. Faites un clic droit sur le fichier nat2018.csv, puis propriétés pour accéder aux métadonnées de ce fichier et
répondre aux questions suivantes :

a- Quand ce fichier nat2018.csv a-t-il été créé ? date et heure de l’extraction


b- Quand ce fichier a-t-il été modifié pour la dernière fois ? mardi 30 avril 2019, 15:07:08
c- Quelle est sa taille en octets ? 11602588

Les métadonnées de ce fichier sont structurées en quatre parties :


d- Chercher dans les différentes parties qui est le propriétaire de ce fichier : nom de l’utilisateur du PC

Partie C –fichier .CSV


1.  Faites un clic droit sur le fichier nat2018.csv puis edit with notepad++ ou ouvrir avec puis bloc note,
2.  Recopier ci-dessous le contenu des 2 premières lignes.
sexe;preusuel;annais;nombre
1;A;1980;3
3. Quel est le séparateur utilisé dans ce fichier ? le point virgule

4. Retourner sur le navigateur et votre page du site data.gouv.fr sur le fichier des prénoms de 1900 à 2018.
En bas de la page, dans l’onglet documentation, cliquer sur le bouton .
Enfin cliquer sur l’onglet dictionnaire des variables.
Compléter le tableau ci-dessous :

Descripteur Intitulé Type Modalité


SEXE sexe Caractère - longueur 1 1 pour masculin, 2 pour féminin
PREUSUEL Premier prénom Caractère - longueur 25
ANNAIS Année de naissance caractère - Longueur : 4 1900 à 2018, XXXX
NOMBRE Fréquence numérique - Longueur : 8
Pour ouvrir un fichier CSV dans Calc
Partie D - traitement des données avec un tableur (calc ou excel)
1. Choisissez Fichier - Ouvrir.
1. Ouvrir un tableur. 2. Recherchez le fichier CSV à ouvrir.
2. Suivre la démarche ci-contre pour importer les données. Puis sélectionnez-le.
Le fichier peut être un peu long à s’ouvrir… 3. Cliquez sur Ouvrir. La boîte de dialogue
Import de texte s'ouvre.
3. Combien y-a-t’il de lignes dans cette feuille de calcul ? 4. Spécifiez le bon séparateur de colonnes
du texte du fichier. ...
4. Combien de personnes portent le même prénom que vous et sont 5. Cliquez sur OK.
nées la même année ?
Mon Prénom est : … mon année de naissance est …
Il y a … personnes qui …
5. Dans la cellule F10 saisir =SOMME(D5 : D10)
Ceci revient à faire la somme des nombres des cellules allant de D5 à D10, et permet de déterminer le
nombre de personnes prénommées AADAM depuis 1900.

6. Combien de personnes portent le même prénom que vous depuis 1900 ?

Remarque : L’indication XXXX dans le champ année de naissance indique que ce prénom a été attribué au
moins 20 fois entre 1946 et 2018. Le nombre associé indique combien de fois ce prénom a été attribué
au total sachant que seules les années où il a été attribué 1 ou 2 fois sont prises en compte.
Par exemple, le prénom AADAM a été attribué : 4+3+4+4+3+9 soit 27 fois entre 1946 et 2018.

7. Combien de fois le prénom féminin SCHOLASTIQUE a-t-il été attribué entre 1900 et 2018 ?
Aide : dans calc, utiliser edition puis rechercher ; dans excel, utiliser l’icône rechercher et selectionner

8. Trier
Les données sont actuellement triées par sexe, puis par nom, puis par année.
On souhaite déterminer les deux prénoms qui ont été le plus utilisés sur une année. Vu le nombre important
de données, et la manière dont elles sont triées il est judicieux de trier les données par année :
a- sélectionner les quatre colonnes A, B, C et D
(aide : cliquer sur A, rester cliquer et déplacer la souris jusque D, puis relâcher le bouton)
b- sur calc Sur excel,
Onglet Données Icône Trier et filtrer 1
Cliquer sur Trier Tri personnalisé
Clé de tri 1 : nombre cocher : décroissant Trier par nombre et du
Valider plus grand au plus petit 2

3
c- Compléter le tableau en reportant les deux premières lignes de votre tableur:
sexe preusuel annais nombre
1 JEAN 1946 53706
2 MARIE 1901 52149

9. Filtrer
a- sélectionner les quatre colonnes A, B, C et D
b- sur calc Sur excel,
Onglet Données Icône Trier et filtrer
Autofiltre
Sélectionnez la flèche de preusuel Sélectionnez la flèche de preusuel
Décocher , puis cocher , OK Décocher , puis cocher , OK

c- En quelle année le prénom masculin JEAN a-t-il été le moins utilisé ? 2017 avec 764 prénoms

10. Utiliser les filtres et tris pour déterminer le prénom féminin le plus utilisé en 2004 ? Léa

Vous aimerez peut-être aussi