Académique Documents
Professionnel Documents
Culture Documents
Ce module propose une formation interactive sur le thème "Les données structurées et leur traitement" du programme des Sciences Numériques et
Technologie (SNT).
https://www.youtube.com/watch?v=y_mgaxO0fJY
1. Quelle invention datant du XVIIe siècle a été mis à profit par les informaticiens pour stocker des données ?
3. En quelle année a été développé le premier modèle permettant de structurer et d'indexer des bases de
données ?
6. Quelle est le nom du texte de loi européen qui protège les citoyens européens quant à leurs données
personnelles ?
II Les données numériques
1) Définition :
Prenons l’exemple d’une carte vitale ; la donnée brute qui nous intéresse
est la série ordonnée de chiffres...
2…………..
69…………
05………….
49…………..
588…………..
157……………
80 : c est la clé de classement dans un fichier de stockage
Activité 1 Regardez cette vidéo de France Télévision consacrée à « le business des données personnelles » :
https://youtu.be/dztbDIPux9A
Q2. Comment les données personnelles sont-elles recueillies sur internet par les GAFAM .. entreprises telles que Google,
Apple, Facebook, Amazon ou Microsoft ?
Q4 Qui est à l’origine de cette collecte des données ? Dans quel but ?
Q5 Quel est l’intérêt pour les entreprises d’obtenir les données personnelles des internautes ?
BILAN :
Activité 2 : Préciser dans chaque cas si les données sont personnelles et sensibles quantitatives ou qualitatives. .
Des exemples de données Caractéristique de la Nature de la donnée ( quantitative ; qualitative)/
donnée ( personne- (personnelle ; impersonnelle;sensible)
objet-evennement)
Léa
Activité 3 : Le lendemain d’une journée pour la planète organisée le 17 février 2019 par les élèves du Lycée André
Chamson à Le Vigan, Mila veut poster un article sur le site de l’établissement.
En tant que webmaster , définir les descripteurs ou les données à ajouter pour que l’article soit bien référencé :
Information Données brutes
Date et emplacement
concernés
1703
Auteur
Date de création
26/02/2019
Titre
langue
Les élèves du lycée André Chamson ont organisé une journée pour la planète en
soutien à la marche en févier en faveur de l’écologie
jpeg
Q1. Quel est l’objectif du règlement européen sur les données personnelles (RGDP) ?
BILAN/ Le RGPD
• ceux lisibles par des éditeurs de texte comme Notepad++,Geany, Bloc-Notes, (on dit alors "de type texte")
qui ne contiennent que des caractères alphanumériques : CSV, XML,JSON et vCard (extension .vcf) pour
une collection de contacts.
Les caractères sont codés en mémoire en respectant une norme d'encodage, telle que le Latin1 [html,
fr] (spécialisé pour coder efficacement les caractères latins) ou l'UTF-8 [html, fr].
• les autres que les éditeurs de texte ne pourront pas lire correctement (on dit "de type binaire"). Ce sont
principalement les formats des tableurs (LibreOffice Calc, Excel, Numbers...):ODS,XLS,XLSX ...
• et ceux des logiciels de gestion de bases de données (Dbase pour n'en citer qu'un): DBF ...
Le format CSV (Comma Separated Values, données avec des séparateurs) est à privilégier ; c'est le plus universel
et le plus simple. C'est aussi très flexible : on peut troquer la virgule contre un point virgule ou une tabulation comme
séparateur de données, si celles-ci contiennent elles-mêmes des virgules (en comme français où la virgule est
utilisée pour écrire des nombres décimaux).
Activité 1 : Essayez d'ouvrir un fichier binaire (une image d'extension JPG par exemple) par un traitement de texte
basique tel que Pluma Text Editor, Notepad, Geany, NotePad++ qui n'est pas fait pour ça.
Expliquez le résultat
• CSV [html, fr] : les données sont séparées par une virgule pour cet exemple. La première ligne du format CSV
contient la liste des descripteurs de la table, séparés eux aussi par une virgule. Chaque ligne correspond aux
données d'un individu de la collection. Les séparateurs n'étant pas standardisés, ils peuvent être dans d'autres
cas un point-virgule ou une tabulation par exemple on parle alors de format TSV (Tabulation-separated values)
• XML [html, fr] (Extensible Markup Language langage de balisage extensible) : c'est un langage "à balises".
Chaque enregistrement est ici écrit sous la forme <descripteur>donnée</descripteur> , une donnée pouvant être
elle-même une table (données hiérarchisées).
• JSON [html, fr] (JavaScript Object Notation) : cet exemple montre que JSON est similaire au XML. Les
enregistrements, séparés par des virgules, sont écrits de la forme descripteur/ donnée.
Activité 2 : On a ouvert un fichier avec un traitement de texte et voici ce qu'on a obtenu :
Activité 5 :
1. De quel type de format s’agit t’il ? Comment l’identifiez vous ?
2. Quels sont les descripteurs ?
Pb /Quelles sont les opérations qu’il est alors possible d’effectuer pour réutiliser et analyser ces données ?
Collectez les données à partir des étiquettes alimentaires et construire une table de données de la composition nutritionnelle
de 6 aliments au choix avec l’éditeur calc office.
Principes :
• la première ligne correspond aux descripteurs
• les lignes suivantes correspondent aux données brutes.
• La même information ne doit pas etre répétée pour minimiser le volume du fichier.
Colorez en surimpression la ligne descripteur -Donner un titre à votre table.
Sauvegardez votre table dans un dossier que vous nommerez « SNT traitement de données »
Réalisez une copie de ce fichier dans un format permettant les échanges de données figées; Ex le format PDF
Chaque ligne du fichier CSV correspond à une ligne du tableau et chaque valeur séparée par une virgule correspond à
une colonne du tableau, c’est-à-dire les descripteurs.
La première ligne du fichier contient l'entête de la table, à savoir le nom de chacune des colonnes. Les lignes suivantes
contiennent les données du tableau, en respectant l'ordre des colonnes. Le séparateur n'est pas forcément une virgule, on peut par
exemple utiliser le point-virgule.
-Notre collection n’est pas exhaustive. Allons collecter un jeu de données plus complet. Récuperez le fichier « table-composition-
aliments « ( dossier public les ordi salle ou ENT /mes classes) ces données proviennent de l ‘OpenData …site institutionnel sur
la nutrition (pour info ... https://ciqual.anses.fr/=)
Question 1 : Trier les fruits les plus riches : ( indiquer les 3 premiers)
Tutoriel https://youtu.be/wOxNQJ--hNM
Ouvrir le fichier « composition des aliments « présent dans l ‘espace classe de L ‘ENT.
Q3 Classer par ordre décroissant les viandes et produits laitiers en fonction de leur proportion (pourcentage ) en proteines par
1. Quel est le caractère de séparation des données ? Quels sont les descripteurs ?
2. Utilisez des filtres et/ou des tris pour répondre aux questions suivantes.
……………………………………………………………………………………………………………
b. Citez les villes villes du gard de plus de 100 habitants (en 2012) dont l’altitude est supérieure ou égale à 500 m .
c. indiquez les .
Dans la barre d’outils : cliquez sur « Données / plus de filtres/ filtre standard »
Utiliser les fonctionnalités du tableur pour construire une représentation graphique appropriée de ces données.
Votre graphique devra comporter les titres des axes Y ( axe des ordonnées) et X (axe des abscisses) et un titre général .
https://www.youtube.com/watch?v=SrAGvCE8BO0
Enregistrez votre travail en format PDF et glisser le dans votre dossier personnel nominatif.
4. Construire un graphique en bâtonnets des 10 communes les plus peuplées de France en 2012.