Vous êtes sur la page 1sur 11

Thème 1 LES DONNÉES NUMÉRIQUES SNT

Ce module propose une formation interactive sur le thème "Les données structurées et leur traitement" du programme des Sciences Numériques et
Technologie (SNT).

I Historique des données structurées et de leur traitement

https://www.youtube.com/watch?v=y_mgaxO0fJY

Répondre à l'aide de la vidéo précédente aux questions suivantes :

1. Quelle invention datant du XVIIe siècle a été mis à profit par les informaticiens pour stocker des données ?

2. En quelle année a été créé le premier disque dur ?

3. En quelle année a été développé le premier modèle permettant de structurer et d'indexer des bases de
données ?

4. Comment s'appelle le premier tableur mis à la disposition du grand public ?

5. En quelle année l'Open Government Initiative a t-elle été mise en place ?

6. Quelle est le nom du texte de loi européen qui protège les citoyens européens quant à leurs données
personnelles ?
II Les données numériques

1) Définition :

Activité 1 : Les données chiffrées de la carte vitale .

Prenons l’exemple d’une carte vitale ; la donnée brute qui nous intéresse
est la série ordonnée de chiffres...

Si maintenant on précise que c'est un numéro de sécurité sociale, chaque


série de chiffres devient une information compréhensible...

Q1 Quelle information correspond a ces chiffres..

2…………..
69…………
05………….
49…………..
588…………..
157……………
80 : c est la clé de classement dans un fichier de stockage

Q2 Quelles informations déduire de cette carte vitale ( texte attendu)


Il s’agit de la carte vitale de ……

2) Les données personnelles

Activité 1 Regardez cette vidéo de France Télévision consacrée à « le business des données personnelles » :

https://youtu.be/dztbDIPux9A

Répondre aux questions :

Q1. Qu’est-ce qu’une donnée personnelle ?

Q2. Comment les données personnelles sont-elles recueillies sur internet par les GAFAM .. entreprises telles que Google,
Apple, Facebook, Amazon ou Microsoft ?

Q3. Ou son elles stockées ?

Q4 Qui est à l’origine de cette collecte des données ? Dans quel but ?

Q5 Quel est l’intérêt pour les entreprises d’obtenir les données personnelles des internautes ?

Q4. Justifiez le titre de la vidéo.

BILAN :

Activité 2 : Préciser dans chaque cas si les données sont personnelles et sensibles quantitatives ou qualitatives. .
Des exemples de données Caractéristique de la Nature de la donnée ( quantitative ; qualitative)/
donnée ( personne- (personnelle ; impersonnelle;sensible)
objet-evennement)

Léa

15 like de sa dernière publication sur


Facebook
17 ans

72.456.12.1 Adresse Ip de son ordi

Message à caractère politique sur


Instagram
Achat d’un bureau sur Cdiscount

Numéro de carte bancaire

Photo de ses vacances sur twitter.

Activité 3 : Le lendemain d’une journée pour la planète organisée le 17 février 2019 par les élèves du Lycée André
Chamson à Le Vigan, Mila veut poster un article sur le site de l’établissement.
En tant que webmaster , définir les descripteurs ou les données à ajouter pour que l’article soit bien référencé :
Information Données brutes
Date et emplacement
concernés
1703
Auteur
Date de création
26/02/2019
Titre
langue
Les élèves du lycée André Chamson ont organisé une journée pour la planète en
soutien à la marche en févier en faveur de l’écologie
jpeg

3) Le règlement européen sur les données personnelles (RGPD)


Activité : Regardez cette vidéo du quotidien Le Monde consacré au règlement européen sur les données personnelles
(RGPD) : https://www.youtube.com/watch?time_continue=12&v=iMD3pWAFXEY.

Répondre aux questions :

Q1. Quel est l’objectif du règlement européen sur les données personnelles (RGDP) ?

Q2. Complétez le tableau afin de présenter les principes du RGDP.

Principes concernant le Principes concernant la portabilité Principes concernant les conditions


consentement des mineurs des données d’utilisation

Q3 :Que change le RGPD pour les entreprises ?

BILAN/ Le RGPD

III LES FORMATS DE DONNÉES


Pour assurer la persistance des données, ces dernières sont stockées dans des fichiers.

Il y a deux types de formats de fichiers dont voici les principaux :

• ceux lisibles par des éditeurs de texte comme Notepad++,Geany, Bloc-Notes, (on dit alors "de type texte")
qui ne contiennent que des caractères alphanumériques : CSV, XML,JSON et vCard (extension .vcf) pour
une collection de contacts.
Les caractères sont codés en mémoire en respectant une norme d'encodage, telle que le Latin1 [html,
fr] (spécialisé pour coder efficacement les caractères latins) ou l'UTF-8 [html, fr].

• les autres que les éditeurs de texte ne pourront pas lire correctement (on dit "de type binaire"). Ce sont
principalement les formats des tableurs (LibreOffice Calc, Excel, Numbers...):ODS,XLS,XLSX ...

• et ceux des logiciels de gestion de bases de données (Dbase pour n'en citer qu'un): DBF ...

Le format CSV (Comma Separated Values, données avec des séparateurs) est à privilégier ; c'est le plus universel
et le plus simple. C'est aussi très flexible : on peut troquer la virgule contre un point virgule ou une tabulation comme
séparateur de données, si celles-ci contiennent elles-mêmes des virgules (en comme français où la virgule est
utilisée pour écrire des nombres décimaux).
Activité  1 : Essayez d'ouvrir un fichier binaire (une image d'extension JPG par exemple) par un traitement de texte
basique tel que Pluma Text Editor, Notepad, Geany, NotePad++ qui n'est pas fait pour ça.
Expliquez le résultat

Propriétés  des formats de fichiers au format texte  : CSV ; JSON ; XML :

• CSV [html, fr] : les données sont séparées par une virgule pour cet exemple. La première ligne du format CSV
contient la liste des descripteurs de la table, séparés eux aussi par une virgule. Chaque ligne correspond aux
données d'un individu de la collection. Les séparateurs n'étant pas standardisés, ils peuvent être dans d'autres
cas un point-virgule ou une tabulation par exemple on parle alors de format TSV (Tabulation-separated values)

• XML [html, fr] (Extensible Markup Language langage de balisage extensible) : c'est un langage "à balises".
Chaque enregistrement est ici écrit sous la forme <descripteur>donnée</descripteur> , une donnée pouvant être
elle-même une table (données hiérarchisées).

• JSON [html, fr] (JavaScript Object Notation) : cet exemple montre que JSON est similaire au XML. Les
enregistrements, séparés par des virgules, sont écrits de la forme descripteur/ donnée.

• Chaque individu de la collection est délimité par des accolades { ... }.

Activité 2 : On a ouvert un fichier avec un traitement de texte et voici ce qu'on a obtenu :

Quel est le format de ce fichier ?

Activité 3 On a ouvert un fichier avec un


traitement de texte et voici ce qu'on a
obtenu :
Quel est le format de ce fichier ? Autre ?

Activité 4 : Identifiez les deux formats de fichier.

Activité 5 :
1. De quel type de format s’agit t’il ? Comment l’identifiez vous ?
2. Quels sont les descripteurs ?

3. Combien d'objets sont présents dans cette collection de données ?

V - TRAITEMENT DES DONNÉES


Une table de données peut faire l’objet de différents traitements opérations : recherche d’une information précise, tri de
la collection sur un ou plusieurs propriétés, filtre de la collection , calculs, représentation graphique des
informations produites. La recherche dans une base de données peut aussi amener à croiser plusieurs collections ;

Pb /Quelles sont les opérations qu’il est alors possible d’effectuer pour réutiliser et analyser ces données ?

Exercice1  : Collecter des données et générer une table.

 Collectez les données à partir des étiquettes alimentaires et construire une table de données de la composition nutritionnelle
de 6 aliments au choix avec l’éditeur calc office.
 Principes :
• la première ligne correspond aux descripteurs
• les lignes suivantes correspondent aux données brutes.
• La même information ne doit pas etre répétée pour minimiser le volume du fichier.
 Colorez en surimpression la ligne descripteur -Donner un titre à votre table.
 Sauvegardez votre table dans un dossier que vous nommerez « SNT traitement de données »

 Identifiez votre fichier ( mot clef - Nom - date)

 Réalisez une copie de ce fichier dans un format permettant les échanges de données  figées; Ex le format PDF

 Appelez le professeur pour évaluation.

Rappel : Le format CSV


Le format Comma Separated Values (CSV) structure les données sous la forme de valeurs séparées par des virgules. Ce
format est très facile à générer et à manipuler. C’est un format de partage très utilisé.

Chaque ligne du fichier CSV correspond à une ligne du tableau et chaque valeur séparée par une virgule correspond à
une colonne du tableau, c’est-à-dire les descripteurs.

La première ligne du fichier contient l'entête de la table, à savoir le nom de chacune des colonnes. Les lignes suivantes
contiennent les données du tableau, en respectant l'ordre des colonnes. Le séparateur n'est pas forcément une virgule, on peut par
exemple utiliser le point-virgule.

Exercice  2 : - Opérations de tri de données

-Notre collection n’est pas exhaustive. Allons collecter un jeu de données plus complet. Récuperez le fichier « table-composition-
aliments «  ( dossier public les ordi salle ou ENT /mes classes) ces données proviennent de l ‘OpenData …site institutionnel sur
la nutrition (pour info ... https://ciqual.anses.fr/=)

Ouvrir la base de donnée en mode calc.


 On souhaite trier des données concernant les constituants nutritionnels d’aliments intéressants pour la santé .
Trier (=ordonner les objets suivant les valeurs de l’un des descripteurs)
• Cliquez sur Données puis auto-filtre.
 Sélectionner les bons descripteurs et répondez aux questions
suivantes :

Question 1 : Trier les fruits les plus riches : ( indiquer les 3 premiers)

 En Vit A (= favorable à la vision):


 Réponse : ...
 En vit C ? ( = antioxydant et anti infectieux)

 En Magnésium ( = décontractant musculaire) et fer (= qualité du sang) ?

Q2 : Les aliments les plus riches en protéines ? (stimulant défenses immunitaires- masse muscle)

Q3 : Quels sont les légumes les moins caloriques ?

Q4 : Quel est l’aliment le plus riche en Vitamine D ?

Q6 : Quels sont les poissons les plus gras ?



Q7 : Quel commentaire pouvez vous faire sur les aliments les plus caloriques ?

Exercice 3  : Calculs simple sur tableur …...quelques exemples ……

Tutoriel https://youtu.be/wOxNQJ--hNM

Ouvrir le fichier « composition des aliments « présent dans l ‘espace classe de L ‘ENT.

Q1: Quelle est la masse en matière organique des fuits et légumes.


Rque : Vous pouvez utiliser la fonction SOMME du tableur.
Posez le calcul:

Q2 Quelle est la proportion ( pourcnetage) en matière orgnique des fruits et légumes ?


Posez le calcul:

Q3 Classer par ordre décroissant les viandes et produits laitiers en fonction de leur proportion (pourcentage ) en proteines par

rapport a leur masse organique

Matière organique: lipides , glucides , protéines , fibres et vitamines  

Exercice 4: Représenter graphiquement.

« Les communes de France »

Chargez (sur public/snt) le fichier « communes_France.csv » qui est une table


de données sur les communes françaises puis ouvrez ce fichier avec
LibreOffice Calc.

1. Quel est le caractère de séparation des données ? Quels sont les descripteurs ?

2. Utilisez des filtres et/ou des tris pour répondre aux questions suivantes.

a. Quelles sont les 5 villes les plus peuplées en France en 2022 ?

……………………………………………………………………………………………………………

b. Citez les villes villes du gard de plus de 100 habitants (en 2012) dont l’altitude est supérieure ou égale à 500 m .

c. indiquez les .
Dans la barre d’outils : cliquez sur «  Données / plus de filtres/ filtre standard »

3. Visualiser graphiquement l’évolution du nombre d’habitants de la commune ou vous résidez.

 Utiliser les fonctionnalités du tableur pour construire une représentation graphique appropriée de ces données.

 Votre graphique devra comporter les titres des axes Y ( axe des ordonnées) et X (axe des abscisses) et un titre général .

 le tuto «  les fonctionnalités du tableur pour construire une représentation graphique »

 https://www.youtube.com/watch?v=SrAGvCE8BO0

 Représentez votre graphique en courbe ,

 Copier-coller votre table et votre graphique sur cette page.

 Enregistrez votre travail en format PDF et glisser le dans votre dossier personnel nominatif.

4. Construire un graphique en bâtonnets des 10 communes les plus peuplées de France en 2012.

Insérer votre graphique ci-dessous- Titrez votre graphique.

Vous aimerez peut-être aussi