Vous êtes sur la page 1sur 13

SNT - THEME 4 Les données structurées et leur traitement

I. Qu'est-ce qu'une donnée ?

A) De la donnée aux données structurées

Une donnée est une valeur associée à un objet, une personne ou un élément (ex : 15° ou 2 kg). Elle
est dite structurée lorsqu'elle est définie par des référentiels et présentées dans les champs d'une
base de données.
Les données sont factuelles et neutres, mais l’information qui en découle en général ne l’est pas.
Pour devenir une information qui a du sens, les données doivent être traitées, manipulées,
transformées ou encore croisées et nécessitent une interprétation.

 Exercice 1 : Les descripteurs de données

Le tableau suivant est tiré d’un fichier de contacts :

1/ Quels sont les descripteurs utilises pour caractériser un contact ?


..........................................................................................................................................................

2/ Quelle est la donnée correspondante au descripteur Nom du premier contact ?


..........................................................................................................................................................

3/ Quelle est la donnée correspondante au descripteur Adresse du troisième contact ?


..........................................................................................................................................................

4/ Quelles sont les données correspondantes aux descripteurs Nom et Adresse des deux premiers
contacts ?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

5/ Quelle information en découle-t-il ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

Une collection regroupe des objets partageant les mêmes descripteurs. Les collections sont en
général représentées par une table : les objets sont disposées en ligne, les descripteurs en colonne et
les données à l’intersection. Lorsque des collections sont représentées sous la forme d’une table, on
parle de données structurées.

SNT 2de Page 1 sur 13


Exemple : La collection des livres sur les aventures de Harry Potter (J. K.
Rowling) peut être d´écrite par la table suivante :

On reprend le tableau de l’exercice 1


6/ Ce tableau est-il un ensemble de données structurées ? Si oui, que représente la collection qui y
est d´écrite ?
..........................................................................................................................................................

7/ Les données présentes sont-elles bien structurées ?


..........................................................................................................................................................

B) Les bases de données

Une base de données (database en anglais) regroupe plusieurs collections de données reliées entre
elles. Elle permet de stocker et de retrouver l’intégralité des données en rapport avec un thème ou
une activité.
Exemple : La base de données d’une bibliothèque regroupe par la collection sur les livres, les abonnes
et les emprunts effectues.

Le dispositif comporte un système de gestion spécifique appelé système de gestion de base de


données relationnelles ou simplement SGBDR. Il s’agit d’un logiciel moteur qui agit sur la base de
données en utilisant un langage informatique particulier lui permettant de modifier et d’interroger la
base. MySQL et Microsoft Access sont deux SGBDR grand public parmi les plus connus. Le langage
informatique le plus utilise est le langage SQL (Structured Query Language ou langage de requête
structurée). Le mot relationnel vient du fait qu’une même base de données peut comporter
différentes tables partageant des descripteurs identiques. Ceci permet de croiser facilement les
données et d’obtenir des informations tr`es pertinentes suivant les requêtes effectuées.

 Doc 1 : Clé primaire

SNT 2de Page 2 sur 13


C) Les métadonnées

Les métadonnées sont des données connexes d’un document. Elles ne font pas partie du contenu du
document mais viennent apporter des informations complémentaires telles que :
• Mots-clefs ou tags facilitant la classification d’un document ;
• Auteur ou copyright ;
• Date de création, version, etc.

 Exercice 2 : Les métadonnées avec Audio Shell

8/ Quelles informations peut-on tirer de ces métadonnées ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

SNT 2de Page 3 sur 13


II. Quels sont les différents types de données ?

A) Les formats de fichiers

Pour assurer la persistance des données, ces dernières sont stockées dans des fichiers. Il existe deux
types de formats de fichiers :
 Les fichiers de type texte , c’est-`a-dire ceux lisibles par des logiciels de traitements de texte
comme Notepad++, qui ne comportent que des caractères alphanumériques. Les principaux
formats des fichiers textes sont les formats txt, CSV, XML, JSON et vCard. Les caractères sont
codés en mémoire en respectant une norme d’encodage.

 Les fichiers de type binaire , c’est-`a-dire ceux non lisibles par des logiciels de traitements de
texte. Ce sont principalement les formats des tableurs (ODS, XLS, XLSX, etc.), des SGBDR et
de certaines images (JGP, PNG, TIFF, etc.)

Le format des fichiers est indiqué sous forme d'extension à la fin du fichier ex : machanson.mp3

 Exercice 3 : Différents formats de fichiers

1/ Associez chaque type de données en mettant la lettre correspondante sous l'extension qui
correspond.
A. Son B. Image C. Archive compressée D. Texte
E. Vidéo F. Page Internet G. Texte non modifiable H. Tableur

Certains formats de données ne peuvent s'ouvrir qu'avec un logiciel bien précis (pour des raisons
techniques mais aussi souvent commerciales). En revanche, d'autres peuvent être compris et ouverts
par plusieurs logiciels interopérables. L'interopérabilité est donc la capacité de plusieurs systèmes, à
fonctionner ensemble grâce à des normes communes pour faciliter la transmission d'informations.

B) L'Open Data

Pour assurer au mieux l'interopérabilité entre les systèmes il est préférable d'utiliser des standards
communs et notamment favorisant les données ouvertes (Open Data).
Un format de données est dit ouvert (ou libre) si son mode d'organisation a été rendu public par son
auteur et qu'aucune entrave légale ne s'oppose à sa libre utilisation (droit d'auteur, brevet,
copyright).
La finalité de telles données est de donner la possibilité `a tout citoyen, toute entreprise ou
association de les utiliser `a ses propres fin d’analyse pour en extraire l’information désirée. le
gouvernement français met à disposition des données ouvertes sur le site "data.gouv.fr".

Les principaux formats ouverts de données sont XML, CSV ou bien JSON.
SNT 2de Page 4 sur 13
C. Les formats ouverts

 Doc 2 : Quelques formats ouverts de données

Le format CSV (Comma Separated Values) est à privilégier ; c’est le plus universel et le plus simple. Il
est également très flexible :
 Même s’il est de base un fichier texte, on peut l’importer facilement dans un tableur. De
plus, un fichier écrit dans un tableur peut facilement être export´e au format CSV.

 On peut troquer la virgule contre un point-virgule ou une tabulation comme séparateur de


données. Ceci est particulièrement intéressant dans le cas où la virgule est déjà utilisée dans
une écriture spécifique des données comme, par exemple, dans l’´ecriture des nombres
décimaux en français.

Le XML(Extensible Markup Language) n’est pas un langage de programmation . Il s’agit d’un format.
Il permet de structurer de l’information, de décrire des données.
Il offre des avantages en matière de fiabilité, car il doit obligatoirement être bien formé. C’est-à-dire
que tous les éléments ouverts doivent être fermés et tous les éléments doivent être correctement
imbriqués les uns dans les autres.

 Exercice 4 : Les formats textes CSV, XML et JSON

On considère une même table codée sous les trois formats textes CSV, XML et JSON :

SNT 2de Page 5 sur 13


3/ Quels sont les descripteurs et les données de la table ?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

4/ Sous quelle forme est codée la table suivant le format utilisé ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

5/ On désire ajouter le descripteur Nationalité, ainsi que l’auteur Jane Austen. Modifiez les trois
codes ci-dessus en conséquence.

 Exercice 5 : Un carnet d'adresse

Un carnet d’adresses est un fichier vCard contenant une ou plusieurs cartes de visites
virtuelles, chacune étant délimitée par les instructions BEGIN:VCARD et END:VCARD.
Exercice 3.4 (Etude d’un carnet) On donne le fichier vCard suivant :

6/ Combien y a-t-il de contacts ?


..........................................................................................................................................................

7/ Quels sont les prénoms et noms des contacts ?

SNT 2de Page 6 sur 13


..........................................................................................................................................................
..........................................................................................................................................................

8/ Peuvent-ils être tous contactés par mail ?


..........................................................................................................................................................
..........................................................................................................................................................

9/ Peuvent-ils être tous contact´es par téléphone ?


.........................................................................................................................................................
..........................................................................................................................................................
.

10/ Peuvent-ils être tous contactés par courrier écrit ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

III. Comment stocker les données ?

A) Une quantité exponentielle de données

Vidéo : L'histoire du stockage des données

 Exercice 6 : L'échelle des octets

1/ Replacez les données sur la frise en fonction de leur taille.


- Un Datacenter de la NSA (2013) de 300000m2 - Un film de 2 heures
- Un morceau de musique (mp3) - 6 millions de livres
- Toutes les informations produites jusqu'en -La totalité des données enregistrées en une
2003 année

SNT 2de Page 7 sur 13


B) Les données d'Internet

 Exercice 7 : Les données transmisses sur Internet

2/ D'une manière générale et ensuite en vous basant sur trois exemples, présentez l'évolution
d'Internet.
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

3/ D'après-vous pourquoi les données Internet connaissent-elles cette évolution ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

4/ Quelle conséquence cela peut-il générer ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

C) Le Cloud computing

Le Cloud computing ou informatique en nuage est une infrastructure dans laquelle la puissance de
calcul et le stockage sont gérés par des serveurs distants auxquels les usagers se connectent via une
liaison Internet sécurisée. Cela permet de pouvoir utiliser en ligne des ressources informatiques sans
les posséder physiquement.
SNT 2de Page 8 sur 13
Il existe actuellement trois grands modèles d'hébergement cloud sur le marché : le IaaS
(Infrastructure as a service) qui s'adresse aux administrateurs SI , le PaaS (Platform as a service) qui
s'adresse surtout aux développeurs d'applications et le SaaS (Software as a service) qui est destiné
aux utilisateurs. Chacune de ces solutions répond à des besoins spécifiques de ses utilisateurs.

Vidéo : Le cloud c'est quoi ?

 Exercice 8 : Les différents clouds

5/ Voici 5 services disponibles (tableau ci-dessous) dans le cloud. Pour chacun d'entre eux, préciser
de quel type de cloud il s'agit (SaaS, PaaS, IaaS).
Service Caractéristiques Type
Gmail est un service de messagerie électronique gratuit
proposé par Google. Les messages reçus sur un compte
Gmail peuvent être lus via un client de messagerie, une
application mobile ou avec un navigateur web.
Google Apps (G Suite) est une suite d'outils et de logiciels de
productivité de type Cloud computing et de groupware
destinée aux professionnels, proposée par Google sous la
forme d'un abonnement

OVH est une entreprise française spécialisée dans les


services de cloud computing. Elle propose des solutions
de cloud public et privé, des serveurs dédiés, de
l’hébergement mutualisé
Amazon Web Services fournit des services en ligne à
d'autres sites internet ou applications clientes. La plupart
d'entre eux ne sont pas directement exposés à l'utilisateur
final, mais offrent des fonctionnalités que d'autres
développeurs
Dropbox est un service de stockage et de partage de
copies de fichiers locaux en ligne proposé par Dropbox,
Inc.

Vidéo : Le datacenter Normandie

 Exercice 9 : La gestion des Datacenters

1/ De quelles manières sont sécurisées les données dans un Datacenter ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
SNT 2de Page 9 sur 13
2/ Pourquoi les Datacenters doivent-ils mettre en place un système de refroidissement ?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

3/ Qu'est-ce que la notion de redondance ? Pourquoi est-elle si importante ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

IV. Qu'est ce que le Big Data et les données personnelles ?

A) Le Big Data

 Exercice 9 : Les 3V du Big Data

1/ Pourquoi la notion de BigData est-elle apparue ces dernières années ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

2/Quelles conséquences cela génère-t-il ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
3/ Pourquoi parle-t-on de la règle des "3V" ?
SNT 2de Page 10 sur 13
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

B) La protection des données personnelles

Dans le domaine du numérique, la Commission Nationale de l'Informatique et des Libertés(CNIL)


aide les particuliers à avoir une maitrise de leurs données personnelles et elle accompagne les
entreprises dans leur mise en conformité vis-à-vis de la loi.

Vidéo : C'est quoi la CNIL ?

 Exercice 9 : Les missions de la CNIL

1/ Pourquoi peut-on dire que la CNIL est le gendarme d'Internet ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

2/ Peut-on dire qu'elle a également un rôle de guide ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

C) Le Règlement Général sur la Protection des Données

SNT 2de Page 11 sur 13


L’acronyme RGPD signifie « Règlement Général sur la Protection des Données ». Le RGPD encadre le
traitement des données personnelles sur le territoire de l’Union européenne et adapte ainsi le
contexte juridiques aux évolutions des technologies et de nos sociétés (usages accrus du numérique,
développement du commerce en ligne…). Il harmonise les règles en Europe en offrant un cadre
juridique unique aux professionnels. Il permet de développer leurs activités numériques au sein de
l’UE en se fondant sur la confiance des utilisateurs.

Vidéo : Comprendre le RGPD en 5 questions

 Exercice 10 : Le RGPD

https://www.legal-tools.fr/tous-articles-blog/rgpd-et-conformite-lenjeu-fiscal/

1. Pourquoi l'UE a-t-elle instauré le RGPD ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

2. Quelles données retrouve-t-on dans les RGPD ?


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

3. Pourquoi le mienur (15 ans en France) doit-il avoir le consentement de ses parents ?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

4. Qu'est ce que la portabilité des données ?

SNT 2de Page 12 sur 13


..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

5. Avez-vous ressenti la mise en place du RGPD lors de vos navigations sur Internet ?
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................
..........................................................................................................................................................

V. Synthèse
 Exercice 11 : Les cheminement des données sur Internet

Expliquez en une quinzaine de lignes le cycle de vie des données sur Internet et les différents enjeux
et risques qui peuvent apparaitre.

SNT 2de Page 13 sur 13

Vous aimerez peut-être aussi