Vous êtes sur la page 1sur 3

Types de données :

Le Big Data fait référence à la gestion et à l'analyse de vastes ensembles


de données, et ces ensembles de données massives peuvent être classés en 3
catégories principales : données structurées, non structurées et semi-
structurées.

Données structurées :
Elles sont organisées dans un format bien défini, c’est-à-dire sous forme
de tableaux, avec des lignes et des colonnes.
Elles sont souvent stockées dans des bases de données relationnelles et
utilisent des langages comme SQL (Structured Query Language), pour leur
manipulation. Ces données ont un schéma prédéfini, c’est-à-dire que chaque
entrée de données est catégorisée dans des colonnes spécifiques : par
exemple, dans une base de données(c’est une forme de tableau), chaque
colonne représente un type d'information (nom, âge, adresse, etc.).
Ces données sont ainsi plus faciles à analyser et à interroger, et sont très
utilisées pour des opérations de type requête ou analyse dans une base de
bases de données par exemple.

Données non-structurées :
Les données non structurées ne suivent pas un schéma ou une
organisation claire comme les données structurées. Elles peuvent être de
différentes natures, comme des fichiers texte, des images, des vidéos, des e-
mails, des médias sociaux, des enregistrements audios, etc.
Ces données ne sont pas facilement classifiables dans des colonnes ou autres.
Elles nécessitent souvent des méthodes avancées de traitement pour être
analysées et interprétées.
Elles représentent la majorité des données générées, mais sont plus difficiles à
traiter.
Données semi-structurées :
Les données semi-structurées partagent des caractéristiques des
données structurées et non structurées. Elles ont une certaine forme
d’organisation, mais pas un schéma rigide comme dans les données
structurées.
Elles peuvent être représentées dans des formats comme JSON (JavaScript
Object Notation) ou XML (eXtensible Markup Language) où il y a une structure,
mais toutes les données ne sont pas nécessairement régulièrement disposées
dans des colonnes fixes comme dans les données structurées.

Caractéristique du Big Data :


Le Big Data est défini par 5 caractéristiques fondamentales, souvent désignées
par les "5 V" : le Volume (quantité massive de données), la Variété (différents
types et formats de données), la Vélocité (vitesse de génération et de
traitement des données), la Véracité (qualité et fiabilité des données), et la
Valeur (capacité à tirer des enseignements de ces données).
Volume :
Chaque minute, des quantités énormes de données sont générées. Pour
donner un aperçu de cette énormité, pensez à combien de photos sont
partagées sur les réseaux sociaux, combien de vidéos sont visionnées sur
différentes plateformes de streaming, combien d'e-mails sont envoyés et
combien de recherches sont effectuées en ligne. Chaque action sur Internet,
chaque transaction financière, chaque appareil connecté génère des données.
Ces données s'accumulent rapidement, et atteignent des volumes incroyables :
des téraoctets aux pétaoctets, voire aux exaoctets de données. On dit alors que
le Big Data est caractérisé par son volume.
Vélocité :
Dans le monde, les données sont créées, échangées et traitées avec une vitesse
incroyable. Les tonnes de messages envoyés sur les réseaux sociaux, le suivi des
transactions en temps réel sur les marchés financiers, ou encore la surveillance
des capteurs IOT pour les applications de santé. Ces données sont générées et
circulent à une vitesse étonnante, on dit alors que le Big Data est caractérisé
par sa vélocité. Par exemple, chaque seconde, des milliers de nouvelles
données apparaissent, et nécessite une action ou une réponse immédiate.
Imaginez une autoroute où des milliers de voitures circulent sans cesse, et
chacune transporte une information précieuse. La vélocité des données
représente la capacité à gérer ce flux continu, à traiter et à analyser ces
informations en temps réel pour prendre des décisions rapides et pertinentes.
Des technologies de pointe, telles que le traitement en temps réel et le
streaming de données, sont utilisées pour gérer ce flux rapide d'informations.
Cela permet ainsi d'agir rapidement et efficacement en fonction des données
en temps réel.

Vous aimerez peut-être aussi