Vous êtes sur la page 1sur 23

Bases de données NoSQL

INGC 2 - InDIA
M. Jean-Marie PREIRA
jmpreira@gmail.com

1
SOMMAIRE

I. Les origines du Big Data


II. Le mouvement NoSQL
III. MongoDB
IV. Neo4j

2
Bases de données NoSQL

I. Les origines du Big Data

3
Les origines du Big data
● Un d'éluge d'information
– Une minute sur Internet
– Format d'encodage des données
– Unités de mesure
– Quelques chiffres
● Les « 3V » du Big Data
– Le Big Data
– Modèle des « 3V »
– Les applications du Big Data
● Les avancées technologiques
– De nouveaux besoins
– Les nouveaux services et architectures 4
– Les nouveaux modèles de données
Un déluge d'information

5
Un déluge d'information
● Format d'encodage des données
– Les données (texte, image, son) sont codées en
binaire.
– Suite de bits (0 ou 1).
– Normes de codage des jeux de caractères:
● Norme ASCII : 7 bits pour un caractère
● Norme ISO/CEI 646 : 8 bits = 1 octet pour un caractère
● Norme Unicode UTF-8 : variable de 1 à 4 octets pour
un caractère.

6
Un déluge d'information
● Unités de mesure

7
Un déluge d'information
● Unités de mesure

8
Un déluge d'information
● Quelques chiffres
● En 1992, 100 Go / jour
● En 2013, 29.000 Go / seconde
● En 2016, 90% des données
existantes avaient été créées au
cours des deux années
précédentes.

9
Les « 3V » du Big Data
● Les 3 V du Big Data
– Le Big Data regroupe des données présentant
une grande variété, arrivant en volumes
croissants et à grande vitesse.
– Il se caractérise par le modèle dit des « 3V »,
● Volume,
● Variété,
● Vélocité

10
Les « 3V » du Big Data
● Les 3V du Big Data
« Le Big Data (ou mégadonnées) représente les
collections de données caractérisées par un
volume, une vélocité et une variété si grands
que leur transformation en valeur utilisable
requiert l’utilisation de technologies et de
méthodes analytiques spécifiques. »

11
Les « 3V » du Big Data
● Les 3V du Big Data
– Le Volume fait référence à la quantité d’informations,
trop volumineuse pour être acquise, stockée,
traitée, analysée et diffusée par des outils
standards.

12
Les « 3V » du Big Data
● Les 3V du Big Data
– La Variété fait référence à l’hétérogénéité des
formats,de types, et de qualité des informations.

13
Les « 3V » du Big Data
● Les 3V du Big Data
– La Vélocité fait référence à l’aspect dynamique et/ou
temporel des données, à leur délai d’actualisation
et d’analyse.

14
Les « 3V » du Big Data
● Les 5V

15
Les « 3V » du Big Data
● Les applications du Big Data
Développement Des sociétés comme Netflix et Procter & Gamble utilisent le
Big Data pour anticiper la demande des clients. Elles
de produits créent des modèles prédictifs pour de nouveaux produits
et services, en classant les principaux attributs de produits ou
services passés et présents et en modélisant la relation entre
ces attributs et le succès commercial de leurs offres.

Maintenance Les facteurs permettant de prédire les défaillances


mécaniques peuvent être profondément enfouis dans des
prédictive données structurées, telles que l’année, la marque et le
modèle de l’équipement, ainsi que dans des données non
structurées couvrant des millions d’entrées de journaux, de
données de capteur, de messages d’erreur et de
température du moteur. En analysant ces indications de
problèmes potentiels avant que ceux-ci surgissent, les
entreprises sont à même de déployer leur maintenance de
manière plus rentable et d’optimiser le temps de
16
fonctionnement de leurs pièces et équipements.
Les « 3V » du Big Data
● Les applications du Big Data
Expérience client La course aux clients est lancée. Il est désormais possible
d’avoir une meilleure vue d’ensemble de l’expérience client
qu’auparavant. Le Big Data vous permet de rassembler
des données provenant de médias sociaux, de visites
Web, de journaux d’appels et d’autres sources pour
améliorer l’expérience d’interaction et maximiser la
valeur fournie. Commencez à proposer des offres
personnalisées, à réduire la perte de clients et à traiter les
problèmes de manière proactive.

Fraude et En matière de sécurité, il ne s’agit pas que de quelques


pirates informatiques malhonnêtes : vous faites face à des
conformité équipes entières. Les paysages de la sécurité et les
exigences de conformité sont en évolution constante. Le Big
Data vous aide à identifier des modèles dans les
données qui indiquent une fraude et à agréger de
grands volumes d’informations permettant d’accélérer
17
le reporting réglementaire.
Les avancées technologiques
● De nouveaux besoins
– Essentiellement en termes de capacité de
stockage et de calcul.
– Accompagnés par une baisse des coûts et les
technologies de virtualisation

18
Les avancées technologiques
● Les nouveaux services et architectures
– Le Cloud Computing a grandement facilité l'accès
aux infrastructures
● Ressources ajustables
● Facturation à la consommation
● Capacité de stockage illimitée
– Les architectures distribuées pour le traitement et
le stockage.
– Exemple : La plateforme Hadoop avec
● Son système de fichiers distribués HDFS,
● Son Modèle de calcul distribué MapReduce 19
Les avancées technologiques
● Les nouveaux services et architectures

20
Les avancées technologiques
● Les nouveaux modèles de données
– Les SGDB (MySQL, SQL Server ou Oracle) basés sur
le modèle relationnel, ne peuvent pas répondre aux
exigeances (les 3V) du Big Data.
– Les données doivent être stockées autrement que
sous forme de tables, afin que leur traitement
puisse répondre aux exigeances du Big Data
– Les Bases de données NoSQL répondent mieux à ces
exigences. Elles ont été introduites par les géants du
Web, Google, Amazon, Facebook.

21
Les avancées technologiques
● Les nouveaux modèles de données
– Les bases de données NoSQL (Not Only SQL) se
caractérisent par les propriétés suivantes :
● Forte distribution des données
● « Schema-less » ou schéma dynamique
– Elles se divisent en quatre catégories
● Modèle orienté clé/valeur
● Modèle orienté colonne
● Modèle orienté document
● Modèle orienté graphe
22
Les avancées technologiques
● Les nouveaux modèles de données

23

Vous aimerez peut-être aussi