Vous êtes sur la page 1sur 22

1ère année cycle d’ingénieur

Cybersécurité & Confiance Numérique (CCN)

Bases de données
Prof. HANINE Mohamed
Département de Télécommunications, Réseaux et Informatique (TRI)
ENSA Eljadida, Université Chouaib Doukkali, Maroc
Email: m.hanine.ensaj@gmail.com

Année Universitaire 2023/2024


Plan
• A- Systèmes d’information
• B- SGBD relationnel
• C- SGBD NoSQL
• Introduction générale de NoSQL
• Base de Données Orientées Documents (MongoDB)
• Base de Données Orientées Colonnes (Cassandra)
• Base de Données Orientées Clé/Valeur (Redis)
• Base de Données Orientées Graphes (Neo4j)

Année Universitaire 2023/2024


Bibliographie
• Les cours et les supports de cet élément reposent principalement
sur ces sources bibliographiques :

Année universitaire 2023/2024


Les Bases de Données Relationnelles (SGBDR)
• Les technologies de bases de données relationnelles et transactionnelles (technologies SQL),
règnent en maîtres pour le stockage et la manipulation de données depuis plus de 20 ans.
• Outre, la plupart des moteurs de SGBDR sont transactionnels ce qui leur impose le respect des
contraintes Atomicity Consistency Isolation Durability, communément appelé par son
acronyme ACID.
• Un certain nombre de limitations importantes sont apparues au fil des années
• Le constat était simple : les SGBD relationnels ne sont pas adaptés aux environnements
distribués requis par les volumes gigantesques de données et par les trafics tout aussi
gigantesques générés par ces opérateurs. (Google 2004)

Année universitaire 2023/2024


Scalabilité
verticale
vs
Scalabilité
horizontale

Année universitaire 2023/2024


Les Bases de Données Relationnelles
(SGBD)
• Les besoins majeurs identifiés par les acteurs (GAFAM) sont les suivants :
• Capacité à distribuer les traitements sur un nombre de machines important afin d’être en mesure
d’absorber des charges très importantes. On parlera de scaling des traitements.
• Capacité à répartir les données entre un nombre important de machines afin d’être en mesure de
stocker de très grands volumes de données. On parlera plutôt de scaling des données.
• La distribution de données sur plusieurs Datacenter afin d’assurer une continuité de service en
cas d'indisponibilité de service sur un Datacenter. Cette approche doit par ailleurs permettre que
les données soient au plus proche des personnes qui les utilisent.
• Une architecture qui fonctionne sur du matériel peu spécialisé et donc facilement remplaçable
en cas de panne.

Année universitaire 2023/2024


Bases de Données NoSQL
• Bases de données NoSQL (Not Only SQL) :
• Bases de données non-relationnelles et largement distribuées
• Permet une analyse et une organisation rapides et ad-hoc des données de très grands
volumes et de types de données disparates
• Appelées également
• Cloud Databases
• Non-Relational Databases
• Big Data Databases
• …
• Développées en réponse à l’augmentation exponentielle des données générées, enregistrées
et analysées par les utilisateurs modernes et leurs applications
• NoSQL est une approche de la conception des bases et de leur administration
particulièrement utile pour de très grands ensembles de données distribuées.
Année universitaire 2023/2024
Bases de Données NoSQL

Composition pluridisciplinaire du Big Data & Data Science

Année universitaire 2023/2024


Bases de Données NoSQL : Propriétés BASE

• le principe BASE (Basically Available Soft-state services with Eventual-consistency), à savoir :


simplement disponible, état souple, finalement consistant.
• Basically Available : quelle que soit la charge de la base de données (données/requêtes), le système
garantie un taux de disponibilité de la donnée.
• Soft-state : La base peut changer lors des mises à jour ou lors d'ajout/suppression de serveurs. (La base
NoSQL n'a pas à être cohérente à tout instant)
• Eventually consistent : Les modifications arriveront éventuellement à tous les serveurs, si on leur donne
suffisamment de temps (la base atteindra un état cohérent).

Année universitaire 2023/2024


Type de Bases de Données NoSQL
• Types des bases de données NoSQL
• Orientées Clef/Valeur
• Orientées Documents
• Orientées Colonnes
• Orientées Graphes

Année universitaire 2023/2024


Types de Bases de Données NoSQL
1- Clef/Valeur (Key/Value Store)

• Dans ce modèle on ne dispose généralement que des quatre


opérations Create Read Update Delete (CRUD):
• Create: créer un nouvel objet avec sa clé → create(key, value)
• Read: lit un objet à partir de sa clé → read(key)
• Update: met à jour la valeur d’un objet à partir de sa clé → update(key, value)
• Delete: supprime un objet à partir de sa clé → delete(key)

Année universitaire 2023/2024


Types de Bases de Données NoSQL
1- Clef/Valeur (Key/Value Store)

• L’un des types les plus simples, sorte de Hashmap (table de


hashage) distribuée
• Conçues pour sauvegarder les données sans définir de schéma
• Toutes les données sont sous forme de clef/valeur
• La valeur peut être une chaîne de caractères, un objet sérialisé, blob…
• La donnée est opaque au système: il n’est pas possible d’y accéder sans
passer par la clef

Année universitaire 2023/2024


Types de Bases de Données NoSQL
1- Clef/Valeur (Key/Value Store)

Stockage clé/valeur
Exemple des solutions NoSQL orientée Clé/Valeur
• Redis (VMWare) : Vodafone, Trip Advisor, Nokia, Samsung, Docker
• Memcached (Danga) : LiveJournal, Wikipédia, Flickr, Wordpress
• Azure Cosmos DB (Microsoft) : Real Madrid, Orange tribes, MSN, LG, Schneider Electric
• SimpleDB (Amazon)
• Oracle NoSQL (Oracle)

Année universitaire 2023/2024


Types de Bases de Données NoSQL
2 - Orientée Documents (Document Database)
• Étendent le paradigme clef/valeur, avec des « documents »
plus complexes à la place des données simples, et une clef
unique pour chacun d’eux
• Documents de type JSON ou XML
• Chaque document est un objet, contient un ou plusieurs
champs, et chaque champs contient une valeur typée (string,
date, binary ou array)
• Permettent de stocker, extraire et gérer les informations
orientées documents (données semi-structurées)
• Avantage : pouvoir récupérer, via une seule clef, un
ensemble d’informations structurées de manière hiérarchique

Année universitaire 2023/2024


Types de Bases de Données NoSQL
2 - Orientée Documents (Document Database)

Stockage orienté Document


Exemple des solutions NoSQL Orientée Document:
• MongoDB (MongoDB) : ADP, Adobe, Bosch, Cisco, eBay, Electronic Arts, Expedia, Foursquare
• DynamoDB (Amazon) : BMW, Dropcam, Duolingo, Supercell, Zynga
• CouchBase (Apache, Hadoop) : AOL, AT&T, Comcast, Disney, PayPal, Ryanair

Année universitaire 2023/2024


Types de Bases de Données NoSQL
3 - Orientées Colonnes (Column Store)

• Évolution de la BD clef/valeur
• Ressemble aux SGBDR, mais avec un nombre de
colonnes dynamique, différent d’un enregistrement à un
autre (pas de colonnes portant les valeurs NULL)
• Offrent de très hautes performances et une architecture
hautement évolutive

SGBDR NoSQL Orientée Colonnes

Année universitaire 2023/2024


Types de Bases de Données NoSQL
3 - Orientées Colonnes (Column Store)

Stockage orienté Colonnes


Exemple des solutions NoSQL Orientée Colonnes:
• BigTable (Google) • Cassandra (Facebook -> Apache) : NY Times, eBay, Sky, Pearson
• HBase (Apache, Hadoop) Education
• Elasticsearch (elastic) -> moteur de recherche
• Spark SQL (Apache)
Année universitaire 2023/2024
Types de Bases de Données NoSQL
4- Orienté Graphes (Graph Database)
• Basées sur la théorie des graphes
• S’appuie sur les notions de nœuds, de relations et des propriétés qui
leur sont rattachées
• Conçues pour les données dont les relations sont représentées comme
graphes, et ayant des éléments interconnectés, avec un nombre
indéterminé de relations entre elles
• Adapté aux traitements des données des réseaux sociaux
Exemple des solutions NoSQL orienté Graphes
• Neo4j : eBay, Cisco, HP, The National Geographic Society
• OrientDB (Apache) : Warner Music Group,, Sky, United
Nations,
• FlockDB (Twitter) : Twitter

Année universitaire 2023/2024


Bases de Données NoSQL : Théorème CAP
• Destiné à évaluer les systèmes de stockage distribués
• Propriétés CAP : Consistency, Availability, Partition
tolerance
• Le théorème de CAP (théorème de Brewer) (Brewer,
2000) stipule qu’il est impossible d’obtenir ces trois
propriétés en même temps dans un système distribué et
qu'il faut donc en choisir deux parmi les trois

Année universitaire 2023/2024


Bases de Données NoSQL : Théorème CAP

Année universitaire 2023/2024


Quand utiliser NoSQL?
• Si l’évolutivité est une préoccupation
• Si l’absence de schéma est une préoccupation
• Si la distribution est une préoccupation
• NoSQL est particulièrement utile lorsqu'une entreprise doit accéder, à des fins d'analyse,
à de grandes quantités de données non structurées ou de données stockées à distance sur
plusieurs serveurs virtuels du Cloud.
• Voici quelques critères pour le choix d’une base de données NoSQL:
• Le coût
• La cohérence des données
• La disponibilité du système
• Le langage d'interrogation
• Les fonctionnalités

Année universitaire 2023/2024


Questions
• Q1: Modèle de données EAV (Entity- Attribute-Value) ?

• Les limites du relationnel par rapport au NoSQL [Présentation ]


• les Propriétés: ACID vs BASE

Année universitaire 2023/2024

Vous aimerez peut-être aussi