Vous êtes sur la page 1sur 31

Mastère Professionnel co-construit

en Ingénierie Des Applications Web-Nuagiques


"MPWIN"

Architectures Répartie :

Réplication, fragmentation et Intégration SBS –-2020


Eléments à discuter
 Comment rendre une base de données distribué
 Que veut dire fragmenter une base de données
 Quelle est la différence entre réplication, intégrations et synchronisation
 Un aperçus sur les
 Conclusion
 Perspective

MPWIN
Rappel

MPWIN
Centralisé vs Distribué vs Décentralisé

• Centralisé : Toutes les données sont un corps unifié qui est stocké sur un
ordinateur. Pour obtenir l’information, vous devez vous connecter à l’ordinateur
principal appelé serveur.

• Distribué : Il n’y a pas de stockage de données central, de plus, Tous les nœuds
contiennent des informations. Les clients sont égaux et ont des droits égaux.

• Décentralisé : Cela signifie qu’il n’y a pas de stockage central. Certains serveurs
fournissent des informations aux clients. Les serveurs sont connectés les uns aux
autres.
Pourquoi un système réparti?
 Partage des ressources (données, applications, périphériques chers). Optimisation de
leur utilisation.
 Tolérance aux pannes (fiabilité, disponibilité).
 Contraintes physiques (ex : avionique, usines automatisées).
 Contrainte d’interconnexion de machines dédiées.
 Facilite la communication entre utilisateurs.
 Concurrence, parallélisme pour une meilleurs efficacité,
 Besoin économique

MPWIN
Distribuer ses DB

MPWIN
Pourquoi un système réparti?
Une base de données centralisée est gérée par un seul SGBD, est stockée dans sa totalité à
un emplacement physique unique et ses divers traitements sont confiés à une seule et
même unité de traitement.
Par opposition, une base de données distribuée est gérée par plusieurs processeurs, sites
ou SGBD. Un système de bases de données réparties ne doit donc en aucun cas être
confondu avec un système dans lequel les bases de données sont accessibles à distance.

MPWIN
Comment distribuer une base de donnée
Fragmentation
On part d’une grosse base de données § On la distribue en fragments pour améliorer les
performances. On obtient une base de données distribuées
Intégration
On part de bases de données existantes (autonomes). On les intègre pour obtenir un point
d’entrée unique. On obtient une base de données distribuées
Réplication
On part de bases de données existantes, on duplique les mêmes données sur plusieurs
périphériques. On obtient une base de données distribuées
MPWIN
Fragmentation

MPWIN
Fragmentation
Définition.
La fragmentation est le processus de décomposition d'une base de donnée logique en un
ensemble de "sous" bases de données. Cette décomposition doit être sans perte
d'information. La fragmentation peut être coûteuse s’il existe des applications qui
possèdent des besoins opposés.

MPWIN
Fragmentation
Les règles de fragmentation
1. La complétude : pour toute donnée d’une relation R, il existe un fragment Ri de la relation
R qui possède cette donnée.
2. La reconstruction : pour toute relation décomposée en un ensemble de fragments Ri, il
existe une opération de reconstruction. Pour les fragmentations horizontales, l’opération de
reconstruction est une union. Pour les fragmentations verticales c’est la jointure.
3. La Disjonction: assure que les fragments d’une relation sont disjoints deux à deux

MPWIN
Fragmentation
Techniques de Fragmentation
Il existe deux type de fragmentations, la fragmentation horizontale et la fragmentation
verticale.
Fragmentation horizontale
C’est l’opération de décomposer une table en groupes de lignes.

MPWIN
Fragmentation horizontale primaire

MPWIN
Fragmentation horizontale dérivée
La Fragmentation d’une table en fonction des fragments horizontaux d’une autre table.

MPWIN
Fragmentation verticale
La fragmentation verticale est obtenue par décomposition de la table en groupes de colonnes.

MPWIN
Réplication

MPWIN
Réplication de données
La réplication de données c’est la duplication de mêmes données sur plusieurs
périphériques.

Approches de réplication:
• Réplication maître-maître: les données de chaque réplique sont dynamiques et
peuvent être mises à jour
• Réplication maître-subordonnée: les données d'une seule des répliques sont
dynamiques (le maître) et les répliques restantes sont en lecture seule.
Réplication maître-maître

Les modifications apportées aux données


d'une réplique doivent être propagées à
l’autres réplique

lire et écrire lire et écrire


des données des données
dans la dans la
réplique locale réplique locale

Master-2
Master-1
Réplication maître-subordonnée
Lire et écrire
des données
dans le
maître

Master-1

Les modifications apportées aux


En lecture données de maitre doivent être
seul propagées aux réplicas subordonnés En lecture
seul

Slave-1 Slave-2
Synchronisation

MPWIN
Synchronisation de données
• La synchronisation des données est le processus de propagation des modifications de
données entre les répliques.

• Les modifications de données peuvent être des insertions, des mises à jour et des
suppressions.

• Type de synchronisation
• Synchronisation bidirectionnelle
• Synchronisation unidirectionnelle
• Synchronisation personnalisée
• Il faut bien choisir la fréquence de synchronisation
MPWIN
Intégration

MPWIN
Intégration de données
• L'intégration de données : un mécanisme qui est capable d'extraire les données dans
différentes sources , de les adapter et de les charger vers une destination.

• Approche d’intégration de données ETL


• Extraction : Identifier et extraire les données de sources ayant subi une
modification depuis la dernière exécution.
• Transformation : Appliquer diverses transformations aux données.
• Chargement : Insérer les données transformées dans la destination et gérer les
changements aux données existantes.

MPWIN
ETL
ETL: Extraction
• Méthodes d’extraction:

Chargement initial Chargement incrémentielle


(Full) (Delta)

• Il faut bien étudier les sources pour définir la stratégie de


chargement.

MPWIN
ETL: Extraction
• Quelle est la disponibilité de mes sources de données ?
• Comment y accéder ?
• Comment faire des chargements incrémentiels ?
• Quel est le temps d'un chargement incrémentiel?
• Quelle politique vais-je utiliser dans le cas d'échec de chargement ?

MPWIN
ETL: Transformation
• Les données doivent être conformes aux données de la destination.

• Types de transformation:
• Analyse de données
• Déduplication
• Sélection
• Standardisation
• Calcul
• Conversion

MPWIN
ETL: Load
• Chargement de données extraites et transformées dans la base cible
• Utiliser une requête Insert SQL ou bien une insertion en bloc massif
(bulk insert).

• Méthodes de chargement:

Chargement Chargement
Full Refresh
initial incrémentielle

MPWIN
ETL: Load
• Que faire si un chargement échoue ?
• Ai-je les moyens de revenir à l'état avant le chargement ?
• Comment valider mon chargement, comment détecter les erreurs ?

MPWIN
Exigences

Cohérence Performance

Disponibilité
MPWIN
Merci