Vous êtes sur la page 1sur 17

20/10/2015

Introduction aux concepts de


bases de données réparties
Hedia.mhiri@isg.rnu.tn
Hedia.mhiri@tunet.tn

Architecture
centralisée

-La gestion des données


et des applications par
ordinateur central

- La connexion à la BD
par des terminaux
locaux ou distants

1
20/10/2015

2
20/10/2015

SGBD
SGBD

SGBD
SGBD

SGBD
5

3
20/10/2015

Motivations pour les DBRep

• Goulot d’étranglement
• Développement des réseaux
• …

Architecture répartie
- Les données et les applications sont réparties
entre ordinateurs différents
- Les données sont gérées par des ordinateurs
distants et interconnectés
- Dénommé aussi:
- BD répartie,
- BD distribuée,
- Multi-BD,
- Bd interopérables,
- BD fédérées,
- ….

4
20/10/2015

Définitions
• Collection de bases de données logiquement
reliées et physiquement distribuées sur un
réseau.
• Distributed databases refer to one database (or
data replicates) that are distributed across
multiple sites (ref MIT).
• L’architecture distribuée est un système gérant
une collection de BD logiquement reliées,
réparties sur différents sites en fournissant un
moyen d ’accès rendant la distribution
transparente.
9

• Une base de données répartie est


composée de bases de données localisées
sur des sites différents. Elles sont
généralement gérées chacune par un
SGBD local dit serveur de base de données
• Une base de données distribuée permet
de rassembler des ensembles de
données plus au moins hétérogènes
disséminés dans un réseau d’ordinateurs
sous forme d’une base de données
globale homogène et intégrée
10

5
20/10/2015

– Plusieurs bases sur plusieurs sites, mais une seule BD


«logique»
– Les ordinateurs (sites) communiquent via le réseau
et sont faiblement couplés.
– Chaque site contient des données de la base, peut
exécuter des transactions locales et participer à
l’exécution de transactions globales.
– Un site:

11

Exemple de BD répartie

12

6
20/10/2015

13

SGBD distribué
• SGBD distribué (Distributed DBMS) ou SGBD
réparti : Système gérant une collection de BD
logiquement reliées, distribuées sur différents
sites en fournissant un moyen d’accès rendant
la distribution transparente

14

7
20/10/2015

• Objectifs:
• Rendre la distribution (ou répartition) des BD locales
«transparente »
– Définition des données réparties : Cohérence des données
---> dictionnaire des données réparties
– Traitement des requêtes réparties
---> Requête distribuée : Requête émise par un client dont
l’exécution nécessite l’exécution de n sous requêtes sur n serveur
(n > 1)
• Indépendance des données
– on interroge sans savoir où sont localisées les données,
– catalogue des données réparties.
• Atomicité des transactions
– traitement des requêtes distribuées,
– gestion de transactions distribuées,
– maintien de la cohérence et de la sécurité.
15

• Transparence à la localisation des données (location


transparency):
– Propriété d’un SGBD distribué: permettre d’écrire des
requêtes avec des noms d’objets référencés(les tables en
relationnel) ne contenant pas la localisation des données
• Exemple: requête « noms et prénoms des buveurs parisiens
ayant passé une commande de Volnay de degré >12 en
quantité supérieure à 100 depuis le 1 JANVIER 1992 (avec le
schéma déjà présenté)

• Select Nom, prénom From BUVEURS B, VINS V,


COMMANDES C WHERE V.CRU= ‘volnay’ AND
V.DEGRE>12
AND C.QTE>100 and C.NV=V.NV and
C.DATE> 1/10/92 AND B.NB=C.NB And B.VILLE=‘PARIS’
16

8
20/10/2015

• Même requête quelque soit la localisation des tables


• SGBDR recherche les sites capables de générer des
éléments de réponse à une requête

• Pour réaliser cette transparence:


– toute requête effectuée sur une base de données fédérée
est:
• transformée;
• distribuée en sous-requêtes aux différentes bases constituant la
fédération.
– Les résultats sont agrégés et si besoin transformés pour
retourner un seul résultat à la requête originale.
• Les difficultés sont la gestion des modifications
concurrentes et en particulier la gestion des
transactions.

17

Conception d’une base de données


répartie
• La définition du schéma de répartition est
une partie délicate de la phase de conception
d'une BDRep
– il n'existe pas de méthode pour trouver la solution
optimale.
– DBA doit prendre des décisions en fonction de
critères techniques et organisationnels
– minimiser le nombre et le temps de transferts
entre sites, le volume de données transférées, les
temps moyens de traitement des requêtes, le
nombre de copies de fragments, etc...

18

9
20/10/2015

• Conception descendante (top down design):


• Répartition
– on définit un schéma conceptuel global de la base de
données répartie,
– puis on distribue sur les différents sites en des schémas
conceptuels locaux.
• La répartition se fait donc en deux étapes:
– en première étape la fragmentation,
– En deuxième étape l’allocation de ces fragments aux
sites.
• L’approche top down est intéressante quand on part
du néant. Si les BDs existent déjà la méthode
bottom up est utilisée.
19

• Conception ascendante (bottom up design):


• Fédération
– se base sur le fait que la répartition est déjà faite,
mais il faut réussir à intégrer les différentes BDs
existantes en une seule BD globale:
– les schémas conceptuels locaux existent et il faut
réussir à les unifier dans un schéma conceptuel global.
• Base de donnée fédérée - à priori hétérogène
• (Federated BD)
• Plusieurs BD hétérogènes capables d’interopérer
via une vue commune (modèle commun)

20

10
20/10/2015

Migration vers une BD répartie

21

• La répartition d'une base de donnée intervient dans


les trois niveaux de son architecture
• Rappel Architecture ANSI/SPARC

22

11
20/10/2015

• La répartition d'une base de donnée intervient


dans les trois niveaux de son architecture en plus
de la répartition physique des données :
• Niveau externe: les vues sont distribuées sur les
sites utilisateurs.
• Niveau conceptuel: le schéma conceptuel des
données est associé, par l'intermédiaire du
schéma de répartition, aux schémas locaux qui
sont réparties sur plusieurs sites, les sites
physiques.
• Niveau interne: le schéma interne global n'a pas
d'existence réelle mais fait place à des schémas
internes locaux répartis sur différents sites.
23

Architecture de schémas

24

12
20/10/2015

– Chaque base possède son schéma local


– Le schéma de la base répartie constitue le schéma
global:
• décomposé en un schéma de fragmentation et un
schéma d'allocation
• assure la transparence à la localisation des données
• permet des recompositions de tables par union/jointure
• il n’y a pas de base globale physique correspondant à ce
schéma
– Les données sont accédées via des vues intégrées
• assurent la transparence à la localisation
• permettent des recompositions de tables par
union/jointure

25

Le schéma global pour une BDRep

26

13
20/10/2015

Schéma d’une BD répartie

27

Architecture d’un SGBD distribué

28

14
20/10/2015

Problèmes liés à la distribution


• Quoi distribuer?
– Données
– Traitements
– Fonctions du système
– Contrôle et coordination des tâches
• Conception des bases distribuées
– Partitionnement des données (Fragmentation,
Localisation)
– Duplication (totale/partielle)
– Administrateur global/ local

29

• Dictionnaire(s)
– Extension avec des informations sur les sites, la
fragmentation, la duplication et la localisation des
données
– Centralisé ou distribué ?
– Copie simple ou multiple?
• Traitement des requêtes …

30

15
20/10/2015

Evaluation
• Avantages:
– Extensibilité,
– partage de données hétérogènes et réparties,
– performances avec le parallélisme,
– disponibilité avec la réplication.
• Inconvénients
– administration complexe,
– complexité de mise en œuvre et de développement,
– distribution du contrôle,
– difficulté de migration,
– surcharge (l’échange de messages augmente le temps
de calcul)
31

• Paramètres à considérer:
• Coût et temps de communication entre deux
sites,
• Fiabilité,
– fréquence des pannes des sites du réseau.
• Accessibilité aux données,
– accès aux données en cas de panne des sites, du
réseau.
• Accès aux sites les moins encombrés, les plus
puissants

32

16
20/10/2015

Quelques termes équivoques…


• BD Répartie (Distributed DB):
– Un schéma global
– Les données sont réparties sur plusieurs sites,
– accessibles à partir ou de tous les sites
• BD fédérée - a priori hétérogène (Federated DB):
– Chaque site a son schéma local, pas forcément inclus
entièrement dans le schéma global (il y a un site central)
– Plusieurs BD hétérogènes capables d’interopérer via une
vue commune (modèle commun)
• Multibase:
– Plusieurs BD (hétérogènes ou non) capables
d’interopérer sans une vue commune (absence de
modèle commun)
– Pas de schéma global, pas de site central. Accès à (une
partie des) données distantes.
33

Ref
• http://www.iro.umontreal.ca/~sahraouh/cour
s/ift3030/02_architecture.pdf

34

17

Vous aimerez peut-être aussi