Vous êtes sur la page 1sur 43

Introduction aux concepts de

bases de données réparties


Hedia.mhiri@isg.rnu.tn
Hedia.mhiri@tunet.tn

1
Architecture
centralisée
-
La gestion des
données et des
applications par
ordinateur central

-
La connexion à la
BD par des terminaux
locaux ou distants

2
3
4
SGBD
SGBD

SGBD
SGBD

SGBD
5
6
Motivations pour les DBRep


Goulot d’étranglement

Développement des réseaux

7
Définitions

Collection de bases de données
logiquement reliées et physiquement
distribuées sur un réseau.

Distributed databases refer to one
database (or data replicates) that are
distributed across multiple sites (ref MIT).

L’architecture distribuée est un système
gérant une collection de BD logiquement
reliées, réparties sur différents sites en
fournissant un moyen d ’accès rendant
8 la

Une base de données répartie est
composée de bases de données localisées
sur des sites différents. Elles sont
généralement gérées chacune par un
SGBD local dit serveur de base de données

Une base de données distribuée permet
de rassembler des ensembles de
données plus au moins hétérogènes
disséminés dans un réseau d’ordinateurs
sous forme d’une base de données
globale homogène et intégrée 9
– Plusieurs bases sur plusieurs sites, mais une seule BD
«logique»
– Les ordinateurs (sites) communiquent via le réseau et
sont faiblement couplés.
– Chaque site contient des données de la base, peut
exécuter des transactions locales et participer à
l’exécution de transactions globales.
– Un site:

10
Architecture répartie
-
Les données et les applications sont réparties
entre ordinateurs différents
-
Les données sont gérées par des ordinateurs
distants et interconnectés
-
Dénommé aussi:
- BD répartie,
- BD distribuée,
- Multi-BD,
- BD fédérées,
- ….
11
Architecture répartie

1. SGBD répartis homogènes

2. Multi-SGBD

3. SGBD fédérés

12
1-SGBD répartis homogènes

Toutes les BD suivent un même schéma et
utilisent la même technologie (ex: Oracle)


Accès aux données et gestion des transactions
réparties souvent fait de manière centralisée

Plus grande fiabilité et performance dû à un
13
meilleure couplage entre les sites
2- Multi-SGBD

Chaque site est autonome et peut avoir un SGBD
de type différent


Aucune interface en commun(ex: schéma
conceptuel)

Accès aux données fait à partir de requêtes ad-
hoc spécialisées 14
3- SGBD fédérés

Intègre plusieurs SGBD autonomes et
potentiellement hétérogènes en une seule BD
virtuelle


Interface d’accès commun pour masquer
l’hétérogénéité des BD et la répartition des données
15

SGBD fédérés

Application type:

– Consolidation des données après la
fusion/acquisition de compagnies

Inconvénients:
– Intégration du schéma
– Réécriture des requêtes complexes
– Performance limitée.

Produits commerciaux:
– IBM InfoSphere Federation Server, Oracle Data Service
16
Integrator, etc.
Architecture des schémas (cas
fédération)

17
Exemple de BD répartie

18
19
SGBD distribué

SGBD distribué (Distributed DBMS) ou SGBD
réparti : Système gérant une collection de BD
logiquement reliées, distribuées sur différents
sites en fournissant un moyen d’accès rendant
la distribution transparente

20

Objectifs:

Rendre la distribution (ou répartition) des BD
locales «transparente »
– Définition des données réparties : Cohérence des
données
---> dictionnaire des données réparties
– Traitement des requêtes réparties
---> Requête distribuée : Requête émise par un client dont
l’exécution nécessite l’exécution de n sous requêtes sur n serveur
(n > 1)

Indépendance des données
– 21
on interroge sans savoir où sont localisées les

Transparence à la localisation des données (location
transparency):
– Propriété d’un SGBD distribué: permettre d’écrire des
requêtes avec des noms d’objets référencés(les tables en
relationnel) ne contenant pas la localisation des données

Exemple: requête « noms et prénoms des buveurs parisiens
ayant passé une commande de Volnay de degré >12 en
quantité supérieure à 100 depuis le 1 JANVIER 1992 (avec le
schéma déjà présenté)


Select Nom, prénom From BUVEURS B, VINS V,
COMMANDES C WHERE V.CRU= ‘volnay’ AND
V.DEGRE>12
AND C.QTE>100 and C.NV=V.NV and
C.DATE> 1/10/92 AND B.NB=C.NB And B.VILLE=‘PARIS’
22
BD parallèles et réparties

BD répartie avec Oracle (DATABASE LINKS)

Permet à un usager local d’accéder aux tables
d’une autre BD sans qu’il soit usager de cette BD

Syntaxe:

– SHARED: permet de partager la connexion entre plusieurs


usagers
– PUBLIC : rend le lien disponible à tous les usagers
23 locaux

BD répartie avec Oracle (DATABASE LINKS)

Exemple: accès au catalogue de produits en
Grande-Bretagne

24
Transparence de localisation

Synonyme (SYNONYM)
– Évite aux applications de devoir connaître la
localisation des données (transparence de localisation)
– Permet de conserver les mêmes requêtes, même si le
lien change


Exemple

25

Même requête quelque soit la localisation des
tables

SGBDR recherche les sites capables de générer
des éléments de réponse à une requête


Pour réaliser cette transparence:
– toute requête effectuée sur une base de données
fédérée est:

transformée;

distribuée en sous-requêtes aux différentes bases
constituant la fédération. 26
Conception d’une base de données
• répartie
La définition du schéma de répartition est une
partie délicate de la phase de conception
d'une BDRep
– il n'existe pas de méthode pour trouver la solution
optimale.
– DBA doit prendre des décisions en fonction de
critères techniques et organisationnels
– minimiser le nombre et le temps de transferts
entre sites, le volume de données transférées, les
temps moyens de traitement des requêtes, le
nombre de copies de fragments, etc...27

Conception descendante (top down design):

Répartition
– on définit un schéma conceptuel global de la base de
données répartie,
– puis on distribue sur les différents sites en des
schémas conceptuels locaux.

La répartition se fait donc en deux étapes:
– en première étape la fragmentation,
– En deuxième étape l’allocation de ces fragments aux
sites.

L’approche top down est intéressante
28 quand on

Conception ascendante (bottom up design):

Fédération
– se base sur le fait que la répartition est déjà faite,
mais il faut réussir à intégrer les différentes BDs
existantes en une seule BD globale:
– les schémas conceptuels locaux existent et il faut
réussir à les unifier dans un schéma conceptuel
global.

Base de donnée fédérée - à priori hétérogène

(Federated BD)

Plusieurs BD hétérogènes capables29
Migration vers une BD répartie

30

La répartition d'une base de donnée intervient dans
les trois niveaux de son architecture

Rappel Architecture ANSI/SPARC

31

La répartition d'une base de donnée intervient
dans les trois niveaux de son architecture en
plus de la répartition physique des données :

Niveau externe: les vues sont distribuées sur
les sites utilisateurs.

Niveau conceptuel: le schéma conceptuel des
données est associé, par l'intermédiaire du
schéma de répartition, aux schémas locaux qui
sont réparties sur plusieurs sites, les sites
physiques.

Niveau interne: le schéma interne global n'a
pas d'existence réelle mais fait place
32
à des
Architecture de schémas

33
– Chaque base possède son schéma local
– Le schéma de la base répartie constitue le schéma
global:

décomposé en un schéma de fragmentation et un
schéma d'allocation

assure la transparence à la localisation des données

permet des recompositions de tables par union/jointure

il n’y a pas de base globale physique correspondant à ce
schéma
– Les données sont accédées via des vues intégrées

assurent la transparence à la localisation

permettent des recompositions de tables par
34
union/jointure
Le schéma global pour une BDRep

35
Schéma d’une BD répartie

36
Architecture d’un SGBD distribué

37
Problèmes liés à la distribution

Quoi distribuer?
– Données
– Traitements
– Fonctions du système
– Contrôle et coordination des tâches

Conception des bases distribuées
– Partitionnement des données (Fragmentation,
Localisation)
– Duplication (totale/partielle)
– 38
Administrateur global/ local

Dictionnaire(s)
– Extension avec des informations sur les sites, la
fragmentation, la duplication et la localisation des
données
– Centralisé ou distribué ?
– Copie simple ou multiple?

Traitement des requêtes …

39
Evaluation

Avantages:
– Extensibilité,
– partage de données hétérogènes et réparties,
– performances avec le parallélisme,
– disponibilité avec la réplication.

Inconvénients
– administration complexe,
– complexité de mise en œuvre et de
développement,
40
– distribution du contrôle,

Paramètres à considérer:

Coût et temps de communication entre deux
sites,

Fiabilité,
– fréquence des pannes des sites du réseau.

Accessibilité aux données,
– accès aux données en cas de panne des sites, du
réseau.

Accès aux sites les moins encombrés, les plus
puissants
41
Quelques termes équivoques…

BD Répartie (Distributed DB):
– Un schéma global
– Les données sont réparties sur plusieurs sites,
– accessibles à partir ou de tous les sites

BD fédérée - a priori hétérogène (Federated DB):
– Chaque site a son schéma local, pas forcément inclus
entièrement dans le schéma global (il y a un site
central)
– Plusieurs BD hétérogènes capables d’interopérer via
une vue commune (modèle commun)
42

Ref

http://www.iro.umontreal.ca/~sahraouh/cour
s/ift3030/02_architecture.pdf

43

Vous aimerez peut-être aussi