Vous êtes sur la page 1sur 32

Université de Manouba

MP2- Data Science


École Supérieure de Commerce de Tunis

Bases de Données Réparties

Mme Sélima Besbes Essanaa


Selima.besbes@esct.uma.tn
Module en EAD
MmeSélima Besbes Essanaa 1
PLAN DU COURS

Chapitre 0 : Introduction

Chapitre 1 : Bases de Données et SGBD Répartis

Chapitre 2 : Les Techniques de Répartition des Données

Chapitre 3 : Evaluation Répartie des Requêtes

Chapitre 4 : Evaluation Répartie des Transactions

Mme Sélima Besbes Essanaa 2


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

PLAN
1. Introduction
2. La répartition : Pourquoi ? Comment ? …
3. Les SGBD Répartis
4. Les Bases de Données Réparties
5. Conception d’une Base de Données Répartie

Mme Sélima Besbes Essanaa 3


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

1- Introduction

Définition : Une BD Répartie (BDR) est une BD dont les données sont mémorisées sur
plusieurs sites géographiquement éloignés et connectés par un réseau

Représentation Schématique :
Site i
Site 1 BDi
R
BD 1
Réseau

(Savoir reproduire !!!)


Site j
BDj
Mme Sélima Besbes Essanaa 4
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
Pourquoi ?
1- Introduction Objectifs …
Motivations …

Comment ?
Quelles sont les techniques …

Quelles sont les approches pour concevoir une BD répartie ?


La Répartition des
Approche ascendante VS approche descendante …
données soulève
plusieurs questions Axes d’Investigation ?
Stockage … et Exécution …

Mme Sélima Besbes Essanaa 5


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …
◆ Un système est dit réparti si les fonctions qu’il assure et les données qu’il gère sont
géographiquement dispersées sur plusieurs sites

Exemple : Une entreprise est répartie sur trois sites : le principal, héberge le système de pilotage, est situé à Tunis. Le site de
Sfax, a un effectif plus important que celui de Sousse, ce qui a poussé les décideurs à lui attribuer la responsabilité
de gérer les fournisseurs, les clients et leurs commandes. Le site de Sousse gère les produits et la facturation.

Sfax
✓ Absence de BD sur le site de Tunis
Sousse
Fournisseur ✓ Les sites de Sousse et de Sfax gèrent les données se rapportant aux trois sites
Produit
Client
Facture ✓ Une commande en provenance d’un client de Tunis est gérée par le site de
Commande
Tunis Sfax. La facturation de ce même client est assurée par le site de Sousse

Optimiser l’utilisation des ressources


Mme Sélima Besbes Essanaa 6
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …

◆ Techniquement, pour réaliser une répartition, plusieurs solutions sont possibles :


accès par terminal distant, application répartie, SGBD réparti

A. Accès par terminal distant : la BD est située sur un ordinateur autre que celui de l’utilisateur

Exemple : les moteurs de recherche


Ordinateur
BD
Central
Entrées
R
Schématiquement :
Réponses
Application + BD +
Interface SGBD centralisés

Site n Réseau Site central


Mme Sélima Besbes Essanaa 7
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

2- La répartition : Pourquoi ? Comment ? …

B. Application répartie : une application frontale qui est dupliquée sur chaque site et une
application dorsale qui réside sur le site central.

Schématiquement
a. L’application frontale :
✓ Gère le dialogue avec les utilisateurs et Ordinateur
BD
Central
effectue les traitements locaux dans le site
Entrées
demandeur (contrôle, validation,...)
R
✓ Réduit l’utilisation du réseau
Réponses
b. L’application dorsale :
Application Dorsale
✓ Gère les traitements qui nécessitent un accès Application
+ SGBD centralisé
à la BD ou mettent en jeu différents sites frontale

Site n Réseau Site central


Mme Sélima Besbes Essanaa 8
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

2- La répartition : Pourquoi ? Comment ? …

B. Application répartie :

Exemple : Les guichets de retrait automatique d’argent (GAB)

1. L’application frontale :

✓ Demande d’introduire la carte, de taper le code secret (guider l’utilisateur)

✓ Vérifie le code saisi (conforme à celui stocké dans la puce de la carte), la somme demandée
(saisie correcte)

2. L’application dorsale :

✓ Met à jour la BD : débite ou crédite le compte de l’utilisateur lorsque l’opération est validée, ...

Mme Sélima Besbes Essanaa 9


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …

C. SGBD réparti : l’objectif du cours !

✓ Le SGBD, la BD et l’application sont répartis sur différents nœuds (ou sites) connectés par un réseau
✓ Sur un nœud donné, l’utilisateur utilise les applications qui résident sur son nœud, travaille sur un sous-ensemble
local de données et n’utilise le réseau que si ses traitements nécessitent des données hébergées par un autre site.

Schématiquement :

Absence de site central : tous les sites sont désignés par le terme
« nœud », hébergent un fragment de la BD et un SGBD réparti.
Afin de réduire la complexité liée à l’hétérogénéité des composants,
il est préférable de doter tous les nœuds du même SGBDR BD = BD1 (+) BD2 (+) … BDk
Mme Sélima Besbes Essanaa 10
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …

C. SGBD réparti :

Exemple : Soit une entreprise avec plusieurs succursales situées à des villes différentes. La BD de cette entreprise
contient entre autres, la relation : Employé (NSS, Nom, Prénom, Ville)
Select *
On désire que les employés de chaque région soient gérés localement : From Employe
where ville =‘Sfax’;

✓Trois tables locales :


Tunis : Employe (NSS, Nom, Prénom, Ville)
Sousse : Employe (NSS, Nom, Prénom, Ville)
Select *
Sfax : Employe (NSS, Nom, Prénom, Ville) From Employe
where ville =‘Sousse’;
✓ même schéma relationnel (même structure)
Select *
✓ contenu différent : les tuples sont filtrés selon l’attribut ville From Employe
where ville =‘Tunis’;
Mme Sélima Besbes Essanaa 11
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …

C. SGBD réparti :

Exemple : Employé (NSS, Nom, Prénom, Ville)

✓ Soient les deux requêtes provenant du site de Tunis :

Q1: Donner la liste des employés de Tunis (Données locales)

Q2: Donner la liste des employés de la société (Données provenant de différents sites)

Enjeu : Exécution de la seconde requêtes de manière totalement transparente à


l’utilisateur, quelque soit le site d’où elle provient !

Mme Sélima Besbes Essanaa 12


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
2- La répartition : Pourquoi ? Comment ? …

C. SGBD réparti :
Exemple : Employé (NSS, Nom, Prénom, Ville)

Q1: Select NSS, Nom, Prenom From Employe where Ville = ‘Tunis’;

Q2 : Select NSS, Nom, Prenom From Employe ;

Schématiquement :
Q1 Tunis Q2 Application
Q2
R Sousse
(Sousse)
+ SGBD R
Employés Employés de
Application (Tunis) de Tunis Sousse
+ SGBD R Sfax
Q2 Application (Sfax)
Employés + SGBD R
de Sfax
Mme Sélima Besbes Essanaa 13
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

3- Les SGBD Répartis

◆ Un SGBD Réparti est un SGBD (classique) qui en plus, doit :


✓ Supporter la répartition des usagers et des données sur différents sites (accès distants)
✓ Fournir une transparence à la répartition
 manipulation des données sans savoir sur quel site elles sont
 accès aux données indépendamment du site demandeur et du site où elles se trouvent

Mme Sélima Besbes Essanaa 14


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

3- Les SGBD Répartis

◆ Objectifs d’un SGBD Réparti :

1. Minimiser les coûts de communication entre les différents sites:


 effectuer le plus possible des traitements locaux
 optimiser l’usage du réseau par les requêtes des usagers
 minimiser le temps et donc le coût d’exécution

2. Assurer la disponibilité du système : indépendance des sites afin de résister à la


panne de l’un d’entre eux. Le système doit être disponible et fonctionnel à tout instant

Mme Sélima Besbes Essanaa 15


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

3- Les SGBD Répartis


◆ Objectifs d’un SGBD Réparti :

3. Assurer la disponibilité des données : l’information doit être accessible de n’importe quel site

même en cas de panne : plusieurs techniques existent (duplication sur les différents sites, etc.)

Exemple : Site 5 Site 4


une requête émane du site 1 et
Panne
nécessite des données sur le site 3 noeud Site 3

Demande d’accès
Panne
Site 1 Site 2 Données
réseau
distantes
Mme Sélima Besbes Essanaa 16
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

3- Les SGBD Répartis

◆ Objectifs d’un SGBD Réparti :

4. Améliorer le temps de réponse :


• les requêtes de dialogue, de contrôle et de validation sont évaluées localement
• le partage des charges entre les différents sites (parallélisme, ...)

5. Favoriser la modularité :
• les sites travaillent de manière autonome
• possibilité de spécialiser les équipements, etc.

Mme Sélima Besbes Essanaa 17


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
4- Les BD Réparties
◆ Objectifs des BD Réparties :
Ceux des BD centralisées : indépendance D/T, cohérence des données, partage des données, etc.
+ Accès à des BD multiples
1. Répartition totalement transparente à l’utilisateur

Program
User 1
Program … Program Program
User 2 User i User j


Réellement
Pour User j Une seule BD
Mme Sélima Besbes Essanaa BD1 BD2 BDn 18
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

4- Les BD Réparties

1. Répartition totalement transparente à l’utilisateur


Sfax
Exemple (Diapo 6)
Sousse
Voici les schémas relationnels des tables Client et Facture : Produit
Fournisseur
Client
Client (CodeCl, Nom, Prénom, Adresse, …) Facture
Commande
Tunis
Facture (NumFact, MontantFact, DateFact, …, #CodeCl)

Requête du site de Tunis : le nom et l’adresse du client ayant la facture numéro 11

Requête environnement Centralisée Requête environnement Réparti (du point de vue de l’utilisateur)
SELECT Nom, Adresse SELECT Nom, Adresse
FROM Client, Facture FROM Client, Facture
WHERE Facture.NumFact = 11 WHERE Facture.NumFact = 11
AND Facture.CodeCl = Client.CodeCl; AND Facture.CodeCl = Client.CodeCl;
Mme Sélima Besbes Essanaa
Identiques ! 19
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
4- Les BD Réparties
◆ Objectifs des BD Réparties :

2. Garantir l’autonomie locale des sites


• Meilleure disponibilité du système
• Meilleure répartition des charges entre les différents sites
• Conserver les contrôles des données locales (utilisation minimale du réseau)

3. Réduire les limites des SGBD classiques (centralisés)


• Difficultés de concevoir des applications réparties destinées aux entreprises et leurs filiales
• Prise en charge des besoins de coopération
• Diversité des sources d’information (Internet,...)
• Multitude de modèles de données utilisés (relationnel, objet,...)
• Eloignement géographique des utilisateurs, etc.
Mme Sélima Besbes Essanaa 20
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

4- Les BD Réparties

◆ Objectifs des BD Réparties :

4. Profiter pleinement de l’existence des réseaux

• Profiter des avantages des équipements existants (réseau, téléphonie, etc.), etc.

5. Réaliser l’intégration de plusieurs BD en un sur-ensemble qui sera vu comme une seule BD

Mme Sélima Besbes Essanaa 21


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

4- Les BD Réparties

◆ Points forts de la répartition des BD :

☺ Indépendance totale des programmes à la localisation des données

☺ Le programmeur n’a pas à se soucier de la répartition des données

☺ Pas d’administration globale (lourde et pénible) des données

☺ Accès locaux possibles simultanément aux accès répartis

☺ Possibilité d’autoriser ou non un accès réparti à une BD locale

Mme Sélima Besbes Essanaa 22


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

4- Les BD Réparties

◆ Pour conclure, la répartition implique :

✓ les données : intégration de plusieurs BD ou, la décomposition d’une BD

et sa répartition entre plusieurs sites.

✓ les accès : accès locaux, accès distants.

✓ les contrôles : application frontale - application dorsale.

Mme Sélima Besbes Essanaa 23


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
5- Conception d’une BD Répartie
Concevoir une Base de Données Répartie : fait référence à l’axe 1 et

concerne le stockage des données sur les différents sites

◆ La conception d’une BD « classique », nécessite trois étapes :


• La collecte des informations
• La ventilation des données en relations
• Le procédé de normalisation, etc.

◆ La conception d’une BDR suit l’une des démarches suivantes :


1. Décomposition (Top-Down)
! 2.
3.
Intégration homogène (Bottom-Up)
Intégration hétérogène (Bottom-Up)

◆ Le choix de l’une de ces démarches est fonction de :


• l’existence ou non d’un schéma global (une seule BD)
• du (ou des) modèle(s) de données utilisé(s) pour la (ou les) BD locale(s)
Mme Sélima Besbes Essanaa
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

5- Conception d’une BD Répartie


1. Conception par décomposition (Top-Down)

✓ Approche Top-Down : on part d’un seul schéma global (une seule BD) qu’on désire répartir

✓ Les différentes BD résultats gardent le modèle de données du schéma global : aucune perte des données

La fragmentation désigne le procédé


qui permet de découper une table en
plusieurs fragments (morceaux)

L’allocation fait référence à l’emplacement


du fragment (le site qui va l’héberger)
Mme Sélima Besbes Essanaa 25
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
5- Conception d’une BD Répartie

1. Conception par décomposition (Top-Down)

! Les prochains chapitres concernent cette approche

Trois étapes :

 Conception du schéma global de la BD comme avec un système centralisé,


en faisant abstraction de la répartition

Mme Sélima Besbes Essanaa 26


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
5- Conception d’une BD Répartie

1. Conception par décomposition (Top-Down)

Trois étapes :

 Distribution des données sur les sites en utilisant des prédicats de localisation, la
fragmentation des données, la réplication des données par copies de relations, etc.
▪ Exemples de prédicats de localisation:
• les clients habitant le site A sont gérés par le site A
• les produits dont le prix > 100 sur le site B, etc.

▪ Les différents types de fragmentation des données :


• fragmentation horizontale
• fragmentation verticale
• fragmentation mixte;
Mme Sélima Besbes Essanaa 27
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

5- Conception d’une BD Répartie

1. Conception par décomposition (Top-Down)

Trois étapes :

 Définition de la transformation inverse ou « Mapping Back » des schémas locaux


pour calculer le schéma global comme une vue relationnelle

Remarque:
L’étape 3 est indispensable pour retrouver les relations du schéma global et pour
s’assurer qu’il n’y a pas eu perte d’information

Mme Sélima Besbes Essanaa 28


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

5- Conception d’une BD Répartie

2. Conception par intégration homogène (Bottom-Up)

✓ Approche « Bottom-Up » où sont intégrées :


▪ plusieurs BD conçues séparément sur plusieurs sites, fonctionnant avec un même SGBD

▪ et utilisant le même modèle de données (relationnel, relationnel-objet, XML, etc.)

Mme Sélima Besbes Essanaa 29


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

5- Conception d’une BD Répartie

2. Conception par intégration homogène (Bottom-Up)

Trois étapes :

 Résolution des conflits :


▪ une donnée peut être appelée différemment dans les différentes BD (NumClt, NumClient, NumC, etc.)
▪ une donnée peut avoir différents types selon la BD (entier, char (5), etc.)

 Intégration des schémas locaux compatibles :


▪ différentes relations (vues) sont créées pour représenter les différents schémas des BD initiales
▪ certaines données sont relocalisées (déplacées) ou répliquées (dupliquées) pour améliorer les
performances

 Mesures de performance, …
Mme Sélima Besbes Essanaa 30
CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS
5- Conception d’une BD Répartie

3. Conception par intégration hétérogène (Bottom-Up)

▪ les BD locales utilisent des modèles de données


différents
▪ une étape de pré-intégration est requise à cause
de l’hétérogénéité des modèles des données
▪ un modèle de données commun doit être utilisé
pour l’intégration : modèle pivot
▪ Le processus est semi-automatique et nécessite
l’intervention du concepteur et des spécialistes
métiers à toutes les étapes

Mme Sélima Besbes Essanaa 31


CHAPITRE 1 : BASES DE DONNÉES ET SGBD RÉPARTIS

5- Conception d’une BD Répartie

3. Conception par intégration hétérogène

Quatre étapes :

 Les BD initiales, hétérogènes, sont traduites dans un même modèle de données (Modèle Pivot)
afin d’harmoniser les BD initiales et faciliter leur comparaison
 Les similarités et les conflits (de noms, de types, etc.) entre les schémas initiaux sont localisés
 Les conflits détectés à l’étape précédente sont résolus par le choix d’un nom (ou d’un type)
unique, etc.
 Les schémas sont fusionnés en un seul schéma de BD. Cette étape assure le mapping-back et
permet de déduire le schéma intégré global

Mme Sélima Besbes Essanaa 32

Vous aimerez peut-être aussi