RÉPARTIES
1
RÉPARTITION DES DONNÉES
2
POURQUOI RÉPARTIR LES DONNÉES ?
Progrès technologique
Capacités de stockage
Augmentation du volume d’information (14 fois entre 1990 et 2000)
Capacités de calcul
Augmentation du volume de transactions (10 fois dans les 5 prochaines
années)
Infrastructure réseau
« Loi » de Moore :
le nombre de transistors des microprocesseurs sur une puce de silicium
double tous les deux ans à coût constant.
Plus connue : les capacités de stockage et de calcul doublent tous les 18
mois
Entre 1971 et 2001, la densité des transistors a doublé chaque 1,96
année. En conséquence, les machines électroniques sont devenues de
moins en moins coûteuses et de plus en plus puissantes.
« Loi » de Gilder :
la bande passante des réseaux triplerait à prix égal tous les ans 3
le débit des liaisons quadruplerait tous les trois ans.
POURQUOI RÉPARTIR LES DONNÉES ?
décentraliser l’information
Limiter le transfert d’information (nombre et volume) en
répartissant les données les plus utilisées
Accroître les performances par :
La répartition de la charge de travail sur plusieurs unités de
traitement opérant en parallèle et sur les E/Ss
La réduction du trafic sur le réseau
5
LES RÈGLES D’UNE BDR
Ces règles ont pour but d’évaluer une base de données
distribuée.
1. Principe Fondamental: Transparence pour
l’utilisateur: le système apparait à l’utilisateur comme
un système non distribué.
2. Autonomie de chaque site: (ang. local site
independence) tout site est responsable de la gestion de
ses données: contrôle de concurrence, back up, sécurité
…
3. Absence de site privilégié (ang. central site
independence) tous les serveurs ont les mêmes capacités
même si à un moment un serveur exerce le rôle de
coordinateur
6
4. Continuité de service (ang. Failureindependence)
5. Transparence vis à vis de la localisation des données:
(ang. location transparency) l’utilisateur ne sait pas où
se trouvent les données.
6. Transparence vis à vis de la fragmentation: (ang.
fragmentation transparency)
7. Transparence vis à vis de la réplication
8. Traitement des requêtes distribuées
9. Traitement de transactions distribuées
10. Indépendance vis à vis du matériel
11. Indépendance vis à vis du système d’exploitation
12. Indépendance vis à vis du réseau
13. Indépendance vis à vis du SGBD
7
ARCHITECTURE D’UNE BD RÉPARTIE
Utilisateurs
Schéma de
fragmentation
Schéma d'allocation
8
ARCHITECTURE D’UNE BD RÉPARTIE
Décomposition en BD locales
Les données sont accédées via des vues intégrées qui assurent la transparence à la
localisation
Intégration logique des BDs locales existantes
9
APPROCHES DE CONCEPTION D’UNE BD RÉPARTIE
10
APPROCHES DE CONCEPTION D’UNE BD RÉPARTIE
11
APPROCHES DE CONCEPTION D’UNE BD
RÉPARTIE
Exemple
Relation Employé (nss, nom, loc, ...)
Relation Taux (pays, valeur, ...)
80% des requêtes dans une ville portent sur les employés
de la ville
10% des requêtes dans une ville portent sur Taux
12
APPROCHES DE CONCEPTION D’UNE BD
RÉPARTIE
Exemple (suite)
Créer 3 bases de données : P, M, L
Sur chaque base : les employés de la ville et une copie de
de la table Taux.
Si trop cher :
fusionner M et L
ou maintenir Taux à M.
13
GESTION DES BD-R
▪ Schéma Global
Indépendance Applications/Bases de Données
Schéma global lourd à gérer
15
SCHÉMA GLOBAL
▪ Schéma de placement
• Régle de correspondance avec les données locales
• Indépendance à la localisation et à la décomposition
16
COUPLAGE FAIBLE
▪ N Schémas Locaux
• Pas de Schéma global
• Pas d ’Indépendance Applications/Bases de Données
17
FÉDÉRÉ
▪ Fédération de Schémas Hétérogènes
Moyen contrôlé de migration depuis les SGBDs locaux
vers un SGBD-R
23
FRAGMENTATION HORIZONTALE DÉRIVÉE
24
FRAGMENTATION VERTICALE
La FV est utile pour distribuer les parties des données
sur le site où chacune de ces parties est utilisée, ainsi
que pour diminuer le volume de données chargées du
disque en mémoire; et par conséquent le temps de
réponse d’une requête.
L'opérateur de partitionnement est la projection ()
26
ALLOCATION DES FRAGMENTS AUX SITES
▪ Non-Dupliquée
• partitionnée
• chaque fragment n ’existe que sur un seul site
▪ Dupliquée
• Chaque fragment est sur plus d’un site
• Maintien de la cohérence des copies multiples
27
ALLOCATION DES FRAGMENTS
Avantages:
Haute disponibilité
Equilibre de charge par l’ interrogation des réplicas
Inconvénients:
Coût du stockage
Coût de mise à jour des réplicas 29
..RÉPLICATION
MAJ des réplicas:
Protocole de MAJ synchrone: envoi immédiat des màjs
(+) pertinence des réplicas
30
MODÈLE DE RÉPLICATION
▪ Copies
• Copie Primaire (ou Maître ou Source)
• reçoit les mises à jour
• Copie Secondaire (ou Esclave ou Cible)
• en consultation seulement
• peut être désigné Primaire
en cas d ’arrêt de la copie primaire
▪ Mode de réplication
• Asymétrique
• une copie primaire / N copies secondaires
• Symétrique 31
• N copies primaires
EVALUATION DES REQUÊTES RÉPARTIES
32
TRAITEMENT DE REQUÊTES
DISTRIBUÉES
Coût d’une requête distribuée est la somme de:
Coût des E/Ss
Coût de traitement (CPU)
Coût de transfert de données/ requêtes (communication)
Chaque requête distribuée lui est associé un arbre distribué.
Parallélisme
Inter-requêtes: +sieurs requêtes sont traitées en //, par
différents noeuds.
Intra-requête: la requête est décomposée en sous-requêtes
exécutées en //.
Stratégie d’exécution
Transfert de requêtes (ang. queryshipping)
Transfert de données (ang. data shipping)
33
EXEMPLE I
2 ARBRES
34
EXEMPLE I :
FRAGMENTATION DE L ’ARBRE 1
35
EXEMPLE I :
ALLOCATION DES FRAGMENTS DE L ’ARBRE 1
36
EXEMPLE II
37
OPTIMISATION
Mêmes stratégies qu’en centralisé:
Réduire temps CPU
Réduire temps E/Ss
38
GESTION DES TRANSACTIONS RÉPARTIES
39
NOTIONS COMPLÉMENTAIRES
▪ Disponibilité
• Disponible quand prêt à fonctionner et apte à accomplir sa fonction de
manière fiable
▪ Fiabilité
• Aptitude à accomplir sa fonction sans défaillance dans des conditions
données pour une durée déterminée
▪ Maintenabilité
• Possibilité d’être maintenu ou rétabli en un temps donnée dans un état
d’aptitude à accomplir sa fonction
▪ Maintenance
• Ensemble des opérations qui permettent de maintenir (m. préventive) ou
de rétablir (m. corrective)
▪ Sûreté de fonctionnement
• Fiabilité et sécurité vis à vis des personnes et des biens
40