Vous êtes sur la page 1sur 6

Chapitre 1

GENERALITES SUR LES BASES DE DONNEES


DISTRIBUEES

Objectif : Présenter les bases de données distribuées, les architectures


globales et les avantages et les contraintes liés à leur utilisation.

I. Définitions
 Une base de données est une collection de données organisées de façon à être accessibles,
administrées et mise à jour. Les bases de données peuvent être classées par le type de contenu
qu’elles renferment : données géographiques, données statistiques …

Cette définition englobe le concept de « centralisation », c’est-à-dire que la base de données est stockée
dans sa totalité à un emplacement physique unique.

 Le Système de gestion des bases de données (SGBD) est le logiciel destiné à stocker et à
partager les informations contenues dans une base de données. (MySQL, Oracle, PostGreSQL,
etc…). Une base de données centralisée est gérée par un seul SGBD.

 Une Base de données Distribuées (BDD), en anglais : DDB « Distributed DataBase », est une
base de données dont la gestion est traitée par un réseau d’ordinateurs interconnectés qui
stockent les données à différents emplacements physiques. Ce stockage peut être soit
partitionnée entre différents nœuds du réseau, soit répliqué entièrement sur chacun d’eux, soit
organisé de façon hybride. Une BDD est gérée par plusieurs processeurs, sites ou SGBD.
II. Problématique
Les BDD sont d'abords des bases de données normales. En fait, elles sont issues de l'évolution
de ces dernières. En effet, la gestion de bases de données avec le temps, s'est confrontée à divers
problèmes qui sont :
- L'augmentation du volume de données ;
- l'augmentation du volume de traitements ;
- l'augmentation du volume de transactions ;

Cela a entraîné la lenteur des applications, car les périphériques de stockage submergés, ne
répondant pas assez vite. Aussi, il a été noté que les débits des liaisons réseaux évoluaient beaucoup
plus vite que les capacités des périphériques de stockage.

Ainsi, l'idée est venue de multiplier les sources de données et les faire communiquer par réseau,
afin de bénéficier de traitements parallèles, minimisant ainsi les temps de réponses. Aujourd'hui, les
BDDs sont de plus en plus répandus, et comblent largement les lacunes des bases de données classiques.

III. Buts de la répartition des bases de données


Les bases de données distribuées ont une architecture plus adaptée à l’organisation des
entreprises décentralisées. Elles offrent :

- Plus de fiabilité : les bases de données réparties ont souvent des données répliquées. Ainsi, la
panne d’un site n’est pas très importante pour l’utilisateur, qui s’adressera à autre site.

- De meilleures performances : la réduction du trafic sur le réseau est une possibilité d’accroître
les performances. Le but de la répartition des données est de les rapprocher de l’endroit où elles
sont accédées. Répartir une base de données sur plusieurs sites permet de répartir la charge sur
les processeurs et sur les entrées/ sorties.

- Une possibilité d’évolution technique : par l’ajout de machines sur le réseau.

IV. Quelques architectures usuelles des bases de données


En fonction des contextes, on retrouve quelques architectures usuelles des bases de données :

1) Architecture centralisée
Les données sont stockées dans une seule base de données. Ceci a pour avantage de faciliter la gestion
du système des données. Cependant il sera très difficile d’élargir le système si le volume de données
devient conséquent.
2) Architecture distribuée
Plusieurs bases de données sont mises à contribution pour la gestion du système de données. Ceci
favorise la bonne répartition des charges entre les bases ainsi que la gestion des données en local.
Cependant, l’administration des bases réparties ainsi que la gestion de la transaction entre ces bases sont
les principaux problèmes à résoudre.

Dans le cadre de l’architecture distribuée, on distingue plusieurs variantes :

 Architecture répartie :
Dans laquelle le système gère de manière transparente un ensemble de bases de données
logiquement reliés et réparties sur différents sites. Pour faciliter le management de ce système,
il est nécessaire de mettre en place un schéma global

 Architecture fédérée :
Système pouvant gérer plusieurs bases de données hétérogènes capables d’inter opérer via un
modèle commun (une vue commune)
 Architecture de médiation :
Système pouvant gérer plusieurs sources de données (fichiers) hétérogènes capable d’inter
opérer via une architecture de médiation.

 Architecture multi-base : système pouvant gérer plusieurs bases de données (hétérogènes ou


non) capables d’inter opérer sans modèle commun. Cette architecture est généralement utilisé à
l’échelle mondiale, au regard du nombre important d’utilisateurs et de sources à gérer.

 Architecture « Big Data » : lorsqu’il y a une masse de données véloce à traiter, cette
architecture distribuée est la mieux indiquée. En effet, il s’agit d’un système gérant plusieurs
processeurs capables de traiter en parallèle des sous-ensembles de tâches.

V. Architecture fonctionnelle de la répartition des données


Dans un environnement de bases de données réparties, il existe 2 principaux types
d'architectures :
- L’architecture client – serveur ;
- L’architecture serveur – serveur.

1) L'architecture client-serveur

Dans cette architecture, l'application client se connecte au serveur de base de données (ici Oracle
10g). Ce dernier à son tour, leur renvoie des réponses en fonction de leurs requêtes.
2) L'architecture serveur-serveur

Dans un système de bases de données réparties, il existe en général plusieurs serveurs de


données qui fonctionnent selon l'architecture suivante :

Chaque serveur gère sa base de données et échange les informations avec les autres. Le tout est
vu comme une seule base de données logique.

De façon globale voici comment fonctionne un système de base de données distribuées:

Les clients se connectent à leurs serveurs respectifs, et ces derniers s'échangent les informations
si nécessaires.

VI. Avantages
Les avantages dans la mise en place d’une BDD sont les suivantes :
- Transparence pour l’utilisateur ;
- Autonomie de chaque site ;
- Absence de site privilégié ;
- Continuité de service ;
- Transparence vis à vis de la localisation des données ;
- Transparence vis à vis de la fragmentation ;
- Transparence vis à vis de la réplication ;
- Traitement des requêtes distribuées ;
- Indépendance vis à vis du matériel ;
- Indépendance vis à vis du système d’exploitation ;
- Indépendance vis à vis du réseau ;
- Indépendance vis à vis du SGBD.

VII. Contraintes
- Coût : la distribution entraîne des coûts supplémentaires en termes de communication, et en
gestion des communications (hardware et software à installer pour gérer les communications
et la distribution).

- Sécurité : la sécurité est un problème plus complexe dans le cas des bases de données
réparties que dans le cas des bases de données centralisées.

Vous aimerez peut-être aussi