Vous êtes sur la page 1sur 12

LoadBalancer

Base de donnée
distribuée
hela gharbi
Qu’est-ce que le
load balancing ?
Normalement, chaque domaine est associé à un serveur Web. Si un
internaute charge une page Web en entrant une URL dans le champ de
recherche du navigateur, les données du serveur correspondant sont
récupérées. Si celui-ci est surchargé, l’utilisateur reçoit alors un message
d’erreur ou Code de statut http, et la page Internet ne peut s’afficher. C’est
ici qu’intervient le load balancing et qu’il peut vous être utile. Grâce à un
load balancer en amont, il est possible d’affecter un domaine à plusieurs
serveurs sans créer de conflit avec les adresses. Par la suite, le load
balancer est accessible dans le domaine public.
Le principal avantage d’un load
balancer est de réduire le temps de
réponse d’un site suite aux requêtes
Avantages et des utilisateurs. En effet, optimiser la
charge de travail des serveurs limite
importance du les risques de pannes liés à une
load balancer surcharge. Si une machine devient
indisponible, les utilisateurs seront
redirigés vers un autre serveur et
auront toujours accès aux pages
Comment un load balancer fonctionne-t-il ?

La répartition de charge est effectuée par un algorithme, s’appuyant sur


le DNS (Domain Name System). L’utilisateur accède aux sites internet via
une URL, liée à une adresse IP. Cette dernière contacte le répartiteur de
charge, qui transmet la demande au serveur. La répartition dépendra
alors du type d’algorithme utilisé. Les quatre plus connus sont : Round
Robin, Weighted Round Robin, Least Connections et Weighted Least
Connections
Round Robin Weighted Round Robin
Cette méthode crée une file d’attente pour les
demandes entrantes. Ces dernières sont ensuite Contrairement au Round Robin « classique
gérées par le répartiteur de charge, qui les distribue », cette méthode fonctionne en distribution
aux serveurs du cluster. Les requêtes sont pondérée. Une valeur est attribuée à
assignées de manière séquentielle, selon la l’avance à chaque serveur, selon ses
disponibilité des machines. Round Robin ne tient pas capacités et sa puissance. Par exemple, le
compte de l’urgence de la demande, ni de la charge plus puissant aura une valeur de 10 et le
qu’elle va représenter pour le serveur concerné. Il
moins puissant une valeur de 1. Le load
est donc adapté aux environnements où les serveurs
balancer attribuera alors davantage de
disposent de ressources identiques. Mais dans une
charge à la machine la plus robuste. Cette
infrastructure où celles-ci diffèrent, il pourrait
assigner des charges non adaptées à des machines méthode convient donc mieux à un
moins puissantes… ce qui pourrait entraîner une environnement dont les ressources entre
surcharge. les serveurs diffèrent : la charge est
Il s’agit de la méthode la plus classique. Elle sert de optimisée en fonction de leurs capacités.
modèle aux autres algorithmes.
Least Connections Weighted Least
CLes deux méthodes précédentes ne tiennent pas Connections
compte du nombre de connexions que les serveurs Cet algorithme complète celui de Least
du cluster doivent gérer, lors de la distribution des Connections. Au sein d’une infrastructure
tâches par le load balancer. Donc plusieurs où les ressources des serveurs sont
connexions peuvent parfois s’accumuler sur un hétérogènes, il tient compte du volume de
serveur et entraîner sa surcharge. Least demandes pour chaque machine, ainsi que
Connections remédie à cela. Il tient compte en de leur pondération définie par
effet des demandes déjà existantes sur le serveur l’administrateur. Comme pour Weighted
web durant la distribution. La machine avec le plus Round Robin, le serveur le plus puissant a
petit nombre de requêtes reçoit la prochaine une pondération plus importante. Ceci
sollicitation du load balancer. En revanche, cet permet de maintenir une répartition
algorithme ne tient pas compte des capacités optimale des requêtes dans un cluster. En
techniques des serveurs. Il est par conséquent plus effet, chaque nouvelle demande est
adapté aux environnements dont les ressources assignée au serveur dont le rapport
serveur sont identiques. connexions actives-pondération est le plus
faible.
Une base de données distribuée est
essentiellement une base de données qui
Base de n'est pas limitée à un seul système, elle est
répartie sur différents sites, c'est-à-dire sur
donnée plusieurs ordinateurs ou sur un réseau
d'ordinateurs. Un système de base de
distribuée données distribuée est situé sur différents
sites qui ne partagent pas de composants
physiques. Cela peut être nécessaire
lorsqu'une base de données particulière doit
être consultée par différents utilisateurs à
l'échelle mondiale. Elle doit être gérée de
telle sorte que pour les utilisateurs, elle
ressemble à une base de données unique.
Types de base de donneés distribués

Base de données Base de données hétérogène


homogène les différents sites peuvent utiliser des schémas et
des logiciels différents susceptibles d’entraîner des
Dans une base de données problèmes dans le traitement des requêtes et les
homogène, tous les sites stockent transactions. En outre, un site particulier peut
la base de données de manière ignorer complètement les autres sites. Des
identique. Le système ordinateurs différents peuvent utiliser un système
d'exploitation, le système de d'exploitation différent, une application de base de
gestion de la base de données et données différente. Ils peuvent même utiliser des
les structures de données utilisées : modèles de données différents pour la base de
tous sont identiques sur tous les données. Par conséquent, des traductions sont
sites. Ils sont donc faciles à gérer. nécessaires pour que les différents sites puissent
communiquer.
Stockage de données réparties
Réplication
Dans cette approche, l'ensemble de la relation est stocké de manière redondante sur 2
sites ou plus. Si l'ensemble de la base de données est disponible sur tous les sites, il s'agit
d'une base de données entièrement redondante. Par conséquent, en cas de réplication,
les systèmes
Nous proposons plusieurs conservent desselon
plans tarifaires, copies des données.
la taille de votre entreprise.
Cette méthode est avantageuse car elle augmente la disponibilité des données sur
différents sites. En outre, les demandes de recherche peuvent désormais être traitées en
parallèle. Toutefois, cette solution présente également certains inconvénients. Les
données doivent être constamment mises à jour. Toute modification apportée sur un site
doit être enregistrée sur chaque site où la relation est stockée, sous peine d'entraîner une
incohérence. Cela représente beaucoup de frais généraux. En outre, le contrôle de la
simultanéité devient beaucoup plus complexe car l'accès simultané doit maintenant être
vérifié sur plusieurs sites.
Fragmentation

Dans cette approche, les relations sont fragmentées (c'est-à-dire qu'elles sont divisées
en plus petites parties) et chacun des fragments est stocké dans différents sites où il
est nécessaire. Il faut s'assurer que les fragments sont tels qu'ils peuvent être utilisés
pour reconstruire la relation originale (c'est-à-dire qu'il n'y a pas de perte de données).
La fragmentation est avantageuse car elle ne crée pas de copies des données, la
cohérence
Nous proposons plusieurs plans n'est pas selon
tarifaires, un problème.
la taille de votre entreprise.
La fragmentation des relations peut se faire de deux manières :
Fragmentation horizontale - Séparation par lignes - La relation est fragmentée en
groupes de tuples de sorte que chaque tuple est attribué à au moins un fragment.
Fragmentation verticale : séparation par colonnes. Le schéma de la relation est
divisé en schémas plus petits. Chaque fragment doit contenir une clé candidate
commune afin d'assurer une liaison sans perte.
Merci !

Vous aimerez peut-être aussi