Vous êtes sur la page 1sur 9

Chaque système distribué a un certain nombre de processus exécutés sur un certain nombre de

serveurs physiques différents. Ces processus communiquent entre eux via des canaux de
communication utilisant la messagerie texte. Ces processus n'ont ni mémoire partagée ni horloge
physique commune, ce qui rend difficile le processus de détermination de l'état global instantané.

Chandy et Lamport ont été les premiers à proposer un algorithme pour capturer l'état global cohérent
d'un système distribué. L'idée principale derrière l'algorithme proposé est que si nous savons que tous
les messages qui ont été envoyés par un processus ont été reçus par un autre, nous pouvons enregistrer
l'état global du système.
PASS

15 eme chapitre

Pannes et detecteur de panne

Une panne peut être comprise comme une faille au sein du système , qui peut conduire à des
résultats erronés comme aussi engendrer l'arrêt de toute ou partie du système distribué

Peut-être, c'est une raison matérielle ou logique liée à la conception des applications, , des systèmes
d'exploitation.

Ainsi, un système distribué doit être conçu pour masquer ce genre des pannes aux utilisateurs. La
panne de certains serveurs (ou leur réintégration dans le système après la réparation) ne doit pas
perturber l'utilisation du système en terme de fonctionnalité.

Classification des pannes

La moins sévère des défaillances est le plantage ou le crash. Cette défaillance se produit quand le
serveur fonctionne correctement puis s’arrête subitement et de façon prématurée. L’exemple le plus
répandu dans les machines mono-processeurs est lors du blocage du système d’exploitation ; la seule
solution est de relancer (rebooter) le système.

L’autre classe de défaillance est l’omission. Elle survient lorsque le serveur n’arrive plus à traiter les
requêtes qui arrivent de l’extérieur. Il peut s’agir d’un échec de réception des messages entrants
(omission de réception), ou un échec d’envoi des messages (omission d’envoi).

Les défaillances temporelles sont plus sérieuses que l’omission. Il s’agit d’une réponse qui n’arrive
pas dans les délais. En d’autres termes, l’arrivée ne respecte pas un intervalle dans le temps
prédéfini. Cette défaillance est considérée comme une défaillance temporelle.
Un autre type de défaillances peut survenir lorsque la réponse du serveur est incorrecte. A ce
moment, on parle de défaillance de réponse. Elle peut se produire lorsque la valeur de la réponse est
fausse. Par exemple, dans le cas du Web où un moteur de recherche retourne des résultats qui n’ont
rien à voir avec les termes de recherche [2]. L’autre cas de défaillance de réponse est la défaillance
de transition d’état. Il s’agit d’un serveur qui réagit de façon inattendue à une requête. Par exemple,
lorsque le serveur reçoit un message qu’il ne reconnaît pas et aucune mesure n’a été prévue pour ce
genre de situations [2].

La défaillance la plus sévère est la défaillance arbitraire, appelée aussi byzantine

Les pannes byzantines peuvent être "naturelles" ou "malicieuses". Elles sont dites naturelles si par
exemple une erreur physique non détectée (sur une transmission de message, en mémoire, sur une
instruction . . . ) ou une erreur logicielle qui mènent vers la non vérification des spécifications. Elles
sont dites malicieuses dans le cas d’un comportement visant à faire échouer le système (sabotage,
virus, ...)

PASS

DETECTION DE PANNE

proposée par Chandra et Toueg ,La tolérance aux pannes permet de construire des systèmes qui
continuent à fonctionner même en présence de pannes . Et donc il faut fournir au système les
moyens de détection et de prise en compte des pannes.

IL EXISTE DEUX FACONS D’IMPLEMENTER LE DETECTEUR DE PANNE

1. Celles qui utilisent le temps physique et celles qui ne l’utilisent pas et en fin nous avons des s.
2. olutions hybrides.

Le détecteur de défaillances Heart-Beat Heart-Beat est une technique bien connue pour
l’implémentation des détecteurs de défaillances. Le principe de ce détecteur de défaillances est très
simple. Tout processus envoie périodiquement à tous les autres processus un message ‘’ I am alive’’
pour leur signaler qu'il est en vie. Si un processus n'a reçu aucun message d'un processus durant un
intervalle de temps donné –timeout-, il le suspecte. S’il reçoit ultérieurement un message ‘’ I am
alive’’ d’un processus suspecté, alors il le ôte de sa liste des processus suspectés

B. Le détecteur de défaillances Interrogation L’interrogation est une autre technique pour


l’implémentation de détecteurs de défaillances Le principe du détecteur de défaillances Interrogation
est, comme le principe de Heart-Beat, très simple. Il génère cependant un peu plus de messages que
le mécanisme précédent. Un processus questionne périodiquement tous les autres processus pour
savoir s'ils sont vivants en envoyant régulièrement des messages ‘’Are you alive ? ‘’. Il attend ensuite
les message de réponses ‘’I am alive’’. Le processus qui n'a pas répondu dans les délais est alors
suspecté. Si la réponse parvient plus tard, le processus en question est réhabilité. La période d'envoi
des interrogations doit être plus grande que la durée d'attente des réponses.

ALGORITHME A JETON

SUZUKI KASAMI , RICARD AGRAWALA , ALGORITHM DE MAEKAWA ,

’Algorithme Ricart-Agrawala est un algorithme d'exclusion mutuelle sur un système distribué.


Cet algorithme est une extension et une optimisation de l'algorithme de Lamport, en supprimant
la nécessité de communiquer un message de libération. Dans cet algorithme, les requêtes
d'entrée sont totalement ordonnées grâce à l'utilisation de l'Horloge de Lamport.

Il a pour but de diminuer le nombre de messages échangés par entrée en section critique et
élimine les messages de type libération.
Deux types de message sont utilisés ici1:

 les messages REQUETE qui sont envoyés lorsqu'un site veut entrer en section critique
 les messages REPONSE qui sont envoyés soit immédiatement à la réception d'un message
de type REQUETE, soit ultérieurement à la sortie de section critique du site.

PASS
ELECTION

Peut-

L\\\
\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
TYPES D ALGORITHME D ELECTION

ALGORITHME BRUTAL

ALGORITHME DE LAGNEAU
U

\\\\\\\A
ALGORITHME DE CHANG ROBERT

PASS

Pa
PASS

ICI ON examine les principaux problèmes de coordination et d'accord liés aux

communication - c'est-à-dire comment obtenir la fiabilité et les propriétés de commande souhaitées

Nous recherchons particulièrement la fiabilité dans LES termes des propriétés de validité, d'intégrité
et d'accord, et l'ordre en termes de Ordre FIFO, ordre causal et ordre total.

Dans ce chapitre, nous étudions la communication multicast vers des groupes de processus dont

l'appartenance est connue.

Vous aimerez peut-être aussi