Vous êtes sur la page 1sur 30

Introduction

Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

Systèmes de Fichiers Distribués (SFD)

Latreche F.
UNIV CONSTANTINE 2, NTIC, M1 GL

2020/2021

Latreche F. Systèmes de Fichiers Distribués (SFD) 1/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Les fichiers constituent le support permanent de


stockage des informations,
— Le SFD est la partie du système d’exploitation distribué
qui se charge de gérer les fichiers et de fournir des
facilités d’accès et de traitement,
— Le SFD permet le partage de l’information et le travail
collaboratif,
— La réalisation d’un SFD est une tâche difficile du fait
que les utilisateurs et les supports de stockage sont
dispersés,
— Un SFD est implémenté soit à l’aide d’un seul
composant, ou par le biais de coopération entre
plusieurs composants répartis (une couche logicielle).
Latreche F. Systèmes de Fichiers Distribués (SFD) 2/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

Modèles de fichiers (Structure)


— fichiers non structurés : un fichier est une séquence non
structurée de données, tout fichier du système apparait
au serveur de fichiers comme une séquence non
interprété d’octets. La structure et la signification des
données du fichier dépend entièrement des programmes
d’application.
— fichiers structurés : un fichier est une séquence
ordonnée d’enregistrements de différentes tailles. Un
système de fichier peut avoir plusieurs types de fichiers,
chacun ayant des propriétés différentes. Les opérations
de lecture et d’écriture sont réalisées sur un ou
plusieurs d’octets.
Latreche F. Systèmes de Fichiers Distribués (SFD) 3/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

Modèles de fichiers (modification)


— fichiers mutable (changeable) : une mise à jour
effectuée sur un fichier réécrit son ancien contenu.
— fichier immuable (inlatérable) : L’approche des versions
d’un fichier (file versioning ) est employée pour
implémenter les modifications sur un fichier. Tout
fichier est représenté par une suite de fichiers (de
versions) immuables, c’est à dire une nouvelle version
du fichier sera crée après chaque opération de
modification, et l’ancienne version est maintenue telle
quelle.

Latreche F. Systèmes de Fichiers Distribués (SFD) 4/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

Fonctions d’un systèmes de gestion des fichiers


Le système de gestion des fichiers assure les fonctions :
— Manipulation des fichiers : des opérations qui
permettent la manipulation des fichiers par les
programmes d’application : créer/détruire des fichiers,
insérer, supprimer et modifier un article dans un fichier.
— Allocation de la place sur mémoires secondaires : le
système de fichiers alloue à chaque fichier un nombre
variable de blocs mémoires.
— Localisation des fichiers : identifier et retrouver les
données ; à l’aide d’informations descriptives (nom,
adresse...).

Latreche F. Systèmes de Fichiers Distribués (SFD) 5/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

Fonctions d’un systèmes de gestion des fichiers(suite)


— Sécurité et contrôle des fichiers : des mécanismes de
protection sont associés à chaque fichier afin de le
protéger contre tout accès non autorisé ou mal
intentionné lors du partage des fichiers.
— Les systèmes de fichiers peuvent inclure la compression
ou le chiffrement automatique des données, une gestion
des droits d’accès aux fichiers et une journalisation des
écritures.

Latreche F. Systèmes de Fichiers Distribués (SFD) 6/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué Le Service de fichiers
Sémantiques de partage de fichiers (File sharing semantics) Le Service de répertoires
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Le rôle du système de fichiers distribué est de stocker


les programmes et les données sur les différents sites du
SD et les rendre disponibles à la demande,
— Un SFD doit avoir des performances acceptables,
— La multiplicité et la dispersion des serveurs et des
dispositifs de stockage doivent être invisibles aux
clients,
— Dans SFD on distingue deux composants distincts :
— Le service de fichiers,
— Le service de répertoires.

Latreche F. Systèmes de Fichiers Distribués (SFD) 7/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué Le Service de fichiers
Sémantiques de partage de fichiers (File sharing semantics) Le Service de répertoires
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Un service de fichiers distribué est une implémentation


distribuée du service de fichiers centralisé.
— Un serveur de fichiers est un processus qui s’exécute
sur un ensemble de machines et qui contribue à la mise
en œuvre du service de fichiers, il contrôle les
dispositifs de stockage secondaires sur lesquels les
fichiers sont stockés.
— Le service de fichiers distribué gère les opérations sur
les fichiers, des opérations fournies aux clients,
— Les serveurs de fichiers peuvent s’exécuter sur des
machines spécialisées ou sur des machines qui sont à la
fois clients et serveurs.

Latreche F. Systèmes de Fichiers Distribués (SFD) 8/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué Le Service de fichiers
Sémantiques de partage de fichiers (File sharing semantics) Le Service de répertoires
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Le service de répertoires gère les opérations sur les


répertoires, des opérations de création et suppression
des répertoires, de nommage et renommage des
fichiers, et leur déplacement d’un répertoire à un autre
à travers le réseau,
— Les nœuds du SD peuvent avoir la même vue de
l’hiérarchie globale des répertoires ou non,
— Le nommage (désignation) des fichiers est
l’établissement de correspondances entre les noms
logiques et les noms physiques des fichiers,
— Le service répertoire doit adopter une syntaxe
permettant de définir les noms de fichiers et des
répertoires.
Latreche F. Systèmes de Fichiers Distribués (SFD) 9/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Transparence d’accès : Les fichiers distants et les


fichiers locaux sont accessibles de la même façon, Les
application et utilisateurs du SD ne doivent avoir
aucune information sur la répartition des fichiers sur
sites.
— Transparence de localisation : Les noms des
fichiers ne doivent pas révéler leurs emplacements. Un
fichier peut être déplacé d’un nœud du système vers un
autre sans avoir besoin de modifier son nom.
— Indépendance d’emplacement : Le SFD doit
permettre le déplacement dynamique des fichiers entre
ses nœuds. Un utilisateur doit être capable d’accéder à
un fichier à l’aide du même nom indépendamment de
son emplacement.
Latreche F. Systèmes de Fichiers Distribués (SFD) 10/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Mobilité des utilisateurs :


— Un utilisateur du SFD devrait avoir la liberté de
travailler sur différents sites du système distribué à
des moments différents sans perdre la performance.
— le SFD doit apporter automatiquement
l’environnement de travail de l’utilisateur à son
endroit d’accès dans le système.
— Performance :
— La performance d’un système de fichiers distribué
doit être proche de la performance d’un système de
fichiers centralisé.
— Le SFD doit employer des techniques qui
minimisent le trafic réseau causé par les accès
distants aux fichiers.
Latreche F. Systèmes de Fichiers Distribués (SFD) 11/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Convivialité :
— L’interface utilisateur au SFD doit être simple et le
nombre de ses commandes d’accès doit être limité.
— Le système de fichiers distribué doit également
supporter une large gamme d’applications.
— Extensibilité :
— Le SFD doit s’adapter à l’évolution dynamique du
système distribué.
— Le temps de réponse du système de fichiers ne doit
pas se dégrader lorsque le système distribué
s’accroît.

Latreche F. Systèmes de Fichiers Distribués (SFD) 12/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Disponibilté :
— Les fichiers doivent être disponibles même en cas de
la panne temporaire d’un ou de plusieurs nœuds du
SD.
— Pour atteindre une meilleure disponibilité, la
duplication des fichiers sur plusieurs sites est
employée.
— Fiabilité :
— la perte de fichiers stockés doit être minimisée
autant que possible,
— Le SFD doit effectuer des sauvegardes
automatiques des fichiers importants.

Latreche F. Systèmes de Fichiers Distribués (SFD) 13/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Hétérogénéité :
— Les nœuds Du SD sont hétérogènes par nature,
— Un SD doit faciliter l’intégration de nouveaux types
de nœuds et de supports de stockage.
— Concurrence :
— La concurrence se produit lorsque plusieurs clients
accèdent à un même fichier en modes conflictuels,
— des mécanismes de contrôle d’accès concurrents
aux fichiers et des techniques de verrouillage
doivent être appliqués pour pallier ce problème.

Latreche F. Systèmes de Fichiers Distribués (SFD) 14/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Sémantique d’UNIX
Buts d’un Système de Fichiers Distribué Sémantique de session
Sémantiques de partage de fichiers (File sharing semantics) Sémantique transactionnelle
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— La sémantique de partage des fichiers d’UNIX supporte


des fichiers ayant une image unique ; les modifications
appliquées sur un fichier sont instantanément visibles.
— La sémantique d’UNIX dans un système de fichiers
distribué peut être réalisée par interdire la mise en
cache des fichiers et par affecter la gestion d’un fichier
partagé à un serveur de fichiers unique.
— A cause des délais de transmission non nuls sur le
réseau, les requêtes peuvent ne pas être traitées en
ordre.

Latreche F. Systèmes de Fichiers Distribués (SFD) 15/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Sémantique d’UNIX
Buts d’un Système de Fichiers Distribué Sémantique de session
Sémantiques de partage de fichiers (File sharing semantics) Sémantique transactionnelle
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Une session est une suite d’opérations d’accès à un


fichier effectuées entre son ouverture et sa fermeture.
— Tous les changements apportés sur un fichier sont
rendus visibles aux processus clients appartenant à la
même session, une fois la session fermée (fermeture du
fichier) ces changements deviennent visibles aux
processus distants appartenant à d’autres sessions.
— les processus d’une session partagent la même image
modifiable d’un fichier, dans le sens où le résultat d’une
opération d’écriture effectuée par un processus de la
session est visible immédiatement aux autres processus
de la session, mais pas aux processus clients des
sessions simultanées.
Latreche F. Systèmes de Fichiers Distribués (SFD) 16/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué Sémantique d’UNIX
Buts d’un Système de Fichiers Distribué Sémantique de session
Sémantiques de partage de fichiers (File sharing semantics) Sémantique transactionnelle
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Cette sémantique considère les opérations d’ouverture


et de fermeture d’un fichier comme le début et la fin
d’une transaction assurant un traitement atomique du
fichier.
— Cette technique fournit un accès exclusif aux fichiers, la
propriété : “The al l-or-nothing” maintient le fichier
dans un état cohérent.
— A tout moment un seul processus client accède au
fichier, ce qui fait soit toutes ces modifications sont
accomplies soit aucune d’entre elles.

Latreche F. Systèmes de Fichiers Distribués (SFD) 17/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

— Le but de la mise en cache de données dans un système


de fichiers centralisé est de minimiser le nombre
opérations d’E/S de disques.
— L’objectif de la mise en cache dans un SFD est de
réduire les accès distants (minimiser le trafic réseau).
— La mise en cache dans un SFD consiste à maintenir en
mémoire locale une copie des données d’un serveur
distant. Le but est de traiter localement les accès
ultérieurs.

Latreche F. Systèmes de Fichiers Distribués (SFD) 18/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

En supposant que l’emplacement initial des fichiers est le


disque du serveur, les données cachées peuvent être mises
dans trois emplacements différents :
Réseau de communication

Mémoire (3) Mémoire (1)

Disque (2) Disque

Client Serveur
(1) Cache dans la mémoire du serveur
(2) Cache dans le disque du client
(3) Cache dansLatreche
la mémoire
F. du client
Systèmes de Fichiers Distribués (SFD) 19/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Cache dans la mémoire principale du serveur


— Un cache dans la mémoire principale du nœud serveur
élimine le coût d’accès au disque du serveur.
— Il est facile de garder conformes le fichier orignal et les
données cachées.
— Un cache dans la mémoire du serveur nécessite toujours
un accès réseau pour toute opération d’accès au fichier.

Latreche F. Systèmes de Fichiers Distribués (SFD) 20/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Cache dans le disque du client


— Un cache sur le disque du client élimine le coût
engendré par les accès réseaux.
— Un cache sur le disque du client améliore aussi la
fiabilité du système, les modifications faites sur le cache
sont préservées en cas d’accident.
— Une capacité de stockage importante.
— Mais, il est impossible d’avoir des nœuds sans disque
(diskless workstation).

Latreche F. Systèmes de Fichiers Distribués (SFD) 21/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Cache dans la mémoire principale du client


— Un cache dans la mémoire principale du nœud client
élimine à la fois les coûts des accès réseaux et les coûts
d’accès au disque du serveur.
— Ce type de caches fournit une meilleure performance et
elle contribue aussi à l’extensibilité et la fiabilité du
système.

Latreche F. Systèmes de Fichiers Distribués (SFD) 22/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Écriture immédiate (write-through policy)


— Consiste à réécrire les blocs de données sur le disque
dès qu’ils sont modifiés dans le cache.
— L’écriture immédiate est la politique la plus simple.
— peu d’informations sont perdues lors d’une panne d’un
nœud client .
— Cependant, l’écriture immédiate réduit les
performances.

Latreche F. Systèmes de Fichiers Distribués (SFD) 23/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Écriture différée (delayed-write)


— La politique d’écriture différée retarde la modification
de la copie principale, les modifications sont tout
d’abord apportées sur les données du cache, ensuite, à
un instant ultérieur, appliquées sur la copie du serveur.
— Les accès en mode écriture s’effectuent beaucoup plus
rapidement.
— Uniquement la dernière mise à jour des données est
appliqué.
— Mais, cette politique n’est pas fiable, les données non
sauvegardées peuvent être perdues en cas de panne du
nœud client.

Latreche F. Systèmes de Fichiers Distribués (SFD) 24/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

— La politique les variantes :


— Modifier un bloc lorsqu’il est sur le point d’être
éjecté du cache du site client.
— Analyser le cache à un intervalle de temps contrôlé.
— Politique d’écriture à la fermeture
(write-on-close-policy).

Latreche F. Systèmes de Fichiers Distribués (SFD) 25/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

Deux approches de vérification de la validité du cache sont


employées :
— Validation initiée par le client
Le client démarre le processus de contrôle de cohérence
du cache en faisant appel au serveur. La fréquence de
vérification de validité du cache varie d’une vérification
avant tout accès à une vérification au premier accès au
fichier uniquement.
— Validation initiée par le serveur
Le serveur enregistre, pour chaque client, les fichiers
qu’il met en cache. Il réagit quand le serveur détecte
une inconsistance. Une inconsistance se produit lorsque
deux clients mettent en cache un fichier en modes
conflictuels.
Latreche F. Systèmes de Fichiers Distribués (SFD) 26/30
Introduction
Concepts préliminaires
Système de Fichiers Distribué Emplacement des caches
Buts d’un Système de Fichiers Distribué Politiques de mise à jour des fichiers cachés
Sémantiques de partage de fichiers (File sharing semantics) Cohérence du cache
Mise en cache des fichiers Granularité des données mises en cache
Duplication des fichiers
Conclusion

— La taille des données mises en cache varie de quelques


blocs à un fichier complet.
— Les données mises en cache doivent servir plus d’un
accès.
— La taille des données mises en cache doit prendre en
compte l’unité de transfert du protocole de
communication. Si les données mises en cache ont des
tailles supérieures aux unités de transfert, les données
doivent être désassemblées pour l’envoi et rassemblées
après réception.

Latreche F. Systèmes de Fichiers Distribués (SFD) 27/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué Avantages
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— La duplication des fichiers sur plusieurs sites améliore la


disponibilité et garantit une performance élevée.
— Les copies d’un fichier doivent être placées sur des sites
qui sont indépendants en ce qui concerne la panne.
— Il faut cacher les détails de la gestion de duplication
aux utilisateurs.

Latreche F. Systèmes de Fichiers Distribués (SFD) 28/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué Avantages
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— La disponibilité d’une copie d’un fichier n’est pas liée à


la disponibilité des autres copies.
— Possibilité d’accéder à un fichier même si le serveur qui
l’héberge et arrêté.
— Répartition de la charge de traitement sur plusieurs
serveurs (performance améliorée).
— Amélioration de la sécurité ;
— La multiplicité de copies facilite la reprise en cas de
pannes.
— Possibilité d’avoir des applications insensibles au
placement des données.

Latreche F. Systèmes de Fichiers Distribués (SFD) 29/30


Introduction
Concepts préliminaires
Système de Fichiers Distribué
Buts d’un Système de Fichiers Distribué
Sémantiques de partage de fichiers (File sharing semantics)
Mise en cache des fichiers
Duplication des fichiers
Conclusion

— Un fichier est une collection de données réunies sous un


même nom logique est préservé sur un support de
stockage permanent.
— Un système de fichiers distribué est le composant du
système distribué qui assure la gestion des fichiers
répartis sur les différents nœuds.
— Un système de fichiers distribué doit être convivial,
extensible, fiable et performant.
— La performance d’un système de fichiers distribué peut
être atteinte par utiliser la technique de mise en cache.
— Le but principal de la technique de duplication est
d’assurer la disponibilité des fichiers.

Latreche F. Systèmes de Fichiers Distribués (SFD) 30/30

Vous aimerez peut-être aussi