DC et RODC
DC et RODC
Dédicace
FADIL Oussama
DC Remerciements
et RODC
En préambule à ce mémoire, nous souhaitons adresser nos remerciements les plus sincères
aux personnes qui nous ont apporté de l’aide et qui ont contribué à l’élaboration de ce
projet.
Enfin nous saisissons cette occasion pour remercier les membres du jury tout en espérant
qu’ils trouvent dans ce rapport les qualités de clarté et de motivation qu’ils attendent.
DC Résumé
et RODC
informatiques.
Dans ce cadre, j’ai implémenté une solution de sauvegarde sur un serveur NAS,
permettant de minimiser les divers dégâts provenant des incidents graves suite d’une male
implémente une solution basée sur la diversité de types de sauvegardes, tout en intégrant
DC Abstract
et RODC
DC Table
et RODC de matières
2) Statistiques :............................................................................................................................. 13
DC Liste
et RODCdes figures
Figure 1-1-1 Statistiques sur les principales causes de perte de données………………... 12
Introduction générale
DC et RODC
Afin d’appliquer les méthodologies et les cours enseignés à l’institut
supérieur du génie appliqué de Marrakech, je dois réaliser un
travail de recherche et d'étude. Celui-ci me permet de m’initier à la recherche, d’appliquer
mes connaissances acquises durant ma formation. Dans le cadre de
mon mini projet, je suis amené à réaliser une solution de sauvegarde sur un serveur NAS.
projet ainsi les statistiques montrant une nécessité de suivre une stratégie de sauvegarde.
Après, dans le deuxième chapitre on va voir les différents types de sauvegardes et les
systèmes à tolérance aux pannes, par la suite, le troisième chapitre va présenter les anciens
périphériques de sauvegarde ainsi que les systèmes adoptés pour la gestion rationnelle des
sauvegardes. Enfin, dans le dernier chapitre, je vais terminer par une réalisation de la
solution permettant de concrétiser ces notions théoriques en travaillant sur une technologie
NAS4FREE
DC et RODC
DC et RODC
Partie 1 :
Problématique du projet
de sauvegarde pertinente.
I) Problématique du projet
DC et RODC
Tout d’abord, n’importe quel projet a une problématique donnant un sens pour
lui. Notre problématique se concentre dans la perte des données qui peuvent être sensibles,
ce qui nous obligent de manipuler les différentes situations permettant cette perte qui vient
généralement d’une absence au niveau de la gestion des systèmes informatiques.
2) Statistiques :
Selon les statistiques établies par les plus grandes entreprises spécialisées dans la
récupération de données, on peut dire que les principales causes de perte de données
mentionnées par les utilisateurs sont :
DC En se basant sur ce schéma, on peut sortir quelques analyses qui peuvent nous diriger vers
et RODC
des solutions précises. Donc voilà les analyses des causes les plus critiques et qui ont un
pourcentage plus élevé :
Dans le prochain chapitre, nous allons traiter les différentes solutions existées pour faire
protéger les systèmes informatiques, en commençant par une définition des sauvegardes
informatiques et aussi voir les types de ces sauvegardes, et finalement on traitera les
diverses technologies permettant de renforcer la bonne gestion de nos systèmes
informatiques.
DC et RODC
Partie 2 :
1) Introduction
l'enregistrement des données, qui consiste à écrire des données sur un périphérique,
tel qu'un disque dur, une clé USB, des bandes magnétiques, où les informations
demeureront même après l'extinction de la machine, contrairement à la mémoire
vive.
l'archivage, qui consiste à enregistrer des données de manière à garantir sur le long
terme leur conformité à un état donné, en général leur état au moment où elles ont
été validées par leurs auteurs.
DC et RODC
Il s’agit d’un système de sauvegarde de données sur internet : votre serveur est alors
connecté à un serveur distant qui effectue des sauvegardes soit en léger décalé, soit en
temps réel selon votre configuration.
Avec une sauvegarde complète, chaque fois qu’un système est sauvegardé, tous les fichiers
et dossiers du système sont copiés. Votre système de sauvegarde stocke une copie
complète supplémentaire de la source de données lors de chaque sauvegarde programmée.
Donc, si vous sauvegardez votre système le cinquième jour de chaque mois, le 5 Mars,
vous auriez une sauvegarde complète des données de votre système. Il existera une autre
sauvegarde complète avec les données du 5 Février, du 5 Janvier, etc.
Bien que le temps de sauvegarde soit plus lent et que la sauvegarde nécessite plus d’espace
de stockage, l’avantage de la sauvegarde complète des fichiers est que les opérations de
restauration sont plus rapides et plus simples.
Par conséquent, pour une sauvegarde effectuée le 5 Mars, vous auriez une sauvegarde
complète des données telle qu’elle existait le 5 Janvier avec les modifications apportées
entre Janvier 5 et 5 Février, puis les modifications apportées entre le 5 Février et 5 Mars.
La sauvegarde incrémentielle est plus longue à restaurer, mais plus rapide à sauvegarder, à
quantité de stockage. Ceci est généralement la méthode utilisée par les systèmes de
sauvegarde en ligne.
sauvegarde est complète. Mais par la suite, le système sauvegarde tous les changements
Pour reprendre notre exemple, le 5 Mars, le système sauvegarde tous les changements
DC et RODC
2) Rotation de médias :
2.1 Définition :
La rotation Grand-père-Père-Fils est la planification de rotation des médias la plus
couramment utilisée. Cette stratégie de planification utilise des ensembles de médias de
sauvegarde (bandes) quotidiens (Fils), hebdomadaires (Père) et mensuels (Grand-père).
Vous pouvez ainsi sauvegarder vos données pendant une année entière en utilisant un
nombre minimum de médias (bandes). Le nombre de bandes utilisées pour les rotations
GFS dépend du nombre de jours ouvrables spécifiés pour la stratégie de sauvegarde.
2.2 Fonctionnement
La méthode de rotation GFS fonctionne comme suit :
Sauvegardez vos données sur une bande séparée tous les jours ouvrables. Pour
chaque sauvegarde quotidienne, nous vous conseillons d'utiliser une bande
différente. Par exemple, si votre cycle de sauvegarde est de cinq jours ouvrables par
semaine, vous devez utiliser quatre bandes quotidiennes avant de vous servir d'une
bande hebdomadaire (vous pouvez par exemple étiqueter les bandes quotidiennes
Lundi, Mardi, Mercredi et Jeudi ou de Jour 1 à Jour 4, etc.). Vos sauvegardes
quotidiennes peuvent être complètes, incrémentielles ou différentielles. Après le
quatrième jour, la première bande quotidienne utilisée est recyclée et écrasée par la
sauvegarde quotidienne planifiée suivante.
Le cinquième jour, utilisez une bande hebdomadaire et non une autre bande
quotidienne. Vos sauvegardes hebdomadaires doivent toujours être complètes.
Vous devez utiliser cinq bandes hebdomadaires avant d'utiliser une bande
mensuelle (vous pouvez étiqueter les bandes hebdomadaires de Semaine 1 à
2.3 Illustration
Le schéma suivant présente un exemple de stratégie de rotation GFS sur 5 jours qui vous
offre une méthode sûre et fiable de sauvegarde des données sur une année entière en
utilisant un nombre minimum de médias de sauvegarde :
3.1 Définition :
3.2 Fonctionnement
Pour mieux comprendre comment la technologie RAID fonctionne, veuillez tout d'abord
vous familiariser avec les termes ci-dessous :
Le striping :
(Entrelacement) est la séparation des données entre plusieurs disques. Les matrices RAID
en striping visent à regrouper la capacité maximale en un seul volume.
Le mirroring :
DC et RODC
(Mise en miroir) correspond à la copie de données vers un ou plusieurs disques. Les
matrices RAID en mirroring permettent généralement la panne d'au moins un disque de la
matrice sans aucune perte de données, en fonction du niveau RAID de cette matrice.
Permet à une matrice RAID de continuer à fonctionner (c'est-à-dire que les données
stockées dans la matrice sont encore disponibles pour l'utilisateur) en cas de panne d'un
disque. Toutes les matrices RAID en mirroring ne sont pas conviviales. Par exemple,
certains dispositifs RAID doivent être éteints avant qu'un disque défaillant ne
Soit remplacé alors que les dispositifs LaCie RAID disposent d'une option de
remplacement avec un disque « remplaçable à chaud » qui permet au dispositif de rester
sous tension et aux données de demeurer accessibles pendant que le disque défaillant est
remplacé.
3.3.1.1 Définition :
RAID 0 (également appelé mode FAST dans certains dispositifs LaCie) est le mode RAID
le plus rapide. Nécessitant au moins 2 disques, RAID 0 « stripe » les données sur chaque
disque. Les capacités disponibles de chaque disque sont ajoutées afin qu'un seul volume
logique apparaisse sur l'ordinateur. En cas de panne d'un disque physique de la matrice, les
données de tous les disques ne sont plus accessibles étant donné que seules certaines
parties des données ont été enregistrées sur tous les disques.
RAID 0 est idéal pour les utilisateurs qui nécessitent une vitesse et une capacité
maximales. Les éditeurs de vidéo travaillant avec des fichiers très volumineux peuvent
utiliser RAID 0 lors de l'édition de plusieurs flux vidéo afin d'obtenir des performances de
lecture optimales. Une matrice RAID 0 convient plus à des personnes travaillant
3.3.2 RAID 1
3.3.2.1 Définition :
RAID1 est un mode RAID sûr qui nécessite au moins 2 disques et fonctionne avec des
paires de disques. Un volume logique apparaît sur l'ordinateur et la capacité disponible
combinée des deux disques est limitée à la capacité du disque de capacité inférieure. Si l'un
des deux disques tombe en panne, les données sont immédiatement disponibles sur l'autre
disque. Aucune donnée n'est perdue si l'un des deux disques tombe en panne
RAID 1 fournit une sécurité maximale des données en cas de panne d'un seul disque mais
Étant donné que les données sont enregistrées deux fois, les performances sont légèrement
Réduites lors de l'écriture. RAID 1 est un bon choix lorsque la sécurité est plus importante
que la vitesse.
DC et RODC
3.3.3 RAID 5
3.3.3.1 Définition
RAID 5 combine striping de RAID 0 et redondance des données dans une matrice avec un
minimum de trois disques. La différence entre RAID 3 et RAID 5 est que la configuration
RAID 3 offre de meilleures performances mais une capacité globale légèrement inférieure.
Les données sont en striping sur tous les disques et un bloc de parité (P) est enregistré sur
la même bande pour chaque bloc de données. Si l'un des deux disques tombe en panne, les
Données du disque défaillant peuvent être reconstruites sur un disque de remplacement.
Aucune donnée n'est perdue en cas de panne d'un seul disque, mais si un deuxième disque
tombe en panne avant que les données n'aient pu être reconstruites sur un disque de
remplacement, toutes les données de la matrice seront perdues.
RAID 5 combine sécurité des données et utilisation efficace de l'espace disque. La panne
d'un disque n'entraîne pas d'interruption de service car les données sont lues à partir de
blocs de parité. RAID 5 est utile pour l'archivage ainsi que pour les personnes qui
souhaitent un certain niveau de performance et ont besoin d'avoir constamment accès à
leurs données, par exemple les éditeurs vidéo.
DC et RODC
3.3.4 RAID 10
3.3.4.1 Définition
RAID 10 (également appelé RAID 1+0) est un autre niveau RAID qui combine les
attributs des autres niveaux, en particulier RAID 1 et RAID 0. Elle est une « bande
d'éléments en mirroring », ce qui signifie que les données sont en striping sur deux
matrices en mirroring. Le striping se produit entre deux matrices et le mirroring a lieu
sur la même matrice, ce qui rend la reconstruction extrêmement rapide. Le nombre de
disques des matrices RAID 10 doit être un multiple de quatre. Pour les produits LaCie
disposant de cinq disques, dans une matrice RAID 10, le cinquième disque sera un disque
de rechange ou sera inutilisé. Voir le schéma à droite. Dans une matrice RAID 10, un
disque de chaque paire en mirroring peut tomber en panne sans aucune perte de données.
Cependant, le disque qui fonctionne dans une matrice contenant un disque défaillant
devient un point faible pour la matrice toute entière. Si le deuxième disque d'une paire en
mirroring tombe en panne, la matrice toute entière est perdue
DC et RODC
RAID 10 fournit de bonnes vitesses en raison du striping de RAID 0 mais réduit de moitié
la capacité disponible d'un dispositif (en supposant que tous les disques dans la matrice
aient la même capacité)
Partie 3 :
temps, ainsi que les différents systèmes de sauvegarde permettant une persistance des
1.1 Définition :
Ici le type d'enregistrement est donc magnétique et se fait sur le disque métallique que
vous voyez sur la photo. Il peut y avoir plusieurs disques magnétiques en parallèle dans les
disques durs à grande capacité de stockage. Lorsque vous éteignez votre ordinateur ces
Le lecteur de disquettes permet d'enregistrer et de lire les informations sur une disquette.
Les disquettes ne peuvent d'habitude contenir que 1,44 mégaoctets. De plus ils ne sont pas
très fiables, leur temps de vie n'est généralement pas très élevé. Leur avantage est qu'ils
sont pratiques pour le transport de petites quantités d'informations.
Le lecteur CD-ROM permet de lire les informations sur un CD-ROM, ce qui peut
contenir environ 700 mégaoctets. Si c'est un graveur, il peut en outre enregistrer des
informations sur des CDs. La musique étant enregistrée sous forme de bits, celle-ci est
restituée par le lecteur qui envoie les bits à l'ordinateur et celui-ci transforme l'information
en impulsions électriques qui font vibrer les hauts parleurs.
DC et RODC
Le lecteur DVD est l'équivalent pour les images. L'acronyme DVD correspondait au départ
à Digital Vidéo Disc, puis à Digital Versatile Disc. Le mot Anglais "versatile" est un
exemple typique de faux ami qui veut dire que la chose a beaucoup d'utilités diverses ou
que la personne a des talents variés, alors qu'en Français cela qualifie une personne qui
change facilement d'opinion, lunatique... Un DVD peut contenir 133 minutes de film en
plus de l'enregistrement sonore.
2.1 Introduction :
Le stockage des données et leurs exploitations sont au cœur du système d’information
d’une entreprise. Pour cela différentes architectures sont possibles, mais quelles sont-elles
et laquelle choisir ?
Direct Attached Storage, ou comme son nom l’indique, méthode de connexion où la baie
de disque est directement connectée sur un serveur
2.3.2 NAS
Network Attached Storage, via cette méthode on distingue la connexion d’une baie de
stockage directement sur le réseau. Elle est alors accessible par tous les périphériques
connectés au même réseau sans devoir passer par un hôte intermédiaire.
DC et RODC
Storage Area Network, on reste sur les baies de stockage connectées au réseau, mais cette
fois ce réseau leur est dédié.
Dans les détails l’architecture de ces deux systèmes ne fonctionne pas de la même manière
:
NAS :
DC et RODC
L’intérêt de mettre en œuvre un SAN est d’obtenir un réseau dédié aux données à haut
débit, qui ne sera pas perturbé par les différents flux qui peuvent transiter sur un LAN
(Accès internet, Messagerie, Accès, NAS, VoIP, etc…).
Tout est fait dans un SAN pour optimiser les temps d’accès et de traitements aux données :
On peut ainsi stocker par le SAN les VMs de la solution de virtualisation, stocker les bases
de données, les bases mails…
Un réseau SAN est également idéal pour effectuer les sauvegardes des serveurs sur les
robots en un minimum de temps et sans perturbation sur le trafic du LAN.
DC Les
et RODC
réseaux cuivrés tendent à concurrencer le NAS en fibre optique, avec le 10Gbit/s
d’ores et déjà disponibles. Ainsi chez un constructeur comme NetApp, il est tout à fait
possible d’envisager le stockage des machines virtuelles d’un ESX sur un NAS NFS sans
pertes de performances par rapport à une architecture SAN.
– Simplicité d’administration :
– Coût amoindri par l’utilisation d’un réseau cuivré, plus courant que de la fibre optique
2.6 Conclusion :
Le SAN aurait tendance à reculer face aux réseaux cuivrés en 10 Gbit/s qui proposent des
débits et des performances équivalents. De plus les technologies tendent à évoluer dans ce
sens avec l’implémentation de protocole tel que le FCoE qui permet d’utiliser le protocole
Fibre Channel sur un réseau IP classique.
Cependant le SAN reste une architecture permettant d’isoler complètement son réseau de
données, et ainsi de garantir la performance des échanges. Cela peut avoir son importance
dans le système de sauvegarde notamment, en maitrisant au mieux le temps disponible lors
des fenêtres de sauvegarde.
DC et RODC
Partie 4 :
1) Introduction :
Le but de ce projet est de créer un serveur NAS ou pour faire plus simple, d’avoir un
Serveur qui met à disposition de toutes les machines sur le réseau l n’importe quel type de
fichiers, ainsi que les différents objets dedans le domaine d’étude.
Des distributions de NAS il en existe des tas, parmi les plus connues on trouve notamment
FreeNAS. La distribution sur laquelle portera ce projet s’appelle NAS4Free. FreeNAS est
maintenant exploité par une société commerciale et NAS4Free est la continuation du projet
initial. Ce qui m’a surtout fait pencher pour Nas4Free c’est que dans leurs dernières
versions réciproques Nas4Free est beaucoup moins gourmand en ressources machines.
3) Simulation du projet :
Il est peu gourmand en ressources, la machine que j’ai utilisée dispose d’un
CéléronD à 3Ghz et comme j’avais de la RAM sous la main je l’ai montée à 3 GO
de RAM ;
Il accepte tous les types de stockage sans broncher : j’ai pu lui coller un disque en
SATA, un en USB.
Pour faire l’installation nous allons choisir la dernière : Install/Upgrade NAS4Free from
LiveCD/LiveUSB
1. Mettre le système du NAS sur un disque dur ou sur une clé USB
2. Installer le système avec une partition de swap ou pas
Quelques éléments pour vous aider dans ces douloureux choix. Si vous choisissez un
disque dur ce disque ne pourra pas être utilisé pour stocker des données et il vous bouffera
un port SATA ou IDE.
Si vous choisissez une clé USB, le démarrage sera beaucoup plus lent. C’est même parce
que je trouvais le démarrage particulièrement lent que je suis passé au disque dur. Il faudra
Cette fenêtre demande la source d’installation et normalement c’est donc le CD ROM qui
est proposé. La fenêtre qui suit et qui est celle de destination est plus intéressante :
Dans ma copie d’écran je n’ai que 3 disques dur. Je dois donc choisir entre eux. A noter
pour les non linuxiens que si j’avais des périphériques USB ils apparaitraient comme DA0,
DA1, …
DC et RODC
Mais cette fois nous allons choisir de configurer le réseau. Ce sera donc le choix numéro 2
: Configure Network IP Adress. C’est du grand classique, dans un premier temps on
choisit si l’on veut du DHCP ou de l’adressage fixe.
Si l’on a choisi du fixe, il faudra configurer une adresse IP, un masque et éventuellement
une passerelle (si vous avez du routage à faire) et un DNS si vous avez besoin de résoudre
des noms de machine.
DC et RODC
Et voilà c’est fini ! Le serveur est maintenant installé. Vous pouvez ranger l’écran, le
clavier et la souris (qui d’ailleurs n’a servi à rien) et laisser le serveur tourner dans son
coin.
La suite va se passer sur la console web, c’est à dire depuis n’importe quelle machine du
réseau depuis un navigateur avec l’adresse IP que vous avez choisie. Exemple :
http://192.168.23.128/
DC et RODC
Dans cette fenêtre nous allons choisir Importer des disques afin que le système nous
indique les disques qui sont à sa disposition. Lorsqu’il a fini d’importer les disques la
fenêtre suivante (avec vos disques à vous) doit s’afficher :
Le point de montage est une notion qui est plus connue des utilisateurs barbus et sales du
monde Unix/Linux que des gens normaux qui utilisent Windows, regardent des matches de
foot et ne savent pas dire non à une jolie fille. Le point de montage est en fait un premier
répertoire à créer (ou plutôt à monter) sur un disque et à partir duquel seront accessibles
tous les fichiers et dossiers.
Pour créer ce point de montage, se rendre dans le menu Disques => Point de montage
Dans la fenêtre qui s’affiche cliquer sur + pour ajouter un point de montage.
DC et RODC
Sélectionner le disque.
Donner un nom au point de montage
Cliquer sur Ajouter
L’opération est à réaliser sur chacun des disques à utiliser. Lorsque tous les points de
montage ont été créés il reste à Appliquer les modifications en cliquant sur le bouton
éponyme.
Voilà une figure qui présente les points de montage crées le long de la réalisation de ce
projet :
DC et RODC
Cette image montre le logiciel utilisé pouvant de gérer et automatiser les différentes
sauvegardes.
L’image suivante illustre les médias qui vont être réservés pour contenir les sauvegardes
réalisées :
Figure 4-1-20 Les médias qui vont contenir les sauvegardes réalisées
Finalement voilà le résultat donné par ce logiciel qui nous facilite l’implémentation des
DC et RODC
stratégies :
V) Conclusion et perspectives
DC et RODC
VI) Références
DC et RODC