Vous êtes sur la page 1sur 45

Gestion des disques durs, Système de fichier, Tolérance de panne

GESTION DES DISQUE DUR, SYSTEME DE FICHIERS, TOLERANCE DE


PANNE

1. INTRODUCTION
Pourquoi un disque dur formaté par Windows NT ne peut pas toujours être relu par MS-
DOS ?

Pourquoi peut-on installer sur le même disque MS-DOS et Windows 95 alors que ce sont
deux systèmes d’exploitation à part entière ?

Auparavant un changement de système d'exploitation signifiait la perte des informations


stockées sur le disque dur. Maintenant dans certains cas (?) on peut garder ces
informations, pourquoi ?

Quand j'installe Windows NT (Workstation ou Server), la procédure me propose de


choisir entre une partition de type FAT, NTFS ou HPFS. Quand j'installe OS/2 Warp, la
procédure me propose de choisir entre une partition de type FAT ou HPFS. Laquelle
choisir ? et pourquoi ?

C'est à ce genre de question que va tenter de répondre ce document. Pour cela, il va partir
des systèmes d’exploitation les plus courants : MS-DOS, Windows NT (Workstation et
Server), Windows 95 et OS/2 Warp.

Dans un premier temps nous allons expliquer ce qu'est une partition et comment les
systèmes les gèrent. Puis nous allons aborder la notion de système de fichiers, c'est à dire
comment sont stockées les informations sur le disque dur, et détailler les systèmes les
plus courants (FAT, VFAT, NTFS et HPFS).

Pour terminer nous aborderons les fonctionnalités qu'offrent certains systèmes


d'exploitation pour pallier aux incidents inhérents aux disques durs : pertes de secteurs,
du disque complet ... Ces systèmes s'entendent avec une grosse capacité disque
(plusieurs disques) et un maximum de temps de marche et un minimum de temps
d'immobilisation en cas de panne sévère.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Disque Dur
1. Définition du disque dur.
Le disque dur est constitué de plusieurs plateaux de forme circulaire en aluminium ou en verre.
Contrairement aux disquettes, ces plateaux ne sont absolument pas flexibles, ce qui explique que
ce disque soit qualifié de dur. Les plateaux de la plupart des disques durs sont inamovibles, ce
qui explique qu'IBM appelle ces disques des disques durs fixes. II existe certes des disques durs
à plateaux amovibles (SYQUEST) mais leur taille n'est pas standard. Leur coût est de surcroît
plus élevé et ils posent des problèmes de fiabilité, ce qui justifie leur succès limité.

1.1 Densité en bits par pouce carré.


La densité en bits par pouce carré a été l'un des premiers indicateurs de performance utilisés
par les fabricants de disques durs. La densité en bits par pouce carré correspond au produit
du nombre de bits linéaires par pouce mesurés le long des pistes concentriques du disque dur
et du nombre de pistes par pouce mesuré sur le rayon du disque.

Ce résultat est exprimé en Megabits par pouce carré et sert à mesurer l'efficacité de la
technologie d'enregistrement utilisée par les disques durs.
Les disques durs haut de gamme actuels enregistrent à une densité de 160 Megabits par pouce
carré. Certains fabricants ont mis au point des prototypes de disques durs enregistrant à une
densité pouvant atteindre plusieurs Gigabits par pouce carré et permettant de stocker plus de
2 Go de données sur un seul plateau de disque dur.

La densité en bits par pouce carré (et par conséquent la capacité) des disques durs double
tous les deux ou trois ans environ et il est probable que d'ici à l'an 2000, les disques durs
enregistreront à une densité d'au moins 10 Gigabits par pouce carré, ce qui correspondra à
une capacité de stockage de données d'environ 20 Go sur un seul plateau de 2"1/2 pouces,
l'ensemble du disque dur tenant dans la paume de la main.

De nouveaux supports magnétiques et de nouvelle têtes (plateaux de céramique ou de verre,


les têtes magnétorésistantes, dispositifs électroniques à probabilité maximale de réponse
partielle, etc.) utilisent de nouveaux procédés technologiques sont actuellement à l'étude pour
permettre d'obtenir des densités de cet ordre.

Le principal obstacle que les fabricants doivent franchir pour produire des disques durs
enregistrant à une densité aussi élevée est de concevoir des têtes et des plateaux capables de
travailler avec des tolérances plus réduites. II semble incroyable que les progrès
technologiques réalisés en informatique permettent à la capacité de stockage des disques durs
de doubler tous les deux ou trois ans et l'on ne peut à cet égard que souhaiter qu'il en aille de
même dans les autres secteurs d'activité.
Gestion des disques durs, Système de fichier, Tolérance de panne

2. La structure physique du disque dur.

2.1 Division physique sur la surface du disque dur.


Comme les disquettes, les disques durs doivent être formatés avant que le système
d'exploitation puisse commencer à y écrire des données. Mais les disques durs subissent deux
formatages: l'un physique et l'autre logique.

Au cours de cette préparation physique de la surface magnétique du disque, tous les plateaux
du lecteur reçoivent des éléments de structure. Le principe de cette structure n'est pas le
même pour tous les disques durs. Plus les disques sont compacts et performants, plus la
subdivision des plateaux doit être fine et dense.

2.2 Le principe CHS.


Au départ, la structure des disques durs est analogue à celle des disquettes. Dans le cas des
disques durs, il s'agit de pistes, en fait des cercles concentriques. Ces pistes sont réparties de
manière homogène sur tous les plateaux du disque. Une même piste s'étend sur l'ensemble
des plateaux. Vous pouvez aussi vous représenter cette division sous la forme de corps
cylindriques emboîtés, constitués par les pistes situées l'une au-dessus de l'autre dans la pile
des disques. Le nombre de cylindres fréquemment évoqué correspond en fait au nombre de
pistes.

Les pistes sont ensuite elles-mêmes divisées en secteurs . De cette manière, il est possible
d'identifier sans ambiguïté une zone particulière du disque dur. Voici un exemple d'adresse
possible: "cylindre (piste) 6, disque 2 face inférieure, secteur 8". Cela permet de définir un
emplacement particulier à l'intérieur de la structure décrite.Le nombre de pistes/cylindres est
défini lors de la fabrication; de même, le nombre de faces de disques et de têtes est déterminé
physiquement. Quant au nombre de secteurs résultant du formatage physique, il dépend
essentiellement de la procédure d'inscription et donc de la densité de données que le disque
dur est capable de recevoir. Il est clair que la qualité de la couche magnétique joue également
un rôle dans ce contexte. C'est pourquoi on parle souvent de paramètres physiques.

Ces paramètres regroupent les cylindres (Cylinder), les têtes (Heads) et les secteurs (Sectors),
abrégé en CHS.C'est avec ces paramètres physiques que l'on déclare un disque dur dans le
setup du BIOS. Si l'on connaît la taille d'un secteur - elle est en général de 512 Ko - on peut
également calculer la capacité totale du disque. C'est possible avec les anciens disques durs
mais plus avec les nouveaux qui structurent la surface disponible de manière plus astucieuse.

2.3 Zone-Bit-Recording.
Faites-vous encore une fois une représentation mentale de cette subdivision physique du
disque dur en cylindres et en secteurs. L'image d'un fond de tarte garni de cerises disposées
en cercles concentriques correspond bien à cette structure. En marquant 17 parts de taille
Gestion des disques dur, Système de fichiers, Tolérance de panne

égale sur cette tarte, selon la façon habituelle de découper des tartes, vous obtenez la structure
typique d'un lecteur MFM avec 17 secteurs. On observe sans difficulté que les secteurs situés
à l'extérieur de chaque part contiennent nettement plus de cerises que ceux qui se trouvent
vers l'intérieur. Sur un disque dur formaté d'après le principe CHS, tous les cylindres ont le
même nombre de secteurs, qu'ils soient situés à l'extérieur ou à l'intérieur. On gaspille ainsi
énormément de place sur les pistes externes. Pour éviter ce gaspillage, on utilise le "zone-
bit-recording" (ZBR), un procédé qui subdivise les faces en plusieurs zones (par exemple
extérieure, médiane, intérieure). En fonction de la place disponible, chaque zone est dotée
d'un nombre adéquat de secteurs. Ainsi, sur le cylindre intérieur, nous trouverons par
exemple 44 secteurs alors que le cylindre extérieur en contiendra 112. Les performances du
système sont fonction du nombre de zones définies. Dans les systèmes actuels, chaque piste
est affectée du nombre maximum de secteurs. Le problème est que ce type de disque dur
n'est plus compatible avec le mode CHS du BIOS-SETUP. C'est pourquoi il a d'abord été
appliqué aux disques SCSI qui n'ont pas à être connus du BIOS. Puis il s'est progressivement
étendu au bus AT et déclaré au BIOS par une petite astuce: les paramètres de translation. Le
principe consiste à leurrer le BIOS en lui faisant croire à un disque dur CHS, le disque se
chargeant lui-même de la conversion en Zone-Bit.

3. Structure logique du disque dur.

Le système d'exploitation utilise une structure logique du disque sur la base de la structure
physique précédemment décrite. Le programme FDISK permet de diviser le disque dur en unités
logiques ou disques logiques.

Les versions anciennes de DOS (avant 3.3) ne pouvaient gérer que 32 Mo dans une même
partition. Les disques durs de capacité plus importante devaient par conséquent être subdivisés
en plusieurs lecteurs logiques. Même si l'on ne possédait qu'un seul disque dur physiquement
parlant, on pouvait accéder à plusieurs lecteurs (C:, D:, etc.).

Depuis la version 4.0 du DOS, les disques durs d'une capacité de 2 Go peuvent être gérés sous
la forme d'une seule partition, c'est-à-dire d'un seul disque logique (C:). Du fait justement de ces
grandes capacités, il est souvent nécessaire de subdiviser le disque dur en plusieurs lecteurs
logiques. Avec les versions actuelles de DOS, ainsi qu'avec Windows 95, il est possible
d'installer plusieurs disques logiques sur un même disque dur. Malheureusement, une des
contraintes de FDISK n'est pas encore levée: les disques durs déclarés dans le BIOS selon le
principe CHS n'acceptent comme taille maximale que 504 Mo. Les disques d'une capacité
supérieure sont ramenés à cette valeur. DOS et Windows 95 ne savent gérer en guise de nombre
de cylindres, de têtes et de secteurs que les valeurs maximales 1024, 16 et 63.Avec une capacité
par secteur de 512 octets, le calcul de capacité aboutit à :

512 * 1024 * 16 * 63 = 528 482 304 octets soit 504 Mo


Gestion des disques durs, Système de fichier, Tolérance de panne

Ceci est le maximum, il n'y a pas moyen d'aller au-delà et tout ce qui dépasse est
invariablement tronqué.

En ce qui concerne les disques plus grands, la seule solution est de les piloter comme
périphérique de bloc ou "Block Device". Dans ce cas, les entrées de BIOS n'interviennent pas,
le disque dur et sa capacité sont déclarés au système par une autre instance.

Sur la base de la première répartition en disques DOS logiques, le système d'exploitation effectue
ensuite une structuration logique à l'intérieur de chacun des disques. Cette structure est réalisée
à l'aide de la commande FORMAT du DOS.Le DOS divise chaque disque logique en unités
d'allocation. Ces unités d'allocation, également appelées "clusters ", représentent la plus petite
unité du disque dur accessible au système d'exploitation. Chaque disque logique contient une
table d'allocation des fichiers (FAT = File Allocation Table). Chaque fichier créé sur le disque
dur est affecté à l'une au moins de ces unités d'allocation. Ce procédé permet de reconstituer, par
exemple, un fichier volumineux dont les blocs de données sont dispersés sur l'ensemble du
disque. Les fichiers correspondent à chaque unité d'allocation sont répertoriés dans la FAT.A
partir de la version 5.0 de DOS, les disques logiques sont gérés par l'intermédiaire d'une FAT à
16 bits. Cela signifie que chaque FAT peut gérer au maximum 2 puissance 16 soit 65536
entrées ou unités d'allocation communément appelée cluster.

FAT 16 bits FAT 32 bits

Nombre d'unités 216 = 65536 232 = 4 294 967


d'allocation entrées 296 entrées

Capacité avec un cluster 2 147 483 648 131 072 Go = 128


de 32768 octets octets = 2 Go To (Teraoctet)

La définition de la taille des unités d'allocation va de pair avec la définition de la taille du


disque logique. La plus petite unité d'allocation possible sous DOS 5.0 correspond à un espace
de stockage de 2048 octets. A partir d'une taille de disque égale ou supérieure à 128 Mo (
Méga Octect ), la table d'allocation des fichiers ne pourrait plus gérer cette taille de clusters.

Rappel : 1 Téra octect = 1 To = 1024 Go = 1 048 576 Mo

Taille d'une Taille minimale Taille d'une


partition en FAT 16 d'un cluster partition en FAT 32

128 Mo 2 048 octets 8 To

256 Mo 4 096 octets 16 To

512 Mo 8 192 octets 32 To

1 024 Mo 16 384 octets 65 To

2 048 Mo 32 768 octets 128 To


Gestion des disques dur, Système de fichiers, Tolérance de panne

Le DOS effectue une régulation automatique de ces rapports lors du formatage. Puisque
chaque fichier, indépendamment de sa taille, reçoit une unité d'allocation, cela veut dire que les
fichiers ayant une taille inférieure à 4 096 octets occuperont sur le disque effectivement 4096
octets. Un fichier AUTOEXEC.BAT de 250 octets occupe ainsi un espace 16 fois plus grand
qu'il ne devrait. Il est évident que l'on gaspille ainsi beaucoup de place dans le cas de petits
fichiers.

C'est d'autant plus vrai que les unités d'allocation sont plus grandes. Il est donc préférable de
diviser les gros disques durs en plusieurs lecteurs logiques.

4. Fonctionnement du disque dur.

Le principe de fonctionnement physique de base du disque dur est semblable à celui d'un lecteur
de disquettes: il utilise des disques rotatifs et des têtes qui se déplacent au-dessus des disques et
permettent de stocker des données sur des pistes et des secteurs. Les disques durs fonctionnent
toutefois à maints égards différemment des lecteurs de disquettes.

Les disques durs sont généralement constitués de plusieurs plateaux, chacun comptant deux faces
pouvant stocker des données. Ces plateaux sont le plus souvent au nombre de deux ou de trois,
soit un nombre total de 4 ou 6 faces sachant que certains disques peuvent compter jusqu'à 11
plateaux, voire davantage.

Les pistes situées au même endroit sur chaque face de chaque plateau constituent un cylindre.
Le disque dur compte une tête par face de plateau et toutes ces têtes sont montées sur un même
dispositif mobile: le support de tête. Toutes les tête se déplacent simultanément sur le disque
puisqu'elles sont fixées sur le même support.

Les disques durs fonctionnent beaucoup plus rapidement que les lecteurs de disquettes. Ils
tournaient à l'origine à une vitesse de 3 600 tr/min, soit environ 10 fois plus rapidement que les
lecteurs de disquettes, ce qui était encore récemment la vitesse de la plupart des disques durs.

Aujourd'hui, toutefois, ils tournent généralement à une vitesse sensiblement plus élevée qui peut
atteindre 3 600, 4 400, 5 400, 6 400, 7200 et même 10 000 tr/min ( avec le Seagate Cheetah 4
LP ).

Leur vitesse de rotation élevée, la rapidité de leur mécanisme de positionnement des têtes et leur
nombre de secteurs par piste plus élevé leur permettent de stocker et de retrouver plus rapidement
les données que les lecteurs de disquettes. Ce sont également ces paramètres qui font qu'un
Gestion des disques durs, Système de fichier, Tolérance de panne

disque dur est plus rapide qu'un autre.Les têtes de la plupart des disques durs ne touchent pas (et
ne doivent pas toucher ! ) les plateaux lorsque ceux-ci fonctionnent en mode normal. Lorsque le
disque n'est pas sous tension, toutefois, elles se posent dessus dès que les plateaux s'arrêtent de
tourner. Lorsque le disque dur est sous tension, un coussin d'air très fin maintient chaque tête à
une distance infime en dessous ou au-dessus des plateaux. Si ce coussin d'air est interrompu par
une particule de poussière ou un choc, les têtes risquent d'entrer en contact avec les plateaux
alors qu'ils tournent à pleine vitesse.

Lorsque ce contact est suffisamment violent pour endommager le disque dur, il se produit un
écrasement de tête ce qui peut provoquer la perte de quelques octets de données, voire la
destruction totale du disque dur. La plupart des plateaux de disques durs sont dotés d'une couche
de lubrifiant et de surfaces renforcées qui leur permettent de résister aux "décollages" et aux
"atterrissages" des têtes ainsi qu'à un certain nombre d'incidents.Les plateaux étant scellés et
inamovibles, la densité des pistes peut être très élevée. Les plateaux de la plupart des disques
comptent 3 000 pistes par pouce, voire davantage.

Le module d'assemblage des têtes de disque, qui contient les plateaux, est assemblé et scellé à
l'abri de la poussière et dans des conditions de propreté absolues. Les sociétés qui assurent la
réparation ou le remplacement des modules d'assemblage de têtes de disque étant peu
nombreuses, ce type d'intervention peut se révéler très coûteux.

Tout disque dur finit par tomber en panne mais la question est bien entendu de savoir quand la
date fatidique arrivera et si les données sont sauvegardées sur un support externe.Beaucoup
d'utilisateurs de PC pensent que le disque dur est un périphérique fragile et de fait, il est
généralement l'élément le plus fragile d'un ordinateur. Il est toutefois intéressant de savoir que
des techniciens en informatique en cours de formation laissent des disques durs tourner sans
couvercle pendant plusieurs jours et même qu'ils ôtent et remettent en place ce couvercle pendant
qu'ils fonctionnent, et que ces disques durs demeurent parfaitement capables de stocker des
données, que leur couvercle soit ouvert ou fermé.

II est bien entendu déconseillé de procéder à pareille expérience et ces techniciens ne prendraient
eux-mêmes pas le risque d'agir ainsi avec des disques durs de grande capacité et par conséquent
coûteux.

5. Les secteurs.
Une piste est trop importante pour permettre de stocker convenablement des données à elle seule.
Beaucoup de pistes de disques ont une capacité de stockage de 50 000 octets, voire davantage.
C'est pour cette raison quelles sont divisées en plusieurs sous-unités de stockage numérotées
appelées secteurs. Ces secteurs représentent des portions de piste.Les différents types de disques
durs et de disquettes donnent lieu à des découpages en secteurs différents selon la densité des
pistes.

Ainsi les différents formats de disquettes peuvent utiliser des densités de 8 à 36 secteurs par piste
tandis que les disques durs utilisent une densité de stockage de données plus élevée pouvant
varier de 17 à 100 secteurs par piste, voire davantage.

Les secteurs créés par la procédure de formatage standard d'un PC ont une capacité de 512 octets
mais cette capacité risque d'être appelée à changer à l'avenir.Les secteurs de chaque piste sont
Gestion des disques dur, Système de fichiers, Tolérance de panne

numérotés en commençant à partir de 1, contrairement aux têtes et cylindres qui sont numérotés
en commençant à partir de 0. Ainsi une disquette contient 80 cylindres numérotés de 0 à 79 et
deux têtes portent les numéros 0 et l, tandis que chaque piste de chaque cylindre comporte 18
secteurs numérotés de 1 à 18.Lorsqu'un disque dur est formaté, des zones supplémentaires sont
créées pour permettre au contrôleur de gérer la numérotation des secteurs et d'identifier le début
et la fin de chaque secteur. Ces zones précèdent et suivent la zone de données de chaque secteur
et correspondent à la différence existant entre la capacité d'un disque non formaté et sa capacité
une fois formaté.

Ainsi une disquette de 4 Mo (3 1/2 pouces) a une capacité de 2,88 Mo une fois formatée,tandis
qu'un disque dur d'une capacité de 38 Mo a une capacité de 32 Mo une fois formaté.

Tous les disques dur utilisent une partie de l'espace réservé pour gérer les données qu'ils sont
capables de stocker.Bien qu'il ai été dit que chaque secteur de disque dur a une taille de 512
octets, ce n'est pas exact d'un point de vue technique. Chaque secteur permet effectivement de
stocker 512 octets de données mais la zone de données ne constitue qu'une portion du secteur.

Chaque secteur de disque dur occupe en fait 571 octets sur le disque, dont 512 sont utilisables
par l'utilisateur pour stocker des données. Le nombre réel d'octets requis pour le préfixe et pour
le suffixe du secteur peut varier selon les disques durs mais ces valeurs donnent une idée de la
façon dont les secteurs sont constitués.

Pour utiliser une image concrète, chaque secteur peut être comparé à une page de livre :
Dans un livre, chaque page contient du texte mais toute la page n'est pas recouverte de texte.
En effet, chaque page comporte un bas et un haut de page, ainsi que des marges à gauche et
à droite.

Les informations telles que les titres de chapitre (nombre de pilote et de cylindres) sont
placées dans les marges.

Les zones de "marges" du secteur sont délimitées et remplies durant la phase de formatage
du disque. Le formatage remplit également la zone de données de chaque secteur à l'aide de
données choisies de manière aléatoire. Une fois le formatage effectué, le disque peut modifier
cette zone de donnée et écrire normalement. Les informations du préfixe et du suffixe de
chaque secteur ne peuvent en revanche être modifiées que lors d'un nouveau formatage et
non en fonctionnement normal.

Chaque secteur est défini par :

Une zone de préfixe, qui détermine :

- le début du secteur ainsi que


- son numéro

Une zone de suffixe, qui contient

- une somme de contrôle appelée CRC ( Cyclical Redundancy Check ) qui a pour rôle
de garantir l'intégrité des données stockées. C'est la fonction INT 13h - 04h qui réalise
ce contrôle.
Gestion des disques durs, Système de fichier, Tolérance de panne

Le calcul se fait à l'aide du polynôme suivant :

CRC = x16 + x15 + x2 + 1

Il existe une autre variante de ce polynôme fournit par le CCITT :

CRC = x16 + x12 + x5 + 1

Chaque secteur contient également 512 octets de données.

Les octets de données sont en principe placés à une valeur spécifique telle que F6h (en
hexadécimal) lors du formatage physique (ou formatage de bas niveau) du disque. (Pour plus
d'informations sur le formatage de bas niveau, reportez-vous au chapitre suivant). Très souvent,
le formatage de bas niveau définit également une structure d'octets considérés comme difficiles
à enregistrer de façon à éliminer tout secteur défectueux. Des espaces sont ménagés à l'intérieur
des secteurs mais aussi entre les secteurs et les pistes. Ils ne peuvent pas être utilisés pour stocker
des données. Le préfixe, le suffixe et ces espaces représentent donc l'espace perdu qui correspond
à la différence entre la capacité avant formatage d'un disque et sa capacité après formatage.

6. Formatage du disque.
II existe en principe deux types de formatage. Le formatage:

 physique, ou de bas niveau,


 logique, ou de haut niveau.
Lorsque vous formatez une disquette à l'aide de la commande FORMAT de DOS, cette
commande effectue ces deux types de formatage simultanément. Pour formater un disque dur,
en revanche, vous devez effectuer chaque formatage séparément.

Vous devrez de surcroît procéder à une troisième manœuvre entre chaque formatage, durant
laquelle les informations sur le partitionnement seront écrites sur le disque.

Vous devez partitionner le disque dur lorsque vous souhaitez l'utiliser avec plusieurs systèmes
d'exploitation. En séparant les formats physiques d'une manière identique à chaque fois,
indépendamment du système d'exploitation utilisé et du formatage de haut niveau (qui serait
différent pour chaque système d'exploitation), vous pourrez utiliser plusieurs systèmes
d'exploitation sur un seul et même disque dur.

Le partitionnement permet en effet à plusieurs types de systèmes d'exploitation d'utiliser le même


disque dur ou à un seul et même système d'exploitation DOS d'utiliser ce disque sous forme de
plusieurs volumes ou lecteurs logiques. Un volume ou lecteur logique est un élément auquel
DOS attribue une lettre.Le formatage s'effectue en trois étapes:

 Formatage de bas niveau


 Partitionnement
 Formatage de haut niveau
Gestion des disques dur, Système de fichiers, Tolérance de panne

6.1 Formatage de bas niveau.


Durant le formatage de bas niveau, les pistes du disque sont divisées en un nombre donné de
secteurs. Le préfixe et le suffixe de chaque secteur est enregistré, de même que les écarts
d'intersection et les écarts entre les pistes.

La zone de données de chaque secteur contient une valeur d'octet factice ou un modèle de
test de valeurs. Sur les disquettes, le nombre de secteurs enregistrés sur chaque piste dépend
du type de disquette et de lecteur. Sur les disques durs, le nombre de secteurs par piste dépend
du disque dur et de l'interface contrôleur. Le contrôleur original ST-506/412 MFM disposait
toujours de 17 secteurs par piste sur un disque.

Les contrôleurs ST-506/412 qui utilisent le système de codage RLL (Run Lenght Limited)
permettent de porter ce nombre à 25 ou 26.

 Les disques durs ESDI peuvent compter 32 secteurs par piste, voire davantage.
 Les disques durs IDE sont tout simplement des disques avec contrôleur intégré et
selon le type de ce contrôleur, le nombre de secteurs par piste peut varier de 17 à
100, voire davantage.
 Les disques durs SCSI sont des disques IDE auxquels ont été ajoutés des circuits
adaptateurs de bus SCSI. Ils possèdent par conséquent également une forme de
contrôleur intégré. Leur nombre de secteurs par piste dépend, comme dans le cas
des disques IDE, du type de contrôleur utilisé.
La quasi-totalité des disques durs IDE et SCSI utilisent une technique appelée
"enregistrement par zone", qui écrit un nombre variable de secteurs par piste. Les pistes
situées à la périphérie contiennent davantage de secteurs que celles situées à l'intérieur car
elles sont plus longues. Du fait des limites du BIOS des PC, ces disques durs doivent
néanmoins se comporter comme s'ils avaient un nombre fixe de secteurs par piste.

L'ordinateur utilise des algorithmes de conversion contenus dans le contrôleur.

6.2 Enregistrement par zone.


Pour accroître la capacité d'un disque dur, il est possible de formater davantage de secteurs
sur les cylindres situés près du bord extérieur que sur les cylindres situés à l'intérieur.

Les cylindres extérieurs ayant une circonférence plus importante, ils peuvent contenir
davantage de données. Les lecteurs qui n'utilisent pas l'enregistrement par zone stockent la
même quantité de données sur chaque cylindre bien que les cylindres extérieurs puissent être
deux fois plus longs que les cylindres intérieurs.

II s'ensuit un gaspillage d'espace de stockage puisque la surface enregistrable du disque doit


être capable d'assurer un stockage fiable sur la base de la densité permise par les cylindres
situés vers le centre.
Gestion des disques durs, Système de fichier, Tolérance de panne

Sur les disques durs ST-506/412 et ESDI le nombre de secteurs par piste était
malheureusement fixe et la capacité des lecteurs était par conséquent limitée par la capacité
de densité de la piste située la plus à l'intérieur (et par conséquent la plus courte).

L'enregistrement par zone découpe les cylindres en groupes qui portent le nom de zones,
le nombre de secteurs des pistes successives étant de plus en plus important au fur et à mesure
que l'on s'éloigne du centre pour se rapprocher de la périphérie. Tous les cylindres d'une zone
donnée comptent le même nombre de secteurs par piste et le nombre de zones varie selon le
type de disque, mais la plupart des disques comportent au moins dix zones.

L'enregistrement par zone permet également d'accroître de manière plus ou moins sensible
la vitesse de transfert selon les données contenues par les zones puisque le disque dur
comporte davantage de secteurs à la périphérie et que sa vitesse de rotation demeure
identique. Les disques durs pourvus d'un contrôleur séparé ne pouvaient utiliser
l'enregistrement par zone car il n'existait pas de moyen de communication standard
permettant au disque dur de transmettre au contrôleur les informations relatives aux zones.

Avec l'apparition des disques SCSI et IDE, il est devenu possible de formater chaque piste
avec des numéros de secteurs différents puisque ces disques comportent un contrôleur intégré
qui leur permet de connaître parfaitement les différents types de zones utilisées.

Le contrôleur intégré doit ensuite convertir les numéros de cylindres, de têtes et de secteurs
physiques en nombres de cylindres, de têtes et de secteurs logiques pour que le disque donne
l'impression de comporter le même nombre de secteurs par piste sur toute sa surface.

Le BIOS du PC ne peut en effet traiter qu'un seul nombre de secteurs spécifiques par piste
pour l ‘ensemble du disque dur et les disques durs qui utilisent l'enregistrement par zone
doivent par conséquent être placés sous le contrôle de ce mode de conversion de secteurs.

L'enregistrement par zone a permis aux fabricants d'accroître la capacité des disques durs
de 20 à 50 % par rapport au mode d'enregistrement qui repose sur un nombre de secteurs
par piste fixe.

6.3 Partitionnement d'un disque.


Il permet de diviser le disque dur en plusieurs zones appelées partitions pouvant chacune
contenir leur propre système d'exploitation. Les systèmes d'exploitation actuels utilisent trois
types de systèmes de fichiers:

6.3.1 La FAT.
La FAT (File Allocation Table) est un système de fichiers utilisé par DOS, OS/2,
Windows 3.x et 95 et NT. La table d'allocation des fichiers est une structure contenant la
liste des clusters utilisés et non utilisés. Elle contient également l'adresse des fichiers
utilisés, c'est à dire le numéro du premier cluster qu'ils utilisent. Cette table est dupliquée
afin de protéger les données.

La structure d'un volume est constituée :


Gestion des disques dur, Système de fichiers, Tolérance de panne

D'un secteur de boot aussi appelé Master Boot Record ( MBR) contenant la
structure de l'unité physique. C'est à dire le nombre de partition, leur taille, leur
type (principale ou étendue) et le nombre d'unités logiques avec leur taille.

La première table d'allocation de fichier.

Une ou plusieurs copies de la table d'allocation de fichier.

Le répertoire racine avec le nom de volume.

La zone de données pour les fichiers et les sous répertoires.

Lorsque l'on crée un fichier ou un sous répertoire, les informations relatives à cette
création sont stockées dans le répertoire racine sous la forme d'une structure contenant le
nom et la taille du fichier, la date et l'heure de sa dernière modification, le numéro de
cluster de départ et l'attribut ( Archive, Caché, Système ...)

Les segments de la FAT acceptent des noms de fichiers pouvant comprendre jusqu'à 11
caractères (8 caractères pour le nom plus 3 caractères pour l'extension). Cette FAT dit
FAT 16 bits ne permet d'adresser qu'un volume de 2 Go au maximum ( 216 * 32768 ).

Microsoft, avec la dernière version de Windows 95 4.0.0.1111 a développé une FAT 32


bits qui permet théoriquement de gérer au maximum des partitions de 128 To et
d'autoriser des noms de fichiers de 256 caractères. Voir le chapitre 3 pour plus de détails.

6.3.2 Le HPFS.
Le HPFS (High Performance File System) est un système de fichiers comparable à celui
d'UNIX. C'est le système de fichier utilisé par OS/2. Il est également supporté par les
premières versions de Windows NT. Les applications DOS fonctionnant sous OS/2 ou
Windows NT peuvent accéder aux fichiers des segments HPFS, ce qui n'est pas possible
directement depuis DOS. La longueur des noms de fichiers peut atteindre 256 caractères
et la taille de chaque volume peut atteindre 8 Go.

Contrairement au système FAT, le HPFS trie les répertoires sur la base des noms de
fichier et utilise une structure plus efficace pour organiser les répertoires. L'accès au
fichier est plus rapide qu'en FAT.

Contrairement a la FAT, HPFS n'utilise pas de cluster. Son unité de base est un secteur
de 512 Ko. Les données sont organisées sous la forme de volume d'une taille de 8 Mo
séparés par 4 secteurs. Ce qui permet à la tête de lecture de se positionner plus
rapidement. En effet sa référence est la bande courante et non la piste 0.

6.3.3 Le NTFS.
Le NTFS (New Technologie File Système) est un système de fichiers comparable à celui
d'UNIX. Il n'est accessible que sous Windows NT, mais Microsoft devrait prochainement
sortir des pilotes permettant d'accéder au NTFS depuis OS/2.
Gestion des disques durs, Système de fichier, Tolérance de panne

DOS ne peut pas accéder à NTFS, contrairement aux applications DOS qui fonctionnent
sous Windows NT. La longueur des noms de fichiers peut atteindre 256 caractères et la
taille maximale d'un volume est de 16 Eo ( Exa-Octect = 1 073 741 824 Go ). La partition
système est cependant limitée entre 2 Go et 4 Go avec des Compaq.

NTFS utilise une grande quantité d'espace pour stocker les structures du système. Il est
donc conseillé de ne l'utiliser qu'avec des volumes supérieurs à 400 Mo. NTFS dispose
d'une table des fichiers la MFT ( Master File Table ). NTFS stocke plusieurs copie des
parties critique de cette table, ce qui permet de récupérer facilement des données.

NTFS utilise des clusters pour stoker ses données. Mais contrairement à la FAT la taille
des clusters n'est pas liée à celle du volume et peut être inférieur à la taille d'un seteur
(512 Ko). On a donc une faible fragmentation des fichiers. Par contre lorsque les clusters
ne sont pas contigus on a une légère réduction des performances par rapport à la FAT.
En contrepartie de cette légère baisse de performence, NTFS peut gérer la réparation
automatique des secteurs défectueux. En effet dès qu'ils sont détecté et signalés, NTFS
les supprimes de la liste des secteurs utilisables par le système.

Il se peut que les fonctions du NTFS soient intégrées, à l'avenir, à Windows 95.

Il existe d'autres type de partition comme celles de NetWare de Linux Ext2 et celle
d'UNIX

De ces trois systèmes de fichiers, le système FAT est de loin le plus répandu (et le plus
recommandé). Le principal problème posé par le système de fichiers FAT est que l'espace
du disque est utilisé sous forme de groupes de secteurs appelés unités d'allocation ou clusters.
Sur les volumes importants, la taille la plus importante nécessaire pour les clusters provoque
une mauvaise utilisation de l'espace disque.

Le HPFS et le NTFS organisent toujours l'espace disque sous forme d'incréments de secteurs
et ils n'entraînent par conséquent pas de gaspillage d'espace lorsque les volumes sont
importants.Le système de fichiers FAT est le plus recommandé pour des raisons de
compatibilité. Ainsi existe-t-il actuellement très peu d'applications compatibles avec les
noms de fichiers longs possibles sous les systèmes de fichiers HPFS et NTFS. Tous les
systèmes d'exploitation sont capables d'accéder aux volumes du système de fichiers FAT.

Les structures de fichiers et les procédures de récupération de données sont par ailleurs très
connues. Sous les systèmes HPFS et NTFS, il peut être difficile, voire impossible de
récupérer les données, et il est alors impératif de disposer de sauvegardes sur support externe
fiables. Durant le partitionnement, et ceci quel que soit le type de système de fichiers utilisé,
le logiciel de partitionnement écrit un programme de démarrage spécial et une table de
partition sur le premier secteur, appelé indifféremment "secteur amorce de partition
principale" (MBS) ou "enregistrement amorce de partition principale" ( MBR = Master Boot
Record ).

6.4 Formatage de haut niveau.


Durant le formatage de haut niveau, le système d'exploitation (DOS, OS/2 ou Windows NT)
écrit les structures nécessaires pour gérer les fichiers et les données.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Les partitions du système de fichiers FAT comportent un secteur amorce de volume (VBS),
une table d'allocation des fichiers (FAT) ainsi qu'un répertoire racine pour chaque lecteur
logique.

Ces structures de données permettent au système d'exploitation de gérer l'espace du disque


et de cartographier l'emplacement des fichiers. Ils peuvent même gérer les zones
défectueuses de façon à ce qu'elles ne provoquent pas de problèmes.

Le formatage de haut niveau n'est pas un véritable formatage. II correspond à la création


d'une table des matières du disque. Lors d'un formatage de bas niveau, qui correspond au
mode de formatage réel, les pistes et les secteurs sont écrits sur le disque.

Comme cela a été mentionné précédemment, la commande FORMAT de DOS peut effectuer
tant un formatage de bas niveau qu'un formatage de haut niveau lorsqu'elle s'applique à une
disquette mais elle ne permet d'effectuer qu'un formatage de haut niveau sur un disque dur.

Pour effectuer un formatage de bas niveau sur un disque dur, vous aurez besoin d'un utilitaire
généralement fourni par le fabricant du contrôleur de disque.

7. Capacité d'un disque dur.

Quatre critères paramètres peuvent être utilisés pour mesurer la capacité d'un disque dur:

avant formatage en millions d'octets (Mo),

après formatage en millions d'octets (Mo),

avant formatage en Mega-octets (Meg ou Mo),

après formatage en Mega-octets (Meg ou Mo)

La plupart des fabricants de disques IDE et SCSI n'indiquent plus aujourd'hui que la capacité
après formatage de leurs disques puisqu'ils les livrent préformatés.

Les publicités utilisent en revanche généralement la capacité avant ou après formatage exprimée
en millions d'octets (Mo) car elle permet d'afficher des valeurs supérieures aux capacités
exprimées en Mega-octets (Meg ou Mo).

Cette ambiguïté est souvent source d'interrogations pour l'utilisateur lorsqu'il utilise le
programme FDISK (qui indique la capacité totale du disque, exprimée en Mega-octets) puisqu'il
se demande ce que les octets manquants sont devenus. La réponse est très simple. Elle repose
sur quelques formules mathématiques.
Gestion des disques durs, Système de fichier, Tolérance de panne

Le problème peut se résumer par une question du type: "Je viens d'installer sur mon ordinateur
un disque dur Western Digital AC2200 pour lequel le vendeur m'a indiqué une capacité de 212
Mo. Lorsque j'ai entré ses paramètres dans le Bios (989 cylindres, 12 têtes et 35 secteurs par
piste), la routine de Setup du BIOS et le programme FDISK de DOS m'ont indiqué que la
capacité de mon disque n'était que de 203 Mo! Ou sont passés les 9 Mo manquants ? "

Il suffit de quelques calculs pour connaître la réponse à cette question. En multipliant les
paramètres du disque, on obtient en effet le résultat suivant: Cylindres: 989 Têtes: 12 Secteurs
par piste: 35 Octets par secteur: 512 Nombre total d'octets: 212,67 Mo Nombre total de Mega-
octets: 202,82 MegLa capacité de ce disque dur est donc de 212,67 Mo (millions d'octets) ou
202,82 Meg.

Les fabricants indiquent généralement la capacité de leurs disques durs en millions d'octets alors
que le BIOS et le programme FDISK l'indiquent en Mega-octets.

1 Meg équivaut à 1 048 576 octets (ou 1 024 Ko, chaque Ko équivalant à 1 024 octets).

La preuve est donc établie que ce disque dur d'une capacité de 202,82 Meg a aussi une capacité
de 212,67 Mo ! Le plus étonnant est que les fabricants n'aient pas choisi de privilégier l'une ou
l'autre de ces unités pour distinguer les valeurs binaires, exprimées en Mega-octets, des valeurs
décimales.

Ces deux unités ont de surcroît la même abréviation officielle, "Mo", et il est par conséquent
difficile de savoir quelle capacité est indiquée. Les fabricants utilisent l'unité décimale car elle
leur permet d'afficher des valeurs plus importantes et donc plus impressionnantes.

II est en outre intéressant de souligner que le disque considéré pour cet exemple est un disque à
enregistrement par zones et que ses paramètres physiques réels seront donc différents.

II comportera en effet 1 971 secteurs et 4 têtes physiques. Le nombre de secteurs (et par
conséquent la capacité) du disque demeure toutefois le même quelle que soit la méthode retenue
pour convertir ces paramètres.Western Digital n'indique pas, dans ce cas précis, la capacité avant
formatage de son disque, mais cette capacité est en général supérieure de 19 % à la capacité après
formatage. Segate indique les capacités suivantes pour son disque dur ST-12550N Barracuda de
2 Go:

Avant formatage: 2 572,00 Mo.Avant formatage: 2 452,85 Meg.Après formatage: 2 139,00


Mo.Après formatage: 2 039,91 Meg.

Chacune de ces valeurs répond à la question: "Quelle est la capacité de stockage de ce disque ?
", mais comme vous pouvez le constater, elles diffèrent sensiblement. II est même possible
d'utiliser une cinquième unité. Si l'on divise 2 039,91 Meg par 1 024, on obtient en effet une
capacité de 1,99 Go !

Lorsque vous comparez des capacités de disques durs ou que vous abordez ce sujet, assurez-
vous de toujours utiliser la même unité de mesure, sans quoi vos comparaisons n'auront aucune
valeur.Afin d'éviter toute confusion entre les diverges mesures de capacité, il a été fait usage
dans cette partie de l'abréviation "Meg", qui n'est pas utilisée par les fabricants. Les abréviations
réellement utilisées sont répertoriées dans le tableau ci-après: (1 024 x 1 024 = 1 048 576)
Gestion des disques dur, Système de fichiers, Tolérance de panne

7.1 Les abréviations standard et leur signification.

Abréviatio Forme Vale


Correspondance décimale Correspondance binaire
n développée ur
Ko Kilo-octet 1 000 1 024 210
Mo Méga-octet 1 000 000 1 048 576 220
Go Giga-octet 1 000 000 000 1 073 741 824 230
To Téra-octet 1 000 000 000 000 1 099 511 627 776 240
Po Péta-octet 1 000 000 000 000 000 1 125 899 906 842 624 250
Eo Exa-octet 1 000 000 000 000 000 000 1 152 921 504 606 846 976 260

II n'existe malheureusement aucun moyen de différencier une abréviation qui utilise le système
décimal d'une abréviation qui utilise le système binaire. En d'autres termes, l'abréviation Mo peut
être utilisée tant pour indiquer des millions d'octets que des Mega-octets. Les quantités de
mémoire sont généralement calculées en binaire, tandis que l'une et l'autre unités peuvent être
utilisées pour exprimer des capacités de disques durs.

8. Les têtes de lecture/écriture.

Tête de
Description
lecture

Actuellement totalement démodé, elle se présentait comme une sorte


Ferrite
d'aimant en forme de U.

Il s'agit ici de l'abréviation de Metal-In-Gap. Aussi démodée, très


MIG proche du modèle Ferrite, elle est composée d'un alliage nettement
plus sensible
Gestion des disques durs, Système de fichier, Tolérance de panne

Thin-Film, ce modèle était le plus utilisé jusqu'en 1997. Le principe


TF consiste à détecter le courant induit généré par une bobine soumis à
un champ magnétique.

Magneto-résistive, il s'agit ici d'un modèle qui utilise 2 tête. En effet,


si la lecture utilise une tête MR, l'écriture se fait toujours à l'aide
d'une tête TF. La tête de lecture contient un capteur à base de NiFe
dont la résistance change d'état en fonction du champ magnétique
MR
provenant des plateaux du disque dur. Un capteur lit cette variation
et la transmet. Ce procédé permet d'avoir des têtes plus sensibles et
plus fines donc une densité plus importante. C'est grâce à cela que
les disques on considérablement évolués en terme de capacités.

Giant Magneto-résistive, il s'agit d'une évolution du modèle


précédent. Dans ce cas on à deux film NiFe séparés par une couche
de conductrice très fine. On utilise ici le fait qu'un électron peut
avoir d'un point de vue quantique, 2 spins.
Lorsque le spin est parallèle à l'orientation du champ magnétique du
GMR
disque dur,
une faible résistance électrique est produite , par contre quand le spin
est de direction opposé, une forte résistance électrique est généré.
L'objectif est d'augmenter la sensibilité des têtes afin d'augmenter la
densité de particule ferromagnétique d'un support.
Gestion des disques dur, Système de fichiers, Tolérance de panne

8.1 Schéma d'une tête Magnéto-Résistive.

8.2 PRML et têtes magneto resistives.


Les technologies récentes PRML (Partial Response Maximum Likehood) et MR (Magnéto-
Résistive). La technologie PRML (Partial Response Maximum Likelihood) réduit l’interférence
signal-bruit (S/B), ce qui permet des densités surfaciques et des taux de transfert élevés, sans
sacrifier la fiabilité de l’unité.

Ces deux technologies concernent les têtes de lecture des disques durs. Issues des centres de
recherche et de développement d’IBM, les têtes de lecture magnéto-résistives (ou MR) vont peu
à peu remplacer les têtes de lecture film mince (ou TF pour thin film ) inductive
conventionnelles. La raison avancée, les têtes MR fournissent des signaux de bien meilleure
qualité que les têtes TF. D'autre part, le niveau des signaux, issus des têtes MR, est indépendant
de la vitesse de rotation du disque, à la différence des têtes TF. Grâce à la technologie MR, il est
donc envisageable d'augmenter encore la vitesse de rotation des disques, et de ce fait d’accroître
leurs performances générales.

Les disques les plus rapides, disponibles sur le marché, offrent une vitesse de rotation d'environ
12000 RPM (rotations par minute) avec le DK3K1 de Hitachi.

Aussi, grâce à la technologie MR, la densité de stockage (ou areal density) pourra être accrue.
Aujourd'hui, avec les têtes TF, la densité de stockage maximum est de l’ordre de 800
Mbits/pouces2.
Gestion des disques durs, Système de fichier, Tolérance de panne

En l997, la technologie MR permettra de porter cette densité à plus de l 000 Mbits/pouces2, voire
même 2000 Mbits/pouces2 selon Hewlett Packard (grâce à la technologie DSMR utilisant deux
composants MR). La densité de stockage augmente en moyenne d'environ 60% par an: Hewlett
Packard et Conner estiment par conséquent, qu’en l999, la barrière des 20 Gbits/pouces 2 sera
atteint (grâce à la technologie GMR, ou Giant Magnetoresistive, une évolution de la technologie
MR).

De nombreux fabricants de disques durs ont d'ores et déjà adopté la technologie MR (Fujitsu,
Western Digital, Quantum, IBM, Seagate, etc. ). D'ici l997, les têtes MR devraient totalement
supplanter les têtes film mince conventionnelles. Pour le moment toutefois, les têtes MR ne sont
présentes essentiellement que sur les disques durs haut de gamme car leur prix est plus élevé que
celui des têtes film mince conventionnelles.

Autre technologie clé, PRML (ou Partial Response Maximum likehood ). Cette technologie
améliore la qualité du signal issu de la tête de lecture du disque dur. Le signal analogique est
tout d'abord amplifié et filtré, puis échantillonné en différents points et converti ensuite en
données digitales. Plus rapide que les méthodes classiques de détection de pics (ou techniques
peak-detection read channel), PRML élimine pratiquement tous les parasites, ou bruits, captés
par la tête de lecture.

9. Adresses Internet des principaux fabriquants des disques.

Fabriqua
Adresses Serveurs
nts

Conner www.conner.com/products.html

Maxtor www.maxtor.com/idx1.html

www.quantum.com/quantum.html
Quantum
liste des HD/product/indexes/index by form/html

Western
www.wdc.com/products/drive-specs
Digital

www.storage.ibm.com/storage/
IBM
Tel : 01-49-14-49-24
Gestion des disques dur, Système de fichiers, Tolérance de panne

2. QU'EST CE QU'UNE PARTITION ?

Qu'est-ce qu'une partition?


Le partitionnement d'un disque dur se fait après le formatage physique de celui-ci et
avant le formatage logique. Il consiste à créer des zones sur le disque dont les données
ne seront pas mélangées. Cela sert par exemple à installer des systèmes d'exploitation
différents n'utilisant pas le même système de fichiers. Il y aura donc au minimum autant
de partitions que de systèmes d'exploitation utilisant des systèmes de fichiers différents.
Dans le cas d'un utilisateur d'un système d'exploitation unique, une seule partition de la
taille du disque peut suffire, sauf si l'utilisateur désire en créer plusieurs pour faire par
exemple plusieurs lecteurs dont les données sont séparées.

Il y a trois sortes de partitions: la partition principale, la partition étendue et les


lecteurs logiques. Un disque peut contenir jusqu'à quatre partitions principales (dont
une seule peut être active), ou trois partitions principales et une partition étendue. Dans
la partition étendue l'utilisateur peut créer des lecteurs logiques (c'est-à-dire "simuler"
plusieurs disques durs de taille moindre).

Voyons voir un exemple, dans lequel le disque contient une partition principale et une
partition étendue composée de trois lecteurs logiques (nous verrons par la suite les
partitions principales multiples) :

Pour les systèmes DOS (DOS, Windows 9x), seulement la partition principale est
bootable, c'est donc la seule sur laquelle on peut démarrer le système d'exploitation.

On appelle partitionnement le processus qui consiste à écrire les secteurs qui


constitueront la table de partition (qui contient les informations sur la partition: taille de
celle-ci en terme de nombre de secteurs, position par rapport à la partition principale,
types de partitions présentes, systèmes d'exploitation installés,...).

Lorsque la partition est créée, on lui donne un nom de volume qui va permettre de
l'identifier facilement.
Gestion des disques durs, Système de fichier, Tolérance de panne

Master Boot Record


Le secteur de démarrage (appelé Master Boot Record ou MBR en anglais) est le
premier secteur d'un disque dur (cylindre 0, tête 0 et secteur 1), il contient la table de
partition principale (en anglais partition table) et le code, appelé boot loader, qui, une
fois chargé en mémoire, va permettre d'amorcer (booter) le système.
Ce programme, une fois en mémoire, va déterminer sur quelle partition le système va
s'amorcer, et il va démarrer le programme (appelé bootstrap) qui va amorcer le système
d'exploitation présent sur cette partition.
D'autre part, c'est ce secteur du disque qui contient toutes les informations relatives au
disque dur (fabricant, numéro de série, nombre d'octets par secteur, nombre de secteurs
par cluster, nombre de secteurs,...). Ce secteur est donc le secteur le plus important du
disque dur, il sert au setup du BIOS à reconnaître le disque dur. Ainsi, sans celui-ci votre
disque dur est inutilisable, c'est donc une cible de prédilection pour les virus.

Les systèmes de fichiers


Dans toute cette section il s'agira de différencier le système de fichier FAT de la table
d'allocation des fichiers (FAT en anglais).

On appelle FAT le système de fichiers utilisés par les systèmes d'exploitation DOS (DOS
et Windows 95 ainsi que Windows NT et OS/2 qui la supportent).

Système d'exploitation Système de fichiers associé


DOS FAT16
Windows XP NTFS
Windows 98 FAT32
Windows 95 FAT16 - FAT32 (pour la version OSR2)
Windows NT NTFS
OS/2 HPFS
Linux Linux Ext2, Linux Ext3

Le système de fichiers FAT est caractérisé par l'utilisation d'une table d'allocation de
fichiers et de clusters (ou blocs).

Les clusters sont les plus petites unités de stockage du système de fichier FAT. Un cluster
représente en vérité un nombre fixé de secteurs du disque.

La FAT (File Allocation Table: table d'allocation des fichiers) est le coeur du système
de fichiers. Elle est localisée dans le secteur 2 du cylindre 0 à la tête 1 (Elle est dupliquée
dans un autre secteur par des mesures de précautions en cas d'accident). Dans cette table
sont enregistrés les numéros des clusters utilisés, et où sont situés les fichiers dans les
clusters.

Le système de fichiers FAT supporte des disques ou des partitions d'une taille allant
jusqu'à 2 GB, mais autorise au maximum 65536 clusters. Ainsi, quelle que soit la taille
de la partition ou du disque, il doit y avoir suffisamment de secteurs par cluster pour que
tout l'espace disque puisse être contenu dans ces 65525 clusters. Ainsi, plus la taille du
Gestion des disques dur, Système de fichiers, Tolérance de panne

disque (ou de la partition) est importante, plus le nombre de secteurs par cluster doit être
important.

Le système de fichier FAT utilise un répertoire racine (représenté sur les systèmes
d'exploitations qui utilisent ce type de systèmes de fichiers par le signe C:\ ) , qui doit
être situé à un endroit spécifique du disque dur. Ce répertoire racine stocke les
informations sur les sous-répertoires et fichiers qu'il contient. Pour un fichier, il stockera
donc :

 le nom de fichier
 la taille du fichier
 la date et l'heure de la dernière modification du fichier
 les attributs du fichier
 le numéro du cluster auquel le fichier commence

Utiliser des partitions multiples


Il y a, comme on l'a précédemment vu, trois sortes de partitions: les partitions principales,
la partition étendue et les lecteurs logiques. Un disque peut contenir jusqu'à quatre
partitions principales (dont une seule peut être active), ou trois partitions principales et
une partition étendue. Dans la partition étendue l'utilisateur peut créer des lecteurs
logiques (c'est-à-dire faire en sorte que l'on ait l'impression qu'il y a plusieurs disques
durs de taille moindre).

Partition principale

Une partition principale doit être formatée logiquement, puis contenir un système de
fichier correspondant au système d'exploitation installé sur celle-ci.
Si jamais vous avez plusieurs partitions principales sur votre disque, une seule sera active
et visible à la fois, cela dépendra du système d'exploitation sur lequel vous avez démarré
l'ordinateur. En choisissant le système d'exploitation que vous lancez au démarrage, vous
déterminez la partition qui sera visible. La partition active est la partition sur laquelle
un des système d'exploitation est démarré au lancement de l'ordinateur. Les partitions
autres que celle sur laquelle vous démarrez seront alors cachées, ce qui empêchera
d'accéder à leur données. Ainsi, les données d'une partition principale ne sont accessible
qu'à partir du système d'exploitation installé sur cette partition.

Partition étendue

La partition étendue a été mise au point pour outrepasser la limite des quatre partitions
principales, en ayant la possibilité de créer autant de lecteurs logiques que vous désirez
dans celle-ci. Au moins un lecteur logique est nécessaire dans une partition étendue, car
vous ne pouvez pas y stocker de données directement.

Beaucoup de machines sont formatées en une grande partition utilisant l'intégralité de


l'espace disponible du lecteur. Ce n'est pourtant pas la solution la plus avantageuse en
terme de performances et de capacité. La solution est de créer plusieurs partitions, ce qui
va vous permettre :

 d'installer plusieurs systèmes d'exploitation sur votre disque


 d'économiser de l'espace disque
 d'augmenter la sécurité de vos fichiers
Gestion des disques durs, Système de fichier, Tolérance de panne

 d'organiser vos données plus facilement

Voyons voir à quoi pourrait ressembler un système comportant plusieurs systèmes


d'exploitation :

3. PRINCIPAUX SYSTEMES DE FICHIER


Le système de fichier définit comment les informations sont organisées sur le disque.
Chaque disque a son propre répertoire racine et peut disposer d'un système de fichiers
différent. Tous les fichiers sont organisés en une arborescence dont l'origine est le
répertoire racine.

Le système de fichier définit les conventions en matière de noms de fichiers, détermine


le niveau de sécurité, l'organisation des répertoires et sous-répertoires et la
reconstruction éventuelle.

Les principaux systèmes de fichiers sont le système FAT, NTFS et HPFS.

3.1. LE SYSTEM FAT

Le système FAT est le seul système utilisé par MS-DOS. Il est en mesure d'organiser les
données aussi bien sur disque dur que sur disquette. Il peut aussi être utilisé par Windows
NT et OS/2 (pour des raisons de compatibilité des applications MS-DOS) mais dans ce
cas, on perd les fonctionnalités de sécurité supplémentaires offertes par ces systèmes
d'exploitation.

Chaque nom de fichier ou de répertoires doit répondre à la convention 8.3 (de 1 à 8


caractères pour le nom et de 0 à 3 pour l'extension).

Le système permet de placer pour chaque fichier ou répertoire, des attributs. Ces derniers
offrent une première ébauche d'un système sécurisé. Les attributs possibles sont : lecture
seule (Read only), caché (Hiden), système (System) et archive.

L'unité de stockage élémentaire du système FAT est l'unité d'allocation (Cluster) qui
est constitué de 4 ou 8 secteurs. Chaque unité d'allocation est décrite dans une zone de
Gestion des disques dur, Système de fichiers, Tolérance de panne

la partition appelée FAT (File Allocation Table) et les fichiers sont repérés par le numéro
de la première unité d'allocation qu'ils occupent.

Il est clair qu'avec un système FAT de la taille d'une disquette, la table d'allocation des
fichiers est chargée en mémoire et les têtes de lecture du disque dur ne font plus des aller
et retour entre la FAT et les zones de fichiers. Par contre plus le disque dur est grand et
plus la taille de la FAT est grande. Elle ne peut donc plus tenir en mémoire d'ou une
perte de temps au niveau des accès disque.

Lorsque le système FAT a été développé, il était tout à fait impossible de s'imaginer
qu'un jour les machines disposeraient de disques durs de plus de 500 M°. Ce système
semble donc un peu dépassé pour les gros volumes.

3.2. UNE VARIANTE : LE SYSTEME FAT

Windows 95 s'installe sur une partition de type FAT. Windows 95 est capable de gérer
des noms de fichier jusqu'à 255 caractères. Il semble donc y avoir une incompatibilité
entre le système de fichier FAT et la gestion des noms longs.

Avec le système FAT, les références des fichiers et répertoires (nom, extension, attributs,
dates, numéro du premier cluster ...) sont stockées dans des zones ( la première étant
appelée répertoire racine) constituées de multiples enregistrements de 32 caractères.
Chaque enregistrement concernant un fichier ou un répertoire.

Pour gérer cette incompatibilité, Windows 95 se sert de multiples entrées à nom court
consécutives pour une chaîne de noms longs. Le nom de fichier est donc stocké sur
plusieurs entrées et le nom de fichier court associé est stocké sur la dernière entrée. La
distinction entre une entrée ou est stockée une partie du nom long et une entrée ou est
stocké le nom court associé se fait par l'intermédiaire de l'octet d'attribut de fichier.

La production de noms courts associés, se fait selon les règles suivantes :

• Les espaces et caractères spéciaux sont supprimés.

• Le nom de fichier est tronqué à 8 caractères.

• l'extension est tronquée à 3 caractères.

• Le nom de fichier doit être unique dans le répertoire. S'il existe déjà, les deux
derniers caractères sont remplacés par un système de numérotation permettant
de discerner les différents fichiers.

• Exemple : Les fichiers "Le document de Catherine.document" et "Le document


de Bernard.document" deviennent "LEDOCU~1.DOC" et "LEDOCU~2.DOC

Ainsi MS-DOS quand il exploite une partition Windows 95 n'exploite que les entrées à
nom court.

Le système de fichier de Windows 95 n'offre donc pas d'autres possibilités que le


système FAT (en dehors des noms longs).
Gestion des disques durs, Système de fichier, Tolérance de panne

3.3. LE SYSTEME NTFS

New Technology File System est un système de fichier qui ne peut organiser des données
que sur disque dur. C'est le système de fichier privilégié de Windows NT.

NTFS a été réalisé avec des adresses sur 64 bits permettant la gestion de médias de
mémoire de masse allant jusqu'à une taille de 2 puissance 64 soit près de 17 milliards de
G°. La taille maximale des partitions n'est plus en théorie une contrainte.

Les noms longs sont autorisés (255 caractères) et des noms courts associés sont générés
pour des raisons de comptabilités avec MS-DOS
Si le système FAT n'autorise que peu de possibilité en terme sécurité, les concepteur de
NTFS ont largement développé ce domaine. Le système permet d'autoriser l'accès à un
fichier ou à un répertoire à tel ou tel utilisateur ou groupe d'utilisateur en précisant pour
chaque utilisateur ou groupe autorisé le type d'accès : Aucun accès, Lister, Lire, Ajouter,
Ajouter & Lire, modifier, Ecrire, Exécuter, Supprimer, Changer les permission et
Contrôle total.

NTFS ressemble au système FAT dans le sens ou il utilise aussi l'unité d'allocation
comme unité de base. La taille d'un cluster est déterminée lors du formatage du disque
dur ce qui permet de gérer plus efficacement les grands disques durs en utilisant une
taille de cluster plus grande.

NTFS gère les fichiers grâce à une base de données relationnelle appelée Master File
Table (MFT) qui constitue le cœur de la structure d'un volume NTFS. Ce système
permet de n'être plus limité par la taille d'un enregistrement pour placer les attributs de
fichiers, les descripteurs de sécurité etc ... A chaque modification ou ajout d'attribut sur
un fichier ou un répertoire, NTFS alloue un espace supplémentaire pour stocker les
caractéristiques de ce fichier.

NTFS implémente en plus tout un système de récupération des données en cas d'incident
(panne de secteur par exemple) et notamment la journalisation de toutes les opérations
d'écriture sur le disque.

Les autres possibilités telles que les disques miroir, les agrégat de partition, les agrégats
par bandes seront détaillées dans le chapitre "Système à tolérance de panne".

En conclusion, NTFS atteind un tel niveau de sécurité qu'il a obtenu la certification C2.
Cette certification est exigée par l'armée américaine.

Pour étudier la structure interne d'une partition NTFS, il faut se reporter à la bibliographie et notamment au
"Grand livre de Windows NT" ou les différents systèmes de fichiers sont détaillés.

3.4. LE SYSTEME HPFS

HPFS est l'abréviation de High Performance File System. Ce système permet d'organiser
des données sur un disque dur mais pas sur une disquette.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Basé sur un algorythme différent du système FAT, il est normalement plus rapide. Il gère
les longs noms (254 caractères) sans distinction entre le nom et l'extension (le point est
un caractère comme un autre).

La taille maximale d'une partition est de 2199 G° ce qui permet de voir l'avenir avec une
certaine sérénité.
HPFS inclus des fonctionnalités très intéressantes :

• les attributs étendus (ils viennent en plus des attributs classiques type FAT) permettent par
exemple d'associer un fichier et un programme ou un fichier et une icône.

• Un système de récupération des secteurs défectueux

• Une méthode de Disk caching permet d'augmenter les performances du système.

En conclusion HPFS, système de fichier natif pour OS/2 et géré aussi par Windows NT est une
alternative au système FAT vieillissant.

un système d'exploitation peut donc exploiter une partition créée par un autre système à condition
que cette partition soit d'un type que le système sait gérer. Exemple OS/2 peut exploiter une partition
créée par MS-DOS ou Windows 95.

Dans la pratique il faut apporter quelques restrictions. Un SE est annoncé avec des fonctionnalités
pour un type de partition. Il ne peut donc pas appliquer ces fonctionnalités aux autres types.

Exemple : Windows NT peut créer et exploiter une partition de type FAT mais on perd tout le
bénéfice du système de sécurité. MS-DOS peut lire une partition créée par Windows 95 mais il
n'utilisera que les noms courts. ...

Il existe par contre des incompatibilités quand un système essaie d'exploiter une partition d'un type
pour lequel il n'est pas prévu par exemple MSDOS ne peut exploiter une partition NTFS ou une
partition HPFS.

Le réseau peut être une solution pour lever ces incompatibilité. Ainsi une station MSDOS peut lire
et écrire dans un répertoire partagé sur un serveur NT ( partition NTFS). Il est donc possible de
bénéficier sur le serveur de tout le système de sécurité et le répertoire partagé est vu depuis la station
MS-DOS comme une partition FAT.

Dans tous les cas avant de choisir le type de partition à créer, il faut réfléchir aux possibilités des
systèmes qui vont y accéder, aux possibilités de conversion via le réseau et au niveau de sécurité
que l'on veut utiliser.

4. GESTION DE VOLUME ET TOLERANCE DE PANNE


Sur certaines machines, notamment les serveurs de réseau, des problèmes se posent
quand le nombre de disque devient important (serveur avec n disques SCSI), et quand le
nombre d'utilisateurs accédant aux disque durs devient important
Gestion des disques durs, Système de fichier, Tolérance de panne

Dans ce cas il est devient compliqué de gérer les partages sur de nombreux disques et la
taille de la partition (limitée à la taille du disque) devient une contrainte. De plus la
multiplicité des accès disques augmente les temps de réponse, et en même temps la
nervosité et l'insatisfaction des utilisateurs.

Dans un autre registre, il est quasiment impossible qu'un serveur de réseau tombe en
panne. Or il arrive qu'un disque dur à l'usage ne fonctionne plus. Il faut dans ce cas
arrêter les utilisateurs (si le disque du serveur est en panne) c'est déjà fait, changer le
disque dur, restaurer les données avec la dernière sauvegarde, remettre en route le
serveur et demander aux utilisateurs de recommencer leur travail depuis cette dernière
sauvegarde. On pardonnera un incident de ce genre au responsable réseau mais rarement
deux ...

Pour résoudre (en partie) ces problèmes, les systèmes d'exploitation offrent de plus en
plus de possibilités en terme d'optimisation des accès disque et de la tolérance de panne.

4.1. GESTION DE VOLUMES

4.1.1. AGREAGAT DE PARTITIONS


Un agrégat de partitions est un volume logique constitué de n partitions réparties sur un
ou plusieurs disques. Ce volume quand il sera formaté, ne sera vu que comme un seul
disque.

Un agrégat de partitions est utile pour regrouper des petites partitions sur un seul disque
ou de créer un seul volume à partir de plusieurs disques durs.

Ainsi Windows NT permet de regrouper jusqu'à 32 partitions, le volume créé peut être
formaté par n'importe quel système de fichier supporté par NT. Si le volume créé a été
formaté pour NTFS, il peut être à tout moment agrandi par des partitions supplémentaires
sans affecter les données qu'il contient déjà.

4.1.2 .AGREGAT PAR BANDES


Un agrégat par bandes est constitué d'une série de partitions à raison d'une partition par
disque. Chaque partition ne doit pas obligatoirement occuper tout le disque mais toutes
les partitions doivent avoir la même taille.

Le système de fichier optimise les accès disque en répartissant les données sur les
différents disques. Les disques sont divisés en bandes. La première bandes se trouvant
sur le premier disque, la deuxième sur le deuxième, la énième sur le énième disque, la n
plus unième sur le premier disque et ainsi de suite.
Cette disposition augmente la probabilité d'opérations d'écriture et de lecture effectuées
simultanément sur les différents disques. Le temps de latence des entrées/sorties disque
est donc réduit, notamment sur les systèmes lourdement chargés.
Gestion des disques dur, Système de fichiers, Tolérance de panne

4.2. VOLUMES A TOLERANCE DE PANNE

4.2.1. MODE MIROIR


Avec le mode miroir, le contenu d'une partition d'un disque est dupliqué dans une
partition de même taille sur un autre disque. En cas de panne de l'un des deux disques,
le système se sert alors du disque valide comme s'il était seul.

Dans ce cas la réparation attendra le moment opportun (le soir par exemple).

Ce dispositif permet dans certains cas d'optimiser les opérations d'entrée/sorties en


équilibrant les opérations de lecture entre la partition primaire et le partition miroir. Deux
opérations de lecture peuvent ainsi s'effectuer en même temps.

4.2.2. MODE DUPLEX


Le mode duplex est une variante du mode miroir. Le disque miroir est maintenant géré
par un contrôleur différent de celui contrôlant le premier disque. Cette disposition donne
un degré supplémentaire de fiabilité et de disponibilité du système car les données du
miroir sont encore disponible en cas de panne d'un contrôleur.

4.2.3. AGREGAT PAR BANDE AVEC PARITE


Ce dispositif est une variante de l'agrégat par bande. La tolérance de panne est obtenue
en réservant l'équivalent d'un disque pour l'enregistrement de la parité de chaque bande.

Une bande est constituée d'une somme logique (XOR : addition logique bit à bit) octet
par octet de deux autres bandes associées. Il est donc facile de reconstituer une bande à
partir des autres.

Les bandes de parités successives sont réparties sur les différents disques pour une raison
d'optimisation des accès disques : si toutes les bandes de parités se trouvaient sur le
même disque, toute modification de l'information d'une bande entraîne la modification
de la bande de parité (toujours sur le même disque).

L'exemple ci-dessous montre la répartition des bandes de parités :

• BP (bande de parité) des bandes 1 des disques 2 et 3 sur le disque 1

• BP des bandes 2 des disques 1 et 3 sur le disque 2

• BP des bandes 3 des disques 1 et 2 sur le disque 3

• ....

Les données réelles sont situées successivement sur la bande 1 disque 2, bande 1 disque
3, bande 2 disque 1, bande 2 disque 3, bande 3 disque 1, ...
Gestion des disques durs, Système de fichier, Tolérance de panne

En cas
de
panne
de l'un
des
deux

disques, après réparation, le système reconstitue les données de chacune des bandes du disque
remplacé à l'aide des deux autres. La restauration des données repose sur un principe arithmétique
simple : avec l'équation
x + y = z ou z représente la parité, x = z - y et y = z - x.

4.2.4. REPARATION DE SECTEUR


En plus de la redondance de données (miroir ou parité), certains systèmes d'exploitation remplace
de façon dynamique (c'est transparent pour l'utilisateur) les données perdues lorsqu'un secteur
devient inutilisable.
cette technique exploite une possibilité de certains disques durs (notamment les disques SCSI) qui
fournissent un ensemble de secteurs physique comme secteurs de secours.
Si un secteur est défectueux sur un disque ne fournissant pas de secteurs de secours, il est toujours
possible de restaurer les données à partir du miroir ou des bandes avec parité. Dans ce cas le
système signale qu'il y a perte de redondance sur le secteur défectueux. C'est donc à l'utilisateur à
prendre les mesures adéquates pour réparer les secteurs défectueux (format, chkdsk ...).

4.3. LES STRATEGIES RAID

Le RAID est un ensemble de techniques de virtualisation du stockage permettant de répartir des


données sur plusieurs disques durs afin d'améliorer soit les performances, soit la sécurité ou la
tolérance aux pannes de l'ensemble du ou des systèmes.

L'acronyme RAID a été défini en 1987 par l'Université de Berkeley (Californie), dans un article
nommé A Case for Redundant Arrays of Inexpensive Disks (RAID)1, soit « regroupement
redondant de disques peu onéreux ». Aujourd'hui, le mot est devenu l'acronyme de Redundant
Array of Independent Disks, ce qui signifie « regroupement redondant de disques indépendants ».
Le coût au mégaoctet des disques durs ayant été divisé par 1 300 000 en 29 ans, aujourd'hui le
RAID est choisi pour d'autres raisons que le coût de l'espace de stockage.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Description et concepts
Comparaison RAID/SLED

Depuis sa création, la particularité principale de l'architecture RAID est sa capacité à combiner


plusieurs périphériques de stockage bon marché et de technologie courante dans une matrice
unique, de sorte que ce groupement offre une fiabilité et/ou des performances accrues, ce pour un
coût largement inférieur à un périphérique de stockage unique de capacité équivalente exploitant
des techniques de pointe. L'architecture RAID s'oppose donc à l'architecture SLED (Single Large
Expensive Disk), qui est fondée sur l'utilisation d'un seul et même disque dur de grande capacité et
de haute performance, donc de prix élevé, car celui-ci doit non seulement pouvoir stocker
beaucoup d'informations, mais il doit de plus être d'excellente qualité pour garantir au mieux la
pérennité et l'accessibilité de son contenu non redondant.

En effet, dans une architecture de type SLED, la bonne conservation des données est dépendante
de la moindre défaillance du disque dur. Lorsqu'une panne survient, non seulement le système est
inexploitable le temps du remplacement du matériel défectueux, mais la seule manière de
récupérer les données est de procéder à une restauration de la dernière sauvegarde, ce qui peut
prendre plusieurs heures durant lesquelles le système est inutilisable.

Si un tel temps d'inactivité est acceptable pour l'ordinateur d'un particulier, il est en revanche
rédhibitoire pour le système informatique d'une entreprise, pour laquelle une telle panne peut avoir
des conséquences non négligeables. L'utilisation d'une architecture RAID, du moins dans la
plupart de ses niveaux fonctionnels, permet justement d'apporter une réponse à ces besoins, car
non seulement la défaillance d'un des disques de la grappe n'interrompt pas le fonctionnement de
l'ensemble, ce qui permet au système de continuer à fonctionner, mais de surcroît, une fois le
disque en panne échangé, son contenu est reconstruit automatiquement à partir des autres disques
pendant le fonctionnement normal du système. Ainsi, pendant toute la durée de l'incident, l'activité
de l'entreprise peut continuer de façon ininterrompue et transparente.

Le RAID, suivant ses niveaux fonctionnels, s'il donne des temps de réponse identiques à ceux des
disques s'ils étaient utilisés individuellement, offre des débits significativement supérieurs, même
en utilisant des disques durs bon marché aux performances moyennes, tout en garantissant une
bien meilleure fiabilité (sauf pour le RAID 0 qui la réduit d'autant que le nombre de disques – voir
explications ci-dessous). Dans de telles situations, les architectures RAID se révèlent donc idéales,
tant du point de vue de leurs performances que de leur fiabilité. Dans tous les cas, le RAID reste
complètement transparent à l'utilisateur qui, quel que soit le nombre de disques physiques utilisés
pour construire le RAID, ne verra jamais qu'un seul grand volume logique, auquel il accédera de
façon tout à fait habituelle via le système d'exploitation.
Gestion des disques durs, Système de fichier, Tolérance de panne

Parité et redondance

La mise en miroir s'avère être une solution onéreuse, puisqu'il est nécessaire d'acquérir les
périphériques de stockage en plusieurs exemplaires, pour n'avoir à disposition qu'une fraction de
leur capacité totale (généralement la moitié). Aussi, partant du principe que plusieurs unités de
stockage ont une faible probabilité de tomber en panne simultanément, d'autres systèmes ont été
conçus, dont ceux permettant de régénérer les données manquantes à partir des données restant
accessibles et de données supplémentaires, dites de redondance.

Les différents types de systèmes RAID

Le système RAID est :

 soit un système de redondance qui donne au stockage des données une certaine tolérance
aux pannes matérielles (ex : RAID 1).
 soit un système de répartition qui améliore ses performances (ex : RAID 0).
 soit les deux à la fois, mais avec une moins bonne efficacité (ex : RAID 5).

Le système RAID est donc capable de gérer d'une manière ou d'une autre la répartition et la
cohérence de ces données. Ce système de contrôle peut être purement logiciel ou utiliser un
matériel dédié.

Le RAID logiciel
En RAID logiciel, le contrôle du RAID est intégralement assuré par une couche logicielle du
système d'exploitation. Cette couche s'intercale entre la couche d'abstraction matérielle (pilote) et
la couche du système de fichiers.
Avantages
 C'est la méthode la moins onéreuse puisqu'elle ne demande aucun matériel supplémentaire.
 Cette méthode possède une grande souplesse d'administration (logiciel).
 Cette méthode présente l'avantage de la compatibilité entre toutes les machines équipées du
même logiciel de RAID (c’est-à-dire du même système d'exploitation)
Gestion des disques dur, Système de fichiers, Tolérance de panne

Inconvénients

 L'inconvénient majeur réside dans le fait que cette méthode repose sur la couche
d'abstraction matérielle des périphériques qui composent le volume RAID. Pour diverses
raisons, cette couche peut être imparfaite et manquer de certaines fonctions importantes
comme la détection et le diagnostic des défauts matériels et/ou la prise en charge du
remplacement à chaud (hot-swap) des unités de stockage.
 La gestion logicielle du RAID monopolise des ressources systèmes (légèrement le
processeur et surtout le bus système) qui pourraient être employées à d'autres fins. La
baisse de performances due à la gestion logicielle du RAID est particulièrement sensible
dans des configurations où le système doit transférer plusieurs fois les mêmes données,
comme en RAID 1, et assez faible dans des configurations sans redondance, typiquement
en RAID 0.
 L'utilisation du RAID logiciel sur le disque système n'est pas toujours possible.

Diverses implémentations

La plupart des systèmes d'exploitation grand public permettent déjà de mettre en œuvre le RAID
logiciel, qu'il s'agisse de Microsoft Windows, des diverses distributions Linux, ou de Mac OS X.

 Microsoft Windows XP (et supérieur) gère les RAID 0 et 1 logiciel, et peut gérer le RAID
5 moyennant une petite adaptation5.
 Microsoft Windows 2003 Server gère logiciellement les RAID 0, 1, et 5.
 Mac OS X gère logiciellement les RAID 0, 1, et la concaténation.
 Le noyau Linux (>=2.6) gère logiciellement les RAID 0, 1, 4, 5, 6, et 10, ainsi que les
combinaisons de ces modes.
 Unraid est un OS basé sur Linux, orienté stockage en réseau et permettant de transformer
un PC en NAS avec des disques en RAID.

Les RAID logiciels de Microsoft Windows et de Linux sont incompatibles entre eux

Le RAID pseudo-matériel

L'immense majorité des contrôleurs RAID bon marché intégrés à de nombreuses cartes-mères
depuis 2004/2005 gèrent le RAID 0 et 1 sur des disques durs IDE ou SATA. Malgré le discours
marketing à cette époque qui tendait systématiquement à induire en erreur sur ce point, il ne s'agit
pas de RAID matériel à proprement parler, mais plutôt d'un contrôleur de disque doté de quelques
fonctions avancées. D'un point de vue strictement matériel, cette solution hybride n'est pas
différente d'un RAID logiciel. Elle diffère cependant sur l'emplacement des routines logicielles de
gestion du RAID.

Avec les matériels plus récents, la différence entre RAID pseudo-matériel et RAID matériel est
purement théorique. La seule différence pratique est que dans le RAID pseudo-matériel,
processeur et mémoire ne sont pas dédiés. Cependant, la puissance des processeurs récents et le
coût réduit de la mémoire font que cette limitation n'est plus un élément critique. Le seul avantage
restant pour les RAID spécialisés est la disposition d'outils de gestion des incidents plus
performants.
Gestion des disques durs, Système de fichier, Tolérance de panne

Avantages
 L'intérêt principal de ce type de RAID est d'apporter une solution au troisième problème du
RAID logiciel, à savoir qu'il ne peut pas toujours servir à héberger les fichiers du système
d'exploitation puisque c'est justement ce dernier qui permet d'y accéder.
 Dans ce type de RAID, la présence d'un BIOS intégrant les routines logicielles basiques de
gestion du RAID permet de charger en mémoire les fichiers essentiels du système d'exploitation
(le noyau et les pilotes principaux), puis le pilote du contrôleur, lequel intègre les mêmes routines
logicielles de gestion du RAID et fournit alors aux couches supérieures de l'OS non pas un accès
aux périphériques, mais un accès au volume RAID qu'il émule.

Inconvénients

En dehors de cet avantage important, ce type de RAID cumule les défauts des deux autres
approches :

 Les limitations de performances sont les mêmes que pour le RAID logiciel, car il s'agit
effectivement d'un RAID logiciel camouflé.
 Un problème important posé par ces contrôleurs hybrides est leur piètre gestion des défauts
matériels et leurs fonctionnalités BIOS généralement limitées.
 L'interopérabilité est très mauvaise surtout si l'on considère qu'il s'agit généralement de
matériel intégré aux cartes-mères des ordinateurs. Pire, le changement de carte-mère, si la
nouvelle utilise des jeux de puces différents, voire simplement de version du BIOS, peut
imposer de reconstruire le RAID entièrement. Une reconstruction est généralement
possible si l'on reste dans des contrôleurs RAID de même marque et de modèles différents,
mais il n'existe pas de règle définie de compatibilité.
 La fiabilité annoncée de ces dispositifs est assez controversée

Le RAID matériel

Dans le cas du RAID matériel, une carte ou un composant est affecté à la gestion des opérations.
Le contrôleur RAID peut être interne à l'unité centrale (carte d'extension) ou déporté dans une baie
de stockage.

Un contrôleur raid est en général doté d'un processeur spécifique, de mémoire dédiée,
éventuellement d'une batterie de secours, et est capable de gérer tous les aspects du système de
stockage RAID grâce au microcode embarqué (firmware).

Du point de vue du système d'exploitation, le contrôleur RAID matériel offre une virtualisation
complète du système de stockage. Le système d'exploitation considère chaque volume RAID
comme un volume de stockage unique et n'a pas connaissance de ses constituants physiques.

Avantages

 Les contrôleurs RAID matériels permettent la détection des défauts, le remplacement à


chaud des unités défectueuses et offrent la possibilité de reconstruire de manière
transparente les unités défaillantes. (Mais les systèmes d'exploitation évolués permettent
également cela si le matériel le permet.)
 La charge système (principalement l'occupation du bus) est allégée (ceci se ressent surtout
dans le cas de configurations avec beaucoup de disques et une forte redondance).
 Les opérations de vérification de cohérence, de diagnostic de maintenance sont effectuées
en arrière-plan par le contrôleur sans solliciter de ressources système.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Inconvénients

 Les contrôleurs RAID matériels utilisent chacun leur propre système pour gérer les unités
de stockage. En conséquence, au contraire d'un RAID logiciel, des disques transférés d'un
système à un autre ne pourront pas être récupérés si le contrôleur RAID n'est pas
exactement le même (firmware compris). Il est donc conseillé de posséder une deuxième
carte en cas de panne de la première. Ceci n'est pourtant pas toujours vrai, au moins en raid
1, les disques, redondants en miroir, peuvent être utilisables montés sur des unités séparées
et ainsi permettre leur contrôle matériel fin par exemple (ceci est à vérifier pour chaque
configuration matérielle).
 Les cartes d'entrée de gamme possèdent des processeurs de puissance bien inférieure à
celle des ordinateurs actuels. On peut donc avoir de bien moins bonnes performances pour
un prix supérieur à celui d'un RAID logiciel.
 Le coût : l'entrée de gamme se situe aux alentours de 200 € mais les cartes plus
performantes peuvent souvent dépasser les 650000(NOTE générale : Les prix affichés sont
non contractuels, compte-tenu de la date de mise à jour et de l'inflation)
 Le contrôleur RAID est lui-même un composant matériel, qui peut tomber en panne. Son
logiciel (firmware) peut contenir des erreurs, ce qui constitue un autre risque de panne
potentielle (single-point-of-failure). (Néanmoins, la garantie fréquemment décennale de ce
type de matériel incite les fabricants à porter une attention particulière à l'écriture du
firmware, ce qui réduit ce risque en pratique.)
 Les différents fabricants de contrôleurs RAID fournissent des outils de gestion logicielle
très différents les uns des autres (et de qualité parfois inégale). À l'opposé, les outils de
gestion du RAID logiciel fournis avec un système d'exploitation sont généralement bien
intégrés dans ce système.
 La durée du support d'un contrôleur RAID par son constructeur (correction de bugs dans le
firmware, par exemple), parfois liée à l'arrivée de nouveaux produits rendant les anciens
obsolètes, peut-être moins longue ou plus volatile que le support du RAID logiciel par le
fournisseur du système d'exploitation. Le constructeur peut même disparaître (ce qui est
plus rare parmi les fabricants de systèmes d'exploitation).
 Une moindre souplesse par rapport au RAID logiciel, qui dispose d'une couche
d'abstraction permettant de gérer du RAID au-dessus de tous types de périphériques blocs
supportés par le système d'exploitation, locaux ou distants (ATA, SCSI, ATA over
Ethernet, iSCSI… et toutes les combinaisons possibles entre eux). Les contrôleurs RAID
sont spécialisés pour un seul type de périphérique bloc.

Les différents niveaux de RAID

Les niveaux standards


Les différents types d'architecture RAID sont numérotés à partir de 0 et peuvent se
combiner entre eux (on parlera alors de RAID 0+1, 1+0, etc.).

Le RAID 0, également connu sous le nom d'« entrelacement de disques » ou de


« volume agrégé par bandes » (striping en anglais), est une configuration RAID
permettant d'augmenter significativement les performances de la grappe en faisant
travailler n disques durs en parallèle (avec n≥2).

Capacité
La capacité totale est égale à celle du plus petit élément de la grappe multiplié par le
nombre d'éléments présents dans la grappe, car le système d'agrégation par bandes se
retrouvera bloqué une fois que le plus petit disque sera rempli (voir schéma ci-dessous).
Gestion des disques durs, Système de fichier, Tolérance de panne

L'espace excédentaire des autres éléments de la grappe restera inutilisé. Il est donc
conseillé d'utiliser des disques de même capacité.

RAID 0 : volume agrégé par bandes

Structure RAID 0

Fiabilité
Le défaut de cette solution est que la perte d'une seule unité de stockage entraîne la perte de
toutes les données du volume RAID.

Coût
Dans un RAID 0, qui n'apporte aucune redondance, tout l'espace disque disponible est
utilisé (à condition que les supports soient de même capacité).

Dans cette configuration, les données sont réparties par bandes (stripes en anglais) d'une taille
fixe. Cette taille est appelée granularité (voir plus loin la section Granularité).
Gestion des disques dur, Système de fichiers, Tolérance de panne

Utilisations

Ce type de RAID était parfait pour des applications requérant un traitement rapide d'une grande
quantité de données avec des disques durs. Mais cette architecture n'assure en rien la sécurité des
données. En effet, si l'un des disques tombe en panne, la totalité des données du volume RAID est
perdue.

Le RAID 0 était utilisé dans les ordinateurs, dans le cadre d'applications nécessitant de gros
transferts de données (montage vidéo...), plutôt que dans des NAS.

Il peut être utilisé afin d'augmenter la bande passante d'un serveur nécessitant des supports de
stockage capables de supporter de très grandes quantités d'écritures.

Nota: en RAID matériel, la migration d'un RAID 0 avec plusieurs disques vers un RAID 1 est
rarement possible, alors que l'inverse l'est. Il est donc plus souple de démarrer en RAID 1.

RAID 1 : Disques en miroir

Le RAID 1 consiste en l'utilisation de n disques redondants (avec n≥2), chaque disque de la


grappe contenant à tout moment exactement les mêmes données, d'où l'utilisation du mot
« miroir » (mirroring en anglais).

Capacité
La capacité totale est égale à celle du plus petit élément de la grappe, l'espace excédentaire
des autres éléments de la grappe restant inutilisé. Il est donc conseillé d'utiliser des
éléments de capacité identique.
Fiabilité
Cette solution offre un excellent niveau de protection des données. Elle fonctionne tant
qu'il reste au moins un disque fonctionnel.
Coût
Les coûts de stockage sont élevés et directement proportionnels au nombre de miroirs
utilisés, alors que la capacité utile reste inchangée. Plus le nombre de miroirs est élevé, et
plus la sécurité augmente, mais plus son coût devient rédhibitoire.

Structure RAID 1
Gestion des disques durs, Système de fichier, Tolérance de panne

Les accès en lecture du système d'exploitation se font sur le disque le plus facilement accessible à
ce moment-là.[réf. nécessaire] Les écritures sur la grappe se font de manière simultanée sur tous les
disques pour que n'importe quel disque soit interchangeable à tout moment.

Lors de la défaillance de l'un des disques, le contrôleur RAID désactive (de manière transparente
pour l'accès aux données) le disque incriminé. Une fois le disque défectueux remplacé, le
contrôleur RAID reconstitue, soit automatiquement, soit sur intervention manuelle, le miroir. Une
fois la synchronisation effectuée, le RAID retrouve son niveau initial de redondance.

Nota: la migration du RAID 1 vers RAID 0, RAID 5, RAID 6 est presque toujours envisageable,
ce qui fait du RAID 1 une bonne solution de départ si on n'a pas un besoin important en
performance.
RAID 5 : volume agrégé par bandes à parité répartie

Le RAID 5 combine la méthode du volume agrégé par bandes (striping) à une parité répartie. Il
s'agit là d'un ensemble à redondance N+1. La parité, qui est incluse avec chaque écriture, se
retrouve répartie circulairement sur les différents disques. Chaque bande est donc constituée de N
blocs de données et d'un bloc de parité. Ainsi, en cas de défaillance de l'un des disques de la
grappe, pour chaque bande il manquera soit un bloc de données soit le bloc de parité. Si c'est le
bloc de parité, ce n'est pas grave, car aucune donnée ne manque. Si c'est un bloc de données, on
peut calculer son contenu à partir des N -1 autres blocs de données et du bloc de parité. L'intégrité
des données de chaque bande est préservée. Donc non seulement la grappe est toujours en état de
fonctionner, mais il est de plus possible de reconstruire le disque une fois échangé à partir des
données et des informations de parité contenues sur les autres disques.

On voit donc que le RAID 5 ne supporte la perte que d'un seul disque à la fois, ce qui devient un
problème depuis que les disques qui composent une grappe sont de plus en plus gros (1 To et
plus), car le temps de reconstruction de la parité en cas de disque défaillant est allongé (ce qui
augmente la probabilité de survenue d'une nouvelle défaillance car les autres disques durs sont
sollicités de façon intensive durant la reconstruction). Ainsi, le temps de reconstruction est long, et
plus les disques sont volumineux, plus la durée de reconstruction est longue. Pour limiter le risque,
il est courant d'ajouter un disque de rechange (spare), dédié au remplacement immédiat d'un
éventuel disque défaillant.

Un système RAID 5 doit donc être vérifié et sauvegardé périodiquement pour s'assurer que l'on ne
risque pas de tomber sur ce genre de cas.

Avantages :

Performances en lecture aussi élevées qu'en RAID 0,


Tolère la perte d'un disque.

Inconvénients :

Ralentissement en écriture du fait du calcul de la parité,


Capacité utile de n-1 disques sur un total de n disques.
Temps de reconstruction long pour les disques durs de grande capacité.
Gestion des disques dur, Système de fichiers, Tolérance de panne

Les niveaux de RAID peu courants

Concaténation de disques

NRAID : Near/Non Redundant Array of Inexpensive/Independent Disk

La concaténation de disques consiste à additionner les capacités de plusieurs disques durs en un


volume logique d'une taille équivalente à la somme des tailles des disques durs. Cette méthode
utilise une méthode d'écriture séquentielle : les données ne sont écrites sur le disque dur suivant
que lorsqu'il ne reste plus de place sur le précédent.

Le NRAID n'est pas à proprement parler un RAID, et il ne permet d'ailleurs aucune redondance de
données. La panne d'un disque peut avoir des conséquences désastreuses sur le reste des données
si des métadonnées critiques sont affectées.
Il est parfois confondu à tort avec le JBOD, qui désigne une baie de stockage regroupant des unités
accessibles individuellement, sans configuration spéciale.

Le NRAID est aussi désigné comme « Volume Simple » sous Windows (à partir de Windows
2000)

Le RAID 2 est aujourd'hui désuet. Il combine la méthode du RAID 0 (volume agrégé par bande) à
l'écriture d'un code de contrôle d'erreur sur un disque dur distinct. Or, l'écriture de ce code de
contrôle est désormais directement intégrée dans les contrôleurs de disques durs. Cette technologie
offre un bon niveau de sécurité, mais de mauvaises performances.

RAID 3 et RAID 4
Le RAID 3 et le RAID 4 sont semblables à ceci près que le premier opère par octets et le second
par blocs. Le RAID 4 ne nécessite pas autant de synchronisme entre les disques. Le RAID 3 tend
donc à disparaître au profit du RAID 4 qui offre des performances nettement supérieures.

RAID 3

 Si le disque de parité tombe en panne, il est possible de reconstruire l'information de parité


avec le contenu des autres disques de données.
 Si l'un des disques de données tombe en panne, il est possible de reconstruire l'information
avec le contenu des disques de données restants et celui du disque de parité.

Il est important que le disque de parité soit de bonne qualité, car il est à tout instant sollicité en
écriture. Ce dernier point est une des limitations des RAID 3 et 4.

De même, si plus d'un disque vient à défaillir, il est impossible de remédier à la perte de données.
Gestion des disques durs, Système de fichier, Tolérance de panne

RAID 6

Le RAID 6 est une évolution du RAID 5 qui accroît la sécurité en utilisant n informations
redondantes au lieu d'une. Il peut donc résister à la défaillance de n disques. Les fondements
mathématiques utilisés pour les informations de redondance du RAID 6 sont beaucoup plus
complexes que pour le RAID 5 ; de ce fait les implémentations de l'algorithme se limitent souvent
à n =2(soit la perte de 2 disques).

Si la sécurité est plus grande, le coût en matériel est plus élevé et la vitesse est moindre. La
puissance CPU nécessaire pour calculer les redondances et surtout pour reconstruire un volume
défectueux est également nettement plus importante.

Les défauts majeurs sont :

 Les temps d'écriture sont allongés à cause des calculs de redondance complexes.
 Le temps de reconstruction en cas de défaillance simultanée de 2 disques est nettement
allongé.

Le RAID 6 était peu utilisé du fait de son surcoût. Toutefois l'envolée des capacités des disques
durs ces dernières années ainsi que la vulgarisation de solutions professionnelles à base de disques
SATA a suscité un intérêt nouveau dans l'utilisation du RAID 6, que ce soit par le biais de
contrôleurs RAID matériels ou via du RAID logiciel (le noyau Linux 2.6 intègre le RAID 6).

Fiabilisation et réglages d'une installation RAID

Choix du contrôleur
La plupart des cartes-mères actuelles proposent un contrôleur RAID intégré. Il est toujours
préférable de choisir un contrôleur affecté à cette tâche. En plus de l'interface retenue, la mémoire
cache du contrôleur dédié est un facteur important dans les performances du système RAID.

Une carte RAID IDE Ultra 33


Gestion des disques dur, Système de fichiers, Tolérance de panne

Redondance de contrôleurs

Un paramètre à ne pas oublier dans la conception d'un RAID est le nombre d'interfaces contrôlant
les disques (cartes IDE, SCSI, SATA ou SAS). En effet, le contrôleur RAID est un élément
indispensable au fonctionnement de l'ensemble ; s'il vient à défaillir, il entraîne l'indisponibilité de
tous les éléments du RAID.

Si ce point est jugé crucial, il est possible de remédier à ce problème, en utilisant plus d'un
contrôleur. Par exemple, dans le cas d'un RAID 1 logiciel simple reposant sur l'utilisation de
disques IDE, il est conseillé de connecter chaque disque dur à un connecteur différent sur la carte-
mère. Dans les cas plus complexes, notamment lorsqu'il est fait usage d'une baie de disques
externes, il est possible de rajouter une ou plusieurs baies redondantes, permettant non seulement
de pallier la déficience de l'une d'entre elles, mais également de procéder à un équilibrage de
charge (load balancing), ce qui améliore notablement les performances, notamment en évitant les
goulots d'étranglement au niveau de la bande passante.

Les possibilités et les limites du RAID

Le RAID ne dispense pas d'effectuer des sauvegardes régulières. En effet, des défaillances à
plusieurs disques sont plus fréquentes que l'on ne le croit (voir section RAID 5 plus haut). De plus,
des erreurs humaines (effacement / corruption de fichiers) finissent toujours par se produire. Un
exemple classique de défaillance simultanée de plusieurs disques est le suivant : un premier disque
est victime d'un atterrissage de tête, provoquant la dislocation d'une partie de la surface des
plateaux ; mais le disque continuant de tourner se met à chauffer et atteint une température gênante
pour ses voisins… On comprendra que l'un des disques se trouvant à côté peut à son tour connaître
une défaillance du fait de la température locale excessive.

De plus, la taille des disques ne cessant de croître, un RAID dépassant les 12 To utiles (RAID 5 à
quatre disques de 4 To par exemple) sera probablement impossible à reconstruire, car atteignant la
limite de fiabilité des contrôleurs SATA (sauf pour des contrôleurs haut de gamme pour serveur) :
il sera presque sûr statistiquement qu'une erreur de lecture / écriture se produira pendant la
reconstruction. Cela serait aussi valable pour les RAID-Z

Ce que peut faire le RAID

 réduire les risques de pertes de données en cas de défaillance d'une unité de stockage ;
 réduire les pertes de productivité lors de la défaillance d'un disque ;
 améliorer les performances.

Ce que ne peut pas faire le RAID

 protéger totalement des défaillances matérielles (éventualité de pannes successives de


plusieurs unités de stockage ou du système RAID lui-même) ;
 protéger les données des erreurs humaines (suppression accidentelle de fichiers) ;
 protéger l'utilisateur des risques extérieurs au système (surcharge électrique qui grillerait
l'ensemble des disques, incendie, vol, inondation, vandalisme) ;
 protéger les données des virus qui pourraient corrompre les données.
 protéger par chiffrement nativement : le raid est un volume logique, et ne peut être chiffré
(sauf si un contrôleur dédié à une carte RAID le propose, mais qui impliquerait davantage
de ressource). Il faut alors, par exemple, créer un disque virtuel placé sur le volume RAID,
qui lui, pourra être chiffré nativement.
Gestion des disques durs, Système de fichier, Tolérance de panne

Comment le RAID peut poser problème


Le RAID a tendance à rendre les utilisateurs trop confiants. Cet excès de confiance en
une technologie, bien que très robuste et très fiable dans son principe, peut entraîner des
désastres. Multiplier le nombre de disques multiplie les risques de panne. De plus, les
disques utilisés par une grappe RAID sont souvent de même type et de même âge, et
auront donc une durée de vie similaire. C'est pourquoi il peut être judicieux d'utiliser des
disques qui soient du même modèle, mais pas de la même série (au cas où une série
particulière s'avérerait défectueuse). La complexité du système RAID ajoute des risques
technologiques : de rares mais possibles dysfonctionnements du contrôleur RAID, ou du
logiciel, sont à craindre. Un disque défectueux peut aussi perturber le fonctionnement
du contrôleur, logiquement ou électriquement, ce qui peut causer la perte de plusieurs
unités ; dans le cas d'un dysfonctionnement répété, la perte totale d'une grappe voire de
toute l'unité de stockage est possible.

 Les défaillances du système d'exploitation (intrinsèques ou dues à un problème de


configuration ou encore un conflit de composants) ;
 Une destruction de données par dysfonctionnement d'un logiciel, virus ou malveillance ;
 Les risques physiques classiques (feu, inondation, vol, foudre et surtensions externes,
surtensions internes à la machine, etc.), excepté pour les très onéreux miroirs distants
(remote mirroring).

Il n'est donc pas raisonnable de faire totalement confiance à un système de stockage de données,
quel qu'il soit. Il convient alors d'effectuer des sauvegardes régulières, la façon la plus sûre de
préserver une banque de données des avaries étant d'en stocker une sauvegarde sur un support
inerte dans un endroit sécurisé distant, régulièrement mis à jour et vérifié pour ce qui est de la
validité et de l'exploitabilité des fichiers.

L'augmentation progressive de la capacité des supports de stockage est un facteur qui augmente
exponentiellement la fragilité des systèmes RAID, comme l'a montré une étude sur les RAID 5 et
6

Évolutions du RAID

Une nouveauté dans la façon d'aborder la redondance des blocs disques est apparue au California
Institute of Technology, consistant à répliquer les blocs non pas à l'intérieur d'un seul serveur, mais
entre plusieurs serveurs à travers le réseau, ce qui s'apparente à un RAID réparti. Cette technique est
appelée RAIN (en), pour « Redundant Array of Independent Nodes » (ou « Reliable Array of
Inexpensive Nodes »), que l'on peut traduire par « réseau redondant de nœuds indépendants ». Les
principaux intérêts de cette architecture de stockage sont son niveau de performance et sa capacité
d'évolution

EN RESUME
Gestion des disques dur, Système de fichiers, Tolérance de panne

Architecture RAID : différences des configurations 0, 1, 5, 10, 01

En informatique, la technologie RAID (Redundant Array of Independent Disks ou regroupement


redondant de disques indépendants) permet d'améliorer la sécurité et/ou la performance des
disques d'un serveur (ou d'un pc).

Son principe consiste à répartir les données sur plusieurs disques durs. Cette répartition se fera
différemment en fonction des priorités et du budget de l'entreprise. Certaines configuration
privilégient la sécurité, d'autres la performance et certaines les deux.

Les configurations RAID les plus courantes

RAID 0

la configuration RAID 0 permet d'améliorer la performance du système en répartissant 50% des


données sur un disque et 50% sur l'autre.
Les deux disques travaillant simultanément, on dispose ainsi de performances deux fois plus
élevée.
Soit une donnée A et une donnée B :

• Volumétrie utile = Volumétrie totale


Les données n'étant pas dupliquées, il n'y aura pas de perte de volume stokage.

• Sécurité des données : FAIBLE


Il est fortement déconseillé d'utiliser cette configuration pour des serveurs assurant les services
critiques de votre entreprise. Les données n'étant à aucuns moments dupliquées seront perdues si
un des deux disques venait à être défectueux.

• Fonctionne uniquement sur deux disques


Gestion des disques durs, Système de fichier, Tolérance de panne

RAID 1

La configuration RAID 1 permet de sécuriser un système en disposant de deux disques avec


exactement les mêmes données. Dans cette configuration on ne recherche pas la performance mais
plutôt la sécurité.
Soit une donnée A et une donnée B :

• Volumétrie utile = Volumétrie totale / 2


Le disque 1 contenant exactement les mêmes données que le disque 2, la volumétrie utile sera
divisée par 2.

• Sécurité des données : BONNE


Si un disque venait à être défaillant, cela ne poserait pas de problèmes car le second prendrait
directement le relais.

RAID 5

La configuration RAID 5, par un système de parité, répartit une petite partie des données sur
chaque disque.
Dans cette configuration, ce n'est pas la performance qu'on recherche mais plutôt la sécurité tout
en économisant le volume de stockage.
Soit une donnée A, une donnée B et une donnée C :

• Volumétrie utile = Nombre de disques - 1 X capacité d'un disque


Pour 3 disques de 200 Go, on aurait ainsi 3 -1 X 200 = 400 Go de volumétrie utile.

• Sécurité des données : CORRECTE


Dans cette configuration, on ne peut se permettre de perdre qu'un seul disque.

• Nombre de disques nécessaires : Au moins 3


Gestion des disques dur, Système de fichiers, Tolérance de panne

RAID 10 (1+0)

La configuration RAID 10 répartit dans une première grappe les données en RAID 0, et dans une
seconde grappe temps en RAID 1.
Celle-ci permet ainsi de disposer du niveau de sécurité de la configuration RAID 1 avec les
performances qu'offre la configuration RAID 0.
Soit une donnée A et une donnée B :

• Volumétrie utile = Volumétrie totale / 2

• Sécurité des données : BONNE


Cette configuration offre un très bon niveau de sécurité car pour qu'une défaillance globale
apparaisse, il faudrait que tous les éléments d'une grappe présentent un défaut en même temps.

• Nombre de disques nécessaires : Au moins 4


Gestion des disques durs, Système de fichier, Tolérance de panne

RAID 01 (0+1)

A l'inverse de la configuration RAID 10, le RAID 01 répartit dans une première grappe les
données en RAID 1, puis dans une seconde grappe en RAID 0.
Soit une donnée A et une donnée B :

• Volumétrie utile = Volumétrie totale / 2

• Sécurité des données : MOYENNE


Dans cette configuration, si un disque présente un défaut, il entraîne une une défaillance de toute la
grappe et altère donc la performance du système.

4.4. POSSIBILITE DES DIFFERENTS SYSTEMES D'EXPLOITATION


MS-DOS ne possède rien en terme de tolérance de panne Windows 95 non plus Windows NT offre

trois des stratégies RAID citées ci-dessus et peut les exploiter sur tous les types de partition qu'il

sait gérer : RAID 0, RAID 1 et RAID 5

OS /2 ne permet que la récupération de secteurs défectueux Un serveur Netware permet de gérer

des disques miroir.

Vous aimerez peut-être aussi