Vous êtes sur la page 1sur 35

Chapitre 2: Architecture

des systèmes
R.A.I.D

1
Cours animé par A.MOHAMMEDI
1- Définition
• Le terme de RAID (Redundant Array of Independent/Inexpensive
Disks, c'est-à-dire un groupe de disques redondants et
indépendants/bon marché) désigne une architecture matérielle (et
parfois logicielle) permettant d'accélérer, de sécuriser et/ou de
fiabiliser les accès aux données stockées sur disques durs.
• Cette architecture est basée sur la multiplication des disques durs,
par opposition à la méthode SLED (Single Large Expensive Disk) où
toutes les données sont rassemblées sur un seul disque de prix élevé.
• L’ensemble de ces disques constitue une grappe.

2
2- Historique

• La première description de cette architecture date d'une publication


de 1987, dans une publication de Patterson, Gibson & Katz (3
chercheurs de l'Université de Berkeley). Cette publication comparait le
RAID au SLED et proposait cinq niveaux différents de RAID, chacun
d'eux ayant ses avantages et ses inconvénients.

3
3- Niveaux de RAID

• Il existe différents types d'architectures RAID et sont numérotés à


partir de 0 et peuvent se combiner entre eux (on parlera alors de
RAID 0+1, 1+0, etc...).
• A partir du RAID 1, les disques doivent être de même capacité et de
même constructeurs.

4
3.1- RAID 0

• Appelé STRIPING (entrelacement ou agrégat par bande), ce niveau ne


protège pas les données contre la perte.
• Il permet de voir un seul disque logique alors qu’il y a plusieurs
disques physiques.
• Dans cette configuration, chaque octet est divisé en autant de
morceaux (généralement de 32Ko) qu'il y a de disques.

5
• Exemple:
Avec un RAID 0 composé de quatre disques, si l'on veut écrire l'octet
00111001, le stockage des différents bits composant cet octet se fera
de la façon suivante :
➢ disque 1 : 00
➢ disque 2 : 11
➢ disque 3 : 10
➢ disque 4 : 01

6
• Ainsi, sur un RAID 0 de n disques, chaque disque ne doit lire et écrire
que 1/n des données, ce qui a pour effet de décupler les taux de
transfert des données entre le CPU et les disques, et donc d'accélérer
les traitements.

7
• Ce type de RAID est parfait pour des applications requérant un
traitement rapide d'une grande quantité de données.
• Mais cette architecture n'assure en rien la sécurité des données; en
effet, si l'un des disques tombe en panne, la totalité des données du
RAID est perdue, ce qui fait du RAID 0 une solution moins fiable que
l'utilisation d'un seul disque de stockage, puisque la probabilité de
défaillance d'un des disques du RAID est largement supérieure à la
probabilité de défaillance d'un disque unique.

8
3.2- RAID 1

• Appelé MIRRORING, Shadowing ou Duplexing, ce niveau de RAID


duplique les données sur un autre disque dur de la grappe.
• Si cette solution n'apporte aucun gain de performance, elle permet
en revanche de sécuriser les données en cas de défaillance d'un des
disques. Il est à noter que dans ce type de RAID, la perte de capacité
de stockage liée à l'utilisation des disques, est égale à 50% de la
capacité totale des disques utilisés.

9
3.3- RAID 2
• Ce système incorpore un contrôle d’erreur par code de Hamming
(ECC).
• Quant un mot est écrit sur le disque dur, un code ECC est écrit sur un
disque de correction d’erreurs.
• Quant un mot est lu sur le disque de stockage, une vérification de
l’ECC est effectuée sur le disque de correction d’erreurs pour s’assurer
que l’octet lu n’est pas erroné.
• Une grappe RAID 2 constituée de 4 disque dur pour le stockage des
données utiles utilisera 3 disques de plus pour la correction d’erreur.

10
• Exemple:
 4 Disques dur de données  3 disques dur pour la parité ECC
 16 disques dur de données  12 disques dur pour la parité ECC

Disque 1 Disque 2 Disque 3 Disque 4 Disque 5 Disque 6 Disque 7

A0 A1 A2 A3 ECC/Ax ECC/Ay ECC/Az

B0 B1 B2 B3 ECC/Bx ECC/By ECC/Bz

C0 C1 C2 C3 ECC/Cx ECC/Cy ECC/Cz

D0 D1 D2 D3 ECC/Dx ECC/Dy ECC/Dz

11
3.4- RAID 3

• Appelé Disk Array with bit Interleaved Data, ce niveau fonctionne


avec le même principe de correction d’erreur que le RAID 2.
• Un seul Disque dur de parité est nécessaire pour 3 disques dur de
données.
• Les données sont écrites octet par octet sur chaque disque dur.
• Le RAID 3 nécessite au minimum 3 disques.

12
• Exemple:
 3 Disques de 500 Go  1000 Go utilisable et 500 Go pour l’ECC

Disque 1 Disque 2 Disque 3


Octet 1 Octet 2 Parité 1 + 2
Octet 3 Octet 4 Parité 3 + 4
Octet 5 Octet 6 Parité 5 + 6

13
• Si un des disques de données tombe en panne, le RAID 3 peut être
reconstitué sans perte de données à partir du disque de parité.
• Si les 2 disques de données tombent simultanément en panne, les
données seront perdues sans possibilité de récupération.
• Si le disque de parité tombe en panne, le RAID 3 devient alors un
RAID 0.

14
3.5- RAID 4
• Appelé Disk Array with Parity Sector Interleaved Data, il est quasi-
équivalent au RAID 3 sauf qu’au lieu d’écrire les données octet par
octet, elles sont écrites bloc par bloc (un secteur de 512 Octet).
• Nécessite au minimum 3 disques dur dont 2 pour les données et le
troisième pour la parité.

Disque 1 Disque 2 Disque 3


Bloc 1 Bloc 2 Parité 1 + 2
Bloc 3 Bloc 4 Parité 3 + 4
Bloc 5 Bloc 6 Parité 5 + 6

15
• Les mêmes avantages et inconvénients que le RAID 3.
• En plus, si une données de taille inférieure à 512 Octet doit être
écrite, la parité du secteur entier doit être recalculé, ce qui fait
baisser les performances.

16
3.6- RAID 5
• Le RAID 5 associe le striping et un système à parité répartie, il permet
une bonne disponibilité (même en cas de défaillance d'un des disques
de stockage.
• Les données sont écrites bloc par bloc et chaque disque de la grappe
contient des données et de la parité. Ce qui améliore l’accès en
lecture et écriture (utilisation de plusieurs disques simultanément).
• Nécessite au minimum 3 disques dur mais il est recommandé
d’utiliser 5 disques.

17
• Si un disque dur tombe en panne, en remplaçant le disque, le RAID 5
se régénèrera automatiquement grâce aux autres disques.
• Au niveau capacité de stockage, on perd l’équivalent d’un disque.
Disque 1 Disque 2 Disque 3 Disque 4 Disque 5
Bloc 1 Bloc 2 Bloc 3 Bloc 4 Parité 1+2+3+4
Bloc 5 Bloc 6 Bloc 7 Parité 5+6+7+8 Bloc 8
Bloc 9 Bloc 10 Parité Bloc 11 Bloc 12
9+10+11+12
Bloc 13 Parité Bloc 14 Bloc 15 Bloc 16
13+14+15+16
Parité Bloc 17 Bloc 18 Bloc 19 Bloc 20
17+18+19+20
18
3.7- RAID 6
• Les données sont entrelacées sur plusieurs disques physiques et une
double parité est utilisée pour stocker et restaurer les données. Cette
configuration tolère la défaillance de deux disques dans une pile,
assurant ainsi une meilleure tolérance aux pannes que RAID 5. Elle
permet aussi d’utiliser des disques ATA et SATA plus économiques
pour le stockage des données vitales.
• Ce niveau RAID est similaire à RAID 5, mais il comprend un deuxième
schéma de parité qui est distribué sur des disques différents, et offre
donc une tolérance extrême aux pannes et aux défaillances de
disques. RAID 6 peut tolérer une double défaillance de disques.

19
3.8- RAID Hybride
• Avec les 6 niveaux de RAID précédents, on peut jouer avec les
configurations pour construire des architectures de disques rapides et
sûres. Les plus communéments utilisées sont:

➔ RAID 0+1 : Deux groupes de n disques en RAID 0, ces deux groupes sont en RAID 1.
➔ RAID 10 (1+0) : n groupes de deux disques en RAID 1, tous ceux-ci en RAID 0. Il faut
que deux disques d'un même groupe rendent l'âme pour que le tout soit perdu, ce qui
réduit la probabilité de panne.
➔ RAID 50 (5+0) : n groupes de trois disques en RAID 5, tous ceux-ci en RAID 0. Il faut
que deux disques d'un même groupe rendent l'âme pour que le tout soit perdu, ce qui
réduit encore la probabilité de défaillance. Un des meilleurs compromis lorsque l'on
cherche la rapidité.

20
4- Types de RAID

• Il existe trois grandes familles de RAID: logiciels, matériels internes et


matériels externes.

21
4.1- RAID Logiciel

• Les RAID logiciels font appels au système d'exploitation pour


découper et disperser les données sur les disques. C'est donc le CPU
qui travaille, ce qui pose des problèmes de performances sur les
systèmes exigeants.

22
4.2- RAID Matériel Interne
• Les RAID matériels internes sont implémentés par des contrôleurs,
typiquement des cartes filles connectées en PCI. Ainsi les contrôleurs
travaillent indépendamment de la charge CPU et de façon constante.
• Les données relatives à la configuration RAID se trouvent sur tous les
disques durs du système RAID et sont ainsi protégées même si l'un
des disques ou le contrôleur venait à tomber en panne. Lors de
l'échange du contrôleur ou d'un disque, les données de configuration
RAID sont reconstruites grâce aux informations stockées sur les
disques.

23
4.3- RAID Matériel Externe
• Les RAID matériels externes
(souvent appelés Network
Attached Storage [NAS])
représentent la solution RAID
dite de haut de gamme. Ici, les
contrôleurs et les disques durs
sont logés dans un boîtier
externe autonome par rapport
à l'ordinateur. La connexion
est assurée par un câble SCSI
ou Fibre Channel.
RAID Externe – 4*300Go et Controleur raid 0,1,5 24
• L'utilisation d'un contrôleur RAID redondant augmente le niveau de
sécurité. Lorsque le contrôleur primaire tombe en panne, l'ensemble
RAID commute automatiquement sur le second contrôleur, sans perte
de temps et de données. Le contrôleur défectueux peut alors être
remplacé en cours de fonctionnement.
• Les RAID matériels externes travaillent, comme le contrôleur RAID
PCI, indépendamment de la charge CPU. Les données de l'adaptateur
SCSI sont directement transmises au contrôleur RAID via le bus SCSI.

25
5- Connectique utilisée

• Le type de connectiques des périphériques d'un système RAID à un


impact immédiat sur les performances de celui-ci.

26
5.1- IDE

• La connectique IDE, acronyme de Integrated Drive Electronics, est la


plus répandue au sein des ordinateurs personnels. Son utilisation
dans les systèmes RAID est rare, hormis dans le cas d'un RAID logiciel
que l'on peut retrouver dans des stations personnelles ou sur des
serveurs de petites entreprises.

27
5.2- SCSI
• La plus implémentée des
connectiques RAID est sans
contexte SCSI (Small
computer System Interface).
Ce standard définit un bus
permettant de relier un
ordinateur à des
périphériques ou bien
même à un autre
ordinateur.

28
5.3- SATA

• Le Serial ATA est un bus principalement conçu pour le transfert de


données entre le CPU et un disque dur (a la différence de SCSI et IDE
qui sont plus généraux). C'est l'évolution du standard Advanced
Technology Attachment (ATA ou IDE). Le S-ATA a de multiples
avantages par rapport à l'IDE, les trois principaux étant sa vitesse, la
gestion des câbles et le Hot-Plug.

29
• Les premiers modèles de S-ATA, apparus en 2003 permettent un débit
théorique de 150 Mo/s mais il a été conçu pour aller bien plus vite.
• Le S-ATA 2 double sa vitesse à 300 Mo/s, puis les 600 Mo/s rattrapant
ainsi les 640mo/s du Ultra-640 SCSI, Physiquement les câbles utilisés
sont le plus grand changement du S-ATA.
• Les données sont transmises par un fil flexible de sept conducteurs
avec des connecteurs de 8 mm à chaque extrémité. Le Sata utilise
l'encodage 8b/10b pour effectuer des transferts (technique
d'encodage permettant une haute vitesse de transmission),

30
6- Contrôleurs

• Il existe plusieurs types et plusieurs marques de contrôleurs RAID.


• Parmi ces contrôleurs on peut citer Adaptec SCSI RAID 2200S, LSI
Logic MegaRAID S-ATA 300-8X.

31
6.1- Adaptec SCSI RAID 2200S
• Adaptec est un des leader
mondiaux des contrôleurs RAID.
• Ce modèle utilise une interface
SCSI-3 Ultra-320 et gére les
niveaux de RAID 0,1,5,10,50 et
JBOD (addition de disques
disparates sans tolérance de
pannes). La Strip-size (taille des
blocs de données) est configurable
de 16Ko à 32Ko. Il dispose de 2
connecteur internes et 2 externes
et d'une mémoire cache de 64Mo.
32
• Fonctionnalités avancées:
➢ Batterie de secours pour maintenir le cache en cas de coupure de courant.
➢ Strip-Size variable: possibilité de modifier la Strip-Size aprés la création du
RAID et sans destruction de la grappe.
• Performances:
➢ RAID0: lecture=110,1 Mo/s et écriture=62,6 Mo/s
➢ RAID5: lecture=83,6 Mo/s et écriture=56,8 Mo/s
• Administration:
➢ Interface web sécurisée par SSL
➢ Interface ligne de commande

33
6.2- LSI Logic MegaRAID S-ATA 300-8X

• LSI Logic est également un important constructeur de contrôleurs


RAID.
• Ce modèle présente les caractéristiques suivantes:
• La carte est équipé de 8ports SATA2 300 internes qui permettent un
débit de 3Gb/s par port, soit 384Mo/s théoriques. Les niveaux
supportés sont les mêmes que ceux de l'Adaptec, à l'exception du
mode JBOD (à l'utilité plus que discutable). Il s'appuie sur la nouvelle
norme de bus PCI: le PCI Express.

34
• Fonctionnalités avancées:
➢ Batterie de secours pour maintenir le cache en cas de coupure de courant.
➢ Annonce acoustique des erreurs critiques.
➢ Migration RAID 0 vers RAID 10 et RAID 5 vers RAID 50
• Performances:
➢ RAID0: lecture=121,1 Mo/s et écriture=58,9 Mo/s
➢ RAID5: lecture=77,5 Mo/s et écriture=49,4 Mo/s
• Administration:
➢ Ligne de commande uniquement

35

Vous aimerez peut-être aussi