Académique Documents
Professionnel Documents
Culture Documents
Rsum
Ce livre blanc fournit une tude approfondie des principaux
composants du systme dexploitation et du systme de
fichiers EMC Isilon OneFS. Il dcrit en dtail les logiciels, le
matriel, larchitecture distribue et les diffrents
mcanismes de protection des donnes qui font de OneFS
une solution de stockage dentreprise trs flexible, facile
grer et hautement volutive en matire de capacit, ainsi
que de performances.
Juillet 2014
Copyright 2014 EMC Corporation. Tous droits rservs.
Rfrence H10719.4
Nuds Isilon
OneFS fonctionne exclusivement avec les nuds scale-out NAS Isilon, appels
cluster . Un cluster Isilon se compose de plusieurs nuds conus comme des
appliances dentreprise montables en rack contenant : la mmoire, le CPU, le
rseau, la RAM non volatile (NVRAM), les interconnexions InfiniBand faible
latence, les contrleurs de disques et les supports de stockage. Chaque nud du
cluster distribu possde ainsi des fonctions de calcul ou de traitement ainsi que
des fonctions de stockage ou de capacit.
Un cluster Isilon commence avec trois nuds uniquement, et peut actuellement
voluer jusqu 144 nuds (rgis par le switch InfiniBand de 144 ports le plus
tendu, qualifi par Isilon). Il existe diffrents types de nud qui peuvent tous
tre intgrs dans un seul cluster sur lequel diffrents nuds fournissent
diffrents rapports de capacit de dbit ou dE/S par seconde (IOPS).
Rseau
Il existe deux types de rseau associs un cluster : internes et externes.
Rseau back-end
Toutes les communications entre les nuds dun cluster seffectuent laide dun
protocole unicast (nud nud) propritaire. La communication utilise un rseau
InfiniBand (IB) faible latence, extrmement rapide. Ce rseau back-end,
configur avec des switches redondants pour garantir une haute disponibilit, joue
le rle de backplane pour le cluster en permettant chaque nud dagir en tant
que contributeur et en isolant la communication de nud nud un rseau
priv, haute vitesse, faible latence. Ce rseau back-end utilise le protocole
Internet (IP) sur IB pour la communication entre les nuds.
Rseau front-end
Les clients se connectent au cluster laide de connexions Ethernet (1 GbE ou
10 GbE) disponibles sur tous les nuds. Puisque chaque nud fournit ses propres
ports Ethernet, la bande passante rseau disponible pour le cluster volue de
faon linaire par rapport aux performances et la capacit. Le cluster Isilon
prend en charge les protocoles de communication rseau standard vers un rseau
du client, notamment NFS, CIFS, HTTP, FTP et HDFS.
Services clients
Les protocoles front-end que les clients peuvent utiliser pour interagir avec OneFS
sont dsigns sous le nom de services clients. Reportez-vous la section
Protocoles pris en charge pour obtenir la liste dtaille des protocoles pris en
charge. Pour comprendre comment OneFS communique avec les clients, nous
avons divis le sous-systme dE/S en deux moitis : la partie suprieure ou
initiateur et la partie infrieure ou participant . Tous les nuds du cluster
sont des participants une opration dE/S spcifique. Le nud auquel le client se
connecte est linitiateur et ce nud agit en tant que capitaine pour lensemble
des oprations dE/S. Les oprations de lecture et dcriture sont dtailles dans
les sections ultrieures.
Les tches de prise en charge des fonctions effectuent un travail qui facilite
certaines fonctions de gestion du stockage tendues et ne fonctionnent
gnralement que lorsque la fonction a t configure. Il sagit notamment
de la dduplication et de lanalyse antivirus.
En outre, les tches du moteur de tches sont hirarchises sur une chelle de un
dix, une valeur faible indiquant une priorit leve. Ce concept est semblable au
concept de lutilitaire de planification UNIX, nice .
OneFS est un systme de fichiers unique dot dun espace de nommage. Les
donnes et les mtadonnes sont rparties entre les nuds des fins de
redondance et de disponibilit. Le stockage a t entirement virtualis pour les
utilisateurs et ladministrateur. Larborescence de fichiers peut augmenter de faon
organique sans quil soit ncessaire de planifier ni de superviser le mode de
croissance de larborescence ou la manire dont les utilisateurs lemploient.
Ladministrateur na pas se proccuper de la hirarchisation des fichiers sur le
disque appropri, car Isilon SmartPools sen charge automatiquement sans
gnrer dinterruption pour larborescence unique. Il nest pas ncessaire
daccorder une attention particulire la manire dont il est possible de rpliquer
une telle arborescence, car le service Isilon SyncIQTM paralllise automatiquement
le transfert de larborescence de fichiers vers un ou plusieurs autres clusters, sans
tenir compte de la forme ou de la profondeur de larborescence de fichiers.
critures de fichier
Le logiciel OneFS sexcute de faon gale sur tous les nuds, ce qui cre un
systme de fichiers unique qui sexcute sur chaque nud. Aucun nud ne
contrle le cluster ; tous les nuds sont de vritables homologues.
OneFS utilise le rseau back-end InfiniBand pour allouer et rpartir les donnes
sur tous les nuds du cluster automatiquement ; par consquent, aucun
traitement supplmentaire nest requis. mesure que les donnes sont crites,
elles sont protges au niveau spcifi.
Lorsque les oprations dcriture sont effectues, OneFS divise les donnes en
units atomiques appeles groupes de protection. La redondance est intgre dans
des groupes de protection, de telle sorte que si chaque groupe de protection est
scuris, le fichier entier est scuris. Pour les fichiers protgs par des codes
deffacement, un groupe de protection se compose dune srie de blocs de
donnes, ainsi que dun ensemble de codes deffacement pour ces blocs de
donnes. Pour les fichiers mis en miroir, un groupe de protection comprend tous
les miroirs dun ensemble de blocs. OneFS est capable de changer le type du
groupe de protection utilis dans un fichier de faon dynamique, mesure de
lcriture. Cela peut autoriser de nombreuses fonctions supplmentaires,
notamment en permettant au systme de continuer sans blocage dans les
situations o les dfaillances temporaires de nud dans le cluster empcheraient
dutiliser le nombre souhait de codes deffacement. La mise en miroir peut tre
utilise temporairement dans ces cas pour permettre aux critures de continuer.
Lorsque les nuds sont restaurs dans le cluster, ces groupes de protection mis
en miroir sont convertis de manire transparente et automatique en code
deffacement protg, sans intervention de ladministrateur.
Chaque nud dtenant des blocs dans une criture particulire est impliqu dans
une validation deux phases. Le mcanisme sappuie sur la NVRAM pour consigner
toutes les transactions effectues sur chaque nud du cluster de stockage.
Lutilisation de plusieurs NVRAM en parallle autorise les critures haut dbit tout
en prservant la scurit de donnes contre tous les types de dfaillance, y compris
les coupures dalimentation. Si un nud tombe en panne au cours dune transaction,
la transaction est redmarre instantanment sans ce nud. Lorsque le nud est
rtabli, les seules actions requises sont la relecture de son journal depuis la NVRAM,
qui prend quelques secondes ou minutes, et le rquilibrage par AutoBalance des
fichiers impliqus dans la transaction. Les processus coteux fsck ou disk-
check ne sont jamais obligatoires. Aucune longue resynchronisation nest jamais
ncessaire. Les critures ne sont jamais bloques la suite dune panne. Le
systme de transaction brevet est lune des mthodes utilises par OneFS pour
liminer un seul point de dfaillance, voire plusieurs.
Dans une opration dcriture, linitiateur (capitaine) dirige ou orchestre la
rpartition des donnes et des mtadonnes, la cration des codes deffacement et
les oprations normales de gestion des verrous et de contrle des autorisations.
partir de linterface de gestion Web ou de linterface CLI, un administrateur peut
tout moment optimiser les dcisions de rpartition prises par OneFS pour
amliorer le workflow. Ladministrateur peut effectuer un choix parmi les modles
daccs ci-dessous, un niveau de fichier individuel ou de rpertoire :
Accs simultans : optimise la charge actuelle sur le cluster, avec de
nombreux clients simultans. Ce paramtre constitue le meilleur
comportement pour les charges applicatives mixtes.
Lecture en temps rel : optimise la lecture en temps rel haut dbit dun seul
fichier, par exemple pour activer la lecture trs rapide avec un client unique.
Pour laccs la mmoire distante, OneFS utilise le protocole SDP (Sockets Direct
Protocol) sur une interconnexion back-end Infiniband (IB) sur le cluster, cest--
dire un bus systme distribu. SDP fournit une interface efficace de type socket
entre les nuds qui, grce une topologie en toile organise autour dun switch,
garantit que les adresses mmoire distantes sont ne jamais un plus dun hop IB.
Bien que ntant pas aussi rapide que la mmoire locale, laccs la mmoire
distante est nanmoins trs rapide grce la faible latence IB.
OneFS utilise jusqu trois niveaux de cache de lecture, ainsi quun cache
dcriture, ou fusionneur, reposant sur la NVRAM. Ces diffrents niveaux et leur
interaction gnrale sont illustrs dans le schma suivant.
OneFS impose quun fichier soit crit sur plusieurs nuds du cluster, et
ventuellement sur plusieurs disques dun nud, afin que toutes les demandes de
lecture impliquent la lecture de donnes distantes (et ventuellement locales).
Lorsquune demande de lecture arrive dun client, OneFS dtermine si les donnes
demandes sont prsentes dans le cache local. Les donnes rsidant dans le cache
local sont lues immdiatement. Si les donnes demandes ne se trouvent pas dans le
cache local, elles sont lues partir du disque. Pour les donnes qui ne sont pas sur le
nud local, une demande est effectue depuis les nuds distants sur lesquels elles
rsident. Sur chacun des autres nuds, une autre recherche de cache est excute.
Toutes les donnes contenues dans le cache sont retournes immdiatement, et
celles qui ne sont pas dans le cache sont rcupres sur le disque.
Lorsque les donnes ont t rcupres des caches local et distant (et
ventuellement du disque), elles sont retournes au client.
1. Dterminez si une partie des donnes demandes est dans le cache N1 local.
Si oui, retournez-les au client.
2. Si elles ne figurent pas dans le cache local, demandez-les au ou aux nuds
distants.
Lectures de fichier
Dans un cluster Isilon, les donnes, les mtadonnes et les inodes sont tous
distribus sur plusieurs nuds, voire plusieurs disques dans les nuds. Lors de la
lecture ou de lcriture dans le cluster, le nud auquel un client se connecte agit
en tant que capitaine pour lopration.
E/S multithread
Lutilisation croissante de vastes datastores NFS pour la prise en charge de la
virtualisation des serveurs et des applications dentreprise ncessite des dbits
levs et une faible latence pour les fichiers volumineux. Pour prendre en compte
cette ncessit, OneFS Multi-writer prend en charge plusieurs threads capables
dcrire simultanment dans des fichiers individuels.
Reconstruction volutive
OneFS ne dpend pas de la mise en uvre RAID matrielle pour lallocation de
donnes ou pour la reconstruction des donnes aprs une panne. Au lieu de cela,
OneFS gre la protection des donnes des fichiers directement, et lorsquune
panne se produit, OneFS reconstruit les donnes en mode paralllis. OneFS peut
dterminer quels fichiers sont affects par une panne dans le temps constant, en
lisant les donnes inode dune manire linaire, directement depuis le disque.
Lensemble de fichiers affects est attribu un jeu de threads de travail qui sont
rpartis entre les nuds de cluster par le moteur de tches. Les nuds de
traitement rparent les fichiers en parallle. Cela implique qu mesure que la
taille du cluster augmente, le dlai de reconstruction aprs une panne diminue.
Cest un avantage considrable en termes defficacit car la rsilience des clusters
est maintenue mesure que leur taille augmente.
Les clusters plus petits peuvent bnficier dune protection N+1, mais cela
implique que si un seul disque ou nud peut tre restaur, il est impossible de
restaurer deux disques prsents dans deux nuds distincts. Les dfaillances de
disque sont beaucoup plus susceptibles de se produire que les dfaillances de
nud. Pour les clusters dots des disques de grande taille, il est prfrable
dassurer la protection contre plusieurs dfaillances de disque, bien que la
restauration de nud unique soit acceptable.
Pour fournir un exemple de situation o il est souhaitable de bnficier de la
redondance de deux disques et de la redondance de nud unique, nous pouvons
crer des groupes de protection longueur double. Ces groupes de protection
longueur double sont appliqus une fois au mme ensemble de nuds,
lorsquils sont rpartis. Comme tous les groupes de protection contiennent
exactement lquivalent de deux disques de redondance, ce mcanisme permettra
au cluster de rsister une panne de deux disques ou une panne du nud
complet, sans indisponibilit des donnes.
Le plus important pour les petits clusters, cest que cette mthode de rpartition
est trs efficace, avec une efficacit sur disque de M/(N+M). Par exemple, sur un
cluster de cinq nuds avec une protection contre les doubles dfaillances, si nous
utilisons les valeurs N=3 et M=2, nous obtenons un groupe de protection 3+2
avec une efficacit de 12/5, soit 60 %. Avec le mme cluster 5 nuds mais
avec chaque groupe de protection rparti sur 2 bandes, N serait prsent gal 8
et M 2, ce qui nous permettrait dobtenir une efficacit sur disque de 1-2/(8+2),
soit 80 %, avec maintien de la protection contre les doubles dfaillances de
disques, et perte uniquement de la protection contre les dfaillances de deux
nuds.
OneFS prend en charge les niveaux de protection du code deffacement N+1, N+2,
N+3 et N+4 (dfaillance de un quatre disques ou dfaillance de nud complet
par cluster), ainsi que les niveaux de protection N+2:1 (tolrance pour deux
disques et un seul nud) et N+3:1 (tolrance pour trois disques et un seul nud).
En outre, les niveaux de protection en miroir compris entre deux et huit (mise en
miroir entre deux et huit fois) sont galement fournis pour le fichier et les
mtadonnes. La protection des donnes OneFS est galement trs flexible, ce qui
permet dappliquer la protection au niveau de fichiers individuels, de rpertoires et
de leur contenu, ou au niveau du systme de fichiers entier.
Partitionnement automatique
La hirarchisation et la gestion des donnes de OneFS sont assures par le
framework SmartPools. Du point de vue de lefficacit de la protection et de la
rpartition des donnes, SmartPools facilite la subdivision dun grand nombre de
nuds de grande capacit et homognes en pools de disques plus petits et plus
compatibles avec le ratio MTTDL (Mean Time to Data Loss, temps moyen/perte de
donnes). Par exemple, un cluster de 80 nuds nearline (NL) fonctionnerait
gnralement avec un niveau de protection +4. Toutefois, le partitionnement en
quatre pools de disques de vingt nuds permettrait chaque pool de sexcuter
avec une protection +2:1, ce qui diminuerait le temps systme de protection et
amliorerait le taux dutilisation de lespace, sans provoquer daugmentation nette
des frais de gestion.
En accord avec lobjectif de simplicit de la gestion du stockage, OneFS calculera
et partitionnera automatiquement le cluster en pools de disques, ou pools de
nuds, optimiss pour le ratio MTTDL et un taux dutilisation efficace de lespace.
Cela signifie que les dcisions relatives au niveau de protection, telles que dans
lexemple du cluster de 80 nuds ci-dessus, ne sont pas laisses lapprciation
du client, sauf sil le souhaite.
Grce au provisionnement automatique, chaque ensemble de matriel de nud
quivalent est automatiquement divis en pools de nuds pouvant inclure jusqu
quarante nuds et six disques par nud. Ces pools de nuds bnficient par
dfaut dune protection +2:1. Plusieurs pools peuvent ensuite tre combins en
niveaux logiques et grs laide de rgles de pools de fichiers SmartPools. En
subdivisant les disques dun nud en plusieurs pools protgs sparment, les
nuds sont plus rsilients quauparavant aux multiples pannes de disque.
Interfaces
Les administrateurs peuvent utiliser plusieurs interfaces pour grer un cluster de
stockage Isilon dans leur environnement :
Interface utilisateur dadministration Web (WebUI)
Interface de ligne de commande via laccs rseau SSH ou la connexion srie
RS232
cran LCD sur les nuds eux-mmes pour des fonctions dajout/de
suppression simples
API RESTful de plate-forme pour le contrle et lautomatisation par
programmation de la configuration et de la gestion du cluster.
LDAP
Le protocole LDAP (Lightweight Directory Access Protocol) est un protocole rseau
utilis pour dfinir, interroger et modifier des services et des ressources. Son
principal avantage rside dans le caractre ouvert des services dannuaire et dans
la possibilit de lutiliser sur un grand nombre de plates-formes. Le systme de
stockage en cluster Isilon peut utiliser LDAP pour authentifier les utilisateurs et les
groupes en vue de les autoriser accder au cluster.
NIS
NIS, ou Network Information Service, est un protocole de services dannuaire
conu par Sun Microsystems. Il peut tre utilis par le systme Isilon pour
authentifier les utilisateurs et les groupes lors de laccs au cluster. NIS, parfois
appel Yellow Pages (YP), est diffrent de NIS+, que le cluster Isilon ne prend pas
en charge.
Utilisateurs locaux
Le systme de stockage en cluster dIsilon prend en charge lauthentification des
utilisateurs et des groupes locaux. Vous pouvez crer des comptes utilisateur et de
groupe locaux directement sur le cluster, laide de linterface WebUI.
Lauthentification locale peut se rvler utile si vous nutilisez pas de services
dannuaire tels quActive Directory, LDAP ou NIS, ou lorsquun utilisateur ou une
application spcifique a besoin daccder au cluster.
Access Zones
Access Zones fournit une mthode permettant de partitionner logiquement laccs
au cluster et dallouer les ressources pour les units autonomes, offrant ainsi un
environnement partag de tenant. Pour faciliter le processus, Access Zones
associe les trois principaux composants daccs externes :
Configuration du rseau du cluster
Protocole daccs aux fichiers
Authentification
Gestion des
Isilon for vCenter Gestion des fonctions Isilon depuis vCenter.
donnes
Conclusion
Avec OneFS, les entreprises et les administrateurs peuvent bnficier dune
volutivit de 18 To 20 Po dans un systme de fichiers unique, un volume
unique, avec un point dadministration unique. OneFS offre de hautes
performances et/ou un dbit lev, sans augmenter la complexit de la gestion.
Les datacenters nouvelle gnration doivent tre conus pour une volutivit
durable. Ils doivent matriser la puissance de lautomatisation, tirer parti de
luniformisation du matriel, garantir la consommation totale du fabric rseau et
offrir une flexibilit optimale aux entreprises soucieuses de satisfaire un ensemble
dexigences en constante volution.
OneFS est le systme de fichiers nouvelle gnration conu pour relever ces dfis.
OneFS offre les avantages suivants :
systme de fichiers unique entirement distribu ;
performances optimales, cluster 100 % symtrique ;
rpartition des fichiers sur tous les nuds du cluster ;
logiciel automatis pour liminer la complexit ;
quilibrage dynamique du contenu ;
protection flexible des donnes ;
haute disponibilit ;
administration via interface Web et CLI.
OneFS est particulirement adapt aux applications de Big Data bases sur
des fichiers ou des donnes non structures dans des environnements dentreprise
(rpertoires personnels grande chelle, partages de fichiers, archives,
virtualisation, analytique mtier), mais aussi dans divers environnements
informatiques hautes performances utilisant les donnes de faon intensive
(exploration des ressources nergtiques, services financiers, services Internet et
dhbergement, business intelligence, ingnierie, fabrication, multimdia et
divertissement, bioinformatique, recherche scientifique, etc.).