Isilon Onefs Technical Overview WP

Livre blanc
EMC ISILON ONEFS : PRESENTATION

TECHNIQUE
Rsum
Ce livre blanc fournit une tude approfondie des principaux
composants du systme dexploitation et du systme de
fichiers EMC Isilon OneFS. Il dcrit en dtail les logiciels, le
matriel, larchitecture distribue et les diffrents
mcanismes de protection des donnes qui font de OneFS
une solution de stockage dentreprise trs flexible, facile
grer et hautement volutive en matire de capacit, ainsi
que de performances.
Juillet 2014
Copyright 2014 EMC Corporation. Tous droits rservs.
EMC estime que les informations figurant dans ce document

sont exactes la date de publication. Ces informations sont
modifiables sans pravis.
Les informations contenues dans cette publication sont

fournies en ltat . EMC Corporation ne fournit aucune
dclaration ou garantie daucune sorte concernant les
informations contenues dans cette publication et rejette plus
spcialement toute garantie implicite de qualit commerciale
ou dadquation une utilisation particulire.
Lutilisation, la copie et la diffusion de tout logiciel EMC dcrit

dans cette publication ncessitent une licence logicielle en
cours de validit.
Pour obtenir la liste actualise des noms de produits,

consultez la rubrique des marques EMC via le lien Lgislation,
sur france.emc.com.
Toutes les autres marques cites dans le prsent document

sont la proprit de leurs dtenteurs respectifs.
Rfrence H10719.4
EMC Isilon OneFS : prsentation technique 2

Index
Introduction ................................................................................................... 5
Prsentation dEMC Isilon OneFS ................................................................... 6
Nuds Isilon .................................................................................................. 6
Rseau ........................................................................................................... 7
Rseau back-end .......................................................................................... 7
Rseau front-end .......................................................................................... 7
Vue du cluster complet................................................................................... 8
Prsentation du logiciel OneFS ....................................................................... 8
Systme dexploitation ..................................................................................8
Services clients ............................................................................................ 8
Oprations du cluster ....................................................................................9
Structure du systme de fichiers .................................................................. 12
Rpartition des donnes............................................................................... 14
critures de fichier ....................................................................................... 15
Mise en cache OneFS .................................................................................... 20
Lectures de fichier........................................................................................ 22
Verrous et accs simultan .......................................................................... 24
E/S multithread ........................................................................................... 25
Protection des donnes ................................................................................ 26
Perte dalimentation .................................................................................... 26
Pannes matrielles et quorum ...................................................................... 27
Dfaillances matrielles ajout/suppression de nuds ................................... 27
Reconstruction volutive .............................................................................. 28
Disque de secours virtuel ............................................................................. 28
Protection des donnes N+M ........................................................................ 28
Partitionnement automatique ....................................................................... 31
Protocoles pris en charge ............................................................................. 32
volutivit dynamique/volutivit la demande ......................................... 33
Performances et capacit ............................................................................. 33
Interfaces .................................................................................................... 34
Authentification et contrle daccs ............................................................. 34
Active Directory .......................................................................................... 35
LDAP ........................................................................................................ 35
NIS........................................................................................................... 35
Utilisateurs locaux ...................................................................................... 35
Access Zones ............................................................................................. 35
Administration base sur des rles ................................................................ 36
Mise niveau des logiciels ........................................................................... 36
Mise niveau simultane ............................................................................. 36
Mise niveau conscutive ............................................................................ 36
Ralisation de la mise niveau ..................................................................... 37

Logiciels de gestion et de protection des donnes EMC Isilon ...................... 37
Conclusion.................................................................................................... 38
propos dEMC ............................................................................................ 39

Introduction
En 2000, face aux dfis lis aux architectures de stockage traditionnelles et au
rythme de croissance des donnes en mode fichier, les fondateurs dIsilon Systems
ont commenc travailler sur une nouvelle architecture de stockage
rvolutionnaire : le systme dexploitation OneFS. La diffrence fondamentale du
stockage EMC Isilon est quil utilise un logiciel intelligent pour faire voluer les
donnes sur de grandes quantits de matriel gnrique en stimulant la croissance
exponentielle de performances et de capacit. Les trois couches du modle de
stockage traditionnel (systme de fichiers, gestionnaire de volume et protection des
donnes) ont volu au fil du temps pour sadapter aux besoins des architectures de
stockage petite chelle, mais prsentent plus de complexit et ne sont pas trs
adaptes aux systmes capables dvoluer vers plusieurs ptaoctets. OneFS
remplace tous ces lments et fournit un systme de fichiers en cluster unifi dot
dune protection des donnes volutive intgre, et permet de ne pas avoir besoin
de grer les volumes. OneFS est un module fondamental pour les infrastructures
scale-out, garantissant une importante volutivit et une trs grande efficacit.
De par sa conception, OneFS sadapte non seulement aux machines, mais
galement au personnel, permettant aux systmes grande chelle dtre grs
avec une fraction du personnel requis pour les systmes de stockage traditionnels.
OneFS limine la complexit et intgre des fonctionnalits dautorparation et
dautogestion qui rduisent considrablement les tches de gestion du stockage.
OneFS intgre galement le paralllisme un niveau trs profond du systme
dexploitation, de sorte que presque tous les services systme cls sont distribus
entre plusieurs units de matriel. Ainsi, OneFS peut voluer dans pratiquement
toutes les dimensions mesure que linfrastructure se dveloppe, garantissant que
les stratgies qui fonctionnent aujourdhui continueront de fonctionner mesure
que la taille du Dataset augmente.
OneFS est un systme de fichiers parfaitement symtrique sans point unique de
dfaillance qui tire parti du clustering pour adapter les performances et la capacit,
mais aussi pour permettre un basculement sur incident de/vers nimporte quel
systme et plusieurs niveaux de redondance qui vont bien au-del des capacits
RAID. La tendance, pour les sous-systmes de disques, est une augmentation lente
des performances et une augmentation rapide des densits de stockage. OneFS
rpond cette ralit en faisant voluer la quantit de redondance et la vitesse de
rparation des pannes. Cela permet OneFS dvoluer jusqu plusieurs ptaoctets
tout en offrant plus de fiabilit que les petits systmes de stockage traditionnels.
Le matriel scale-out NAS Isilon fournit lappliance sur laquelle sexcute OneFS.
Les composants matriels sont innovants mais universels, ce qui garantit que le
matriel Isilon bnficie des courbes defficacit et de cot en constante
amlioration du matriel gnrique. OneFS permet au matriel dtre incorpor ou
retir du cluster volont et tout moment, en soustrayant les donnes et les
applications de ce matriel. Les donnes possdent une longvit illimite et sont
protges contre les vicissitudes lies lvolution du matriel. Le cot lev et
les difficults lies aux migrations de donnes, de mme que lactualisation du
matriel, sont limins.

OneFS est particulirement adapt aux applications de Big Data bases sur
des fichiers ou des donnes non structures dans des environnements
dentreprise : rpertoires personnels grande chelle, partages de fichiers,
archives, virtualisation et analytique mtier. De ce fait, OneFS est trs rpandu
dans de nombreux secteurs grant lheure actuelle dimportants volumes de
donnes, comme lnergie, les services financiers, Internet et les services
dhbergement, la business intelligence, lingnierie, la fabrication, les mdias et le
divertissement, la bioinformatique, la recherche scientifique et dautres
environnements informatiques hautes performances.
Prsentation dEMC Isilon OneFS

OneFS regroupe les trois couches des architectures de stockage traditionnel
(systme de fichiers, gestionnaire de volume et protection des donnes) en une
seule couche logicielle unifie, constituant ainsi un seul systme de fichiers
intelligent et distribu qui sexcute sur un cluster de stockage Isilon.
Figure 1 : OneFS associe un systme de fichiers, un gestionnaire de

volume et la protection des donnes dans un systme unique, intelligent
et distribu.
Il sagit de linnovation principale qui permet directement aux entreprises dutiliser

avec succs le stockage scale-out NAS dans leurs environnements actuels. OneFS
est conforme aux principes cls du scale-out ; logiciel intelligent, composants
matriels gnriques et architecture distribue. OneFS nest pas uniquement le
systme dexploitation, mais galement le systme de fichiers sous-jacent qui
dirige et stocke les donnes dans le cluster scale-out NAS Isilon.
Nuds Isilon
OneFS fonctionne exclusivement avec les nuds scale-out NAS Isilon, appels
cluster . Un cluster Isilon se compose de plusieurs nuds conus comme des
appliances dentreprise montables en rack contenant : la mmoire, le CPU, le
rseau, la RAM non volatile (NVRAM), les interconnexions InfiniBand faible
latence, les contrleurs de disques et les supports de stockage. Chaque nud du
cluster distribu possde ainsi des fonctions de calcul ou de traitement ainsi que
des fonctions de stockage ou de capacit.
Un cluster Isilon commence avec trois nuds uniquement, et peut actuellement
voluer jusqu 144 nuds (rgis par le switch InfiniBand de 144 ports le plus
tendu, qualifi par Isilon). Il existe diffrents types de nud qui peuvent tous
tre intgrs dans un seul cluster sur lequel diffrents nuds fournissent
diffrents rapports de capacit de dbit ou dE/S par seconde (IOPS).

OneFS ne dispose daucune limite en termes de nombre de nuds pouvant tre
inclus dans un seul systme. Chaque nud ajout un cluster augmente la
capacit cumule en termes despace disque, de cache, de CPU et de rseau.
OneFS valorise chaque module matriel, ce qui signifie que lensemble est plus
important que la somme des parties. La RAM est regroupe dans un seul cache
cohrent, permettant ainsi aux E/S sur nimporte quelle partie du cluster de
bnficier des donnes mises en cache en tout lieu. La NVRAM est regroupe pour
autoriser des critures haut dbit scurises entre les coupures dalimentation
lectrique. Les piles de disques et le CPU sont combins pour augmenter le dbit,
la capacit et les E/S par seconde au fil de la croissance du cluster, pour laccs
un seul fichier comme plusieurs fichiers. La capacit de stockage dun cluster
peut aller dun minimum de 18 traoctets (To) un maximum de 20 ptaoctets
(Po). La capacit maximale continuera dvoluer mesure que les disques
gagneront en densit.
Les nuds Isilon disponibles aujourdhui se divisent en plusieurs catgories
suivant leur fonction :
Gamme S : applications gourmandes en E/S par seconde
Gamme X : workflows haut niveau daccs simultan et bass sur le dbit
Gamme NL : accessibilit proche de celle des systmes de stockage primaires,
un prix proche de celui des bandes
Performance Accelerator : volutivit indpendante pour des performances
optimales
Backup Accelerator : solution de sauvegarde et de restauration volutive et
ultrarapide
Rseau
Il existe deux types de rseau associs un cluster : internes et externes.
Rseau back-end
Toutes les communications entre les nuds dun cluster seffectuent laide dun
protocole unicast (nud nud) propritaire. La communication utilise un rseau
InfiniBand (IB) faible latence, extrmement rapide. Ce rseau back-end,
configur avec des switches redondants pour garantir une haute disponibilit, joue
le rle de backplane pour le cluster en permettant chaque nud dagir en tant
que contributeur et en isolant la communication de nud nud un rseau
priv, haute vitesse, faible latence. Ce rseau back-end utilise le protocole
Internet (IP) sur IB pour la communication entre les nuds.
Rseau front-end
Les clients se connectent au cluster laide de connexions Ethernet (1 GbE ou
10 GbE) disponibles sur tous les nuds. Puisque chaque nud fournit ses propres
ports Ethernet, la bande passante rseau disponible pour le cluster volue de
faon linaire par rapport aux performances et la capacit. Le cluster Isilon
prend en charge les protocoles de communication rseau standard vers un rseau
du client, notamment NFS, CIFS, HTTP, FTP et HDFS.

Vue du cluster complet
Le cluster complet est combin avec le matriel, les logiciels, les rseaux dans la
vue suivante :
Figure 2 : fonctionnement de tous les composants OneFS
La figure 2 illustre larchitecture complte : logiciels, matriel et rseau

fonctionnant ensemble dans votre environnement ; les serveurs fournissant un
systme de fichiers unique totalement distribu qui peut voluer de faon
dynamique mesure que les charges applicatives et les besoins en capacit ou en
dbit voluent dans un environnement scale-out.
Prsentation du logiciel OneFS

Systme dexploitation
OneFS est bas sur un systme dexploitation UNIX reposant sur BSD. Il prend en
charge la smantique Linux/UNIX et Windows en mode natif, y compris les liens
matriels, leffacement lors de la fermeture, la modification de noms atomique, les
ACL et les attributs tendus. OneFS utilise BSD comme systme dexploitation de
base, car il sagit dun systme dexploitation avanc et prouv. De plus, la
communaut Open Source peut tre utilise pour linnovation.
Services clients
Les protocoles front-end que les clients peuvent utiliser pour interagir avec OneFS
sont dsigns sous le nom de services clients. Reportez-vous la section
Protocoles pris en charge pour obtenir la liste dtaille des protocoles pris en
charge. Pour comprendre comment OneFS communique avec les clients, nous
avons divis le sous-systme dE/S en deux moitis : la partie suprieure ou
initiateur et la partie infrieure ou participant . Tous les nuds du cluster
sont des participants une opration dE/S spcifique. Le nud auquel le client se
connecte est linitiateur et ce nud agit en tant que capitaine pour lensemble
des oprations dE/S. Les oprations de lecture et dcriture sont dtailles dans
les sections ultrieures.

Oprations du cluster
Dans une architecture en clusters, il existe des tches responsables de la sant et
de la maintenance du cluster, ces tches tant toutes gres par le moteur de
tches OneFS. Le moteur de tches sexcute sur lensemble du cluster et est
charg de diviser et de matriser les tches tendues de gestion et de protection
du stockage. Pour y parvenir, il rduit une tche en lments de travail de petite
taille, puis alloue ou mappe ces parties de la tche globale plusieurs threads de
travail sur chaque nud. La progression fait lobjet dun suivi tout au long de
lexcution de la tche, puis un rapport dtaill et un tat sont prsents
lorsquelle est termine.
Le moteur de tches inclut un systme complet de point de contrle qui permet de
suspendre et de reprendre les tches, en plus de les arrter et de les dmarrer. La
structure du moteur de tches comprend galement un systme de gestion
volutive de limpact.
Le moteur de tches excute gnralement les tches en arrire-plan sur le
cluster, laide de capacits et de ressources de secours ou rserves cet effet.
Les tches elles-mmes peuvent tre classes en trois principaux types :
Tches de maintenance du systme de fichiers
Ces tches assurent la maintenance du systme de fichiers en arrire-plan

et ncessitent gnralement laccs tous les nuds. Elles sont requises
pour sexcuter dans les configurations par dfaut, et souvent dans des
conditions de cluster dgrad. Citons titre dexemple la protection du
systme de fichiers et la reconstruction des disques.
Tches de prise en charge des fonctions
Les tches de prise en charge des fonctions effectuent un travail qui facilite
certaines fonctions de gestion du stockage tendues et ne fonctionnent
gnralement que lorsque la fonction a t configure. Il sagit notamment
de la dduplication et de lanalyse antivirus.
Tches de type action de lutilisateur
Ces tches sont ralises directement par ladministrateur de stockage pour

atteindre certains objectifs de gestion des donnes. Citons notamment les
suppressions darborescence parallles et la maintenance des autorisations.
Le tableau ci-dessous fournit la liste complte des tches exposes du moteur de

tches, des oprations quelles effectuent et de leurs mthodes daccs leur
systme de fichiers respectif :
Nom de la tche Description de la tche Mthodes

daccs
AutoBalance quilibre lespace disponible dans le Analyses des
cluster. disques + LIN
AutoBalanceLin quilibre lespace disponible dans le Analyse LIN
cluster.

Nom de la tche Description de la tche Mthodes
daccs
AVScan Tche danalyse antivirus excute par le Treewalk
ou les serveurs ICAP.
Collect Rcupre lespace disque qui na pas pu Analyses des
tre libr en raison dun nud ou dun disques + LIN
disque non disponible alors quil prsente
diffrentes conditions de panne.
Dedupe Dduplique les blocs identiques dans le Treewalk
systme de fichiers.
DedupeAssessment value en mode test les avantages de la Treewalk
dduplication.
DomainMark Associe un chemin et son contenu un Treewalk
domaine.
FlexProtect Reconstruit et reprotge le systme de Analyses des
fichiers restaurer lors dun scnario de disques + LIN
panne.
FlexProtectLin Reprotge le systme de fichiers. Analyse LIN
FSAnalyze Collecte des donnes danalytique du Analyse LIN
systme de fichiers utilises en
combinaison avec le logiciel InsightIQTM.
IntegrityScan Procde une vrification en ligne et la Analyse LIN
correction des ventuelles incohrences
dun systme de fichiers.
MediaScan Analyse les disques afin de dtecter Analyses des
dventuelles erreurs de support. disques + LIN
MultiScan Excute les tches Collect et AutoBalance Analyse LIN
simultanment.
PermissionRepair Autorisations adquates sur les fichiers et Treewalk
rpertoires.
QuotaScan Met jour le quota relatif aux domaines Treewalk
crs sur un chemin de rpertoire
existant.
SetProtectPlus Applique la rgle de fichier par dfaut. Analyse LIN
Cette tche est dsactive si SmartPools
est activ sur le cluster.
ShadowStoreDelete Libre lespace associ une zone de Analyse LIN
stockage en miroir.
SmartPools Excute et dplace les donnes entre les Analyse LIN
niveaux des nuds dun cluster.
SnapRevert Restaure lintgralit dun snapshot son
tat dorigine.
SnapshotDelete Libre lespace disque associ aux Analyse LIN
snapshots supprims.
TreeDelete Supprime un chemin du systme de Treewalk
fichiers directement partir du cluster.
Figure 3 : descriptions des tches du moteur de tches OneFS

Bien que les tches de maintenance du systme de fichiers soient excutes par
dfaut, la suite dune planification ou en rponse un vnement spcifique du
systme de fichiers, toutes les tches du moteur de tches peuvent tre gres
via la configuration de leur niveau de priorit (par rapport aux autres tches) et de
leur rgle dimpact.
Une rgle dimpact peut comporter un ou plusieurs intervalles dimpact, qui

reprsentent une priode sur une semaine donne. Chaque intervalle dimpact
peut tre configur pour utiliser un seul niveau dimpact prdfini qui spcifie la
quantit de ressources de cluster utiliser pour une opration de cluster
particulire. Les niveaux dimpact disponibles du moteur de tches sont les
suivants :
Suspendu
Bas
Moyen
lev
Ce niveau de granularit permet de configurer les intervalles et les niveaux
dimpact par tche, afin de garantir un fonctionnement fluide du cluster. Les rgles
dimpact qui en rsultent dterminent le moment dexcution dune tche et les
ressources quelle peut consommer.
En outre, les tches du moteur de tches sont hirarchises sur une chelle de un
dix, une valeur faible indiquant une priorit leve. Ce concept est semblable au
concept de lutilitaire de planification UNIX, nice .
Avec la version OneFS 7.1, le moteur de tches permet lexcution simultane

dun maximum de trois tches. Cette excution de tches simultane est rgie par
les critres suivants :
Priorit des tches

Jeu dexclusions : tches qui ne peuvent pas sexcuter ensemble
(FlexProtect et AutoBalance, par exemple)
Intgrit du cluster : la plupart des tches ne peuvent pas sexcuter
lorsque le cluster a ltat dgrad.

Figure 4 : jeux dexclusions du moteur de tches OneFS
Structure du systme de fichiers

Le systme de fichiers OneFS est bas sur le systme de fichiers Unix (UFS) et,
par consquent, est un systme de fichiers DFS trs rapide. Chaque cluster cre
un espace de nommage et un systme de fichiers uniques. Cela signifie que le
systme de fichiers est distribu sur tous les nuds du cluster et est accessible
par les clients qui se connectent nimporte quel nud du cluster. Il ny a aucun
partitionnement et il nest pas ncessaire de crer des volumes. Au lieu de limiter
laccs lespace disponible et des fichiers non autoriss au niveau du volume
physique, OneFS fournit les mmes fonctions logicielles via le partage et les
autorisations de fichier, et par le biais du service Isilon SmartQuotasTM, qui vous
permet de grer les quotas au niveau du rpertoire.
Toutes les informations tant partages entre les nuds sur le rseau interne, les
donnes peuvent tre crites et lues partir de nimporte quel nud, ce qui
optimise les performances lorsque plusieurs utilisateurs lisent et crivent
simultanment sur le mme jeu de donnes.

Figure 5 : systme de fichiers unique avec plusieurs protocoles daccs
OneFS est un systme de fichiers unique dot dun espace de nommage. Les
donnes et les mtadonnes sont rparties entre les nuds des fins de
redondance et de disponibilit. Le stockage a t entirement virtualis pour les
utilisateurs et ladministrateur. Larborescence de fichiers peut augmenter de faon
organique sans quil soit ncessaire de planifier ni de superviser le mode de
croissance de larborescence ou la manire dont les utilisateurs lemploient.
Ladministrateur na pas se proccuper de la hirarchisation des fichiers sur le
disque appropri, car Isilon SmartPools sen charge automatiquement sans
gnrer dinterruption pour larborescence unique. Il nest pas ncessaire
daccorder une attention particulire la manire dont il est possible de rpliquer
une telle arborescence, car le service Isilon SyncIQTM paralllise automatiquement
le transfert de larborescence de fichiers vers un ou plusieurs autres clusters, sans
tenir compte de la forme ou de la profondeur de larborescence de fichiers.

Cette conception doit tre compare lagrgation despace de nommage, une
technologie couramment utilise pour que le NAS traditionnel semble disposer
dun espace de nommage unique. Avec lagrgation des espaces de nommage, les
fichiers doivent quand mme tre grs dans des volumes distincts, mais une
simple couche de placage permet de coller diffrents rpertoires de
volumes un niveau suprieur de larborescence via des liens symboliques. Dans
ce modle, les LUN et les volumes, ainsi que les limites de volume, sont toujours
prsents. Les fichiers doivent tre dplacs manuellement dun volume lautre
des fins dquilibrage de la charge. Ladministrateur doit bien rflchir
lorganisation de larborescence. La hirarchisation est loin dtre transparente et
ncessite une intervention importante et continue. Le basculement sur incident
requiert la mise en miroir des fichiers entre les volumes, ce qui rduit lefficacit et
accrot les cots dachat, dalimentation et de ventilation. Dune manire gnrale,
lors de lutilisation de lagrgation des espaces de nommage, la charge de
ladministrateur est plus leve que pour un priphrique NAS traditionnel simple.
Cela vite ces infrastructures de devenir trs volumineuses.
Rpartition des donnes

OneFS utilise des pointeurs physiques et des extensions pour les mtadonnes et
stocke les mtadonnes des fichiers et des rpertoires dans les inodes. Les
arborescences B sont largement utilises dans le systme de fichiers, ce qui autorise
lvolutivit vers des milliards dobjets et des recherches quasi instantanes de
donnes ou de mtadonnes. OneFS est un systme de fichiers hautement distribu
et compltement symtrique. Les donnes et les mtadonnes sont toujours
redondantes sur plusieurs priphriques matriels. Les donnes sont protges
laide du codage deffacement sur les nuds du cluster. Cela cre un cluster haute
efficacit autorisant un ratio capacit brute-capacit utile de 80 % ou plus sur les
clusters de cinq nuds ou plus. Les mtadonnes (qui composent gnralement
moins de 1 % du systme) sont mises en miroir dans le cluster pour accrotre les
performances et la disponibilit. tant donn que OneFS ne dpend pas de la
technologie RAID, la capacit de redondance est dfinie par ladministrateur, au
niveau fichier ou rpertoire, au-dessus des valeurs par dfaut du cluster. Laccs
aux mtadonnes et le verrouillage sont grs par tous les nuds de faon
collective et gale dans une architecture peer-to-peer. Cette symtrie est essentielle
la simplicit et la rsilience de larchitecture. Il ny a aucun serveur de
mtadonnes, gestionnaire de verrou ou nud de passerelle.
Puisque OneFS doit accder des blocs partir de plusieurs priphriques au mme
moment, le systme dadressage utilis pour les donnes et les mtadonnes est
index au niveau physique par un tuple de {nud, disque, dcalage}. Par exemple,
si 12345 est ladresse dun bloc situ sur le disque 2 du nud 3, cela se lit
{3,2,12345}. Toutes les mtadonnes du cluster sont mises en miroir plusieurs fois
des fins de protection des donnes, au minimum au niveau de redondance du
fichier associ. Par exemple, si un fichier dispose dune protection par code
deffacement N+2 , son utilisation pourrait rsister deux dfaillances
simultanes ; ensuite, toutes les mtadonnes ncessaires pour accder ce fichier
seraient mises en miroir trois fois afin quil puisse rsister deux pannes. Le
systme de fichiers permet de faon inhrente nimporte quelle structure dutiliser
nimporte quel bloc (ou lintgralit des blocs), sur nimporte quel nud du cluster.

Les autres systmes de stockage envoient les donnes via les couches RAID et de
gestion des volumes, do un manque defficacit au niveau de la rpartition des
donnes et un accs non optimis en mode bloc. Isilon OneFS gre directement le
positionnement des fichiers, jusquau niveau du secteur, sur nimporte quel disque
du cluster. Cela permet doptimiser le positionnement des donnes et les schmas
dE/S, et vite les oprations inutiles de lecture-modification-criture. En plaant
les donnes sur les disques fichier par fichier, OneFS peut grer avec flexibilit le
type de rpartition ainsi que la redondance du systme de stockage au niveau du
systme, du rpertoire ou mme des fichiers. Les systmes de stockage
traditionnels ncessiteraient que tout un volume RAID soit ddi un type de
performances et un paramtre de protection particuliers. Par exemple, un
ensemble de disques pourrait tre rorganis dans une protection RAID 1+0 pour
une base de donnes. Il est donc difficile doptimiser lutilisation de la pile de
disques sur lensemble du domaine de stockage (car les piles inactives ne peuvent
pas tre empruntes). Cela mne des conceptions rigides qui ne sont pas
adaptes aux besoins mtiers. OneFS autorise des rglages individuels et des
modifications flexibles tout moment et en ligne.
critures de fichier
Le logiciel OneFS sexcute de faon gale sur tous les nuds, ce qui cre un
systme de fichiers unique qui sexcute sur chaque nud. Aucun nud ne
contrle le cluster ; tous les nuds sont de vritables homologues.
Figure 6 : modle de composants de nud impliqus dans les E/S

Si nous devions visualiser tous les composants de chaque nud dun cluster
impliqus dans les E/S dun point de vue gnral, cela ressemblerait la figure 6
ci-dessus. Nous avons divis la pile en une couche suprieure, appele initiateur,
et une couche infrieure, appele participant. Cette division est utilise comme
modle logique pour lanalyse des donnes en lecture ou criture. un niveau
physique, les CPU et le cache RAM des nuds grent simultanment les tches de
linitiateur et du participant pour les E/S qui se produisent dans lensemble du
cluster. Certains caches et un gestionnaire de verrou distribu sont exclus du
schma ci-dessus pour en conserver la simplicit. Ils sont abords dans les
sections ultrieures de ce document.
Lorsquun client se connecte un nud pour crire dans un fichier, il se connecte
la partie suprieure, ou initiateur, de ce nud. Les fichiers sont dcomposs en
petits fragments logiques nomms bandes avant dtre crits dans la moiti
infrieure, ou participant, dun nud (disque). La mise en mmoire tampon en
toute scurit laide dun fusionneur dcriture permet de sassurer que les
critures sont efficaces et que les oprations de lecture-modification-criture sont
vites. La taille de chaque fragment de fichier est appele taille dunit de bande.
OneFS rpartit les donnes sur tous les nuds, et pas seulement entre les disques,
et protge les fichiers, les rpertoires et les mtadonnes associes via le codage
deffacement logiciel ou la technologie de mise en miroir. Pour les donnes, OneFS
peut utiliser ( la seule discrtion de ladministrateur), le systme de codage
deffacement Reed-Solomon pour assurer la protection des donnes, ou la mise en
miroir (moins frquente). La mise en miroir, lorsquelle est applique aux donnes
utilisateur, a tendance tre plus utilise lorsque les performances impliquent des
taux levs de transactions. La majeure partie des donnes utilisateur utilise
habituellement le codage deffacement, car il fournit de trs hautes performances
sans sacrifier lefficacit sur disque. Le codage deffacement peut fournir une
efficacit suprieure 80 % sur un disque brut de cinq nuds ou plus et, sur de
grands clusters, peut faire de mme tout en fournissant une redondance quatre
fois plus importante. La largeur de rpartition de nimporte quel fichier correspond
au nombre de nuds (et non de disques) sur lequel un fichier est crit. Elle est
dtermine par le nombre de nuds du cluster, la taille du fichier et le paramtre
de protection (par exemple, N+2).
OneFS utilise des algorithmes avancs pour dterminer la rpartition des donnes
qui offrira les performances et lefficacit maximales. Lorsquun client se connecte
un nud, linitiateur de ce nud agit en tant que capitaine pour la
rpartition des donnes dcriture de ce fichier. Dans un cluster Isilon, les donnes,
la parit, les mtadonnes et les inodes sont tous distribus sur plusieurs nuds,
voire plusieurs disques au sein des nuds. La figure 7 ci-dessous illustre une
criture de fichier sur lensemble des nuds dun cluster 3 nuds.

Figure 7 : opration dcriture de fichier sur un cluster Isilon trois nuds
OneFS utilise le rseau back-end InfiniBand pour allouer et rpartir les donnes
sur tous les nuds du cluster automatiquement ; par consquent, aucun
traitement supplmentaire nest requis. mesure que les donnes sont crites,
elles sont protges au niveau spcifi.
Lorsque les oprations dcriture sont effectues, OneFS divise les donnes en
units atomiques appeles groupes de protection. La redondance est intgre dans
des groupes de protection, de telle sorte que si chaque groupe de protection est
scuris, le fichier entier est scuris. Pour les fichiers protgs par des codes
deffacement, un groupe de protection se compose dune srie de blocs de
donnes, ainsi que dun ensemble de codes deffacement pour ces blocs de
donnes. Pour les fichiers mis en miroir, un groupe de protection comprend tous
les miroirs dun ensemble de blocs. OneFS est capable de changer le type du
groupe de protection utilis dans un fichier de faon dynamique, mesure de
lcriture. Cela peut autoriser de nombreuses fonctions supplmentaires,
notamment en permettant au systme de continuer sans blocage dans les
situations o les dfaillances temporaires de nud dans le cluster empcheraient
dutiliser le nombre souhait de codes deffacement. La mise en miroir peut tre
utilise temporairement dans ces cas pour permettre aux critures de continuer.
Lorsque les nuds sont restaurs dans le cluster, ces groupes de protection mis
en miroir sont convertis de manire transparente et automatique en code
deffacement protg, sans intervention de ladministrateur.

La taille de bloc du systme de fichiers OneFS est de 8 Ko. Un fichier dont la taille
est infrieure 8 Ko utilisera un bloc de 8 Ko complet. En fonction du niveau de
protection des donnes, ce fichier de 8 Ko pourrait utiliser plus de 8 Ko despace
de donnes. Notez que les paramtres de protection des donnes sont dcrits en
dtail dans une section ultrieure du prsent document. OneFS peut prendre en
charge les systmes de fichiers comptant des milliards de petits fichiers avec de
trs hautes performances, car toutes les structures sur disque sont conues pour
sadapter de telles tailles et fournissent un accs quasi instantan nimporte
quel objet, quel que soit le nombre total dobjets. Pour les fichiers volumineux,
OneFS peut utiliser plusieurs blocs de 8 Ko conscutifs. Dans ce cas, jusqu seize
blocs contigus peuvent tre agrgs par bandes sur un disque un seul nud.
Dans le cas dun fichier de 32 Ko, quatre blocs contigus de 8 Ko seront utiliss.
Pour les fichiers encore plus volumineux, OneFS peut optimiser les performances
squentielles en tirant parti dune unit de bande compose de 16 blocs contigus,
pour un total de 128 Ko par unit de bande. Lors dune opration dcriture, les
donnes sont divises en units de bande elles-mmes rparties sur plusieurs
nuds en tant que groupes de protection. mesure que les donnes sont places
dans le cluster, les codes deffacement ou les miroirs, en fonction des besoins,
sont distribus au sein de chaque groupe de protection pour assurer la protection
des fichiers tout moment.
La fonction AutoBalance de OneFS permet, entre autres, de rallouer et de
rquilibrer automatiquement les donnes et de rendre lespace de stockage plus
utile et plus efficace lorsque cela est possible. Dans la plupart des cas, la largeur
de bande des fichiers volumineux peut tre augmente pour tirer parti du nouvel
espace disponible ( mesure que vous ajoutez des nuds), afin que la rpartition
sur disque soit plus efficace. AutoBalance maintient une efficacit leve sur
disque et limine automatiquement les points sensibles.
La partie suprieure de linitiateur du nud capitaine utilise une transaction de
validation deux phases, modifie et brevete pour distribuer en toute scurit
les critures plusieurs NVRAM sur lensemble du cluster, comme illustr la
figure 8 ci-dessous.

Figure 8 : transactions distribues avec validation deux phases
Chaque nud dtenant des blocs dans une criture particulire est impliqu dans
une validation deux phases. Le mcanisme sappuie sur la NVRAM pour consigner
toutes les transactions effectues sur chaque nud du cluster de stockage.
Lutilisation de plusieurs NVRAM en parallle autorise les critures haut dbit tout
en prservant la scurit de donnes contre tous les types de dfaillance, y compris
les coupures dalimentation. Si un nud tombe en panne au cours dune transaction,
la transaction est redmarre instantanment sans ce nud. Lorsque le nud est
rtabli, les seules actions requises sont la relecture de son journal depuis la NVRAM,
qui prend quelques secondes ou minutes, et le rquilibrage par AutoBalance des
fichiers impliqus dans la transaction. Les processus coteux fsck ou disk-
check ne sont jamais obligatoires. Aucune longue resynchronisation nest jamais
ncessaire. Les critures ne sont jamais bloques la suite dune panne. Le
systme de transaction brevet est lune des mthodes utilises par OneFS pour
liminer un seul point de dfaillance, voire plusieurs.
Dans une opration dcriture, linitiateur (capitaine) dirige ou orchestre la
rpartition des donnes et des mtadonnes, la cration des codes deffacement et
les oprations normales de gestion des verrous et de contrle des autorisations.
partir de linterface de gestion Web ou de linterface CLI, un administrateur peut
tout moment optimiser les dcisions de rpartition prises par OneFS pour
amliorer le workflow. Ladministrateur peut effectuer un choix parmi les modles
daccs ci-dessous, un niveau de fichier individuel ou de rpertoire :
Accs simultans : optimise la charge actuelle sur le cluster, avec de
nombreux clients simultans. Ce paramtre constitue le meilleur
comportement pour les charges applicatives mixtes.
Lecture en temps rel : optimise la lecture en temps rel haut dbit dun seul
fichier, par exemple pour activer la lecture trs rapide avec un client unique.

Alatoire : optimise laccs imprvisible au fichier en ajustant la rpartition et
en dsactivant lutilisation de tous les caches de lecture pralable.
Mise en cache OneFS

La conception de linfrastructure de mise en cache OneFS repose sur lagrgation
du cache prsent sur chaque nud dun cluster dans un pool de mmoire
accessible dans le monde entier. Pour ce faire, Isilon utilise un systme de
messagerie efficace, similaire au systme NUMA (non-uniform memory access).
Cela permet au cache mmoire de tous les nuds dtre disponible pour chacun
des nuds du cluster. La mmoire distante est accessible via une interconnexion
interne et sa latence est trs infrieure par rapport laccs aux disques durs.
Pour laccs la mmoire distante, OneFS utilise le protocole SDP (Sockets Direct
Protocol) sur une interconnexion back-end Infiniband (IB) sur le cluster, cest--
dire un bus systme distribu. SDP fournit une interface efficace de type socket
entre les nuds qui, grce une topologie en toile organise autour dun switch,
garantit que les adresses mmoire distantes sont ne jamais un plus dun hop IB.
Bien que ntant pas aussi rapide que la mmoire locale, laccs la mmoire
distante est nanmoins trs rapide grce la faible latence IB.
Le sous-systme de mise en cache de OneFS est cohrent dans lensemble du

cluster. Cela signifie que si le mme contenu existe dans les caches privs de
plusieurs nuds, les donnes du cache sont cohrentes sur toutes les instances.
OneFS utilise le protocole MESI pour conserver la cohrence de cache. Ce
protocole met en uvre une rgle d invalidation lcriture pour garantir que
toutes les donnes sont cohrentes sur lensemble du cache partag.
OneFS utilise jusqu trois niveaux de cache de lecture, ainsi quun cache
dcriture, ou fusionneur, reposant sur la NVRAM. Ces diffrents niveaux et leur
interaction gnrale sont illustrs dans le schma suivant.
Figure 9 : hirarchie de mise en cache OneFS

Les deux premiers types de cache de lecture, niveau 1 (N1) et niveau 2 (N2) sont
bass sur la mmoire (RAM) et analogues au cache utilis dans les processeurs
(CPU). Ces deux couches de cache sont prsentes dans tous les nuds de
stockage Isilon.
Un troisime niveau facultatif de cache de lecture, appel SmartFlash ou cache de

niveau 3 (N3), est galement configurable sur des nuds qui contiennent des
disques SSD. SmartFlash (N3) est un cache dexclusion rempli par des blocs du
cache N2 mesure quils deviennent obsoltes et sont retirs de la mmoire. Il
existe plusieurs avantages lis lutilisation de disques SSD pour la mise en cache
au lieu de priphriques de stockage de systme de fichiers traditionnels. Par
exemple, lorsquil est rserv pour la mise en cache, tout le disque SSD est utilis,
et les critures se produisent de faon trs linaire et prvisible. Cela amliore le
taux dutilisation et se traduit galement par une rduction considrable de lusure
et une longvit accrue par rapport lutilisation dun systme de fichiers normal,
en particulier pour les oprations alatoires dcriture. Lutilisation de disques SSD
pour le cache rend galement le dimensionnement de la capacit SSD beaucoup
plus simple et moins source derreur par rapport lutilisation des disques SSD en
tant que niveau de stockage.
Nom Type Persistance Description

Cache N1 RAM Volatile galement appel cache front-end, il
dtient des copies, propres et cohrentes
avec le cluster, des donnes et des blocs
de mtadonnes du systme de fichiers,
demandes par lintermdiaire des clients
NFS et SMB, etc. via le rseau front-end.
Cache N2 RAM Volatile Cache back-end contenant les copies
propres des donnes et des mtadonnes
du systme de fichiers sur un nud local.
SmartCache / NVRAM Non volatile Cache persistant du journal de la NVRAM
Fusionneur avec batterie qui met en mmoire tampon
dcritures les critures en attente vers les fichiers
front-end qui nont pas t valides par le
disque.
SmartFlash Disque Non volatile Contient des donnes de fichier et des
Cache N3 SSD blocs de mtadonnes exclus du cache N2,
ce qui augmente efficacement la capacit
de cache N2.
OneFS impose quun fichier soit crit sur plusieurs nuds du cluster, et
ventuellement sur plusieurs disques dun nud, afin que toutes les demandes de
lecture impliquent la lecture de donnes distantes (et ventuellement locales).
Lorsquune demande de lecture arrive dun client, OneFS dtermine si les donnes
demandes sont prsentes dans le cache local. Les donnes rsidant dans le cache
local sont lues immdiatement. Si les donnes demandes ne se trouvent pas dans le
cache local, elles sont lues partir du disque. Pour les donnes qui ne sont pas sur le
nud local, une demande est effectue depuis les nuds distants sur lesquels elles
rsident. Sur chacun des autres nuds, une autre recherche de cache est excute.
Toutes les donnes contenues dans le cache sont retournes immdiatement, et
celles qui ne sont pas dans le cache sont rcupres sur le disque.
Lorsque les donnes ont t rcupres des caches local et distant (et
ventuellement du disque), elles sont retournes au client.

Les tapes gnrales permettant de satisfaire une demande de lecture sur un
nud local et un nud distant sont les suivantes :
Sur le nud local (le nud qui reoit la demande) :
1. Dterminez si une partie des donnes demandes est dans le cache N1 local.
Si oui, retournez-les au client.
2. Si elles ne figurent pas dans le cache local, demandez-les au ou aux nuds
distants.
Sur les nuds distants :
1. Dterminez si les donnes demandes sont dans le cache N2 local ou le

cache N3. Si oui, retournez-les au nud qui les a demandes.
2. Si elles ne figurent pas dans le cache local, lisez-les partir du disque et
retournez-les au nud qui les a demandes.
Le cache dcriture acclre le processus dcriture des donnes sur un cluster

Isilon. Pour ce faire, il faut regrouper par lots les demandes dcriture plus petites
et les envoyer au disque sous forme de fragments plus importants, ce qui permet
dliminer une quantit importante de latence dcriture sur le disque. Lorsque les
clients crivent sur le cluster, OneFS crit temporairement les donnes dans un
cache de journal de la NVRAM sur le nud initiateur, au lieu de les crire
immdiatement sur le disque. OneFS peut ensuite vider ces critures mises en
cache sur le disque plus tard, un moment plus adquat. De plus, ces critures
sont galement mises en miroir dans les journaux NVRAM des nuds participants
pour rpondre aux exigences de protection du fichier. Par consquent, en cas de
division du cluster ou de larrt non planifi dun nud, les critures du cache non
valides sont entirement protges.
Le cache dcriture fonctionne comme suit :
Un client NFS envoie au nud 1 la demande dcriture dun fichier possdant
une protection N+2.
Le nud 1 accepte les critures dans le cache dcriture NVRAM (raccourci),
puis les met en miroir dans les fichiers logs des nuds participants des fins
de protection.
Des accuss de rception dcriture sont envoys au client NFS immdiatement
et, de ce fait, il ny a pas de latence dcriture sur disque.
mesure que le cache dcriture du nud 1 se remplit, il est rgulirement
vid et les critures sont valides sur le disque par le biais du processus de
validation de deux phases (dcrit prcdemment), avec la protection par parit
approprie applique (N+2).
Les fichiers logs des nuds participants et le cache dcriture sont effacs et
disponibles pour accepter de nouvelles critures.
Lectures de fichier
Dans un cluster Isilon, les donnes, les mtadonnes et les inodes sont tous
distribus sur plusieurs nuds, voire plusieurs disques dans les nuds. Lors de la
lecture ou de lcriture dans le cluster, le nud auquel un client se connecte agit
en tant que capitaine pour lopration.

Au cours dune opration de lecture, le nud capitaine rassemble toutes les
donnes provenant des diffrents nuds du cluster et les prsente de manire
cohrente au demandeur.
Avec lutilisation de matriel standard conomique, le cluster Isilon fournit un
rapport lev de cache sur disque (plusieurs Go par nud), avec allocation
dynamique pour les oprations de lecture et dcriture en fonction des besoins. Ce
cache RAM est unifi et cohrent sur tous les nuds du cluster, permettant une
demande de lecture client sur un nud de bnficier des E/S dj traites sur un
autre nud. Ces blocs mis en cache peuvent tre rapidement accessibles partir
de nimporte quel nud du backplane InfiniBand faible latence, ce qui garantit
un cache RAM de grande taille et efficace, qui acclre considrablement les
performances de lecture. Plus le cluster devient grand, plus le cache prsente des
avantages. Cest pour cette raison que le nombre dE/S de disque sur un cluster
Isilon est gnralement nettement infrieur celui des plates-formes
traditionnelles, ce qui gnre des latences rduites et une meilleure exprience
utilisateur.
Pour les fichiers marqus par un schma daccs simultan ou en temps rel,
OneFS tire parti de la lecture pralable des donnes base sur lheuristique utilise
par le composant Isilon SmartRead. SmartRead peut crer un pipeline de donnes
partir du cache N2, en effectuant une lecture pralable dans un cache N1 local
sur le nud capitaine . Cela permet damliorer considrablement les
performances de lecture squentielle sur tous les protocoles et signifie que les
lectures proviennent directement de la RAM en quelques millisecondes. Pour les
lectures hautement squentielles, SmartRead peut excuter une lecture pralable
trs agressive qui autorise les lectures et les critures de fichiers individuels des
taux de transfert trs levs.
Figure 10 : opration de lecture de fichier sur un cluster Isilon

trois nuds

La figure 10 montre comment SmartRead lit un fichier accs squentiel et non
mis en cache demand par un client rattach au nud 1 dans un cluster
3 nuds.
1. Le nud 1 lit les mtadonnes pour identifier lemplacement de tous les blocs
de donnes de fichier.
2. Le nud 1 vrifie galement son cache N1 pour voir sil contient les donnes
de fichier demandes.
3. Le nud 1 construit un pipeline de lecture, envoyant des demandes
simultanes tous les nuds ayant un lment de donnes afin de rcuprer
ces donnes de fichier partir du disque.
4. Chaque nud rcupre les blocs de donnes partir du disque et les place
dans son cache N2 (ou dans le cache SmartFlash N3, le cas chant), puis
transmet les donnes de fichier au nud 1.
5. Le nud 1 stocke les donnes entrantes dans le cache N1, tout en prsentant
simultanment le fichier au client. Dans le mme temps, le processus de
lecture pralable se poursuit.
6. Pour les cas hautement squentiels, les donnes du cache N1 peuvent
ventuellement tre abandonnes pour librer de la mmoire RAM pour
dautres demandes de cache N1 ou N2.
La mise en cache intelligente de SmartRead gnre des performances de lecture
trs leves avec des niveaux levs daccs simultans. Plus important encore, il
est plus facile, pour le nud 1, dobtenir des donnes de fichier du cache du
nud 2 (par le biais de linterconnexion de cluster de faible latence) que daccder
son propre disque local. Les algorithmes de SmartRead contrlent le niveau
dagressivit de la lecture pralable (lecture pralable dsactive dans les cas
daccs alatoire) et la dure pendant laquelle les donnes restent dans le cache,
et optimisent la mise en cache des donnes.
Verrous et accs simultan

OneFS a un gestionnaire de verrous totalement distribu qui collecte les verrous
des donnes sur lensemble des nuds dun cluster de stockage. Le gestionnaire
de verrouillage est extrmement volutif, et permet plusieurs personnes de
prendre en charge les verrous du systme de fichiers, ainsi que les verrous de
protocole cohrents avec le cluster, tels que les verrous en mode de partage SMB
ou les verrous en mode conseil NFS. OneFS permet galement la prise en charge
des verrous dlgus tels que les oplocks CIFS et les dlgations NFSv4.
Chaque nud dun cluster est un coordinateur de verrouillage des ressources ; un
coordinateur est affect aux ressources quil est possible de verrouiller bases sur
un algorithme de hachage avanc. Lalgorithme est conu de telle manire que le
coordinateur termine presque toujours sur un nud diffrent de linitiateur de la
demande. Lorsquun verrou est demand pour un fichier, il peut sagir dun verrou
partag (ce qui permet plusieurs utilisateurs de partager le verrou
simultanment, gnralement pour les lectures) ou un verrou exclusif (pour un
utilisateur, tout moment, en gnral pour les critures).

La figure 11 ci-dessous illustre un exemple de la faon dont les threads de
diffrents nuds peuvent demander un verrou au coordinateur.
1. Le nud 2 est dsign coordinateur de ces ressources.
2. Le thread 1 du nud 4 et le thread 2 du nud 3 demandent un verrou partag
sur un fichier partir du nud 2, en mme temps.
3. Le nud 2 vrifie si un verrou exclusif existe pour le fichier demand.
4. Si aucun verrou exclusif nexiste, le nud 2 accorde au thread 1 du nud 4 et
au thread 2 du nud 3 des verrous partags sur le fichier demand.
5. Les nuds 3 et 4 excutent maintenant une lecture sur le fichier demand.
6. Le thread 3 du nud 1 demande un verrou exclusif pour le fichier en cours de
lecture par les nuds 3 et 4.
7. Le nud 2 vrifie avec les nuds 3 et 4 si les verrous partags peuvent tre
rcuprs.
8. Les nuds 3 et 4 procdent toujours la lecture, cest pourquoi le nud 2
demande au thread 3 du nud 1 de patienter.
9. Le thread 3 du nud 1 est bloqu jusqu ce quun verrou exclusif soit accord
par le nud 2, puis termine lopration dcriture.
Figure 11 : gestionnaire de verrou distribu
E/S multithread
Lutilisation croissante de vastes datastores NFS pour la prise en charge de la
virtualisation des serveurs et des applications dentreprise ncessite des dbits
levs et une faible latence pour les fichiers volumineux. Pour prendre en compte
cette ncessit, OneFS Multi-writer prend en charge plusieurs threads capables
dcrire simultanment dans des fichiers individuels.

Dans lexemple ci-dessus, laccs en criture simultan un fichier volumineux
peut tre limit par le mcanisme de verrouillage exclusif, appliqu lensemble
du fichier. Afin dviter ce goulot dtranglement potentiel, OneFS Multi-writer
fournit un verrouillage en criture plus granulaire en divisant le fichier en zones
distinctes et en accordant des verrous en criture exclusifs des rgions
individuelles, et non lintgralit du fichier. De ce fait, plusieurs clients peuvent
simultanment crire sur diffrentes parties du mme fichier.
Figure 12 : writer dE/S multithread
Protection des donnes

Perte dalimentation
Un journal de systme de fichiers, qui stocke des informations sur les
modifications apportes au systme de fichiers, est conu pour permettre des
restaurations rapides et cohrentes aprs des dfaillances systme ou des pannes,
comme une perte dalimentation. Le systme de fichiers relit les entres du journal
aprs la restauration dun nud ou dun cluster la suite dune panne de courant
ou dune autre panne. Sans journal, un systme de fichiers devrait passer en
revue individuellement toutes les modifications potentielles aprs une panne
(opration fsck ou chkdsk). Dans un systme de fichiers volumineux, cette
opration peut prendre un certain temps.
OneFS est un systme de fichiers bas sur la consignation dans lequel chaque
nud contient une carte NVRAM avec batterie de secours utilise pour protger
les critures non valides vers le systme de fichiers. La batterie de la carte
NVRAM dure plusieurs jours sans ncessiter de rechargement. Lorsquun nud
dmarre, il vrifie son journal et relit de manire slective des transactions sur le
disque sur lequel le systme de consignation le juge ncessaire.

OneFS effectue uniquement le montage sil peut garantir que toutes les
transactions qui ne sont pas dj dans le systme ont t enregistres. Par
exemple, si les procdures darrt appropries nont pas t suivies et que la
batterie NVRAM est dcharge, des transactions peuvent avoir t perdues. Pour
empcher tout problme potentiel, le nud ne monte pas le systme de fichiers.
Pannes matrielles et quorum

Pour que le cluster fonctionne correctement et accepte les critures de donnes,
un quorum de nuds doit tre actif et rpondre. Un quorum est dfini comme une
majorit simple : un cluster comportant nuds doit possder /2+1 nuds en
ligne pour pouvoir autoriser les critures. Par exemple, pour un cluster de sept
nuds, quatre nuds sont ncessaires pour obtenir un quorum. Si un nud ou un
groupe de nuds est install et ractif, mais nest pas membre dun quorum, il
sexcute en lecture seule.
Le systme Isilon utilise un quorum pour empcher les tats de dconnexion
( split-brain ) qui peuvent se produire si le cluster est temporairement divis en
deux clusters. Selon la rgle de quorum, larchitecture garantit
quindpendamment du nombre de nuds qui tombent en panne ou sont remis en
ligne, si une criture a lieu, elle peut tre rendue cohrente avec toutes les
critures prcdentes qui ont dj eu lieu. Le quorum indique galement le
nombre de nuds ncessaires pour un dplacement vers un niveau de protection
des donnes dtermin. Pour un niveau de protection bas sur un code
deffacement de +, le cluster doit contenir au moins 2+1 nuds. Par exemple,
au moins sept nuds sont requis pour une configuration N+3 ; cela permet une
dfaillance simultane de trois nuds tout en maintenant un quorum de quatre
nuds pour que le cluster reste entirement oprationnel. Si un cluster passe au-
dessous du quorum, le systme de fichiers est automatiquement plac dans un
tat de protection, en lecture seule, interdisant les critures, mais autorisant
nanmoins un accs en lecture seule aux donnes disponibles.
Dfaillances matrielles ajout/suppression de nuds

Un systme appel protocole de gestion de groupe active la connaissance globale de
ltat du cluster tout moment, et garantit une vue cohrente sur lensemble du
cluster de ltat de tous les autres nuds. Si un ou plusieurs nuds deviennent
inaccessibles via linterconnexion de cluster, le groupe est spar ou retir du
cluster. Tous les nuds sont rsolus dans une nouvelle vue cohrente de leur cluster.
(Cest un peu comme si le cluster tait spar en deux groupes de nuds distincts et
quun seul groupe dtenait le quorum.) Tant quelles sont dans cet tat de division,
toutes les donnes du systme de fichiers sont accessibles et, pour la partie grant le
quorum, modifiables. Toutes les donnes stockes sur le priphrique dfaillant sont
reconstruites partir de la redondance stocke dans le cluster.
Si le nud redevient accessible, une fusion ou un ajout se produit, ce qui permet de
replacer le ou les nuds dans le cluster. (Les deux groupes fusionnent en un seul.)
Le nud peut rejoindre le cluster sans tre reconstruit ni reconfigur. Ce processus
est diffrent de celui des baies RAID matrielles, qui ncessitent des disques pour
tre reconstruites. AutoBalance peut de nouveau agrger certains fichiers par bande
pour gagner en efficacit, si certains de leurs groupes de protection ont t crass
et transforms en bandes plus petites pendant la sparation.

Le moteur de tches OneFS intgre galement un processus appel Collect, qui
agit comme un collecteur dorphelins. Lorsquun cluster est divis lors dune
opration dcriture, certains blocs qui ont t allous au fichier devront peut-tre
tre raffects la partie quorum. Cette approche rend orphelins les blocs
allous la partie sans quorum. Lorsque le cluster refusionne, la tche Collect
recherche ces blocs orphelins par une analyse marquage et nettoyage
paralllise et les rcupre sous forme despace disponible pour le cluster.
Reconstruction volutive
OneFS ne dpend pas de la mise en uvre RAID matrielle pour lallocation de
donnes ou pour la reconstruction des donnes aprs une panne. Au lieu de cela,
OneFS gre la protection des donnes des fichiers directement, et lorsquune
panne se produit, OneFS reconstruit les donnes en mode paralllis. OneFS peut
dterminer quels fichiers sont affects par une panne dans le temps constant, en
lisant les donnes inode dune manire linaire, directement depuis le disque.
Lensemble de fichiers affects est attribu un jeu de threads de travail qui sont
rpartis entre les nuds de cluster par le moteur de tches. Les nuds de
traitement rparent les fichiers en parallle. Cela implique qu mesure que la
taille du cluster augmente, le dlai de reconstruction aprs une panne diminue.
Cest un avantage considrable en termes defficacit car la rsilience des clusters
est maintenue mesure que leur taille augmente.
Disque de secours virtuel

La plupart des systmes de stockage traditionnels bass sur RAID ont besoin du
provisionnement dun ou de plusieurs disques de secours pour permettre une
restauration indpendante des disques dfaillants. Le disque de secours remplace
le disque dfaillant dans un ensemble RAID. Si ces disques de secours ne sont pas
eux-mmes remplacs avant que dautres pannes se produisent, le systme risque
une perte de donnes catastrophique. OneFS permet dviter lutilisation de
disques de secours et emprunte simplement de lespace libre disponible dans le
systme afin de rcuprer aprs une panne ; cette technique sappelle disque de
secours virtuel. Ce faisant, il permet au cluster de sautorparer entirement, sans
intervention humaine. Ladministrateur peut crer une rserve de disques de
secours virtuels, ce qui permet au systme de sautorparer en dpit des critures
continues des utilisateurs.
Protection des donnes N+M

Un cluster Isilon est conu pour tolrer une ou plusieurs dfaillances de
composants simultanes, sans que cela nempche le cluster de servir les donnes.
Pour y parvenir, OneFS protge les fichiers par parit, via la correction derreur
Reed-Solomon (protection N+M) ou un systme de mise en miroir. La protection
des donnes est applique au logiciel au niveau des fichiers, ce qui permet au
systme de se concentrer uniquement sur la restauration des fichiers compromis
par une panne, plutt que davoir vrifier et rparer un ensemble ou un volume
de fichiers entier. Les mtadonnes et les inodes OneFS sont toujours protgs
par la mise en miroir, plutt que par le codage Reed-Solomon, et avec au
minimum le niveau de protection des donnes quils rfrencent.

Comme toutes les donnes, les mtadonnes et les informations de parit sont
distribues entre les nuds du cluster, le cluster Isilon na pas besoin dun nud
ou dun disque de parit ddi, ni dun priphrique ou dun ensemble de
priphriques ddi pour grer les mtadonnes. Cela garantit quaucun nud ne
peut devenir un point unitaire de panne. Tous les nuds sont quitablement
rpartis par rapport aux tches excuter, offrant ainsi une symtrie et un
quilibrage de la charge idaux dans une architecture peer-to-peer.
Le systme Isilon propose plusieurs niveaux de paramtres de protection des
donnes configurables que vous pouvez modifier tout moment sans avoir
mettre le cluster ou le systme de fichiers hors ligne.
Pour un fichier protg par des codes deffacement, nous supposons que chacun
de ses groupes de protection est protg un niveau N+M/b, o N>M et M>=b.
Les valeurs N et M reprsentent, respectivement, le nombre de disques utiliss
pour les donnes et les codes deffacement au sein du groupe de protection. La
valeur de b correspond au nombre de bandes de donnes utilises pour un groupe
de protection et est dcrite ci-dessous. Voici un exemple courant et facile
comprendre : b=1, ce qui signifie quun groupe de protection contient : N disques
de donnes ; M disques de redondance, stocks dans des codes deffacement ; et
que le groupe de protection doit tre dispos au-dessus dune bande au sein dun
ensemble de nuds. Cela permet aux membres M du groupe de protection de
tomber en panne simultanment tout en continuant doffrir une disponibilit des
donnes de 100 %. Les membres du code deffacement M sont calculs partir
des membres de donnes N. La figure 12 ci-dessous illustre lexemple dun groupe
de protection 4+2 standard (N=4, M=2, b=1).
tant donn que OneFS rpartit les fichiers entre les nuds, cela implique que les
fichiers rpartis au niveau N+M peuvent rsister dfaillances simultanes de
nud sans perte de disponibilit. OneFS fournit par consquent la rsilience quel
que soit le type de dfaillance, quil sagisse dun disque, dun nud ou dun
composant de nud (une carte, par exemple). En outre, la dfaillance dun nud
compte comme une seule dfaillance, quel que soit le type ou le nombre de
composants dfaillants. Par consquent, si cinq disques tombent en panne dans un
nud, cela reprsente une seule dfaillance dans le cas de la protection N+M.
OneFS peut fournir de faon unique un niveau variable pour M pouvant aller
jusqu quatre, pour une protection des dfaillances quatre fois suprieure. Cette
protection va bien plus loin que le niveau RAID maximal couramment utilis
lheure actuelle, qui reprsente une protection double contre les dfaillances de
RAID-6. La fiabilit du stockage augmentant de manire gomtrique avec cette
capacit de redondance, la protection N+4 peut tre beaucoup plus fiable que la
protection matrielle RAID traditionnelle. Cette protection supplmentaire signifie
que des disques SATA haute capacit, de 3 To et 4 To, par exemple, peuvent tre
ajouts en toute confiance.

Figure 13 : redondance OneFS protection par parit N+M
Les clusters plus petits peuvent bnficier dune protection N+1, mais cela
implique que si un seul disque ou nud peut tre restaur, il est impossible de
restaurer deux disques prsents dans deux nuds distincts. Les dfaillances de
disque sont beaucoup plus susceptibles de se produire que les dfaillances de
nud. Pour les clusters dots des disques de grande taille, il est prfrable
dassurer la protection contre plusieurs dfaillances de disque, bien que la
restauration de nud unique soit acceptable.
Pour fournir un exemple de situation o il est souhaitable de bnficier de la
redondance de deux disques et de la redondance de nud unique, nous pouvons
crer des groupes de protection longueur double. Ces groupes de protection
longueur double sont appliqus une fois au mme ensemble de nuds,
lorsquils sont rpartis. Comme tous les groupes de protection contiennent
exactement lquivalent de deux disques de redondance, ce mcanisme permettra
au cluster de rsister une panne de deux disques ou une panne du nud
complet, sans indisponibilit des donnes.
Le plus important pour les petits clusters, cest que cette mthode de rpartition
est trs efficace, avec une efficacit sur disque de M/(N+M). Par exemple, sur un
cluster de cinq nuds avec une protection contre les doubles dfaillances, si nous
utilisons les valeurs N=3 et M=2, nous obtenons un groupe de protection 3+2
avec une efficacit de 12/5, soit 60 %. Avec le mme cluster 5 nuds mais
avec chaque groupe de protection rparti sur 2 bandes, N serait prsent gal 8
et M 2, ce qui nous permettrait dobtenir une efficacit sur disque de 1-2/(8+2),
soit 80 %, avec maintien de la protection contre les doubles dfaillances de
disques, et perte uniquement de la protection contre les dfaillances de deux
nuds.
OneFS prend en charge les niveaux de protection du code deffacement N+1, N+2,
N+3 et N+4 (dfaillance de un quatre disques ou dfaillance de nud complet
par cluster), ainsi que les niveaux de protection N+2:1 (tolrance pour deux
disques et un seul nud) et N+3:1 (tolrance pour trois disques et un seul nud).
En outre, les niveaux de protection en miroir compris entre deux et huit (mise en
miroir entre deux et huit fois) sont galement fournis pour le fichier et les
mtadonnes. La protection des donnes OneFS est galement trs flexible, ce qui
permet dappliquer la protection au niveau de fichiers individuels, de rpertoires et
de leur contenu, ou au niveau du systme de fichiers entier.

OneFS permet un administrateur de modifier la rgle de protection en temps rel,
alors que les clients sont connects et lisent/crivent des donnes. Notez
quaugmenter le niveau de protection dun cluster peut augmenter la quantit
despace utilise par les donnes du cluster.
Figure 14 : schma de protection par parit hybride OneFS (N+M:x)
Partitionnement automatique
La hirarchisation et la gestion des donnes de OneFS sont assures par le
framework SmartPools. Du point de vue de lefficacit de la protection et de la
rpartition des donnes, SmartPools facilite la subdivision dun grand nombre de
nuds de grande capacit et homognes en pools de disques plus petits et plus
compatibles avec le ratio MTTDL (Mean Time to Data Loss, temps moyen/perte de
donnes). Par exemple, un cluster de 80 nuds nearline (NL) fonctionnerait
gnralement avec un niveau de protection +4. Toutefois, le partitionnement en
quatre pools de disques de vingt nuds permettrait chaque pool de sexcuter
avec une protection +2:1, ce qui diminuerait le temps systme de protection et
amliorerait le taux dutilisation de lespace, sans provoquer daugmentation nette
des frais de gestion.
En accord avec lobjectif de simplicit de la gestion du stockage, OneFS calculera
et partitionnera automatiquement le cluster en pools de disques, ou pools de
nuds, optimiss pour le ratio MTTDL et un taux dutilisation efficace de lespace.
Cela signifie que les dcisions relatives au niveau de protection, telles que dans
lexemple du cluster de 80 nuds ci-dessus, ne sont pas laisses lapprciation
du client, sauf sil le souhaite.
Grce au provisionnement automatique, chaque ensemble de matriel de nud
quivalent est automatiquement divis en pools de nuds pouvant inclure jusqu
quarante nuds et six disques par nud. Ces pools de nuds bnficient par
dfaut dune protection +2:1. Plusieurs pools peuvent ensuite tre combins en
niveaux logiques et grs laide de rgles de pools de fichiers SmartPools. En
subdivisant les disques dun nud en plusieurs pools protgs sparment, les
nuds sont plus rsilients quauparavant aux multiples pannes de disque.

Figure 15 : partitionnement automatique avec SmartPools
Protocoles pris en charge

Les clients disposant des informations didentification et des privilges appropris
peuvent crer, modifier et lire les donnes laide de lune des mthodes standard
pour communiquer avec le cluster :
NFS (Network File System)
SMB/CIFS (Server Message Block/Common Internet File System), avec prise
en charge du multicanal SMB3
FTP (File Transfer Protocol)
HTTP (Hypertext Transfer Protocol)
HDFS (Hadoop Distributed File System)
REST API (Representational State Transfer Application Programming Interface)
Par dfaut, seuls les protocoles SMB/CIFS et NFS sont activs dans le cluster Isilon.
La racine du systme de fichiers pour toutes les donnes du cluster est /ifs
(systme de fichiers Isilon OneFS). Le protocole SMB/CIFS utilise la prsentation
de type partage ifs (\\<cluster_name\ifs), et le protocole NFS utilise la
prsentation de type /ifs (<cluster_name>:/ifs).
Remarque : les donnes tant communes tous les protocoles, les modifications
apportes au contenu des fichiers via un protocole daccs sont instantanment
affichables par tous les autres.

volutivit dynamique/volutivit la demande
Performances et capacit
Contrairement aux systmes de stockage traditionnels qui doivent voluer
verticalement (scale-up) lorsque les performances ou la capacit atteignent leurs
limites, OneFS permet un systme de stockage Isilon dvoluer horizontalement
(scale-out), en largissant de manire transparente le systme de fichiers ou le
volume existant pour atteindre une capacit de plusieurs ptaoctets, tout en
augmentant paralllement les performances de faon linaire.
Laugmentation de la capacit et des performances est beaucoup plus facile sur un
cluster Isilon que sur les autres systmes de stockage. Elle ne demande que trois
tapes simples ladministrateur de stockage : ajouter un autre nud au rack,
connecter le nud au rseau InfiniBand et demander au cluster dajouter le nud
supplmentaire. Le nouveau nud offre de la capacit et des performances
supplmentaires, puisque chaque nud intgre des ressources CPU, mmoire,
cache, rseau, NVRAM et des chemins de contrle des E/S.
La fonction Autobalance de OneFS dplace les donnes sur le rseau InfiniBand de
manire automatique et cohrente, de telle sorte que les donnes existantes qui
rsident sur le cluster soient stockes sur ce nouveau nud. Ce rquilibrage
automatique vite que ce nud ne devienne un point sensible pour les nouvelles
donnes et permet aux donnes existantes de bnficier des avantages dun
systme de stockage plus puissant. La fonction AutoBalance de OneFS est
galement totalement transparente pour lutilisateur. Il est possible de la rgler
pour minimiser son impact sur les charges applicatives hautes performances.
elle seule, cette fonction permet OneFS de passer, de manire transparente et
la vole, dune capacit de 18 To un maximum de 20 Po, sans augmenter le
temps de gestion de ladministrateur ni la complexit du systme de stockage.
Un systme de stockage grande chelle doit offrir les performances requises
pour diffrents types de workflows, quils soient squentiels, simultans ou
alatoires. Il existe diffrents workflows entre les applications et au sein dune
application. travers un logiciel intelligent, OneFS rpond tous ces besoins la
fois. Plus important encore, avec OneFS, le dbit et le nombre dE/S par seconde
voluent de faon linaire en fonction du nombre de nuds prsents dans le
systme. Grce la distribution quilibre des donnes, au rquilibrage
automatique et au traitement distribu, OneFS est en mesure de tirer le meilleur
parti des CPU, des ports rseau et de la mmoire supplmentaires mesure que le
systme volue.

Figure 16 : volutivit linaire OneFS
Interfaces
Les administrateurs peuvent utiliser plusieurs interfaces pour grer un cluster de
stockage Isilon dans leur environnement :
Interface utilisateur dadministration Web (WebUI)
Interface de ligne de commande via laccs rseau SSH ou la connexion srie
RS232
cran LCD sur les nuds eux-mmes pour des fonctions dajout/de
suppression simples
API RESTful de plate-forme pour le contrle et lautomatisation par
programmation de la configuration et de la gestion du cluster.
Authentification et contrle daccs

Les services dauthentification offrent une couche de scurit en vrifiant les
informations didentification des utilisateurs avant de leur permettre de consulter
et modifier des fichiers. OneFS prend en charge quatre mthodes
dauthentification des utilisateurs :
Active Directory (AD)
LDAP (Lightweight Directory Access Protocol)
NIS (Network Information Service)
Groupes et utilisateurs locaux
OneFS permet dutiliser plusieurs types dauthentification. Toutefois, nous vous
recommandons de vous familiariser en dtail avec les interactions qui existent
entre ces types dauthentification avant dactiver plusieurs mthodes sur le cluster.
Consultez la documentation du produit pour savoir comment configurer
correctement plusieurs modes dauthentification.

Active Directory
Active Directory, une implmentation Microsoft de LDAP, est un service dannuaire
qui peut stocker des informations relatives aux ressources rseau. Bien
quActive Directory puisse jouer de nombreux rles, lintrt principal de
lassociation du cluster au domaine rside dans la mise en uvre de
lauthentification des utilisateurs et des groupes.
Vous pouvez configurer et grer les paramtres Active Directory dun cluster
partir de linterface dadministration Web ou de linterface CLI ; toutefois, il est
gnralement recommand dutiliser linterface dadministration Web pour cette
opration.
Chaque nud du cluster partage le mme compte de machine Active Directory, ce
qui facilite considrablement ladministration et la gestion.
LDAP
Le protocole LDAP (Lightweight Directory Access Protocol) est un protocole rseau
utilis pour dfinir, interroger et modifier des services et des ressources. Son
principal avantage rside dans le caractre ouvert des services dannuaire et dans
la possibilit de lutiliser sur un grand nombre de plates-formes. Le systme de
stockage en cluster Isilon peut utiliser LDAP pour authentifier les utilisateurs et les
groupes en vue de les autoriser accder au cluster.
NIS
NIS, ou Network Information Service, est un protocole de services dannuaire
conu par Sun Microsystems. Il peut tre utilis par le systme Isilon pour
authentifier les utilisateurs et les groupes lors de laccs au cluster. NIS, parfois
appel Yellow Pages (YP), est diffrent de NIS+, que le cluster Isilon ne prend pas
en charge.
Utilisateurs locaux
Le systme de stockage en cluster dIsilon prend en charge lauthentification des
utilisateurs et des groupes locaux. Vous pouvez crer des comptes utilisateur et de
groupe locaux directement sur le cluster, laide de linterface WebUI.
Lauthentification locale peut se rvler utile si vous nutilisez pas de services
dannuaire tels quActive Directory, LDAP ou NIS, ou lorsquun utilisateur ou une
application spcifique a besoin daccder au cluster.
Access Zones
Access Zones fournit une mthode permettant de partitionner logiquement laccs
au cluster et dallouer les ressources pour les units autonomes, offrant ainsi un
environnement partag de tenant. Pour faciliter le processus, Access Zones
associe les trois principaux composants daccs externes :
Configuration du rseau du cluster
Protocole daccs aux fichiers
Authentification

Les zones Isilon SmartConnectTM sont associes un ensemble de partages
SMB/CIFS et un ou plusieurs fournisseurs dauthentification pour le contrle
daccs. Les partages qui se chevauchent sont autoriss, ce qui permet une
gestion centralise dun seul espace de nommage de rpertoires personnels, mais
aussi provisionne et scurise pour plusieurs tenants. Cette fonction est
particulirement utile pour les environnements dentreprise o les multiples entits
distinctes font appel un dpartement informatique central. Autre exemple :
durant une initiative de consolidation de serveurs, lors de la fusion de plusieurs
serveurs de fichiers Windows associs des forts Active Directory spares et
non fiables.
Avec Access Zones, la zone daccs systme intgre contient une instance de
chaque fournisseur dauthentification pris en charge, tous les partages SMB
disponibles et toutes les exportations NFS disponibles par dfaut.
Ces fournisseurs dauthentification peuvent inclure plusieurs instances de Microsoft
Active Directory, LDAP, NIS et des bases de donnes dutilisateurs ou de groupes
locaux.
Administration base sur des rles

Ladministration base sur des rles est un systme de contrle daccs bas sur
des rles de gestion de cluster (RBAC) qui divise les privilges des utilisateurs root
et administrateur en privilges plus granulaires et qui autorise laffectation de ces
rles spcifiques. Il est possible daccorder ces rles des utilisateurs sans
privilges. Par exemple, le personnel en charge des oprations du datacenter peut
se voir octroyer des droits en lecture seule sur lensemble du cluster, ce qui lui
donne un accs avec contrle total mais ne lui permet pas de modifier la
configuration. OneFS propose un ensemble de rles prdfinis, comprenant laudit,
ladministrateur systme et scurit, avec en plus la possibilit de crer des rles
personnaliss. Ladministration base sur les rles est intgre avec linterface CLI,
linterface WebUI et lAPI de plate-forme de OneFS.
Mise niveau des logiciels

La mise niveau vers la dernire version de OneFS vous permet de tirer parti des
nouvelles fonctionnalits et correctifs du cluster Isilon. Les clusters peuvent tre
mis niveau avec deux mthodes : simultane ou conscutive
Mise niveau simultane

Une mise niveau simultane installe le nouveau systme dexploitation et
redmarre tous les nuds du cluster en mme temps. Cette opration requiert
une interruption de service temporaire (moins de 2 minutes) pendant le processus
de mise niveau, tandis que les nuds sont redmarrs.
Mise niveau conscutive

Une mise niveau conscutive met niveau et redmarre individuellement
chaque nud du cluster de faon squentielle. Dans le cadre dune mise niveau
conscutive, le cluster reste en ligne et continue de servir les donnes aux clients
sans aucune interruption de service. Cette mise niveau ne peut tre excute
quavec une mme famille de versions de code OneFS, et non avec diffrentes
rvisions de versions de code majeures de OneFS.

Ralisation de la mise niveau
Avant une mise niveau, Isilon vous recommande vivement dexcuter un script
de vrification de prinstallation. Le script vrifie que la configuration de
linstallation actuelle de OneFS est compatible avec la version de OneFS destine
la mise niveau. Un correctif contenant le script est fourni par le centre de
support clients dIsilon.
Lors dune mise niveau, une vrification de mise niveau pralable
linstallation est galement ralise pour garantir que seule une configuration prise
en charge est autorise. Lorsquune configuration non prise en charge est trouve,
la mise niveau est arrte et des instructions de dpannage saffichent.
Lexcution proactive de la vrification de prinstallation avant de lancer une mise
niveau permet dviter toute interruption due une configuration incompatible.
Une fois que ladministrateur a tlcharg le module de mise niveau du centre
de support clients Isilon, il peut excuter la mise niveau via linterface CLI ou
linterface dadministration Web. Cette vrification relative la mise niveau peut
tre effectue via lune ou lautre interface, par la vrification de ltat de sant de
lintgralit du cluster une fois la mise niveau russie.
Logiciels de gestion et de protection des donnes

EMC Isilon
Isilon propose un portefeuille complet de logiciels de gestion et de protection des
donnes pour rpondre vos besoins :
Optimisation des performances de votre systme de stockage

Gestion des
InsightIQ scale-out Isilon grce des outils innovants de contrle des
performances
performances et de reporting.
Mise en uvre dune hirarchisation automatise du stockage

Gestion des
SmartPools extrmement efficace pour optimiser les performances et les
ressources
cots de stockage.
Attribution et gestion de quotas, permettant de partitionner et

Gestion des dallouer de manire dynamique et transparente lespace de
SmartQuotas
donnes stockage sous forme de segments faciles grer aux niveaux
cluster, rpertoire, sous-rpertoire, utilisateur et groupe.
Activation de lquilibrage de la charge des connexions client et

Accs aux basculement NFS sur incident et retour arrire dynamiques de
SmartConnect
donnes ces connexions sur lensemble des nuds de stockage pour
optimiser lutilisation des ressources du cluster.
Protection des donnes de manire fiable et efficace laide de

Protection des snapshots quasi instantans avec un impact faible ou nul sur les
SnapshotIQ
donnes performances. Restauration rapide des donnes critiques grce
des restaurations de snapshot la demande et quasi immdiates.
Gestion des
Isilon for vCenter Gestion des fonctions Isilon depuis vCenter.
donnes

Rplication et distribution asynchrones de volumineux Datasets
critiques sur plusieurs systmes de stockage partags, rpartis sur
Rplication des
SyncIQ diffrents sites, pour une fonction de reprise aprs sinistre fiable.
donnes
Simplicit des fonctions de basculement sur incident et de retour
arrire pour amliorer la disponibilit des donnes critiques.
Protection des donnes critiques en cas de suppression ou de

modification accidentelle, prmature ou malveillante grce
Rtention des
SmartLockTM notre solution logicielle de type WORM (Write Once Read Many),
donnes
et respect des exigences de conformit et de gouvernance les
plus strictes (norme SEC 17a-4, par exemple).
SmartDedupe Dduplication Optimisation de lefficacit du stockage par lanalyse du cluster

des donnes pour rechercher les blocs identiques, puis par la suppression des
rplicas, ce qui rduit la quantit de stockage physique requise.
Reportez-vous la documentation produit pour en savoir plus sur les logiciels

Isilon indiqus ci-dessus.
Conclusion
Avec OneFS, les entreprises et les administrateurs peuvent bnficier dune
volutivit de 18 To 20 Po dans un systme de fichiers unique, un volume
unique, avec un point dadministration unique. OneFS offre de hautes
performances et/ou un dbit lev, sans augmenter la complexit de la gestion.
Les datacenters nouvelle gnration doivent tre conus pour une volutivit
durable. Ils doivent matriser la puissance de lautomatisation, tirer parti de
luniformisation du matriel, garantir la consommation totale du fabric rseau et
offrir une flexibilit optimale aux entreprises soucieuses de satisfaire un ensemble
dexigences en constante volution.
OneFS est le systme de fichiers nouvelle gnration conu pour relever ces dfis.
OneFS offre les avantages suivants :
systme de fichiers unique entirement distribu ;
performances optimales, cluster 100 % symtrique ;
rpartition des fichiers sur tous les nuds du cluster ;
logiciel automatis pour liminer la complexit ;
quilibrage dynamique du contenu ;
protection flexible des donnes ;
haute disponibilit ;
administration via interface Web et CLI.
OneFS est particulirement adapt aux applications de Big Data bases sur
des fichiers ou des donnes non structures dans des environnements dentreprise
(rpertoires personnels grande chelle, partages de fichiers, archives,
virtualisation, analytique mtier), mais aussi dans divers environnements
informatiques hautes performances utilisant les donnes de faon intensive
(exploration des ressources nergtiques, services financiers, services Internet et
dhbergement, business intelligence, ingnierie, fabrication, multimdia et
divertissement, bioinformatique, recherche scientifique, etc.).

propos dEMC
EMC Corporation est un leader mondial qui accompagne les entreprises et les
fournisseurs de services dans la transformation de leurs activits et les aide
dlivrer linformatique en tant que service. Le Cloud computing est au cur de
cette dmarche. Grce des produits et services innovants, EMC acclre la
transition vers le Cloud et aide les dpartements informatiques stocker, grer,
protger et analyser leur ressource la plus prcieuse, savoir linformation, de
faon plus fiable, agile et conomique. Pour des informations complmentaires sur
EMC, consultez le site france.emc.com.

Isilon Onefs Technical Overview WP

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Isilon Onefs Technical Overview WP

Transféré par

Droits d'auteur :

Formats disponibles

Livre blanc

EMC ISILON ONEFS : PRESENTATION

EMC estime que les informations figurant dans ce document

Les informations contenues dans cette publication sont

Lutilisation, la copie et la diffusion de tout logiciel EMC dcrit

Pour obtenir la liste actualise des noms de produits,

Toutes les autres marques cites dans le prsent document

EMC Isilon OneFS : prsentation technique 2

EMC Isilon OneFS : prsentation technique 3

EMC Isilon OneFS : prsentation technique 4

EMC Isilon OneFS : prsentation technique 5

Prsentation dEMC Isilon OneFS

Figure 1 : OneFS associe un systme de fichiers, un gestionnaire de

Il sagit de linnovation principale qui permet directement aux entreprises dutiliser

EMC Isilon OneFS : prsentation technique 6

EMC Isilon OneFS : prsentation technique 7

Figure 2 : fonctionnement de tous les composants OneFS

La figure 2 illustre larchitecture complte : logiciels, matriel et rseau

Prsentation du logiciel OneFS

EMC Isilon OneFS : prsentation technique 8

Tches de maintenance du systme de fichiers

Ces tches assurent la maintenance du systme de fichiers en arrire-plan

Tches de prise en charge des fonctions

Tches de type action de lutilisateur

Ces tches sont ralises directement par ladministrateur de stockage pour

Le tableau ci-dessous fournit la liste complte des tches exposes du moteur de

Nom de la tche Description de la tche Mthodes

EMC Isilon OneFS : prsentation technique 9

Figure 3 : descriptions des tches du moteur de tches OneFS

EMC Isilon OneFS : prsentation technique 10

Une rgle dimpact peut comporter un ou plusieurs intervalles dimpact, qui

Avec la version OneFS 7.1, le moteur de tches permet lexcution simultane

Priorit des tches

EMC Isilon OneFS : prsentation technique 11

Structure du systme de fichiers

EMC Isilon OneFS : prsentation technique 12

EMC Isilon OneFS : prsentation technique 13

Rpartition des donnes

EMC Isilon OneFS : prsentation technique 14

Figure 6 : modle de composants de nud impliqus dans les E/S

EMC Isilon OneFS : prsentation technique 15

EMC Isilon OneFS : prsentation technique 16

EMC Isilon OneFS : prsentation technique 17

EMC Isilon OneFS : prsentation technique 18

EMC Isilon OneFS : prsentation technique 19

Mise en cache OneFS

Le sous-systme de mise en cache de OneFS est cohrent dans lensemble du

Figure 9 : hirarchie de mise en cache OneFS

EMC Isilon OneFS : prsentation technique 20

Un troisime niveau facultatif de cache de lecture, appel SmartFlash ou cache de

Nom Type Persistance Description

EMC Isilon OneFS : prsentation technique 21

Sur le nud local (le nud qui reoit la demande) :

Sur les nuds distants :

1. Dterminez si les donnes demandes sont dans le cache N2 local ou le

Le cache dcriture acclre le processus dcriture des donnes sur un cluster

EMC Isilon OneFS : prsentation technique 22

Figure 10 : opration de lecture de fichier sur un cluster Isilon

EMC Isilon OneFS : prsentation technique 23

Verrous et accs simultan

EMC Isilon OneFS : prsentation technique 24

Figure 11 : gestionnaire de verrou distribu

EMC Isilon OneFS : prsentation technique 25