Vous êtes sur la page 1sur 39

INDICE

INTRODUCCION
I. DEFINICIN:.............................................................................4
II. DISCOS MAGNETICOS:...............................................................4
2.1. MECANISMOS DE LECTURA Y ESCRITURA MAGNETICA..............4
2.2. ORGANIZACIN Y FORMATO DE LOS DATOS.............................5
2.3. CARACTERSTICAS FSICAS.....................................................8
2.4. PARMETROS PARA MEDIR LAS PRESTACIONES DE UN DISCO: 10
2.5. Algunos Conceptos Claves:...................................................11
III............................................................................NIVELES RAID:
14
A.

NIVELES RAID ESTNDAR....................................................14


1. RAID 0 (Data Striping, Striped Volume):............................14
2. RAID 1 (Data Mirroring)....................................................15
3. RAID 2.............................................................................17
4. RAID 3.............................................................................18
5. RAID 4.............................................................................19
6. RAID 5.............................................................................20
7. RAID 6.............................................................................22

B.

NIVELES RAID ANIDADOS....................................................22


1. RAID 0+1.........................................................................23
2. RAID 1+0.........................................................................24

3. RAID 30...........................................................................24
4. RAID 100.........................................................................25
5. RAID 10+1.......................................................................26
6. RAID 50...........................................................................26
C.

NIVELES RAID PROPIETARIOS..............................................27


1. RAID 50EE.......................................................................27
2. PARIDAD DOBLE:..............................................................27
3. RAID 1.5..........................................................................28
4. RAID 7.............................................................................29
5. RAID S O RAID DE PARIDAD..............................................29
6. MATRIX RAID...................................................................29
7. LINUX MD RAID 10...........................................................30
8. IBM SERVERAID 1E...........................................................31
9. RAID Z.............................................................................32

D.

Clculo de paridad..............................................................32

BIBLIOGRAFIA

INTRODUCCIN

Gracias a la universificacin de la informtica, ms personas estn en


contacto con el mundo de los ordenadores, ya sea para uso personal o
profesional. Todo ha servido para una evolucin ms rpida de los diferentes
componentes de los ordenadores. Desde hace 20 aos la capacidad de
proceso de los procesadores ha aumentado un 40 % cada ao. En el mismo
periodo de tiempo, los discos han doblado su capacidad cada ao, mientras
que su costo se ha reducido a la mitad. Desgraciadamente, el aumento del
rendimiento de los discos duros ha sido menos importante en comparacin
con el rendimiento del sistema, ya que tan solo ha mejorado un 50 %
durante la ltima dcada.
Por lo que tenamos y tenemos un problema con los discos duros, que son
menos eficaces que el redimiendo general del sistema, provocando una
descompensacin entre el tratamiento de la informacin del sistema (muy
rpido) y la lectura - grabacin de datos en el disco duro(muy lenta). Para
ello se invent un sistema para guardar informacin en varios discos duros a
la vez por lo que acceso se haca ms rpido ya que la carga se distribua
entre los diferentes discos duros, a esto se le llamo cadenas redundantes de
discos de bajo costo (RAID). Pero a la hora de saber cmo podemos
optimizar nuestro RAID nos encontrbamos con algunos problemas, como
puede ser encontrar la perfecta relacin calidad precio
HITORIA
El trmino RAID hizo su debut oficial en 1989 en forma de un paper
publicado por David Paterson, Garth Gibson y Randy Katz, todos ellos de la
Universidad de California. El paper se titulaba "A case for Redundant Array
of Inexpensive Disks".
En dicho trabajo el equipo defini cinco niveles para arreglos de discos
cuyas funciones eran ofrecer mejoras en el rendimiento, confiabilidad, tasa
de transferencia y tasas de lectura/escritura. Cada nivel tiene sus propias
ventajas y desventajas, las cuales iremos revisando en el transcurso de la
lectura.
Desde entonces, mltiples fabricantes han introducido y/o desarrollado
variaciones a estos cinco niveles originales y las han bautizado en acuerdo a
las genialidades de sus respectivos Departamentos de Marketing. Para
propsitos de esta lectura usaremos las definiciones especificadas por el
RAID Advisory Board, que es una institucin conformada por un grupo de 40
empresas entre fabricantes y desarrolladores interesados en el tema de
RAID y en su estandarizacin.
En el trabajo original el trmino RAID se refera a Redundant Array of
Inexpensive Disks como una contraposicin directa a los SLED (Single Large
Expensive Disks). Sin embargo, las increbles bajas en los precios de los
discos duros han ocasionado que los SLED prcticamente desaparezcan, por
lo tanto, el significado de la sigla ha cambiado y en la actualidad se la
traduce como Redundant Array of Independent Disks.

I. DEFINICIN:
RAID es una forma de almacenar los mismos datos en distintos lugares
(por tanto de modo redundante) en mltiples discos duros. Al colocar los
datos en discos mltiples, las operaciones I/O (input/output, de entrada
y salida) pueden superponerse de un modo equilibrado, mejorando el
rendimiento del sistema. Dado que los discos mltiples incrementan el
tiempo medio entre errores (mean time between failure, MTBF), el
almacenamiento redundante de datos incrementa la tolerancia a fallos.
Un RAID, para el sistema operativo, aparenta ser un slo disco duro
lgico. El RAID emplea la tcnica conocida como "striping" (bandeado o
creacin de bandas), que incluye la particin del espacio de
almacenamiento de cada disco en unidades que van de un sector (512
bytes) hasta varios megabytes. Las bandas de todos los discos estn
interpaginadas (interleaved) y se accede a ellas en orden.
En un sistema de un solo usuario donde se almacenan grandes registros
(como imgenes mdicas o de otro tipo), las bandas generalmente se
establecen para ser muy pequeas (quiz de 512 bytes) de modo que
un solo registro est ubicado en todos los discos y se pueda acceder a l
rpidamente leyendo todos los discos a la vez.
En un sistema multiusuario, un mejor rendimiento demanda que se
establezca una banda lo suficientemente ancha para contener el
registro de tamao tpico o el de mayor tamao. Esto permite acciones
I/O superpuestas en los distintos discos.

II. DISCOS MAGNETICOS:


Un disco magntico es un plato circular construido con un material no
magntico, llamado sustrato, cubierto por un material magnetizable.
Tradicionalmente, el sustrato es aluminio o una aleacin de aluminio.
Recientemente, se han utilizado sustratos de cristal. Los sustratos de
cristal tienen una serie de ventajas, entre las cuales se encuentran:
Mejora en la uniformidad de la superficie magntica para
incrementar la fiabilidad del disco.
Reduccin significativa de los defectos en toda la superficie lo que
ayuda a reducir los errores de lectura/escritura.
Capacidad para soportar grabaciones de gran proximidad
Mejor rigidez para reducir la dinmica del disco
Mayor capacidad para resistir golpes y daos.

2.1. MECANISMOS DE LECTURA Y ESCRITURA MAGNETICA


Los datos se graban y despus se recuperan del disco a travs de
una bobina, llamada cabeza, en muchos sistemas, hay dos cabezas,
una de lectura y otra de escritura.
Durante una operacin de lectura o escritura, la cabeza permanece
quieta mientras el plato rota bajo ella.
El mecanismo de escritura se basa en el hecho que un flujo elctrico
atraviesa una bobina creando un campo magntico. Se envan
pulsos elctricos a la cabeza de escritura, y se graban los patrones
magnticos en la superficie bajo ella, con patrones diferentes para
corrientes positivas y negativas. La propia cabeza de lectura est
hecha de un material fcilmente magnetizable y tiene forma de
donut rectangular con un agujero a lo largo de un lado y varias
vueltas de cable conductor a lo largo del lado opuesto. Una corriente
elctrica en el cable induce un campo magntico a lo largo del
agujero, que magnetiza una pequea rea del medio grabable.
Cambiando la direccin de la corriente, cambia el sentido de
magnetizacin del medio de grabacin.

El mecanismo tradicional de lectura se basa en el hecho de que un


campo magntico en movimiento respecto a una bobina, induce una
corriente elctrica en la bobina. Cuando la superficie del disco pasa
bajo la cabeza, en esta se genera una corriente de la misma
polaridad que la que produjo la grabacin magntica. La escritura de
la cabeza de lectura es, este caso, esencialmente la misma que la
de escritura y, que por tanto, se puede usar la misma cabeza para
ambas operaciones. Estas cabezas nicas se usan en disquetes y
discos duros antiguos.

Los discos duros de hoy usan un mecanismo diferente para la


lectura, siendo necesaria una cabeza de lectura separada
posicionada, por conveniencia, cerca de la cabeza de escritura. La
cabeza de lectura cosiste en un sensor magneto-resistivo (MR)
parcialmente blindado. El MR tiene una resistencia elctrica que
depende de la direccin de la magnetizacin del medio que se
mueve bajo l. Haciendo pasar una corriente a travs del sensor MR,
los cambios de la resistencia se detectan como seales de tensin.
El diseo del MR permite operar a altas frecuencias, lo que equivale
a grandes densidades de almacenamiento y de velocidad de
funcionamiento.

2.2. ORGANIZACIN Y FORMATO DE LOS DATOS


La cabeza es un dispositivo relativamente pequeo, capaza de leer o
escribir en una zona del palto que rota bajo ella. Esto da lugar a que
los datos se organicen en un conjunto de anillos concntricos en el
plato, llamados pistas. Cada pista es del mismo ancho que la
cabeza. Usualmente hay cientos de pistas por superficie.

Se puede ver la disposicin de los datos. Las pistas adyacentes


estn separadas por bandas vacas. Esto previene, o por lo menos
minimiza, los errores debidos a desalineamientos de la cabeza o
simplemente a interferencias del campo magntico.

Los datos se transfieren al y desde el disco en sectores.


Normalmente hay cientos de sectores por pista, y estos pueden
tener una longitud variable o fija. En la mayora de los sistemas de
hoy se utilizan sectores de longitud fija, siendo 512 bytes el tamao
casi universal de un sector. Para evitar imposiciones de precisin
ilgicas del sistema, los sectores adyacentes se separan con intrapistas (inter-sectores) vacas. Un bit cercano al centro de un disco
girando, pasa por punto fijo (como la cabeza de lectura-escritura)
ms despacio que un bit ms externo. Por tanto, debe haber alguna
forma de compensar la variacin de la velocidad de forma que la
cabeza pueda leer todos los bits a la misma velocidad. Esto se
puede hacer incrementando el espacio entre bits de la informacin
grabada en los segmentos del disco. La informacin se puede
escanear a la misma velocidad a una velocidad fija, conocida como
velocidad angular constante (constant angular velocity, CAV).

La figura 6.3a muestra la estructura de un disco que usa CAV. El


disco se divide en una serie de sectores en forma de trozo de tarta y
en una serie de pistas concntricas. La ventaja de usar CAV es que
los bloques individuales de datos se pueden direccionar
directamente con la pista y sector. Para mover la cabeza a la pista
especfica y esperar a que el sector se site bajo la cabeza. La
desventaja de CAV es que la cantidad de datos que se puede
almacenar en las pistas ms externas es solo la misma que la de las
pistas internas.
Debido a que la densidad, en bits por pulgada, aumenta a medida
que nos movemos desde la pista ms externa a la ms interna, la

capacidad de almacenamiento de un disco con un sistema CAV


sencillo viene limitada por la mxima densidad de grabacin que se
puede llevar a cabo en la pista ms interna. Para aumentar la
capacidad los discos duros modernos utilizan una tcnica conocida
como grabaciones en varias zonas. (multiple zone recording), en la
que la superficie se divide en varias zonas concntricas (usualmente
16). Dentro de una zona, el nmero de bits por pista es constante.
Las zonas ms lejanas del centro contienen ms bits (ms sectores)
que las zonas prximas al centro. Esto permite capacidades de
almacenamiento mayores a expensas de una circuitera de alguna
forma ms compleja. Como la cabeza del disco se mueve de una
zona a otra. La longitud (a lo largo de la pista) de los bits
individuales cambia, provocando un cambio en tiempo de lectura y
escritura. La figura 6.3b sugiere la naturaleza de la grabacin en
varias zonas; en esta figura, cada zona es una sola pista.
Algn procedimiento es necesario para situar las posiciones del
sector en una pista. Claramente, debe haber algn punto de
comienzo de la pista y manera de identificar el principio y el fin de
cada sector. Estos requisitos son gestionados mediante datos de
control grabados en el disco. Por tanto, el disco se graba con un
formato que contiene algunos datos dados solo por el controlador
del disco y no accesibles al usuario.

En la figura 6.4 se muestra un ejemplo del formato de grabacin


de un disco. En este caso, cada pista contiene treinta sectores de
longitud fija de 600 bytes cada uno. Cada sector contiene 512 bytes
de datos ms informacin de control til al controlador del disco. El
campo ID es un identificador nico o direccin usado para localizar
un sector particular. El byte SINCRO es un patrn de bits especial
que delimita el comienzo del campo. El nmero de pista identifica
una pista en una superficie. El nmero de cabeza identifica una
cabeza, si el disco tiene varias superficies (como acabamos de
explicar). El ID y los campos de datos contiene, cada uno, un cdigo
de deteccin de errores.

2.3. CARACTERSTICAS FSICAS

En la Tabla 6.1 se listan las principales caractersticas que


diferencias los distintos tipos de discos. Primero, las cabezas pueden
ser fijas o mviles con respecto a la direccin radial del plato. En un
disco de cabeza fija hay una cabeza de lectura/escritura por pista.
Todas las cabezas se montan en un brazo rgido que se extiende a
travs de todas las pistas. En un disco de cabeza mvil, hay solo una
cabeza de lectura/escritura. Como antes, la cabeza se monta en un
brazo. Como la cabeza debe poder posicionarse encima de cualquier
pista, el brazo debe extenderse o retraerse para este propsito.
El disco mismo, se monta en una unidad de disco, que consta del
brazo, un eje que rota el disco, y la electrnica necesaria para la
entrada y salida de datos binarios. Un disco no extrable est
permanente, puede ser quitada y sustituido por otro disco. La
ventaja de este ltimo tipo que es posible una cantidad de datos
ilimitada con un nmero limitado de unidades de disco. Adems, un
disco puede ser utilizado en diversos computadores. Los disquetes y
los cartuchos ZIP son ejemplos de discos extrables.
En la mayora de los discos, la cubierta magnetizable se aplica a
ambas caras del plato, denominndose estos discos de doble
superficie. Algunos discos, menos caros, son de una superficie.
Algunas unidades de disco poseen varios platos apilados
verticalmente y separados por una distancia de alrededor de una
pulgada. Disponen de varios brazos (Figura 6.5). Los discos de
varios platos utilizan una cabeza que se mueve, con una cabeza de
lectura-escritura para cada superficie del plato. El conjunto de todas
las pistas que tienen la misma posicin relativa en el plato se
denomina cilindro. Por ejemplo, todas las pistas sombreadas en la
Figura 6.6 pertenecen al mismo cilindro.

Finalmente, el mecanismo de la cabeza proporciona una clara


clasificacin de los discos en tres tipos. Tradicionalmente, la cabeza
de lectura/escritura se posiciona a una distancia fija sobre el plato,
dejando entre ambos una capa de aire. En el otro extremo est el
mecanismo de la cabeza que realmente efecta un contacto fsico
con el medio durante la operacin de lectura o escritura. Este
mecanismo es el que se usa con los disquetes, que son pequeos,
de plato flexible y es el tipo de disco ms barato.

Para entender el tercer tipo de disco, necesitamos comentar la


relacin entre la densidad de datos y la anchura de la capa de aire.
La cabeza debe generar o detectar un campo magntico de
intensidad suficiente para escribir y leer correctamente. Cuando ms
estrecha es la cabeza, ms cercana debe estar la superficie del plato
para funcionar. Esto es deseable, ya que una cabeza ms estrecha
implica pistas ms estrechas y por tanto, mayor densidad de datos.
Sin embargo, cuando ms cerca este la cabeza del disco, mayor ser
el riesgo de error debido a impurezas o imperfecciones. Los discos
Winchester supieron un avance tecnolgico en este sentido.
Las cabezas de los Winchester estn montadas en unidades
hermticamente cerradas, que estn casi libres de contaminacin.
Fueron diseados para operar ms cerca de la superficie del disco
que las cabezas de los discos rgidos anteriores, por tanto permiten
una densidad de datos mayor. La cabeza esta en contorno de una
hoja de metal aerodinmica que reposa suavemente sobre la
superficie del plato cuando el disco no se mueve. La presin del aire
generada por el giro del disco es suficiente para hacer subir la hoja
encima de la superficie. El sistema sin contacto resultante puede ser
diseado para usar cabezas ms estrechas que las de los discos
rgidos convencionales, operando ms cerca de la superficie de los
platos.

2.4. PARMETROS PARA MEDIR LAS PRESTACIONES DE UN


DISCO:
Los detalles de las operaciones de E/S de un disco dependen del tipo
de computador, del sistema operativo, de la naturaleza de los
canales de E/S y del hardware controlador del disco. En la figura 6.7
se muestra un diagrama de temporizacin general de las
transferencias de E/S del disco.
Cuando la unidad de disco est funcionando, el disco est rotando a
una velocidad constante. Para leer o escribir, la cabeza debe
posicionarse en la pista deseada y al principio del sector deseado en

la pista. La seleccin de la pista implica un movimiento de la cabeza,


en un sistema de cabeza mvil, o una seleccin electrnica de una
cabeza, en un sistema de cabezas fijas. En un sistema de cabeza
mvil, el tiempo que tarda la cabeza en posicionarse en la pista se
conoce como tiempo de bsqueda. En cualquier caso, una vez
seleccionada la pista, el controlador del disco espera hasta que el
sector apropiado rote hasta alinearse con la cabeza. El tiempo que
tarda el sector en alcanzar la cabeza se llama retardo rotacional o
latencia rotacional. La suma de tiempo de bsqueda, si lo hay, y
el retardo rotacional se denomina tiempo de acceso, o tiempo que
se tarda en llegar a la posicin de lectura o escritura. Una vez
posicionada la cabeza, se lleva a cabo la operacin de lectura o
escritura, desplazndose el sector bajo la cabeza; esta operacin
conlleva un tiempo de transferencia de datos.
Adems del tiempo de acceso y de transferencia, hay varios retardos
en cola usualmente asociados con operaciones de E/S del disco.
Cuando un proceso hace una peticin de E/S, primero debe esperar
en cola hasta que el dispositivo est disponible. En ese momento, el
dispositivo es asignado al proceso. Si el dispositivo comparte un
nico canal E/S o un conjunto de canales de E/S con otros discos,
entonces puede tener que hacer esperas adicionales para que el
canal est disponible. En este punto se hace la bsqueda para
empezar el acceso del disco.
En algunos computadores grandes, se usa una tcnica conocida
como deteccin de posiciones rotacional (RPS, rotational positional
sensing). Esta funciona de la siguiente forma; cuando se lleva a cabo
una orden de bsqueda, el canal es liberado para entender otras
operaciones de E/S. Cuando la bsqueda se ha completado, el
dispositivo determina cuando se rotan los datos bajo la cabeza.
Mientras el sector se aproxima a la cabeza, el dispositivo intenta
restablecer el camino de comunicacin hacia el anfitrin. Si la
unidad de control o el canal estn ocupados con otra E/S, la
conexin puede fallar y el dispositivo rotar una vuelta completa
antes de que pueda intentar conectarse de nuevo, lo que se
denomina una prdida de RPS. Esto supone un retardo extra que se
debe aadir a la lnea de tiempo de la Figura 6.7.

2.5. Algunos Conceptos Claves:


TIEMPO DE BUSQUEDA: El tiempo de bsqueda es el tiempo
necesario para desplazar el brazo de disco hasta la pista
requerida. Este tiempo resulta difcil de precisar. El tiempo de
bsqueda est formado por dos componentes clave: el tiempo
inicial de comienzo y el tiempo necesario para atravesar las pistas
que tienen que cruzarse una vez que el brazo de acceso est a la
velocidad
adecuada.
El
tiempo
transversal
no
es,
desgraciadamente, una funciona lineal del nmero de pistas, pero
incluye un tiempo de espera (tiempo desde que se posiciona la
cabeza sobre la pista objetivo hasta que se confirma la
identificacin de la pista).
Muchas mejoras provienen de componentes ms pequeos y
ligeros. Hace algunos aos, un disco tpico tena 14 pulgadas (36
cm) de dimetro, mientras que hoy el tamao ms normal es de
3.5 pulgadas (8.9 cm), reducindose la distancia que tiene que
recorrer el brazo. Un tiempo de bsqueda medio tpico de un disco
actual est entre 100 a 150 ms.
RETARDO ROTACIONAL: Los discos, que no sean disquetes,
rotan a velocidades de 3600 rpm (para controlar dispositivos
como cmaras digitales) en adelante, como 15 000 rpm; esta
ltima velocidad es una revolucin cada 4 ms.
Por tanto, de media, el retardo rotacional ser de unos 2 ms. Las
disqueteras normalmente rotan entre 300 a 600 rpm. Por tanto, el
retardo medio est entre los 100 a 20 ms.
TIEMPO DE TRANSFERENCIA: El tiempo de transferencia hacia
o desde el disco depende de la velocidad de rotacin del disco de
la siguiente forma:

T=

br
N
Donde:
T = tiempo de transferencia
b = nmero de bytes a transferir
N = nmero de bytes de una pista
r = velocidad de rotacin en revoluciones por
segundo
Por tanto, el tiempo de acceso medio total se puede expresar
como

T a=T s +

1 br
+
2r N

donde

Ts

es el tiempo de bsqueda medio. Ntese que en una

unidad con zonas, el nmero de pistas es variable, complicndose


el clculo.
UNA COMPARACION DE TIEMPOS: Con los parmetros
definidos anteriormente, veamos dos operaciones de E/S
diferentes que ilustrarn el peligro de fiarse de los valores
medios. Considrese un disco con un tiempo de bsqueda medio
especificado de 4 ms, una velocidad de rotacin de 15 000 rpm y
sectores de 512 bytes con 500 sectores por pista. Supngase que
queremos leer un fichero que consta de 2 500 sectores con un
total de 1.28 Mb. Queremos estimar el tiempo total de
transferencia.
Primero, supongamos que el fichero est almacenado de la forma
ms compacta posible en el disco. Es decir el fichero ocupa todos
los sectores de 5 pistas adyacentes (5 pistas x 500 sectores /pista
= 2 500 sectores). Esto se conoce como organizacin secuencial.
Ahora, el tiempo para leer la primera pista es el siguiente:
Bsqueda
media
Retardo
rotacional
Leer 500
sectores

4 ms
2 ms
4 ms
10 ms

Supongamos que el resto de las pistas se puede leer ahora sin


prcticamente tiempo de bsqueda. Es decir, la operacin de E/S
puede mantenerse con un flujo continuo desde el disco. Entonces,
al menos, se necesita considerar un retardo rotacional para cada
pista leda. Entonces, cada pista siguiente se lee en 2 + 4 = 6 ms.
Para leer el fichero entero:
Tiempo Total = 10 + (4 x 6) = 34 ms = 0.034 segundos
Ahora calculemos el tiempo requerido para leer los mismos datos utilizando
acceso aleatorio en vez de secuencial; es decir, los accesos a los sectores se
distribuyen
aleatoriamente
Bsqueda
4
ms
sobre
el
disco. media
Para cada sector
tenemos:
Retardo
2 ms
rotacional
Leer 1
0.008 ms
sectores
10 ms

Tiempo total = 2 500 x 6.008 = 15 020 ms = 15.02 segundos


Est claro que el orden en que se lean los sectores desde el disco
tiene una repercusin enorme en las prestaciones de E/S. En el
caso de acceso a ficheros en los que se lean o escriban varios
sectores, se tienen un cierto control sobre la forma en que los
sectores o datos se organizan, y debemos decir algo sobre este
tema en el siguiente captulo. Sin embargo, aun en el caso de un
acceso a un fichero, en un entorno de multiprogramacin, habr
peticiones de E/S compitiendo por el mismo disco. Entonces,
merece la pena examinar maneras en las que las prestaciones de
E/S del disco mejoren respecto a las llevadas a cabo con accesos
al disco puramente aleatorios. Esto conduce a considerar
algoritmos de planificacin del disco, que son jurisdiccin de los
sistemas operativos.

III.NIVELES RAID:
A. NIVELES RAID ESTNDAR

1. RAID 0 (Data Striping, Striped Volume):

Tambin llamado conjunto dividido, volumen dividido o volumen


seleccionado. Es conocido como Striping o Fraccionamiento.
Este nivel RAID distribuye equitativamente los datos entre dos o
ms discos sin informacin de paridad que proporcione
redundancia.
El RAID 0 no era uno de los niveles RAID originales, adems no
ofrece tolerancia a fallos debido a que en este nivel no existe
redundancia. Esto implica que cuando ocurra un fallo en
cualquiera de los discos rgidos, ocasione prdida de informacin;
ya que, una ensima parte de los datos se encuentran en cada
una de las unidades de disco (donde n es el nmero de discos
duros). Sin embargo, al no existir redundancia, la recuperacin de
datos (recuperacin paralela) de los discos, permite poseer un
alto rendimiento de lectura y escritura de estos.
Generalmente este nivel se usa para crear discos de diferentes
tamaos, donde su espacio de almacenamiento al conjunto est
limitado por el tamao del disco de menor capacidad. Esto quiere

decir que si tenemos un disco de 500 GB y otro de 250 GB con el


cual se quiere dividir, la capacidad del conjunto resultante sera
500 GB, donde cada uno aportara 250 GB (capacidad del disco de
menor tamao).
Los tiempos de acceso en este tipo de nivel, donde los discos
presenten diferentes caractersticas, por lo general se encuentran
entre los del ms rpido y los del ms lento (aunque usualmente
se encuentran ms cerca al ms lento). Adems la velocidad de
transferencia, en teora debera ser igual a la suma de las
velocidades de transferencia de los discos; sin embargo los
limitantes de esta velocidad, son las velocidades de transferencia
de la propia tarjeta RAID y del sistema.
VENTAJAS:
-

Permite crear discos grandes a partir de discos con menos


capacidad de almacenamiento. Aunque esto, ahora ya no
soluciona el problema de discos con poca capacidad ya que
hoy en da se cuenta con discos de gran capacidad y a
precios bajos.
Por el simple hecho de que en este tipo de nivel no existe
redundancia, se logra una mayor velocidad de acceso de
datos. Esta ventaja, es ms en comparacin con la realidad
de los discos de hace 10 aos, ya que proporcionaba un
mayor rendimiento causado por la lectura y escritura de
datos en dos discos a la vez. Sin embargo comparndolo con
los discos actuales, no se aprecia demasiado.

DESVENTAJAS:
-

Como una de sus caractersticas es que no existe tolerancia


a fallos ni control de paridad, no es aconsejable para copias
de seguridad o instalacin de estos en sistemas operativos;
por el motivo de que no nos garantiza que los datos se
encuentren integrados.
As como aumenta el rendimiento de los discos, tambin
aumenta la carga que tiene que soportar el procesador. Sin
embargo, este incremento solo es mayor en sistemas con
discos de igual velocidad; pues en el caso de discos de
diferentes velocidades, el lmite en este incremento suele
estar en la velocidad del ms rpido.
Se tiene casi nulas posibilidades de recuperar informacin en
un disco averiado, lo que significa que ante el fallo de uno de
estos; se echara a perder todo el sistema por el simple
hecho de su forma de guardar los datos.
Si el dispositivo presenta algn fallo, es mejor no seguir
usndolo, ya que los daos fsicos son progresivos.
No se puede realizar ningn operacin que tenga que ver
con sobrescribir datos, como es el caso de escaneo,

formateo, instalacin de algn programa, sustitucin de


discos, reconstruccin, etc.
USO:
Este nivel proporciona alto rendimiento para los siguientes casos:
-

Se trabaja en diseo de grandes grficos para los cuales se


necesita un espacio de trabaja, donde por ejemplo, se usa la
herramienta Photoshop, y se requiere que esta trabaje a alta
velocidad.
Se requiere la grabacin de grandes archivos DV (archivos
de videos asociados con Digital Video File y File ViewPro) o la
edicin de archivos de este tipo o videos HD y se desea un
flujo continuo, donde se conserve un rendimiento limpio de
audio y de cuadros de video.
Se quiere visualizar en 3D, objetos y efectos especiales que
sean complejos.
Se realice operaciones de bases de datos con uso intensivo
del disco.

2. RAID 1 (Data Mirroring)


Este nivel de RAID hace rplicas de un conjunto de datos en dos o
ms discos (redundancia), es decir funciona con un espejo.
Permitiendo as que un disco sea una copia exacta del otro disco;
y por tanto, si uno de los discos presentes falla o se avera, es
posible continuar normalmente con las operaciones que el disco
averiado estaba realizando, ya que el otro disco asume las
responsabilidades del anterior. Todo esto quiere decir que para
que el nivel falle, es necesario el fallo de todos sus discos, lo cual
se resume en que la probabilidad de fallo del RAID 1 es igual al
producto de las probabilidades de fallo de cada uno de sus discos.

El hecho de que los datos se almacenen en cada uno de los discos


permite que el rendimiento de lectura se incremente (en uso de
controladoras de disco independientes para cada uno), pues este
nivel en algn momento, puede por ejemplo leer dos datos
distintos a la vez que se encuentran en dos discos distintos,
produciendo as que el rendimiento se duplique.
Los discos, puedes ser ledos desde el disco original o el disco
duplicado sin temor a que ocurra alguna interrupcin o se
detenga el sistema.
VENTAJAS:
-

Permite tener una copia de seguridad del disco, lo que


disminuye la probabilidad de prdida de datos.
Cuando falla un disco, se tiene como respaldo el otro disco, y
no solo como respaldo de informacin, sino de todo lo que

estaba realizando el disco que se averi. Lo cual evita que el


sistema presente interrupciones ocasionado por fallo de los
discos.
Se puede utilizar para tener una copia exacta no solo de un
disco, sino de otros distintos, permitiendo as un mejor
funcionamiento del sistema y de respuestas de lectura. Lo
que se suele conocer como duplexing.
Raid Nivel 1 Trabajo Arquitectura de Computadoras Sebastin

Araya

DESVENTAJAS:
-

En el caso de la escritura, el conjunto acta como un nico


disco. Esto debido a que los discos deben ser escritor en
todos los discos que contenga el RAID 1. En resumen, el
rendimiento con respecto a la escritura, no mejora.
Como se menciona anteriormente, la escritura se realiza en
cada disco, esto resulta costoso y un mal aprovechamiento
del espacio. Supongamos que tenemos 2 discos de 100 GB,
la capacidad terica total sera 80 GB, sin embargo solo se
estara aprovechando la mitad, ya que la otra mitad vendra
a ser exactamente lo mismo.

USO:
-

Se puede usar para una lectura intensiva en el


Procesamiento de Transacciones en Lnea (OLTP OnLine
Transaction Precessing) u otras formas de transacciones de
datos para alto rendimiento y alta disponibilidad.
Asimismo, el uso de RAID puede ser muy recomendable en el
caso de los correos electrnicos, los sistemas operativos, los
ficheros de aplicaciones y los entornos donde sea requiera
acceso aleatorio o de lectura intensiva.
Su mejor aplicacin es en sistemas donde se requiera poco
espacio como sistemas operativos o discos de arranque.

3. RAID 2
Este nivel en lugar de la divisin en bloques, utiliza la divisin de
datos en bits. Adems usa cdigos Hamming, el cual permite
detectar y corregir errores (lo que se conoce como Error Checking
and Correcting o ECC). El RAID 2 adapta el mecanismo de
deteccin de fallas en discos rgidos para poder funcionar como
memoria lo que cual le permite tener una especie de control y
seguimiento de los datos.

Adems, se necesita como mnimo 2 discos dinmicos para su


acceso aleatorio a los datos. Los datos en este nivel se almacenan
de forma aleatoria pero adems se necesita espacio para guardar
datos con respecto a la verificacin y correccin de errores
(cdigos Hamming).
Diagrama de configuracin de RAID 2 Raid - Wikipedia

VENTAJAS:
-

El uso del cdigo Hamming permite la deteccin y correccin


de errores en los discos rgidos.

DESVENTAJAS:
-

Es un nivel RAID casi obsoleto, actualmente es el nico tipo


RAID que se utiliza extraas veces.
Usualmente no permite atender varias peticiones a la vez,
debido a que un bloque de datos se dividir en una parte
para cada disco, conservando la misma direccin dentro de
estos. Esto quiere decir que si se guarda en 3 discos un dato
A dividido en A1, A2 y A3 en el disco 1, disco 2 y disco 3
respectivamente (llammosla posicin 0 en cada disco); y se
necesita guardar un dato B dividido en B1, B2 y B3, todos
ests divisiones tienen que estar en la misma posicin, como
el dato A se guard en la posicin 0 de cada disco, los datos
B tienen que estar en la posicin 1 de cada disco.
El hecho de que los datos estn divididos en cada disco
genera que cualquier operacin de lectura o escritura sea
lento ya que para leer un dato (completo) se tiene que
acceder a la misma direccin de cada disco. Por lo tanto no

es posible leer y escribir al mismo tiempo ya que los discos


son paralelos pero no independientes.
El costo es elevado ya que como utiliza cdigo Hamming, es
necesario un disco adicional para cada disco para deteccin
de errores.

USO
-

Por ser de principalmente una tecnologa de acceso paralelo,


el RAID 2 no es muy conveniente en aplicaciones que
necesiten una alta tasa de demanda de entrada y salida;
ms bien apunta hacia aplicaciones que necesiten una alta
tasa de transferencia

4. RAID 3
En el RAID 3, los datos no son divididos en bloques sino en bytes.
Los datos son divididos entre todos los discos que posee, excepto
uno, que es usado para guardar la informacin relacionada con la
paridad. Por eso, el nmero de discos va a ser siempre n+1, ya
que uno estar dedicado solo a la paridad.
Diagrama de configuracin de RAID 3 Raid - Wikipedia

En la imagen podemos ver cmo se guardan los datos. Se ha


guardado el dato A pero dividido en bytes desde A1 hasta A6; si
se quiere leer este dato, se tendr primero que ubicar el primer
byte (A1) y as sucesivamente hasta el ltimo byte que lo
conforma (A6). Y si adems se quiere leer el dato B, luego de

terminar de leer el dato A, recin leer el primer byte de B (B1) y


de la misma manera como en el dato A, hasta B6.
VENTAJAS:
-

Proporciona alto rendimiento en el uso de aplicaciones que


necesiten una alta velocidad de transferencia.
Como en el RAID 2, el hecho de contar con el disco de
paridad permite encontrar errores as como tambin
recuperarlos y corregirlos.

DESVENTAJAS:
-

Las peticiones de entrada y salida que se ejecutan de forma


simultnea en el caso de que se requiera leer y escribir
mltiples registros aleatorios, podran ocasionar que se
sobrecargue o que se haga ms lento el sistema.
Los datos al estar divididos en bytes, no se puede acceder
independientemente a cada byte. Por ejemplo, considerando
la imagen anterior, si queremos acceder al dato que est en
A1, necesariamente tenemos que atender todo el dato A; es
decir leer A1, A2 y A3.
Como en el RAID 3, los discos atienden una a la vez las
peticiones de entrada o salida, no es recomendable para
operaciones transaccionales, en donde casi todo el tiempo
se tenga que buscar pequeos registros almacenado de
forma aleatoria en los discos.
Este RAID no es el ms indicado para el tipo de acceso de
base de datos en los que se requiera transferir pequeas
unidades de datos aleatoriamente.

USO:
-

Es recomendable en sistemas que prioricen audio o video ya


que se transfieren extensas cantidades de datos de modo
secuencial. Adems contando con el disco de paridad, facilita
acciones como escribir, modificar o leer.

5. RAID 4
Tambin conocido como IDA (Acceso Independiente de Discos
dedicados a la paridad), donde al igual que en el RAID 3, hay un
disco de paridad pero con la diferencia de que los discos no estn
divididos a nivel de bytes sino de bloques.
Diagrama de configuracin de RAID 4 Raid - Wikipedia

En la imagen podemos ver cmo se guardan los datos. Se ha


guardado el dato A pero dividido en 3 bloques: A1, A2 y A3. Y as
si se quiere leer el dato C, primero tiene que leerse los datos A y
B; y en cada uno, los 3 bloques en los que estn divididos
VENTAJAS:
-

Posee un disco de paridad lo que le permite no estar


propenso a errores.
A diferencia del RAID 3, este nivel puede reconstruir en
tiempo real en caso de fallos de un disco, los datos que
contienen los dems discos mediante el uso de la paridad
(paridad concentrada en un solo disco). Adems se puede
acceder a cada disco de forma independiente
Como los datos estn en bloques, este nivel permite leer los
datos por bloques y no completos tambin. Esto quiere decir,
por ejemplo considerando la imagen anterior, se puede
atender una peticin del bloque A1 del disco 0, y si luego
existe una peticin del bloque B1, primero tiene que
atenderse la peticin anterior ya que estn en el mismo
disco, en cambio si se tiene una peticin del bloque B2, se
puede atender concurrentemente.

DESVENTAJAS:
-

Puede existir un embotellamiento en el disco de paridad, ya


que contiene informacin de todos los discos, y sera muy

complicado cuando se tenga muchas peticiones simultneas


de datos.
En caso de escritura, se tardara mucho en este proceso, ya
que se requiere que los datos de paridad sean actualizados
cada vez. Cada operacin de escritura requiere un clculo de
paridad pero esto sera un inconveniente para datos
grandes.

USO:
-

El RAID 4 es el indicado cuando se trate de almacenamiento


de archivos grandes donde se requiera la integridad de los
datos.
Ideal para el uso de aplicaciones grficas donde se requiera
un gran tamao de almacenamiento as como integridad y
fiabilidad con los datos.

6. RAID 5
Tambin llamado distribuido con paridad. Es similar al RAID 4, con
la diferencia de que este nivel crea datos de paridad que se
encuentran distribuidos en un disco que no sea el disco que tenga
la informacin original. El modo en el bloque de paridad se
designe en los discos puede ser de 4 formas: izquierda asimtrica,
derecha asimtrica, izquierda simtrica y derecha asimtrica.
RAID 5 Gua a los niveles de RAID El blog de datos

Este nivel de RAID soluciona el problema del RAID 4 que puede


ocasionar guardar la informacin de la paridad en un solo disco.
Diagrama de configuracin de RAID 4 Raid - Wikipedia

En la imagen podemos ver cmo se guardan los datos. Se ha


guardado el dato A pero dividido en 3 bloques: A1, A2 y A3. Su
paridad est en el disco 3. Lo mismo con el dato B, la informacin
de paridad de este disco se encuentra en el disco 2.
Adems, al igual que el RAID 4, se pueden acceder a los bloques
de forma independiente. Si se tiene una peticin del bloque A1 lo
realizar el disco 0, y si luego se tiene una peticin del bloque B1,
tendra que ejecutarse primero la anterior, pero s se podra
acceder concurrentemente a un bloque que est en un disco
distinto al disco 0.
En este nivel RAID, cuando se escribe un dato se genera un
bloque de paridad dentro de la misma divisin (lo que se llama
stripe). Se llama stripe a un bloque de cada uno de los discos del

conjunto. Por ejemplo, considerando la imagen anterior, se


escribe el dato A, pero este se divide en 3 bloques y uno adicional
para la informacin de su paridad. Asumiendo que la posicin 0 es
la posicin que est ms arriba de cada disco; el bloque de
paridad del dato A debe estar en la posicin 0 de cualquier disco;
y as igualmente para los otros datos que se escriban luego.
Cabe resaltar que los bloques de paridad no se leen cuando se
realiza alguna operacin de lectura de datos sino provocara un
bajo rendimiento acompaado de una sobrecarga innecesaria.
Este proceso se realiza cuando la lectura de un sector de datos
ocasiona un error de CRC (Verificacin por redundancia). CRC es
un cdigo de deteccin de error que se calcula utilizando
operaciones aritmticas.
VENTAJAS:
-

La grabacin de datos es ms rpido debido a que no hay un


nico disco de paridad. Al estar divididos, no es necesario
acceder a un disco de paridad en cada grabacin.
El aprovechamiento de hasta un 80% de la capacidad de los
discos ya que este nivel optimiza el sistema con la divisin
en bloques de la informacin de paridad.
Se puede recuperar la informacin en tiempo real sin que el
sistema se detenga mediante una simple lgica de O
exclusivo.

DESVENTAJAS:
USO:
-

Este nivel constituye un RAID recomendable para los


entornos de servidores en donde las entradas y salidas de
datos es aleatoria, y adems es necesaria una integridad y
seguridad de los datos.

7. RAID 6

B. NIVELES RAID ANIDADOS


Muchas controladoras permiten anidar niveles RAID, es decir, que un RAID
pueda usarse como elemento bsico de otro en lugar de discos fsicos. Resulta
instructivo pensar en estos conjuntos como capas dispuestas unas sobre otras,
con los discos fsicos en la inferior.
Los RAIDs anidados se indican normalmente uniendo en un solo nmero los
correspondientes a los niveles RAID usados, aadiendo a veces un + entre

ellos. Por ejemplo, el RAID 10 (o RAID 1+0) consiste conceptualmente en


mltiples conjuntos de nivel 1 almacenados en discos fsicos con un nivel 0
encima, agrupando los anteriores niveles 1. En el caso del RAID 0+1 se usa ms
esta forma que RAID 01 para evitar la confusin con el RAID 1. Sin embargo,
cuando el conjunto de ms alto nivel es un RAID 0 (como en el RAID 10 y en el
RAID 50), la mayora de los vendedores eligen omitir el +, a pesar de que RAID
5+0 sea ms informativo.
Al anidar niveles RAID, se suele combinar un nivel RAID que proporcione
redundancia con un RAID 0 que aumenta el rendimiento. Con estas
configuraciones es preferible tener el RAID 0 como nivel ms alto y los conjuntos
redundantes debajo, porque as ser necesario reconstruir menos discos cuando
uno falle. (As, el RAID 10 es preferible al RAID 0+1 aunque las ventajas
administrativas de dividir el espejo del RAID 1 se perderan.)
Los niveles RAID anidados ms comnmente usados son:

RAID 0+1: Un espejo de divisiones


RAID 1+0: Una divisin de espejos
RAID 30: Una divisin de niveles RAID con paridad dedicada
RAID 100: Una divisin de una divisin de espejos
RAID 10+1: Un Espejo de espejos

1. RAID 0+1
Un RAID 0+1 (tambin llamado RAID 01, que no debe confundirse con RAID 1)
es un RAID usado para replicar y compartir datos entre varios discos. La
diferencia entre un RAID 0+1 y un RAID 1+0 es la localizacin de cada nivel RAID
dentro del conjunto final: un RAID 0+1 es un espejo de divisiones.
Como puede verse en el diagrama, primero se crean dos conjuntos RAID 0
(dividiendo los datos en discos) y luego, sobre los anteriores, se crea un conjunto
RAID 1 (realizando un espejo de los anteriores). La ventaja de un RAID 0+1 es
que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro
conjunto de nivel 0 para reconstruir el conjunto global. Sin embargo, aadir un
disco duro adicional en una divisin, es obligatorio aadir otro al de la otra
divisin para equilibrar el tamao del conjunto.
Adems, el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar
dos fallos simultneos de discos salvo que sean en la misma divisin. Es decir,
cuando un disco falla, la otra divisin se convierte en un punto de fallo nico.

Adems, cuando se sustituye el disco que fall, se necesita que todos los discos
del conjunto participen en la reconstruccin de los datos.
Con la cada vez mayor capacidad de las unidades de discos (liderada por las
unidades serial ATA), el riesgo de fallo de los discos es cada vez mayor. Adems,
las tecnologas de correccin de errores de bit no han sido capaces de mantener
el ritmo de rpido incremento de las capacidades de los discos, provocando un
mayor riesgo de hallar errores fsicos irrecuperables.
Dados estos cada vez mayores riesgos del RAID 0+1 (y su vulnerabilidad ante los
fallos dobles simultneos), muchos entornos empresariales crticos estn
empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden
un mecanismo de paridad subyacente. Entre los ms prometedores estn los
enfoques hbridos como el RAID 0+1+5 (espejo sobre paridad nica) o RAID
0+1+6 (espejo sobre paridad dual). Son los ms habituales por las empresas.
Diagrama de una configuracin RAID 0+1

2. RAID 1+0
Un RAID 1+0, a veces llamado RAID 10, es parecido a un RAID 0+1 con la
excepcin de que los niveles RAID que lo forman se invierte: el RAID 10 es
una divisin de espejos.

En cada divisin RAID 1 pueden fallar todos los discos salvo uno sin que se
pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el
restante pasa a ser un punto nico de fallo para todo el conjunto. Si ese disco
falla entonces, se perdern todos los datos del conjunto completo. Como en el
caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un
solo error de medio irrecuperable que ocurra en el disco espejado resultara en
prdida de datos.
Debido a estos mayores riesgos del RAID 1+0, muchos entornos
empresariales crticos estn empezando a evaluar configuraciones RAID ms
tolerantes a fallos que aaden un mecanismo de paridad subyacente. Entre los
ms prometedores estn los enfoques hbridos como el RAID 0+1+5 (espejo
sobre paridad nica) o RAID 0+1+6 (espejo sobre paridad dual).
El RAID 10 es a menudo la mejor eleccin para bases de datos de altas
prestaciones, debido a que la ausencia de clculos de paridad proporciona
mayor velocidad de escritura.
Diagrama de una configuracin RAID 1+0

3. RAID 30
El RAID 30 o divisin con conjunto de paridad dedicado es una combinacin
de un RAID 3 y un RAID 0. El RAID 30 proporciona tasas de transferencia
elevadas combinadas con una alta fiabilidad a cambio de un coste de
implementacin muy alto. La mejor forma de construir un RAID 30 es combinar
dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30
trocea los datos en bloque ms pequeos y los divide en cada conjunto RAID
3, que a su vez lo divide en trozos an menores, calcula la paridad aplicando
un XOR a cada uno y los escriben en todos los discos del conjunto salvo en

uno, donde se almacena la informacin de paridad. El tamao de cada bloque


se decide en el momento de construir el RAID.
El RAID 30 permite que falle un disco de cada conjunto RAID 3. Hasta que
estos discos que fallaron sean reemplazados, los otros discos de cada
conjunto que sufri el fallo son puntos nicos de fallo para el conjunto RAID 30
completo. En otras palabras, si alguno de ellos falla se perdern todos los
datos del conjunto. El tiempo de recuperacin necesario (detectar y responder
al fallo del disco y reconstruir el conjunto sobre el disco nuevo) representa un
periodo de vulnerabilidad para el RAID.
Diagrama de una configuracin RAID 30

4. RAID 100
Un RAID 100, a veces llamado tambin RAID 10+0, es una divisin de
conjuntos RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un
RAID en el que conjuntos divididos son a su vez divididos conjuntamente de
nuevo.
Todos los discos menos unos podran fallar en cada RAID 1 sin perder datos.
Sin embargo, el disco restante de un RAID 1 se convierte as en un punto
nico de fallo para el conjunto degradado. A menudo el nivel superior de
divisin se hace por software. Algunos vendedores llaman a este nivel ms
alto un MetaLun oSoft Stripe.
Los principales beneficios de un RAID 100 (y de los RAIDs cuadriculados en
general) sobre un nico nivel RAID son mejor rendimiento para lecturas
aleatorias y la mitigacin de los puntos calientes de riesgo en el conjunto. Por
estas razones, el RAID 100 es a menudo la mejor eleccin para bases de
datos muy grandes, donde el conjunto software subyacente limita la cantidad
de discos fsicos permitidos en cada conjunto estndar. Implementar niveles

RAID anidados permite eliminar virtualmente el lmite de unidades fsicas en


un nico volumen lgico.
Diagrama de una configuracin RAID 100

5. RAID 10+1
Un RAID 10+1, es un reflejo de dos RAID 10. Se utiliza en los
llamados Network RAID que aceptan algunas cabinas de datos. Es un
sistema de alta disponibilidad por red, lo que permite la replicacin de datos
entre cabinas a nivel de RAID, con lo cual se simplifica ampliamente la gestin
de replicacin de cabinas.
El RAID 10+1, tratndose de espejos de RAID10 que tienen una gran
velocidad de acceso, hace que el rendimiento sea muy aceptable, siempre y
cuando se respete el requerimiento de 2ms de latencia como mximo.
6. RAID 50
Un RAID 50, a veces llamado tambin RAID 5+0, combina la divisin a nivel
de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues
un conjunto RAID 0 dividido de elementos RAID 5.
Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin
embargo, si el disco que falla no se reemplaza, los discos restantes de dicho
conjunto se convierten en un punto nico de fallo para todo el conjunto. Si uno
falla, todos los datos del conjunto global se pierden. El tiempo necesario para
recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre
el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID.
La configuracin de los conjuntos RAID repercute sobre la tolerancia a fallos
general. Una configuracin de tres conjuntos RAID 5 de siete discos cada uno

tiene la mayor capacidad y eficiencia de almacenamiento, pero slo puede


tolerar un mximo de tres fallos potenciales de disco. Debido a que la fiabilidad
del sistema depende del rpido reemplazo de los discos averiados para que el
conjunto pueda reconstruirse, es comn construir conjuntos RAID 5 de seis
discos con un disco de reserva en lnea (hot spare) que permite empezar de
inmediato la reconstruccin en caso de fallo del conjunto. Esto no soluciona el
problema de que el conjunto sufre un estrs mximo durante la reconstruccin
dado que es necesario leer cada bit, justo cuando es ms vulnerable. Una
configuracin de siete conjuntos RAID 5 de tres discos cada uno puede tolerar
hasta siete fallos de disco pero tiene menor capacidad y eficiencia de
almacenamiento.
El RAID 50 mejora el rendimiento del RAID 5, especialmente en escritura, y
proporciona mejor tolerancia a fallos que un nivel RAID nico. Este nivel se
recomienda para aplicaciones que necesitan gran tolerancia a fallos,
capacidad y rendimiento de bsqueda aleatoria.
A medida que el nmero de unidades del conjunto RAID 50 crece y la
capacidad de los discos aumenta, el tiempo de recuperacin lo hace tambin.
Diagrama de una configuracin RAID 50

C.

N
I
V
E
L
ES RAID PROPIETARIOS
Aunque todas las implementaciones de RAID difieren en algn grado de la
especificacin idealizada, algunas compaas han desarrollado implementaciones
RAID completamente propietarias que difieren sustancialmente de todas las
dems.
1. RAID 50EE
Se trata de un RAID 0 de dos pools, cada uno de ellos con RAID 5EE (7+1+1).
Tolera el fallo simultneo de dos discos, y hasta 4 discos no simultneos. El
tiempo de reconstruccin se reduce al mnimo, gracias al RAID 5EE. Y se
mejora el rendimiento gracias al RAID 0.

2. PARIDAD DOBLE:
Una adicin frecuente a los niveles RAID existentes es la paridad doble, a
veces implementada y conocida como paridad diagonal. Como en el RAID 6,
hay dos conjuntos de informacin de chequeo de paridad, pero a diferencia de
aqul, el segundo conjunto no es otro conjunto de puntos calculado sobre un
sndrome polinomial diferente para los mismos grupos de bloques de datos,
sino que se calcula la paridad extra a partir de un grupo diferente de bloques
de datos. Por ejemplo, sobre el grfico tanto el RAID 5 como el RAID 6
calcularan la paridad sobre todos los bloques de la letra A para generar uno o
dos bloques de paridad. Sin embargo, es bastante fcil calcular la paridad
contra mltiples grupos de bloques, en lugar de slo sobre los bloques de la
letra A: puede calcularse la paridad sobre los bloques de la letra A y un grupo
permutado de bloques.
Diagrama una configuracin RAID de doble paridad.

De nuevo sobre el ejemplo, los bloques Q son los de la paridad doble. El


bloque Q2 se calculara como A2 XOR B3 XOR P3, mientras el bloque Q3 se
calculara como A3 XOR P2 XOR C1 y el Q1 sera A1 XOR B2 XOR C3.
Debido a que los bloques de paridad doble se distribuyen correctamente, es
posible reconstruir dos discos de datos que fallen mediante recuperacin
iterativa. Por ejemplo, B2 podra recuperarse sin usar ninguno de los bloque
X1 ni X2 mediante el clculo de B3 XOR P3 XOR Q2 = A2, luego
A2 XOR A3 XOR P1 = A1, y finalmente A1 XOR C3 XOR Q1 = B2.
No es recomendable que el sistema de paridad doble funcione en modo
degradado debido a su bajo rendimiento.

3. RAID 1.5
RAID 1.5 es un nivel RAID propietario de HighPoint a veces incorrectamente
denominado RAID 15. Por la poca informacin disponible, parece ser una
implementacin correcta de un RAID 1. Cuando se lee, los datos se recuperan
de ambos discos simultneamente y la mayora del trabajo se hace en
hardware en lugar de en el controlador software.
RAID 15 se compone de al menos tres elementos lgicos (el requisito mnimo
para RAID 5) que son a su vez compuesta de matrices RAID 1. RAID 51 es
exactamente lo contrario: que refleja dos matrices RAID 5.
No es difcil ver que la combinacin de dos modos RAID mejora en gran
medida la seguridad de datos. Con una matriz RAID 15, una unidad puede
fallar en cada bloque RAID 1 sin poner todo el sistema al borde del desastre.
4. RAID 7
RAID 7 es una marca registrada de Storage Computer Corporation, que
aade cachs a un RAID 3 o RAID 4 para mejorar el rendimiento.
5. RAID S O RAID DE PARIDAD
RAID S es un sistema RAID de paridad distribuida propietario de EMC
Corporation usado en sus sistemas de almacenamiento Symmetrix. Cada
volumen reside en un nico disco fsico, y se combinan arbitrariamente varios
volmenes para el clculo de paridad. EMC llamaba originalmente a esta
caracterstica RAID S y luego la rebautiz RAID de paridad (Parity RAID) para
su plataforma Symmetrix DMX. EMC ofrece tambin actualmente un RAID 5
estndar para el Symmetrix DMX.

6. MATRIX RAID
Matrix RAID (matriz RAID) es una caracterstica que apareci por vez
primera en la BIOS RAID Intel ICH6R. No es un nuevo nivel RAID.
El Matrix RAID utiliza dos o ms discos fsicos, asignando partes de idntico
tamao de cada uno de los diferentes niveles de RAID. As, por ejemplo, sobre
4 discos de un total de 600GB, se pueden usar 200 en raid 0, 200 en raid 10 y
200 en raid 5. Actualmente, la mayora de los otros productos RAID BIOS de
gama baja slo permiten que un disco participen en un nico conjunto.
Este producto est dirigido a los usuarios domsticos, proporcionando una
zona segura (la seccin RAID 1) para documentos y otros archivos que se
desean almacenar redundantemente y una zona ms rpida (la seccin RAID
0) para el sistema operativo, aplicaciones, etctera.

Diagrama una configuracin Matriz RAID.

7. LINUX MD RAID 10
La

controladora

RAID

software

del KERNEL de Linux (llamada md,

de multiple disk, disco mltiple) puede ser usada para construir un conjunto
RAID 1+0 clsico, pero tambin permite un nico nivel RAID 10 con algunas
extensiones interesantes.

En particular, soporta un espejado de k bloques en n unidades cuando k no es


divisible por n. Esto se hace repitiendo cada bloque k veces al escribirlo en un
conjunto RAID 0 subyacente de n unidades. Evidentemente esto equivale a la
configuracin RAID 10 estndar.
Linux tambin permite crear otras configuraciones RAID usando la
controladora md (niveles 0, 1, 4, 5 y 6) adems de otros usos no RAID como
almacenamiento multirruta y LVM2.

Diagrama una configuracin Linux MD RAID.

8. IBM SERVERAID 1E
La serie de adaptadores IBM ServeRAID soportan un espejado doble de un
nmero arbitrario de discos, como se ilustra en el grfico.
Esta configuracin es tolerante a fallos de unidades no adyacentes. Otros
sistemas de almacenamiento como el StorEdge T3 de Sun soportan tambin
este modo.

Diagrama una configuracin RAID 1E.

9. RAID Z
El sistema de archivos ZFS de Sun Microsystems implementa un esquema de
redundancia integrado parecido al RAID 5 que se denomina RAID Z. Esta
configuracin evita el agujero de escritura del RAID 54 y la necesidad de la
secuencia leer-modificar-escribir para operaciones de escrituras pequeas
efectuando slo escrituras de divisiones (stripes) completas, espejando los
bloques pequeos en lugar de protegerlos con el clculo de paridad, lo que
resulta posible gracias a que el sistema de archivos conoce la estructura de
almacenamiento subyacente y puede gestionar el espacio adicional cuando lo
necesita.

D. Clculo de paridad
Muchos niveles de RAID, emplean un sistema para detectar errores, llamado
paridad, un mtodo comnmente usado en tecnologas de la informacin para
proporcionar tolerancia a errores en un conjunto de datos. La mayora, utilizan la
sencilla paridad XOR, descrita en esta seccin, pero se pueden usar otros
mtodos, como RAID 6, que utiliza paridades distintas basadas respectivamente
en la suma y en la multiplicacin en un campo de Galois particular o utilizando
la correccin de errores de Reed-Solomon.
En el lgebra de Boole, existe una operacin llamada OR exclusivo, que
significa o uno, o el otro pero no ambos, esto es:

0
0
1
1

XOR
XOR
XOR
XOR

0
1
0
1

=
=
=
=

0
1
1
0

El operador XOR es la pieza central que define como se crea la paridad y como
se usa en el RAID. Se usa tanto para la proteccin de los datos, como para
recuperar datos que se han perdido.
Por ejemplo, consideremos un RAID compuesto por 6 discos (4 para datos, 1
para paridad y 1 de repuesto, llamado en ingls hot spare), donde cada disco
tiene un nicamente un byte que merece la pena guardar:

Disco
Disco
Disco
Disco
Disco
Disco

1:
2:
3:
4:
5:
6:

(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
(Paridad)

Supongamos que escribimos los siguientes datos en el disco duro:

Disco
Disco
Disco
Disco
Disco
Disco

1:
2:
3:
4:
5:
6:

00101010
10001110
11110111
10110101

(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
(Paridad)

Cada vez que se escriben datos en los discos, se debe calcular el valor de la
paridad para que la organizacin RAID sea capaz de recuperar los datos en caso
de fallo de uno de los discos. Para calcular la paridad se utiliza una XOR bit a
bit para cada uno de los datos de los discos y se calcula de la siguiente manera:
00101010 XOR 10001110 XOR 11110111 XOR 10110101 = 11100110

Los datos de paridad 11100110 se escriben al disco destinado a guardar los datos
de paridad:

Disco
Disco
Disco
Disco
Disco
Disco

1:
2:
3:
4:
5:
6:

00101010
10001110
11110111
10110101

(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
11100110 (Paridad)

Supongamos ahora que el disco 3 falla. Para restaurar los datos que contena
dicho disco, utilizamos la misma operacin XOR que antes, pero esta vez
utilizando los datos de los discos duros que quedan, y los datos de paridad
que hay en el disco 6.
00101010 XOR 10001110 XOR 11100110 XOR 10110101 = 11110111

Con esta operacin XOR, obtendremos los datos que faltan. Con los datos
recuperados, se escribirn en el disco de repuesto, el cual entonces actuara
como un miembro del RAID permitiendo que todo el grupo contine
funcionando con normalidad
Disco 1: 00101010 (Datos)
Disco 2: 10001110 (Datos)
Disco 3:

Muerto

(Datos)

Disco 4: 10110101 (Datos)


Disco 5: 11110111 (Repuesto)
Disco 6: 11100110 (Paridad)

El mismo principio bsico se aplica con la paridad en grupos RAID sin importar
la capacidad ni el nmero de discos. Mientras haya discos suficientes para
permitir la operacin XOR, la paridad puede ser utilizada para recuperar los
datos cuando hay un fallo de un solo disco (Debe existir un mnimo de tres
discos para la paridad, porque la operacin XOR requiere dos operandos y un
lugar donde guardar el resultado)

BIBLIOGRAFIA:
-

ARQUITECTURA DE COMPUTADORAS, Williams Stallings 8 edicion


ARQUITECTURA DE COMPUTADORAS, M. Morris Mano, Editorial
Pearson

Vous aimerez peut-être aussi