Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
I. DEFINICIN:.............................................................................4
II. DISCOS MAGNETICOS:...............................................................4
2.1. MECANISMOS DE LECTURA Y ESCRITURA MAGNETICA..............4
2.2. ORGANIZACIN Y FORMATO DE LOS DATOS.............................5
2.3. CARACTERSTICAS FSICAS.....................................................8
2.4. PARMETROS PARA MEDIR LAS PRESTACIONES DE UN DISCO: 10
2.5. Algunos Conceptos Claves:...................................................11
III............................................................................NIVELES RAID:
14
A.
B.
3. RAID 30...........................................................................24
4. RAID 100.........................................................................25
5. RAID 10+1.......................................................................26
6. RAID 50...........................................................................26
C.
D.
Clculo de paridad..............................................................32
BIBLIOGRAFIA
INTRODUCCIN
I. DEFINICIN:
RAID es una forma de almacenar los mismos datos en distintos lugares
(por tanto de modo redundante) en mltiples discos duros. Al colocar los
datos en discos mltiples, las operaciones I/O (input/output, de entrada
y salida) pueden superponerse de un modo equilibrado, mejorando el
rendimiento del sistema. Dado que los discos mltiples incrementan el
tiempo medio entre errores (mean time between failure, MTBF), el
almacenamiento redundante de datos incrementa la tolerancia a fallos.
Un RAID, para el sistema operativo, aparenta ser un slo disco duro
lgico. El RAID emplea la tcnica conocida como "striping" (bandeado o
creacin de bandas), que incluye la particin del espacio de
almacenamiento de cada disco en unidades que van de un sector (512
bytes) hasta varios megabytes. Las bandas de todos los discos estn
interpaginadas (interleaved) y se accede a ellas en orden.
En un sistema de un solo usuario donde se almacenan grandes registros
(como imgenes mdicas o de otro tipo), las bandas generalmente se
establecen para ser muy pequeas (quiz de 512 bytes) de modo que
un solo registro est ubicado en todos los discos y se pueda acceder a l
rpidamente leyendo todos los discos a la vez.
En un sistema multiusuario, un mejor rendimiento demanda que se
establezca una banda lo suficientemente ancha para contener el
registro de tamao tpico o el de mayor tamao. Esto permite acciones
I/O superpuestas en los distintos discos.
T=
br
N
Donde:
T = tiempo de transferencia
b = nmero de bytes a transferir
N = nmero de bytes de una pista
r = velocidad de rotacin en revoluciones por
segundo
Por tanto, el tiempo de acceso medio total se puede expresar
como
T a=T s +
1 br
+
2r N
donde
Ts
4 ms
2 ms
4 ms
10 ms
III.NIVELES RAID:
A. NIVELES RAID ESTNDAR
DESVENTAJAS:
-
Araya
DESVENTAJAS:
-
USO:
-
3. RAID 2
Este nivel en lugar de la divisin en bloques, utiliza la divisin de
datos en bits. Adems usa cdigos Hamming, el cual permite
detectar y corregir errores (lo que se conoce como Error Checking
and Correcting o ECC). El RAID 2 adapta el mecanismo de
deteccin de fallas en discos rgidos para poder funcionar como
memoria lo que cual le permite tener una especie de control y
seguimiento de los datos.
VENTAJAS:
-
DESVENTAJAS:
-
USO
-
4. RAID 3
En el RAID 3, los datos no son divididos en bloques sino en bytes.
Los datos son divididos entre todos los discos que posee, excepto
uno, que es usado para guardar la informacin relacionada con la
paridad. Por eso, el nmero de discos va a ser siempre n+1, ya
que uno estar dedicado solo a la paridad.
Diagrama de configuracin de RAID 3 Raid - Wikipedia
DESVENTAJAS:
-
USO:
-
5. RAID 4
Tambin conocido como IDA (Acceso Independiente de Discos
dedicados a la paridad), donde al igual que en el RAID 3, hay un
disco de paridad pero con la diferencia de que los discos no estn
divididos a nivel de bytes sino de bloques.
Diagrama de configuracin de RAID 4 Raid - Wikipedia
DESVENTAJAS:
-
USO:
-
6. RAID 5
Tambin llamado distribuido con paridad. Es similar al RAID 4, con
la diferencia de que este nivel crea datos de paridad que se
encuentran distribuidos en un disco que no sea el disco que tenga
la informacin original. El modo en el bloque de paridad se
designe en los discos puede ser de 4 formas: izquierda asimtrica,
derecha asimtrica, izquierda simtrica y derecha asimtrica.
RAID 5 Gua a los niveles de RAID El blog de datos
DESVENTAJAS:
USO:
-
7. RAID 6
1. RAID 0+1
Un RAID 0+1 (tambin llamado RAID 01, que no debe confundirse con RAID 1)
es un RAID usado para replicar y compartir datos entre varios discos. La
diferencia entre un RAID 0+1 y un RAID 1+0 es la localizacin de cada nivel RAID
dentro del conjunto final: un RAID 0+1 es un espejo de divisiones.
Como puede verse en el diagrama, primero se crean dos conjuntos RAID 0
(dividiendo los datos en discos) y luego, sobre los anteriores, se crea un conjunto
RAID 1 (realizando un espejo de los anteriores). La ventaja de un RAID 0+1 es
que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro
conjunto de nivel 0 para reconstruir el conjunto global. Sin embargo, aadir un
disco duro adicional en una divisin, es obligatorio aadir otro al de la otra
divisin para equilibrar el tamao del conjunto.
Adems, el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar
dos fallos simultneos de discos salvo que sean en la misma divisin. Es decir,
cuando un disco falla, la otra divisin se convierte en un punto de fallo nico.
Adems, cuando se sustituye el disco que fall, se necesita que todos los discos
del conjunto participen en la reconstruccin de los datos.
Con la cada vez mayor capacidad de las unidades de discos (liderada por las
unidades serial ATA), el riesgo de fallo de los discos es cada vez mayor. Adems,
las tecnologas de correccin de errores de bit no han sido capaces de mantener
el ritmo de rpido incremento de las capacidades de los discos, provocando un
mayor riesgo de hallar errores fsicos irrecuperables.
Dados estos cada vez mayores riesgos del RAID 0+1 (y su vulnerabilidad ante los
fallos dobles simultneos), muchos entornos empresariales crticos estn
empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden
un mecanismo de paridad subyacente. Entre los ms prometedores estn los
enfoques hbridos como el RAID 0+1+5 (espejo sobre paridad nica) o RAID
0+1+6 (espejo sobre paridad dual). Son los ms habituales por las empresas.
Diagrama de una configuracin RAID 0+1
2. RAID 1+0
Un RAID 1+0, a veces llamado RAID 10, es parecido a un RAID 0+1 con la
excepcin de que los niveles RAID que lo forman se invierte: el RAID 10 es
una divisin de espejos.
En cada divisin RAID 1 pueden fallar todos los discos salvo uno sin que se
pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el
restante pasa a ser un punto nico de fallo para todo el conjunto. Si ese disco
falla entonces, se perdern todos los datos del conjunto completo. Como en el
caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un
solo error de medio irrecuperable que ocurra en el disco espejado resultara en
prdida de datos.
Debido a estos mayores riesgos del RAID 1+0, muchos entornos
empresariales crticos estn empezando a evaluar configuraciones RAID ms
tolerantes a fallos que aaden un mecanismo de paridad subyacente. Entre los
ms prometedores estn los enfoques hbridos como el RAID 0+1+5 (espejo
sobre paridad nica) o RAID 0+1+6 (espejo sobre paridad dual).
El RAID 10 es a menudo la mejor eleccin para bases de datos de altas
prestaciones, debido a que la ausencia de clculos de paridad proporciona
mayor velocidad de escritura.
Diagrama de una configuracin RAID 1+0
3. RAID 30
El RAID 30 o divisin con conjunto de paridad dedicado es una combinacin
de un RAID 3 y un RAID 0. El RAID 30 proporciona tasas de transferencia
elevadas combinadas con una alta fiabilidad a cambio de un coste de
implementacin muy alto. La mejor forma de construir un RAID 30 es combinar
dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30
trocea los datos en bloque ms pequeos y los divide en cada conjunto RAID
3, que a su vez lo divide en trozos an menores, calcula la paridad aplicando
un XOR a cada uno y los escriben en todos los discos del conjunto salvo en
4. RAID 100
Un RAID 100, a veces llamado tambin RAID 10+0, es una divisin de
conjuntos RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un
RAID en el que conjuntos divididos son a su vez divididos conjuntamente de
nuevo.
Todos los discos menos unos podran fallar en cada RAID 1 sin perder datos.
Sin embargo, el disco restante de un RAID 1 se convierte as en un punto
nico de fallo para el conjunto degradado. A menudo el nivel superior de
divisin se hace por software. Algunos vendedores llaman a este nivel ms
alto un MetaLun oSoft Stripe.
Los principales beneficios de un RAID 100 (y de los RAIDs cuadriculados en
general) sobre un nico nivel RAID son mejor rendimiento para lecturas
aleatorias y la mitigacin de los puntos calientes de riesgo en el conjunto. Por
estas razones, el RAID 100 es a menudo la mejor eleccin para bases de
datos muy grandes, donde el conjunto software subyacente limita la cantidad
de discos fsicos permitidos en cada conjunto estndar. Implementar niveles
5. RAID 10+1
Un RAID 10+1, es un reflejo de dos RAID 10. Se utiliza en los
llamados Network RAID que aceptan algunas cabinas de datos. Es un
sistema de alta disponibilidad por red, lo que permite la replicacin de datos
entre cabinas a nivel de RAID, con lo cual se simplifica ampliamente la gestin
de replicacin de cabinas.
El RAID 10+1, tratndose de espejos de RAID10 que tienen una gran
velocidad de acceso, hace que el rendimiento sea muy aceptable, siempre y
cuando se respete el requerimiento de 2ms de latencia como mximo.
6. RAID 50
Un RAID 50, a veces llamado tambin RAID 5+0, combina la divisin a nivel
de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues
un conjunto RAID 0 dividido de elementos RAID 5.
Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin
embargo, si el disco que falla no se reemplaza, los discos restantes de dicho
conjunto se convierten en un punto nico de fallo para todo el conjunto. Si uno
falla, todos los datos del conjunto global se pierden. El tiempo necesario para
recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre
el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID.
La configuracin de los conjuntos RAID repercute sobre la tolerancia a fallos
general. Una configuracin de tres conjuntos RAID 5 de siete discos cada uno
C.
N
I
V
E
L
ES RAID PROPIETARIOS
Aunque todas las implementaciones de RAID difieren en algn grado de la
especificacin idealizada, algunas compaas han desarrollado implementaciones
RAID completamente propietarias que difieren sustancialmente de todas las
dems.
1. RAID 50EE
Se trata de un RAID 0 de dos pools, cada uno de ellos con RAID 5EE (7+1+1).
Tolera el fallo simultneo de dos discos, y hasta 4 discos no simultneos. El
tiempo de reconstruccin se reduce al mnimo, gracias al RAID 5EE. Y se
mejora el rendimiento gracias al RAID 0.
2. PARIDAD DOBLE:
Una adicin frecuente a los niveles RAID existentes es la paridad doble, a
veces implementada y conocida como paridad diagonal. Como en el RAID 6,
hay dos conjuntos de informacin de chequeo de paridad, pero a diferencia de
aqul, el segundo conjunto no es otro conjunto de puntos calculado sobre un
sndrome polinomial diferente para los mismos grupos de bloques de datos,
sino que se calcula la paridad extra a partir de un grupo diferente de bloques
de datos. Por ejemplo, sobre el grfico tanto el RAID 5 como el RAID 6
calcularan la paridad sobre todos los bloques de la letra A para generar uno o
dos bloques de paridad. Sin embargo, es bastante fcil calcular la paridad
contra mltiples grupos de bloques, en lugar de slo sobre los bloques de la
letra A: puede calcularse la paridad sobre los bloques de la letra A y un grupo
permutado de bloques.
Diagrama una configuracin RAID de doble paridad.
3. RAID 1.5
RAID 1.5 es un nivel RAID propietario de HighPoint a veces incorrectamente
denominado RAID 15. Por la poca informacin disponible, parece ser una
implementacin correcta de un RAID 1. Cuando se lee, los datos se recuperan
de ambos discos simultneamente y la mayora del trabajo se hace en
hardware en lugar de en el controlador software.
RAID 15 se compone de al menos tres elementos lgicos (el requisito mnimo
para RAID 5) que son a su vez compuesta de matrices RAID 1. RAID 51 es
exactamente lo contrario: que refleja dos matrices RAID 5.
No es difcil ver que la combinacin de dos modos RAID mejora en gran
medida la seguridad de datos. Con una matriz RAID 15, una unidad puede
fallar en cada bloque RAID 1 sin poner todo el sistema al borde del desastre.
4. RAID 7
RAID 7 es una marca registrada de Storage Computer Corporation, que
aade cachs a un RAID 3 o RAID 4 para mejorar el rendimiento.
5. RAID S O RAID DE PARIDAD
RAID S es un sistema RAID de paridad distribuida propietario de EMC
Corporation usado en sus sistemas de almacenamiento Symmetrix. Cada
volumen reside en un nico disco fsico, y se combinan arbitrariamente varios
volmenes para el clculo de paridad. EMC llamaba originalmente a esta
caracterstica RAID S y luego la rebautiz RAID de paridad (Parity RAID) para
su plataforma Symmetrix DMX. EMC ofrece tambin actualmente un RAID 5
estndar para el Symmetrix DMX.
6. MATRIX RAID
Matrix RAID (matriz RAID) es una caracterstica que apareci por vez
primera en la BIOS RAID Intel ICH6R. No es un nuevo nivel RAID.
El Matrix RAID utiliza dos o ms discos fsicos, asignando partes de idntico
tamao de cada uno de los diferentes niveles de RAID. As, por ejemplo, sobre
4 discos de un total de 600GB, se pueden usar 200 en raid 0, 200 en raid 10 y
200 en raid 5. Actualmente, la mayora de los otros productos RAID BIOS de
gama baja slo permiten que un disco participen en un nico conjunto.
Este producto est dirigido a los usuarios domsticos, proporcionando una
zona segura (la seccin RAID 1) para documentos y otros archivos que se
desean almacenar redundantemente y una zona ms rpida (la seccin RAID
0) para el sistema operativo, aplicaciones, etctera.
7. LINUX MD RAID 10
La
controladora
RAID
software
de multiple disk, disco mltiple) puede ser usada para construir un conjunto
RAID 1+0 clsico, pero tambin permite un nico nivel RAID 10 con algunas
extensiones interesantes.
8. IBM SERVERAID 1E
La serie de adaptadores IBM ServeRAID soportan un espejado doble de un
nmero arbitrario de discos, como se ilustra en el grfico.
Esta configuracin es tolerante a fallos de unidades no adyacentes. Otros
sistemas de almacenamiento como el StorEdge T3 de Sun soportan tambin
este modo.
9. RAID Z
El sistema de archivos ZFS de Sun Microsystems implementa un esquema de
redundancia integrado parecido al RAID 5 que se denomina RAID Z. Esta
configuracin evita el agujero de escritura del RAID 54 y la necesidad de la
secuencia leer-modificar-escribir para operaciones de escrituras pequeas
efectuando slo escrituras de divisiones (stripes) completas, espejando los
bloques pequeos en lugar de protegerlos con el clculo de paridad, lo que
resulta posible gracias a que el sistema de archivos conoce la estructura de
almacenamiento subyacente y puede gestionar el espacio adicional cuando lo
necesita.
D. Clculo de paridad
Muchos niveles de RAID, emplean un sistema para detectar errores, llamado
paridad, un mtodo comnmente usado en tecnologas de la informacin para
proporcionar tolerancia a errores en un conjunto de datos. La mayora, utilizan la
sencilla paridad XOR, descrita en esta seccin, pero se pueden usar otros
mtodos, como RAID 6, que utiliza paridades distintas basadas respectivamente
en la suma y en la multiplicacin en un campo de Galois particular o utilizando
la correccin de errores de Reed-Solomon.
En el lgebra de Boole, existe una operacin llamada OR exclusivo, que
significa o uno, o el otro pero no ambos, esto es:
0
0
1
1
XOR
XOR
XOR
XOR
0
1
0
1
=
=
=
=
0
1
1
0
El operador XOR es la pieza central que define como se crea la paridad y como
se usa en el RAID. Se usa tanto para la proteccin de los datos, como para
recuperar datos que se han perdido.
Por ejemplo, consideremos un RAID compuesto por 6 discos (4 para datos, 1
para paridad y 1 de repuesto, llamado en ingls hot spare), donde cada disco
tiene un nicamente un byte que merece la pena guardar:
Disco
Disco
Disco
Disco
Disco
Disco
1:
2:
3:
4:
5:
6:
(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
(Paridad)
Disco
Disco
Disco
Disco
Disco
Disco
1:
2:
3:
4:
5:
6:
00101010
10001110
11110111
10110101
(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
(Paridad)
Cada vez que se escriben datos en los discos, se debe calcular el valor de la
paridad para que la organizacin RAID sea capaz de recuperar los datos en caso
de fallo de uno de los discos. Para calcular la paridad se utiliza una XOR bit a
bit para cada uno de los datos de los discos y se calcula de la siguiente manera:
00101010 XOR 10001110 XOR 11110111 XOR 10110101 = 11100110
Los datos de paridad 11100110 se escriben al disco destinado a guardar los datos
de paridad:
Disco
Disco
Disco
Disco
Disco
Disco
1:
2:
3:
4:
5:
6:
00101010
10001110
11110111
10110101
(Datos)
(Datos)
(Datos)
(Datos)
(Repuesto)
11100110 (Paridad)
Supongamos ahora que el disco 3 falla. Para restaurar los datos que contena
dicho disco, utilizamos la misma operacin XOR que antes, pero esta vez
utilizando los datos de los discos duros que quedan, y los datos de paridad
que hay en el disco 6.
00101010 XOR 10001110 XOR 11100110 XOR 10110101 = 11110111
Con esta operacin XOR, obtendremos los datos que faltan. Con los datos
recuperados, se escribirn en el disco de repuesto, el cual entonces actuara
como un miembro del RAID permitiendo que todo el grupo contine
funcionando con normalidad
Disco 1: 00101010 (Datos)
Disco 2: 10001110 (Datos)
Disco 3:
Muerto
(Datos)
El mismo principio bsico se aplica con la paridad en grupos RAID sin importar
la capacidad ni el nmero de discos. Mientras haya discos suficientes para
permitir la operacin XOR, la paridad puede ser utilizada para recuperar los
datos cuando hay un fallo de un solo disco (Debe existir un mnimo de tres
discos para la paridad, porque la operacin XOR requiere dos operandos y un
lugar donde guardar el resultado)
BIBLIOGRAFIA:
-