Académique Documents
Professionnel Documents
Culture Documents
N
T
E
G
R
A
N
T
E
S
R
o
b
i
n
g
Tecnologa RAID
RAID: INTRODUCCION
Debido a la rpida expansin de la informtica a nivel mundial,
ms personas estn en contacto con el mundo de las
computadoras y la informtica, teniendo principalmente 2
enfoques, el primero los tipos de personas que hacen uso de las
computadoras a nivel personal y por el otro lado las personas que
hacen uso de estas a nivel profesional. Todo ha servido para una
evolucin ms rpida de los distintos componentes que integran
las computadoras, es decir que cada da hay avances en esta rea,
en donde cada vez se ven dispositivos nuevos con caractersticas
nuevas y sobre todo con capacidades que superan a las anteriores.
Partiendo de datos histricos en los que se hace referencia a que
desde hace ms de 20 aos la capacidad de proceso de los
procesadores ha aumentado un 40 % cada ao y en el mismo
periodo de tiempo, los discos han doblado su capacidad cada ao,
mientras que su costo se ha reducido a la mitad.
Desgraciadamente, el aumento del rendimiento de los discos duros
ha sido menos importante en comparacin con el rendimiento del
sistema, ya que tan solo ha mejorado un 50 % durante los ltimos
aos.
En base al escenario anterior podemos observar que existe un
problema con los discos duros, que son menos eficaces que el
redimiendo general del sistema, provocando una descompensacin
entre el tratamiento de la informacin del sistema que es muy
rpida y la lectura - grabacin de datos en el disco duro que es
muy lenta.
Por lo anterior mencionado se propuso un sistema para guardar
informacin en varios discos duros a la vez por lo que acceso se
haca ms rpido ya que la carga se distribua entre los diferentes
discos duros, a esto se le llamo cadenas redundantes de discos de
bajo costo (RAID).
Pero a la hora de saber cmo podemos optimizar nuestro RAID nos
encontrbamos con algunos problemas, como puede ser el
encontrar la perfecta relacin calidad precio y es ah cuando
Tecnologa RAID
RAID: HISTORIA
A Norman Ouchi de IBM le fue concedida en 1978 la Patente
USPTO n 4,092,732, titulada Sistema para recuperar datos
almacenados en una unidad de memoria averiada (System
for recovering data stored in failed memory unit), cuyas
demandas describen los que ms tarde sera denominado
escritura totalmente dividida (full striping). Esta patente de
1978 tambin menciona la copia espejo (mirroring o
duplexing), que ms tarde sera denominada RAID 1, y la
proteccin con clculo de paridad dedicado, que ms tarde
sera denominada RAID 4, que eran ya arte previo en aquella
poca.
La tecnologa RAID fue definida por primera vez en 1987 por
un grupo de informticos de la Universidad de California,
Berkeley. Este grupo estudi la posibilidad de usar dos o ms
discos que aparecieran como un nico dispositivo para el
sistema.
En 1988, los niveles RAID 1 a 5 fueron definidos formalmente
por David A. Patterson, Garth A. Gibson y Randy H. Katz en el
ensayo Un Caso para Conjuntos de Discos Redundantes
Econmicos (RAID) A Case for Redundant Arrays of
Inexpensive Disks (RAID), publicado en la Conferencia
SIGMOD de 1988. El trmino RAID se us por vez primera
en este ensayo, que dio origen a toda la industria de los
conjuntos de discos.
Tecnologa RAID
RAID: Qu es?
Significa matriz redundante de discos independientes.
RAID es un mtodo de combinacin de varios discos duros
para formar una nica unidad lgica en la que se almacenan
los datos de forma redundante. Ofrece mayor tolerancia a
fallos y ms altos niveles de rendimiento que un slo disco
duro o un grupo de discos duros independientes.
En este mtodo, la informacin se reparte entre varios discos,
usando tcnicas como el entrelazado de bloques (RAID nivel
0) o la duplicacin de discos (RAID nivel 1) para proporcionar
redundancia, reducir el tiempo de acceso, y/o obtener mayor
ancho de banda para leer y/o escribir, as como la posibilidad
de recuperar un sistema tras la avera de uno de los discos.
Un RAID, para el sistema operativo, aparenta ser un slo disco
duro lgico (LUN).
La tecnologa RAID protege los datos contra el fallo de una
unidad de disco duro. Si se produce un fallo, RAID mantiene el
servidor activo y en funcionamiento hasta que se sustituya la
unidad defectuosa.
RAID ofrece varias opciones, llamadas niveles RAID, cada una
de las cuales proporciona un equilibrio distinto entre
tolerancia a fallos, rendimiento y coste.
Todos los sistemas RAID suponen la prdida de parte de la
capacidad de almacenamiento de los discos, para conseguir la
redundancia o almacenar los datos de paridad.
Tecnologa RAID
RAID: INTERNO
Un sistema RAID implementado internamente, hace referencia
al uso de los discos propios del servidor y su hardware
especializado para el uso de RAID.
Servidor Rack:
Los servidores montados en rack proporcionan espacio
adicional para el crecimiento gracias a su diseo vertical.
Tecnologa RAID
RAID: INTERNO
Servidor Blade:
Cada servidor Blade es una delgada "tarjeta" que contiene
nicamente microprocesador, memoria y buses. Es decir, no
son directamente utilizables ya que no disponen de fuente de
alimentacin ni tarjetas de comunicaciones.
Tecnologa RAID
RAID: EXTERNO
Un sistema RAID externo se basa en el uso de un STORAGE,
donde se implementa el RAID por hardware que luego se
conecta al servidor donde este seria de almacenamiento de
datos.
Tecnologa RAID
RAID: SOFTWARE
Se basa en la instalacin de un Software en el sistema
operativo que controlara el RAID cuyos discos podrn ser de
tipo IDE o SATA.
Estos ya no son transparentes para el sistema operativo, pues
es l quien tiene que hacer todo el trabajo de mantener las
copias de los datos, distribuirlos entre todos los discos, etc, lo
que, obviamente, consume recursos del sistema como
memoria y, sobre todo, CPU. Adems, es necesario que sea
soportado por el sistema operativo. Hoy en da, el RAID por
software est implementado en sistemas operativos
profesionales, como Linux, o Windows 2000 o XP. La ventaja
es su precio, pues no hacen falta controladoras especificas ni
nada similar; tan slo dos o ms discos duros conectados al
ordenador.
Tecnologa RAID
RAID: HARDWARE
En una implementacin de hardware que a travs de la BIOS.
Le corresponden controlar el RAID ya que cuenta con
capacidad de proceso propia y dispone de una interfaz SCSI o
SATA para la conexin de los discos que conforman el array o
matriz.
Es el mtodo ms eficiente de implementar un sistema RAID,
En este caso, el usuario compra una tarjeta RAID que conecta
al bus PCI, y a esta tarjeta conecta los discos duros que desee.
El ordenador simplemente ver un nico disco duro, pues
todas las operaciones de copia de datos, distribucin entre
discos duros y checksums son realizadas por la propia tarjeta,
de forma totalmente transparente al ordenador. Incluso en
sistemas profesionales con montajes en rack, los discos duros
pueden ser desconectados y conectados con el sistema
encendido, de forma que no hace falta parar el servidor en el
caso de que uno de los discos falle. El inconveniente de esta
opcin es el precio, que hace que slo se use en servidores
profesionales de alto rendimiento.
Tecnologa RAID
RAID 0
Realiza striping de datos a nivel bloque sin informacin de
paridad con una distribucin equitativa de estos entre dos o
ms discos. Este nivel mejora el rendimiento pero no aporta
tolerancia a fallos. En caso de avera en cualquiera de los
componentes de array el sistema fallar en su totalidad.
Un RAID 0 puede ser creado con discos de diferentes
tamaos, si bien el espacio de almacenamiento del conjunto
estar limitado por el tamao del disco de menor capacidad.
Tecnologa RAID
RAID 1
Crea una copia idntica (espejo) de un conjunto de datos en
dos o ms discos. En esta configuracin no se hace striping
de datos, si bien consigue un alto nivel de tolerancia a fallos.
Para alcanzar un mximo rendimiento se recomienda el uso
de controladoras de disco duplicadas, de esta forma ser
posible leer de los dos discos al mismo tiempo incrementando
la tasa de transferencia de lectura al doble de la generada por
un disco individual sin alterar el ratio de escritura.
Se desperdicia el 50% de la capacidad de almacenamiento
del sistema haciendo que el coste por megabyte til sea
mayor.
10
Tecnologa RAID
RAID 2
Este nivel no presenta ninguna ventaja relevante sobre RAID 3
y en la actualidad resulta ser el nico nivel RAID de la
especificacin original que no se utiliza.
Funciona con striping de datos a nivel de bit en todos los
discos, dedicando algunos de estos a almacenar informacin
de verificacin y correccin de errores (error checking and
correcting, ECC). Los discos son sincronizados por la
controladora para funcionar al unsono, generando tasas de
trasferencias extremadamente altas.
La tasa de transferencia de datos puede llegar a ser
extremadamente alta.
11
Tecnologa RAID
RAID 3
Es un nivel raramente utilizado.
Opera con striping de datos a nivel byte y dedica un disco
del array para almacenar la informacin de paridad que
permitir reconstruir la informacin en caso de fallos.
Toda la informacin se escribe en paralelo entre los discos del
array mejorando el rendimiento del sistema gracias al
incremento en la tasa de transferencia de datos que esta
funcionalidad conlleva.
12
Tecnologa RAID
RAID 4
Opera con striping de datos a nivel bloque con un disco de
paridad dedicado (similar a RAID 3 excepto que divide a nivel
de bloque en lugar de a nivel de bytes). Ante el fallo de uno
de los discos del array, podremos, a partir de la informacin
de paridad, reconstruir en un disco de reserva los datos de la
unidad averiada.
RAID 4 puede atender varias peticiones simultneas de
lectura, siempre que la controladora lo soporte, y tambin de
escritura, pero en este ltimo caso al residir toda la
informacin de paridad en un nico disco, ste se convertira
en un cuello de botella para el sistema.
Un disco de paridad dedicado puede convertirse en un cuello
de botella en escritura.
13
Tecnologa RAID
RAID 5
Por su bajo coste RAID 5 es una de las implementaciones ms
populares. Utiliza striping de datos a nivel de bloque
distribuyendo la informacin de paridad entre todos los discos
que conforman el array. Esta combinacin proporciona un
excelente rendimiento y buena tolerancia a fallos.
Cuando las aplicaciones requieren muchas escrituras de
tamao inferior a la divisin de datos establecida (stripe), el
rendimiento ofrecido por RAID 5 no es el ptimo.
RAID 5 precisa al menos tres discos aunque las
implementaciones ms habituales estn formadas por
arrays con cinco unidades.
14
Tecnologa RAID
RAID 5E
El trmino RAID 5E hace referencia a la variante de RAID 5
que incorpora discos de reserva. Estos discos pueden estar en
modo conectado y preparado (hot spare) o simplemente en
espera (standby spare), para cubrir los fallos de cualquiera de
las unidades que conforman el array. No representan
mejora en el rendimiento del sistema, pero minimizan las
labores de administracin cuando se producen fallos y
reducen el tiempo de reconstruccin (en configuraciones con
discos hot spare). Tcnicamente un disco de reserva no forma
parte del array hasta que uno de los discos falla y se
reconstruye la informacin sobre l.
15
Tecnologa RAID
RAID 6
Dado su coste, existen pocas implementaciones comerciales.
Funciona con striping de datos a nivel de bloque con doble
paridad distribuida entre todos los discos y en una posicin
diferente para cada divisin (stripe), proporcionando
proteccin ante fallos tanto por averas en discos como en la
reconstruccin de discos.
RAID 6 es ineficiente cuand o el array est formado por una
cantidad pequea de discos.
Las operaciones de escritura se ven penalizadas por los
clculos implcitos a la doble paridad.
Mayor coste que otros niveles RAID.
RAID 6 no es uno de los niveles incluidos en la especificacin
original de RAID.
16
Tecnologa RAID
RAID 6E
Idntico a RAID 5E pero aplicado a un array RAID 6.
Es decir se trata de un RAID 6 que incluye discos de reserva
en modo hot spare o standby spare.
Se suele llamar RAID 6E a los que incluyen discos de reserva.
Estos discos pueden estar conectados y preparados (hot
spare) o en espera (standby spare). En los RAID 6E, los discos
de reserva estn disponibles para cualquiera de las unidades
miembro. No suponen mejora alguna del rendimiento, pero s
se minimiza el tiempo de reconstruccin (en el caso de los
discos hot spare) y las labores de administracin cuando se
producen fallos.
Un disco de reserva no es realmente parte del conjunto hasta
que un disco falla y el conjunto se reconstruye sobre el de
reserva.
17
Tecnologa RAID
18
Tecnologa RAID
RAID 10 (1+0)
Primero se crea un espejo RAID 1 y luego, sobre los anteriores,
se establece un RAID 0. El resultado es un array dotado de
redundancia con una mejora de rendimiento al no precisar
escritura de paridad.
Para que no se pierdan datos cada RAID 1 deber mantener al
menos uno de sus discos sin fallos.
En cada divisin RAID 1 pueden fallar todos los discos salvo
uno sin que se pierdan datos. Sin embargo, si los discos que
han fallado no se reemplazan, el restante pasa a ser un punto
nico de fallo para todo el conjunto. Si ese disco falla
19
Tecnologa RAID
RAID: PROPIETARIOS
En general las implementaciones de RAID realizadas por cada
fabricante presenta algunas particularidades sobre la
especificacin original, sin embargo algunas compaas han
desarrollado soluciones RAID totalmente propietarias.
Entre ellas mencionar:
RAID 1.5: Desarrollado por HighPoint.
20
Tecnologa RAID
RAID: DISCO
Utilizar discos rpidos para montar un RAID no suele estar
justificado. Son mucho ms caros. Los discos rpidos suelen
serlo debido a una mayor agilidad de las cabezas para
posicionarse en la pista necesaria. Los cambios de pista es la
operacin que ms tiempo consume en un disco duro, pero a
diferencia por ejemplo de MSDOS en Linux estn optimizadas
de manera que la informacin no se accede en el mismo
orden que es solicitada sino que se comporta de manera
similar a un ascensor inteligente que va memorizando las
peticiones y las va atendiendo por el orden ms conveniente.
Tambin se usan otras estrategias que aumentan el
rendimiento minimizando el nmero de accesos a disco,
21
Tecnologa RAID
22
RAID 0
RAID 1
RAID 2
RAID 3
2 Discos
2 Discos
3 Discos
3 Discos
Tecnologa RAID
Ventajas
Permite el
acceso a ms
de un disco a la
vez, logrando
una tasa de
transferencia
ms elevada.
Proteccin de la
informacin en
caso de fallos
del disco y/o de
la controladora.
Buena
proteccin de la
informacin en
caso de fallos
del disco.
Elevada tasa de
transferencia de
datos tanto de
lectura como de
escritura con alta
disponibilidad del
array.
Desventaj
as
No se dispone
de informacin
de paridad y
por tanto no
ofrece
funcionalidad
de tolerancia a
fallos.
Ineficiencia
debido a las
tareas de
escritura en el
disco espejo.
Elevado coste.
Segn el tipo
de
configuracin
requiere un
gran nmero de
discos.
No ofrece
solucin al fallo
simultneo de
dos discos.
RAID 4
RAID 5
RAID 6
RAID 10
Discos
3 Discos
3 Discos
4 Discos
4 Discos
Ventajas
Alta
disponibilidad
del array con
elevada tasa
de
transferencia
de datos.
Proporciona un
buen
rendimiento con
mnima prdida
de capacidad de
almacenamient
o.
Tolerancia a
fallos
extremadament
e alta.
Combina el
rendimiento de
lectura de RAID
0 con la
tolerancia a
fallos de RAID 1.
Desventaja
s
La
controladora
requerida es
compleja y por
lo tanto
costosa.
Menores
prestaciones
que en RAID 1.
No ofrece
solucin al fallo
simultneo en
dos discos.
Utiliza el
equivalente a
dos unidades de
disco para
funciones de
paridad por lo
que el coste por
megabyte til
es mayor.
Pierdes la mitad
de capacidad
aunque es la
ms resistente a
fallos. No ofrece
ningn tipo de
proteccin
frente a fallos.
Si slo un disco
cae se perder
la informacin.
23
Tecnologa RAID
Tecnologa RAID
25
Tecnologa RAID
RAID: SEGERENCIAS
Use dos unidades nuevas si est creando un RAID 0 de
rendimiento. Se recomienda que use dos unidades SATA
del mismo tamao. Si usa dos unidades de distintos
tamaos, la capacidad del disco duro ms pequeo
ser el almacenamiento base para cada unidad. Por
ejemplo, si un disco duro tiene una capacidad de
almacenamiento de 80GB y el otro disco duro tiene
60GB, la capacidad mxima de almacenamiento del
disco de 80GB ser de 60GB, y el almacenamiento total
del conjunto RAID 0 ser de 120GB.
26
Tecnologa RAID
RAID: CONCLUSIONES
En base a lo anteriormente expuesto se concluye lo siguiente:
Que los sistemas RAID, fueron definidos por primera vez
en el ao 1987 por un grupo de informticos de la
universidad de California, Berkeley, en donde se estudi
la posibilidad de usar dos o ms discos que funcionarn
como un nico dispositivo para el sistema.
Que un Nivel 5 de RAID implementa la divisin de datos a
nivel de bloques, distribuyendo la informacin de paridad
entre todos los miembros del conjunto de discos.
27
Tecnologa RAID
RAID: BIBLIOGRAFIA
La seccin conceptual de este documento fue investigada
bajo las siguientes fuentes bibliogrficas.
Sitios Virtuales Consultados:
http://es.wikipedia.org/wiki/RAID
http://www.mastermagazine.info/termino/6464.php
http://www.agalisa.es/article64.html
28