Académique Documents
Professionnel Documents
Culture Documents
ARQUITECTURA DE INVULNERABILIDAD DE
DATOS DE EMC DATA DOMAIN: MEJORA DE
LA CAPACIDAD DE RECUPERACIN Y LA
INTEGRIDAD DE LOS DATOS
Anlisis detallado
Resumen
Ningn mecanismo por s mismo es suficiente para garantizar la
integridad de los datos en un sistema de almacenamiento.
La capacidad de recuperacin de datos solo se puede garantizar
mediante la cooperacin de una gran cantidad de mecanismos que
establecen lneas de defensa contra todos los orgenes de errores.
A diferencia de los sistemas de almacenamiento de uso general, los
sistemas de almacenamiento con deduplicacin EMC Data Domain
han sido diseados especficamente como el almacenamiento del
ltimo recurso. Los sistemas de almacenamiento Data Domain
priorizan la recuperacin sobre todo lo dems, con funcionalidades
de proteccin de la integridad de los datos incorporadas mediante la
arquitectura de invulnerabilidad de datos de EMC Data Domain. Este
informe tcnico se centra en cuatro elementos clave de la
arquitectura de invulnerabilidad de datos de Data Domain, que, al
combinarse, proporcionan los mayores niveles de capacidad de
recuperacin e integridad de datos del sector:
abril 2013
Tabla de contenidos
Resumen ejecutivo ........................................................................................... 4
Integridad de datos del sistema de almacenamiento ....................................................... 4
Introduccin .................................................................................................... 4
Pblico al que va dirigido ............................................................................................... 4
Conclusiones .................................................................................................. 11
Resumen ejecutivo
Integridad de datos del sistema de almacenamiento
Detrs de todo el valor agregado, los sistemas de almacenamiento especializados se
basan en componentes informticos de propsito general y herramientas de
software que pueden presentar errores. Algunas fallas tienen un impacto visible e
inmediato, por ejemplo, la falla total de una unidad de disco. Otras fallas son sutiles
y estn ocultas, por ejemplo, un error de software que provoca daos latentes en el
sistema de archivos que solo se descubren en el momento de la lectura. Para
garantizar la integridad de los datos ante dichas fallas, los mejores sistemas de
almacenamiento incluyen varias comprobaciones de integridad de los datos y,
generalmente, cuentan con caractersticas optimizadas de rendimiento y
disponibilidad del sistema, no de invulnerabilidad de los datos. En el anlisis final,
suponen que todos los respaldos se efectan, y presentan disyuntivas relacionadas
con el diseo que priorizan la velocidad con respecto a la capacidad de
recuperacin de datos garantizada. Por ejemplo, ningn sistema de archivos de
almacenamiento primario de uso general lee datos desde el disco para garantizar
que se hayan almacenado correctamente, pues, si lo hiciera, afectara el
rendimiento. Sin embargo, los datos no se pueden considerar invulnerables si no se
almacenan correctamente en primer lugar. En el respaldo a disco especialmente
diseado, se debe priorizar la invulnerabilidad de los datos sobre el rendimiento e
incluso sobre la disponibilidad. A menos que el inters se centre en la integridad de
los datos, los datos de respaldo y de archivo estn expuestos a riesgo. Si los datos
estn expuestos a riesgo, cuando se pierde la copia primaria de los datos, la
recuperacin tambin se encuentra expuesta a riesgo. La mayora de los dispositivos
de respaldo especialmente diseados son simplemente sistemas de
almacenamiento primario creados a partir de discos ms econmicos. Por lo tanto,
heredan la filosofa de diseo de sus antecesores de almacenamiento primario. Si
bien se etiquetan como dispositivos de respaldo especialmente diseados, sus
diseos destacan el rendimiento a costa de la invulnerabilidad de los datos.
Introduccin
Este informe tcnico se centra en cuatro elementos clave de la arquitectura de
invulnerabilidad de datos de EMC Data Domain, que, al combinarse, proporcionan
los mayores niveles del sector en cuanto a capacidad de recuperacin e integridad
de los datos.
Incluso con este modelo, resulta importante recordar que DD OS es simplemente tan
bueno como los datos que recibe. Puede realizar una prueba de punto a punto de
los datos que recibe dentro de los lmites del sistema, pero DD OS no puede saber si
esos datos estuvieron protegidos durante cada paso de la red en su trayecto hacia el
sistema. Si se produce un error en la red que ocasiona daos en los datos o si los
datos se daan en el almacenamiento primario, DD OS no puede repararlos.
Recomendamos probar la recuperacin a nivel de aplicaciones de manera peridica.
La verificacin de punto a punto confirma que los datos sean correctos y puedan
recuperarse desde cualquier nivel del sistema. Si existen problemas en cualquier
parte del trayecto (por ejemplo, si se han perdido algunos datos en la unidad), se
detectarn. Los errores tambin se pueden corregir mediante un proceso de
autorreparacin, como se describe en la seccin siguiente. Los sistemas de
almacenamiento primario convencionales no pueden realizar este tipo de
verificaciones tan exigentes. No obstante, los dispositivos de respaldo
especialmente diseados las requieren. La gran reduccin de datos que se logra
mediante Data Domain Global Compression disminuye la cantidad de datos que
se deben verificar y posibilita la realizacin de estas verificaciones.
El producto de gateway, que utiliza RAID externo, no puede garantizar la ausencia de escrituras parciales de
fracciones.
ponen en riesgo los respaldos existentes. Los sistemas Data Domain estn
diseados para minimizar la cantidad de errores estndar en el sistema de
almacenamiento. Si se producen errores ms desafiantes, se tarda menos tiempo en
encontrarlos, corregirlos y notificar al operador.
10
Conclusiones
Ningn mecanismo por s mismo es suficiente para garantizar la integridad de los
datos en un sistema de almacenamiento. La capacidad de recuperacin de datos
solo se puede garantizar mediante la cooperacin de una gran cantidad de
mecanismos que establecen lneas de defensa contra todos los orgenes de errores.
A diferencia de los sistemas de almacenamiento tradicionales, cuyo propsito ha
cambiado del almacenamiento primario a la proteccin de datos, los sistemas
Data Domain estn diseados desde el principio especficamente para el
almacenamiento de datos de ltimo recurso. La innovadora arquitectura de
invulnerabilidad de datos brinda la mejor proteccin del sector contra los problemas
de integridad de datos. La verificacin avanzada garantiza que los nuevos datos de
respaldo y de archivo se almacenen correctamente. La arquitectura estructurada en
logs y sin sobrescritura del sistema de archivos de Data Domain, junto con la
reiteracin de escrituras de fracciones completas, garantiza que los datos antiguos
siempre estn seguros, incluso, ante posibles errores de software ocasionados por
los nuevos datos. Mientras tanto, una implementacin simple y slida reduce la
posibilidad de que se produzcan errores de software en primer lugar.
Los mecanismos mencionados brindan proteccin contra problemas durante el
almacenamiento de datos de respaldo y de archivo, pero las fallas en el
almacenamiento en s tambin ponen en peligro la capacidad de recuperacin de los
datos. Por este motivo, la arquitectura de invulnerabilidad de datos incluye una
implementacin propietaria de RAID 6 que brinda proteccin contra fallas en hasta
dos discos; puede reconstruir un disco con errores, incluso si se presenta un error de
lectura de datos; y corrige errores de manera instantnea durante la lectura.
Asimismo, incluye un proceso de limpieza constante que busca y repara de manera
activa las fallas latentes antes de que se conviertan en un problema.
La ltima medida de defensa es la funcin de recuperacin del sistema de archivos
Data Domain. El formato de datos autodescriptivo permite reconstruir los datos de
archivo, incluso si se daan o se pierden varias estructuras de metadatos. Adems,
la comprobacin y la reparacin rpidas del sistema de archivos logran que hasta un
sistema con docenas de terabytes de datos no est offline durante mucho tiempo en
caso de que se presente algn tipo de problema.
Los sistemas Data Domain son la nica solucin que incluye esta atencin incesante
a la integridad de los datos, lo que le permite tener la mxima confianza en su
capacidad de recuperacin.
11