Vous êtes sur la page 1sur 16

Almacenamiento SAN, NAS, DAS.

Conceptos e Historia: NFS, SMB, CIFS, Fiber Channel, HBA, Switch Fabric, iSCSI, IQN, MPIO, LUN, Snapshot, Switch Zoning, LUN Masking, WWN, WWNN, WWPN, FCIP, iFCP

Este Artculo pretende ser un Manual de Almacenamiento a nivel bsico, donde introducir los principales conceptos de Almacenamiento, arquitecturas de Almacenamiento, tecnologas de Almacenamiento, etc., tanto desde un punto prctico como desde un punto de teora universitaria, actuando tambin como Glosario de trminos de Almacenamiento: SAN, NAS, DAS, NFS, SMB, CIFS, Fiber Channel, HBA, Switch Fabric, iSCSI, IQN, MPIO, LUN, Snapshot, Switch Zoning, LUN Masking, WWN, WWNN, WWPN, FCIP, iFCP Qu significa y qu son cada uno de estos trminos de Almacenamiento? Tena muchas ganas de escribir un artculo como este. El Almacenamiento es un rea que me ha suscitado bastante inters en los ltimos aos, en especial lo relativo a las soluciones de Almacenamiento SAN, y por supuesto a las soluciones de Target iSCSI por software para la construccin de laboratorios de pruebas en los proyectos en que participo. De hecho, actualmente tengo una asignatura pendiente con Windows Storage Server 2008 y Microsoft iSCSI Target, producto con el cual tengo bastantes ganas de poner a prueba y escribir un poco ms sobre l. En muchos casos, no se tiene verdadera conciencia de la importancia de los Sistemas de Almacenamiento de las empresas, uno de los principales recursos crticos de las mismas, un elemento muy importante y delicado, desde la poca de los Mainframe de IBM hasta nuestros das. Sin ms, empezamos con el temario. A disfrutar, jeje.
y

DAS, NAS y SAN. Arquitecturas de Almacenamiento y Evolucin histrica En este primer captulo se introducen las Arquitecturas de Almacenamiento DAS (Direct Attached Storage), NAS (Network Attached Storage), y SAN (Storage Area Network), sus ventajas e inconvenientes, diferencias y similitudes, y otros conceptos y tecnologas relacionadas (SCSI, Fiber Channel, RAID, NFS Network File System, CIFS Common Internet File System, iSCSI, MPIO, SecurePath, LUN Masking, Zoning, etc.). Finalmente, se introduce la arquitectura SSA (Serial Storage Architecture) de IBM.

Creo que la mejor forma de empezar es con la introduccin de las Arquitecturas de Almacenamiento DAS, NAS y SAN, por dos motivos: el primero para su conocimiento (fundamental) y el segundo porque al explicar estas tecnologas daremos pie a la introduccin de otros conceptos y tecnologas, tambin de gran importacia. All vamos.
y

DAS (Direct Attached Storage), la gran poca del Mainframe. Se trata de dispositivos de almacenamiento directamente conectados a las mquinas, como es el caso de discos duros internos, cabinas de disco (en Rack en o cualquier otro formato) conectadas directamente a un servidor, o unidades de cinta para backup. Suele basarse en tecnologas SCSI (Small Computers System Interface), FC (Fiber Channel), e IDE. Esta arquitectura de almacenamiento, se relaciona principalmente con la poca de los Mainframe de IBM, y los

Miniordenadores UNIX, pues aquellos aos se dotaba a estas mquinas de sus propios medios locales de almacenamiento y backup. Sin embargo, hoy en da, los PCs de sobremesa utilizan arquitectura de almacenamiento DAS, mientras que en los servidores de las empresas, empieza a caer en desuso, utilizndose nicamente para el almacenamiento del Sistema de Operativo (en muchos casos ni eso, gracias a las soluciones Boot-on-SAN), y empleando almacenamiento SAN y NAS para el resto. La arquitectura de almacenamiento DAS (Direct Attached Storage), presenta muchos inconvenientes, como es la Dispersin del Almacenamiento que implica una Dificultad en la gestin de los Backups, una relativamente baja tolerancia a fallos (slo posible a travs de soluciones RAID), y un alto TCO debido a las dificultades de mantenimiento.
y

NAS (Network Attached Storage), la introduccin de las redes. Con la introduccin de las redes locales (LAN), se empezarn a utilizar servidores de almacenamiento conectados a la LAN, a los cuales se poda acceder directamente a travs de la propia red mediante protocolos especficos como NFS (Network File System) en entornos UNIX y CIFS (Common Internet File System) en entornos Microsoft (antes conocido como SMB, protocolo original de IBM que fue mejorado por Microsoft en CIFS), o incluso mediante FTP, HTTP, etc. Antiguamente, se utilizaban los protocolos de Novell Netware que en ocasiones funcionabas sobre redes SPX, pero Novell Netware qued en desuso, y actualmente las soluciones NAS se basan en TCP/IP, con protocolos NFS o CIFS por encima. En consecuencia, en la actualidad, un dispositivo NAS ser una mquina dedicada con una o varias direcciones IP (sea un dispositivo NAS por hardware tipo frigorfico o un servidor Window/UNIX), y adems estar dotado de una conexin de alta velocidad a la red LAN. Por ello, una arquitectura de almacenamiento NAS puede estar formada por mltiples dispositivos NAS geogrficamente distribuidos. En cualquier caso, tngase en cuenta que un servidor NAS utilizar almacenamiento DAS o SAN (almacenamiento interno o almacenamiento externo), evidentemente. Claro est, que existen alternativas que integran soluciones NAS dentro de la propia infraestructura SAN. As, los equipos clientes en una arquitectura de almacenamiento NAS, delegan la gestin del sistema de ficheros al propio dispositivo NAS. Se limitan a montar las unidades de red exportadas o compartidas por los dispositivos NAS, de tal modo que usuarios y aplicaciones utilizan estos sistemas de ficheros como si fueran sistemas de ficheros locales, aunque para el sistema operativo se trate claramente de sistemas de ficheros remotos. El problema de esta arquitectura de almacenamiento, es que la red LAN puede actuar de cuello de botella. Actualmente, sigue utilizndose masivamente las arquitecturas NAS (ej: tpicas Carpetas Compartidas o Shared Folder, que se utilizan en las empresas para el almacenamiento de ficheros), aunque no a todas las aplicaciones le resulte igual de til (ej: los grandes servidores de base de datos, preferiran almacenamiento SAN). Los principales beneficios de las Arquitecturas de Almacenamiento NAS, es que

proporcionan un mejor TCO (Total Cost of Ownship), resultando una arquitectura fcilmente escalable, capaz de ofrecer una alta disponibilidad. En definitiva, es quizs la mejor forma de ofrecer comparticin e intercambio de ficheros en un entorno heterogneo.
y

SAN (Storage Area Network). Esta arquitectura implica disponer de una infraestructura de red de alta velocidad dedicada slo para Almacenamiento y Backup, optimizada para mover grandes cantidades de datos, y consistente en mltiples recursos de almacenamiento geogrficamente distribuidos y otros elementos (cables, switches de fibra FC, routers, adaptadores HBA, etc), completamente accesibles desde la red corporativa. Las redes de almacenamiento SAN geogrficamente distribuidas, han facilitado enormemente la creacin de Centros de Procesos de Datos (CDP) geogrficamente distribuidos, Clusters Geogrficos o GeoClusters, creacin de centros de respaldo (BDC), etc. La utilizacin de una arquitectura de almacenamiento SAN implica la existencia y mantenimiento de al menos dos redes: la red LAN y las red SAN. En la prctica, las redes de almacenamiento SAN suelen basarse en la tecnologa FC (Fibre Channel), aunque tambin pueden basarse en Gigabit Ethernet o GigaEthernet (vase el caso de iSCSI). Cuando se haba de redes conmutadas en Fiber Channel, suele utilizarse el trmino Switch Fabric. En ambos casos, suele emplearse sobre redes conmutadas, utilizando mltiples switches y mltiples puertos (tanto en los clientes como en los servidores de almacenamiento) para ofrecer Alta Disponibilidad basada en la existencia de mltiples caminos, apoyndose para ello en soluciones y protocolos como MPIO (Multipath Input Output) y SecurePath (solucin propietaria de HP), y gracias tambin a la configuraciones de LUN Masking y Zoning. Evidentemente, adems de la Alta Disponibilidad relativa a la redundancia de caminos, tambin se utilizan soluciones de Alta Disponibilidad del almacenamiento (Espejo o RAID1, RAID5, RAID10, etc.). La arquitectura de almacenamiento SAN, lleva experimentando un gran auge en los ltimos aos, tanto por los beneficios propios de la utilizacin de redes de almacenamiento SAN, como por la propia evolucin de la tecnologa, como la incorporacin de soluciones de almacenamiento SAN basadas en iSCSI, incluyen soluciones SAN iSCSI por software como Windows Storage Server 2008 y Microsoft iSCSI Target. Los beneficios o ventajas de las redes de almacenamiento SAN, son evidentes: mayor velocidad de acceso a datos, menor tiempo de recuperacin ante desastres (los tiempos de Backup y Restore se minimizan, y se aaden los clonados y Snapshots de LUN), escalabilidad (siempre es posible aadir ms bandejas de discos, o incluso, ms Cabinas de Discos y Switches), y sobre todo, una gestin centralizada, compartida y concurrente del almacenamiento (indiferentemente de la plataforma y sistema operativo de los Host). Por ejemplo, si necesitamos un disco de 20GB para un Servidor o Host, para que voy comprar 2 discos de 320GB y montar un RAID1, si podemos crear una LUN de 20GB? Lo que quiero decir, es que hoy en da, no existen discos de 20GB a la venta (por poner un ejemplo), de tal modo, que la centralizacin del

almacenamiento nos va a permitir optimizar nuestros recursos y minimizar costes (esto ltimo es francamente mentira, pues los costes de infraestructura SAN son bastante altos, pero as al menos se consiguen amortiguar). Adems, existen otros efectos colaterales, como por ejemplo, que la introduccin de una infraestructura de almacenamiento SAN en una empresa, liberar de bastante trfico de red LAN. Por desgracia, las redes de almacenamiento SAN tambin tienen sus inconvenientes, principalmente su coste (el precio del Gigabyte sale muy caro), y tambin la existencia de ciertas limitaciones para integrar soluciones y/o dispositivos de diferentes fabricantes. Una de la principales alternativas para la reduccin de costes de la redes de almacenamiento SAN es la utilizacin de soluciones de almacenamiento SAN basadas en iSCSI, que funcionan con tarjetas Ethernet (de las de toda la vida, no hacen falta HBA) y sobre los Switches Ethernet de la LAN (de los de toda la vida, tambin). El hecho aqu, es que con las actuales redes Ethernet de 10Gbps, el cuello de botella se transfiere de la red al acceso a disco. La diferencia entre NAS y SAN, principalmente es que un Host o Servidor accede a un disco NAS a travs de la red LAN, MAN o WAN (ej: carpeta compartida), siendo el Sistema Operativo consciente de que se est accediendo a un recurso (el disco o mejor dicho, el sistema de ficheros) remoto. Sin embargo, un Host o Servidor accede a un disco SAN como si fuera un disco local (es decir, un disco DAS), de forma transparente para el Sistema Operativo, siendo las tarjetas HBA y sus drivers quienes se preocupen de que dicho acceso a la SAN sea as de transparente. Tambin se dice, que NAS se encuentra entre el Servidor de Aplicaciones y el Sistema de Ficheros, mientras que SAN se encuentra entre el Sistema de ficheros y el Almacenamiento Fsico. Por ltimo, vamos a introducir la arquitectura SSA de IBM, principalmente por culturilla informtica y con fines didcticos. SSA (Serial Storage Architecture) es una Arquitectura de Almacenamiento desarrollada por IBM (posteriormente estandarizada en ANSI X3T10.1), consistente en la conexin serie de mltiples dispositivos de almacenamiento SCSI a un Host, en modo dual-port full-duplex. El fallo de un nico cable no evitar el acceso a los datos. Cada puerto transmite a 20MB, consiguiendo un ancho de banda total de 80MB. Es de la poca de los discos DASD, de tamaos de 2,2GB, 4,5GB, 9,1GB, etc.

Fiber Channel (FC), Introduccin Este captulo lo dedicamos a la tecnologa Fiber Channel (FC), una tecnologa de red Gigabit utilizada principalmente para redes de almacenamiento SAN y para la conexin de Cabinas de Discos DAS, capaz de funcionar sobre cables de fibra ptica (fiber-optic cables) y sobre cables de cobre (twisted pair copper wire), aunque en la prctica suele ser cableado de fibra ptica (multimodo o monomodo). Cometaremos la posibles topologas Fiber Channel (punto a punto FC-P2P, bucle arbitrado o FC-AL, y red conmutado FC-SW) y las capas de Fiber Channel.

Lo primero de lo que hablar, quizs sea del protocolo Fiber Channel Protocol (FCP). Fiber Channel Protocol (FCP) es un protocolo de transporte para la transmisin de comandos SCSI sobre redes Fiber Channel. Muy utilizado y extendido. Bien, ya sabemos que estamos hablando de redes de almacenamiento basadas en conexiones de fibra ptica, sobre las que circula informacin a travs del protocolo FCP (Fiber Channel Protocol), principalmente intercambio de comandos SCSI entre los dispositivos conectados a dicha red de fibra. Ahora bien, Qu posible topologas o formas de conexin existen con Fiber Channel (FC)? La tecnologa Fiber Channel (FC) ofrece tres posibles topologas:
y

Conexin punto a punto (FC-P2P, Point-to-Point). Se utiliza en soluciones de almacenamiento DAS, en las cuales, se conecta una cabina de almacenamiento directamente a las tarjetas HBA del servidor (o servidores, vese el caso de un Cluster). Bueno, puede ser una cabina de almacenamiento, un robot de cintas, etc. Bucle arbitrado (FC-AL). Permite conectar hasta 126 dispositivos en anillo, compartiendo el ancho de banda, de forma anloga a las redes Token Ring. Que yo sepa, no tiene mucho uso. Red conmutada (FC-SW, Switch Fabric). Aprovecha la utilizacin de conmutadores o switches Fiber Channel (FC) para la conexin de mltiples dispositivos, sin compartir el ancho de banda (siempre que el switch tenga suficiente capacidad de conmutacin, claro), soportando hasta 15,5 millones de nodos, y manteniendo todo el ancho de banda. Se utiliza habitualmente en arquitecturas de almacenamiento SAN, utilizndose el trmino de Switch Fabric, por la capidad de este tipo de redes de reenviar los paquetes entre switches, desde el origen al destino, por el puerto apropiado. Suelen utilizarse mltiples swiches, y mltiples puertos tanto en la cabina de almacenamiento (Storage) y Librera de Cintas, como en los equipos cliente (Servidores Windows, UNIX o Mainframe), de tal modo, que puedan definirse mltiples caminos entre el equipo cliente (Servidor Windows, UNIX o Mainframe) y el destino, la cabina de Almacenamiento (Storage) o Librera de Cintas. Esto proporciona un mecanismo de Alta Disponibilidad, vital en las actuales infraestructuras de almacenamiento SAN corporativas. Suele apoyarse en protocolos para la gestin de caminos mltiples al almacenamiento, como es el caso de MPIO (Multi Path Input Output) y SecurePath (protocolo propietario de HP) , y gracias tambin a la configuraciones de LUN Masking y Zoning.

Por ltimo, comentar que Fiber Channel es un Protocolo Multicapa, formado por las siguientes cinco capas:

y y y y y

FC0, la capa fsica (physical layer). Cables, conectores, etc. FC1, la capa de enlace (data link layer). Realiza la codificacin y decodificacin 8b/10b. FC2, la capa de red (network layer). Es el corazn de Fiber Channel. Define los principales protocolos de Fiber Channel. FC3, la capa de servicios comunes (common services layer). Puede implementar funcionalidades como encriptacin y RAID. FC4, la capa de mapeo de procolos (protocol mapping layer). Es la capa, en la que otros protocolos (como es el caso de SCSI) son encapsulados para su entrega a FC2.

Poco ms que decir, en esta breve introduccin a Fiber Channel (FC).

Componentes de la Arquitectura SAN En este captulo, nos centramos en la Arquitectura de Almacenamiento SAN, entrando a estudiar sus principales componentes: Los dispositivos Cliente o Host (Servidores Windows, UNIX, Mainframe), Los equipos de Almacenamiento (las Cabinas de Discos y Libreras de Cintas) y Dispositivos de interconexin (Los Switches Fiber Channel - FC). Tambin hablaremos de las tarjetas HBA (Host Bus Adapter), de las LUN (Qu es una LUN?), de MPIO y SecurePath, de iSCSI, etc.

Ahora que ya tenemos un poco de base, adquirida tras la lectura de los captulos anteriores, empieza a ser el momento de entrar en ms detalle con la Arquitectura de Almacenamiento SAN, por lo que aprovecharemos para introducir los componentes principales de una Arquitectura de Almacenamiento SAN:
y

Los dispositivos Cliente o Host: los Servidores Windows, UNIX, Mainframe. Realizarn un acceso transparente al almacenamiento SAN, como si se tratase de discos locales DAS, siendo esta la principal diferencia entre SAN y NAS. Para poder conectarse a la red de almacenamiento SAN, necesitarn de tarjetas HBA (Host Bus Adapter). Las tarjetas HBA, son dispositivos de conexin Fiber Channel (FC), que permitirn la conexin de estos equipos clientes a los switches de la red de almacenamiento SAN mediante cables de fibra. Es interesante que dispongan de mltiples puertos Fiber Channel, ya sea a travs una HBA con mltiples puertos, o bien por la utilizacin de mltiples HBA. La disponibilidad de mltiples puertos Fiber Channel, facilitar disponer de Alta Disponibilidad a travs de mltiples caminos, consiguiendo as ser invulnerables ante la cada de un Switch de Fibra, o de un puerto de la Cabina de Almacenamiento, etc., gracias a la utilizacin de protocolos como de MPIO (Multi Path Input Output) y SecurePath (protocolo propietario de HP), y gracias tambin a la configuraciones de LUN Masking y Zoning. Actualmente, los principales fabricantes de tarjetas HBA son Emulex y qLogic. En el caso de iSCSI, existen tarjetas HBA especficas, pero tambin pueden utilizarse tarjetas de red tradicionales, a poder ser de alto rendimiento (Gigabit Ethernet o ms, pues actualmente ya existe tecnoga Ethernet de 10Gbps),

pudiendo del mismo modo disfrutar de Alta Disponibilidad a travs de mltiples caminos, gracias a protocolos como de MPIO (Multi Path Input Output) y SecurePath (protocolo propietario de HP). En este caso, en vez de Zoning, suelen utilizarse VLANs, que al final, es el equivalente en los switches de fibra Ethernet.
y

Los equipos de Almacenamiento: las Cabinas de Discos y Libreras de Cintas (o Robots de Cintas). Estos dispositivos requieres de un gestin especial, por personal tcnico especializado. Tngase en cuenta, que el hecho de dotar a una empresa de una infraestructura de almacenamiento SAN, automticamente convierte a estos dispositivos de almacenamientos en un elemento crtico de la empresa. La cada del Almacenamiento (especialmente de las Cambinas de Discos), implicara una prdida del servicio, algo que en determinados sectores como la Banca, podra repercutir en prdidas millonarias. Las Cabinas de Almacenamiento suelen disponer de mltiples puertos para ofrecer Alta Disponibilidad basada en la existencia de mltiples caminos, gracias tambin a protocolos como MPIO y SecurePath. Del mismo modo suele utilizar tecnologas RAID como RAID1 y RAID5 para ofrecer Alta Disponibilidad en el Almacenamiento, y as, que la prdida de un disco, no ocasione ninguna prdida de datos. En las Cabinas de Almacenamiento actuales, suelen formarse un gran RAID (ej: un RAID5 con 48 discos fsicos de Alta Velocidad), y sobre ese gran RAID, suelen crearse las LUN (Logical Unit Number). La conexin de las Cabinas de Disco a la red de almacenamiento SAN, suele realizarse a travs de los Procesadores de Almacenamiento (Storage Processor SP), de tal modo, que suelen utilizarse al menos dos Storage Processor, cada uno con uno o varios puertos de fibra. Estor Procesadores de Almacenamiento (Storage Processors) tambin sern capaces de dotar de memoria cach al Almacenamiento, con el objetivo de maximizar el rendimiento en base a minimizar los accesos a disco necesarios. Qu es una LUN? Una LUN (Logical Unit Number) es un trocito de este gran RAID al que nos referamos antes, el cual, se presentar o asignar a un Servidor (ej: Windows, UNIX o Mainframe) para su utilizacin. Es decir, una LUN es un disco lgico, desde el punto de vista de la Cabina de Almacenamiento (Storage). El Servidor, realmento lo ver como un Disco ms, aunque por detrs, exista una infraestructura de Almacenamiento SAN compleja, y realmente ese Disco del Servidor se almacene fsicamente repartido entre 45 discos fsicos de la Cabina de Almacenamiento, y se pueda llegar al mismo a travs de mltiples caminos (a este fenmeno, algunos le llaman Virtualizacin del Almacenamiento o Storage Virtualization). Todo esto es transparente, simplemente las LUN (Loginal Unit Number) son los discos o volmenes que vern los Servidores de nuestra empresa. Una LUN (Logical Unit Number) es una direccin que identifica dicho trocito del gran RAID o disco lgico. El trmino LUN (Logical Unit Number) es originario del protocolo SCSI (recordemos, que hace unos aos, las Cabinas de Almacenamiento se conectaban a travs de cables SCSI a tarjetas SCSI de los Servidores, es decir, un almacenamiento DAS basado en SCSI). De hecho, una red de almacenamiento

SAN utiliza el procolo SCSI, trasportndolo a travs de Fiber Channel (FC). Una ventaja de las Cabinas de Almacenamiento en redes SAN, es el hecho de tener todos los discos (perdn, LUNs) de todos los servidores de la empresa en una nica Cabina de Almacenamiento (o en varias, si la empresa es mas grande). El hecho de poder clonar discos rpidamente (perdn, clonar LUNs), es un mtodo de copia de seguridad rpido, transparente y econmico, muy til para operaciones de parcheo de servidores, cambios de configuracin con riesgo, etc. Tambin resulta til poder realizar Snapshot de un disco (perdn, un Snapshot de una LUN), sin que los Servidores pierdan acceso al mismo, es decir, realizar el Snapshot en caliente. Tambin es cierto, que actualmente existen soluciones de Replicacin del Almacenamiento, tanto Sncrona como Asncrona. Es decir, es posible tener dos Cabinas de Almacenamiento y definir una Replicacin Sncrona para una o varias LUNs entre las dos Cabinas de Almacenamiento, siendo este otro mtodo de Alta Disponibilidad utilizado en entornos crticos de empresa. Un importante detalle, en lo relacionado con las Cabinas de Almacenamiento, no nos podemos olvidar de su corazn: los discos. Es muy importante disponer de un Plan de Capacidad apropiado para la infraestructura de Almacenamiento, disponiendo siempre de espacio suficiente. Por supuesto, es muy importante poder disponer de discos rpidos. Debido a que el precio es ms caro, en ocasiones se crea un RAID (o varios) slo con discos rpidos para los entornos crticos, y por otro lado se crea un RAID (o varios) slo con disco ms lentos (y baratos, claro), para entornos menos crticos y para otro tipo de operaciones como clonados, backups, etc.
y

Dispositivos de interconexin: Los Switches Fiber Channel (FC). Una de las partes ms importantes de una red de almacenamiento SAN, y al igual que ocurre en redes Ethernet, son los Conmutadoes o Switches, es decir, la electrnica de red. Estos dispositivos son los que permitirn interconectar al resto de dispositivos de la red de almacenamiento SAN, como los Host o Servidores, las Cabinas de Almacenamiento y las Libreras de Cintas. La capacidad y velocidad de conmutacin de los Switches Fiber Channel, as como el nmero de puertos, suelen datos bastante representativos de una red de almacenamiento SAN. Algunos fabricantes actualmente reconocidos en productos de electrnica de red Fiber Channel como Switches de Almacenamiento Fiber Channel, son Brocade y McData. Habitualmente, suelen utilizarse mltiples Switches para as ofrecer mltiples caminos entre los Host o Servidores y las Cabinas de Almacenamiento y Libreras de Cintas. Es sobre los Switches, dnde se realiza la configuracin de Switch Zoning, como se describe ms adelante en este mismo artculo. Evidentemente, en el caso de redes de almacenamiento SAN basadas en iSCSI, hablaremos de Switches Ethernet (utilicen fibra o cobre, como medio de transporte), y en vez de Zoning utilizaremos VLAN.

Evidentemente, se podra hablar mucho ms de este tema, y profundizar hasta niveles de detalle muy exhaustivos. Sin embargo, vamos a dejarlo aqu, tomando una visin global arquitectnica, y seguimos profundizando a travs del resto de captulos.
y

World Wide Name (WWN), WWNN y WWPN Un trmino que debos conocer antes de continuar es el World Wide Name (WWN) o World Wide Identifier (WWID), as como sus trminos derivados World Wide Port Name (WWPN) y World Wide Node Name (WWNN). En todos los casos, estamos hablando de direcciones, que nos ayudarn en la identificacin de los diferentes dispositivos y elementos de una red de almacenamiento SAN basada en Fiber Channel.

Antes de continuar, es importante introducir los conceptos de World Wide Name (WWN), World Wide Node Name (WWNN), y World Wide Port Name (WWPN). Vamos a empezar con el World Wide Name (WWN).
y

World Wide Name (WWN). Un World Wide Name (WWN) o World Wide Identifier (WWID) es un identificador nico dentro de una red de almacenamiento SAN, es decir, es una direccin de 64-bit para identificar elementos en una red Fiber Channel (FC), similar a una direccin MAC.

Hasta aqu bien, pero claro, esta definicin es como algo genrica Verdad? Lo nico que nos dice, es que un WWN es una direccin, y ya est. Bien, el truco, ahora es introducir los conceptos World Wide Node Name (WWNN), y World Wide Port Name (WWPN).
y

World Wide Port Name (WWPN). Un World Wide Port Name (WWPN) es un World Wide Name (WWN) asignado a un puerto de fibra en una red de almacenamiento SAN, similar a lo que es una direccin MAC en una red Ethernet. World Wide Node Name (WWNN). Un World Wide Node Name (WWNN) es un World Wide Name (WWN) asignado a un Nodo o Dispositivo Fiber Channel (FC) de una red de almacenamiento SAN.

Como consecuencia de lo anterior, un Servidor (Windows, UNIX o Mainframe) habitualmente tendr varios puertos de fibra, cada uno con su WWPN, y adems, el propio Servidor como Dispositivo, tendr su propio World Wide Node Name. Lo mismo ocurre con el resto de Dispositivos Fiber Channel (FC) de la red de almacenamiento SAN, como es el caso de las Cabinas de Almacenamiento y las Libreras de Cintas.
y

Switch Zoning y LUN Masking Dos aspectos muy importante en la gestin del Almacenamiento SAN, son Switch Zoning y LUN Masking. Ahora, despus de todo lo visto en este artculo, es quizs el mejor momento para introducir los conceptos de Zoning y LUN Masking, as como los distintos tipos de Zoning: Zoning por Software (Soft Zoning) y Zoning por Hardware (Hard Zoning). Zoning por Puerto (Port Zoning) y Zoning por Nombre (Name Zoning). Qu es Zoning? Qu es LUN Masking? Sigue leyendo.

Las configuraciones de Zoning y Masking son bsicas en las redes de almacenamiento SAN basadas en Fiber Channel (FC), y a estas alturas ya sabemos que es una LUN, tenemos cierta idea de que es una red de Almacenamiento SAN y qu elementos dispone, sabemos que es una HBA, etc., es el mejor momento para dar una explicacin de lo que es el Zoning y Masking.
y

Zoning (o Switch Zoning). Los conmutadores o switches Fiber Channel (FC), permiten segmentar sus puertos en diferentes Zonas, de forma similar a como ocurre con las VLAN en los conmutadores o switches Ethernet, de tal modo, que cada dispositivo slo podr comunicarse con el resto de dispositivos de su zona. Es importante tener en cuenta que cada puerto de fibra puede ser miembro de mltiples Zonas. Ojo, que esto es una diferencia importante con VSAN (Virtual SAN o redes virtuales SAN), ya que cada puerto de fibra slo puede pertenecer a una VSAN. Existen principalmente dos mtodos de Zoning, por Hardware y por Software. As, el Zoning por Software (Soft Zoning) se restringe el acceso por nombre, sin embargo, cualquier servidor podr acceder a cualquier dispositivo por su direccin de red. Por el contrario, el Zoning por Hardware (Hard Zoning) restringe las comunicaciones en los switches a travs de filtrado de tramas, resultando mucho ms seguro que el Zoning por Software. Del mismo modo, suelen emplearse con dos tipos de atributos, el Puerto y el World Wide Name (WWN). As, el Zoning por Puerto (Port Zoning) permite restringir a un puerto de un Switch, con que otros puertos puede comunicarse (suele requerir que todos los Switches sean del mismo fabricante). Por el contrario, el Zoning por Nombre (Name Zoning) restringe el acceso entre dispositivos en funcin del World Wide Name (WWN), resultando mucho ms flexible aunque ms inseguro que el Zoning por Puerto (Port Zoning). Habitualmente, las redes de almacenamiento SAN suelen particionarse en mltiples Zonas, por motivos de Seguridad (evitar accesos indebidos), evitar interferencias (que podran generar problemas en el almacenamiento) y facilitar la gestin. Todo dispositivo conectado a una red de almacenamiento SAN, debe poder acceder slo a los puertos y dispositivos que necesita utilizar, para lo cual se configurarn las correspondientes Zonas en los Switches Fiber Channel (Switching Zoning). En consecuencia, es posible que mltiples Servidores sean mapeados al mismo puerto de la Cabina de Almacenamiento (o de la Librera de Cintas), del mismo modo, que es posible que un nico Servidor sea mapeado a mltiples puertos de las Cabina de Almacenamiento (o de la Librera de Cintas). Como puede observarse, se trata de una configuracin de los switches de Fiber Channel, que trabaja en el Nivel 2 de Fiber Channel.

LUN Masking. Permite restringir que Servidores (Windows, UNIX o Mainframe) o Hosts, pueden acceder a una determinada LUN (disco virtual) en una Cabina de Almacenamiento. En consecuencia, podemos ver el LUN

Masking, como una configuracin o proceso de Autorizacin y Seguridad dentro de la red de almacenamiento SAN, y en particular, en las Cabinas de Almacenamiento, que trabaja en el Nivel 4 de Fiber Channel. De lo visto anteriormente, cuando hablamos del Switch Zoning, podemos inferir que a un puerto de una Cabina de Almacenamiento pueden acceder mltiples Host o Servidores (Windows, UNIX o Mainframe). Bien, no es que podamos inferirlo, es que en la prctica es as en la mayora de las empresas, de tal modo que cada puerto de fibra de una Cabina de Almacenamiento, puede estar dando servicio a decenas de Host o Servidores. Llegados a este punto, si a travs de un puerto de la Cabina de Almacenamiento, estamos exponiendo mltiples LUN a mltiples Host o Servidores Cmo podemos garantizar que cada Host o Servidor slo pueda ver las LUN o discos virtuales que le corresponden, a travs del Puerto de la Cabina de Almacenamiento al que est conectado? Bien, pues para eso, est el LUN Masking. As, si una LUN no es asignada o presentada por la Cabina de Almacenamiento a un Host o Servidor especfico, este no podr acceder a dicha LUN (no tendr visibilidad). En el caso de servidores en Cluster, como es el caso de Microsoft Cluster (MSCS), es necesario que todos los Servidores miembros del mismo Cluster tengan visibilidad sobre todos los discos compartidos (perdn, las LUN), tarea de configuracin que tambin realizaremos a travs de LUN Masking. LUN Masking nos va a permitir que una LUN (o un grupo de LUNs) en un puerto de la Cabina de Almacenamiento, sea mapeada a un WWN (o a un grupo de WWN, en el caso de un Cluster). LUN Masking se implementa de diferentes formas, en funcin del fabricante. As, EMC implementa LUN Masking como parte del Volume Logix database, mientras HDS implementa LUN Masking utilizando Host Storage Domains. En la prctica, Switch Zoning y LUN Masking suelen utilizarse en conjunto. En consecuencia, para que un Host o Servidor (Windows, UNIX, o Mainframe) pueda acceder a una LUN (disco virtual) de una Cabina de Almacenamiento, ambos deben pertenecer a la misma Zona (Switch Zoning), y adems la Cabina de Almacenamiento debe permitir el acceso de dicho Host o Servidor a dicha LUN (LUN Masking).
y

iSCSI, FCIP e iFCP: TCP/IP y las redes SAN extendidas geogrficamente Este captulo est dedicado a las tecnologas FCIP (Fiber Channel over IP) e iFCP (Internet Fiber Channel Protocol), como medios para extender geogrficamente las redes de almacenamiento SAN, aprovechando tecnologas basadas en TCP/IP. Tambin dedicaremos otra parte a la tecnologa iSCSI (Internet Small Computer System Interface), donde hablaremos sus ventajas y trminos como Initiator, Target, IQN (iSCSI Qualified Name), TOE (TCP Offload Engine), HBAs iSCSI, etc.

A estas alturas del artculo, ya hemos visto la parte quizs ms importante de las tecnologas y conceptos de Almacenamiento que quera tratar, aprovechando ahora para

tratar otras tecnologas como es el caso de FCIP (Fiber Channel over IP) e iFCP (Internet Fiber Channel Protocol), quizs las principales alternativas para extender geogrficamente una red de almacenamiento SAN, a travs de tecnologas basadas en TCP/IP (las LAN, MAN y WAN).
y

FCIP (Fiber Channel over IP). Tambin conocido como Fiber Channel Tunneling o Storage Tunneling, se trata de una tecnologa basada en IP y desarrollada por el IETF, que permite la transmisin de tramas Fiber Channel (FC) sin modificar (ya sean FCP o SCSI) a travs de tneles IP, con el objetivo de facilitar la extensin geogrfica de las redes de almacenamiento SAN (redes de almacenamiento geogrficamente dispersas) a travs de redes LAN, MAN o WAN. Para ello se utilizan equipos conversores (Edge Devices FCIP Gateways) situados en la periferia de cada una de las redes SAN que se desean intercomunicar, de tal modo que dichos dispositivos, se limitarn a encapsular y reenviar las tramas FC (Fiber Channel) via TCP/IP (a travs de un Tunel IP), de forma transparente. FCIP confa la gestin de errores y la recuperacin ante fallos, tanto en TCP/IP como en Fiber Channel (FC). Evidentemente, se mantiene la duda de si los niveles de disponibilidad y servicio de la red SAN podrn ser mantenidos a travs de la red IP (LAN, MAN WAN) utilizada. Gracias a la combinacin de redes IP y redes SAN, es posible interconectar mltiples redes de almacenamiento SAN a travs de distancias mucho mayores y con menores costes, que trabajando slo con Fiber Channel, dando lugar a las redes de almacenamiento SAN-to-SAN. Es decir, gracias a FCIP, es posible unir dos redes de almacenamiento SAN fsicamente separadas, es una nica y unificada red de almacenamiento SAN.

iFCP (Internet Fiber Channel Protocol). Se trata de una tecnologa basada en IP ratificada por el IETF, que permite la transmisin de las capas superiores de tramas Fiber Channel (FC) a travs de una red IP, con el objetivo de facilitar la extensin geogrfica de las redes de almacenamiento SAN (redes de almacenamiento geogrficamente dispersas) a travs de redes LAN, MAN o WAN. Para ello se utilizan equipos conversores (iFCP Gateways) situados en la periferia de cada una de las redes SAN que se desean intercomunicar. Las conexiones Fiber Channel (FC) son finalizadas en el Gateway local, quin establece una conexin TCP/IP con el Gateway remoto, el cual vuelve a iniciar conexiones Fiber Channel (FC), pero en este caso en la red SAN externa. De este modo, los dispositivos de una red Fiber Channel de almacenamiento SAN, que deseen comunicarse con dispositivos remotos de otra red SAN, debern comunicarse a travs de Fiber Channel con el Gateway local (no con el dispositivo remoto), y as unir dos redes de almacenamiento SAN fsicamente separadas. Una caracterstica especial de iFCP, es que mapea direcciones IP a dispositivos Fiber Channel (FC) especficos de la red de almacenamiento SAN. Adems,

TCP es el responsable de gestionar la congestin, deteccin de errores y recuperacin ante fallos. Como puede verse, FCIP (Fiber Channel over IP) e iFCP (Internet Fiber Channel Protocol) son protocolos muy parecidos, cuyo objetivo es la extensin de las redes de almacenamiento SAN, y cuya principal diferencia radica en el mtodo elegido para cumplir su objetivo: FCIP utiliza Tunneling mientras iFCP utiliza Routing. Ahora llega el momento de hablar de iSCSI (Internet Small Computer System Interface), la alternativa a Fiber Channel, una tecnologa para m bastante atractiva, cara a poder construir mi propia red de almacenamiento SAN en entornos de Laboratorio y sin asumir los costes de Fiber Channel. En la prctica, en los entornos empresariales, iSCSI se mantiene como la eterna promesa, y es que a fecha de hoy las empresas siguen apostando por las soluciones de almacenamiento SAN basadas en Fiber Channel, aunque cada vez son ms las Cabinas de Almacenamiento que vienen con interfaces Fiber Channel e iSCSI, ambos incluidos para poder elegir la tecnologa de transporte que ms nos interese para cada Host.
y

iSCSI (Internet Small Computer System Interface). Se trata de un standard de almacenamiento basado en IP y desarrollado por el IETF (), que permite el envo de comandos SCSI a travs de redes IP (LAN, MAN o WAN). Habitualmente iSCSI utiliza los puertos TCP-860 y TCP-3260. En consecuencia, iSCSI permite implementar redes de almacenamiento SAN basadas en TCP/IP (sin utilizar Fiber Channel - FC), de tal modo que se minimizan los costes (es posible reutilizar los dispositivos de red de la LAN, como switches y routers, funcionando as sobre la infraestructura de red existente), y se facilitan las comunicaciones de larga distancia y la extensin de la red SAN (ej: interconexin de redes SAN remotas, por ejemplo, en DataCenter geogrficamente distribuidos, Clusters Geogrficos o GeoClusters, etc.), que en el caso de redes de almacenamiento SAN Fiber Channel requiere de recurrir a tecnologas como FCIP o iFCP. As, el protoco iSCSI permite que los clientes (denominados initiators) enven comandos SCSI a los dispositivos de almacenamiento (denominados targets), es decir, facilita el intercambio de comandos SCSI a travs de IP. Es importante tener en cuenta que los clientes iSCSI (iSCSI initiators) pueden utilizar tarjetas de red Ethernet convencionales. Sin embargo, es ms conveniente que utilizar tarjetas de red Ethernet con TOE (TCP Offload Engine). Sin embargo, Qu es TOE (TCP Offload Engine)? TOE es una caracterstica de las tarjetas de red ethernet (hoy en da ya incluida en la mayora) que libera a la CPU del equipo cliente de la realizacin de ciertas tareas propias del protocolo TCP/IP, de tal modo, que dichas tareas sern realizadas por la tarjeta de red TOE (es como las aceleradoras grficas, pero aplicado a las tarjetas de red Ethernet). En el caso de utilizar tarjetas de red Ethernet con TOE (TCP Offload Engine), la CPU del equipo cliente sigue realizando las tareas de conversin de iSCSI. Por ltimo, sera an ms conveniente utilizar tarjetas HBA iSCSI, de tal modo que se libere a la CPU del equipo cliente (iSCSI initiator) tanto del procesamiento iSCSI como de

procesamiento propio de TCP/IP, mejorando as el rendimiento. En iSCSI, en vez de utilizar WWN, se utilizan direcciones IP y nombres iSCSI (iSCSI Qualified Name IQN). Los nombres IQN tiene el formato iqn.yyyymm.{reverse domain name}. Es posible utilizar Targets iSCSI por Hardware o por Software. En principio, las soluciones SAN basadas en iSCSI por Hardware (ej: soluciones de HP, EMC, etc.) ofrecern un mejor rendimiento. Sin embargo, las soluciones SAN basadas en iSCSI por Software, permitirn implementar soluciones SAN basadas en iSCSI muy sencillas, ideales para entornos de laboratorio y pruebas, as como con carcter didctico. Como ejemplos de Target iSCSI por Software, podemos hablar de Microsoft Windows Storage Server 2008 y Microsoft iSCSI Target y de otras soluciones basadas en Linux como iSCSI Enterprise Target (IET) u OpenFiler (una distribucin de Linux que monta IET), por citar algunas soluciones de almacenamiento iSCSI por Software. Las principales diferencias entre iSCSI y Fiber Channel, es que con iSCSI se est trabajando directamente con TCP/IP, hecho que facilita la extensin geogrfica de la red de almacenamiento SAN, evitando tener que utilizar tecnologas como FCIP e iFCP. Adems, con iSCSI puede aprovechar la electrnica de red de las redes LAN, MAN y WAN corporativas, evitando as la inversin en una nueva infraestructura de red (y su mantenimiento, que requerir de personal especializado). Lo mismo ocurre con las HBA, pudiendo utilizarse tarjetas de red Ethernet (recordemos que actualmente la mayora son de Gigabit e incorporan TOE). Insisto, para mi iSCSI es una tecnooga muy atractiva, aunque de momento no deja de ser la eterna promesa. Virtualizacin del Almacenamiento (Storage Virtualization)

La Virtualizacin es una tcnica, ms que una tecnologa, actualmente aplicada a distintas reas de la informtica, consistente en independizar al software del hardware (el almacenamiento lgico del almacenamiento fsico). La Virtualizacin del Almacenamiento (Storage Virtualization) permite que mltiples sistemas de almacenamiento parezcan un nico sistema de almacenamiento lgico (consolidacin) de forma transparente, aunque tambin puede permitir que un sistema de almacenamiento parezca varios (particionamiento) en funcin de las necesidades (criticidad, rendimientos, etc.) de los Host que consuman cada particin. Existen distintas formas de Virtualizacin del Almacenamiento (Storage Virtualization). As, una LUN es un ejemplo de Virtualizacin del Almacenamiento. En una Cabina de Almacenamiento creamos un Grupo de Recursos (Storage Pool) en un nivel RAID determinado (ej: RAID1, RAID5, etc.), al que agregamos un conjunto de discos fsicos. Seguidamente, sobre dicho Grupo de Recursos (Storage Pool) creamos una LUN, y asignamos permisos a un Host (LUN Masking), y finalmente, el Host a travs de su HBA es capaz de ver la LUN como si se tratase de un disco local (una ilusin ptica, cual osasis en el desierto ;-). A travs de la Virtualizacin del Almacenamiento (Storage Virtualization) se pretende:

y y y y y

Facilitar la creacin y movilidad de discos lgicos entre Cabinas de Almacenamiento. Facilitar la creacin de redes virtuales de almacenamiento (VSAN). Facilitar la redundancia en el acceso a los discos lgicos, de forma transparente. Minimizar el consumo elctrico y de refrigeracin, gracias a la optimizacin de los recursos de almacenamiento. Organizacin ptima de los recursos de almacenamiento: Grupos de Recursos (Storage Groups) con discos rpidos, fiables y caros para los entornos crticos, y otros con discos lentos y baratos para entornos menos crticos, backups, etc.

Actualmente, hablar de la Virtualizacin del Almacenamiento (Storage Virtualization) implica hablar de redes de almacenamiento SAN. Sin embargo, tambin se puede aplicar a discos locales a travs de sistemas de Gestin de Volmenes (Volume Manager) que facilitan la creacin de volmenes lgicos en base a particiones o trozos de los discos fsicos, con el objetivo de facilitar la ampliacin de espacio de dichos volmenes lgicos agregndoles nuevas particiones del mismo o distintos discos fsicos. Actualmente, existen entornos en los cuales se utilizan sistemas de Gestin de Volmenes (Volume Manager), utilizando particiones de discos locales (DAS) o remotos (SAN). La Gestin de Volmenes (Volume Manager) es quizs el primer paso que se dio en lo referente a la Virtualizacin del Almacenamiento (Storage Virtualization). Tambin podemos hablar de Virtualizacin del Almacenamiento (Storage Virtualization), en el caso de las antiguas Cabinas de Almacenamiento locales, que se conectaban a travs de conexiones SCSI, sobre las cuales se agrupabaman mltiples discos fsicos formando uno o varios RAID, sobre los que se creaban los discos lgicos que utilizaban los Sistemas Operativos de los Host a los que estaban conectadas. Cabe destacar, el caso de las Cabinas de Almacenamiento para entornos de Clustering, las cuales, estaban dotadas de dos o ms conexiones SCSI (una para cada Nodo del Cluster). Sin embargo, el ms reciente y pontente sistema de almacenamiento se encuentra en las redes de almacenamiento SAN: la externalizacin del almacenamiento, separar el almacenamiento de los Host, y centralizarlo en una o mltiples Cabinas de Almacenamiento. Algunos fabricantes como IBM, diferencian entre:
y

Virtualizacin In-Band. Toda la informacin entre el Host y el Almacenamiento, pasa a travs del sistema virtualizador. No necesita software adicional en el Host (en todo caso, software MPIO o similar) pero existe el riesgo de cuello de botella. Virtualizacin Out-Of-Band. El sistema virtualizador no est en la ruta o camino entre entre el Host y el Almacenamiento, evitando as actuar como cuello de botella, pero por el contrario requiere de software o hardware especfico (ej: HBA espcficas).

Por ltimo, aprovecho a incluir esta breve teora relativa a los tipos de acceso a sistemas de Virtualizacin del Almacenamiento (Storage Virtualization):
y

Acceso a Disco por Bloques (entornos SAN). Tres mtodos posibles:

En Servidor. Requiere de un software en el Host, que sea quien sirva las peticiones de acceso a disco (virtuales), reenvindolas a los dispositivos deseados (reales). Requiere de dicho software y consume ciclos de CPU. o En Red. Requiere de unos Switches inteligentes, que sustituyan en las tramas de red la direccin de las Cabinas de Almacenamiento originales (virtuales), por las deseadas (reales). o En Cabina. La Cabina de Almacenamiento que recibe las peticiones del Host (la cual acta siempre como destino o virtual), las reenva a la Cabina de Almacenamiento que realmente contiene los datos (real). Acceso a Disco por Ficheros (entornos NAS). Los Host utilizan un dispositivo NAS (virtual), el cual reenva las peticiones a los dispositivos NAS que tienen los datos (reales). Acceso a Cintas. Permite simular una Librera de Cintas utilizando Almacenamiento en Disco (ms rpido), que posteriormente puede ser volvado a Cintas reales. Tres mtodos posibles: o En Servidor. Un software en el Host, reenva las peticiones de cinta (virtuales) a discos (reales). o En Appliance. Un hardware de red (virtual), sin cintas ni discos, reenva las peticiones a discos de la red SAN. o En dispositivo virtualizador. Similar al caso de Appliance, pero el dispositivo incluye almacenamiento local, cach, posibilidades de gestin y replicacin de datos, etc.
o

Y hasta aqu llega el contenido del presente artculo, dedicado en completo a las tecnologas, protocolos y arquitecturas de almacenamiento, y en especial a la redes de almacenamiento SAN, Fiber Channel e iSCSI.

Vous aimerez peut-être aussi