Vous êtes sur la page 1sur 5

CLUSTERING Y GRID COMPUTING EN SISTEMAS

DE ALTA DISPOBILIDAD PARA SERVICIOS WEB Y


MAIL
Aguilera, Pablo.
pabloaav@gmail.com
Universidad de las Fuerzas Armadas ESPE
Estevan Gmez
ergomez@espe.edu.ec
Universidad de las Fuerzas Armada ESPE

Resumen En base a las tendencias mundiales, se debe Se realiza esta investigacin buscando conocer el estado del
conocer las ventajas y desventajas presentes en las tecnologas arte de clustering y grid computing, validando las ventajas y
clustering y grid computing, para alcanzar una alta desventajas de cada tecnologa, considerando los elementos que
disponibilidad en los principales servicios empresariales, que lo conforman, la clasificacin y su arquitectura; analizando
permitan lograr los objetivos organizacionales tanto en la cada una de sus caractersticas permitira al lector estimar con
productividad, la integridad, disponibilidad y confiabilidad de mayor fundamento el tipo de infraestructura que colaborara al
la informacin. Para lograrlo se revisan los principales desarrollo empresarial.
conceptos y caractersticas, buscando direccionar al lector el Existen muchas empresas dedicadas a proporcionar servicio
tipo de tecnologa que se adapta a sus necesidades y as sacar en cloud pero en vista que es un servicio que poco a poco se
provecho a los servicios web y mail de la empresa. est haciendo conocer, an no es aceptado en su totalidad a
nivel empresarial, ya que los servidores no estn fsicamente
Index Terms Clustering: Es un conjunto de computadoras ubicados en sus propias instalaciones.
interconectadas que funcionan en conjunto usando el poder de Un aspecto fundamental que se debe considerar con mucha
cmputo de varios procesadores para resolver transacciones seriedad, es el tema de los contratos para saber lo que cada
complejas. empresa ofrece y la responsabilidad que tienen en ambas partes
Grid computing: Es la comparticin de potencia de (contratante contratado). Adicionalmente se puede utilizar el
procesadores, aprovechando los ciclos de procesamientos no
utilizados de cada nodo de la Grid.
mismo servicio de internet para evaluar las puntuaciones o
calificaciones que se han otorgado a la empresa a evaluar.
Abstract Based on global trends , one must know the
Si luego del anlisis an no se obtiene un consenso de los
directivos de la empresa, es recomendable analizar la
advantages and disadvantages present in the clustering
posibilidad de realizar una implementacin interna, y para ello
technologies and grid computing to achieve high availability in
en el presente artculo se indica los conceptos principales y
major business services, which will achieve the organizational
caractersticas a considerar.
objectives both productivity , integrity , availability and
Debido a las mltiples transacciones que se requieren en los
reliability of the information . To achieve the main concepts and
sistemas actuales, tenemos la necesidad de cada vez contar con
characteristics are reviewed, addressing the reader looking for
equipos cada vez ms potentes, por ello se puede encontrar las
the kind of technology that adapts to your needs and take
llamadas sper computadoras, que no son ms que equipos que
advantage of Web services and mail company.
cuentan con sper procesadores que permiten tener un menor
.
tiempo de respuesta incluso con clculos muy demandantes.
Una gran cantidad de empresas ya cuentan con sistemas
I. INTRODUCCIN
transaccionales orientados a la web, y utilizan en gran magnitud
Con el cambio de tecnologa actual, que cada momento los servicios mail precisamente para tener una comunicacin
requiere el manejo de informacin de forma remota, pero casi en tiempo real, sin necesidad de tener la necesidad de pasar
manteniendo la confiabilidad y la integridad de la misma, se ve cada segundo del tiempo laboral en las oficinas.
la necesidad de conocer sobre los servicios en cloud,
balanceando la carga y desarrollando infraestructuras que II. MATERIAL Y MTODOS
permitan tener alta disponibilidad, alcanzando un grado muy
alto de continuidad operacional y reduciendo al mnimo el 2.1 Marco Terico
tiempo en el cual el sistema no est disponible.
Un cluster es un conjunto de computadoras, construidas
mediante la utilizacin de componentes de hardware que se
comportan como si fuera una sola computadora. [6]
Este trabajo se realiz para titulacin en la Maestra de Gerencia en Sistemas
de la Universidad de las Fuerzas Armadas - ESPE. Da a da las tecnologas clster siguen evolucionando
apoyando a las aplicaciones de sper cmputo, software de
misiones crticas, servidores web, comercio electrnico, bases
de datos de alto rendimiento, entre otros.
En sus inicios clustering aparece como resultado de varias
tendencias actuales, basndose en la disponibilidad de
microprocesadores econmicos de alto rendimiento, redes de
alta velocidad y la creciente necesidad potenciar las
aplicaciones, a partir de ah incluso ya nace una nueva
terminologa denominada clster HA.
Un cluster HA (High Availability) es un sistema orientado a
ofrecer y garantizar servicios de alta disponibilidad,
entendiendo por ello que alcanza un grado alto de fiabilidad y
la respectiva continuidad de las operaciones.
Fig. 1. Elementos de un cluster
El cluster HA debe ser capaz de detectar cualquier fallo de
hardware y software, reiniciar la aplicacin en otro nodo y B. CLASIFICACIN DE SISTEMAS
mantener el servicio sin intervencin de un operador, Su clasificacin radica en las mejoras de prestaciones que se
garantizando la integridad de los datos. desea conseguir, y es as:
Pero finalmente el clustering presenta una desventaja, ya que Sistemas de alta disponibilidad (HAS High Availability
como veamos en la descripcin son un grupo de mquinas Systems), donde garantiza que el servicio siempre est activo,
interconectadas pero adicionalmente ests estn dentro de una por medio de la tolerancia a fallos.
red LAN, y al existir nuevos requerimientos y nuevas Sistemas de alto rendimiento (HPC High Performance
necesidades, aparece un nuevo trmino, Grid Computing. Computing), se busca alcanzar una potencia de cmputo mayor,
El concepto de grid computing hace referencia a tecnologas es decir, ejecutar trabajos pesados en menor tiempo.
de computacin distribuida, en la cual primeramente ya se Sistemas de alto aprovechamiento (HTS High Troughput
orienta a redes WAN, permitiendo que los recursos de varios Systems), donde el nmero de tareas resueltas sea el mximo
ordenadores resuelvan necesidades existentes, por medio de un posible, maximizando el uso de recursos para servir a ms
intercambio colaborativo y sobre todo utilizando de forma clientes. [7]
ptima los tiempos inactivos de los procesadores.
Por otro lado actualmente se intenta minimizar los gastos de C. CLASIFICACIN DE LOS CLUSTER
actualizacin de hardware y software de los equipos Se clasifican en base a sus caractersticas:
informticos, debido al mejoramiento continuo de la tecnologa Cluster de alto rendimiento (HPC High Performance
que a su vez requiere una mayor capacidad incluso de Cluster), son cluster en los cuales se ejecutan tareas que
almacenamiento. Utilizado la tecnologa de grid computing e requieren una gran capacidad transaccional, alto
integrndola al cloud se lograra una mejora sustancial en la requerimiento de memoria o ambas a la vez.
capacidad de procesamiento y almacenamiento sin necesidad de Cluster de alta disponibilidad (HAC High Availability
mquinas locales, acceso seguro a la informacin desde Cluster), su objetivo es proveer disponibilidad y
cualquier lugar, innovacin constante, entre otros. confiabilidad, La confiabilidad se provee mediante un
software que detecta fallos y permite recuperarse frente a
ellos, mientras que en hardware se evita tener un nico punto
de fallo.
A. ELEMENTOS QUE FORMAN PARTE DE UN CLUSTER
Cluster de alta eficiencia (HTC High Throughput
Cluster), el objetivo es ejecutar la mayor cantidad de tareas en
Los elementos con los que cuenta un cluster son: el menor tiempo posible, el retardo entre los nodos del cluster
no es considerado un gran problema. [5]
Nodo activo (donde corren los servicios) Balanceo de carga, cluster que permite que un conjunto de
Nodo pasivo (backup) servidores compartan la carga de trabajo y de trfico a sus
Servidores reales clientes. Las caractersticas de este cluster son: ampliar su
Software de administracin capacidad fcilmente aadiendo ms ordenadores y ante la
Protocolos de comunicacin y servicios cada de uno de los servidores, por ms que el servicio se vea
Conexiones de red mermado, el sistema seguir funcionando. [1]
Ambientes de programacin paralela D. ARQUITECTURA DE LOS GRID
Middleware. [2]
Se describe la arquitectura Grid en trminos de capas donde
cada una proveer funciones especficas. Las capas ms altas
de esta estructura se orientan ms a la relacin directa ocn el
usuario, mientras las de nivel ms bajo se aproximan al
hardware (computadores, redes).
Fig. 2. Arquitectura de capas en Grid
Fig. 3. Sistemas de Computacin

A diferencia de los cluster como ya se haba mencionado


Esta tecnologa brinda a las empresas el beneficio de la
anteriormente, los nodos de la grid pueden estar en cualquier
velocidad, lo que supone una ventaja competitiva, con lo cual
parte del mundo.
se provee una mejora en los tiempos para la produccin de En un cluster se busca el rendimiento de los nodos
nuevos productos y servicios. englobndolos en uno solo, en cambio en un grid el resultado
El paralelismo puede ser considerado un problema en base obtenido engloba de las mquinas de una supercomputadora.
a los equipos paralelos son muy costosos, pero se puede
generar el mismo procedimiento utilizando un conjunto de
mquinas heterogneas de pequeo o mediano porte, cuya III. EVALUACIN, VALIDACIN Y VERIFICACIN
potencia sumada sea considerable, lo que permite tener DE RESULTADOS
sistemas de najo costo y alta potencia.
3.1 Evaluacin y Discusin de Resultados

E. CLASIFICACIN DE LOS GRID Al existir mltiples empresas que actualmente ofertan este
En base a sus caractersticas se puede clasificar a los grid tipo de servicios, se debe considerar ciertos parmetros que
nos ayuden a elegir:
dependiendo de su enfoque:
Escalabilidad: Conocer el grado de escalabilidad que me
permite, ya que la idea principal no es tener los
INTRAGRID: Que est enfocado a una misma empresa, supercomputadores de los cuales solo utilizaremos el 10%, al
con recursos heterogneos, utilizando redes LAN y por tanto contrario es poder utilizar los equipos en base a nuestras
contando con menores problemas de seguridad y por ende necesidades, y de modificar las mismas la escalabilidad sea
tambin menores problemas de confiabilidad. prcticamente transparente.
Precios y Costos: Este punto est relacionado con la
INTERGRID: Su enfoque es a mltiples empresas, escalabilidad, ya que segn vamos necesitando mayores
requiere mltiples dominios administrativos, utiliza la recursos vamos solicitando y por ende incrementa el valor, a
interconexin WAN, desde este punto la seguridad es un diferencia de tener contratado un servidor dedicado, al cual
asunto de mucha importancia, y comienzan a aparecer posiblemente nunca lo utilicemos en su totalidad.
problemas de confiabilidad. Administracin de la infraestructura que te pertenece:
existen empresas que incluso ofrecen un servicio de
administracin y por ende est incluido en el costo, mientras
que otras no ofrecen este servicio, lo que implica que el
F. DIFERENCIAS Y SIMILITUDES ENTRE LAS DOS contratante es el encargado las mquinas virtuales alojadas
TECNOLOGAS en la nube.
Las dos tecnologas en anlisis son aplicadas en sistemas Alta disponibilidad: Al no depender directamente del
distribuidos, la principal diferencia la podemos visualizar en hardware, los fallos fsicos se reducen ostensiblemente, y la
la Fig. 3 donde se encuentra que los cluster estn ms empresa que ofrece el servicio debe indicar los planes contra
enfocados a un control y administracin centralizada, desastres que tengan establecidos.
mientras que los grid prcticamente se adapta tanto en Rendimiento: Este punto se lo debe evaluar en base al
centralizado como a descentralizado, siendo su ms requerimiento del negocio, ya que una empresa que tena su
importante aplicacin de modo descentralizado. [11] servidor dedicado y cambia de esquema si va a sentir una
diferencia precisamente porque el hardware dedicado es
100% designado, mientras que en cloud se considera el tener
una parte del pastel.
Seguridad y privacidad: Como en puntos anteriores se
indicaba existe mucha controversia al sacar las aplicaciones
a la nube en lugar de mantenerlas en equipos fsicos, por ello
se debe conocer las polticas y niveles de seguridad, ya que IV. TRABAJOS RELACIONADOS
en muchos de los casos es casi imposible conocer fsicamente Al finalizar la lectura podemos realizar prcticas de
las instalaciones que nos ofrecen el servicio y estn al otro laboratorio para validar los conceptos revisados, uno de los
lado del mundo en algunos casos. primeros trabajos propuestos es realizar un clustering debido
A. CONFIGURACIONES EJEMPLO DE CLUSTER DE a la facilidad y flexibilidad, utilizando la misma configuracin
ALTA DISPONIBILIDAD de hardware y sistema operativo (cluster homogneo),
diferente rendimiento pero con arquitecturas y sistemas
Existen mltiples programas para poder realizar el cluster
operativos similares (cluster semi-homogneo), o tener
requerido, incluso depende del S.O. de los servidores que
diferente hardware y sistema operativo (cluster heterogneo).
utilicemos. Como nuestro enfoque es hacia la alta
disponibilidad, vamos a indicar los elementos utilizados en Adems es recomendable para facilidad de comunicacin y
un proyecto de Debian GNU/Linux denominado acceso, sistemas operativos como GNU/Linux, Mac OS X o
Windows NT/2000/2003 Server.
UltraMonkey, es un proyecto que utiliza diferentes
Al sincronizar as los equipos se puede validar el tiempo
herramientas de Software Libre y busca conseguir el
de respuesta sobre todo en transacciones complejas, para ello
balanceo de carga y alta disponibilidad que es lo que
incluso se debe realizar un pequeo programa en cualquier
buscamos en el cluster de estudio.
La integracin de las herramientas no permiten apuntalar lenguaje que necesite un procesamiento especial.
el enfoque del cluster por ello podemos ver las
caractersticas principales de cada una, iniciando con LVS V. CONCLUSIONES Y TRABAJO FUTURO
(Linux Virtual Server), por medio de este programa Este tipo de tecnologas proveen una alta disponibilidad en
podemos realizar un parche al kernel de Linux y lograr que respuesta a solicitudes complejas, pero se debe identificar
sea nuestro balanceador de carga, ya que permite balancear correctamente cual se debe utilizar e incluso si la
muchos protocolos distintos, adems que trabaja con las infraestructura se la adquiere in-house o se la alquila.
mayora de protocolos como HTTP, HTTPS, Telnet, FTP, En las tecnologas grid se debe considerar el no aplicarlas
etc. en aplicaciones paralelas con muchos interprocesadores de
HearBeat es una herramienta que se debe integrar con comunicacin, aplicaciones con muchas interdependencias
LVS para aumentar la disponibilidad, debido a que funciona entre trabajos y aplicaciones sin protocolos de red estndar.
enviando peridicamente un paquete, que si no llegara, Un cluster implementado, representa varios beneficios
indicara que un servidor no est disponible, cuando un entre otros encontramos la disponibilidad por la redundancia
ordenador se lo considera muerto se hace una transicin
del hardware, el sistema operativo y las aplicaciones;
en el cluster; el problema de esta herramienta es puede
escalabilidad mediante la incorporacin de nuevos servidores
provocar colisiones con los trficos que vayan por la misma
o cluster en la red; alto rendimiento y alta productividad.
red.
Ldirectord trabaja con las dos herramientas anteriores, y Cabe recalcar que las tecnologas mencionadas tambin
su funcin es censar por medio del envo de una cadena url presentan ciertas desventajas que se han venido hablando
conocida y comprobando que la respuesta contenga una durante el documento, por lo mismo la recomendacin es la
cadena concreta y as verifica que los servidores principales de siempre evaluar las necesidades empresariales, y las
estn en lnea. caractersticas de cada tecnologa y de esta forma verificar el
MON (Service Monitoring Service) este software nos costo beneficio.
permite definir diferentes alarmas y acciones a tomar Se puede mencionar que grid computing, es un paradigma
cuando un servicio deje de funcionar, son programas de sistemas distribuidos, que nos permite combinar la
escritos en Perl que se puede configurar el monitoreo y la potencia de muchos computadores y otros equipos para
frecuencia y adems las acciones especficas en base a las alcanzar una alta disponibilidad. Pero con ciertas
alertas. [12] complicaciones que provienen de la difcil sincronizacin de
B. CONFIGURACIONES EJEMPLO DE GRID los distintos procesos de todos los equipos, controlando los
COMPUTING DE ALTA DISPONIBILIDAD recursos, asignando las distintas cargas de trabajo e
incluyendo las polticas de seguridad.
Para el middleware de Grid, Globus Toolkit, se identific
como una de las herramientas ms completas, su
documentacin tanto de implementacin, como de AGRADECIMIENTO
configuracin, administracin y uso, se encuentra en El ms grato reconocimiento a las personas que da a da
diferentes idiomas y ambientes de desarrollo. investigan y generan nuevos modelos tecnolgicos para cubrir
Nos permite manejar la gestin de recursos, los servicios las necesidades que se presentan da a da, y principalmente
de informacin y monitorizacin, as como la gestin de en el caso de la seguridad informtica.
traslado de datos. Adems incluye un software relacionado El poder aportar por medio de prcticas de seguridad,
con seguridad, informacin y manejo de recursos y manejo permite recordar el grado de importancia que tiene la
de datos. [13] informacin en cualquier empresa o institucin.
Un agradecimiento a nuestro apreciado maestro, que logr
inculcar modelos de estudio y un espritu investigador que nos [10] THE DATA GRID ARCHITECTURE, Work package:
permita publicar documentos cientficos, basados en la WP12: Project Management. Partners: CERN, CS SI,
bsqueda de nuevas tecnologas, o en la repotenciacin de las Documento en lnea disponible:
https://edms.cern.ch/file/333671/3.0/DataGrid-12-D12.4-
ya existentes.
333671-3-0.pdf
Actualmente el constante aumento de las exigencias para
alcanzar una mayor eficiencia en cada uno de sus procesos, [11] DISEO DE SISTEMAS DISTRIBUIDOS, Felix Garca
las empresas requieren los servicios de la plataforma de TI, Caballeria, Master en Ciencia y Tecnologa Informtica,
exigiendo tiempos de respuesta muy cercanos al 100%, lo que Documento en lnea disponible:
implica la necesidad de soluciones de Alta Disponibilidad, http://www.arcos.inf.uc3m.es/~dsd/lib/exe/fetch.php?media=clu
ster-grid.pdf
que permitan garantizar un estado de funcionamiento
constante. [12] PASOS PARA CREAR UN CLUSTER, Sergio Gonzlez
Gonzlez, Documento en lnea disponible:
REFERENCIAS BIBLIOGRFICAS http://www.sergio-gonzalez.com/doc/09-conceptos-de-
clustering/html/index.html
[1] AGUILAR RESELL V. J., Clstering de Alta Disponibilidad
bajo GNU/Linux, Documento en lnea disponible: http:// [13] Welcome to the Globus Toolkit Homepage, Globus, Globus
www.bisente.com/documentos/clstering/informe.pdf.
Alliance, and Globus Toolkit are trademarks held by the
Septiembre 2002.
University of Chicago, Documento en lnea disponible:
http://toolkit.globus.org/toolkit/
[2] GALLARDO P. FLAVIO. M. Diseo de una solucin para
servidores de alta disponibilidad y balanceo de carga con Open
Source, Documento en lnea disponible:http://es.scribd.
com/doc/57937293/33/Funcionamiento-de-un-clster. BIOGRAFA
Mayo 2011..

[3] Pablo A. Aguilera V. Graduado del Colegio Tcnico


MORENO R. ALBERTO. Clster Web de alta disponibilidad Salesiano Don Bosco, con la especialidad de Electrnica,
a travs de una red de rea extensa, Documento en lnea posteriormente sus estudios superiores los realiz en la
disponible: Escuela Politcnica del Ejercito ESPE, culminando
http://oa.upm.es/4958/2/PFC_ALBERTO_MORENO_ exitosamente los estudios de Ingeniero en Sistemas;
RAMIREZ.pdf. Marzo 2010. actualmente estudia la Maestra de Gerencia de Sistemas
en la misma universidad.
Desde el ao 2006 se encuentra trabajando en la empresa ECUAQUIMICA
[4] URREJOLA R. ANTONIO, ORTIZ FERNANDO.2009 Diseo C.A. y actualmente desempea el cargo de Jefe Regional de Tecnologa.
de un clster de balanceo de carga y alta disponibilidad para
un servidor web en Linux utilizando ultra-Monkey; Documento
en lnea disponible:http://www.buenastareas.com/ Estevan Gmez, se gradu de Ingeniero en
ensayos/Balanceo-De-Carga/468560.html. 2009. Sistemas en la Escuela Politcnica del Ejrcito
trabaja como Docente a nivel de Pre-grado y
[5] OATE A., VCTOR M. ORTEGA S., EDWARD J. Post grado.
PARRELLA R., JOS Phd Candidate por la Universidad Nacional de la
M. Clster de alta disponibilidad con balanceo de carga para Plata- Argentina
servicios corporativos sobre Debian GNU/Linux; Documento
en lnea disponible: http://es.scribd.com/doc/25185182/
Clsters-de-alta-disponibilidad-con-balanceo-de-carga-pa para-
servicios-corporativos-sobre-Debian-GNU-Linux-Caso-
de-exito-EDELCA. 2010.

[6] BUYYA, ROBERT. High Performance Clster Computing:


Architectures and Systems. Volumen 1. Prentice-Hall PRT.
1999.

[7] Transparent Process Migration: Design Alternatives and the


Sprite Implementation (1991) Fred Douglis, John Ousterhout.
Software - Practice and Experience

[8] BProc: Beowulf Distributed Process Space ; Documento en


lnea disponible: http://bproc.sourceforge.net

A Dynamic Load Balancing System for Parallel Cluster


[9] Computing (1996) B. J. Overeinder, P. M. A. Sloot, R. N.
Heederik. Future Generation Computer Systems

Vous aimerez peut-être aussi