Vous êtes sur la page 1sur 48

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

IMPLEMENTACIN, PUESTA EN OPERACIN Y PRUEBAS DEL NODO GRID-UD PARA INTERCONECTAR A LA UNIVERSIDAD DISTRITALCON LA MALLA COMPUTACIONAL GRID COLOMBIA USANDO LA RED DE TECNOLOGIA AVANZADA RENATA

PROPONENTES: OMAR ALEJANDRO TLLEZ FLECHAS NGEL IVN RODRGUEZ HIDALGO JOS ALEXANDER PABN AYALA

UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS FACULTAD DE INGENIERA PROYECTO CURRICULAR DE INGENIERA DE SISTEMAS BOGOT D.C. 2010 1

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

IMPLEMENTACIN, PUESTA EN OPERACIN Y PRUEBAS DEL NODO GRID-UD PARA INTERCONECTAR A LA UNIVERSIDAD DISTRITALCON LA MALLA COMPUTACIONAL GRID COLOMBIA USANDO LA RED DE TECNOLOGIA AVANZADA RENATA

PROPONENTES: OMAR ALEJANDRO TLLEZ FLECHAS NGEL IVN RODRGUEZ HIDALGO JOS ALEXANDER PABN AYALA

20031020094 20031020156 20021020092

Anteproyecto de Tesis de Grado para optar al ttulo de Ingenieros de Sistemas

Director de Tesis Ph.D. Jos Nelson Prez Castillo

UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS FACULTAD DE INGENIERA PROYECTO CURRICULAR DE INGENIERA DE SISTEMAS BOGOT D.C. 2010 2

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

TABLA DE CONTENIDO
INTRODUCCIN 1. PLANTEAMIENTO DEL PROBLEMA 2. JUSTIFICACIN 3. OBJETIVOS DEL PROYECTO 3.1 OBJETIVO GENERAL 3.2 OBJETIVOS ESPECFICOS 4. ALCANCE Y LIMITACIONES 4.1 ALCANCE 4.2 LIMITACIONES 5. MARCO TERICO 5.1 COMPUTACIN GRID 5.2 ORGANIZACIONES INTERNACIONALES GRID 5.2.1 OSG 5.2.2 EELA 5.2.2.1 Afiliados a EELA 5.3 RED CLARA 5.3.1 Pases Conectados a CLARA 5.3.2 Conexiones al Mundo 5.4 RENATA 5.4.1 Objetivos RENATA 5.4.2 Caractersticas Tcnicas 5.2.3 Redes Acadmicas Regionales Colombianas 5.5 GRID COLOMBIA 5.5.1 Instituciones Conectadas al Proyecto 5.6 COMPONENTES DE UN NODO GRID 5.6.1 Worker Node 5.6.2 Computing Element 5.6.3 Workload Management System 5.6.4 User Interface 5.6.5 Certification Authorities 5.6.6 MyProxy 5.6.7 Storage Element 5.7 MIDDLEWARE 5.7.1 GLOBUS 5.7.1.1 Globus Toolkit 5.7.1.2 Servicio GridFTP 5.7.2 CONDOR 3 5 7 8 10 10 10 12 12 12 13 13 16 16 17 18 19 19 19 20 20 21 21 22 23 24 24 24 24 24 25 25 25 25 26 26 28 29

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.8 VIRTUALIZACIN 31 5.8.1 Virtualizacin del almacenamiento 32 5.8.2 Virtualizacin del Servidor 33 5.8.3 Ventajas de la virtualizacin 34 5.8.4 Plataforma para Virtualizacin 34 5.8.4.1 VirtualBOX 34 5.9. ENTIDAD CERTIFICADORA 35 5.9.1 Introduccin 35 5.9.2 SSL 36 5.9.2 Definicin 36 5.9.3 Modo de Funcionamiento 36 5.9.4 OSG Registration Authority 37 6. METODOLOGA 38 6.1 Fase 1: Levantamiento de Informacin 38 6.2 Fase 2: Configuracin del Sistema Base 39 6.3 Fase 3: Servicios Extra 39 6.4 Fase 4: Middleware 39 6.5 Fase 5: Computer Element 39 6.6 Fase 6: Pruebas 39 6.7 Fase 7: Documentacin 40 7. RECURSOS 41 7.1 Recursos Humanos 41 7.2 Recursos Fsicos 41 7.2.1 Hardware 41 7.2.2 Software 42 7.3 Recursos Financieros 42 8. CRONOGRAMA 43 9. REFERENCIAS 44 10. BIBLIOGRAFIA 47 11. ANEXOS Anexo 1: Topologa de Red Propuesta Anexo 2: Topologa RED CLARA Carta 1: Invitacin a participar en la iniciativa Grid Colombia Carta 2: Aval Institucional para participacin en Grid Colombia Carta 3: Aval Institucional para pertenecer a la iniciativa Nacional de Grid Colombia patrocinada por Colciencias 4

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

INTRODUCCIN
A travs de la historia la mayora de desarrollos cientficos han ido de la mano con el progreso de la tecnologa. En las ltimas dcadas esta relacin se ha hecho mucho ms estrecha, a tal punto que actualmente en muchos mbitos de la ciencia es imposible el avance de sta sin la tecnologa que la soporte. Como parte del soporte actual realizado por la tecnologa, se incluye la realizacin de clculos complejos y la gestin de grandes cantidades de datos, de tal magnitud, que son difcilmente realizados por una sola mquina o centro de cmputo. Una de las tecnologas que puede proporcionar la capacidad de cmputo adecuada es la computacin grid, la cual consiste en la integracin de recursos computacionales heterogneos que se encuentran conectados y trabajando en paralelo, sin un control centralizado, actuando como una nica mquina. Esta tecnologa se ha utilizado para llevar a cabo tareas computacionales complejas como el manejo, procesamiento e intercambio de enormes cantidades de datos, demostrando una mayor efectividad si se le compara con un sistema de cmputo aislado; y guardando una relacin beneficio/costo aceptable. Por esta razn han ido surgiendo alrededor del mundo propuestas para utilizar esta tecnologa en el soporte de desarrollos cientficos contemporneos. Para incluir a nuestro pas en este tipo de tecnologas, la comunidad acadmica y cientfica colombiana emprendi el proyecto Grid Colombia, el cual est siendo desarrollado por diversas Universidades interesadas en el tema dentro del territorio nacional con el apoyo de Colciencias. Este proyecto tiene como objetivo la conformacin de un grid computacional entre las Universidades miembro 1, integrando los centros de cmputo de cada una de ellas y vinculando este grid con los grids existentes a nivel mundial2; permitiendo la realizacin de estudios avanzados en diversos mbitos que puedan contribuir al desarrollo integral de la nacin. La Universidad Distrital Francisco Jos de Caldas es un nuevo miembro del proyecto, y como tal debe cumplir con el requisito base de implementar un nodo activo dentro de la infraestructura de Grid Colombia, y as cumplir con el compromiso adquirido por la universidad para el desarrollo del proyecto, este nodo debe contar con unas
1 2

Ver Anexo 1 Ver Anexo 2

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

especificaciones mnimas requeridas por la organizacin para poder establecer una ptima interconexin con los dems miembros. En septiembre del ao 2010 la Universidad inaugur el Centro de Cmputo de Alto Desempeo -CECAD-, el cual se desea vincular a la iniciativa Grid Colombia, permitiendo con esto realizar alianzas con centros de supercomputacin Internacionales. Con la implementacin del nodo activo de la Universidad Distrital, y la integracin del mismo al proyecto Grid Colombia, la Universidad se podr beneficiar del amplio espectro de posibilidades en ciencia e investigacin que le suministra este tipo de tecnologas, permitiendo a la Universidad ofrecer servicios computacionales y fomentar la investigacin en diversas reas del conocimiento.

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

1. PLANTEAMIENTO DEL PROBLEMA


La Universidad Distrital Francisco Jos de Caldas fue aceptada en 2010 como miembro activo de Grid Colombia, el proyecto de carcter cientfico enfocado en establecer un grid computacional nacional entre sus miembros, los cuales son universidades pioneras en el desarrollo de este tipo de tecnologas en nuestro pas. La Universidad Distrital como miembro del proyecto debe cumplir con el requisito primordial de contribuir con un nodo activo funcional que le permitir beneficiarse y al mismo tiempo, fortalecer el poder de cmputo del grid nacional, el cual esta interconectado a travs de la red de alta velocidad RENATA a los diversos grids de carcter cientfico y acadmico que hay en el mundo Con la adquisicin de equipos de ltima generacin, y la ayuda de donaciones de empresas privadas, la Universidad conform en 2010 un centro de cmputo de alto desempeo denominado laboratorio CECAD el cual estar listo para su puesta en marcha en los prximos meses. Adicionalmente, la universidad est presentando un crecimiento continuo en proyectos de investigacin que requieren de mejores y ms avanzados recursos computacionales para poder ser llevados a cabo. Por lo anteriormente descrito se hace necesaria la puesta en marcha del nodo grid activo de la Universidad Distrital para mantenerse como miembro de Grid Colombia, generando un aprovechamiento de los recursos de los centros de cmputo de alto desempeo de las diversas universidades miembros del proyecto.

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

2. JUSTIFICACIN
La Universidad Distrital como institucin pblica y enfocada en el desarrollo del pas necesita la generacin de nuevos proyectos y espacios para la investigacin que signifiquen ponerse a la vanguardia de nuevo conocimiento y nuevas tecnologas. Con la entrada en funcionamiento del nodo grid de la Universidad Distrital se lograr dar un paso ms para acercarse a este conocimiento, ya que se dar acceso al poder de cmputo disponible no slo de nuestra institucin sino de todos los miembros del grid alrededor del mundo para llevar a cabo procesos de gran complejidad computacional que no son posibles de realizar con los recursos actuales de la universidad. El desarrollo de los diversos proyectos que desea realizar la universidad se reflejar en un incremento de la calidad de nuestros proyectos institucionales lo que implica un mejoramiento de la educacin pblica de nuestro pas gracias al carcter de nuestra institucin. El proyecto Grid Colombia al ser una iniciativa sin precedentes en nuestro pas carece de la experiencia necesaria para definir los lineamientos a seguir para la implementacin de los nodos, razn por la cual cada uno de los miembros de proyecto es libre de elegir la infraestructura que desee para implementar sus respectivos nodos, haciendo que cada uno de estos nodos sea objeto de estudio, verificando as la factibilidad y rendimiento de cada uno de estos. Actualmente, ninguna de las instituciones miembro del proyecto se ha dado a la tarea de implementar este nodo utilizando mquinas virtuales, razn por la cual se ha decidido ser pioneros en este tipo de implementacin en nuestro pas, de modo que pueda llegar a ser un modelo a seguir por parte de las dems instituciones miembro. Al ser una iniciativa basada en la virtualizacin de mquinas se simplifica la administracin, permite reducir el espacio fsico, logrando una disminucin de costos generados por la administracin y mantenimiento de los mismos. La realizacin de pruebas permitir contribuir a la investigacin nacional, aportando a la comunidad cientfica colombiana una estadstica real acerca del rendimiento del nodo de la Universidad Distrital con vista a proponer un sistema diferente al sistema fsico al cual estn apegadas las dems instituciones del prototipo. Adems ayudando en la identificacin de los alcances y limitaciones de la grid, y anticipando futuras dificultades que puedan rezagar la marcha del proyecto nacional. 8

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Adems de esto el proyecto cuenta con el respaldo de la OSG de Estados Unidos y EELA de Europa - Latinoamrica, organizaciones lderes en el tema del grid computing, las cuales brindan apoyo en el desarrollo del proyecto, lo cual garantizar la calidad de todo el proceso y del producto final.

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

3. OBJETIVOS
Objetivo General Implementar el nodo activo de computacin grid de la Universidad Distrital Francisco Jos de Caldas como parte del proyecto de Grid Colombia. Objetivos especficos Proponer un modelo virtualizado para el nodo grid de la Universidad Distrital enlazado con Grid Colombia. Implementar un modelo virtualizado para el nodo grid de la Universidad Distrital enlazado con Grid Colombia. Obtener los certificados de autenticacin del cliente y host expedidos por la entidad certificadora vigente al momento de solicitarlos. Implementar el servicio GridFTP en el nodo grid de la Universidad. Ejecutar las pruebas internas de carga con el cliente OSG corriendo algoritmos para pruebas de rendimiento. Integrar el nodo de la Universidad Distrital a Grid Colombia, brindando acceso al recurso de cmputo designado para el proyecto. Ejecutar las pruebas piloto de integracin y de comunicacin con otros nodos de la grid para validar su operatividad. Comparar el rendimiento del nodo virtualizado frente a un nodo fsico. Elaborar la documentacin adecuada sobre el desarrollo del proyecto. Publicar los resultados obtenidos de la investigacin realizada para el desarrollo del proyecto. 10

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Obtener acceso a los recursos computacionales de la comunidad universitaria que conforma Grid Colombia, utilizando los recursos computacionales destinados por la universidad para el proyecto.

11

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

4. ALCANCES Y LIMITACIONES
Alcance El alcance del proyecto est definido hasta la integracin del nodo grid virtualizado de la Universidad Distrital al prototipo Grid Colombia, adems de la realizacin de pruebas de integracin y rendimiento, junto con la divulgacin de los resultados obtenidos en la investigacin del proyecto.

Limitaciones Una limitacin del presente proyecto viene dada por los parmetros que define Grid Colombia para la agregacin del nodo al prototipo, debido a que busca la integracin con la infraestructura OSG. Es un lmite para nuestro proyecto, el tiempo definido para la etapa prototipo de Grid Colombia la cual inici en el mes de Diciembre de 2009 y tiene un ao de duracin con la posibilidad de ser ampliado por tres meses ms. Se requiere que por lo menos un miembro diferente a la Universidad Distrital del proyecto Grid Colombia tenga implementado un nodo lo suficientemente desarrollado para poder realizar con este las pruebas externas de funcionamiento.

12

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5. MARCO TERICO
5.1 COMPUTACIN GRID La computacin Grid es una tecnologa de la informacin emergente en el que todos los recursos computacionales de un nmero indeterminado de sistemas de cmputo son compartidos, de tal manera que puedan ser tratados, de manera transparente, como un nico superordenador. Las bases de lo que es Grid las pusieron Ian Foster y Carl Kesselmans: Es un sistema que coordina recursos que no estn sujetos a un control centralizado, utilizando protocolos de propsito general e interfaces, ambos abiertos y estndares, para entregar servicios de calidad. [FOSTER01] Los recursos computacionales que se comparten son heterogneos (distintas plataformas, arquitecturas de equipos, programas, lenguajes de programacin, etc), se encuentran geogrficamente dispersos y pertenecen a diferentes dominios de la red; la informacin se procesa usando una red de banda ancha de alta velocidad que permite aplicar todo el poder de las comunicaciones para la integracin de datos y as entregar resultados con mayor rapidez.

13

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Figura 1: Representacin de un Grid Computacional. [GRID02]

Algunos de los usos ms importantes de la computacin Grid son: Aprovechamiento de recursos de cmputo no utilizados: Habitualmente en una maquina los recursos de cmputo y de almacenamiento no son completamente aprovechados la mayora del tiempo por lo tanto la computacin grid ofrece un marco para explotar estos recursos cuando no estn siendo utilizados aumentando considerablemente la eficiencia del uso de los recursos. (Figura 2)

14

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Figura 2: migracin de procesos a nodos del grid menos utilizados. [GRID03]

Procesamiento paralelo: Una tarea, de una aplicacin, puede ser distribuida como muchas pequeas sub tareas, cada una de las cuales se ejecuta en una maquina diferente del Grid. Gridificacin de aplicaciones: consiste no solo en distribuir tareas de una aplicacin, sino en distribuir la aplicacin como tal para que se ejecute en paralelo. Acceso a recursos adicionales: El grid puede proporcionar acceso a recursos existentes en otros nodos del grid, teniendo la posibilidad de ejecutar aplicaciones instaladas un sitio diferente del grid.

15

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.2 ORGANIZACIONES INTERNACIONALES DE COMPUTACIN GRID OSG en Estados Unidos y EELA en la Unin Europea-Latinoamrica son organizaciones a nivel mundial en con mucha experiencia en cuanto al tema de montaje, estndares e integracin de grillas computacionales para el desarrollo cientfico y acadmico. Nacidas como propuestas separadas, estas dos propuestas han avalado la iniciativa Grid Colombia brindado asesora en el montaje del proyecto de la grid nacional colombiana. Estas objetivo de estas dos propuestas dos propuestas es el de proveer a los cientficos un recurso sobre el cual correr aplicaciones cientficas con un nfasis especial aplicaciones de computacin de alto rendimiento. 5.2.1 OSG La OSG Open Science Grid- fundada en el ao 2004 es una organizacin estadounidense cuyo fin es estimular nuevos descubrimientos proveyendo a los cientficos un acceso confiable y efectivo a un complejo de computacin distribuida nacional estadounidense sin precedentes. Su propsito es construir una ciber-infraestructura que puede crecer para ofrecer miles de usuarios un acceso efectivo a 100.000 CPUs, decenas de peta bytes de almacenamiento ubicados en cientos de sitios y enlazados entre s por redes de alta velocidad. Una caracterstica nica de la OSG es el apoyo a la integracin dinmica de los nuevos recursos y aplicaciones y el aprovechamiento de todos los recursos disponibles, extendiendo as el retorno de las inversiones de nuestra infraestructura informtica y facilitar la inclusin de nuevas comunidades. [OSG01] La OSG es coordinada por el Doctor Rob Gardner de la Universidad de Chicago quien nos apoyar con su equipo tcnico va web en el proceso de resolucin de dudas y dificultades que se puedan presentar.

16

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Mapa 1: Sitios adscritos a OSG en los Estados Unidos.

[Mapa1]

5.2.2 EELA Nacida en el 1 de febrero de 2006 y coordinada por el CIEMAT 3 en Espaa, EELA es un proyecto que integra instituciones Europeas y Latinoamericanas con el fin de crear una red de colaboracin que se encarga de la organizacin de la formacin en tecnologas Grid y de la implementacin de una infraestructura Grid piloto para aplicaciones de e-ciencia. El objetivo de EELA es llevar el las infraestructuras de los pases latinoamericanos al nivel de los de Europa, usando el soporte que brinda la CE4. EELA se beneficiarn del estado de madurez del proyecto Red CLARA para centrarse en la infraestructura Grid y aplicaciones relacionadas con la e-Ciencia, identificando y promoviendo un marco sostenible para la e-Ciencia.

3 4

Centro de Investigaciones Energticas, Medioambientales y Tecnolgicas Comisin Europea

17

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.2.2.1 Afiliados a EELA [EELA02] Ciemat-Centro de Investigaciones Energticas Medioambientales y Tecnolgicas-Espaa CSIC-Consejo Superior de Investigaciones Cientficas-Espaa UFRJ-Universidade Federal do Rio do Janeiro-Brasil UPV-Universidad Politcnica de Valencia-Espaa ULA-Universidad Nacional Los Andes-Venezuela INFN-Istituto Nazionale di Fisica Nucleare-italia CUBAENERGIA-Centro de Gestin de la Informacin y Desarrollo de la EnergaCuba UTFSM-Universidad Tcnica Federico Santa Mara-Chile CLARA-Cooperacin Latioamericana de Redes Avanzadas-Latinoamerica UFF-Universidade Federal Fluminense-Brasil UNAM-Universidad Nacional Autnoma de Mxico-Mexico CEDERJ-Centro de Educao Superior a Distncia do Estado de Rio de JaneiroBrasil RNP-Rede Nacional de Ensino e Pesquisa-Brasil CERN-European Organization for Nuclear Research-Europa LIP-Laboratrio de Instrumentao e Fsica Experimental de Partculas-Portugal SENAMHI-Servicio Nacional de Meteorologa e Hidrologa-Peru UC-Universidad de Cantabria-Espaa REUNA-Red Universitaria Nacional-Chile UDEC-Universidad de Concepcin-Chile REDIRIS-Red Acadmica y de Investigacin Espaola-Espaa UNLP-Universidad Nacional de La Plata-Argentina UFCG-Universidade Federal de Campina Grande - Laboratrio de Sistemas Distribudos-Brasil UNIANDES-Universidad de los Andes-Colombia SEEGRID-2-SEEGRID-2 Project-Internacional

18

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.3 RED CLARA La red CLARA5 comenz a funcionar el da 15 de noviembre de 2004 con el propsito de proveer conectividad entre los pases latinoamericanos, interconectando las redes acadmicas de cada uno de estos pases con las redes de Europa, Estados Unidos y el resto del mundo. El objetivo de CLARA es fomentar la colaboracin latinoamericana con la comunidad cientfica global. 5.3.1 Pases Conectados a CLARA Argentina Brasil Chile Colombia Ecuador El Salvador Guatemala Mxico Panam Per Uruguay Venezuela

5.3.2 Conexiones al mundo [CLARA] Gracias a Red CLARA y a su conexin a la red paneuropea GANT2, Amrica Latina se conecta con Europa a 622 Mbps a travs de la conexin entre So Paulo (Brasil) y Madrid (Espaa). A travs de los enlaces que posee GANT2 con TEIN2 (TransEurasia Information Network) y EUMEDCONNECT, RedCLARA accede tambin a la zona Asia-Pacfico y a la cuenca Mediterrnea, respectivamente. Gracias al proyecto WHREN-LILA, Red CLARA se conecta tambin con Estados Unidos, lo que se lleva a cabo mediante los enlaces del nodo de Tijuana (Mxico) con
5

Cooperacin Latino-Americana de Redes Avanzadas

19

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

San Diego (Costa Pacfico de EE.UU.) y del de So Paulo con Miami. Cabe destacar que el enlace establecido con San Diego, permite a Red CLARA acceder a las conexiones hacia el Asia-Pacfico, donde, adems, CLARA posee calidad de miembro asociado de APAN, la Red Avanzada del Asia-Pacfico. 5.4 RENATA RENATA es la red de tecnologa avanzada que conecta, comunica y propicia la colaboracin entre la comunidad acadmica y cientfica de Colombia con la comunidad acadmica internacional y los centros de investigacin ms desarrollados del mundo. RENATA es administrada por la Corporacin RENATA, de la cual son miembros las Redes Acadmicas Regionales, el Ministerio de Educacin, el Ministerio de Tecnologas de la Informacin y las Comunicaciones y Colciencias. El gran valor agregado de RENATA radica en el poder de comunicacin y colaboracin entre sus miembros. Nuestra labor se rige por los principios de colaboracin, innovacin, desarrollo tecnolgico y calidad del servicio. 5.4.1 Objetivos de Renata 1. Ofrecer un servicio de conectividad de alta calidad usando tecnologas avanzadas. 2. Consolidar una red nacional con el mayor nmero de instituciones acadmicas y de investigacin que hagan uso efectivo de la red. 3. Ofrecer servicios que faciliten y promuevan el intercambio eficiente de informacin y comunicaciones, as como el trabajo colaborativo entre las instituciones nacionales e internacionales. 4. Estimular la ejecucin de proyectos de educacin, investigacin y desarrollo que contribuyan a la competitividad y el progreso del pas. 5. Desarrollar acciones y alianzas que contribuyan al desarrollo y sostenibilidad de RENATA.

20

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.4.2 Caractersticas Tcnicas RENATA transita sobre un ancho de banda de 200 Mbps. La infraestructura de la Red Nacional Acadmica de Tecnologa Avanzada, RENATA, est basada en una topologa de estrella jerrquica donde el punto central es la sede Morato de Colombia Telecomunicaciones en Bogot, los puntos de la estrella los conforman los nodos principales de las Redes Acadmicas Regionales de las ciudades de Cali, Barranquilla, Medelln, Bucaramanga, Pereira (Eje Cafetero), Popayn y Bogot, en donde se interconectan a cada uno de los operadores locales que manejan las redes metropolitanas de las universidades. [RENATA01] 5.4.3 Redes Acadmicas Regionales Colombianas RADAR, Red Acadmica de alta Velocidad Regional RIESCAR, Red de Instituciones de Educacin Superior de Cartagena de Indias RUANA, Red Universitaria Antioquea. RUAV, Asociacin Red Universitaria de Alta Velocidad del Valle del Cauca RUP, Asociacin Red Universitaria de Popayn RUMBO, Red Universitaria metropolitana de Bogot RUTA, Red Universitaria de Tecnologa Avanzada del Caribe UNIRED, Corporacin Red de Instituciones de Educacin, Investigacin y Desarrollo del Oriente Colombiano.

21

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Mapa 2: Cinco redes regionales de alta velocidad.

[REDES01]

5.5 GRID COLOMBIA Grid Colombia es una organizacin en formacin, con una base fundamentalmente acadmica, destinada originalmente a centralizar los esfuerzos para la puesta en operacin del primer grid de cmputo de alcance nacional que facilite el establecimiento y desarrollo de la e-ciencia en Colombia usando las Redes de Tecnologa Avanzada (RENATA) a escala regional y nacional. Esta meta implica la generacin del diseo, tanto tcnico como organizacional, de una modelo grid nacional y la puesta en marcha y evaluacin de un prototipo funcional. [GRIDCO01] La universidad fue aceptada recientemente en este proyecto6, razn por la cual se desea implementar el nodo activo de esta en el proyecto, que est en fase prototipo

[Cartas 1 y 2]

22

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

hasta el 31 de diciembre del ao 2010. Grid Colombia brinda capacitaciones y asesora a las instituciones miembro del proyecto. La conectividad se logra a travs de las Redes Acadmicas de Alta Tecnologa regionales RUANA, Ruta Caribe, RUAV, Unired y RUMBO y nacional RENATA. Cada institucin participante contar con un nodo local perteneciente a la Grid Nacional que le permitir ampliar sus recursos de cmputo y almacenamiento para apoyar las actividades de docencia, investigacin y extensin. Un elemento importante es el apoyo y asesora internacional de EELA y OSG, quienes contribuirn con su experiencia para que Grid Colombia pueda integrarse a estas grillas y en el futuro prximo se constituya en un nodo internacional con acceso a los inmensos recursos disponibles en ellas. Al finalizar el proyecto se obtendr el diseo de una arquitectura de Grid nacional, el middleware operativo para la administracin de recursos y la programacin de trabajos, el modelo organizacional para la operacin del Grid, un prototipo de Grid de Cmputo Nacional en funcionamiento y al menos una aplicacin que permita hacer una evaluacin rigurosa de las capacidades del sistema. El aporte directo al conocimiento ms relevante es el modelo organizacional y la arquitectura, el cual es novedoso debido a que tiene en cuenta las particularidades del contexto colombiano, problemtica que actualmente est sin resolver. [GRIDCO02] 5.5.1 Instituciones conectadas con el proyecto: Pontificia Universidad Javeriana / RUMBO Universidad Antonio Nario / RUMBO Universidad Autnoma de Bucaramanga, UNAB / UNIRED Universidad Autnoma de Manizales / RADAR Universidad Catlica de Colombia / RUMBO Universidad de Antioquia / RUANA Universidad de Los Andes / RUMBO Universidad del Atlntico / RUTA Universidad del Norte / RUTA Universidad del Valle / RUAV Universidad Industrial de Santander, UIS / UNIRED Universidad Javeriana de Cali / RUAV Universidad Nacional de Colombia, Bogot / RUMBO Universidad Pontificia Bolivariana de Medelln, UPB / RUANA 23

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.6 COMPONENTES DE UN NODO GRID 5.6.1 Worker Node WN Es una unidad del centro de procesamiento que est compuesto de procesadores [GUG], donde se desarrolla el trabajo pesado. Un centro de procesamiento puede estar compuesto de uno o ms WN. 5.6.2 Computing Element CE En la terminologa Grid, los elementos de computacin son recursos localizados en algn sitio (por ejemplo en un clster).El CE desarrolla las funciones de administracin de cargas y asignacin de tareas a los WNs. [CE01] El CE ofrece recursos locales de computacin tales como colas de lote, nmero de procesadores y derechos de acceso mediante un Servicio de Directorio y Monitoreo (Monitoring and Directory Service - MDS). [GUG] 5.6.3 Workload Management System WMS Se encarga de aceptar trabajos de los usuarios para asignarlos al Computing Element ms adecuado, registrar su estado y recuperar su produccin. El WMS utiliza el servicio de ejecucin de trabajos en una maquina que se denomina Resource Broker (RB). [GUG] [WMS01] 5.6.4 User Interface (UI) El punto de acceso a una Grid es la interfaz de usuario (UI). La UI puede ser cualquier mquina en donde los usuarios tienen una cuenta personal, con un certificado de autenticacin de usuario instalado. Una vez el usuario ha sido autenticado y autorizado a utilizar los recursos, ste puede acceder a las funcionalidades bsicas para la gestin de trabajos. Se deben tener en cuenta pasos bsicos como: 1. 2. 3. 4. Preparacin del trabajo Envi del Trabajo Comprobacin del estado del trabajo Recuperacin de la salida del trabajo. 24

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.6.5 Certification Authorities CA Para ejecutar procesos Grids es requisito tramitar un certificado de seguridad ante una entidad certificadora. [NGS01] Una CA es la entidad encargada de firmar los certificados de autenticacin de cada elemento participante en el Grid. [PTH][SG] Los certificados son firmados por la CA usando procedimientos de inscripcin con algoritmos de clave pblica y privada con el x509, para que el mensaje solo pueda ser desencriptado por el destinatario. [GUG] 5.5.6MyProxy Para enviar trabajos a la Grid, los usuarios requieren de un proxy valido. Los trabajos llevan su propia copia del proxy para poderse autenticar en la Grid y as, ser luego ejecutados. Si el trabajo se demora ms del tiempo estipulado en el certificado proxy, el trabajo es cancelado. Para evitar este percance, existe Myproxy, que renueva el certificado hasta que el trabajo termine. El servidor Myproxy es quien provee este servicio. [GUG] 5.5.7 Storage Element SE Son los elementos de almacenamiento que deben tener cada uno de los nodos del grid, sobre los cuales se realizan procesos de persistencia de los datos. Para realizar la gestin de esos datos es necesario contar adems con un catlogo de archivos que publique la informacin acerca de la ubicacin de los archivos fsicamente. 5.7 MIDDLEWARE Conjunto de servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogneas, protege a quien escribe la aplicacin de la complejidad subyacente al funcionamiento del sistema, y permite a los usuarios aprovechar el poder de los sistemas distribuidos sin tener que conocer los detalles de los sistemas en uso.

25

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.7.1 GLOBUS Es un proyecto de colaboracin centrado en el Laboratorio Nacional de Argonne que permite la aplicacin de conceptos de Computacin Grid, este proyecto fue desarrollado por la Globus Alliance bajo la direccin de Ian Foster y Carl Kesselman. Globus desarrolla la infraestructura y mecanismos bsicos para Grid Un resultado importante es el desarrollo de la Globus Toolkit, la infraestructura subyacente utilizada por la mayora de proyectos Grid. 5.7.1.1 Globus Toolkit Globus Toolkit ha sido considerado por muchos como el estndar de facto para la aplicacin de las Grid, proporcionando numerosas tecnologas clave, tales como la gua de servicios para la localizacin de recursos, la autenticacin y planificacin de tareas. El conjunto de herramientas creci sobre la idea de hacer una red de trabajo para los cientficos e ingenieros, la cual requiere de infraestructuras de middleware importantes. Globus Toolkit es un paquete de software de licencia libre (GPL) que contiene [GUILLE01]: Implementacin del estndar WSRF (Web Service Resource Framework), que permite incorporar a los servicios web las funcionalidades que aportaba un grid service. Implementacin del estndar OGSA, especificacin que trata de estandarizar el acceso a los servicios presentes en una infraestructura grid, servicios de alto nivel necesarios para desarrollo de aplicaciones distribuidas.

26

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Figura 3 - Integracin de Globus Toolkit con los estndares Grid. [GLOB01]

La arquitectura de Globus tiene bsicamente tres grupos de servicios y una capa de seguridad. Estos grupos son la gestin de recursos (Resource Management), el tratamiento de los datos (Data Management) y los servicios de informacin (Information Services). Por debajo de estos tres grupos y de la capa de seguridad est la capa de servicios locales (Local Services), que contiene los servicios del sistema operativo, los de la red (como TCP/IP), gestores de bases de datos, etc.

27

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Las capas superiores son las que permiten la integracin con diferentes aplicaciones distribuidas. Para estas capas Globus tambin tiene funcionalidades, pero normalmente son otros grupos los que desarrollan ese software aprovechando el middleware bsico que aporta el Globus toolkit.

Figura 4 - Diagrama de la arquitectura de Globus. [ARXI01]

5.7.1.2 GridFTP Es una extensin del protocolo estndar FTP que dispone de datos segura, eficiente y confiable movimientos en entornos de red. Adems de las funciones estndar de FTP, GridFTP GSI proporciona apoyo para autenticada de transferencia de datos, la invocacin de transferencia de terceros y el apoyo de transferencia de datos a rayas, en paralelo y parcial. En el entorno Grid, el acceso a los datos distribuidos es tan importante como el acceso a los recursos computacionales distribuidos. GridFTP es utilizado para la transferencia segura, robusta, rpida y eficiente de datos (no es un Web Service), especialmente optimizado para el movimiento de grandes cantidades de datos en el entorno Grid. 28

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

GridFTP est definido en el GGF (GFD 0.20) [GRID01], permite abrir mltiples streams entre diferentes maquinas para transferir archivos, realizar transferencias paralelas, transferencias parciales, transferencias en modo stripe, tiene la posibilidad de reiniciar transferencias y permite verificar estadsticas de uso. Es seguro mediante GSI. 5.7.2 CONDOR Condor es un software de administracin especializado en la monitorizacin y gestin de recursos para aplicaciones que requieren altas capacidades computacionales. Provee un mecanismo de manejo de colas, polticas de planificacin y esquema de prioridades.

Las funcionalidades ms importantes de Condor son [FC]: Directiva ClassAds: provee un marco de trabajo flexible para determinar si las peticiones de acceso a recursos coinciden con los recursos ofrecidos por el sistema. Entrega distribuida: Condor no establece un control central para la recepcin de tareas, sino que stas son entregadas desde varios computadores. Prioridades de usuario: los administradores del entorno Grid pueden asignar prioridades a los usuarios mediante un mecanismo que habilita una poltica de comparticin justa, orden estricto o una combinacin de polticas. Prioridades de tareas: el orden de ejecucin de las tareas de los usuarios se controla mediante asignacin de prioridades. Dependencia de tareas: algunas tareas no son independientes, por lo que si existe un conjunto de tareas relacionadas se requiere un orden de inicializacin de las mismas. Un ejemplo claro sera relaciones principio fin, en las que una tarea no puede comenzar hasta que otra ha terminado. Soporte de tareas simultneas: permite manipular tareas serializadas o distribuidas mediante PVM y MPI. 29

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Puntos de verificacin y migracin de tareas: Condor puede realizar puntos de verificacin de manera transparente. Esto quiere decir que toma una imagen del estado de la tarea, proporcionando al tiempo la ilusin que se est ejecutando normalmente. La tarea puede continuar su ejecucin desde el punto de verificacin. As se habilita la migracin transparente de tareas desde un nodo a otro. Condor coloca automticamente puntos de verificacin cuando se planifica la asignacin de recursos o cuando un recurso es desactivado. Mediante los puntos de verificacin y la migracin de tareas se provee una forma de tolerancia a fallos, reduciendo las prdidas ante fallos del sistema tales como apagado inadecuado o deficiencias del hardware. Suspensin y reanudacin: Condor puede preguntar al sistema operativo si puede suspender o reanudar una tarea cuando se requiera. Para poder desempear estas tareas se utilizan reglas. Autenticacin y autorizacin: Condor permite tener autenticacin de red utilizando una gran variedad de mecanismos, como Kerberos. Plataformas heterogneas: Condor tiene soporte para sistemas Linux, Unix y Windows. Grid computing: funcionalidades basadas en computacin grid. Condor contiene el software necesario para recibir tareas de otros clsters, supercomputadores y sistemas distribuidos utilizando Globus toolkit.

Componentes bsicos de Condor [GRID03]:

Central Manager: tiene dos funciones principales en un clster de Condor. La primera funcin es recoger la situacin de todos los nodos en un clster Condor. La segunda funcin es hacer coincidir las solicitudes de recursos para la tareas con un nodo Condor que cumpla con los requisitos. Execution hosts: son los nodos que pueden ejecutar tareas de Condor.

30

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Submission hosts: son las mquinas donde las tareas condor pueden ser presentados.

Figura 5: componentes de Condor

5.8 VIRTUALIZACIN Para la mayora de los empleados de TI, la palabra virtualizacin evoca la idea de ejecutar mltiples sistemas operativos en una nica mquina fsica. Esto es virtualizacin del hardware y aunque no es la nica clase importante de virtualizacin, sin dudas es la ms visible en la actualidad. La idea bsica de la virtualizacin del hardware es simple: utilizar software para crear una mquina virtual que emula a una computadora fsica. Esto crea un entorno de sistema operativo separado que se asla en forma lgica del servidor host. Al ofrecer mltiples mquinas virtuales al momento, este enfoque permite ejecutar varios sistemas operativos en forma simultnea en una nica mquina fsica.

31

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Figura 6 - La virtualizacin del hardware quiebra la estrecha dependencia entre el hardware y el sistema operativo y permite que mltiples sistemas operativos se ejecuten en el mismo hardware. Esto acelera en gran medida el despliegue, la reorganizacin y la administracin de cada sistema operativo al tanto que permite una mejor utilizacin del hardware. [VIRT01]

5.8.1 Virtualizacin del almacenamiento En trminos generales, la virtualizacin del almacenamiento se refiere a ofrecer una vista lgica y abstracta de los dispositivos de almacenamiento fsico. Proporciona un modo para que muchos usuarios o aplicaciones accedan al almacenamiento sin la preocupacin de saber cmo y dnde se ubica o administra fsicamente ese almacenamiento. Facilita el almacenamiento fsico en un entorno para compartir en mltiples servidores de aplicaciones y dispositivos fsicos detrs de la capa de virtualizacin a ser visualizado y administrado como si fuera un gran grupo de almacenamiento sin lmites fsicos. La virtualizacin almacenamiento de redes habilita dos capacidades adicionales clave: La capacidad de ocultar o esconder volmenes de los servidores que no estn autorizados para acceder a esos volmenes y ofrecer un nivel adicional de seguridad. La capacidad de modificar y aumentar volmenes sobre la marcha para satisfacer las necesidades de servidores individuales. [VIRT03]

32

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Figura 7 Representacin de un disco duro virtual. [VIRT03]

5.8.2 Virtualizacin del servidor Un beneficio clave de las tecnologas de virtualizacin es la virtualizacin del servidor, la capacidad de virtualizar cargas de trabajo del servidor. La virtualizacin de servidores puede ahorrar dinero a las empresas al simplificar la administracin y gastos generales por lo que les permite reducir el nmero de servidores fsicos que necesitan a travs de la consolidacin de servidores virtuales. La tecnologa de virtualizacin de servidores permite virtualizar ordenadores, ejecutando mltiples sistemas operativos (Por lo general sistemas operativos de servidor) en un nico equipo fsico (por lo general con hardware de clase servidor). Cada sistema operativo invitado piensa (si los sistemas operativos pudieran pensar) que posee el equipo y tiene el uso exclusivo de los recursos de hardware de la computadora (o cualquier subconjunto de los recursos del total de la mquina que se han asignado a la mquina virtual). Cada una de estos sistemas es por lo tanto, ejecutado en una mquina virtual independiente; obteniendo mltiples mquinas virtuales que se ejecutan en el mismo equipo fsico.

33

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.8.3 Ventajas de la Virtualizacin La virtualizacin lleva asociada una serie de ventajas: Consolidacin de servidores. Aumento de la disponibilidad, reduccin de tiempos de parada. Reduccin de los costes de administracin. Mejora de las polticas de backup, recuperacin gil mediante puntos de control de las mquinas virtuales. Aprovechamiento ptimo de los recursos disponibles. Respuesta rpida ante cambios bajo demanda. Continuidad de negocio y recuperacin ante desastres. En caso de fallo de un sistema fsico, los sistemas lgicos all contenidos pueden distribuirse dinmicamente a otros sistemas. Escalabilidad. Crecimiento gil con contencin de costes. Virtual appliance: mquinas virtuales preconfiguradas, cargar y funcionar. Mquinas paquetizadas y preconfiguradas para desempear una funcin determinada (servidores de correo, bases de datos, centralitas VoIP, aplicaciones cerradas). Mantenimiento de aplicaciones heredadas. Aplicaciones propietarias que no han sido adaptadas a las nuevas versiones de sistema operativo. Eficiencia energtica. [VIRT02]

5.8.4 Plataforma para virtualizacin 5.8.4.1 VirtualBox VirtualBox es un virtualizador completo de uso general para el hardware x86. Dirigido a virtualizacin de servidor, de escritorio e incluye su uso, es ahora la nica solucin de virtualizacin de calidad profesional que tambin es software de fuente abierta. Algunas de las caractersticas de VirtualBox son: Modularidad. VirtualBox tiene un diseo extremadamente modular con interfaces de programacin bien definida dentro de un modelo de cliente / servidor. Esto hace que sea fcil de controlar de varias interfaces a la vez: por ejemplo, puede iniciar una 34

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

mquina virtual en un GUI tpico de la mquina virtual y luego controlar esa mquina de la lnea de comandos, o posiblemente de forma remota. VirtualBox tambin viene con un completo kit de desarrollo de software: a pesar de que es software de fuente abierta, no tiene que cortar la fuente para escribir una nueva interfaz para VirtualBox. Descripciones virtuales de la mquina en XML. Las opciones de configuracin de las mquinas virtuales se almacenan enteramente en XML y son independientes de las mquinas locales. Definiciones de mquinas virtuales pueden por lo tanto ser portadas fcilmente a otros equipos reales. Invitado Adiciones para Windows, Linux y Solaris. VirtualBox tiene un software especial que puede ser instalado dentro de las mquinas virtuales de Windows, Linux y Solaris para mejorar el rendimiento y hacer una integracin mucho ms fluida. Dentro de las caractersticas proporcionadas por estas adiciones estn: huspedes integracin del ratn y las soluciones arbitrarias de pantalla (por ejemplo, cambiar el tamao de la ventana de resultados). Tambin hay complementos de evaluacin para OS / 2 con una funcionalidad algo menor. Las carpetas compartidas. Al igual que muchas otras soluciones de virtualizacin, permiten el intercambio de datos entre anfitriones e invitados, VirtualBox permite declarar ciertos directorios de recepcin como "carpetas compartidas", que a continuacin se pueden acceder desde dentro de las mquinas virtuales. 5.9 ENTIDAD CERTIFICADORA 5.9.1 Introduccin La mayor vulnerabilidad en las comunicaciones de hoy en da es el no poder saber a ciencia cierta con quin uno est estableciendo contacto. Existen mtodos para asegurar un canal de comunicacin, sin embargo no sabemos si el canal de comunicacin que hemos abierto, lo hemos abierto con quien deseamos o con algn tercero. Hasta el momento la nica forma para identificarse ante alguien es a travs de una tercera entidad que avale la identidad de la contra parte en la comunicacin. Estos anillos de confianza estn basados en las Entidades Certificadoras, las que avalan la identidad de otras organizaciones o individuos.

35

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

5.9.2 SSL (Secure Sockets Layer) Es la tecnologa de seguridad estndar para el establecimiento de un enlace encriptado entre un servidor web y un usuario. Este enlace asegura de que todos los datos transmitidos entre el servidor web y el usuario se mantengan privados e ntegros. SSL es un estndar de la industria y es utilizado por millones de sitios web en la proteccin de sus transacciones en lnea con sus clientes. El principal problema que tiene SSL es que si no est firmado por una entidad certificadora, el servicio es muy susceptible al ataque MIM (Man in the Middle). Poseer una entidad certificadora que firme todos los certificados SSL del departamento de informtica disminuye el riesgo de MIM de manera considerable. [SSL01] 5.9.3 Definicin La Entidad Certificadora, de ahora en adelante CA (Certificate Authority) es una entidad que emite certificados al firmar con su propia firma digital las firmas de terceros. Un CA debe guardas las llaves, certificados y un registro completo de los certificados que han sido revocados. La firma de un certificado por un CA implica que el CA esta avalando la identidad de la entidad a quien se le firma su certificado, de la misma forma que un notario lo hace en una notara. Las CA se pueden organizar en una jerarqua en la que una organizacin de CA entidades emisoras de certificados son operadas por subordinados dentro de las organizaciones, como una sucursal, divisin o departamento dentro de una organizacin ms grande. 5.9.4 Modo de funcionamiento Las mejores prcticas indican que las terceras entidades deben postular a ser certificadas, una vez que el CA ha comprobado completamente la identidad del tercero, y est dispuesto a avalar su identidad, entonces se emite un certificado digitalmente firmado. 1. Contacto inicial. 2. verificacin de identidad. 3. Emisin del certificado. 36

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

Adicionalmente la firma digital de la entidad certificadora debe estar disponible para ser instalada como certificado de raz por los usuarios. 5.9.5 OSG Registration Authority (OSGRA) La RA OSG opera como parte de la PKI DOEGrids con el fin de proporcionar certificados X509 red de personas y servicios que participan en la Open Science Grid, a partir de julio de 2006. Las polticas que rigen la PKI DOEGrids y el AR OSG se definen en el PP DOEGrids / CPS en http://www.doegrids.org/Docs/CP-CPS.pdf se describen las responsabilidades de los abonados (personas que reciben certificados), las partes que confan (sitios y la gente que acepte el uso de los certificados), adems de la entidad emisora y el personal de la AR. [OSG02] DOEGrids: Autoridad de Certificacin (CA) y de Infraestructura (PKI) clave pblica. X509: El estndar X.509 define qu informacin puede entrar en un certificado, y describe la forma de escribir (el formato de datos).

37

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

6. METODOLOGA
De acuerdo con la documentacin proporcionada por la OSG, para el uso de sus herramientas de computacin grid, hay procesos relacionados con la implementacin de los componentes del nodo que pueden realizarse de forma paralela. Adicional a esto, se contactaron personas con experiencia en el campo de la computacin grid de algunas universidades en el mbito nacional, con el fin de indagar acerca de los diversos procesos que se llevan a cabo en la implementacin de un nodo de este tipo. Analizando la informacin recolectada, determinamos que para la implementacin de nuestro nodo lo ms apropiado es la utilizacin de una metodologa por fases en la cual cada fase comprende un conjunto de tareas diferenciables, algunas de las cuales pueden llevarse a cabo de manera paralela. Las fases definidas son descritas a continuacin:

6.1 Fase 1: Levantamiento de informacin Comprende la investigacin inicial de la informacin sobre los temas necesarios para el inicio del proyecto, en los cuales est incluida la informacin especfica acerca del hardware, software y de red Reunir la documentacin detallada sobre las opciones de software para virtualizacin de servidores y el paquete de software VDT definido por OSG. Solicitar la documentacin detallada sobre el hardware que nos proporciona la Universidad para llevar a cabo el proyecto. Especficamente equipos del laboratorio CECAD. Determinar cul es la mejor opcin de software de virtualizacin de las mquinas para el caso especfico del proyecto.

38

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

6.2 Fase 2: Configuracin del sistema base En esta fase se proceder a la instalacin del sistema operativo sobre el rack, instalacin del software de virtualizacin elegido para la implementacin de las 4 mquinas virtuales, repartiendo los recursos de hardware disponibles, ms el diseo, la implementacin y pruebas de la red privada virtual. 6.3 Fase 3: Servicios extra En esta fase del proyecto se busca implementar los servicios extras que se deben configurar para el correcto funcionamiento del nodo Grid, se configuran los servicios de red, SSH, NFS y de usuarios. 6.4 Fase 4: Middleware La fase middleware comprende la implementacin y configuracin adecuada del software de clusterizacin y del cliente OSG en nuestro caso Globus Toolkit, se investiga sobre la forma correcta de poner en funcionamiento la arquitectura de Globus comprendida bsicamente por tres grupos de servicios y una capa de seguridad, el administrador de recursos Condor, y otra herramientas para asegurar la conectividad y funcionalidad del nodo internamente. 6.5 Fase 5: Computer Element Esta fase comprende el montaje de la mquina CE encargada de ser la interfaz del nodo grid de la Universidad frente a los usuarios que vayan a acceder a este. Tambin se hace la solicitud de los certificados de autenticacin de host y de cliente frente a las entidades certificadoras encargadas de expedirlos. 6.6 Fase 6: Pruebas Se verifica que todas las especificaciones y funcionalidades requeridas para el nodo se encuentren debidamente implementadas. Se aplicarn pruebas bsicas que determina Grid Colombia para los nodos que van a ser integrados a la grid nacional. Adems de esto se disearn pruebas propias que nos permitan hacer la verificacin del rendimiento de nuestro nodo frente a los dems. Adems se la conectividad y 39

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

funcionalidad del nodo externamente con la red de alta tecnologa RENATA y dems nodos de Grid Colombia. 6.7 Fase 7: Documentacin Se proceder a la documentacin pertinente de todo el proceso y se redactar un artculo con los resultados ms importantes del nodo virtualizado. Se hace el cierre oficial del proyecto.

40

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

7. RECURSOS

7.1 HUMANOS

Omar Alejandro Tllez Flechas, estudiante Ingeniera de Sistemas, Universidad Distrital Francisco Jos de Caldas. ngel Ivn Rodrguez Hidalgo, estudiante Ingeniera de Sistemas, Universidad Distrital Francisco Jos de Caldas. Jos Alexander Pabn Ayala, estudiante Ingeniera de Sistemas, Universidad Distrital Francisco Jos de Caldas. Ingeniero Alexis Rojas, Coordinador laboratorio CECAD.

7.2 FSICOS. 7.2.1 HARDWARE

HP RACK PROLiANT DL160 G6 E5504 Hot Plug 2 Procesadores Intel Xeon E5504 Quad-core 2GHz. 24 Gb RAM DDR3 RDIMM.

STORAGE ELEMENT IBM Disco Duro de 1TB SATA IMB Storage Blade 7200 RPM SATA de 3.5

Red de tecnologa Avanzada RENATA a travs de la red bogotana RUMBO.

41

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

7.2.2 SOFTWARE Globus Toolkit Versin 5.0.2 Condor Versin 7.4.3 Oracle Virtual y Nebula o Virtual Box, para creacin de maquinas virtuales. Scientific Linux, CentOS y RedHat como sistemas operativos.

7.3 FINANCIEROS

Debido a que la implementacin es impulsada directamente por la Universidad Distrital los recursos financieros para este proyecto estn disponibles en la infraestructura fsica de la universidad y no se requiere de inversin adicional.

COSTOS MANTENIMIENTO INTEGRANTES Transporte Sostenimiento Papelera Libros Fotocopias Otros Contratiempos $720.000 $1.080.000 $100.000 $300.000 $85.000 $150.000 TOTAL $2.435.000

42

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

8.CRONOGRAMA

43

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

9. REFERENCIAS
1. [GUG] Burke S y otros. gLite 3.1 User Guide Manual Series. CERN-LCGGDEIS-722398, Abril 7 del 2008. 2. [CE01] Cunha Werner James. Grid computing in High Energy Physics using LCG: the BaBar experience. Universidad de Manchester. Londres 2006. 3. [WMS01] Gmez Iglesias Antonio y otros. Workload Management System WMS. 15 y 16 Tutorial Grid de EELA. Mrida (Espaa) 5-8 Octubre 2008, Badajoz (Espaa) 12-14 de Octubre 2008. 4. [NGS01] NGS National Grid Service. Reino Unido. Abril 29 del 2008. Disponible en: http://www.grid-support.ac.uk/ 5. [PTH] Bruno Ricardo. Preparing to Host a Gilda Tutorial. INFN Sicilia 2006 6. [SG] Marn Llorente Ignacio. Introduccin a la Seguridad en un Grid. Departamento de Arquitectura de Computadores y Automtica. Universidad Complutense de Madrid Espaa. 7. [GRID02] Hamar V, Hoeger H -Vctor Mendoza V, Ramrez Y. Grids en la ULA. Universidad de los Andes. Mrida, Venezuela. 15-20 November 2004. 8. [GUILLE01] Guillermo Losilla Anadn 06 de Octubre de http://bifi.unizar.es/events/clustersygrid/slides/Introduccion_al_GRID.pdf 2010

9. [FOSTER01] Foster, Ian, Carl Kesselman. The Grid: Blueprint for a New Computing Infrastructure, 1998 10. [GRID03] Luis Ferreira, Viktors Berstis, Jonathan Armstrong, Mike Kendzierski, Andreas Neukoetter, MasanobuTakagi, Richard Bing-Wo, Adeeb Amir, Ryo Murakawa, Olegario Hernandez, James Magowan, Norbert Bieberstein. Introduction to Grid Computing with Globus, Second Edition, September 2003 11. [FC] Miguel Toledano Ortega, proyecto fin de carrera, Adaptacin a grid computing del mdulo de clculo de disponibilidad de satlites de un sistema de navegacin, Madrid, Septiembre de 2007

44

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

12. [VIRT01] Virtualizacin 06 de Octubre de http://www.microsoft.com/latam/virtualizacion/solution-tech-server.aspx 13. [VIRT03] Virtualizacin del almacenamiento - 06 de Octubre de 2010 14. http://www.microsoft.com/latam/virtualizacion/solution-tech-storage.aspx 15. [VIRT02] Ventajas de la Virtualizacin - 06 http://www.virtualizate.es/virtualizacion_ventajas.html 16. [SSL01] Que es SSL? http://info.ssl.com/article.aspx?id=10241 17. [OSG02] OSG Registration Authority https://twiki.grid.iu.edu/bin/view/OSGRA/ 06 de de Octubre de

2010:

2010

Octubre

de

2010

06

de

Octubre

de

2010

18. [GLOB01] Integracin de Globus Toolkit con los estndares Grid 06 de Octubre de 2010 www.globus.org
19. [ARXI01] Diagrama de la arquitectura de Globus - 10 de Octubre de 2010

http://arxiv.org/ftp/cs/papers/0407/0407001.pdf 20. [GRID01] W. Allcock. GridFTP: Protocol Extensions to FTP for the Grid. GFD-RP.020. Editor Argonne National Laboratory. April 2003. Revised April 2003 21. [OSG01] Open Science Grid Descripcin del proyecto -06 de Octubre de 2010 http://osg-docdb.opensciencegrid.org/0003/000310/002/OSG-ProjDescFinal%20Version.pdf 22. [EELA01] Informacin EELA-06 de Octubre de 2010 http://www.eueela.org/first-phase.php 23. [EELA02] Asociados EELA-06 de Octubre de 2010 eela.org/eela_associated_partners.php http://www.eu-

24. [RENATA01] Objetivos RENATA - 06 de Octubre de 2010 http://www.renata.edu.co/index.php/quienes-somos-identidad-y-objetivos-derenata.html?showall=1 45

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

25. [GRIDCO01] Grid Colombia quienes somos 06 de Octubre de 2010 http://www.gridcolombia.org/index.php?option=com_content&view=article&id=59 &Itemid=76

26. [GRIDCO02] - Grid Colombia: Servicio de Computacin en Grilla Nacional a


travs de RENATA 06 de Octubre de 2010 http://www.renata.edu.co/index.php/proyectos-en-realizacion-convocatorias2009-a-l/1309-grid-colombia-servicio-de-computacion-en-grilla-nacional-a-travesde-renata.html 27. [CLARA] - CLARA Conexiones al Mundo - 06 de Octubre de 2010 http://www.redclara.net/index.php?option=com_content&task=view&id=54&Itemi d=239 28. [MAPA01] - Sitios Adscritos a OSG-06 http://myosg.grid.iu.edu/map/promo?acro de Octubre de 2010

29. [REDES01] Grid Colombia 06 de Octubre http://www.gridcolombia.org/images/gc/mapa_gridcolombia.png

de

2010

46

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

10.

BIBLIOGRAFIA

1. Mark Baker, Rajkumar Buyya, Domenico Laforenza. Grids and Grid technologies for wide-area distribuided computing. 2002. Disponible en: www.globus.org/papers/gridtech.pdf 2. Ian Foster, Carl Kesselman, Steven Tuecke. The Anatomy of the Grid, Enabling Scalable Virtual Organizations, Intl J. Supercomputer Applications, 2001. 3. IBM, Grid solutions for Data Intensive Computing. IBM 2005. 4. Verstis Viktors. Fundamentals of Grid Computing. Redbooks Papers. IBM. Austin Texas. 2002. 5. Miguel Toledano Ortega, proyecto fin de carrera, Adaptacin a grid computing del mdulo de clculo de disponibilidad de satlites de un sistema de navegacin, Madrid, Septiembre de 2007 6. Mitch Tulloch with the Microsoft Virtualization Teams, Understanding Microsoft, Virtualization Solutions from the desktop to the Datacenter 2 Second Edition, Copyright 2010 by Microsoft Corporation 7. VirtualBox - 10 de Octubre de 2010 http://www.virtualbox.org/wiki/VirtualBox 8. Nicols Troncoso Carrre Entidad Certificadora y Polticas Pertinentes Seguridad de Sistemas, Departamento de Informtica, Universidad Tcnica Federico Santa Mara Valparaso, 25 de noviembre de 2005 9. John Bresnahan, Argonne National Laboratory Intro to GridFTP, October 2006 10. Igor Mandrichenko, FNAL (editor). GridFTP Protocol Improvements. GWD-E. GridFTP WG. July 3, 2003. Revised July 11, 2003 11. Cunha Werner James. Grid computing in High Energy Physics using LCG: the BaBar experience. Universidad de Manchester. Londres 2006. 12. Burke S y otros. gLite 3.1 User Guide Manual Series. CERN-LCG-GDEIS722398, Abril 7 del 2008. 47

__________________________________________________________________________

Universidad Distrital Francisco Jos de Caldas

13. Estndar X.509 - 06 de Octubre de 2010 http://download-llnw.oracle.com/javase/1.3/docs/guide/security/cert3.html

48

Vous aimerez peut-être aussi