Vous êtes sur la page 1sur 8

Plan du cours

Les grilles informatiques


Nouredine.Melab@lifl.fr

Les grilles informatiques : concepts et infrastructures

La grille nationale Grid5000

Membre du comit national de pilotage de Grid5000

Modles de programmation et intergiciels pour le grilles


Etude de cas : Globus et MPICH-G2

Taxinomie et applications des grilles

Systme distribu

Les grilles informatiques


Concepts et infrastructures

Evolution des systmes distribus vers les grilles


Tentative de dfinition
Principales infrastructures de grilles existantes
Les grilles dans les mondes de la recherche et de
lentreprise

Exemple de meta-systme

Meta-systme = ensemble de ressources


htrognes rparties grande chelle

pouvant cooprer pour excuter des codes


rpartis

Le meta-systme est

vu comme une machine


virtuelle parallle sur un
systme distribu

SAN

CASA: Distribute large computations among several


supercomputers linked with a Gigabit network (1990 1995)
Deux sujets dtude :

Algorithmes et implantations
de calcul intensif distribus

Impact des rseaux rapides


longue distance sur le calcul
intensif distribu

LAN

Cluster of PCs
WAN
SAN

Cluster of PCs

Storage Area Network

Petite chelle gographique, homognes, monodomaine dadministration


Types de ressources : CPUs, disques, logiciels, etc.

A distributed system is a collection of independent computers that appear to the


users of the system as a single computer . A. Tanenbaum, Prentice-Hall, 1994

Meta-systme (metacomuting)

N ordinateurs autonomes (sites)


et un rseau dinterconnexion
Vue utilisateur : un seul systme (virtuel)
Systmes distribus traditionnels

Supercomputer

Visualization

A montr le besoin dun


middleware (intergiciel) de
Grille !

Lexprience grande chelle I-WAY (1995)

Notion de grille exprimentale

Point de dpart du Grid Computing

GUSTO: Globus Ubiquitous Supercomputing Testbed Organization


(1995-2000)
Une plate-forme de test pour les 1er prototypes de middleware de grille
125 sites, 23 pays
Un des plus grands systmes de calcul distribu jamais construit

Dautres types de ressources


Super-calculateurs et priphriques de visualisation
(caves de ralit virtuelle immersive, instruments
dobservation) rpartis sur 17 sites

A montr la faisabilit
dun systme trs grande
chelle !

Source : Linda Winkler and Richard Foster

Notion de grille de production


Data-GRID: Next generation of scientific exploration, with
intensive computing and analysis of shared large scale
datasets, across widely distributed scientific communities (2001-2003)

Les grilles informatiques


Concepts et infrastructures

Projet Europen :
15 pays dEurope 21 organisations 200 personnes
100 To 1 Po
Domaines dappli. :
Physique, biologie,
sciences de lenv.

Bti sur Globus-II

A montr lutilit des


grilles de donnes et leur
manque de robustesse !

Le concept de grille lectrique

Approche pour la distribution de la puissance lectrique =


le rseau lectrique et la haute-tension
Obtention de la puissance lectrique via une prise de courant
Transparence la localisation et la technologie de fabrication

Evolution des systmes distribus vers les grilles


Tentative de dfinition
Principales infrastructures de grilles existantes
Les grilles dans les mondes de la recherche et de
lentreprise

Le concept de grille informatique

Approche pour la distribution de la puissance informatique =


le rseau Internet et la haute-performance
Obtention de la puissance informatique via une prise rseau
Transparence la localisation et la technologie des ressources

Ralit invisible lutilisateur


Lutilisateur ne peroit pas larchitecture sous-jacente de la
grille (son middleware la masque)
O sont stockes mes donnes ?
O sont lancs mes calculs ?

Dfinition dIan Foster et al.

Ne pas sen soucier !!

GRID

Partage scuris et coordonn de ressources


(gographiquement rparties) entre collections
dynamiques dindividus et dinstitutions
(organisations virtuelles)
Dans The Anatomy of the Grid: Enabling Scalable Virtual
Organizations, Ian Foster,

Lutilisateur se contente de soumettre des requtes la grille !

Autre dfinition (N. Melab, HDR,


USTL, Novembre 2005) - Caractristiques

Multi-domaine dadministration

Pourquoi maintenant ?

Scurit (passage de pare-feu), diffrents systmes


dordonnancement, ...

Grande chelle
Dlais de communication importants,

Volatile (disponibilit variable et pannes des machines)


Dcouverte de ressources, check-pointing, re-

Evolution des mthodes de travail et de


rsolution de problmes vers plus de collaboratif
Evolution des rseaux en termes de dbit et de
latence

ordonnancement, ...

Htrogne (systmes, rseaux, machines, etc.)

La vitesse des rseaux double tous les 9 mois

LInternet fournit une connectivit universelle

1986 2000

2001 2010

Equilibrage de charge, mesure de performances, ...

Ordinateurs x 500, Rseaux x 340,000


Ordinateurs x 60, Rseaux x 4000

Principales infrastructures

Les grilles informatiques


Concepts et infrastructures

Evolution des systmes distribus vers les grilles


Tentative de dfinition
Principales infrastructures de grilles existantes
Les grilles dans les mondes de la recherche et de
lentreprise

Grid5000 : la grille franaise

DAS3 : la grille hollandaise

Naregi : la grille japonaise

TeraGrid : une grille amricaine

PlanetLab : une grille plantaire

DAS : la grille hollandaise


Distributed ASCI Supercomputer (DAS2)

Grid5000 : la grille exprimentale franaise


Grappe de grappes interconnectes par Renater 4 (10Gbps)

Install dbut 2002

VU (72 nodes)

UvA (32)

Fournisseur : IBM
Proc. Dual 1-GHz Pentium-III
Rseau : Myrinet/Surfnet
Systme : Linux

SurfNet

Ordonnanceur : SGE
Globus install

Delft (32)

Leiden (32)

Utrecht (32)

DAS-3

DAS2-3

UvA/MultimediaN (46)

VU (85 noeuds)

DAS2-3 est exprimental (comme Grid5000)

UvA/VL-e (40)

DAS2-3 est une grappe de grappes (comme Grid5000)


SURFnet6

Oprationnel depuis oct. 2006


272 nuds AMD Opteron
792 cores, 1To memory
Plus htrogne que DAS-2

10 Gb/s lambdas

TU Delft (68)

Proc. 2.2-2.6 GHz


Nuds single/dual core

Leiden (32)

Myrinet-10G (except Delft)


Gigabit Ethernet

Rservation

non disponible (diffrent de Grid5000)


Slot de 15 minutes maximum dans la journe
Pas de contrainte pour la nuit et le Week-End

Reconfigurabilit
Les nuds sont non reconfigurables (diffrent de Grid5000)

DAS2-3 est moins htrogne que Grid5000


Echelle de la grille
DAS2-3 a moins de nuds et moins de sites que Grid5000

Franck
Cappello

DAS3 Grid-5000

Naregi : la grille japonaise

DAS
Grid5000
NAREGI

NAtional REsearch Grid Intiative (NAREGI) Japan (11 sites)


Distributed ASCII Supercomputer 2 (DAS2) Pays Bas (5 sites)

Comparaison avec Grid5000

Naregi : la grille japonaise

Naregi est un peu plus quexprimental


Naregi est plus htrogne que Grid5000
Reconfigurabilit
Les nuds sont non reconfigurables (diffrent de
Grid5000)

Echelle de la grille
Naregi a moins de nuds mais plus de sites que
Grid5000

Naregi Grid-5000

Franck
Cappello

TeraGrid

La plus large interconnexion de supercalculateurs dans le monde

DAS
Grid5000

NAREGI
Naregi

NAtional REsearch Grid Intiative (NAREGI) Japan (11 sites)


Distributed ASCII Supercomputer 2 (DAS2) Pays Bas (5 sites)

Pittsburgh Supercomputing Center

Echelle

Taille

http://www.teragrid.org

NCSA: National Center for Super-computing


Applications

3000 processeurs

6 TeraFlops (6 trillion
doprations flottantes par
seconde)
Peut faire en 3h ce quun PC
fait en un an

Echelle

1 terrain de basket

Puissance de calcul

The Terascale Computing System (TCS) at the


Pittsburgh Supercomputing Center

Une grille amricaine


National Science Foundation

Architecture

1774 processeurs
Intel Itanium2

Puissance de calcul

10 TeraFlops

The TeraGrid cluster at NCSA

TeraGrid est plus htrogne que Grid5000

TACC: Texas Advanced Computing Center

Echelle

Architecture

Intel Xeon

Puissance de calcul

Grappes Intel/Linux
Grappes Alpha SMP
Grappes IBM POWER3 and POWER4
SGI Altix SMPs
Systmes de visualisation SUN
Cray XT3
IBM Blue Gene/L

1024 processeurs

6 TeraFlops

The TeraGrid cluster LoneStar at TACC

Une grille plantaire : PlanetLab

Ressources de TeraGrid
ANL/
UC

Caltech
CACR

IU

NCSA

ORNL

PSC

Purdue

SDSC

TACC

Itanium2

Itanium2

Itanium2

Itanium2

(0.8 TF)

(0.2 TF)

(10 TF)

IA-32
(0.3 TF)

Hetero
(1.7 TF)

(4.4 TF)

IA-32
(6.3 TF)

IA-32
(2.0 TF)

SGI SMP
(6.5 TF)

XT3
(10 TF)
TCS
(6 TF)
Marvel
(0.3 TF)

Itanium2

(0.5 TF)

Power4
(1.1 TF)

Sun
(Vis)

32 To

600 To

150 To

540 To

50 To

Stockage de
masse

1.2 Po

3 Po

2.4 Po

6 Po

2 Po

Collections
de donnes

Oui

Oui

Oui

Oui

Ressources
de calcul

IA-32
(0.5 TF)

Stockage en 20 To
ligne

155 To

Visualisation Oui
Instruments
Rseau
(Gb/s,Hub)

30
CHI

1 To

Oui

Oui
Oui

Oui

30
LA

10
CHI

Oui

Oui

30
CHI

10
CHI

Oui

Oui
30
CHI

10
ATL

30
LA

10
CHI

PlanetLab est une grille de production (diffrent de Grid5000)


711 noeuds sur 338 sites de 25 pays
Beaucoup plus large mais a moins de nuds que Grid5000

PCs distribus (non pas une grappe de grappes) diffrent de Grid5000


Non reconfigurable (diffrent de Grid5000)

Grilles en entreprise

Entreprises intresses (1)

Les grilles informatiques


Concepts et infrastructures

Fournisseurs de ressources (et rseaux)

entreprises (ex : CGG) possdant un grand nombre de


ressources peu utilises

souci de rentabilit

Fournisseurs de services

Evolution des systmes distribus vers les grilles


Tentative de dfinition
Principales infrastructures de grilles existantes
Les grilles dans les mondes de la recherche et de
lentreprise

permanents : diteurs de logiciels (ex : SUN Sun Grid


Engine)
ponctuels en utilisant les technologies ASP (service la
demande)
de conseil, dveloppement, maintenance, migration, etc. (ex :
ATOS)

CGG : Compagnie Gnrale de Gophysique (appli. sismologiques, )

Grilles en entreprise

Profils/dbouchs en Grid Computing

Entreprises intresses (1)


Demandeurs dapplications pour les grilles

entreprises ayant besoin dun grand nombre de


ressources (ex : EDF, EADS, )
amlioration de la performance des applications
pour rester comptitif

Exploitation (gestion et volution) de grilles

Adaptation, dveloppement et installation de middlewares

besoin de migration des applications (


gridification ) pour les adapter aux grilles

Conception, dploiement et administration dinfrastructure


de grille

besoin de mise en grille de ressources

Conception, dveloppement et gridification


dapplications
Conseil - Etude dopportunit, expression des besoins,
cahier des charges
Matrise duvre et assistance la matrise duvre

Grilles pour la recherche :

Grilles pour la recherche :

Aladdin : Initiative INRIA (1)

Aladdin

Dfis scientifiques 2007-2011 / Groupes de travail

A LArge-scale DIstributed and Deployable INfrastructure

Dfis scientifiques 2007-2011 / Groupes de travail

Aladdin : Initiative INRIA (1)

Rendre l'utilisation et la programmation des systmes distribus


grande chelle rellement transparents, srs et efficaces
Etre capable de garantir un contrat de service l'utilisateur (QoS,
disponibilit, fiabilit, robustesse, performance, etc.)

Rendre l'utilisateur confiant envers l'infrastructure (avoir confiance


dans les rsultats, dans la scurit, etc.)
Savoir exploiter efficacement des systmes grande chelle
composs de ressources fortement htrognes et hirarchiques

Savoir composer et orchestrer efficacement un trs grand nombre


de services (au sens large)
Savoir modliser les systmes grande chelle et valider leurs
simulateurs
Rendre les applications extensibles pour leur excution efficace sur
des systmes grande chelle (algorithmique, programmation,
modle d'excution, etc.)
Optimiser la construction et l'utilisation des interconnexions
dynamiques de ressources autonomes htrognes et en
comprendre le comportement
Grer et exploiter les grands volumes d'informations (recherche
d'information, fouille, classification, gestion des donnes, scurit,
bases de donnes, algorithmique, visualisation, entrepts et bases
de donnes, ...) avec des applications en web, imagerie, sant,
environnement, etc.

Grilles pour la recherche :

Projets majeurs de Grid (1)

Institut des grilles : Initiative CNRS

Cr par le CNRS le 1er septembre 2007

http://idgrilles.lal.in2p3.fr/

Inauguration prvue pour les 3-4 dcembre 2007

Composition

Communaut Grid5000 (recherche sur le Grid Computing)


Grille exprimentale
Communaut grille de production (IN2P3, CEA, )

Name
Access Grid

URL & Sponsors

Focus

www.mcs.anl.gov/FL/
accessgrid; DOE, NSF

Create & deploy group collaboration


systems using commodity technologies
Grid testbed linking IBM laboratories

BlueGrid

IBM

DISCOM

www.cs.sandia.gov/
Create operational Grid providing access to
discom
resources at three U.S. DOE weapons
DOE Defense Programs laboratories

DOE Science
Grid

sciencegrid.org
DOE Office of Science

Create operational Grid providing access to


resources & applications at U.S. DOE
science laboratories & partner universities

Earth System
Grid (ESG)

earthsystemgrid.org
DOE Office of Science

Delivery and analysis of large climate


model datasets for the climate research
community

European
Union (EU)
DataGrid

eu-datagrid.org
European Union

Create & apply an operational grid for


applications in high energy physics,
environmental science, bioinformatics

Projets majeurs de Grid (2)


Name

URL/Sponsor

Projets majeurs de Grid (3)


Focus

EuroGrid, Grid
Interoperability
(GRIP)

eurogrid.org
European Union

Create tech for remote access to


supercomp resources & simulation codes;
in GRIP, integrate with Globus Toolkit

Fusion
Collaboratory

fusiongrid.org
DOE Off. Science

Create a national computational


collaboratory for fusion research

Globus Project

globus.org
DARPA, DOE,
NSF, NASA, Msoft

Research on Grid technologies;


development and support of Globus
Toolkit; application and deployment

GridLab

gridlab.org
European Union

GridPP
Grid Research
Integration Dev. &
Support Center

Name

Focus

hipersoft.rice.edu/
grads; NSF

Research into program development


technologies for Grid applications

Grid Physics
Network

griphyn.org
NSF

Technology R&D for data analysis in


physics expts: ATLAS, CMS, LIGO, SDSS

Information Power
Grid

ipg.nasa.gov
NASA

Create and apply a production Grid for


aerosciences and other NASA missions

Grid technologies and applications

International
Virtual Data Grid
Laboratory

ivdgl.org
NSF

Create international Data Grid to enable


large-scale experimentation on Grid
technologies & applications

gridpp.ac.uk
U.K. eScience

Create & apply an operational grid within


the U.K. for particle physics research

Network for
Earthquake Eng.
Simulation Grid

neesgrid.org
NSF

Create and apply a production Grid for


earthquake engineering

grids-center.org
NSF

Integration, deployment, support of the


NSF Middleware Infrastructure for
research & education

Particle Physics
Data Grid

ppdg.net
DOE Science

Create and apply production Grids for


data analysis in high energy and nuclear
physics experiments

Projets majeurs de Grid (4)

Rfrences/remerciements

Name

URL/Sponsor

Grid Application
Dev. Software

URL/Sponsor

Focus

TeraGrid

teragrid.org
NSF

U.S. science infrastructure linking four


major resource sites at 40 Gb/s

UK Grid Support
Center

grid-support.ac.uk
U.K. eScience

Support center for Grid projects within


the U.K.

Unicore

BMBFT

Technologies for remote access to


supercomputers

Voir aussi www.gridforum.org

The GRID 2 Blueprint for a New Computing Infrastructure. Edited


by Ian Foster and Carl Kesselman, Elsevier, Morgan Koffman, 2004.

The Globus alliance documentation

Prsentation de lACI GRID

Les technologies pair pair

Peer-to-Peer Computing

http://www.globus.org/
Thierry Priol (IRISA, Rennes)
Bruno Richard (HP labs., Grenoble)
D-S. Milojicic, V. Kalogeraki, R. Lukose, K. Nagaraja, J. Pruyne, B.
Richard, S. Rollins, Z. Xu, HP Labs technical report HPL-2002-57
http://www.hpl.hp.com/techreports/2002/HPL-2002-57.pdf

Cours de Stphane Vialle

Professeur Suplec - Metz

Vous aimerez peut-être aussi