Vous êtes sur la page 1sur 39

DESCRIPTIF DES BESOINS DE CALCULS SCIENTIFIQUES SUR ARCHITECTURE DEDIEE

Institut de recherche pour le dveloppement

DEMANDE DES UNITES DE RECHERCHE 103 ET 65 DU CENTRE DE NOUMEA, SEPTEMBRE 2004

Groupe de travail
Pascal Douillet, resp. Scientifique UR 103 (Douillet@noumea.ird.nc) Alexandre Ganachaud, resp. Scientifique UMR 65 (Ganachaud@noumea.ird.nc) Jrme Lefvre, resp. Informatique UMR 65 / UR 103 (Lefevre@noumea.ird.nc) Michel Mnzo, resp. Informatique IRD, Centre Nouma (Menezo@noumea.ird.nc)

Avec la participation de : Franck Delmas, IFREMER Brest (Code MARS 3D) Patrick Marchesiello, IRD Brest (Code ROMS)

SOMMAIRE
1. Objet....................................................................................................................... 2 2. Besoins en calculs intensifs des UR 65 (Legos) et 103 (Camelia).................... 3 2.1. Thmes de recherche de lUMR 65 .................................................................. 3 2.2. Thmes de recherche de lUR 103 ................................................................... 5 2.3. Les types dutilisation ....................................................................................... 8 3. Dfinition du matriel informatique adapt aux besoins................................... 9 3.1. Critres de dfinition......................................................................................... 9 3.2. Configuration matrielle propose et offres.................................................... 10 3.3. Avantages / inconvnients.............................................................................. 14 3.3. Loffre OS ....................................................................................................... 15 3.4. Comptences et demande dassistance ........................................................ 17 4. Exemple de plateformes de calcul ddies la dynamique des fluides installes dans dautres organismes de recherche publique en France ........... 18 4.1. Tour dhorizon des plateformes de calcul ....................................................... 18 4.2. Quelques exemples de plateformes utilises pour des applications CFD (Computational Flow Dynamic).............................................................................. 18 Bibliographie ........................................................................................................... 20

ANNEXE 1 Dtail des deux configurations matrielles fondes sur des nuds bi-processeurs ANNEXE 2 Dpouillement des offres commerciales ANNEXE 3 Extrait des notes dvaluation des performances de calcul des machines disponibles localement en vue de limplantation du code ROMS au Centre de Nouma ANNEXE 4 Le modle hydrodynamique Mars ANNEXE 5 A propos du processeur AMD Opteron

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

1. Objet
Le prsent dossier expose les besoins en matriel de calcul scientifique intensif exprims par les UR 103 (CAMELIA) et UMR 65 (LEGOS) du centre IRD de Nouma. Les activits de recherche des UR 103 et 65, axes respectivement sur les consquences des activits anthropiques sur les eaux marines ctires en milieu tropical insulaire et sur ltude de la circulation ocanique lchelle du Pacifique Sud-Ouest, emploient des modles numriques de circulation grande et petite chelle, bass sur la mthode des diffrences finies. Les chelles des phnomnes tudis et des domaines couverts ncessitent un minimum de moyens de calcul pour tre effectus sur place. Les rcentes et futures simulations portent galement sur lintgration dans les modles de circulation de modules sdimentaires, biologiques et gochimiques, certains mis au point localement. Ces dveloppements impliquent une augmentation de la charge de calcul, assure jusquici au moyen de station de travail. Les besoins actuels et exprims court terme impliquent des dlais de calcul draisonnables avec les moyens actuels. Dautre part, les pays insulaires de la rgion sont intresss par des simulations numriques dans leur lagon ou autour, et le renforcement de projet rgionaux impliquera une augmentation des demandes locales. Ce dossier expose en premire partie les besoins de chaque UR, replacs dans le contexte scientifique et technique. En seconde partie, une tude technique prsente le matriel informatique que nous croyons adapt ces besoins et les comptences ncessaires pour sa mise en place et son administration. Des tableaux financiers accompagnent lvaluation des solutions retenues ainsi que leur principaux avantages/inconvnients. Le troisime volet prsente des exemples de solutions de calculs, utiliss dans le cadre de thmatiques scientifiques similaires.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

2. Besoins en calculs intensifs des UR 65 (Legos) et 103 (Camelia)


Les deux UR ont en commun demployer des codes de calcul portant sur la modlisation de la circulation hydrodynamique, avec le modle ROMS (Regional Ocean Modelling System) pour lextrieur du lagon (UMR 65) et M A R S pour lintrieur du lagon (UR 103).

2.1. Thmes de recherche de lUMR 65


Le groupe ECOP rattach au Laboratoire en Etudes Gophysiques et Ocanographie Spatiale (LEGOS) dveloppe actuellement une tude de la circulation ocanique rgionale sur l'ensemble du Pacifique Sud-Ouest avec un zoom autour de la Nouvelle Caldonie et des les de Polynsie Franaise. Cette tude inclura des mesures satellites. En 2005, un modle oprationnel devrait tre produit, imbriqu dans les champs de prvision du projet oprationnel Franais MERCATOR. Lexercice de ces thmatiques ncessite lemploi dun modle numrique de circulation capable la fois de restituer la rponse des phnomnes climatiques de variabilit annuelle et inter-annuelle observe lchelle rgionale et rendre compte de la circulation ctire lapproche des archipels de NouvelleCaldonie et de la Polynsie Franaise. Les enjeux conomiques pour les activits de pche hauturires et les activits environnementales ncessitent daboutir une restitution et une prvision de lvolution des fronts thermiques et halins et des champs de vitesse une chelle ctire. Ce projet d'ocanographie ctire est cofinanc par le programme ZoNeCo (Nouvelle Caldonie), le Ministre de l'Outre Mer et l'IRD. Le modle ROMS a t retenu dans le cadre de ces chantiers. Ce code 3D et qui emploi un schma aux diffrences finies, est dvelopp sous la supervision dHerman Arango et Dale Haidvogel (Universit Rutgers, New-Jersey). Au sein de lIRD, Patrick Marchesiello et Pierrick Penven (UR097, IRD Brest), apportent leur contribution lvolution du code. Parmi les dernires options innovantes du code, citons les fonctions de zoom et de raffinement (logiciel AGRIF, INRIA) issues du travail collaboratif entre lIRD, lINRIA et lUCLA (University of California at Los Angeles). Cet outil, condition de disposer de moyens de calculs adapts, permet de concevoir sereinement la modlisation des coulements ctiers une chelle approprie (de lordre de 1 2 km la cte et 10 km au large) en recourant aux fonctions de zoom. Aspects informatiques du code Ds les premires versions, le code a t paralllis pour bnficier des plateformes mmoire partage (Sun, SGI, etc). Le code comprend les directives OpenMP, pour tre employ sur ce type de plateforme.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

Lalgorithme de calcul fait galement appel la bibliothque d'changes de messages MPI (Message Passing Interface) pour les architectures mmoire distribue (grappe de PC). La technique de paralllisation consiste dcomposer le domaine de calcul en sous domaines, de manire explicite. Avant compilation du programme, lutilisateur dclare un nombre de sous domaine gal au nombre de processeurs (ou multiple, pour les plateformes mmoire partage). Chaque processus parallle gre alors de manire autonome son propre sous domaine et est dfini une seule fois pour tout le reste de lexcution du programme. La mthode de paralllisation est particulirement efficace et offre une grande scalabilit (augmentation linaire de la performance avec le nombre de processeurs). Localement, le compilateur fortran Intel Version 8 (qui supporte les directives OpenMP) a t employ pour des tests prliminaires (cf Annexe 3). Le code a t excut en mode parallle sur un bi-processeur Pentium III sous Linux et les performances compares avec des plateformes monoprocesseurs plus rcentes. Les temps de calcul obtenus sur une grille comportant 544 000 points sont les suivants :
Fig.1 Temps de calcul observs pour 3 machines testes au centre de Nouma Configuration Tiki Pentium III Bi-Processeur
1002 Mhz, cache 256 ko, SSE oui, SSE2 non, HT non Mmoire : SDR 133 Mhz 1,5 GO

Nb CPU 1 x 1002 Mhz 2 x 1002 MHZ 1 x 1615 Mhz

1 itration 36,5 s 13 s 7s

1 mois 50,5 heures 18,0 heures 9,7 heures

1 anne 606 heures 216 heures 116.4 heures

Boris Pentium IV
1615 Mhz, cache 512 ko, SSE oui, SSE2 oui, HT non Mmoire : DDR 266 Mhz 512 MO

Pentium IV P4P8X
2940 Mhz, cache 512 ko, SSE oui, SSE2 oui, HT oui Mmoire : DDR 333 Mhz 512 MO

1 x 2940 Mhz

4,7 s

6,5 heures

78 heures

Les rsultats obtenus au cours des tests mettent en relief : - le gain vident de performance de calcul en mode paralllis (Fig. 1), qui montre les perspectives daugmentation de la vitesse dexcution sur un cluster compos de machines rcentes, qui plus est compos de nud bi-processeur - le gain apprciable apport par le partitionnement du domaine, qui permet daboutir un jeu de bloc de donnes de taille quivalente la mmoire cache. Lexcution du code sen trouve amliore (cf. Annexe 3).

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

Adquation des moyens avec les objectifs Il apparat que les dernires machines du Centre constitues de pentium IV monoprocesseur sont suffisantes pour lexcution du code sur des domaines moyenne chelle, dans le cas dune rsolution infrieure 1/10 et des priodes simules de quelques mois. Par exemple, 6 mois de simulation sur une machine cadence 3 GHz ncessiterait 36 heures. Au-del, dans le cadre de ltude affine de processus ctiers ncessitant lemploi de maillages imbriqus avec une rsolution plus fine (1 2 km) et pour des priodes dintgration plus longue (recherche dun tat dquilibre, ncessitant plusieurs annes dintgration, par exemple), les temps de calculs deviennent difficilement acceptables. En effet, les fonctions de zoom pnalisent lexcution du code, en fixant un pas de temps adapt avec la maille la plus petite. De mme, si lon active les modules biologique, sdimentaire et biochimique. Les solutions envisageables sont alors celles pour lesquelles le code est prvu, multiprocesseur ou grappe de PC (cluster).

2.2. Thmes de recherche de lUR 103


LUnit de Recherche 103 (Camlia) tudie linfluence des apports terrignes et anthropiques sur les lagons de Nouma et de Suva (Fidji). Les principales questions scientifiques poses sont les suivantes :
Quels sont les mcanismes de transport et de transformation des principaux agents dinfluence terrignes et anthropiques au niveau de la zone ctire tropicale ? Quels sont les effets des apports terrignes et anthropiques en terme deutrophisation des systmes et de bioaccumulation des mtaux dans les organismes marins ? Dans quelle mesure la modlisation permet-elle de rendre compte de ces mcanismes de transport et de transformation ?

LUR Camlia a pour objectif principal de dterminer comment lhomme influence les cosystmes littoraux du Pacifique. Dans ce cadre, Camlia sintresse plus spcifiquement aux apports :
en particules entranes par lrosion des sols et sous-sols qui sont responsables du processus dhypersdimentation, en lments nutritifs organiques et inorganiques qui sont responsables du processus deutrophisation, en mtaux qui peuvent savrer potentiellement toxiques pour les organismes vivant dans le lagon.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

Les actions de recherche ont t dfinies de faon apporter des rponses aux questions scientifiques suivantes :
Quels sont les mcanismes de transport et de transformation des principaux agents dinfluence terrignes et anthropiques au niveau de la zone ctire tropicale ? Quels sont les effets des apports terrignes et anthropiques en terme deutrophisation des systmes et de bioaccumulation des mtaux dans les organismes ? Dans quelle mesure la modlisation permet-elle de rendre compte de ces mcanismes de transport et de transformation ?

Pour rpondre ces questions, lUR mise en place un rseau de modles numriques couvrant les diffrents domaines de recherche. A la base, nous avons dvelopp un modle hydrodynamique du lagon sud-ouest partir du modle MARS3D de lIFREMER, le modle de gnration et de propagation des vagues WaveWatch III a ensuite t adjoint. Depuis nous avons coupl ces deux modles un modle de transport des vases et sables. Un modle de production primaire coupl au modle hydrodynamique est en cours de dveloppement dans le cadre de la thse de Vincent Faure (Univ. Marseille) et devrait tre oprationnel dbut 2005. Enfin lUR travaille sur les possibilits dadaptation dun modle atmosphrique la Nouvelle-Caldonie et au lagon sud-ouest.

Bathymtrie
1980-90s

Mare
1998

Circulation msochelle

Vent
Modle 3D 2004

Courants
Modle 3D 1999

Vagues Turbulence
l -> k-l 2004 Modle Wavewatch III 2002-2003

Transport particulaire
Modle Vases 2000-2003 Modle Sables 2001-

Modle Biogochimique

Fig. 1 Organisation des activits de modlisation physique au sein de lUR Camlia. La circulation msochelle na pas dinfluence sur la circulation dans le lagon sudouest, qui nest ouvert lextrieur quau niveau des passes.

Le modle MARS 3D (Cf. Annexe 4) est un modle tri-dimensionnel qui utilise un schma aux diffrences finies surface libre. Il est dvelopp par lIFREMER
Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

(Pascal Lazure), qui lapplique sur les faades ctires Franaise. Les quations hydrodynamiques sont portes sur un maillage isotrope. Le code comporte galement des fonctions de zoom et de raffinement (Logiciel AGRIF). Loutil est destin servir de module hydrodynamique principal appliqu au lagon de NouvelleCaldonie et de Fidji. Les dveloppements portent sur lintgration de modules particulaires, biologiques et bio-gochimiques. . Le modle du lagon sud-ouest de Nouvelle Caldonie couvre une zone de 170 km de long sur 50 km de large. Les grilles du maillage ont actuellement une taille de 500 mtres mais seront augmentes de manire sadapter la physique des phnomnes tudis et la bathymtrie, marque par de fort gradient de pente. La rsolution verticale est de 21 niveaux. Les travaux de mise au point et de couplage au modle hydrodynamique des modules particulaires, biologiques la prise en compte de nouveaux paramtres tel le dplacement des larves aboutira une augmentation des paramtres et des quations rsoudre numriquement. Ltude du transport particulaire et de la production primaire est au stade de la comprhension des processus. Cette phase implique la multiplication des runs avant daboutir des modles calibrs et valids. Aspects informatiques du code La version officielle du code MARS 3D incorpore dj les directives de compilation OpenMP permettant son excution parallle sur une architecture mmoire partage. Franck Dumas (IFREMER) dveloppe actuellement la version MPI de MARS. Les tests raliss sur un cluster de PC montre une bonne performance dexcution du code (speed-up de lordre de 13 pour une configuration 16 processeurs) et des conditions de simulation ralistes sur grande grille (400 x 500 mailles). Bien que le projet soit ltat de prototype, une version excutable sur plateforme mmoire distribue devrait tre disponible dans quelques mois.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

2.3. Les types dutilisation


Les objectifs dtudes de la circulation ctire mobilisant la ressource de calculs se traduisent par exemple de la manire suivante pour le code ROMS (UMR 65) :
Courant 2004, 2me semestre

- Etude des vnements dUpwelling : Identification des sources de forage et rponse hydrodynamique du phnomne sur la cte Ouest de la Nouvelle-Caldonie. Scnarios saison froide / saison chaude pour diffrentes conditions de vent. - Dveloppement du modle ROMS sur un maillage ferm par les latitudes 10 S et 26 S et par les longitudes 153 et 180 E autour de la Nouv elle-Caldonie. Elaboration dune bathymtrie adapte aux chelles des domaines et phnomnes physiques tudis. Prparation et validation des donnes climatologiques disponibles et runs pour vrification prliminaire de la qualit des solutions.
Courant 2005 (Sous condition de moyens de calculs ddis)

- Prparation des maillages embots par mthode de zoom (passage progressif de 10 km une rsolution la cote de 1 km) et vrification des conditions de convergence / critres de stabilit aux zones frontires. - partir dune solution stable, tude de la circulation ctire sous leffet du vent, des flux de chaleur, de la mare .... Amlioration des connaissances sur les phnomnes ctiers localiss (Upwelling, dynamique des structures thermo-halines, ondes internes, variabilit saisonnire des champs de temprature et courant ). Scnario et runs tests pour analyse des processus et qualit des solutions en fonction des donnes climatologiques et de forage
2005/2006

- Extraction des conditions aux limites de MERCATOR sur la zone rgionale (Utilisation de l'interface dveloppe par P. Marchesiello, Pierrick Penven et V. Echevin (IRD)). Etablissement dune circulation gnrale stable et cohrente et analyse de la circulation basse et haute frquence, apport du forage ocanique sur les conditions de circulation ctire. Validation / Calibration des solutions - Etablissement dune plateforme dOcanographie oprationnelle applique la Nouvelle-Caldonie. Cette dmarche applique la Nouvelle-caldonie est galement prvue dans le cas de ltude de la circulation ctire dans la ZEE de la Polynsie Franaise.

Dans le cas du code MARS 3D (UR 103), les diffrentes tapes de mise au point des modles et de leur calage mobiliseront la ressource dans une proportion quivalente. La mise au point du modle de production primaire, sa validation laide dimagerie spatiale ncessitera en 2005 lutilisation intensive de ce cluster. Le dveloppement du modle atmosphrique demandera, pour sa mise au point, de fortes capacits de calcul en 2005 et 2006. En 2005 et 2006 les rsultats du chantier Caldonien, en terme de modle, seront transpos au chantier Fidjien.
Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

3. Dfinition du matriel informatique adapt aux besoins


3.1. Critres de dfinition
Le matriel est principalement ddi au calcul scientifique intensif, faisant interface entre les ressources des centres de calcul nationaux et les applications rgionales.

Nuds de calcul

CLUSTER

SWITCH Gigabit
Sauvegarde rapide sur SATA Raid 0 Sauvegarde scurise sur SATA en Raid 1 Frontale (exploitation
des donnes)

Connection Gigabit

Serveur de calcul
(job, serveur de fichiers)

Connection Gigabit

Connection vers le centre

Fig. 2 Synoptique de larchitecture de calcul envisage La performance de calcul (prcision et rapidit) est particulirement recherche. Le calculateur disposera dun rseau de communication priv haut dbit, desservant les nuds de calculs. Le calculateur est dot dun systme de sauvegarde rapide des donnes en cours de simulation (1er niveau), moyennant les ressources du serveur de calcul. Une sauvegarde de 2nd niveau, visant la scurit des donnes, est effectue sur une machine frontale. Les donnes sauvegardes sur les disques mirors du frontal concernent principalement les sorties valides des modles et les tableaux de donnes employes pour lalimentation des modles. La solution devra offrir une souplesse dvolutivit en fonction de la monte en puissance des besoins de calculs, avec possibilit dajout de nuds de calcul par exemple. Une maintenance rduite et un remplacement des pices dfectueuses avec des pices accessibles localement constituent galement un critre important, compte tenu de la position gographique du Centre. Larchitecture doit tre compatible et offrir une bonne performance vis--vis des problmes soumis et des mthodes de paralllisation adoptes dans les codes.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

Ct administration, le systme doit offrir une ergonomie dinstallation, de surveillance, de mise jour (logiciel et matriel) et correspondre si possible des solutions OS dj connues au Centre (solutions Redhat, Mandrake). En outre, il devra permettre de grer une architecture homogne ou htrogne, dans le cas par exemple de lincorporation de nuds de calcul bass sur une technologie diffrente. Larchitecture propose est un cluster Beowulf de classe I, compos de nuds mono et/ou bi-processeur. Le cluster de classe I est compos de PC accessibles dans les magasins informatiques grand public et auprs des assembleurs. Ces solutions sont couramment utilises dans les laboratoires de calculs, notamment dans les domaines des Sciences de la mer, de la Terre, du Climat, de lEnvironnement, en gnie Bio-Mdicale, Mcanique des structures etc...

3.2. Configuration matrielle propose et offres


La configuration matrielle propose est base sur les configurations similaires utilises dans les centres de calculs employant des clusters de PC. Les dernires technologies en la matire disponibles sur le march et rputes fiables sous Linux sont galement considres (carte mre, processeur, switch, carte raid etc.). Pour lvaluation budgtaire de la solution, 2 pistes ont t explores : Lvaluation de 3 configurations sur la base des prix du march mtropolitain augment de 30 % pour taxe et frais dexpdition (source : www.LDLC.fr, vente en ligne) Lvaluation de 2 configurations sur la base des prix du march local, aprs consultation des fournisseurs Une description plus complte des configurations matrielles fondes sur des nuds bi-processeurs figure en Annexe 1.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

10

A / Rsultats des configurations issues des consultations en ligne, march mtropolitain Les 3 configurations proposes, par ordre dcroissant de performance (et de cot), sont les suivantes :
Configuration 1 : Serveur Bi-Opteron 2.0 Ghz + 4 Nuds Bi-Opteron 2.0 Ghz
Master 2 opterons 246 2.0 ghz MB : Tyan K8S PC3200 4 x 512 Mo 4 DD serial ATA 200 Go + contrleur raid 0 Carte ATI entre de gamme Ecran 17, clavier OS : ROCKS / OSCAR / CLIC Nuds 2 opterons 246 2.0 ghz MB : Tyan K8S PC3200 4 x 512 Mo DD ATA 40 Go Rseau SWITCH 3COM 12 ports 24 Gbps Wirespeed Cartes PCI Gigabit Cuivre Full Duplex, cble

Prix indicatif : 18 000 Euros *

Configuration 2 : Serveur Bi-Xeon 3.0 Ghz + 4 Nuds Bi-Xeon 3.0 Ghz


Master 2 x Xeon 3.0 cache 512 FSB 533 MB : ASUS PC-DL Deluxe PC3200 4 x 512 Mo 4 DD serial ATA 200 Go + contrleur raid 0 Carte ATI entre de gamme Ecran 17, clavier OS : ROCKS / OSCAR / CLIC Nuds 2 x Xeon 3.0 cache 512 FSB 533 MB : ASUS PC-DL Deluxe PC3200 4 x 512 Mo DD ATA 40 Go Rseau SWITCH 3COM 12 ports 24 Gbps Wirespeed Cartes PCI Gigabit Cuivre Full Duplex, cble

Prix indicatif : 15 600 Euros *


Configuration 3 : Serveur Bi-Xeon 3.0 Ghz + 8 Nuds Pentium IV 3.0 Ghz
Master 2 x Xeon 3.0 cache 512 FSB 533 MB : ASUS PC-DL Deluxe PC3200 4 x 512 Mo 2 DD serial ATA 200 Go + contrleur raid 0 Carte ATI entre de gamme Ecran 17, clavier OS : ROCKS / OSCAR / CLIC Nuds Pentium IV 3.0 512 FSB 800 MB : ASUS P4P800 PC3200 4 x 512 Mo DD ATA 40 Go Rseau SWITCH 3COM 12 ports 24 Gbps Wirespeed Cartes PCI Gigabit Cuivre Full Duplex, cble

Prix indicatif : 15 000 Euros * A ces cots sajoute le serveur frontal. Ce serveur permet la sauvegarde scurise des donnes sur disques mirors (disques sata 400 Go) et leur consultation/exploitation, sans pnaliser lexcution des sessions de calculs. Il est

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

11

dot de deux cartes rseaux gigabit, lune relie au rseau du centre, lautre au serveur de calcul :
Frontale (commune aux trois configurations proposes)
Frontale Pentium IV 3.0 512 FSB 800 MB : ASUS P4P800 PC3200 4 x 512 Mo 2 DD SATA 400 Go + contrleur raid 1 Carte ATI 9600 256 Mo Ecran 19, graveur DVD, clavier 2 cartes PCI Gigabit OS : Mandrake

Prix indicatif : 2 100 Euros * * Les valuations financires sont tablies sur la base des tarifs HT des composants en France + 30 % (frais de port et taxe)

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

12

B / Rsultats des consultations locales Les deux premires configurations prcdentes, cluster composs de bi-processeurs Xeon ou Opteron, ont t soumises pour valuation auprs des fournisseurs de la place. Les configurations matriels objets des consultations sont dtailles en Annexe 1. Le rsultat du dpouillement des offres commerciales se trouve en Annexe 2. La synthse est restitue ci-dessous. En jaune figure la proposition commerciale nous paraissant offrir le meilleur compromis Cot / Performance.
Fournissseur Configuration A dual Xeon + Frontale Barrau Bureau 48 392,84
Bi-Pro Xeon 3.6 Ghz/800 MHz 1Mo L2 (serveur) 2 X 512 MB PC 3200 ECC (serveur) IBM ServerRaid SATA Controller (serveur) 2 Disques IBM 160 GB SATA 7200 RPM (serveur) Bi-Pro Xeon 3.4 Ghz/800 MHz 1MB L2 (noeud) 2 X 512 MB PC 3200 ECC (noeud)

Barrau Bureau 35 824,51


Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (serveur) 4 x 512 MB PC 2100 ECC (serveur) Adaptec SATA RAID Controller (serveur) 2 Disques Seagate 200 GB SATA (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (noeud) 4 x 512 MB PC 2100 ECC (noeud)

Bull 25 140,01
Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (serveur) 2 x 1024 MB PC 2100 ECC (serveur) Carte PCI SATA RAID FastTrack S150SX4 (serveur) 2 Disques 250 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 (noeud) 2 x 1024 MB PC 2700 ECC (noeud)

Spcificits

Performances Configuration B dual Opteron + Frontale

+++
45 306,49
Bi-Pro Opteron 248 2.2 Ghz 1Mo L2 (serveur) 2 X 512 MB PC 3200 ECC (serveur) IBM ServerRaid SATA Controller (serveur) 2 Disques IBM 160 GB SATA 7200 RPM (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 (noeud) 2 X 512 MB PC 3200 ECC (noeud)

++
37 240,73
Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 (serveur) 2 x 512 MB PC 3200 ECC (serveur) Adaptec SATA RAID Controller (serveur) 2 Disques Seagate 200 GB SATA (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 (noeud) 2 X 512 MB PC 3200 ECC (noeud)

++
/

Spcificits

Performances Commentaire Fournissseur Configuration A dual Xeon + Frontale

++++
Solution IBM IntelliStation Haut de gamme Office Plus 19 022,61
Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (noeud) 4 x 512 MB PC 3200 ECC (noeud)

+++
Solution IBM IntelliStation Version Solution BULL Express5800 "conomique" Office Plus 31 290,93
Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 250 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 (noeud) 4 x 512 MB PC 3200 ECC (noeud)

Cyber Media 17 043,18


Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 (noeud) 4 x 512 MB PC 3200 ECC (noeu

Spcificits

Performances Configuration B dual Opteron + Frontale

++
22 626,01
Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 (noeud) 4 X 512 MB PC 3200 ECC (noeud)

+++
/

++
/

Spcificits

Performances Commentaire

+++
Solution assembleur Carte Asus Solution DELL Precision (Xeon) Carte Tyan (Opteron) Workstation 670 Solution assembleur Carte Asus (Xeon)

Ces propositions locales ne comprennent pas le matriel portant sur le rseau (Switch et connectiques). Les tableaux suivants dtaillent les propositions commerciales pour ce matriel spcifique.
Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

13

Proposition INMAC (www.inmac.fr) Switch 3COM 12 ports: capacit de commutation 24 Gbps (Wirespeed performance) Dpart France 3COM SWITCH 12*10/100/1000 4*MINI-GBIC Fabricant : 3Com Rduction 10% Cbles pour rseaux gigabit Dpart France CORDON RJ45 CAT5+ 3M UTP GRIS SURMOULE Fabricant : Siecor 13,00 Nb 6 Rendu Nouma 93,60 100,00 1 080,00 1 000,00 Rendu Nouma

Les logiciels (Compilateurs, OS, bibliothque de fonction) ne sont pas compris. Pour ide, le compilateur Fortran ou Portland 64 bit reprsente un cot de lordre de 600 euros.

3.3. Avantages / inconvnients


Commentaires gnraux Ces architectures permettent lexcution en mode paralllis des codes ROMS et MARS 3D, ces derniers comportant dj les instructions de la bibliothque de communication MPI (Message Passing Interface) leur permettant de sexcuter sur les architectures proposes. De plus, les codes ont dj t tests avec succs sur architecture Cluster Linux. De manire gnrale, la configuration matrielle propose (cluster de PC) est compatible avec les diffrents modes de programmation parallle, fonds sur le paralllisme des donnes et des tches, sous condition que les codes intgrent les instructions de message passing (librairie de communication MPICH, PVM, LAM ). Les codes parallliss, qualifis de portable, incorporent systmatiquement ces instructions. Ces configurations sont galement modulables en jouant par exemple sur lajout de nuds de calcul (mono ou bi-processeur). La configuration comportant des bi-processeurs offre lavantage de bnficier des vitesses de communication entre les processeurs embarques sur la mme carte. La configuration comportant des Opterons (AMD) permet en outre de profiter de la mmoire cache de second niveau lev (1024 ko) et de la performance de ce processeur en raison de sa technologie. LOpteron cadence 2 ghz offre en effet des
Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

14

performances suprieures compares au Xeon cadence 3 ghz ou au pentium IV (cf. Annexe 5). Les derniers Xeons avec mmoire cache 1 Mo et 2 Mo arrivent tout juste le concurrencer mais prsentent un cot lev. Par contre, pour gagner en performance, larchitecture 64 bit (Opteron) ncessite lachat dun compilateur fortran ddi (de lordre de 600 euros, solution Portland ou Intel), alors que sur architecture 32 bits, des compilateurs performants sont disponibles gratuitement (solution ifc IA32 dIntel, libre sous Linux). Pour des raisons de performance, le nud de calcul bi-processeur Opteron est prfr. Commentaires sur les offres Les rponses des fournisseurs locaux nous ont permis de constater que du matriel rpondant nos attentes tait disponible localement, des prix finalement comparables avec les solutions dachat direct en France. Ainsi, configuration gale, on peut tabler, partir de loffre Office Plus, sur un cot matriel de 23 800 euros (Serveur + Nuds + Frontal + Rseau) contre 20 100 euros en Mtropole (frais de port et taxes inclus). Le principal avantage se fournir localement est de permettre une maintenance et un retour pour pices dfectueuses plus rapide et sans frais dexpdition. Les offres bases sur les marques (IBM, DELL, Bull) noffrent pas davantage de performances par rapport des solutions assembleurs, sauf pour le haut de gamme IBM propos par Barrau Bureau (mais dont loffre vaut lachat de 2 clusters !).

3.3. Loffre OS
Parmi les solutions disponibles, les choix peuvent porter prfrentiellement sur les produits OSCAR, ROCKS et MandrakeClustering. Ce dernier tant payant (2500 euros). ROCKS (noyau RedHat) comporte une version supportant lOpteron 64 bits. En plus dtre gratuit, ce dernier comporte des outils Open Source rputs pour une installation et une administration aise du cluster. Il intgre galement les principales librairies de communication MPICH, PVM pour le calcul parallle. Dautres librairies et applications ddies devront tre installes en fonction des besoins. Certains sont payants selon les architectures. Par exemple larchitecture 64 bit ncessitent lachat dun compilateur fortran ddi (solution Portland ou Intel) si lon souhaite bnficier des gains de performance lis cette architecture (10 20 % de gain selon les applications).

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

15

Fig. 3 Aperu du moniteur de statut et gestion des ressources sous Ganglia (Outil OpenSource, sous ROCKS)

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

16

3.4. Comptences et demande dassistance


Linstallation dun cluster Beowulf est grable par les informaticiens du centre IRD de Nouma. Nous recherchons ici larchitecture compatible avec les applications parallles vises et qui puisse offrir le meilleur compromis Performance/Evolutivit. Pour cela, nous avons consult les dveloppeurs des codes concerns (IRD Brest pour ROMS, IFREMER pour MARS 3D) et les concepteurs des nouveaux codes dont lexcution est prvue sur le Centre de Nouma. Nous sollicitons galement une assistance technique auprs de la DSI sur le conseil en matire darchitecture / composants / OS, notre proposition pouvant servir de base. Une consultation interne la DSI est juge suffisante. De notre ct, des dmarches de consultation auprs des dveloppeurs des codes et laboratoires de calculs sont en cours, afin daffiner nos choix. Le Service Informatique du Centre de Nouma pourra installer les matriels et les systmes dexploitation et procder aux premiers tests. En 2003, Jrme Lefvre (LEGOS) a eu l'opportunit de tester et comparer linstallation des solutions OSCAR et CLIC 2 sur un cluster Beowulf compos de 3 nuds. Son exprience sera mise contribution lors de la configuration du systme. Pour la programmation parallle de ROMS, dj portable sous LINUX, une assistance est assure par lUR097 (IRD, Patrick Marchesiello et Pierrick Penven). Pour le code MARS 3D, un travail collaboratif avec Franck DELMAS (IFREMER), qui dveloppe actuellement la version MPI, pourra tre mis en place.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

17

4. Exemple de plateformes de calcul ddies la dynamique des fluides installes dans dautres organismes de recherche publique en France
4.1. Tour dhorizon des plateformes de calcul
Le CEA, le CNRS et l'INRIA ont cr une structure de collaboration pour le dveloppement et la diffusion du calcul parallle : lorganisation ORAP (ORganisation Associative du Paralllisme). Outre ses missions visant le renforcement des collaborations entre partenaires nationaux, europens et internationaux dans le cadre du calcul parallle, lORAP ralise une veille technologique et un tat des lieux du calcul scientifique en France. Leur site Web http://maply.univ-lyon1.fr/spip/rubrique.php3?id_rubrique=2 dresse un recensement des ressources matrielles informatiques en rapport avec le calcul intensif. Sur ce site, un tour dhorizon permet de sinformer des architectures employes dans les grands centres technologiques, les Universits, les Laboratoires, les entreprises.

4.2. Quelques exemples de plateformes utilises pour des applications CFD (Computational Flow Dynamic)
IFREMER : Ple de calcul Intensif pour la mer Le calculateur Nymphea se compose d'un cluster de 9 nuds COMPAQ ES45, quadri-processeurs, connects par switch Quadrix. Les processeurs sont des processeurs Alpha EV68 cadencs 1GHz. Sa mmoire globale est de 92 GigaOctets. LOS est Tru64 UNIX. Ressource partage avec le SHOM et lIRD. Le code ROMS est rgulirement excut desus. Problmatiques : Hydrodynamique, Calcul de structure, Biochimie, Applications couples (ex. : hydrodynamique et chimique), dveloppement de code paralllis SHOM : Serveur P655, 64 processeurs (IBM Power4 1.7Ghz), totalisant une puissance thorique de 435 Gflops. Problmatique : traitement de linformation des missions hydro-ocanographiques. BRGM : Calculateur bas Orlans : Grappe PCs Intel, compos de 8 nuds bi-processeurs Xeon 3.06 GHz. Puissance thorique : 49 Gflps. Problmatiques : Hydrogologie, Environnement, Gomcanique.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

18

CEMAGREF : Calculateur bas Aubire : Grappe PCs Intel, compos de 24 nuds biprocesseurs Xeon 2.4 GHz. Puissance thorique : 230 Gflps, rseau gigabit. Problmatiques : Environnement, hydrologie, CFD. Les codes utiliss sont soit des codes internes crits en C, C++, Fortran et Java ou des codes propritaires tels que FLUENT. EDF :
Calculateur DELL 420 bi-PIII 800MHz 4Go Dataswift bi-Xeon 3.06 Ghz Dataswift bi-Opteron 1.8 GHz IBM Xeon MP 2.8 GHz 8 Go HP X4000 bi-Xeon 2.2 GHz 2Go Fujitsu bi Athlon 1800+ 2 Go DELL 530 bi-Xeon 2.4 GHz 2Go DELL 450 bi-Xeon 2.6 GHz 2Go DELL 450 bi-Xeon 2.6 GHz 2Go Nb CPU 8 bi-processeurs 16 bi-processeurs 8 bi-processeurs 4+2x2 10 bi-processeurs 16 bi-processeurs 8 bi-processeurs 32 bi-processeurs 32 bi-processeurs Perf. crte 15 Gflps 180 Gflps 60 Gflps 40Gflps 90 Gflp 40 Gflps 64 Gflps 275 Gflps 275 Gflps Rseau myrinet cuivre 1.2 Gbit/s Ethernet Gigabit myrinet fibre 2 Gbit/s Ethernet Gigabit myrinet cuivre 1.2 Gbit/s Scali Ethernet 100 Mbit/s Ethernet Gigabit Ethernet Gigabit

Problmatiques : Calcul scientifique et modlisation numrique, Mathmatiques financires, CFD (coulements multiphases, couplage thermo-chimique) INRIA (Sophia Antipolis) Calculateurs : Cluster bi-Xeon 2 Ghz, 16 bi-processeurs, carte intel Pro/1000 gigabit, rseau Gigabit-Ethernet, OS Linux 2.4.17/glibc2 Cluster bi-pentium III 933 Mhz, 19 bi-processeurs, rseau Fast-Ethernet Full Duplex (Summit48), OS Linux 2.4.17/glibc2 Cluster bi-Pentium III 500 Mhz, 14 bi-processeurs, OS Linux 2.4.17/glibc2 Problmatiques : Toutes disciplines impliquant du calcul scientifique Centre Commun de Calcul Intensif (C3I) de Guadeloupe Calculateur HP-Compaq SMP muni de 12 processeurs EV7 cadencs 1.15Ghz, 12 Go de mmoire vive et de 400 Gigaoctets de mmoire de masse en disques RAID Cluster Intel muni de 17 noeuds mono-processeur Problmatiques : Mtorologie, Environnement.

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

19

Bibliographie
Littrature consulte Cluster Computing, Architectures, Operating Systems, Parallel Processing & Programming Languages, Richard S. Morrison (Document pdf) Beowulf HOWTO (source : http://www.ixus.net/howto.php) Beowulf Tutorial : Building a Beowulf http://www.cacr.caltech.edu/beowulf/tutorial/building.html) System (source :

ROMS/TOMS User Manual : http://marine.rutgers.edu/po/documentation/docs.php ROMS AGRIF et ROMS TOOLS User Manual (IRD, Centre de Brest) http://www.brest.ird.fr/personnel/ppenven/Roms_tools/index.html). OS ddis cluster Site de MandrakeClustering : http://www.mandrakesoft.com/products/clustering) Site de rocks, dont doc pdf : http://www.rocksclusters.org/rocks-documentation/3.2.0/ Site dOscar : http://oscar.openclustergroup.org Guide dinstallation de MandrakeClustering 1.0 The Steps Required to (htp://oscarsourceforgenet/) Sites Conception dun systme haute performance, CETMEF - Ministre de lequipement, des Transports, de lAmnagement du Territoire, du Tourisme et de la Mer http://www.cetmef.equipement.gouv.fr/projets/transversaux/cluster/calculs.php ORganisation Associative du Paralllisme (ORAP) : http://www.irisa.fr/orap Prsentation des ressources en calculs parallles de lINRIA Sophia Antipolis http://www-sop.inria.fr/parallel/ Install an OSCAR Cluster, Version 1.2.1

Descriptif des besoins de calculs scientifiques sur architecture ddie, Centre IRD de Nouma, Septembre 2004

20

ANNEXE 1 Dtail des deux configurations matrielles fondes sur des nuds bi-processeurs (objet des demandes de proforma)
CONFIG. A: 1 Serveur et 4 Nuds -- Processeurs Xeon 3.0 Ghz Serveur bi-pro Processeurs: 2 Xeon 3.0Ghz cache 512k FSB 533Mhz Carte mre: MB ASUS PC-DL Deluxe i875P Mmoire: 4 PC3200 512 Mo (4 X 512 MO (ECC), DDR 400) Disques durs: 2 x DD Serial ATA (200 Go minimum) Grande tour (emplacement et alimentation suffisante pour quatre disques) Lecteur CD/DVD Carte vido: ATI 9600 256 Mo ou quivalente Ecran CRT 17" Lecteur disquette Carte rseau 10/100/1000 supplmentaire Intel (PWLA8391MT GIGABIT RJ45) Carte Adaptec Serial ATA RAID 2410SA Clavier, souris 4 nuds bi-pro Processeurs: 2 Xeon 3.0Ghz cache 512k FSB 533Mhz Carte mre: MB ASUS PC-DL Deluxe i875P Mmoire: 4 PC3200 512 Mo (4 X 512 Mo (ECC), DDR 400) Disque dur: 1 IDE 60 Go minimum Lecteur CD-ROM Carte rseau 10/100/1000 supplmentaire Intel (PWLA8391MT GIGABIT RJ45) Carte graphique d'entre de gamme (ATI 7000 32 Mo ou quivalente) Frontale (sauvegarde) : 1 PC Pentium IV 3.0Ghz Serveur Processeurs: Pentium IV 3.0Ghz Carte mre ASUS (avec port ethernet 10/100 intgr) Mmoire: 2 PC3200 512 Mo (2 X 512 Mo (ECC) Disques durs: 2 DD Serial ATA (400 Go minimum) Grande tour (emplacement et alimentation suffisante pour quatre disques) Graveur DVD Carte vido: ATI 9600 256 Mo ou quivalente Ecran CRT 19 " Lecteur disquette Carte rseau 10/100/1000 supplmentaire Intel (PWLA8391MT GIGABIT RJ45) Carte Adaptec Serial ATA RAID 2410SA Clavier, souris CONFIG. B: 1 Serveur et 4 Nuds -- Processeurs Opteron 2.0 Ghz Serveur bi-pro Processeurs: 2 Opteron 2.0Ghz cache L1 128K, cache L2 1024K (Model 246) Carte mre: MB Tyan Thunder K8W (S2885) Mmoire: 4 PC3200 512 Mo (4 X 512 Mo (ECC), DDR 400) Disques durs: 2 DD Serial ATA (200 Go minimum) Grande tour (emplacement et alimentation suffisante pour quatre disques) Lecteur CD/DVD Carte vido: ATI 9600 256 Mo ou quivalente Ecran CRT 17 " Lecteur disquette Carte rseau 10/100/1000 supplmentaire Intel (PWLA8391MT GIGABIT RJ45) Carte Adaptec Serial ATA RAID 2410SA Clavier, souris 4 nuds bi-pro Processeurs: 2 Opteron 2.0Ghz cache L1 128K, cache L2 1024K (Model 246) Carte mre: MB Tyan Thunder K8W (S2885) Mmoire: 4 PC3200 512 Mo (4 X 512 Mo DDR 400 ) Disque dur: 1 IDE 60 Go minimum Lecteur CD-ROM Carte rseau 10/100/1000 supplmentaire Intel (PWLA8391MT GIGABIT RJ45) Carte graphique d'entre de gamme (ATI 7000 32 Mo ou quivalente)

ANNEXE 2 Dpouillement des offres commerciales


Nom du fournisseur

BBS - Configuration "haut de gamme"


Rduction ventuelle Prix Hors TGI en CFP 1 276 200 XPF 3 528 800 XPF 4 805 000 XPF Prix Hors TGI en CFP 1 316 700 XPF 3 120 000 XPF 4 436 700 XPF Prix Hors TGI en Euro 10 694,56 29 571,35 40 265,91 Prix Hors TGI en Euro 11 033,95 26 145,61 37 179,56

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 1 276 200 XPF 882 200 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire 1 316 700 XPF 780 000 XPF

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 969 800 XPF

Nombre 1

Rduction ventuelle

Prix Hors TGI en CFP 969 800 XPF

Prix Hors TGI en Euro 8 126,93

Dlais livraison Dure de la garantie

3 4 semaines 3 ans Total configuration A + machine stockage: Total configuration B + machine stockage: 48 392,84 45 306,49

Commentaires :
Configuration IBM haut de gamme, tablie sur la gamme IBM IntelliStation Z Pro 6223 (Xeon, config A) et IntelliStation A Pro 6224 (Opteron, config B), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.6 Ghz/800 MHz 1Mo L2 cache (serveur) 2 X 512 MB PC 3200 ECC (serveur) IBM ServerRaid SATA Controller (serveur) 2 Disques IBM 160 GB SATA 7200 RPM (serveur) Bi-Pro Xeon 3.4 Ghz/800 MHz 1MB L2 cache (noeud) 2 X 512 MB PC 3200 ECC (noeud) Bi-Pro Opteron 248 2.2 Ghz 1Mo L2 cache (serveur) 2 X 512 MB PC 3200 ECC (serveur) IBM ServerRaid SATA Controller (serveur) 2 Disques IBM 160 GB SATA 7200 RPM (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 cache (noeud) 2 X 512 MB PC 3200 ECC (noeud)

Config B :

Cette solution propose les dernires technologies en matire de processeurs, RAM et disque de stockage, offrant des performances leves (et similaires entre les 2 configurations).

Nom du fournisseur

BBS - Configuration "conomique"


Rduction ventuelle Prix Hors TGI en CFP 823 000 XPF 3 024 000 XPF 3 847 000 XPF Prix Hors TGI en CFP 896 000 XPF 3 120 000 XPF 4 016 000 XPF Prix Hors TGI en Euro 6 896,74 25 341,13 32 237,87 Prix Hors TGI en Euro 7 508,48 26 145,61 33 654,09

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 823 000 XPF 756 000 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire 896 000 XPF 780 000 XPF

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 428 000 XPF

Nombre 1

Rduction ventuelle

Prix Hors TGI en CFP 428 000 XPF

Prix Hors TGI en Euro 3 586,64

Dlais livraison 3 4 semaines Dure de la garantie 3 ans Total configuration A + machine stockage: Total configuration B + machine stockage: 35 824,51 37 240,73

Commentaires :
Configuration IBM conomique, tablie sur la gamme IBM IntelliStation Z Pro 6223 (Xeon, config A) et IntelliStation A Pro 6224 (Opteron, config B), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (serveur) 4 x 512 MB PC 2100 ECC (serveur) Adaptec SATA RAID Controller (serveur) 2 Disques Seagate 200 GB SATA (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (noeud) 4 x 512 MB PC 2100 ECC (noeud) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 cache (serveur) 2 x 512 MB PC 3200 ECC (serveur) Adaptec SATA RAID Controller (serveur) 2 Disques Seagate 200 GB SATA (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 cache (noeud) 2 X 512 MB PC 3200 ECC (noeud)

Config B :

Cette solution propose des technologies rcentes en matire de processeurs, offrant des performances trs honorables. La config B est susceptible doffrir de meilleures performances compare la A. Cot lev en raison de la marque, sans gain notable par rapport une solution assembleur.

Nom du fournisseur

OFFICE PLUS configuration 1


Rduction ventuelle Prix Hors TGI en CFP 485 000 XPF 1 380 000 XPF 1 865 000 XPF Prix Hors TGI en CFP 575 000 XPF 1 720 000 XPF 2 295 000 XPF Prix Hors TGI en Euro 4 064,30 11 564,40 15 628,71 Prix Hors TGI en Euro 4 818,50 14 413,61 19 232,11

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 485 000 XPF 345 000 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire 575 000 XPF 430 000 XPF

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 405 000 XPF

Nombre 1

Rduction ventuelle

Prix Hors TGI en CFP 405 000 XPF

Prix Hors TGI en Euro 3 393,90

Dlais livraison Dure de la garantie

1 mois 1/2 1 an Total configuration A + machine stockage: Total configuration B + machine stockage: 19 022,61 22 626,01

Commentaires :
Solution assembleur conomique constitue de carte mre Asus PC-DL deluxe (Xeon, config A) et carte mre Tyan Thunder K8W (Opteron, config B), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (noeud) 4 x 512 MB PC 3200 ECC (noeud) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 cache (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA (serveur) Bi-Pro Opteron 246 2.0 Ghz 1Mo L2 cache (noeud) 4 X 512 MB PC 3200 ECC (noeud)

Config B :

Cette solution propose des technologies rcentes en matire de processeurs, offrant des performances trs honorables. La config B est susceptible doffrir de meilleures performances compare la A.

Nom du fournisseur

OFFICE PLUS configuration 2


Rduction ventuelle Prix Hors TGI en CFP 884 000 XPF 2 036 000 XPF 2 920 000 XPF Prix Hors TGI en CFP 0 XPF 0 XPF 0 XPF Prix Hors TGI en Euro 7 407,92 17 061,69 24 469,61 Prix Hors TGI en Euro 0,00 0,00 0,00

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 884 000 XPF 509 000 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 814 000 XPF

Nombre 1

Rduction ventuelle

Prix Hors TGI en CFP 814 000 XPF

Prix Hors TGI en Euro 6 821,32

Dlais livraison Dure de la garantie

1 mois 1/2 1 an Total configuration A + machine stockage: 31 290,93

Commentaires :
Configuration DELL tablie sur la gamme DELL Precision Workstation 670 (Xeon, config A), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 cache (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 250 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 cache (noeud) 4 x 512 MB PC 3200 ECC (noeud)

Cette solution propose les dernires technologies en matire de processeur Xeon. Cot lev en raison de la marque, sans gain notable par rapport une solution assembleur.

Nom du fournisseur

CYBERMEDIA - INFOCOM
Rduction ventuelle 408 360 XPF 331 706 XPF Prix Hors TGI en CFP 408 360 XPF 1 326 824 XPF 1 735 184 XPF Prix Hors TGI en CFP 0 XPF 0 XPF 0 XPF Prix Hors TGI en Euro 3 422,06 11 118,79 14 540,85 Prix Hors TGI en Euro 0,00 0,00 0,00

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 429 780 XPF 349 090 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 314 250 XPF

Nombre 1

Rduction ventuelle 298 608 XPF

Prix Hors TGI en CFP 298 608 XPF

Prix Hors TGI en Euro 2 502,34

Dlais livraison 15j 3 semaines Dure de la garantie 1 an Total configuration A + machine stockage: 17 043,18

Solution assembleur conomique constitue de carte mre Asus PC-DL deluxe (Xeon, config A), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (serveur) 4 x 512 MB PC 3200 ECC (serveur) Carte Adaptec SATA RAID 2410 SA Controller (serveur) 2 Disques 200 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (noeud) 4 x 512 MB PC 3200 ECC (noeud)

Cette solution, la plus conomique, propose des technologies rcentes en matire de processeurs, offrant des performances trs honorables, mais infrieures une solution base dOpteron.

Nom du fournisseur

BULL configuration 1
Rduction ventuelle Prix Hors TGI en CFP 721 376 XPF 1 870 284 XPF 2 591 660 XPF Prix Hors TGI en CFP 0 XPF 0 XPF 0 XPF Prix Hors TGI en Euro 6 045,13 15 672,99 21 718,12 Prix Hors TGI en Euro 0,00 0,00 0,00

Configuration A 1 serveur avec 2 Xeon 4 nuds avec 2 Xeon chacun

Prix unitaire 721 376 XPF 467 571 XPF

Nombre 1 4

Total Configuration A Hors TGI: Rduction ventuelle

Configuration B 1 serveur avec 2 Opteron 4 nuds avec 2 Opteron chacun

Prix unitaire

Nombre 1 4

Total Configuration B Hors TGI:

Machine de stockage PC Pentium IV 3.0 Ghz

Prix unitaire 408 340 XPF

Nombre 1

Rduction ventuelle

Prix Hors TGI en CFP 408 340 XPF

Prix Hors TGI en Euro 3 421,89

Dlais livraison Dure de la garantie

1 mois 1/2 1 an Total configuration A + machine stockage: 25 140,01

Commentaires :
Configuration BULL tablie sur la gamme BULL Express5800/ 120Ef SATA (Xeon, config A), avec les spcificits suivantes :

Config A :

Bi-Pro Xeon 3.06 Ghz/533 MHz 512 Ko L2 cache (serveur) 2 x 1024 MB PC 2100 ECC (serveur) Carte PCI SATA RAID FastTrack S150SX4 (serveur) 2 Disques 250 GB SATA 7200 rpm (serveur) Bi-Pro Xeon 3.06 Ghz/800 MHz 1 Mo L2 cache (noeud) 2 x 1024 MB PC 2700 ECC (noeud)

Cette solution propose les dernires technologies en matire de processeur Xeon pour les nuds de calcul. La RAM propose pour les nuds de calcul ne permet pas de couvrir les performances du bus processeur. Cot modrment lev en raison de la marque, sans gain notable par rapport une solution assembleur.

ANNEXE 3 Extrait des notes dvaluation des performances de calcul des machines disponibles localement en vue de limplantation du code ROMS au Centre de Nouma

1. Objet
Lobjet de cette note est de passer en revue les performances de calculs des moyens informatiques accessibles au dpartement ocanographie physique du centre et de proposer, si besoin est, dautres alternatives de calcul. La note se prsente de la manire suivante : Prsentation du modle ROMS et des logiciels ddis Mthodologie et caractristiques du domaine tudi Performances obtenues Perspectives

2. Prsentation du modle de circulation ROMs


2.1. Prsentation gnrale ROMs (= Regional Ocean Modeling System) est dvelopp sous la supervision dHerman Arango et Dale Haidvogel, de luniversit Rutgers (New-Jersey). Au sein de lIRD, Patrick Marchesiello et Pierrick Penven (UR097, IRD Brest) contribuent galement au dveloppement du code. Deux versions de ROMS sont accessibles : La version officielle de ROMS (ROMS V 2.0), distribue par lUniversit de Rutgers. Elle comprend les dernires techniques numriques valides par le groupe de collaborateurs dHerman Arango. Le code est paralllis et comprend galement un module biologique. Par contre, le code noffre pas doption permettant de travailler sur des maillages embots. La version obtenue auprs de lIRD Brest, ROMS/AGRIF, est le fruit dune collaboration entre lIRD, lINRIA et lUCLA (University of California at Los Angeles). Cette version est exprimentale, mais reprend les fonctions de ROMS 2.0 en y ajoutant des fonctions nouvelles, notamment pour le traitement des problmes de circulation en zone ctire ou les conditions aux limites. Ainsi, le code diffre de la version officielle en offrant au moyen de la bibliothque de fonctions AGRIF des fonctionnalits dadaptation de la rsolution. AGRIF permet de travailler de manire dynamique avec une grille embote dans le modle parent. Un nouveau schma de traitement des conditions aux limites y est galement incorpor. Ce code est utilis avec succs dans de nombreux laboratoires.

La version ROMS/AGRIF est utilise au centre de Nouma pour les raisons suivantes :
Support technique apport directement par Patrick Marchesiello et Pierrick Penven Fonctions dadaptation de grille et nouvelle condition aux limites particulirement appropries et pertinentes eu gard le type dutilisation du modle localement ROMS/AGRIF vient avec une suite doutils crits en langage Matlab facilitant les tapes de pr et post-traitement, adaptables si ncessaires

2.2. Le modle
Le modle ROMS est un modle 3D qui utilise un schma aux diffrences finies. Il est fond sur la rsolution des quations primitives de Navier Stockes qui permettent le calcul des courants, de la temprature, de la salinit et de l'lvation de la surface libre en utilisant les approximations hydrostatiques, de Boussinesq et d'incompressibilit. Les quations primitives sont appliques sur un maillage tridimentionnel orthogonal et curviligne sur la sphre. La discrtisation sur la verticale utilise les coordonnes sigma, indpendantes de la profondeur (entre 0 et 1), qui suivent la topographie du fond. Lpaisseur entre chaque niveau est donc variable. La rsolution se fait par sparation de mode. Un modle 2D de surface est coupl au modle 3D selon un systme prdiction-correction afin de considrer sparment les ondes de gravit de surface et les ondes internes. Les ondes externes sont plus rapides, la rsolution des quations intgres sur la verticale ncessite donc un plus petit pas de temps pour respecter le critre de stabilit. La temprature, la salinit et la concentration dun traceur quelconque sont calcules en rsolvant lquation de conservation de la masse, de la chaleur ou de la salinit. Ces dernires annes, les efforts de dveloppement de ROMS ont port sur lincorporation de mthodes numriques plus sophistiques, permettant un gain de rsolution sans augmenter le cot de calcul. Cette recherche doptimisation est fonde sur lvolution des architectures des ordinateurs, notamment sur le fait que leur puissance de calculs augmente plus rapidement que la largeur de bande mmoire. Ainsi, lapport des nouveaux schmas numriques pour ladvection, passant par la rsolution numrique dquations de 3me ou 4me ordre, permet par exemple de mieux rendre compte des structures turbulentes, et donc des mlanges des masses deau, tout en tant moins sensibles aux effets de gradient. Ces schmas permettent de profiter de la puissance de calcul tout en utilisant les ressources (processeur/mmoire) dune manire optimale. Conditions aux limites Le type de schma employ pour tenir compte du traitement de linformation aux limites ouvertes est dterminant sur la convergence de la solution et la qualit des

rsultats retourns. ROMS (V 2.0) comporte diffrents schmas permettant de spcifier le type de conditions aux limites. La condition radiative est la plus employe. Au cours de son sjour lUniversit de Los Angeles (UCLA), Patrick Marchessiello (IRD, UR097) a dvelopp puis incorpor dans le code ROMS/AGRIF une condition radiative dite oblique. La condition radiative oblique permet destimer la direction du flux dinformation entrant ou sortant aux limites ouvertes, ceci chaque itration. En configuration de flux entrant, linformation provenant des donnes hydrologiques est restaure aux limites, moyennant une procdure de relaxation newtonienne avec un rappel relativement fort (temps de rappel court de l'ordre de quelques jours). En configuration de flux sortant, les donnes intrieures sont extrapoles aux limites et une relaxation avec un temps de rappel faible (de lordre de 1 an) est applique. Ces procdures de relaxation permettent lattnuation des carts entre les valeurs intrieures et extrieures qui peuvent se manifester au moment de linversion du flux, propice au dveloppement dinstabilits numriques.

2.3. Aspects informatiques du code


Paralllisation Dj paralllis ds les premires versions pour lutilisation des plateformes mmoire partage (Sun, SGI, etc), lalgorithme de calcul fait appel la bibliothque d'changes de messages MPI (Message Passing Interface) pour les architectures mmoire distribue (grappe de PC). Les directives OpenMP peuvent galement tre employes sur les plateformes mmoire partage. La technique de paralllisation consiste partager le domaine de calcul en sous domaines, de manire explicite. Avant compilation du programme, lutilisateur dclare un nombre de sous domaine gal au nombre de processeurs (ou multiple, pour les plateformes mmoire partage). Chaque thread parallle gre alors de manire autonome son propre sous domaine et est dfini une seule fois pour tout le reste de lexcution du programme. Seules les changes dinformation aux nuds frontires subsistent. Sur la plateforme biprocesseur teste, la paralllisation est effectue au moyen des directives OpenMP. Le compilateur fortran Intel version 8 utilis sous Linux pour les tests supporte linterprtation des directives OpenMP. Optimisation dutilisation de la mmoire cache De manire avantageuse, le partitionnement du domaine permet galement dobtenir un gain de temps de calcul en procdant loptimisation de lutilisation du cache du processeur. Le partitionnement permet en effet dobtenir un jeu de blocs de donnes associs chaque sous domaine dont la taille correspond celle de la mmoire cache. Les performances sen trouvent amliores, y compris sur les plateformes monoprocesseurs.

Stratgie de raffinement et mthodes de zoom Le logiciel AGRIF (Adaptive Grid Refinement in Fortran) est associ au modle ROMS. Moyennant lutilisation de pointeurs et le renseignement dun fichier pr-defini de description du modle, le logiciel AGRIF permet dajouter des fonctionnalits dadaptation de la rsolution dans le modle, sous la forme dune grille embote dans le domaine parent. Cette fonctionnalit a t ajoute sur la base de travaux de Laurent Debreu (INRIA) et Eric Blayo (Universit de Grenoble). Les efforts portent actuellement sur lajout de fonctions de couplage et dembotement de modles ocaniques distincts. Les fonctions du logiciel AGRIF seront testes ultrieurement. 2.4. Outils pr et post-traitement Les outils employs pour la prparation du maillage, la construction des sries temporelles de forage et dinitialisation du modle proviennent de la boite doutils ROMS_TOOLS, dveloppe par lIRD (Pierrick Penven et Patrick Marchesiello). Les outils dvelopps sous Matlab permettent galement la visualisation et lanalyse des sorties du modle, moyennent linterface graphique de Matlab et des routines ddies. Le format des donnes (entre et sortie) rpond au format netCDF.

3. Mthodologie et caractristiques du domaine tudi 3.1. Mthode


Aprs une tape de familiarisation avec le code (compilation, prparation, test de convergence, etc.), des tests portant sur la vitesse de calcul ont t excuts de manire vrifier dans quelles mesures le parc informatique du centre peut rpondre lexploitation du code. Pour effectuer les comparaisons entre les diffrents PC, une grille comprenant 543 780 points portant sur un domaine centr sur la Nouvelle-Caldonie a t soumise aux machines. La rsolution du domaine atteint 1/10 , soit une chelle horizontale denviron 10 km.

Bathymtrie du domaine rgional centre sur la Nouvelle-Caldonie (Bathymtrie = Etopo2) Grille horizontale : 159 X 171 Niveaux sigma : 20 Pas de temps - Mode barocline : 520 s (8.6 minutes) Profondeur maximale : 7500 m Profondeur minimale : 10 m Pas de temps - Mode barotrope : 13 s

Le code est compil avec le compilateur fortran 90 dIntel pour Linux. Les mmes options de compilation ont t conserves sur les diffrentes machines. Les caractristiques des machines testes sont :
Tiki Pentium III Biprocesseur
PC biprocesseur, Intel Pentium 3, 1002 Mhz, cache 256 ko, SSE oui, SSE2 non, ht non Mmoire : SDR 133 Mhz 1,5 GO

Boris Pentium IV Monoprocesseur


PC monoprocesseur, Intel Pentium 4, 1615 Mhz, cache 512 ko, SSE oui, SSE2 oui, ht non Mmoire : DDR 266 Mhz 512 MO

AMD XP Monoprocesseur
PC monoprocesseur, AMD Athlon XP, 2029 Mhz, cache 256 ko, SSE oui, SSE2 non, ht non Mmoire : Dual DDR 300 Mhz 1024 MO

Pentium IV P4P8X 2.9 ghz


PC monoprocesseur, Intel Pentium 4, 2940 Mhz, cache 512 ko, SSE oui, SSE2 oui, ht oui Mmoire : DDR 333 Mhz 512 MO

3.2. Comparaison des performances


Pour apprcier les temps de calcul, les comparaisons de performances sont tablies sur la base de lunit itration, du mois et de lanne.
Configuration Tiki Pentium Monoprocesseur Tiki Pentium Biprocesseur Boris Pentium Monoprocesseur AMD XP 2400 + Pentium IV P4P8X III III IV CPU 1002 Mhz 2 x 1002 MHZ 1615 Mhz 2029 Mhz 2940 Mhz 1 itration 36,5 s 13 s 7s 7,6 s 4,7 s 1 mois 50,5 heures 18,0 heures 9,7 heures 10,5 heures 6,5 heures 1 anne 606 heures 216 heures 116.4 heures 126 heures 78 heures

Le code tire le meilleur partie de la technologie pentium IV avec un cache 512 ko. On notera que le processeur AMD XP Athlon cadenc 2.0 Ghz napporte pas daussi bonnes performances quun Pentium 4 cadenc 1,6 Ghz, ce dernier bnficiant dun cache suprieur. Il apparat galement que la fonction de partitionnement du domaine apporte un gain de performance apprciable, que ce soit pour une machine biprocesseur ou monoprocesseur. Ces gains sont illustrs ci-aprs, en jouant sur diffrentes combinaisons de partition du domaine : Machine monoprocessseur
Effet du partitionnement Boris, pentium IV (monoprocesseur)
10 8 6 4 2 0
10 12 18 14 X X X 20 22 2 X X 1 X X X 1

seconde/itration

Partition du dom aine en Latitude et Longitude

24

Dpassement de pile

Machine biprocesseur
Effet du partitionnement Tiki, pentium III (biprocesseur)
seconde/itration 30 25 20 15 10 5 0
6 2 8 20 10 30 X X X X X X 2 6 8 X 20 20

10

Partition du dom aine en Latitude et Longitude

Dans cet exemple, un gain de facteur 2 et 1.3 est obtenu respectivement sur les machines pentium biprocesseur et monoprocesseur testes.

4. Perspectives
Malgr le manque de recul sur les aspects informatiques du code, il apparat que les dernires machines du Centre quipes de processeur pentium IV sont suffisantes pour son excution sur des domaines moyenne chelle, dans le cas dune rsolution infrieure 1/10 et des priodes de 1 quelques mois. Par exemple, 6 mois de simulation sur une machine cadence 1.6 Ghz ncessiterait 2,5 jours. Sur une plateforme cadence 3 ghz (teste les jours venir), il est probable que le rsultat soit obtenu en moins de 36 heures. Au-del, dans le cadre de ltude affine de processus ctiers ncessitant lemploi de maillage imbriqu avec une rsolution plus fine (2 3 km) et pour des priodes dintgration plus longue (recherche dun tat dquilibre, ncessitant plusieurs annes dintgration, par exemple), les temps de calculs deviennent difficilement grables. Les solutions envisageables sont alors celles pour lesquelles le code est prvu, multiprocesseur ou grappe de PC (cluster), cette dernire solution permettant de bnficier de processeurs plus rapides que ceux disponibles sur les plateformes multiprocesseurs.

10

20

ANNEXE 4 Le modle hydrodynamique Mars 3D


Il s'agit d'un algorithme de calcul des courants marins, des hauteurs d'eau, et des concentrations en lments solubles (ou en suspension temporaire) transports par les courants. Mars est compos de : un noyau de calcul oprationnel en version 2D et 3D qui, dans un souci de meilleure prcision, de minimisation des temps de calcul et de facilit d'emploi, adopte une mthode en diffrences finies sur un maillage rgulier. un pr-processeur nomm IMars dont les fonctions essentielles sont la gestion et l'intgration aises des paramtres et donnes dentre qui servent l'activation du code de calcul. IMars permet galement un contrle en temps rel de lvolution de variables hydrodynamiques modlises. un post-processeur, ou programme d'exploitation graphique des rsultats de Mars nomm VisuMars mis la disposition des utilisateurs du logiciel de modlisation hydrodynamique ctire qui ne possdent pas d'interface avec le SIG Arc View. Il permet de prsenter les rsultats de calculs dj raliss (ou en cours de calcul) sous forme de courbes et de cartes. Il permet aussi des calculs spcifiques d'interprtation (trajectoires, etc)

Mars effectue le calcul des courants, des hauteurs d'eau et des concentrations en substances dissoutes, dans un coulement liquide plan, quasi-horizontal. La forme des fonds peut tre absolument quelconque et comporter un nombre quelconque de chenaux, les, hauts fonds, bancs dcouvrants et estrans. MARS permet de modliser sous forme de calculs instantans ou de synthses (valeurs moyennes, maxi, mini) les grandeurs suivantes : - le courant (composantes U et V) et les rsiduelles eulriennes, - la hauteur du plan d'eau, les niveaux moyens et les composantes harmoniques de mare, - la salinit, - des constituants provenant de rejets (par exemple les coliformes fcaux), - le transport sdimentaire et les dpts. Il produit pour chaque zone tudie une base de donnes dont les rsultats sont stocks sous la forme d'une srie temporelle de vecteurs et de scalaires en coordonnes gographiques. On se limitera dans ce qui suit la description puis aux applications de la version 2D du modle.

On dmontre que les calculs raliss par le modle ncessitent lutilisation de trois types d'information : - La topographie du domaine (fournie ici par une matrice des profondeurs). - Les conditions aux limites sur les frontires ouvertes du domaine. Pour la partie hydraulique, on utilisera des conditions aux limites fortes de dnivellation et des conditions faibles de vitesse des courants. - Les flux d'eau et de matire dissoute (ou en suspension) l'intrieur du domaine (rivires, missaires ...)

Les hypothses du calcul valables en 2D sont les suivantes : La composante horizontale du courant ne varie pas beaucoup depuis la surface jusqu' proximit du fond (courant de masse). Le modle dans sa version 2D calcule la moyenne des courants sur la verticale et cette valeur moyenne a une forte signification physique. Les vitesses verticales sont faibles.

Sous ces hypothses, les lois qui dcrivent le comportement physique du systme, savoir le second principe de Newton et la loi de conservation de la masse se traduisent par le systme d'quations dit de Saint-Venant :

2u 2u u u u u u 2 + v 2 Pa x +u +v +g fv + + g + + =0 x 2 y 2 t x y x k 2H 4/3 x H 2v 2v v v v v u 2 + v 2 Pa y +u +v +g fu + + g + + =0 x 2 y 2 t x y y k 2H 4/3 y H ( Hu ) ( Hv ) + + =0 t x y
U V composante de la vitesse selon Ox composante de la vitesse selon Oy cote de la surface libre facteur de Coriolis coefficient de frottement de fond, de Strikler hauteur de la colonne d'eau

f kr H

Ce systme est complt par l'quation de transport-diffusion-dcroissance d'un lment chimique (ou assimil) transport en suspension :

C C HKx HKy y ( HC ) ( HUC ) ( HVC ) x + + lHC + S = 0 t x y x y


C K L S Concentration en une substance dissoute Coefficient de diffusion horizontale Coefficient de dcroissance propre Source

Mars intgre ces quations diffrentielles de manire totalement automatique, quelle que soit la forme du domaine, qui peut d'ailleurs voluer dans le temps (zones dcouvrantes, murs immergs, etc). Un modle mathmatique doit offrir une reprsentation de la ralit d'autant plus fine et prcise que l'on se situe sur la zone d'intrt. A cette fin le modle Mars utilise une technique d'embotement de modles sous forme gigogne. Par cette technique un modle de grande emprise et de grande maille contient lui mme un ou plusieurs sous modles (loupes). Ces derniers reoivent des modles qui les prcdent, les conditions aux limites sur leur primtre.

Au plan spatial les modles intermdiaires possdent une maille environ 4 fois plus petite que celle du modle prcdent. Le modle de grande emprise s'tend jusqu'au plateau continental et trouve ses conditions aux limites dans la valeur des ondes gnrant la mare au large. Un forcing mtorologique peut tre pris en compte sur toute la surface du modle et ses ventuelles loupes successives. La figure ci-aprs prsente l'embotement de quatre niveaux de modles construits dans le cas de l'tude de deux zones d'intrt : rgions du nord de La Rochele et de La Tremblade - Marennes Olron au sud.

Roch 2

Roch1

Roch 3 Roch 4

Roch

Principe de l'embotement de modles : cas des zones La Rochelle (Roch 4 Nord) et La Tremblade - Marennes Olron (Roch 4 Sud).

ANNEXE 5 A propos du processeur AMD Opteron Premier processeur 32 bits et 64 bits au monde tre compatible avec l'architecture x86, le processeur AMD Opteron s'appuie sur la technologie AMD64 et Direct Connect Architecture. L'architecture Direct Connect permet de supprimer les goulots d'tranglement inhrents l'existence d'un bus systme en connectant directement les processeurs, le contrleur mmoire et les E/S au processeur central, afin damliorer les performances et l'efficacit globale du systme. AMD a galement t le premier constructeur annoncer la ralisation dune conception de processeur x86 double cur destin linformatique 64 bits.