HPC 2011

SUPER-
ORDINATEURS
Aux extrmes du calcul
NOVEMBRE 2011
EN PARTENARIAT AVEC
Laboratoire
commun
PME
HPC
linterface des sciences informatiques et des mathmatiques, les chercheurs dInria
tablissent depuis 40 ans les bases scientifques dun nouveau champ de connaissances :
les sciences du numrique. En interaction avec les autres disciplines scientifques, les sciences du
numrique proposent de nouveaux concepts, langages, mthodes et objets denseignement qui ouvrent
des perspectives indites dans lapprhension des phnomnes complexes.
Le calcul intensif ( HPC pour High
Performance Computing) est un
thme stratgique pour Inria, qui
concerne prs dune trentaine de ses
quipes de recherche.
Linstitut est engag dans des
partenariats stratgiques sur ces
sujets avec Bull pour la conception
des futures architectures et avec
EDF R&D pour la simulation haute
performance dans le domaine de
lnergie.
Au niveau international, Inria et luni-
versit dUrbana Champaign (Etats-
Unis), ont cr en 2009 un laboratoire
commun de recherche en calcul
intensif, le Joint Laboratory
for Pestascale Computing (JLPC).

Ce laboratoire concentre ses travaux
sur le dveloppement dalgorithmes
et de logiciels pour des ordinateurs
chelle ptafopique et au-del. Les
chercheurs du laboratoire ont intgr
leurs travaux dans le cadre du projet
Blue Waters.
Par ailleurs, plusieurs socits
issues dInria proposent des tech-
nologies dans ce domaine, comme
par exemple Kerlabs, Caps Entreprise,
Activeeon ou encore Sysfera.
Enfn, dans le cadre de sa mission
de transfert de technologies, Inria a
lanc, avec le GENCI, OSEO et quatre
ples de comptitivit (Arospace
valley, Axelara, Minalogic, Systmatic)
le programme HPC-PME .
Objectif? Faciliter et encourager
laccs des PME au calcul haute
performance pour renforcer leur
comptitivit.
Les PME qui souhaitent faire appel
la simulation ou au calcul haute per-
formance pour laborer leurs produits
et services (conception, modlisation,
systme, test, traitement et visualisa-
tion des donnes) peuvent postuler
sur le site web ddi cette Initiative
HPC-PME.
www.inria.fr
www.initiative-hpc-pme.org
Inria est linstitut de recherche en sciences du numrique.
Inria accueille chaque anne plus de 1000 jeunes chercheurs.
Chercher et innover avec le HPC
3
S
U
P
E
R
O
R
D
I
N
A
T
E
U
R
S
DITORIAL
L
e calcul scientique de haute performance,
ou HPC, sest peu peu install dans
notre vie, sans que nous en ayons
toujours conscience. Il est dans nos
mdicaments, nos placements financiers, les films
que nous voyons au cinma et lquipement de
nos champions, la voiture que nous conduisons
et lessence qui la fait fonctionner.
Il rend notre monde plus sr,
plus conome de ses ressources
et, grce nos chercheurs, plus
comprhensible. Mais ces pas de
gants que nous avons accomplis,
notamment en franchissant la
barre du petaflops, soit un million
de milliards doprations par
seconde, vont vite nous paratre
bien modestes, car les plus
extraordinaires bouleversements technologiques
sont devant nous : le Cloud Computing, qui va
rvolutionner et dmocratiser laccs au calcul
scientifique et lexaflops, 1 000 fois la puissance
du petaflops, qui fera entrer la simulation
numrique dans une nouvelle dimension, etc.
Aujourdhui, les grandes rgions du monde,
tats-Unis et Chine en tte, ont pris dimportantes
initiatives pour avoir la matrise complte
de ces technologies du futur. LEurope est reste
jusqu maintenant en retrait. Puissions-nous
rapidement nous mobiliser si nous voulons
garder chez nous ce savoir-faire indispensable
pour notre souverainet, pour notre recherche
et pour notre industrie. Et prserver nos emplois.
LENJEU DU FUTUR
PAR PHILIPPE
VANNIER
prsident-
directeur
gnral de Bull
F
R
A
N
O
I
S

D
A
B
U
R
O
N
SUPERORDINATEURS LA RECHERCHE NOVEMBRE 2011 N 457 .
La Technopole TERATEC
Cre linitiative du CEA pour dvelopper et promouvoir la simulation numrique au bnfce de l'industrie et de la
recherche, la Technopole TERATEC est implante Bruyres-le-Chtel, dans le sud de lle-de-France, et regroupe tous les
lments de la chane de valeur du calcul haute performance et de la simulation autour de trois entits :
Le Trs Grand Centre de calcul du CEA (TGCC)
Infrastructure ddie laccueil de supercalculateurs et quipe notamment des machines du CCRT et de la machine
Curie dans le cadre du projet europen PRACE. Le TGCC est galement un lieu dchanges et de rencontres qui comporte
un espace confrence avec un amphithtre de 200 places.
Le Campus TERATEC
Implant sur la Technopole TERATEC, face au Trs Grand Centre de calcul du CEA, le Campus TERATEC, dune surface de
plus de 13 000 m
2
regroupe :
Des industriels (des systmes, des logiciels et des services) ainsi quune ppinire et un htel dentreprises ,
Des laboratoires de recherche industrielle : Exascale Computing Research Lab (INTEL/CEA/GENCI/UVSQ), Extreme
Computing Lab (BULL/CEA)
Un Institut Europen de Formation HPC,
Des plateformes de services accessibles par tous les acteurs de lindustrie et de la recherche.
Lobjectif du Campus TERATEC est dofrir aux professionnels de la Simulation numrique et du Calcul Haute Performance
un environnement dynamique et convivial, vritable carrefour de linnovation autour de trois axes majeurs : architecture et
performance des systmes, dveloppement de logiciels et prestations de services.
LAssociation TERATEC
LAssociation TERATEC regroupe plus de 80 partenaires issus de lindustrie et de la recherche qui ont en commun
lutilisation ou le dveloppement de systmes, de logiciels ou de services ddis la simulation et au calcul haute perfor-
mance.
TERATEC fdre et anime cette communaut pour promouvoir et dvelopper la conception et la simulation numriques et
faciliter les changes et les collaborations entre les acteurs. TERATEC organise chaque anne le Forum TERATEC qui est la
manifestation majeure en France et en Europe dans ce domaine (prochaine session prvue les 26 et 27 juin 2012 - pour en
savoir plus : www.teratec.eu)

Si vous tes intresss par une installation sur le Campus TERATEC, contactez TERATEC : infos@teratec.fr ou +33(0)1 69 26 61 76
5
S
U
P
E
R
O
R
D
I
N
A
T
E
U
R
S
06 LE DFI PERMANENT
DES SUPERCALCULATEURS
Depuis la n des essais nuclaires,
le CEA relve le d de garantir
la abilit et la sret des armes
nuclaires par la seule simulation.
08 DMOCRATISONS
LE CALCUL INTENSIF !
Genci veut rendre le calcul intensif
accessible tous les scientiques.
11 INRIA DESSINE LE FUTUR
La simulation numrique via
les supercalculateurs pousse la
France dans la course lexascale.
12 LE TERA 100 BRILLE CT
RENDEMENT
Le rendement nergtique
du Tera 100 est 7 fois suprieur
celui de son an, le Tera 10.
14 LES TRANSISTORS
3D TRI-GATE LASSAUT DE
LEXASCALE
Le dveloppement de machines
exaopiques requiert
un ensemble davances
technologiques majeures.
16 MODLISER LES
MOLCULES DU VIVANT
POUR MIEUX SOIGNER
La simulation devrait permettre
de choisir les mdicaments
tester dans les tudes cliniques.
20 LE SUPERCALCULATEUR
AU SERVICE DE LALERTE
TSUNAMI
Les effets dun sisme sous-marin
sur les ctes pourraient tre
prvisibles en quinze minutes !
22 LES FUTURS RACTEURS
NUCLAIRES PROFITENT
DJ DU CALCUL HPC
La sret nationale doit aussi la
modlisation tridimensionnelle.
24 VOIR LES MATRIAUX
GRANDIR ATOME PAR ATOME
Simuler la croissance au niveau
atomique permettra de mieux
matriser la nanolectronique.
26 LE BON CALCUL DE
LA DISSUASION NUCLAIRE
Modlisation et simulation sont
les cls de la conception nuclaire.
28 COMPRENDRE COMMENT
SE FORMENT LES TOILES
Analyser un choc entre galaxies,
cest observer la naissance dastres.
30 PHYSIQUE DES CHOCS
L'CHELLE ATOMIQUE
La mcanique des matriaux se
comprend au niveau de latome.
32 LES DFORMATIONS
MARTENSITIQUES SOUS LA
LOUPE DES PROCESSEURS
Des alliages mtalliques peuvent
retrouver leur forme initiale
aprs une grande dformation.
34 DES PROCESSEURS
GRAPHIQUES POUR
VISUALISER LA LUMIRE
Ou lternelle question du
comportement du rayon laser
35 LE PROCHAIN DFI :
LA MATRISE DE LNERGIE
Lefcacit nergtique des
mmoires et processeurs est
un rel enjeu pour demain
41 SE PROCCUPER
DURGENCE DES ERREURS
Dans la perspective de lexascale,
la simulation devrait aider les
chercheurs valider des calculs
mme en cas de pannes.
S
O
M
M
A
I
R
E
LES NOUVEAUX HORIZONS
FUTUR : VERS LEXASCALE
LES GRANDS CHALLENGES
Le cahier 2 de La Recherche ne peut
tre vendu sparment du cahier 1 (LR
N 457). La Recherche est publie par
Sophia Publications, liale de Financire
Tallandier.
SOPHIA PUBLICATIONS
74, avenue du Maine 75014 Paris
Tl. : 01 44 10 10 10
e-mail rdaction : courrier@larecherche.fr
PRSIDENT-DIRECTEUR GNRAL
ET DIRECTEUR DE LA PUBLICATION
Philippe Clerget
CONSEILLER DE LA DIRECTION
Jean-Michel Ghidaglia
Pour joindre directement par tlphone
un membre de la rdaction, composez le
01 44 10, suivi des quatre chiffres placs
aprs son nom.
DIRECTRICE DE LA RDACTION
Aline Richard
RDACTEUR EN CHEF
Luc Allemand
RDACTEUR EN CHEF ADJOINT
DU CAHIER 2
Thomas Guillemain
SECRTAIRE DE RDACTION
DU CAHIER 2
Jean-Marc Denis
DIRECTION ARTISTIQUE
ET RALISATION
A noir, 01 48 06 22 22
RESPONSABLE DE FABRICATION
Christophe Perrusson (1378)
DIRECTRICE COMMERCIALE PUBLICIT
ET DVELOPPEMENT
Caroline Nourry (1396)
DIRECTEUR DE CLIENTLE
Laurent Petitbon (1212)
DIRECTEUR ADMINISTRATIF
ET FINANCIER
Dounia Ammor
DIRECTRICE DES VENTES
ET PROMOTION
velyne Miont (1380)

Les titres, les intertitres, les textes
de prsentation et les lgendes
sont tablis par la rdaction du cahier 2.
La loi du 11 mars 1957 interdit les
copies ou reproductions destines
une utilisation collective. Toute
reprsentation ou reproduction intgrale
ou partielle faite sans le consentement
de lauteur, ou de ses ayants droit ou
ayants cause, est illicite (article L.122-4
du Code de proprit intellectuelle). Toute
copie doit avoir laccord du Centre franais
du droit de copie (CFC, 20, rue des Grands-
Augustins, 75006 Paris.
Tl. : 01 44 07 47 70. Fax : 01 46 34 67 19).
Lditeur sautorise refuser toute
insertion qui semblerait contraire aux
intrts moraux ou matriels de la
publication.

Cahier 2 de La Recherche
Commission paritaire : 0909 K 85863.
ISSN 0029-5671
IMPRIMERIE
G. Canale & C., Via Liguria 24, 10071
Borgaro (TO), Italie.
Dpt lgal parution.
2011 SOPHIA PUBLICATIONS.
IMPRIM EN ITALIE. PRINTED IN ITALY
1996 : LA FRANCE SIGNE LARRT DFINITIF DES ESSAIS NUCLAIRES. LE CEA DOIT ALORS
RELEVER UN NOUVEAU CHALLENGE : GARANTIR, DICI 2011, LA FIABILIT ET LA SRET
DES ARMES NUCLAIRES PAR LA SEULE SIMULATION. RETOUR SUR CES QUINZE ANNES
DAVENTURE INDUSTRIELLE ET DE RECHERCHE, AVEC JEAN GONNORD, DU CEA.
LE DFI PERMANENT
z
Nous sommes en 2011. Avez-
vous atteint vos objectifs ?
Jean Gonnord : Nous venons de
livrer aux concepteurs darmes
le Standard 2010 : lensemble
des codes de simulation darmes
nuclaires qui, associ notre
supercalculateur, le Tera 100,
dsormais oprationnel,
permettra de garantir les futures
ttes nuclaires des sous-marins,
sans nouvel essai nuclaire.
Une premire scientique !
Seuls les tats-Unis ont affront,
comme la France, cette
problmatique trs ambitieuse.
z
Votre vision du calcul haute
performance et de la
simulation est aujourdhui
unanimement partage par
lindustrie et la recherche
J. G. : Heureusement ! LEurope
tait trs en retard. Entre 1996
et 2006, sa part dans le Top 500
tait passe de 28 % moins
de 17 %, pour revenir aujourdhui
25 %. Il nous a fallu dix ans pour
convaincre que la simulation
haute performance (HPC,
pour High Performance
Computing) tait stratgique,
tant pour le monde industriel
an de rduire les cycles
de dveloppement et les cots
que pour celui de la recherche
nergie, climat, sant, etc. Cest
dsormais une vidence dans
le monde. Mais disposer dune
capacit de calcul ne suft pas.
Si lon considre cette capacit
comme stratgique, il faut en
contrler la technologie ! Or,
jusquen 2005, lEurope tait
absente du march du HPC :
moins de 0,2 % des machines y
tait conu. Notre vision pour
cette industrie est globale :
de la matrise des technologies
matrielles et logicielles, de leur
intgration dans des super-
calculateurs, lapplication
nale. Sur ce point, nous avons
souvent, limpression de
prcher dans le dsert.
z
Comment avez-vous mis en
uvre cette politique ?
J. G. : En ingnieur, avec une
stratgie long terme et des
JEAN
GONNORD
est le chef
du projet
Simulation
numrique
et informatique
la Direction
des applications
militaires
du CEA.
C
E
A
C
A
D
A
M
6
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
LES NOUVEAUX HORIZONS
N 457 NOVEMBRE 2011 LA RECHERCHE SUPERORDINATEURS

avons mis en place une
politique trs innovante :
le codesign qui associe
le constructeur et lutilisateur
expert en architecture.
Grce au codesign, lutilit
relle de ces Formule 1
de linformatique est garantie.
z
Comment cela sest-il
organis avec le constructeur ?
J. G. : Sur la base dun contrat,
rsultat dun appel doffres
lanc en 2008, o nous
proposions une R & D partage
donc un partage de la proprit
intellectuelle , la ralisation
dun dmonstrateur et
une option dachat. Bull,
constructeur franais, qui avait
dj ralis le Tera 10, la
emport. Plus de deux cents
personnes du CEA et de chez
Bull ont travaill ensemble
sur le Tera 100, tant sur
larchitecture matrielle que sur
les logiciels systme. Cela a t
un immense succs humain et
organisationnel, matrialis par
qualit. Cest une machine
gnraliste et non un outil de
recherche comme les Blue Gene
ou le Roadrunner dIBM, Los
Alamos au Nouveau-Mexique,
que nous avons nalement
battus. Cest enn un vrai succs
commercial pour lindustriel
franais Bull. Larchitecture
du Tera 100 a reu le prix de la
Meilleure architecture de
lanne 2009 par le magazine de
rfrence amricain, HPCwire
(1)
.
Bull a vendu ses ordinateurs en
Europe mais aussi au Brsil.
Notre quivalent anglais (AWE)
lui a achet deux machines
de 150 traops ; Genci a
command pour le programme
europen Prace la machine Curie
de plus de 1,5 petaops, qui sera
oprationnelle au Trs grand
centre de calcul du CEA (TGCC)
Bruyres-le-Chtel cette anne
ce sera la premire machine
petaopique la disposition
de lensemble de la recherche
europenne. Le programme
mondial pour la fusion
contrle F4E a command
en avril un ordinateur de
1,5 petaops qui sera installe
Rokasho, au Japon. Cela prouve
que, lorsquon a un objectif,
avec la volont de le raliser et
une organisation sans faille, rien
nest impossible.
z
Comment voyez-vous
lavenir ?
J. G. : Il sagit maintenant de
prenniser cette capacit
pour lEurope, que nous avons
dmontre, concevoir et
raliser ces trs grands
ordinateurs, stratgiques pour
notre conomie et notre socit
toute entire. lheure o le
Japon et la Chine occupent les
premires places, devant les
tats-Unis, lEurope ne peut
rester la seule rgion du monde
laisser dautres le contrle
dune technologie qui est
lune des cls de son avenir.
Cest pourquoi, nous soutenons
la cration dun ETP, pour
European Technology Platform,
pilot par les industriels
europens et sappuyant sur
les grands laboratoires de
recherche. En ce qui nous
concerne, la R & D pour les deux
prochaines gnrations
de machines du CEA/DAM :
Tera 1000 et EXA1 est dores
et dj lance. Et nous serons
au rendez-vous de lexaops *
avant la n de cette dcennie.
z
PROPOS RECUEILLIS PAR ISABELLE BELLIN
JOURNALISTE SCIENTIFIQUE
(1)
HPCwire, novembre 2009.
la cration dun laboratoire
commun, Extreme Computing,
implant sur trois sites :
aux Clayes-sous-Bois (Yvelines),
chirolles (Isre) et Bruyres-
le-Chtel (Essonne), o est situe
Ter@tec, la premire technopole
europenne du HPC.
z
Quel bilan tirez-vous de ces
quinze annes ?
J. G. : Le Tera 100 est la premire
machine conue et ralise en
Europe dpasser le petaops.
Lensemble du programme
dni en 1996 a t ralis
dans les dlais et les budgets
annoncs. Avec un rendement *
exceptionnel de 83,7 %, lun des
meilleurs du Top 500, le Tera 100
dmontre sa abilit et sa
puissances, une architecture
massivement parallle sest
impose. Ce qui impliquait
pour le Tera 100 plus de
100 000 processeurs de haute
technologie. Pour des raisons
conomiques, nous avons utilis
des composants fabriqus
en trs grandes quantits, dits
composants pris sur tagre .
Et, quinze ans plus tard, ils
savrent aussi tre les plus
performants. Seul le march
mondial permet de nancer
la recherche et dveloppement
(R & D) ncessaire un nouveau
processeur. Ct logiciels,
nous avons choisi de mutualiser
dveloppement et validation
en imposant des logiciels libres.
Enn, pour le Tera 100, nous
z
Plus de
200 personnes
au CEA et chez
Bull ont travaill
ensemble
pour concevoir
et raliser
le Tera 100.
Cest la troisime
machine
installe au CEA
de Bruyres-le-
Chtel (Essonne),
ddie
la simulation.
Ci-dessous, des
coulements
tourbillonnaires.
FLOPS
Le ops (FLoating point
Operations Per Second)
est lunit de mesure
de la puissance des
ordinateurs en nombre
doprations par
seconde. Un traops
permet de faire mille
milliards doprations
par seconde (10
12
),
un petaops den faire
un million de milliards
par seconde (10
15
)
et un exaops
permet datteindre
le milliard de milliards
doprations par
seconde (10
18
).
RENDEMENT
Le rendement est
le rapport entre la
puissance mesure
et la puissance
thorique.
tapes intermdiaires pour
proter du retour dexprience.
Avec pour principe de
dvelopper des machines
gnralistes, ables, qui
supportent la concurrence, pas
des btes de calcul pour faire
la course la premire place
ni des machines darsenal pour
notre seul besoin. Le trs haut
niveau dexpertise de lquipe
et la capacit du Commissariat
lnergie atomique et aux
nergies alternatives (CEA)
organiser de grands projets
ont fait le reste. Tenir nos
engagements en 2010 supposait
de disposer de 500 traops *.
En 2001, nous avons vis
5 traops et conu le
supercalculateur Tera 1 et, en
2005, 50 traops avec le
Tera 10. Le succs du Tera 10
nous a pousss doubler
la puissance prvue pour le
Tera 100 qui dispose nalement
de plus de 1 000 traops soit
1 petaops. Face de telles
C
E
A
7
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
FLOPS
est lunit de mesure
de la puissance des
doprations par
seconde. Un traops
par seconde (10
12
),
par seconde (10
15
)
et un exaops
permet datteindre
doprations par
seconde (10
18
).
pr-requis pour largir le nombre
dtats membres de Prace, qui
contribueront de manire subs-
tantielle au fonctionnement de
linfrastructure de recherche. Ces
nouvelles contributions permet-
tront Prace de mettre disposi-
tion des ressources toujours plus
comptitives qui favoriseront
leur tour la production dune
meilleure science... Cest un cercle
vertueux. Prace est sur la bonne
voie : la Hongrie a rejoint linfras-
tructure de recherche, le 8 juin
dernier, devenant ainsi le 21
e

tat europen membre de Prace.
Ds la mi-2010, les scienti-
ques europens ont eu accs
au supercalculateur Jugene,
premire composante de
linfrastructure Prace, situ
Juelich, en Allemagne. Depuis
le dbut de cette anne, ils
peuvent galement calculer sur
Curie, install en France au Trs
grand centre de calcul du CEA
(TGCC). Financ par Genci, ce
supercalculateur sera pleine-
ment oprationnel la n 2011
et dlivrera une puissance dau
moins 1,8 petaops. partir de
2012, ils auront accs dautres
machines, en Allemagne, en Ita-
lie et en Espagne.
Pour Jrmie Bec, premier
scientifique franais laurat
dheures europennes de
calcul, des progrs scientiques
majeurs sont en vue. Les su-
percalculateurs petaflopiques
ouvrent une nouvelle re de la
recherche, celle de lexprimen-
tation dans un laboratoire vir-
tuel , se rjouit ce spcialiste des
coulements turbulents bas
lObservatoire de la Cte dAzur,
Nice, qui travaille notamment
lucider le rle que jouent les
uctuations turbulentes dans le
dclenchement des prcipita-
tions des nuages chauds.
I
maginez des machines si
puissantes quelles effec-
tuent en une seule journe
une tche quun ordinateur
de bureau mettrait au moins
150 ans accomplir Science-
ction ? Non, science tout court !
Ces machines, que lon appelle
des supercalculateurs, sont ca-
pables deffectuer des millions
de milliards doprations en une
seule seconde do le terme de
calcul intensif. Elles permettent
de reproduire, par la modlisa-
tion et la simulation, des exp-
riences qui ne peuvent pas tre
ralises en laboratoire, quand
elles sont dangereuses, co-
teuses, de longue dure ou trs
complexes, voire inaccessibles
lchelle humaine.
La simulation numrique est
devenue une dmarche essen-
tielle de la recherche scientique
en complment de la thorie et
de lexprimentation. Au niveau
national, Genci (Grand quipe-
ment national de calcul inten-
sif ) est la structure publique
charge de porter la politique
franaise en matire de calcul
intensif pour la recherche aca-
dmique. Avec le ministre de
lEnseignement suprieur et de
la Recherche, Genci associe les
principaux acteurs franais du
calcul intensif : le CEA, le CNRS,
les universits et lInria. En
quatre ans, les investissements
raliss par Genci ont permis de
multiplier par un facteur sup-
rieur 30 la puissance de calcul
mise la disposition de la com-
munaut scientique franaise,
qui est actuellement de lordre de
600 traops * , dclare Cathe-
rine Rivire, PDG de Genci.
Au-del de la France, lEu-
rope du calcul intensif se concr-
tise. Convaincus quaucun pays
ne pouvait, lui seul, nancer et
faire voluer de manire durable
une infrastructure de calcul de
visibilit mondiale, vingt repr-
sentants de pays europens,
dont Genci, ont cr, le 9 juin
2010 Barcelone, en Espagne,
linfrastructure europenne de
recherche Prace (Partnership
for Advanced Computing in Eu-
rope). Objectif ? Mettre en place
et animer sur le Vieux Continent
une infrastructure distribue et
prenne de calcul, compose
de quatre six centres quips
de machines dotes dune puis-
sance suprieure au petaops *.
Laboratoire virtuel
Le succs de Prace dpend des
rsultats scientiques qui seront
obtenus et qui devront tre re-
connus parmi les meilleurs au
monde, souligne le physicien
britannique Richard Kenway,
prsident du conseil scientique
de Prace. Cest l un objectif fon-
damental pour nous. La dmons-
tration de notre russite est un
8
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
z
Catherine Rivire,
PDG de Genci.
LA SIMULATION NUMRIQUE EST PROGRESSIVEMENT DEVENUE UN VECTEUR UNIVERSEL
DE NOTRE DVELOPPEMENT SCIENTIFIQUE ET CONOMIQUE. LAMBITION DE LA
STRUCTURE PUBLIQUE GENCI EST DE DMOCRATISER LUTILISATION DU CALCUL INTENSIF
EN LE RENDANT ACCESSIBLE TOUS LES SCIENTIFIQUES SUR LE TERRITOIRE NATIONAL.
DMOCRATISONS
LE CALCUL INTENSIF !
D
R
responsable de la
Communication
de Genci (Grand
quipement
national de
calcul intensif).
PAR
LTITIA
BAUDIN
De faon plus gnrale, selon
Alain Lichnewsky, responsable
scientique de Genci : Laccrois-
sement des capacits des super-
calculateurs, installs en France
sous lgide de Genci ou dans le
cadre de Prace, permet des rsul-
tats novateurs : gnralisation
des modles ab initio reposant
sur les principes fondamentaux
dans les domaines de la chimie
et des matriaux ; obtention de
donnes essentielles pour fonder
de nouvelles mthodes expri-
mentales. Avec les progrs de la
modlisation et ladaptation des
codes de calcul aux nouveaux
calculateurs, la frontire des
connaissances stablit main-
tenant en confrontant ltat de
lart en simulation et la nature
des problmes tudis.
Vers un systme pyramidal
Ainsi les scientiques peuvent-
ils aborder des phnomnes de
plus en plus complexes pour ap-
porter des rponses concrtes
des problmes cruciaux du point
de vue conomique ou socital.
Dans le domaine de la clima-
tologie, par exemple, la sauve-
garde de la Plante passe par une
connaissance fine du climat :
Il est indispensable de disposer
dune trs grande puissance de
calcul pour simuler avec le plus
de ralisme possible le pass de
notre climat, les conditions ac-
tuelles et son volution future en
fonction de diffrents scnarios,
explique Jean Jouzel, vice-prsi-
dent du Groupe dexperts inter-
gouvernemental sur lvolution
du climat (Giec). Avec Curie,
nous pourrons envisager des
simulations climatiques une
rsolution de lordre de la dizaine
de kilomtres sur lensemble de la
Plante et sur plusieurs centaines
dannes. Cela nous permettra
galement daccrotre la partici-
pation europenne lors des pro-
chains exercices internationaux
de simulation du climat. Ce
nest l quun exemple, dautres
sont prsents dans ces pages.
Beaucoup reste cependant
faire. Aujourdhui, nous ne
disposons pas rellement dun
niveau intermdiaire entre les
supercalculateurs, nationaux et
europens, et les machines de la-
boratoire, souligne Olivier Piron-
neau, prsident du Comit >>>
9
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
z
Inauguration
ofcielle de
linfrastructure
europenne de
recherche Prace
(Partnership
for Advanced
Computing
in Europe),
Barcelone
(Espagne),
le 9 juin 2010.
z
Le super-
calculateur
petaopique
Curie en cours
dinstallation
au Trs grand
centre de calcul
(TGCC) du CEA,
Bruyres-
le-Chtel
(Essonne). C
E
A
P
R
A
C
E
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
>>> stratgique du calcul inten-
sif (CSCI), charg de veiller la
cohrence des actions menes
en France dans le domaine du
calcul intensif. Dvelopper les
moyens des centres universitaires
est une priorit ; cest dailleurs
lobjectif du projet Equip@meso,
ou quipement dexcellence de
calcul intensif de mso-centres
coordonns, conduit par Genci
et qui associe dix partenaires de
diffrentes rgions franaises.
Retenu dans le cadre de
lappel projets quipements
dexcellence men sous lgide
du Commissariat gnral
linvestissement, Equip@meso
bncie dun nancement de
10,5 millions deuros pour ren-
forcer les moyens de calcul
lchelle rgionale en compl-
ment des moyens nationaux.
Nous allons ainsi acclrer la
construction dune vritable py-
ramide du calcul intensif autour
de ses trois strates gographiques :
les moyens de calcul accessibles
au niveau europen, les res-
sources des centres de calcul na-
tionaux et les moyens coordonns
en rgion , complte Catherine
Rivire.
En attendant lexascale
Ce rapprochement avec les
universits doit galement per-
mettre de mettre en uvre une
offre concerte et toffe de for-
mation de spcialistes matri-
sant le calcul intensif et la simu-
lation numrique, linstar par
exemple du master Modlisa-
tion et simulation , mis en place
notamment par le CEA, Centrale
Paris, lcole polytechnique et
luniversit de Versailles Saint-
Quentin-en-Yvelines (UVSQ).
Nous avons effectivement
besoin dun nombre croissant
de jeunes scientifiques forms
aux technologies de calcul les
plus pointues, capables de com-
prendre, de dvelopper et de
maintenir les logiciels nces-
saires , estime Richard Kenway.
Cest que le prochain d rele-
ver, le passage lexascale, vers
2018, sera de taille : Ce nest pas
une vue de lesprit, conrme Oli-
vier Pironneau, pour russir cette
nouvelle transition, de grands
chantiers doivent tre mens :
amlioration des communica-
tions dans les puces ; dveloppe-
ment de logiciels, compte tenu
du nombre de processeurs qui
seront ncessaires pour atteindre
le milliard de milliards dopra-
tions la seconde ; rsistance aux
pannes, enn, qui devrait bn-
cier de la virtualisation.
En France, cet enjeu dcisif
est notamment abord au tra-
vers du Laboratoire europen
de recherche sur lexascale (ECR
Lab), cr conjointement par
le CEA, Genci, Intel et lUVSQ.
Accueillant une vingtaine de
chercheurs, lECR Lab prpare
et dveloppe les architectures
matrielles et logicielles (codes
scientifiques et outils de pro-
grammation) qui permettront
de soutenir le niveau de perfor-
mance exaopique. La contri-
bution de Genci sinscrit notam-
ment dans la perspective de pr-
parer la communaut scientique
franaise larrive de lexascale ,
explique Stphane Requena, res-
ponsable technique de Genci.
Mais le champ du calcul
intensif et de la simulation nu-
mrique ne se rsume pas la
recherche acadmique : Ce sont
galement des outils stratgiques
dun point de vue conomique,
rappelle Catherine Rivire. Ils
sont un lment essentiel de la
productivit industrielle, dune
part en permettant de rduire
considrablement le temps de
conception et de mise sur le mar-
ch dun produit ou dun service,
dautre part en contribuant forte-
ment linnovation et loptimi-
sation des tapes de production et
de maintenance.
Simulation numrique et PME
Si les grands groupes industriels
ou financiers comme Total,
EDF, Airbus ou BNP Paribas ont
communment intgr la simu-
lation numrique et le calcul
intensif dans leurs schmas de
dveloppement, la dmonstra-
tion reste faire auprs des PME
qui en matrisent souvent moins
bien les enjeux technologiques,
nanciers et humains.
Do linitiative HPC-
PME , porte par Genci, lInria
et Oseo. Btie en cohrence
avec les recommandations du
plan France Numrique 2012,
cette initiative a t lance il y
a un peu plus dun an. Notre
objectif est daider les PME va-
luer la pertinence de lutilisation
de la simulation numrique au
regard de leur modle dactivit,
en mobilisant les acteurs du
calcul intensif les mieux mme
de les accompagner dans cette
valuation , prcise Catherine
Rivire. lt 2011, pas moins
de quinze PME ont exprim
leur intrt pour un accompa-
gnement. Issues de diffrents
secteurs (automobile, aronau-
tique, mdia numrique, indus-
trie navale, microlectronique,
traitement du signal, etc.), elles
sont rparties sur lensemble du
territoire national.
lheure o lAsie domine la
course aux supercalculateurs, il est
crucial de soutenir le dveloppe-
ment scientique et conomique
national. La simulation num-
rique en est un des outils : plus
que jamais, il est ncessaire de
dmocratiser le calcul intensif !
z
z
De haut en bas :
le physicien
britannique
Richard Kenway
prsident
du conseil
scientique
de Prace ;
Olivier Pironneau,
prsident
du Conseil
stratgique du
calcul intensif.
10
U
N
I
V
E
R
S
I
T
Y
O
F
E
D
I
N
B
U
R
G
H
D
R
LINSTITUT NATIONAL DE RECHERCHE EN INFORMATIQUE ET EN AUTOMATIQUE (INRIA)
SEST DOT DUNE ACTION DENVERGURE NATIONALE (AEN) DANS LE BUT DOPTIMISER
LEXPLOITATION DES SUPERCALCULATEURS VIA LA SIMULATION NUMRIQUE. ON PEUT
DORES ET DJ CONSIDRER LA FRANCE COMME ENGAGE DANS LA COURSE LEXASCALE.
INRIA DESSINE LE FUTUR
Toulouse. Celui-ci est focalis
sur la conception et la ralisa-
tion doutils numriques prcis
et utilisant un grand nombre de
curs de calcul pour des appli-
cations complexes en physique
des matriaux, en mcanique
des uides et en climatologie.
Le prochain d de la com-
munaut scientifique concer-
nant la simulation numrique
est le passage lexascale, au
cours duquel la performance du
meilleur supercalculateur sera
multiplie par 1 000. Inria par-
ticipe depuis 2009 la phase de
prparation de lexascale.
Feuille de route
Il sagit notamment de recenser
les applications qui requirent ce
type de machine, de projeter les
architectures ralisables en 2018
avec laide des constructeurs et,
enfin, dvaluer les recherches
et dveloppements ncessaires
pour raliser des logiciels utili-
sables ds que le premier calcu-
lateur de cette catgorie sera dis-
ponible. Le projet IESP (Interna-
tional Exascale Software Project),
a tabli une premire feuille de
route ; le projet EESI (European
Exascale Software Initiative),
contribue IESP en construisant
la feuille de route europenne.
Inria est un acteur majeur dans
ces deux projets.
Enfin, il faut tudier com-
ment adapter les applications
pour fonctionner cette chelle.
Inria est initiateur et membre du
projet G8 ECS (Enabling Climate
Simulation at Extreme Scale). Ce
projet regroupe les meilleures
quipes de six pays pour tudier
de nouveaux algorithmes et de
nouvelles techniques logicielles
an dobtenir une performance
maximale sur les futurs calcula-
teurs exascale en climatologie.
z
C
omment attaquer les
grandes problma-
tiques poses par la
programmation des
architectures de calculs massi-
vement parallles petaopiques
et bientt exaopiques ? Com-
ment apprhender leur exploita-
tion pour la comprhension des
problmes scientiques et des
technologies complexes dint-
rt pour notre socit ? Pour
rpondre ces questions, Inria
sest dot dune Action denver-
gure nationale (AEN) runissant
des quipes de diffrents sites sur
le thme du Calcul trs haute
performance pour les sciences
computationnelles . Lobjectif :
mettre en place un continuum de
comptences visant exploiter
de manire efcace les capacits
de traitement et de stockage des
supercalculateurs, an de mettre
en uvre des simulations num-
riques complexes de trs grandes
tailles.
Laboratoires communs
Cette AEN sera rsolument
oriente par les domaines ap-
plicatifs qui seront des ds
cibles des mthodologies infor-
matiques et mathmatiques
tudies. Lensemble des activi-
ts de recherche quelles soient
mthodologiques ou applica-
tives viseront toutes le mme
objectif : la recherche de la meil-
leure performance eu gard
aux possibilits offertes par les
technologies actuelles ou dispo-
nibles dans un futur proche.
ce partenariat interne au
sein dInria vont se joindre un
certain nombre dorganismes
et dindustriels, tels que, dans
un premier temps, lAndra, le
BRGM, le CEA, EDF R & D ou Das-
sault Aviation. Leur participation
saccompagnera de la dnition
de dfis applicatifs dans diff-
rents domaines tels que lenvi-
ronnement (risque sismique,
squestration du CO
2
, transport
de radionuclides), la fusion
nuclaire en lien avec le projet
Iter (dynamique des plasmas) ou
laronautique (conception aro-
dynamique).
Chacun de ces dfis appli-
catifs conduira au dploiement
de simulations numriques
trs grande chelle en termes de
taille de problme et de volume
de donnes mises en jeu sur des
congurations de calculs massi-
vement parallles de plusieurs
milliers plusieurs centaines de
milliers de curs de calcul.
Inria a aussi cr des labo-
ratoires communs avec des
tablissements jouant un rle
majeur dans le domaine. Un
premier laboratoire a ainsi t
ouvert il y a deux ans avec luni-
versit de lIllinois (tats-Unis)
et le National Center for Super-
computing Applications dans
cette mme universit. Ses ob-
jectifs scientiques ont t d-
nis autour de quatre thmes : les
langages et environnements de
programmation parallle ; les lo-
giciels systmes ; les algorithmes
et bibliothques numriques ; et
la tolrance aux pannes.
Autre exemple : Inria a ouvert
un laboratoire commun national
avec le Centre europen de re-
cherche et de formation avance
en calcul scientique (Cerfacs),
responsable
de lquipe
de recherche
Nachos, ddie
la modlisation
numrique et au
calcul intensif
responsable
de lquipe
de recherche
Hiepacs, ddie
aux algorithmes
parallles pour
la simulation
sur des
calculateurs
peta/exaops.
PAR
STPHANE
LANTRI
ET
JEAN ROMAN
11
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
Le prochain d
de la communaut
scientique concernant
la simulation
numrique est le
passage lexascale
INSTALL EN JUILLET 2010, LE SUPERCALCULATEUR TERA 100 EST CLASS PARMI LES PLUS
PERFORMANTS DE LA PLANTE. CE FUT LE PREMIER EN EUROPE ACCDER AU PETAFLOPS.
SON PLUS GRAND ATOUT : LE RENDEMENT NERGTIQUE, QUI EST MULTIPLI PAR UN
FACTEUR 7 COMPAR SON AN LE TERA 10 POURTANT 20 FOIS MOINS PUISSANT !
LE TERA 100 BRILLE
CT RENDEMENT
z
Le rseau
dinterconnexion
de la machine
possde
un cblage
complexe qui
permet la
communication
entre les
4 370 nuds
de calcul.
de calcul et de gestion des don-
nes, le Tera 100 a aussi bnci
de lexprience acquise depuis le
dbut des annes 2000 avec lins-
tallation et lexploitation russies
de ses prdcesseurs : le Tera 1
en 2001, puis le Tera 10 en 2005.
Grce ce savoir-faire et ces
connaissances, tant en termes
danalyse des besoins, darchitec-
ture des calculateurs, que pour
lvolution des technologies ma-
trielles et logicielles, nous avons
pu dnir les caractristiques de
ce colosse du calcul.
Le Tera 100 a t conu pour
tre efcace quelles que soient
les mthodes numriques et al-
gorithmiques utilises. Bti avec
des logiciels libres et des proces-
seurs de grande diffusion, il a
donn naissance une gamme
commerciale comptitive de
supercalculateurs. En effet, il ne
sagissait pas de raliser un objet
unique, mais dintgrer ce projet
dans une dmarche industrielle.
A
boutissement de deux
annes de recherche et
dveloppement entre
des ingnieurs de la
direction des applications mili-
taires du Commissariat lner-
gie atomique et aux nergies al-
ternatives (CEA) et du construc-
teur informatique franais Bull,
le supercalculateur Tera 100 est
le premier ordinateur conu et
fabriqu en Europe avoir pass
la barre symbolique du peta-
ops *. Sa performance mesure
de 1,05 petaops le plaait en no-
vembre 2010 au 6
e
rang des cinq
cents ordinateurs les plus puis-
sants du monde ; il est repass
la 9
e
place au palmars tabli en
juin 2011. Avec un rendement *
remarquable de 83,7 % au test de
rfrence de ce classement, cest
certainement lun des super-
calculateur les plus gnralistes
parmi les dix premiers mondiaux.
Fruit de quinze annes de tra-
vaux en simulation numrique et
architecture des grands systmes
C
E
A
C
A
D
A
M
-
P
.
S
T
R
O
P
P
A
/
C
E
A
P. STROPPA/CEA
z
peine le
supercalculateur
Tera 100 fut-il
install que
lquipe Bull-CEA
envisageait dj
son successeur
1 000 fois plus
puissant !
12
PAR
PIERRE LECA
chef du
dpartement
des Sciences de
la simulation et
de linformation
la Direction
des applications
militaires du CEA
ET SOPHIE
HOUSSIAUX
responsable du
projet Tera 100
chez Bull.
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
R
A
N
G
SITE PAYS
NOM CONSTRUCTEUR
PUISSANCE MESURE
(en petaops)
RENDEMENT
(en %)
1
RIKEN Advanced Institute
for Computational Science Japon
Super K Fujitsu 8,16 93,0
2 National Supercomputing Center, Tianjin Chine Tianhe-1A NUDT MPP 2,57 54,6
3
DOE/Oak Ridge National Laboratory,
Tennessee tats-Unis
Jaguar Cray XT 1,75 75,5
4
National Supercomputing Center,
Shenzhen Chine
Nebulae Dawning 1,27 42,6
5 Tokyo Institute of Technology Japon Tsubame-2.0 HP 3000SL 1,19 52,1
6
DOE/Los Alamos National Laboratory,
Nouveau-Mexique tats-Unis
Cielo Cray XE 1,11 81,2
7 NASA/Ames Research Center/NAS tats-Unis Pleiades SGI 1,09 82,7
8
DOE/National Energy Research Scientic
Computing Center, Californie tats-Unis
Hopper Cray XE 1,05 81,8
9
Commissariat lnergie atomique
et aux nergies alternatives (CEA) France
Tera 100 Bull bullx 1,05 83,7
10
DOE/Los Alamos National Laboratory,
Nouveau-Mexique tats-Unis
Roadrunner IBM 1,04 75,7
Cest larchitecture trs rpandue
des microprocesseurs X86 qui a
t retenue. Le supercalculateur
sintgre ainsi parfaitement
lenvironnement de stations de
travail fonctionnant sous le sys-
tme dexploitation Linux.
Les choix ont tenu compte
de lvolution technologique
des microprocesseurs : leur
frquence ou vitesse de tra-
vail naugmente gure plus,
ce sont leurs curs, les units
de calcul lmentaires, qui se
multiplient dans chaque micro-
processeur. Ceux retenus pour
btir le Tera 100, Intel Xeon
X7560 connu sous le nom de
Nehalem-EX , comportent huit
curs. Quatre de ces micropro-
cesseurs sont assembls pour
former un multiprocesseur (le
serveur bullx 3060), vritable
brique de base du supercalcula-
teur, appel nud de calcul dans
le jargon des informaticiens.
Ainsi, au sein de chaque nud,
32 curs partagent une mmoire
de 64 gigaoctets. Pour atteindre
sa puissance de calcul, le Tera 100
interconnecte 4 370 nuds, soit
17 480 microprocesseurs et prs
de 140 000 curs.
Consommation matrise
Le rseau dinterconnexion a t
conu selon une architecture ori-
ginale : une topologie en archipels
reliant des grappes de nuds et
permettant un accs rapide aux
mdias de stockage de donnes.
Le dbit maximal agrg de ce
rseau peut atteindre 13 traoc-
tets (13 milliers de milliards
doctets) par seconde. Globale-
ment, larchitecture du Tera 100
ressemble un embotement de
poupes russes : au dpart un
microprocesseur, puis un nud
de calcul (4 microprocesseurs),
puis une armoire (24 nuds),
ensuite un archipel (une vingtaine
darmoires) et, enn, le supercal-
culateur (10 archipels). En outre,
le rseau dinterconnexion est
deux niveaux : intra-archipel et
interarchipel. Il assure la com-
munication des donnes entre
tout couple de nuds au sein de
lordinateur.
Pouvoir matriser la consom-
mation dnergie, problme
majeur de ces installations den-
vergure, a t lune des proccu-
pations essentielles de lquipe
Bull-CEA. Parmi les principales
innovations, un dispositif de
refroidissement par eau, install
dans la porte des armoires, a per-
mis de rendre linstallation com-
pacte. Le calculateur noccupe
que 650 mtres carrs au sol. Ce
refroidissement, au plus proche
du dgagement de chaleur, am-
liore lefcacit nergtique du
centre de calcul. Par ailleurs, la
consommation est module en
fonction de la charge de calcul,
ce qui permet de baisser la fr-
quence des curs sils ne sont
pas utiliss pleine puissance.
En rgime normal, cela devrait
limiter la puissance lectrique n-
cessaire 3 mgawatts. Avec une
puissance de calcul 20 fois sup-
rieure celle du Tera 10, son an,
le Tera 100 amliore le rendement
nergtique dun facteur 7.
Pour bncier des logiciels
les plus avancs, les dvelop-
pements ont t mens avec la
communaut internationale :
certains avec les spcialistes du
Department of Energy, aux tats-
Unis, dautres avec des indus-
triels et des chercheurs acad-
miques, notamment sur Lustre,
le systme de gestion de chiers
libre. Ce systme dit distribu
permet de partager les donnes
LE TOP 10 DES SUPERCALCULATEURS
FLOPS
est lunit de mesure
de la puissance des
doprations par
seconde. Un traops
par seconde (10
12
),
par seconde (10
15
)
et un exaops
permet datteindre
doprations par
seconde (10
18
).
RENDEMENT
Le rendement est
le rapport entre la
puissance mesure
dun ordinateur et sa
puissance thorique.
rparties sur des centaines de
nuds de calcul. Lenvironne-
ment logiciel prend en compte la
spcicit des nuds de calcul
et la topologie particulire du
rseau dinterconnexion. vi-
demment, cest le cas pour la
bibliothque de communication,
mais aussi pour le logiciel de ges-
tion de ressources qui sefforce
notamment de placer les calculs
selon leur prol.
Enn, un logiciel dadminis-
tration et de supervision contrle
ltat des diffrents lments (m-
moires, processeurs, rseau)
pour prvenir la consquence de
pannes sur les calculs en cours. Ce
maintien en condition opration-
nelle est critique durant toute la
vie de lordinateur.
Ltape du petaflops tant
franchie, lquipe Bull-CEA se
consacre dsormais au nou-
veau Graal du supercalcul :
lexaops *, soit une puissance
de calcul 1 000 fois suprieure
celle du Tera 100.
z
UN FRANAIS EN 9
E
POSITION MONDIALE
Comme chaque anne, en juin et en novembre, un palmars des cinq cents
supercalculateurs les plus puissants du monde est tabli sur la base de lexcution
dun calcul talon, baptis Linpack. Dans le dernier classement, de juin 2011,
tous les ordinateurs contre seulement 7 en novembre 2010 dpassaient la barre
du petaops. Un cap franchi pour la premire fois en juin 2008 par IBM et son
Roadrunner, aujourdhui 10
e
au classement. Le Tera 100 est le supercalculateur le
plus puissant dEurope, tout comme ltait son prdcesseur, le Tera 10, en juin 2006.
Avec sa 9
e
place au palmars mondial, le Tera 100 se classe brillamment deuxime
en termes de rendement (83,7 %), autrement dit pour sa abilit par rapport
la puissance thorique annonce. La Chine continue sa progression fulgurante
afchant deux machines dans le dernier Top 10, avec nanmoins de faibles
rendements. Les tats-Unis restent leaders incontests ct supercalculateurs
installs, mais cest dsormais le Japon qui prend et de loin la tte du classement
avec le Super K Computer de Fujitsu et ses 8,16 petaops.
13
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
Depuis plus de quarante ans,
le modle conomique de lin-
dustrie des semi-conducteurs
est dict par la loi de Moore, qui
doit son nom au cofondateur
dIntel, Gordon Moore. Selon
cette prvision du rythme de d-
veloppement de la technologie
du silicium, la densit de transis-
tors doit doubler environ tous les
deux ans, tout en augmentant la
fonctionnalit, la performance et
en abaissant les cots. Commen-
tant lapparition dune struc-
ture tridimensionnelle, Gordon
Moore note que depuis des
annes, nous avons constat les
limites la miniaturisation des
D
but mai, Intel a an-
nonc une innova-
tion majeure concer-
nant le transistor, ce
composant microscopique qui
est la base de llectronique
moderne. Pour la premire fois
depuis leur invention voici plus
de cinquante ans, le design des
transistors va changer pour tre
dot dune structure tridimen-
sionnelle. Ces nouveaux transis-
tors rvolutionnaires en 3D ,
baptiss Tri-Gate , seront utili-
ss pour la premire fois dans un
microprocesseur (nom de code
Ivy Bridge ), grav en 22 nano-
mtres (nm).
Jusqu ce jour, et depuis des
dcennies, tous les transistors
utilisent une structure planaire
bidimensionnelle en 2D qui
se retrouve non seulement dans
tous les ordinateurs, les tl-
phones mobiles et llectronique
grand public, mais aussi dans les
commandes embarques bord
des vhicules, de lavionique,
des appareils mnagers, des
appareils mdicaux, ainsi que
dans, virtuellement, des milliers
dautres appareils que nous utili-
sons dans notre vie quotidienne.
Cest dire limportance de cette
annonce.
Les scientifiques recon-
naissent depuis longtemps les
avantages dune structure 3D
pour faire progresser les carac-
tristiques des processeurs.
Aujourdhui, la taille microsco-
pique des transistors rend en-
core plus difcile leur concep-
tion, sujette aux lois physiques
de linfiniment petit. Il sagit
donc dune vritable prouesse
technologique, tant pour la
conception du processeur lui-
mme que dans la capacit
produire de faon industrielle et
en grand volume ces nouveaux
transistors. Les 3D Tri-Gate
marquent une rinvention du
transistor. La porte planaire (ou
plate ) en deux dimensions
est en effet remplace par une
ailette tridimensionnelle in-
croyablement ne, en position
verticale par rapport au substrat
de silicium.
Le contrle du courant in-
tervient en plaant une porte
sur chacun des trois cts de
laileron une sur chaque ct
et une troisime au-dessus et
non plus seulement une au-
dessus, comme cest le cas pour
un transistor planaire en 2D. Ce
contrle supplmentaire permet
la transmission dautant de cou-
rant que possible lorsque le tran-
sistor est en mode actif dans
un souci de performances et
aussi proche de zro que pos-
sible lorsquil est en mode teint
pour limiter la consommation
lectrique. Il lui permet ainsi de
passer trs rapidement dun tat
lautre, l encore dans un souci
de performances.
Toujours la loi de Moore
De mme que les gratte-ciel
permettent aux urbanistes
doptimiser lespace disponible
en construisant en hauteur, la
structure du transistor 3D Tri-
Gate constitue un moyen de
grer la densit. Comme ces aile-
rons sont verticaux, les transis-
tors peuvent tre rangs de ma-
nire plus dense les uns ct
des autres, ce qui est essentiel
pour bncier des avantages
technologiques et conomiques
de la loi de Moore. Pour les fu-
tures gnrations de transistors,
les concepteurs auront aussi la
capacit dallonger les ailerons
pour en tirer encore plus de
performances et de rendement
lectrique.
14
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
LE DVELOPPEMENT DE MACHINES EXAFLOPIQUES DONT LA PUISSANCE DE CALCUL
EST MILLE FOIS SUPRIEURE CELLES DES PLUS GROS CALCULATEURS ACTUELS
REQUIERT UN ENSEMBLE DAVANCES TECHNOLOGIQUES MAJEURES. TANT DU CT
MATRIEL QUE DU CT LOGICIEL.
LES TRANSISTORS
3D TRI-GATE LASSAUT
DE LEXASCALE
responsable HPC
secteur public
et recherche
chez Intel.
PAR
MARC
DOLLFUS
transistors ; ce changement dans
leur structure de base reprsente
une approche rellement rvolu-
tionnaire, qui devrait permettre
la loi de Moore et au rythme de
linnovation de perdurer .
Les transistors 3D Tri-Gate
permettent aux puces de fonc-
tionner plus faible tension et
avec moins de dperdition. Il en
rsulte une combinaison in-
dite de gains de performances
et de meilleur rendement lec-
trique par rapport aux prc-
dents transistors, mme les
plus modernes. Les transistors
3D Tri-Gate 22 nm affichent
ainsi des gains de performances
allant jusqu 37 % par rapport
aux transistors planaires 32 nm
dIntel. De plus, la consomma-
tion de ces nouveaux transistors
a t plus que divise par deux
pour des performances iden-
tiques celles de leurs prdces-
seurs 2D. Ce gain considrable
les rend trs attractifs pour une
utilisation dans de petits termi-
naux de poche, pour lesquels la
consommation lectrique est
une donne essentielle.
Un saut indit
Pour Mark Bohr, Intel Senior Fel-
low, qui a contribu fortement
ces avances, les gains de perfor-
mances et les conomies dner-
gie quafchent les transistors
3D Tri-Gate ne ressemblent
rien de ce qui a t fait jusque-l.
Cette tape est bien plus quune
simple validation continue de la
loi de Moore. Les avantages en
tension et en consommation
lectrique dpassent de loin
ceux que lon peut en gnral
obtenir dune gnration de
techniques de gravure une
autre. Ils donneront aux concep-
teurs de produits la exibilit de
rendre les appareils existants
plus intelligents. Ils rendront
possible la conception de pro-
duits entirement nouveaux.
Le transistor 3D Tri-Gate
sera implment loccasion
du passage au prochain pro-
cd de fabrication, la gravure
en 22 nm. Les processeurs Intel
Core base de puces Ivy Bridge
seront les premiers tre fabri-
qus en grande srie, la n de
lanne 2011.
z
15
L
E
S

N
O
U
V
E
A
U
X

H
O
R
I
Z
O
N
S
z
Jusqu
prsent, tous
les transistors
avaient une
structure
bidimensionnelle
( gauche :
le transistor
en 90 nm
prsent en 2002).
Le Tri-Gate
(ci-dessus)
possde quant
lui une ailette
verticale
par rapport
au substrat
de silicium.
P
R
A
C
E
P
H
O
T
O
S
:
I
N
T
E
L
reprsenter leur com-
portement avec suffi-
samment de prcision.
chelle infranchissable
Cest essentiellement pour
cette raison que la puis-
sance des supercalculateurs
est capitale, puisquelle per-
met deffectuer ces calculs en
des dlais toujours plus courts.
Au dbut des annes 2000, pr-
dire une seule interaction entre
une molcule thrapeutique et
une biomolcule demandait
trois mois de calculs !, se sou-
vient Michel Masella, chercheur
au laboratoire de Chimie du vi-
vant au Commissariat lner-
gie atomique et aux nergies
alternatives (CEA). lpoque,
la simulation numrique faisait
sourire de nombreuses personnes
qui estimaient que lon avait plus
vite fait de faire des expriences
que dattendre trois mois pour un
seul rsultat. Aujourdhui, notre
objectif est de raliser de 100
1 000 prdictions dinteraction
par jour, ce qui sera possible
grce aux ressources fournies
par le supercalculateur euro-
pen Curie, hberg par le CEA,
et qui disposera bientt de 80 000
processeurs. Un saut phnom-
nal ! la fois technique, car il a
fallu des machines beaucoup
plus performantes, mais gale-
ment un saut aux niveaux de la
physique et de lalgorithmique,
car les mthodes que les cher-
cheurs utilisent actuellement
ont t beaucoup amliores
et optimises. Certaines uni-
ts de recherche du CEA conti-
P
our un traitement th-
rapeutique, il existe
plusieurs milliers de
molcules poten-
tielles. Voici le casse-tte quoti-
dien des laboratoires pharma-
ceutiques. Impossible de mener
des essais cliniques pour chaque
candidat. Aussi, comment pr-
dire quelles biomolcules ont le
plus de chances dtre efcaces ?
Une solution, considre il y a
encore peu comme une pure
fiction : la simulation num-
rique. Une machine colossale,
un supercalculateur, pourrait
devenir loutil indispensable
pour comprendre le fonctionne-
ment des traitements au niveau
molculaire.
Grce la puissance de
calcul aujourdhui disponible,
il devient possible de simuler le
comportement des biomacro-
molcules protines, acides
nucliques, polysaccharides,
etc. dans leur milieu naturel
et de mieux comprendre leurs
interactions et leurs rles fonc-
tionnels au sein de la cellule ,
explique Richard Lavery, cher-
cheur au laboratoire Bases
molculaires et structurales
des systmes infectieux du
CNRS, Lyon. En remplaant
les modles atomiques par des
reprsentations simplifies, on
peut mme btir un modle de
virus contenant lquivalent de
15 millions datomes et voir vo-
luer sa structure dans le temps.
La simulation permet de
sonder ce qui se produit au sein
dune cellule vivante. Concrte-
ment, il sagit de modliser des
systmes comportant plusieurs
dizaines de milliers datomes,
de prdire les forces qui sta-
blissent entre ces atomes les
interactions et destimer avec
prcision leur comportement
au sein de lorganisme. Or plus
une interaction est forte, plus la
molcule ltude a de chances
dtre un agent thrapeutique
ou diagnostique efcace. Mais
le problme est que la simulation
oblige adopter des modles de
macromolcules qui obissent la
mcanique classique de Newton
plutt qu la mcanique quan-
tique de Schrdinger, pourtant
plus adapte au monde molcu-
laire , souligne Richard Lavery.
En effet, pour faire simple,
une liaison chimique entre
deux atomes correspond un
change dlectrons, un ph-
nomne essentiellement quan-
tique. Mais cest une quation
trs difcile rsoudre car il y
a des milliers, voire parfois des
millions, dlectrons prendre
en compte. Et si les interactions
atomiques sont importantes,
il ne faut pas oublier que les
atomes bougent, que les struc-
tures atomiques se replient, etc.
Ces mouvements complexes
dans le temps reprsentent la
partie dynamique de la mol-
cule. Les biomacromolcules
ont des structures flexibles, et
leur fonctionnement implique
des mouvements sur plusieurs
chelles de temps, allant de la
femtoseconde * la seconde ,
prcise Richard Lavery. Aussi,
de trs nombreux calculs sont
ncessaires pour parvenir se
COMMENT DTERMINER LEFFICACIT DUNE MOLCULE VISE THRAPEUTIQUE
AVANT DE LANCER UNE TUDE CLINIQUE ? LA SOLUTION POURRAIT TRE APPORTE
PAR LES SUPERCALCULATEURS. POUR PRPARER LES TESTS, LES SIMULATIONS
DEVRAIENT ORIENTER LA RECHERCHE VERS LES BONS MDICAMENTS.
MODLISER LES
MOLCULES DU VIVANT
POUR MIEUX SOIGNER
FEMTOSECONDE
La nanoseconde
(1 ns) vaut 10
-9
s.
La picoseconde
(1 ps) vaut 10
-12
s.
La femtoseconde
(1 fs) vaut 10
-15
s.
SOLVATATION
Phnomne physico-
chimique observ
lors de la dissolution
dun compos
chimique dans un
solvant, qui voit les
atomes, ions ou
molcules, de lespce
chimique se disperser
dans la solution en
interagissant avec les
molcules du solvant.
LES GRANDS CHALLENGES
16
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S

aussi prcise que la DFT, mais
passant le cap dun nombre quel-
conque de processeurs on parle
de scalabilit idale : une m-
thode dite de Monte-Carlo quan-
tique. Un nom qui fait rfrence
au clbre casino mongasque
et qui sexplique par lintroduc-
tion de trajectoires lectroniques
ayant un caractre alatoire, ces
trajectoires tant construites sur
ordinateur en tirant des sries de
nombres au hasard comme la
roulette du casino. Lavantage,
avec la dynamique molculaire
probabiliste des lectrons, cest
quelle est paralllisable : on peut
effectuer les calculs en parallle
sans avoir connatre ce quil
se passe sur chacun des proces-
seurs, prcise Michel Caffarel.
Pourquoi ? Tout simplement
parce que la simulation peut
tre dcoupe loisir en un
ensemble de trajectoires lectro-
niques indpendantes. Une pro-
prit unique pour exploiter un
nombre arbitraire de processeurs,
puisque ceux-ci ne se parlent pas
tout au long de la simulation.
En pratique, chaque pro-
cesseur se voit coner le calcul
dune trajectoire. Reste faire la
moyenne des rsultats obtenus
an de reconstituer le rsultat
qui correspondrait une tra-
jectoire lectronique unique,
obtenue par juxtaposition des
trajectoires individuelles. Au
printemps dernier, cette m-
thode a fait ses preuves sur la
machine Curie. En collabora-
tion avec Anthony Scemama,
un jeune ingnieur de recherche
du CNRS, une simulation a pu
tre effectue sur lensemble
des 10 000 processeurs de la
machine avec une scalabilit
parfaite. La simulation a ainsi
pu tre ralise en un temps
10 000 fois infrieur celui
quaurait demand le mme
calcul sur un seul processeur.
Cela fait plus de vingt ans
que je dveloppe ces mthodes et
je pense quon arrive un tour-
nant : on pourrait supplanter dici
quelques annes les mthodes
actuelles ! , senthousiasme
Michel Caffarel. Et la phase de
validation de commencer. En
octobre, nous ferons une tude
sur linteraction de molcules
la base de la chimie de la mala-
die dAlzheimer lagrgation des
peptides amylodes en utilisant
les 80 000 processeurs de Curie,
et il semble envisageable terme
de contribuer la comprhension
de certains aspects des maladies
neurodgnratives. Un vrai
d ! Et surtout lespoir de >>>
nuent dailleurs de se consacrer
lamlioration du rendement
quantitatif de codes algorith-
miques, cest--dire en augmen-
tant le nombre doprations ra-
lises chaque seconde, ou ops.
En revanche, ces mthodes
de calcul quantique ne passe-
ront pas lchelle vers lexascale.
Dans le jargon informatique, on
parle de non-scalabilit , ce qui
signie quil est impossible avec
ce type de calculs dexploiter au
mieux les potentialits des ordina-
teurs exascale venir, comprenant
des millions voire des milliards de
processeurs. Aujourdhui, la m-
thode phare pour le calcul quan-
tique des molcules du vivant
est une mthode ayant merg
dans les annes 1990 : la DFT
(pour Density Functional Theory)
ou thorie de la fonctionnelle de
la densit, sous-
entendu lectro-
nique. Bien que cette
approche ne permette de
rsoudre que de manire appro-
che lquation de Schrdinger
dcrivant la nature quantique
des lectrons, elle est considre
comme un bon compromis entre
rapidit et prcision chimique.
Malheureusement, cause de sa
mauvaise scalabilit , tirer avan-
tage des plates-formes plus de
quelques milliers de processeurs
semble trs difcile avec elle.
Trajectoires alatoires
Cest pourquoi, la recherche
soriente vers le dveloppement de
nouvelles approches intrinsque-
ment adaptes des machines qui
auraient un nombre arbitraire de
processeurs. Ainsi, Toulouse au
laboratoire de chimie et physique
quantiques, Michel Caffarel dirige
une quipe de recherche qui se
consacre au dveloppement dune
mthode de rsolution alterna-
tive de lquation de Schrdinger,
CEA
z
Ce modle de
lenveloppe
du virus de la
grippe obtenu
par simulation
numrique
permettra
terme dtudier
les interactions
entre les
protines
principales
(orange, crme
et rouge) et les
molcules vise
thrapeutique.
(D. Parton -
Oxford univ.,
et al.)
I
B
P
C
,
P
A
R
I
S
17
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
>>> dvelopper la recherche sur
des pathologies pour lesquelles
les essais cliniques sont trs durs
raliser.
Plus loin, cest la perspective
dune recherche mdicale cible
qui se dessine. Nous allons com-
mencer intgrer les simulations
numriques prcises en amont de
tous les projets exprimentaux, ce
quon ne faisait avant quavec des
modles trs, voire trop, simplis,
pour entrer dans une phase prdic-
tive dune grande efcacit , pr-
voit Michel Masella. Cest la coop-
ration entre thorie et exprimen-
tation qui est en train de se mettre
en place : elle devrait permettre aux
chercheurs de prdire des voies
forte probabilit de succs.
Histoire dinteractions
Mais il faut rester raliste, tem-
pre cependant Michel Ma-
sella. En biologie, les ractions
chimiques se jouent parfois
presque rien. Bien que cette
approche soit trs prometteuse,
il faut donc continuer optimi-
ser les molcules prslection-
nes . Do la ncessit dafner
au maximum les modles. On
corrige petit petit tous les d-
fauts connus. Par exemple, nous
travaillons en ce moment sur les
interactions lectrostatiques
longue porte. Car les modles
actuels nanalysent des interac-
tions qu des distances assez
petites, ce qui dcrit assez mal
la solvatation * des molcules
charges. Or cest un paramtre
important pour comprendre la
raction du mdicament dissout
dans un solvant. Dsormais, le
but est dadapter le modle aux
interactions charges.
En outre, si lon veut com-
prendre au mieux ce qui se pro-
duit dans une cellule vivante, il ne
faut pas oublier quaux interac-
tions thrapeutiques du mdica-
ment avec une protine cellulaire
sajoute le fait que les protines
interagissent galement les unes
avec les autres. Et, pour rendre les
choses encore plus complexes, la
gntique fait que chaque indivi-
du peut prsenter des variations
au niveau de ces protines. Si
parvenir une simulation indivi-
dualise dinteractions thrapeu-
tiques relve donc pour lheure
de la science-ction, Michel Ma-
sella nen rejette pas lhypothse :
Lorsque nous serons capables
de bien identier ces mutations,
nous pourrons alors entrer dans
ce que lon appelle de la personna-
lisation. Mais pour cela, il faudra
bien attendre encore vingt ans !
z

MORGANE KERGOAT JOURNALISTE SCIENTIFIQUE
z
Le mouvement
des lectrons
(ronds blancs
et gris) de ce
peptide amylode
bta impliqu
dans la maladie
dAlzheimer
a t simul
avec la mthode
dite de Monte-
Carlo quantique.
chaque pas
de simulation,
la couleur
des lectrons
est modie.
(A. Scemama - CEA,
M. Caffarel - CNRS)
D
R
UNE EXIGENCE DE PRCISION

Contrairement laronautique ou
la climatologie, qui utilisent les modles
numriques depuis longtemps, la biochimie
ne les intgre que difcilement dans
sa culture. En effet, dans les deux premiers
domaines, il nest pas besoin davoir des
modles trs volus pour commencer
les prdictions par simulation. Tandis quen
biologie il est exig quen phase de test un
rsultat corrobore totalement lexprience
pour que la mthode puisse tre valide.
Si ce nest pas le cas et quil y a un dcalage,
les rsultats ne sont pas corriger ; cest
lensemble du modle thorique qui doit tre
repris. Cela exige un degr de prcision de
calcul extrme et une adaptation constante
des codes. Une culture de lexcellence, qui
a pour revers de creuser lcart avec les autres
domaines scientiques ayant plus largement
recours aux simulations numriques.
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
18

P
.
A
V
A
V
I
A
N
/
C
E
A
D
R
P
.
A
V
A
V
I
A
N
/
C
E
A
oosfez la renfablllfe de
vos slmulaflons grce au
calcul de solver hybrlde
Parc d'AFFalres SlLlC - 99 rue des Solefs - 94SI1 kungls cedex
1el . -11 [0}I 49 /8 28 00 - |ax . -11 [0}I 46 8/ /2 02
lnFoesl-group.com
.
ProFlfez d'une grande Faclllfe
de mlse en ouvre,
.
Obfenez vos resulfafs plus
rapldemenf que jamals,
.
eneFlclez de la pulssance maxlmale
de vofre clusfer HPC.
www.esl-group.com/vps
Nombre de cours uflllses
La fechnologle de calcul hybrlde permef d'uflllser la
parallellsaflon en memolre dlsfrlbuee ef parfagee [DMP
ef SMP} qul amellore conslderablemenf la perFormance
de calcul.
Sans calcul hybrlde
Avec calcul hybrlde
1
e
m
p
s

d
e

c
a
l
c
u
l
Calcul de slmulaflon
de crash Fronfal
20
teindre les ctes polynsiennes
est de trois heures.
Lorsquun sisme est dtect,
les chercheurs analysent sa loca-
lisation et sa magnitude, puis es-
timent sil est susceptible de
conduire la formation dun tsu-
nami. Lestimation de lamplitude
du tsunami attendu tait tradi-
tionnellement ralise selon une
loi empirique obtenue partir des
prcdents vnements observs
en Polynsie. Cest ainsi qua t
labore lalerte au tsunami qui
est survenu au Chili en fvrier 2010.
Une autre mthode, dont le dve-
loppement a dbut en 2009 au
CPPT, a pu tre utilise de faon
oprationnelle lors du tsunami du
Japon en mars 2011. Elle sappuie
sur une base de donnes de 260 sc-
narios de tsunamis prcalculs,
dont les sources ctives sont rpar-
ties le long des principales zones
de subduction * du Pacique. Cette
nouvelle mthode permet de dimi-
nuer lincertitude sur les hauteurs
deau attendues, et ce, trs rapi-
dement aprs le sisme, mais ne
donne cependant pas les carto-
graphies dtailles des hauteurs
attendues la cte.
Une triple modlisation
Plus prcise, la simulation com-
plte des tsunamis jusqu un ni-
veau dtaill sur la cte demandait
jusqu rcemment un temps de
calcul prohibitif pour une utilisa-
tion en temps rel. La paralllisa-
tion du code sur les calculateurs
haute performance ouvre dsor-
mais de nouvelles perspectives.
Les simulations numriques
des tsunamis reposent sur la mo-
dlisation de trois phnomnes :
les dformations du plancher
ocanique causes par le sisme,
la propagation en ocan profond
et les effets ctiers. La dforma-
tion initiale de la surface de locan
est calcule par des modles las-
tiques de dformation de la crote
terrestre.
La propagation au large, quant
elle, repose sur la rsolution
des quations non linaires de
la mcanique des uides dans
lhypothse des ondes longues :
les longueurs donde des tsuna-
mis (100 300 km) sont largement
suprieures la profondeur du
milieu de propagation (4 6 km).
Enn, la simulation des effets du
tsunami lapproche des ctes
nest possible que si des donnes
bathymtriques (profondeurs
marines) et topographiques de
haute rsolution sont disponibles.
Lacuit de la reprsentation des
processus physiques tels que
linondation, les tourbillons ou
N
ous lavons encore vu en
mars dernier au Japon, les
tsunamis sont capables
de dvaster des ctes en-
tires en provoquant des destruc-
tions considrables. Ces vagues par-
ticulires se traduisent par des
inondations successives de la cte
toutes les 20 40 minutes , alter-
nant avec des retraits marqus de
la mer. Les tsunamis sont gnrs
par de trs forts sismes, dune ma-
gnitude gnralement suprieure
7,5 sur lchelle de Richter, qui se
produisent sur les zones de subduc-
tion *. Cest dans le Pacique que
ces phnomnes sont les plus fr-
quents, du fait de lactivit tectonique
intense dans cette partie du Globe.
Durant les annes 1960, la
suite de cinq tsunamis catastro-
phiques sur les ctes du Pacique,
le Centre polynsien de prvention
des tsunamis (CPPT) a t cr au
Laboratoire de gophysique du
CEA bas Tahiti. Sa mission est
dassurer une veille permanente
de lactivit sismique globale de
locan Pacique an de signaler
toute alerte aux autorits du ter-
ritoire polynsien. La rgion la plus
proche o peuvent se produire des
sismes se situe dans la zone des
Tonga Kermadec ; le temps de
parcours minimal dun tsunami
gnr dans cette rgion pour at-
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
LORS DUN SISME SOUS-MARIN PROVOQUANT UN TSUNAMI, LES TEMPS DE CALCUL
DES HAUTEURS DEAU ATTENDUES SUR LES CTES EMPCHENT DE PRENDRE EN COMPTE
EN TEMPS REL LES SIMULATIONS. AVEC LES SUPERCALCULATEURS, LES EFFETS DES
TSUNAMIS SUR LES CTES POURRAIENT TRE PRVISIBLES EN QUINZE MINUTES.
LE SUPERCALCULATEUR
AU SERVICE
DE LALERTE TSUNAMI
PAR ANTHONY
JAMELOT
ET DOMINIQUE
REYMOND
du Laboratoire
de gophysique
de Pamatai
Tahiti
ET SBASTIEN
ALLGEYER,
FRANOIS
SCHINDEL
ET HLNE
HBERT
du dpartement
Analyse,
surveillance,
environnement
de la Direction
des applications
militaires
du CEA.
z
La hauteur dun
tsunami lorsquil
arrive sur une
cte (ci-contre,
photo montage)
nest aujourdhui
mesure quaprs
son passage.
Des calculs
plus rapides
permettront
de lanticiper
et dvacuer
les populations.
S
T
O
C
K
L
I
B

C
H
R
I
S
T
O
P
H
E
F
O
U
Q
U
I
N
vorisent lamplication des tsu-
namis. Depuis le milieu du
XIX
e
sicle, plus de quinze tsuna-
mis ont ainsi t observs dans
les baies de ces les.
De 36 heures 15 minutes
tant donne la magnitude du
sisme du Chili, la loi empirique
utilise lors de cette alerte indi-
quait des hauteurs pouvant at-
teindre 3 m aux Marquises et 2 m
Tahiti. Le niveau dalerte est alors
pass rapidement au rouge, ce qui
impliquait lvacuation des zones
littorales et des ports. Les niveaux
deau ( crte creux ) mesurs
sur les margraphes portuaires
ont nalement atteint plus de 3 m
Hiva Oa et Nuku Hiva, contre
seulement 35 cm environ dans le
port de Papeete. Les hauteurs me-
sures aux Marquises sur les ctes
(hors margraphes) vont jusqu
3 m au-dessus du niveau des plus
basses mers, mais le tsunami est
arriv mare basse. Lalerte a bien
fonctionn, il ny a eu aucune vic-
time ; seuls quelques dgts d-
plorer une embarcation dont le
propritaire avait refus lvacua-
tion. La simulation numrique de
cet vnement a t ralise a pos-
teriori sur deux cents processeurs
du CCRT, pour quinze baies des
les Marquises. Les rsultats ont
t obtenus en moins de 15 mi-
21
encore lamplication par rso-
nance dans un port, dpend de
la rsolution des grilles de calcul.
Avec le modle que nous uti-
lisons, nous accdons une des-
cription de la bathymtrie avec
une rsolution spatiale allant de
5 km pour tout le Pacique et
jusqu 15 mtres, voire 10 mtres,
dans les ports et les baies. Nous
disposons de donnes bathym-
triques et topographiques de
haute dnition pour dix-neuf
baies polynsiennes. La parall-
lisation du code et lutilisation
du Centre de calcul recherche et
technologie (CCRT) du CEA le-
de-France ont t incontournables
pour multiplier les tudes et di-
minuer les incertitudes.
Mais que valent ces techniques,
confrontes lexprience ? Nous
avons pu les valuer la suite du
tsunami du Chili, le 27 fvrier
2010. 6 h 34 mn GMT sest pro-
duit un violent sisme de magni-
tude 8,8 prs des ctes chiliennes.
Comme attendu, vu la force du
sisme, le tsunami a t trs des-
tructeur au Chili et sest ensuite
propag travers tout le Paci-
que. En Polynsie franaise, ce
sont les les Marquises qui ont
t les plus touches. En effet,
les pentes sous-marines peu raides
et les larges baies ouvertes sur
locan sans rcif protecteur fa-
z
Figure 1. Hauteurs
maximales aprs
quinze heures
de propagation
du tsunami.
Comparaison des
enregistrements de
deux tsunamimtres
DART (Deep-
ocean Assessment
and Reporting of
Tsunamis) et simuls.
SUBDUCTION
Phnomne au cours
duquel une plaque
lithosphrique plonge
sous une autre plaque
et senfonce dans
le manteau terrestre.
nutes de calcul, alors quil aurait
fallu environ 36 heures avec un
seul processeur. Ils ont permis
dtablir la distribution des hau-
teurs deau maximales au large
aprs quinze heures de propaga-
tion soit environ 10 000 km par-
courus. On a ainsi pu voir que la
Polynsie tait dans laxe dner-
gie principale (Figure 1).
Estimer les hauteurs deau
Dautre part, la simulation num-
rique du tsunami dans des grilles
de plus en plus nes au voisinage
des ctes (10 15 m de rsolution)
a permis destimer la distribution
des hauteurs deau maximales,
ainsi que les champs de vitesses
horizontales dcrivant les cou-
rants un instant donn pour les
quinze baies. Conclusion : les
margrammes synthtiques sont
bien comparables aux observa-
tions relles des margraphes
portuaires ; de mme, la compa-
raison est cohrente avec les hau-
teurs deau rapportes dans des
tmoignages ou sur des photo-
graphies, comme celles de la baie
de Tahauku sur lle dHiva Oa. Un
tourbillon photographi dans la
baie de Hakahau (le de Ua Pou),
aprs environ 11 heures 45 minutes
de propagation, est reproduit au
mme instant.
Ce type de simulation com-
plte du tsunami, de sa source
jusquaux ctes, montre quel
point la prcision des rsultats
constitue un outil primordial dans
le cadre de lalerte, et compl-
mentaire aux mthodes existantes.
En effet, connatre lavance le
niveau dinondation sur les ctes
avec une incertitude minime r-
volutionnerait la gestion de ladite
alerte. Ce nest pas encore pos-
sible aujourdhui, mais on peut
envisager dans un avenir proche
dobtenir, en moins dune heure,
les rsultats de ces simulations
prdictives pour toute la Polyn-
sie franaise. En supposant bien
sr que des moyens de calcul
adquats soient ddis au sys-
tme dalerte.
z
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
C
E
A
22
tion des particules, comme les
neutrons, avec le combustible et
les matriaux du racteur. Et les
donnes nuclaires de base sont
issues de mesures exprimentales
prcises.
Finesse de modlisation
Tout cela semble parfait : des don-
nes prcises et des quations qui
permettent de modliser au plus
prs les phnomnes physiques.
Nanmoins, ces quations imposent
de rsoudre des systmes qui com-
portent plus de 1 000 milliards
dinconnues ! Mission impossible,
quelle que soit la puissance de
calcul. Aussi, an de rsoudre ces
quations, on fait appel deux
approches complmentaires. Dune
part, lapproche dterministe : elle
repose sur des hypothses phy-
siques et des modles numriques
an de rsoudre le problme. Ce
sont les codes APOLLO2 et
APOLLO3, dvelopps la Direc-
tion de lnergie nuclaire du CEA
(CEA/DEN). Dautre part, lapproche
Monte-Carlo : elle fait appel la
reprsentation native des donnes
Q
ue ce soit pour la sret,
lextension de la dure
de fonctionnement
des racteurs ou lop-
timisation de la gestion des dchets,
la simulation joue un rle capital
et croissant dans lindustrie nu-
claire. Les quipes dingnierie
comme de R & D lutilisent de plus
en plus : pour calculer le compor-
tement normal des systmes, bien
sr, mais aussi pour imaginer des
domaines de fonctionnement au-
del de ce que lexprience peut
mesurer. Un point majeur pour
la sret nuclaire. Comme dans
tout secteur, cette approche repose
sur un triptyque de modlisation
des phnomnes physiques, de
simulation numrique et de vali-
dation exprimentale.
Dans le domaine de la phy-
sique des racteurs et du cycle du
combustible, plusieurs phno-
mnes physiques font lobjet de
calculs. La cintique et la rpar-
tition des neutrons dans le cur
dterminent le contrle de la rac-
tion en chane et la matrise du
combustible nuclaire. La propa-
gation des rayonnements ionisants
est calcule la fois pour la pro-
tection des personnes et pour
connatre les effets sur les mat-
riels. Enn, lvolution du com-
bustible nuclaire est en lien direct
avec loptimisation de lutilisation
des ressources en matires ssiles
et la gestion des dchets.
La modlisation thorique de
ces phnomnes repose sur les
deux quations de bilan neutro-
niques : l quation de Boltzmann
permet de modliser la vie des
neutrons, tandis que l quation
de Batemann traduit lvolution
des isotopes au cours du temps.
Ce sont deux quations exactes ,
cest--dire sans approximation .
Elles utilisent des grandeurs phy-
siques qui caractrisent linterac-
AUJOURDHUI, LINDUSTRIE NUCLAIRE NE POURRAIT PLUS SENVISAGER SANS
LA SIMULATION. ELLE PERMET DOPTIMISER TOUT LE CYCLE DU COMBUSTIBLE,
JUSQU LA GESTION DES DCHETS. UNE MODLISATION TRIDIMENSIONNELLE
AU SERVICE DES INGNIEURS ET DE LA SRET DES RACTEURS.
LES FUTURS RACTEURS
NUCLAIRES PROFITENT
DJ DU CALCUL HPC
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
chef de
laboratoire au
sein du Service
dtudes des
racteurs et de
mathmatiques
appliques
la Direction
de lnergie
nuclaire du CEA,
expert en
calcul haute
performance
appliqu
la physique
des racteurs.
PAR
CHRISTOPHE
CALVIN
C
E
A
z
Le cur dun
racteur
nuclaire est
charg avec
du combustible.
Sa composition
et son
positionnement
sont des
paramtres cls
pour la puissance
et la sret
dune centrale.
23
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
tudes. Ils peuvent connatre beau-
coup plus rapidement limpact
prcis dun maillage de calcul plus
ou moins n sur le rsultat nal.
Ils dterminent ainsi des solutions
qualies de type rfrence pour
rpondre aux besoins dvaluation
des incertitudes. Et pour cela, on
dploie les grands moyens : des
puissances de calcul de plusieurs
centaines de traops *, utilisant
de manire simultane plus de
30 000 processeurs. larrive : un
calcul du cur du racteur en trois
dimensions extrmement raliste,
grce la rsolution exacte de
lquation du transport des neu-
trons obtenu en seulement quelques
heures. Avec un unique processeur,
il aurait fallu au bas mot une anne
entire
Chargement du cur
Le calcul haute performance per-
met enn de mettre en uvre des
mthodes novatrices doptimi-
sation des paramtres de fonc-
tionnement et de matriser de
manire systmatique les incer-
titudes. Un exemple caractris-
tique de ce type dapproche est
lutilisation combine de la puis-
sance de calcul, des mthodes
dintelligence articielle et de
codes de simulation de nouvelle
gnration pour optimiser des
plans de chargement de cur de
racteur. De quoi sagit-il ? Un
cur de racteur nuclaire est
constitu dassemblages com-
bustibles. Ces assemblages restent
un certain temps dans le cur
du racteur. Leur positionnement
en fonction de leur type (nature
du combustible et temps de pr-
sence dans le cur) constitue le
plan de chargement du cur.
Selon ce plan de chargement, des
paramtres majeurs de fonction-
nement en termes de sret et
de rentabilit comme la puis-
sance maximale du racteur
peuvent tre optimiss.
Jusqualors, ces optimisations
taient ralises grce lexper-
tise humaine et au retour dexp-
rience sur les racteurs existants.
Mais pour les nouveaux concepts
de racteur, il est de plus en plus
difcile et surtout trs long dop-
timiser la main le chargement
de combustible, vu le nombre de
congurations possibles.
La conception dun outil dop-
timisation, adapt la dtermi-
nation des plans de chargement
des combustibles nuclaires et
indpendant de la conguration
tudie cur, combustible ,
permet de faciliter le travail des
ingnieurs et surtout de diminuer
les temps dtude. Cet outil, bas
sur un logiciel doptimisation
multicritres par algorithme g-
ntique (VIZIR) et sur le code de
calcul neutronique APOLLO3,
permet au concepteur damlio-
rer les performances et la suret
des racteurs. Cest ainsi quavec
laide de 4 000 processeurs on peut
dsormais trouver des solutions
de plan de chargement de curs
de racteurs complexes en moins
de 24 heures.
z
pour jouer la vie de milliards de
neutrons utiles (code TRIPOLI-
4
TM
, galement dvelopp au CEA/
DEN). Ces mthodes de simula-
tion numrique sont troitement
couples des expriences et des
mesures.
Dans le domaine de la phy-
sique des racteurs, le calcul haute
performance (HPC) conduit
modier la faon dutiliser la simu-
lation numrique. Les volutions
des codes calculs (algorithmes,
mthodes numriques, etc.) et
lutilisation efcace de puissances
de calcul croissantes font tout
dabord continuellement progres-
ser la prcision et la nesse des
modlisations. Les informations
ainsi obtenues par la simulation
numrique sont aussi plus com-
pltes grce la gnralisation des
calculs tridimensionnels appa-
rus au dbut des annes 1990 et
la prise en compte des phnomnes
multi physiques (neutronique,
thermo hydraulique, modlisation
du combustible, etc.).
Autre avance : la possibilit
de simuler de manire simultane
un nombre toujours plus grand
de composants des centrales. Par
exemple, le HPC ouvre la voie
la modlisation, au sein dune
mme simulation et en trois di-
mensions, du cur du racteur
et de la chaudire en prenant en
compte de manire couple les
phnomnes neutroniques et
thermo-hydrauliques rseaux
de circulation primaire de leau,
gnrateurs de vapeur, etc. Les
ingnieurs obtiennent ainsi des
rsultats beaucoup plus prcis
sans consacrer plus de temps quils
ne le faisaient avec des modles
simplis utiliss couramment.
Prenons lexemple du code de
simulation neutronique APOLLO3,
qui a t utilis la n 2010 sur la
nouvelle machine de calcul peta-
opique (Tera 100 ) du CEA/DAM
(Direction des applications mili-
taire du CEA), pour raliser des
simulations tridimensionnelles
dun racteur de quatrime gn-
ration, successeur de lEPR. La
dtermination des incertitudes et
des biais des schmas de calcul
des racteurs nuclaires est un des
points cls pour la conception des
prochains racteurs.
En associant le calcul haute
performance un code moderne,
les ingnieurs parviennent une
valuation efcace de ces incerti-
z
Sur cette
reprsentation
dun cur
de racteur
nuclaire
de quatrime
gnration,
calcule
laide du code
APOLLO
3
,
chaque losange
reprsente
un assemblage
de combustible.
Le niveau
de puissance
neutronique
de chaque
assemblage est
reprsent par
une couleur, du
bleu (puissance
nulle) au rouge
(puissance
maximale). Les
losanges bleus
au centre sont
les barres de
contrle.
0
1
0
FLOPS
est lunit de mesure
de la puissance des
doprations par
seconde. Un traops
par seconde (10
12
),
par seconde (10
15
)
et un exaops
permet datteindre
doprations par
seconde (10
18
).
C
E
A
24
barrire dnergie le plus exhaus-
tif possible comme MH (Minima
Hopping, invent par le groupe
de Stefan Goedecker Ble) ou
bien ART ( Activation Relaxation
Technics , dvelopp par Nor-
mand Mousseau, de luniversit
de Montral).
Actuellement, de nombreux
algorithmes sont mis au point et
tests pour chercher le plus rapi-
dement possible les congura-
tions atomiques les plus stables
et les barrires dnergie. Ces al-
gorithmes sont ncessaires pour
comprendre, entre autres, le re-
pliement des protines.
La seconde tape consiste
mettre en comptition les diff-
rents mcanismes de diffusion des
atomes. Pour cela, on fait appel
la physique statistique, et plus par-
ticulirement un algorithme de
Monte Carlo cintique, qui consiste
tirer alatoirement une nou-
velle position atomique en fonction
de la barrire dnergie franchir.
On peut ainsi raliser des exp-
riences numriques de croissance
des matriaux en considrant les
atomes un par un.
Mais cest le calcul des minima
et des barrires dnergies en uti-
lisant des mthodes ab initio, qui
est le facteur limitant de cette ap-
proche, cause de limmense puis-
sance de calcul ncessaire. En ef-
fet, il faut ici rsoudre lquation
de Schrdinger ! On fait appel au
formalisme de Kohn-Sham , qui
repose sur le thorme de la fonc-
tionnelle de la densit qui a valu
son auteur le prix Nobel de chimie
en 1998. De quoi sagit-il ? Lide
sous-jacente est que la densit
lectronique suft dterminer
ltat fondamental des lectrons
pour une position atomique d-
nie. En considrant que les lec-
trons sont toujours lquilibre
lorsque les atomes bougent, il est
alors possible de calculer des forces
atomiques et de trouver les minima
cest--dire les congurations
atomiques stables et les barrires
dnergie (Figure 1).
Notre groupe sest intress
la simulation de la croissance du
graphne sur carbure de silicium
(SiC) (Figure 2). Nous avons consi-
dr des surfaces priodiques dans
deux directions constitues de
lordre de 700 atomes, soit 2 608 lec-
trons. Dans lune de ces directions,
le cristal de carbure de silicum
(SiC) est constitu dune alternance
de plan pur carbone et silicium.
La surface peut donc se terminer
par un plan carbone ou un plan
silicium. Les mthodes ab initio
sont ici incontournables pour
dcrire notamment les liaisons
des atomes de carbone, diffrentes
dans le carbure de silicium et dans
le graphne. Pour donner un ordre
dide, le calcul dune congura-
tion atomique requiert environ
cinq heures de calcul en utilisant
600 processeurs mis en parallle
dans un supercalculateur !
Les ondelettes en renfort
Le code BigDFT utilise de manire
originale de nouvelles fonctions
mathmatiques, les ondelettes,
jusque-l principalement utilises
pour la compression dimage. Il a
t optimis en partenariat avec
le laboratoire dinformatique de
Grenoble pour utiliser plusieurs
curs de calcul par lectron simul.
En pratique, il est donc possible
pour notre systme de 2 608 lec-
trons dutiliser plus de 2 608 curs
de calcul. Le code BigDFT est aussi
capable dutiliser des processeurs
graphiques, avec un temps de calcul
encore divis dun facteur 10.
Le supercalculateur Tera 100
permet de raliser des calculs 2 000
fois plus rapides quun ordinateur
classique. Nous arrivons ainsi
A
u niveau atomique, la
croissance dun matriau
est un mouvement des
atomes arrivant la sur-
face et sincorporant aux atomes
dj prsents. Et ce, en minimi-
sant lnergie du systme, raison
pour laquelle les atomes sorga-
nisent en rseaux trs rguliers,
comme les cristaux. Pour tudier
ce phnomne, il faut dabord
identier les diffrents mcanismes
atomiques de diffusion, puis les
mettre en comptition entre eux
en fonction de la temprature.
Cela requiert de pouvoir simuler
la matire lchelle atomique.
On peut modliser la crois-
sance partir de modles ph-
nomnologiques : un modle avec
peu de paramtres et reposant
sur certaines hypothses permet
de dcrire lessentiel du phno-
mne physique. Mais il est difcile
de savoir si un tel modle rendra
bien compte des phnomnes et
sil aura des capacits prdictives
sans faire des expriences relles
ou numriques.
Aussi, le mieux est de faire
appel des mthodes dites de
premiers principes , ou ab ini-
tio, qui sappuient sur lquation
de Schrdinger de la mcanique
quantique, capable de prdire de
faon ne les congurations ato-
miques les plus stables. Elles per-
mettent de voir les vnements
rares qui gouvernent la croissance,
comme le mouvement ou la dif-
fusion dun atome dun site stable
un autre.
Barrires dnergie
En pratique, il faut coupler une
mthode de calcul de la structure
lectronique, comme le code
BigDFT (dvelopp depuis 2005
par le laboratoire L_Sim du CEA,
Grenoble), avec un algorithme
de recherche de minima et de
COMMENT LES ATOMES SE LIENT-ILS ENTRE EUX POUR FORMER DES MATRIAUX ? SIMULER
LA CROISSANCE AU NIVEAU ATOMIQUE RESTE UN GRAND DFI. LOBJECTIF EST DE MIEUX LA
MATRISER EN FONCTION DU FLUX DATOMES, DE LA TEMPRATURE, DU CHAMP LECTRIQUE
UNE COMPRHENSION PRIMORDIALE DANS LE DOMAINE DE LA NANOLECTRONIQUE.
VOIR LES MATRIAUX
GRANDIR ATOME PAR ATOME
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
chercheur
lINAC (Institut
nanosciences
et cryognie)
au CEA de
Grenoble,
o il dirige
le Laboratoire
de simulation
atomistique
PAR THIERRY
DEUTSCH
chercheur
lINAC.
ET PASCAL
POCHET
25
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
z

Lapparition des lamelles
Une dformation, applique
ici en quelques xxx secondes
sur un alliage de fer et de
nickel, induit une transforma-
tion martensitique complexe.
Les diffrentes phases sempi-
lant en grandes lamelles, se
structurant elles-mmes en
bandes.
FIGURE 1
FIGURE 2
dterminer deux nouveaux minima
par jour avec lalgorithme ART.
Pour y parvenir, cet algorithme a
t largement optimis. Avec, la
cl, une diminution dun facteur 4
du nombre dvaluations dner-
gies ncessaires pour dterminer
un minimum et arriver un ordre
de 400 valuations seulement un
travail prliminaire qui vient dtre
publi dans le Journal of Chemical
Physics.
Malgr tout, nous supposons
quil nous faudra plusieurs mois
pour obtenir des informations
physiques exploitables dans la par-
tie Monte Carlo cintique.
Actuellement, nous tudions
la croissance du graphne sur SiC
en partant dune surface termine
silicium (Figure 3). Ensuite, nous
nous pencherons sur la croissance
dune feuille complte de graphne
partir des atomes de carbone
prsents dans la dernire couche
du carbure de silicium. Avec les-
poir, terme, de pouvoir confron-
ter nos rsultats aux donnes ex-
primentales. Sils sont en bonne
adquation, nous aurons alors
mis la main sur un mcanisme
de synthse du graphne sur car-
bure de silicium.
z
z
Figure 1
Courbe dnergie
reprsentant le chemin
entre deux minima
pour une cage de SiC
(120 atomes). Il existe une
barrire dnergie (bosse)
entre la structure de
gauche (minimum local)
et la structure de droite
(minimum global).
z
Figure 2
Surface nue de SiC
termine silicium
(en vert) au-dessus
du plan jaune.
La surface du bas est
termine carbone
(en noir). La bote
dlimite par les traits
bleus correspond
la bote de calcul
contenant 700 atomes.
z

Figure 3
Vue du dessus de la
surface de SiC avec une
nanofeuille compose
de 16 atomes de carbone
de couleur bleue
Les liaisons en rouge
dans la nanofeuille
de graphne sont de
nature diffrente des
liaisons en violet dans
le matriau SiC.
Source : E. Machado-Charry
et al., J. Chem. Phys., 135,
034102, 2011.
FIGURE 3
C
E
A
26
dautres modlisations, telle la
mtorologie, du fait de la bri-
vet des phnomnes en jeu et
du couplage intime des mca-
nismes physiques.
Impossible de rsoudre ce sys-
tme de faon exacte. Il faut re-
courir des mthodes danalyse
numrique pour le transformer
en un systme dquations ap-
proches , soluble par un super-
calculateur. Les calculs sont ra-
liss sur de petites zones, appeles
des mailles. Plus les mailles sont
nombreuses, plus on sapproche
de la solution exacte du problme
rel. Concrtement, des dizaines
voire des centaines de millions de
mailles sont utilises. Cela repr-
sente des milliards dinconnues.
Valider par partie
Pour sassurer que lordinateur
fournit une reprsentation aussi
raliste que possible, la validation
des rsultats se fait en deux phases.
On valide dabord des parties de
modle : un seul phnomne phy-
sique, tel le comportement mca-
nique dun matriau, ou quelques
phnomnes coupls. Pour cela,
on compare les rsultats des simu-
lations des exprimentations
menes sur deux outils : la machine
radiographique Airix et le Laser
mgajoule (LMJ).
Installe Moronvilliers, en
Champagne-Ardenne, depuis
2000, le Airix permet de radiogra-
phier une maquette darme nu-
claire ne comportant pas de
matire ssile pour valider la phase
initiale, pyrotechnique. On y si-
mule la compression des matires
au moyen de matriaux non ra-
dioactifs aux comportements
mcanique et thermique com-
parables. Les images radiogra-
phiques de cette phase de com-
pression sont confrontes aux
simulations numriques. Quant
au LMJ, en construction au Barp,
prs de Bordeaux, il devrait per-
mettre la n 2014 de reproduire
et dtudier la phase de fusion
nuclaire. Ce sera le pendant de
la souferie pour un concepteur
davion. Le LMJ pourra concen-
trer jusqu lquivalent de 240 puis-
sants faisceaux laser sur une bille
remplie de deutrium et de tri-
tium, deux isotopes * de lhydro-
gne, provoquant leur fusion pen-
dant quelques milliardimes de
seconde.
Un prototype, la Ligne dint-
gration laser (LIL), comprenant
quatre faisceaux, a t mis en ser-
vice en mars 2002 et a permis de
valider les choix technologiques
du LMJ. Celui-ci, comme cest
dj le cas pour la LIL, sera ouvert
la communaut scientique
internationale astrophysique,
mdecine, nergie, etc.
Arrive enn la dernire tape :
la validation globale. Elle consiste
comparer les rsultats obtenus
grce nos logiciels avec lensemble
des mesures recueillies lors des
essais nuclaires du pass, notam-
P
our parvenir simuler
le fonctionnement com-
plet dune arme atomique
sans avoir recours de
nouveaux essais nuclaires, il faut
concevoir un modle mathma-
tique, rsoudre un systme dqua-
tions sur des supercalculateurs
et, enn, valider les rsultats ob-
tenus grce des expriences
menes en laboratoire et grce
aux mesures enregistres lors des
essais nuclaires du pass.
La premire tape, celle de la
modlisation, impose avant tout
de bien connatre les diffrents
phnomnes physiques impliqus
et la faon dont ils senchanent
(lire Le b a-ba de la bombe H ).
Les quations susceptibles de les
reproduire par le calcul sont
connues : ce sont les quations
de Navier-Stokes pour la mca-
nique des uides, celles de Boltz-
mann pour le transport des neu-
trons et les quations de diffusion
et de transport pour lvolution
de la matire et des photons. En
couplant ces modles physiques,
on obtient un systme dquations
mathmatiques reproduisant -
dlement le fonctionnement dune
arme nuclaire.
Des milliards dinconnues
tape suivante, celle de la simu-
lation pour rsoudre ce systme
dquations dans des conditions
aussi proches que possible de la
ralit du fonctionnement dune
arme nuclaire. Pour cela, il sagit
de dcrire une grande varit de
particules (des neutrons aux pho-
tons, en passant par les ions et les
lectrons) sur trois chelles de
temps infrieures au millionime
de seconde. Et dans des tats ex-
trmes de pression : jusqu mille
milliards de fois la pression atmos-
phrique ! Un calcul incroyable-
ment plus complexe que beaucoup
COMMENT CONCEVOIR UNE ARME ATOMIQUE SANS AVOIR RALISER DE NOUVEAUX
ESSAIS NUCLAIRES ? LA SOLUTION SE TROUVE CONJOINTEMENT DANS LA
MODLISATION ET LA SIMULATION. DANS CES DOMAINES, LES SUPERCALCULATEURS
ONT DJ FAIT LEURS PREUVES. DANS CET EXERCICE, LA FRANCE NEST PAS EN RESTE.
LE BON CALCUL DE LA
DISSUASION NUCLAIRE
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
directeur du
programme
Simulation
la Direction
des applications
militaires
du CEA.
ISOTOPES
Les isotopes sont
des atomes qui
ne se diffrencient
que par leur nombre
de neutrons.
FLOPS
est lunit de mesure
de la puissance des
doprations par
seconde. Un traops
par seconde (10
12
).
LE B A-BA DE LA BOMBE H

Premire tape du fonctionnement
dune arme thermonuclaire : la dtonation
dune charge explosive (pyrotechnie).
En quelques millionimes de seconde,
plusieurs milliers de degrs sont atteints,
ce qui permet damorcer la ssion en
comprimant la matire ssile (plutonium
ou uranium) transforme en plasma
(gaz ionis). Cette mini-explosion nuclaire
dure environ 100 milliardimes de seconde
et permet datteindre les dix millions
de degrs requis pour amorcer la troisime
tape, la fusion du deutrium et du
tritium, deux isotopes de lhydrogne.
La temprature atteinte est alors de lordre
du milliard de degrs pendant quelques
milliardimes de seconde.
PAR
CHARLES LION
27
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
Tera 10 (50 traops) a permis de
dnir un standard de calcul valid
sur un ensemble dexpriences
bien plus large, avec les premires
simulations tridimensionnelles.
Nous avons pu garantir le fonc-
tionnement dune tte nuclaire
aroporte par la seule simulation
sans nouvel essai nuclaire : une
premire mondiale notre connais-
sance. Les missiles ports par le
Mirage et le Rafale ont commenc
en tre quips ds 2009.
Avec une puissance de 1 000 t-
raops, le Tera 100 permet un
nouveau saut signicatif dans les
capacits de modlisation. Ins-
tall en juillet 2010, le supercal-
culateur est aujourdhui pleine-
ment oprationnel. Des simulations
tridimensionnelles sont accessibles
en grand nombre, ce qui permet-
tra de garantir les prochaines ttes
nuclaires des sous-marins qui
devraient entrer en service en 2015.
La simulation permettra dadap-
ter le standard de calcul leurs
environnements thermique et
mcanique spciques. Lautre
volet fondamental de ces recherches
consiste former et homologuer
les futurs concepteurs darmes
nuclaires. Ils doivent matriser
parfaitement la simulation num-
rique et en connatre les limites.
La conjugaison des moyens
uniques, tels que les supercalcu-
lateurs Tera de classe mondiale
et le LMJ, permet aussi dattirer
de jeunes ingnieurs, physiciens
et mathmaticiens brillants et de
conserver les comptences nces-
saires nos missions de dissua-
sion.
z
ment ceux effectus en 1996, lors
de la dernire campagne. Cette
tape permet de produire un stan-
dard de calcul, autrement dit de
vritables prescriptions demploi
des simulations numriques, le
domaine de conance de la simu-
lation un temps t .
Une premire mondiale
En 2001, grce au supercalculateur
Tera 1 dune puissance de calcul
de 5 traops * install au CEA de
Bruyres-le-Chatel (Essonne), nous
avons produit notre premier stan-
dard de calcul, premier pas pour
garantir les armes nuclaires par
la seule simulation. En 2005, le
z

Le Laser
Mgajoule (LMJ),
en construction
au Barp, prs de
Bordeaux, est
un des outils
majeurs pour
la simulation des
armes nuclaires.
La fusion y sera
reproduite en
vraie grandeur
dans cette
chambre
dexprience
de 10 mtres
de diamtre.
C
E
A
28
o dintenses ambes de for-
mation stellaire peuvent se pro-
duire.
Un mois de simulation
Voil pour la thorie. Comment
maintenant dcrire ces phno-
mnes avec prcision ? Faute de
pouvoir les mesurer, sachant quils
se produisent des distances as-
tronomiques de nous et sur des
chelles de temps dpassant lar-
gement la vie humaine En simu-
lant lvolution de galaxies en in-
teraction ! Facile noncer, ce
problme est un vritable d
scientique. Pour simuler le com-
portement des galaxies, il faut
prendre en compte la dynamique
de leurs disques lchelle de di-
zaines de kiloparsecs (kpc) *, soit
des distances de lordre de 10
21
m
(mille milliards de milliards de
mtres). Quant la formation des
toiles et des nuages interstellaires,
lchelle prendre en compte est
de lordre du parsec, soit environ
10
16
m. Et les calculs doivent en
outre coupler les deux chelles.
Les supercalculateurs nous ont
A
u dbut de lUnivers com-
mencent se former de
petites galaxies naines,
qui vont fusionner entre
elles pour former des galaxies de
plus en plus massives. Les fusions
de galaxies participent aussi la
redistribution du moment angu-
laire * entre la composante visible
des galaxies en rotation rapide
(gaz et toiles) et la composante
de matire noire, laquelle stend
comme un halo autour de la ma-
tire visible. Elles favorisent la
chute de gaz au centre des galaxies,
QUE SE PASSE-T-IL LORSQUE DEUX GALAXIES VIENNENT SE PERCUTER ?
VOIL UNE QUESTION QUI NE RELVE PAS QUE DE LA SIMPLE CURIOSIT DES
ASTRONOMES : CAR LES PROCESSUS DINTERACTIONS ET DE FUSIONS DE GALAXIES
SONT DES PHASES CLS DANS LA NAISSANCE ET LA FORMATION DES ASTRES.
COMPRENDRE COMMENT
LES TOILES SE FORMENT
D
R
PAR PAOLA
DI MATTEO,
FRANOISE
COMBES
ET BENOT
SEMELIN
astrophysiciens
lObservatoire
de Paris.
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
on suit lvolution sous leffet des
diffrents processus physiques
pris en compte. Une particule cor-
respond soit un amas dtoiles,
soit un nuage de gaz interstel-
laire. Les processus physiques sont
essentiellement les forces de gra-
vit qui sexercent entre toutes les
particules, mais aussi les forces
de pression du gaz, la viscosit,
les ondes de choc, la formation
des toiles partir du gaz et ljec-
tion de gaz par les toiles en n
de vie.
Pour obtenir une rsolution
spatiale de 50 parsecs, la masse
des particules doit tre de lordre
de 5 000 fois celle du Soleil, et il
faut 30 millions de particules pour
modliser la fusion de deux ga-
laxies du type de la Voie lacte.
Pour valuer les forces gravita-
tionnelles entre N particules, les
algorithmes les plus simples de-
mandent N
2
calculs dinteractions.
Au prix dune approximation,
lalgorithme auquel nous avons
fait appel, dit en arbre et dve-
lopp dans les annes 1980, per-
met de raliser le calcul en un ordre
dopration proportionnel N ln(N)
oprations : sans ce gain substan-
tiel, ces simulations seraient im-
possibles.
Forces hydrodynamiques
Mais les forces gravitationnelles
ne sont pas tout. Il faut aussi
prendre en compte les forces hy-
drodynamiques (pression et vis-
cosit) caractrisant la dynamique
des galaxies. Nous les calculons
par la mthode dite SPH (Smooth
Particle Hydrodynamics), dve-
loppe partir de la n des annes
1970, qui consiste reprsenter
le uide en une multitude de pe-
tits lments se recouvrant.
Pour tre capable de suivre
non seulement la rotation des
galaxies, mais aussi la formation
lors des fusions de petites struc-
tures denses, de type nuages mo-
lculaires dont le temps dvolu-
tion dynamique est beaucoup plus
court, nous valuons les forces
tous les 250 000 ans, cest--dire
8 000 fois sur les 2 milliards dan-
nes quenglobe une simulation.
On peut estimer que cela corres-
pond au total environ 10 000 mil-
liards de calculs dinteractions
entre particules pour une seule
simulation.
Si nous navions quun seul
processeur disposition, il fau-
drait plusieurs annes de calcul.
Seule solution : faire appel plu-
sieurs units de calcul pour chaque
simulation. Dans le cadre du Grand
Challenge sur le supercalcula-
teur Curie, et grce la parallli-
sation du code (OpenMP), chaque
simulation a t lance sur 32 curs
et a utilis plus de 50 Go de RAM
sur chaque nud de calcul. La
force de ces simulations toujours
en cours et dont lexploitation
commence peine est de nous
apporter des rsultats avec une
rsolution spatiale indite. Dans
un premier temps, celle-ci nous
permettra de savoir o et avec
quelle efcacit le gaz est trans-
form en toiles.
Notre vision de la dynamique
des galaxies en sera radicalement
change. En effet, lnergie nu-
claire dans les toiles est non
seulement rayonne , mais aussi
transforme en nergie cintique,
au travers des ots de gaz rejets.
basse rsolution, la formation
dtoiles ne peut tre traite que
de faon semi-analytique, en se
servant dune probabilit propor-
tionnelle la densit de gaz pr-
sente. Or cela nest pas satisfaisant
car les instabilits des disques des
galaxies sont plus subtiles.
La physique globale fragilise ?
Lespoir est donc de traiter le gaz
interstellaire de faon plus ne,
en considrant sa dissipation par
rayonnement, les collisions entre
nuages, les ondes de choc formes,
la turbulence macroscopique g-
nre et sa viscosit. En prenant
en compte ces diffrents para-
mtres physiques avec prcision,
il nest pas dit que la physique
globale nen soit pas complte-
ment transforme. Dabord parce
que lnergie rinjecte dans le
milieu interstellaire par les toiles,
les vents stellaires et explosions
de supernovae, peut passer ina-
perue, si lchelle considre est
infrieure la rsolution. En re-
vanche, si les simulations ne
lignorent pas, alors cette nergie
transfre dans le milieu inters-
tellaire change compltement sa
dynamique et peut empcher la
formation dtoiles.
Mais surtout, le milieu inters-
tellaire comporte plusieurs phases,
dont les densits sont trs diff-
rentes, de plus de 10 ordres de
grandeur entre les nuages les plus
denses et le milieu diffus. basse
rsolution, les diverses phases
peuvent tre simules par des
composants diffrents, avec des
changes de masse entre phases,
calibrs de faon semi-analytique.
haute rsolution, on peut esp-
rer recrer directement plusieurs
phases, par lintermdiaire des
instabilits naturelles du milieu,
et ainsi traiter les nuages mol-
culaires part entire, sans les
introduire de faon articielle.
z
29
permis damorcer une tude sta-
tistique des fusions de galaxies,
en ralisant une cinquantaine de
simulations, une rsolution spa-
tiale de lordre de 50 parsecs.
Concrtement, nous avons men
des calculs pendant plus dun mois
sur environ 1 550 curs du super-
calculateur Curie, install au Trs
grand centre de calcul (TGCC) du
CEA, Bruyres-le-Chtel.
Modlisation des fusions
Nous modlisons ainsi la fusion
de galaxies de mme taille on
parle de fusions majeures ainsi
que laccrtion de satellites sur
une galaxie du type Voie lacte
ou fusions mineures . Les r-
sultats de cette volution violente
peuvent ensuite tre compars
lvolution des processus internes
plus lents, dits dvolution scu-
laire. Lobjectif nal est de com-
prendre notamment la redistri-
bution du moment angulaire entre
la matire visible et la matire
noire, lintensit des sursauts de
formation stellaire qui se produi-
sent, ou encore les proprits
morphologiques des rsidus de
fusions.
Dans notre mthode de simu-
lation, le systme est modlis par
un ensemble de particules dont
z
Distribution
du gaz aprs
la premire
rencontre de
deux galaxies
de mme taille
(fusion majeure).
Lors du passage
proche de
deux galaxies,
une partie de
la matire peut
tre expulse
de larges
distances du
disque, avec
la formation
de structures
dites queues
de mare ,
qui peuvent
stendre sur
des centaines
de kiloparsecs.
MOMENT ANGULAIRE
Vecteur parallle
laxe de rotation dont
lamplitude reprsente
la quantit de rotation
dun systme.
PARSEC
Parallaxe-seconde,
unit de longueur
astronomique,
quivalent de
3,26 annes-lumire,
ou 206 265 units
astronomiques
(distance Terre-Soleil)
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
30
culateurs massivement parallles :
cest le cas du code Stamp, dve-
lopp la Direction des applica-
tions militaires du CEA (CEA-DAM)
depuis une dizaine dannes. Forts
de ce code, nous avons pu simuler
quelques cas trs concrets.
Premier exemple, la transition
dun rgime lastique vers un
rgime plastique : au-del dun
certain seuil de pression, la pro-
pagation dun choc entrane la
cration irrversible de dfauts
structuraux. Parce quelle affecte
considrablement les proprits
mcaniques du matriau, la plas-
ticit ncessite de procder une
modlisation trs ne en sap-
puyant sur une description des
mcanismes lmentaires sous-
jacents.
Plasticit et rupture
Nous nous sommes intresss en
particulier la plasticit du dia-
mant : un vritable d car elle
impose non seulement de prendre
en compte la complexit du pro-
cessus, mais aussi limplantation
dun modle dinteraction capable
de reproduire les nombreux tats
du carbone (diamant, graphite,
etc.). Le code Stamp permet de
dcrire trs prcisment le car-
bone, mais au prix dun temps de
calcul important. Nous lavons
utilis pour simuler la propaga-
tion de chocs dintensits diverses
sur les principales orientations
cristallographiques du diamant
(gure 1).
Ainsi, pas moins de 1,3 million
datomes de carbone ont t pris
en compte pour le calcul effectu
par 6 400 curs de la machine
Tera 100. Rsultat : nous avons vu
apparatre de multiples dfauts
structuraux traduisant lappari-
tion de la plasticit. Cette mesure
trs dtaille de ltat de la matire
sera une aide prcieuse pour la
construction dun modle utili-
sable dans un code travaillant
lchelle macroscopique.
Un choc rencontre au cours
de sa propagation des interfaces
entre matriaux, et en particulier
des surfaces dites libres , formant
les limites entre le systme et lair
ambiant. Or, lorsquil se rchit
sur une surface libre, le choc peut
tre lorigine de diffrents ph-
nomnes qui dpendent de son
intensit ainsi que de la topologie
locale de la surface entre autres
sa rugosit. Ces phnomnes
peuvent fortement affecter les pro-
prits du matriau et endomma-
ger son environnement comme,
par exemple, un systme de mesure.
Cest notamment le cas de la
rupture par caillage . Ce ph-
nomne se produit lorsque londe
de dtente (ou dcompression)
issue de la rexion du choc sur
la surface libre rencontre celle qui
suit le choc initial. Il se produit
localement une mise en tension
trs brutale du milieu, qui peut
entraner la rupture du matriau.
Lcaillage fait activement lobjet
de travaux associant des simula-
tions de dynamique molculaire
grande chelle et des expriences
spciques.
jection de matire
Autre phnomne induit par le
choc : une projection de matire.
Celle-ci est provoque par un d-
faut de planit de la surface libre,
comme par exemple une rayure
cre lors du passage dun outil
dusinage. Selon le dfaut, la ma-
tire jecte se prsente sous la
forme de petits agrgats, de jets,
etc. Si lon veut protger les mat-
riaux environnants (appareil de
mesure, revtement de la chambre
dexprience, etc.), il faut matriser
ces mcanismes djection. Les
conditions de formation dun jet,
par exemple, obissent des condi-
tions hydrodynamiques relative-
Q
ue se passe-t-il au
niveau molculaire
lorsquun matriau
subit un choc intense
conscutif, par exemple,
une explosion ou un violent
impact ? Le choc peut tre vu
comme une compression extr-
mement rapide de lordre de
10
-11
s et intense 10
10
pascal,
soit 10
5
atmosphres et plus Il
est encore impossible dobserver
exprimentalement avec prci-
sion et en temps rel ce qui se
passe lchelle de latome. On
sait nanmoins quil sagit de
phnomnes complexes : plas-
ticit (dformation irrversible
du matriau), endommagement
(ssuration, rupture), dcompo-
sition chimique, etc. Pour avoir
une ide plus prcise, une solu-
tion passe par des simulations sur
des ordinateurs petaopiques.
La dynamique molculaire est
une mthode de simulation lar-
gement utilise. Elle consiste
rsoudre les quations du mou-
vement dun ensemble de parti-
cules (atomes, molcules) inte-
ragissant par le biais dune force
prdnie. Ces dernires annes,
les calculateurs permettaient de
raliser des tudes plutt phno-
mnologiques sur des systmes
de dimension rduite quelques
millions datomes soit des dimen-
sions de quelques millimes de
micron.
Avec la machine Tera 100, on
peut dsormais prendre en compte
des systmes dont les dimensions,
proches du micron, permettent
une comparaison avec lexprience,
tout en utilisant des forces dinte-
raction dcrivant avec une bonne
approximation la complexit des
interactions interatomiques.
Pour mener bien ces simu-
lations, il nous a fallu repenser les
logiciels an quils tirent pleine-
ment prot des capacits des cal-
LA MCANIQUE QUI AFFECTE UN MATRIAU EN CAS DE CHOC INTENSE RESTE MAL
COMPRISE. POUR LTUDIER, IL FAUT DESCENDRE AU NIVEAU DE LATOME. DFORMATION
IRRVERSIBLE, ENDOMMAGEMENT, DCOMPOSITION LA SIMULATION DE HAUT VOL
NEST PAS DE TROP POUR MIEUX COMPRENDRE LA PHYSIQUE DES CHOCS.
LA PHYSIQUE DES CHOCS
LCHELLE ATOMIQUE
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
ingnieurs
la Direction
des applications
militaires
du CEA.
PAR LAURENT
SOULARD,
NICOLAS
PINEAU,
OLIVIER
DURAND
ET JEAN-
BERNARD
MAILLET
teindre un rgime de dtonation,
cest--dire la propagation dune
raction chimique par onde de
choc. On ne peut bien comprendre
ce phnomne quen tudiant les
mcanismes molculaires qui en
sont lorigine. La dcomposition
chimique de lexplosif se produit
sur une paisseur allant de quelques
microns quelques millimtres,
selon la nature de lexplosif. Or les
simulations de ractions chimiques,
qui ncessitent par nature de
prendre en compte des lectrons,
sont limites aux chelles nano-
mtriques.
Revisiter les modles
Comment lier les deux chelles ?
Par un modle qui permet de simu-
ler lvolution dun ensemble de
superparticules reprsentant
31
ment bien connues. Son compor-
tement ultrieur, et notamment
sa fragmentation, sont en revanche
beaucoup plus difciles appr-
hender. L aussi, on peut aborder
le problme de faon extrmement
ne mais sur une chelle spatiale
rduite grce une exprience
numrique de dynamique mol-
culaire. Nous avons ainsi simul
la formation dun jet en prenant
en compte 125 millions datomes
de cuivre grce aux calculs mens
par 4 000 curs sur la machine
Tera 100 (gure 2). Et comme avec
ltude de la plasticit, ces infor-
mations nous permettront de
construire des modles aux chelles
macroscopiques.
Enn, si le matriau dans lequel
se propage le choc est le sige de
ractions chimiques, on peut at-
z
Figure 1.
Propagation
dune onde
de choc dans
un monocristal
de diamant.
Derrire le
front de choc
(trait blanc),
de multiples
dfauts
structuraux
traduisent
lapparition
de la plasticit
(1 ps vaut
1 picoseconde, soit
10
-12
seconde).
C
E
A
une ou plusieurs molcules pos-
sdant leur propre dynamique
interne. La dynamique de ce sys-
tme est donne par une extension
de la dynamique hamiltonienne
usuelle ; elle reste donc compatible
avec un code de dynamique mo-
lculaire. Des simulations du nitro-
mthane (CH
3
NO
2
) avec 8 000 curs
sur le Tera 100 ont permis de mon-
trer que lapparition dune dto-
nation est un processus beaucoup
plus complexe que le laisse sup-
poser lobservation exprimentale.
La simulation permet de revi-
siter les modles macroscopiques.
Elle complte les expriences pour
comprendre cette physique com-
plexe. troitement lie la puis-
sance des ordinateurs, son impor-
tance ne pourra que crotre dans
les prochaines annes.
z
z
Figure 2.
Formation
dun jet de
matire lors
de la rexion
dun choc sur
une surface
affecte
dun dfaut
de planit.
Un total
de 125 millions
datomes
de cuivre et
4 000 curs
du Tera 100 ont
t requis pour
ce calcul.
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
32
ingnieur
de recherche
au CEA.
PAR
CHRISTOPHE
DENOUAL
C
E
A
du millimtre. Peut-on simuler
les transitions martensitiques
en dynamique molculaire sur
daussi larges domaines ?
Mur du temps
Lors dune telle simulation, les
quilibres stablissent via la pro-
pagation dondes de dformation.
La distance maximale parcourue
par ces ondes, proportionnelle au
temps de la simulation, limite la
corrlation entre diffrents points
de lespace. En pratique, augmen-
ter la taille de la bote de calcul
au-del de cette distance maxi-
male de corrlation napporte
rien de plus si lon naugmente
pas la dure de la simulation dans
les mmes proportions. Or, si la
puissance des calculateurs aug-
mente grce la multiplication
des curs, la puissance par cur
a en revanche peu volu.
Aujourdhui, comme il y a dix
ans, il est en pratique difcile de
dpasser le million de cycles de
calculs, chacun deux correspon-
dant un pas de temps dune fem-
toseconde (un millionime de
milliardime de seconde), soit une
dure totale simule dune nano-
seconde. Cette dure limite cor-
respond une distance maximale
de corrlation de quelques micro-
mtres seulement et restreint
lapparition de microstructures
de tailles suprieures.
Les plus grandes simulations
se heurtent donc ce mur du
temps . On ne peut le franchir
quen changeant de reprsenta-
tion, par exemple en regroupant
quelques atomes dune molcule
complexe pour en optimiser le
calcul. Dans le mme esprit, nous
avons opt en 2010 pour une m-
thode qui permet un changement
radical de la granularit de la
reprsentation de la matire, en
regroupant les atomes par 10, 100
ou 1 000, tout en assurant une cer-
taine quivalence entre lnergie
de cet ensemble et la reprsentation
atomique (et dtaille) sous-jacente.
Cette approche repose sur une
reprsentation particulirement
compacte du paysage nergtique
impliqu dans les changements de
phases. Chacun des tats stables
est reprsent par un minimum
dnergie, dont le niveau est estim
(avant le calcul) par une technique
de modlisation lchelle atomique.
Lors dune transition, la matire
passe dun tat stable (ou puits)
un autre en empruntant un che-
min de raction , cest--dire un
ensemble dtats qui permettent
C
est en 1970 que lon
a dcouvert des al-
liages mtalliques aux
proprits surpre-
nantes : sous une faible contrainte
de traction, ils peuvent stirer
dun certain pourcentage, puis
retrouvent, quand on les re-
lche , leur forme initiale. Ces
alliages complexes souvent
base de nickel et de titane , dont
le comportement est quelque-
fois appel pseudo-lastique ,
ont rapidement trouv de nom-
breuses applications, comme les
montures de lunettes ou les stents,
en chirurgie.
Le mcanisme permettant
daussi grandes dformations
est appel transformation mar-
tensitique (gure 1) : il sagit
dune modication de la maille
cristalline conscutive une
modication de lenvironnement,
soit une contrainte applique,
une pression ou un changement
de la temprature. Dans les m-
taux, ces transformations sont
extrmement courantes et elles
ont fait lobjet dune intense ac-
tivit de recherche. Bien quelles
permettent rarement des com-
portements aussi spectaculaires
que la pseudo-lasticit, elles
peuvent induire, sous laction
de fortes sollicitations, dimpor-
tantes dformations, et jouent
un rle fondamental dans le
comportement des mtaux.
Notre comprhension de ces
mcanismes de dformation
lchelle atomique a beaucoup
progress grce des modlisa-
tions de transitions martensi-
tiques sous choc par dynamique
molculaire, ralises sur des
millions datomes. Pour des sol-
licitations prolonges, la micros-
tructure nale devient trs com-
plexe et stend sur de larges
zones despace, souvent de lordre
DEPUIS ENVIRON QUARANTE ANS, DES ALLIAGES MTALLIQUES RVLENT DES PROPRITS
MCANIQUES SURPRENANTES : ILS ENCAISSENT DE GRANDES DFORMATIONS AVANT DE
RETROUVER LEUR FORME INITIALE. LA COMPRHENSION DE CE PHNOMNE AU NIVEAU
ATOMIQUE NE POURRAIT SENVISAGER SANS DES PUISSANCES DE CALCUL COLOSSALES.
LES DFORMATIONS
MARTENSITIQUES SOUS LA
LOUPE DES PROCESSEURS
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
33
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
z

Figure 2.
Lapparition des lamelles :
une dformation,
applique ici en 1
microseconde sur un
alliage de fer et de nickel,
induit une transformation
martensitique complexe.
Les diffrentes phases
sempilant en grandes
lamelles et se structurant
elles-mmes en bandes. C
E
A
une transition facile entre deux puits.
Cet arbre des chemins de raction
(gure 1) est dupliqu pour toutes
les mailles du calcul, chacune mi-
nimisant au mieux lnergie.
Larbre des chemins de raction
Prenons lexemple du calcul sur
un alliage de fer et de nickel (-
gure 2). Ralis avec le Tera 100
sur plus de 4 500 processeurs, il a
permis datteindre des dimensions
de botes de 0,5 micron * de ct
pour un temps de simulation de
1 microseconde. Les microstruc-
tures qui mergent de ces calculs
font apparatre une alternance de
lamelles composes de diffrentes
variantes de martensites aux fron-
tires bien planes. plus grande
chelle, elles sempilent galement
en bandes relativement rectilignes,
elles-mmes contenues dans un
couloir plus large.
Pour pouvoir obtenir cette struc-
ture imbrique sur trois niveaux, il
faut pouvoir garantir la fois une
trs bonne rsolution ici chaque
maille reprsente une centaine
datomes , de grandes botes de
calcul et un temps de calculs suf-
samment long pour que de grandes
structures apparaissent. Seuls des
calculs grands grains, raliss sur
plusieurs milliers de curs per-
mettent datteindre la fois ces
rsolutions et ces chelles despace
et de temps.
Les rsultats que nous obtenons
aujourdhui reposent sur un arbre
de chemins de raction calcul
laide de potentiels atomiques sim-
plis. Mais en ralit, ces trans-
formations sont induites par une
recomposition de la structure lec-
tronique des atomes. Or, lchelle
de latome, ces transformations
sont dcrites uniquement par une
approche quantique. Les simuler
demande de recourir une autre
approche : les calculs de structures
lectroniques dits ab initio. Ils sont
galement trs complexes et trs
consommateurs de temps de calcul
et bncient eux aussi du paral-
llisme massif, propre au calcul
haute performance. On obtient ainsi
une estimation able des chemins
de raction.
En couplant ces deux approches,
nous aurons bientt une vision uni-
e dune microstructure de lchelle
du millimtre lchelle de latome.
Ces transformations, quelquefois
si rapides quelles chappent aux
diagnostics les plus ns, pourront
alors tre analyses dans le dtail,
et le mystre de leur formation par-
tiellement lev.
z
z

Figure 1.
Transformations
martensitiques : les alliages
de fer-nickel peuvent
facilement passer dune
structure cubique faces
centres (en haut gauche)
cubique centre (en haut
droite), moyennant
une dformation homogne
de la maille (cadre blanc).
Les transitions de phases
sont reprsentes comme
des lignes (en gris)
connectant deux tats
stables (pastilles de couleur).
La dimension de lespace
de larbre (ici reprsent
schmatiquement en
deux dimensions) est dans
le cas gnral un espace
9 dimensions.
MICRON
Le micron
ou micromtre,
vaut un millime
de millimtre (10
-6
m).
calculateurs haute performance,
comme les machines Titane ou
Tera 100, situes au centre CEA de
Bruyres-le-Chtel (Essonne). Mais
les techniques de paralllisation
classiques, qui consistent calcu-
ler le champ laser simultanment
sur diffrents processeurs CPU
( Central Processing Unit ) dis-
tribus le long dune seule dimen-
sion spcique les uns la suite
des autres, deviennent obsoltes
pour ce type de calcul.
Dcrire la formation de plasma
En effet, pour simuler une impul-
sion laser de diamtre infrieur au
millimtre, il faudrait monopoliser
128 processeurs CPU pendant plu-
sieurs mois. Avec des faisceaux de
taille centimtrique tels que ceux
du Laser Megajoule (LMJ), tout
doit tre multipli par 10 000 ! De
plus, outre les mcanismes op-
tiques, il faut aussi simuler la d-
gradation du matriau. Concr-
tement, cela conduit calculer la
gnration de plasma, produite
pendant quelques femtosecondes,
lorsque les intensits laser atteignent
plusieurs dizaines de TW/cm
2
*.
La solution passe par lutilisa-
tion dun autre type de processeur :
les processeurs graphiques, ou GPU
pour Graphics Processing Units .
Originellement destins aux jeux
vido, les GPU rcents possdent
une puissance de traitement extr-
mement importante grce plu-
sieurs centaines dunits de calcul
pouvant travailler en parallle.
Lart du programmeur consiste
organiser toutes ces ressources
en exprimant son algorithme laide
de milliers de processus lgers, se-
lon un dcoupage particulier dit
grille de calcul . Les acclrations
de calcul entre processeurs GPU
et leurs anctres CPU peuvent at-
teindre un facteur 50 et rsoudre
en quelques heures des systmes
dquations non linaires qui n-
cessitaient plusieurs jours dint-
gration numrique il y a un an.
Actuellement, les calculs sur
GPU offrent la possibilit de simu-
ler des impulsions laser de 3 nano-
secondes avec une rsolution de
30 femtosecondes (soit cinq ordres
de grandeur sur une dimension)
en moins dune semaine. Prochain
d : atteindre la femtoseconde
pour dcrire la formation de plasma.
Des processeurs graphiques pour
visualiser la lumire, cest bien
naturel
z
LES PREMIERS RAYONS LASER ONT T PRODUITS IL Y A PLUS DE CINQUANTE ANS. MAIS LE
COMPORTEMENT DE CETTE LUMIRE LORSQUELLE TRAVERSE DES MATRIAUX RESTE LA
SOURCE DE NOMBREUSES INTERROGATIONS. OPTIQUE NON LINAIRE, AUTOFOCALISATION
GRCE AUX SUPERCALCULATEURS, LE RAYON LASER PEUT ENCORE NOUS SURPRENDRE.
DES PROCESSEURS
GRAPHIQUES POUR
VISUALISER LA LUMIRE
C
est un des enseigne-
ments de base de lop-
tique dite linaire :
la lumire se comporte
diffremment selon le milieu quelle
traverse. chaque matriau son
indice de rfraction. Mais cest une
vrit qui a t mise mal dans les
annes 1960 avec lavnement des
sources laser : lindice de rfraction
des matriaux transparents les
gaz, les verres peut dpendre
de lintensit lumineuse qui les
traverse. Ltude de ce phnomne
sappelle l optique non linaire.
Sous certaines conditions, par
exemple lorsque la puissance
dlivre par un laser devient su-
prieure une valeur seuil, lin-
dice du milieu augmente contin-
ment le long du chemin optique.
Consquence : limpulsion laser
se focalise la manire dune loupe
ou dune lentille. On parle alors
d autofocalisation optique .
Architecture obsolte
Cette trange proprit de la lu-
mire se rencontre dans des exp-
riences utilisant des sources laser
dnergie modre quelques
millijoules mais dlivrant des
impulsions de dure femtose-
conde *. Elle se rencontre aussi si
lon a affaire des sources de forte
nergie (une dizaine de kilojoules)
mais pour des impulsions de du-
re, plus longue, nanoseconde *.
Cest le cas par exemple avec les
installations laser de forte puis-
sance, o le phnomne dauto-
focalisation se manifeste dans les
verres de silice et conduit une
fragmentation de limpulsion op-
tique en une multitude de la-
ments de taille micromtrique et
dintensit mille fois suprieure
celle de londe incidente.
Pour dcrire ces dynamiques
non linaires, on ralise des simu-
lations numriques avec des super-
FEMTOSECONDE
La femtoseconde
(1 fs) vaut 10
-15
s.
La nanoseconde
(1 ns) vaut 10
-9
s.
La picoseconde
(1 ps) vaut 10
-12
s.
TERAWATT
Lintensit dune
onde lumineuse
sexprime en
watt par cm
2
.
Un trawatt (TW)
vaut 10
12
W.
Intensit [TW/cm]
directeur de
recherche
au dpartement
de Physique
thorique
et applique,
au centre CEA
de Bruyres-
le-Chtel,
PAR
LUC BERG
ingnieur-
chercheur
au dpartement
des Sciences de
la simulation et
de linformation ,
au centre CEA
de Bruyres-
le-Chtel
(Essonne).
ET GUILLAUME
COLIN
DE VERDIRE
z
Sur cette simulation
en 3D dun petit
faisceau laser de
dure picoseconde
et dun diamtre
de 0,5 mm, on voit
que limpulsion,
initialement
homogne, se
casse sous leffet de
lautofocalisation
optique en de
multiples laments
trs intenses, ayant
chacun un diamtre
micromtrique et une
dure de quelques
femtosecondes.
34
L
E
S

G
R
A
N
D
S

C
H
A
L
L
E
N
G
E
S
LACCROISSEMENT DE LA PUISSANCE DES SUPERCALCULATEURS PASSE PAR UNE AMLIORATION
DRASTIQUE DE LEUR EFFICACIT NERGTIQUE. MMOIRES ET PROCESSEURS MOINS
GOURMANDS, ARCHITECTURE MASSIVEMENT PARALLLE, OPTIMISATION LOGICIELLE,
REFROIDISSEMENT : TOUTES LES PISTES SONT EXPLORES POUR RDUIRE LEUR VORACIT.
PROCHAIN DFI :
LA MATRISE DE LNERGIE
par le fabricant Fujitsu et lInstitut
avanc de sciences informatiques
de Kobe, au Japon, consomme
quasiment 10 mgawatts plein
rgime, soit la consommation
lectrique annuelle hors chauf-
fage denviron 5 000 foyers !
Grce cette nergie, il a af-
ch un score de 8,16 millions de
milliards doprations par seconde,
soit 8,16 petaops *au test Linpack *,
prenant ainsi la premire place
du Top 500, un classement inter-
national des supercalculateurs
qui, bien que contest, reste trs
utilis. En valeur absolue, la
consommation du Super K est
impressionnante mais, parado-
L
e calcul haute performance
est un sport de haut ni-
veau. Pour battre de nou-
veaux records, les ath-
ltes de cette discipline ont
aujourdhui une priorit : rduire
par tous les moyens leur alimen-
tation en lectricit. La voracit
nergtique des machines est en
effet devenue le frein majeur au
dveloppement de supercalcu-
lateurs plus puissants.
lheure actuelle, les super-
calculateurs ont besoin dune trs
grosse quantit dlectricit. Cham-
pion du monde de calcul intensif
depuis juin dernier, le systme
japonais Super K, co-dvelopp
xalement, il afche aussi lune des
meilleures efcacits nergtiques
de sa catgorie. Sa performance
par watt est de 824 mgaops *
par watt (8,16 petaops rapports
9,9 mgawatts), alors que lef-
cacit nergtique moyenne des
dix premiers supercalculateurs
du Top 500 est de seulement
463 mgaops par watt.
Ce bon rsultat est toutefois
encore insufsant pour envisager
la construction dune machine
capable datteindre le prochain
objectif que se sont xs en 2009
les acteurs du domaine : lexaops *,
cest--dire le milliard de milliards
doprations par seconde. >>>
35
z
quip
de 68 544
processeurs,
lordinateur
Super K est le
supercalculateur
le plus puissant
du monde depuis
juin dernier.
Son efcacit
nergtique
est aussi lune
des meilleures.
FUTUR : VERS LEXASCALE
F
U
J
I
T
S
U
F
U
T
U
R

:

V
E
R
S

L
'
E
X
A
S
C
A
L
E
FLOPS
est lunit de mesure
de la puissance des
doprations par
seconde. Un traops
par seconde (10
12
)
et un exaops un
milliard de milliards
par seconde (10
18
).
.
LINPACK
Ce test de performance
mesure le temps
ncessaire
un ordinateur pour
rsoudre un systme
dquations linaires
de n quations
n inconnues.
culateurs ont en effet besoin de
toujours plus de processeurs et de
mmoires qui contiennent din-
nombrables transistors ayant cha-
cun besoin de courant lectrique
pour souvrir ou se fermer de concert
chaque cycle doprations. Il leur
faut une quantit dnergie ph-
nomnale une grande partie se
dissipe qui plus est sous forme de
chaleur par effet Joule , ce qui n-
cessite linstallation de systmes
de refroidissement eux aussi gour-
mands en nergie.
Plus de 500 000 curs
Depuis trente ans, les industriels
qui fabriquent ces composants
(Intel, IBM, AMD, Fujitsu, Nvidia,
etc.) augmentent la nesse de gra-
vure, ou le diamtre du plus petit
l reliant deux composantes dun
circuit. Ils ont aussi mis au point
des alliages qui ont permis daug-
menter les frquences de commu-
tation des transistors tout en limi-
tant les voltages des puces. Mais
>>> On estime que dbut 2012,
les supercalculateurs les plus puis-
sants dlivreront 10 petaops en
consommant 10 mgawatts, soit
environ un petaops par mgawatt,
explique Franck Cappello, codi-
recteur du laboratoire commun
lInria et luniversit de lIllinois
(tats-Unis), spcialiste de la course
lexaops. En extrapolant ces r-
sultats, un supercalculateur exa-
opique consommerait 1 000 m-
gawatts. Ce nest pas acceptable.
Mme si la demande pour des
calculateurs capables datteindre
lexaops est trs forte, le cot dun
tel niveau de consommation ner-
gtique nest pas viable conomi-
quement. Pour un supercalculateur
qui peut brler jusqu 1 000 m-
gawatts plein rgime soit autant
quune navette spatiale au dcol-
lage , la facture dlectricit annuelle
pourrait dpasser les 500 millions
deuros en France, soit environ deux
fois le cot du supercalculateur lui-
mme : entre 200 et 300 millions
deuros. Lobjectif est de concevoir
dici 2018 un supercalculateur
exaopique consommant seulement
20 mgawatts car cela correspond
la capacit maximale des infras-
tructures ayant besoin daccueillir
une telle machine, explique Franck
Cappello. Certains pensent toutefois
quil sera difcile de rester en dessous
des 50 mgawatts.
Avec un objectif de 20 mga-
watts, lefcacit nergtique dun
supercalculateur exaopique se-
rait de 50 000 mgaops par watt !
Pourra-t-on multiplier la puissance
des supercalculateurs actuels par
100 tout en amliorant leur ef-
cacit nergtique dun facteur 50 ?
Pour relever ce d, les chercheurs
font feu de tout bois. Un premier
axe damlioration est la mise au
point de microprocesseurs et de
mmoires plus conomes en ner-
gie. Pour raliser des milliards dop-
rations par seconde, les supercal-
36
R
A
N
G
NOM CONSTRUCTEUR SITE PUISSANCE
DE CALCUL (PETAFLOPS)
CONSOMMATION
LECTRIQUE (MGAWATTS)
EFFICACIT NERGTIQUE
(MGAFLOPS / W)
1 Super K Fujitsu Japon 8,16 9,9 824,6
2 Tianhe-1A NUDT Chine 2,57 4,04 635,1
3 Jaguar Cray tats-Unis 1,75 6,95 253,1
4 Nebulae Dawning Chine 1,27 2,58 492,6
5 Tsubame 2.0 NEC/HP Japon 1,19 1,4 852,3
6 Cielo Cray tats-Unis 1,11 3,98 278,9
7 Pleiades SGI tats-Unis 1,09 4,10 265,2
8 Hopper Cray tats-Unis 1,05 2,91 362,2
9 Tera 100 Bull France 1,05 4,59 228,8
10 Roadrunner IBM tats-Unis 1,04 2,35 444,3
LEFFICACIT NERGTIQUE DES
DIX PREMIERS SUPERCALCULATEURS
F
U
T
U
R

:

V
E
R
S

L
'
E
X
A
S
C
A
L
E
Si on divise par
deux le voltage,
il faut multiplier par
quatre le nombre de
curs pour conserver
le mme niveau
de performance
z
Conu par Intel,
ce prototype
de circuit
en silicium
produit un laser
qui permet
dchanger
jusqu
50 gigabits de
donnes par
seconde ; une
aubaine pour
les fabricants
de super-
calculateurs.
voltage, il faut multiplier par quatre
le nombre de curs pour conser-
ver le mme niveau de perfor-
mance. Il sagit ici dun axe majeur
pour rduire la facture dlectri-
cit. En 2018, les supercalcula-
teurs compteront plusieurs cen-
taines de millions de curs, contre
300 000 aujourdhui , annonce
Franck Cappello.
Toujours trop gourmands
Autre levier pour gagner en ef-
cacit nergtique : lamlioration
des mmoires et des liaisons de
communication entre compo-
sants. Actuellement, le dplace-
ment des donnes entre les pro-
cesseurs et les mmoires consomme
en effet plus dnergie que les
traitements raliss au sein des
processeurs ! L aussi, les concep-
teurs misent sur les progrs des
fabricants de composants.
Une premire innovation esp-
re par les fabricants de supercal-
culateurs est ici la mise en uvre
de liaisons optiques, en lieu et place
des cbles en cuivre, pour relier
armoires et cartes lectroniques,
ainsi quau sein des puces en rem-
placement de certains tracs sur
les circuits imprims.
En utilisant des photons plu-
tt que des lectrons pour trans-
porter linformation, les liaisons
photoniques cres par des puces
en silicium mettrices/rceptrices
dun laser permettent datteindre
en laboratoire des dbits trs le-
vs (plus de 50 Gbits/sec) et pro-
mettent de rduire la consomma-
tion nergtique dun facteur 10.
La mise en uvre dun rseau >>>
la chaleur dgage sur des surfaces
toujours plus petites a atteint des
niveaux ingrables ds 2004, et les
fondeurs ont d se rsoudre pla-
fonner les frquen ces de leurs puces
qui dpassent dsormais rarement
les 4 gigahertz (GHz). Dans un su-
percalculateur, elle oscille mme
gnralement entre 1 et 3 GHz.
La vitesse ne pouvant plus aug-
menter, les progrs en miniaturi-
sation ont t mis au service du
paralllisme. Chaque micropro-
cesseur contient dsormais plu-
sieurs curs qui sont des units
de traitement capables de travail-
ler de manire autonome et en
parallle. Lordinateur Super K uti-
lise par exemple 68 544 processeurs
Sparc64 VIIIfx 8 curs, gravs en
45 nanomtres (nm) et cadencs
2 GHz, ce qui porte 548 352 le
nombre total de ses curs. Et ce
nest quun dbut. On prvoit quen
2018 les puces seront graves en
8 nm et que les processeurs contien-
dront plus de 1 000 curs , anticipe
Franck Cappello.
Cette prolifration des curs
permet notamment damliorer
lefcacit nergtique en dimi-
nuant le voltage des puces. Une
technique baptise voltage sca-
ling en anglais. En abaissant le
voltage dun processeur, on rduit
sa consommation, mais on abaisse
aussi son niveau de performance
et il faut plus de curs pour com-
penser. Si on divise par deux le
37
LE CO-DESIGN LA RESCOUSSE
Vu les rendements nergtiques des supercalculateurs gnralistes actuels,
certains chercheurs pensent quil faudra forcment envisager du co-design pour
mettre au point une machine exaopique consommant moins de 50 mgawatts.
Le co-design consiste concevoir les architectures matrielles des machines
en fonction de lapplication quelles doivent excuter et donc crer des
supercalculateurs spcialiss cherchant offrir les meilleures performances
et/ou la meilleure efcacit nergtique. Il est trs probable que le premier
supercalculateur exaopique sera un supercalculateur spcialis. Linconvnient
de ces machines est bien sr leur trop grande spcialisation.
z
Le projet Green Flash vise concevoir un simulateur climatique capable datteindre 200 petaops
en consommant 4 mgawatts, soit une efcacit nergtique de 50 000 mgaops par watt.
Il mise pour cela sur une architecture massivement parallle, rassemblant 20 millions de curs,
et ralise sur mesure par rapport lapplication cible. Un prototype a montr la pertinence
de cette approche la n 2010, mais il reste trouver des nancements, estims 75 millions
de dollars, pour fabriquer lensemble.

F
U
T
U
R

:

V
E
R
S

L
'
E
X
A
S
C
A
L
E
2
0
1
0

J
E
F
F
R
E
Y
T
S
E
N
G

@

I
N
T
O
U
C
H
S
T
U
D
I
O
S
.
C
O
M
D
A
V
I
D

R
A
N
D
A
L
L
,

U
N
I
V
E
R
S
I
T

D
U

C
O
L
O
R
A
D
O
38
ront se contenter de micropoints de
contrle , explique Franck Cappello.
Si lon se contente de lvolution
technologique des composants sans
remise en cause des architectures,
les experts estiment que la consom-
mation hors systme de refroidis-
sement dun supercalculateur exa-
flopique pourrait atteindre
150 mgawatts en 2018. Les pro-
cesseurs consommeraient 50 m-
gawatts, la mmoire 80 mgawatts
et le rseau 20 mgawatts. Il faudrait
ensuite ajouter la consommation
du systme de refroidissement soit
50 70 % dnergie supplmentaire
pour un total dpassant les 200 m-
gawatts. Encore beaucoup trop.
Processeurs graphiques
Pour aller plus loin, larchitecture
du supercalculateur sera un choix
dterminant. Les concepteurs
rchissent la nature des uni-
ts de traitement utiliser au sein
des supercalculateurs.
Deux tendances saffrontent.
Certains privilgient des machines
utilisant un seul modle de pro-
cesseur gnraliste linstar du
Super K , tandis que dautres
combinent des processeurs gn-
ralistes (des CPU pour Central
Processing Unit) et des proces-
seurs graphiques (GPU

*) dans des
machines hybrides ainsi la
deuxime machine la plus puis-
sante du monde, le Tianhe-1A,
installe en Chine Tianjin, qui
atteint 2,5 petaops pour 4 m-
gawatts.
Utiliss ici pour effectuer des
calculs et non pas pour afcher
des graphismes, les GPU jouent
le rle dacclrateur dans cer-
taines applications et permettent
damliorer lefcacit nergtique
globale de la machine. Outre leur
spcialisation, leur point faible
lheure actuelle est quils ne com-
muniquent pas rapidement avec
les autres GPU, car ils ont besoin
des CPU qui jouent les interm-
diaires. Pour les applications o
les processeurs communiquent
beaucoup entre eux, cette approche
nest donc pas pertinente. La si-
tuation pourrait venir changer.
terme, on ne distinguera vrai-
semblablement plus les CPU et les
>>> de communication optique
de bout en bout sera un saut tech-
nologique majeur dans la course
lexaops , souligne Patrick Demi-
chel, architecte systme spcialiste
du calcul intensif chez Hewlett-Pac-
kard. Les fabricants dveloppent
des puces mmoire permettant un
empilement en trois dimensions
grce des interfaces de commu-
nication verticales. Il sera donc pos-
sible de les empiler au-dessus des
processeurs et donc de rduire les
distances entre composants.
Mais cest surtout lavnement
des mmoires non volatiles, comme
les mmoires changement de
phase* ou les memristors*, qui per-
mettrait de rduire considrable-
ment la facture dlectricit. Contrai-
rement la mmoire DRAM actuelle,
les mmoires non volatiles nont
pas besoin dtre alimentes en
permanence. Si elles sont suf-
samment performantes, elles per-
mettront de revoir larchitecture des
machines et de simplier les dispo-
sitifs de tolrance de pannes qui
auront moins de sauvegardes effec-
tuer sur disque dur ou SSD*, et pour-
38
LE REFROIDISSEMENT,
OBJET DE TOUTES
LES ATTENTIONS
Le systme de refroidissement qui permet de garantir
le bon fonctionnement dun supercalculateur
augmente en gnral la facture dlectricit de 50
75 %. Les concepteurs multiplient donc les innovations
pour concevoir des systmes de climatisation plus
efcaces. La priorit des fabricants est de fonctionner
en free-cooling, cest--dire en faisant circuler lair
ambiant sans aide de pompe chaleur. Quand il est
possible, le choix dun site situ dans une rgion
froide est privilgier mais le free-cooling reste un
objectif inatteignable en permanence pour un
supercalculateur exaopique. Les fabricants tentent
donc de trouver des solutions complmentaires les
moins gourmandes possible. Les portes des armoires
qui contiennent les grappes de processeurs
contiennent par exemple des circuits deau glace.
Les cartes lectroniques de certains fabricants sont
parcourues par des circuits de refroidissement, et IBM
prpare mme des puces parcourues et refroidies par
des microcanaux de uide rfrigrant. Malgr tous ces
efforts, certains experts pensent que les propritaires
de supercalculateurs devront revendre la chaleur
rcupre pour quilibrer leur modle conomique,
une ide sduisante mais pas forcment vidente
concrtiser dans la pratique.
z
Les portes des armoires du plus puissant supercalculateur franais,
le Tera 100 (9
e
rang mondial), de Bull, contiennent un changeur,
des ventilateurs et une tuyauterie deau glace relie au faux
plancher, totalisant 1 km. Chaque porte dissipe 40 kW par armoire.
C
E
A
F
U
T
U
R

:

V
E
R
S

L
'
E
X
A
S
C
A
L
E
MMOIRE
CHANGEMENT
DE PHASE
Les mmoires
changement de phase
(ou PRAM,pour Phase-
Change Random Access
Memory) enregistrent
linformation dans
un matriau vitreux
qui change dtat
quand un courant
lectrique est appliqu
et elles nont pas besoin
dtre alimentes
en permanence.
MEMRISTOR
Le memristor (ou
memristance) est un
composant lectronique
passif dont la valeur de
la rsistance change de
faon permanente sous
leffet dune impulsion
lectrique. Il est utilis
pour la conception
de mmoires dites
RRAM ou ReRam
pour Resistive Random
Access Memory
qui nont pas besoin
dtre alimentes
en permanence.
nous trouverons face un mur au-
del des 100 petaops et quil faudra
absolument ouvrir de nouveaux
paradigmes.
Aujourdhui dj, il est de plus
en plus difcile de parallliser les
calculs, cest--dire de les diviser
en sous-calculs excuts par les
curs des processeurs. Le logiciel
doit en outre privilgier la localit,
donc limiter les mouvements de
donnes entre processeurs. Cela
se traduit par lapparition de nou-
velles disciplines algorithmiques
comme la Communication Avoi-
ding Algorithm , dont lobjectif
est de permettre au processeur de
travailler au maximum en autarcie.
Comme il nest jamais possible
davoir en permanence un paral-
llisme parfait, le logiciel doit d-
sormais tre capable dteindre
les ressources matrielles non uti-
lises. Ce rle est dj dvolu aux
systmes dexploitation et cer-
tains matriels comme le proces-
seur qui peut ralentir ou dsactiver
certains de ses curs. Aussi les
applications sont conues demble
pour conomiser lnergie. Le
programmeur a maintenant trois
critres grer : le nombre ditra-
tions, la dure de chaque itration
et lnergie globale associe lex-
cution de toutes ces itrations, ex-
plique Serge Petiton. Et selon les
besoins, ses algorithmes semploient
rduire le temps de calcul ou la
facture nergtique.
Avec des centaines de milliers
de processeurs, il est de plus en
plus difcile de prvoir quelle sera
la meilleure mthode de calcul
pour rduire la facture lectrique.
Selon Serge Petiton : Ce nest pas
un problme dterministe. Cest
pourquoi nous mettons en place
des techniques dautotuning qui
consistent faire voluer automa-
tiquement en temps rel les para-
mtres de calcul, an de rduire la
consommation nergtique. En
optimisant les systmes dexploi-
tation, les langages, les compila-
teurs et les applications, on pour-
rait ainsi conomiser 10 20 %
dnergie.
Pour monsieur Tout-le-Monde
Les gains obtenus pourront tre
importants mais la complexit des
architectures ncessitera de ren-
forcer les dispositifs de tolrance
aux pannes (systmes de correc-
tions derreur, sauvegardes des
registres). Nous estimons que
cela induira un surcot nergtique
et, au nal, les mcanismes de tol-
rance de pannes devraient drainer
un tiers de lnergie dpense par le
supercalculateur contre 20 % ce
jour , imagine Franck Cappello.
Pour trouver des solutions tous
ces problmes, lingniosit des
chercheurs sera indispensable. Ainsi,
Serge Petiton estime que pour
concevoir un calculateur exaopique,
il faudra des quipes pluridiscipli-
naires de plusieurs centaines de
personnes, formes la problma-
tique de lnergie ; ce sera un vrai
challenge en matire de recrutement
et de formation.
Mais le jeu en vaut la chandelle.
En mettant au point des machines
atteignant lexaops, une multitude
de problmes ayant un fort impact
sur la socit pourront tre rsolus,
comme les prvisions climatiques
ou le criblage des mdicaments. Et
de la mme manire que les inno-
vations en Formule 1 se retrouvent
sur les voitures de monsieur Tout-
le-Monde, les progrs raliss dans
le domaine des supercalculateurs
devraient permettre de rduire
considrablement la consomma-
tion lectrique des ordinateurs et
des quipements high-tech grand
public. Vivement les prochains
grands challenges !
z
CONSTANTIN LENSEELE - JOURNALISTE SCIENTIFIQUE
GPU, car les processeurs contien-
dront la fois des curs gnra-
listes et des curs spcialiss qui
joueront le rle dacclrateurs ,
anticipe Franck Cappello.
Vu la complexit des futurs su-
percalculateurs, le logiciel tiendra
demain une place primordiale.
Dans la course lexaops, le prin-
cipal problme scientique sera de
trouver de bonnes mthodes de pro-
grammation et de nouveaux modles
mathmatiques, prdit Serge Peti-
ton, responsable de lquipe MAP
(Mthodologie et algorithmique
parallle pour le calcul scientique)
au Laboratoire dinformatique fon-
damentale de Lille. Je pense que nous
39
SSD
Un disque SSD (pour
Solid-State Drive) est
un matriel de stockage
de donnes constitu
de mmoires Flash.

GPU
Un processeur
graphique, ou Graphics
Processing Unit
en anglais, est un
processeur ddi au
calcul de lafchage.
Il est capable deffectuer
plusieurs tches
en parallle.
Le principal
problme de lexascale
sera de trouver
de bonnes mthodes
de programmation et
de nouveaux modles
mathmatiques
F
U
T
U
R

:

V
E
R
S

L
'
E
X
A
S
C
A
L
E
supercalculateurs. Ainsi, notre
premier dbouch nest pas
la recherche, mais les services :
banques, assurances, effets
spciaux pour imagerie
numrique En jouant sur le
grand volume de composants
standard, nous parvenons faire
baisser les prix. Cette approche
est par ailleurs une garantie
pour nos clients de notre
engagement sur le long terme.
Adopter des composants
standard, cest un gage de
prennit et de abilit.
Le risque nest-il pas
de dcrocher de la course
la puissance ?
Non, car nous travaillons sur
des solutions innovantes pour
les prochaines gnrations.
Seulement, nous nous assurons
que les technologies les plus
performantes deviennent des
standards de lindustrie avant de
les dployer. Prenons lexemple
des cartes graphiques ( many
cores ) : elles permettent de
dmultiplier les performances
des serveurs, mais la condition
que lon sache les programmer
de faon prenne et que lon
soit sr darriver des calculs
numriquement justes. Or, ces
deux conditions ne sont
remplies que depuis 2010.
Maintenant que la technologie
est able, nous la mettons en
uvre. HP est dailleurs le
premier revendeur mondial de
solutions many cores avec
une gamme trs large, qui va
des stations de travail aux
serveurs haute densit.

Les architectures actuelles
seront-elles adaptables
pour parvenir lexascale ?
Non : pour la premire fois
depuis dix ans, nous devons
rednir les principes de
linformatique et larchitecture
des ordinateurs. Les
technologies base de cuivre
atteignent leurs limites pour des
questions nergtiques : an de
faire fonctionner une machine
exascale aujourdhui, il faudrait
lalimenter par une ou deux
centrales nuclaires ! La seule
solution est de repenser une
bonne partie de larchitecture
des ordinateurs pour gagner
dici 2020 un facteur
5 ou 10 sur la consommation
nergtique.
Investissez-vous une nouvelle
voie pour y parvenir ?
Oui, il faudra en effet faire appel
loptique, et lchelle du
nanomtre, que ce soit pour la
communication entre les
processeurs comme pour les
changes avec la mmoire ; car
augmenter la nesse de gravure
des logiques de calcul ne sufra
pas. Nous avons dvelopp
le concept de ring resonator
ou rsonateur en rseau :
une structure de quelques
micromtres qui permet de
moduler la lumire et de passer
du domaine lectrique au
domaine optique en consommant
trs peu dnergie. Enn, pour
avoir un systme rsistant
aux pannes, nous dveloppons
le memristor , qui offrira
une grande quantit de mmoire
non volatile et pour un faible cot,
tout en ayant de bonnes
caractristiques. Il pourra aussi
tre utilise en mmoire de
stockage. Avec les brevets
dposs par HP, la route est
trace au moins jusquen 2020.
PUBLI RDACTIONNEL
TOUT EN CONSERVANT LUTILISATION DE COMPOSANTS STANDARD, HP FERA APPEL
LOPTIQUE POUR RDUIRE CONSIDRABLEMENT LA CONSOMMATION DNERGIE
DES MACHINES ET PARVENIR LEXASCALE.
JEAN-LUC ASSOR :
HP A TRAC LA VOIE
JUSQUEN 2020
Dans le calcul haute
performance, HP se distingue
en proposant des solutions
dotes de composants
standard : nest-ce pas
paradoxal ?
Nous ne voulons pas rentrer
dans une logique de
performance tout prix,
limage dune Formule 1 conue
uniquement pour battre des
records. Notre ambition est de
partir de solutions conformes
aux standards de lindustrie
informatique pour les rendre
plus performantes. Cest ainsi
que HP se distingue parmi la
dizaine dacteurs prsents sur le
calcul haute performance. Cest
une stratgie payante dun point
de vue commercial car nous
largissons le march des
Jean-Luc Assor
est responsable
du march
Engineering
(aronautique,
automobile
et semi-
conducteurs)
au sein de la
Division HPC
chez HP Corp.
D
R
UNE MACHINE 1 MILLION DUNITS, DONT CHACUNE NE TOMBERAIT EN PANNE
QUE TOUS LES MILLE ANS, SUBIRA UNE ERREUR PAR MINUTE ! DANS LA PERSPECTIVE DE
LEXASCALE, IL FAUT RSOUDRE LE PROBLME DE LA TOLRANCE AUX PANNES. AVEC DES
PROTOCOLES DE SAUVEGARDE DTAT DE LEXCUTION ET DVITEMENT DE PANNES.
SE PROCCUPER
DURGENCE DES ERREURS
LENJEU DES BIBLIOTHQUES
NUMRIQUES
PAR LUC GIRAUD
membre de lquipe de recherche Hiepacs, ddie aux algorithmes
parallles devant passer lchelle sur un trs grand nombre
de curs de calcul.
Les bibliothques numriques sont les briques logicielles de
base qui permettent de rsoudre des problmes mathmatiques
rcurrents. Ces problmes gnriques interviennent dans
les grands codes de simulation dvelopps pour comprendre des
phnomnes complexes, hors datteinte de lexprimentation
mais apprhendables grce aux futures machines exaopiques.
Les quipes dInria travaillent avec leurs partenaires sur
des solutions qui visent faciliter lutilisation des machines
futures par des chercheurs non experts en informatique
parallle. Dans ce contexte, de nombreux ds doivent tre
relevs pour avoir un impact signicatif sur lutilisation de ces
calculateurs. De nouveaux algorithmes, dits hirarchiques
exibles , sont capables dutiliser simultanment un grand
nombre de curs de calcul pour des calculateurs htrognes.
Ces bibliothques devront en particulier tre tolrantes
aux pannes. Elles devront aussi limiter lnergie consomme
pour un calcul tout en sadaptant automatiquement aux
conditions variables de leur utilisation en termes de volume
des donnes traiter et de nombre de curs disponibles.
C
est la n de la dcen-
nie que devraient ap-
paratre les machines
exascales , cest--
dire dont la capacit de calcul aura
atteint lexaops. Mais pour envi-
sager des applications scientiques
capables de tirer prot du travail
simultan des centaines de mil-
lions de curs (paralllisme mas-
sif), il faut aussi envisager que la
mise en uvre du calcul puisse
tolrer un ux quasi continu de
pannes. Le supercalculateur Jaguar
dOak Ridge National Laboratory,
aux tats-Unis, est ainsi sujet en
moyenne une panne journalire,
alors quil ne comporte que
250 000 curs.
Petit calcul : imaginons une
machine 1 million dunits de
calcul ; si chacune tombe en panne
tous les mille ans en moyenne
hypothse optimiste sur la a-
bilit du matriel , eh bien, cette
machine subira une panne en
moyenne toutes les minutes ! >>>
41
A
P
/
S
I
P
A
F
U
T
U
R

:

V
E
R
S

L
E
X
A
S
C
A
L
E
PAR FRANCK
CAPPELLO
codirecteur
du Laboratoire
de recherche en
calcul intensif,
commun
entre Inria et
luniversit
dUrbana
Champaign,
aux tats-Unis.
z
Le supercalculateur amricain Jaguar est soumis en
moyenne une panne journalire. Rien dtonnant au
regard du nombre de curs quil contient (un peu moins
de 250 000) et de sa puissance de calcul de 2,33 petaops.
42
>>> On comprend donc quil est
impossible dexcuter une quel-
conque application sans rencontrer
de nombreuses pannes
quels types de pannes les
grands calculateurs sont-ils expo-
ss ? Des dfaillances du systme
dalimentation lectrique, le crash
du calcul cause dune erreur sys-
tme, ou des pannes intermittentes
que subissent les circuits intgrs.
Celles-ci sont de loin les plus fr-
quentes. Il sagit de changements
dtat de cellules mmoires (dont
un bit passe de 0 1 ou inverse-
ment) dus aux rayonnements
lectromagntiques ou cosmiques !
Des applications exascales
Le matriel des supercalculateurs
est prvu pour dtecter et corriger
ces pannes intermittentes, au prix
dune consommation lectrique
notable, car cela multiplie le nombre
de circuits. Au-del, les donnes
de lapplication sont corrom-
pues et les programmes peuvent
entrer dans des tats non prvus
et aboutir des rsultats errons
sans que lexprimentateur ne
sen rende compte.
Les quipes dInria dveloppent
avec leurs partenaires des tech-
niques algorithmiques et des ou-
tils logiciels an de rsoudre le
problme de la tolrance aux pannes
sur les machines exascales. Et ce,
en travaillant sur les protocoles de
sauvegarde dtat de lexcution
et dvitement de pannes. Dans le
premier cas, si une panne se pro-
duit, lexcution est reprise par-
tir du dernier tat sauvegard. Dans
le second, il sagit de prvoir les
pannes et de dplacer les calculs
en cours vers des ressources ables.
La prdiction de pannes reste un
problme trs difcile rsoudre,
et cest la sauvegarde dtat de lex-
cution qui reste lapproche prin-
cipale. Le d est de concevoir des
algorithmes de sauvegarde trs
rapides et consommant peu de
ressources, alors que lapplication
utilise prs d'1 million de curs.
Des quipes tudient des mo-
dles dexcution stochastiques
pour prdire, donc optimiser, la
performance dune application
scientifique parallle grande
chelle. Enn, des chercheurs tra-
vaillent sur de nouvelles mthodes
numriques et des algorithmes
robustes pour la simulation, qui
permettent de calculer les solutions
recherches mme si de nombreuses
pannes surviennent. Cette dernire
approche reprsente une voie trs
prometteuse long terme, mais il
sera difcile dadapter lintgralit
des applications exascales avant
la n de la dcennie.
z
42
F
U
T
U
R

:

V
E
R
S

L
E
X
A
S
C
A
L
E
VIRTUALISATION DES ARCHITECTURES HYBRIDES
PAR RAYMOND NAMYST
responsable de lquipe de recherche Runtime, ddie aux supports excutifs performants
pour les architectures parallles.
Larrive rcente des machines de calcul dites hybrides , associant
des processeurs gnralistes et des acclrateurs, bouleverse les techniques
de dveloppement des applications de simulation. Alors que les programmeurs
dapplications scientiques et les dveloppeurs denvironnements et de
compilateurs avaient dj fort faire avec larrive des processeurs multicurs
au sein des supercalculateurs, une nouvelle rvolution semble dsormais ancre
dans le paysage : lutilisation dacclrateurs telles que les cartes graphiques
(GPU) pour pauler les processeurs multicurs traditionnels. lorigine, les
cartes graphiques ont t adoptes pour leur capacit acclrer certaines
parties spciques des applications, dont
les calculs taient ainsi dlgus la carte.
Progressivement, les cartes graphiques se
sont rpandues, et aujourdhui leur puissance
dpasse souvent de beaucoup celle fournie
par les processeurs gnralistes. Toutefois,
elles ncessitent de recourir des techniques
de programmation radicalement diffrentes
de ce que les programmeurs ont lhabitude
de pratiquer. Lun des plus grands ds auquel
la communaut est confronte est de parvenir
exploiter simultanment toutes les units
de calcul. Pour cela, il faut alimenter en continu
un ensemble htrogne dunits de calcul. Une voie rcemment explore au sein
dInria consiste dcouper les applications en tches, sans prjuger lavance
des units de calcul sur lesquelles elles sexcuteront. Lide est de conserver
le maximum de souplesse lexcution, o lenjeu sera dajuster judicieusement
la rpartition des tches sur les units de calcul. Typiquement, on cherchera
placer les tches sur les units qui les excuteront le plus efcacement. Mais les
nombreux paramtres entrant en jeu rendent le problme difcile : degr de
paralllisme exploitable, quantit de donnes transfrer, consommation
nergtique, etc. Par ailleurs, mme si les GPU sont gnralement plus puissants
que les curs traditionnels, lacclration obtenue dpend fortement du type
de tche effectuer et du volume de donnes traiter. Si certains calculs peuvent
tre effectus cinquante fois plus vite sur un GPU que sur un cur traditionnel,
les gains seront beaucoup plus modestes avec dautres, voire seront ngatifs !
De manire surprenante, cet cueil apparent est en fait une qualit : une
bonne rpartition des tches sur une machine hybride est bien plus efcace
que ce que lon obtiendrait sur une machine homogne, pourtant plus facile
exploiter ! Lide est quune usine regroupant une diversit douvriers spcialiss
fonctionne de manire bien plus efcace que si elle regroupait uniquement
des ouvriers possdant les mmes comptences.
Une usine
regroupant une
diversit douvriers
spcialiss est plus
efcace que si elle
ne regroupait que
des ouvriers de mmes
comptences.
W
E
I
T
A
/
I
M
A
G
I
N
E
C
H
I
N
A
z
Le Tianhe-1A fut
lordinateur le plus
puissant du monde lors
de sa prsentation, la
n 2010. De conception
chinoise, il a dpass
l'Amricain Jaguar en
adoptant une architecture
hybride, qui associe des
processeurs gnralistes
(CPU) des acclrateurs
graphiques (GPU).

DEVENEZ EXPERT
EN MODLI SATI ON
E T S I MU L A T I ON
Matriser le calcul intensif
uu laboraloire de recherche pluridiscipliuaire aulour de la siuulaliou uuurique el uu ceulre d'experlise
eu calcul haule peroruauce pour accoupaguer el souleuir les couuuuauls scieuliques ulilisalrices
des grauds uoyeus de calcul.
uue slruclure de syuergies propice aux graudes avauces.
uu prograuue de lheses el de posldoclorals.
0es orualious daus le douaiue du calcul haule peroruauce el de ses applicalious.
Propos par de
grauds orgauisues
de recherche el
d'euseigueueul
suprieur (Ecole
Polylechuique, ECP,
ENS Cachau, ENSJ^,
|NSJN, uvS0, CE^,
0uera.), le uasler 2
Modlisaliou el
siuulaliou M2S
orue des scieuli
ques de haul uiveau
eu uodlisaliou
ualhualique
des phuoueues
couplexes el
siuulaliou appliques
aux scieuces physiques.
|uguierie ou
recherche, apporlez
volre experlise a
des iuduslries el
des orgauisues
scieuliques a orl
poleuliel.
UVSQ
linformatique du futur
Le uasler
|uorualique haule
peroruauce el
siuulaliou M|hPS
(Ecole ceulrale Paris,
ENS Cachau, uvS0)
orue les cadres
spcialisles du
paralllisue
(processeurs
uullicoeur,
supercalculaleurs)
el de la siuulaliou
uuurique aux cls
de parleuaires de
reuou.
0veloppez de
uouveaux oulils el
plougez au cour de
la couplilivil des
eulreprises el de
l'iuduslrie du ulur.
www.uihps.r
UVSQ.fr
www.maisondelasimulation.fr
www.maisondelasimulation.fr/M2S
MAI SON DE L A SI MUL AT I ON
C
r
d
i
l

p
h
o
l
o

.

i
S
l
o
c
k

(
P
h
o
l
o
s
l
a
s
h
)
C
r
d
i
l

p
h
o
l
o

.

C
E
^
C
r
d
i
l

p
h
o
l
o

.

C
E
^

HPC 2011

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

HPC 2011

Transféré par

Droits d'auteur :

Formats disponibles

SUPER-

Vous aimerez peut-être aussi