Académique Documents
Professionnel Documents
Culture Documents
Cdric LHERM
Ingnieurs 2000
5me anne
Sommaire
Prsentation : quest ce que le clustering ?
Problmatique (problmes darchitecture)
Les clusters dapplications
architecture
algorithmes utiliss
librairies
exemples
Les clusters de fichiers
conception
structure des fichiers
statistiques
Conclusion
Cdric LHERM Ingni
Quest ce que le clustering ?
Dfinition :
Node :
Poste client connect au rseau et capable dexcuter
du code informatique sous lordre dun serveur.
Node Server :
Serveur du cluster dordinateurs. Il est responsable de
la rpartition du travail entre les diffrents postes
clients ainsi que de leur synchronisation. Il rcupre
galement les erreurs et les rsultats des calculs.
Cdric LHERM Ingni
Problmatique
Excution dune application partage entre
plusieurs ordinateurs dun rseau
Htrognit des diffrentes machines
(Sun, GNU/Linux, Windows NT, )
Partage de la charge
Temps de latence
Architecture multiprocesseurs
cot important
maximum de 16 processeurs (systmes Linux)
calculs rapides
accs facile lapplication et la mmoire
Architecture en clusters
utilisation de machines du rseau
cot de mise en uvre relativement abordable
architecture client serveur difficile mettre en place
ncessite une bande passante importante
Concepts :
la mmoire physique est accessible depuis tous
les microprocesseurs
le code source rsidant en mmoire est lui aussi
visible par tous les microprocesseurs
le noyau se charge de rpartir les calculs
importants (et prvus cet effet) entre les
processeurs
Code
rsident dans
la mmoire
CPU 1 CPU 2 CPU 3 commune
aux trois
processeurs
Mmoire
Cdric LHERM Ingni
Architecture multiprocesseurs
Bilan :
mise en place aise
cot important
limites de dveloppement
problme de redondance
ncessite du code crit pour tre excut sur
plusieurs processeurs en parallle
accs la mmoire
accs au code
Application
Echange de messages
Algorithmes utiliss :
mthode de partage du calcul des boucles
dexcution (for, while)
dlgation des calculs
redondance
change de messages
int sum = 0;
for (i = 0; i < 1000; i++)
{
sum += i * 50;
}
Concepts :
application client / serveur
mission des informations propres un
processus vers la node cliente afin que cette
dernire puisse excuter le code ( fork sur le
rseau )
librairies portables
bande passante importante
Bilan :
protocole haut niveau de communication client /
serveur afin dimplmenter les systmes en cluster
portable et fonctionnant sur des systmes htrognes
gourmand en bande passante (entre 20 et 50 Mbits par
seconde)
demande de faible temps de latence (moins de 200 ms)
Principes :
partage de fichiers entre plusieurs nodes
fragments de donnes indpendants
stockages de fichiers de grande taille
redondance
accs transparent aux fichiers
Cdric LHERM Ingni
Les clusters de fichiers
Niveau utilisateur
et application
Dmons
Interface shell
Niveau
systme
Sous Linux :
beowolf :
Optimisation du taux doccupation de la bande
passante
Nombre important de nodes sur le rseau local
mosix :
Ncessite de patcher le noyau linux
Load balancing dynamique