Vous êtes sur la page 1sur 35

28/03/2020

Objectif PLAN
 Comprendre le concept et le fonctionnement  Introduction aux systèmes à large échelle
des systèmes distribués à grande échelle. (Définitions, caractéristiques, …)
 Prendre connaissances des nouvelles  Calcul Intensif parallèle et distribué
évolutions liés aux architectures parallèles  Grilles de Calcul
telles que: (Topologies , Architectures, Middlewares, …)
 Systèmes P2P
Calcul sur les architectures multiprocesseurs.
(Architectures, Applications, …)
Grilles de calcul
 Cloud Computing
P2P (Pair à pair) (Définitions, Infrastructures, plateformes, …)
Cloud Computing  Grands projets d’applications des Grilles de
calculs
HADI NADIA HADI NADIA
2 2018/2019 3 2018/2019

Les systèmes Informatiques de nos


jours sont par essence distribués,
CHAPITRE I souvent ils sont composés de sites
(processeurs, capteurs, ordinateurs,
…) reliés en réseaux.
Introduction aux
Ces sites étant caractérisés par:
systèmes à large échelle
Distribution géographique étendue
Hétérogénéité et mobilité des
composants
(PC, capteurs, téléphones, …)
4
HADI NADIA
2018/2019 5 Volatilité et disponibilité partielle.
HADI NADIA
2018/2019

Systèmes distribués (S D) Vision matérielle d'un système distribué :


Système distribué en opposition à système -Machine multi-processeurs avec mémoire partagée, CPU
centralisé multi-core
-Système centralisé : tout est localisé sur la même - Cluster d'ordinateurs dédiés au calcul/traitement massif
machine et accessible par le programme parallèle
- Système logiciel s'exécutant sur une seule -Ordinateurs standards connectés en réseau
machine
- Accédant localement aux ressources nécessaires Vision logicielle d'un système distribué
(données, code, périphériques, mémoire ...) Système logiciel composé de plusieurs entités logicielles
s'exécutant indépendamment et en parallèle sur un ensemble
définition d’un S D (Andrew Tannenbaum) d'ordinateurs connectés en réseau.
Ensemble d'ordinateurs indépendants connectés en
réseau et communiquant via ce réseau . Cet
ensemble apparaît à l'utilisateur comme une unique
HADI NADIA HADI NADIA
6 2018/2019 entité. 7 2018/2019

1
28/03/2020

Exemples de systèmes distribués : Intérêts :


1- Serveur de fichier Accès aux fichiers à partir de n'importe quelle
Serveur de fichiers permet l’Accès aux fichiers de machine. Le Système de sauvegarde associé à ce
l'utilisateur quelque soit la machine utilisée serveur est Transparent pour l'utilisateur.
• Virtuellement : accès à ces fichiers à partir de Inconvénients:
n'importe quelle machine cliente en faisant Si réseau ou le serveur plante : plus d'accès aux
« croire » que ces fichiers sont stockés localement fichiers pour personne.
• Arborescence de fichiers Unix : arborescence 2- Internet
unique avec -C’est le plus grand système distribué actuel
-Répertoires physiquement locaux - Contient de nombreux sous-systèmes selon le
-Répertoires distants montés via le protocole protocole considéré
NFS (Network File System) – Web (http)
8
HADI NADIA
2018/2019 9
– Bittorrent
HADI NADIA
2018/2019
(peer-to-peer)

Web:
Un serveur web auquel se connecte un nombre
quelconque de navigateurs web (clients)
- Accès à distance à de l'information 2 types :
•Accès simple : Serveur renvoie une page HTML
statique qu'il stocke localement
systèmes distribués
• Traitement plus complexe : Serveur interroge une à grande échelle
base de données pour générer dynamiquement le
contenu de la page
• C’est Transparent pour l'utilisateur :
les informations s'affichent dans son navigateur
quelque soit la façon dont le serveur les génère.
HADI NADIA HADI NADIA
10 2018/2019 11 2018/2019

Particularité des systèmes distribués Exemples typiques de systèmes à grande


à grande échelle: échelle :
1-Dans le domaine des télécommunications et des
transmissions de données multimédia, le recours à
la quantité considérable d’informations des architectures décentralisées et distribuées pour
stockées, échangées et traitées. éviter les problèmes de congestion et de surcharge
est de plus en plus courant.

2-Dans le domaine du calcul scientifique et de haute


performance (biotechnologie, chimie, physique,
traitement d’images, etc.), les machines
massivement parallèles et centralisées ont cédé la
place à des configurations largement distribuées et
HADI NADIA hétérogènes.
HADI NADIA
12 2018/2019 13 2018/2019

2
28/03/2020

3-Dans le domaine des banques et


assurances où les systèmes
d’informations sont distribués et
hétérogènes tant sur le plan des Comment est mesurée la
architectures matérielles que
dimension d’un SDGE ?
logicielles.

HADI NADIA HADI NADIA


14 2018/2019 15 2018/2019

La dimension d’un système distribué à


grande échelle est mesurée en fonction
de plusieurs facteurs : Dans l'informatique distribuée, de
•La taille du code, nouvelles formes de
•La quantité de données stockées, distribution ont vu le jour pour
accédées et manipulées, accueillir la dynamicité et
• Les connexions et interdépendances la grande échelle de ces
entre les composants du système, nouveaux systèmes.
•L’hétérogénéité et/ou l’interopérabilité
du ou des réseaux utilisés,
…ect
HADI NADIA HADI NADIA
16 2018/2019 17 2018/2019

Ces nouvelles formes de distribution Intérêt des systèmes distribués à


comprennent: large échelle
 Mise en commun d’un grand nombre de
ressources à faible coûts et avec une
 les technologies centralisées appelées puissance globale supérieure à celle des gros
Grille de calcul ou Grid computing. calculateurs.
les technologies décentralisées tels  Disponibilité et flexibilité càd qu’un composant
que pair-à-pair ou P2P. peut tomber en panne sans bloquer le
le Cloud Computing (qu’on appel système et la distribution de la charge.
Souvent Informatique dans les nuages)  Partage des ressources coûteuses entre
plusieurs utilisateurs
HADI NADIA  Accès
HADI NADIAaux mêmes ressources depuis tous les
18 19
2018/2019
endroits
2018/2019
du système.

3
28/03/2020

Inconvénients des systèmes Caractéristiques des systèmes


distribués à large échelle distribués à large échelle:
 Les logiciels de gestion de tels
Un système distribué doit assurer
systèmes sont difficiles à concevoir.
plusieurs propriétés pour être considéré
 Problèmes inhérents aux
comme performant:
communications •Transparence
(Lenteur, Saturation, perte de message, • Passage à l’échelle
…) •Disponibilité
 Partage et distribution des données qui • Autonomie
20
imposent des mécanismes de sécurité.
HADI NADIA
2018/2019 21
HADI NADIA
2018/2019

Accès
1 -Transparence Cacher l’organisation logique des ressources
et les moyens d’accès à une ressource
•La transparence permet de cacher aux
 Localisation
utilisateurs les détails techniques et
L’emplacement d’une ressource du système
organisationnels d’un système distribué.
n’a pas à être connu
•L’objectif est de pouvoir faire bénéficier aux
Migration
applications d’une multitude de services sans
Une ressource peut changer d’emplacement
avoir besoin de connaître exactement la
sans que cela ne soit aperçu
localisation ou les détails techniques des
Réplication
ressources qui les fournissent.
les ressources sont dupliquées mais les
•Pour un système distribué la transparence a
utilisateurs n’ont aucune connaissance de cela
plusieurs niveaux :
HADI NADIA HADI NADIA
22 2018/2019 23 2018/2019

 Panne 2-Passage à l’échelle


Si un nœud est en panne, l’utilisateur ne doit
pas s’en rendre compte et encore moins de sa Le concept de passage à l’échelle désigne la
reprise après panne. capacité d’un système à continuer à délivrer
Concurrence avec un temps de réponse constant un service
Rendre invisible le fait qu’une ressource peut même si le nombre de clients ou de données
être partagée ou sollicitée simultanément par augmente de manière importante.
plusieurs utilisateurs.
Extension Le passage à l’échelle peut être mesuré avec
Extension ou réduction du système sans au moins trois dimensions :
occasionner de gène pour l’utilisateur .
HADI NADIA HADI NADIA
24 2018/2019 25 2018/2019

4
28/03/2020

3-Disponibilité
•Un système est dit disponible s’il est en
•Le nombre d’utilisateurs et/ou de
mesure de délivrer correctement le ( les)
processus (passage à l’échelle en taille) ;
service(s) de manière conforme à sa
spécification.
• La distance maximale physique qui
•Pour rendre un système disponible, il faut
sépare les nœuds ou ressources du
donc le rendre capable de faire face à tout
système (passage à l’échelle
obstacle qui peut compromettre son bon
géographique) ;
fonctionnement.
•Parmi les causes qui peuvent rendre un
• Le nombre de domaines administratifs
système indisponible nous pouvons citer:
(passage à l’échelle administrative).
HADI NADIA HADI NADIA
26 2018/2019 27 2018/2019

- Pannes
Pour faire face aux pannes, deux solutions
des conditions ou évènements accidentels
sont généralement utilisées:
empêchant le système, ou un de ses
1-La première consiste à détecter la panne et à la
composants, de fonctionner de manière conforme résoudre (dans un délai très court).
à sa spécification ; La détection des pannes nécessite des mécanismes
– Surcharges de surveillance qui s’appuient en général sur des
des sollicitations excessives d’une ressource du timeouts ou des envois de messages périodiques
système entraînant sa congestion et la entre ressources surveillées et ressources
dégradation des performances du système ; surveillantes.
2-La deuxième solution consiste à masquer les
– Attaques de sécurité
pannes en utilisant la réplication.
des tentatives délibérées pour perturber le Ainsi, quand une ressource est en panne, le traitement
fonctionnement du système, engendrant des qu’elle effectuait est déplacé sur une autre ressource
pertes de données et de cohérences ou l’arrêt disponible.
2018/2019 du système.
HADI NADIA HADI NADIA
28 29 2018/2019

Solution à la surcharge d’un système: 4-Autonomie


•Un système ou un composant est dit autonome si
•La réplication peut être utilisée pour faire
son fonctionnement ou son intégration dans un
face à la seconde cause d’indisponibilité d’un système existant ne nécessite aucune modification
système qui est la surcharge . des composants du système hôte.
•Pour réduire la surcharge d’une ressource, • L’autonomie des composants d’un système favorise
les tâches sont traitées parallèlement sur l’adaptabilité, l’extensibilité et la réutilisation des
plusieurs répliques ou sur les différentes ressources de ce système.
répliques disponibles à tour de rôle.
Exemple:
•Une autre technique qui permet de réduire la
une ressource autonome peut être remplacée par
surcharge d’une ressource consiste à une autre ressource plus riche en termes de
distribuer les services (ou les données) sur fonctionnalités, ce qui étend les services du système.
plusieurs sites et donc de les solliciter de
30
HADI NADIA
2018/2019 manière parallèle. 31
HADI NADIA
2018/2019

5
28/03/2020

Le calcul parallèle: qu'est ce que c'est?


CHAPITRE II Faire coopérer plusieurs processeurs pour réaliser un
calcul.
Avantages:
•Rapidité:
Calcul Intensif Pour N processeurs, temps de calcul divisé par N
parallèle et distribué •Taille mémoire:
Pour N processeurs, on dispose de N fois plus de
mémoire (en général)
Difficultés:
•Il faut gérer le partage des tâches.
•Il faut gérer l'échange d'information. (tâches non-
indépendantes)
HADI NADIA HADI NADIA
32 2018/2019 33 2018/2019

Modèles de parallélisme Messages Messages


Architecture matérielle: SISD SIMD MIMD CPU
CPU CPU CPU CPU CPU
Single Single Multiple

Ecriture
Instruction Instruction Instruction

Lecture
Ecriture
Lecture
Single Data Multiple Data Multiple Data
PC Architecture Architecture RAM RAM RAM
monoprocesse Vectorielle, parallèle Mémoire RAM
ur GPU… multiprocesseurs
Mémoire Partagé Mémoire distribuée

Tous les processeurs ont accès à Chaque processeur possède sa


Modèles de programmation: SPMD MPMD
l'ensemble de la mémoire. propre mémoire. Il n'a pas accès à
Single Program Multiple Program
celle des autres.
Le plus utilisé Multiple Data Multiple Data  Attention aux conflits.
Un seul programme Création dynamique de process Il faut gérer l'échange de messages
(n° processeur = Modèle maître-esclave
 Très peu de surcoût de (surcoût)
variable) parallélisation.  Architecture bon-marché.
Outils de  Le plus souvent nb proc < 64.  Il faut ajouter un réseau de commun
parallélisation: OpenMP MPI  Architecture coûteuse. performant.
HADI NADIA ordinateur à ordinateur à HADI NADIA  Nb de proc ~ illimité.
34 2018/2019 mémoire partagée mémoire distribuée 35 2018/2019

La taxonomie de Flynn, proposée par l'américain Michael J.


Flynn est l'un des premiers systèmes de classification des
ordinateurs créés.
Les programmes et les architectures sont classés selon le type
d'organisation du flux de données et du flux d'instructions.
Tableau récapitulatif de la taxonomie de Flynn 1-Les machines les plus simples traitent une donnée à la fois :
Une seule Plusieurs ces systèmes sont dits « séquentiels ». Ce type de
instruction instructions
Donnée
fonctionnement était prédominant pour les ordinateurs
SISD MISD
unique personnels jusqu'à la fin des années 1990. On parle
Plusieurs
SIMD MIMD d'architectures SISD (Single Instruction, Single Data).
données
2-Les systèmes traitant de grandes quantités de données d'une
manière uniforme ont intérêt à être des SIMD (Single
Instruction, Multiple Data) ; c'est typiquement le cas
des processeurs vectoriels ou des unités de calcul gérant
36
HADI NADIA
2018/2019
le traitement
37
HADI NADIA du signal comme la vidéo ou le son.
2018/2019
.

6
28/03/2020

• Dans de nombreux domaines des sciences et de l’industrie


3-Les systèmes utilisant plusieurs processeurs ou un la maîtrise des technologies de modélisation et de simulation
processeur multi-cœur sont plus polyvalents et numérique est devenue indispensable.
pleinement parallèles, ce sont des MIMD (Multiple • Pour faire face à l'accroissement considérable de la quantité
Instructions, Multiple Data). d'informations numériques disponibles et
à la complexité croissante des systèmes à concevoir,
4-Le type MISD a été beaucoup plus rarement utilisé, il le calcul haute performance (HPC : "High Performance
semble néanmoins adapté à certains problèmes comme Computing") permet de calculer plus vite sur des données de
les réseaux neuronaux et aux problèmes temps-réel liés. tailles toujours plus importantes.
L'architecture appelée Systolic array est un type Le calcul intensif désigne l’utilisation
d'architecture MISD d'ordinateurs(calculateurs) puissants, munis de ressources
considérables (nombre de processeurs, mémoire, …) pour des
applications de recherche ou de l'industrie.
HADI NADIA HADI NADIA
38 2018/2019 39 2018/2019

Ces nouveaux calculateurs ou ensembles de  L’usage du calcul Intensif et de la simulation


calculateurs (clusters) ont permis un développement numérique constitues une opportunité d’amélioration
spectaculaire des performances des applications de la compétitivité des entreprises, en leur permettant
de diminuer les coûts et les durées de leurs
logicielles tout en ouvrant la voie à des applications
applications et d’augmenter la qualité globale de leurs
nouvelles, dans de nombreux domaines, industriels, à produits.
forts enjeux économiques tel que l’aéronautique et  L’augmentation exponentielle des puissances de calcul
spatial, transports, énergie, chimie, médecine et permet des simulations toujours plus riches.
biologie, matériaux, environnement, multimédia ou  L’usage des technologies du calcul intensif n’est pas
finance… réservé uniquement aux grands industriels, il est
Exemple: désormais accessible aux petite entreprises grâce au
•compagnies pétrolières, Cloud computing qui offre la possibilité d’achat de
• compagnies de construction aéronautique … . puissance de calcul à la demande sans l’acquisition de
HADI NADIA supercalculateur.
HADI NADIA
40 2018/2019 41 2018/2019

Donc partout dans le monde, le calcul intensif est Impact du calcul intensif sur la
considéré comme un enjeu stratégique. science
Il permet de développer des produits et des services Le Calcul intensif est déterminant pour les
ou de réaliser des recherches sans passer par les recherches scientifiques internationales dans les
processus classiques d'expérimentation. domaines suivants:
On peut ainsi mettre au point des avions, des
 Etude du cerveau humain et des maladies
voitures ou des médicaments, en moins de temps et à
associées tel que Alzheimer et Parkinson.
un coût plus faible.
Quels que soient les domaines d'utilisation, pour faire face à  Optimisation et contrôle des réseaux électriques,
l'accroissement considérable de la quantité d'informations informatiques et sociaux.
numériques disponible et à la complexité croissante des  Evolution du climat et de prévision météorologique.
systèmes à concevoir, la maîtrise des technologies de  Mise au point de nouveaux médicaments plus
modélisation et de simulation, par le calcul haute efficaces.
performance (HPC) , est devenue une des clefs du succès.
HADI NADIA  Recherche
HADI NADIA fondamentale en physique des
42 2018/2019 43 2018/2019
particules et en astrophysique (étoiles, galaxies…)

7
28/03/2020

calcul intensif Machines capables de répondre à ces besoins


L'architecture des ordinateurs dédiés au calcul
(super-Computing)
intensif a évoluée rapidement (d’après la loi de
Définition :
Moore qui spécifie que les caractéristiques
Ensemble de techniques et de moyens destinés à
techniques des superordinateurs les plus
traiter des applications complexes en faisant appel à
puissants doublent au moins tous les 18 mois
des ordinateurs spécialisés dans le traitement rapide
depuis 1970).
de gros volumes de données numériques.
On peut distinguer trois grandes classes de
Exemples d’applications: nous pouvons citer
machines adaptées à différents types
-la recherche de clés cryptographiques
d'applications :
-les simulations de molécules
• Supercalculateurs ;
-l’analyse du génome (étude des gènes des
• Grappes de stations de travail (ou clusters) ;
cellules)…
HADI NADIA • Systèmes
HADI NADIA distribués, Grilles de calcul et Cloud
44 2018/2019 45 2018/2019
computing;

1-Supercalculateurs: Leur puissance de calcul ne cesse d'augmenter pour


Les ordinateurs les plus puissants depuis plusieurs années sont
dépasser la dizaine de Tflops.
des machines massivement parallèles (plusieurs milliers de
processeurs). Ils sont utilisés pour des simulations de plus en plus
Leur organisation est généralement centrée sur : ambitieuses.
•un réseau de communication à haut débit (de l'ordre de
quelques Go/s à quelques dizaines de Go/s)
•auquel sont connectés des nœuds de calcul constitués
d'ensembles de quelques processeurs(de 4 à 16) ,
•partageant une mémoire commune.
•Des dispositifs de stockage de masse sont connectés aussi bien
aux nœuds de calcul que directement sur le réseau
d'interconnexion.
HADI NADIA HADI NADIA
46 2018/2019 47 2018/2019

2-Grappes de stations de travail (CLUSTER): noeuds de calcul :


• Un ensemble d'ordinateurs (noeuds de calcul) les noeuds des clusters sont des ordinateurs à part entière
indépendants, homogènes et reliés entre eux par un réseau alors que ceux des supercalculateurs ne sont pas autonomes,
local rapide » ils sont directement conçus pour être connectés au réseau
•Ces clusters, sont des architectures apparues il y a une d'interconnexion ; le nombre de processeurs (se partageant la
vingtaine d'années et qui prennent de plus en plus mémoire) par noeud est en général moins important dans les
d'importance. clusters, un, deux ou quatre ;
•La particularité de ces architectures est qu'elles sont réseau d'interconnexion :
construites à partir de composants bon marché du ceux des clusters sont la plupart du temps des bus, certes à
commerce. haut débit mais supportant moins de charge que ceux des
•Elles consistent à regrouper un certain nombre de stations supercalculateurs ;
de travail autour d'un réseau de communication.
Cette architecture ressemble beaucoup à celle des
supercalculateurs
HADI NADIA décrites précédemment avec HADI NADIA
48 49
2018/2019
des différences significatives telles que: 2018/2019

8
28/03/2020

système d'exploitation :
•Pour la majorité des clusters, c'est le système libre 3-Systèmes distribués et grilles de calcul
GNU/Linux qui est utilisé en raison de la disponibilité d'outils, Les systèmes distribués, a priori destinés à des applications
de la possibilité de le modifier pour l'adapter à chaque système mettant en relation des entités réparties ont évolués vers le
et de sa gratuité. méta-calcul consistant à exécuter une unique application sur
• les supercalculateurs sont en général livrés avec le système du un tel système. Deux façons assez répandues de considérer le
constructeur, certes optimisé pour la machine mais moins méta-calcul sont les grilles de calcul et les calculs distribués
flexible (et beaucoup plus cher). sur Internet.
Donc les clusters permettent d'obtenir un rapport 1-Les grilles de calcul ont une architecture en plein

puissance/prix très avantageux . développement. Elles consistent en un réseau d'ordinateurs


Par contre un cluster nécessite des outils logiciels (intergiciels) faiblement couplés et ont pour but d'offrir une très grande
le faisant apparaître comme un unique ordinateur vis-à-vis des puissance de calcul à leurs utilisateurs de la façon la plus
applications. Ces intergiciels permettent de programmer les transparente possible.
clusters
HADI avec
NADIA les mêmes langages que les supercalculateurs. HADI NADIA
50 2018/2019 51 2018/2019

Ces ordinateurs peuvent être Le support logiciel nécessaire à l'utilisation de


• des supercalculateurs, grilles de calcul est encore plus important que celui
•des clusters des clusters.
• des stations de travail ordinaires.
Il faut en particulier gérer les transparences de
 Ils sont reliés par un réseau à très grande échelle, le localisation, d'accès et d'architecture des diverses
plus souvent internet. ressources composants la grille.

De ce fait, les grilles sont plus un ensemble de Ce genre d'architecture permet l'exécution
logiciels permettant de répartir et d'exécuter des d'applications nécessitant une puissance de calcul
applications sur un parc de machines hétérogènes et considérable
placées sous des autorités administratives différentes.
HADI NADIA HADI NADIA
52 2018/2019 53 2018/2019

2- Pour des applications encore plus faiblement couplées,


les systèmes de distribution de calculs sur l'internet
Exemple de plateformes de calcul Intensif
sont devenus populaires (P2P).
•XTREMWEB-CH est une plateforme orientée calcul
intensif.
Il est fait ici appel à la bonne volonté du public • il est sensé permettre à des centres de recherche, des
pour la mise à disposition de temps de calcul. universités et des industriels d’installer et d’utiliser leur
propre système de calcul P2P pour leurs travaux de
recherches ou pour la production de calculs.

HADI NADIA HADI NADIA


54 2018/2019 55 2018/2019

9
28/03/2020

•Chaque participant télécharge un logiciel client •Ces applications nécessitent de telles quantités de
qui se charge de la communication avec un calculs que l'utilisation d'un maximum de ressources
serveur centralisé chargé de lui envoyé une partie de calcul prime sur l'optimisation du code.
du calcul.
•Les problèmes de partitionnement et de
•Les applications de ces systèmes sont, par distribution des calculs, de tolérance aux pannes sont
exemple, des simulations distribuées (astronomie, centraux à leur développement.
génome, chimie, etc) ou des calculs en
mathématiques (recherche de nombres premier,
problèmes de factorisation, etc).

HADI NADIA HADI NADIA


56 2018/2019 57 2018/2019

Unités de mesure pour le calcul Intensif: Exemple de Plate-forme de calcul intensif (HPC)
Généralement pour le Calcul de Haute Performance (HPC) les pour la modélisation:
mesures suivantes sont utilisées :
◦ Flop: opération flottante (double précision) Le cluster de calcul de l’OSU-Institut Pythéas est un
◦ Flop/s: opération flottante par seconde
◦ Bytes: taille des données (Octets)
ensemble de machines, sévèrement « gonflées » en
Mega Mflop/s = 106 flop/sec Mbyte = 220 ~ 106 bytes processeur et mémoire, connectées sur un réseau
Giga Gflop/s = 109 flop/sec Gbyte = 230 ~ 109 bytes Infiniband, et dédiées au calcul intensif.
Tera Tflop/s = 1012 flop/sec Tbyte = 240 ~ 1012 bytes Ce cluster a été financé à son origine (2008) par des
Peta Pflop/s = 1015 flop/sec Pbyte = 250 ~ 1015 bytes fonds provenant du Centre d’Océanologie de Marseille
Exa Eflop/s = 1018 flop/sec Ebyte = 260 ~ 1018 bytes et de l’Université de la Méditerranée.
Zetta Zflop/s = 1021 flop/sec Zbyte = 270 ~ 1021 bytes
 Ce cluster est mis à la disposition de chacune des
Yotta Yflop/s = 1024 flop/sec Ybyte = 280 ~ 1024 bytes
La machine la plus puissante ~ 16 Pflop/s (Obtenu
unités de Pytheas moyennant une participation
58
HADI NADIA
avec1572864 coeurs) www.top500.org éventuelle,
59
HADI NADIAselon l’importance des ressources
2018/2019 2018/2019
de calcul nécessaires

Les superordinateurs sont utilisés pour toutes les La Chine et les Etats Unis dominent le reste du monde
tâches qui nécessitent une très forte puissance de dans le domaine des supercalculateurs,
calcul,telle que: selon le classement TOP500 publié récemment (2017)
• les prévisions météorologiques, l’étude du climat,
• la modélisation d'objets chimiques (calcul de La course à la puissance de calcul est mondiale
structures et de propriétés, modélisation Dans le classement mondial des 500 supercalculateurs les plus
moléculaire, etc.), puissants installés,
• les simulations physiques la Chine occupe les deux premières places.
Le Japon (avec deux systèmes)
(simulations aérodynamiques, calculs de résistance les États-Unis (avec cinq)
des matériaux, simulation d'explosion d'arme la Suisse (avec un seul)
nucléaire, étude de la fusion nucléaire, etc.), monopolisant les 10 premières places de ce classement.
• la cryptanalyse
• les
60
HADI simulations
NADIA
2018/2019
en finance et en assurance . 61
HADI NADIA
2018/2019

10
28/03/2020

•Le nouveau supercalculateur chinois, Sunway TaihuLight, a


pris la tête, du classement des 500 ordinateurs les plus
puissants du monde, selon le site du
projet TOP500 responsable de l'élaboration du classement.
•Le Sunway TaihuLight, qui a pris la première place au
détenteur du record précèdent, Tianhe-2 (également situé en
Chine), est trois fois plus puissant que ce dernier.
•Le nouveau numéro un est capable d'effectuer 93 quadrillions
de calculs par seconde (autrement connu comme pétaflops) et
est environ cinq fois plus puissant que le système le plus rapide
des États-Unis, qui est maintenant à la troisième place du
classement mondial.
•Avec ce supercalculateur, qui a pris la tête du classement
mondial, la Chine compte actuellement plus de Le nouveau supercalculateur
62
HADI NADIA
2018/2019 superordinateurs que les Etats-Unis. 63
HADI NADIA
2018/2019
chinois, Sunway TaihuLight

Et la France dans l’histoire


•Sunway TaihuLight est le nouveau supercalculateur le plus •Parmi les 500 supercalculateurs les plus puissants au monde
puissant au monde. Il réalise plus de 93 millions de milliards de en Juin 2016, 18 sont français.
calculs à la seconde grâce à plus de 40 000 processeurs... chinois. •Pangea de la société pétrolière Total est celui le mieux classé,
•Le TaihuLight comprend 41.000 processeurs, chacun disposant 11ème au TOP500 avec 5,3 petaflops au compteur, suivi
de 260 cœurs, totalisant 10,65 millions de cœurs, par Prolix de Météo-France qui se classe 40ème et affiche 0,7
par rapport aux 560.000 cœurs du plus puissant ordinateur des petaflops.
Etats-Unis. •Le CEA (Commissariat à l’Energie Atomique) est
•Il est également économe en énergie, l’organisation française qui détient le plus de supercalculateurs
sa consommation électrique de six gigaflops/watt est qualifiée en France avec Tera-1000-1, Curie thin nodes, Cobalt, Tera-
d'"excellente" par le site top500.org, en tirant 100, Airain et Tera-1000-1-Hybrid, tous conçu par la société
seulement 15,3 mégawatts d'énergie, par rapport aux 17,8 Bull, qui est acquise par le groupe informatique français ATOS
mégawatts utilisés par le 33 pétaflops de Tianhe-2 son en 2014.
successeur dans le classement.
HADI NADIA HADI NADIA
64 2018/2019 65 2018/2019

La France est donc le 5ème pays au monde avec le plus


•Cette puissance de calcul hors-norme est utilisée à
de supercalculateurs, devant l’Angleterre (12) mais
derrière le Japon (29) et l’Allemagne (26). la fois dans le domaine de la recherche scientifique
Et elle se classe pareil en terme de capacité totale de fondamentale et appliquée ainsi que dans un
calcul et aussi en économie d’énergie. nombre croissant de secteurs comme
Le supercalculateur Atos sera installé en 2018 •la météorologie,
Le futur ordinateur surpuissant d'Atos développera dans sa •l'exploration pétrolière,
configuration initiale, telle qu’elle sera installée début 2018, •la pharmacie,
une puissance de calcul de 9 pétaflops, soit 9 millions de
•l'aéronautique ou l'énergie,
milliards d’opérations par seconde (l'équivalent de la
puissance de plus de 75.000 PC de bureau connectés entre • Les domaines militaires.
eux). Il sera quatre fois et demie plus puissant que le système
Bull Curie en service. Le doublement de ses capacités de
calculHADI
à 20 pétaflops est prévu en 2019.
NADIA HADI NADIA
66 2018/2019 67 2018/2019

11
28/03/2020

HADI NADIA HADI NADIA


68 2018/2019 69 2018/2019

Exemples :
Roadrunner est le premier supercalculateur américain à avoir
officiellement dépassé la puissance de 1 pétaFLOPS (soit
1015 opérations flottantes par seconde).
Il appartient au département de l'Énergie des États-
Unis (DOE) et est construit au Laboratoire national de Los
Alamos, au Nouveau-Mexique.
IBM a été chargé de sa construction et Roadrunner est devenu
l'ordinateur le plus puissant du monde en juin 2008
mais a été détrôné en novembre 2009 par Jaguar - Cray XT5-
HE.
Ce projet, annoncé en septembre 2006, lançait le
premier supercalculateur utilisant le processeur Cell de ce
constructeur.
HADI NADIA HADI NADIA
70 2018/2019 71 2018/2019

Cette machine se prête bien à la simulation de processus


massivement parallèles.
L'un de ses premiers emplois, dès la semaine suivant sa
sortie, a été
•la simulation partielle de processus visuels humains au
niveau des neurones mêmes.
•Il sera aussi utilisé pour calculer les effets du changement
climatique .
•Et, à des fins militaires, le vieillissement des stocks d'armes
nucléaires des États-Unis.

Roadrunner premier supercalculateur


HADI NADIA HADI NADIA américain
72 2018/2019 73 2018/2019

12
28/03/2020

Supercalculateur IBM Blue Le supercalculateur IBM Blue Gene/P de l'Argonne National


Laboratory fonctionne avec 250 000 processeurs
Gene/Q de l'Argonne National utilisant un système de refroidissement standard par air, groupé
HADI NADIA
Laboratory (2013) dans 72 racks/cabinets et interconnectés par un réseau de fibre
HADI NADIA
74 75
2018/2019 optique à haute vitesse1(2007).
2018/2019

Le supercalculateur Jade installé par le GENCI au Centre informatique


Le supercalculateur Occigen installé par le GENCI au CINES, à
national de l'enseignement supérieur (CINES), à Montpellier (2015).
Montpellier, France (2010).
HADI NADIA HADI NADIA
76 2018/2019 77 2018/2019

Conclusion :
Aujourd’hui, il est difficile de dire jusqu’où la Chine peut encore Les Chinois, ont déjà inclus le développement de
préserver son avance par rapport aux Etats Unis. supercalculateur exa-Flops dans le 13ème plan quinquennal
Le DoE, United States Department of Energy, s’apprêtait à allouer (2016-2020) du pays.
plus de 258 millions de dollar US à six sociétés américaines pour Trois entités chinoises, le Sugon Information Industry
mettre au point le supercalculateur de demain de puissance Exa- soutenue par l’Académie chinoise des sciences (CAS), la
Flops, National University of Defense Technology (NUDT) ainsi
des machines 10 fois plus puissantes que le chinois Sunway que l’Institut 56 de l’État-major chinois, ont déjà reçu
TaihuLight d’aujourd’hui, à l’horizon 2021. l’autorisation et le financement pour lancer chacun leur
propre prototype.
La Chine a lancé les projets de développement de ses futurs L’objectif visé est de finaliser les premiers prototypes d’ici
supercalculateurs qui permettent d'atteindre la vitesse 2018-2019, et les modèles opérationnels vers 2020-2021.
ExaFLOPS.

HADI NADIA HADI NADIA


78 2018/2019 79 2018/2019

13
28/03/2020

Le graphique suivant présente un


classement des superordinateurs selon la
puissance maximale de calcul soutenue lors
d'un test Linpack, en pétaFLOPS
(novembre 2019).

HADI NADIA HADI NADIA


80 2018/2019 81 2018/2019

Conclusion
Comme le montre cette infographie, ces performances
restent sans commune mesure avec les supercalculateurs
américains et chinois qui dominent de loin le palmarès
mondial. Le supercalculateur Summit, propriété du
département américain de l'énergie, reste le lus puissant au
monde avec 148,6 pétaFLOPS de puissance de calcul
soutenue pendant un test Linpack. Dans ces conditions, il
est pour l'instant le seul ordinateur au monde capable
d’effectuer plus de 100 millions d’opérations par seconde

HADI NADIA HADI NADIA


82 2018/2019 83 2018/2019

CHAPITRE III
Grilles de Calcul
Comme le montre notre infographie, ces
performances restent sans commune mesure avec les
supercalculateurs américains et chinois qui dominent •Introduction (prémisses, définition,
de loin le palmarès mondial. Le supercalculateur caractéristiques )
Summit, propriété du département américain de •Fonctionnement des grilles de calcul.
l'énergie, reste le plus puissant au monde avec 148,6 •Domaines d’application
pétaFLOPS de puissance de calcul soutenue pendant •Middlewares (Intergiciels)
un test Linpack. Dans ces conditions, il est pour •GLOBUS Middleware Standard
l'instant le seul ordinateur au monde capable
d’effectuer plus de 100 millions d’opérations par
seconde.
HADI NADIA HADI NADIA
84 2018/2019 85 2018/2019

14
28/03/2020

Problématique Une solution: le calcul distribué


Les temps de calcul: un problème majeur Certaines personnes consciente du réel problème qui se pose
Dans tous les domaines l'homme est amené à faire mieux, se sont posées plusieurs questions intéressantes. Ils en sont
plus, et plus rapidement notamment dans le domaine de arrivés à un constat très simple:
l'informatique. Il se retrouve face à des défis colossaux, Toute seconde de CPU inutilisée est PERDUE à jamais!
nécessitant énormément d'unités de calcul et traitements de Alors, pourquoi ne pas les utiliser à bon escient? Pourquoi ne
très gros volumes de données. pourrait-on pas créer un système dont chaque unité de calcul
Les laboratoires de recherche, et certaines grandes sociétés serait indépendante, sans contrainte pour les utilisateurs des
avec des centres de Recherches et Développement, ont un postes?
besoin toujours grandissant de force de calcul. De ce fait, l'idée de répartir un calcul imposant entre plusieurs
Des applications "très gourmandes" en terme de puissance machines indépendantes commence à émerger.
nécessiteraient plusieurs dizaines d'années pour pouvoir être Un ensemble de machines hétérogènes, toutes regroupées
menée à bien sur une machine standard, ou alors une autre pour une même cause, représente une puissance de calcul
solution serait d'investir dans la construction d'un exceptionnelle.
supercalculateur
HADI NADIA à coup de Millions d'euros, ce qui n'est pas à HADI NADIA
86 2018/2019 87 2018/2019
la portée de tout le monde.

Ce concept représenterait une alternative intéressante aux Introduction


clusters:
Les grilles de calcul Aujourd’hui, le calcul informatique prend de plus en plus
de place dans la vie des Scientifiques .
 Les besoins en terme de capacité de calcul, de stockage
de données, de bande passante de réseau, augmentent de
jour en jour.
 C’est pour cela, que les laboratoires et les
constructeurs en informatiques ont eu l’idée de fédérer
(regrouper) toutes ces ressources de calcul, disque et
réseaux, afin de faire du calcul distribué.
 Une des méthodes pour faire du calcul distribué est
de faire partager le travail sur plusieurs machines réparties
sur Internet.
Nous parlerons alors de grille de calcul.
HADI NADIA HADI NADIA
88 2018/2019 89 2018/2019

1-Prémisses
 L’idée de grille est qu’un utilisateur puisse disposer de
 Avant l’apparition du réseau électrique chaque user devait
générer sa propre électricité et la consommer sur place. La vraie puissance de calcul distante c à d exécuter une ou
révolution n’était pas l’électricité, mais les réseaux de transport, plusieurs applications sur d’autres processeurs que le sien,
associés aux techniques de transmission et de distribution. il pourra le faire sans avoir à se préoccuper de l’endroit où
ses données sont traitées.
 La génération et la distribution de l’électricité ont permis de  Donc par analogie à la grille d’électricité, la notion de
diminuer les coûts et de rendre ce service standard à chacun. grille de calcul est définie comme étant une
infrastructure matérielle et logicielle fournissant un accès
 Par analogie, le terme « grille de calcul » a été adopté pour
fiable, cohérant et bon marché à de grandes capacités de
augmenter la puissance de calcul. Chaque utilisateur exécuter traitement et de stockage.
ses applications sur son propre processeur (PC).  L’origine de la terminologie ‘Grid Computing’ provient du
réseau électrique ‘ Electric power Grid’.

HADI NADIA HADI NADIA


90 2018/2019 91 2018/2019

15
28/03/2020

2 -Définition
Nous parlons d’infrastructure car une grille
La grille de calcul est un concept conçu dans les
devra fournir des ressources (calcul, stockage …) années 90 en USA. C’est une méthode pour faire
à grande échelle. du calcul distribué et de partager le travail à
plusieurs machines sur le réseau internet.
Cela nécessite une quantité significative de
matériel qui constituera les ressources et assurera C’ est un ensemble de ressources autonomes
,hétérogènes permettant le traitement
leur interconnexion et une quantité importante de (supercalculateurs, pc,…) et le stockage
logiciel pour contrôler et superviser cet ensemble d’information (serveur de disque, de bande,…)
de matériels. interconnectés au moyens d’un réseau à large échelle
(internet,…) gérés au moyen de logiciel (intergiciel
ou middleware) d’une telle manière que le système
puisse être utilisé aussi facilement qu’un simple
HADI NADIA
ordinateur.
HADI NADIA
92 2018/2019 93 2018/2019

Le principe de ce type d’architecture est de


profiter de toute la puissance inexploitée des
ordinateurs d’un réseau pour la mettre à
disposition d’applications très lourdes
(nécessitant un temps d’exécution important),
évitant ainsi l’achat de supercalculateurs (très
couteux) et également de profiter de l’espace de
stockage inutilisé des serveurs.

La principale caractéristique d’une grille de


calcul est qu’il y a un coordinateur qui est
responsable du partage du travail sur les
Principe d’une grille informatique différentes ressources.
HADI NADIA HADI NADIA
94 2018/2019 95 2018/2019

3-Caractéristiques d’une grille de calcul Intragrille (en analogie avec Intranet)


C’est la plus simple des Grilles, elle est composée d’un
3-1Différentes topologies de grilles de ensemble relativement simple de ressources et de
services appartenant à une organisation (groupe de
calcul
personnes ayant un objectif commun) unique.
Les grilles sont répertoriées d’un point de Les principales caractéristiques d’une telle grille sont :
vue topologique en trois types par ordre  présence d’un réseau d’interconnexion performant et
croissant d’étendue géographique et de haut-débit.
complexité :  un domaine de sécurité unique et maîtrisé par les
Intragrilles (Intragrids) administrateurs de l’organisation.
 un ensemble relativement statique et homogène de
Extragrilles (Extragrids )
ressources.
Intergrilles (Intergrids ).
HADI NADIA HADI NADIA
96 2018/2019 97 2018/2019

16
28/03/2020

Extragrille (en analogie avec Extranet)


Exemple :
Une Extra-grille étend le modèle en agrégeant
Une entreprise peut être amenée à (regroupant) plusieurs Intra-grilles.
construire une intra-grille pour
Les principales caractéristiques d’une telle grille :
augmenter la puissance de calcul de
 la présence d’un réseau d’interconnexion
ses équipes de recherche et de hétérogène haut et bas débit (LAN / WAN).
développement.
 plusieurs domaines de sécurité distincts.
 un ensemble plus ou moins dynamique de
ressources

HADI NADIA HADI NADIA


98 2018/2019 99 2018/2019

Intergrille (en analogie avec Internet)


Une intergrille consiste à agréger les grilles de
multiples organisations, en une seule grille. Exemples:
Les principales caractéristiques d’une telle grille sont : • Projet Industriel:
• la présence d’un réseau d’interconnexion très conception d’un avion par un consortium
hétérogène haut et bas débit (LAN/WAN) aéronautique.
• plusieurs domaines de sécurité distincts ayant parfois • Projet Scientifique :
des politiques de sécurité différentes et même
contradictoires. Modélisation de protéines où plusieurs
• un ensemble très dynamique de ressources.
organisations seront amenées à participer.
Les inter-grilles seront souvent mises en œuvre lors de
grands projets .

HADI NADIA HADI NADIA


100 2018/2019 101 2018/2019

3-2 Classement des grilles de Calcul

L’usage des grilles de calcul peut être classer en


trois catégories :
- Utilisation pour la diffusion d’information qui
permet un plus grand partage des informations.
- Utilisation pour l’augmentation des capacités de
stockage.
- Utilisation pour le calcul ou l’augmentation de la
puissance des ordinateurs.

HADI NADIA HADI NADIA


102 2018/2019 103 2018/2019

17
28/03/2020

Grille d’information
Trois type d’architectures :
 Partager la connaissance
1-Internet computing
Exemple: le Web
Caractéristiques :
Grille de stockage
*système distribué à grande échelle.
 Stocker à grande échelle (de grandes
*de simples pcs connectés a Internet (des millions)
quantités de données)
*plusieurs problèmes : volatilité de machines, Pas
Exemples: DataGrid, Kaaza, Gnutella (partage
d’identité, pas de confiance
de fichiers pair à pair ou P2P)
Exemple d’application :
Grille de calcul
Recherche d’extraterrestres Seti@Home.
 Agréger la puissance de calcul
Exemples: Globus, Unicore,Legion.
HADI NADIA HADI NADIA
104 2018/2019 105 2018/2019

2- Supercalculateur virtuel Définition :


Caractéristiques :
*agréger la puissance de calcul de plusieurs clusters Une OV est constituée d’un grand nombre
et supercalculateur. d’utilisateurs ( des scientifiques, des chercheurs,
*Connexion via un réseau spécialisé ou via internet. …), d’un très grand nombre de ressources (bases de
données, CPU, mémoire, programme, services, …)
*Collaboration entre Organisations virtuelles (VO)
et elle est souvent dédiée à un domaine
Exemple de Grille : Teragrid d’application ( Biologie, Physique, Astrologie, …)
(www.teragrid.org)
-fournie une puissance de calcul de 13,6 Teraflops
-Utilise un réseau à 40 GB/S

HADI NADIA HADI NADIA


106 2018/2019 107 2018/2019

3-3Architecture d’une grille de calcul


• Bien que chaque projet de Grid-computing ait sa
propre architecture logique, une architecture
L’architecture d’une grille est la manière dont
générale en couches est cependant admise pour
elle est structurée.
expliquer certains concepts fondamentaux des
Une grille est organisée en « couches » ayant
chacune une fonction spécifique. grilles.
Généralement, les couches supérieurs sont • Une telle architecture est représentée par la figure
orientées vers l’user, tandis que les couches suivante:
inférieures sont orientées vers le matériel
(Ordinateurs, réseaux…)
 Chaque couche fait appel aux services de
n’importe quelle couche inférieure.
HADI NADIA HADI NADIA
108 2018/2019 109 2018/2019

18
28/03/2020

Couche Infrastructure Matérielle


C’est la couche la plus basse elle correspond à
l’infrastructure matérielle :
• les ressources (interconnectées à travers les
réseaux ) composants la Grille.
• le réseau ( assure la connexion de ces ressources)
Ces ressources peuvent être :
 des processeurs (pc)
 des équipements de stockage.
 des stations de travail, …
 des Bases de données,
 des équipements spéciaux,..
Modèle en couches des grilles  des grappes de calcul (clusters), ...
HADI NADIA HADI NADIA
110 2018/2019 111 2018/2019

Couche Service Couche Intergiciel:


La troisième couche appelée Intergiciel, regroupe
La seconde couche appelée Service offre des
tous les outils qui peuvent aider les développeurs à
services de noyau tels que:
écrire des applications pouvant tourner sur la grille
 Contrôle de processus à distance,
de calcul.
 Co-allocation des ressources, On y trouve :
 Accès aux stockages et l’enregistrement de • des compilateurs, des librairies,
l’information, •des outils de conception d’applications,
 Mécanismes de sécurité, etc. •des services de gestion, de transfert et de calcul de
données sur la grille.
Elle est considérée comme le cerveau de la grille de
calcul.
HADI NADIA HADI NADIA
112 2018/2019 113 2018/2019

FONCTIONNEMENT D’UNE GRILLE


Couche Applications
DE CALCULS
 Représente l’ensemble des différentes
Applications qui ont été développées pour
interagir avec la grille.  L’objectif d’une grille de calcul est de concevoir
 C’est la couche que « voient » les users et
une architecture informatique permettant de
avec laquelle ils interagissent souvent. mettre à disposition des utilisateurs toutes les
ressources dont ils ont besoin au moyen d’une
Exemple d’applications:
interface simplifiée.
1. scientifiques
 La complexité du réseau et des logiciels de
2. Techniques gestion du système doit être invisible à l’user qui
3. financières …. doit accéder aux ressources de façon transparente.
HADI NADIA HADI NADIA
114 2018/2019 115 2018/2019

19
28/03/2020

2- Hétérogénéité des ressources :


I-Caractéristiques d'une grille de calcul
les ressources dans une grille sont de nature
Les principales caractéristiques des grilles hétérogène en terme de matériels et de logiciels.
de calcul dont certaines représentent des 3-Passage à l'échelle :
avantages indiscutables alors que d'autres une grille peut aussi bien contenir quelques
soulèvent quelques problèmes sont: dizaines de ressources que des millions voire des
dizaines de millions. Cela pose de nouvelles
1-Existence de plusieurs domaines contraintes sur les applications et les algorithmes de
administratifs : gestion des ressources.
les ressources sont géographiquement 4-Nature dynamique des ressources :
distribuées et appartiennent à différentes dans les grilles, ce caractère dynamique génère
organisations chacune ayant ses propres certaines contraintes telles que:
politiques de gestion et de sécurité. Il est  l'adaptation au changement dynamique du nombre
donc crucial de respecter les politiques de
HADI NADIA
de HADI
ressources
NADIA
116 117
chacune
2018/2019
de ces organisations.  la 2018/2019
tolérance aux fautes, ...

II-Les Composants d’une Grille de calcul


1-Les Nœuds qui peuvent être de deux types:
 Les terminaux : 2- Le middleware :
Chaque participant utilise un logiciel client  Pour centraliser les données, un
spécifique (conçu par l’initiateur du projet), installé middleware installé sur un serveur est
sur son pc. Cette application va contacter le nécessaire.
serveur, demander un paquet de données et  Il permet une interaction avec les
commencer le traitement de ces données, en local, utilisateurs, les applications et les
elle va ensuite recontacter le serveur pour lui ressources . Il doit être en mesure
envoyer le résultat de sa recherche, d’identifier et d’exploiter aux mieux les
éventuellement télécharger un autre paquet de ressources disponibles.
données pour d’autres calculs.
 Analyse les requêtes des users et
 Les clusters : répartit automatiquement les tâches sur
Plusieurs pc sont connectés ensemble, contrôlés les différentes ressources en fonction
par un seul administrateur. Il nécessite la des disponibilités.
118
conception
HADI NADIA
2018/2019
d’algorithmes spécifiques pour la 119
HADI NADIA
2018/2019
gestion et le contrôle des ressources.

4- Les connexions :
3-Le système d’exploitation :
Elles s’effectuent par Internet, intranet ou réseau
 Le système d’exploitation fournit
l’interface entre les applications du privé. L’hétérogénéité et l’administration séparée
réseau, les services du middleware et la sont les principaux problèmes à résoudre,
plate forme matérielle. impliquant des conflits de sécurité et une gestion
 La grille exige un système difficile des ressources.
complémentaire du système 5-Les protocoles:
d’exploitation, capable d’offrir : Les applications de calculs distribués sont construites sur
-Une architecture de sécurité puissante. des protocoles comme:
-Contrôle des performances. - RTP(Real time Transport Protocol)
-Vérification des applications distribuées. - XTP(Xpress Transfert Protocol)pour les applications
parallèles dans les clusters,
-Planification des ressources.
- CORBA(Common Object Request Broker Architecture)
- RSVP(Ressource reservation protocol)
HADI NADIA HADI NADIA
120 121
2018/2019 - RMI(Remode
2018/2019 Methode Invocation)…

20
28/03/2020

Application des Grilles de Calculs  Selon la nature et l’étendue de la grille, les


Les principales applications des grilles de calcul ressources agrégées pourront aller de toutes les
se font dans les domaines suivants : stations de travail d’une université à tous les
Supercalculateur réparti : (calcul distribué) supercalculateurs des organismes de
Une grille de calcul pourra agréger une recherche d’un pays.
importante quantité de ressources afin de  Comme exemples d’applications nous
fournir la puissance de calcul nécessaire pour pouvons citer:
de nombreuses applications et que même les -la simulation distribuée dans la météorologie,
supercalculateurs les plus modernes ne peuvent -la cosmologie
fournir. -l’aéronautique …

HADI NADIA HADI NADIA


122 2018/2019 123 2018/2019

Calcul sur demande:


 Une grille de calcul pourra fournir les
Calcul haut-débit: (calcul intensif)
ressources pour satisfaire les demandes à
 Une grille de calcul sera utilisée pour court terme d’une application et que les
ordonnancer en parallèle une importante ressources locales ne sont pas en mesure
quantité de tâches indépendantes les unes d’assurer (cycles processeur, espace de
des autres. stockage …).
 Comme exemples d’applications nous  Le défi principal pour les concepteurs
pouvons citer de telles grilles est la nature dynamique et
- la recherche de clés cryptographiques aléatoire des demandes faites par les
- les simulations de molécules utilisateurs qui peuvent constituer une large
- l’analyse du génome … population.
HADI NADIA HADI NADIA
124 2018/2019 125 2018/2019

Génération, traitement et stockage


Calcul Collaboratif (Collaborative
d’énormes quantités de données :( Data-
Computing) :
intensive Computing)
Cette classe d’applications inclut les
 Dans de telles applications, une grille de
applications d’interaction entre humains
calcul pourra absorber et stocker
en vue de partager des bases de
d’importantes quantités d’informations
données ou des simulations.
générées.
 production de nouvelles données à partir de
Exemples :
données géographiquement dispersées. -Conception et interaction avec un
 Comme exemple d’applications nous
nouveau moteur d’avion.
pouvons mentionner: -Conception d’un plan urbain .
- la production d’une carte de l’univers, -Exploration conjointe de bases de
126
HADI NADIA
- la prévision météorologique à long terme,
2018/2019 127 données
HADI NADIA
2018/2019 géographiques.

21
28/03/2020

MIDDLEWARES (intergiciels)
 Le domaine de l'intergiciel (middleware),
apparu dans les années 1990, a pris une place
centrale dans le développement des
applications informatiques reparties.
 L'intergiciel joue aujourd'hui, pour celles-ci,
MIDDLEWARES un rôle analogue a celui d'un système
(intergiciels) d'exploitation pour les applications
centralisées.
 Il dissimule la complexité de l'infrastructure
sous-jacente, il présente une interface
HADI NADIA
commode
HADI NADIA
aux développeurs d'applications et
fournit un ensemble de services communs.
128 2018/2019 129 2018/2019

La Couche Middleware:
L'intergiciel (middleware) est l'élément
 En partageant cette couche, différentes
essentiel qui permet d'agréger les diverses
machines ont accès à des outils de ressources composant une grille.
communication beaucoup plus évolués qu’avec
les services réseaux de base. Si deux machines ayant des systèmes
Les middlewares utilisent en fait les services d’exploitation différents, partagent le même
réseaux de bases mais leur utilisation est faite de middleware, la communication sera faite de
façon transparente. façon transparente c à d qu’il jouera le rôle
Le développeur n’a pas à ce préoccuper de la d’intermédiaire entre les deux systèmes
complexité de leur fonctionnement et dispose de d’exploitations.
fonctions simples à mettre en place pour gérer la
communication entre les machines.
HADI NADIA HADI NADIA
130 2018/2019 131 2018/2019

But et fonctionnalités d'un middleware:


•Offrir des services de configuration et de
gestion du système:
• Gestion de l'hétérogénéité
- Service d'annuaire pour connaître les
(Langage de programmation, systèmes
éléments présents et leurs états.
d'exploitation utilisés ...)
-Services de sécurité, de transaction, de
persistance...
•Offrir des abstractions de communication de
plus haut niveau:
•Gérer les différences d’implémentations des
-Appel d'une procédure à distance
services entre les différents systèmes
- Communication via une mémoire partagée
d’exploitation.
-Diffusion d'événements …
HADI NADIA HADI NADIA
132 2018/2019 133 2018/2019

22
28/03/2020

 Un middleware (intergiciel) permet la


Définition
Le middleware(intergiciel) est un ensemble de communication entre des clients et des serveurs
logiciels qui servent d’intermédiaires entre les ayant des structures et des implémentations
applications et les Ressources via le réseau. différentes.

Il offre des services de haut niveau liés aux


besoins de communication des applications
(sécurisation, transaction informatique, temps
réel,….)

Donc c’est une couche logicielle intermédiaire


entre les applications et le réseau permettant le
dialogue entre des applications hétérogènes.

HADI NADIA HADI NADIA


134 2018/2019 135 2018/2019

Le domaine de l'intergiciel est en évolution


permanente: Les Intergiciels «globaux» :
Plusieurs groupes de chercheurs et développeurs  Parmi les exemples les plus connus, on citera
travaillent à la création de divers middlewares. Globus Toolkit, NorduGrid, Glite, Unicore, . . .
certains cherchent à connecter des ressources de  Ces intergiciels sont libres, ne fonctionnant que
taille conséquente (clusters). dans le monde Unix, ont été développés autour de
Java et XML.
 d'autres s'attachent plus particulièrement à la  Ils offrent des interfaces permettant de dialoguer
récupération de cycles de calcul sur des machines avec les ordonnanceurs locaux des divers clusters
personnelles. de la grille et l'authentification des clients et des
 Dans ce qui suit, on Appellera noeuds de la grille s'effectue via des certificats SSL
• les premiers des intergiciels «globaux» (Secure Sockets Layer).
• les seconds des intergiciels «spécifiques»
HADI NADIA HADI NADIA
136 2018/2019 137 2018/2019

• Ce toolkit (kit d’outils) est gratuit, open-source et


L'intergiciel globus toolkit: fournit un ensemble de services de base (noyau)
nécessaires à la construction de grille de calcul
 C’est le plus répandu. Le projet est un tels que
effort de recherche multi-institutionnel -Authentification,
américain dont le but essentiel etait de - Localisation de ressources,
construire des grilles de calcul. -Allocation de ressources,
 Le projet Globus a débuté en 1997 et a - Réservation,
délivré sa première version en novembre - Configuration,
1998. - Communication, Accès aux fichiers,….
• Ces services ne sont pas tous nécessaires pour
une application, c'est le développeur
d'applications qui sélectionne les services dont il
a besoin.
HADI NADIA HADI NADIA
138 2018/2019 139 2018/2019

23
28/03/2020

L'intergiciel Unicore (uniform


Les intergiciels NorduGrid (développé en interface to computing ressources)
Scandinavie) et Glite (développé au  Démarré en 1997,c’est le concurrent européen open
source de Globus Toolkit. Il est supporté par un ensemble
CERN) : d'industriels et par le gouvernement allemand.
 Ils sont basés sur Globus, chacun d'eux  Il est entièrement écrit en Java et chaque module prend
comprend un choix de modules de Globus la forme d'un plugin.
associés à des modules spécifiques  Le client de la grille Unicore peut charger les plugins
souhaités à l'aide d'une interface graphique permettant
adaptés en vue d'une forme d'utilisation de soumettre des tâches et de les suivre.
particulière de la grille.  Il est un peu moins complet que Globus, mais son
 Il est à noter que Glite tend à devenir de installation est plus aisée.
 Notons de plus qu'Unicore est capable de dialoguer avec
plus en plus indépendant de Globus. Globus, mais que le contraire n'est pas encore possible
(l'implémentation d'une passerelle est toutefois prévue :
140
HADI NADIA
2018/2019
GridHADI
141
Interoperability
NADIA
2018/2019
Project

Les Intergiciels «spécifiques» :


 Cependant, les applications parallèles
 Ces intergiciels ont pour but de récupérer
des cycles de calcul sur un parc de (avec communications) nécessitant
machines personnelles. beaucoup de processeurs ne sont pas très
adaptées à une grille de machines
 Certains ne permettent d'exécuter que des personnelles, cette dernière étant très
tâches parallèlement indépendantes, alors instable.
que d'autres sont plus flexibles et
autorisent des communications entre les  En effet, les machines n'entrent dans le
processeurs. groupe de noeuds disponibles que pour
quelques heures et ceci de manière
totalement imprévisible.
HADI NADIA HADI NADIA
142 2018/2019 143 2018/2019

 InnerGrid est une plateforme logicielle


développée et distribuée par la société
 Compte tenu de cette instabilité, les GridSystem, qui permet, au sein d’un réseau
intergiciels «spécifiques» sont généralement hétérogène d’équipements informatiques, de
dotés d'une fonctionnalité leur permettant de bénéficier de la puissance de calcul
réallouer des tâches qui auraient été disponible, et de manière plus générale, des
interrompues. ressources informatiques inutilisées.
 Condor, un logiciel libre, c’est un
 Les principaux intergiciels non libres pouvant ordonnanceur évolué permettant la migration
être déployés sur un parc de machines de tâches en cas de «disparition» d'un noeud
hétérogènes sont GridMP et InnerGrid. Ils (il peut également être vu comme un
permettent de soumettre des tâches intergiciel).
parallèles .  Un exemple d'intergiciel libre développé pour
des applications parallèles et indépendantes
est : Xtremweb-CH.
HADI NADIA HADI NADIA
144 2018/2019 145 2018/2019

24
28/03/2020

XTREMWEB-CH:
 C’est un environnement P2P développé à A la différence des projets SETI@HOME,
partir du prototype Xtremweb de l ’université XTREMWEB-CH n’est pas dédier à une
d’ORSAY(France) dont les concepts sont application particulière mais configurable
ceux de P2P càd décentralisation des pour toute application.
traitements et des prises de décisions.
 XTREMWEB-CH est une plateforme Le système est construit à partir de
orientée calculs intensifs. standards et de logiciels libres (open
 Il permet à des centres de recherches, des source) tel que C++, java, PERL,
universités et des industriels d’installer et MYSQL(SGBD), APACHE(serveur web)…
d’utiliser leur propre système de calcul P2P
pour leurs travaux de recherches ou pour la
production de calculs.
HADI NADIA HADI NADIA
146 2018/2019 147 2018/2019

GLOBUS TOOLKIT
Introduction
• C’est un projet open source visant à créer les
requête Accepter
logiciels et les outils nécessaires pour la conception
Pc client et la mise en œuvre de grilles de calcul.
Workers
• Globus a été principalement développé aux
Résultat
Master Etats-Unis dans l’Argonne National Laboratory
Application
Xtrem-web Résultat par l’équipe de Ian Foster.
client
• Le travail sur Globus a commencé en 1997 et le
Schéma de l’architecture de Xtremweb projet est toujours actif.

HADI NADIA HADI NADIA


148 2018/2019 149 2018/2019

Principales fonctionnalités (Services) offertes par


Globus
• Le « Globus Toolkit » (ou boite à outils )est
formé d’un ensemble de composants. Son Service Nom Description
architecture modulaire permet d’apporter les
modifications et les améliorations d’une manière Gestion de ressources GRAM Allocation des ressources
rapide et efficace. et gestion des processus.

Communications NEXUS Services de communication


• Globus est devenu le standard utilisé dans les unicast et multicast.
projets de grilles de calcul c à d que de
Sécurité GSI Authentification et autorisation.
nombreuses entreprises l’ont adopté pour servir
comme base de leurs produits commerciaux
pour grilles de calcul. Information MDS Informations sur la structure et
l’état de la grille.

HADI NADIA HADI NADIA


150 2018/2019 151 2018/2019

25
28/03/2020

Conclusion CHAPITRE IV
 Donc Globus, constitue une boîte à outils permettant Les Systèmes P2P
la construction de grilles.
 Introduction, Définition et Objectif.
 Principes des P2P.
 Globus est un projet en constante évolution et
la communauté, qu’elle soit académique ou  Fonctionnement.
industrielle, y participe activement.  Différentes Applications du P2P.
 Différentes Architectures P2P.
 On y trouve des entreprises telles que IBM et
 Avantages & Inconvénients des Systèmes
Platform Computing qui tentent de créer des
produits commerciaux basés sur Globus plus
P2P.
complets et faciles à installer et à administrer.

HADI NADIA HADI NADIA


152 2018/2019 153 2018/2019

Introduction
Dans l'architecture client-serveur, la ressource
 Le pair à pair traduit de l’anglais Peer to Peer, demandée n'est disponible qu'en un point central du
généralement abréger P2P , est un modèle de réseau et les clients ne sont que des demandeurs de
réseaux informatique proche du modèle cette ressource.
client/serveur, où chaque client est aussi serveur
(c à d que chaque nœud est a la foie demandeur Dans le modèle pair à pair, il n'y a ni client ni
et fournisseur ). serveur mais des pairs. Tous les pairs peuvent
 Le P2P peut être centralisé (les connexions avoir la ressource et tous les pairs peuvent la
passant par un serveur intermédiaire) ou demander.
décentralisé (les connexions se faisant
directement). Donc on peut aussi dire que tous les noeuds du
 Il peut servir au partage de fichiers, au calcul réseau pair-à-pair sont à la fois client et serveur.
scientifique où à la communication.
HADI NADIA HADI NADIA
154 2018/2019 155 2018/2019

Définition : Objectifs:
 Le P2P se définit comme "un ensemble de  L’objectif des systèmes Peer-To-Peer (P2P) est de
mécanismes basés sur des normes ouvertes faire collaborer des milliers d’ordinateurs pour exécuter
permettant le partage de ressources informatiques un service donné ( échange de données, exécution
distribuées". Cette technologie repose sur des d’une application de calcul intensif, jeux etc).
processus disponibles à la fois en puissance de  Partage et réduction des coûts entre les différents
calcul et en capacité de stockage. pairs
 Les systèmes pair-à-pair permettent à plusieurs  Fiabilité et passage à l’échelle:
ordinateurs de communiquer via un réseau, de l’absence d’élément centralisé pour l’échange des
partager simplement des objets – des fichiers le plus données permet d’accroître la fiabilité en supprimant
souvent, mais également des flux multimédia tout point central de panne et d’améliorer le passage à
continus (streaming)-, le calcul réparti, la téléphonie l’échelle en évitant les goulots d’étranglement .
(Skype)… etc sur Internet.
HADI NADIA HADI NADIA
156 2018/2019 157 2018/2019

26
28/03/2020

Principe du P2P :
Fonctionnement :
• Les systèmes P2P permettent à plusieurs ordinateurs
(personnels) de communiquer via un réseau( de  Le P2P nécessite l’installation d’un logiciel spécifique
partager des fichiers, de faire du calcul réparti… sur sur chacun des ordinateurs et une sélection des
Internet) en permettant à tous les ordinateurs de jouer
le rôle de client et serveur. fichiers mis à la disposition des autres utilisateurs.
• Anonymat pouvant être assuré par certaines
applications, en utilisant par exemple des algorithmes
de routage qui rendent quasiment impossible le pistage  L’utilisateur charge et exécute un logiciel P2P de son
d’une requête . choix, (Gnutella, BitTorrent, FastTrack, Freenet
 L’utilisation d’un système P2P nécessite pour Project, Gnutella2, NEOnet, Skype, Google Talk,
chaque nœud , l’utilisation d’un logiciel particulier Bonjour, etc.), adapté à l’application désirée (voix
qui remplit à la fois les fonctions du client et du sous IP, messagerie instantanée, visioconférence,
serveur.
 Donc le P2P permet de facilité le partage
partage de fichier en Open Source, etc.).
d’informations.

HADI NADIA HADI NADIA
158 2018/2019 159 2018/2019

Les différentes Applications du P2P:


Il introduit l’adresse de son correspondant
 Le P2P ne s’est pas fait connaître en tant que
disposant du même logiciel ou valide l’adresse principe mais par les applications qui ont pu
recommandée par la version du logiciel. émergées selon ce nouveau modèle de réseau.
Dès que la connexion est établie avec l’un  Le P2P permet à plusieurs ordinateurs de
quelconque du groupe de correspondants (ou communiquer via un réseau, de partager
essaim), l’utilisateur choisit le nombre de simplement des objets des fichiers le plus souvent,
mais également des flux multimédia (streaming),
connexions souhaitées et le type de fichier désiré.
faire du calcul réparti, la téléphonie ( Skype )… etc
 Il indique les fichiers dont il dispose et qu’il sur Internet.
souhaite copartager avec les membres de
l’essaim.
HADI NADIA HADI NADIA
160 2018/2019 161 2018/2019

1. Partage de fichiers:
2. Calcul distribué :
 L’application la plus connue du P2P est le partage  Une autre application du P2P, destinée à la
de fichiers. L’arrivée des connexions à Internet à recherche mais moins répandue que le Partage de
haut débit (ADSL) sans limite de temps à contribué fichier est la possibilité pour les utilisateurs de mettre
au développement de ce type d’application. à disposition une partie de leur puissance de calcul .
 Chaque Internaute (nœud) est un pair et les
ressources sont des fichiers.  Les ordinateurs aujourd’hui sont tellement puissants
 Chacun peut donc partager ses fichiers et ,que la majeure partie du temps, une grande partie
télécharger ceux des autres. de leur processeur est disponible pour effectuer des
 Ces systèmes sont efficaces surtout pour l’échange calculs.
de gros volumes de données.
 Les applications les plus utilisées pour le partage
des fichiers sont Bit Torrent et Emule.

HADI NADIA HADI NADIA


162 2018/2019 163 2018/2019

27
28/03/2020

3. Applications parallèles
Exemple :
Consistent à utiliser les machines oisives (en repos)
Le projet « BOINC » à pu crée un gigantesque d’un réseau pour effectuer différents calculs (gros
parc informatique réparti dans le monde afin calcul découpé en petit calcul )répartis sur un
d’utiliser cette immense puissance de calcul totale certains nombre de pairs .
pour effectuer des calculs trop complexes réalisés
Il ya deux types d’applications parallèles:
dans un laboratoire.
Application de calcul intensif:
NB : Projet BOINC les utilisateurs particuliers
contribues à la recherche sur le repliement de Le même calcul avec des paramètres différents est
protéines (Application folding@home). exécuté sur les différents pairs.
Exemple: Seti@Home et Genome@Home
Application de calcul composontal:
Découper un même calcul en petites unités
indépendantes à exécuter sur différents pairs et
165 réassembler pour effectuer le calcul complet.
HADI NADIA HADI NADIA
164 2018/2019 2018/2019

Le diagramme suivant résume les différentes


applications des systèmes P2P
4. Applications de Collaboration:
Applications P2P
 Jeux Aa

 Messagerie instantanée (MSn, skype,…)


Partage de
Partage de Fichiers Collaborations
Con
PPPPP
Parallèles fichiers

C Calculs
Calculs intensifs
ca
composantals

Système de Extraction
ee de
Echange ss
fichiers et Filtrage
contenu

Applications In
Jeux
j partagées Messageries
Messa
instantanées
gerie
HADI NADIA HADI NADIA
166 2018/2019 167 2018/2019

Architectures : Première génération: Architecture centralisée


Depuis leur émergence à la fin des années 90, les •La première génération de réseaux pair à pair est
systèmes pair à pair ont beaucoup évolués et se sont l’architecture centralisée qui est très similaire à
diversifiés dans leur architecture. On peut classifier l’architecture client/serveur.
les réseaux pair à pair en trois générations : • Dans ce modèle, un serveur central stable indexe
tous les pairs du système et stocke les informations
Première génération : architecture centralisée. sur leur contenu.
Deuxième génération : architecture décentralisée. •Lors de la réception d’une requête d'un pair, le
Troisième génération : architecture hybride. serveur central choisit un autre pair dans son
répertoire qui assortit la demande. Ensuite, des
communications sont exécutées directement entre les
deux pairs. Exemple de cette génération l’Application
168
HADI NADIA
2018/2019 169
HADI NADIA
2018/2019 Seti@home

28
28/03/2020

•Bien que la communication de bout en bout et •Ce type de topologie est servie par un serveur
l’échange des fichiers se fassent d’une façon directe central qui sert d’annuaire.
entre les nœuds, le serveur facilite cette interaction •Les pairs se connectent au serveur central en
en gérant la recherche et en identifiant les nœuds donnant leur liste de ressources partagées et en
stockant les fichiers. demandant une ressource particulière.
•Cependant, la centralisation sur le serveur peut •Le serveur renvoie une liste de pairs contenant
engendrer un goulot d’étranglement et un point la ressource demandée.
faible du système : quand le nombre de pairs et de
requêtes augmente, il a besoin d’une machine très
•C’est l’architecture utilisé par le logiciel
puissante et d’une très grande bande passante ; si le NAPSTER.
serveur tombe en panne ou est attaqué par un
virus, alors tout le système s’effondre.
HADI NADIA HADI NADIA
170 2018/2019 171 2018/2019

Les avantages de cette architecture :


•Simplicité : pas de soucis de connexion au
bon serveur.
•La recherche de document est facilitée. Le
serveur maintient en effet un index des
ressources.
•Trafic réseau réduit. Les pairs ne
communiquent entre eux que s’ils ont quelque
chose à échanger.

HADI NADIA HADI NADIA


172 2018/2019 173 2018/2019

Inconvénients : • Sécurité:
•Vulnérabilité du serveur: sans serveur tout -une architecture P2P centralisée s'avère
disparait, il suffit de supprimer le serveur pour que particulièrement vulnérable:
l'intégralité du réseau soit inactif. -Elle ne propose qu'une seule porte d'entrée,
•Anonymat :Liste des clients donc pas son serveur centralisé, ce qui constitue le point
d’anonymat, chaque utilisateur est identifié sur le faible de tout le réseau.
serveur. (possibilité de surveillance). -Il suffit effectivement de bloquer ce serveur
•Ces systèmes offrent une faible performance pour déconnecter tous les utilisateurs et
de passage à l’échelle due à la limite de la stopper le fonctionnement de l'ensemble du
taille de la base de données du serveur et sa réseau.
capacité à répondre aux requêtes (saturation Exemple:
de la bande passante du serveur). NAPSTER – EDONKEY 2000- Audio Galaxy
HADI NADIA HADI NADIA
174 2018/2019 175 2018/2019

29
28/03/2020

Architecture centralisée à plusieurs  Il existe aussi un autre avantage dans ce


serveurs :( Amélioration de type d’architecture, en utilisant plusieurs
l’architecture centralisée) serveurs, ça permet de mieux répartir les
 Meilleur exemple des systèmes qui utilise cette
demandes de connexions et donc de
architecture est EDONKEY
limiter la chute de bande passante.
 Pour résoudre le problème de robustesse et
améliorer la qualité de connexion avec le serveur  Chaque serveur peut avoir accès aux
central, ce dernier est remplacé par un anneau ou un informations des clients connectés sur
cluster de serveurs. les autres serveurs, l’accès aux données
 Ceci permet d’éviter la chute du réseau si une panne partagées est donc totalement
se produit sur un serveur, car il y aura toujours un transparent pour les utilisateurs.
pointHADIdeNADIA
connexion aux serveurs. HADI NADIA
176 2018/2019 177 2018/2019

Architecture décentralisée (PUR)


[Gnutella, Freenet]

 Dans le modèle pur, il n’existe pas de serveur


centralisé. Les nœuds de ces réseaux remplissent
tous les mêmes tâches, ils jouent le rôle de serveur
et de client donc pas de coordination centrale.
 Dans ce type d’architecture le client se connecte à
plusieurs serveurs, le système est ainsi plus robuste
mais la recherche d’informations est plus difficile.
 Donc pas de serveur central, tous les pairs sont
égaux, ceci permet d’éviter la chute du réseau si
une panne se produit sur un serveur .
HADI NADIA HADI NADIA
178 2018/2019 179 2018/2019

 Pour obtenir une ressource, un Peer transmet une requête à ses


voisins qui la font passer à leurs voisins et ainsi de suite (par
inondation).
 Une fois la ressource trouvée, une connexion directe
s’établi entre le pair qui la recherche et celui qui la
possède.
 Ce mécanisme de recherche présente néanmoins une
limite, car une requête peut être stoppée, sans avoir
parcouru l’intégralité du réseau et retourne une réponse
négative.
 Contrairement aux réseaux centralisés, où il suffisait de se
connecter au serveur pour avoir accès aux informations, en
décentralisé il faut Rechercher l’information sur tous les nœuds
ensuite recevoir une réponse d’un nœud répondant aux
Architecture Décentralisée
180 HADI NADIA
2018/2019
critères. 181
HADI NADIA
2018/2019

30
28/03/2020

•Chaque pair peut communiquer directement


avec l’ensemble de ses voisins.
•Afin de rejoindre le réseau, un participant doit Avantages:
connaître au moins un membre qui deviendra son  La taille d'un tel réseau est théoriquement
premier voisin. infinie. IL n’y a pas de contraintes sur les
•Cela est fait soit par l’intermédiaire de pairs ressources d’un serveur central.
notoirement connus ou par une requête  Anonymat
broadcastée sur le réseau pour trouver les pairs
 Tolérance aux pannes (grand nombre de
déjà connectés.
noeuds pouvant répliquer les mêmes données)
• Le routage des requêtes et des réponses se fait
par inondation.  Adaptabilité (connexion et déconnection des
•Chaque nœud retransmet chaque requête à ses pairs sans conséquences)
voisins, l’évalue et y répond si possible.
HADI NADIA HADI NADIA
182 2018/2019 183 2018/2019

Inconvénients: Exemple: Gnutella


•Gros consommateurs de Bande (http://rfc-gnutella.sourceforge.net/)
passante.  La première version (version 0.4) date
de mars 2000, il fut développé en une
•Pas de garantie de succès, ni quinzaine de jours par Justin Frankell et
d'estimation de la durée des requêtes. Tom Pepper.
 Comme Gnutella repose sur une
architecture réseau complètement
•Pas de sécurité, ni de réputation (pas de
décentralisée, chaque noeud joue le rôle à
notion de qualité des pairs, ni des la fois de client et de serveur, d’où la
données fournies). notion de servent qui est la contraction
184
HADI NADIA
2018/2019 185
des mots serveur et client.
HADI NADIA
2018/2019

Architecture hybride : les réseaux •Ces réseaux utilisent des serveurs mais
Super-Peers ces serveurs sont suffisamment nombreux
 La topologie précédente part du principe que pour ne pas représenter un risque en cas
tous les pairs sont égaux. de disparition de l’un d’eux.
 Hors cela n’est en pratique pas vrai. Les pairs On distingue deux types de réseaux
ont de fortes différences en ce qui concerne leur hybrides :
bande passante, la capacité disque ou la 1-Les hybrides statiques :
puissance du processeur. Certains pairs décident manuellement de
 D’où l’idée de la création d’un modèle que l'on
faire tourner la partie serveur en plus de la
pourrait qualifier d'hybride entre le modèle
partie cliente du réseau.
client/serveur et le modèle P2P pur.
HADI NADIA (Exemple: Le réseau E-Donkey)
HADI NADIA
186 2018/2019 187 2018/2019

31
28/03/2020

2. Les hybrides dynamiques : P2P Hybride ou Super Peer


Dans certaines conditions, le logiciel
client décide de transformer le nœud en
serveur. (Exemple: Kazaa et Skype)
Principe:
Les nœuds disposant d'une bonne bande
passante sont organisés en P2P. Ce sont les
super-pairs.
les nœuds avec une faible bande passante
sont reliés en mode client/serveur à un super-
pair.
Chaque
HADI NADIA
super-pair dispose d'un index des HADI NADIA
188
ressources
2018/2019 de son cluster. 189 2018/2019

•Le modèle super noeud a pour but d’utiliser les


avantages des 2 types de réseaux(centralisé et
décentralisé). En effet sa structure permet de diminuer le
nombres de connexions sur chaque serveur, et ainsi
d’éviter les problèmes de bandes passantes.
•D’autre part le réseau de serveurs utilise un mécanisme
issu des réseaux décentralisés pour tenir à jour un
annuaire client et un index des fichiers à partir des
informations provenant des autres serveurs.
•Un serveur peut donc proposer à n’importe quel client
toutes les informations contenues sur le réseau.
•Le réseau n’est plus pollué par les trames de broadcast.
Mais la contrepartie est que l’anonymat n’est plus assuré.
HADI NADIA HADI NADIA
190 2018/2019 191 2018/2019

Avantages:
Classification des systèmes
-Tolérance aux pannes (pas de point de
informatiques:
défaillance unique).
-Réduction du trafic des requêtes. Systèmes Informatiques

-Le temps de découverte (d’information) est


réduit par rapport aux systèmes purement Systèmes
SS
centralisés SystèmesSdistribués
décentralisé.
Inconvénients:
Client/Serveur Pair à Pair
P
-Complexité à mettre en œuvre. cc

-Pas d’anonymat
Platp Hiérarchique
H PurPur h
Hybride
HADI NADIA HADI NADIA
192 2018/2019 193 2018/2019

32
28/03/2020

Avantages des systèmes P2P :


La Sécurité dans les systèmes P2P: Réduit la congestion du réseau et évite la
La plupart des questions de sécurité dans les création de goulots d’étranglement qui sont
systèmes P2P sont dues au partage omniprésent dans le cas d’un serveur central
d’informations. où y accède un très grand nombre de nœuds
Généralement les users recherchent :
clients.
 L’anonymat (pour éviter d’éventuelles
poursuites judiciaires).  les systèmes Peer to Peer sont naturellement
 Le Brouillage du protocole (pour éviter Les adaptés au passage à l’échelle bénéfique à la
filtrages du fournisseur d’accès Internet) fois en termes de puissance de traitement et
 Le chiffrement (On peut savoir qui je suis mais de capacité de stockage.
pas ce que je télécharge)
Les systèmes Peer to Peer peuvent exploiter
Afin d’assurer la sécurité des users, un ou
plusieurs de ces concepts sont mis en pratique leurs ressources et donc maximiser leur taux
194
dans
HADI NADIA
les applications P2P.
2018/2019 d’utilisation
195
HADI NADIA
2018/2019 et augmenter ainsi leur rendement.

 Offre la possibilité d’accomplir une tâche en moins de Permettent la répartition de la charge,


temps étant donné que les Peers sont liés directement l’accroissement de l’autonomie (chacun est
entre eux sans avoir de serveurs intermédiaires ( qui responsable des ressources qu’il partage) et
constituent habituellement les embouteillages sur les
l’agrégation des ressources, ce qui augmente
réseaux).
la performance des réseaux Peer to Peer.
 Résiste aux pannes des réseaux, car contrairement à
une architecture traditionnelle, où la défaillance d’un  les utilisateurs maintiennent le contrôle de
serveur centralisé rend indisponibles tous les services leurs ressources étant donné qu’ils peuvent
pour l’ensemble des nœuds. joindre ou quitter le système à tout moment.
 Fiabilité et robustesse: La distribution redondantes des
ressources et la décentralisation des systèmes Peer to
Peer a fait qu’ils n’aient pas de point d’échec unique,
donc plus de fiabilité et de robustesse.
HADI NADIA HADI NADIA
196 2018/2019 197 2018/2019

Problème de disponibilité des ressources. Une


Inconvénients: ressource peut disparaitre du réseau si le nœud qui
Etant complètement décentralisés, ces la fournit se déconnecte. Néanmoins, du fait de la
réplication implicite des ressources, ce problème ne
systèmes sont difficiles à administrer, en plus,
se pose que dans le cas des ressources rarement
une connaissance globale de l’état des demandées.
ressources est impossible. La plupart des utilisateurs de logiciels P2P ignorent
Ces systèmes présentent une très forte le danger présenté par l’hébergement de logiciels de
variation au court du temps. communication P2P sur leurs ordinateurs. Des
risques relatifs aux informations à caractère
Problème de sécurité lors des communications
professionnel, personnel, financier, intéressent les
entre pairs dans des réseaux différents. La voleurs d’identité. Des milliers de fraudeurs
sécurité est moins facile à assurer, compte tenu cherchent, grâce aux logiciels P2P, à obtenir de
des échanges non hiérarchisés. l’argent par la fraude informatique.
HADI NADIA HADI NADIA
198 2018/2019 199 2018/2019

33
28/03/2020

La pollution des réseaux P2P


L'objectif est de rendre ces réseaux gratuits et Ces spywares listent les sites Web consultés par les
utilisateurs pour mieux cibler les publicités qu’ils
anarchiques moins attractifs. peuvent recevoir.
Exemple
•Les systèmes d'échanges de fichiers peer-to-peer
Plusieurs entreprises proposent de polluer les réseaux peuvent facilement souffrir de l'anarchie générale.
d'échange de musique en particuliers en y incorporant L'anonymat aidant, les membres sont parfois tentés
des fichiers de moindre qualité ou incorrects. d'avoir des comportements malveillants tel que
La propagande la diffusion de virus ou le freeloading.
•Nul n’est sans savoir que les systèmes peer-to-peer Le freeloading
sont pour la plupart envahis par les bannières •Les réseaux peer-to-peer ne peuvent fonctionner
publicitaires même si à présent, des versions allégées correctement que s'il y a participation active de leurs
des logiciels sont proposées sans publicités. membres.
•Mais la propagande va plus loin : l’installation de
certains logiciels tels que Kazaa est accompagnée de
HADI NADIA HADI NADIA
l’installation
200 2018/2019 de logiciels espions (spyware). 201 2018/2019

Les virus
•Ainsi, une des pratiques les plus néfastes au Nombres de virus circulent sur les réseaux peer-to-
fonctionnement de ces réseaux est le peer et démontrent la vulnérabilité d'un réseau ou
freeloading. l'information circule librement.
•Les free-loaders sont les utilisateurs qui Exemple:
prennent sans donner, ils bénéficient des •Un virus de type cheval de Troie s'attaque aux
ressources partagées sans pour autant réseaux de type peer-to-peer. Baptisé Clicktilluwin, il
se propage lors de l'installation des logiciels clients de
partager les leurs.
Kazaa.
•Donc une grande quantité de bande passante •En février 2001, le réseau Gnutella a été infecté par
est dépensée pour acheminer les ressources un virus de type worm.
jusqu'à eux sans qu'il y ait de contribution. •qui est un virus capable de se répandre de pair en pair
sur un réseau.
•Ce virus n'avait pas d'effet néfaste pour les machines
HADI NADIA HADI NADIA mais polluait et ralentissait le réseau.
202 2018/2019 203 2018/2019

Caractéristiques des systèmes P2P L'avenir du P2P


Localisation des fichiers dans un En informatique, il est difficile de prédire
environnement distribué l'avenir, mais on peut prévoir quelques
Meta données ou index du réseau P2P tendances pour les P2P:
Libre circulation des fichiers entre Peers I Les P2P payants :
Capacité de connexion variable suivant •Actuellement, le contenu de tous les réseaux
les modèles P2P est accessible gratuitement.
 Echanges d’informations non sécurisés •Beaucoup d'entreprises essaient de mettre en
Peers non sûrs (Volatilité) place un système P2P qui permettrait de
Aucune vue globale du système rapporter de l'argent, mais le modèle
économique est difficile à trouver, et cela pose
de nombreux problèmes techniques.
HADI NADIA HADI NADIA
204 2018/2019 205 2018/2019

34
28/03/2020

II Les P2P anonymes : III Les P2P privés


•Dans les réseaux P2P classiques, il est possible de •Ce système consiste à créer des réseaux
savoir que telle adresse IP possède tel fichier. Cela P2P privés, uniquement entre amis. On ne
permet donc d'identifier théoriquement qui distribue ou peut accéder à un réseau P2P privé que sur
télécharge un fichier.
invitation.
•Les P2P anonymes sont différents: ils fonctionnent de
telle manière que vous ne savez pas qui distribue un •Chacun peut créer un réseau privé, et se
fichier (utilisation d'intermédiaires), et il est impossible relier à d'autres réseaux privés.
de savoir ce que vous téléchargez (tout est chiffré). •Toute personne extérieur au réseau P2P
•Pour le moment, ces réseaux sont expérimentaux et privé ne peut pas voir ce qu'il contient, ni ce
possèdent de nombreux inconvénients (lenteur, que les personnes échangent.
complexité, faible nombre de participants, mauvaise •Ils sont encore assez peu développés, mais
résistance aux attaques, etc.). Ex: Freenet, Mute,….
ils fonctionnent bien et ne possèdent pas les
GnuNet ...
206
HADI NADIA
2018/2019
inconvénients
207
HADI NADIA
2018/2019
des P2P anonymes.

Système Particularité Noeuds Caractéristiques


Système Particularité Noeuds Caractéristiques

-Exploite pleinement -Grands sites de -< 100 -Toutes les ressources -environ 100000
l’intégralité des ressources (PC) sont égales
Grille de calcul -stables Systèmes P2P PC ( -Volatiles
(serveurs et pc). -Les opérations se
calcul -Clusters -Identification Windows, -pas d’identité
-Un serveur centralisé font à parité de pair à
individuelle individuelle
ordonnance les calculs. -Parfois des pair. Linux)
-Confiance
-simplifie les contrôles de Grilles de calculs -l’ajout de nouveaux -pas de confiance
sécurité et la mise à jour des pairs améliore le
données et des logiciels. fonctionnement du
réseau.
-Le serveur risque de ne pas
supporter la charge si trop de -Le réseau continu à
clients veulent communiquer fonctionner même si
avec. plusieurs pairs
quittent le réseau.
-Si le serveur n’est plus
disponible, panne de tous le
système.
HADI NADIA HADI NADIA
208 -Les Coûts de
2018/2019 mise en place et 209 2018/2019
de maintenance sont élevés.

35

Vous aimerez peut-être aussi