Vous êtes sur la page 1sur 44

Virtualisation & Cloud

Computing

Mehrez Ben Soltan


S/D de la Technologie de l’information et de la
communication
Plan
2

 Définitions
 SAN
 NAS
 RAID
Virtualisation de stockage
3

 Dans tout projet de virtualisation se pose


nécessairement la question du stockage.

 La virtualisation de stockage est un procédé qui va


séparer la représentation logique et la réalité
physique de l'espace de stockage.
 Son but est de faire abstraction des périphériques de
stockage utilisés et des interfaces qui leur sont associées
(SATA, SCSI, ...) afin de limiter l'impact des modifications
structurelles de l'architecture de stockage.
Virtualisation de stockage
4

 L’hyperviseur se charge de fournir à chaque système


virtualisé un espace de stockage: placé sur un disque
local, un réseau de stockage ou un autre serveur.
Virtualisation de stockage
6

 La virtualisation de stockage permet de :


 Ajouter un périphérique de stockage supplémentaire à
chaud, sans interruption des services
 Regrouper des unités de disques durs de différents
constructeurs, vitesses et tailles
 Réallouer dynamiquement de l’espace de stockage:
 un serveur nécessitant un espace de stockage supplémentaire
pourra rechercher des ressources non allouées sur le disque
logique.
 Inversement, un serveur nécessitant moins d’espace de stockage
pourra libérer cet espace et le rendre disponible pour d’autres
serveurs.
Virtualisation de stockage
7
DAS (Direct Attached Storage)
8
Réseau de stockage SAN
9

Réseau de stockage SAN (Storage Area Network),


 SAN est un réseau spécialisé pour mutualiser des ressources
de stockage.
 le SAN est un réseau de stockage ouvert et évolutif qui
relie, à des périphériques de stockage, des serveurs reliés
au réseau d’entreprise.
 Un SAN permet aux serveurs un accès partagé à une ferme
de stockage commune.
 Chaque serveur voit l'espace disque d'une baie SAN auquel
il a accès comme son propre disque dur.
Réseau de stockage SAN
10

 Dans le cas du SAN, les baies de stockage sont


directement accessibles en mode bloc par les VMs.

https://www.youtube.com/watch?v=37Qhsz6qojs
Réseau de stockage SAN
 Caractéristiques :
 Augmenter la capacité de stockage des serveurs particuliers
 Accès multiples et directs aux mêmes données
 Séparation de lieu (serveur et sauvegarde)
 Intégration des solutions back up (tape libraries)

 Avantages :
 Haute disponibilité des données
 Redondance des données
 Stockage évolutif
 Allocation dynamique de l’espace disque

 Limites
 Coût élevé.
Réseau de stockage SAN
13
Réseau de stockage SAN
 Composé de :
 Serveurs

 Groupes de disques (Storage Array)


 Fibre Channel Switch/Hub, SCSI, iSCSI: pour la connexion
entre les serveurs et les SA
 Storage Array (SA)
 Groupe de disques magnétiques en RAID (Redundant Array
of Independant Disks)
SAN : Produits
 Sun
 StoreEdge Series
 IBM
 FAStT200 storage server, FAStT400 storage server, …
 EMC2
 EMC CLARiiON Midrange Storage Systems, …
 HP
 Disk System 2100…2405, HP Surestore series, …
 Autres
 Hitachi, Broadcom,…
Serveur de stockage en réseau NAS
16

Serveur de stockage en réseau NAS


 Un NAS (Network Attached Storage) est un serveur de stockage
à part entière pouvant être facilement attaché au réseau de
l'entreprise afin de servir de serveur de fichiers et fournir un
espace de stockage tolérant aux pannes.

 Un NAS posséde:
 Son propre SE dédié à la gestion de données,
 Son propre logiciel de configuration,
 Sa propre adresse IP (statique) spécialement configuré pour la gestion
d’un espace de stockage à destination de clients hétérogènes
 Un NAS permet de répondre aux exigences de stockage pour un
nombre important de VM.
Serveur de stockage en réseau NAS
17

https://www.youtube.com/watch?v=37Qhsz6qojs
Serveur de stockage en réseau NAS
18

 Les serveurs de stockage en réseau NAS permettent le


partage d’un même fichier entre de multiples serveurs,
VM et clients dans un environnement hétérogène via le
réseau Ethernet de l’entreprise.
 Le plus souvent un réseau local Ethernet, mais parfois au
travers un réseau étendu de type WAN.
 L’utilisation d’un NAS est adaptée aux applications
faisant appel au service de fichiers comme
l’hébergement de sites WEB ou encore les serveurs de
fichiers ou de messagerie.
Serveur de stockage en réseau NAS
19

Avantage :
 Son administration est simplifié: Un NAS se configure et se
gère généralement depuis une interface WEB depuis
laquelle sera proposée un système de gestion des accès, de
gestion de quotas, de réplication, etc.
 Coût faible par rapport au SAN

Inconvénient :
 Stockage NAS ne peut envoyer que des fichiers, et non des
blocs de données.
 Utilise le réseau IP de l’entreprise donc risque d’engendrer
des congestions particulièrement pour de gros transferts de
données.
IP SAN vs FC SAN
Description IP SAN FC SAN

Network speed 1 Gbit/s, 10 Gbit/s, 40 Gbit/s 4 Gbit/s, 8 Gbit/s, 16 Gbit/s


Network
Existing IP networks Dedicated FC network and HBA card
architecture
Transmission Limited by the transmission distances
No limit in theory
distance of optical fibers
Management and Simple operations like those with IP Complex techniques and
maintenance devices management
Compatible with all IP network
Compatibility Poor compatibility
devices
1 Gbit/s is the current mainstream; 10 High transmission and read/write
Performance
Gbit/s is emerging. performance
High purchase costs (FC switches,
HBA cards, FC disk arrays, etc.) and
Cost Low purchase and maintenance costs maintenance costs (personnel
training, system configuration and
monitoring)
Built-in local and remote disaster High hardware and software costs for
DR
recovery capability at low costs DR
Security Relatively low High
Tête de NAS
21

 NAS HEAD : Groupement de machine(s) (cluster)


offrant les données persistantes (SAN) à l’extérieur à
travers le protocole TCP/IP
 Caractéristiques :
 Haute disponibilité (High Availability)
 Groupes redondantes de disques (redundant storage array)
 Serveurs redondants (redundant server)
 Redémarrage automatique et disponible en quelques minutes
 Haute performance (High Performance)
 Système d’exploitation optimisé I/O pour serveurs de fichiers
 Connexion multiple entre Serveurs et SA (distribution de charge)
 Cache sur SA
Tête de NAS
22
DAS vs SAN vs NAS
23
Storage Array : RAID
 RAID signifie Redundant Array of Independent Disks, ce
qui veut dire littéralement regroupement redondant de
disques indépendants.
 Il s’agit de mettre en grappe plusieurs disques
durs pour en obtenir une partition logique unique.
 En clair, à partir de plusieurs disques durs physiques, on
obtient un seul espace visible par le système
d’exploitation.
 https://www.youtube.com/watch?v=WqGeTOt6A0Q&t
=57s
Pourquoi le RAID ?
26

 Proposé en 1987 par l’université de Berkeley


 3 axes d’amélioration de l’existant:
 Coût

 Performances

 Disponibilité des données


 Qui sont difficiles à concilier en même temps
Performances : le data stripping
27

bloc : bloc de
bloc 1
données
Disque bloc 2 destiné à être
logique stocké sur un
bloc 3 disque physique
bloc 4

Stripe :
bloc 1 bloc 2 bloc 3 ensemble
Disques de blocs
physiques bloc 4 de même
niveau

 Le système voit un disque logique, dont les blocs de données sont en fait répartis
sur plusieurs disques physiques.
 On bénéficie alors de la parallélisation des accès, aussi bien en écriture qu’en
lecture.
 Par contre, en cas de panne de l’un des disques? Donc risque d’indisponibilité
Disponibilité : redondance des données
29
par duplication (mirroring)

bloc 1
Disque bloc 2
logique
bloc 3

bloc 4

bloc 1 bloc 1
Disque miroir
Disques
physiques bloc 2 bloc 2
bloc 3 bloc 3

bloc 4 bloc 4

 Principe du miroir
 Les données sont dupliquées intégralement sur un 2ème
disque.
Disponibilité : redondance des données
30
par contrôle de parité

bloc 1
Disque
logique bloc 2
bloc 3

bloc 4

bloc 1 bloc 2 bloc 3 bloc P

bloc 4

Disques physiques

bloc_P = bloc_1 XOR bloc_2 XOR bloc_3

Les propriétés du ou exclusif font que cette relation est équivalente à :


Bloc_1 = bloc_P XOR bloc_2 XOR bloc_3 et ainsi de suite.

On est donc capable de reconstituer l’information de n’importe quel disque à partir


de celle des autres.
Contrôle de parité : reconstitution
31

bloc_1 = 01011101
XOR bloc_2 = 11101011
XOR bloc_3 = 01010101
--------------------------------
= bloc_P = 11100011

Si le disque 2 tombe, on reconstruit l’information perdue


à l’aide des 2 autres disques et du disque de parité :

bloc_1 = 01011101
XOR bloc_3 = 01010101
XOR bloc_P = 11100011
--------------------------------
= bloc_2 = 11101011
Inconvénients du contrôle de parité
32

 On ne peut perdre qu’un seul disque


 Dans le cas de la mise à jour il faut modifier la parité :
Exemple : bloc_1 est modifié en bloc_1’. Il faut :

Lire l’ancienne valeur de bloc_1


Lire l’ancienne parité
Calculer la nouvelle parité = bloc_1 XOR bloc_1’ XOR bloc_P
Écrire la nouvelle parité
Écrire la nouvelle valeur de bloc 1

On doit faire 4 accès disques !


Les modèles de base sans parité
34

RAID 0 (data stripping)

RAID 0 : c ’est simplement le data striping.


Uniquement amélioration des performances.
Aucune sécurisation.
 Surcoût 0

RAID 1 : c ’est simplement le miroir.


RAID 1 (mirroring)  Disponibilité
 Améliore les performances de lecture (disque
le + rapide répond en premier).
 Dégrade légèrement les temps de réponse en
écriture (attente du disque le + lent).
 Surcoût 100 % (doublement de la capacité)
Les modèles de base à parité tournante
36

RAID 5

Parité
tournante

La parité est écrite alternativement sur l’ensemble des disques.


Conçu au départ pour les applications transactionnelles en lecture, donne de bons
résultats aussi dans le cas de grosses E/S.
 Performance moins bonne en écriture à cause de la parité
Surcoût 1/nb disques.
On peut perdre un seul disque à la fois.
RAID 10 (0+1)
37

Performances du RAID 0 alliées à la disponibilité du RAID 1


 On peut perdre jusqu‘à trois disques sur l’exemple (nombre de disques miroirs)
 Surcoût 100 % (doublement de la capacité)
RAID 50 (0+5)
38

 RAID5 avec utilisation de plus de disques et une meilleure


disponibilité.
Exemples de domaines d’application
40

 RAID0:
 Applications utilisant de gros fichiers sans besoin de haute disponibilité,
 Hautes performances en lecture/écriture pour données non critiques (fichiers
temporaires…)
 RAID1:
 Applications nécessitant une quantité limitée de donnés mais avec un besoin de haute
disponibilité,
 Besoin de bonnes performances en lecture et écriture pour données très sensibles
exemple: Journaux de bases de données.
 RAID5: Applications nécessitant des taux E/S élevés sur des faibles volumes
 RAID10:
 Applications avec besoins forts en termes de performance et de disponibilité
 Haute performance en lecture et écriture pour données très sensibles.
 RAID50: Base de données de grandes tailles
Diverses configurations matérielles
42

Cluster

RAID interne

SAN
Baie externe
Annexe: Quelques
solutions de virtualiation

43
XEN
44

 Xen est une solution de virtualisation open source


développée initialement par le département informatique
de l’Université́ de Cambridge.

 Son développement est aujourd’hui activement sponsorisé


par Citrix, qui a racheté l’éditeur initial XenSource.

 Citrix distribue une version commerciale de Xen, nommée


Citrix XenServer, particulièrement adaptée à la
virtualisation des OS Microsoft Windows et Linux .
XEN
45

 Elle est dotée d’une interface d’administration avancée,


et d’un accès au support technique. De grandes sociétés
comme IBM ont contribué au développement de Xen, et
de gros efforts ont été faits par Citrix pour assurer une
compatibilité parfaite avec Windows.
VMWare
46

 VMware vSphere est un logiciel d’infrastructure de


Cloud computing de l’éditeur VMware, c’est un
hyperviseur de type 1 (Bare Metal), basé sur
l’architecture VMware ESXi.
 VMware vSphere nécessite une configuration matérielle
restreinte précisée dans le guide de comptabilité
VMware.
VMWare
47

 La gestion du serveur hôte peut se faire via plusieurs


possibilités : par le navigateur Web avec une connexion
directe, par une console cliente avec une connexion
directe ou par un outil de gestion centralisée nommé
VMware vCenter Server qui permet d’administrer
l’ensemble des machines virtuelles, des hôtes physiques,
de leurs ressources et des options de l’environnement
(High Availability, Storage vMotion, Distributed Resource
Scheduler, Fault Tolerance) depuis une seule console.
OpenVZ
48

 Une des solutions les plus avancées et matures dans le


domaine de l’isolation est OpenVZ. Ce produit se présente
sous la forme d’un patch pour le noyau Linux, et d’un
ensemble d’outils d’administration. Le patch du noyau
permet à un système GNU/Linux de gérer des contextes
virtualisés.
 Le projet OpenVZ fournit aux systèmes GNU/Linux une
méthode de virtualisation. Cette virtualisation se situe au
niveau du noyau de l’OS. Cela rend possible l’exécution de
multiples instances d’OS GNU/Linux sur la même machine.
Ces instances fonctionnant de façon complètement sécurisées
et partageant intelligemment les ressources du serveur hôte.
OpenVZ
49

 Les outils d’administration permettent de créer,


d’instancier, et de contrôler les environnements virtuels.
Rappelons que la technologie d’isolation ne permet
d’exécuter que des serveurs virtuels Linux sur un hôte
OpenVZ, même si ces serveurs peuvent être de
distributions différentes.
Openstack
50

 OpenStack est un ensemble de logiciels permettant de


déployer des open source infrastructures de cloud
computing (IaaS).
 La technologie possède une architecture modulaire
composée de plusieurs projets corrélés (Nova, Swift,
Glance...) qui permettent de contrôler les différentes
ressources des machines virtuelles telles que la puissance
de calcul, le stockage ou encore le réseau inhérents au
centre de données sollicité.

Openstack
51

 OpenStack : Architecture & Composants


 OpenStack possède une architecture modulaire qui
comprend de nombreux composants.
Comparatif entre solutions
52

 http://socialcompare.com/fr/comparison/system-
virtual-machines-software