Vous êtes sur la page 1sur 62

Disponibilit vSphere

ESXi 5.5
vCenter Server 5.5

Ce document prend en charge la version de chacun des produits


rpertoris, ainsi que toutes les versions publies par la suite
jusqu'au remplacement dudit document par une nouvelle
dition. Pour rechercher des ditions plus rcentes de ce
document, rendez-vous sur :
http://www.vmware.com/fr/support/pubs.

FR-001254-00

Disponibilit vSphere

Vous trouverez la documentation technique la plus rcente sur le site Web de VMware l'adresse :
http://www.vmware.com/fr/support/
Le site Web de VMware propose galement les dernires mises jour des produits.
Nhsitez pas nous transmettre tous vos commentaires concernant cette documentation ladresse suivante :
docfeedback@vmware.com

Copyright 20092013 VMware, Inc. Tous droits rservs. Copyright et informations sur les marques.

VMware, Inc.
3401 Hillview Ave.
Palo Alto, CA 94304
www.vmware.com

VMware, Inc.
100-101 Quartier Boieldieu
92042 Paris La Dfense
France
www.vmware.com/fr

VMware, Inc.

Table des matires

propos de Disponibilit de vSphere 5

1 Continuit d'activit et minimisation des interruptions de service 7


Rduire les interruptions de service prvues 7
Prvenir les interruptions de service imprvues 8
vSphere HA assure une reprise d'activit rapide suite une interruption
vSphere Fault Tolerance assure la continuit de la disponibilit 9

2 Crer et utiliser des clusters vSphere HA 11

Fonctionnement de vSphere HA 11
Contrle d'admission vSphere HA 20
Liste de contrle de vSphere HA 27
Crer un cluster vSphere HA 28
Personnaliser le comportement de vSphere HA 32
Meilleures pratiques pour les clusters vSphere HA 35

3 Assurer Fault Tolerance des machines virtuelles 41

Fonctionnement de Fault Tolerance 42


Utiliser Fault Tolerance avec DRS 43
Cas d'utilisation de Fault Tolerance 43
Liste de vrification de Fault Tolerance 44
Interoprabilit de Fault Tolerance 45
Prparer votre cluster et vos htes Fault Tolerance 47
Assurer Fault Tolerance des machines virtuelles 50
Consulter les informations sur les machines virtuelles Fault Tolerant dans vSphere Web Client
Pratiques d'excellence pour Fault Tolerance 56
Recommandations de configuration de vSphere Fault Tolerance 58

Index

VMware, Inc.

54

59

Disponibilit vSphere

VMware, Inc.

propos de Disponibilit de vSphere

Disponibilit vSphere prsente les solutions permettant d'assurer la continuit d'activit, et explique

notamment comment mettre en place vSphere High Availability (HA) et vSphere Fault Tolerance.

Public cibl
Ces informations sont destines tous ceux qui veulent assurer la continuit d'activit l'aide des solutions
vSphere HA et Fault Tolerance. Les informations fournies dans ce manuel sont destines aux
administrateurs systme Windows ou Linux expriments qui connaissent le fonctionnement de la
technologie des machines virtuelles et des centres de donnes.

VMware, Inc.

Disponibilit vSphere

VMware, Inc.

Continuit d'activit et minimisation


des interruptions de service

Qu'elles soient prvues ou imprvues, les interruptions de service engendrent des cots considrables.
Cependant les solutions assurant des niveaux levs de disponibilit sont gnralement chres et difficiles
implmenter et grer.
Les logiciels de VMware assurent facilement et moindre cot un niveau lev de disponibilit pour les
applications importantes. Avec vSphere, les entreprises peuvent augmenter facilement le niveau de
disponibilit de base assur pour toutes les applications et fournir des niveaux levs de disponibilit plus
facilement et moindre frais. Avec vSphere, vous pouvez :
n

Assurer une disponibilit leve quels que soient les matriels, le systme d'exploitation et les
applications.

Rduire les interruptions de service prvues pour les oprations de maintenance ordinaires.

Assurer la restauration automatique en cas de dysfonctionnement.

vSphere permet de rduire les interruptions de service prvues, d'viter des interruptions de service
imprvues et de rcuprer rapidement suite des interruptions.
Ce chapitre aborde les rubriques suivantes :
n

Rduire les interruptions de service prvues , page 7

Prvenir les interruptions de service imprvues , page 8

vSphere HA assure une reprise d'activit rapide suite une interruption , page 8

vSphere Fault Tolerance assure la continuit de la disponibilit , page 9

Rduire les interruptions de service prvues


Les interruptions de service prvues reprsentent gnralement plus de 80 % des interruptions de service
d'un centre de donnes. La maintenance matrielle, la migration des serveurs et les mises niveau des
microprogramme imposent une interruption du service des serveurs physiques. Pour rduire les
rpercussions de ces interruptions de service, les entreprises doivent reporter la maintenance des plages
horaires peu pratiques et difficiles planifier.
vSphere permet aux entreprises de rduire considrablement les interruptions de service prvues. Comme
les charges de travail d'un environnement vSphere peuvent tre dplaces dynamiquement sur diffrents
serveurs physiques sans interruptions de service, la maintenance des serveurs peut tre effectue sans exiger
une interruption des applications et du service. Avec vSphere, les entreprises peuvent :
n

liminer les interruptions de service pour les oprations de maintenance ordinaires.

liminer les plages de maintenance prvues.

excuter la maintenance tout moment sans perturber les utilisateurs et les services.

VMware, Inc.

Disponibilit vSphere

vSphere vMotion et la fonctionnalit Storage vMotion de vSphere permettent aux entreprises de rduire les
interruptions de service prvues car les charges de travail d'un environnement VMware peuvent tre
dplaces dynamiquement sur d'autres serveurs physiques ou sur d'autres stockages sous-jacents sans
interruption de service. Les administrateurs peuvent effectuer plus rapidement des oprations de
maintenance entirement transparentes, sans devoir planifier des plages de maintenance peu pratiques.

Prvenir les interruptions de service imprvues


Alors qu'un hte ESXi offre une plate-forme stable pour excuter des applications, les entreprises doivent
aussi se protger contre les interruptions de service imprvues provoques par des dfaillances matrielles
ou logicielles. vSphere renforce considrablement les capacits des infrastructures des centres de donnes,
ce qui contribue viter les interruptions de service imprvues.
Ces capacits vSphere font partie d'une infrastructure virtuelle et sont transparentes pour le systme
d'exploitation et les applications excutes sur les machines virtuelles. Ces fonctions peuvent tre
configures et utilises par toutes les machines virtuelles sur un systme physique, ce qui rduit le cot et la
complexit de la prvision d'une disponibilit suprieure. Des fonctions cls de disponibilit sont intgres
vSphere :
n

Stockage partag. limine des points de panne isols en stockant les fichiers des machines virtuelles
dans des espaces de stockage partags, comme Fibre Channel ou iSCSI SAN, ou encore NAS. Il est
possible de faire appel aux fonctions de rplication et de mise en miroir SAN pour conserver les copies
mises niveau des disques virtuels dans des sites de reprise.

Association d'interfaces rseau. Assure la tolrance aux dfaillances des adaptateurs rseau
individuelles.

chemins multiples du stockage. Assure la tolrance aux dfaillances des emplacements de stockage.

En outre, les fonctions vSphere HA et Fault Tolerance peuvent rduire ou liminer les interruptions de
service imprvues en assurant respectivement la reprise rapide de l'activit suite une interruption et la
continuit de la disponibilit.

vSphere HA assure une reprise d'activit rapide suite une


interruption
vSphere HA a recours plusieurs htes ESXi configurs en cluster pour assurer une reprise d'activit rapide
suite une interruption et une haute disponibilit moindres cots pour les applications excutes sur des
machines virtuelles.
vSphere HA protge la disponibilit des applications de la manire suivante :
n

Il protge contre une dfaillance du serveur en redmarrant les machines virtuelles sur d'autres htes
au sein du cluster.

Il protge contre les dfaillances des applications en surveillant en permanence une machine virtuelle et
en la rinitialisant en cas de dtection d'une dfaillance.

Contrairement aux autres solutions de mise en cluster, vSphere HA fournit l'infrastructure ncessaire la
protection de toutes les charges de travail :

Il n'est pas ncessaire d'installer des logiciels spciaux dans l'application ou sur la machine virtuelle.
Toutes les charges de travail sont protges par vSphere HA. Une fois que vSphere HA est configur,
aucune action n'est requise pour protger de nouvelles machines virtuelles. Elles sont protges
automatiquement.

Vous pouvez associer vSphere HA vSphere Distributed Resource Scheduler (DRS) pour assurer la
protection contre les pannes, et pour rpartir la charge entre tous les htes d'un cluster.

VMware, Inc.

Chapitre 1 Continuit d'activit et minimisation des interruptions de service

vSphere HA prsente plusieurs avantages face aux solutions de basculement habituelles :


Configuration minimale

Quand un cluster vSphere HA a t configur, toutes les machines virtuelles


du cluster sont incluses dans le basculement sans configuration
supplmentaire.

Cots et configuration
matrielle rduits

La machine virtuelle fait office de conteneur portable pour les applications et


elle peut tre dplace parmi les htes. Les administrateurs vitent ainsi de
reproduire les configurations sur plusieurs machines. Lorsque vous utilisez
vSphere HA, vous devez disposer de suffisamment de ressources pour le
basculement des htes que vous souhaitez protger avec vSphere HA.
Toutefois, le systme vCenter Server gre automatiquement les ressources et
configure les clusters.

Disponibilit accrue des


applications

Une application excute au sein d'une machine virtuelle a accs une


disponibilit accrue. Comme la machine virtuelle peut rcuprer d'une
dfaillance matrielle, toutes les applications qui dmarrent au moment de
l'initialisation ont une disponibilit accrue sans accrotre la charge de calcul,
mme si l'application n'est pas en cluster. En surveillant et en rpondant aux
signaux de pulsation de VMware Tools et en redmarrant les machines
virtuelles qui ne rpondent plus, elle assure galement une protection contre
les dfaillances du systme d'exploitation client.

Intgration DRS et
vMotion

En cas de dfaillance d'un hte et du redmarrage des machines virtuelles


sur d'autres htes, DRS peut fournir des recommandations de migration ou
faire migrer les machines virtuelle en quilibrant les ressources alloues. Si
l'hte source et/ou l'hte de destination d'une migration sont dfaillants,
vSphere HA peut faciliter la rcupration suite la dfaillance.

vSphere Fault Tolerance assure la continuit de la disponibilit


vSphere HA assure un niveau de protection de base pour vos machines virtuelles en les redmarrant en cas
de dfaillance de l'hte. vSphere Fault Tolerance assure un niveau de disponibilit suprieur en permettant
aux utilisateurs de protger les machines virtuelles contre une dfaillance de l'hte sans perte de donnes,
de transactions ou de connexions.
Fault Tolerance assure la continuit de la disponibilit en vrifiant que les tats des machines virtuelles
principales et secondaires demeurent identiques tout au long de l'excution des instructions de la machine
virtuelle. Ceci s'effectue l'aide de la technologie VMware vLockstep sur la plate-forme de l'hte ESXi.
vLockstep s'en assure en faisant excuter des squences d'instructions x86 identiques aux machines
virtuelles principales et secondaires. La machine virtuelle principale capture les entres et vnements (en
provenance du processeur et destination des priphriques d'E/S virtuels) et les relit sur la machine
virtuelle secondaire. La machine virtuelle secondaire excute les mmes instructions que la machine
virtuelle principale, alors qu'une seule image de machine virtuelle (la machine virtuelle principale) excute
toute la charge de travail.
Si l'hte faisant fonctionner la machine virtuelle principale ou l'hte faisant fonctionner la machine virtuelle
secondaire est dfaillant, un basculement immdiat et transparent se produit. L'hte ESXi en tat de marche
devient la machine virtuelle principale sans qu'il y ait perte des connexions rseau ou des transactions en
cours. Le basculement transparent vite toute perte de donnes et assure le maintien des connexions rseau.
En cas de basculement transparent, une nouvelle machine virtuelle est raffecte et la redondance est
rtablie. Le processus est entirement transparent et automatis et se produit mme en cas d'indisponibilit
du vCenter Server.

VMware, Inc.

Disponibilit vSphere

10

VMware, Inc.

Crer et utiliser des clusters vSphere


HA

Les clusters vSphere HA permettent un ensemble d'htes ESXi de travailler conjointement, de faon
fournir aux machines virtuelles, en tant que groupe, un niveau de disponibilit suprieur celui d'un seul
hte ESXi. Si vous envisagez de crer et d'utiliser un nouveau cluster vSphere HA, les options choisies
affectent la manire dont ce cluster ragit aux pannes des htes ou des machines virtuelles.
Avant de crer un cluster vSphere HA, vous devez savoir comment vSphere HA identifie les pannes et
l'isolation de l'hte et comment il ragit ces situations. Vous devez aussi connatre le mode de
fonctionnement du contrle d'admission de faon tre capable de choisir les rgles qui rpondent vos
besoins de basculement. Aprs avoir cr un cluster, vous pouvez en personnaliser le comportement avec
des attributs avancs et en optimiser les performances en suivant les recommandations.
REMARQUE Un message d'erreur peut apparatre lorsque vous essayez d'utiliser vSphere HA. Pour plus
d'informations sur les messages d'erreur relatifs vSphere HA, consultez l'article de la base de
connaissances VMware sur http://kb.vmware.com/kb/1033634.
Ce chapitre aborde les rubriques suivantes :
n

Fonctionnement de vSphere HA , page 11

Contrle d'admission vSphere HA , page 20

Liste de contrle de vSphere HA , page 27

Crer un cluster vSphere HA , page 28

Personnaliser le comportement de vSphere HA , page 32

Meilleures pratiques pour les clusters vSphere HA , page 35

Fonctionnement de vSphere HA
vSphere HA assure la disponibilit leve des machines virtuelles en les rassemblant avec leurs htes
respectifs dans un cluster. Les htes du cluster sont surveills et, en cas de dfaillance, les machines
virtuelles d'un hte dfectueux sont redmarres sur d'autres htes.
Lorsque vous crez un cluster vSphere HA , un seul hte est automatiquement slectionn en tant qu'hte
matre. L'hte matre communique avec vCenter Server et surveille l' tat de protection de toutes les
machines virtuelles et des htes esclaves. Diffrents types de dfaillances d'htes sont possibles, et l'hte
principal doit les dtecter et les traiter de faon adapte. L'hte principal doit faire la diffrence entre un
hte dfaillant et un hte se trouvant dans une partition de rseau ou rseau isol. L'hte principal utilise le
signal de pulsation de banques de donnes pour dterminer le type de panne.

VMware, Inc.

11

Disponibilit vSphere

Hte matre et htes esclaves


Lorsque vous ajoutez un hte un cluster vSphere HA, un agent est transfr vers l'hte et configur pour
communiquer avec les autres agents du cluster. Chaque hte du cluster fonctionne en tant qu'hte principal
(matre) ou hte secondaire (esclave).
Lorsque vSphere HA est activ pour un cluster, tous les htes actifs (ceux qui ne sont pas en mode standby
ou maintenance, ou qui ne sont pas dconnects) participent au choix de l'hte principal du cluster. L'hte
contenant le plus grand nombre de banques de donnes a l'avantage pour tre choisi. Habituellement, il
n'existe qu'un hte principal par cluster, tous les autres sont des htes secondaires. Si l'hte principal est
dfaillant, ferm, mis en mode standby ou limin du cluster, un nouvel hte principal doit tre choisi.
L'hte principal d'un cluster a un certain nombre de responsabilits :
n

Surveiller l'tat des htes secondaires. Si un hte secondaire est dfaillant ou devient inaccessible, l'hte
principal identifie les machines virtuelles qui doivent tre redmarres.

Surveiller l'tat d'alimentation de toutes les machines virtuelles protges. Si une machine virtuelle est
dfaillante, l'hte principal s'assure qu'elle est redmarre. Grce un moteur de placement local, l'hte
principal dtermine galement o le redmarrage doit avoir lieu.

Grer les listes d'htes et de machines virtuelles protges du cluster.

Servir d'interface de gestion vCenter Server du cluster et rendre compte de l'tat de sant du cluster.

Les htes secondaires apportent une contribution essentielle au cluster en excutant des machines virtuelles
localement, en surveillant leur tat d'excution et en communiquant les mises jour d'tat l'hte principal.
Un hte principal peut galement excuter et surveiller des machines virtuelles. Les htes principaux et les
htes secondaires mettent en uvre les fonctions de surveillance de VM et d'application.
Une des fonctions exerces par l'hte matre est la coordination des redmarrages de machines virtuelles
protges. Une VM est protge par un hte matre aprs que vCenter Server observe que l'tat
d'alimentation de la VM est pass de hors tension sous tension en rponse une action de l'utilisateur.
L'hte matre conserve la liste des machines virtuelles protges dans les banques de donnes du cluster. Un
hte matre nouvellement lu utilise ces informations pour dterminer quelles machines virtuelles doivent
tre protges.
REMARQUE Si vous dconnectez un hte d'un cluster, aucune des machines virtuelles enregistres sur cet
hte n'est protge par vSphere HA.

Types de pannes des htes et dtection


L'hte principal d'un cluster vSphere HA est responsable de la dtection des pannes des htes secondaires.
Selon le type de panne dtect, les machines virtuelles excutes sur les htes peuvent ncessiter un
basculement.
Dans un cluster vSphere HA, trois types de pannes d'htes sont dtects :
n

Un hte cesse de fonctionner (autrement dit, il est dfaillant).

Un hte est rseau isol.

Un hte perd sa connexion rseau avec l'hte principal.

L'hte principal surveille la ractivit des htes secondaires du cluster. Cette communication s'effectue par
l'change, toutes les secondes, de signaux de pulsation rseau. Lorsqu'un hte principal cesse de recevoir
des signaux de pulsation d'un hte secondaire ou esclave, il vrifie la ractivit de l'hte avant de le dclarer
dfaillant. Le contrle de ractivit effectu par l'hte principal permet de dterminer si l'hte secondaire
change des signaux de pulsation avec une des banques de donnes. Reportez-vous la section Signal de
pulsation de banque de donnes , page 16. Par ailleurs, l'hte principal vrifie si l'hte rpond aux pings
ICMP envoys ses adresses IP de gestion.

12

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Si un hte principal est incapable de communiquer directement avec l'agent prsent sur un hte secondaire,
si l'hte secondaire ne rpond pas aux pings ICMP, et si l'agent n'met pas de signaux de pulsation, il est
considr comme dfaillant. Les machines virtuelles des htes sont redmarres sur d'autres htes. Si un tel
hte secondaire change des signaux de pulsation avec une banque de donnes, l'hte principal considre
qu'il se trouve dans une partition de rseau ou qu'il est rseau isol, et continue donc de surveiller l'hte et
ses machines virtuelles. Reportez-vous la section Partitions de rseau , page 16.
L'isolation du rseau de l'hte survient lorsqu'un hte, toujours en cours d'excution, ne parvient plus
observer le trafic provenant des agents vSphere HA sur le rseau de gestion. Si un hte cesse d'observer ce
trafic, il tente d'envoyer un ping aux adresses d'isolation du cluster. Si cela choue aussi, l'hte se dclare
isol du rseau.
L'hte principal surveille les machines virtuelles excutes sur un hte isol. S'il constate qu'elles s'arrtent,
et s'il est responsable de ces machines virtuelles, il les redmarre.
REMARQUE Si vous vous assurez que l'infrastructure rseau est suffisamment redondante et qu'un chemin
d'accs au rseau est disponible en permanence, l'isolation du rseau de l'hte devrait se produire trs
rarement.

Dterminer les rponses aux problmes de l'hte


Si un hte tombe en panne et que ses machines virtuelles doivent tre redmarres, vous pouvez contrler
l'ordre dans lequel cela se fait la priorit de redmarrage de la VM. De mme, vous pouvez configurer la
rponse de vSphere HA lorsque des htes perdent la connectivit au rseau de gestion d'autres htes en
utilisant les paramtres de rponse d'isolation.
Ces paramtres s'appliquent toutes les machines virtuelles du cluster en cas de dfaillance ou d'isolement
d'un hte. Vous pouvez configurer des exceptions pour des machines virtuelles spcifiques. Reportez-vous
la section Personnaliser une VM individuelle dans vSphere Web Client , page 35.

Priorit de redmarrage des VM


La priorit de redmarrage VM dtermine l'ordre relatif dans lequel les machines virtuelles sont places sur
un nouvel hte aprs une panne d'hte. Les machines virtuelles sont redmarres squentiellement sur leurs
nouveaux htes, en commenant par les machines virtuelles ayant la priorit la plus leve, puis celles ayant
une priorit infrieure, jusqu' ce que toutes les machines virtuelles aient redmarr ou qu'il n'y ait plus de
ressources de cluster disponibles. Notez que si vSphere HA ne parvient pas mettre sous tension une
machine virtuelle haute priorit, il tentera le processus avec les machines virtuelles de priorit infrieure.
Pour cette raison, la priorit de redmarrage des VM ne peut tre utilise pour appliquer une priorit de
redmarrage pour une application avec plusieurs machines virtuelles. De mme, si le nombre de
dfaillances d'htes dpasse le seuil autoris par le contrle d'admission, les machines virtuelles ayant une
priorit infrieure risquent de ne pas redmarrer tant que des ressources supplmentaires ne seront pas
disponibles. Les machines virtuelles sont redmarres sur les htes de basculement, s'ils ont t
pralablement dfinis.
Les valeurs de ce paramtre sont les suivantes : Dsactiv, Basse, Moyen (par dfaut) et Haut. Si l'option
Dsactiv est slectionne, vSphere HA est dsactiv pour la machine virtuelle, ce qui signifie qu'elle n'est
pas redmarre sur d'autres htes ESXi en cas de dysfonctionnement de son hte. Le paramtre Dsactiv
est ignor par la fonction Surveillance de VM et dapplication de vSphere HA car cette fonction protge les
machines virtuelles contre les pannes de niveau systme d'exploitation et non contre les pannes de machine
virtuelle. Lorsqu'une panne se produit au niveau du systme d'exploitation, vSphere HA redmarre le
systme d'exploitation et la machine virtuelle est laisse en fonctionnement sur le mme hte. Vous pouvez
modifier ce paramtre pour des machines virtuelles individuelles.
REMARQUE La rinitialisation d'une machine virtuelle provoque un redmarrage du systme d'exploitation
client mais ne place pas la machine virtuelle en cycle d'alimentation.

VMware, Inc.

13

Disponibilit vSphere

Les paramtres de priorit du redmarrage des machines virtuelles varient en fonction des besoins de
l'utilisateur. Attribuez une priorit plus leve de redmarrage aux machines virtuelles qui fournissent les
services les plus importants.
Par exemple, dans le cas d'une application multitche, vous pouvez classer les attributions en fonction des
fonctions hberges sur les machines virtuelles.
n

Haute. Serveurs de base de donnes qui fournissent des donnes aux applications.

Moyenne. Serveurs d'application qui exploitent les donnes de la base de donnes et fournissent des
rsultats sur des pages web.

Basse. Serveurs Web qui reoivent des demandes d'utilisateurs, transmettent des requtes des
serveurs d'application et transmettent les rsultats aux utilisateurs.

Rponse d'isolation de l'hte


La rponse l'isolement d'un hte dtermine les vnements survenant lorsqu'un hte d'un cluster vSphere
HA perd ses connexions au rseau de gestion mais continue fonctionner. Vous pouvez utiliser la rponse
d'isolation pour que vSphere HA atteigne les machines virtuelles en cours d'excution sur un hte isol et
les redmarrer sur un hte non isol hte. Les rponses l'isolement d'un hte exigent que l'tat de
surveillance de l'hte soit activ. Si l'tat de surveillance de l'hte est dsactiv, les rponses l'isolement
d'un hte sont galement suspendues. Un hte dtermine qu'il est isol lorsqu'il est incapable de
communiquer avec les agents en cours d'excution sur les autres htes et d'envoyer un ping ses adresses
d'isolement. Lorsque cela se produit, l'hte excute sa rponse d'isolement. Les rponses sont les suivantes :
Laisser sous tension (la valeur par dfaut), Mettre hors tension, puis basculer et Arrter, puis basculer. Vous
pouvez personnaliser cette proprit pour des machines virtuelles individuelles.
REMARQUE Si le paramtre de priorit de redmarrage d'une machine virtuelle est dfini sur Dsactiver,
aucune rponse d'isolation de l'hte n'est effectue.
Pour utiliser le paramtre Arrter la machine virtuelle, vous devez installer VMware Tools dans le systme
d'exploitation client de la machine virtuelle. L'arrt de la machine virtuelle offre l'avantage de prserver son
tat. L'arrt est prfrable la mise hors tension de la machine virtuelle qui ne prend pas en compte pas les
dernires modifications apportes aux disques ni ne valide les transactions. Le basculement des machines
virtuelles qui sont en train de se fermer est plus long car la fermeture doit aussi tre effectue. Les machines
virtuelles qui n'ont pas t arrtes au bout de 300 secondes ou du dlai dfini par l'attribut avanc
das.isolationshutdowntimeout seconds, sont mises hors tension.
REMARQUE Lorsque vous avez cr un cluster vSphere HA, vous pouvez changer les paramtres par dfaut
du cluster relatifs la Priorit de redmarrage et la Rponse l'isolement de machines virtuelles
spcifiques. Ces remplacements sont utiles pour les machines virtuelles qui sont utilises pour des tches
spciales. Par exemple, les machines virtuelles qui fournissent des services d'infrastructure, comme DNS ou
DHCP, doivent ventuellement tre mises sous tension avant d'autres machines virtuelles du cluster.
Si la rponse l'isolement d'un hte est dsactive (autrement dit, s'il laisse les machines virtuelles sous
tension lorsqu'il est isol) et si l'hte n'a plus accs au rseau de gestion et au rseau de stockage, une
situation de division peut survenir. Dans ce cas, l'hte isol perd le verrouillage des disques et les machines
virtuelles sont bascules vers un autre hte, mme si les instances d'origine des machines virtuelles
continuent de s'excuter sur l'hte isol. Lorsque l'hte retrouve l'accs la banque de donnes de la VM, il
y aura deux copies des VM, bien que la copie sur l'hte initialement isol n'ait pas accs aux fichiers vmdk et
que la corruption des donnes soit empche.
Pour rsoudre ce problme, ESXi gnre une question sur la machine virtuelle qui a perdu les verrouillages
disque pour le moment o l'hte quittera son tat d'isolation et ralise qu'il ne peut pas obtenir de nouveau
les verrouillages disque. vSphere HA rpond automatiquement cette question ce qui permet l'instance de
la machine virtuelle qui a perdu les verrouillages disque de s'arrter, laissant uniquement l'instance qui
dispose des verrouillages disque.

14

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Surveillance des VM et applications


Surveillance de VM redmarre les machines virtuelles si leurs signaux de pulsation de VMware Tools n'ont
pas t reus pendant un certain temps. De mme, la Surveillance d'application peut redmarrer une
machine virtuelle si les signaux de pulsation d'une application excute ne sont pas reus. Il est possible
d'activer ces fonctions et de configurer la sensibilit de la surveillance de l'absence de raction par vSphere
HA.
Lorsque vous activez la Surveillance de VM, le service Surveillance de VM ( l'aide de VMware Tools)
vrifie si chaque machine virtuelle du cluster fonctionne en vrifiant la rgularit des signaux de pulsations
et l'activit des E/S partir du processus VMware Tools excut sur le client. Si aucun signal de pulsation ou
activit des E/S n'est reu, cela est probablement d une dfaillance du systme d'exploitation client ou au
fait que les VMware Tools n'ont pas eu le temps de terminer certaines tches. Dans ce cas, le service
Surveillance de VM dtermine que la machine virtuelle est dfectueuse et la machine virtuelle redmarre
pour restaurer le service.
Il arrive qu'occasionnellement, les machines virtuelles ou les applications qui continuent fonctionner
correctement, cessent d'mettre des signaux de pulsation. Pour viter les rinitialisations inutiles, le service
Surveillance de VM surveille aussi l'activit des E/S d'une machine virtuelle. Si aucun signal de pulsation
n'est reu pendant la priode de dfaillance, la frquence des statistiques des E/S (attribut dfini au niveau
du cluster) est vrifie. La frquence des statistiques des E/S dtermine si un disque ou une activit rseau
s'est produite sur la machine virtuelle au cours des deux minutes (120 secondes) prcdentes. Si ce n'est pas
le cas, la machine virtuelle est rinitialise. Cette valeur par dfaut (120 secondes) peut tre modifie l'aide
de l'attribut avanc das.iostatsinterval.
Pour activer la surveillance d'application, il faut d'abord obtenir le SDK appropri (ou utiliser une
application qui prend en charge la surveillance de l'application VMware) et l'utiliser pour configurer des
signaux de pulsation personnaliss pour les applications surveiller. Aprs avoir fait cela, la surveillance
d'application fonctionne de la mme manire que la Surveillance de VM. Si les signaux de pulsation d'une
application ne sont pas reus pendant un certain temps, sa machine virtuelle est redmarre.
Vous pouvez configurer le niveau de sensibilit de la surveillance. Une sensibilit de surveillance leve
permet de conclure plus rapidement un dysfonctionnement. Mme si cela est peu probable, une sensibilit
de surveillance leve peut entraner l'identification errone de dysfonctionnements alors que la machine
virtuelle ou l'application en question fonctionne toujours mais les signaux de pulsation ne sont pas reus du
fait de certains facteurs tels que des contraintes de ressources. Une sensibilit de surveillance basse se
traduit par des interruptions de service prolonges entre les dfaillances avres et le redmarrage des
machines virtuelles. Slectionnez l'option qui offre un compromis intressant par rapport vos besoins.
Les paramtres par dfaut de la sensibilit de surveillance sont dcrits dans Tableau 2-1. Vous pouvez aussi
indiquer des valeurs personnalises la fois pour la sensibilit de la surveillance et les intervalles de
statistiques d'E/S en cochant la case Personnalis.
Tableau 21. Paramtres de surveillance des machines virtuelles
Paramtre

Intervalle de dfaillance (en


secondes)

Priode de rinitialisation

Haut

30

1 heure

Moyen

60

24 heures

Faible

120

7 jours

Lorsque des dysfonctionnements sont dtects, vSphere HA rinitialise les machines virtuelles. La
rinitialisation contribue garantir que les services restent disponibles. Pour viter de rinitialiser
constamment des machines virtuelles en cas d'erreurs non transitoires, les machines virtuelles sont
rinitialises par dfaut trois fois seulement au cours d'une priode configurable. Aprs trois rinitialisations

VMware, Inc.

15

Disponibilit vSphere

des machines virtuelles, vSphere HA n'effectue aucune tentative supplmentaire pour redmarrer les
machines virtuelles en cas de nouvel chec et ce jusqu' ce que la priode dfinie ne soit coule. Vous
pouvez configurer le nombre de rinitialisations l'aide du paramtre personnalis Nbre maximum de
rinitialisations par machine virtuelle.
REMARQUE Les statistiques de rinitialisation sont effaces lorsque la machine virtuelle est mise hors tension
puis sous tension, ou quand elle est migre un autre hte en utilisant vMotion. Cela provoque le
redmarrage du systme d'exploitation d'hte, mais de faon diffrente un redmarrage dans lequel
l'tat d'alimentation de la VM est chang.

Partitions de rseau
En cas de dfaillance du rseau de gestion d'un cluster vSphere HA, un sous-ensemble d'htes du cluster
risque d'tre incapable de communiquer avec les autres htes sur le rseau de gestion. De multiples
partitions peuvent se produire dans un cluster.
Un cluster partitionn entrane une diminution de la protection des machines virtuelles et une altration des
fonctions de gestion du cluster. Rparez le cluster partitionn ds que possible.
n

Protection de VM. vCenter Server permet de mettre sous tension une VM, mais celle-ci n'est protge
que si elle s'excute sur la mme partition que l'hte principal qui en est responsable. L'hte principal
doit communiquer avec vCenter Server. Un hte principal est responsable d'une machine virtuelle s'il a
bloqu exclusivement un fichier dfini par le systme sur la banque de donnes contenant le fichier de
configuration de la machine virtuelle.

Gestion de cluster. vCenter Server ne peut communiquer qu'avec certains htes du cluster, et ne peut se
connecter qu' un hte principal. Par consquent, il se peut que les modifications de configuration
relatives vSphere HA ne prennent pas effet tant que le problme de partition n'est pas rsolu. Suite
cette dfaillance, une des partitions pourrait s'excuter selon l'ancienne configuration, tandis qu'une
autre utiliserait les nouveaux paramtres.

En cas de partition d'un cluster vSphere HA contenant des htes antrieurs ESXi 5.0, il se peut que
vSphere HA mette sous tension, tort, une VM qui avait t mise hors tension par l'utilisateur ou n'arrive
pas redmarrer une VM dfaillante.

Signal de pulsation de banque de donnes


Lorsque l'hte principal d'un cluster vSphere HA ne peut pas communiquer avec un hte secondaire sur le
rseau de gestion, l'hte principal utilise le signal de pulsation de banque de donnes pour dterminer si
l'hte secondaire est dfaillant, s'il se trouve dans une partition de rseau ou s'il est rseau isol. Si l'hte
secondaire a arrt le signal de pulsation de banque de donnes, il est considr comme dfaillant et ses
machines virtuelles sont redmarres ailleurs.
vCenter Server slectionne un ensemble de banques de donnes prfres pour le signal de pulsation. Cette
slection a pour but d'optimiser le nombre d'htes ayant accs une banque de donnes de signaux de
pulsation et de minimiser le risque que les banques de donnes soient sauvegardes par le mme LUN ou le
mme serveur NFS.
Vous pouvez utiliser l'attribut avanc das.heartbeatdsperhost pour modifier le nombre de banques de
donnes de signaux de pulsation slectionn par vCenter Server pour chaque hte. La valeur par dfaut est
deux et la valeur maximale est cinq.
vSphere HA cre un rpertoire la racine de chaque banque de donnes qui sert la fois au signal de
pulsation de banques de donnes et maintenir l'ensemble des machines virtuelles protges. Le nom de ce
rpertoire est .vSphere-HA. Vous ne devez ni supprimer ni modifier les fichiers stocks dans ce rpertoire car
cela peut avoir des rpercussions sur les oprations. Plusieurs clusters peuvent utiliser une banque de
donnes. Des sous-rpertoires sont donc crs dans ce rpertoire pour chaque cluster. Ces rpertoires et
fichiers font partie de la racine, et seule celle-ci peut les lire et les modifier. L'espace disque utilis par
vSphere HA dpend de plusieurs facteurs, notamment la version de VMFS et le nombre d'htes qui utilisent

16

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

la banque de donnes pour le signal de pulsation. Avec vmfs3, l'utilisation maximale est d'environ 2 Go et
l'utilisation type est d'environ 3 Mo. Avec vmfs5, l'utilisation normale maximale est d'environ 3 Mo.
L'utilisation vSphere HA de la banque de donnes ajoute une charge additionnelle ngligeable et n'a pas
d'impact sur la performance des autres oprations de la banque de donnes.
vSphere HA limite le nombre de machines virtuelles qui peuvent avoir des fichiers de configuration sur une
banque de donnes unique. Consultez Configurations Maximales pour connatre les limites mises jour. Si
vous placez plus que ce nombre de machines virtuelles sur une banque de donnes et que vous les mettez
sous tension, vSphere HA ne protge un certain nombre de machines virtuelles que jusqu' cette limite.
REMARQUE Une banque de donnes de Virtual SAN ne peut pas tre utilise pour le signal de pulsation de
banque de donnes. Par consquent, si aucun autre stockage partag n'est accessible tous les htes du
cluster, il se peut qu'aucune banque de donnes de signaux de pulsation ne soit utilise. Toutefois, si vous
disposez d'un stockage qui peut tre atteint par un chemin rseau alternatif indpendant de Virtual SAN,
vous pouvez l'utiliser pour configurer une banque de donnes de signaux de pulsation.

Scurit vSphere HA
Plusieurs fonctions de scurit permettent d'amliorer vSphere HA.
Slectionner les ports
de pare-feu ouverts

vSphere HA utilise les ports 8182 TCP et UDP pour la communication


d'agent agent. Les ports de pare-feu s'ouvrent et se ferment
automatiquement pour assurer qu'ils sont ouverts uniquement lorsque cela
est ncessaire.

Fichiers de
configuration protgs
par les autorisations du
systme de fichiers

vSphere HA stocke les informations de configuration sur le systme de


stockage local ou sur le ramdisk s'il n'existe aucune banque de donnes
locale. Ces fichiers sont protgs par les autorisations du systme de fichiers
et sont accessibles uniquement par l'utilisateur racine. Les htes sans
stockage local sont pris en charge uniquement si ils sont grs par Auto
Deploy.

Journalisation dtaille

L'emplacement des fichiers journaux choisi par vSphere HA dpend de la


version de l'hte.

Connexions vSphere
HA scurises

VMware, Inc.

Pour les htes ESXi 5.x, vSphere HA crit sur syslog uniquement par
dfaut. Les journaux sont donc placs l'endroit indiqu dans la
configuration de syslog. Les noms des fichiers journaux de vSphere HA
sont prcds de fdm, fault domain manager (gestionnaire de domaine
de pannes), qui est un service de vSphere HA.

Pour les htes existants 4.x ESXi, vSphere HA crit


dans /var/log/vmware/fdm sur le disque local, ainsi que syslog si il est
configur.

Pour les htes hrits ESX 4.x, vSphere HA crit


sur /var/log/vmware/fdm.

vSphere HA se connecte aux agents vSphere HA l'aide d'un compte


d'utilisateur, vpxuser, cr par vCenter Server. Ce compte est le mme que
celui utilis par vCenter Server pour la gestion de l'hte. vCenter Server cre
un mot de passe alatoire pour ce compte et le change rgulirement. La
frquence de renouvellement du mot de passe est dfinie par le paramtre
VirtualCenter.VimPasswordExpirationInDays de vCenter Server. Les
utilisateurs ayant des privilges d'administration sur le dossier racine de
l'hte peut se connecter l'agent.

17

Disponibilit vSphere

Communication
scurise

Toutes les communications entre vCenter Server et l'agent vSphere HA sont


scurises par SSL. La communication d'agent agent utilise galement le
protocole SSL sauf pour les messages d'lection, qui utilisent UDP. Les
messages d'lection sont vrifis via SSL de sorte qu'un agent non autoris
puisse empcher uniquement l'hte sur lequel l'agent s'excute d'tre choisi
comme hte principal. Dans ce cas, un problme de configuration du cluster
est mis afin que l'utilisateur soit inform du problme.

Vrification du certificat
SSL de l'hte requise

vSphere HA exige que chaque hte dispose d'un certificat SSL vrifi.
Chaque hte gnre un certificat auto-sign lors de son premier dmarrage.
Ce certificat peut tre gnr une nouvelle fois ou remplac par un certificat
mis par une autorit. Si le certificat est remplac, vSphere HA doit tre
reconfigur sur l'hte. Si un hte se dconnecte de vCenter Server aprs la
mise jour de son certificat et si l'agent de l'hte ESXi ou ESX est redmarr,
vSphere HA est automatiquement reconfigur au moment o l'hte est
reconnect vCenter Server. Si la dconnexion n'est pas due au fait que la
vrification du certificat SSL de l'hte de vCenter Server est dsactive ce
moment-l, vrifiez le nouveau certificat et reconfigurez vSphere HA sur
l'hte.

Utilisation de vSphere HA avec Virtual SAN


Vous pouvez utiliser Virtual SAN comme stockage partag pour un cluster vSphere HA. Lorsqu'il est activ,
Virtual SAN cumule les disques de stockage locaux spcifis qui sont disponibles sur les htes afin de crer
une banque de donnes unique partage par tous les htes.
Avant d'utiliser vSphere HA avec Virtual SAN, vous devez connatre les exigences et les limitations lies
l'interoprabilit de ces deux fonctions.
Pour plus d'informations sur Virtual SAN, reportez-vous Stockage vSphere.

Conditions requises pour les htes ESXI


Pour utiliser Virtual SAN avec un cluster vSphere HA, les conditions suivantes doivent tre remplies :
n

Tous les htes ESXi du cluster doivent tre de la version 5.5 ou ultrieure.

Le cluster doit avoir au moins trois htes ESXi.

Diffrences de mise en rseau


Virtual SAN dispose de son propre rseau. Lorsque Virtual SAN et vSphere HA sont activs sur le mme
cluster, le trafic entre agents HA circule sur ce rseau de stockage et non pas sur le rseau de gestion.
vSphere HA utilise le rseau de gestion uniquement lorsque Virtual SAN est dsactiv. vCenter Server
choisit le rseau appropri lorsque vSphere HA est configur sur un hte.
REMARQUE Virtual SAN ne peut tre activ que si vSphere HA est dsactiv.
Si vous modifiez la configuration de Virtual SAN, les agents vSphere HA ne choisissent pas
automatiquement les nouveaux paramtres rseau. Pour modifier Virtual SAN, vous devez effectuer la
procdure suivante dans vSphere Web Client :

18

Dsactivez la surveillance de l'hte pour le cluster vSphere HA.

Modifiez Virtual SAN.

Cliquez avec le bouton droit sur chacun des htes du cluster et slectionnez Reconfigurer HA.

Ractivez la surveillance de l'hte pour le cluster vSphere HA.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Tableau 2-2 montre les diffrences de mise en rseau de vSphere HA en fonction de l'utilisation ou non de
Virtual SAN.
Tableau 22. Diffrences de mise en rseau de vSphere HA
Virtual SAN activ

Virtual SAN dsactiv

Rseau utilis par vSphere HA

Rseau de stockage de Virtual SAN

Rseau de gestion

Banques de donnes de signaux de


pulsation

Toutes les banques de donnes


monte sur plusieurs htes, sauf les
banques de donnes de Virtual SAN.

Toutes les banques de donnes


montes sur plusieurs htes.

Hte dclar comme isol

Adresses d'isolation ne rpondant pas


aux commandes ping et rseau de
stockage de Virtual SAN inaccessible.

Adresses d'isolation ne rpondant pas


aux commandes ping et rseau de
gestion inaccessible.

Paramtres de rservation de capacit


Lorsque vous rservez de la capacit pour votre cluster vSphere HA l'aide d'une stratgie de contrle
d'admission, ce paramtre doit tre cohrent avec le paramtre de Virtual SAN correspondant qui permet
d'assurer l'accessibilit des donnes en cas de panne. Plus prcisment, la valeur du paramtre dfinissant le
nombre de pannes tolr dans l'ensemble des rgles de Virtual SAN ne doit pas tre infrieure la capacit
rserve par le paramtre de contrle d'admission de vSphere HA.
Par exemple, si l'ensemble de rgles de Virtual SAN n'autorise que deux pannes, la stratgie du contrle
d'admission de vSphere HA doit rserver une capacit quivalente seulement une ou deux pannes d'hte.
Si vous utilisez la stratgie du pourcentage de ressources de cluster rserves sur un cluster disposant de
huit htes, vous ne devez pas rserver plus de 25 % des ressources du cluster. Si vous utilisez la stratgie
des pannes d'htes tolres par le cluster sur ce mme cluster, la valeur du paramtre ne doit pas dpasser
deux htes. Si vSphere HA rserve une capacit infrieure, l'activit du basculement peut tre imprvisible ;
si, au contraire, il rserve une capacit trop leve, la contrainte impose la mise sous tension des machines
virtuelles et aux migrations vMotion entre clusters est excessive.

Utilisation conjointe de vSphere HA et DRS


L'utilisation de vSphere HA avec Distributed Resource Scheduler (DRS) allie le basculement automatique
l'quilibrage de la charge. Cette association peut aboutir un cluster mieux quilibr une fois que vSphere
HA a dplac les machines virtuelles sur d'autres htes.
Quand vSphere HA excute le basculement et redmarre les machines virtuelles sur des htes diffrents, sa
premire priorit est la disponibilit immdiate de toutes les machines virtuelles. Aprs le redmarrage des
VM, les htes sur lesquels elles sont mises sous tension peuvent se retrouver surchargs, tandis que la
charge d'autres htes est, en comparaison, plus lgre. vSphere HA utilise le CPU et la rservation de
mmoire de la VM pour dterminer si un hte dispose de suffisamment de capacit disponible pour prendre
en charge la VM.
Dans un cluster utilisant DRS et vSphere HA avec le contrle d'admission activ, les machines virtuelles ne
sont pas ncessairement vacues des htes passant en mode maintenance. Ce comportement intervient par
suite des ressources rserves pour le redmarrage des machines virtuelles en cas de panne. Il faut migrer
manuellement les machines virtuelles en dehors des htes avec vMotion.
Dans certains cas, vSphere HA ne parvient pas basculer les machines virtuelles en raison de contraintes de
ressources. Ceci peut se produire pour plusieurs raisons.
n

Le contrle d'admission HA est dsactiv et Gestion de l'alimentation distribue (DPM) est activ. Cela
peut aboutir la consolidation par DPM des machines virtuelles sur un nombre infrieur d'htes et la
mise en veille des htes vides, ce qui ne laisse pas suffisamment de rserve de capacit active pour
effectuer un basculement.

Les rgles (requises) d'affinit de machine virtuelle/hte peuvent limiter les htes sur lesquels certaines
machines virtuelles peuvent tre places.

VMware, Inc.

19

Disponibilit vSphere

Il peut y avoir suffisamment de ressources cumules mais celles-ci sont fragmentes sur plusieurs htes
de sorte qu'elles ne peuvent pas tre utilises par les machines virtuelles pour le basculement.

Dans ces cas-l, vSphere HA peut utiliser DRS pour essayer d'ajuster le cluster (par exemple, en sortant les
htes du mode veille ou en migrant les machines virtuelles pour dfragmenter les ressources du cluster) de
sorte que HA puisse excuter les basculements.
Si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de mise sous
tension des htes. De mme, si DPM est en mode manuel, vous devrez ventuellement confirmer les
recommandations de migration.
Si vous utilisez les rgles d'affinit entre VM et hte requises, sachez que ces rgles doivent obligatoirement
tre respectes. vSphere HA n'effectue pas de basculement si cela risque d'enfreindre une rgle.
Pour plus d'informations sur DRS, consultez la documentation Gestion des ressources vSphere.

Contrle d'admission vSphere HA


vCenter Server utilise le contrle d'admission pour assurer que suffisamment de ressources sont disponibles
dans un cluster pour permettre la protection par basculement et pour assurer que les rservations de
ressources pour les machines virtuelles sont respectes.
Trois types de contrle d'admission sont disponibles.
Hte

Garantit qu'un hte dispose de suffisamment de ressources pour satisfaire les


rservations de toutes les machines virtuelles qui y sont excutes.

Pool de ressources

Garantit qu'un pool de ressources dispose de suffisamment de ressources


pour satisfaire les rservations, les partages et les limites de toutes les
machines virtuelles qui y sont associes.

vSphere HA

Garantit qu'une part suffisante des ressources du cluster sont rserves la


restauration des machines virtuelles en cas de dfaillance de l'hte.

Le contrle d'admission impose des contraintes d'utilisation des ressources et toute action contrevenant
ces contraintes n'est pas autorise. Parmi les exemples d'actions qui peuvent tre interdites, on peut citer :
n

la mise sous tension d'une machine virtuelle.

la migration d'une machine virtuelle sur un hte ou dans un cluster ou un pool de ressources.

l'augmentation de la rserve de CPU ou de mmoire d'une machine virtuelle.

Parmi les trois types de contrle d'admission, seul le contrle d'admission vSphere HA peut tre dsactiv.
Cependant, sans ce contrle, il est impossible de garantir que le nombre de machines virtuelles attendu
puisse tre redmarr aprs une dfaillance. Ne dsactivez pas le contrle d'admission, mais vous pouvez
avoir besoin de le faire temporairement pour les raisons suivantes :

20

Si vous devez enfreindre les contraintes de basculement lorsqu'il n'y a pas suffisamment de ressources
pour les prendre en charge (par exemple, si vous mettez les htes en mode veille pour en tester le
fonctionnement avec DPM).

Si un processus automatis doit effectuer des actions qui risquent d'enfreindre temporairement les
contraintes de basculement (par exemple, dans le cadre d'une mise niveau dirige par vSphere
Update Manager).

Si vous devez excuter des tests ou des oprations de maintenance.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Le contrle d'admission rserve la capacit, mais en cas de panne, vSphere HA utilise la capacit disponible
restante pour les redmarrages de la machine virtuelle. Par exemple, vSphere HA place plus de machines
virtuelles sur un hte que ce que le contrle d'admission permettrait pour des mises en tensions par des
utilisateurs.
REMARQUE Lorsque le contrle d'admission vSphere HA est dsactiv, vSphere HA garantit qu'au moins
deux htes du cluster sont sous tension mme si DPM est activ et peut regrouper toutes les machines
virtuelles sur un seul hte. Ceci permet de garantir que le basculement est possible.

Stratgie de contrle d'admission Dfaillances d'hte tolres par le cluster


Vous pouvez configurer vSphere HA pour qu'il tolre un nombre dfini de dfaillances d'htes. Avec la
stratgie de contrle d'admission Dfaillances d'hte tolres par le cluster, vSphere HA s'assure que mme
si un nombre d'htes spcifi est dfaillant, les ressources demeurent en quantit suffisante sur le cluster
pour permettre le basculement de toutes les machines virtuelles de ces htes.
Avec la stratgie Dfaillances d'hte tolres par le cluster, vSphere HA effectue le contrle d'admission de
la manire suivante :
1

Calcule la taille d'emplacement.


Un emplacement est une reprsentation logique de la mmoire et des ressources CPU. Par dfaut, il est
dimensionn pour satisfaire aux exigences de chaque machine virtuelle sous tension dans le cluster.

Dtermine le nombre d'emplacements pouvant se trouver sur chaque hte du cluster.

Dtermine la Capacit de basculement actuelle du cluster.


Il s'agit du nombre d'htes dfectueux permettant de conserver un nombre suffisant d'emplacements
pour satisfaire toutes les machines virtuelles sous tension.

Dtermine si la Capacit de basculement actuelle est infrieure ou non la Capacit de basculement


configure (prcise par l'utilisateur).
Si c'est le cas, le contrle d'admission n'autorise pas l'opration.

REMARQUE Vous pouvez dfinir une taille d'emplacement spcifique pour les CPU et la mmoire dans la
section de contrle d'admission des paramtres vSphere HA dans vSphere Web Client

Calcul de la taille d'emplacement


La taille d'un emplacement est dtermine par deux composants, le CPU et la mmoire.
n

vSphere HA calcule la taille de CPU partir du CPU rserv par chaque machine virtuelle sous tension,
en slectionnant la valeur la plus leve. Si aucun CPU n'a t rserv pour une machine virtuelle, une
valeur de 32 MHz est dfinie par dfaut. Cette valeur peut tre modifie par l'attribut avanc
das.vmcpuminmhz.)

vSphere HA calcule la taille de la mmoire partir de la mmoire rserve (plus la capacit


supplmentaire de mmoire) de chaque machine virtuelle sous tension, en slectionnant la valeur la
plus leve. Il n'y a pas de valeur par dfaut pour la mmoire rserve.

Si le cluster contient des machines virtuelles ayant des valeurs de rservation bien plus leves que d'autres,
celles-ci influeront sur le calcul de la taille d'emplacement. Pour viter cela, vous pouvez prciser une limite
suprieure pour le CPU ou le composant de mmoire de la taille d'emplacement en utilisant respectivement
les attributs avancs das.slotcpuinmhz ou das.slotmeminmb. Reportez-vous Attributs avancs de
vSphere HA , page 33.

VMware, Inc.

21

Disponibilit vSphere

Vous pouvez galement dterminer le risque de fragmentation des ressources dans le cluster en regardant le
nombre de machines virtuelles qui ncessitent plusieurs emplacements. Ceci peut tre calcul dans la
section de contrle d'admission des paramtres vSphere HA dans vSphere Web Client. Les machines
virtuelles peuvent ncessiter plusieurs emplacements si vous avez spcifi une taille fixe ou maximale
d'emplacements dans les options avances.

Utiliser les emplacements pour dterminer la capacit de basculement actuelle


Une fois la taille d'emplacement calcule, vSphere HA dtermine les ressources de CPU et de mmoire
disponibles sur chaque hte pour les machines virtuelles. Ces valeurs sont celles contenues dans le pool de
ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Vous trouverez les
donnes sur les ressources d'un hte utilis par vSphere HA dans l'onglet Rsum de l'hte, sur
vSphere Web Client. Si tous les htes de votre cluster sont identiques, vous pouvez obtenir ces donnes en
divisant les chiffres relatifs au cluster dans son ensemble par le nombre d'htes. Les ressources utilises
des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode
maintenance et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte.
Le nombre maximum d'emplacements pouvant tre pris en charge par chaque hte est alors dtermin.
cette fin, la quantit de ressources CPU de l'hte est divise par le composant de CPU de la taille
d'emplacement et le rsultat est arrondi. Le mme calcul est fait pour la quantit de ressources de mmoire
de l'hte. Ces deux valeurs sont compares et la plus basse quivaut au nombre d'emplacements pouvant
tre pris en charge par l'hte.
La Capacit de basculement actuelle est calcule en dterminant le nombre d'htes (en commenant par le
plus gros) pouvant tre dfectueux tout en conservant un nombre suffisant d'emplacements pour satisfaire
toutes les machines virtuelles sous tension.

Informations d'excution avances


Lorsque vous slectionnez la politique de contrle d'admission des dfaillances de l'hte tolres par le
cluster, le volet Infos dexcution avances apparat dans la section vSphere HA de l'onglet Moniteur du
cluster dans vSphere Web Client. Ce volet affiche les informations suivantes concernant le cluster :

22

Taille d'emplacement.

Nombre total d'emplacements dans le cluster. Somme des emplacements pris en charge par les htes en
tat de marche dans le cluster.

Emplacements utiliss. Nombre d'emplacements associs aux machines virtuelles sous tension. Ce
nombre peut tre suprieur au nombre de machines virtuelles sous tension si vous avez dfini une
limite suprieure pour la taille d'emplacement au moyen des options avances. Ceci parce que quelques
machines virtuelles peuvent occuper plusieurs emplacements.

Emplacements disponibles Nombre d'emplacements disponibles pour mettre sous tension des
machines virtuelles supplmentaires dans le cluster. vSphere HA rserve le nombre d'emplacements
requis pour le basculement. Les emplacements restants sont disponibles pour mettre sous tension de
nouvelles machines virtuelles.

Emplacements de basculement. Nombre total d'emplacements l'exception des emplacements utiliss


ou des emplacements disponibles.

Nombre total de machines virtuelles sous tension dans le cluster.

Nombre total d'htes dans le cluster.

Total des bons htes dans le cluster. Nombre d'htes qui sont connects, qui ne sont pas en mode
maintenance et qui ne prsentent pas d'erreurs vSphere HA.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Exemple : Stratgie de contrle d'admission Dfaillances d'hte tolres par le


cluster
Nous allons illustrer par un exemple le mode de calcul de la taille d'emplacement et son utilisation avec
cette stratgie de contrle d'admission. Prenons les hypothses suivantes pour un cluster :
n

Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources
mmoire disponibles. Le premier hte (H1) a 9 GHz de ressources CPU et 9 Go de mmoire disponibles.
Le second (H2) a 9 GHz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 GHz de CPU et
6 Go de mmoire disponibles.

Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire
diffrents. VM1 a besoin de 2 GHz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de
2 GHz et 1 Go, VM3 a besoin de 1 GHz et de 2 Go, VM4 a besoin de 1 GHz et 1 Go, VM5 a besoin de
1 GHz et 1 Go.

Les dfaillances d'hte tolres par le cluster sont dfinies sur la valeur 1.

Figure 21. Exemple de contrle d'admission avec la stratgie Dfaillances d'hte tolres par le cluster

VM1
2 Ghz
1 Go

VM2
2 Ghz
1 Go

VM3
1 Ghz
2 Go

VM4
1 Ghz
1 Go

VM5
1 Ghz
1 Go

taille du slot
2 Ghz, 2 Go
H1

H2

H3

9 Ghz
9 Go

9 Ghz
6 Go

6 Ghz
6 Go

4 slots

3 slots

3 slots

6 slots restent
si H1 est dfectueux
1

La taille d'emplacement est calcule en comparant la fois les exigences de CPU et de mmoire des
machines virtuelles et en slectionnant la plus leve.
Le besoin en CPU le plus lev (partag par VM1 et VM2) est de 2 GHz, tandis que le besoin en
mmoire le plus lev (VM3) est de 2 Go. Partant de l, la taille d'emplacement se compose d'un CPU
de 2 GHz et d'une mmoire de 2 Go.

Le nombre maximum d'emplacements pouvant tre pris en charge par chaque hte est dtermin.
H1 peut prendre en charge quatre emplacements. H2 peut prendre en charge trois emplacements (le
plus bas de 9 GHz/2 GHz et 6 Go/2 Go) et H3 peut aussi en prendre en charge trois.

La Capacit de basculement actuelle est calcule.


Le plus gros hte est H1 et s'il est dfectueux, le cluster contient toujours six emplacements, ce qui est
suffisant pour les cinq machines virtuelles sous tension. Si H1 et H2 sont dfectueux, il ne reste que trois
emplacements, ce qui est insuffisant. Par consquent, la Capacit de basculement actuelle est de 1.

Le cluster a un emplacement disponible (les six emplacements de H2 et H3 moins les cinq emplacements
utiliss).

VMware, Inc.

23

Disponibilit vSphere

Rgles de contrle d'admission Pourcentage de ressources de cluster


rserves
Il est possible de configurer vSphere HA pour effectuer le contrle d'admission en rservant un pourcentage
spcifique de ressources de CPU et de mmoire du cluster la rcupration en cas de pannes d'htes.
Les rgles de contrle d'admission Pourcentage de ressources de cluster rserves permettent vSphere HA
de rserver au basculement un pourcentage spcifi de ressources cumules de CPU et de mmoire du
cluster.
vSphere HA met en uvre le contrle d'admission conformment aux rgles de Ressources de cluster
rserves suivantes :
1

Calcule les besoins totaux en ressources pour toutes les machines virtuelles sous tension dans le cluster.

Calcule les ressources totales de l'hte disponibles pour les machines virtuelles.

Calcule la Capacit CPU de basculement actuelle et la Capacit mmoire de basculement actuelle du


cluster.

Dtermine si la Capacit de basculement de CPU actuelle ou la Capacit de basculement mmoire


actuelle sont infrieures ou non la Capacit de basculement configure correspondante (spcifie par
l'utilisateur).
Si c'est le cas, le contrle d'admission n'autorise pas l'opration.

vSphere HA utilise les rserves effectives des machines virtuelles. Si une machine virtuelle n'a pas de
rserves, c'est--dire que la valeur de rserve est nulle, les valeurs utilises par dfaut sont 0 Mo de mmoire
et 32 MHz de CPU.
REMARQUE Les rgles de contrle d'admission Pourcentage de ressources de cluster rserves vrifient
galement qu'il existe au moins deux htes compatibles vSphere HA dans le cluster ( l'exception des htes
qui passent en mode maintenance). S'il n'y a qu'un hte compatible vSphere HA, aucune opration n'est
autorise, mme si le pourcentage de ressources disponibles est suffisant. Cette vrification supplmentaire
s'explique par le fait que vSphere HA ne peut pas effectuer de basculement s'il n'y a qu'un seul hte dans le
cluster.

Calcul de la Capacit de basculement actuelle


Les ressources totales requises par les machines virtuelles sous tension incluent deux composants, CPU et
mmoire. vSphere HA calcule ces valeurs.
n

Le besoin en composant CPU est obtenu en additionnant le CPU rserv par les machines virtuelles
sous tension. Si aucun CPU n'a t rserv pour une machine virtuelle, une valeur de 32 MHz est
dfinie par dfaut (cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz).

La taille du composant de mmoire est obtenue en additionnant la mmoire rserve (plus la capacit
supplmentaire de mmoire) de chaque machine virtuelle sous tension.

Les ressources totales des htes disponibles pour les machines virtuelles sont calcules en additionnant les
ressources de CPU et de mmoire des htes. Ces valeurs sont celles contenues dans le pool de ressources
racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de
virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode maintenance
et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte.
La Capacit CPU de basculement actuelle est calcule en soustrayant les besoins totaux en ressources CPU
des ressources CPU totales des htes et en divisant le rsultat par les ressources CPU totales des htes. La
Capacit mmoire de basculement actuelle est calcule de la mme manire.

24

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Exemple : Rgles de contrle d'admission Pourcentage de ressources de cluster


rserves
Nous allons illustrer par un exemple le mode de calcul de la Capacit de basculement actuelle et son
utilisation avec cette rgle de contrle d'admission. Prenons les hypothses suivantes pour un cluster :
n

Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources
mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles.
Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et
6 Go de mmoire disponibles.

Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire
diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de
2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 a besoin de 1 Ghz et 1 Go, VM5 a besoin de
1 Ghz et 1 Go.

La capacit de basculement configure pour le processeur et la mmoire est pour tous deux de 25 %.

Figure 22. Exemple de contrle d'admission utilisant les rgles de Pourcentage de ressources de cluster
rserves

VM1
2 Ghz
1 Go

VM2
2 Ghz
1 Go

VM3
1 Ghz
2 Go

VM4
1 Ghz
1 Go

VM5
1 Ghz
1 Go

besoins totaux en ressources


7 Ghz, 6 Go
H1

H2

H3

9 Ghz
9 Go

9 Ghz
6 Go

6 Ghz
6 Go

ressources totales de l'hte


24 GHz, 21 Go
Les besoins totaux en ressources des machines virtuelles sous tension sont de 7 Ghz et 6 Go. Les ressources
totales de l'hte disponibles pour les machines virtuelles sont de 24 Ghz et 21 Go. Partant de l, la Capacit
CPU de basculement actuelle s'lve 70% ((24 Ghz - 7 Ghz)/24 Ghz). De mme, la Capacit mmoire de
basculement actuelle s'lve 71% ((21 Go - -6 Go)/21 Go).
Comme la Capacit de basculement configure pour le cluster est de 25 %, 45 % des ressources CPU totales
du cluster et 46 % des ressources mmoire totales du cluster sont toujours disponibles pour les machines
virtuelles supplmentaires.

Rgles de contrle d'admission Spcifier des htes de basculement


Il est possible de configurer vSphere HA afin de dsigner des htes spcifiques comme htes de
basculement.
En cas de dfaillance d'un hte, les rgles de contrle d'admission Dfinir les htes de basculement
prvoient que vSphere HA tente de redmarrer ses machines virtuelles sur un des htes de basculement
prdfinis. Si ce n'est pas possible car les htes de basculement sont eux-mme en panne ou leurs ressources
sont insuffisantes, par exemple, vSphere HA tente de redmarrer ces machines virtuelles sur d'autres htes
du cluster.

VMware, Inc.

25

Disponibilit vSphere

Pour que des capacits restent disponibles sur un hte de basculement, vous ne pouvez pas mettre sous
tension des machines virtuelles ni utiliser vMotion pour faire migrer des machines virtuelles vers un hte de
basculement. De plus, DRS n'utilise pas d'hte de basculement pour la rpartition de la charge.
REMARQUE Si vous utilisez les rgles de contrle d'admission Dfinir les htes de basculement et dsignez
plusieurs htes de basculement, DRS ne cherche pas faire respecter les rgles d'affinit VM-VM pour les
machines virtuelles qui s'excutent sur des htes de basculement.
Les htes de basculement actuels apparaissent dans la section vSphere HA de l'onglet Rsum du cluster.
L'icne de statut qui se trouve ct de chaque hte peut tre verte, jaune ou rouge.
n

Vert. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA.
Aucune machine virtuelle sous tension ne rside sur l'hte.

Jaune. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA.
Mais des machines virtuelles sous tension rsident sur l'hte.

Rouge. L'hte est dconnect, il est en mode maintenance ou prsente des erreurs vSphere HA.

Choisir une rgle de contrle d'admission


Les rgles de contrle d'admission de vSphere HA doivent tre choisies en fonction des besoins de
disponibilit et des caractristiques du cluster. Diffrents critres doivent tre pris en compte lors du choix
des rgles de contrle d'admission.

viter la fragmentation des ressources


La fragmentation des ressources se produit lorsqu'il y a suffisamment de ressources cumules pour le
basculement d'une machine virtuelle. Toutefois, ces ressources sont rparties sur plusieurs htes et sont
inutilisables car une machine virtuelle ne peut tre excute que sur un seul hte ESXi la fois. La
configuration par dfaut de la rgle de Dfaillances d'hte tolres par le cluster vite la fragmentation des
ressources en dfinissant un slot comme rservation maximale des machines virtuelles. Les rgles de
Pourcentage de ressources de clusters ne traitent pas du problme de la fragmentation des ressources. Les
rgles Spcifier des htes de basculement n'entranent pas la fragmentation des ressources car des htes sont
rservs au basculement.

Flexibilit de la rservation des ressources de basculement


Les rgles de contrle d'admission diffrent de par la granularit qu'elles accordent au moment de la
rservation des ressources du cluster pour la protection du basculement. Les rgles Dfaillances d'hte
tolres par le cluster permettent de dfinir le niveau de basculement d'un certain nombre d'htes. Les
rgles Pourcentage de ressources de cluster permettent d'attribuer jusqu' 100 % des ressources de CPU ou
de mmoire du cluster pour le basculement. Les rgles Spcifier un hte de basculement permettent de
spcifier un ensemble d'htes de basculement.

26

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Htrognit des clusters


Les clusters peuvent tre htrognes en termes de rservations des ressources des machines virtuelles et de
capacits des ressources totales des htes. Dans un cluster htrogne, les rgles de Dfaillances d'hte
tolres par le cluster peuvent tre insuffisantes puisqu'elles tiennent uniquement compte des plus grosses
rserves de machines virtuelles lors de la dfinition de la taille du slot et qu'elles envisagent uniquement la
dfaillance du plus gros hte lors de l'estimation de la Capacit de basculement actuelle. Les deux autres
rgles de contrle d'admission ne sont pas affectes par l'htrognit des clusters.
REMARQUE vSphere HA tient compte de l'utilisation des ressources des machines virtuelles secondaires
tolrantes aux pannes dans les calculs de contrle d'admission. Les rgles de Dfaillances d'hte tolres par
le cluster veulent qu'un slot soit affect une machine virtuelle secondaire, tandis que les rgles de
Pourcentage de ressources de clusters prvoient que l'utilisation des ressources des machines virtuelles
secondaires soit prise en compte lors de l'valuation de l'utilisation des ressources du cluster.

Liste de contrle de vSphere HA


La liste de contrle de vSphere HA contient les spcifications que vous devez connatre pour pouvoir crer
et utiliser un cluster vSphere HA.

Spcifications applicables un cluster vSphere HA


Consultez cette liste avant de configurer un cluster vSphere HA. Pour plus d'informations, suivez les
rfrences croises appropries ou consultez Crer un cluster vSphere HA , page 28.
n

Tous les htes doivent disposer d'une licence pour vSphere HA.

Le cluster doit contenir deux htes au minimum.

Tous les htes doivent tre configurs avec des adresses IP statiques. Si vous utilisez DHCP, vrifiez
que l'adresse de chaque hte est conserve aprs les redmarrages.

Il doit y avoir au moins un rseau de gestion commun parmi tous les htes mais il est recommand d'en
avoir au moins deux. Les rseaux de gestion diffrent selon la version de l'hte que vous utilisez.
n

Htes ESX - rseau de la console du service.

Htes ESXi antrieurs la version 4.0 - Rseau VMkernel.

Htes ESXi version 4.0 et ultrieures - Rseau VMkernel avec case Traffic de gestion coche.

Reportez-vous la section Meilleures pratiques pour la mise en rseau , page 37.


n

Pour vous assurer que toutes les machines virtuelles peuvent tre excutes sur n'importe quel hte du
cluster, tous les htes doivent avoir accs aux mme rseaux et banques de sonnes de machines
virtuelles. De mme, les machines virtuelles doivent se trouver sur des stockages partags, et non
locaux, sinon il ne peut pas y avoir de basculement en cas de dfaillance de l'hte.
REMARQUE vSphere HA utilise le signal de pulsation de banque de donnes pour diffrencier les htes
partitionns, isols ou dfaillants. Par consquent, s'il ya des banques de donnes plus fiables dans
votre environnement, configurez vSphere HA pour leur donner la prfrence.

Le fonctionnement de surveillance des machines virtuelles ncessite l'installation des outils VMware.
Reportez-vous la section Surveillance des VM et applications , page 15.

vSphere HA prend en charge IPv4 et IPv6. Un cluster utilisant la fois ces deux versions de protocole
est cependant plus susceptible d'entraner une partition de rseau.

VMware, Inc.

27

Disponibilit vSphere

Crer un cluster vSphere HA


vSphere HA fonctionne dans le cadre d'un cluster d'htes ESXi (ou ESX hrits). Vous devez crer un
cluster, le remplir d'htes et configurer les paramtres vSphere HA pour que la protection du basculement
puisse tre tablie.
Lorsque vous crez un cluster vSphere HA, vous devez configurer divers paramtres qui dterminent le
mode de fonctionnement de la fonction. Avant de commencer, identifiez les nuds du cluster. Ces nuds
sont les htes ESXi qui fourniront les ressources pour la prise en charge des machines virtuelles et qui seront
utiliss par vSphere HA pour la protection du basculement. Dterminez ensuite la manire dont ces nuds
doivent tre relis les uns aux autres et au stockage partag o rsident les donnes de la machine virtuelle.
Lorsque l'architecture de mise en rseau est en place, vous pouvez ajouter les htes au cluster et terminer la
configuration de vSphere HA.
Vous pouvez activer et configurer vSphere HA avant d'ajouter des nuds d'htes au cluster. Toutefois, tant
que les htes n'ont pas t ajouts, le cluster n'est pas entirement oprationnel et quelques paramtres du
cluster ne sont pas disponibles. Par exemple, les rgles de contrle d'admission Spcifier un hte de
basculement ne sont pas disponibles tant qu'un hte n'a pas t dfini comme hte de basculement.
REMARQUE La fonction de dmarrage et d'arrt de la machine virtuelle (dmarrage automatique) est
dsactive pour toutes les machines virtuelles rsidant sur des htes qui se trouvent dans un cluster vSphere
HA (ou qui y ont t dplaces). Le dmarrage automatique n'est pas pris en charge avec vSphere HA.

Crer un cluster vSphere HA dans vSphere Web Client


Pour activer le cluster pour vSphere HA, commencez par crer un cluster vide. Aprs avoir planifi les
ressources et l'architecture de rseau de votre cluster, utiliser vSphere Web Client pour ajouter des htes au
cluster et spcifier les paramtres du cluster vSphere HA.
Connecter vSphere Web Client au vCenter Server en utilisant un compte disposant des autorisations
d'administrateur de cluster.
Prrequis
Vrifiez que toutes les machines virtuelles et leurs fichiers de configuration rsident sur des stockages
partags.
Vrifiez que les htes sont configurs pour accder ce stockage partag, afin de pouvoir mettre sous
tension les machines virtuelles l'aide des diffrents htes dans le cluster.
Vrifiez que les htes sont configurs pour avoir accs au rseau de machines virtuelles.
REMARQUE Utilisez des connexions rseau de gestion redondantes pour vSphere HA. Pour plus
d'informations sur la configuration d'un rseau redondant, consultez la rubrique Redondance des chemins
de rseau , page 38. Vous devez configurer aussi les htes avec au moins deux banques de donnes pour
fournir de redondance la pulsation de banques de donnes vSphere HA.
Procdure
1

Dans vSphere Web Client accdez au centre de donnes o vous voulez que le cluster rside

Cliquer sur Crer un cluster.

Compltez le paramtre de l'assistant Nouveau cluster.


Ne pas mettre sous tension vSphere HA (ou DRS).

Cliquez sur OK pour fermer l'assistant et crer le cluster.


Vous avez cr un cluster vide.

28

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Sur la base de votre plan pour les ressources et l'architecture de rseau du cluster, utiliser
vSphere Web Client pour ajouter des htes au cluster.

Accdez au cluster.

Cliquez sur l'onglet Grer puis sur Paramtres.

Slectionner vSphere HA et cliquer sur Modifier.

Slectionnez Activer vSphere HA.

10

Configurez les paramtres vSphere HA comme il convient pour le cluster.

11

Surveillance d'hte

Contrle d'admission

Surveillance de VM

Signal de pulsation de banque de donnes

Options avances

Cliquez sur OK.

Vous disposez dsormais d'un cluster vSphere HA configur et rempli d'htes. Reportez-vous
Configuration des paramtres de cluster vSphere HA dans vSphere Web Client , page 29.
REMARQUE Un cluster doit obligatoirement tre compatible avec vSphere HA pour que Fault Tolerance
fonctionne.

Configuration des paramtres de cluster vSphere HA dans vSphere Web Client


Lorsque vous crez un cluster vSphere HA ou que vous configurez un cluster existant, vous devez
configurer les paramtres qui dterminent le mode de fonctionnement de la fonction.
Dans vSphere Web Client vous pouvez configurer les paramtres vSphere HA suivants :
Surveillance d'hte

Activez la surveillance de l'hte pour permettre aux htes du cluster


d'changer des signaux de pulsation rseau et vSphere HA d'agir lorsqu'il
dtecte des pannes. Ici vous pouvez galement dfinir la priorit de rponse
de redmarrage de la VM et d'isolation de l'hte.
REMARQUE La surveillance d'hte est aussi requise pour le bon
fonctionnement du processus de rcupration de vSphere Fault Tolerance.

Contrle d'admission

Activez ou dsactivez le contrle d'admission pour le cluster vSphere HA et


choisissez une rgle pour dterminer son application.

Surveillance de VM

Activer la surveillance des VM ou surveillance des VM et application.

Signal de pulsation de
banque de donnes

Indiquez vos prfrences pour les banques de donnes que vSphere HA


utilise pour le signal de pulsation des banques de donnes.

Options avances

Personnalisez le comportement de vSphere HA en dfinissant les options


avances.

VMware, Inc.

29

Disponibilit vSphere

Configurer la surveillance d'hte


Aprs avoir cr un cluster, la surveillance d'hte permet l'hte matre vSphere HA de rpondre aux
dfaillances de l'hte ou de la machine virtuelle et l'isolation du rseau de gestion. La priorit de
redmarrage et la rponse d'isolement de l'hte de la VM dterminent comment vSphere HA rpond
dfaillances d'htes et aux isolations.
La page Surveillance d'hte apparat uniquement si vous avez activ vSphere HA.
Procdure
1

Dans vSphere Web Client, accdez au cluster vSphere HA .

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionner vSphere HA et cliquer sur Modifier.

Dveloppez Surveillance d'hte pour afficher les options de configuration pour la surveillance de
l'hte.

Slectionnez Surveillance d'hte pour activer cette fonction.

Slectionnez la Priorit redmarrage VM pour les machines virtuelles dans le cluster.


La priorit de redmarrage dtermine l'ordre de redmarrage des machines virtuelles en cas d'chec de
l'hte. Les machines virtuelles de plus haute priorit sont dmarres en premier. Cette priorit
s'applique seulement par hte. Si plusieurs htes chouent, toutes les machines virtuelles sont migres
du premier hte par ordre de priorit, puis toutes les machines virtuelles du deuxime hte par ordre
de priorit, et ainsi de suite.

Slectionnez la Rponse d'isolation de l'hte.


La rponse d'isolation de l'hte dtermine les vnements survenant lorsqu'un hte dans un cluster
vSphere HA perd la connexion rseau de sa console mais poursuit son excution.

Cliquez sur OK.

La Surveillance d'hte est active et les paramtres de priorit de redmarrage et de rponse d'isolation de
l'hte prennent effet.

Configurer le contrle d'admission


Aprs la cration d'un cluster, le contrle d'admission permet de spcifier si les machines virtuelles peuvent
tre dmarres si elles violent les contraintes de disponibilit. Le cluster rserve des ressources pour
permettre le basculement de toutes les machines virtuelles en cours d'excution sur le nombre d'htes
spcifi.
La page Contrle admission apparat uniquement si vous avez activ vSphere HA.
Procdure

30

Dans vSphere Web Client, accdez au cluster vSphere HA.

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionner vSphere HA et cliquer sur Modifier.

Dveloppez Contrle d'admission pour afficher les options de configuration.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Slectionnez une rgle de contrle d'admission appliquer au cluster.


Option

Description

Dfinir la capacit de basculement


partir du nombre statique d'htes

Slectionnez le nombre maximal de pannes d'hte dont vous pouvez


rcuprer ou pour lesquels vous pouvez garantir le basculement. En outre,
vous devez slectionner une rgle de taille de slot.

Dfinir la capacit de basculement


en rservant un pourcentage des
ressources du cluster

Spcifiez un pourcentage des ressources CPU et de mmoire du cluster


rserver comme capacit disponible pour prendre en charge les
basculements.

Utilisez des htes de basculement


ddis

Slectionnez les htes utiliser pour les actions de basculement. Les


basculements peuvent toujours se produire sur d'autres htes du cluster si
l'hte de basculement par dfaut ne dispose pas des ressources suffisantes.

Ne pas rserver de la capacit de


basculement

Cette option permet de mettre sous tension les VM qui violent les
contraintes de disponibilit.

Cliquez sur OK.

Le contrle d'admission est activ et la politique que vous avez choisi prend effet.

Configurer la surveillance des VM et applications


La fonction Surveillance des machines virtuelles utilise les informations de signal de pulsation captures par
VMware Tools comme proxy pour la disponibilit des systmes d'exploitation clients. Cette fonction permet
vSphere HA de rinitialiser ou de redmarrer automatiquement les machines virtuelles qui ont perdu leur
capacit de produire un signal de pulsation.
La page Surveillance de VM apparat uniquement si vous avez activ vSphere HA.
Procdure
1

Dans vSphere Web Client, accdez au cluster vSphere HA .

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionner vSphere HA et cliquer sur le bouton Modifier.

Dveloppez Surveillance VM pour afficher les options de configuration.

Slectionnez Surveillance de VM seulement pour redmarrer des machines virtuelles individuelles si


leurs signaux de pulsation ne sont pas reus dans un dlai dtermin.
Vous pouvez slectionner Surveillance de VM et d'application afin d'activer galement la surveillance
des applications.

Dfinissez la sensibilit de la surveillance des machines virtuelles en dplaant le curseur entre Bas et
Haut.

(Facultatif) Slectionnez Personnalis pour fournir des paramtres personnaliss.

Cliquez sur OK.

Configurer le signal de pulsation d'une banque de donnes


vSphere HA utilise le signal de pulsation de banque de donnes pour identifier les htes dfaillants et les
htes qui rsident dans une partition rseau. Le signal de pulsation d'une banque de donnes permet
vSphere HA de contrler les htes en cas de partition du rseau de gestion et de continuer rpondre aux
dfaillances qui se produisent.
Vous pouvez spcifier les banques de donnes que vous voulez utiliser pour le signal de pulsation des
banques de donnes.

VMware, Inc.

31

Disponibilit vSphere

Procdure
1

Dans vSphere Web Client, accdez au cluster vSphere HA .

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionner vSphere HA et cliquer sur Modifier.

Dveloppez Signal de pulsation de la banque de donnes pour afficher les options de configuration
du signal de pulsation de la banque de donnes.

Pour indiquer vSphere HA comment slectionner les banques de donnes et comment traiter vos
prfrences, choisissez une des options suivantes :
Tableau 23.
Options de signal de pulsation de banque de donnes
Slectionner automatiquement les banques de donnes accessibles partir de l'hte
Utiliser les banques de donnes uniquement partir de la liste spcifie
Utiliser la banque de donnes de la liste spcifie et complter automatiquement si ncessaire

Dans le volet Banques de donnes des signaux de pulsation disponibles, slectionner les banques de
donnes que vous souhaitez utiliser pour le signal de pulsation.
Les banques de donnes rpertories sont partages par plusieurs htes du cluster vSphere HA.
Lorsque vous slectionnez une banque de donnes, le volet infrieur affiche tous les htes du cluster
vSphere HA qui peuvent y accder.

Cliquez sur OK.

Personnaliser le comportement de vSphere HA


Aprs avoir cr un cluster, vous pouvez modifier les attributs spcifiques qui affectent le comportement de
vSphere HA. Vous pouvez galement modifier les paramtres par dfaut du cluster hrits par des
machines virtuelles individuelles.
Vrifiez les paramtres avancs que vous pouvez utiliser pour optimiser les clusters vSphere HA dans votre
environnement. Ces attributs affectent le fonctionnement de vSphere HA. Modifiez-les donc avec prudence.

Dfinir les options avances dans vSphere Web Client


Pour personnaliser le comportement de vSphere HA, dfinissez les options avances de vSphere HA.
Prrequis
Vrifiez que vous possdez des privilges d'administrateur sur les clusters.
Procdure
1

Dans vSphere Web Client, accdez au cluster vSphere HA .

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionner vSphere HA et cliquer sur Modifier.

Cliquez sur Options avances.

Cliquez sur Ajouter et tapez le nom de l'option avance dans la zone de texte.
Vous pouvez dfinir la valeur de l'option dans la zone de texte dans la colonne Valeur.

32

Rptez l'tape 5 pour chaque nouvelle option que vous souhaitez ajouter et cliquez sur OK.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Le cluster utilise les options que vous avez ajoutes ou modifies.

Attributs avancs de vSphere HA


Vous pouvez dfinir des attributs avancs qui affectent le comportement du cluster vSphere HA.
Tableau 24. Attributs avancs de vSphere HA
Attribut

Description

das.isolationaddress[...]

dfinit l'adresse pour excuter un ping afin de dterminer


si un hte est isol du rseau. Le ping est uniquement
envoy cette adresse lorsqu'aucun autre hte du cluster
ne reoit de signaux de pulsation. En l'absence de
prcision, la passerelle par dfaut du rseau de gestion est
utilise. Cette passerelle par dfaut doit tre une adresse
fiable et disponible, de sorte que l'hte puisse dterminer
s'il est isol du rseau. Vous pouvez indiquer plusieurs
adresses d'isolement (jusqu' 10) pour le cluster :
das.isolationaddressX, o X = 0-9. Vous devez
gnralement en indiquer une par rseau de gestion.
L'indication d'un nombre excessif d'adresses ralentit la
dtection de l'isolement.

das.usedefaultisolationaddress

Par dfaut, vSphere HA utilise la passerelle par dfaut du


rseau de console comme adresse d'isolement. Cet attribut
indique l'utilisation ou non de ce paramtre par dfaut
(vrai|faux).

das.isolationshutdowntimeout

Priode pendant laquelle le systme attend que la machine


virtuelle s'arrte avant de la mettre hors tension. Cela
s'applique uniquement si la rponse l'isolement de l'hte
est Arrter la machine virtuelle. La valeur par dfaut est de
300 secondes.

das.slotmeminmb

Dfinit la limite maximum de la taille d'un emplacement de


mmoire. Si cette option est utilise, la taille d'emplacement
est la plus petite de cette valeur ou la rserve de mmoire
maximale plus la capacit supplmentaire de n'importe
quelle machine virtuelle sous tension dans le cluster.

das.slotcpuinmhz

Dfinit la limite maximale de la taille d'un emplacement de


CPU. Si cette option est utilise, la taille d'emplacement est
la plus petite de cette valeur ou la rserve de CPU
maximale de n'importe quelle machine virtuelle sous
tension dans le cluster.

das.vmmemoryminmb

Dfinit la valeur de ressources de mmoire par dfaut


associe une machine virtuelle si sa rserve de mmoire
n'est pas prcise ou nulle. Celle-ci est utilise pour la
stratgie de contrle d'admission Dfaillances d'hte
tolres par le cluster. Si aucune valeur n'est spcifie, la
valeur par dfaut est de 0 Mo.

das.vmcpuminmhz

Dfinit la valeur des ressources CPU par dfaut associe


une machine virtuelle si sa rserve de CPU n'est pas
prcise ou nulle. Celle-ci est utilise pour la stratgie de
contrle d'admission Dfaillances d'hte tolres par le
cluster. Si aucune valeur n'est spcifie, la valeur par
dfaut est de 32 MHz.

das.iostatsinterval

Modifie l'intervalle de statistique des E/S par dfaut pour la


sensibilit de surveillance des machines virtuelles. La
valeur par dfaut est de 120 (secondes). Peut tre dfinie
sur une valeur suprieure ou gale 0. Une valeur nulle
dsactive la vrification.

VMware, Inc.

33

Disponibilit vSphere

Tableau 24. Attributs avancs de vSphere HA (suite)


Attribut

Description

das.ignoreinsufficienthbdatastore

Dsactive les problmes de configuration crs si l'hte n'a


pas suffisamment de banques de donnes de signaux de
pulsation pour vSphere HA. La valeur par dfaut est
"faux".

das.heartbeatdsperhost

Modifie le nombre de banques de donnes de signaux de


pulsation ncessaire. Les valeurs peuvent s'tendre de 2 5
et la valeur par dfaut est 2.

fdm.isolationpolicydelaysec

Le nombre de secondes pendant lesquelles le systme


attend avant d'excuter la politique d'isolation une fois que
l'isolation de l'hte est dtermine. La valeur minimale est
30. S'il une valeur infrieure 30 est dfinie, le dlai sera de
30 secondes.

das.respectvmvmantiaffinityrules

Dtermine si vSphere HA applique les rgles d'anti-affinit


VM-VM. Avec la valeur par dfaut false , les rgles ne
sont pas appliques. Si la valeur true est choisie, les
rgles sont appliques (mme si vSphere DRS n'est pas
activ). Dans ce cas, vSphere HA ne bascule pas sur une
machine virtuelle s'il viole une rgle en le faisant, mais
met un vnement signalant que les ressources sont
insuffisantes pour effectuer le basculement.
Pour plus d'informations sur les rgles d'anti-affinit,
reportez-vous Gestion des ressources vSphere.

REMARQUE Si vous modifiez la valeur de l'un des attributs avancs suivants, vous devez dsactiver, puis
ractiver vSphere HA avant que les modifications ne s'appliquent.
n

das.isolationaddress[...]

das.usedefaultisolationaddress

das.isolationshutdowntimeout

Options Plus prises en charge


Dans vCenter Server 5.x, un certain nombre d'options de configuration avances de vSphere HA ne sont
plus prises en charge. Les options suivantes ne sont plus prises en charge.

34

das.consoleUser

das.consoleNode

das.consolePerm

das.primaryCount

das.checkVmStateDelay

das.trace

das.traceLevel

das.traceOutput

das.preferredPrimaries

das.disableUWSwapRequirement

das.sensorPollingFreq

das.bypassNetCompatCheck

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

das.defaultfailoverhost

das.failureDetectionTime

das.failureDetectionInterval

Si vous essayez de dfinir l'une des options non prises en charge, vCenter Server 5.0 signalera que l'option
n'est pas valide. En outre, si vous mettez jour vCenter Server 5.x depuis une ancienne version possdant
l'une des options dfinies, elles seront supprimes et ne seront plus actives.

Personnaliser une VM individuelle dans vSphere Web Client


Les paramtres par dfaut du cluster relatifs la priorit de redmarrage, la rponse d'isolation de l'hte et
la surveillance des machines virtuelles sont associs chaque machine virtuelle d'un cluster vSphere HA.
Vous pouvez prciser des comportements spcifiques pour chaque machine virtuelle en changeant ces
valeurs par dfaut. Si la machine virtuelle quitte le cluster, ces paramtres sont perdus.
Procdure
1

Dans vSphere Web Client, accdez au cluster vSphere HA .

Cliquez sur l'onglet Grer puis sur Paramtres.

Sous Paramtres, slectionnez Remplacements VM et cliquez sur Ajouter.

Utilisez le bouton + pour slectionner les machines virtuelles sur lesquelles appliquer les
remplacements.

Cliquez sur OK.

(Facultatif) Vous pouvez changer les paramtres de Niveau d'automatisation, Priorit redmarrage
VM, Rponse d'isolement d'hte, Surveillance VM, ou Sensibilit de surveillance VM.
REMARQUE Vous pouvez afficher les paramtres par dfaut du cluster pour ces paramtres en
commenant par dvelopper Paramtres, puis en dveloppant vSphere HA.

Cliquez sur OK.

Le comportement de la VM est dsormais diffrent des rglages par dfaut du cluster pour chaque
paramtre que avez modifi.

Meilleures pratiques pour les clusters vSphere HA


Pour garantir des performances optimales des clusters vSphere HA, vous devez suivre certaines meilleures
pratiques. Cette rubrique met en vidence quelques-unes des meilleures pratiques essentielles pour un
cluster vSphere HA. Vous pouvez galement consulter la publication Meilleures pratiques du dploiement
vSphere High Availability pour poursuivre la discussion.

Dfinir des alarmes pour surveiller les changements des clusters


Quand vSphere HA ou Fault Tolerance interviennent pour prserver la disponibilit en effectuant un
basculement de machine virtuelle, par exemple, vous avez la possibilit d'tre averti de ces changements.
Dans vCenter Server, configurez des alarmes qui seront dclenches lorsque ces actions surviendront, et
recevez des alertes, sous forme de messages lectroniques, par exemple, envoyes un groupe
d'administrateurs prdfini.
Plusieurs alarmes par dfaut sont disponibles pour vSphere HA.
n

Ressources de basculement insuffisantes (alarme de cluster)

Impossible de trouver le cluster principal (alarme du cluster)

VMware, Inc.

35

Disponibilit vSphere

Basculement en cours (alarme du cluster)

Statut de l'hte HA (alarme d'hte)

Erreur de surveillance de VM (alarme de machine virtuelle)

Action de surveillance de VM (alarme de machine virtuelle)

chec du basculement (alarme de machine virtuelle)

REMARQUE Les alarmes par dfaut contiennent le nom de la fonction, vSphere HA.

Surveillance de la validit du cluster


Un cluster valide est un cluster sur lequel il n'y eu aucune violation des stratgies de contrle d'admission.
Un cluster sur lequel HA est activ devient invalide lorsque le nombre de machines virtuelles sous tension
dpasse les exigences de basculement, ce qui signifie, que la capacit de basculement actuelle est infrieure
la capacit de basculement configure. Si le contrle d'admission est dsactiv, les clusters ne deviennent
pas non valides.
Dans vSphere Web Client, slectionnez vSphere HA dans l'onglet Moniteur du cluster, puis slectionnez
Problmes de configuration. La liste de problmes actuels de vSphere HA apparat.
Le comportement DRS n'est pas affect par un cluster rouge cause d'un problme li vSphere HA.

Interoprabilit de vSphere HA et de Storage vMotion dans un cluster mixte


Dans les clusters o des htes ESXi 5.x et ESX/ESXi 4.1 ou des htes antrieurs sont prsents et o Storage
vMotion est largement utilis ou Storage DRS est activ, ne dployez pas vSphere HA. vSphere HA pourrait
rpondre une dfaillance de l'hte en redmarrant une VM sur un hte avec une version ESXi diffrente de
celle sur laquelle la VM a t lance avant la dfaillance. Un problme peut survenir si, au moment de la
dfaillance, la machine virtuelle participait une action de Storage vMotion sur un hte ESXi 5.x, et si
vSphere HA redmarre la VM sur un hte ayant une version antrieure ESXi 5.0. Pendant l'allumage de la
machine virtuelle, des tentatives ultrieures d'oprations de snapshot pourraient corrompre l'tat du vdisk
et rendre la machine virtuelle inutilisable.

Pratiques d'excellence pour le contrle d'admission


Les recommandations suivantes constituent les pratiques d'excellence pour le contrle d'admission vSphere
HA.

36

Slectionnez la stratgie de contrle d'admission Pourcentage de ressources de cluster rserves. Cette


stratgie offre la plus grande flexibilit en termes de dimensionnement d'htes et de machines
virtuelles. Lors de la configuration de cette stratgie, choisissez un pourcentage de CPU et de mmoire
qui reflte le nombre de pannes que vous voulez que l'hte prenne en charge. Par exemple, si vous
voulez que vSphere HA rserve des ressources pour deux pannes et que vous avez dix htes d'une
capacit gale dans le cluster, spcifiez 20 % (2/10).

Assurez-vous d'attribuer la mme taille tous les htes du cluster. Pour la stratgie Dfaillances d'hte
tolres par le cluster, un cluster non quilibr entrane un excs de capacit rserv au traitement des
pannes car vSphere HA rserve la capacit pour les htes les plus volumineux. Pour la stratgie
Pourcentage de ressources du cluster, un cluster non quilibr ncessite que vous spcifiez des
pourcentages plus levs que ncessaire pour rserver une capacit suffisante en anticipation au
nombre de pannes d'htes.

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Si vous prvoyez d'utiliser la stratgie Dfaillances d'hte tolres par le cluster, faites en sorte que les
spcifications de dimensionnement des machines virtuelles soient similaires sur toutes les machines
virtuelles configures. Cette stratgie utilise des tailles d'emplacement pour calculer la capacit qui doit
tre rserve chaque VM. La taille d'emplacement repose sur la plus grande mmoire et CPU
rserves ncessaires une machine virtuelle. Lorsque vous mlangez des machines virtuelles ayant
des spcifications de CPU et de mmoire diffrentes, le calcul dtermine la plus grande taille
d'emplacement possible, ce qui limite la consolidation.

Si vous prvoyez d'utiliser la stratgie Dfinir les htes de basculement, indiquez le nombre de pannes
d'htes prendre en charge puis spcifiez ce nombre d'htes en tant qu'htes de basculement. Si le
cluster n'est pas quilibr,, les htes de basculement dsigns doivent tre au moins de la mme taille
que les htes de non-basculement dans votre cluster. Cela garantit une capacit suffisante en cas de
panne.

Utiliser Auto Deploy avec vSphere HA


Vous pouvez utiliser simultanment vSphere HA et Auto Deploy pour amliorer la disponibilit de vos
machines virtuelles. Auto Deploy approvisionne les htes lorsqu'ils s'allument. Vous pouvez galement le
configurer pour installer l'agent vSphere HA sur ces htes pendant le processus de dmarrage. Pour plus de
dtails, consultez la documentation d'Auto Deploy incluse dans le guide Installation et configuration de
vSphere.

Mise niveau d'htes dans un cluster l'aide de Virtual SAN


Si vous mettez niveau les htes ESXi dans votre cluster vSphere HA vers la version 5.5 ou une version
ultrieure, et que vous prvoyez galement d'utiliser Virtual SAN, suivez ce processus.
1

Mettez niveau tous les htes.

Dsactivez vSphere HA.

Activez Virtual SAN.

Ractivez vSphere HA.

Meilleures pratiques pour la mise en rseau


Suivez les meilleures pratiques pour la configuration des adaptateurs rseau htes et la topologie du rseau
pour vSphere HA. Les pratiques d'excellence incluent des recommandations pour vos htes ESXi, et traitent
aussi du cblage, des commutateurs, des routeurs et des pare-feu.

Configuration et maintenance du rseau


Les suggestions de maintenance du rseau suivantes contribuent viter une dtection accidentelle d'htes
dfectueux et une isolation du rseau dues la perte des signaux de pulsation vSphere HA.
n

Lors d'une modification des rseaux sur lesquels se trouvent les htes ESXi en clusters, suspendez la
fonction de surveillance d'hte. Les changements de matriel ou de paramtres rseau peuvent
interrompre les signaux de pulsation utiliss par vSphere HA pour dtecter les dfaillances d'htes, ce
qui risque d'entraner des tentatives intempestives de basculement des machines virtuelles.

Lorsque, par exemple, vous modifiez la configuration du rseau sur les htes ESXi, l'ajout de groupes
de ports, ou la suppression de vSwitches, suspendez la surveillance d'hte. Aprs avoir effectu les
modifications de configuration de rseau, vous devez reconfigurer vSphere HA sur tous les htes du
cluster, ce qui provoque une nouvelle inspection des informations du rseau. Ractivez ensuite la
Surveillance d'hte.

REMARQUE La mise en rseau tant un aspect essentiel de vSphere HA, l'administrateur de vSphere HA doit
tre tenu inform de toute opration de maintenance du rseau.

VMware, Inc.

37

Disponibilit vSphere

Rseaux utiliss pour les communications vSphere HA


Pour identifier les oprations rseau qui risquent de perturber le bon fonctionnement de vSphere HA, il est
ncessaire d'identifier les rseaux de gestion utiliss pour les signaux de pulsation et autres communications
vSphere HA.
n

Sur les htes hrits ESX du cluster, les communications vSphere HA sont achemines via tous les
rseaux qui sont identifis comme rseaux de console de service. Les rseaux VMkernel ne sont pas
utiliss par ces htes pour les communications vSphere HA.

Sur les htes ESXi du cluster, les communications vSphere HA sont achemines par dfaut via les
rseaux VMkernel, sauf ceux spcifiques vMotion. S'il n'existe qu'un seul rseau VMkernel, vSphere
HA le partage avec vMotion, si ncessaire. Avec ESXi 4.x et ESXi, vous devez aussi cocher explicitement
la case Trafic de gestion si vSphere HA doit utiliser ce rseau.

REMARQUE Pour garder le trafic de l'agent vSphere HA sur les rseaux que vous avez spcifis, configurez
des htes de faon ce que les cartes vmkNICs utilises par vSphere HA ne ne partagent pas les sousrseaux avec les cartes vmkNIC utilises dautres fins. Les agents vSphere HA envoient des paquets en
utilisant une carte pNIC associe un sous-rseau donn sil y a aussi au moins une carte vmkNIC
configure pour le trafic de gestion vSphere HA. Par consquent, pour assurer la sparation de flux rseau,
les cartes vmkNIC utiliss par vSphere HA et par les autres fonctionnalits doivent tre sur des sousrseaux diffrents.

Adresses d'isolation rseau


Une adresse d'isolation rseau est une adresse IP qui reoit une commande ping pour dterminer si un hte
est isol du rseau. Le ping est uniquement envoy cette adresse lorsqu'un hte a cess de recevoir les
signaux de pulsation de tous les autres htes du cluster. Si un hte peut envoyer un ping son adresse
d'isolation rseau, l'hte n'est pas isol dans le rseau et soit les autres htes du cluster ont chou, soit le
rseau s'est partitionn. Mais si l'hte ne peut pas envoyer de ping son adresse d'isolation, il est probable
que l'hte ait t isol du rseau et aucune action de basculement n'est entreprise.
L'adresse d'isolation rseau est la passerelle par dfaut de l'hte. Une seule passerelle est dfinie par dfaut,
quel que soit le nombre de rseaux de gestion dfinis. Vous devez utiliser l'attribut avanc
das.isolationaddress[...] pour ajouter des adresses d'isolation des rseaux supplmentaires. Reportez-vous
la section Attributs avancs de vSphere HA , page 33.

Redondance des chemins de rseau


La redondance des chemins de rseau entre les nuds de cluster est importante pour la fiabilit de vSphere
HA. Un rseau de gestion isol finit par tre un point de panne isol, ce qui aboutit des basculements
mme si le rseau uniquement est dfectueux.
Si vous avez un seul rseau de gestion, toute dfaillance entre l'hte et le cluster peut provoquer une activit
de basculement inutile (ou faux) si la connectivit du signal de pulsation des banques de donnes n'est pas
conserv lors de la panne de rseau. Les dfaillances possibles incluent les pannes de adaptateurs rseau, les
pannes de cbles rseau, la suppression de cbles rseau et les rinitialisations de commutateurs. Examinez
ces causes possibles de dfaillances entre les htes et efforcez-vous de les minimiser en assurant une
redondance du rseau.
Il est possible d'implmenter la redondance du rseau au niveau de l'association de adaptateurs rseau, ou
au niveau rseau de gestion. Dans la plupart des implmentations, l'association des adaptateurs rseau offre
une redondance suffisante, mais il est possible d'utiliser ou d'ajouter au besoin la redondance de rseau de
gestion. La mise en rseau de gestion redondante garantit la fiabilit de la dtection des pannes et vite la
ralisation de conditions d'isolation ou de partition car les signaux de pulsation peuvent tre transmis via
plusieurs rseaux.

38

VMware, Inc.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Configurez un nombre aussi rduit que possible de segments matriels entre les serveurs d'un cluster.
L'objectif est de limiter les points de panne isols. De plus, les chemins contenant trop de bonds peuvent
provoquer des retards de paquets de signaux de pulsation et augmenter les points de panne ventuels.

Redondance par association de adaptateurs rseau


L'utilisation d'une association de deux adaptateurs rseau connectes pour sparer les commutateurs
physiques amliore la fiabilit d'un rseau de gestion. Le cluster est plus rsilient car les serveurs connects
par deux adaptateurs rseau (et par des commutateurs spars) ont deux chemins indpendants pour la
transmission et la rception de signaux de pulsation. Pour configurer une association de adaptateurs rseau
pour rseau de gestion, configurez les vNIC de la configuration vSwitch pour la configuration Active ou
Standby. Les rglages recommands pour les paramtres des vNIC sont les suivants :
n

quilibrage de charge par dfaut = Router en fonction de l'ID du port d'origine

Retour arrire = Non

Lorsque vous avez ajout une carte rseau un hte de votre cluster vSphere HA, vous devez reconfigurer
vSphere HA sur cet hte.

Redondance rseau utilisant un rseau secondaire


Au lieu d'associer des adaptateurs rseau pour assurer la redondance des signaux de pulsation, vous
pouvez crer une connexion de rseau de gestion secondaire qui est lie un commutateur virtuel distinct.
La connexion de rseau de gestion originelle est utilise pour le rseau et des fins de gestion. Lorsque la
connexion de rseau de gestion secondaire est cre, vSphere HA transmet des signaux de pulsation sur les
deux connexions de rseau de gestion la fois. Si un chemin est dfaillant, vSphere HA continue
transmettre et recevoir des signaux de pulsation par l'autre chemin.

VMware, Inc.

39

Disponibilit vSphere

40

VMware, Inc.

Assurer Fault Tolerance des


machines virtuelles

Il est possible d'activer vSphere Fault Tolerance pour les machines virtuelles afin d'assurer la continuit
d'activit avec des niveaux de disponibilit et de protection des donnes suprieurs ceux offerts par
vSphere HA.
Fault Tolerance est intgre la plate-forme hte ESXi (par la technologie VMware vLockstep) et elle assure
la continuit de la disponibilit en excutant des machines virtuelles identiques en mode rigide virtuel sur
des htes distincts.
Pour obtenir des rsultats optimaux de Fault Tolerance, il est ncessaire d'en comprendre le fonctionnement,
de savoir comment l'activer sur un cluster et sur des machines virtuelles, et de connatre les meilleures
pratiques pour son utilisation.
REMARQUE Vous verrez parfois apparatre des messages d'erreur quand vous tenterez d'utiliser Fault
Tolerance. Pour plus d'informations sur les messages d'erreur lis Fault Tolerance, consultez l'article de la
base de connaissances VMware sur http://kb.vmware.com/kb/1033634.
Ce chapitre aborde les rubriques suivantes :
n

Fonctionnement de Fault Tolerance , page 42

Utiliser Fault Tolerance avec DRS , page 43

Cas d'utilisation de Fault Tolerance , page 43

Liste de vrification de Fault Tolerance , page 44

Interoprabilit de Fault Tolerance , page 45

Prparer votre cluster et vos htes Fault Tolerance , page 47

Assurer Fault Tolerance des machines virtuelles , page 50

Consulter les informations sur les machines virtuelles Fault Tolerant dans vSphere Web Client ,
page 54

Pratiques d'excellence pour Fault Tolerance , page 56

Recommandations de configuration de vSphere Fault Tolerance , page 58

VMware, Inc.

41

Disponibilit vSphere

Fonctionnement de Fault Tolerance


vSphere Fault Tolerance assure la disponibilit continue des machines virtuelles en crant et maintenant une
VM secondaire identique la VM primaire et disponible en permanence pour la remplacer en cas de
situation de basculement.
Il est possible d'activer Fault Tolerance sur la plupart des machines virtuelles cruciales pour une mission.
Une copie de la machine virtuelle, que l'on appelle machine virtuelle secondaire, est cre et excute en
mode rigide virtuel avec la machine virtuelle principale. VMware vLockstep capture les entres et les
vnements qui se produisent sur la machine virtuelle principale et les transmet la machine virtuelle
secondaire qui est excute sur un autre hte. partir de ces informations, l'excution de la machine
virtuelle secondaire est identique celle de la machine virtuelle principale. Comme la machine virtuelle
secondaire est en mode rigide virtuel avec la machine virtuelle principale, elle peut reprendre l'excution
tout moment sans interruption, assurant ainsi une protection tolrante aux pannes.
REMARQUE Le trafic de la journalisation de la tolrance aux pannes entre les machines virtuelles primaires et
secondaires est chiffr et contient un rseau client et des donnes E/S de stockage, ainsi que le contenu de la
mmoire du systme d'exploitation client. Ce trafic peut inclure des donnes sensibles telles que des mots de
passe en texte brut. Pour viter que ces donnes ne soient divulgues, assurez-vous que ce rseau est
scuris, notamment pour viter les attaques de l'intercepteur . Par exemple, vous pourriez utiliser un
rseau priv pour le trafic de la journalisation de la tolrance aux pannes.
Figure 31. Machine virtuelle principale et machine virtuelle secondaire dans une paire avec Fault
Tolerance
primaire

secondaire

applications

applications

systme
d'exploitation
client

journalisation du trafic

VMware

systme
d'exploitation
client

VMware

client
ENREGISTREMENT
vnements non dterministes
Entre (rseau, utilisateur),
E/S asynchrone (disque,
priphriques) vnements
de la minuterie de l'UC

RPTITION
vnements non dterministes
Rsultat = excution
reproductible de la
machine virtuelle

Les machines virtuelles principale et secondaire changent des signaux de pulsation en continu. Cet change
permet la paire de machines virtuelles de contrler mutuellement leur tat pour assurer le maintien
permanent de Fault Tolerance. Un basculement transparent se produit en cas de dfaillance de l'hte sur
lequel la machine virtuelle principale est excute. Dans ce cas, la machine virtuelle secondaire est
immdiatement active pour remplacer la machine virtuelle principale. Une nouvelle machine virtuelle
secondaire dmarre et la redondance de Fault Tolerance est rtablie en quelques secondes. Si l'hte de la
machine virtuelle secondaire devient dfectueux, il est aussi immdiatement remplac. Dans l'un ou l'autre
cas, les utilisateurs ne constatent aucune interruption de service ni perte de donnes.
Une machine virtuelle tolrante aux pannes et sa copie secondaire ne sont pas autorises fonctionner sur le
mme hte. Cette restriction garantit qu'une dfaillance de l'hte ne peut pas entraner la perte des deux
machines virtuelles. Vous pouvez aussi utiliser les rgles d'affinit entre machine virtuelle et hte pour
prciser les htes sur lesquels certaines machines virtuelles peuvent tre excutes. Si vous utilisez ces
rgles, souvenez-vous que pour chaque machine virtuelle principale affecte par une rgle prcise, la
machine virtuelle secondaire qui y est associe est aussi affecte par la mme rgle. Pour plus d'informations
sur les rgles d'affinit, reportez-vous la documentation Gestion des ressources vSphere.

42

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Fault Tolerance vite les situations de division qui peuvent se traduire par deux copies actives d'une
machine virtuelle aprs la reprise suite un dysfonctionnement. Le verrouillage atomique des fichiers sur
les stockages partags est utilis pour coordonner le basculement de faon ce qu'un ct seulement
continue excuter la machine virtuelle principale et une nouvelle machine virtuelle secondaire est
automatiquement raffecte.
REMARQUE Le contrle anti-affinit est effectu la mise sous tension de la machine virtuelle principale. Les
machines virtuelles principales et secondaires peuvent tre sur les mme htes lorsqu'elles sont toutes deux
hors tension. C'est un comportement normal. Quand la machine virtuelle principale s'allume, la machine
virtuelle secondaire est dmarre sur un hte diffrent.

Utiliser Fault Tolerance avec DRS


Vous pouvez utiliser vSphere Fault Tolerance avec vSphere Distributed Resource Scheduler (DRS) quand la
fonction Compatibilit amliore de vMotion (EVC) est active. Ce processus permet aux machines
virtuelles tolrantes aux pannes de bnficier d'un meilleur placement initial et d'tre incluses dans les
calculs d'quilibrage de charge du cluster.
Quand EVC est activ pour un cluster, DRS met les recommandations de placement initiales pour les
machines virtuelles tolrantes aux pannes, les dplace pendant le rquilibrage de la charge du cluster et
vous autorise attribuer un niveau d'automatisation DRS aux machines virtuelles principales (la machine
virtuelle secondaire adopte toujours le mme paramtre que la machine virtuelle principale associe).
DRS ne place pas plus d'un nombre prdfini de machines virtuelles principales ou secondaires sur un hte
au cours du placement initial ou de l'quilibrage de la charge. Cette limite est contrle par l'option avance
das.maxftvmsperhost. La valeur par dfaut de cette option est de 4. Mais si vous choisissez une valeur nulle,
DRS ignore cette restriction.
Quand vSphere Fault Tolerance est utilis pour les machines virtuelles d'un cluster pour lequel EVC est
dsactiv, les machines virtuelles tolrantes aux pannes reoivent des niveaux d'automatisation DRS
"dsactivs". Dans ce type de cluster, chaque machine virtuelle principale est uniquement mise sous tension
sur son hte enregistr, sa machine virtuelle secondaire est place automatiquement et aucune des machines
virtuelles tolrantes aux pannes n'est dplace pour l'quilibrage de charge.
Si vous utilisez des rgles d'affinit avec deux machines virtuelles tolrantes aux pannes, une rgle d'affinit
VM-VM s'applique uniquement la machine virtuelle principale, tandis qu'une rgle d'affinit machine
virtuelle-hte s'applique la fois la machine virtuelle principale et sa machine virtuelle secondaire. Si
une rgle d'affinit VM-VM est dfinie pour une machine virtuelle principale, DRS tente de corriger toutes
les violations survenant aprs un basculement (c'est--dire, aprs le dplacement effectif de la machine
virtuelle principale vers un nouvel hte).

Cas d'utilisation de Fault Tolerance


Plusieurs situations types peuvent bnficier de l'utilisation de vSphere Fault Tolerance.
Fault Tolerance assure un meilleur niveau de continuit d'activit que vSphere HA. Lorsqu'une machine
virtuelle secondaire doit intervenir pour remplacer son homologue, la machine virtuelle principale, la
machine virtuelle secondaire joue immdiatement le rle de machine virtuelle principale, l'tat de la
machine virtuelle restant entirement prserv. Les applications sont dj en cours d'excution et les
donnes conserves en mmoire ne doivent pas tre ressaisies ou recharges. Ce n'est pas le cas du
basculement assur par vSphere HA qui redmarre les machines virtuelles affectes par un
dysfonctionnement.
Ce haut niveau de continuit et la meilleure protection des informations d'tats et des donnes informe les
scnarios du dploiement possible de Fault Tolerance.
n

VMware, Inc.

Les applications qui doivent tre disponibles en permanence, surtout celles prsentant des connexions
longues dures de clients que les utilisateurs veulent conserver pendant la dfaillance matrielle.

43

Disponibilit vSphere

Applications personnalises qui n'ont pas d'autres moyens de former un cluster.

Cas o la grande disponibilit peut tre assure par des solutions de formation de cluster
personnalises qui sont trs compliques configurer et entretenir.

Fault Tolerance la demande


Un autre cas pratique de protection d'une machine virtuelle par Fault Tolerance s'intitule Fault Tolerance
la demande. Dans ce cas, une machine virtuelle est correctement protge par vSphere HA pendant son
fonctionnement normal. Pendant certaines priodes critiques, vous voudrez renforcer la protection de la
machine virtuelle. Pendant la production d'un rapport trimestriel, par exemple, dont l'interruption pourrait
retarder la mise disposition d'informations cruciales pour une mission. vSphere Fault Tolerance permet de
protger cette machine virtuelle avant la production du rapport, puis d'arrter ou de dsactiver Fault
Tolerance aprs la publication du rapport. Vous pouvez utiliser Fault Tolerance la demande pour protger
la machine virtuelle pendant une priode critique et revenir aux ressources normales pour les oprations
non critiques.

Liste de vrification de Fault Tolerance


La liste de vrification suivante contient les spcifications en matire de cluster, d'hte et de machine
virtuelle que vous devez connatre avant d'utiliser vSphere Fault Tolerance.
Consultez cette liste avant de configurer Fault Tolerance. Vous pouvez galement utiliser l'utilitaire
VMware SiteSurvey (tlchargeable sur http://www.vmware.com/download/shared_utilities.html) pour
mieux comprendre les problmes de configuration associs au cluster, l'hte et aux machines virtuelles
utiliss pour vSphere FT.
REMARQUE Le basculement des machines virtuelles tolrantes aux pannes ne dpend pas de vCenter Server,
mais vous devez utiliser vCenter Server pour configurer vos clusters de Fault Tolerance.

Spcifications des clusters pour Fault Tolerance


Les exigences suivantes aux clusters doivent tre remplies avant d'utiliser Fault Tolerance.
n

Deux htes certifis FT au minimum utilisant la mme version de Fault Tolerance ou le mme numro
de version d'hte. Le numro de version de Fault Tolerance apparat dans l'onglet Rsum d'un hte
dans vSphere Web Client.
REMARQUE Pour les htes hrits antrieurs ESX/ESXi 4.1, cet onglet numre les numros de version
des htes. Les correctifs peuvent provoquer une variation des numros de version d'hte entre les
installations ESX et ESXi. Pour vous assurer que vos htes hrits sont compatibles avec FT, ne
mlangez pas les htes hrits ESX et les htes ESXi dans une paire FT.

44

Les htes ESXi ont accs aux mmes banques de donnes et rseaux des machines virtuelles. Reportezvous la section Pratiques d'excellence pour Fault Tolerance , page 56.

Journalisation de Fault Tolerance et rseau vMotion configur. Reportez-vous la section Configurer


la mise en rseau des machines htes dans vSphere Web Client , page 47.

Cluster vSphere HA cr et activ. Reportez-vous la section Crer un cluster vSphere HA , page 28.
vSphere HA doit tre activ avant la mise sous tension des machines virtuelles tolrantes aux pannes ou
avant l'ajout d'un hte dans un cluster qui prend dj en charge des machines virtuelles tolrantes aux
pannes.

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Conditions requises pour les htes pour Fault Tolerance


Les conditions suivantes concernant les htes doivent tre remplies avant d'utiliser Fault Tolerance.
n

Les htes doivent avoir des processeurs appartenant au groupe de processeurs compatibles avec FT. Il
est galement fortement recommand que les processeurs des htes soient compatibles entre eux.
Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour
obtenir des informations sur les processeurs pris en charge.

Les htes doivent avoir une licence pour Fault Tolerance.

Les htes doivent tre certifis pour Fault Tolerance. Reportez-vous la section
http://www.vmware.com/resources/compatibility/search.php et slectionnez Recherche par jeux
compatibles tolrants aux pannes pour dterminer si vos htes sont certifis.

La configuration de chaque hte implique l'activation de la virtualisation matrielle (HV) dans le BIOS.

Pour confirmer la compatibilit des htes dans le cluster pour la prise en charge de la tolrance aux pannes,
vous pouvez aussi effectuer des vrifications de conformit de profils comme dcrit dans Crer un cluster
et vrifier la conformit dans vSphere Web Client , page 50.

Conditions des machines virtuelles pour Fault Tolerance


Les conditions des machines virtuelles suivantes doivent tre remplies avant d'utiliser Fault Tolerance.
n

Aucun priphrique non pris en charge n'est attach la machine virtuelle. Reportez-vous la section
Interoprabilit de Fault Tolerance , page 45.

Les machines virtuelles doivent tre conserves dans des fichiers de RDM virtuel ou de disque de
machine virtuelle (VMDK) qui sont approvisionns en lourd. Lorsqu'une machine virtuelle est
conserve dans un fichier VMDK qui est approvisionn en allg et que vous tentez d'activer Fault
Tolerance, un message vous avertit que le fichier VMDK doit tre converti. Vous devez mettre hors
tension la machine virtuelle pour excuter la conversion.

vSphere Fault Tolerance n'est pas pris en charge sur les disques de machine virtuelle de plus de 2 To.

Les fonctions incompatibles ne doivent pas tre excutes avec les machines virtuelles tolrantes aux
pannes. Reportez-vous la section Interoprabilit de Fault Tolerance , page 45.

Les fichiers de machines virtuelles doivent tre conservs dans un stockage partag. Les solutions de
stockage partag approuves comprennent Fibre Channel, iSCSI (matriel et logiciel), NFS et NAS.

Seules les machines virtuelles avec un seul vCPU sont compatibles avec Fault Tolerance.

Les machines virtuelles doivent tre excutes sur l'un des systmes d'exploitation clients pris en
charge. Consultez l'article de la base de connaissances de VMware sur
http://kb.vmware.com/kb/1008027 pour plus d'informations.

Interoprabilit de Fault Tolerance


Avant de configurer vSphere Fault Tolerance, vous devez connatre les fonctions et produits incompatibles
avec Fault Tolerance.

Fonctions vSphere non prises en charge par Fault Tolerance


Les fonctions vSphere suivantes ne sont pas prises en charge pour les machines virtuelles tolrantes aux
pannes.
n

Snapshots. Les snapshots doivent tre supprims ou engags avant l'activation de Fault Tolerance sur
une machine virtuelle. De plus, il n'est pas possible de prendre des snapshots de machines virtuelles sur
lesquelles Fault Tolerance est active.

VMware, Inc.

45

Disponibilit vSphere

Stockage vMotion Il n'est pas possible d'appeler le stockage vMotion pour les machines virtuelles pour
lesquelles Fault Tolerance est active. Pour migrer le stockage, il faut mettre hors tension
temporairement Fault Tolerance et excuter l'action de stockage vMotion. Une fois ceci fait, vous
pouvez ractiver Fault Tolerance.

Clones lis. Il n'est pas possible d'activer Fault Tolerance sur une machine virtuelle qui est lie un
clone et il n'est pas non plus possible de crer un clone li partir d'une machine virtuelle dont Fault
Tolerance est active.

Sauvegardes des machines virtuelles. Il n'est pas possible de sauvegarder une VM ayant la FT active et
utilisant vStorage API for Data Protection, vShpere Data Protection ou tout autre produit de
sauvegarde similaire exigeant l'utilisation d'un snapshot de VM, comme effectu par ESXi. Pour
sauvegarder une machine virtuelle tolrante aux pannes de cette faon, il faut pralablement dsactiver
la tolrance aux pannes, puis la ractiver aprs la sauvegarde. Les snapshots de stockage bass sur une
baie n'affectent pas la tolrance aux pannes.

Virtual SAN.

Fonctions et priphriques incompatibles avec Fault Tolerance


Pour qu'une machine virtuelle soit compatible avec Fault Tolerance, celle-ci ne doit pas utiliser les fonctions
ou priphriques suivants.
Tableau 31. Fonctions et priphriques incompatibles avec Fault Tolerance et les actions correctives

46

Fonction ou priphrique incompatible

Action corrective

Machines virtuelles multiprocesseur symtrique (SMP).


Seules les machines virtuelles avec un seul vCPU sont
compatibles avec Fault Tolerance.

Reconfigurez la machine virtuelle comme vCPU unique.


De nombreuses charges de travail prsentent de bonnes
performances avec une configuration vCPU unique.

Mappage disque brut physique (RDM).

Reconfigurez les machines virtuelles avec des


priphriques virtuels pris en charge par des RDM
physiques de faon ce qu'ils utilisent des RDM virtuels
la place.

Lecteur de CD-ROM ou de disquettes virtuels pris en


charge par un priphrique physique ou distant.

Retirez le lecteur de CD-ROM ou de disquettes virtuels ou


reconfigurez la sauvegarde avec une image ISO installe
sur le stockage partag.

Clients paravirtualiss.

Si la paravirtualisation n'est pas requise, reconfigurez la


machine virtuelle sans VMI ROM.

Priphrique USB et audio.

Dconnectez ces priphriques de la machine virtuelle.

Virtualisation d'identification N-Port (NPIV).

Dsactivez la configuration NPIV de la machine virtuelle

relais de adaptateurs rseau

Cette fonction n'est pas prise en charge par Fault Tolerance


et doit donc tre dsactive.

Pilotes rseau vlance.

Fault Tolerance ne prend pas en charge les machines


virtuelles qui sont configures avec les adaptateurs rseaux
virtuelles vlance. Toutefois, vmxnet2, vmxnet3 et e1000
sont intgralement pris en charge.

Disques virtuels pris en charge par des disques de


provisionnement lourds ou lgers dont les fonctions de
cluster ne sont pas actives.

Lorsque vous activez Fault Tolerance, la conversion au


format de disque appropri est effectue par dfaut. Vous
devez mettre hors tension la machine virtuelle pour
dclencher cette conversion.

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Tableau 31. Fonctions et priphriques incompatibles avec Fault Tolerance et les actions correctives
(suite)
Fonction ou priphrique incompatible

Action corrective

Connexion de priphriques chaud

La fonction de connexion chaud est automatiquement


dsactive pour les machines virtuelles tolrantes aux
pannes. Pour la connexion des priphriques chaud
(ajout ou suppression), vous devez mettre hors tension
temporairement Fault Tolerance, effectuer la connexion
chaud, puis ractiver Fault Tolerance.
REMARQUE Lorsque vous utilisez Fault Tolerance, la
modification des paramtres d'une carte rseau virtuelle
pendant le fonctionnement d'une machine virtuelle
constitue une connexion chaud, car cela exige de
dbrancher la carte rseau, puis de la rebrancher .
Prenons l'exemple d'une carte rseau virtuelle pour une
machine virtuelle en cours d'excution. Si vous modifiez le
rseau auquel la carte rseau virtuelle est connecte, la
tolrance aux pannes doit pralablement tre arrte.

Extended Page Tables/Rapid Virtualization Indexing


(EPT/RVI).

EPT/RVI est automatiquement dsactiv pour les machines


virtuelles pour lesquelles Fault Tolerance est active.

Ports srie ou parallles

Dconnectez ces priphriques de la machine virtuelle.

IPv6

Utilisez les adresses IPv4 avec la carte rseau de


journalisation FT.

Priphriques vido dont la 3D est active.

Fault Tolerance ne prend pas en charge les priphriques


vido dont la 3D est active.

Microprogramme EFI virtuel

Assurez-vous que la VM est configure pour utiliser le


firmware du BIOS avant d'installer le systme
d'exploitation d'hte.

Prparer votre cluster et vos htes Fault Tolerance


Pour activer vSphere Fault Tolerance pour votre cluster, les conditions pralables de la fonction doivent tre
remplies et il est ncessaire d'effectuer quelques tapes de configuration sur les htes. Une fois ces tapes
accomplies et votre cluster cr, vous pouvez aussi vrifier que la configuration est conforme aux exigences
requises pour l'activation de Fault Tolerance.
Les tches devant tre effectues avant de tenter d'activer Fault Tolerance pour le cluster sont les suivantes :
n

Configurer la mise en rseau de chaque hte

Crer un cluster vSphere HA, ajouter des htes et vrifier la conformit

Lorsque le cluster et les htes sont prts, vous pouvez activer Fault Tolerance pour vos machines virtuelles.
Reportez-vous la section Activer Fault Tolerance pour les machines virtuelles dansvSphere Web Client ,
page 52.

Configurer la mise en rseau des machines htes dans vSphere Web Client
Vous devez configurer deux commutateurs rseau diffrents sur chacun des htes que vous souhaitez
ajouter un cluster vSphere HA, de faon ce que l'hte prenne aussi en charge vSphere Fault Tolerance.
Pour activer Fault Tolerance d'un hte, vous devez excuter deux fois cette procdure, une fois pour chaque
option de groupe de ports afin de vous assurer qu'il y a suffisamment de bande passante disponible pour la
journalisation de Fault Tolerance. Slectionnez une option, terminez la procdure, et recommencez-la une
seconde fois en slectionnant l'autre option de groupes de port.

VMware, Inc.

47

Disponibilit vSphere

Prrequis
Des adaptateurs rseau (NIC) de plusieurs giga-octets sont ncessaires. Pour chaque hte compatible avec
Fault Tolerance (Fault Tolerance), il faut au minimum deux adaptateurs rseau physiques de plusieurs
gigaoctets : par exemple, l'une ddie la journalisation de Fault Tolerance et l'autre ddie vMotion.
Utilisation de trois adaptateurs rseau ou plus pour assurer la disponibilit.
REMARQUE Les cartes rseau de journalisation vMotion et de tolrance aux pannes doivent tre sur des sousrseaux diffrents. IPv6 n'est pas pris en charge sur la carte rseau de journalisation FT.
Procdure
1

Dans vSphere Web Client, accdez l'hte

Cliquez sur longlet Grer, puis cliquez sur Mise en rseau.

Cliquer sur Actions > Toutes les Actions vCenter > Ajouter rseau.

Slectionnez Adaptateur de rseau VMkernel sur la page Slectionner un type de connexion et cliquez
sur Suivant.

Slectionner Nouveau commutateur standard et cliquer sur Suivant.

Attribuer des adaptateurs rseaux physiques gratuits l'interrupteur, puis cliquer sur Suivant.

Fournir une tiquette rseau et activer les services que vous dsirez et cliquer sur Suivant.

Fournir une adresse IP et le masque de sous-rseau et cliquer sur Terminer aprs avoir examin vos
paramtres.

Lorsque vous avez cr la fois un commutateur virtuel de journalisation vMotion et de Fault Tolerance,
vous pouvez crer d'autres commutateurs virtuels en cas de besoin. Ajoutez ensuite l'hte au cluster et
terminez toutes les tapes ncessaires l'activation de Fault Tolerance.
Suivant
REMARQUE Si vous configurez la mise en rseau pour la prise en charge de Fault Tolerance mais que par la
suite vous dsactivez le port de journalisation de Fault Tolerance, les paires de machines virtuelles Fault
Tolerance qui sont dj sous tension le restent. Mais dans le cas de situation de basculement, une nouvelle
VM secondaire n'est pas dmarre aprs le remplacement de la VM principale par sa VM secondaire. Par
consquent, la nouvelle VM principale fonctionne en tat non protg.

Exemple de configuration de la mise en rseau des htes de Fault Tolerance


Cet exemple dcrit la configuration du rseau hte de Fault Tolerance dans un dploiement typique avec
quatre cartes NIC de 1 Go. Ce dploiement garantit un service adquat pour chaque type de trafic identifi
dans cet exemple il pourrait tre considr comme la meilleure configuration possible.
Fault Tolerance assure une disponibilit totale pendant toute la dure de la dfaillance d'un hte physique
due une coupure de l'alimentation lectrique, une panique du systme ou toute autre raison de ce type.
Les dfaillances au niveau du chemin de stockage ou du rseau, ou encore de tout autre composant du
serveur physique qui n'ont pas de rpercussions sur l'tat oprationnel de l'hte ne provoquent pas un
basculement de Fault Tolerance sur la machine virtuelle secondaire. Par consquent, les clients sont
vivement encourags utiliser la redondance approprie (par exemple, l'association de adaptateurs rseau)
pour rduire les risques de perte de connexion des machines virtuelles en faveur de composants
d'infrastructure comme des rseaux ou des baies de stockage.

48

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Les rgles d'association des adaptateurs rseau sont configures sur les groupes de port vSwitch (vSS) (ou
groupes de ports virtuels distribus pour vDS) et rgissent la manire dont vSwitch gre et rpartit le trafic
sur les adaptateurs rseau physiques (vmnics) partir des machines virtuelles et des ports vmkernel. Un
groupe de ports unique est gnralement utilis pour chaque type de trafic, chacun tant gnralement
associ un VLAN diffrent.

Instructions de configuration de mise en rseau des htes


Les directives suivantes vous permettent de configurer la mise en rseau des htes pour la prise en charge
de Fault Tolerance avec diffrentes combinaisons de types de trafic (par exemple, NFS) et plusieurs
adaptateurs rseau physiques.
n

Rpartissez chaque association de adaptateurs rseau sur deux commutateurs physiques assurant la
continuit des domaines L2 pour chaque VLAN entre les deux commutateurs physiques.

Utilisez des rgles d'association dterministe pour vous assurer que des types de trafic particuliers
prsentent une affinit avec une carte rseau particulire (active/veille) ou un ensemble de adaptateurs
rseau (par exemple, ID port virtuel d'origine).

Quand des rgles active/veille sont utilises, associez les types de trafic pour rduire les rpercussions
dans le cas de basculement o les deux types de trafic partagent un vmnic.

Quand des rgles active/veille sont utilises, configurez tous les adaptateurs actifs pour un type de
trafic particulier (par exemple, journalisation de la tolrance aux pannes) sur le mme commutateur
physique. Cela rduit le nombre de bonds rseau et diminue les possibilits de surabonner le
commutateur des liaisons de commutateurs.

Exemple de configuration avec quatre cartes NIC de 1 Go


Figure 3-2 dcrit la configuration du rseau pour un seul hte ESXi avec quatre cartes NIC de 1 Go prenant
en charge Fault Tolerance. Les autres htes du cluster FT seraient configurs de la mme manire.
Cet exemple utilise quatre groupes de ports configurs comme suit :
n

VLAN A : Port rseau des machines virtuelles actif au niveau du groupe sur vmnic2 (vers le
commutateur physique #1) ; en veille sur vmnic0 (vers le commutateur physique #2.)

VLAN B : Port rseau de gestion actif au niveau du groupe sur vmnic0 (vers le commutateur physique
#2) ; en veille sur vmnic2 (vers le commutateur physique #1.)

VLAN C : Port de vMotion actif au niveau du groupe sur vmnic1 (vers le commutateur physique #2) ;
en veille sur vmnic3 (vers le commutateur physique #1.)

VLAN D : Port de journalisation FT actif au niveau du groupe sur vmnic3 (vers le commutateur
physique #1) ; en veille sur vmnic1 (vers le commutateur physique #2.)

La journalisation vMotion et FT peut partager le mme VLAN (configurez le mme nombre de VLAN dans
les deux groupes de ports), mais exige que leurs propres adresses IP uniques rsident dans diffrents sousrseaux IP. Toutefois, des VLAN spars peuvent tre prfrs si des restrictions de qualit de service (QoS)
sont en vigueur sur le rseau physique avec des rgles de QoS bases sur VLAN. QoS est particulirement
utilise lorsque le trafic concurrent intervient, par exemple, lorsque plusieurs bonds de commutateurs
physiques sont utiliss ou quand un basculement a lieu et que plusieurs types de trafic entrent en
concurrence pour des ressources rseau.

VMware, Inc.

49

Disponibilit vSphere

Figure 32. Exemple de configuration de mise en rseau pour Fault Tolerance


FT
machine
virtuelle

machine
virtuelle

machine
virtuelle

vMotion

rseau de
gestion
vmkernel

VLAN
A

vmnic2
Jonctions rseau VLAN
sur des liaisons
montantes Ports de
commutateur physique
configurs comme jonctions
VLAN et porte les
VLAN A, B, C et D

rgles d'association de
groupes de ports
active
mode veille

VLAN
B

vmnic0

vmnic3

VLAN
D

VLAN
C

vmnic1
vSwitch (vSS or vDS)
dans le mode VST (Virtual
Switch Trunking) -- trames
balises par VLAN transmises
sur les liaisons montantes
vers/ partir de vmnics

commutateur
physique 1

commutateur
physique 2

Crer un cluster et vrifier la conformit dans vSphere Web Client


vSphere Fault Tolerance est utilis dans le cadre d'un cluster vSphere HA. Aprs avoir configur la mise en
rseau de chaque hte, crez le cluster vSphere HA et ajoutez-y les htes. Vous pouvez vrifier que le cluster
est configur correctement et qu'il est conforme aux exigences pour l'activation de Fault Tolerance.
Procdure
1

Dans vSphere Web Client, accdez au cluster.

Cliquez sur l'onglet Surveiller puis sur Conformit de profil.

Cliquez sur Vrifier la conformit maintenant pour excuter les tests de conformit.

Les rsultats des tests de conformit apparaissent et la conformit ou non de chaque hte s'affiche.

Assurer Fault Tolerance des machines virtuelles


Aprs avoir suivi toutes les tapes ncessaires l'activation de vSphere Fault Tolerance pour votre cluster,
vous pouvez utiliser cette fonction en l'activant sur des machines virtuelles individuelles.
L'option permettant d'activer Fault Tolerance n'est pas disponible (grise) si l'une de ces conditions
s'applique :

50

La machine virtuelle rside sur un hte qui n'a pas de licence pour la fonction.

La machine virtuelle rside sur un hte qui est en mode maintenance ou standby.

La machine virtuelle est dconnecte ou orpheline (son fichier .vmx n'est pas accessible).

L'utilisateur n'a pas l'autorisation d'activer la fonction.

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Si l'option pour activer Fault Tolerance est disponible, cette tche doit encore tre valide et peut chouer si
certaines conditions n'est pas remplies.

Contrles de validation pour l'activation de Fault Tolerance


Plusieurs contrles de validation sont excuts sur une machine virtuelle avant de pouvoir activer Fault
Tolerance.
n

Le contrle de certificat SSL doit tre activ dans les paramtres de vCenter Server.

L'hte doit se trouver dans un cluster vSphere HA ou un cluster mixte vSphere HA et DRS.

L'hte doir avoir ESX/ESXi 4.0 ou ultrieur install.

La machine virtuelle ne doit pas avoir plusieurs vCPU.

La machine virtuelle ne doit pas avoir de snapshots.

La machine virtuelle ne doit pas tre un modle.

La machine virtuelle ne doit pas avoir vSphere HA dsactiv.

Aucun priphrique vido dont la 3D est active ne doit tre prsent sur la machine virtuelle.

Plusieurs vrifications de validation supplmentaires sont effectues pour les machines virtuelles sous
tension (ou celles qui sont en cours de mise sous tension).
n

Le BIOS des htes o rsident les machines virtuelles tolrantes aux pannes doit avoir la virtualisation
matrielle (HV, Hardware Virtualization) active.

L'hte qui prend en charge la machine virtuelle principale doit avoir un processeur qui prend en charge
Fault Tolerance.

L'hte qui prend en charge la machine virtuelle secondaire doit avoir un processeur qui prend en
charge Fault Tolerance et dont la famille ou le modle de CPU est le mme que l'hte qui prend en
charge la machine virtuelle principale.

Les composants matriels doivent tre certifis compatibles avec Fault Tolerance. Pour en avoir la
confirmation, consultez le Guide de compatibilit VMware sur
http://www.vmware.com/resources/compatibility/search.php et slectionnez Recherche par ensembles
compatibles Fault Tolerance.

La combinaison du systme de la machine virtuelle d'exploitation invit et le processeur doit tre prise
en charge par Fault Tolerance (par exemple, Solaris de 32 bits sur des processeurs AMD n'est pas
actuellement pris en charge). Consultez l'article de la base de connaissances de VMware sur
http://kb.vmware.com/kb/1008027 pour obtenir des informations sur les combinaisons de processeurs et
les systmes d'exploitation clients pris en charge.

La configuration de la machine virtuelle doit tre valide pour tre utilise avec une Fault Tolerance (par
exemple, la configuration ne peut comporter aucun priphrique non pris en charge.).

Quand votre effort d'activation de Fault Tolerance pour une machine virtuelle russit aux contrles de
validation, la machine virtuelle secondaire est cre. Le placement et le statut immdiat de la machine
virtuelle secondaire dpendent de l'tat sous tension ou hors tension de la machine virtuelle principale
quand vous avez activ Fault Tolerance.
Si la machine virtuelle principale est sous tension :
n

L'tat complet de la machine virtuelle principale est copi et la machine virtuelle secondaire est cre,
place sur un hte compatible distinct et mise sous tension si elle passe le contrle d'admission.

Le statut de Fault Tolerance affich pour la machine virtuelle est protge.

VMware, Inc.

51

Disponibilit vSphere

Si la machine virtuelle principale est hors tension :


n

La machine virtuelle secondaire est cre immdiatement et enregistre dans le cluster d'un hte (Il doit
tre enregistr sur un hte plus appropri lorsqu'il est mis sous tension.)

La machine virtuelle secondaire est mise sous tension seulement aprs la mise sous tension de la
machine virtuelle principale.

Le statut de Fault Tolerance affich pour la machine virtuelle est Non protge, VM pas en excution.

Quand vous essayez de mettre sous tension la machine virtuelle primaire aprs l'activation de Fault
Tolerance, les contrles supplmentaires de validation sont excuts. Pour mettre sous tension
correctement, la machine virtuelle ne doit pas employer la paravirtualisation (VMI).
Aprs le passage de ces contrles, les machines virtuelles principales et secondaires sont mises sous
tension et places sur les htes distincts et compatibles. Le statut de Fault Tolerance de la machine
virtuelle est marqu comme Protge.

Activer Fault Tolerance pour les machines virtuelles dans vSphere Web Client
Vous pouvez activer vSphere Fault Tolerance via vSphere Web Client.
Quand Fault Tolerance est active, vCenter Server rinitialise la limite de mmoire de la VM et dfinit la
rservation de mmoire en fonction de la taille de la mmoire de la VM. Si Fault Tolerance reste active, il
n'est pas possible de modifier la rservation de mmoire, sa taille, la limite ou les partages. Quand Fault
Tolerance est dsactive, les valeurs d'origine de tous les paramtres qui ont t modifis ne sont pas
restaures.
Connectez vSphere Web Client vCenter Server en utilisant un compte ayant des droits d'accs
administrateur au cluster.
Procdure
1

Dans vSphere Web Client, accdez la VM pour laquelle vous souhaitez activer Fault Tolerance

Cliquez avec le bouton droit la machine virtuelle et slectionner Toutes les actions vCenter > Fault
Tolerance > Dmarrer Fault Tolerance.

Cliquez sur Oui.

La VM spcifie est dsigne comme VM principale et une VM secondaire est tablie sur un autre hte. La
machine virtuelle principale est dsormais tolrante aux pannes.

Dfinir les options pour les machines virtuelles Fault Tolerant dans
vSphere Web Client
Aprs avoir activ vSphere Fault Tolerance pour une machine virtuelle, de nouvelles options sont ajoutes
la section Tolrance aux pannes de son menu contextuel.
Dans le vSphere Web Client, il existe des options pour mettre hors tension ou dsactiver Fault Tolerance,
faire migrer la machine virtuelle secondaire, tester le basculement et tester le redmarrage de la machine
virtuelle secondaire.

52

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Dsactiver Fault Tolerance dans vSphere Web Client


La dsactivation de vSphere Fault Tolerance supprime la machine virtuelle secondaire, sa configuration et
l'ensemble de son historique.
Utilisez l'option Dsactiver Fault Tolerance si vous n'avez pas prvu de ractiver la fonction. Dans le cas
contraire, utilisez l'option Dsactiver Fault Tolerance.
REMARQUE Si la VM secondaire rside sur un hte en mode maintenance, dconnect ou qui ne rpond pas,
vous ne pouvez pas utiliser l'option Arrter tFault Tolerance. Dans ce cas, dsactivez, puis activez Fault
Tolerance.
Procdure
1

Dans vSphere Web Client, accdez la VM pour laquelle vous souhaitez arrter Fault Tolerance.

Cliquez avec le bouton droit sur la machine virtuelle et slectionner Toutes les actions vCenter > Fault
Tolerance > Dsactiver Fault Tolerance.

Cliquez sur Oui.

Fault Tolerance est arrte pour la machine virtuelle slectionne. L'historique, ainsi que la VM secondaire
de la VM slectionne sont supprims.

Migrer une VM secondaire dans vSphere Web Client


Une fois que vSphere Fault Tolerance est activ pour une VM principale, vous pouvez migrer sa VM
secondaire associe.
Procdure
1

Dans vSphere Web Client, accdez la VM primaire pour laquelle vous souhaitez migrer sa VM
secondaire.

Cliquez-droit sur la machine virtuelle et slectionner Toutes les actions vCenter > Fault Tolerance >
Migration secondaire.

Remplissez les options de la bote de dialogue Migrer et validez les changements que vous faites.

Cliquez sur Terminer pour appliquer les modifications.

La VM secondaire associe la machine virtuelle insensible aux dfaillances slectionne est migre vers
l'hte spcifi.

Dsactiver Fault Tolerance dans vSphere Web Client


La dsactivation de vSphere Fault Tolerance pour une machine virtuelle suspend sa protection de Fault
Tolerance, mais conserve la machine virtuelle secondaire, sa configuration et tout l'historique. Utilisez cette
option pour ractiver la protection Fault Tolerance l'avenir.
Procdure
1

Dans vSphere Web Client, accdez la VM pour laquelle vous souhaitez dsactiver Fault Tolerance.

Cliquez-droit sur la machine virtuelle et slectionner Toutes les actions vCenter > Fault Tolerance >
Dsactiver Fault Tolerance.

Cliquez sur Oui.

Fault Tolerance est dsactive pour la machine virtuelle slectionne. L'historique et la machine virtuelle
secondaire de la machine virtuelle slectionne sont prservs et seront utiliss si la fonction ractive.

VMware, Inc.

53

Disponibilit vSphere

Suivant
Une fois que vous avez dsactiv Fault Tolerance, l'option du menu devient Activer Fault Tolerance.
Activer cette option pour ractivez cette fonction.

Tester le basculement de Fault Tolerance dans vSphere Web Client


Vous pouvez provoquer une situation de basculement pour une VM principale slectionne afin de tester la
protection de Fault Tolerance.
Cette option est indisponible (grise) si la VM est mise sous tension.
Procdure
1

Dans vSphere Web Client accdez la VM primaire pour laquelle vous souhaitez tester le basculement.

Cliquez avec le bouton droit sur la machine virtuelle et slectionner Toutes les actions vCenter > Fault
Tolerance > Tester le basculement.

Consultez les dtails sur le basculement dans la console de travail.

Cette tche provoque la dfaillance de la VM principale afin de s'assurer que la VM secondaire la remplace.
Une nouvelle VM secondaire est galement dmarre, pour replacer la VM principale dans un tat protg.

Tester le redmarrage de VM secondaire dans vSphere Web Client


Vous pouvez provoquer la dfaillance d'une VM secondaire afin de tester la protection Fault Tolerance
fournie pour une VM principale slectionne.
Cette option est indisponible (grise) si la VM est mise sous tension.
Procdure
1

Dans vSphere Web Client, accdez la VM primaire pour laquelle vous souhaitez effectuer le test.

Cliquez avec le bouton droit sur la machine virtuelle et slectionner Toutes les actions vCenter > Fault
Tolerance > Tester le redmarrage secondaire.

Consultez les dtails du test dans la Console des tches

Cette tche a pour consquence l'arrt de la VM secondaire qui assurait la protection Fault Tolerance pour la
VM principale slectionne. Une nouvelle VM secondaire est alors dmarre, replaant la la VM principale
dans un tat protg.

Consulter les informations sur les machines virtuelles Fault Tolerant


dans vSphere Web Client
Vous pouvez visualiser les machines virtuelles tolrantes aux pannes dans l'inventaire de vCenter Server en
utilisant vSphere Web Client.
REMARQUE Vous ne pouvez pas mettre hors tension Fault Tolerance de la machine virtuelle secondaire.
Le volet vSphere Fault Tolerance apparat dans l'onglet Rsum pour la machine virtuelle principale et
contient des informations sur la machine virtuelle.
tat de Fault Tolerance

Indique l'tat de Fault Tolerance de la machine virtuelle.


n

54

Protge. Indique que les machines virtuelles principale et secondaire


sont sous tension et fonctionnent comme prvu.

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Non protge. La VM secondaire ne fonctionne pas. Les raisons


possibles sont rpertories dans le tableau.
Tableau 32. Raisons de l'tat non protg de la machine virtuelle
principale
Raison de l'tat non protg

Description

Dmarrage

Fault Tolerance est en train de


dmarrer la VM secondaire. Ce
message n'est visible que pendant une
courte dure.

VM secondaire ncessaire

La machine virtuelle principale


fonctionne sans machine virtuelle
secondaire, ainsi la machine virtuelle
principale n'est actuellement pas
protge. Ceci se produit
gnralement quand il n'y a aucun
hte compatible dans le cluster
disponible pour la VM secondaire.
Remdiez cette situation en plaant
un hte compatible en ligne. S'il existe
un hte compatible en ligne dans le
cluster, il peut tre ncessaire
d'approfondir la question. Dans
certaines circonstances, la
dsactivation de Fault Tolerance puis
sa ractivation suffit pour corriger ce
problme.

Dsactiv

Fault Tolerance est actuellement


dsactive (aucune machine virtuelle
secondaire ne fonctionne). Ceci se
produit quand Fault Tolerance est
dsactive par l'utilisateur ou quand
vCenter Server dsactive Fault
Tolerance aprs avoir chou dans la
mise sous tension de la machine
virtuelle secondaire.

Machine virtuelle hors


fonctionnement

Fault Tolerance est active mais la


machine virtuelle est hors tension.
Mettez sous tension la machine
virtuelle pour obtenir l'tat Protg.

Emplacement
secondaire

Affiche l'hte ESXi sur lequel la machine virtuelle secondaire est hberge.

CPU secondaire totale

Indique l'utilisation du CPU de la machine virtuelle secondaire, exprime en


MHz.

Mmoire secondaire
totale

Utilisation de la mmoire de la machine virtuelle secondaire, exprime en


Mo.

Intervalle vLockstep

Intervalle de temps (en secondes) requis pour que la machine virtuelle


secondaire corresponde l'tat d'excution actuel de la machine virtuelle
primaire. En gnral, cet intervalle est infrieur une demi-seconde. Aucun
tat n'est perdu pendant un basculement, quelle que soit la valeur de
l'intervalle vLockstep.

Largeur de bande de
journalisation

Capacit rseau utilise pour envoyer les informations de journalisation de


vSphere Fault Tolerance, de l'hte excutant la machine virtuelle principale
l'hte excutant la machine virtuelle secondaire.

VMware, Inc.

55

Disponibilit vSphere

Pratiques d'excellence pour Fault Tolerance


Pour garantir des rsultats Fault Tolerance optimaux, vous devez respectez certaines meilleures pratiques.
En plus des informations suivantes, consultez le livre blanc Recommandations et considrations sur VMware
Fault Tolerance sur http://www.vmware.com/resources/techresources/10040.

Configuration d'hte
Tenez compte des meilleures pratiques suivantes lors de la configuration des htes.
n

Les htes excutant les machines virtuelles principales et secondaires doivent fonctionner des
frquences de processeur assez proches sinon la machine virtuelle secondaire risque de redmarrer plus
souvent. Les fonctions de gestion de l'alimentation de la plate-forme qui ne sont pas rgles selon la
charge de travail (modes de limitation de puissance et de basse frquence pour conomiser de l'nergie,
par exemple) peuvent entraner de fortes variations des frquences du processeur. Si des machines
virtuelles secondaires sont redmarres rgulirement, dsactivez tous les modes de gestion de
l'alimentation sur les htes excutant des machines virtuelles tolrantes aux pannes ou veillez ce que
tous les htes soient excuts avec les mme modes de gestion de l'alimentation.

Appliquez la mme configuration d'extension de jeux d'instructions (activ ou dsactiv) tous les
htes. Le processus d'activation ou de dsactivation des jeux d'instructions varie en fonction du BIOS.
Reportez-vous la documentation du BIOS de vos htes pour plus d'informations sur la configuration
des jeux d'instructions.

Clusters homognes
vSphere Fault Tolerance peut fonctionner dans des clusters contenant des htes non uniformes, mais il est
prfrable que les clusters aient des nuds compatibles. Au moment de la construction du cluster, tous les
htes doivent tre configurs comme suit :
n

Processeurs appartenant au mme groupe de processeurs compatibles.

Accs commun aux banques de donnes utilises par les machines virtuelles.

La mme configuration rseau de machines virtuelles.

La mme version d'ESXi.

Le mme numro de version de Fault Tolerance (ou numro de version d'hte pour les htes antrieurs
ESX/ESXi 4.1).

Les mmes paramtres de BIOS (gestion de l'alimentation et hyperthreading) pour tous les htes.

Excutez Vrifier la conformit pour identifier les incompatibilits et les corriger.

Performances
Pour accrotre la bande passante disponible pour le trafic de journalisation entre les machines virtuelles
principales et secondaires, utilisez une carte rseau de 10 Gbit et activez l'utilisation des Trames jumbo.

Stocker les images ISO sur des stockages partags pour un accs permanent
Les images ISO auxquelles accdent les machines virtuelles dont Fault Tolerance est active doivent tre
conserves sur des stockages partags accessibles aux deux instances de la machine virtuelle tolrante aux
pannes. Si vous utilisez cette configuration, le CD-ROM prsent dans la machine virtuelle continue de
fonctionner correctement, mme en cas de basculement.

56

VMware, Inc.

Chapitre 3 Assurer Fault Tolerance des machines virtuelles

Pour les machines virtuelles dont Fault Tolerance est active, il est possible d'utiliser les images ISO qui sont
uniquement accessibles par la machine virtuelle principale. Dans ce cas, la machine virtuelle principale peut
accder l'image ISO, mais en cas de basculement, le CD-ROM signale les erreurs comme s'il n'y avait pas
de support. Cette situation peut tre tolre si le CD-ROM est utilis pour une opration provisoire et non
critique comme une installation.

viter les partitions de rseau


Une partition de rseau survient quand un cluster vSphere HA connat une dfaillance du rseau de gestion
qui isole certains htes de vCenter Server et les isole les uns des autres. Reportez-vous la section
Partitions de rseau , page 16. En cas de partition, la protection de Fault Tolerance peut tre rduite.
Dans un cluster vSphere HA partitionn utilisant Fault Tolerance, la machine virtuelle principale (ou sa
machine virtuelle secondaire) pourrait se retrouver dans une partition gre par un hte principal qui n'est
pas responsable de cette machine virtuelle. Si un basculement est ncessaire, une machine virtuelle
secondaire est redmarre uniquement si la machine virtuelle principale se trouvait dans une partition gre
par un hte principal qui en tait responsable.
Pour rduire les risques de panne de votre rseau de gestion entranant une partition du rseau, suivez les
recommandations figurant dans Meilleures pratiques pour la mise en rseau , page 37.

Afficher les erreurs Fault Tolerance dans vSphere Web Client


Lorsque les tches lies votre implmentation de Fault Tolerance provoquent des erreurs, vous pouvez
afficher l'information leur sujet dans le volet Tches rcentes.
Le volet Tches rcentes affiche un rsum de chaque erreur sous l'onglet chec. Pour plus d'informations
sur les tches qui ont chou, cliquez sur Plus de tches pour ouvrir la Console des tches.
Dans la console des tches, chaque tche est rpertorie avec ses informations qui comprennent son Nom, sa
cible, et son tat. Dans la colonne tat, si la tche a chou, le type de faute gnre est dcrit. Pour plus
d'informations sur une tche, slectionnez-la et les dtails apparatront dans le volet sous la liste des tches.

Mettre niveau les htes utiliss pour Fault Tolerance


Lorsque vous mettez jour des htes qui contiennent des machines virtuelles tolrantes aux pannes, vrifiez
que les machines virtuelles principales et secondaires continuent tre excutes sur des htes ayant le
mme numro de version de tolrance aux pannes ou de numro de version d'hte (pour les htes
antrieurs ESX/ESXi 4.1).
Prrequis
Vrifiez que vous possdez des privilges d'administrateur sur les clusters.
Vrifiez que vous possdez des ensembles d'au moins quatre htes ESXi hbergeant des machines virtuelles
tolrantes aux pannes qui sont sous tension. Si les machines virtuelles sont hors tension, les machines
virtuelles principales et secondaires tolrantes aux pannes peuvent tre dplaces sur des htes de versions
diffrentes.
REMARQUE Cette procdure de mise niveau est adapte aux clusters de quatre nuds au minimum. Les
mmes instructions peuvent tre suivies avec un plus petit cluster, mais les intervalles sans protection seront
lgrement plus longs.
Procdure
1

Avec vMotion, migrez les machines virtuelles tolrantes aux pannes partir des deux htes.

Mettez niveau les deux htes vacus de faon ce qu'ils aient la mme version d'ESXi.

Dsactivez Fault Tolerance sur la machine virtuelle principale.

VMware, Inc.

57

Disponibilit vSphere

Avec vMotion, dplacez la machine virtuelle principale vers l'un des htes mis niveau.

Activez Fault Tolerance sur la machine virtuelle principale qui a t dplace.

Rpteztape 1 tape 5 pour autant de paires de machines virtuelles tolrantes aux pannes que les
htes mis niveau peuvent en accueillir.

Avec vMotion, rpartissez les machines virtuelles tolrantes aux pannes.

Tous les htes ESXi d'un cluster sont mis niveau.

Recommandations de configuration de vSphere Fault Tolerance


Vous devez respecter certaines directives lors de la configuration de Fault Tolerance.

58

En plus des machines virtuelles non tolrantes aux pannes, vous ne devez pas avoir plus de quatre
machines virtuelles (principales ou secondaires) tolrantes aux pannes par hte unique. Le nombre de
machines virtuelles tolrantes aux pannes que vous pouvez faire tourner en toute scurit sur chaque
hte est fonction de la taille et de la charge de travail, variables, de l'hte ESXi et des machines
virtuelles.

Si vous accdez au stockage partag par NFS, utilisez du matriel NAS ddi avec au moins une carte
rseau 1 Gbit pour atteindre les performances rseaux requises pour le bon fonctionnement de Fault
Tolerance.

Veillez ce qu'un pool de ressources contenant des machines virtuelles tolrantes aux pannes dispose
de rserves de mmoire dpassant la capacit de mmoire des machines virtuelles. La rserve de
mmoire d'une machine virtuelle tolrante aux pannes est dfinie par la taille de la mmoire de la
machine virtuelle lorsque Fault Tolerance est active. Sans cet excdent de pool de ressources, il risque
de ne pas y avoir de mmoire disponible comme capacit supplmentaire.

Utilisez 16 disques virtuels au maximum par machine virtuelle tolrante aux pannes.

Pour assurer la redondance et une protection maximale de Fault Tolerance, il est recommand d'avoir
au minimum trois htes par cluster. Dans une situation de basculement, on dispose ainsi d'un hte
capable de grer la nouvelle machine virtuelle secondaire qui est cre.

VMware, Inc.

Index

A
adresse d'isolation rseau 37
Architecture vSphere HA 11
arrt, Fault Tolerance 53
Association de adaptateurs rseau 38, 48
attributs avancs, vSphere HA 32

B
basculement transparent 9, 42

C
calcul de la taille d'emplacement 21
Capacit de basculement actuelle 21, 24
Capacit de basculement configure 21, 24
cas d'utilisation, Fault Tolerance 43
certificats SSL 17
choix de l'hte principal 12
cluster vSphere HA
contrle d'admission 20
cration 28, 50
htrognit 26
hte esclave 12
hte principal 12, 16
meilleures pratiques 35
planification 11
Compatibilit amliore de vMotion 43
compte d'utilisateur vpxuser 17
conditions pralables, Fault Tolerance 44
configuration de la mise en rseau, Fault
Tolerance 47, 48
configuration des options avances de vSphere
HA 32
continuit d'activit 7
contrle d'admission
configuration 30
rgle 30
types 20
vSphere HA 20
contrles de validation 50
cration d'un cluster vSphere HA 28

D
das.heartbeatdsperhost 16, 33
das.ignoreinsufficienthbdatastore 33
das.iostatsinterval 15, 33

VMware, Inc.

das.isolationaddress 33, 37
das.isolationshutdowntimeout 13, 33
das.maxftvmsperhost 43
das.respectvmvmantiaffinityrules 33
das.slotcpuinmhz 21, 33
das.slotmeminmb 21, 33
das.usedefaultisolationaddress 33
das.vmcpuminmhz 21, 24, 33
das.vmmemoryminmb 33
Dfaillances d'hte tolres par le cluster 21, 35
Dfinir les htes de basculement 25
Dploiement automatique 35
dsactivation, Fault Tolerance 53
Distributed Resource Scheduler (DRS)
et Fault Tolerance 45
utilisation avec vSphere Fault Tolerance 43
utilisation avec vSphere HA 19
DRS de stockage 35

E
emplacement 21
quilibrage de charge 43
erreurs, Fault Tolerance 57
tat de Fault Tolerance
Dmarrage 54
Dsactiv 54
Machine virtuelle hors fonctionnement 54
VM secondaire ncessaire 54
tiquettes rseau 37
EVC 43
vnements et alarmes, paramtre 35
Extended Page Tables (EPT) 45

F
Fault Tolerance
activation 47
arrt 53
cas d'utilisation 43
conditions pralables 44
configuration de la mise en rseau 47, 48
configuration vSphere 44
continuit de la disponibilit 9
contrles de validation 50
CPU secondaire totale 54
dmarrage 52

59

Disponibilit vSphere

dsactivation 53
emplacement secondaire 54
erreurs 57
interoprabilit 45
Intervalle vLockstep 54
journalisation 47, 48
Largeur de bande de journalisation 54
liste de vrification 44
meilleures pratiques 56
Mmoire secondaire totale 54
messages d'erreurs 41
migration secondaire 53
options 52
prsentation 42
recommandations relatives la
configuration 58
rgles d'anti-affinit 42
restrictions pour l'activation 50
tester le basculement 54
tester le redmarrage secondaire 54
vrification de conformit 50
version 44
Fault Tolerance la demande 43
fdm.isolationpolicydelaysec 33
fichiers de journalisation 17
Fonction de dmarrage et d'arrt de machine
virtuelle 28
fonction de surveillance de l'hte 37
fragmentation des ressources 26

J
Journalisation de la tolrance aux pannes 42

M
machines virtuelles, priorit de redmarrage 30
meilleures pratiques
clusters vSphere HA 35
Fault Tolerance 56
Mise en rseau vSphere HA 37
messages d'erreurs
Fault Tolerance 41
vSphere HA 11
migration secondaire, Fault Tolerance 53
minimiser les interruptions de service 7
mise niveau d'htes avec des machines
virtuelles tolrantes aux pannes 57
Mise en rseau vSphere HA
meilleures pratiques 37
Redondance des chemins d'accs 38
modifier les paramtres du cluster 28
multiprocesseur symtrique (SMP) 45

N
Nombre maximum de rinitialisations par
machine virtuelle 15
noms des groupes de ports 37

O
options de machine virtuelle, vSphere HA 30

Gestion de l'alimentation distribue (DPM) 19,


20

paramtre de priorit de redmarrage des


machines virtuelles 13
paramtre de rponse l'isolement d'un hte 13
paramtres de cluster 28
paramtres de remplacement des machines
virtuelles 13, 35
paravirtualisation 45
partition de rseau 12, 16, 56
partition rseau 16
passerelle par dfaut 37
personnalisation de vSphere HA 32
planification d'un cluster vSphere HA 11
port TCP 17
port UDP 17
PortFast 37
ports de pare-feu 17, 37
Pourcentage de ressources de cluster
rserves 24, 35
protection des machines virtuelles 12, 16
Public cibl 5

H
htes
isolation rseau 12
mode maintenance 12, 19
htes de basculement 25
htes de basculement actuels 25

I
images ISO 56
Informations d'excution avances 21
interoprabilit, Fault Tolerance 45
Interruption
imprvu 8
prvu 7
interruption de service imprvue 8
interruption de service prvue 7
intervalles de statistiques d'E/S 15
IPv4 27, 45

60

IPv6 27, 45, 47

VMware, Inc.

Index

R
Rapid Virtualization Indexing (RVI) 45
RDM 44, 45
recherche de DNS 27
rgle de contrle d'admission
choix 26
Dfinir les htes de basculement 25
Pourcentage de ressources de cluster
rserves 24
rgles d'affinit 42, 43
rgles d'affinit machine virtuelle/machine
virtuelle 25
rgles d'anti-affinit 42
rponse d'isolation, hte 30
rponse d'isolation de l'hte 30
rseau de gestion 27, 37

VMware Tools 15
VMware vLockstep 9, 41, 42
vSphere HA
attributs avancs 32
avantages 8
configuration des paramtres de cluster 29
interruption 35
liste de contrle 27
messages d'erreurs 11
options de machine virtuelle 30
paramtres de cluster 28
personnalisation 32
reprise d'activit suite une interruption 8
surveillance 35
surveillance des machines virtuelles 31

S
SAN iSCSI 44
sensibilit de surveillance 15
signal de pulsation de banque de donnes 12,
16
Signal de pulsation de banque de donnes
vSphere HA 31
snapshots 45
stockage
iSCSI 44
NAS 44, 58
NFS 44, 58
Storage vMotion 7, 35, 45
stratgie de contrle d'admission, Dfaillances
d'hte tolres par le cluster 21
Surveillance d'application 12, 15
surveillance d'hte, activation 30
Surveillance de VM 12, 15
surveillance de vSphere HA 35
surveillance des machines virtuelles 31

T
tester le basculement, Fault Tolerance 54
tester le redmarrage secondaire, Fault
Tolerance 54
tolrance des dfaillances d'hte 21

V
validit du cluster 35
vrification de conformit, Fault Tolerance 50
Virtual SAN 16, 18, 35, 45
Virtualisation d'identification N-Port (NPIV) 45
Virtualisation matrielle (HV) 44, 50
VLAN 48
VMDK 44
VMFS 16, 37

VMware, Inc.

61

Disponibilit vSphere

62

VMware, Inc.

Vous aimerez peut-être aussi