VMware Availability Guide PG FR

Guide de disponibilit vSphere
ESX 4.1 ESXi 4.1 vCenter Serveur 4.1
Ce document prend en charge la version de chacun des produits rpertoris, ainsi que toutes les versions publies par la suite jusqu'au remplacement dudit document par une nouvelle dition. Pour rechercher des ditions plus rcentes de ce document, rendez-vous sur : http://www.vmware.com/fr/support/pubs.
FR-000316-00
Vous trouverez la documentation technique la plus rcente sur le site Web de VMware l'adresse : http://www.vmware.com/fr/support/pubs/ Le site Web de VMware propose galement les dernires mises jour des produits. Nhsitez pas nous transmettre tous vos commentaires concernant cette documentation ladresse suivante : docfeedback@vmware.com
Copyright 2009, 2010 VMware, Inc. Tous droits rservs. Ce produit est protg par les lois amricaines et internationales relatives au copyright et la proprit intellectuelle. Les produits VMware sont protgs par un ou plusieurs brevets rpertoris l'adresse http://www.vmware.com/go/patents-fr. VMware est une marque dpose ou une marque de VMware, Inc. aux tats-Unis et/ou dans d'autres juridictions. Toutes les autres marques et noms mentionns sont des marques dposes par leurs propritaires respectifs.
VMware, Inc. 3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com
VMware, Inc. 100-101 Quartier Boieldieu 92042 Paris La Dfense France www.vmware.com/fr
VMware, Inc.
Table des matires
propos de ce guide 5
1 Continuit d'activit et minimisation des interruptions de service 7

Rduction des interruptions de service prvues 7 Prvention les interruptions de service imprvues 8 VMware HA assure une reprise d'activit rapide suite une interruption VMware Fault Tolerance assure la continuit de la disponibilit 9 8
2 Cration et utilisation des clusters VMware HA 11

Fonctionnement de VMware HA 11 Contrle d'admission VMware HA 13 Liste de vrification VMware HA 20 Cration d'un cluster VMware HA 20 Personnalisation du comportement de VMware HA 26 Meilleures pratiques aux clusters VMware HA 28
3 Fourniture de la tolrance aux pannes des machines virtuelles 33
Fonctionnement de la tolrance aux pannes 33 Utilisation de la tolrance aux pannes avec DRS 35 Cas d'utilisation de tolrance aux pannes 35 Liste de vrification de tolrance aux pannes 36 Interoprabilit de la tolrance aux pannes 37 Prparation du cluster et des htes la tolrance aux pannes 39 Fourniture de la tolrance aux pannes des machines virtuelles 43 Affichage des informations sur les machines virtuelles tolrantes aux pannes 45 Recommandations relatives la tolrance aux pannes 46 Recommandations de configuration de la tolrance aux pannes par VMware 49 Dpannage de la tolrance aux pannes 49
Annexe : Message d'erreurs de tolrance aux pannes 53 Index 59
VMware, Inc.
VMware, Inc.
propos de ce guide
Le Guide de disponibilit vSphere prsente des solutions assurant la continuit d'activit, ainsi que la mise en place de VMware Haute disponibilit (HA) et de VMware Fault Tolerance.
Public cible
Ce livre est destin tous ceux qui veulent assurer la continuit d'activit l'aide des solutions VMware HA et Tolrance aux pannes. Les informations fournies dans ce livre sont destines aux administrateurs du systme Windows ou Linux expriments qui connaissent le fonctionnement de la technologie des machines virtuelles et des centres de donnes.
Glossaire VMware Technical Publications

VMware Technical Publications fournit un glossaire des termes qui peuvent ventuellement ne pas vous tre familiers. Pour consulter la dfinition des termes utiliss dans la documentation technique VMware, visitez le site Web http://www.vmware.com/support/pubs.
Commentaires sur les documents

VMware prend en considrations vos suggestions pour amliorer sa documentation. Si vous avez des commentaires, envoyez-les docfeedback@vmware.com
documentation de vSphere
La documentation vSphere se compose de la combinaison de l'ensemble des documentations de VMware vCenter Server et ESX/ESXi. Le Guide de disponibilit vSphere traite d'ESX , d'ESXi et de vCenter Server.
Ressources de support technique et de formation

Les ressources de support technique suivantes sont votre disposition. Pour accder la version actuelle de ce guide et d'autres guides, allez sur http://www.vmware.com/support/pubs. Support en ligne et tlphonique Pour soumettre des demandes d'ordre technique l'assistance en ligne, consulter les informations concernant vos produits et contrats et inscrire vos produits, rendez-vous sur http://www.vmware.com/support.
VMware, Inc.
Les clients ayant souscrit des contrats de support appropris peuvent utiliser le support tlphonique pour obtenir une rponse rapide leurs problmes prioritaires. Allez sur http://www.vmware.com/support/phone_support.html. Offres de support Pour en savoir plus sur la faon dont les offres d'assistance VMware peuvent satisfaire les besoins de votre entreprise, rendez-vous sur http://www.vmware.com/support/services. Les cours VMware Education Services proposent de nombreux exercices pratiques, des exemples d'tude de cas, ainsi que de la documentation destine servir de rfrence sur site. Les cours sont disponibles sur site, en salle de cours et en ligne et en direct. Pour les programmes pilotes sur site et les meilleures pratiques de mise en uvre, VMware Consulting Services propose des offres destines vous aider valuer, planifier, laborer et grer votre environnement virtuel. Pour accder aux informations sur les classes de formation, les programmes de certification et les services-conseil, rendez-vous sur http://www.vmware.com/services.
VMware Professional Services
VMware, Inc.
Continuit d'activit et minimisation des interruptions de service
Qu'elles soient prvues ou imprvues, les interruptions de service engendrent des cots considrables. Mais les solutions assurant des niveaux levs de disponibilit ont toujours t chres et difficiles implmenter et grer. Les logiciels de VMware assurent facilement et moindre cot un niveau lev de disponibilit pour les applications importantes. Avec vSphere, les entreprises peuvent augmenter facilement le niveau de disponibilit de base assur pour toutes les applications et fournir des niveaux levs de disponibilit plus facilement et moindre frais. Avec vSphere, vous pouvez :
n
Assurer une disponibilit leve indpendamment du matriel, du systme d'exploitation et des applications. liminer les interruptions de service prvues pour les oprations de maintenance ordinaires. Assurer la restauration automatique en cas de dysfonctionnement.
n n
vSphere permet de rduire les interruptions de service prvues, d'viter des interruptions de service imprvues et de rcuprer rapidement suite des interruptions. Ce chapitre aborde les rubriques suivantes :
n n n n
Rduction des interruptions de service prvues , page 7 Prvention les interruptions de service imprvues , page 8 VMware HA assure une reprise d'activit rapide suite une interruption , page 8 VMware Fault Tolerance assure la continuit de la disponibilit , page 9
Rduction des interruptions de service prvues

Les interruptions de service prvues reprsentent gnralement plus de 80 % des interruptions de service d'un centre de donnes. La maintenance matrielle, la migration des serveurs et les mises niveau des microprogramme imposent une interruption du service des serveurs physiques. Pour rduire les rpercussions de ces interruptions de service, les entreprises doivent reporter la maintenance des plages horaires peu pratiques et difficiles planifier. vSphere permet aux entreprises de rduire considrablement les interruptions de service prvues. Comme les charges de travail d'un environnement vSphere peuvent tre dplaces dynamiquement sur diffrents serveurs physiques sans interruptions de service, la maintenance des serveurs peut tre effectue sans exiger une interruption des applications et du service. Avec vSphere, les entreprises :
n n n
liminent les interruptions de service pour les oprations de maintenance ordinaires. liminent les plages de maintenance prvues. excutent la maintenance tout moment sans perturber les utilisateurs et les services.
VMware, Inc.
VMware vMotion et la fonctionnalit Storage vMotion de vSphere permet aux entreprises de rduire les interruptions de service prvues car les charges de travail d'un environnement VMware peuvent tre dplaces dynamiquement sur d'autres serveurs physiques ou sur d'autres stockages sous-jacents sans interruption de service. Les administrateurs peuvent effectuer plus rapidement des oprations de maintenance entirement transparentes, sans devoir planifier des plages de maintenance peu pratiques.
Prvention les interruptions de service imprvues

Alors qu'un hte ESX/ESXi constitue une plate-forme stable pour l'excution d'applications, les entreprises doivent aussi se protger contre les interruptions de service imprvues provoques par des dfaillances matrielles ou logicielles. vSphere renforce considrablement les capacits des infrastructures des centres de donnes, ce qui contribue viter des interruptions de service imprvues. Ces capacits vSphere font partie d'une infrastructure virtuelle et sont transparentes pour le systme d'exploitation et les applications excutes sur les machines virtuelles. Ces fonctions peuvent tre configures et utilises par toutes les machines virtuelles sur un systme physique, ce qui rduit le cot et la complexit de la prvision d'une disponibilit suprieure. Les fonctions cls de la tolrance aux pannes sont intgres vSphere :
n
Stockage partag. limine des points de panne isols en stockant les fichiers des machines virtuelles dans des espaces de stockage partags, comme Fibre Channel ou iSCSI SAN, ou encore NAS. Il est possible de faire appel aux fonctions de rplication et de mise en miroir SAN pour conserver les copies mises niveau des disques virtuels dans des sites de reprise. Association d'interfaces rseau. Assure la tolrance aux dfaillances des cartes rseau individuelles. chemins multiples du stockage. Assure la tolrance aux dfaillances des emplacements de stockage.
n n
En outre, les fonctions de VMware HA et Tolrance aux pannes peuvent rduire ou liminer les interruptions de service imprvues en assurant respectivement la reprise d'activit rapide suite une interruption et la continuit de la disponibilit.
VMware HA assure une reprise d'activit rapide suite une interruption

VMware HA a recours plusieurs htes ESX/ESXi configurs en cluster pour assurer une reprise d'activit rapide suite une interruption et une haute disponibilit moindres cots pour les applications excutes sur des machines virtuelles. VMware HA protge la disponibilit des applications de manire suivante :
n
Il protge contre une dfaillance du serveur en redmarrant les machines virtuelles sur d'autres htes au sein du cluster. Il protge contre les dfaillances des applications en surveillant en permanence une machine virtuelle et en la rinitialisant en cas de dtection d'une dfaillance.
Contrairement aux autres solutions de mise en clusters, VMware HA fournit l'infrastructure ncessaire la protection de toutes les charges de travail :
n
Il n'est pas ncessaire d'installer des logiciels spciaux dans l'application ou sur la machine virtuelle. Toutes les charges de travail sont protges par VMware HA. Aprs la configuration de VMware, aucune action n'est requise pour protger de nouvelles machines virtuelles. Elles sont protges automatiquement. Vous pouvez associer VMware HA VMware Distributed Resource Scheduler (DRS) pour assurer la protection contre les pannes, et pour rpartir la charge entre tous les htes d'un cluster.
VMware, Inc.
Chapitre 1 Continuit d'activit et minimisation des interruptions de service
VMware HA prsente plusieurs avantages face aux solutions de basculement habituelles : Configuration minimale Quand un cluster VMware HA a t configur, toutes les machines virtuelles du cluster sont incluses dans le basculement sans configuration supplmentaire. La machine virtuelle fait office de conteneur portable pour les applications et elle peut tre dplace parmi les htes. Les administrateurs vitent ainsi de reproduire les configurations sur plusieurs machines. Lorsque vous utilisez VMware HA, vous devez disposer de suffisamment de ressources pour le basculement de tous les htes protgs par VMware HA. Toutefois, le systme vCenter Server gre automatiquement les ressources et configure les clusters. Une application excute au sein d'une machine virtuelle a accs une disponibilit accrue. Comme la machine virtuelle peut rcuprer d'une dfaillance matrielle, toutes les applications qui dmarrent au moment de l'initialisation ont une disponibilit accrue sans accrotre la charge de calcul, mme si l'application n'est pas en cluster. En surveillant et en rpondant aux signaux de pulsation des VMware Tools et en rinitialisant les machines virtuelles qui ne rpondent plus, elle assure galement une protection contre les dfaillances du systme d'exploitation client. En cas de dfaillance d'un hte et du redmarrage des machines virtuelles sur d'autres htes, DRS peut fournir des recommandations de migration ou faire migrer les machines virtuelle en quilibrant les ressources alloues. Si l'hte source et/ou l'hte de destination d'une migration sont dfaillants, VMware HA peut faciliter la rcupration suite la dfaillance.
Cots et configuration matrielle rduits
Disponibilit accrue des applications
Intgration DRS et vMotion
VMware Fault Tolerance assure la continuit de la disponibilit

VMware HA assure un niveau de protection de base pour vos machines virtuelles en les redmarrant en cas de panne de l'hte. VMware Fault Tolerance assure un niveau de disponibilit suprieur en permettant aux utilisateurs de protger les machines virtuelles contre une dfaillance de l'hte sans perte de donnes, de transactions ou de connexions. Tolrance aux pannes applique la technologie de VMware vLockstep sur la plate-forme de l'hte ESX/ESXi pour assurer la continuit de la disponibilit. La continuit de la disponibilit s'effectue en vrifiant que les tats des machines virtuelles principales et secondaires demeurent identiques tout au long de l'excution des instructions de la machine virtuelle. vLockstep s'en assure en faisant excuter des squences d'instructions x86 identiques aux machines virtuelles principales et secondaires. La machine virtuelle principale capture les entres et vnements (en provenance du processeur et destination des priphriques d'E/S virtuels) et les relit sur la machine virtuelle secondaire. La machine virtuelle secondaire excute les mmes instructions que la machine virtuelle principale, alors qu'une seule image de machine virtuelle (la machine virtuelle principale) excute toute la charge de travail. Si l'hte excutant la machine virtuelle principale ou l'hte excutant la machine virtuelle secondaire est dfaillant, un basculement transparent se produit. L'hte ESX/ESXi en tat de marche devient la machine virtuelle principale sans perte de connexions rseau ou de transactions en cours. Le basculement transparent vite toute perte de donnes et assure le maintien des connexions rseau. En cas de basculement transparent, une nouvelle machine virtuelle est raffecte et la redondance est rtablie. Le processus est entirement transparent et automatis et se produit mme en cas d'indisponibilit du vCenter Server.
VMware, Inc.
10
VMware, Inc.
Cration et utilisation des clusters VMware HA
Les clusters VMware HA permettent de runir plusieurs htes ESX/ESXi de faon ce qu'ils fournissent, en tant que groupes, un niveau de disponibilit suprieur pour les machines virtuelles celle d'un seul hte ESX/ ESXi. Quand vous prvoyez la cration et l'utilisation d'un nouveau VMware HA, les options choisies affectent la manire dont le cluster correspondant ragit aux pannes des htes ou des machines virtuelles. Avant de crer un cluster VMware HA, vous devez savoir comment VMware HA identifie les dfaillances et l'isolement de l'hte et comment il ragit dans ces situations. Vous devez aussi connatre le mode de fonctionnement du contrle d'admission de faon tre capable de choisir les rgles qui rpondent le mieux vos besoins de basculement. Lorsqu'un cluster a t cr, vous pouvez en personnaliser le comportement avec des attributs avancs et en optimiser les performances en suivant les meilleures pratiques recommandes. Ce chapitre aborde les rubriques suivantes :
n n n n n n
Fonctionnement de VMware HA , page 11 Contrle d'admission VMware HA , page 13 Liste de vrification VMware HA , page 20 Cration d'un cluster VMware HA , page 20 Personnalisation du comportement de VMware HA , page 26 Meilleures pratiques aux clusters VMware HA , page 28
Fonctionnement de VMware HA
VMware HA assure la disponibilit leve des machines virtuelles en les plaant avec leurs htes respectifs dans un cluster. Les htes du cluster sont surveills et, en cas de dfaillance, les machines virtuelles d'un hte dfectueux sont redmarrs sur d'autres htes.
Htes principaux et secondaires d'un cluster VMware HA

Lorsque vous ajoutez un hte dans un cluster VMware HA, un agent est transfr vers l'hte et configur afin de communiquer avec d'autres agents du cluster. Les cinq premiers htes ajouts dans le cluster sont nomms des htes principaux et tous les htes suivants sont nomms des htes secondaires. Les htes principaux conservent et copient tous les tats du cluster et servent initier des actions de basculement. Si un hte principal est supprim du cluster, VMware HA promeut un autre hte (secondaire) au rang d'hte principal. Si un hte principal va tre dconnect pendant une dure prolonge, supprimez-le du cluster, de faon pouvoir le remplacer par un hte secondaire. Tout hte rejoignant le cluster doit communiquer avec un hte principal existant pour achever sa configuration (sauf au moment de l'ajout du premier hte au cluster). Un hte principal au moins doit tre oprationnel pour le bon fonctionnement de VMware HA. Si tous les htes principaux ne sont pas disponibles (sans raction), aucun hte ne peut tre configur correctement avec VMware HA. Tenez compte de la limite fixe cinq htes
VMware, Inc.
11
principaux par cluster lors de la planification de l'tendue du cluster. De plus, si le cluster est implment dans un environnement de serveur lame, ne placez pas plus de quatre htes principaux sur un seul chssis de lame. Si les cinq htes principaux sont dans le mme chssis et que celui-ci choue, votre cluster perd la protection VMware HA. L'un des htes principaux est aussi nomm hte principal actif. Ses responsabilits sont les suivantes :
n n n
Dcision du point de dpart du redmarrage des machines virtuelles. Suivi des tentatives de redmarrage choues. Choix du moment appropri pour continuer essayer de redmarrer une machine virtuelle.
Si l'hte principal actif est dfectueux, un autre hte principal le remplace.
Dtection des pannes et isolation du rseau de l'hte

Les agents communiquent les uns avec les autres et surveillent la ractivit des htes du cluster. Cette communication s'effectue par l'change de signaux de pulsation un intervalle d'une seconde par dfaut. Si 15 secondes passent sans rception de signaux de pulsation de la part d'un hte et que l'hte ne peut pas excuter de ping, il est dclar dfaillant. En cas de dfaillance de l'hte, les machines virtuelles excutes sur cet hte sont bascules, c'est--dire qu'elles sont redmarres sur des htes de remplacement. REMARQUE En cas de dfaillance de l'hte, VMware HA ne bascule pas de machines virtuelles vers un hte qui est en mode de maintenance. L'isolation du rseau de l'hte se produit lorsque l'hte fonctionne toujours, mais qu'il ne peut plus communiquer avec d'autres htes du cluster. D'aprs les paramtres par dfaut, si un hte cesse de recevoir les signaux de pulsation de tous les autres htes du cluster pendant plus de 12 secondes, il tente d'envoyer un ping ses adresses d'isolation. Si cela choue aussi, l'hte se dclare isol du rseau. Le ping est uniquement envoy une adresse d'isolation lorsque les pulsations ne sont plus reues d'aucun autre hte du cluster. Si la connexion rseau de l'hte isol n'est pas restaure au bout de 15 secondes ou davantage, les autres htes du cluster considrent l'hte isol comme dfectueux et tentent de basculer ses machines virtuelles. Mais lorsqu'un hte isol conserve l'accs au stockage partag, il conserve aussi le verrouillage disque sur les fichiers des machines virtuelles. Pour viter une corruption potentielle des donnes, le verrouillage disque VMFS empche les oprations d'criture simultane dans les fichiers disque des machines virtuelles et les tentatives de basculement des machines virtuelles des htes isols chouent. Par dfaut, l'hte isol arrte ses machines virtuelles, mais il est possible de modifier la raction d'isolation de l'hte en optant pour [Laisser sous tension] ou [Mise hors tension] . Reportez-vous Options de machine virtuelle , page 23. REMARQUE Si vous vous assurez que l'infrastructure rseau est suffisamment redondante et qu'un chemin d'accs au rseau est disponible en permanence, l'isolation du rseau de l'hte devrait se produire trs rarement.
Utilisation conjointe de VMware HA et DRS

L'utilisation de VMware HA avec Distributed Resource Scheduler (DRS) allie le basculement automatique avec l'quilibrage de charge. Cette combinaison peut aboutir un rquilibrage plus rapide des machines virtuelles aprs leur dplacement sur d'autres htes par VMware HA. Quand VMware HA excute le basculement et redmarre les machines virtuelles sur des htes diffrents, la premire priorit est la disponibilit immdiate de toutes les machines virtuelles. Aprs le redmarrage des machines virtuelles, les htes sur lesquels elles sont excutes peuvent se retrouver surchargs, tandis que la charge d'autres htes est plus lgre, en comparaison. VMware HA utilise le CPU et la rservation de mmoire de la machine virtuelle pour dterminer si un hte dispose de suffisamment de capacit disponible pour prendre en charge la machine virtuelle.
12
VMware, Inc.
Chapitre 2 Cration et utilisation des clusters VMware HA
Dans un cluster utilisant DRS et VMware HA avec le contrle d'admission activ, les machines virtuelles ne sont pas ncessairement vacues des htes passant en mode de maintenance. Ce comportement intervient par suite des ressources rserves pour le redmarrage des machines virtuelles en cas de panne. Il faut migrer manuellement les machines virtuelles en dehors des htes avec vMotion. Dans certains scnarios, VMware HA ne parvient pas basculer des machines virtuelles par suite de contraintes de ressources. Ceci peut se produire pour plusieurs raisons.
n
Le contrle d'admission HA est dsactiv et Gestion de l'alimentation distribue (DPM) est activ. Cela peut aboutir la consolidation par DPM des machines virtuelles sur un nombre infrieur d'htes et la mise en veille des htes vides, ce qui ne laisse pas suffisamment de rserve de capacit active pour effectuer un basculement. Les rgles (requises) d'affinit de machine virtuelle/hte peuvent limiter les htes sur lesquels certaines machines virtuelles peuvent tre places. Il peut y avoir suffisamment de ressources cumules mais celles-ci sont fragmentes sur plusieurs htes de sorte qu'elles ne peuvent pas tre utilises par les machines virtuelles pour le basculement.
Dans ce cas, VMware HA utilise DRS pour essayer d'ajuster le cluster (par exemple, en sortant les htes du mode de veille ou en migrant les machines virtuelles pour dfragmenter les ressources du cluster) de sorte que HA puisse excuter les basculements. Si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de mise sous tension des htes. De mme, si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de migration. Si vous utilisez les rgles d'affinit entre machine virtuelle et hte requises, sachez que ces rgles doivent obligatoirement tre respectes. VMware HA n'effectue pas de basculement si cela risque d'enfreindre une rgle. Pour plus d'informations sur DRS, reportez-vous au Guide de gestion des ressources.
Contrle d'admission VMware HA

vCenter Server utilise le contrle d'admission pour assurer que suffisamment de ressources sont disponibles dans un cluster pour permettre la protection par basculement et pour assurer que les rservations de ressources pour les machines virtuelles sont respectes. Trois types de contrle d'admission sont disponibles. Hte Pool de ressources Garantit qu'un hte dispose de suffisamment de ressources pour satisfaire les rservations de toutes les machines virtuelles qui y sont excutes. Garantit qu'un pool de ressources dispose de suffisamment de ressources pour satisfaire les rservations, les partages et les limites de toutes les machines virtuelles qui y sont associes. Garantit qu'une part suffisante des ressources du cluster sont rserves la restauration des machines virtuelles en cas de dfaillance de l'hte.
VMware HA
Le contrle d'admission impose des contraintes d'utilisation des ressources et toute action contrevenant ces contraintes n'est pas autorise. Parmi les exemples d'actions pouvant tre interdites, on peut citer :
n n n
Mise sous tension d'une machine virtuelle. Migration d'une machine virtuelle sur un hte ou dans un cluster ou un pool de ressources. Augmentation de la rservation de CPU ou de mmoire d'une machine virtuelle.
VMware, Inc.
13
Parmi les trois types de contrle d'admission, seul le contrle d'admission VMware HA peut tre dsactiv. Mais sans ce contrle, il n'est pas possible d'assurer que toutes les machines virtuelles du cluster peuvent tre redmarres aprs une dfaillance d'hte. VMware dconseille de mettre hors tension le contrle d'admission, mais vous pouvez avoir besoin de le faire temporairement pour les raisons suivantes :
n
Si vous devez enfreindre les contraintes de basculement lorsqu'il n'y a pas suffisamment de ressources pour les prendre en charge (par exemple, si vous mettez les htes en veille pour en tester le fonctionnement avec DPM). Si un processus automatis doit effectuer des actions qui risquent d'enfreindre temporairement les contraintes de basculement (par exemple, dans le cadre d'une mise niveau dirige par VMware Update Manager). Si vous devez excuter des tests ou des oprations de maintenance.
Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Vous pouvez configurer VMware HA pour tolrer un nombre spcifi de dfaillances d'htes. Avec les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster, VMware HA s'assure que mme si un nombre d'htes spcifi est dfectueux, les ressources demeurent en quantit suffisante sur le cluster pour le basculement de toutes les machines virtuelles de ces htes. Avec les rgles Dfaillances d'hte tolres par le cluster, VMware HA effectue le contrle d'admission de la manire suivante : 1 Calcule la taille du slot. Un slot est une reprsentation logique de la mmoire et des ressources CPU. Par dfaut, il est dimensionn pour satisfaire aux exigences de chaque machine virtuelle sous tension dans le cluster. 2 3 Dtermine le nombre de slots pouvant se trouver sur chaque hte du cluster. Dtermine la Capacit de basculement actuelle du cluster. Il s'agit du nombre d'htes dfectueux permettant de conserver un nombre suffisant de slots pour satisfaire toutes les machines virtuelles sous tension. 4 Dtermine si la Capacit de basculement actuelle est infrieure ou non la Capacit de basculement configure (prcise par l'utilisateur). Si c'est le cas, le contrle d'admission n'autorise pas l'opration. REMARQUE La Capacit maximale de basculement configure pouvant tre dfinie est limite quatre. Chaque cluster contient jusqu' cinq htes principaux et s'ils tombent tous en panne simultanment, le basculement de toutes les machines virtuelles risque d'chouer.
Calcul de la taille du slot

La taille d'un slot est dtermine par deux composants, la CPU et la mmoire.
n
VMware HA calcule la taille de CPU partir de la CPU rserve par chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Si aucune CPU n'a t rserve pour une machine virtuelle, une valeur de 256 MHz est dfinie par dfaut. Cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz.) VMware HA calcule la taille du composant de mmoire partir de la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Il n'y a pas de valeur par dfaut pour la mmoire rserve.
14
VMware, Inc.
Si le cluster contient des machines virtuelles ayant des valeurs de rservation bien plus leves que d'autres, celles-ci influeront sur le calcul de la taille du slot. Pour l'viter, vous pouvez prciser une limite suprieure pour la CPU ou le composant de mmoire de la taille du slot en utilisant respectivement les attributs avancs das.slotcpuinmhz ou das.slotmeminmb.
Utilisation des slots pour dterminer la capacit de basculement actuelle

Une fois la taille du slot calcule, VMware HA dtermine les ressources de CPU et de mmoire disponibles sur chaque hte pour les machines virtuelles. Ces valeurs sont contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode de maintenance et qui ne prsentent pas d'erreurs VMware HA sont pris en compte. Le nombre maximum de slots pouvant tre pris en charge par chaque hte est alors dtermin. cette fin, la quantit de ressources CPU de l'hte est divise par le composant de CPU de la taille de slot et le rsultat est arrondi. Le mme calcul est fait pour la quantit de ressources de mmoire de l'hte. Ces deux valeurs sont compares et la plus basse quivaut au nombre de slots pouvant tre pris en charge par l'hte. La Capacit de basculement actuelle est calcule en dterminant le nombre d'htes (en commenant par le plus gros) pouvant tre dfectueux tout en conservant un nombre suffisant de slots pour satisfaire toutes les machines virtuelles sous tension.
Informations d'excution avances

Lorsque vous slectionnez les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster, le lien [Informations d'excution avances] apparat dans la rubrique VMware HA de l'onglet [Rsum] du cluster dans vSphere Client. Cliquez sur ce lien pour afficher les informations suivantes propos du cluster :
n n
Taille du slot. Nombre total de slots dans le cluster. Somme des slots pris en charge par les htes en tat de marche dans le cluster. Slots utiliss. Nombre de slots associs aux machines virtuelles sous tension. Ce nombre peut tre suprieur au nombre de machines virtuelles sous tension si vous avez dfini une limite suprieure pour la taille du slot au moyen des options avances. Ceci parce que quelques machines virtuelles peuvent occuper plusieurs slots. Slots disponibles Nombre de slots disponibles pour mettre sous tension des machines virtuelles supplmentaires dans le cluster. VMware HA rservation le nombre de slots requis par le basculement. Les slots restants sont disponibles pour mettre sous tension de nouvelles machines virtuelles. Nombre total de machines virtuelles sous tension dans le cluster. Nombre total d'htes dans le cluster. Nombre total d'htes en marche dans le cluster. Nombre d'htes qui sont connects, qui ne sont pas en mode de maintenance et qui ne prsentent pas d'erreurs VMware HA.
n n n
VMware, Inc.
15
Exemple 2-1. Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster Nous allons illustrer par un exemple le mode de calcul de la taille de slot et son utilisation avec cette rgle de contrle d'admission. Effectuons les suppositions suivantes propos d'un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 utilise 2 Ghz et 1 Go VM3 a besoin de 1 Ghz et de 2 Go, VM4 exige 1 Ghz et 1 Go, VM5 ncessite 1 Ghz et 1 Go. Dfaillances d'hte tolres par le cluster sont dfinies sur la valeur 1.
Figure 2-1. Exemple de contrle d'admission avec des rgles de Dfaillances d'hte tolres par le cluster
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go taille du slot 2 Ghz, 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
H1 9 Ghz 9 Go 4 slots
6 slots restants Si H1 est dfectueux

1 La taille du slot est calcule en comparant la fois les exigences de CPU et de mmoire des machines virtuelles et en slectionnant la plus leve. Le besoin en CPU le plus lev (partag par VM1 et VM2) est de 2 Ghz, tandis que le besoin en mmoire le plus lev (VM3) est de 2 Go. Partant de l, la taille du slot se compose d'une CPU de 2 Ghz et d'une mmoire de 2 Go. 2 Le nombre maximum de slots pouvant tre pris en charge par chaque hte est dtermin. H1 peut prendre en charge quatre slots. H2 peut prendre en charge trois slots (le plus bas de 9 Ghz/2 Ghz et 6 Go/2 Go) et H3 peut aussi en prendre en charge trois. 3 La Capacit de basculement actuelle est calcule. Le plus gros hte est H1 et s'il est dfectueux, le cluster contient toujours six slots, ce qui est suffisant pour les cinq machines virtuelles sous tension. Si H1 et H2 sont dfectueux, il ne reste que trois slots, ce qui est insuffisant. Par consquent, la Capacit de basculement actuelle est de 1. Le cluster a un slot disponible (les six slots de H2 et H3 moins les cinq slots utiliss).
16
VMware, Inc.
Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Il est possible de configurer VMware HA pour effectuer le contrle d'admission en rservant un pourcentage spcifique de ressources de cluster la rcupration en cas de pannes d'hte. Avec les rgles de contrle d'admission Pourcentage de ressources de cluster rserves, VMware HA assure qu'un pourcentage spcifi de ressources de cluster cumules est rserv au basculement. VMware HA effectue le contrle d'admission conformment aux rgles de Ressources de cluster rserves. 1 2 3 4 Calcul des besoins totaux en ressources pour toutes les machines virtuelles sous tension dans le cluster. Calcul les ressources totales de l'hte disponibles pour les machines virtuelles. Calcul la Capacit CPU de basculement actuelle et la Capacit mmoire de basculement actuelle du cluster. Dtermine si la Capacit CPU de basculement actuelle est infrieure ou non la Capacit de basculement configure (spcifiquee par l'utilisateur). Si c'est le cas, le contrle d'admission n'autorise pas l'opration. VMware HA utilise les rservations effectives des machines virtuelles. Si une machine virtuelle n'a pas de rservations, c'est--dire que la valeur de rservation est nulle, alors 0 Mo de mmoire par dfaut et 256 MHz de CPU sont appliqus.
Calcul de la Capacit de basculement actuelle

Les besoins totaux en ressources des machines virtuelles sous tension sont composs de deux composants, CPU et mmoire. VMware HA calcule ces valeurs.
n
Le besoin en composant CPU est obtenu en additionnant la CPU rserve par les machines virtuelles sous tension. Si aucune CPU n'a t rserve pour une machine virtuelle, une valeur de 256 MHz est dfinie par dfaut (cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz). La taille du composant de mmoire est obtenue en additionnant la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension.
Les ressources totales des htes disponibles pour les machines virtuelles sont calcules en additionnant les ressources de CPU et de mmoire des htes. Ces valeurs sont contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode de maintenance et qui ne prsentent pas d'erreurs VMware HA sont pris en compte. La Capacit CPU de basculement actuelle est calcule en soustrayant les besoins totaux en ressources CPU des ressources CPU totales des htes et en divisant le rsultat par les ressources CPU totales des htes. La Capacit mmoire de basculement actuelle est calcule de la mme manire.
VMware, Inc.
17
Exemple 2-2. Rgles de contrle d'admission Pourcentage de ressources de cluster rserves Nous allons illustrer par un exemple le mode de calcul de la Capacit de basculement actuelle et son utilisation avec cette rgle de contrle d'admission. Effectuons les suppositions suivantes propos d'un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 GHz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 GHz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 utilise 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 exige 1 Ghz et 1 Go, VM5 ncessite 1 GHz et 1 Go. La Capacit de basculement configure est de 25 %.
Figure 2-2. Exemple de contrle d'admission utilisant les rgles de Pourcentage de ressources de cluster rserves
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
besoins totaux en ressources 7 Ghz, 6 Go H1 9 Ghz 9 Go H2 9 Ghz 6 Go H3 6 Ghz 6 Go
ressources totales de l'hte 24 GHz, 21 Go

Les besoins totaux en ressources des machines virtuelles sous tension sont de 7 Ghz et 6 Go. Les ressources totales de l'hte disponibles pour les machines virtuelles sont de 24 Ghz et 21 Go. Partant de l, la Capacit CPU de basculement actuelle s'lve 70% ((24 Ghz - 7 Ghz)/24 Ghz). De mme, la Capacit mmoire de basculement actuelle s'lve 71% ((21 Go - -6 Go)/21 Go). Comme la Capacit de basculement configure pour le cluster est de 25 %, 45 % des ressources CPU totales du cluster et 46 % des ressources mmoire totales du cluster sont toujours disponibles pour les machines virtuelles supplmentaires.
Rgles de contrle d'admission Spcifier un hte de basculement

Il est possible de configurer VMware HA afin de dsigner un hte spcifique comme hte du basculement. En cas de dfaillance d'un hte, les rgles de contrle d'admission Spcifier un hte de basculement prvoient que VMware HA tente de redmarrer ses machines virtuelles sur un hte de basculement prdfini. Si ce n'est pas possible car l'hte de basculement est lui-mme en panne ou ses ressources sont insuffisantes, par exemple, VMware HA tente de redmarrer ces machines virtuelles sur d'autres htes du cluster. Pour s'assurer que des capacits restent disponibles sur l'hte de basculement, il n'est pas possible de mettre sous tension des machines virtuelles ou d'utiliser vMotion pour faire migrer des machines virtuelles vers l'hte de basculement. De plus, DRS n'utilise pas l'hte de basculement pour la rpartition de la charge.
18
VMware, Inc.
L'hte de basculement actuel apparat dans la section VMware HA de l'onglet [Rsum] du cluster dans vSphere Client. L'icne de statut qui se trouve ct de l'hte peut tre verte, jaune ou rouge.
n
Vert. L'hte est connect, il n'est pas en mode de maintenance et ne prsente pas d'erreurs VMware HA. Aucune machine virtuelle sous tension ne rside sur l'hte. Jaune. L'hte est connect, il n'est pas en mode de maintenance et ne prsente pas d'erreurs VMware HA. Mais des machines virtuelles sous tension rsident sur l'hte. Rouge. L'hte est dconnect, il est en mode de maintenance ou prsente des erreurs VMware HA.
Choix d'une rgle de contrle d'admission

Les rgles de contrle d'admission VMware HA doivent tre choisies en fonction des besoins de disponibilit et des caractristiques du cluster. Diffrents critres doivent tre pris en compte lors du choix de rgles de contrle d'admission.
viter la fragmentation des ressources

La fragmentation des ressources se produit lorsqu'il y a suffisamment de ressources cumules pour le basculement d'une machine virtuelle. Toutefois, ces ressources sont rparties sur plusieurs htes et sont inutilisables car une machine virtuelle peut uniquement tre excute sur un seul hte ESX/ESXi la fois. Les rgles de Dfaillances d'hte tolres par le cluster vitent la fragmentation des ressources en dfinissant un slot comme rservation maximale des machines virtuelles. Les rgles de Pourcentage de ressources de clusters ne traitent pas du problme de la fragmentation des ressources. Les rgles Spcifier un hte de basculement n'entranent pas la fragmentation des ressources car un seul hte est rserv au basculement.
Flexibilit de la rservation des ressources de basculement

Les rgles de contrle d'admission diffrent de part la granularit qu'elles accordent au moment de la rservation des ressources du cluster pour la protection du basculement. Les rgles de Dfaillances d'hte tolres par le cluster permettent de dfinir le niveau de basculement d'un quatre htes. Les rgles de Pourcentage de ressources de cluster permettent de dfinir jusqu' 50 % de ressources du cluster pour le basculement. Les rgles Spcifier un hte de basculement autorisent uniquement la spcification d'un seul hte de basculement.
Htrognit des clusters

Les clusters peuvent tre htrognes en termes de rservations des ressources des machines virtuelles et de capacits des ressources totales des htes. Dans un cluster htrogne, les rgles de Dfaillances d'hte tolres par le cluster peuvent tre insuffisantes puis qu'elles tiennent uniquement compte des plus grosses rservations de machines virtuelles lors de la dfinition de la taille du slot et qu'elles envisagent uniquement la dfaillance du plus gros hte lors de l'estimation de la Capacit de basculement actuelle. Les deux autres rgles de contrle d'admission ne sont pas affectes par l'htrognit des clusters. REMARQUE VMware HA tient compte de l'utilisation des ressources des machines virtuelles pour la tolrance aux pannes dans les calculs de contrle d'admission. Les rgles de Dfaillances d'hte tolres par le cluster veulent qu'un slot soit affect une machine virtuelle secondaire, tandis que les rgles de Pourcentage de ressources de clusters prvoient que l'utilisation des ressources des machines virtuelles secondaires soit prise en compte lors de l'valuation de l'utilisation des ressources du cluster.
VMware, Inc.
19
Liste de vrification VMware HA

La liste de vrification VMware HA contient les exigences que vous devez connatre avant de crer et d'utiliser un cluster VMware HA.
Exigences applicables un cluster VMware HA

Consultez cette liste avant de configurer un cluster VMware HA. Pour plus d'informations, suivez les rfrences croises appropries ou consultez Cration d'un cluster VMware HA , page 20.
n n n n
Tous les htes doivent disposer d'une licence pour VMware HA. Le cluster doit contenir deux htes au minimum. Tous les htes doivent avoir un nom d'hte unique. Tous les htes doivent tre configurs avec des adresses IP statiques. Si vous utilisez DHCP, vrifiez que l'adresse de chaque hte est conserve aprs les redmarrages. Tous les htes doivent avoir accs aux mmes rseaux de gestion. Il doit au moins y avoir un rseau de gestion commun parmi tous les htes et il est recommand d'avoir au moins deux rseaux de gestion communs. Les rseaux de gestion diffrent selon la version de l'hte que vous utilisez.
n n n
Htes ESX - rseau de la console du service. Htes ESXi antrieurs la version 4.0 - Rseau VMkernel. Htes ESXi version 4.0 et ultrieure - Rseau VMkernel et case cocher active [Rseau de gestion] .
Reportez-vous Meilleures pratiques de mise en rseau , page 29.

n
Pour vous assurer que toutes les machines virtuelles peuvent tre excutes sur n'importe quel hte du cluster, tous les htes doivent avoir accs aux mme rseaux et banques de sonnes de machines virtuelles. De mme, les machines virtuelles doivent se trouver sur des stockages partags, et non locaux, sinon il ne peut pas y avoir de basculement en cas de dfaillance de l'hte. Le fonctionnement de surveillance des machines virtuelles ncessite l'installation des outils VMware. Reportez-vous Surveillance MV et application , page 25. DNS doit tre configur pour tous les htes d'un cluster VMware HA de faon ce que des noms d'hte courts (sans suffixe de domaine) de tous les htes du cluster puissent tre rsolus avec l'adresse IP appropries partir de n'importe quel hte du cluster. Sinon, la tche de Configuration de HA risque d'chouer. Si vous ajoutez l'hte l'aide de l'adresse IP, activez aussi la recherche DNS inverse (l'adresse IP doit pouvoir tre rsolue en nom d'hte court).
REMARQUE VMware HA ne prend pas en charge IPv6
Cration d'un cluster VMware HA

VMware HA fonctionne dans le cadre d'un cluster d'htes ESX/ESXi. Vous devez crer un cluster, le remplir d'htes et configurer les paramtres VMware HA avant de pouvoir tablir la protection du basculement. Lorsque vous crez un cluster VMware HA, vous devez configurer divers paramtres qui dterminent la mise en uvre de la fonction. Avant de commencer, identifiez les nuds du cluster. Ces noeuds sont les htes ESX/ ESXi qui fourniront les ressources pour la prise en charge des machines virtuelles et qui seront utiliss par VMware HA pour la protection du basculement. Dterminez ensuite la manire dont ces nuds doivent tre relis les uns aux autres et au stockage partag o rsident les donnes de la machine virtuelle. Lorsque l'architecture de la mise en rseau est en place, vous pouvez ajouter les htes au cluster et terminer de configurer VMware HA.
20
VMware, Inc.
Vous pouvez activer et configurer VMware HA avant d'ajouter des nuds d'htes au cluster. Toutefois, tant que les htes n'ont pas t ajouts, le cluster n'est pas entirement oprationnel et quelques paramtres du cluster ne sont pas disponibles. Par exemple, les rgles de contrle d'admission Spcifier un hte de basculement ne sont pas disponibles tant qu'un hte n'a pas t dfini comme hte de basculement. REMARQUE La fonction de dmarrage et d'arrt de machine virtuelle (dmarrage automatique) est dsactive pour toutes les machines virtuelles rsidant sur des htes qui se trouvent dans un cluster VMware HA (ou qui y ont t places). VMware recommande de ne pas ractiver manuellement ce paramtre pour l'une des machines virtuelles. Cela risque d'interfrer avec les actions des fonctions du cluster, comme VMware HA ou Tolrance aux pannes.
Crer un cluster VMware HA

Votre cluster peut tre activ pour VMware HA. Un cluster avec VMware HA est une condition pralable pour la tolrance aux pannes. VMware recommande de commencer par crer un cluster vide. Aprs avoir planifi les ressources et l'architecture rseau du cluster, vous pouvez utiliser vSphere Client pour ajouter des htes au cluster et dfinir les paramtres VMware HA du cluster. Connectez vSphere Client vCenter Server en utilisant un compte ayant des droits d'accs administrateur au cluster. Prrequis Vrifiez que toutes les machines virtuelles et leurs fichiers de configuration rsident sur des stockages partags. Vrifiez que les htes sont configurs pour accder ce stockage partag, afin de pouvoir mettre sous tension les machines virtuelles l'aide de diffrents htes dans le cluster. Vrifiez que chaque hte d'un cluster VMware HA possde un nom d'hte (de 26 caractres au maximum) attribu attribu et une adresse IP statique associe chacune des cartes rseau virtuelles. Vrifiez que les htes sont configurs pour avoir accs au rseau de machines virtuelles. REMARQUE VMware recommande des connexions rseau de gestion redondantes pour VMware HA. Pour plus d'informations sur la configuration d'un rseau redondant, consultez la rubrique Redondance des chemins d'accs de rseau , page 30. Procdure 1 2 3 Slectionnez les vues {[Htes & Clusters]}. Cliquez avec le bouton droit sur le centre de donnes dans l'arborescence d'inventaire d'inventaire d'inventaire et slectionnez [Nouveau cluster] . Compltez le paramtre de l'assistant Nouveau cluster. N'activez pas VMware HA (ou DRS) ce moment. 4 Cliquez sur [Terminer] pour fermer l'assistant et crer le cluster. Vous avez cr un cluster vide. 5 6 Utilisez vSphere Client pour ajouter des htes au cluster en vous rfrant la planification des ressources et de l'architecture rseau du cluster. Cliquez avec le bouton droit sur le cluster et slectionnez [Modifier les paramtres] . La bote de dialogue Paramtres du cluster permet de modifier les paramtres de VMware HA (et autres) pour le cluster. 7 Slectionnez [Allumer VMware HA] sur la page des fonctions de cluster.
VMware, Inc.
21
Configurez les paramtres VMware HA comme il convient pour le cluster.

n n n n
tat de surveillance d'hte Contrle d'admission Options de machine virtuelle Surveillance de VM
Cliquez sur [OK] pour fermer la bote de dialogue Paramtres du cluster.
Vous avez maintenant un cluster VMware HA disponible, rempli avec des htes.
Fonctions de cluster
Le premier panneau de l'assistant Nouveau cluster permet de dfinir les options de base du cluster. Ce panneau permet de nommer le cluster et de choisir une ou deux fonctions de cluster. Nom Allumer VMware HA Nommez le cluster. Ce nom figure dans le panneau d'inventaire de vSphere Client. Vous devez saisir un nom pour continuer crer le cluster. Lorsque cette case cocher est slectionne, les machines virtuelles redmarrent sur un autre hte du cluster en cas de dysfonctionnement d'un hte. Vous devez allumer VMware HA pour activer VMware Fault Tolerance sur n'importe quelle machine virtuelle du cluster. Si cette case cocher est slectionne, DRS rpartit la charge des machines virtuelle travers le cluster. DRS place et migre galement les machines virtuelles lorsqu'elles sont protges par HA.
Allumer VMware DRS
Vous pouvez modifier ces fonctions de cluster ultrieurement.
tat de surveillance d'hte

Aprs avoir cr un cluster, activez la surveillance d'hte de faon ce que VMware HA puisse surveiller les pulsations mises par l'agent VMware HA sur chaque hte dans le cluster. Quand [Activer la surveillance de l'hte] est slectionn, chaque hte ESX/ESXi du cluster est surveill pour s'assurer de son bon fonctionnement. En cas de dfaillance d'un hte, les machines virtuelles sont redmarres sur un autre hte. La surveillance d'hte est aussi requise pour le bon fonctionnement du processus de rcupration VMware Fault Tolerance. REMARQUE Si vous devez effectuer des oprations de maintenance rseau risquant de dclencher des ractions d'isolation des htes, VMware vous recommande de suspendre pralablement VMware HA en dsactivant la surveillance d'hte. Lorsque la maintenance est termine, activez nouveau la surveillance d'hte.
22
VMware, Inc.
Activation ou dsactivation du contrle d'admission

L'assistant Nouveau cluster permet d'activer ou de mettre hors tension le contrle d'admission pour le cluster VMware HA et de choisir les rgles d'application. Il est possible d'activer ou de mettre hors tension le contrle d'admission pour le cluster HA. Activer : Ne mettez pas sous tension les machines virtuelles qui violent les contraintes de disponibilit Dsactiver : Mettez sous tension les machines virtuelles qui violent les contraintes de disponibilit Active le contrle d'admission, applique des contraintes de disponibilit et conserve la capacit de basculement. Il est interdit d'effectuer sur une machine virtuelle toute opration qui rduit les ressources non rserves dans le cluster et qui enfreint les contraintes de disponibilit. Dsactive le contrle d'admission Les machines virtuelles peuvent, par exemple, tre mises sous tension mme si cela aboutit une capacit de basculement insuffisante. Lorsque vous faites cela, aucun avertissement n'est prsent et le cluster ne devient pas rouge. Si un cluster a une capacit de basculement insuffisante, VMware HA peut continuer effectuer des basculements et il utilise le paramtre de priorit de redmarrage de la machine virtuelle pour prciser quelles machines virtuelles doivent tre mise sous tension les premires.
VMware HA prvoit trois rgles d'application du contrle d'admission en cas d'activation.

n n n
Dfaillances d'hte que le cluster tolre Pourcentage des ressources de cluster rserves en tant que capacit de basculement de secours Spcifier un hte de basculement
REMARQUE Voir Choix d'une rgle de contrle d'admission , page 19 pour plus d'informations sur le fonctionnement du contrle d'admission VMware HA.
Options de machine virtuelle

Les paramtres par dfaut des machines virtuelles contrlent l'ordre dans lequel les machines virtuelles sont redmarres (priorit de redmarrage VM), ainsi que la rponse de VMware HA lorsque des htes ne sont plus relis par rseau d'autres htes (rponse d'isolation de l'hte). Ces paramtres s'appliquent toutes les machines virtuelles du cluster en cas de dfaillance des htes ou d'isolation. Vous pouvez configurer des exceptions pour des machines virtuelles spcifiques. Reportez-vous Personnaliser le comportement de VMware HA pour une machine virtuelle , page 28.
Paramtre de priorit de redmarrage des machines virtuelles

La priorit de redmarrage des machines virtuelles dtermine l'ordre relatif de redmarrage des machines virtuelles en cas d'chec de l'hte. Les machines virtuelles sont redmarres successivement sur leurs nouveaux htes, les machines virtuelles ayant la priorit la plus leve commencent, et vient le tour de celles ayant une priorit infrieure, jusqu' ce que toutes les machines virtuelles aient redmarr ou qu'il n'y ait plus de ressources de cluster disponibles. Si le nombre de dfaillances d'htes dpasse le seuil autoris par le contrle d'admission, les machines virtuelles ayant une priorit infrieure risquent de ne pas redmarrer tant que davantage de ressources ne sont pas disponibles. Les machines virtuelles sont redmarres sur l'hte de basculement, s'il a t pralablement dfini.
VMware, Inc.
23
Les valeurs de ce paramtre sont les suivantes : Dsactiv, Basse, Moyen (par dfaut) et Haut. Si Dsactiv est slectionn, VMware HA est dsactiv pour la machine virtuelle, ce qui signifie qu'elle n'est pas redmarre sur d'autres htes ESX/ESXi en cas de dysfonctionnement de son hte ESX/ESXi. La slection de Dsactiv n'affecte pas la surveillance des machines virtuelles. Par consquent, si une machine virtuelle est dfaillante sur un hte qui fonctionne correctement, cette machine virtuelle est rinitialise sur le mme hte. Vous pouvez modifier ce paramtre pour des machines virtuelles individuelles. Les paramtres de priorit du redmarrage des machines virtuelles varient en fonction des besoins de l'utilisateur. VMware vous recommande d'associer une priorit de redmarrage leve aux machines virtuelles qui fournissent les services les plus importants. Par exemple, dans le cas d'une application multitche, vous pouvez classer les attributions d'aprs des fonctions hberges sur les machines virtuelles.
n n
Haute. Serveurs de base de donnes qui fournissent des donnes aux applications. Moyenne. Serveurs d'application qui exploitent les donnes de la base de donnes et fournissent des rsultats sur des pages web. Basse. Serveurs Web qui reoivent des demandes d'utilisateurs, transmettent des requtes des serveurs d'application et transmettent les rsultats aux utilisateurs.
Paramtre de rponse d'isolation de l'hte

La rponse d'isolation de l'hte dtermine les vnements survenant lorsqu'un hte dans un cluster VMware HA perd ses connexions rseau de gestion mais poursuit son excution. Les rponses d'isolation des htes exigent que l'tat de surveillance d'hte soit activ. Si l'tat de surveillance d'hte est dsactiv, les rponses d'isolation des htes sont galement suspendues. Un hte dtermine qu'il est isol lorsqu'il cesse de recevoir des heartbeats de tous les autres htes et qu'il est incapable d'envoyer un ping des adresses d'isolation. Lorsque cela se produit, l'hte excute sa rponse d'isolation. Les rponses sont les suivantes : Laisser sous tension, Mettre hors tension et Arrter (par dfaut). Vous pouvez personnaliser cette proprit pour des machines virtuelles individuelles. Pour utiliser le paramtre Arrter la machine virtuelle, vous devez installer VMware Tools dans le systme d'exploitation client de la machine virtuelle. L'arrt de la machine virtuelle offre l'avantage de conserver son tat. L'arrt est prfrable la mise hors tension de mise hors tension de machine virtuelle qui ne purge pas les dernires modifications apportes aux disques ni ne valide les transactions. Le basculement des machines virtuelles qui sont teintes est plus long car l'arrt doit aussi tre effectu. Les machines virtuelles qui n'ont pas t arrtes au bout de 300 secondes ou du dlai dfini par l'attribut avanc das.isolationshutdowntimeout seconds, sont mises hors tension. REMARQUE Lorsque vous avez cr un cluster VMware HA, vous pouvez remplacer les paramtres par dfaut du cluster relatifs la Priorit de redmarrage et la Rponse d'isolation pour les machines virtuelles spcifiques. Ces remplacements sont utiles pour les machines virtuelles qui sont utilises pour les tches spciales. Par exemple, les machines virtuelles qui fournissent des services d'infrastructure, comme DNS ou DHCP, doivent ventuellement tre mises sous tension avant d'autres machines virtuelles du cluster.
24
VMware, Inc.
Surveillance MV et application
Surveillance de VM redmarre les machines virtuelles si leurs heartbeats VMware Tools n'ont pas t reus pendant une certaine priode. De mme, la Surveillance d'application peut redmarrer une machine virtuelle si les heartbeats d'une application excute ne sont pas reus. Il est possible d'activer ces fonctions et de configurer la sensibilit de la surveillance de l'absence de raction par VMware HA. Lorsque vous activez Surveillance de VM, le service Surveillance de VM (utilisant VMware Tools) vrifie si chaque machine virtuelle du cluster fonctionne en contrlant les pulsations rgulires et l'activit d'E/S du processus VMware Tools excut sur le client. Si aucune pulsation ou activit d'E/S n'est reue, c'est probablement parce que le systme d'exploitation client est dfectueux ou que les VMware Tools n'ont pas eu le temps de terminer les tches. Dans ce cas, le service Surveillance de VM dtermine que la machine virtuelle est dfectueuse et la machine virtuelle redmarre pour tre remise en service. Occasionnellement, les machines virtuelles ou les applications qui continuent fonctionner correctement cessent d'mettre des heartbeats. Pour viter les rinitialisations superflues, le service Surveillance de VM surveille aussi l'activit d'E/S d'une machine virtuelle. Si aucun heartbeat n'est reu pendant la priode de dfaillance, l'intervalles statistique d'E/S (un attribut dfini au niveau du cluster) est vrifi. L'intervalle statistique d'E/S dtermine si un disque ou une activit rseau s'est produite pour la machine virtuelle au cours des deux minutes (120 secondes) passes. Si ce n'est pas le cas, la machine virtuelle est rinitialise. Cette valeur par dfaut (120 secondes) peut tre modifie l'aide de l'attribut avanc das.iostatsinterval. Pour activer la surveillance d'application, il faut d'abord obtenir le SDK appropri (ou utiliser une application qui prend en charge la surveillance de l'application VMware) et l'utiliser pour configurer des pulsations personnalises pour les applications devant tre surveilles. Une fois fait, la surveillance d'application fonctionne de la mme manire que Surveillance de VM. Si les pulsations d'une application ne sont pas reues pendant un certain temps, sa machine virtuelle est redmarre. Vous pouvez configurer le niveau de sensibilit de la surveillance. Une sensibilit de surveillance leve permet de conclure plus rapidement un dysfonctionnement. Mme si c'est peu probable, une sensibilit de surveillance leve peut aboutir l'identification errone de dysfonctionnements alors que la machine virtuelle ou l'application en question fonctionne toujours mais que les heartbeats ne sont pas reus cause de contraintes de ressources notamment. Une sensibilit de surveillance basse rsulte en des interruptions de service prolonges entre les dfaillances avres et le redmarrage des machines virtuelles. Slectionnez l'option qui offre un compromis efficace vos besoins. Les paramtres par dfaut de la sensibilit de surveillance sont dcrits dans Tableau 2-1. Vous pouvez aussi indiquer des valeurs personnalises la fois pour la sensibilit de la surveillance et les intervalles statistiques d'E/S en slectionnant la case cocher [Personnalis] . Tableau 2-1. Paramtres de surveillance des machines virtuelles
Paramtre Haut Moyen Faible Intervalle d'chec 30 60 120 Priode de rinitialisation 1 heure 24 heures 7 jours
Lorsque des dysfonctionnements ont t dtects, VMware HA rinitialise les machines virtuelles. La rinitialisation contribue garantir que les services demeurent disponibles. Pour viter de rinitialiser constamment des machines virtuelles en cas d'erreurs non provisoires, les machines virtuelles sont rinitialises par dfaut trois fois seulement au cours d'une priode configurable. Aprs trois reinitialisations des machines virtuelles, VMware HA n'effectue aucune autre tentative pour redmarrer les machines virtuelles aprs des checs ultrieurs jusqu' ce que la priode dfinie ne soit coule. Vous pouvez configurer le nombre de rinitialisations l'aide du paramtre personnalis [Rinitialisations maximales par machine virtuelle] .
VMware, Inc.
25
Personnalisation du comportement de VMware HA

Aprs avoir cr un cluster, vous pouvez modifier les attributs spcifiques qui affectent le comportement de VMware HA. Vous pouvez galement modifier les paramtres par dfaut du cluster hrits par des machines virtuelles individuelles. Examinons les paramtres avancs que vous pouvez utiliser pour optimiser les clusters VMware HA dans votre environnement. Comme ces attributs affectent le fonctionnement de HA, modifiez-les avec prudence.
Dfinir les options avances de VMware HA

Pour personnaliser le comportement de VMware HA, dfinissez les options avances VMware HA. Prrequis Cluster VMware HA dont il faut modifier les paramtres. Privilges de l'administrateur du cluster. Procdure 1 2 3 4 Slectionnez [VMware HA] dans la bote de dialogue Paramtres du cluster. Cliquez sur le bouton [Options avances] pour ouvrir la bote de dialogue Options avances (HA). Saisissez chaque attribut avanc devant tre modifi dans une zone de texte de la colonne [Option] et saisissez une valeur dans la colonne [Valeur] . Cliquez sur [OK] .
Le cluster utilise des options que vous avez ajoutes ou modifies.
Attributs avancs de VMware HA

Vous pouvez dfinir des attributs avancs qui affectent le comportement du cluster VMware HA. Tableau 2-2. Attributs avancs de VMware HA
Attribut das.isolationaddress[...] Description Rgle l'adresse pour excuter un ping pour dterminer si un hte est isol du rseau. Le ping est uniquement envoy cette adresse lorsque les heartbeats ne sont plus reus d'aucun autre hte du cluster. En l'absence de prcision, la passerelle par dfaut du rseau de gestion est utilis. Cette passerelle par dfaut doit tre une adresse fiable et disponible, de sorte que l'hte puisse dterminer s'il est isol du rseau. Vous pouvez indiquer plusieurs adresses d'isolation (jusqu' 10) pour le cluster : das.isolationaddressX, o X = 1-10. Vous devez gnralement en indiquer une par rseau de gestion. L'indication d'un nombre excessif d'adresses ralentit la dtection de l'isolation. Par dfaut, VMware HA utilise la passerelle par dfaut du rseau de console comme adresse d'isolation. Cet attribut indique l'utilisation ou non de ce rglage par dfaut (vrai| faux). Modifie la dure par dfaut de dtection de panne pour la surveillance d'hte. La valeur par dfaut est de 15 000 millisecondes (15 secondes). Cela correspond la dure pendant laquelle un hte n'a pas reu de heartbeats de la part d'un autre hte et l'coulement de laquelle il dclare que l'hte est dfectueux.
das.usedefaultisolationaddress
das.failuredetectiontime
26
VMware, Inc.
Tableau 2-2. Attributs avancs de VMware HA (suite)

Attribut das.failuredetectioninterval Description Modifie l'intervalle des heartbeats parmi les htes VMware HA. Cela se produit par dfaut toutes les 1 000 millisecondes (1 seconde). Priode pendant laquelle le systme attend que la machine virtuelle s'arrte avant de la mettre hors tension. Cela s'applique uniquement si la rponse d'isolation de l'hte est Arrter la machine virtuelle. La valeur par dfaut est de 300 secondes. Dfinit la limite maximale de la taille d'un slot de mmoire. Si cette option est utilise, la taille du slot est infrieure cette valeur ou la rservation de mmoire maximale plus la capacit supplmentaire de toute machine virtuelle sous tension dans le cluster. Dfinit la limite maximale de la taille d'un slot de CPU. Si cette option est utilise, la taille du slot est infrieure cette valeur ou la rservation de CPU maximale de toute machine virtuelle sous tension dans le cluster. Dfinit la valeur de ressources de mmoire par dfaut associe une machine virtuelle si sa rservation de mmoire n'est pas prcise ou nulle. C'est utilis pour les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster. Si aucune valeur n'est spcifie, la valeur par dfaut est de 0 Mo. Dfinit la valeur des ressources CPU par dfaut associe une machine virtuelle si sa rservation de CPU n'est pas prcise ou nulle. C'est utilis pour les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster. Si aucune valeur n'est spcifie, la valeur par dfaut est de 256 MHz. Modifie l'intervalle statistique d'E/S par dfault de sensibilit de surveillance des machines virtuelles. La valeur par dfaut est de 120 (secondes). Peut tre dfinie sur une valeur suprieure ou gale 0. Une valeur nulle dsactive la vrification.
das.isolationshutdowntimeout
das.slotmeminmb
das.slotcpuinmhz
das.vmmemoryminmb
das.vmcpuminmhz
das.iostatsinterval
REMARQUE Si vous modifiez la valeur de l'un des attributs avancs suivants, vous devez mettre hors tension, puis ractiver VMware HA avant que les modifications ne s'appliquent.
n n n n n
das.isolationaddress[...] das.usedefaultisolationaddress das.failuredetectiontime das.failuredetectioninterval das.isolationshutdowntimeout
VMware, Inc.
27
Personnaliser le comportement de VMware HA pour une machine virtuelle

Les paramtres par dfaut du cluster relatifs la priorit de redmarrage, la rponse d'isolation et la surveillance des machines virtuelles sont associs chaque machine virtuelle d'un cluster VMware HA. Vous pouvez prciser des comportements spcifiques chaque machine virtuelle en changeant ces valeurs par dfaut. Si la machine virtuelle quitte le cluster, ces paramtres sont perdus. Procdure 1 2 3 4 5 6 Slectionnez le cluster et choisissez [Modifier les paramtres] dans le menu contextuel. Slectionnez [Options de machine virtuelle] sous VMware HA. Slectionnez une machine virtuelle dans le panneau Paramtres de la machine virtuelle et personnalisez son paramtre [Priorit redmarrage VM] ou [Rponse isolation hte] . Slectionnez [Surveillance de VM] sous VMware HA. Slectionnez une machine virtuelle dans le panneau Paramtres de la machine virtuelle et personnalisez son paramtre [Surveillance de VM] . Cliquez sur [OK] .
Le comportement de la machine virtuelle diffre dsormais des rglages par dfaut du cluster pour chaque paramtre modifi.
Meilleures pratiques aux clusters VMware HA

Pour des performances optimales des clusters VMware HA, VMware recommande de respecter quelques rgles lmentaires. La configuration du rseau et la redondance sont des critres importants de la conception et de l'implmentation du cluster.
Paramtre d'alarmes pour contrler les changements des clusters

Quand VMware HA ou Tolrance aux pannes interviennent pour prserver la disponibilit en effectuant un basculement de machine virtuelle, par exemple, vous voulez probablement tre averti des changements. Il est possible de configurer des alarmes dans vCenter Server qui seront dclenches lorsque ces actions sont effectues et de dfinir des alertes, sous forme de messages lectroniques, par exemple, envoyes un groupes d'administrateurs prdfinis.
Contrle de la validit du cluster

Un cluster valide ne prsente aucune violation des rgles de contrle d'admission. Un cluster activ pour VMware HA devient non valide (rouge) lorsque le nombre de machines virtuelles sous tension dpasse les conditions de basculement, c'est--dire que la capacit de basculement actuelle est infrieure la capacit de basculement configure. Si le contrle d'admission est dsactiv, les clusters ne deviennent pas non valides. La page Rsum du cluster dans vSphere Client prsente la liste des problmes de configuration des clusters. La liste dtaille les causes de la non validit d'un cluster ou de son affectation excessive (jaune). Le comportement DRS n'est pas affect par le fait qu'un cluster soit rouge cause d'un problme li VMware HA.
28
VMware, Inc.
Vrification de l'tat oprationnel du cluster

Un cluster ou ses htes peuvent connatre des problmes de configuration et d'autres erreurs qui nuisent au bon fonctionnement de VMware HA. Vous pouvez vrifier ces erreurs sur l'cran tat oprationnel de cluster qui est accessible dans vSphere Client, sous la rubrique VMware HA de l'onglet [Rsum] du cluster. Vous devez rsoudre tous les problmes rpertoris.
Meilleures pratiques de mise en rseau

VMware met quelques recommandations relatives la configuration des cartes d'interface rseau htes et de la topologie du rseau pour VMware HA. Les meilleures pratiques incluent des recommandations pour vos htes ESX/ESXi, et traitent aussi du cblage, des commutateurs, des routeurs et des pare-feu.
Configuration et maintenance du rseau

Les suggestions suivantes de maintenance du rseau contribuent viter la dtection accidentelle d'htes dfectueux et une isolation rseau cause de la perte de signaux de pulsation VMware HA.
n
En cas de modification des rseaux sur lesquels se trouvent les htes ESX/ESXi en clusters, VMware recommande de suspendre la fonction de surveillance d'hte. Les changements de matriel ou de paramtres rseau peuvent interrompre les signaux de pulsation utiliss par VMware HA pour dtecter les dfaillances d'htes, ce qui risque d'entraner des tentatives malvenues de basculement des machines virtuelles. Lorsque vous modifiez la configuration rseau directement sur les htes ESX/ESXi, par exemple, pour ajouter des groupes de port ou pour supprimer des vSwitches, VMware recommande de placer l'hte en mode maintenance en plus de suspendre sa surveillance.
REMARQUE Comme la mise en rseau est un aspect essentiel de VMware HA, l'administrateur de VMware HA doit tre tenu inform de toute maintenance du rseau.
Rseaux utiliss pour les communications VMware HA

Pour identifier les oprations rseau qui risquent de perturber le bon fonctionnement de VMware HA, il est ncessaire d'identifier les rseaux de gestion utiliss pour les pulsations et d'autres communications VMware HA.
n
Sur les htes ESX du cluster, les communications VMware HA sont achemines via tous les rseaux qui sont identifis comme rseaux de console de service. Les rseaux VMkernel ne sont pas utiliss par ces htes pour les communications VMware HA. Sur les htes ESX du cluster, les communications VMware HA sont achemines par dfaut via tous rseaux VMkernel sauf ceux spcifiques vMotion. S'il n'y a qu'un seul rseau VMkernel, VMware HA le partage avec vMotion, si ncessaire. Avec ESXi 4.0 et version ultrieure, il faut aussi cocher explicitement la case Gestion de rseau si VMware HA doit utiliser ce rseau.
Considrations lies au rseau au niveau du cluster

Pour le bon fonctionnement de VMware HA, tous les htes du cluster doivent avoir des rseaux compatibles. Le premier nud ajout au cluster impose les rseaux devant tre accepts par tous les htes suivants autoriss entrer dans le cluster. Les rseaux sont considrs comme compatibles lorsque la combinaison de l'adresse IP et du masque de sous-rseau produit un rseau dont la combinaison correspond celle d'un autre hte. Si vous essayez d'ajouter un hte ayant trop ou pas assez de rseaux de gestion ou si l'hte ajout a des rseaux incompatibles, la configuration choue et le panneau Dtails de la tche fournit des informations sur cette incompatibilit.
VMware, Inc.
29
Par exemple, si le premier hte ajout dans le cluster comporte deux rseaux utiliss pour les communications VMware HA (10.10.135.0/255.255.255.0 et 10.17.142.0/255.255.255.0), les deux mme rseaux doivent tre configurs sur tous les htes suivants et utiliss pour les communications VMware HA.
Adresses d'isolation rseau

Une adresse d'isolation rseau est une adresse IP qui reoit une commande ping pour dterminer si un hte est isol du rseau. Le ping est uniquement envoy cette adresse lorsqu'un hte a cess de recevoir les signaux de pulsation de tous les autres htes du cluster. Si un host peut envoyer un ping son adresse d'isolation rseau, l'hte n'est pas isol du rseau et les autres htes du cluster ont chou. Mais si l'hte ne peut pas envoyer de ping son adresse d'isolation, il est probable que l'hte ait t isol du rseau et aucune action de basculement n'est entreprise. L'adresse d'isolation rseau est la passerelle par dfaut de l'hte. Une seule passerelle est dfinie par dfaut, quel que soit le nombre de rseaux de gestion dfinis. Par consquent, il faut utiliser l'attribut avanc das.isolationaddress[...] pour ajouter des adresses d'isolation pour des rseaux supplmentaires. Reportezvous Attributs avancs de VMware HA , page 26. Lorsque vous dfinissez des adresses d'isolation supplmentaires, VMware recommande d'augmenter la valeur de l'attribut avanc das.failuredetectiontime 20 000 millisecondes (20 secondes) ou d'avantage. Un nud isol du rseau a besoin d'un certain dlai pour lever le verrouillage VMFS de sa machine virtuelle si la rponse d'isolation de l'hte est de basculer les machines virtuelles (et non de les laisser allumes). Cela doit se produire avant que les autres nuds ne dclarent que le nud a chou, de faon ce qu'ils puissent allumer les machines virtuelles sans recevoir de message d'erreur indiquant que les machines virtuelles sont toujours verrouilles par le nud isol. Pour plus d'informations sur les attributs avanc VMware HA, voir Personnalisation du comportement de VMware HA , page 26.
Autres considrations sur la mise en rseau

Configuration des commutateurs. Si les commutateurs rseau physiques qui relient les serveurs prennent en charge le paramtre PortFast (ou quivalent), activez-le. Ce paramtre empche un hte de se tromper en dterminant qu'un rseau est isol au cours de l'excution de longs algorithmes STA. Pare-feu d'htes Sur les htes ESX/ESXi, VMware HA doit ouvrir automatiquement les ports de pare-feu suivants.
n n
Port entrant : TCP/UDP 8042-8045 Port sortant : TCP/UDP 2050-2250
Noms de groupes de ports et tiquettes rseau. Utilisez des noms de groupes de ports cohrents et des tiquettes rseau sur les VLAN des rseaux publics. Les noms de groupes de ports permettent de reconfigurer l'accs au rseau par les machines virtuelles. Si vous utilisez des noms incohrents entre le serveur d'origine et le serveur de basculement, les machines virtuelles sont dconnectes de leur rseau aprs le basculement. Les tiquettes rseau sont utilises par les machines virtuelles pour rtablir la connectivit rseau au redmarrage.
Redondance des chemins d'accs de rseau

La redondance des chemins d'accs entre les nuds de cluster est importante pour la fiabilit de VMware HA. Un rseau de gestion isol finit par tre un point de panne isol, ce qui aboutit des basculements mme si le rseau uniquement est dfectueux. S'il n'y a qu'un seul rseau de gestion, toute dfaillance entre l'hte et le cluster peut provoquer une situation de basculement inutile (ou errone). Les dfaillances possibles incluent les pannes de cartes rseau, les pannes de cbles rseau, la suppression de cbles rseau et les rinitialisations de commutateurs. Examinez ces causes possibles de dfaillances entre les htes et efforcez-vous de les minimiser en prvoyant la redondance du rseau.
30
VMware, Inc.
Il est possible d'implmenter la redondance du rseau au niveau de l'association de cartes rseau, ou au niveau rseau de gestion. Dans la plupart des implmentations, l'association des cartes rseau offre une redondance suffisante, mais il est possible d'utiliser ou d'ajouter au besoin la redondance de rseau de gestion. La mise en rseau de gestion redondante garantit la fiabilit de la dtection des pannes et vite la ralisation de conditions d'isolation car les signaux de pulsation peuvent tre transmis via plusieurs rseaux. Configurez un nombre aussi rduit que possible de segments matriels entre les serveurs d'un cluster. L'objectif est de limiter les points de panne isols. De plus, les chemins contenant trop de bonds peuvent provoquer des retards de paquets de signaux de pulsation et augmenter les points de panne ventuels.
Redondance par association de cartes rseau

L'utilisation d'une association de deux cartes rseau connectes pour sparer les commutateurs physiques amliore la fiabilit d'un rseau de gestion. Le cluster est plus rsilient car les serveurs connects par deux cartes rseau (et par des commutateurs spars) ont deux chemins indpendants pour la transmission et la rception de signaux de pulsation. Pour configurer une association de cartes rseau pour rseau de gestion, configurez les vNIC de la configuration vSwitch pour la configuration Active ou Standby. Les rglages recommands pour les paramtres des vNIC sont les suivants :
n n
quilibrage de charge par dfaut = Router en fonction de l'ID du port d'origine Retour arrire = Non
Lorsque vous avez ajout un adapteur rseau l'hte de votre cluster VMware HA, vous devez reconfigurer VMware HA sur cet hte.
Redondance rseau utilisant un rseau secondaire

Au lieu d'associer des cartes rseau pour assurer la redondance des signaux de pulsation, vous pouvez crer une connexion de rseau de gestion secondaire qui est lie un commutateur virtuel distinct. La connexion de rseau de gestion principale est utilise pour le rseau et des fins de gestion. Lorsque la connexion de rseau de gestion secondaire est cre, VMware HA transmet des signaux de pulsation la fois sur les connexions de rseau de gestion principales et secondaires. Si un chemin est dfaillant, VMware HA peut continuer transmettre et recevoir des signaux de pulsation sur l'autre chemin.
VMware, Inc.
31
32
VMware, Inc.
Fourniture de la tolrance aux pannes des machines virtuelles
Il est possible d'activer VMware Fault Tolerance pour les machines virtuelles afin d'assurer la continuit d'activit avec des niveaux de disponibilit et de protection des donnes suprieurs ceux offerts par VMware HA. La tolrance aux pannes est intgre la plate-forme hte ESX/ESXi (par la technologie VMware vLockstep) et elle assure la continuit de la disponibilit en excutant des machines virtuelles identiques en mode rigide virtuel sur des htes distincts. Pour obtenir des rsultats optimums de la tolrance aux pannes, il est ncessaire d'en comprendre le fonctionnement, de savoir comment l'activer sur un cluster et sur des machines virtuelles, de connatre les recommandations d'usage et les conseils de dpannage. Ce chapitre aborde les rubriques suivantes :
n n n n n n n n n n n
Fonctionnement de la tolrance aux pannes , page 33 Utilisation de la tolrance aux pannes avec DRS , page 35 Cas d'utilisation de tolrance aux pannes , page 35 Liste de vrification de tolrance aux pannes , page 36 Interoprabilit de la tolrance aux pannes , page 37 Prparation du cluster et des htes la tolrance aux pannes , page 39 Fourniture de la tolrance aux pannes des machines virtuelles , page 43 Affichage des informations sur les machines virtuelles tolrantes aux pannes , page 45 Recommandations relatives la tolrance aux pannes , page 46 Recommandations de configuration de la tolrance aux pannes par VMware , page 49 Dpannage de la tolrance aux pannes , page 49
Fonctionnement de la tolrance aux pannes

VMware Fault Tolerance assure la disponibilit continue des machines virtuelles en crant et maintenant une VM secondaire identique la VM primaire et disponible en permanence pour la remplacer en cas de situation de basculement. Il est possible d'activer la tolrance aux pannes sur la plupart des machines virtuelles cruciales pour une mission. Une copie de la machine virtuelle, qui se nomme la machine virtuelle secondaire, est cre et excute en mode rigide virtuel avec la machine virtuelle principale. VMware vLockstep capture les entres et les vnements qui se produisent sur la machine virtuelle principale et les transmet celle de la machine virtuelle
VMware, Inc.
33
secondaire qui est excute sur un autre hte. partir de ces informations, l'excution de la machine virtuelle secondaire est identique celle de la machine virtuelle principale. Comme la machine virtuelle secondaire est en mode rigide virtuel avec la machine virtuelle principale, elle peut reprendre l'excution tout moment sans interruption, assurant ainsi une protection tolrante aux pannes. Figure 3-1. Machine virtuelle principale et machine virtuelle secondaire dans une paire avec tolrance aux pannes
primaire applications systmes d'exploitation client systme VMware client ENREGISTREMENT RPTITION vnements non dterministes vnements non dterministes Entre (rseau, utilisateur), Rsultat = reproductible E/S asynchrone (disque, excution de la machine virtuelle priphriques) temporisateur CPU vnements secondaire applications systmes d'exploitation client systme VMware
journalisation du trafic
Les machines virtuelles principale et secondaire changent des heartbeats en continu. Cet change permet la paire de machines virtuelles de contrler mutuellement leur tat pour assurer le maintien permanent de la tolrance aux pannes. Un basculement transparent se produit en cas de dfaillance de l'hte sur lequel la machine virtuelle principale est excute. Dans ce cas, la machine virtuelle secondaire est immdiatement active pour remplacer la machine virtuelle principale. Une nouvelle machine virtuelle secondaire dmarre et la redondance de la tolrance aux pannes est rtablie en quelques secondes. Si l'hte de la machine virtuelle secondaire devient dfectueux, il est aussi immdiatement remplac. Dans l'un ou l'autre cas, les utilisateurs ne constatent aucune interruption de service ni perte de donnes. Une machine virtuelle tolrante aux pannes et sa copie secondaire ne sont pas autorises fonctionner sur le mme hte. Cette restriction garantit qu'une dfaillance de l'hte ne peut pas entraner la perte des deux machines virtuelles. Vous pouvez aussi utiliser les rgles d'affinit entre machine virtuelle et hte pour prciser les htes sur lesquels certaines machines virtuelles peuvent tre excutes. Si vous utilisez ces rgles, souvenezvous que pour chaque machine virtuelle principale affecte par une rgle prcise, la machine virtuelle secondaire qui y est associe est aussi affecte par la mme rgle. Pour plus d'informations sur les rgles d'affinit, reportez-vous au Guide de gestion des ressources. La tolrance aux pannes vite les situations de division qui peuvent rsulter en deux copies actives d'une machine virtuelle aprs la reprise suite un dysfonctionnement. Le verrouillage atomique des fichiers sur les stockages partags est utilis pour coordonner le basculement de faon ce qu'un ct seulement continue excuter la machine virtuelle principale et une nouvelle machine virtuelle secondaire est automatiquement raffecte. REMARQUE Le contrle anti-affinit est effectu la mise sous tension de la machine virtuelle principale. Les machines virtuelles principales et secondaires peuvent tre sur les mme htes lorsqu'elles sont toutes deux hors tension. C'est un comportement normal. Quand la machine virtuelle principale s'allume, la machine virtuelle secondaire est dmarre sur un hte diffrent.
34
VMware, Inc.
Chapitre 3 Fourniture de la tolrance aux pannes des machines virtuelles
Utilisation de la tolrance aux pannes avec DRS

Vous pouvez utiliser VMware Fault Tolerance avec VMware Distributed Resource Scheduler (DRS) quand la fonction Compatibilit amliore de vMotion (EVC) est active. Ce processus permet aux machines virtuelles tolrantes aux pannes de bnficier d'un meilleur placement initial et d'tre incluses dans les calculs d'quilibrage de charge du cluster. Quand EVC est activ pour un cluster, DRS met les recommandations de placement initiales pour les machines virtuelles tolrantes aux pannes, les dplace pendant le rquilibrage de la charge du cluster et vous autorise attribuer un niveau d'automatisation DRS aux machines virtuelles principales (la machine virtuelle secondaire adopte toujours le mme paramtre que la machine virtuelle principale associe). Pour plus d'informations sur EVC, reportez-vous au Guide d'administration du centre de donnes VMware vSphere. DRS ne place pas plus d'un nombre prdfini de machines virtuelles principales ou secondaires sur un hte au cours du placement initial ou de l'quilibrage de charge. Cette limite est contrle par l'option avance das.maxftvmsperhost. La valeur par dfaut de cette option est de 4. Mais si vous choisissez une valeur nulle, DRS ignore cette restriction. Quand VMware Fault Tolerance est utilis pour les machines virtuelles d'un cluster pour lequel EVC est dsactiv, les machines virtuelles tolrantes aux pannes reoivent des niveaux d'automatisation DRS "dsactivs". Dans ce type de cluster, chaque machine virtuelle principale est uniquement mise sous tension sur son hte enregistr, sa machine virtuelle secondaire est place automatiquement et aucune des machines virtuelles tolrantes aux pannes n'est dplace pour l'quilibrage de charge. Si vous utilisez des rgles d'affinit avec deux machines virtuelles tolrantes aux pannes, une rgle d'affinit VM-VM s'applique uniquement la machine virtuelle principale, tandis qu'une rgle d'affinit machine virtuelle-hte s'applique la fois la machine virtuelle principale et sa machine virtuelle secondaire.
Cas d'utilisation de tolrance aux pannes

Plusieurs situations typiques peuvent bnficier de l'utilisation de VMware Fault Tolerance. La tolrance aux pannes assure un meilleur niveau de continuit d'activit que VMware HA. Lorsqu'une machine virtuelle secondaire doit intervenir pour remplacer son homologue, la machine virtuelle principale, la machine virtuelle secondaire joue immdiatement le rle de machine virtuelle principale, la totalit de l'tat de la machine virtuelle tant prserv. Les applications sont dj en cours d'excution et les donnes conserves en mmoire ne doivent pas tre ressaisies ou recharges. Ce n'est pas le cas du basculement assur par VMware HA qui redmarre les machines virtuelles affectes par un dysfonctionnement. Ce haut niveau de continuit et la meilleure protection des informations d'tats et des donnes informe les scnarios du dploiement possible de la tolrance aux pannes.
n
Les applications qui doivent tre disponibles en permanence, surtout celles prsentant des connections longues dures de clients que les utilisateurs veulent conserver pendant la dfaillance matrielle. Applications personnalises qui n'ont pas d'autres moyens de former un cluster. Cas o la grande disponibilit peut tre assure par des solutions de formation de cluster personnalises qui sont trs compliques configurer et entretenir.
n n
Tolrance aux pannes la demande

Un autre cas pratique de protection d'une machine virtuelle par la tolrance aux pannes s'intitule la tolrance aux pannes la demande. Dans ce cas, une machine virtuelle est correctement protge par VMware HA pendant son fonctionnement normal. Pendant certaines priodes critiques, vous voudrez renforcer la protection de la machine virtuelle. Pendant la production d'un rapport trimestriel, par exemple, dont l'interruption pourrait retarder la mise disposition d'informations cruciales pour une mission. VMware Fault
VMware, Inc.
35
Tolerance permet de protger la machine virtuelle avant la production du rapport, puis d'teindre ou de mettre hors tension la tolrance aux pannes aprs la publication du rapport. Vous pouvez utiliser la Tolrance aux pannes la demande pour protger la machine virtuelle au cours d'une priode critique et revenir aux ressources normales pour les oprations non critiques.
Liste de vrification de tolrance aux pannes

La liste de vrification suivante contient les exigences en matire de cluster, d'hte et de machine virtuelle que vous devez connatre avant d'utiliser VMware Fault Tolerance. Consultez cette liste avant de configurer la tolrance aux pannes. Vous pouvez aussi utiliser l'utilitaire VMware SiteSurvey (tlchargeable sur http://www.vmware.com/download/shared_utilities.html) pour mieux comprendre les problmes de configuration associs au cluster, l'hte et aux machines virtuelles utilises pour VMware FT.
Exigences aux clusters pour la tolrance aux pannes

Les exigences suivantes aux clusters doivent tre remplies avant d'utiliser la tolrance aux pannes.
n
Vrification du certificat de l'hte active. Reportez-vous Activer la vrification du certificat de l'hte , page 39. Deux htes certifis FT au minimum utilisant la mme version de tolrance aux pannes ou le mme numro de compilation d'hte . Le numro de version de tolrance aux pannes apparat sur l'onglet [Rsum] d'un hte dans le vSphere Client. REMARQUE Pour les htes antrieurs ESX/ESXi 4.1, cet onglet numre les numros de build d'hte. Les correctifs peuvent provoquer une variation des numros de build d'hte entre les installations ESX et ESXi. Pour vous assurer que vos htes sont compatibles avec la tolrance aux pannes, ne mlangez pas les htes ESX et ESXi dans une paire FT.
Les htes ESX/ESXi ont accs aux mmes banques de donnes et rseaux des machines virtuelles. Reportezvous Recommandations relatives la tolrance aux pannes , page 46. Journalisation de la tolrance aux pannes et rseau vMotion configur. Reportez-vous Configurer la mise en rseau des machines htes , page 40. cluster VMware HA cr et activ. Reportez-vous Cration d'un cluster VMware HA , page 20. VMware HA doit tre activ avant la mise sous tension des machines virtuelles tolrantes aux pannes ou l'ajout d'un hte dans un cluster qui prend dj en charge des machines virtuelles tolrantes aux pannes.
Exigences aux htes pour la tolrance aux pannes

Les exigences suivantes aux htes doivent tre remplies avant d'utiliser la tolrance aux pannes.
n
Les htes doivent avoir des processeurs appartenant au groupes de processeurs compatibles avec la tolrance aux pannes. Il est galement fortement recommand que les processeurs des htes soient compatibles entre eux. Voyez l'article de base de connaissance de VMware http://kb.vmware.com/kb/1008027 pour plus d'informations sur les processeurs pris en charge. Les htes doivent disposer d'une licence pour VMware Fault Tolerance. Les htes doivent tre certifis pour VMware Fault Tolerance. Consultez http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par tolrance aux pannes jeux compatibles] pour confirmer si les htes sont certifis. La configuration de chaque hte implique l'activation de la virtualisation matrielle (HV) dans le BIOS.
n n
36
VMware, Inc.
Pour confirmer la compatibilit des htes dans le cluster pour la prise en charge de la tolrance aux pannes, vous pouvez aussi effectuer des vrifications de conformit de profils comme dcrit dans Crer un cluster VMware HA et vrifier la conformit , page 42. REMARQUE Quand un hte ne peut pas prendre en charge VMware Fault Tolerance, vous pouvez en consulter les raisons sur l'onglet [Rsum] de l'hte dans vSphere Client. Cliquez sur l'icne de lgende bleue ct du champ [Hte configur pour FT] et une liste des conditions pour la tolrance aux pannes que l'hte ne satisfait pas s'affiche.
Exigences aux machines virtuelles pour la tolrance aux pannes

Les exigences suivantes aux machines virtuelles doivent tre remplies avant d'utiliser la tolrance aux pannes.
n
Aucun priphrique non pris en charge n'est attach la machine virtuelle. Reportez-vous Interoprabilit de la tolrance aux pannes , page 37. Les machines virtuelles doivent tre conserves dans des fichiers de RDM virtuel ou de disque de machine virtuelle (VMDK) qui sont approvisionns en lourd. Lorsqu'une machine virtuelle est conserve dans un fichier VMDK qui est approvisionn en allg et que vous tentez d'activer la tolrance aux pannes, un message vous avertit que le fichier VMDK doit tre converti. Vous devez mettre hors tension la machine virtuelle pour excuter la conversion. Les fonctions incompatibles ne doivent pas tre excutes avec les machines virtuelles tolrantes aux pannes. Reportez-vous Interoprabilit de la tolrance aux pannes , page 37. Les fichiers de machines virtuelles doivent tre conservs dans un stockage partag. Les solutions de stockage partag approuves comprennent Fibre Channel, iSCSI (matriel et logiciel), NFS et NAS. Seules les machines virtuelles avec un seul vCPU sont compatibles avec la tolrance aux pannes. Les machines virtuelles doivent tre excutes sur l'un des systmes d'exploitation clients pris en charge. Consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations.
n n
Interoprabilit de la tolrance aux pannes

Avant de configurer VMware Fault Tolerance, vous devez connatre les fonctions et produits incompatibles avec la tolrance aux pannes.
Fonctions vSphere non prises en charge par la tolrance aux pannes

Les fonctions vSphere suivantes suivantes ne sont pas prises en charge pour les machines virtuelles tolrantes aux pannes.
n
Snapshots. Les snapshots doivent tre supprims ou soumis avant l'activation de la tolrance aux pannes sur une machine virtuelle. De plus, il n'est pas possible de prendre des snapshots des machines virtuelles sur lesquelles la tolrance aux pannes est active. Stockage vMotion Il n'est pas possible d'appeler le stockage vMotion pour les machines virtuelles pour lesquelles la tolrance aux pannes est active. Pour migrer le stockage, il faut mettre hors tension temporairement la tolrance aux pannes et excuter l'action de stockage vMotion. Une fois fait, vous pouvez ractiver la tolrance aux pannes.
VMware, Inc.
37
Clones lis. Il n'est pas possible d'activer la tolrance aux pannes sur une machine virtuelle qui est lie un clone et il n'est pas non plus possible de crer un clone li partir d'une machine virtuelle dont la tolrance aux pannes est active. VMware Consolidated Backup (VCB) Il n'est pas possible de sauvegarder une machine virtuelle dont la tolrance aux pannes est active avec VCB, vStorage API for Data Protection, VMware Data Recovery ou tout autre produit de sauvegarde similaire exigeant l'utilisation d'un snapshot de machine virtuelle, comme effectu par ESX/ESXi. Pour sauvegarder ainsi une machine virtuelle tolrante aux pannes, il faut pralablement mettre hors tension la tolrance aux pannes, puis la ractiver aprs la sauvegarde. Les snapshots de stockage bas sur une baie n'affectent pas la tolrance aux pannes.
Fonctions et priphriques incompatibles avec la tolrance aux pannes

Pour qu'une machine virtuelle soit compatible avec la tolrance aux pannes, la machine virtuelle ne doit pas utiliser les fonctions ou priphriques suivants. Tableau 3-1. Fonctions et priphriques incompatibles avec la tolrance aux pannes et les actions correctives
Fonction ou priphrique incompatible Machines virtuelles multiprocesseur symtrique (SMP). Seules les machines virtuelles avec un seul vCPU sont compatibles avec la tolrance aux pannes. Mappage disque brut physique (RDM). Action corrective Reconfigurez la machine virtuelle comme vCPU unique. De nombreuses charges de travail prsentent de bonnes performances avec une configuration vCPU unique. Reconfigurez les machines virtuelles avec des priphriques virtuels pris en charge par des RDM physiques de faon ce qu'ils utilisent des RDM virtuels la place. Retirez le lecteur de CD-ROM ou de disquettes virtuels ou reconfigurez la prise en charge avec une image ISO installe sur le stockage partag. Si la paravirtualisation n'est pas requise, reconfigurez la machine virtuelle sans VMI ROM. Dconnectez ces priphriques de la machine virtuelle. Dsactivez la configuration NPIV de la machine virtuelle Cette fonction n'est pas prise en charge par la tolrance aux pannes et doit donc tre dsactive. La tolrance aux pannes ne prend pas en charge les machines virtuelles qui sont configures avec les cartes rseaux virtuelles vlance. Toutefois, vmxnet2, vmxnet3 et e1000 sont intgralement pris en charge. Lorsque vous activez la tolrance aux pannes, la conversion au format de disque appropri est effectue par dfaut. Vous devez mettre hors tension la machine virtuelle pour dclencher cette conversion. La fonction de connexion chaud est automatiquement dsactive pour les machines virtuelles tolrantes aux pannes. Pour la connexion des priphriques chaud (ajout ou suppression), vous devez mettre hors tension temporairement la tolrance aux pannes, effectuer la connexion chaud, puis ractiver la tolrance aux pannes. REMARQUE En cas d'utilisation de la tolrance aux pannes, modifier les paramtres d'un adapteur rseau virtuelle au cours du fonctionnement d'une machine virtuelle est une opration de connexion chaud car elle exige de "dbrancher" la carte rseau, puis de la "rebrancher". Prenons l'exemple d'un adapteur rseau virtuelle pour une machine virtuelle en cours d'excution. Si vous modifiez le rseau auquel la carte rseau virtuelle est connecte, la tolrance aux pannes doit pralablement tre dsactive.
Lecteur de CD-ROM ou de disquettes virtuels pris en charge par un priphrique physique ou distant. Clients paravirtualiss. Priphrique USB et audio. Virtualisation d'identification N-Port (NPIV). relais de cartes rseau Pilotes rseau vlance.
Disques virtuels pris en charge par des disques de provisionnement lourds ou lgers dont les fonctions de cluster ne sont pas actives. Connexion de priphriques chaud
38
VMware, Inc.
Tableau 3-1. Fonctions et priphriques incompatibles avec la tolrance aux pannes et les actions correctives (suite)
Fonction ou priphrique incompatible Extended Page Tables/Rapid Virtualization Indexing (EPT/ RVI). Ports srie ou parallles IPv6 Action corrective EPT/RVI est automatiquement dsactiv pour les machines virtuelles pour lesquelles la tolrance aux pannes est active. Dconnectez ces priphriques de la machine virtuelle. Utilisez les adresses IPv4 avec la tolrance aux pannes.
Prparation du cluster et des htes la tolrance aux pannes

Pour activer VMware Fault Tolerance pour votre cluster, les conditions pralables de la fonction doivent tre remplies et il est ncessaire d'effectuer quelques tapes de configuration sur les htes. Une fois ces tapes accomplies et votre cluster cr, vous pouvez aussi vrifier que la configuration est conforme aux exigences requises pour l'activation de la tolrance aux pannes. Les tches devant tre effectues avant de tenter d'activer la tolrance aux pannes pour le cluster sont les suivantes :
n
Activer la vrification du certificat de l'hte (s'il s'agit d'une mise niveau d'une ancienne version de vCenter Server) Configurer la mise en rseau de chaque hte Crer un cluster VMware HA, ajouter des htes et vrifier la conformit
n n
Lorsque le cluster et les htes sont prts, vous pouvez activer la tolrance aux pannes pour vos machines virtuelles. Reportez-vous Mettre sous tension la tolrance aux pannes pour des machines virtuelles , page 44.
Activer la vrification du certificat de l'hte

La vrification du certificat de l'hte permet de configurer les htes ESX/ESXi de faon ce qu'ils vrifient leurs identits mutuelles, ce qui contribue scuriser l'environnement. La vrification du certificat de l'hte est requise pour les htes ESX/ESXi sur lesquels rsident les machines virtuelles tolrantes aux pannes. Si vous avez install la version 4.1 de VMware vCenter Server, la vrification du certificat de l'hte est active automatiquement. Si vous avez mis niveau partir d'une version antrieure, vous devez effectuer la procdure manuellement. Au cours de cette procdure, vous verrez la liste des htes et leur certificat pour vrification. Vous pouvez vrifier le certificat de l'hte avant de valider l'activation de la vrification du certificat. Les htes non vrifis au cours de cette tape doivent tre vrifis et reconnects manuellement. Procdure 1 2 Connectez vSphere Client vCenter Server. Slectionnez [Administration] , puis [Paramtres vCenter Server] . La fentre [Paramtres vCenter Server] apparat. 3 4 5 Cliquez sur [Paramtres SSL] dans le panneau gauche. Cochez la case [vCenter exige des certificats SSL d'htes vrifis] . Cliquez sur [OK] .
VMware, Inc.
39
Configurer la mise en rseau des machines htes

Sur chaque hte que vous voulez ajouter dans un cluster VMware HA, vous devez configurer deux commutateurs rseau diffrents, de faon ce que l'hte prenne aussi en charge VMware Fault Tolerance. Pour activer la tolrance aux pannes d'un hte, vous devez excuter deux fois cette procdure, une fois par option de groupe de ports pour veiller ce que suffisamment de bande passante soit disponible pour la journalisation de la tolrance aux pannes. Slectionnez une option, terminez la procdure, et recommencez-la une seconde fois en slectionnant l'autre option de groupes de port. Prrequis Des cartes rseau (NIC) de plusieurs gigaoctets sont ncessaires. Pour chaque hte compatible avec la tolrance aux pannes, il faut au minimum deux adaptateurs rseau physiques de plusieurs gigaoctets : par exemple, l'une ddie la journalisation de la tolrance aux pannes et l'autre ddie vMotion. VMware recommande trois cartes rseau ou davantage pour assurer la disponibilit. Les cartes rseau de journalisation vMotion et de tolrance aux pannes doivent tre sur des sous-rseaux diffrents. Procdure 1 2 3 Connectez vSphere Client vCenter Server. Dans l'inventaire de vSphere Server, slectionnez l'hte et cliquez sur l'onglet [Configuration] . Slectionnez [Mise en rseau] sous [Matriel] , puis cliquez sur le lien [Ajouter gestion rseau] . L'assistant Ajouter un rseau apparat. 4 5 6 7 8 9 Slectionnez [VMkernel] sous [Types connexion] et cliquez sur [Suivant] . Slectionnez [Crer un commutateur virtuel] et cliquez sur [Suivant] . Fournir une tiquette pour le commutateur. Slectionnez [Utiliser ce groupe de ports pour vMotion] ou [Utiliser ce groupe de ports pour la journalisation de la tolrance aux pannes] puis cliquez sur [Suivant] . Indiquez une adresse IP et un masque de sous-rseau et cliquez sur [Suivant] . Cliquez sur [Terminer] .
Lorsque vous avez cr la fois un commutateur virtuel de journalisation vMotion et de tolrance aux pannes, vous pouvez crer d'autres commutateurs virtuels en cas de besoin. Ajoutez ensuite l'hte au cluster et suivez les tapes ncessaires l'activation de la tolrance aux pannes. Suivant Pour confirmer la russite de l'activation de vMotion et de la tolrance aux pannes sur l'hte, consultez son onglet [Rsum] dans le vSphere Client. Dans le volet Gnral, les champs [vMotion activ] et [Hte configur pour FT] doivent tre dfinis sur oui. REMARQUE Si vous configurez la mise en rseau pour la prise en charge de la tolrance aux pannes mais que vous dsactivez ensuite le port de journalisation de la tolrance aux pannes, les paires de machines virtuelles tolrantes aux pannes qui sont dj sous tension le restent. Mais si une situation de basculement surgit, une nouvelle machine virtuelle secondaire n'est pas dmarre aprs le remplacement de la machine virtuelle principale par sa machine virtuelle secondaire. Par consquent, la nouvelle machine virtuelle principale fonctionne en tant non protge.
40
VMware, Inc.
Exemple de configuration de la mise en rseau des htes pour la tolrance aux pannes
Cet exemple prsente la configuration rseau de l'hte pour la tolrance aux pannes dans un dploiement typique avec quatre cartes rseau de plusieurs gigaoctets. Ce dploiement garantit un service adquat pour chaque type de trafic identifi ici et il pourrait tre considr comme une configuration exemplaire. La tolrance aux pannes intervient pendant toute la dure de la dfaillance d'un hte physique en raison d'une interruption de l'alimentation lectrique, d'une panique du systme ou d'autres raisons comparables. Les dfaillances des emplacements de stockage ou du rseau ou de tous composants de serveurs physiques qui n'ont pas de rpercussions sur l'tat oprationnel de l'hte n'initient pas un basculement de la tolrance aux pannes sur la machine virtuelle secondaire. Par consquent, les clients sont vivement encourags utiliser la redondance approprie (par exemple, l'association de cartes rseau) pour rduire les risques de perte de la connectivit des machines virtuelles en faveur de composants d'infrastructure comme des rseaux ou des baies de stockage. Les rgles d'association des cartes rseau sont configures sur les groupes de port vSwitch (vSS) (ou groupes de ports virtuels distribus pour vDS) et rgissent la manire dont vSwitch gre et rpartit le trafic sur les adaptateurs rseau physiques (vmnics) des machines virtuelles, des ports vmkernel et des ports de consoles de services. Un groupes de port unique est gnralement utilis pour chaque type de trafic, chacun tant gnralement associ un VLAN diffrent. Directives de configuration de mise en rseau des htes Les directives suivantes vous permettent de configurer la mise en rseau des htes pour la prise en charge de la tolrance aux pannes avec diffrentes combinaisons de types de trafic (par exemple, NFS) et plusieurs adaptateurs rseau physiques.
n
Rpartissez chaque association de cartes rseau sur deux commutateurs physiques assurant la continuit des domaines L2 pour chaque VLAN entre deux commutateurs physiques. Utilisez des rgles d'association dterministe pour vous assurer que des types de trafic particulier prsentent une affinit avec un adapteur rseau particulire (active/veille) ou un ensemble de cartes rseau (par exemple, ID port virtuel d'origine). Quand des rgles active/veille sont utilises, associez les types de trafic pour rduire les rpercussions en cas de basculement o les deux types de trafic partagent un vmnic. Quand des rgles active/veille sont utilises, configurez tous les adaptateurs actifs pour un type de trafic particulier (par exemple, journalisation de la tolrance aux pannes) sur le mme commutateur physique. Cela rduit le nombre de bonds rseau et diminue les possibilits de surexploitation du commutateur.
Exemple de configuration avec cartes rseau de 4 Go Figure 3-2 illustre la configuration rseau d'un seul l'hte ESX/ESXi avec quatre cartes rseau de plusieurs gigaoctets compatibles avec la tolrance aux pannes. Les autres htes du cluster tolrant aux pannes seraient configurs de la mme manire. Cet exemple utilise quatre groupes de ports configurs comme suit :
n
VLAN A : groupes de ports rseau des machines virtuelles actif sur vmnic2 (vers le commutateur physique #1) ; en veille sur vmnic0 (vers le commutateur physique #2.) VLAN B : groupes de ports de console de service actif sur vmnic0 (vers le commutateur physique #2) ; en veille sur vmnic2 (vers le commutateur physique #1.) VLAN C : groupes de ports de vMotion actif sur vmnic1 (vers le commutateur physique #2) ; en veille sur vmnic3 (vers le commutateur physique #1.) VLAN D : groupes de ports de journalisation de la tolrance aux pannes actif sur vmnic3 (vers le commutateur physique #1) ; en veille sur vmnic1 (vers le commutateur physique #2.)
VMware, Inc.
41
vMotion et la journalisation de la tolrance aux pannes peuvent partager le mme VLAN (configurez le mme nombre de VLAN dans les deux groupes de ports), mais ils exigent leur propre adresse IP unique rsidant dans diffrents sous-rseaux IP. Toutefois, des VLAN spars peuvent tre prfrs si des restrictions de qualit de service (QoS) sont en vigueur sur le rseau physique avec des rgles de QoS bases sur VLAN. QoS est particulirement utilise lorsque le trafic concurrent intervient, par exemple, lorsque plusieurs bonds de commutateurs physiques sont utiliss ou quand un basculement a lieu et que plusieurs types de trafic entrent en concurrence pour des ressources rseau. Figure 3-2. Exemple de configuration de mise en rseau pour la tolrance aux pannes
FT vMotion
virtuel machine
virtuel machine
virtuel machine
service console
vmkernel
VLAN A
VLAN B
VLAN D
VLAN C
vmnic2
vmnic0
vmnic3
vmnic1
Joncteurs rseau VLAN sur des liaisons montantes Ports de commutateur physique configurs comme VLAN joncteurs et porte les VLAN A, B, C et D
vSwitch (vSS or vDS) dans Jonction de commutateur virtuel Mode (VST) balisage VLAN trames transmises liaison montante vers/ partir de vmnics physique commutateur 2
physique rgles d'association de groupes de ports commutateur 1 active mode veille
Crer un cluster VMware HA et vrifier la conformit

Tolrance aux pannes VMware est utilise dans le cadre d'un cluster VMware HA. Aprs avoir configur la mise en rseau de chaque hte, crez le cluster VMware HA et ajoutez-y les htes. Vous pouvez vrifier que le cluster est configur correctement et est conforme aux exigences relatives l'activation russie de la tolrance aux pannes. Procdure 1 2 3 Connectez vSphere Client vCenter Server. Dans l'inventaire de vSphere Server, slectionnez le cluster et cliquez sur l'onglet [Conformit de profil] . Cliquez sur [Vrifier la conformit maintenant] pour excuter les tests de conformit. Pour visionner les tests effectus, cliquez sur [Description] . Les rsultats du test de conformit sont affichs en bas de l'cran. Un hte est dsign comme tant conforme ou non conforme. REMARQUE Pour plus d'informations sur la cration d'un cluster VMware HA, reportez-vous Chapitre 2, Cration et utilisation des clusters VMware HA , page 11.
42
VMware, Inc.
Fourniture de la tolrance aux pannes des machines virtuelles

Aprs avoir suivi les tapes ncessaires pour activer VMware Fault Tolerance pour votre cluster, vous pouvez utiliser la fonction en l'activant pour des machines virtuelles individuelles. L'option pour activer la tolrance aux pannes n'est pas disponible (grise) si l'une de ces conditions s'applique :
n n n n
La machine virtuelle rside sur un hte qui n'a pas de licence pour la fonction. La machine virtuelle rside sur un hte qui est dans le mode maintenance ou le mode de veille. La machine virtuelle est dconnecte ou orpheline (son fichier .vmx n'est pas accessible). L'utilisateur n'a pas l'autorisation d'activer la fonction.
Si l'option pour activer la tolrance aux pannes est disponible, cette tche doit encore tre valide et peut chouer si certaines conditions n'est pas remplies.
Contrles de validation pour l'activation de la tolrance aux pannes

Plusieurs contrles de validation sont excuts sur une machine virtuelle avant de pouvoir activer la tolrance aux pannes.
n n n n n n n
Le contrle de certificat SSL doit tre activ dans les paramtres de vCenter Server. L'hte doit tre dans un cluster HA VMware ou un cluster mixte HA et DRS VMware. L'hte doit avoir ESX/ESXi 4.0 ou ultrieur install. La machine virtuelle ne doit pas avoir plusieurs vCPU. La machine virtuelle ne doit pas avoir de snapshots. La machine virtuelle ne doit pas tre un modle. La machine virtuelle ne doit pas avoir VMware HA dsactiv.
Plusieurs vrifications de validation supplmentaires sont effectues pour les machines virtuelles sous tension (ou celles qui sont en cours de mise sous tension).
n
Le BIOS des htes o rsident les machines virtuelles tolrantes aux pannes doit avoir la virtualisation matrielle (HV, Hardware Virtualization) active. L'hte qui prend en charge la machine virtuelle principale doit avoir un processeur qui prend en charge la tolrance aux pannes. L'hte qui prend en charge la machine virtuelle secondaire doit avoir un processeur qui prend en charge la tolrance aux pannes et dont la famille ou le modle de CPU est le mme que l'hte qui prend en charge la machine virtuelle principale. Les composants matriels doivent tre certifis compatibles avec la tolrance aux pannes. Pour le vrifier, reportez-vous au Guide de compatibilit VMware l'adresse http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par tolrance aux pannes jeux compatibles] . La combinaison du systme de la machine virtuelle d'exploitation invit et le processeur doit tre prise en charge par la tolrance aux pannes (par exemple, Solaris de 32 bits sur des processeurs AMD n'est pas actuellement pris en charge). Consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations sur la combinaison de processeurs et les systmes d'exploitation clients pris en charge. La configuration de la machine virtuelle doit tre valide pour tre utilise avec une tolrance aux pannes (par exemple, la configuration ne peut comporter aucun priphrique non pris en charge.).
VMware, Inc.
43
Quand votre effort d'activation de la tolrance aux pannes pour une machine virtuelle russit aux contrles de validation, la machine virtuelle secondaire est cre. Le placement et le statut immdiat de la machine virtuelle secondaire dpendent de l'tat sous tension ou hors tension de la machine virtuelle principale quand vous avez activ la tolrance aux pannes. Si la machine virtuelle principale est sous tension :
n
L'tat complet de la machine virtuelle principale est copi et la machine virtuelle secondaire est cre, place sur un hte compatible distinct et mise sous tension si elle passe le contrle d'admission. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est [Protg] .
Si la machine virtuelle principale est hors tension :

n
La machine virtuelle secondaire est cre immdiatement et enregistre dans le cluster d'un hte (Il doit tre enregistr sur un hte plus appropri lorsqu'il est mis sous tension.) La machine virtuelle secondaire est mise sous tension seulement aprs la mise sous tension de la machine virtuelle principale. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans vSphere Client est [Non protg, VM inactive] . Quand vous essayez de mettre sous tension la machine virtuelle primaire aprs l'activation de la tolrance aux pannes, les contrles supplmentaires de validation sont excuts. Pour mettre sous tension correctement, la machine virtuelle ne doit pas employer la paravirtualisation (VMI). Aprs le passage de ces contrles, les machines virtuelles principales et secondaires sont mises sous tension et places sur les htes distincts et compatibles. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est marqu [Protg] .
Mettre sous tension la tolrance aux pannes pour des machines virtuelles
Vous pouvez activer Tolrance aux pannes VMware par l'intermdiaire de vSphere Client. Quand la tolrance aux pannes est active, vCenter Server dsactive la limite de mmoire de la machine virtuelle et dfinit la rservation de mmoire en fonction de la taille de la mmoire de la machine virtuelle. Si la tolrance aux pannes reste active, il n'est pas possible de modifier la rservation de mmoire, sa taille, la limite ou les partages. Quand la tolrance aux pannes est dsactive, les valeurs d'origine de tous les paramtres qui ont t modifis ne sont pas restaures. Connectez vSphere Client vCenter Server en utilisant un compte ayant des droits d'accs administrateur au cluster. Procdure 1 2 Slectionnez les vues Htes & Clusters. Cliquez avec le bouton droit sur une seule machine virtuelle et slectionnez [Tolrance aux pannes] > [Dmarrer tolrance aux pannes] . Si vous slectionnez plusieurs machines virtuelles, le menu [Tolrance aux pannes] est dsactiv. Vous devez activer Tolrance aux pannes pour une seule machine virtuelle la fois. La machine virtuelle spcifie est dsigne comme machine virtuelle principale et une machine virtuelle secondaire est tablie sur un autre hte. La machine virtuelle principale est dsormais tolrante aux pannes.
44
VMware, Inc.
Affichage des informations sur les machines virtuelles tolrantes aux pannes
Vous pouvez consulter les machines virtuelles tolrantes aux pannes dans l'inventaire de vCenter Server en utilisant le vSphere Client. REMARQUE Vous ne pouvez pas mettre hors tension la tolrance aux pannes de la machine virtuelle secondaire. Le volet VMware Fault Tolerance apparat dans l'onglet [Rsum] pour la machine virtuelle primaire et inclut des informations sur la machine virtuelle. tat de la tolrance aux pannes Indique l'tat de tolrance aux pannes de la machine virtuelle.
n
Protected. Indique que les machines virtuelles principale et secondaire sont sous tension et fonctionnent comme prvu. Non protg. Indique que la machine virtuelle secondaire ne fonctionne pas. Les raisons possibles sont rpertoris dans le tableau. Tableau 3-2. Raisons pour l'tat non protg de la machine virtuelle principale
Raison pour l'tat non protg Dmarrage Description Tolrance aux pannes est en train de dmarrer la VM secondaire. Ce message n'est visible que pour une courte priode de temps. La machine virtuelle principale fonctionne sans machine virtuelle secondaire, ainsi la machine virtuelle principale n'est actuellement pas protge. Ceci se produit gnralement quand il n'y a aucun hte compatible dans le cluster disponible pour la machine virtuelle secondaire. Corrigez cette situation en plaant un hte compatible en ligne. S'il existe un hte compatible en ligne dans le cluster, il peut tre ncessaire d'approfondir la question. Dans certaines circonstances, la dsactivation de la tolrance aux pannes puis sa ractivation corrige ce problme. La tolrance aux pannes est actuellement dsactive (aucune machine virtuelle secondaire ne fonctionne). Ceci se produit quand la tolrance aux pannes est dsactive par l'utilisateur ou quand vCenter Server dsactive la tolrance aux pannes aprs avoir chou dans la mise sous tension de la machine virtuelle secondaire. La tolrance aux pannes est active mais la machine virtuelle est hors tension. Mettez sous tension la machine virtuelle pour atteindre l'tat Protected.
VM secondaire ncessaire
Dsactiv
Machine virtuelle hors excution
Emplacement secondaire
Affiche l'hte ESX/ESXi sur lequel la machine virtuelle secondaire est hberge.
VMware, Inc.
45
CPU secondaire totale Mmoire secondaire totale Intervalle vLockstep
Indique l'utilisation de la CPU de la machine virtuelle secondaire, exprime en MHz. Indique l'utilisation de la mmoire de la machine virtuelle secondaire, exprime en Mo. Intervalle de temps (en secondes) requis pour que la machine virtuelle secondaire corresponde l'tat d'excution actuel de la machine virtuelle primaire. En gnral, cet intervalle est infrieur une demi-seconde. Aucun tat n'est perdu pendant un basculement, quelle que soit la valeur de l'intervalle vLockstep. La quantit de capacit rseau utilise pour envoyer les informations de journalisation de VMware Fault Tolerance depuis l'hte excutant la machine virtuelle principale jusqu' l'hte excutant la machine virtuelle secondaire.
Log Bandwidth
Pour chaque hte configur pour prendre en charge la tolrance aux pannes, vous pouvez consulter les informations sur ses machines virtuelles tolrantes aux pannes en accdant l'onglet [Rsum] de l'hte dans vSphere Client. [Trans]The [Tolrance aux pannes] section of this screen displays the total number of Primary and Secondary VMs residing on the host and the number of those virtual machines that are powered on. [Trans]If the host is ESX/ESXi 4.1 or greater, this section also displays the Fault Tolerance version the host is running. Autrement, elle mentionne le numro de build de l'hte. [Trans]For two hosts to be compatible they must have matching FT version numbers or matching host build numbers.
Recommandations relatives la tolrance aux pannes

Pour bnficier de rsultats optimums avec la tolrance aux pannes, VMware recommande de respecter quelques meilleures pratiques. En plus des rubriques ci-dessous, vous pouvez aussi consulter le livre blanc sur http://www.vmware.com/resources/techresources/10040 pour plus d'informations sur les recommandations relatives la tolrance aux pannes.
Configuration d'hte
Suivez les recommandations suivantes lors de la configuration des htes.
n
Les htes excutant les machines virtuelles principales et secondaires doivent fonctionner des frquences de processeur assez proches sinon la machine virtuelle secondaire risque de redmarrer plus souvent. Les fonctions de gestion de l'alimentation de la plate-forme qui ne sont pas ajustes selon la charge de travail (modes de limitation de puissance et de basse frquence pour conomiser de l'nergie, par exemple) peuvent entraner de fortes variations des frquences du processeur. Si des machines virtuelles secondaires sont redmarres rgulirement, dsactivez tous les modes de gestion de l'alimentation sur les htes excutant des machines virtuelles tolrantes aux pannes ou veillez ce que tous les htes soient excuts avec les mme modes de gestion de l'alimentation. Appliquez la mme configuration d'extension de jeux d'instructions (activ ou dsactiv) tous les htes. Le processus d'activation ou de dsactivation des jeux d'instructions varie en fonction du BIOS. Reportezvous la documentation du BIOS de vos htes pour plus d'informations sur la configuration des jeux d'instructions.
46
VMware, Inc.
Clusters homognes
VMware Fault Tolerance peut fonctionner dans des clusters avec des htes non uniformes, mais il est prfrable que les clusters aient des nuds compatibles. Au moment de la construction du cluster, tous les htes doivent intgrer les lments suivants :
n n n n n
Processeurs appartenant au mme groupes de processeurs compatibles. Accs commun aux banques de donnes utilises par les machines virtuelles. La mme configuration rseau de machines virtuelles. La mme version ESX/ESXi Le mme numro de version de tolrance aux pannes (ou de numro de compilation d'hte pour les htes antrieurs ESX/ESXi 4.1). Les mme paramtres BIOS (gestion de l'alimentation et hyperthreading) pour tous les htes.
Excutez [Vrifier la conformit] pour identifier les incompatibilits et les corriger.
Performances
Pour accrotre la bande passante disponible pour le trafic de journalisation entre les machines virtuelles principales et secondaires, utilisez un adapteur rseau 10 Gbit au lieu d'un modle 1 Gbit et activez l'utilisation des Trames jumbo.
Stocker les images ISO sur des stockages partags pour un accs permanent
Les images ISO auxquelles accdent les machines virtuelles dont la tolrance aux pannes est active doivent tre conserves sur des stockages partags qui sont accessibles aux deux instances de machines virtuelles tolrantes aux pannes. Si cette configuration est utilise, le CD-ROM dans la machine virtuelle continue fonctionner correctement, mme en cas de basculement. Pour les machines virtuelles dont la tolrance aux pannes est active, il est possible d'utiliser les images ISO qui sont uniquement accessibles par la machine virtuelle principale. Dans ce cas, la machine virtuelle principale peut accder l'image ISO, mais en cas de dfaillance, le CD-ROM signale les erreurs comme s'il n'y avait pas de support. Cette situation peut tre tolre si le CD-ROM est utilis pour une opration provisoire et non critique comme une installation.
Basculements vers des machines virtuelles

Une machine virtuelle principale ou secondaire peut basculer, mme si son hte ESX/ESXi n'est pas dfectueux. Dans ce cas, l'excution de la machine virtuelle n'est pas interrompue mais la redondance est temporairement perdue. Pour viter ce type de basculement, soyez conscient de quelques-unes des situations pouvant survenir et prenez des mesures pour les viter.
Panne matrielle partielle lie au stockage

Ce problme peut survenir lorsque l'accs au stockage est lent ou interrompu sur l'un des htes. Lorsque cela se produit, de nombreuses erreurs de stockage sont prsentes dans le journal VMkernel. Pour rsoudre ce problme, vous devez liminer les problmes de stockage.
Panne matrielle partielle lie au rseau

Si la carte rseau de journalisation ne fonctionne pas ou si les connexions d'autres htes via cette carte rseau sont dfectueuses, cela risque de dclencher le basculement d'une machine virtuelle tolrante aux pannes de faon rtablir la redondance. Pour viter ce problme, ddiez un adapteur rseau spare au trafic de journalisation vMotion et FT et excutez uniquement les migrations vMotion quand les machines virtuelles sont moins actives.
VMware, Inc.
47
Bande passante insuffisante sur le rseau de la carte de journalisation

Cela peut se produire lorsque trop de machines virtuelles tolrantes aux pannes se trouvent sur un hte. Pour rsoudre ce problme, rpartissez davantage les paires de machines virtuelles tolrantes aux pannes entre les htes.
Dfaillances de vMotion en raison du niveau d'activit des machines virtuelles

En cas d'chec de la migration vMotion d'une machine virtuelle tolrante aux pannes, celle-ci peut avoir besoin d'tre bascule. Cela se produit gnralement lorsque la machine virtuelle est trop active pour que la migration soit acheve avec seulement des perturbations minimales de l'activit. Pour viter ce problme, effectuez uniquement les migrations vMotion quand les machines virtuelles sont moins actives.
Une activit excessive sur le volume VMFS peut entraner le basculement des machines virtuelles
Lorsqu'un certain nombre d'oprations de verrouillage du systme de fichiers, de mises hors et sous tension des machines virtuelle ou de migrations vMotion se produisent sur un seul volume VMFS, cela risque de dclencher le basculement des machines virtuelles tolrantes aux pannes. La rception de nombreux avertissements relatifs des rservations SCSI dans le journal VMkernel peut tre un symptme. Pour rsoudre ce problme, rduisez le nombre d'oprations dans le systme de fichiers ou vrifiez que la machine virtuelle tolrante aux pannes se trouve sur un volume VMFS qui ne contient pas un grand nombre de machines virtuelles rgulirement mises sous tension, mises hors tension ou migres l'aide de vMotion.
Le manque d'espace dans le systme de fichiers empche le dmarrage d'une machine virtuelle secondaire
Vrifiez que les systmes de fichiers /(root) ou /vmfs/datasource ont de l'espace disponible. Ces systmes de fichiers peuvent tre pleins pour de nombreuses raisons et un manque d'espace peut empcher le dmarrage d'une nouvelle machine virtuelle secondaire.
Mise niveau des htes utiliss pour la tolrance aux pannes

Lorsque vous mettez niveau des htes qui contiennent des machines virtuelles tolrantes aux pannes, vrifiez que les machines virtuelles principales et secondaires continuent tre excutes sur des htes ayant le mme numro de version de tolrance aux pannes ou de numro de compilation d'hte (pour les htes antrieurs ESX/ESXi 4.1). Prrequis Vrifiez que vous possdez des privilges d'administrateur sur les clusters. Vrifiez que vous possdez des jeux de quatre htes ESX/ESXi ou davantage hbergeant des machines virtuelles tolrantes aux pannes sous tension. Si les machines virtuelles sont hors tension, les machines virtuelles principales et secondaires tolrantes aux pannes peuvent tre dplaces sur des htes de versions diffrentes. REMARQUE Cette procdure de mise niveau est adapte aux clusters de quatre nuds au minimum. Les mmes instructions peuvent tre suivies avec un plus petit cluster, mais les intervalles sans protection seront lgrement plus longs. Procdure 1 2 3 4 Avec vMotion, migrez les machines virtuelles tolrantes aux pannes partir des deux htes. Mettez niveau les deux htes vacus avec la mme version d'ESX/ESXi. Dsactivez la tolrance aux pannes sur la machine virtuelle principale. Avec vMotion, dplacez la machine virtuelle principale vers l'un des htes mis niveau.
48
VMware, Inc.
5 6 7
Activez la tolrance aux pannes sur la machine virtuelle principale qui a t dplace. Rptez tape 1 tape 5 pour autant de paires de machines virtuelles tolrantes aux pannes que les htes mis niveau peuvent en accueillir. Avec vMotion, rpartissez les machines virtuelles tolrantes aux pannes.
Tous les htes ESX/ESXi d'un cluster sont mis niveau.
Recommandations de configuration de la tolrance aux pannes par VMware

VMware vous recommande de respecter certaines directives lors de la configuration de la tolrance aux pannes.
n
En plus des machines virtuelles non tolrantes aux pannes, vous ne devez pas avoir plus de quatre machines virtuelles (principales ou secondaires) tolrantes aux pannes par hte unique. Le nombre de machines virtuelles tolrantes aux pannes que vous pouvez excuter en toute scurit sur chaque hte est bas sur la taille et la charge de travail variables des htes ESX/ESXi et des machines virtuelles. Si vous accdez au stockage partag par NFS, utilisez du matriel NAS ddi avec un adapteur rseau de 1 Gbit au minimum pour parvenir aux performances rseaux requises pour le bon fonctionnement de la tolrance aux pannes. Veillez ce qu'un pool de ressources contenant des machines virtuelles tolrantes aux pannes dispose de rserves de mmoire dpassant la capacit de mmoire des machines virtuelles. La rservation de mmoire d'une machine virtuelle tolrance aux pannes est dfinie par la taille de la mmoire de la machine virtuelle lorsque la tolrance aux pannes est active. Sans cet excdent de pool de ressources, il risque de ne pas y avoir de mmoire disponible comme capacit supplmentaire. Utilisez 16 disques virtuels au maximum par machine virtuelle tolrante aux pannes. Pour assurer la redondance et une protection maximale de la tolrance aux pannes, il est recommand d'avoir un nombre minimum de trois htes par cluster. Dans une situation de basculement, on dispose ainsi d'un hte capable de grer la nouvelle machine virtuelle secondaire qui est cre.
n n
Dpannage de la tolrance aux pannes

Il est ncessaire de connatre quelques rubriques de dpannage pour conserver un haut niveau de performance et de stabilit pour les machines virtuelles tolrantes aux pannes et pour rduire les taux de basculement. Les rubriques de dpannage traitent essentiellement de problmes que vous risquez de rencontrer au cours de l'utilisation de la fonction Tolrance aux pannes VMware sur les machines virtuelles. Les rubriques expliquent galement comment rsoudre les problmes. Vous pouvez vous rfrer aux informations fournies en annexe Messages d'erreurs de tolrance aux pannes pour faciliter le dpannage de la tolrance aux pannes. L'annexe contient la liste des messages d'erreurs que vous pourriez rencontrer lorsque vous essayez d'utiliser la fonction, ainsi que des conseils sur la rsolution de l'erreur, le cas chant.
La virtualisation matrielle doit tre active

Vous devez activer la virtualisation matrielle (HV) avant d'utiliser VMware Fault Tolerance. Problme Lorsque vous essayez de mettre sous tension une machine virtuelle dont la Tolrance aux pannes est active, un message d'erreur risque d'apparatre si vous n'avez pas activ HV.
VMware, Inc.
49
Cause Ceci est souvent d au fait que la virtualisation matrielle (HV) n'est pas disponible sur le serveur ESX/ESXi sur lequel vous essayez de mettre sous tension la machine virtuelle. Il est possible que la virtualisation matrielle ne soit pas non plus disponible parce qu'elle n'est pas prise en charge par les composants matriels du serveur ESX/ESXi ou qu'elle n'a pas t active dans le BIOS. Solution Si les composants matriels du serveur ESX/ESXi prennent en charge la virtualisation matrielle, mais que celle-ci n'est pas active, activez-la dans le BIOS du serveur. Le processus d'activation de la virtualisation matrielle varie en fonction du BIOS. Reportez-vous la documentation du BIOS de vos htes pour plus d'informations sur la configuration de la virtualisation matrielle. Si les composants matriels du serveur ESX/ESXi ne prennent pas en charge la virtualisation matrielle, basculez sur des composants matriels qui utilisant des processeurs qui prennent en charge la tolrance aux pannes.
Des htes compatibles doivent tre disponibles pour les machines virtuelles secondaires
Si vous mettez sous tension une machine virtuelle avec la Tolrance aux pannes active et qu'aucun hte compatible n'est disponible pour sa machine virtuelle secondaire, un message d'erreur s'affichera peut-tre. Problme Le message d'erreur suivant est susceptible de s'afficher dans le panneau Tches rcentes :
La machine virtuelle secondaire ne peut tre allume car il n'existe pas d'hte compatible.
Cause Ce problme peut s'expliquer de diffrentes manires. Parmi les causes possibles, on peut citer le fait qu'il n'y a pas d'autres htes dans le cluster, qu'il n'y a pas d'autres htes dont la virtualisation matrielle est active, que les banques de donnes sont inaccessibles, qu'il n'y a pas de capacit disponible ou que les htes sont en mode maintenance. Solution S'il n'y a pas suffisamment d'htes, ajoutez-en davantage dans le cluster. S'il y a des htes dans le cluster, vrifiez qu'ils prennent en charge la virtualisation matrielle et que celle-ci est active. Le processus d'activation de la virtualisation matrielle varie en fonction du BIOS. Reportez-vous la documentation du BIOS de vos htes pour plus d'informations sur la configuration de la virtualisation matrielle. Vrifiez que les htes disposent de capacit suffisante et qu'ils ne sont pas en mode de maintenance.
Une machine virtuelle secondaire sur un hte surcharg dgrade les performances de la machine virtuelle principale
Lorsqu'une machine virtuelle principale semble ralentie, alors que la charge de travail de son hte est lgre et qu'elle conserve du temps de CPU inactif, vrifiez que l'hte sur lequel la machine virtuelle secondaire est excute n'est pas surcharg. Problme Lorsqu'une machine virtuelle secondaire rside sur un hte fortement charg, ceci peut affecter la performance de la machine virtuelle principale.
50
VMware, Inc.
Une manifestation de ce problme peut tre le voyant jaune ou rouge pour l'intervalle vLockstep sur le panneau de tolrance aux pannes de la machine virtuelle principale. Cela signifie que la machine virtuelle secondaire a quelques secondes de retard par rapport la machine virtuelle principale. Dans ce cas, la tolrance aux pannes ralentit la machine virtuelle principale. Si l'intervalle vLockstep reste jaune ou rouge de manire prolonge, cela indique que la machine virtuelle secondaire ne bnficie pas de suffisamment de ressources CPU pour suivre la machine virtuelle principale. Cause Une machine virtuelle secondaire excute sur un hte dont les ressources de CPU sont surcharges ne bnficiera pas ncessairement de la mme quantit de ressources CPU que la machine virtuelle principale. Si c'est le cas, la machine virtuelle principale doit ralentir pour que la machine virtuelle secondaire parvienne la suivre. Elle rduit alors sa vitesse d'excution pour atteindre la vitesse infrieure de la machine virtuelle secondaire. Solution Pour rsoudre ce problme, dfinissez une rservation de CPU explicite pour la machine virtuelle principale en rglant une valeur en MHz suffisante pour l'excution de la charge de travail au niveau de performances requis. Cette rservation est applique la fois aux machines virtuelles principale et secondaire, ce qui garantit qu'elles pourront toutes deux fonctionner la vitesse spcifie. Pour vous aider dfinir cette rservation, consultez les courbes de performances de la machine virtuelle (avant l'activation de la tolrance aux pannes) pour vrifier la quantit de ressources CPU utilise dans des conditions normales.
Les machines virtuelles ayant une grosse mmoire peuvent empcher l'utilisation de la tolrance aux pannes
Il est uniquement possible d'activer la tolrance aux pannes sur les machines virtuelles dont la mmoire ne dpasse pas 64 Go. Problme L'activation de la Tolrance aux pannes sur une machine virtuelle possdant plus de 64 Go peut chouer. La migration d'une machine virtuelle tolrante aux pannes, en cours d'excution et utilisant vMotion, risque aussi d'chouer si sa mmoire dpasse 15 Go ou si celle-ci change une vitesse suprieure la capacit de copie de vMotion sur le rseau. Cause Cela se produit cause de la capacit de mmoire de la machine virtuelle, il n'y a plus suffisamment de bande passante pour achever l'opration de basculement vMotion pendant le dlai d'expiration par dfaut (8 secondes). Solution Pour rsoudre ce problme, avant d'activer la tolrance aux pannes, teignez la machine virtuelle et augmentez son dlai d'expiration en ajoutant la ligne suivante dans le fichier vmx de la machine virtuelle :
ft.maxSwitchoverSeconds = "30"
o 30 est le dlai d'expiration en nombre de secondes. Activez la tolrance aux pannes et rallumez la machine virtuelle. Cette solution devrait tre efficace lorsque le rseau prsente une forte activit. REMARQUE Si vous augmentez le dlai d'expiration 30 secondes, la machine virtuelle tolrante aux pannes risque de ne plus rpondre pendant une dure plus longue (jusqu' 30 secondes) lors de l'activation de la tolrance aux pannes ou lorsqu'une nouvelle machine virtuelle secondaire est cre suite un basculement.
VMware, Inc.
51
L'utilisation de la CPU par la machine virtuelle secondaire semble excessive

Dans certains cas, vous constaterez que l'utilisation de la CPU pour une machine virtuelle secondaire est suprieure celle de la machine virtuelle principale qui y est associe. Problme Lorsque la machine virtuelle principale est inactive, la diffrence relative entre les machines virtuelles principale et secondaire peut paratre importante. Cause Le fait de relire des vnements (comme des interruptions du temporisateur) sur la machine virtuelle secondaire peut tre lgrement plus coteux en charge de calcul que leur enregistrement sur la machine virtuelle principale. Cette charge additionnelle est minime. Solution Aucune requise. L'examen de l'utilisation effective de la CPU rvle que trs peu de ressources CPU sont utilises par la machine virtuelle principale ou secondaire.
52
VMware, Inc.
Annexe : Message d'erreurs de tolrance aux pannes
Vous rencontrerez parfois des messages d'erreurs dans le cas de l'utilisation de VMware Fault Tolerance (FT). Les tableaux ci-dessous numrent quelques messages d'erreurs. Chaque message d'erreur s'accompagne d'une description et d'informations sur la rsolution de l'erreur, le cas chant. En plus de l'onglet [Tches et vnements] de vSphere Client, vous pouvez aussi consulter les erreurs de tolrance aux pannes dans l'onglet [Rcapitulatif] de la machine virtuelle.
Messages d'erreurs de configuration de tolrance aux pannes

Le tableau ci-dessous numre quelques messages d'erreurs qui apparaissent lorsque votre hte ou cluster n'est pas configur correctement pour la prise en charge de la tolrance aux pannes. Reportez-vous Liste de vrification de tolrance aux pannes , page 36 pour plus d'informations sur les exigences de configuration des htes et des clusters pour la tolrance aux pannes. Tableau A-1. Erreurs de configuration
Message d'erreur La CPU de l'hte n'est pas compatible avec les exigences requises pour la machine virtuelle. Non-concordance dtecte pour les fonctions suivantes : La CPU ne correspond pas La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : La tolrance aux pannes n'est pas prise en charge par les composants matriels de l'hte La ROM de la machine virtuelle n'est pas prise en charge L'hte {hostName} a rencontr des problmes de tolrance aux pannes pour la machine virtuelle {vmName}. Consultez la liste des erreurs pour plus d'informations La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : vrifiez les certificats de l'hte non dfinis pour vCenter Server La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : HA n'est pas activ sur la machine virtuelle Description et solution La tolrance aux pannes exige que les htes des machines virtuelles principales et secondaires utilisent la mme CPU. Activez la tolrance aux pannes sur une machine virtuelle enregistre sur un hte ayant un modle de CPU, une famille et une version concordants dans le cluster. Si ce type d'htes n'existe pas, vous devez en ajouter un . Ces erreurs se produisent aussi lorsque vous tentez de migrer une machine virtuelle tolrante aux pannes sur un autre hte. La tolrance aux pannes est uniquement prise en charge sur des processeurs spcifiques et des configurations de BIOS avec la virtualisation matrielle (HV) active. Pour rsoudre ce problme, utilisez des htes ayant des modles de CPU et des configurations de BIOS compatibles. La machine virtuelle utilise un noyau VMI et est paravirtualise. VMI n'est pas pris en charge par la tolrance aux pannes et doit tre dsactiv pour la machine virtuelle. Pour rsoudre ce problme, dans vSphere Client, slectionnez l'opration de tolrance aux pannes dfectueuse dans le volet Tches rcentes ou dans l'onglet [Tches et vnements] et cliquez sur le lien [Dtails de vue] qui apparat dans la colonne Dtails. La case "Vrifier les certificats de l'hte" n'est pas coche dans les paramtres SSL de vCenter Server. Vous devez cocher cette case. Reportez-vous Activer la vrification du certificat de l'hte , page 39.
Cette machine virtuelle se trouve sur un hte qui n'est pas dans un cluster VMware HA ou VMware HA a t dsactiv. La tolrance aux pannes exige VMware HA.
VMware, Inc.
53
Tableau A-1. Erreurs de configuration (suite)

Message d'erreur La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : L'hte est inactif L'hte {hostName} ne dispose pas d'une licence pour la tolrance aux pannes. La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : aucune licence vMotion ou carte rseau virtuelle n'est configure pour vMotion La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : aucun adapteur rseau virtuelle n'est configure pour la journalisation de la tolrance aux pannes L'hte {hostName} ne prend pas en charge les machines virtuelles dont la tolrance aux pannes est active. Ce produit VMware ne prend pas en charge la tolrance aux pannes. La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : La tolrance aux pannes n'est pas prise en charge par VMware Server 2.0 La version compilation ou la version de la fonction de tolrance aux pannes de l'hte de destination est diffrente de la version build actuelle ou de la version de la fonction de tolrance aux pannes : {build}. Description et solution Vous devez activer la tolrance aux pannes sur un hte actif. Un hte est dit inactif lorsqu'il est dconnect, en mode maintenance ou en veille. Toutes les ditions de VMware vSphere ne disposent pas d'une licence pour la tolrance aux pannes. Vrifiez la version utilise et mettez-la niveau vers une version qui comprend la tolrance aux pannes. Vrifiez que vous avez configur correctement le rseau sur l'hte. Reportez-vous Configurer la mise en rseau des machines htes , page 40. Si c'est le cas, vous devez ventuellement acheter une licence vMotion.
Aucun adapteur rseau de journalisation de la tolrance aux pannes n'a t configure. Consultez Configurer la mise en rseau des machines htes , page 40 pour plus d'informations.
Le produit utilis n'est pas compatible avec la tolrance aux pannes. Pour utiliser le produit, vous devez mettre hors tension la tolrance aux pannes. Ce message d'erreur apparat principalement quand vCenter Server gre un hte ayant une version prcdente d'ESX/ESXi ou en cas d'utilisation de VMware Server. Mettez niveau vers la version VMware ESX ou ESXi 4.1 ou une version ultrieure.
Les versions de la fonction de tolrance aux pannes doivent tre identiques sur les htes actuels et de destination. Choisissez un hte compatible ou mettez niveau des htes incompatibles.
Erreurs de configuration des machines virtuelles

Quelques problmes de configuration des machines virtuelles peuvent gnrer des messages d'erreurs. Deux messages d'erreurs risquent d'apparatre lorsque la configuration des machines virtuelles ne prend pas en charge la tolrance aux pannes.
n
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la configuration actuelle de la machine virtuelle ne prend pas en charge la tolrance aux pannes La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : les fonctions d'enregistrement et de lecture ne sont pas prises en charge par la machine virtuelle
La tolrance aux pannes fonctionne uniquement sur une machine virtuelle ayant une seule vCPU. Les erreurs suivantes risquent de se produire lorsque vous essayez d'activer la tolrance aux pannes sur une machine virtuelle ayant plusieurs vCPU :
n
La machine virtuelle a {numCpu} CPU virtuelles et n'est pas prise en charge cause de : Tolrance aux pannes La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : machine virtuelle ayant plusieurs CPU virtuelles.
54
VMware, Inc.
La tolrance aux pannes n'est pas compatible avec certaines fonctions vSphere. Si vous essayez d'activer la tolrance aux pannes sur une machine virtuelle utilisant une fonction vSphere qui ne prend pas en charge la tolrance aux pannes, l'un des messages d'erreurs suivants risque d'apparatre. Pour utiliser la tolrance aux pannes, vous devez mettre hors tension la fonction vSphere sur la machine virtuelle problmatique ou activer la tolrance aux pannes sur une machine virtuelle qui n'utilise pas ces fonctions.
n
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la machine virtuelle a un ou deux snapshots La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : machine virtuelle modle
Les messages d'erreurs suivants risquent d'apparatre si la machine virtuelle comporte un priphrique non pris en charge. Pour activer la tolrance aux pannes sur cette machine virtuelle, supprimez le priphrique non pris en charge, puis activez la tolrance aux pannes.
n
La sauvegarde de fichiers ({backingFilename}) pour le priphrique de disque virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le priphrique de disquette virtuelle n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le priphrique de CDROM virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le port srie virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le port parallle virtuel n'est pas prise en charge par la tolrance aux pannes
Le tableau suivant numre d'autres erreurs de configuration des machines virtuelles. Consultez Interoprabilit de la tolrance aux pannes , page 37 pour plus d'informations. Tableau A-2. Autres problmes de configuration des machines virtuelles
Message d'erreur L'hte spcifi n'est pas compatible avec la machine virtuelle secondaire tolrante aux pannes. Hte non compatible pour la machine virtuelle secondaire {vm.name} Le disque {Priphrique} de la machine virtuelle utilise le mode disque {mode} qui n'est pas pris en charge. Description et solution Reportez-vous Dpannage de la tolrance aux pannes , page 49 pour des causes possibles de cette erreur. Reportez-vous Dpannage de la tolrance aux pannes , page 49 pour des causes possibles de cette erreur. La machine virtuelle est quipe d'un ou de plusieurs disques durs configurs pour utiliser le mode Indpendant. Modifiez les paramtres de la machine virtuelle, slectionnez chaque disque dur et dsactivez le mode Indpendant. Adressez-vous votre administrateur systme pour savoir ce qui est acceptable pour l'environnement.
VMware, Inc.
55
Tableau A-2. Autres problmes de configuration des machines virtuelles (suite)

Message d'erreur Les blocs inutiliss des disques de la machine virtuelle n'ont pas t nettoys sur le systme de fichiers. Le nettoyage est ncessaire pour la prise en charge de fonctions comme la tolrance aux pannes. Description et solution Vous avez essay d'activer la tolrance aux pannes sur une machine virtuelle sous tension ayant des disques provisionnement lourd avec la proprit zros diffrs. La tolrance aux pannes ne peut pas tre active sur ce type de machine virtuelle lorsqu'elle est allume. Mettez la machine virtuelle hors tension, puis activez la tolrance aux pannes, puis rallumez la machine virtuelle. Cela modifie le format du disque de la machine virtuelle lorsqu'elle est remise sous tension. L'activation de la tolrance aux pannes peut ncessiter un certain temps pour terminer si le disque virtuel a une grosse capacit. Vous avez essay d'activer la tolrance aux pannes sur une machine virtuelle sous tension ayant des disques provisionnement allg. La tolrance aux pannes ne peut pas tre active sur ce type de machine virtuelle lorsqu'elle est allume. Mettez la machine virtuelle hors tension, puis activez la tolrance aux pannes, puis rallumez la machine virtuelle. Cela modifie le format du disque de la machine virtuelle lorsqu'elle est remise sous tension. L'activation de la tolrance aux pannes peut ncessiter un certain temps pour terminer si le disque virtuel a une grosse capacit.
Les blocs des disques de la machine virtuelle n'ont pas t entirement provisionns sur le systme de fichiers. Le nettoyage est ncessaire pour la prise en charge de fonctions comme la tolrance aux pannes.
Erreurs d'exploitation
Le tableau ci-dessous numre les messages d'erreurs qui apparaissent en cours d'utilisation des machines virtuelles tolrantes aux pannes. Tableau A-3. Erreurs d'exploitation
Message d'erreur Aucun hte adapt n'a t trouv pour placer la machine virtuelle secondaire tolrante aux pannes pour la machine virtuelle {vmName} Description et solution La tolrance aux pannes exige que les htes des machines virtuelles principales et secondaires utilisent la mme CPU ou famille, le mme numro de version de tolrance aux pannes ou numro de compilation d'hte et niveau de correctif. Activez la tolrance aux pannes sur une machine virtuelle enregistre sur un hte ayant un modle de CPU ou une famille concordants dans le cluster. Si ce type d'htes n'existe pas, vous devez en ajouter un . vCenter Server signalera la raison de l'impossibilit d'activer la machine virtuelle principale. Corrigez les conditions, puis ressayez l'opration. Ressayez de mettre sous tension la machine virtuelle secondaire. Le dlai d'expiration peut tre imputable des problmes de rseau ou d'autres problmes temporaires. Pour diagnostiquer la raison de l'impossibilit d'activer la machine virtuelle secondaire, reportez-vous Dpannage de la tolrance aux pannes , page 49. La tolrance aux pannes a dtect une diffrence entre les machines virtuelles principale et secondaire. Elle peut tre due des vnements provisoires qui ont lieu cause de diffrences matrielles ou logicielles entre les deux htes. La tolrance aux pannes a dmarr automatiquement une nouvelle machine virtuelle secondaire et aucune action n'est requise. Si ce message apparat souvent, signalez-le au support technique qui vrifie s'il y a un problme.
La machine virtuelle secondaire tolrante aux pannes n'a pas t active car la machine virtuelle principale tolrante aux pannes n'a pas t active. L'activation de la machine virtuelle secondaire tolrante aux pannes pour {vmName} n'a pas pu tre effectue dans un dlai de {timeout} secondes. vCenter a dsactiv la tolrance aux pannes sur la machine virtuelle {vm.name} car la machine virtuelle secondaire n'a pas pu tre active. Nouvelle synchronisation des machines virtuelles principale et secondaire
56
VMware, Inc.
Tableau A-3. Erreurs d'exploitation (suite)

Message d'erreur La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : aucune information de configuration pour la machine virtuelle Description et solution vCenter Server ne dispose pas d'informations sur la configuration de la machine virtuelle. Vrifiez si la machine virtuelle est mal configure. Vous pouvez essayer de supprimer la machine virtuelle de l'inventaire et de la renregistrer. Impossible de modifier le comportement DRS sur les machines virtuelles secondaires tolrantes aux pannes. Cette configuration est hrite de la machine virtuelle principale. Vous avez essay d'activer vMotion pour une machine virtuelle secondaire avec le mme hte que celui sur lequel se trouve une machine virtuelle principale. Une machine virtuelle principale et sa machine virtuelle secondaire ne peuvent pas rsider sur le mme hte. Slectionnez un hte de destination diffrent pour la machine virtuelle secondaire. La tolrance aux pannes exige que le cluster soit activ pour VMware HA. Modifiez les paramtres du cluster et activez VMware HA. Dsactivez la tolrance aux pannes avant d'ajouter l'hte comme hte autonome vCenter Server. Pour dsactiver la tolrance aux pannes, ajoutez l'hte un cluster VMware HA, cliquez avec le bouton droit de la souris sur chaque machine virtuelle sur l'hte et slectionnez Arrter tolrance aux pannes. Lorsque la tolrance aux pannes est dsactive, l'hte peut tre transform en hte autonome. Ce paramtre n'est pas autoris pour une machine virtuelle tolrante aux pannes. Cette erreur se produit uniquement en cas de rglage de la priorit de redmarrage d'une machine virtuelle tolrante aux pannes sur Dsactiv. Pour mettre sous tension ou migrer d'autres machines virtuelles tolrantes aux pannes sur cet hte, dplacez l'une des machines virtuelles tolrantes aux pannes vers un autre hte ou dsactivez cette restriction en configurant l'option avance VMware HA das.maxftvmsperhost sur 0.
Impossible de modifier le comportement DRS de la machine virtuelle secondaire tolrante aux pannes {vmName}. Les machines virtuelles de la mme paire tolrante aux pannes ne peuvent se trouver sur le mme hte.
Impossible d'ajouter un hte avec des machines virtuelles dont la tolrance aux pannes est active sur un cluster non compatible HA. Impossible d'ajouter un hte avec des machines virtuelles dont la tolrance aux pannes est active sous la forme d'un hte autonome.
Impossible de rgler la priorit de redmarrage HA sur Dsactiv pour la machine virtuelle tolrante aux pannes {vmName}. L'hte dispose dj du nombre recommand de {maxNumFtVms} machines virtuelles tolrantes aux pannes
Erreurs d'exploitation SDK

Le tableau ci-dessous numre les messages d'erreurs qui apparaissent en cours d'utilisation de SDK. Tableau A-4. Erreurs d'exploitation SDK
Message d'erreur Cette opration n'est pas prise en charge par une machine virtuelle secondaire d'une paire tolrante aux pannes. Description et solution Une opration non prise en charge a t excute directement sur la machine virtuelle secondaire utilisant l'API. La tolrance aux pannes n'autorise pas l'interaction directe avec la machine virtuelle secondaire (sauf pour la dplacer ou la migrer sur un hte diffrent). La machine virtuelle principale a dj une machine virtuelle secondaire. N'essayez pas de crer plusieurs machines virtuelles secondaires pour la mme machine virtuelle principale.
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la machine virtuelle secondaire existe dj
VMware, Inc.
57
Tableau A-4. Erreurs d'exploitation SDK (suite)

Message d'erreur La machine virtuelle secondaire avec instanceUuid '{instanceUuid}' a dj t active. Description et solution Vous avez essay d'activer la tolrance aux pannes sur une machine virtuelle sur laquelle la tolrance aux pannes tait dj active. Cette opration provient gnralement d'un API. Vous avez essay de mettre hors tension la tolrance aux pannes sur une machine virtuelle secondaire sur laquelle la tolrance aux pannes tait dj dsactive. Cette opration provient gnralement d'un API.
La machine virtuelle secondaire avec instanceUuid '{instanceUuid}' a dj t dsactive.
REMARQUE Pour les erreurs lies la compatibilit CPU, consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations sur les processeurs et les systmes d'exploitation clients pris en charge. Vous pouvez aussi utiliser l'utilitaire VMware SiteSurvey (tlchargeable sur http://www.vmware.com/download/shared_utilities.html) pour avoir une connaissance approfondie des problmes de configuration associs au cluster, l'hte et aux machines virtuelles utilises pour VMware FT.
58
VMware, Inc.
Index
A
activation de VMware HA 22 adresse d'isolation rseau 29 Association de cartes rseau 30, 41 attributs avancs, VMware HA 26
B
basculement transparent 9, 33
C
calcul de la taille du slot 14 Capacit de basculement actuelle 14, 17 Capacit de basculement configure 14, 17 cas d'utilisation, Tolrance aux pannes 35 cluster VMware HA contrle d'admission 13 cration 20, 21, 42 htrognit 19 htes principaux 11 htes secondaires 11 meilleures pratiques 28 planification 11 Compatibilit amliore de vMotion 35 conditions pralables, Tolrance aux pannes 36 configuration rseau, Tolrance aux pannes 40, 41 configurer les options avances VMware HA 26 continuit d'activit 7 contrle d'admission activation 23 rgle 23 types 13 VMware HA 13 contrles de validation 43 cration d'un cluster VMware HA 20
das.slotmeminmb 14, 26 das.usedefaultisolationaddress 26 das.vmcpuminmhz 14, 17, 26 das.vmmemoryminmb 26 Dfaillances d'hte tolres par le cluster 14 dpannage de la tolrance aux pannes 49 Distributed Resource Scheduler (DRS) activation 22 erreurs de tolrance aux pannes 53 et tolrance aux pannes 37 utilisation avec VMware Fault Tolerance 35 utilisation avec VMware HA 11
E
quilibrage de charge 35 tat de la tolrance aux pannes Dmarrage 45 Dsactiv 45 Machine virtuelle hors excution 45 VM secondaire ncessaire 45 tiquettes rseau 29 EVC 35 vnements et alarmes, paramtre 28 Extended Page Tables (EPT) 37
F
Fonction de dmarrage et d'arrt de machine virtuelle 20 fonction de surveillance d'hte 22, 29 fragmentation des ressources 19 ft.maxSwitchoverSeconds 51
G
Gestion de l'alimentation distribue (DPM) 11, 13
D
das.defaultfailoverhost 26 das.failuredetectioninterval 26 das.failuredetectiontime 26, 29 das.iostatsinterval 25, 26 das.isolationaddress 26, 29 das.isolationshutdowntimeout 23, 26 das.maxftvmsperhost 35 das.slotcpuinmhz 14, 26
H
hte de basculement 18 hte de basculement actuel 18 hte surcharg 50 htes isolation rseau 11 mode maintenance 11 htes principaux dans des clusters 11 htes secondaires dans des clusters 11
VMware, Inc.
59
I
images ISO 46 Informations d'excution avances 14 interoprabilit, Tolrance aux pannes 37 Interruption imprvu 8 prvu 7 interruption de service imprvue 8 interruption de service prvue 7 intervalles statistiques d'E/S 25 IPv6 37
Pourcentage de ressources de cluster rserves 17 Spcifier un hte de basculement 18 rgles d'affinit 33, 35 rgles d'anti-affinit 33 Rinitialisations maximales par machine virtuelle 25 rseau de gestion 20, 29
S
SAN iSCSI 36 sensibilit de surveillance 25 slot 14 snapshots 37 Spcifier un hte de basculement 18 stockage iSCSI 36 NAS 36, 49 NFS 36, 49 Storage vMotion 7, 37 support pdagogique 5 support technique 5 Surveillance d'application 25 Surveillance de VM 25 surveillance de VMware HA 28 suspension de VMware HA 22
M
meilleures pratiques clusters VMware HA 28 mise en rseau VMware HA 29 Tolrance aux pannes 46 messages d'erreurs, Tolrance aux pannes 53 minimisation des interruptions de service 7 mise niveau d'htes avec des machines virtuelles tolrantes aux pannes 48 mise en rseau VMware HA meilleures pratiques 29 Redondance des chemins d'accs 30 modifier les paramtres du cluster 21 multiprocesseur symtrique (SMP) 37
N
noms des groupes de ports 29
T
Tolrance aux pannes activation 39, 44 Log Bandwidth 45 cas d'utilisation 35 conditions pralables 36 configuration rseau 40, 41 configuration vSphere 36 continuit de la disponibilit 9 contrles de validation 43 CPU secondaire totale 45 dpannage 4952 emplacement secondaire 45 interoprabilit 37 Intervalle vLockstep 45 journalisation 40, 41, 47 liste de vrification 36 meilleures pratiques 46 Mmoire secondaire totale 45 messages d'erreurs 53 prsentation 33 recommandations relatives la configuration 49 rgles d'anti-affinit 33 restrictions pour l'activation 43
P
paramtre de priorit de redmarrage des machines virtuelles 23 paramtre de rponse d'isolation de l'hte 23 paramtres de cluster 21 paramtres de remplacement des machines virtuelles 23, 28 paravirtualisation 37 passerelle par dfaut 29 personnalisation de VMware HA 26 planificaiton d'un cluster VMware HA 11 PortFast 29 ports de pare-feu 29 Pourcentage de ressources de cluster rserves 17
R
Rapid Virtualization Indexing (RVI) 37 RDM 36, 37 recherche de DNS 20 rgle de contrle d'admission choix 19 Dfaillances d'hte tolres par le cluster 14
60
VMware, Inc.
Index
vrification de conformit 42 version 36 tolrance aux pannes la demande 35 tolrance des dfaillances d'hte 14
V
validit du cluster 28 vrification de conformit, Tolrance aux pannes 42 vrification du certificat de l'hte 36, 39 Virtualisation d'identification N-Port (NPIV) 37 Virtualisation matrielle (HV) 36, 43, 49, 50 VLAN 41 VMDK 36 VMFS 11, 29, 47
VMware Consolidated Backup (VCB) 37 VMware HA activation 22 attributs avancs 26 avantages 8 contrle 28 interruption 22 liste de vrification 20 paramtres de cluster 20 personnalisation 26 reprise d'activit suite une interruption 8 VMware Tools 25 VMware vLockstep 9, 33
VMware, Inc.
61
62
VMware, Inc.

VMware Availability Guide PG FR

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

VMware Availability Guide PG FR

Transféré par

Droits d'auteur :

Formats disponibles

Guide de disponibilit vSphere

ESX 4.1 ESXi 4.1 vCenter Serveur 4.1

Guide de disponibilit vSphere

VMware, Inc. 3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com

Table des matires

1 Continuit d'activit et minimisation des interruptions de service 7

2 Cration et utilisation des clusters VMware HA 11

3 Fourniture de la tolrance aux pannes des machines virtuelles 33

Annexe : Message d'erreurs de tolrance aux pannes 53 Index 59

Guide de disponibilit vSphere

Glossaire VMware Technical Publications

Commentaires sur les documents

Ressources de support technique et de formation

Guide de disponibilit vSphere

VMware Professional Services

Continuit d'activit et minimisation des interruptions de service

Rduction des interruptions de service prvues

Guide de disponibilit vSphere

Prvention les interruptions de service imprvues

VMware HA assure une reprise d'activit rapide suite une interruption

Chapitre 1 Continuit d'activit et minimisation des interruptions de service

Cots et configuration matrielle rduits

Disponibilit accrue des applications

Intgration DRS et vMotion

VMware Fault Tolerance assure la continuit de la disponibilit

Guide de disponibilit vSphere

Cration et utilisation des clusters VMware HA

Htes principaux et secondaires d'un cluster VMware HA

Guide de disponibilit vSphere

Si l'hte principal actif est dfectueux, un autre hte principal le remplace.

Dtection des pannes et isolation du rseau de l'hte

Utilisation conjointe de VMware HA et DRS

Chapitre 2 Cration et utilisation des clusters VMware HA

Contrle d'admission VMware HA

Guide de disponibilit vSphere

Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Calcul de la taille du slot

Chapitre 2 Cration et utilisation des clusters VMware HA

Utilisation des slots pour dterminer la capacit de basculement actuelle

Informations d'excution avances

Guide de disponibilit vSphere

VM3 1 Ghz 2 Go taille du slot 2 Ghz, 2 Go

6 slots restants Si H1 est dfectueux

Chapitre 2 Cration et utilisation des clusters VMware HA

Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Calcul de la Capacit de basculement actuelle

Guide de disponibilit vSphere

besoins totaux en ressources 7 Ghz, 6 Go H1 9 Ghz 9 Go H2 9 Ghz 6 Go H3 6 Ghz 6 Go

ressources totales de l'hte 24 GHz, 21 Go

Rgles de contrle d'admission Spcifier un hte de basculement

Chapitre 2 Cration et utilisation des clusters VMware HA

Choix d'une rgle de contrle d'admission

viter la fragmentation des ressources

Flexibilit de la rservation des ressources de basculement

Htrognit des clusters

Guide de disponibilit vSphere

Liste de vrification VMware HA

Exigences applicables un cluster VMware HA

Reportez-vous Meilleures pratiques de mise en rseau , page 29.

REMARQUE VMware HA ne prend pas en charge IPv6

Cration d'un cluster VMware HA

Chapitre 2 Cration et utilisation des clusters VMware HA

Crer un cluster VMware HA

Guide de disponibilit vSphere