Académique Documents
Professionnel Documents
Culture Documents
Ce document prend en charge la version de chacun des produits rpertoris, ainsi que toutes les versions publies par la suite jusqu'au remplacement dudit document par une nouvelle dition. Pour rechercher des ditions plus rcentes de ce document, rendez-vous sur : http://www.vmware.com/fr/support/pubs.
FR-000316-00
Vous trouverez la documentation technique la plus rcente sur le site Web de VMware l'adresse : http://www.vmware.com/fr/support/pubs/ Le site Web de VMware propose galement les dernires mises jour des produits. Nhsitez pas nous transmettre tous vos commentaires concernant cette documentation ladresse suivante : docfeedback@vmware.com
Copyright 2009, 2010 VMware, Inc. Tous droits rservs. Ce produit est protg par les lois amricaines et internationales relatives au copyright et la proprit intellectuelle. Les produits VMware sont protgs par un ou plusieurs brevets rpertoris l'adresse http://www.vmware.com/go/patents-fr. VMware est une marque dpose ou une marque de VMware, Inc. aux tats-Unis et/ou dans d'autres juridictions. Toutes les autres marques et noms mentionns sont des marques dposes par leurs propritaires respectifs.
VMware, Inc. 100-101 Quartier Boieldieu 92042 Paris La Dfense France www.vmware.com/fr
VMware, Inc.
propos de ce guide 5
Fonctionnement de la tolrance aux pannes 33 Utilisation de la tolrance aux pannes avec DRS 35 Cas d'utilisation de tolrance aux pannes 35 Liste de vrification de tolrance aux pannes 36 Interoprabilit de la tolrance aux pannes 37 Prparation du cluster et des htes la tolrance aux pannes 39 Fourniture de la tolrance aux pannes des machines virtuelles 43 Affichage des informations sur les machines virtuelles tolrantes aux pannes 45 Recommandations relatives la tolrance aux pannes 46 Recommandations de configuration de la tolrance aux pannes par VMware 49 Dpannage de la tolrance aux pannes 49
VMware, Inc.
VMware, Inc.
propos de ce guide
Le Guide de disponibilit vSphere prsente des solutions assurant la continuit d'activit, ainsi que la mise en place de VMware Haute disponibilit (HA) et de VMware Fault Tolerance.
Public cible
Ce livre est destin tous ceux qui veulent assurer la continuit d'activit l'aide des solutions VMware HA et Tolrance aux pannes. Les informations fournies dans ce livre sont destines aux administrateurs du systme Windows ou Linux expriments qui connaissent le fonctionnement de la technologie des machines virtuelles et des centres de donnes.
documentation de vSphere
La documentation vSphere se compose de la combinaison de l'ensemble des documentations de VMware vCenter Server et ESX/ESXi. Le Guide de disponibilit vSphere traite d'ESX , d'ESXi et de vCenter Server.
VMware, Inc.
Les clients ayant souscrit des contrats de support appropris peuvent utiliser le support tlphonique pour obtenir une rponse rapide leurs problmes prioritaires. Allez sur http://www.vmware.com/support/phone_support.html. Offres de support Pour en savoir plus sur la faon dont les offres d'assistance VMware peuvent satisfaire les besoins de votre entreprise, rendez-vous sur http://www.vmware.com/support/services. Les cours VMware Education Services proposent de nombreux exercices pratiques, des exemples d'tude de cas, ainsi que de la documentation destine servir de rfrence sur site. Les cours sont disponibles sur site, en salle de cours et en ligne et en direct. Pour les programmes pilotes sur site et les meilleures pratiques de mise en uvre, VMware Consulting Services propose des offres destines vous aider valuer, planifier, laborer et grer votre environnement virtuel. Pour accder aux informations sur les classes de formation, les programmes de certification et les services-conseil, rendez-vous sur http://www.vmware.com/services.
VMware, Inc.
Qu'elles soient prvues ou imprvues, les interruptions de service engendrent des cots considrables. Mais les solutions assurant des niveaux levs de disponibilit ont toujours t chres et difficiles implmenter et grer. Les logiciels de VMware assurent facilement et moindre cot un niveau lev de disponibilit pour les applications importantes. Avec vSphere, les entreprises peuvent augmenter facilement le niveau de disponibilit de base assur pour toutes les applications et fournir des niveaux levs de disponibilit plus facilement et moindre frais. Avec vSphere, vous pouvez :
n
Assurer une disponibilit leve indpendamment du matriel, du systme d'exploitation et des applications. liminer les interruptions de service prvues pour les oprations de maintenance ordinaires. Assurer la restauration automatique en cas de dysfonctionnement.
n n
vSphere permet de rduire les interruptions de service prvues, d'viter des interruptions de service imprvues et de rcuprer rapidement suite des interruptions. Ce chapitre aborde les rubriques suivantes :
n n n n
Rduction des interruptions de service prvues , page 7 Prvention les interruptions de service imprvues , page 8 VMware HA assure une reprise d'activit rapide suite une interruption , page 8 VMware Fault Tolerance assure la continuit de la disponibilit , page 9
liminent les interruptions de service pour les oprations de maintenance ordinaires. liminent les plages de maintenance prvues. excutent la maintenance tout moment sans perturber les utilisateurs et les services.
VMware, Inc.
VMware vMotion et la fonctionnalit Storage vMotion de vSphere permet aux entreprises de rduire les interruptions de service prvues car les charges de travail d'un environnement VMware peuvent tre dplaces dynamiquement sur d'autres serveurs physiques ou sur d'autres stockages sous-jacents sans interruption de service. Les administrateurs peuvent effectuer plus rapidement des oprations de maintenance entirement transparentes, sans devoir planifier des plages de maintenance peu pratiques.
Stockage partag. limine des points de panne isols en stockant les fichiers des machines virtuelles dans des espaces de stockage partags, comme Fibre Channel ou iSCSI SAN, ou encore NAS. Il est possible de faire appel aux fonctions de rplication et de mise en miroir SAN pour conserver les copies mises niveau des disques virtuels dans des sites de reprise. Association d'interfaces rseau. Assure la tolrance aux dfaillances des cartes rseau individuelles. chemins multiples du stockage. Assure la tolrance aux dfaillances des emplacements de stockage.
n n
En outre, les fonctions de VMware HA et Tolrance aux pannes peuvent rduire ou liminer les interruptions de service imprvues en assurant respectivement la reprise d'activit rapide suite une interruption et la continuit de la disponibilit.
Il protge contre une dfaillance du serveur en redmarrant les machines virtuelles sur d'autres htes au sein du cluster. Il protge contre les dfaillances des applications en surveillant en permanence une machine virtuelle et en la rinitialisant en cas de dtection d'une dfaillance.
Contrairement aux autres solutions de mise en clusters, VMware HA fournit l'infrastructure ncessaire la protection de toutes les charges de travail :
n
Il n'est pas ncessaire d'installer des logiciels spciaux dans l'application ou sur la machine virtuelle. Toutes les charges de travail sont protges par VMware HA. Aprs la configuration de VMware, aucune action n'est requise pour protger de nouvelles machines virtuelles. Elles sont protges automatiquement. Vous pouvez associer VMware HA VMware Distributed Resource Scheduler (DRS) pour assurer la protection contre les pannes, et pour rpartir la charge entre tous les htes d'un cluster.
VMware, Inc.
VMware HA prsente plusieurs avantages face aux solutions de basculement habituelles : Configuration minimale Quand un cluster VMware HA a t configur, toutes les machines virtuelles du cluster sont incluses dans le basculement sans configuration supplmentaire. La machine virtuelle fait office de conteneur portable pour les applications et elle peut tre dplace parmi les htes. Les administrateurs vitent ainsi de reproduire les configurations sur plusieurs machines. Lorsque vous utilisez VMware HA, vous devez disposer de suffisamment de ressources pour le basculement de tous les htes protgs par VMware HA. Toutefois, le systme vCenter Server gre automatiquement les ressources et configure les clusters. Une application excute au sein d'une machine virtuelle a accs une disponibilit accrue. Comme la machine virtuelle peut rcuprer d'une dfaillance matrielle, toutes les applications qui dmarrent au moment de l'initialisation ont une disponibilit accrue sans accrotre la charge de calcul, mme si l'application n'est pas en cluster. En surveillant et en rpondant aux signaux de pulsation des VMware Tools et en rinitialisant les machines virtuelles qui ne rpondent plus, elle assure galement une protection contre les dfaillances du systme d'exploitation client. En cas de dfaillance d'un hte et du redmarrage des machines virtuelles sur d'autres htes, DRS peut fournir des recommandations de migration ou faire migrer les machines virtuelle en quilibrant les ressources alloues. Si l'hte source et/ou l'hte de destination d'une migration sont dfaillants, VMware HA peut faciliter la rcupration suite la dfaillance.
VMware, Inc.
10
VMware, Inc.
Les clusters VMware HA permettent de runir plusieurs htes ESX/ESXi de faon ce qu'ils fournissent, en tant que groupes, un niveau de disponibilit suprieur pour les machines virtuelles celle d'un seul hte ESX/ ESXi. Quand vous prvoyez la cration et l'utilisation d'un nouveau VMware HA, les options choisies affectent la manire dont le cluster correspondant ragit aux pannes des htes ou des machines virtuelles. Avant de crer un cluster VMware HA, vous devez savoir comment VMware HA identifie les dfaillances et l'isolement de l'hte et comment il ragit dans ces situations. Vous devez aussi connatre le mode de fonctionnement du contrle d'admission de faon tre capable de choisir les rgles qui rpondent le mieux vos besoins de basculement. Lorsqu'un cluster a t cr, vous pouvez en personnaliser le comportement avec des attributs avancs et en optimiser les performances en suivant les meilleures pratiques recommandes. Ce chapitre aborde les rubriques suivantes :
n n n n n n
Fonctionnement de VMware HA , page 11 Contrle d'admission VMware HA , page 13 Liste de vrification VMware HA , page 20 Cration d'un cluster VMware HA , page 20 Personnalisation du comportement de VMware HA , page 26 Meilleures pratiques aux clusters VMware HA , page 28
Fonctionnement de VMware HA
VMware HA assure la disponibilit leve des machines virtuelles en les plaant avec leurs htes respectifs dans un cluster. Les htes du cluster sont surveills et, en cas de dfaillance, les machines virtuelles d'un hte dfectueux sont redmarrs sur d'autres htes.
VMware, Inc.
11
principaux par cluster lors de la planification de l'tendue du cluster. De plus, si le cluster est implment dans un environnement de serveur lame, ne placez pas plus de quatre htes principaux sur un seul chssis de lame. Si les cinq htes principaux sont dans le mme chssis et que celui-ci choue, votre cluster perd la protection VMware HA. L'un des htes principaux est aussi nomm hte principal actif. Ses responsabilits sont les suivantes :
n n n
Dcision du point de dpart du redmarrage des machines virtuelles. Suivi des tentatives de redmarrage choues. Choix du moment appropri pour continuer essayer de redmarrer une machine virtuelle.
12
VMware, Inc.
Dans un cluster utilisant DRS et VMware HA avec le contrle d'admission activ, les machines virtuelles ne sont pas ncessairement vacues des htes passant en mode de maintenance. Ce comportement intervient par suite des ressources rserves pour le redmarrage des machines virtuelles en cas de panne. Il faut migrer manuellement les machines virtuelles en dehors des htes avec vMotion. Dans certains scnarios, VMware HA ne parvient pas basculer des machines virtuelles par suite de contraintes de ressources. Ceci peut se produire pour plusieurs raisons.
n
Le contrle d'admission HA est dsactiv et Gestion de l'alimentation distribue (DPM) est activ. Cela peut aboutir la consolidation par DPM des machines virtuelles sur un nombre infrieur d'htes et la mise en veille des htes vides, ce qui ne laisse pas suffisamment de rserve de capacit active pour effectuer un basculement. Les rgles (requises) d'affinit de machine virtuelle/hte peuvent limiter les htes sur lesquels certaines machines virtuelles peuvent tre places. Il peut y avoir suffisamment de ressources cumules mais celles-ci sont fragmentes sur plusieurs htes de sorte qu'elles ne peuvent pas tre utilises par les machines virtuelles pour le basculement.
Dans ce cas, VMware HA utilise DRS pour essayer d'ajuster le cluster (par exemple, en sortant les htes du mode de veille ou en migrant les machines virtuelles pour dfragmenter les ressources du cluster) de sorte que HA puisse excuter les basculements. Si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de mise sous tension des htes. De mme, si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de migration. Si vous utilisez les rgles d'affinit entre machine virtuelle et hte requises, sachez que ces rgles doivent obligatoirement tre respectes. VMware HA n'effectue pas de basculement si cela risque d'enfreindre une rgle. Pour plus d'informations sur DRS, reportez-vous au Guide de gestion des ressources.
VMware HA
Le contrle d'admission impose des contraintes d'utilisation des ressources et toute action contrevenant ces contraintes n'est pas autorise. Parmi les exemples d'actions pouvant tre interdites, on peut citer :
n n n
Mise sous tension d'une machine virtuelle. Migration d'une machine virtuelle sur un hte ou dans un cluster ou un pool de ressources. Augmentation de la rservation de CPU ou de mmoire d'une machine virtuelle.
VMware, Inc.
13
Parmi les trois types de contrle d'admission, seul le contrle d'admission VMware HA peut tre dsactiv. Mais sans ce contrle, il n'est pas possible d'assurer que toutes les machines virtuelles du cluster peuvent tre redmarres aprs une dfaillance d'hte. VMware dconseille de mettre hors tension le contrle d'admission, mais vous pouvez avoir besoin de le faire temporairement pour les raisons suivantes :
n
Si vous devez enfreindre les contraintes de basculement lorsqu'il n'y a pas suffisamment de ressources pour les prendre en charge (par exemple, si vous mettez les htes en veille pour en tester le fonctionnement avec DPM). Si un processus automatis doit effectuer des actions qui risquent d'enfreindre temporairement les contraintes de basculement (par exemple, dans le cadre d'une mise niveau dirige par VMware Update Manager). Si vous devez excuter des tests ou des oprations de maintenance.
VMware HA calcule la taille de CPU partir de la CPU rserve par chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Si aucune CPU n'a t rserve pour une machine virtuelle, une valeur de 256 MHz est dfinie par dfaut. Cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz.) VMware HA calcule la taille du composant de mmoire partir de la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Il n'y a pas de valeur par dfaut pour la mmoire rserve.
14
VMware, Inc.
Si le cluster contient des machines virtuelles ayant des valeurs de rservation bien plus leves que d'autres, celles-ci influeront sur le calcul de la taille du slot. Pour l'viter, vous pouvez prciser une limite suprieure pour la CPU ou le composant de mmoire de la taille du slot en utilisant respectivement les attributs avancs das.slotcpuinmhz ou das.slotmeminmb.
Taille du slot. Nombre total de slots dans le cluster. Somme des slots pris en charge par les htes en tat de marche dans le cluster. Slots utiliss. Nombre de slots associs aux machines virtuelles sous tension. Ce nombre peut tre suprieur au nombre de machines virtuelles sous tension si vous avez dfini une limite suprieure pour la taille du slot au moyen des options avances. Ceci parce que quelques machines virtuelles peuvent occuper plusieurs slots. Slots disponibles Nombre de slots disponibles pour mettre sous tension des machines virtuelles supplmentaires dans le cluster. VMware HA rservation le nombre de slots requis par le basculement. Les slots restants sont disponibles pour mettre sous tension de nouvelles machines virtuelles. Nombre total de machines virtuelles sous tension dans le cluster. Nombre total d'htes dans le cluster. Nombre total d'htes en marche dans le cluster. Nombre d'htes qui sont connects, qui ne sont pas en mode de maintenance et qui ne prsentent pas d'erreurs VMware HA.
n n n
VMware, Inc.
15
Exemple 2-1. Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster Nous allons illustrer par un exemple le mode de calcul de la taille de slot et son utilisation avec cette rgle de contrle d'admission. Effectuons les suppositions suivantes propos d'un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 utilise 2 Ghz et 1 Go VM3 a besoin de 1 Ghz et de 2 Go, VM4 exige 1 Ghz et 1 Go, VM5 ncessite 1 Ghz et 1 Go. Dfaillances d'hte tolres par le cluster sont dfinies sur la valeur 1.
Figure 2-1. Exemple de contrle d'admission avec des rgles de Dfaillances d'hte tolres par le cluster
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
H1 9 Ghz 9 Go 4 slots
H2 9 Ghz 6 Go 3 slots
H3 6 Ghz 6 Go 3 slots
16
VMware, Inc.
Le besoin en composant CPU est obtenu en additionnant la CPU rserve par les machines virtuelles sous tension. Si aucune CPU n'a t rserve pour une machine virtuelle, une valeur de 256 MHz est dfinie par dfaut (cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz). La taille du composant de mmoire est obtenue en additionnant la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension.
Les ressources totales des htes disponibles pour les machines virtuelles sont calcules en additionnant les ressources de CPU et de mmoire des htes. Ces valeurs sont contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode de maintenance et qui ne prsentent pas d'erreurs VMware HA sont pris en compte. La Capacit CPU de basculement actuelle est calcule en soustrayant les besoins totaux en ressources CPU des ressources CPU totales des htes et en divisant le rsultat par les ressources CPU totales des htes. La Capacit mmoire de basculement actuelle est calcule de la mme manire.
VMware, Inc.
17
Exemple 2-2. Rgles de contrle d'admission Pourcentage de ressources de cluster rserves Nous allons illustrer par un exemple le mode de calcul de la Capacit de basculement actuelle et son utilisation avec cette rgle de contrle d'admission. Effectuons les suppositions suivantes propos d'un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 GHz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 GHz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 utilise 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 exige 1 Ghz et 1 Go, VM5 ncessite 1 GHz et 1 Go. La Capacit de basculement configure est de 25 %.
Figure 2-2. Exemple de contrle d'admission utilisant les rgles de Pourcentage de ressources de cluster rserves
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
18
VMware, Inc.
L'hte de basculement actuel apparat dans la section VMware HA de l'onglet [Rsum] du cluster dans vSphere Client. L'icne de statut qui se trouve ct de l'hte peut tre verte, jaune ou rouge.
n
Vert. L'hte est connect, il n'est pas en mode de maintenance et ne prsente pas d'erreurs VMware HA. Aucune machine virtuelle sous tension ne rside sur l'hte. Jaune. L'hte est connect, il n'est pas en mode de maintenance et ne prsente pas d'erreurs VMware HA. Mais des machines virtuelles sous tension rsident sur l'hte. Rouge. L'hte est dconnect, il est en mode de maintenance ou prsente des erreurs VMware HA.
VMware, Inc.
19
Tous les htes doivent disposer d'une licence pour VMware HA. Le cluster doit contenir deux htes au minimum. Tous les htes doivent avoir un nom d'hte unique. Tous les htes doivent tre configurs avec des adresses IP statiques. Si vous utilisez DHCP, vrifiez que l'adresse de chaque hte est conserve aprs les redmarrages. Tous les htes doivent avoir accs aux mmes rseaux de gestion. Il doit au moins y avoir un rseau de gestion commun parmi tous les htes et il est recommand d'avoir au moins deux rseaux de gestion communs. Les rseaux de gestion diffrent selon la version de l'hte que vous utilisez.
n n n
Htes ESX - rseau de la console du service. Htes ESXi antrieurs la version 4.0 - Rseau VMkernel. Htes ESXi version 4.0 et ultrieure - Rseau VMkernel et case cocher active [Rseau de gestion] .
Pour vous assurer que toutes les machines virtuelles peuvent tre excutes sur n'importe quel hte du cluster, tous les htes doivent avoir accs aux mme rseaux et banques de sonnes de machines virtuelles. De mme, les machines virtuelles doivent se trouver sur des stockages partags, et non locaux, sinon il ne peut pas y avoir de basculement en cas de dfaillance de l'hte. Le fonctionnement de surveillance des machines virtuelles ncessite l'installation des outils VMware. Reportez-vous Surveillance MV et application , page 25. DNS doit tre configur pour tous les htes d'un cluster VMware HA de faon ce que des noms d'hte courts (sans suffixe de domaine) de tous les htes du cluster puissent tre rsolus avec l'adresse IP appropries partir de n'importe quel hte du cluster. Sinon, la tche de Configuration de HA risque d'chouer. Si vous ajoutez l'hte l'aide de l'adresse IP, activez aussi la recherche DNS inverse (l'adresse IP doit pouvoir tre rsolue en nom d'hte court).
20
VMware, Inc.
Vous pouvez activer et configurer VMware HA avant d'ajouter des nuds d'htes au cluster. Toutefois, tant que les htes n'ont pas t ajouts, le cluster n'est pas entirement oprationnel et quelques paramtres du cluster ne sont pas disponibles. Par exemple, les rgles de contrle d'admission Spcifier un hte de basculement ne sont pas disponibles tant qu'un hte n'a pas t dfini comme hte de basculement. REMARQUE La fonction de dmarrage et d'arrt de machine virtuelle (dmarrage automatique) est dsactive pour toutes les machines virtuelles rsidant sur des htes qui se trouvent dans un cluster VMware HA (ou qui y ont t places). VMware recommande de ne pas ractiver manuellement ce paramtre pour l'une des machines virtuelles. Cela risque d'interfrer avec les actions des fonctions du cluster, comme VMware HA ou Tolrance aux pannes.
VMware, Inc.
21
Vous avez maintenant un cluster VMware HA disponible, rempli avec des htes.
Fonctions de cluster
Le premier panneau de l'assistant Nouveau cluster permet de dfinir les options de base du cluster. Ce panneau permet de nommer le cluster et de choisir une ou deux fonctions de cluster. Nom Allumer VMware HA Nommez le cluster. Ce nom figure dans le panneau d'inventaire de vSphere Client. Vous devez saisir un nom pour continuer crer le cluster. Lorsque cette case cocher est slectionne, les machines virtuelles redmarrent sur un autre hte du cluster en cas de dysfonctionnement d'un hte. Vous devez allumer VMware HA pour activer VMware Fault Tolerance sur n'importe quelle machine virtuelle du cluster. Si cette case cocher est slectionne, DRS rpartit la charge des machines virtuelle travers le cluster. DRS place et migre galement les machines virtuelles lorsqu'elles sont protges par HA.
22
VMware, Inc.
Dfaillances d'hte que le cluster tolre Pourcentage des ressources de cluster rserves en tant que capacit de basculement de secours Spcifier un hte de basculement
REMARQUE Voir Choix d'une rgle de contrle d'admission , page 19 pour plus d'informations sur le fonctionnement du contrle d'admission VMware HA.
VMware, Inc.
23
Les valeurs de ce paramtre sont les suivantes : Dsactiv, Basse, Moyen (par dfaut) et Haut. Si Dsactiv est slectionn, VMware HA est dsactiv pour la machine virtuelle, ce qui signifie qu'elle n'est pas redmarre sur d'autres htes ESX/ESXi en cas de dysfonctionnement de son hte ESX/ESXi. La slection de Dsactiv n'affecte pas la surveillance des machines virtuelles. Par consquent, si une machine virtuelle est dfaillante sur un hte qui fonctionne correctement, cette machine virtuelle est rinitialise sur le mme hte. Vous pouvez modifier ce paramtre pour des machines virtuelles individuelles. Les paramtres de priorit du redmarrage des machines virtuelles varient en fonction des besoins de l'utilisateur. VMware vous recommande d'associer une priorit de redmarrage leve aux machines virtuelles qui fournissent les services les plus importants. Par exemple, dans le cas d'une application multitche, vous pouvez classer les attributions d'aprs des fonctions hberges sur les machines virtuelles.
n n
Haute. Serveurs de base de donnes qui fournissent des donnes aux applications. Moyenne. Serveurs d'application qui exploitent les donnes de la base de donnes et fournissent des rsultats sur des pages web. Basse. Serveurs Web qui reoivent des demandes d'utilisateurs, transmettent des requtes des serveurs d'application et transmettent les rsultats aux utilisateurs.
24
VMware, Inc.
Surveillance MV et application
Surveillance de VM redmarre les machines virtuelles si leurs heartbeats VMware Tools n'ont pas t reus pendant une certaine priode. De mme, la Surveillance d'application peut redmarrer une machine virtuelle si les heartbeats d'une application excute ne sont pas reus. Il est possible d'activer ces fonctions et de configurer la sensibilit de la surveillance de l'absence de raction par VMware HA. Lorsque vous activez Surveillance de VM, le service Surveillance de VM (utilisant VMware Tools) vrifie si chaque machine virtuelle du cluster fonctionne en contrlant les pulsations rgulires et l'activit d'E/S du processus VMware Tools excut sur le client. Si aucune pulsation ou activit d'E/S n'est reue, c'est probablement parce que le systme d'exploitation client est dfectueux ou que les VMware Tools n'ont pas eu le temps de terminer les tches. Dans ce cas, le service Surveillance de VM dtermine que la machine virtuelle est dfectueuse et la machine virtuelle redmarre pour tre remise en service. Occasionnellement, les machines virtuelles ou les applications qui continuent fonctionner correctement cessent d'mettre des heartbeats. Pour viter les rinitialisations superflues, le service Surveillance de VM surveille aussi l'activit d'E/S d'une machine virtuelle. Si aucun heartbeat n'est reu pendant la priode de dfaillance, l'intervalles statistique d'E/S (un attribut dfini au niveau du cluster) est vrifi. L'intervalle statistique d'E/S dtermine si un disque ou une activit rseau s'est produite pour la machine virtuelle au cours des deux minutes (120 secondes) passes. Si ce n'est pas le cas, la machine virtuelle est rinitialise. Cette valeur par dfaut (120 secondes) peut tre modifie l'aide de l'attribut avanc das.iostatsinterval. Pour activer la surveillance d'application, il faut d'abord obtenir le SDK appropri (ou utiliser une application qui prend en charge la surveillance de l'application VMware) et l'utiliser pour configurer des pulsations personnalises pour les applications devant tre surveilles. Une fois fait, la surveillance d'application fonctionne de la mme manire que Surveillance de VM. Si les pulsations d'une application ne sont pas reues pendant un certain temps, sa machine virtuelle est redmarre. Vous pouvez configurer le niveau de sensibilit de la surveillance. Une sensibilit de surveillance leve permet de conclure plus rapidement un dysfonctionnement. Mme si c'est peu probable, une sensibilit de surveillance leve peut aboutir l'identification errone de dysfonctionnements alors que la machine virtuelle ou l'application en question fonctionne toujours mais que les heartbeats ne sont pas reus cause de contraintes de ressources notamment. Une sensibilit de surveillance basse rsulte en des interruptions de service prolonges entre les dfaillances avres et le redmarrage des machines virtuelles. Slectionnez l'option qui offre un compromis efficace vos besoins. Les paramtres par dfaut de la sensibilit de surveillance sont dcrits dans Tableau 2-1. Vous pouvez aussi indiquer des valeurs personnalises la fois pour la sensibilit de la surveillance et les intervalles statistiques d'E/S en slectionnant la case cocher [Personnalis] . Tableau 2-1. Paramtres de surveillance des machines virtuelles
Paramtre Haut Moyen Faible Intervalle d'chec 30 60 120 Priode de rinitialisation 1 heure 24 heures 7 jours
Lorsque des dysfonctionnements ont t dtects, VMware HA rinitialise les machines virtuelles. La rinitialisation contribue garantir que les services demeurent disponibles. Pour viter de rinitialiser constamment des machines virtuelles en cas d'erreurs non provisoires, les machines virtuelles sont rinitialises par dfaut trois fois seulement au cours d'une priode configurable. Aprs trois reinitialisations des machines virtuelles, VMware HA n'effectue aucune autre tentative pour redmarrer les machines virtuelles aprs des checs ultrieurs jusqu' ce que la priode dfinie ne soit coule. Vous pouvez configurer le nombre de rinitialisations l'aide du paramtre personnalis [Rinitialisations maximales par machine virtuelle] .
VMware, Inc.
25
das.usedefaultisolationaddress
das.failuredetectiontime
26
VMware, Inc.
das.isolationshutdowntimeout
das.slotmeminmb
das.slotcpuinmhz
das.vmmemoryminmb
das.vmcpuminmhz
das.iostatsinterval
REMARQUE Si vous modifiez la valeur de l'un des attributs avancs suivants, vous devez mettre hors tension, puis ractiver VMware HA avant que les modifications ne s'appliquent.
n n n n n
VMware, Inc.
27
Le comportement de la machine virtuelle diffre dsormais des rglages par dfaut du cluster pour chaque paramtre modifi.
28
VMware, Inc.
En cas de modification des rseaux sur lesquels se trouvent les htes ESX/ESXi en clusters, VMware recommande de suspendre la fonction de surveillance d'hte. Les changements de matriel ou de paramtres rseau peuvent interrompre les signaux de pulsation utiliss par VMware HA pour dtecter les dfaillances d'htes, ce qui risque d'entraner des tentatives malvenues de basculement des machines virtuelles. Lorsque vous modifiez la configuration rseau directement sur les htes ESX/ESXi, par exemple, pour ajouter des groupes de port ou pour supprimer des vSwitches, VMware recommande de placer l'hte en mode maintenance en plus de suspendre sa surveillance.
REMARQUE Comme la mise en rseau est un aspect essentiel de VMware HA, l'administrateur de VMware HA doit tre tenu inform de toute maintenance du rseau.
Sur les htes ESX du cluster, les communications VMware HA sont achemines via tous les rseaux qui sont identifis comme rseaux de console de service. Les rseaux VMkernel ne sont pas utiliss par ces htes pour les communications VMware HA. Sur les htes ESX du cluster, les communications VMware HA sont achemines par dfaut via tous rseaux VMkernel sauf ceux spcifiques vMotion. S'il n'y a qu'un seul rseau VMkernel, VMware HA le partage avec vMotion, si ncessaire. Avec ESXi 4.0 et version ultrieure, il faut aussi cocher explicitement la case Gestion de rseau si VMware HA doit utiliser ce rseau.
VMware, Inc.
29
Par exemple, si le premier hte ajout dans le cluster comporte deux rseaux utiliss pour les communications VMware HA (10.10.135.0/255.255.255.0 et 10.17.142.0/255.255.255.0), les deux mme rseaux doivent tre configurs sur tous les htes suivants et utiliss pour les communications VMware HA.
Noms de groupes de ports et tiquettes rseau. Utilisez des noms de groupes de ports cohrents et des tiquettes rseau sur les VLAN des rseaux publics. Les noms de groupes de ports permettent de reconfigurer l'accs au rseau par les machines virtuelles. Si vous utilisez des noms incohrents entre le serveur d'origine et le serveur de basculement, les machines virtuelles sont dconnectes de leur rseau aprs le basculement. Les tiquettes rseau sont utilises par les machines virtuelles pour rtablir la connectivit rseau au redmarrage.
30
VMware, Inc.
Il est possible d'implmenter la redondance du rseau au niveau de l'association de cartes rseau, ou au niveau rseau de gestion. Dans la plupart des implmentations, l'association des cartes rseau offre une redondance suffisante, mais il est possible d'utiliser ou d'ajouter au besoin la redondance de rseau de gestion. La mise en rseau de gestion redondante garantit la fiabilit de la dtection des pannes et vite la ralisation de conditions d'isolation car les signaux de pulsation peuvent tre transmis via plusieurs rseaux. Configurez un nombre aussi rduit que possible de segments matriels entre les serveurs d'un cluster. L'objectif est de limiter les points de panne isols. De plus, les chemins contenant trop de bonds peuvent provoquer des retards de paquets de signaux de pulsation et augmenter les points de panne ventuels.
quilibrage de charge par dfaut = Router en fonction de l'ID du port d'origine Retour arrire = Non
Lorsque vous avez ajout un adapteur rseau l'hte de votre cluster VMware HA, vous devez reconfigurer VMware HA sur cet hte.
VMware, Inc.
31
32
VMware, Inc.
Il est possible d'activer VMware Fault Tolerance pour les machines virtuelles afin d'assurer la continuit d'activit avec des niveaux de disponibilit et de protection des donnes suprieurs ceux offerts par VMware HA. La tolrance aux pannes est intgre la plate-forme hte ESX/ESXi (par la technologie VMware vLockstep) et elle assure la continuit de la disponibilit en excutant des machines virtuelles identiques en mode rigide virtuel sur des htes distincts. Pour obtenir des rsultats optimums de la tolrance aux pannes, il est ncessaire d'en comprendre le fonctionnement, de savoir comment l'activer sur un cluster et sur des machines virtuelles, de connatre les recommandations d'usage et les conseils de dpannage. Ce chapitre aborde les rubriques suivantes :
n n n n n n n n n n n
Fonctionnement de la tolrance aux pannes , page 33 Utilisation de la tolrance aux pannes avec DRS , page 35 Cas d'utilisation de tolrance aux pannes , page 35 Liste de vrification de tolrance aux pannes , page 36 Interoprabilit de la tolrance aux pannes , page 37 Prparation du cluster et des htes la tolrance aux pannes , page 39 Fourniture de la tolrance aux pannes des machines virtuelles , page 43 Affichage des informations sur les machines virtuelles tolrantes aux pannes , page 45 Recommandations relatives la tolrance aux pannes , page 46 Recommandations de configuration de la tolrance aux pannes par VMware , page 49 Dpannage de la tolrance aux pannes , page 49
VMware, Inc.
33
secondaire qui est excute sur un autre hte. partir de ces informations, l'excution de la machine virtuelle secondaire est identique celle de la machine virtuelle principale. Comme la machine virtuelle secondaire est en mode rigide virtuel avec la machine virtuelle principale, elle peut reprendre l'excution tout moment sans interruption, assurant ainsi une protection tolrante aux pannes. Figure 3-1. Machine virtuelle principale et machine virtuelle secondaire dans une paire avec tolrance aux pannes
primaire applications systmes d'exploitation client systme VMware client ENREGISTREMENT RPTITION vnements non dterministes vnements non dterministes Entre (rseau, utilisateur), Rsultat = reproductible E/S asynchrone (disque, excution de la machine virtuelle priphriques) temporisateur CPU vnements secondaire applications systmes d'exploitation client systme VMware
journalisation du trafic
Les machines virtuelles principale et secondaire changent des heartbeats en continu. Cet change permet la paire de machines virtuelles de contrler mutuellement leur tat pour assurer le maintien permanent de la tolrance aux pannes. Un basculement transparent se produit en cas de dfaillance de l'hte sur lequel la machine virtuelle principale est excute. Dans ce cas, la machine virtuelle secondaire est immdiatement active pour remplacer la machine virtuelle principale. Une nouvelle machine virtuelle secondaire dmarre et la redondance de la tolrance aux pannes est rtablie en quelques secondes. Si l'hte de la machine virtuelle secondaire devient dfectueux, il est aussi immdiatement remplac. Dans l'un ou l'autre cas, les utilisateurs ne constatent aucune interruption de service ni perte de donnes. Une machine virtuelle tolrante aux pannes et sa copie secondaire ne sont pas autorises fonctionner sur le mme hte. Cette restriction garantit qu'une dfaillance de l'hte ne peut pas entraner la perte des deux machines virtuelles. Vous pouvez aussi utiliser les rgles d'affinit entre machine virtuelle et hte pour prciser les htes sur lesquels certaines machines virtuelles peuvent tre excutes. Si vous utilisez ces rgles, souvenezvous que pour chaque machine virtuelle principale affecte par une rgle prcise, la machine virtuelle secondaire qui y est associe est aussi affecte par la mme rgle. Pour plus d'informations sur les rgles d'affinit, reportez-vous au Guide de gestion des ressources. La tolrance aux pannes vite les situations de division qui peuvent rsulter en deux copies actives d'une machine virtuelle aprs la reprise suite un dysfonctionnement. Le verrouillage atomique des fichiers sur les stockages partags est utilis pour coordonner le basculement de faon ce qu'un ct seulement continue excuter la machine virtuelle principale et une nouvelle machine virtuelle secondaire est automatiquement raffecte. REMARQUE Le contrle anti-affinit est effectu la mise sous tension de la machine virtuelle principale. Les machines virtuelles principales et secondaires peuvent tre sur les mme htes lorsqu'elles sont toutes deux hors tension. C'est un comportement normal. Quand la machine virtuelle principale s'allume, la machine virtuelle secondaire est dmarre sur un hte diffrent.
34
VMware, Inc.
Les applications qui doivent tre disponibles en permanence, surtout celles prsentant des connections longues dures de clients que les utilisateurs veulent conserver pendant la dfaillance matrielle. Applications personnalises qui n'ont pas d'autres moyens de former un cluster. Cas o la grande disponibilit peut tre assure par des solutions de formation de cluster personnalises qui sont trs compliques configurer et entretenir.
n n
VMware, Inc.
35
Tolerance permet de protger la machine virtuelle avant la production du rapport, puis d'teindre ou de mettre hors tension la tolrance aux pannes aprs la publication du rapport. Vous pouvez utiliser la Tolrance aux pannes la demande pour protger la machine virtuelle au cours d'une priode critique et revenir aux ressources normales pour les oprations non critiques.
Vrification du certificat de l'hte active. Reportez-vous Activer la vrification du certificat de l'hte , page 39. Deux htes certifis FT au minimum utilisant la mme version de tolrance aux pannes ou le mme numro de compilation d'hte . Le numro de version de tolrance aux pannes apparat sur l'onglet [Rsum] d'un hte dans le vSphere Client. REMARQUE Pour les htes antrieurs ESX/ESXi 4.1, cet onglet numre les numros de build d'hte. Les correctifs peuvent provoquer une variation des numros de build d'hte entre les installations ESX et ESXi. Pour vous assurer que vos htes sont compatibles avec la tolrance aux pannes, ne mlangez pas les htes ESX et ESXi dans une paire FT.
Les htes ESX/ESXi ont accs aux mmes banques de donnes et rseaux des machines virtuelles. Reportezvous Recommandations relatives la tolrance aux pannes , page 46. Journalisation de la tolrance aux pannes et rseau vMotion configur. Reportez-vous Configurer la mise en rseau des machines htes , page 40. cluster VMware HA cr et activ. Reportez-vous Cration d'un cluster VMware HA , page 20. VMware HA doit tre activ avant la mise sous tension des machines virtuelles tolrantes aux pannes ou l'ajout d'un hte dans un cluster qui prend dj en charge des machines virtuelles tolrantes aux pannes.
Les htes doivent avoir des processeurs appartenant au groupes de processeurs compatibles avec la tolrance aux pannes. Il est galement fortement recommand que les processeurs des htes soient compatibles entre eux. Voyez l'article de base de connaissance de VMware http://kb.vmware.com/kb/1008027 pour plus d'informations sur les processeurs pris en charge. Les htes doivent disposer d'une licence pour VMware Fault Tolerance. Les htes doivent tre certifis pour VMware Fault Tolerance. Consultez http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par tolrance aux pannes jeux compatibles] pour confirmer si les htes sont certifis. La configuration de chaque hte implique l'activation de la virtualisation matrielle (HV) dans le BIOS.
n n
36
VMware, Inc.
Pour confirmer la compatibilit des htes dans le cluster pour la prise en charge de la tolrance aux pannes, vous pouvez aussi effectuer des vrifications de conformit de profils comme dcrit dans Crer un cluster VMware HA et vrifier la conformit , page 42. REMARQUE Quand un hte ne peut pas prendre en charge VMware Fault Tolerance, vous pouvez en consulter les raisons sur l'onglet [Rsum] de l'hte dans vSphere Client. Cliquez sur l'icne de lgende bleue ct du champ [Hte configur pour FT] et une liste des conditions pour la tolrance aux pannes que l'hte ne satisfait pas s'affiche.
Aucun priphrique non pris en charge n'est attach la machine virtuelle. Reportez-vous Interoprabilit de la tolrance aux pannes , page 37. Les machines virtuelles doivent tre conserves dans des fichiers de RDM virtuel ou de disque de machine virtuelle (VMDK) qui sont approvisionns en lourd. Lorsqu'une machine virtuelle est conserve dans un fichier VMDK qui est approvisionn en allg et que vous tentez d'activer la tolrance aux pannes, un message vous avertit que le fichier VMDK doit tre converti. Vous devez mettre hors tension la machine virtuelle pour excuter la conversion. Les fonctions incompatibles ne doivent pas tre excutes avec les machines virtuelles tolrantes aux pannes. Reportez-vous Interoprabilit de la tolrance aux pannes , page 37. Les fichiers de machines virtuelles doivent tre conservs dans un stockage partag. Les solutions de stockage partag approuves comprennent Fibre Channel, iSCSI (matriel et logiciel), NFS et NAS. Seules les machines virtuelles avec un seul vCPU sont compatibles avec la tolrance aux pannes. Les machines virtuelles doivent tre excutes sur l'un des systmes d'exploitation clients pris en charge. Consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations.
n n
Snapshots. Les snapshots doivent tre supprims ou soumis avant l'activation de la tolrance aux pannes sur une machine virtuelle. De plus, il n'est pas possible de prendre des snapshots des machines virtuelles sur lesquelles la tolrance aux pannes est active. Stockage vMotion Il n'est pas possible d'appeler le stockage vMotion pour les machines virtuelles pour lesquelles la tolrance aux pannes est active. Pour migrer le stockage, il faut mettre hors tension temporairement la tolrance aux pannes et excuter l'action de stockage vMotion. Une fois fait, vous pouvez ractiver la tolrance aux pannes.
VMware, Inc.
37
Clones lis. Il n'est pas possible d'activer la tolrance aux pannes sur une machine virtuelle qui est lie un clone et il n'est pas non plus possible de crer un clone li partir d'une machine virtuelle dont la tolrance aux pannes est active. VMware Consolidated Backup (VCB) Il n'est pas possible de sauvegarder une machine virtuelle dont la tolrance aux pannes est active avec VCB, vStorage API for Data Protection, VMware Data Recovery ou tout autre produit de sauvegarde similaire exigeant l'utilisation d'un snapshot de machine virtuelle, comme effectu par ESX/ESXi. Pour sauvegarder ainsi une machine virtuelle tolrante aux pannes, il faut pralablement mettre hors tension la tolrance aux pannes, puis la ractiver aprs la sauvegarde. Les snapshots de stockage bas sur une baie n'affectent pas la tolrance aux pannes.
Lecteur de CD-ROM ou de disquettes virtuels pris en charge par un priphrique physique ou distant. Clients paravirtualiss. Priphrique USB et audio. Virtualisation d'identification N-Port (NPIV). relais de cartes rseau Pilotes rseau vlance.
Disques virtuels pris en charge par des disques de provisionnement lourds ou lgers dont les fonctions de cluster ne sont pas actives. Connexion de priphriques chaud
38
VMware, Inc.
Tableau 3-1. Fonctions et priphriques incompatibles avec la tolrance aux pannes et les actions correctives (suite)
Fonction ou priphrique incompatible Extended Page Tables/Rapid Virtualization Indexing (EPT/ RVI). Ports srie ou parallles IPv6 Action corrective EPT/RVI est automatiquement dsactiv pour les machines virtuelles pour lesquelles la tolrance aux pannes est active. Dconnectez ces priphriques de la machine virtuelle. Utilisez les adresses IPv4 avec la tolrance aux pannes.
Activer la vrification du certificat de l'hte (s'il s'agit d'une mise niveau d'une ancienne version de vCenter Server) Configurer la mise en rseau de chaque hte Crer un cluster VMware HA, ajouter des htes et vrifier la conformit
n n
Lorsque le cluster et les htes sont prts, vous pouvez activer la tolrance aux pannes pour vos machines virtuelles. Reportez-vous Mettre sous tension la tolrance aux pannes pour des machines virtuelles , page 44.
VMware, Inc.
39
Lorsque vous avez cr la fois un commutateur virtuel de journalisation vMotion et de tolrance aux pannes, vous pouvez crer d'autres commutateurs virtuels en cas de besoin. Ajoutez ensuite l'hte au cluster et suivez les tapes ncessaires l'activation de la tolrance aux pannes. Suivant Pour confirmer la russite de l'activation de vMotion et de la tolrance aux pannes sur l'hte, consultez son onglet [Rsum] dans le vSphere Client. Dans le volet Gnral, les champs [vMotion activ] et [Hte configur pour FT] doivent tre dfinis sur oui. REMARQUE Si vous configurez la mise en rseau pour la prise en charge de la tolrance aux pannes mais que vous dsactivez ensuite le port de journalisation de la tolrance aux pannes, les paires de machines virtuelles tolrantes aux pannes qui sont dj sous tension le restent. Mais si une situation de basculement surgit, une nouvelle machine virtuelle secondaire n'est pas dmarre aprs le remplacement de la machine virtuelle principale par sa machine virtuelle secondaire. Par consquent, la nouvelle machine virtuelle principale fonctionne en tant non protge.
40
VMware, Inc.
Exemple de configuration de la mise en rseau des htes pour la tolrance aux pannes
Cet exemple prsente la configuration rseau de l'hte pour la tolrance aux pannes dans un dploiement typique avec quatre cartes rseau de plusieurs gigaoctets. Ce dploiement garantit un service adquat pour chaque type de trafic identifi ici et il pourrait tre considr comme une configuration exemplaire. La tolrance aux pannes intervient pendant toute la dure de la dfaillance d'un hte physique en raison d'une interruption de l'alimentation lectrique, d'une panique du systme ou d'autres raisons comparables. Les dfaillances des emplacements de stockage ou du rseau ou de tous composants de serveurs physiques qui n'ont pas de rpercussions sur l'tat oprationnel de l'hte n'initient pas un basculement de la tolrance aux pannes sur la machine virtuelle secondaire. Par consquent, les clients sont vivement encourags utiliser la redondance approprie (par exemple, l'association de cartes rseau) pour rduire les risques de perte de la connectivit des machines virtuelles en faveur de composants d'infrastructure comme des rseaux ou des baies de stockage. Les rgles d'association des cartes rseau sont configures sur les groupes de port vSwitch (vSS) (ou groupes de ports virtuels distribus pour vDS) et rgissent la manire dont vSwitch gre et rpartit le trafic sur les adaptateurs rseau physiques (vmnics) des machines virtuelles, des ports vmkernel et des ports de consoles de services. Un groupes de port unique est gnralement utilis pour chaque type de trafic, chacun tant gnralement associ un VLAN diffrent. Directives de configuration de mise en rseau des htes Les directives suivantes vous permettent de configurer la mise en rseau des htes pour la prise en charge de la tolrance aux pannes avec diffrentes combinaisons de types de trafic (par exemple, NFS) et plusieurs adaptateurs rseau physiques.
n
Rpartissez chaque association de cartes rseau sur deux commutateurs physiques assurant la continuit des domaines L2 pour chaque VLAN entre deux commutateurs physiques. Utilisez des rgles d'association dterministe pour vous assurer que des types de trafic particulier prsentent une affinit avec un adapteur rseau particulire (active/veille) ou un ensemble de cartes rseau (par exemple, ID port virtuel d'origine). Quand des rgles active/veille sont utilises, associez les types de trafic pour rduire les rpercussions en cas de basculement o les deux types de trafic partagent un vmnic. Quand des rgles active/veille sont utilises, configurez tous les adaptateurs actifs pour un type de trafic particulier (par exemple, journalisation de la tolrance aux pannes) sur le mme commutateur physique. Cela rduit le nombre de bonds rseau et diminue les possibilits de surexploitation du commutateur.
Exemple de configuration avec cartes rseau de 4 Go Figure 3-2 illustre la configuration rseau d'un seul l'hte ESX/ESXi avec quatre cartes rseau de plusieurs gigaoctets compatibles avec la tolrance aux pannes. Les autres htes du cluster tolrant aux pannes seraient configurs de la mme manire. Cet exemple utilise quatre groupes de ports configurs comme suit :
n
VLAN A : groupes de ports rseau des machines virtuelles actif sur vmnic2 (vers le commutateur physique #1) ; en veille sur vmnic0 (vers le commutateur physique #2.) VLAN B : groupes de ports de console de service actif sur vmnic0 (vers le commutateur physique #2) ; en veille sur vmnic2 (vers le commutateur physique #1.) VLAN C : groupes de ports de vMotion actif sur vmnic1 (vers le commutateur physique #2) ; en veille sur vmnic3 (vers le commutateur physique #1.) VLAN D : groupes de ports de journalisation de la tolrance aux pannes actif sur vmnic3 (vers le commutateur physique #1) ; en veille sur vmnic1 (vers le commutateur physique #2.)
VMware, Inc.
41
vMotion et la journalisation de la tolrance aux pannes peuvent partager le mme VLAN (configurez le mme nombre de VLAN dans les deux groupes de ports), mais ils exigent leur propre adresse IP unique rsidant dans diffrents sous-rseaux IP. Toutefois, des VLAN spars peuvent tre prfrs si des restrictions de qualit de service (QoS) sont en vigueur sur le rseau physique avec des rgles de QoS bases sur VLAN. QoS est particulirement utilise lorsque le trafic concurrent intervient, par exemple, lorsque plusieurs bonds de commutateurs physiques sont utiliss ou quand un basculement a lieu et que plusieurs types de trafic entrent en concurrence pour des ressources rseau. Figure 3-2. Exemple de configuration de mise en rseau pour la tolrance aux pannes
FT vMotion
virtuel machine
virtuel machine
virtuel machine
service console
vmkernel
VLAN A
VLAN B
VLAN D
VLAN C
vmnic2
vmnic0
vmnic3
vmnic1
Joncteurs rseau VLAN sur des liaisons montantes Ports de commutateur physique configurs comme VLAN joncteurs et porte les VLAN A, B, C et D
vSwitch (vSS or vDS) dans Jonction de commutateur virtuel Mode (VST) balisage VLAN trames transmises liaison montante vers/ partir de vmnics physique commutateur 2
42
VMware, Inc.
La machine virtuelle rside sur un hte qui n'a pas de licence pour la fonction. La machine virtuelle rside sur un hte qui est dans le mode maintenance ou le mode de veille. La machine virtuelle est dconnecte ou orpheline (son fichier .vmx n'est pas accessible). L'utilisateur n'a pas l'autorisation d'activer la fonction.
Si l'option pour activer la tolrance aux pannes est disponible, cette tche doit encore tre valide et peut chouer si certaines conditions n'est pas remplies.
Le contrle de certificat SSL doit tre activ dans les paramtres de vCenter Server. L'hte doit tre dans un cluster HA VMware ou un cluster mixte HA et DRS VMware. L'hte doit avoir ESX/ESXi 4.0 ou ultrieur install. La machine virtuelle ne doit pas avoir plusieurs vCPU. La machine virtuelle ne doit pas avoir de snapshots. La machine virtuelle ne doit pas tre un modle. La machine virtuelle ne doit pas avoir VMware HA dsactiv.
Plusieurs vrifications de validation supplmentaires sont effectues pour les machines virtuelles sous tension (ou celles qui sont en cours de mise sous tension).
n
Le BIOS des htes o rsident les machines virtuelles tolrantes aux pannes doit avoir la virtualisation matrielle (HV, Hardware Virtualization) active. L'hte qui prend en charge la machine virtuelle principale doit avoir un processeur qui prend en charge la tolrance aux pannes. L'hte qui prend en charge la machine virtuelle secondaire doit avoir un processeur qui prend en charge la tolrance aux pannes et dont la famille ou le modle de CPU est le mme que l'hte qui prend en charge la machine virtuelle principale. Les composants matriels doivent tre certifis compatibles avec la tolrance aux pannes. Pour le vrifier, reportez-vous au Guide de compatibilit VMware l'adresse http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par tolrance aux pannes jeux compatibles] . La combinaison du systme de la machine virtuelle d'exploitation invit et le processeur doit tre prise en charge par la tolrance aux pannes (par exemple, Solaris de 32 bits sur des processeurs AMD n'est pas actuellement pris en charge). Consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations sur la combinaison de processeurs et les systmes d'exploitation clients pris en charge. La configuration de la machine virtuelle doit tre valide pour tre utilise avec une tolrance aux pannes (par exemple, la configuration ne peut comporter aucun priphrique non pris en charge.).
VMware, Inc.
43
Quand votre effort d'activation de la tolrance aux pannes pour une machine virtuelle russit aux contrles de validation, la machine virtuelle secondaire est cre. Le placement et le statut immdiat de la machine virtuelle secondaire dpendent de l'tat sous tension ou hors tension de la machine virtuelle principale quand vous avez activ la tolrance aux pannes. Si la machine virtuelle principale est sous tension :
n
L'tat complet de la machine virtuelle principale est copi et la machine virtuelle secondaire est cre, place sur un hte compatible distinct et mise sous tension si elle passe le contrle d'admission. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est [Protg] .
La machine virtuelle secondaire est cre immdiatement et enregistre dans le cluster d'un hte (Il doit tre enregistr sur un hte plus appropri lorsqu'il est mis sous tension.) La machine virtuelle secondaire est mise sous tension seulement aprs la mise sous tension de la machine virtuelle principale. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans vSphere Client est [Non protg, VM inactive] . Quand vous essayez de mettre sous tension la machine virtuelle primaire aprs l'activation de la tolrance aux pannes, les contrles supplmentaires de validation sont excuts. Pour mettre sous tension correctement, la machine virtuelle ne doit pas employer la paravirtualisation (VMI). Aprs le passage de ces contrles, les machines virtuelles principales et secondaires sont mises sous tension et places sur les htes distincts et compatibles. L'tat de tolrance aux pannes affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est marqu [Protg] .
Mettre sous tension la tolrance aux pannes pour des machines virtuelles
Vous pouvez activer Tolrance aux pannes VMware par l'intermdiaire de vSphere Client. Quand la tolrance aux pannes est active, vCenter Server dsactive la limite de mmoire de la machine virtuelle et dfinit la rservation de mmoire en fonction de la taille de la mmoire de la machine virtuelle. Si la tolrance aux pannes reste active, il n'est pas possible de modifier la rservation de mmoire, sa taille, la limite ou les partages. Quand la tolrance aux pannes est dsactive, les valeurs d'origine de tous les paramtres qui ont t modifis ne sont pas restaures. Connectez vSphere Client vCenter Server en utilisant un compte ayant des droits d'accs administrateur au cluster. Procdure 1 2 Slectionnez les vues Htes & Clusters. Cliquez avec le bouton droit sur une seule machine virtuelle et slectionnez [Tolrance aux pannes] > [Dmarrer tolrance aux pannes] . Si vous slectionnez plusieurs machines virtuelles, le menu [Tolrance aux pannes] est dsactiv. Vous devez activer Tolrance aux pannes pour une seule machine virtuelle la fois. La machine virtuelle spcifie est dsigne comme machine virtuelle principale et une machine virtuelle secondaire est tablie sur un autre hte. La machine virtuelle principale est dsormais tolrante aux pannes.
44
VMware, Inc.
Affichage des informations sur les machines virtuelles tolrantes aux pannes
Vous pouvez consulter les machines virtuelles tolrantes aux pannes dans l'inventaire de vCenter Server en utilisant le vSphere Client. REMARQUE Vous ne pouvez pas mettre hors tension la tolrance aux pannes de la machine virtuelle secondaire. Le volet VMware Fault Tolerance apparat dans l'onglet [Rsum] pour la machine virtuelle primaire et inclut des informations sur la machine virtuelle. tat de la tolrance aux pannes Indique l'tat de tolrance aux pannes de la machine virtuelle.
n
Protected. Indique que les machines virtuelles principale et secondaire sont sous tension et fonctionnent comme prvu. Non protg. Indique que la machine virtuelle secondaire ne fonctionne pas. Les raisons possibles sont rpertoris dans le tableau. Tableau 3-2. Raisons pour l'tat non protg de la machine virtuelle principale
Raison pour l'tat non protg Dmarrage Description Tolrance aux pannes est en train de dmarrer la VM secondaire. Ce message n'est visible que pour une courte priode de temps. La machine virtuelle principale fonctionne sans machine virtuelle secondaire, ainsi la machine virtuelle principale n'est actuellement pas protge. Ceci se produit gnralement quand il n'y a aucun hte compatible dans le cluster disponible pour la machine virtuelle secondaire. Corrigez cette situation en plaant un hte compatible en ligne. S'il existe un hte compatible en ligne dans le cluster, il peut tre ncessaire d'approfondir la question. Dans certaines circonstances, la dsactivation de la tolrance aux pannes puis sa ractivation corrige ce problme. La tolrance aux pannes est actuellement dsactive (aucune machine virtuelle secondaire ne fonctionne). Ceci se produit quand la tolrance aux pannes est dsactive par l'utilisateur ou quand vCenter Server dsactive la tolrance aux pannes aprs avoir chou dans la mise sous tension de la machine virtuelle secondaire. La tolrance aux pannes est active mais la machine virtuelle est hors tension. Mettez sous tension la machine virtuelle pour atteindre l'tat Protected.
VM secondaire ncessaire
Dsactiv
Emplacement secondaire
Affiche l'hte ESX/ESXi sur lequel la machine virtuelle secondaire est hberge.
VMware, Inc.
45
Indique l'utilisation de la CPU de la machine virtuelle secondaire, exprime en MHz. Indique l'utilisation de la mmoire de la machine virtuelle secondaire, exprime en Mo. Intervalle de temps (en secondes) requis pour que la machine virtuelle secondaire corresponde l'tat d'excution actuel de la machine virtuelle primaire. En gnral, cet intervalle est infrieur une demi-seconde. Aucun tat n'est perdu pendant un basculement, quelle que soit la valeur de l'intervalle vLockstep. La quantit de capacit rseau utilise pour envoyer les informations de journalisation de VMware Fault Tolerance depuis l'hte excutant la machine virtuelle principale jusqu' l'hte excutant la machine virtuelle secondaire.
Log Bandwidth
Pour chaque hte configur pour prendre en charge la tolrance aux pannes, vous pouvez consulter les informations sur ses machines virtuelles tolrantes aux pannes en accdant l'onglet [Rsum] de l'hte dans vSphere Client. [Trans]The [Tolrance aux pannes] section of this screen displays the total number of Primary and Secondary VMs residing on the host and the number of those virtual machines that are powered on. [Trans]If the host is ESX/ESXi 4.1 or greater, this section also displays the Fault Tolerance version the host is running. Autrement, elle mentionne le numro de build de l'hte. [Trans]For two hosts to be compatible they must have matching FT version numbers or matching host build numbers.
Configuration d'hte
Suivez les recommandations suivantes lors de la configuration des htes.
n
Les htes excutant les machines virtuelles principales et secondaires doivent fonctionner des frquences de processeur assez proches sinon la machine virtuelle secondaire risque de redmarrer plus souvent. Les fonctions de gestion de l'alimentation de la plate-forme qui ne sont pas ajustes selon la charge de travail (modes de limitation de puissance et de basse frquence pour conomiser de l'nergie, par exemple) peuvent entraner de fortes variations des frquences du processeur. Si des machines virtuelles secondaires sont redmarres rgulirement, dsactivez tous les modes de gestion de l'alimentation sur les htes excutant des machines virtuelles tolrantes aux pannes ou veillez ce que tous les htes soient excuts avec les mme modes de gestion de l'alimentation. Appliquez la mme configuration d'extension de jeux d'instructions (activ ou dsactiv) tous les htes. Le processus d'activation ou de dsactivation des jeux d'instructions varie en fonction du BIOS. Reportezvous la documentation du BIOS de vos htes pour plus d'informations sur la configuration des jeux d'instructions.
46
VMware, Inc.
Clusters homognes
VMware Fault Tolerance peut fonctionner dans des clusters avec des htes non uniformes, mais il est prfrable que les clusters aient des nuds compatibles. Au moment de la construction du cluster, tous les htes doivent intgrer les lments suivants :
n n n n n
Processeurs appartenant au mme groupes de processeurs compatibles. Accs commun aux banques de donnes utilises par les machines virtuelles. La mme configuration rseau de machines virtuelles. La mme version ESX/ESXi Le mme numro de version de tolrance aux pannes (ou de numro de compilation d'hte pour les htes antrieurs ESX/ESXi 4.1). Les mme paramtres BIOS (gestion de l'alimentation et hyperthreading) pour tous les htes.
Performances
Pour accrotre la bande passante disponible pour le trafic de journalisation entre les machines virtuelles principales et secondaires, utilisez un adapteur rseau 10 Gbit au lieu d'un modle 1 Gbit et activez l'utilisation des Trames jumbo.
Stocker les images ISO sur des stockages partags pour un accs permanent
Les images ISO auxquelles accdent les machines virtuelles dont la tolrance aux pannes est active doivent tre conserves sur des stockages partags qui sont accessibles aux deux instances de machines virtuelles tolrantes aux pannes. Si cette configuration est utilise, le CD-ROM dans la machine virtuelle continue fonctionner correctement, mme en cas de basculement. Pour les machines virtuelles dont la tolrance aux pannes est active, il est possible d'utiliser les images ISO qui sont uniquement accessibles par la machine virtuelle principale. Dans ce cas, la machine virtuelle principale peut accder l'image ISO, mais en cas de dfaillance, le CD-ROM signale les erreurs comme s'il n'y avait pas de support. Cette situation peut tre tolre si le CD-ROM est utilis pour une opration provisoire et non critique comme une installation.
VMware, Inc.
47
Une activit excessive sur le volume VMFS peut entraner le basculement des machines virtuelles
Lorsqu'un certain nombre d'oprations de verrouillage du systme de fichiers, de mises hors et sous tension des machines virtuelle ou de migrations vMotion se produisent sur un seul volume VMFS, cela risque de dclencher le basculement des machines virtuelles tolrantes aux pannes. La rception de nombreux avertissements relatifs des rservations SCSI dans le journal VMkernel peut tre un symptme. Pour rsoudre ce problme, rduisez le nombre d'oprations dans le systme de fichiers ou vrifiez que la machine virtuelle tolrante aux pannes se trouve sur un volume VMFS qui ne contient pas un grand nombre de machines virtuelles rgulirement mises sous tension, mises hors tension ou migres l'aide de vMotion.
Le manque d'espace dans le systme de fichiers empche le dmarrage d'une machine virtuelle secondaire
Vrifiez que les systmes de fichiers /(root) ou /vmfs/datasource ont de l'espace disponible. Ces systmes de fichiers peuvent tre pleins pour de nombreuses raisons et un manque d'espace peut empcher le dmarrage d'une nouvelle machine virtuelle secondaire.
48
VMware, Inc.
5 6 7
Activez la tolrance aux pannes sur la machine virtuelle principale qui a t dplace. Rptez tape 1 tape 5 pour autant de paires de machines virtuelles tolrantes aux pannes que les htes mis niveau peuvent en accueillir. Avec vMotion, rpartissez les machines virtuelles tolrantes aux pannes.
En plus des machines virtuelles non tolrantes aux pannes, vous ne devez pas avoir plus de quatre machines virtuelles (principales ou secondaires) tolrantes aux pannes par hte unique. Le nombre de machines virtuelles tolrantes aux pannes que vous pouvez excuter en toute scurit sur chaque hte est bas sur la taille et la charge de travail variables des htes ESX/ESXi et des machines virtuelles. Si vous accdez au stockage partag par NFS, utilisez du matriel NAS ddi avec un adapteur rseau de 1 Gbit au minimum pour parvenir aux performances rseaux requises pour le bon fonctionnement de la tolrance aux pannes. Veillez ce qu'un pool de ressources contenant des machines virtuelles tolrantes aux pannes dispose de rserves de mmoire dpassant la capacit de mmoire des machines virtuelles. La rservation de mmoire d'une machine virtuelle tolrance aux pannes est dfinie par la taille de la mmoire de la machine virtuelle lorsque la tolrance aux pannes est active. Sans cet excdent de pool de ressources, il risque de ne pas y avoir de mmoire disponible comme capacit supplmentaire. Utilisez 16 disques virtuels au maximum par machine virtuelle tolrante aux pannes. Pour assurer la redondance et une protection maximale de la tolrance aux pannes, il est recommand d'avoir un nombre minimum de trois htes par cluster. Dans une situation de basculement, on dispose ainsi d'un hte capable de grer la nouvelle machine virtuelle secondaire qui est cre.
n n
VMware, Inc.
49
Cause Ceci est souvent d au fait que la virtualisation matrielle (HV) n'est pas disponible sur le serveur ESX/ESXi sur lequel vous essayez de mettre sous tension la machine virtuelle. Il est possible que la virtualisation matrielle ne soit pas non plus disponible parce qu'elle n'est pas prise en charge par les composants matriels du serveur ESX/ESXi ou qu'elle n'a pas t active dans le BIOS. Solution Si les composants matriels du serveur ESX/ESXi prennent en charge la virtualisation matrielle, mais que celle-ci n'est pas active, activez-la dans le BIOS du serveur. Le processus d'activation de la virtualisation matrielle varie en fonction du BIOS. Reportez-vous la documentation du BIOS de vos htes pour plus d'informations sur la configuration de la virtualisation matrielle. Si les composants matriels du serveur ESX/ESXi ne prennent pas en charge la virtualisation matrielle, basculez sur des composants matriels qui utilisant des processeurs qui prennent en charge la tolrance aux pannes.
Des htes compatibles doivent tre disponibles pour les machines virtuelles secondaires
Si vous mettez sous tension une machine virtuelle avec la Tolrance aux pannes active et qu'aucun hte compatible n'est disponible pour sa machine virtuelle secondaire, un message d'erreur s'affichera peut-tre. Problme Le message d'erreur suivant est susceptible de s'afficher dans le panneau Tches rcentes :
La machine virtuelle secondaire ne peut tre allume car il n'existe pas d'hte compatible.
Cause Ce problme peut s'expliquer de diffrentes manires. Parmi les causes possibles, on peut citer le fait qu'il n'y a pas d'autres htes dans le cluster, qu'il n'y a pas d'autres htes dont la virtualisation matrielle est active, que les banques de donnes sont inaccessibles, qu'il n'y a pas de capacit disponible ou que les htes sont en mode maintenance. Solution S'il n'y a pas suffisamment d'htes, ajoutez-en davantage dans le cluster. S'il y a des htes dans le cluster, vrifiez qu'ils prennent en charge la virtualisation matrielle et que celle-ci est active. Le processus d'activation de la virtualisation matrielle varie en fonction du BIOS. Reportez-vous la documentation du BIOS de vos htes pour plus d'informations sur la configuration de la virtualisation matrielle. Vrifiez que les htes disposent de capacit suffisante et qu'ils ne sont pas en mode de maintenance.
Une machine virtuelle secondaire sur un hte surcharg dgrade les performances de la machine virtuelle principale
Lorsqu'une machine virtuelle principale semble ralentie, alors que la charge de travail de son hte est lgre et qu'elle conserve du temps de CPU inactif, vrifiez que l'hte sur lequel la machine virtuelle secondaire est excute n'est pas surcharg. Problme Lorsqu'une machine virtuelle secondaire rside sur un hte fortement charg, ceci peut affecter la performance de la machine virtuelle principale.
50
VMware, Inc.
Une manifestation de ce problme peut tre le voyant jaune ou rouge pour l'intervalle vLockstep sur le panneau de tolrance aux pannes de la machine virtuelle principale. Cela signifie que la machine virtuelle secondaire a quelques secondes de retard par rapport la machine virtuelle principale. Dans ce cas, la tolrance aux pannes ralentit la machine virtuelle principale. Si l'intervalle vLockstep reste jaune ou rouge de manire prolonge, cela indique que la machine virtuelle secondaire ne bnficie pas de suffisamment de ressources CPU pour suivre la machine virtuelle principale. Cause Une machine virtuelle secondaire excute sur un hte dont les ressources de CPU sont surcharges ne bnficiera pas ncessairement de la mme quantit de ressources CPU que la machine virtuelle principale. Si c'est le cas, la machine virtuelle principale doit ralentir pour que la machine virtuelle secondaire parvienne la suivre. Elle rduit alors sa vitesse d'excution pour atteindre la vitesse infrieure de la machine virtuelle secondaire. Solution Pour rsoudre ce problme, dfinissez une rservation de CPU explicite pour la machine virtuelle principale en rglant une valeur en MHz suffisante pour l'excution de la charge de travail au niveau de performances requis. Cette rservation est applique la fois aux machines virtuelles principale et secondaire, ce qui garantit qu'elles pourront toutes deux fonctionner la vitesse spcifie. Pour vous aider dfinir cette rservation, consultez les courbes de performances de la machine virtuelle (avant l'activation de la tolrance aux pannes) pour vrifier la quantit de ressources CPU utilise dans des conditions normales.
Les machines virtuelles ayant une grosse mmoire peuvent empcher l'utilisation de la tolrance aux pannes
Il est uniquement possible d'activer la tolrance aux pannes sur les machines virtuelles dont la mmoire ne dpasse pas 64 Go. Problme L'activation de la Tolrance aux pannes sur une machine virtuelle possdant plus de 64 Go peut chouer. La migration d'une machine virtuelle tolrante aux pannes, en cours d'excution et utilisant vMotion, risque aussi d'chouer si sa mmoire dpasse 15 Go ou si celle-ci change une vitesse suprieure la capacit de copie de vMotion sur le rseau. Cause Cela se produit cause de la capacit de mmoire de la machine virtuelle, il n'y a plus suffisamment de bande passante pour achever l'opration de basculement vMotion pendant le dlai d'expiration par dfaut (8 secondes). Solution Pour rsoudre ce problme, avant d'activer la tolrance aux pannes, teignez la machine virtuelle et augmentez son dlai d'expiration en ajoutant la ligne suivante dans le fichier vmx de la machine virtuelle :
ft.maxSwitchoverSeconds = "30"
o 30 est le dlai d'expiration en nombre de secondes. Activez la tolrance aux pannes et rallumez la machine virtuelle. Cette solution devrait tre efficace lorsque le rseau prsente une forte activit. REMARQUE Si vous augmentez le dlai d'expiration 30 secondes, la machine virtuelle tolrante aux pannes risque de ne plus rpondre pendant une dure plus longue (jusqu' 30 secondes) lors de l'activation de la tolrance aux pannes ou lorsqu'une nouvelle machine virtuelle secondaire est cre suite un basculement.
VMware, Inc.
51
52
VMware, Inc.
Vous rencontrerez parfois des messages d'erreurs dans le cas de l'utilisation de VMware Fault Tolerance (FT). Les tableaux ci-dessous numrent quelques messages d'erreurs. Chaque message d'erreur s'accompagne d'une description et d'informations sur la rsolution de l'erreur, le cas chant. En plus de l'onglet [Tches et vnements] de vSphere Client, vous pouvez aussi consulter les erreurs de tolrance aux pannes dans l'onglet [Rcapitulatif] de la machine virtuelle.
Cette machine virtuelle se trouve sur un hte qui n'est pas dans un cluster VMware HA ou VMware HA a t dsactiv. La tolrance aux pannes exige VMware HA.
VMware, Inc.
53
Aucun adapteur rseau de journalisation de la tolrance aux pannes n'a t configure. Consultez Configurer la mise en rseau des machines htes , page 40 pour plus d'informations.
Le produit utilis n'est pas compatible avec la tolrance aux pannes. Pour utiliser le produit, vous devez mettre hors tension la tolrance aux pannes. Ce message d'erreur apparat principalement quand vCenter Server gre un hte ayant une version prcdente d'ESX/ESXi ou en cas d'utilisation de VMware Server. Mettez niveau vers la version VMware ESX ou ESXi 4.1 ou une version ultrieure.
Les versions de la fonction de tolrance aux pannes doivent tre identiques sur les htes actuels et de destination. Choisissez un hte compatible ou mettez niveau des htes incompatibles.
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la configuration actuelle de la machine virtuelle ne prend pas en charge la tolrance aux pannes La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : les fonctions d'enregistrement et de lecture ne sont pas prises en charge par la machine virtuelle
La tolrance aux pannes fonctionne uniquement sur une machine virtuelle ayant une seule vCPU. Les erreurs suivantes risquent de se produire lorsque vous essayez d'activer la tolrance aux pannes sur une machine virtuelle ayant plusieurs vCPU :
n
La machine virtuelle a {numCpu} CPU virtuelles et n'est pas prise en charge cause de : Tolrance aux pannes La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : machine virtuelle ayant plusieurs CPU virtuelles.
54
VMware, Inc.
La tolrance aux pannes n'est pas compatible avec certaines fonctions vSphere. Si vous essayez d'activer la tolrance aux pannes sur une machine virtuelle utilisant une fonction vSphere qui ne prend pas en charge la tolrance aux pannes, l'un des messages d'erreurs suivants risque d'apparatre. Pour utiliser la tolrance aux pannes, vous devez mettre hors tension la fonction vSphere sur la machine virtuelle problmatique ou activer la tolrance aux pannes sur une machine virtuelle qui n'utilise pas ces fonctions.
n
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la machine virtuelle a un ou deux snapshots La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : machine virtuelle modle
Les messages d'erreurs suivants risquent d'apparatre si la machine virtuelle comporte un priphrique non pris en charge. Pour activer la tolrance aux pannes sur cette machine virtuelle, supprimez le priphrique non pris en charge, puis activez la tolrance aux pannes.
n
La sauvegarde de fichiers ({backingFilename}) pour le priphrique de disque virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le priphrique de disquette virtuelle n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le priphrique de CDROM virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le port srie virtuel n'est pas prise en charge par la tolrance aux pannes La sauvegarde de fichiers ({backingFilename}) pour le port parallle virtuel n'est pas prise en charge par la tolrance aux pannes
Le tableau suivant numre d'autres erreurs de configuration des machines virtuelles. Consultez Interoprabilit de la tolrance aux pannes , page 37 pour plus d'informations. Tableau A-2. Autres problmes de configuration des machines virtuelles
Message d'erreur L'hte spcifi n'est pas compatible avec la machine virtuelle secondaire tolrante aux pannes. Hte non compatible pour la machine virtuelle secondaire {vm.name} Le disque {Priphrique} de la machine virtuelle utilise le mode disque {mode} qui n'est pas pris en charge. Description et solution Reportez-vous Dpannage de la tolrance aux pannes , page 49 pour des causes possibles de cette erreur. Reportez-vous Dpannage de la tolrance aux pannes , page 49 pour des causes possibles de cette erreur. La machine virtuelle est quipe d'un ou de plusieurs disques durs configurs pour utiliser le mode Indpendant. Modifiez les paramtres de la machine virtuelle, slectionnez chaque disque dur et dsactivez le mode Indpendant. Adressez-vous votre administrateur systme pour savoir ce qui est acceptable pour l'environnement.
VMware, Inc.
55
Les blocs des disques de la machine virtuelle n'ont pas t entirement provisionns sur le systme de fichiers. Le nettoyage est ncessaire pour la prise en charge de fonctions comme la tolrance aux pannes.
Erreurs d'exploitation
Le tableau ci-dessous numre les messages d'erreurs qui apparaissent en cours d'utilisation des machines virtuelles tolrantes aux pannes. Tableau A-3. Erreurs d'exploitation
Message d'erreur Aucun hte adapt n'a t trouv pour placer la machine virtuelle secondaire tolrante aux pannes pour la machine virtuelle {vmName} Description et solution La tolrance aux pannes exige que les htes des machines virtuelles principales et secondaires utilisent la mme CPU ou famille, le mme numro de version de tolrance aux pannes ou numro de compilation d'hte et niveau de correctif. Activez la tolrance aux pannes sur une machine virtuelle enregistre sur un hte ayant un modle de CPU ou une famille concordants dans le cluster. Si ce type d'htes n'existe pas, vous devez en ajouter un . vCenter Server signalera la raison de l'impossibilit d'activer la machine virtuelle principale. Corrigez les conditions, puis ressayez l'opration. Ressayez de mettre sous tension la machine virtuelle secondaire. Le dlai d'expiration peut tre imputable des problmes de rseau ou d'autres problmes temporaires. Pour diagnostiquer la raison de l'impossibilit d'activer la machine virtuelle secondaire, reportez-vous Dpannage de la tolrance aux pannes , page 49. La tolrance aux pannes a dtect une diffrence entre les machines virtuelles principale et secondaire. Elle peut tre due des vnements provisoires qui ont lieu cause de diffrences matrielles ou logicielles entre les deux htes. La tolrance aux pannes a dmarr automatiquement une nouvelle machine virtuelle secondaire et aucune action n'est requise. Si ce message apparat souvent, signalez-le au support technique qui vrifie s'il y a un problme.
La machine virtuelle secondaire tolrante aux pannes n'a pas t active car la machine virtuelle principale tolrante aux pannes n'a pas t active. L'activation de la machine virtuelle secondaire tolrante aux pannes pour {vmName} n'a pas pu tre effectue dans un dlai de {timeout} secondes. vCenter a dsactiv la tolrance aux pannes sur la machine virtuelle {vm.name} car la machine virtuelle secondaire n'a pas pu tre active. Nouvelle synchronisation des machines virtuelles principale et secondaire
56
VMware, Inc.
Impossible de modifier le comportement DRS de la machine virtuelle secondaire tolrante aux pannes {vmName}. Les machines virtuelles de la mme paire tolrante aux pannes ne peuvent se trouver sur le mme hte.
Impossible d'ajouter un hte avec des machines virtuelles dont la tolrance aux pannes est active sur un cluster non compatible HA. Impossible d'ajouter un hte avec des machines virtuelles dont la tolrance aux pannes est active sous la forme d'un hte autonome.
Impossible de rgler la priorit de redmarrage HA sur Dsactiv pour la machine virtuelle tolrante aux pannes {vmName}. L'hte dispose dj du nombre recommand de {maxNumFtVms} machines virtuelles tolrantes aux pannes
La configuration de la tolrance aux pannes de l'entit {entityName} pose un problme : la machine virtuelle secondaire existe dj
VMware, Inc.
57
REMARQUE Pour les erreurs lies la compatibilit CPU, consultez l'article dans la base de connaissances VMware accessible l'adresse http://kb.vmware.com/kb/1008027 pour plus d'informations sur les processeurs et les systmes d'exploitation clients pris en charge. Vous pouvez aussi utiliser l'utilitaire VMware SiteSurvey (tlchargeable sur http://www.vmware.com/download/shared_utilities.html) pour avoir une connaissance approfondie des problmes de configuration associs au cluster, l'hte et aux machines virtuelles utilises pour VMware FT.
58
VMware, Inc.
Index
A
activation de VMware HA 22 adresse d'isolation rseau 29 Association de cartes rseau 30, 41 attributs avancs, VMware HA 26
B
basculement transparent 9, 33
C
calcul de la taille du slot 14 Capacit de basculement actuelle 14, 17 Capacit de basculement configure 14, 17 cas d'utilisation, Tolrance aux pannes 35 cluster VMware HA contrle d'admission 13 cration 20, 21, 42 htrognit 19 htes principaux 11 htes secondaires 11 meilleures pratiques 28 planification 11 Compatibilit amliore de vMotion 35 conditions pralables, Tolrance aux pannes 36 configuration rseau, Tolrance aux pannes 40, 41 configurer les options avances VMware HA 26 continuit d'activit 7 contrle d'admission activation 23 rgle 23 types 13 VMware HA 13 contrles de validation 43 cration d'un cluster VMware HA 20
das.slotmeminmb 14, 26 das.usedefaultisolationaddress 26 das.vmcpuminmhz 14, 17, 26 das.vmmemoryminmb 26 Dfaillances d'hte tolres par le cluster 14 dpannage de la tolrance aux pannes 49 Distributed Resource Scheduler (DRS) activation 22 erreurs de tolrance aux pannes 53 et tolrance aux pannes 37 utilisation avec VMware Fault Tolerance 35 utilisation avec VMware HA 11
E
quilibrage de charge 35 tat de la tolrance aux pannes Dmarrage 45 Dsactiv 45 Machine virtuelle hors excution 45 VM secondaire ncessaire 45 tiquettes rseau 29 EVC 35 vnements et alarmes, paramtre 28 Extended Page Tables (EPT) 37
F
Fonction de dmarrage et d'arrt de machine virtuelle 20 fonction de surveillance d'hte 22, 29 fragmentation des ressources 19 ft.maxSwitchoverSeconds 51
G
Gestion de l'alimentation distribue (DPM) 11, 13
D
das.defaultfailoverhost 26 das.failuredetectioninterval 26 das.failuredetectiontime 26, 29 das.iostatsinterval 25, 26 das.isolationaddress 26, 29 das.isolationshutdowntimeout 23, 26 das.maxftvmsperhost 35 das.slotcpuinmhz 14, 26
H
hte de basculement 18 hte de basculement actuel 18 hte surcharg 50 htes isolation rseau 11 mode maintenance 11 htes principaux dans des clusters 11 htes secondaires dans des clusters 11
VMware, Inc.
59
I
images ISO 46 Informations d'excution avances 14 interoprabilit, Tolrance aux pannes 37 Interruption imprvu 8 prvu 7 interruption de service imprvue 8 interruption de service prvue 7 intervalles statistiques d'E/S 25 IPv6 37
Pourcentage de ressources de cluster rserves 17 Spcifier un hte de basculement 18 rgles d'affinit 33, 35 rgles d'anti-affinit 33 Rinitialisations maximales par machine virtuelle 25 rseau de gestion 20, 29
S
SAN iSCSI 36 sensibilit de surveillance 25 slot 14 snapshots 37 Spcifier un hte de basculement 18 stockage iSCSI 36 NAS 36, 49 NFS 36, 49 Storage vMotion 7, 37 support pdagogique 5 support technique 5 Surveillance d'application 25 Surveillance de VM 25 surveillance de VMware HA 28 suspension de VMware HA 22
M
meilleures pratiques clusters VMware HA 28 mise en rseau VMware HA 29 Tolrance aux pannes 46 messages d'erreurs, Tolrance aux pannes 53 minimisation des interruptions de service 7 mise niveau d'htes avec des machines virtuelles tolrantes aux pannes 48 mise en rseau VMware HA meilleures pratiques 29 Redondance des chemins d'accs 30 modifier les paramtres du cluster 21 multiprocesseur symtrique (SMP) 37
N
noms des groupes de ports 29
T
Tolrance aux pannes activation 39, 44 Log Bandwidth 45 cas d'utilisation 35 conditions pralables 36 configuration rseau 40, 41 configuration vSphere 36 continuit de la disponibilit 9 contrles de validation 43 CPU secondaire totale 45 dpannage 4952 emplacement secondaire 45 interoprabilit 37 Intervalle vLockstep 45 journalisation 40, 41, 47 liste de vrification 36 meilleures pratiques 46 Mmoire secondaire totale 45 messages d'erreurs 53 prsentation 33 recommandations relatives la configuration 49 rgles d'anti-affinit 33 restrictions pour l'activation 43
P
paramtre de priorit de redmarrage des machines virtuelles 23 paramtre de rponse d'isolation de l'hte 23 paramtres de cluster 21 paramtres de remplacement des machines virtuelles 23, 28 paravirtualisation 37 passerelle par dfaut 29 personnalisation de VMware HA 26 planificaiton d'un cluster VMware HA 11 PortFast 29 ports de pare-feu 29 Pourcentage de ressources de cluster rserves 17
R
Rapid Virtualization Indexing (RVI) 37 RDM 36, 37 recherche de DNS 20 rgle de contrle d'admission choix 19 Dfaillances d'hte tolres par le cluster 14
60
VMware, Inc.
Index
vrification de conformit 42 version 36 tolrance aux pannes la demande 35 tolrance des dfaillances d'hte 14
V
validit du cluster 28 vrification de conformit, Tolrance aux pannes 42 vrification du certificat de l'hte 36, 39 Virtualisation d'identification N-Port (NPIV) 37 Virtualisation matrielle (HV) 36, 43, 49, 50 VLAN 41 VMDK 36 VMFS 11, 29, 47
VMware Consolidated Backup (VCB) 37 VMware HA activation 22 attributs avancs 26 avantages 8 contrle 28 interruption 22 liste de vrification 20 paramtres de cluster 20 personnalisation 26 reprise d'activit suite une interruption 8 VMware Tools 25 VMware vLockstep 9, 33
VMware, Inc.
61
62
VMware, Inc.