VMware vSphere HA (High Availability) er et værktøj inkluderet i VMwares vSphere-software, der kan genstarte fejlslagne virtuelle maskiner (VM’er) på alternative værtsservere for at reducere nedetid for applikationer.
VSphere HA gør det muligt for en serveradministrator at samle fysiske servere på det samme netværk i en logisk gruppe kaldet en klynge med høj tilgængelighed. Under en serverfejl, f.eks. et systemnedbrud, strømafbrydelse eller netværksfejl, registrerer vSphere HA, hvilke VM’er der er nede, og genstarter dem på et andet stabilt system i klyngen. Denne proces med at genstarte fejlslagne arbejdsbelastninger på sekundære systemer kaldes failover.
VMware introducerede først vSphere HA i Virtual Infrastructure 3 i 2006 og har fortsat med at udvikle og understøtte funktionen.
Høj tilgængelighed er generelt et begreb, der bruges til at beskrive systemer eller programmer, der er tilgængelige – fungerer som forventet – en høj procentdel af tiden. I virksomhedens datacentre overstiger systemtilgængelighed ofte 99 % og måles ofte i nier.
VMware vSphere HA-funktioner
VMware vSphere HA gør det muligt for organisationer at forbedre tilgængeligheden ved automatisk at registrere fejlslagne VM’er og genstarte dem på forskellige fysiske servere uden manuel menneskelig indblanding. Muligheden for at genstarte disse VM’er på forskellig fysisk hardware er mulig, fordi VMDK-filer (Virtual Machine Disk) opbevares på delt lagring, som er tilgængelig for alle fysiske servere, der er forbundet via HA-klyngen.
VMware Distributed Resource Scheduler (DRS) bruges ofte sammen med vSphere HA til at afbalancere arbejdsbyrder, der skal genstartes på alternative værter. En organisation, der bruger vSphere HA og DRS sammen, kan sikre, at genstartede VM’er ikke påvirker ydeevnen for andre VM’er på failover-værten.
Funktionen VMware Fejltolerance kan også sikre meget høje niveauer af tilgængelighed. Mens vSphere HA genstarter fejlslagne VM’er efter en kort detektions- og opstartstid, opretholder Fault Tolerance en redundant kopi af den beskyttede VM, som problemfrit kan overtage driften af den fejlslagne kopi.
Sådan fungerer vSphere HA
VMware vSphere HA bruger et værktøj kaldet Fault Domain Manager-agenten til at overvåge ESXi-værtens tilgængelighed og til at genstarte fejlslagne VM’er. Når du konfigurerer vSphere HA, definerer en administrator en gruppe af servere, der skal fungere som en klynge med høj tilgængelighed. Fault Domain Manager kører på hver vært i klyngen. En vært i klyngen fungerer som mastervært — alle andre værter kaldes slaver — til at overvåge signaler fra andre værter i klyngen og kommunikere med vCenter Server.
Værtsservere i en HA-klynge kommunikerer via et heartbeat, som er en periodisk meddelelse, der angiver, at en vært kører som forventet. Hvis masterværten ikke kan registrere et heartbeat-signal fra en anden vært eller VM i klyngen, instruerer den vSphere HA om at foretage korrigerende handlinger. Typen af handling afhænger af den type fejl, der er registreret, samt af brugerpræferencer. I tilfælde af en VM-fejl, hvor værtsserveren fortsætter med at køre, genstarter vSphere HA den virtuelle maskine på den oprindelige vært. Hvis en hel vært fejler, genstarter hjælpeprogrammet alle berørte VM’er på andre værter i klyngen.
Ha-hjælpeprogrammet kan også genstarte VM’er, hvis en vært fortsætter med at køre, men mister en netværksforbindelse til resten af klyngen. Hovedværten kan overvåge, om den pågældende vært stadig kommunikerer med netværksforbundne datalagre for at registrere, om en netværkssegregeret vært stadig kører. Fælles lagring, f.eks. et storage area network, gør det muligt for værter i klyngen at få adgang til VM-diskfiler og genstarte den virtuelle maskine, selv om den kørte på en anden server i klyngen.
Sådan konfigurerer og bruger du vSphere HA
Det første skridt til at konfigurere vSphere HA er at oprette en klynge fra vSphere Web Client under Opret en klynge og derefter vælge ESXi-værter og delt lagring, der skal deltage i klyngen. HA-klynger skal indeholde mindst to værter, men mange organisationer opretholder større klynger, der samler flere ressourcer og kan håndtere flere fejl.
En administrator kan derefter slå vSphere HA-funktionen til fra webklienten under Administrer > Indstillinger > vSphere HA. Endelig kan en bruger justere vSphere HA-konfigurationsindstillinger og præferencer fra vSphere Web Client.
VMware vSphere HA-krav og bedste praksis
Administratorer kan justere mange HA-indstillinger, herunder hvor længe en VM eller vært er utilgængelig, før vSphere HA forsøger at genstarte den; standardværdien er 120 sekunder. En administrator kan indstille VM-genstartpræferencer og vælge den rækkefølge, i hvilken VM’er genstartes i klyngen. Denne indstilling er nyttig, hvis der f.eks. ikke er tilstrækkelig plads i klyngen til at genstarte alle de fejlslagne VM’er. I mange tilfælde tildeler en administrator en højere genstartsprioritet til VM’er, der kører forretningskritiske programmer.
En organisation kan også definere affinitets- og anti-affinitetsregler for at begrænse, hvor visse VM’er placeres. Affinitets- og anti-affinitetsregler forhindrer bestemte VM’er i at genstarte på udvalgte servere eller på servere, der allerede er vært for andre bestemte VM’er. Disse regler er nyttige for at sikre, at CPU-intensive VM’er ikke genstartes på den samme vært efter en katastrofe, eller for at sikre, at to kopier af et højprioriteret program ikke ender på den samme vært og skaber et potentielt single point of failure.