VMware vSphere HA (High Availability) je nástroj obsažený v softwaru VMware vSphere, který dokáže restartovat selhané virtuální počítače (VM) na alternativních hostitelských serverech a zkrátit tak výpadky aplikací.
VSphere HA umožňuje správci serveru sdružovat fyzické servery ve stejné síti do logické skupiny nazývané cluster s vysokou dostupností. Při selhání serveru, například při havárii systému, přerušení napájení nebo výpadku sítě, vSphere HA zjistí, které virtuální počítače jsou mimo provoz, a restartuje je na jiném stabilním systému v rámci clusteru. Tento proces restartování selhané pracovní zátěže na sekundárních systémech se nazývá failover.
VMware poprvé představil vSphere HA ve Virtual Infrastructure 3 v roce 2006 a nadále tuto funkci vyvíjí a podporuje.
Vysoká dostupnost je obecně termín používaný k popisu systémů nebo aplikací, které jsou dostupné – fungují podle očekávání – po vysoké procento času. V podnikových datových centrech dostupnost systémů často přesahuje 99 % a často se měří v devítkách.
Funkce VMware vSphere HA
VMware vSphere HA umožňuje organizacím zlepšit dostupnost automatickou detekcí selhaných virtuálních počítačů a jejich restartováním na jiných fyzických serverech bez ruční lidské účasti. Možnost restartovat tyto virtuální počítače na jiném fyzickém hardwaru je možná díky tomu, že soubory VMDK (Virtual Machine Disk) jsou uchovávány na sdíleném úložišti, které je přístupné všem fyzickým serverům připojeným prostřednictvím clusteru HA.
VMware Distributed Resource Scheduler (DRS) se často používá ve spojení s vSphere HA k vyrovnávání pracovních zátěží, které je třeba restartovat na alternativních hostitelích. Organizace, která používá vSphere HA a DRS společně, může zajistit, že restartované virtuální počítače neovlivní výkon ostatních virtuálních počítačů na hostiteli s náhradním řešením.
Funkce VMware Fault Tolerance může také zajistit velmi vysokou úroveň dostupnosti. Zatímco vSphere HA restartuje selhané virtuální počítače po krátké době detekce a spuštění, Fault Tolerance udržuje redundantní kopii chráněného virtuálního počítače, která může plynule převzít operace selhané kopie.
Jak funguje vSphere HA
VMware vSphere HA používá k monitorování dostupnosti hostitele ESXi a k restartování selhaných virtuálních počítačů nástroj nazvaný Fault Domain Manager agent. Při nastavení vSphere HA správce definuje skupinu serverů, které mají sloužit jako cluster s vysokou dostupností. Správce Fault Domain Manager je spuštěn na každém hostiteli v rámci clusteru. Jeden hostitel v clusteru slouží jako hlavní hostitel – všichni ostatní hostitelé jsou označováni jako podřízení – a monitoruje signály od ostatních hostitelů v clusteru a komunikuje se serverem vCenter Server.
Hostitelské servery v rámci clusteru HA komunikují prostřednictvím srdečního rytmu, což je periodická zpráva, která signalizuje, že hostitel pracuje podle očekávání. Pokud hlavní hostitel nezjistí signál heartbeat od jiného hostitele nebo virtuálního počítače v rámci clusteru, dá pokyn vSphere HA k provedení nápravných opatření. Typ akce závisí na typu zjištěné poruchy a také na preferencích uživatele. V případě selhání virtuálního počítače, kdy hostitelský server pokračuje v provozu, vSphere HA restartuje virtuální počítač na původním hostiteli. V případě selhání celého hostitele nástroj restartuje všechny postižené virtuální počítače na ostatních hostitelích v clusteru.
Určení HA může také restartovat virtuální počítače, pokud hostitel pokračuje v provozu, ale ztratí síťové připojení ke zbytku clusteru. Hlavní hostitel může sledovat, zda tento hostitel stále komunikuje s datovými úložišti připojenými k síti, aby zjistil, zda hostitel se síťovou segregací stále běží. Sdílené úložiště, jako je síť úložišť, umožňuje hostitelům v clusteru přistupovat k diskovým souborům virtuálního počítače a restartovat virtuální počítač, i když byl spuštěn na jiném serveru v clusteru.
Jak nastavit a používat vSphere HA
Prvním krokem k nastavení vSphere HA je vytvoření clusteru z webového klienta vSphere v části Vytvořit cluster a poté výběr hostitelů ESXi a sdíleného úložiště, které se budou účastnit clusteru. Clustery HA musí obsahovat alespoň dva hostitele, ale mnoho organizací udržuje větší clustery, které sdružují více zdrojů a mohou se vyrovnat s vícenásobným selháním.
Správce pak může zapnout funkci vSphere HA z webového klienta v části Správa > Nastavení > vSphere HA. Nakonec může uživatel upravit nastavení a předvolby konfigurace vSphere HA z webového klienta vSphere.
Požadavky a osvědčené postupy VMware vSphere HA
Administrátoři mohou upravit mnoho nastavení HA, včetně doby, po kterou je virtuální počítač nebo hostitel nedostupný, než se jej vSphere HA pokusí restartovat; výchozí hodnota je 120 sekund. Správce může nastavit preference restartování virtuálních počítačů a zvolit pořadí, v jakém se budou virtuální počítače v clusteru restartovat. Toto nastavení je užitečné například v případě, že v clusteru není dostatek místa pro restartování všech neúspěšných virtuálních počítačů. V mnoha případech správce přiřadí vyšší prioritu restartu virtuálním počítačům, na kterých běží kritické aplikace.
Organizace může také definovat pravidla afinity a anti-afinity, aby omezila umístění určitých virtuálních počítačů. Pravidla afinity a anti-afinity zabraňují restartování určených virtuálních počítačů na vybraných serverech nebo na serverech, které již hostí jiné určené virtuální počítače. Tato pravidla jsou užitečná k zajištění toho, aby se virtuální počítače náročné na procesor po havárii nerestartovaly na stejném hostiteli nebo aby dvě kopie aplikace s vysokou prioritou neskončily na stejném hostiteli a nevytvořily potenciální jediný bod selhání.
.