VMware vSphere HA (High Availability) è un’utility inclusa nel software vSphere di VMware che può riavviare macchine virtuali (VM) fallite su server host alternativi per ridurre il downtime delle applicazioni.
VSphere HA permette all’amministratore del server di raggruppare i server fisici sulla stessa rete in un gruppo logico chiamato cluster ad alta disponibilità. Durante un guasto del server, come un crash di sistema, un’interruzione di corrente o un guasto di rete, vSphere HA rileva quali VM sono fuori uso e le riavvia su un altro sistema stabile all’interno del cluster. Questo processo di riavvio dei carichi di lavoro falliti su sistemi secondari è chiamato failover.
VMware ha introdotto per la prima volta vSphere HA in Virtual Infrastructure 3 nel 2006 e ha continuato a sviluppare e supportare la funzione.
Utilizzato in generale, alta disponibilità è un termine usato per descrivere sistemi o applicazioni che sono disponibili – funzionando come previsto – per un’alta percentuale del tempo. Nei data center aziendali, la disponibilità del sistema spesso supera il 99% e viene spesso misurata in nove.
Le caratteristiche diVMware vSphere HA
VMware vSphere HA permette alle organizzazioni di migliorare la disponibilità rilevando automaticamente le VM fallite e riavviandole su diversi server fisici senza coinvolgimento umano manuale. La capacità di riavviare queste VM su diversi hardware fisici è possibile perché i file Virtual Machine Disk (VMDK) sono conservati su uno storage condiviso, accessibile a tutti i server fisici collegati tramite cluster HA.
VMware Distributed Resource Scheduler (DRS) è spesso utilizzato insieme a vSphere HA per riequilibrare i carichi di lavoro che devono essere riavviati su host alternativi. Un’organizzazione che utilizza vSphere HA e DRS insieme può garantire che le VM riavviate non influiscano sulle prestazioni di altre VM sull’host di failover.
La funzione VMware Fault Tolerance può anche garantire livelli molto elevati di disponibilità. Mentre vSphere HA riavvia le VM fallite dopo un breve tempo di rilevamento e di avvio, Fault Tolerance mantiene una copia ridondante della VM protetta che può subentrare senza problemi nelle operazioni della copia fallita.
Come funziona vSphere HA
VMware vSphere HA utilizza un’utility chiamata agente Fault Domain Manager per monitorare la disponibilità degli host ESXi e per riavviare le VM fallite. Quando si configura vSphere HA, un amministratore definisce un gruppo di server che fungono da cluster ad alta disponibilità. Il Fault Domain Manager viene eseguito su ogni host all’interno del cluster. Un host nel cluster funge da host master – tutti gli altri host sono indicati come slave – per monitorare i segnali dagli altri host nel cluster e comunicare con il vCenter Server.
I server host all’interno di un cluster HA comunicano tramite un heartbeat, che è un messaggio periodico che indica che un host sta funzionando come previsto. Se l’host master non riesce a rilevare un segnale di heartbeat da un altro host o da una VM all’interno del cluster, istruisce vSphere HA a intraprendere azioni correttive. Il tipo di azione dipende dal tipo di guasto rilevato, così come dalle preferenze dell’utente. Nel caso di un guasto della VM in cui il server host continua a funzionare, vSphere HA riavvia la VM sull’host originale. Se un intero host fallisce, l’utility riavvia tutte le VM interessate su altri host nel cluster.
L’utility HA può anche riavviare le VM se un host continua a funzionare, ma perde una connessione di rete con il resto del cluster. L’host master può monitorare se quell’host sta ancora comunicando con gli archivi di dati connessi alla rete per rilevare se un host segregato in rete è ancora in esecuzione. Lo storage condiviso, come una storage area network, permette agli host nel cluster di accedere ai file del disco della VM e riavviare la VM, anche se era in esecuzione su un altro server nel cluster.
Come impostare e utilizzare vSphere HA
Il primo passo per impostare vSphere HA è creare un cluster da vSphere Web Client in Create a Cluster e quindi selezionare gli host ESXi e lo storage condiviso per partecipare al cluster. I cluster HA devono contenere almeno due host, ma molte organizzazioni mantengono cluster più grandi che mettono in comune più risorse e possono ospitare più guasti.
Un amministratore può quindi attivare la funzione vSphere HA dal Web Client in Manage > Settings > vSphere HA. Infine, un utente può regolare le impostazioni di configurazione e le preferenze di vSphere HA dal vSphere Web Client.
I requisiti e le best practice diVMware vSphere HA
Gli amministratori possono regolare molte impostazioni HA, compreso il tempo in cui una VM o un host non è disponibile prima che vSphere HA tenti di riavviarlo; il valore predefinito è 120 secondi. Un amministratore può impostare le preferenze di riavvio delle VM, selezionando l’ordine in cui le VM si riavviano nel cluster. Questa impostazione è utile se, per esempio, non c’è abbastanza spazio nel cluster per riavviare tutte le VM fallite. In molti casi, un amministratore assegna una priorità di riavvio più alta alle VM che eseguono applicazioni mission-critical.
Un’organizzazione può anche definire regole di affinità e anti-affinità per limitare dove vengono posizionate determinate VM. Le regole di affinità e anti-affinità impediscono alle VM specificate di riavviarsi su server selezionati o su server che ospitano già altre VM specificate. Queste regole sono utili per garantire che le VM ad alta intensità di CPU non si riavviino sullo stesso host dopo un disastro o per garantire che due copie di un’applicazione ad alta priorità non finiscano sullo stesso host e creino un potenziale singolo punto di errore.