VMware vSphere HA (High Availability) é um utilitário incluído no software vSphere da VMware que pode reiniciar máquinas virtuais com falha (VMs) em servidores host alternativos para reduzir o tempo de inatividade de aplicativos.

VSphere HA permite que um administrador de servidor agrupe servidores físicos na mesma rede em um grupo lógico chamado cluster de alta disponibilidade. Durante uma falha do servidor, como uma falha do sistema, interrupção de energia ou falha de rede, o vSphere HA detecta quais VMs estão paradas e as reinicia em outro sistema estável dentro do cluster. Este processo de reiniciar cargas de trabalho com falhas em sistemas secundários é chamado failover.

VMware introduziu o vSphere HA na Infraestrutura Virtual 3 pela primeira vez em 2006 e continuou a desenvolver e suportar o recurso.

Usado em geral, alta disponibilidade é um termo usado para descrever sistemas ou aplicações que estão disponíveis — funcionando como esperado — uma alta porcentagem do tempo. Nos centros de dados corporativos, a disponibilidade do sistema geralmente excede 99% e é frequentemente medida em noves.

VMware vSphere HA recursos

VMware vSphere HA permite que as organizações melhorem a disponibilidade detectando automaticamente VMs com falhas e reiniciando-as em diferentes servidores físicos sem o envolvimento humano manual. A capacidade de reiniciar essas VMs em diferentes hardwares físicos é possível porque os arquivos do Virtual Machine Disk (VMDK) são mantidos em armazenamento compartilhado, acessível a todos os servidores físicos conectados via cluster HA.

VMware Distributed Resource Scheduler (DRS) é freqüentemente usado em conjunto com o vSphere HA para reequilibrar as cargas de trabalho que devem ser reiniciadas em hosts alternativos. Uma organização que usa o vSphere HA e o DRS juntos pode garantir que as VMs reiniciadas não afetem o desempenho de outras VMs no host failover.

O recurso VMware Fault Tolerance também pode garantir níveis muito altos de disponibilidade. Enquanto o vSphere HA reinicia as VMs com falha após um curto tempo de detecção e inicialização, o Fault Tolerance mantém uma cópia redundante da VM protegida que pode assumir perfeitamente as operações da cópia com falha.

Como o vSphere HA funciona

VMware vSphere HA usa um utilitário chamado agente Fault Domain Manager para monitorar a disponibilidade do host ESXi e para reiniciar as VMs com falha. Ao configurar o vSphere HA, um administrador define um grupo de servidores para servir como um cluster de alta disponibilidade. O Fault Domain Manager é executado em cada host dentro do cluster. Um host no cluster serve como host mestre — todos os outros hosts são chamados de escravos — para monitorar sinais de outros hosts no cluster e se comunicar com o vCenter Server.

Servidores host dentro de um cluster HA se comunicam através de um heartbeat, que é uma mensagem periódica que indica que um host está rodando como esperado. Se o host mestre não detectar um sinal de batimento cardíaco de outro host ou VM dentro do cluster, ele instrui o vSphere HA a tomar ações corretivas. O tipo de ação depende do tipo de falha detectada, assim como as preferências do usuário. No caso de uma falha da VM na qual o servidor host continua a funcionar, o vSphere HA reinicia a VM no host original. Se uma máquina inteira falhar, o utilitário reinicia todas as VMs afetadas em outras máquinas no cluster.

O utilitário HA também pode reiniciar as VMs se uma máquina continuar rodando, mas perder uma conexão de rede para o resto do cluster. O host mestre pode monitorar se esse host ainda está se comunicando com os armazéns de dados conectados à rede para detectar se um host segregado pela rede ainda está rodando. O armazenamento compartilhado, como uma rede de área de armazenamento, permite que as máquinas no cluster acessem arquivos de disco VM e reiniciem a VM, mesmo que ela estivesse rodando em outro servidor no cluster.

Como configurar e usar o vSphere HA

O primeiro passo para configurar o vSphere HA é criar um cluster a partir do vSphere Web Client em Create a Cluster e então selecionar máquinas ESXi e armazenamento compartilhado para participar do cluster. Os clusters HA devem conter pelo menos dois hosts, mas muitas organizações mantêm clusters maiores que reúnem mais recursos e podem acomodar múltiplas falhas.

Um administrador pode então ativar o recurso vSphere HA do Cliente Web em Gerenciar > Configurações > vSphere HA. Finalmente, um usuário pode ajustar as configurações e preferências do vSphere HA do Cliente Web vSphere.

Requisitos e melhores práticas do vSphere HA do VMware vSphere

Administradores podem ajustar muitas configurações de HA, incluindo quanto tempo um VM ou host está indisponível antes que o vSphere HA tente reiniciá-lo; o valor padrão é 120 segundos. Um administrador pode definir as preferências de reinicialização da VM, selecionando a ordem em que as VMs reiniciam no cluster. Esta configuração é útil se, por exemplo, não houver espaço suficiente no cluster para reiniciar todas as VMs que falharam. Em muitos casos, um administrador atribui uma maior prioridade de reinicialização às VMs que executam aplicações de missão crítica.

Uma organização também pode definir regras de afinidade e antiafinidade para restringir onde certas VMs são colocadas. As regras de afinidade e antiafinidade impedem que as VMs especificadas sejam reiniciadas em servidores selecionados ou em servidores que já hospedam outras VMs especificadas. Essas regras são úteis para garantir que as VMs com uso intensivo de CPU não reinicializem no mesmo host após um desastre ou para garantir que duas cópias de um aplicativo de alta prioridade não acabem no mesmo host e criem um potencial ponto único de falha.

Deixe uma resposta

O seu endereço de email não será publicado.