VMware vSphere HA (High Availability) は VMware の vSphere ソフトウェアに含まれるユーティリティで、代替ホスト サーバー上で故障した仮想マシン (VM) を再起動し、アプリケーション ダウンタイムを短縮できます。
VSphere HA によりサーバー管理者は同じネットワークに物理サーバーをプールし、高可用クラスタと呼ばれる論理グループを作成することができます。 システム クラッシュ、電力供給停止、またはネットワーク障害などのサーバー障害時に、vSphere HA はどの VM がダウンしたかを検出し、クラスター内の別の安定したシステムでそれらを再起動します。 このように、セカンダリ システム上で故障したワークロードを再起動するプロセスをフェイルオーバーと呼びます。
VMware は 2006 年の Virtual Infrastructure 3 で vSphere HA を初めて導入し、この機能の開発とサポートを続けています。
一般に、高可用性とはシステムまたはアプリケーションに対して高い確率で期待通りに機能することを示す用語として使用されます。 企業のデータ センターでは、システムの可用性は 99% を超えることが多く、しばしば 9 で測定されます。
VMware vSphere HA の機能
VMware vSphere HA により、組織は故障した VM を自動的に検出し、人手をかけずに別の物理サーバーで再起動することで可用性を向上させることが可能です。 仮想マシン ディスク (VMDK) ファイルは、HA クラスターを介して接続されたすべての物理サーバーからアクセス可能な共有ストレージ上に保持されるため、異なる物理ハードウェア上でこれらの VM を再起動することができます。
VMware Distributed Resource Scheduler (DRS) は、代替ホスト上で再起動する必要があるワークロードをリバランスするために vSphere HA と共によく使用されます。 vSphere HA と DRS を併用する組織は、再起動した VM がフェイルオーバー ホスト上の他の VM のパフォーマンスに影響を与えないようにすることができます。
VMware Fault Tolerance 機能は、非常に高いレベルの可用性を確保することもできます。 vSphere HA が短い検出時間と起動時間の後に故障した VM を再起動する一方で、Fault Tolerance は保護された VM の冗長コピーを維持し、故障したコピーの操作をシームレスに引き継ぐことができます。
vSphere HA の仕組み
VMware vSphere HA では Fault Domain Manager エージェントというユーティリティを使用して ESXi ホストの可用性を監視したり故障した VM の再起動のために使用しています。 vSphere HA を設定するとき、管理者は高可用性クラスターとして機能するサーバーのグループを定義します。 Fault Domain Managerは、クラスタ内の各ホスト上で実行されます。 クラスタ内の 1 台のホストがマスター ホストとして機能し、他のすべてのホストをスレーブと呼び、クラスタ内の他のホストからの信号を監視して vCenter Server と通信します。 マスターホストは、クラスタ内の他のホストまたは VM からのハートビート信号を検出できない場合、vSphere HA に修正措置を取るように指示します。 アクションの種類は、検出された障害の種類とユーザーの設定に依存します。 ホストサーバが稼働し続けるVM障害の場合、vSphere HAは元のホスト上でVMを再起動します。 ホスト全体が故障した場合、ユーティリティは、クラスタ内の他のホスト上の影響を受けるすべての VM を再起動します。
HA ユーティリティは、ホストが実行を続けているが、クラスタの残りの部分へのネットワーク接続が失われた場合も VM を再起動することができます。 マスター ホストは、そのホストがネットワーク接続されたデータ ストアとまだ通信しているかどうかを監視して、ネットワーク分離されたホストがまだ実行されているかどうかを検出することができます。 ストレージ エリア ネットワークなどの共有ストレージにより、クラスタ内のホストは、VM がクラスタ内の別のサーバーで実行されていたとしても、VM ディスク ファイルにアクセスして VM を再起動できます。
vSphere HA のセットアップと使用方法
vSphere HA を設定する最初のステップは、vSphere Web Client から [Create a Cluster] にクラスタを作成し、クラスに参加する ESXi ホストおよび共有ストレージを選択することです。 HA クラスターには少なくとも 2 台のホストが含まれていなければなりませんが、多くの組織では、より多くのリソースをプールし、複数の障害に対応できるより大きなクラスターを維持しています。
管理者は次に、Web Client の [Manage > Settings > vSphere HA] から vSphere HA 機能を有効にすることができます。 2870>
VMware vSphere HA の要件とベスト プラクティス
管理者は、vSphere HA が再起動を試みるまでに VM またはホストが使用できない時間(デフォルト値は 120 秒)を含む多くの HA 設定を調整することが可能です。 管理者は、VM 再起動プリファレンスを設定し、クラスタ内で VM を再起動する順序を選択することができます。 この設定は、たとえば、クラスタに十分な空き容量がなく、障害が発生したすべての VM を再起動できない場合に有効です。 多くの場合、管理者はミッションクリティカルなアプリケーションを実行している VM に対してより高い再起動優先度を割り当てます。
組織は、特定の VM が配置される場所を制限するために、親和性および反親和性のルールを定義することも可能です。 親和性および反親和性のルールは、選択されたサーバまたは他の指定されたVMをすでにホストしているサーバ上で指定されたVMが再起動するのを防ぎます。 これらのルールは、災害後にCPU負荷の高いVMが同じホスト上で再起動しないようにしたり、優先度の高いアプリケーションの2つのコピーが同じホスト上で終了して潜在的な単一障害点を作らないようにするために有用です
。