高可用性と障害復旧

このページでは、GKE on VMware の高可用性オプションについて説明します。

コア機能

高可用性ユーザークラスタを備えた GKE on VMware アーキテクチャ — 高可用性ユーザークラスタがある GKE on VMware アーキテクチャ（クリックして拡大）

GKE on VMware には、管理クラスタと 1 つ以上のユーザークラスタが含まれています。

管理クラスタは、ユーザークラスタのライフサイクル（ユーザークラスタの作成、更新、アップグレード、削除など）を管理します。管理クラスタでは、管理マスターが管理ワーカーノードを管理します。管理ワーカーノードには、ユーザーマスター（管理対象ユーザークラスタのコントロールプレーンを実行するワーカーノード）とアドオンノード（アドオンコンポーネントを実行して管理クラスタの機能をサポートするノード）が含まれています。

ユーザークラスタごとに、管理クラスタの 1 つの非 HA ノードまたは 3 つの HA ノードでコントロールプレーンが実行されます。コントロールプレーンには、Kubernetes API サーバー、Kubernetes スケジューラ、Kubernetes コントローラマネージャー、ユーザークラスタの重要なコントローラが含まれています。

ユーザークラスタのコントロールプレーンの可用性は、ワークロードの作成、スケールアップとスケールダウン、終了などのワークロードオペレーションにとってきわめて重要です。つまり、コントロールプレーンが停止しても、実行中のワークロードは影響を受けませんが、既存のワークロードはコントロールプレーンを失うため、Kubernetes API サーバーによる管理機能を利用できなくなります。

コンテナ化されたワークロードとサービスは、ユーザークラスタのワーカーノードにデプロイされます。複数のワーカーノード間でスケジュールされた冗長 Pod でアプリケーションをデプロイされていれば、1 つのワーカーノードがアプリケーションの可用性に重大な影響を及ぼすことはありません。

高可用性の有効化

vSphere と GKE on VMware では、高可用性（HA）に寄与する多くの機能が利用できます。

vSphere HA と vMotion

GKE on VMware クラスタをホストする vCenter クラスタで、次の 2 つの機能を有効にすることをおすすめします。

これらの機能によって、ESXi ホストで発生する障害に対して可用性と復元性が向上します。

vCenter HA は、クラスタとして構成された複数の ESXi ホストを使用して、仮想マシンで稼働するアプリケーションに対し、停止からの迅速な復旧と費用対効果の高い HA を可能にします。追加のホストを使用して vCenter クラスタをプロビジョニングし、Host Failure Response を Restart VMs に設定して vSphere HA ホストモニタリングを有効にすることをおすすめします。そうすると、ESXi ホストで障害が発生した場合、VM は他の利用可能なホストで自動的に再起動されます。

vMotion を使用すると、ダウンタイムなしで ESXi ホスト間での VM のライブマイグレーションが可能になります。計画されたホストメンテナンスに対しては、vMotion ライブマイグレーションを使用してアプリケーションのダウンタイムを完全に回避し、ビジネスの継続性を確保できます。

管理クラスタ

GKE on VMware は、高可用性（HA）管理クラスタの作成をサポートしています。HA 管理クラスタには、コントロールプレーンコンポーネントを実行する 3 つのノードがあります。要件と制限事項については、高可用性管理クラスタをご覧ください。

なお、管理クラスタコントロールプレーンが使用不能になっても、既存のユーザークラスタ機能やユーザークラスタで実行中のワークロードには影響しません。

管理クラスタには 2 つのアドオンノードがあります。1 つが停止しても、もう一方で管理クラスタの操作を実行できます。冗長性を確保するため、GKE on VMware では kube-dns などの重要なアドオンサービスが両方のアドオンノードに分散されます。

管理クラスタの構成ファイルで、true を antiAffinityGroups.enabled に設定すると、GKE on VMware は、アドオン用に vSphere DRS アンチアフィニティルールを自動的に作成します。これにより、HA 用の 2 つの物理ホストにそれぞれが分散されます。

ユーザークラスタ

ユーザークラスタの構成ファイルで masterNode.replicas を 3 に設定すると、ユーザークラスタの HA を有効にできます。ユーザークラスタでControlplane V2 が有効になっている場合（推奨）は、3 つのコントロールプレーンノードがユーザークラスタで実行されます。以前の HA kubeception ユーザークラスタは、管理クラスタ内の 3 つのコントロールプレーンノードを実行します。各コントロールプレーンノードは、etcd レプリカも実行します。1 つのコントロールプレーンと etcd クォーラムが存在する限り、ユーザークラスタは引き続き機能します。etcd のクォーラムでは、3 つの etcd レプリカのうち 2 つが機能している必要があります。

管理クラスタの構成ファイルで、true を antiAffinityGroups.enabled に設定した場合、GKE on VMware は、ユーザークラスタ管理プレーンを実行する 3 つのノード用に、vSphere DRS 反アフィニティルールを自動作成します。これにより、それらの VM は 3 つの物理ホストに分散されます。

また、GKE on VMware は、ユーザークラスタ内のワーカーノード用に vSphere DRS アンチアフィニティルールも作成します。これにより、これらのノードが少なくとも 3 つの物理ホストに分散されます。ノード数に基づいて、ユーザークラスタノードプールごとに複数の DRS 反アフィニティルールが使用されます。これにより、ホストの数が、ユーザークラスタのノードプール内の VM の数より少ない場合でも、ワーカーノードが実行先のホストを見つけることができます。vCenter クラスタに追加の物理ホストを含めることをおすすめします。また、ホストが使用不能になった場合に、DRS が VM の反アフィニティルールに違反することなく、使用可能な他のホスト上の VM を自動的に再起動できるよう、DRS が完全に自動化されるように構成します。

GKE on VMware は、特別なノードラベル onprem.gke.io/failure-domain-name を保持しています。このラベルの値は、基になる ESXi ホスト名に設定されます。高可用性を必要とするユーザーアプリケーションでは、topologyKey としてこのラベルを使用して podAntiAffinity ルールを設定し、アプリケーション Pod が複数の VM と物理ホストに分散されるようにします。異なるデータストアと特別なノードラベルを使用してユーザークラスタに複数のノードプールを構成することもできます。同様に、特別なノードラベルで podAntiAffinity ルールを topologyKey として設定すると、データストアで障害が発生した場合に高可用性を実現できます。

ユーザーワークロードに対して高可用性を確保するには、ユーザークラスタが nodePools.replicas の配下に十分な数のレプリカを持つようにします。これにより、実行中のユーザークラスタワーカーノードの数が適切な状態で維持されます。

管理クラスタとユーザークラスタに別々のデータストアを使用して、障害を隔離できます。

ロードバランサ

高可用性を確保するために使用できるロードバランサには次の 2 種類があります。

バンドル型 MetalLB ロードバランサ

バンドル型 MetalLB ロードバランサでは、enableLoadBalancer: true に複数のノードを使用することで HA を実現します。

MetalLB はサービスをロードバランサノードに分散しますが、単一のサービスの場合、そのサービスのすべてのトラフィックを処理するリーダーノードは 1 つだけです。

クラスタのアップグレード中は、ロードバランサノードがアップグレードされると、ダウンタイムが発生することがあります。ロードバランサノードの数が増えると、MetalLB のフェイルオーバーの中断期間が長くなります。5 ノード未満であれば、中断は 10 秒以内です。

バンドル型 Seesaw ロードバランサ

バンドル型 Seesaw ロードバランサの場合、クラスタ構成ファイルで loadBalancer.seesaw.enableHA を true に設定することで HA を有効にできます。また、ロードバランサのポートグループで、MAC ラーニング、偽装転送、プロミスキャスモードを組み合わせて使用する必要があります。

HA では、アクティブパッシブモードで 2 つのロードバランサが設定されています。アクティブロードバランサに問題がある場合、トラフィックはパッシブロードバランサにフェイルオーバーします。

ロードバランサのアップグレード中はダウンタイムが発生します。ロードバランサで HA が有効になっている場合、ダウンタイムは最大 2 秒です。

統合型 F5 BIG-IP ロードバランサ

F5 BIG-IP プラットフォームでは、アプリケーションのセキュリティ、可用性、パフォーマンスを向上させるさまざまな Service が利用できます。GKE on VMware の場合、BIG-IP は外部アクセスと L3 / 4 負荷分散 Service を提供します。

詳細については、BIG-IP の高可用性をご覧ください。

障害復旧に複数のクラスタを使用する

複数の vCenter または GKE Enterprise プラットフォームにまたがって複数のクラスタにアプリケーションをデプロイすると、全体の可用性が向上し、サービス停止時の中断の影響を制限できます。

この設定では、新しいクラスタを設定するのではなく、セカンダリデータセンターにある既存の GKE Enterprise クラスタを使用して障害復旧を行います。手順の概要は次のとおりです。

セカンダリデータセンターに別の管理クラスタとユーザークラスタを作成します。このマルチクラスタアーキテクチャでは、各データセンターに 2 つの管理クラスタを用意し、各管理クラスタでユーザークラスタを実行する必要があります。
セカンダリユーザークラスタには最小限のワーカーノード（3 つ）があり、ホットスタンバイ（常時稼働）の状態です。
アプリケーションのデプロイは、Config Sync を使用して 2 つの vCenter 間でレプリケートできます。または、既存のアプリケーション DevOps（CI / CD、Spinnaker）ツールチェーンの使用をおすすめします。
大規模障害が発生した場合、ユーザークラスタをそのノード数に変更できます。
また、クラスタ間でのトラフィックをセカンダリデータセンターに転送するために、DNS のスイッチオーバーも必要です。