GKE On-Prem API に登録されているクラスタのトラブルシューティング

このページでは、Google Cloud コンソールで Google Distributed Cloud Virtual for VMware のユーザー クラスタを作成する際の問題を調査する方法について説明します。

GKE On-Prem API は、Google Cloud がホストする API で、Terraform や標準の Google Cloud ツールを使用して、オンプレミス クラスタのライフサイクルを管理できます。GKE On-Prem API は、Google Cloud のインフラストラクチャで動作します。Terraform、Google Cloud コンソール、Google Cloud CLI は API のクライアントであり、API を使用してデータセンターのクラスタを作成、更新、アップグレード、削除します。標準クライアントを使用してクラスタを作成した場合、クラスタは GKE On-Prem API に登録されます。つまり、標準クライアントを使用してクラスタのライフサイクルを管理できます。(ただし、いくつか例外があります)。

さらにサポートを必要とされる場合は、Cloud カスタマーケアにお問い合わせください。

管理クラスタが [クラスタの基本] プルダウン リストに表示されない

Google Cloud コンソールでユーザー クラスタを作成する前に、管理クラスタをフリートに登録する必要があります。Google Cloud コンソールの [クラスタの基本] セクションのプルダウン リストに管理クラスタが表示されない場合、管理クラスタが登録されていないか、gcloud container fleet memberships register コマンドを使用して登録されたかのいずれかです。 この gcloud コマンドで管理クラスタは正しく登録されません。

登録ステータスを確認します。

  • Google Cloud コンソールで [Anthos] > [クラスタ] ページに移動し、ユーザー クラスタの作成を試みたのと同じ Google Cloud プロジェクトを選択します。

    GKE Enterprise の [クラスタ] ページに移動

    • 管理クラスタがリストに表示されない場合は、管理クラスタを登録するをご覧ください。

    • 管理クラスタがリストに表示される場合、この動作はクラスタが gcloud container hub memberships register コマンドを使用して登録されたことを示します。この gcloud コマンドで管理クラスタは正しく登録されません。

登録の問題を解決するには、次の手順を行います。

  1. 管理クラスタのフリート メンバーシップを削除します。

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: 管理クラスタの名前。
    • PROJECT_ID: フリート ホスト プロジェクトの ID。これは、Google Cloud コンソールでユーザー クラスタを作成しようとしたときに選択したプロジェクトです。
  2. 管理クラスタを登録するの手順に沿ってクラスタを再登録します。

クラスタ作成のエラー

このセクションでは、Google Cloud コンソールでのクラスタ作成中に発生するエラーについて説明します。

リソースがすでに存在するエラー

ユーザー クラスタの作成が、次のようなエラー メッセージで失敗します。

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

このエラー メッセージは、そのクラスタ名がすでに使用されていることを示します。

この問題を解決する 1 つの方法として、クラスタを削除して再作成します。

  1. クラスタを削除する
  2. 既存のクラスタと競合しない別の名前でクラスタをもう一度作成する

反アフィニティ グループエラー

ユーザー クラスタの作成が、次のようなエラー メッセージで失敗します。

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

VMware Distributed Resource Scheduler(DRS)の反アフィニティ ルールでは、vSphere 環境に少なくとも 3 つの物理ホストが必要です。問題を解決するには、クラスタの [クラスタの詳細] ページの [機能] セクションで [アンチアフィニティ グループ] を無効にします。次のとおりです。

  1. Google Cloud コンソールで、[GKE Enterprise クラスタ] ページに移動します。

    GKE Enterprise の [クラスタ] ページに移動

  2. ユーザー クラスタが存在する Google Cloud プロジェクトを選択します。

  3. クラスタリストでクラスタの名前をクリックし、[詳細] パネルの [詳細を表示] をクリックします。

  4. [機能] セクションで、 [編集] をクリックします。

  5. [反アフィニティ グループを有効にする] をオフにして、[完了] をクリックします。

  6. Google Cloud コンソールに「クラスタのステータス: 変更中」と表示されます。[詳細を表示] をクリックすると、[リソース ステータス条件] と [ステータス メッセージ] が表示されます。

IP アドレスの競合エラー

ユーザー クラスタの作成が、次のようなエラー メッセージで失敗します。

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Google Cloud コンソールの [クラスタの詳細] ページの [ロードバランサ] セクションにある、[コントロール プレーン VIP] や [Ingress VIP] などのフィールドは編集できません。競合する IP アドレスを解決するには、クラスタを削除して再作成します。

  1. クラスタを削除する
  2. 既存のクラスタと競合しない IP アドレスを使用して、もう一度クラスタを作成する

正常でないクラスタを削除する

クラスタは、次のようなさまざまな理由により、正常でない状態になる可能性があります。

  • Connect Agent またはオンプレミス環境に関する接続の問題。
  • ユーザー クラスタの管理クラスタが削除されたか、管理クラスタとユーザー クラスタの間に発生する接続の問題。
  • クラスタを削除する前に、クラスタの VM が削除された。

コンソールでクラスタを削除できない場合は、gcloud CLI コマンドを使用して、正常でないクラスタから Google Cloud リソースを削除します。gcloud CLI を最近更新していない場合は、次のコマンドを実行してコンポーネントを更新します。

gcloud components update

次に、Google Cloud リソースを削除します。

ユーザー クラスタ

  1. ユーザー クラスタを削除します。

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    次のように置き換えます。

    • USER_CLUSTER_NAME: 削除するユーザー クラスタの名前。

    • PROJECT_ID: クラスタが登録されているプロジェクトの ID。

    • REGION: ユーザー クラスタに関連付けられた Google Cloud のロケーション。このロケーションはコンソールに表示されます。

      --force フラグを指定すると、ノードプールを持つクラスタが削除されます。--force フラグを使用せずに、まず ノードプールを削除 してから、クラスタを削除する必要があります。

      --allow-missing フラグを使用すると、クラスタが見つからない場合にコマンドを続行できます。

      --ignore-errors フラグは、管理クラスタとユーザー クラスタに到達できない場合に Google Cloud リソースを削除します。 F5 または vSphere の一部のリソースが残る可能性があります。残存リソースのクリーンアップについては、リソースのクリーンアップをご覧ください。

      このコマンドは、クラスタが存在する場合にクラスタを削除し、Google Cloud から GKE On-Prem API リソースとフリート メンバーシップ リソースを両方とも削除します。

  2. GKE On-Prem API リソースが削除されたことを確認します。

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    --location=- と設定すると、すべてのリージョンのクラスタがすべて一覧表示されます。リストを絞り込む必要がある場合は、--location特定のリージョンに設定します。

  3. フリート メンバーシップ リソースが削除されたことを確認します。

    gcloud container fleet memberships list \
      --project=PROJECT_ID

管理クラスタ

  1. GKE On-Prem API に管理クラスタを登録した場合は、登録を解除します。

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing
    

    次のように置き換えます。

    • ADMIN_CLUSTER_NAME: 管理クラスタの名前。
    • PROJECT_ID: フリート ホスト プロジェクトの ID。
    • REGION: Google Cloud リージョン。

    --allow-missing フラグは、フリートのメンバーシップが見つからない場合にクラスタの登録を解除します。

    このコマンドは、Google Cloud から GKE On-Prem API リソースを削除します。

  2. フリートからクラスタを削除します。

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    このコマンドは、Google Cloud からフリート メンバーシップ リソースを削除します。

  3. GKE On-Prem API リソースが削除されたことを確認します。

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    --location=- と設定すると、すべてのリージョンのクラスタがすべて一覧表示されます。リストを絞り込む必要がある場合は、--location特定のリージョンに設定します。

  4. フリート メンバーシップ リソースが削除されたことを確認します。

    gcloud container fleet memberships list \
      --project=PROJECT_ID

次のステップ

さらにサポートが必要な場合は、Cloud カスタマーケアにお問い合わせください。