Memecahkan masalah pada cluster yang terdaftar di GKE On-Prem API

Halaman ini menunjukkan cara menyelidiki masalah saat membuat GKE di cluster pengguna VMware di Konsol Google Cloud.

Cluster admin tidak ditampilkan di menu drop-down Dasar-dasar cluster

Cluster admin harus terdaftar ke fleet sebelum Anda dapat membuat cluster pengguna di Konsol Google Cloud. Jika Anda tidak melihat cluster admin pada menu drop-down di bagian Dasar-dasar cluster di Konsol Google Cloud, berarti cluster admin tersebut tidak terdaftar atau terdaftar menggunakan perintah gcloud container hub memberships register.

Periksa status pendaftaran:

  • Di konsol Google Cloud, buka halaman Anthos > Clusters, lalu pilih project Google Cloud yang sama tempat Anda mencoba membuat cluster pengguna.

    Buka halaman cluster GKE Enterprise

    • Jika cluster admin tidak ditampilkan dalam daftar, baca bagian Mendaftarkan cluster admin.

    • Jika cluster admin ditampilkan dalam daftar, ini menunjukkan bahwa cluster tersebut terdaftar menggunakan perintah gcloud container hub memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Untuk memperbaiki masalah pendaftaran:

  1. Hapus keanggotaan fleet cluster admin.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: nama cluster admin.
    • PROJECT_ID: ID project host armada Anda. Ini adalah project yang Anda pilih saat mencoba membuat cluster pengguna di Konsol Google Cloud.
  2. Ikuti langkah-langkah dalam artikel Mendaftarkan cluster admin untuk mendaftarkan ulang cluster.

Error pembuatan cluster

Bagian ini menjelaskan beberapa error yang terjadi selama pembuatan cluster di Konsol Google Cloud.

Error resource sudah ada

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

Resource 'projects/1234567890/locations/europe-west1/vmwareClusters/user-cluster1'
already exists
Request ID: 129290123128705826

Pesan error ini menunjukkan bahwa nama cluster sudah digunakan.

Satu solusi untuk mengatasi masalah ini:

  1. Hapus cluster.

  2. Buat lagi cluster dengan nama lain yang tidak bertentangan dengan cluster yang ada.

Error grup anti-afinitas

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Aturan anti-afinitas VMware Distributed Resource Scheduler (DRS) memerlukan setidaknya 3 host fisik di lingkungan vSphere Anda. Untuk memperbaiki masalah ini, nonaktifkan Grup anti-afinitas di bagian Features di halaman Cluster details untuk cluster Anda, sebagai berikut:

  1. Di konsol Google Cloud, buka halaman cluster GKE Enterprise.

    Buka halaman cluster GKE Enterprise

  2. Pilih project Google Cloud tempat cluster pengguna berada.

  3. Dalam daftar cluster, klik nama cluster, lalu klik View details pada panel Details.

  4. Di bagian Fitur, klik Edit.

  5. Hapus Aktifkan Grup anti-afinitas, lalu klik Selesai.

  6. Konsol Google Cloud akan menampilkan Cluster status: changes in progress. Klik Show Details untuk melihat Resource status condition dan Status messages.

Error alamat IP bentrok

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Saat ini, Anda tidak dapat mengedit kolom seperti Control bidang VIP dan Ingress VIP di bagian Load balancer pada halaman Cluster details di Google Cloud Console. Untuk memperbaiki alamat IP yang bentrok:

  1. Hapus cluster.

  2. Buat cluster lagi dengan alamat IP yang tidak bertentangan dengan cluster yang ada.

Hapus cluster yang tidak responsif

Cluster dapat berada dalam status tidak responsif karena berbagai alasan, seperti:

  • Masalah konektivitas dengan Connect Agent atau lingkungan lokal.

  • Cluster admin untuk cluster pengguna telah dihapus, atau ada masalah konektivitas antara admin dan cluster pengguna.

  • VM cluster telah dihapus sebelum cluster dihapus.

Jika konsol tidak dapat menghapus cluster, gunakan perintah gcloud CLI untuk menghapus resource Google Cloud dari cluster yang tidak responsif. Jika Anda belum mengupdate gcloud CLI baru-baru ini, jalankan perintah berikut untuk mengupdate komponen:

gcloud components update

Berikutnya, hapus resource Google Cloud.

Cluster pengguna

  1. Hapus cluster pengguna:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ganti kode berikut:

    • USER_CLUSTER_NAME: Nama cluster pengguna yang akan dihapus.

    • PROJECT_ID: ID project tempat cluster didaftarkan.

    • REGION: Lokasi Google Cloud yang terkait dengan cluster pengguna. Lokasi akan ditampilkan di konsol.

      Flag --force memungkinkan Anda menghapus cluster yang memiliki kumpulan node. Tanpa flag --force, Anda harus menghapus kumpulan node terlebih dahulu, lalu menghapus cluster.

      Flag --allow-missing memungkinkan perintah dilanjutkan jika cluster tidak ditemukan.

      --ignore-errors menghapus resource Google Cloud saat admin dan cluster pengguna tidak dapat dijangkau. Beberapa resource F5 atau vSphere mungkin tertinggal. Lihat Membersihkan resource untuk mengetahui informasi tentang cara membersihkan resource yang tersisa.

      Perintah ini akan menghapus cluster jika ada, serta menghapus GKE On-Prem API dan resource keanggotaan fleet dari Google Cloud.

  2. Pastikan bahwa resource GKE On-Prem API telah dihapus:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Jika Anda menetapkan --location=-, berarti Anda mencantumkan semua cluster di semua region. Jika Anda perlu menentukan cakupan di bawah daftar, tetapkan --location ke region tertentu.

  3. Pastikan bahwa resource keanggotaan perangkat telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster admin

  1. Jika Anda mendaftarkan cluster admin di GKE On-Prem API, batalkan pendaftarannya:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing

    Ganti kode berikut:

    • ADMIN_CLUSTER_NAME: Nama cluster admin.
    • PROJECT_ID: ID project host fleet.
    • REGION: Region Google Cloud.

    Tanda --allow-missing membatalkan pendaftaran cluster jika keanggotaan fleet tidak ditemukan.

    Perintah ini menghapus resource GKE On-Prem API dari Google Cloud.

  2. Hapus cluster dari fleet:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Perintah ini menghapus resource keanggotaan fleet dari Google Cloud.

  3. Pastikan bahwa resource GKE On-Prem API telah dihapus:

gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID

Jika Anda menetapkan --location=-, berarti mencantumkan semua cluster di semua region. Jika Anda perlu menentukan cakupan di bawah daftar, tetapkan --location ke region tertentu.

  1. Pastikan bahwa resource keanggotaan perangkat telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID