Memecahkan masalah cluster yang didaftarkan di GKE On-Prem API

Halaman ini menunjukkan cara menyelidiki masalah saat membuat cluster pengguna Google Distributed Cloud Virtual for VMware di Konsol Google Cloud.

GKE On-Prem API adalah API yang dihosting Google Cloud dan dapat Anda gunakan untuk mengelola siklus proses cluster lokal menggunakan Terraform dan alat Google Cloud standar. GKE On-Prem API berjalan di infrastruktur Google Cloud. Terraform, konsol Google Cloud, dan Google Cloud CLI adalah klien API ini, dan mereka menggunakan API untuk membuat, mengupdate, mengupgrade, dan menghapus cluster di pusat data Anda. Jika Anda membuat cluster menggunakan klien standar, cluster tersebut terdaftar di GKE On-Prem API, yang berarti Anda dapat menggunakan klien standar untuk mengelola siklus proses cluster (dengan beberapa pengecualian).

Jika Anda memerlukan bantuan lainnya, hubungi Cloud Customer Care.

Cluster admin tidak ditampilkan di menu drop-down Dasar-dasar cluster

Cluster admin harus didaftarkan ke fleet sebelum Anda dapat membuat cluster pengguna di Konsol Google Cloud. Jika Anda tidak melihat cluster admin di menu drop-down di bagian Dasar-dasar cluster di Konsol Google Cloud, berarti cluster admin tidak terdaftar atau didaftarkan menggunakan perintah gcloud container fleet memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Periksa status pendaftaran:

  • Di konsol Google Cloud, buka halaman Anthos > Clusters, lalu pilih project Google Cloud yang sama tempat Anda mencoba membuat cluster pengguna.

    Buka halaman cluster GKE Enterprise

    • Jika cluster admin tidak ditampilkan dalam daftar, baca bagian Mendaftarkan cluster admin.

    • Jika cluster admin ditampilkan dalam daftar, perilaku ini menunjukkan bahwa cluster tersebut telah didaftarkan menggunakan perintah gcloud container hub memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Untuk memperbaiki masalah pendaftaran, selesaikan langkah-langkah berikut:

  1. Hapus keanggotaan fleet cluster admin.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: nama cluster admin.
    • PROJECT_ID: ID project host fleet. Ini adalah project yang Anda pilih saat mencoba membuat cluster pengguna di Konsol Google Cloud.
  2. Ikuti langkah-langkah di bagian Mendaftarkan cluster admin untuk mendaftarkan ulang cluster.

Error pembuatan cluster

Bagian ini menjelaskan beberapa error yang terjadi selama pembuatan cluster di Konsol Google Cloud.

Error resource sudah ada

Pembuatan cluster pengguna gagal dengan pesan error seperti berikut:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Pesan error ini menunjukkan bahwa nama cluster sudah digunakan.

Salah satu solusi untuk memperbaikinya adalah dengan menghapus dan membuat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan nama lain yang tidak bertentangan dengan cluster yang ada.

Error kelompok anti-afinitas

Pembuatan cluster pengguna gagal dengan pesan error seperti berikut:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Aturan anti-afinitas VMware Distributed Resource Scheduler (DRS) memerlukan setidaknya 3 host fisik di lingkungan vSphere Anda. Untuk memperbaiki masalah ini, nonaktifkan Grup anti-afinitas di bagian Features di halaman Cluster details untuk cluster Anda, sebagai berikut:

  1. Di konsol Google Cloud, buka halaman cluster GKE Enterprise.

    Buka halaman cluster GKE Enterprise

  2. Pilih project Google Cloud tempat cluster pengguna berada.

  3. Di daftar cluster, klik nama cluster, lalu klik View details di panel Details.

  4. Di bagian Fitur, klik Edit.

  5. Hapus centang Aktifkan Grup anti-afinitas, lalu klik Selesai.

  6. Konsol Google Cloud akan menampilkan Cluster status: changes in progress. Klik Show Details untuk melihat Resource status condition dan Status messages.

Error alamat IP yang bertentangan

Pembuatan cluster pengguna gagal dengan pesan error seperti berikut:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Anda tidak dapat mengedit kolom seperti Control bidang VIP dan Ingress VIP di bagian Load balancer pada halaman Cluster details di Google Cloud Console. Untuk memperbaiki alamat IP yang bentrok, hapus dan buat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan alamat IP yang tidak bertentangan dengan cluster yang ada.

Hapus cluster yang tidak responsif

Cluster dapat berada dalam status tidak responsif karena berbagai alasan, seperti:

  • Masalah konektivitas dengan Agen Connect atau lingkungan lokal.
  • Cluster admin untuk cluster pengguna telah dihapus, atau ada masalah konektivitas antara admin dan cluster pengguna.
  • VM cluster telah dihapus sebelum cluster dihapus.

Jika konsol tidak dapat menghapus cluster, gunakan perintah gcloud CLI untuk menghapus resource Google Cloud dari cluster yang tidak responsif. Jika Anda belum mengupdate gcloud CLI baru-baru ini, jalankan perintah berikut untuk mengupdate komponen:

gcloud components update

Selanjutnya, hapus resource Google Cloud.

Cluster pengguna

  1. Hapus cluster pengguna:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ganti kode berikut:

    • USER_CLUSTER_NAME: Nama cluster pengguna yang akan dihapus.

    • PROJECT_ID: ID project tempat cluster didaftarkan.

    • REGION: Lokasi Google Cloud yang terkait dengan cluster pengguna. Lokasi ditampilkan di konsol.

      Flag --force menghapus cluster yang memiliki kumpulan node. Tanpa flag --force, Anda harus menghapus kumpulan node terlebih dahulu, lalu menghapus cluster.

      Flag --allow-missing memungkinkan perintah dilanjutkan jika cluster tidak ditemukan.

      Flag --ignore-errors menghapus resource Google Cloud saat cluster admin dan pengguna tidak dapat dijangkau. Beberapa resource F5 atau vSphere mungkin tertinggal. Lihat Membersihkan resource untuk mengetahui informasi tentang cara membersihkan resource yang tersisa.

      Perintah ini akan menghapus cluster jika ada, serta menghapus GKE On-Prem API dan resource keanggotaan fleet dari Google Cloud.

  2. Pastikan resource GKE On-Prem API telah dihapus:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Jika Anda menetapkan --location=-, artinya Anda mencantumkan semua cluster di semua region. Jika Anda perlu menentukan cakupan dalam daftar, tetapkan --location ke region tertentu.

  3. Konfirmasi bahwa resource keanggotaan perangkat telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster admin

  1. Jika Anda mendaftarkan cluster admin di GKE On-Prem API, batalkan pendaftaran cluster tersebut:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing
    

    Ganti kode berikut:

    • ADMIN_CLUSTER_NAME: Nama cluster admin.
    • PROJECT_ID: ID project host fleet.
    • REGION: Region Google Cloud.

    Flag --allow-missing akan membatalkan pendaftaran cluster jika keanggotaan fleet tidak ditemukan.

    Perintah ini menghapus resource GKE On-Prem API dari Google Cloud.

  2. Hapus cluster dari fleet:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Perintah ini menghapus resource keanggotaan fleet dari Google Cloud.

  3. Pastikan resource GKE On-Prem API telah dihapus:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Jika Anda menetapkan --location=-, artinya Anda mencantumkan semua cluster di semua region. Jika Anda perlu menentukan cakupan dalam daftar, tetapkan --location ke region tertentu.

  4. Konfirmasi bahwa resource keanggotaan perangkat telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Langkah selanjutnya

Jika Anda memerlukan bantuan lainnya, hubungi Cloud Customer Care.