Memecahkan masalah cluster yang terdaftar di GKE On-Prem API

Halaman ini menunjukkan cara menyelidiki masalah saat membuat cluster pengguna Google Distributed Cloud di konsol Google Cloud.

GKE On-Prem API adalah API yang dihosting Google Cloud yang memungkinkan Anda mengelola siklus proses cluster on-premise menggunakan Terraform dan alat Google Cloud standar. GKE On-Prem API berjalan di infrastruktur Google Cloud. Terraform, konsol Google Cloud, dan Google Cloud CLI adalah klien API, dan ketiganya menggunakan API untuk membuat, mengupdate, mengupgrade, dan menghapus cluster di pusat data Anda. Jika Anda membuat cluster menggunakan klien standar, cluster akan terdaftar di GKE On-Prem API, yang berarti Anda dapat menggunakan klien standar untuk mengelola siklus proses cluster (dengan beberapa pengecualian).

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Cluster admin tidak ditampilkan di daftar drop-down Dasar-dasar cluster

Cluster admin harus terdaftar ke armada sebelum Anda dapat membuat cluster pengguna di konsol Google Cloud. Jika Anda tidak melihat cluster admin di daftar drop-down pada bagian Dasar-dasar cluster di konsol Google Cloud, cluster admin tidak terdaftar, atau terdaftar menggunakan perintah gcloud container fleet memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Periksa status pendaftaran:

  • Di konsol Google Cloud, buka halaman Kubernetes Engine > Clusters, lalu pilih project Google Cloud yang sama tempat Anda mencoba membuat cluster pengguna.

    Buka halaman cluster GKE

    • Jika cluster admin tidak ditampilkan dalam daftar, lihat Mendaftarkan cluster admin.

    • Jika cluster admin ditampilkan dalam daftar, perilaku ini menunjukkan bahwa cluster didaftarkan menggunakan perintah gcloud container hub memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Untuk memperbaiki masalah pendaftaran, selesaikan langkah-langkah berikut:

  1. Hapus keanggotaan fleet cluster admin.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: nama cluster admin.
    • PROJECT_ID: ID project host fleet Anda. Ini adalah project yang Anda pilih saat mencoba membuat cluster pengguna di konsol Google Cloud.
  2. Ikuti langkah-langkah di artikel Mendaftarkan cluster admin untuk mendaftarkan ulang cluster.

Error pembuatan cluster

Bagian ini menjelaskan beberapa error yang terjadi selama pembuatan cluster di Konsol Google Cloud.

Error resource sudah ada

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Pesan error ini menunjukkan bahwa nama cluster sudah digunakan.

Salah satu solusi untuk memperbaiki masalah ini adalah dengan menghapus dan membuat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan nama lain yang tidak bertentangan dengan cluster yang ada.

Error grup anti-afinitas

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Aturan anti-afinitas VMware Distributed Resource Scheduler (DRS) memerlukan setidaknya 3 host fisik di lingkungan vSphere Anda. Untuk memperbaiki masalah ini, nonaktifkan Anti-affinity groups di bagian Features pada halaman Cluster details untuk cluster Anda, sebagai berikut:

  1. Di konsol Google Cloud, buka halaman cluster GKE.

    Buka halaman cluster GKE

  2. Pilih project Google Cloud tempat cluster pengguna berada.

  3. Di daftar cluster, klik nama cluster, lalu klik Lihat detail di panel Details.

  4. Di bagian Features, klik Edit.

  5. Hapus centang pada Aktifkan grup Anti-afinitas, lalu klik Selesai.

  6. Konsol Google Cloud menampilkan Status cluster: perubahan sedang berlangsung. Klik Tampilkan Detail untuk melihat Kondisi status resource dan Pesan status.

Error alamat IP yang bertentangan

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan yang berikut ini:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Anda tidak dapat mengedit kolom seperti Control plane VIP dan Ingress VIP di bagian Load balancer pada halaman Cluster details di konsol Google Cloud. Untuk memperbaiki alamat IP yang mengalami konflik, hapus dan buat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan alamat IP yang tidak bertentangan dengan cluster yang ada.

Menghapus cluster yang tidak responsif

Cluster dapat berada dalam status tidak sehat karena berbagai alasan, seperti:

  • Masalah konektivitas dengan Connect Agent atau lingkungan lokal.
  • Cluster admin untuk cluster pengguna telah dihapus, atau ada masalah konektivitas antara cluster admin dan pengguna.
  • VM cluster dihapus sebelum menghapus cluster.

Jika konsol tidak dapat menghapus cluster, gunakan perintah gcloud CLI untuk menghapus resource Google Cloud dari cluster yang tidak sehat. Jika Anda belum mengupdate gcloud CLI baru-baru ini, jalankan perintah berikut untuk mengupdate komponen:

gcloud components update

Selanjutnya, hapus resource Google Cloud.

Cluster pengguna

  1. Hapus cluster pengguna:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ganti kode berikut:

    • USER_CLUSTER_NAME: Nama cluster pengguna yang akan dihapus.

    • PROJECT_ID: ID project tempat cluster didaftarkan.

    • REGION: Lokasi Google Cloud yang terkait dengan cluster pengguna. Lokasi ditampilkan di konsol.

      Flag --force menghapus cluster yang memiliki node pool. Tanpa tanda --force, Anda harus menghapus kumpulan node terlebih dahulu, lalu menghapus cluster.

      Flag --allow-missing memungkinkan perintah dilanjutkan jika cluster tidak ditemukan.

      Flag --ignore-errors menghapus resource Google Cloud saat cluster admin dan pengguna tidak dapat dijangkau. Beberapa resource F5 atau vSphere mungkin tertinggal. Lihat Membersihkan resource untuk mengetahui informasi tentang cara membersihkan resource yang tersisa.

      Perintah ini akan menghapus cluster jika ada dan menghapus resource GKE On-Prem API dan langganan fleet dari Google Cloud.

  2. Pastikan resource GKE On-Prem API telah dihapus:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Jika Anda menetapkan --location=-, artinya Anda mencantumkan semua cluster di semua wilayah. Jika Anda perlu mempersempit cakupan daftar, tetapkan --location ke region tertentu.

  3. Pastikan resource langganan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster admin

  1. Jika Anda mendaftarkan cluster admin di GKE On-Prem API, batalkan pendaftarannya:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Ganti kode berikut:

    • ADMIN_CLUSTER_NAME: Nama cluster admin.
    • PROJECT_ID: ID project host fleet.
    • REGION: Region Google Cloud.

    Flag --allow-missing membatalkan pendaftaran cluster jika keanggotaan fleet tidak ditemukan.

    Perintah ini akan menghapus resource GKE On-Prem API dari Google Cloud.

  2. Hapus cluster dari fleet:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Perintah ini akan menghapus resource keanggotaan fleet dari Google Cloud.

  3. Pastikan resource GKE On-Prem API telah dihapus:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Jika Anda menetapkan --location=-, artinya Anda mencantumkan semua cluster di semua wilayah. Jika Anda perlu mempersempit cakupan daftar, tetapkan --location ke region tertentu.

  4. Pastikan resource langganan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Langkah selanjutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.