Produk yang dijelaskan dalam dokumentasi ini, GKE di Azure, kini dalam mode pemeliharaan dan akan dihentikan pada 17 Maret 2027.

Halaman ini diterjemahkan oleh Cloud Translation API.

Mendiagnosis masalah cluster

Fitur pemeriksaan kondisi secara rutin memantau kondisi bidang kontrol cluster dan beberapa komponen penting, serta membantu Anda mendeteksi dan mendiagnosis potensi masalah pada cluster.

Jika Anda memerlukan bantuan tambahan, hubungi Layanan Pelanggan Cloud.

Masalah terdeteksi

Pemeriksa kondisi cluster mendeteksi dan memberi tahu Anda tentang masalah berikut dalam cluster:

Kesehatan kube-scheduler pada node bidang kontrol: Jika kube-scheduler tidak sehat, hal ini menunjukkan bahwa cluster mengalami masalah dalam menetapkan Pod ke node. Untuk menyelidiki lebih lanjut, Anda dapat memeriksa log kube-scheduler Pod.
Kondisi kube-controller-manager pada node bidang kontrol: kube-controller-manager memantau berbagai pengontrol, seperti pengontrol ReplicaSet, Deployment, dan Namespace, serta pengontrol lainnya. Jika kube-controller-manager dianggap tidak berfungsi dengan baik, hal ini menunjukkan bahwa satu atau beberapa pengontrol yang dikelolanya mungkin tidak berfungsi dengan baik. Untuk menentukan masalah yang tepat, Anda dapat memeriksa log Pod kube-controller-manager, yang mungkin memberikan informasi lebih lanjut tentang pengontrol yang tidak berfungsi.
Kapasitas volume root: Pemeriksa kondisi memeriksa kapasitas yang memadai pada volume root setiap node bidang kontrol. Jika kapasitas yang tersedia berada di bawah 512 MB, pemeriksa kondisi akan memberi tahu Anda tentang potensi risiko kehabisan ruang disk.

Melihat peristiwa health check

Untuk melihat pemberitahuan dari pemeriksa kondisi untuk cluster tertentu, jalankan perintah berikut:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Ganti kode berikut:

CLUSTER_NAME: nama cluster Anda
GOOGLE_CLOUD_LOCATION: nama lokasi Google Cloud yang mengelola cluster

Berikut kutipan jenis output yang akan Anda dapatkan:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

Dalam contoh ini, pesan error menunjukkan bahwa komponen kube-controller-manager tidak berfungsi dengan baik, dan kapasitas pada volume root node control plane semakin rendah.

Langkah berikutnya

Jika Anda memerlukan bantuan tambahan, hubungi Layanan Pelanggan Cloud.