Mendiagnosis masalah cluster

Fitur health check secara rutin memantau kondisi bidang kontrol cluster dan beberapa komponen penting, serta membantu Anda mendeteksi dan mendiagnosis potensi masalah pada cluster.

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Masalah terdeteksi

Pemeriksa kondisi cluster mendeteksi dan memberi tahu Anda tentang masalah berikut dalam cluster:

  • Kesehatan kube-scheduler pada node bidang kontrol: Jika kube-scheduler tidak sehat, hal ini menunjukkan bahwa cluster mengalami masalah dalam menetapkan Pod ke node. Untuk menyelidiki lebih lanjut, Anda dapat memeriksa log kube-scheduler Pod log.

  • Kondisi kube-controller-manager pada node bidang kontrol: kube-controller-manager memantau berbagai pengontrol, seperti pengontrol ReplicaSet, Deployment, dan Namespace, serta pengontrol lainnya. Jika kube-controller-manager dianggap tidak sehat, hal ini menunjukkan bahwa satu atau beberapa pengontrol yang dikelolanya mungkin tidak berfungsi dengan baik. Untuk menentukan masalah yang tepat, Anda dapat memeriksa log Pod kube-controller-manager, yang mungkin memberikan informasi lebih lanjut tentang pengontrol yang tidak berfungsi.

  • Kapasitas volume root: Pemeriksa kondisi memeriksa kapasitas yang memadai pada volume root setiap node bidang kontrol. Jika kapasitas yang tersedia berada di bawah 512 MB, pemeriksa kondisi akan memberi tahu Anda tentang potensi risiko kehabisan ruang disk.

Melihat peristiwa health check

Untuk melihat pemberitahuan dari pemeriksa kondisi untuk cluster tertentu, jalankan perintah berikut:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Ganti kode berikut:

  • CLUSTER_NAME: nama cluster Anda
  • GOOGLE_CLOUD_LOCATION: nama lokasi Google Cloud yang mengelola cluster

Berikut kutipan jenis output yang akan Anda dapatkan:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

Dalam contoh ini, pesan error menunjukkan bahwa komponen kube-controller-manager tidak berfungsi dengan baik, dan kapasitas pada volume root node bidang kontrol semakin menipis.

Langkah berikutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.