Mendiagnosis masalah cluster

Fitur health check memantau secara rutin kondisi bidang kontrol cluster dan beberapa komponen penting, serta membantu Anda mendeteksi dan mendiagnosis potensi masalah pada cluster Anda.

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Masalah terdeteksi

Pemeriksa kesehatan cluster mendeteksi dan memberi tahu Anda tentang masalah berikut di cluster:

  • Health kube-scheduler pada node bidang kontrol: Jika kube-scheduler tidak responsif, hal ini menunjukkan bahwa cluster mengalami masalah saat menetapkan Pod ke node. Untuk menyelidiki lebih lanjut, Anda dapat memeriksa log Pod kube-scheduler.

  • Kondisi kube-controller-manager pada node bidang kontrol: kube-controller-manager memantau berbagai pengontrol, seperti pengontrol ReplicaSet, Deployment, dan Namespace. Jika kube-controller-manager dianggap tidak responsif, hal ini menunjukkan bahwa satu atau beberapa pengontrol yang dikelolanya mungkin tidak berfungsi dengan benar. Untuk menentukan masalah sebenarnya, Anda dapat memeriksa log Pod kube-controller-manager, yang mungkin memberikan informasi lebih lanjut tentang pengontrol yang gagal.

  • Kapasitas volume root: Health checker memeriksa apakah ada kapasitas yang memadai pada volume root setiap node bidang kontrol. Jika kapasitas yang tersedia turun di bawah 512 MB, health checker akan memberi tahu Anda tentang potensi risiko kehabisan ruang disk.

Melihat peristiwa health check

Agar dapat melihat pemberitahuan dari health checker untuk cluster tertentu, jalankan perintah berikut:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Ganti kode berikut:

  • CLUSTER_NAME: nama cluster Anda
  • GOOGLE_CLOUD_LOCATION: nama lokasi Google Cloud yang mengelola cluster

Berikut adalah kutipan jenis output yang dapat Anda harapkan:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

Dalam contoh ini, pesan error menunjukkan bahwa komponen kube-controller-manager tidak responsif, dan kapasitas pada volume root node bidang kontrol menipis.

Langkah selanjutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.