Diagnostica dei problemi relativi ai cluster

La funzionalità di controllo di integrità monitora regolarmente l'integrità del piano di controllo del cluster e di diversi componenti critici e ti aiuta a rilevare e diagnosticare potenziali problemi con i cluster.

Se hai bisogno di ulteriore assistenza, contatta l'assistenza clienti Google Cloud.

Problemi rilevati

Il controllo dell'integrità del cluster rileva e ti avvisa dei seguenti problemi in un cluster:

  • Integrità di kube-scheduler sui nodi del piano di controllo: se kube-scheduler non è integro, significa che il cluster ha difficoltà ad assegnare pod ai nodi. Per ulteriori indagini, puoi esaminare il log del pod kube-scheduler.

  • Stato di kube-controller-manager sui nodi del piano di controllo: kube-controller-manager monitora vari controller, come ReplicaSet, Deployment e Namespace, tra gli altri. Se kube-controller-manager è considerato non integro, significa che uno o più dei controller che gestisce potrebbero non funzionare correttamente. Per determinare il problema esatto, puoi esaminare il log del pod kube-controller-manager, che potrebbe fornire maggiori informazioni sui controller malfunzionanti.

  • Capacità del volume radice: il controllo di integrità verifica che la capacità del volume radice di ogni nodo del control plane sia sufficiente. Se la capacità disponibile è inferiore a 512 MB, il controllo di integrità ti avvisa del potenziale rischio di esaurimento dello spazio su disco.

Visualizzare gli eventi di controllo di integrità

Per visualizzare gli avvisi del controllo dell'integrità per un cluster specifico, esegui il seguente comando:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del tuo cluster
  • GOOGLE_CLOUD_LOCATION: il nome della Google Cloud posizione che gestisce il cluster

Ecco un estratto del tipo di output che puoi aspettarti:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

In questo esempio, il messaggio di errore indica che un componente kube-controller-manager non è integro e che la capacità del volume root di un nodo del piano di controllo sta diminuendo.

Passaggi successivi

Se hai bisogno di ulteriore assistenza, contatta l'assistenza clienti Google Cloud.