Controllo di integrità per GKE su AWS

La funzionalità di controllo di integrità monitora regolarmente l'integrità del piano di controllo del cluster e di diversi componenti critici, consentendoti di rilevare potenziali problemi relativi ai cluster.

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.

Sono stati rilevati dei problemi

Il controllo di integrità del cluster rileva e ti avvisa dei seguenti problemi in un cluster:

  • Integrità di kube-scheduler sui nodi del piano di controllo: se kube-scheduler non è integro, significa che il cluster ha problemi ad assegnare pod ai nodi. Per indagare ulteriormente, puoi esaminare il log del pod kube-scheduler.

  • kube-controller-manager Integrità dei nodi del piano di controllo: kube-controller-manager monitora vari controller, tra cui i controller ReplicaSet, Deployment e Spazio dei nomi. Se kube-controller-manager è considerato non integro, significa che uno o più controller che gestisce potrebbero non funzionare correttamente. Per determinare il problema preciso, puoi esaminare il log del pod kube-controller-manager, che potrebbe fornire ulteriori informazioni sui controller che non funzionano correttamente.

  • Capacità del volume root: il controllo di integrità verifica che ci sia capacità sufficiente sul volume radice di ciascun nodo del piano di controllo. Se la capacità disponibile scende al di sotto di 512 MB, il controllo di integrità segnala il potenziale rischio di esaurire lo spazio su disco.

Visualizzazione degli eventi del controllo di integrità

Per visualizzare gli avvisi del controllo di integrità per un cluster specifico, esegui questo comando:

gcloud container aws clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del cluster
  • GOOGLE_CLOUD_LOCATION: il nome della località Google Cloud che gestisce il cluster

Ecco un estratto del tipo di output:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

In questo esempio, il messaggio di errore indica che un componente kube-controller-manager non è integro e che la capacità sul volume principale del nodo del piano di controllo è in esaurimento.

Passaggi successivi

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.