La funzionalità di controllo di integrità monitora regolarmente l'integrità del piano di controllo del cluster e di diversi componenti critici, consentendoti di rilevare potenziali problemi relativi ai cluster.
Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.Sono stati rilevati dei problemi
Il controllo di integrità del cluster rileva e ti avvisa dei seguenti problemi in un cluster:
Integrità di
kube-scheduler
sui nodi del piano di controllo: sekube-scheduler
non è integro, significa che il cluster ha problemi ad assegnare pod ai nodi. Per indagare ulteriormente, puoi esaminare il log del podkube-scheduler
.kube-controller-manager
Integrità dei nodi del piano di controllo:kube-controller-manager
monitora vari controller, tra cui i controller ReplicaSet, Deployment e Spazio dei nomi. Sekube-controller-manager
è considerato non integro, significa che uno o più controller che gestisce potrebbero non funzionare correttamente. Per determinare il problema preciso, puoi esaminare il log del podkube-controller-manager
, che potrebbe fornire ulteriori informazioni sui controller che non funzionano correttamente.Capacità del volume root: il controllo di integrità verifica che ci sia capacità sufficiente sul volume radice di ciascun nodo del piano di controllo. Se la capacità disponibile scende al di sotto di 512 MB, il controllo di integrità segnala il potenziale rischio di esaurire lo spazio su disco.
Visualizzazione degli eventi del controllo di integrità
Per visualizzare gli avvisi del controllo di integrità per un cluster specifico, esegui questo comando:
gcloud container aws clusters describe CLUSTER_NAME \
--location GOOGLE_CLOUD_LOCATION
Sostituisci quanto segue:
CLUSTER_NAME
: il nome del clusterGOOGLE_CLOUD_LOCATION
: il nome della località Google Cloud che gestisce il cluster
Ecco un estratto del tipo di output:
{ "name": "some-cluster-name", "description": "test-cluster", ... "errors": [ { "message": "Replica (replica-name)": kube-controller-manager is unhealthy" }, { "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left" } ] ... }
In questo esempio, il messaggio di errore indica che un componente kube-controller-manager
non è integro e che la capacità sul volume principale del nodo del piano di controllo è in esaurimento.