Questo documento mostra come creare un insieme di dashboard personalizzate consigliate per il monitoraggio dei cluster creati in Google Distributed Cloud (solo software) per VMware.
Autorizzazioni per la creazione di dashboard
Per creare dashboard, il tuo Account Google deve disporre delle seguenti autorizzazioni:
monitoring.dashboards.create
monitoring.dashboards.delete
monitoring.dashboards.update
Avrai queste autorizzazioni se il tuo account dispone di una delle seguenti autorizzazioni ruoli. Puoi controllare le tue autorizzazioni (nella console Google Cloud):
monitoring.dashboardEditor
monitoring.editor
- Progetto
editor
- Progetto
owner
Inoltre, per utilizzare gcloud
(gcloud CLI) per creare dashboard, il tuo Account Google deve disporre dell'autorizzazione serviceusage.services.use
.
Il tuo account avrà questa autorizzazione se ha uno dei seguenti ruoli:
roles/serviceusage.serviceUsageConsumer
roles/serviceusage.serviceUsageAdmin
roles/owner
roles/editor
- Progetto
editor
- Progetto
owner
Dashboard consigliate
Dopo aver creato un cluster (di amministrazione o utente), una best practice è creare le seguenti dashboard con Cloud Monitoring per consentire al team operativo di monitorare l'integrità del cluster:
- Dashboard dell'uptime del piano di controllo
- Dashboard dello stato del pod
- Dashboard dello stato dei nodi
- Dashboard dello stato di salute delle VM
- Dashboard sull'utilizzo dei nodi
- Dashboard di utilizzo di Anthos
Se il tuo cluster esegue anche nodi del sistema operativo Windows Server, puoi creare le seguenti dashboard per monitorare lo stato dei pod e dei nodi Windows:
- Dashboard dello stato dei nodi Windows
- Dashboard dello stato del pod Windows
Le dashboard vengono create automaticamente durante l'installazione del cluster di amministrazione se Cloud Monitoring è abilitato.
Questa sezione descrive come creare queste dashboard. Per ulteriori informazioni sul processo di creazione della dashboard descritto nelle sezioni seguenti, consulta Gestione delle dashboard tramite API.
Crea una dashboard di uptime del piano di controllo
Il piano di controllo è composto da server API, scheduler, gestore del controller, ecc. Per monitorare lo stato del piano di controllo, crea una dashboard che monitori lo stato di questi componenti.
Scarica la configurazione della dashboard:
control-plane-uptime.json
.Crea una dashboard personalizzata con il file di configurazione eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=control-plane-uptime.json
Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Tempo di attività del piano di controllo GKE on-prem. Il tempo di attività del piano di controllo di ogni cluster utente viene raccolto da spazi dei nomi distinti all'interno del cluster di amministrazione. Il campo namespace_name corrisponde al nome del cluster utente.
Se vuoi, puoi creare criteri di avviso.
Crea una dashboard dello stato dei pod
a creare una dashboard che includa la fase di ogni pod e il riavvio e l'utilizzo delle risorse di ciascun container, segui questi passaggi.
Scarica la configurazione della dashboard:
pod-status.json
.Crea una dashboard personalizzata con il file di configurazione eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=pod-status.json
Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Stato dei pod GKE on-prem.
Se vuoi, puoi creare criteri di avviso.
Crea una dashboard dello stato del nodo
Per creare una dashboard dello stato del nodo per monitorare la condizione del nodo, la CPU, la memoria e l'utilizzo del disco: segui questi passaggi:
Scarica la configurazione della dashboard:
node-status.json
.Crea una dashboard personalizzata con il file di configurazione eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=node-status.json
Nella console Google Cloud, seleziona Monitoring o utilizza seguente pulsante:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Stato del nodo GKE on-prem.
Se vuoi, puoi creare criteri di avviso.
Creare una dashboard dello stato di salute della VM
Una dashboard sullo stato di integrità delle VM monitora gli indicatori di contesa delle risorse di CPU, memoria e disco per le VM nel cluster di amministrazione e nei cluster utente.
Per creare una dashboard sullo stato di integrità della VM:
Assicurati che
stackdriver.disableVsphereResourceMetrics
sia impostato su false. Vedi File di configurazione del cluster utente.Scarica la configurazione della dashboard:
vm-health-status.json
.Crea una dashboard personalizzata con il file di configurazione eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=vm-health-status.json
Nella console Google Cloud, seleziona Monitoring o utilizza seguente pulsante:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Stato di salute delle VM on-premise GKE.
Se vuoi, crea criteri di avviso.
Creare una dashboard sull'utilizzo dei nodi
Una dashboard sull'utilizzo dei nodi mostra il seguente utilizzo nel cluster:
- Rapporto di allocazione della CPU del nodo
- vCPU disponibili per pianificare i carichi di lavoro Kubernetes
- Rapporto di allocazione della memoria del nodo
- Memoria disponibile per pianificare il carico di lavoro k8s
- Rapporto di utilizzo del disco del nodo
Per creare una dashboard di utilizzo dei nodi:
Scarica la configurazione della dashboard:
node-utilization.json
.Utilizza questo file di configurazione per creare una dashboard personalizzata eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=node-utilization.json
Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Utilizzo dei nodi GKE on-prem.
Se vuoi, puoi creare criteri di avviso.
Creare una dashboard di misurazione dell'utilizzo di Anthos
Una dashboard di misurazione dell'utilizzo di Anthos mostra l'utilizzo di CPU e memoria nei cluster in base allo spazio dei nomi e alle etichette dei pod.
Per creare una dashboard di misurazione dell'utilizzo di Anthos:
Scarica la configurazione della dashboard:
anthos-utilization.json
.Utilizza questo file di configurazione per creare una dashboard personalizzata eseguendo il comando seguente comando:
gcloud monitoring dashboards create --config-from-file=anthos-utilization.json
Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:
Seleziona Risorse > Dashboard e visualizza la dashboard denominata Misurazione dell'utilizzo di Anthos.
Se vuoi, puoi creare criteri di avviso.