Questa pagina approfondisce le metriche di utilizzo delle risorse del parco risorse e dei team tramite spiegando come vengono calcolate queste metriche e fornendo suggerimenti per come usare queste metriche per ottimizzare l'uso delle risorse.
Puoi visualizzare queste metriche nelle seguenti dashboard:
Queste metriche descrivono l'efficacia con cui i tuoi cluster utilizzano le risorse disponibili fisicamente che paghi o le risorse allocate dell'hardware on-premise. Puoi utilizzare queste informazioni per comprendere l'efficacia dell'utilizzo delle risorse su larga scala, a livello di parco o di team. In questo modo, puoi ottimizzare le dimensioni del cluster e l'allocazione delle risorse tra i cluster e gli spazi dei nomi oppure ottimizzare il modo in cui i team di applicazioni richiedono e prenotano le risorse.
Usa le metriche di utilizzo delle risorse
I seguenti suggerimenti possono aiutarti a utilizzare le metriche nella console per identificare e risolvere i problemi:
- Se l'utilizzo totale della CPU/della memoria/del disco del tuo parco risorse indica un utilizzo inaspettatamente elevato o ridotto negli ultimi sette giorni, controlla sempre il grafico Utilizzo della CPU/della memoria/del disco per parco risorse corrispondente per valutare se l'utilizzo inaspettato è costante o causato da picchi di utilizzo.
- Se Utilizzo superiore di CPU/memoria/disco per cluster indica una singola che si comportano diversamente dagli altri, valuta la possibilità di analizzarli di determinati cluster in modo più dettagliato. Valuta la possibilità di ridimensionare i cluster se possibile.
- Se Utilizzo superiore di CPU/memoria/disco per spazio dei nomi mostra un errore imprevisto degli ultimi sette giorni, valuta la possibilità di verificare se un carico di lavoro è la causa del picco. Una possibile soluzione potrebbe essere quella di ridistribuire i carichi di lavoro tra le risorse.
- Utilizzo CPU/memoria/disco per parco risorse ti consente di osservare il rapporto tra le risorse utilizzate e quelle richieste. Una grossa differenza tra i due potrebbe indicare che i team delle applicazioni richiedono e riservano troppe risorse.
Comprendi le metriche di utilizzo delle risorse
Le seguenti metriche sono fornite nelle dashboard di panoramica dell'ambito di GKE Enterprise, del parco risorse e del team, calcolate utilizzando le informazioni di Cloud Monitoring sui cluster del parco risorse.
Puoi visualizzare le metriche a livello di parco risorse nelle dashboard di panoramica di GKE Enterprise e del parco risorse. Le metriche a livello di team sono disponibili Dashboard di panoramica di GKE Enterprise e dei team.
Metriche della CPU
- Utilizzo CPU totale:
- Per le metriche a livello di parco risorse,
una media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel
tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti
i cluster registrati in un parco risorse.
- Allocabile: la quantità di CPU allocata a tutti i nodi in
a tutti i cluster registrati in un parco risorse. Viene calcolata in base alla
node/cpu/allocatable_cores
in un file di dati. - Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti
registrati in un parco risorse. Viene calcolata in base alla
container/cpu/core_usage_time
in un file di dati.
- Allocabile: la quantità di CPU allocata a tutti i nodi in
a tutti i cluster registrati in un parco risorse. Viene calcolata in base alla
- Per la dashboard di Monitoring del team, una media di tutti i punti
di tempo per una determinata finestra temporale in cui un momento specifico è un rapporto tra
richieste e utilizzate in tutti gli spazi dei nomi
associati a un ambito del team.
- Richiesta: la quantità di CPU richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito del team.
Viene calcolata in base alla
container/cpu/request_cores
in un file di dati. - Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito di gruppo. Calcolata
dalla
metrica
container/cpu/core_usage_time
.
- Richiesta: la quantità di CPU richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito del team.
Viene calcolata in base alla
- Per le metriche a livello di parco risorse,
una media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel
tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti
i cluster registrati in un parco risorse.
- Utilizzo della CPU per flotta/team:
- Per il livello del parco risorse, la relazione tra utilizzato, richiesto e
alle risorse allocate,
- Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti
registrati in un parco risorse. Viene calcolata in base alla
container/cpu/core_usage_time
in un file di dati. - Richiesta: la quantità di CPU richiesta da tutti i container
in tutti i cluster registrati a un parco risorse. Calcolato
dal
container/cpu/request_cores
in un file di dati. - Allocabile: la quantità di CPU allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica
node/cpu/allocatable_cores
.
- Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti
registrati in un parco risorse. Viene calcolata in base alla
- A livello di team, la relazione tra il limite di risorse e
le risorse utilizzate e richieste.
- Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti
associati a un ambito del team. Calcolato
dal
container/cpu/core_usage_time
in un file di dati. - Richiesta: la quantità di CPU richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito del team.
Viene calcolata in base alla
container/cpu/request_cores
in un file di dati. - Limite: la quantità massima di CPU disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito del team.
Viene calcolata in base alla
container/cpu/limit_cores
in un file di dati.
- Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti
associati a un ambito del team. Calcolato
dal
- Per il livello del parco risorse, la relazione tra utilizzato, richiesto e
alle risorse allocate,
- Utilizzo CPU principale per cluster: elenco di cluster ordinato in base alla media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
- Allocabile: la quantità di CPU allocata a tutti i nodi di un
cluster. Calcolata in base alla metrica
node/cpu/allocatable_cores
. - Utilizzata: la quantità di CPU utilizzata da tutti i container in un cluster.
Calcolata in base alla metrica
container/cpu/core_usage_time
.
- Allocabile: la quantità di CPU allocata a tutti i nodi di un
cluster. Calcolata in base alla metrica
- Utilizzo massimo della CPU per spazio dei nomi: elenco di spazi dei nomi ordinati in base alla media di tutti i punti in tempo per un determinato intervallo di tempo, dove il punto in tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
- Usata: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi.
Calcolata in base alla metrica
container/cpu/core_usage_time
. - Richiesta: la quantità di CPU richiesta da tutti i container in un
nello spazio dei nomi. Calcolata in base alla metrica
container/cpu/request_cores
.
- Usata: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi.
Calcolata in base alla metrica
Metriche di memoria
- Utilizzo memoria totale:
- Per le metriche a livello di parco risorse,
si riferisce a una media di tutti i punti nel tempo per una data finestra di tempo in cui
point-in-time è il rapporto tra risorse allocabili e utilizzate
che appartengono a un parco risorse.
- Allocabile: la quantità di memoria allocata a tutti i nodi
in tutti i cluster registrati in un parco risorse. Calcolato
dal
node/memory/allocatable_byte
in un file di dati. - Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
container/memory/used_bytes
.
- Allocabile: la quantità di memoria allocata a tutti i nodi
in tutti i cluster registrati in un parco risorse. Calcolato
dal
- Per le metriche a livello di team, si fa riferimento a una media di
tutti i punti nel tempo di un determinato periodo di tempo in cui un momento specifico è un
rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi
che appartengono a un ambito di un team.
- Richiesta: la quantità di memoria richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito.
Calcolata in base alla metrica
container/memory/request_bytes
. - Usata: la quantità di memoria non rimovibile utilizzata da tutte
container in tutti gli spazi dei nomi associati
l'ambito di attività. Calcolata in base alla metrica
container/memory/used_bytes
.
- Richiesta: la quantità di memoria richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito.
Calcolata in base alla metrica
- Per le metriche a livello di parco risorse,
si riferisce a una media di tutti i punti nel tempo per una data finestra di tempo in cui
point-in-time è il rapporto tra risorse allocabili e utilizzate
che appartengono a un parco risorse.
- Utilizzo della memoria per parco risorse/team:
- A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
container/memory/used_bytes
. - Richiesta: la quantità di memoria richiesta da tutti i container
in tutti i cluster registrati a un parco risorse. Calcolato
dal
container/memory/request_bytes
in un file di dati. - Allocabile: la quantità di memoria allocata a tutti i nodi
in tutti i cluster registrati in un parco risorse. Calcolato
dal
node/memory/allocatable_byte
in un file di dati.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
- A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
container/memory/used_bytes
in un file di dati. - Richiesta: la quantità di memoria richiesta da tutti i container
in tutti gli spazi dei nomi associati a un ambito.
Viene calcolata in base alla
container/memory/request_bytes
in un file di dati. - Limite: la quantità massima di memoria disponibile per tutti
container in tutti gli spazi dei nomi associati
l'ambito di attività. Calcolata in base alla metrica
container/memory/limit_bytes
.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
- A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
- Utilizzo massimo della memoria per cluster: elenco di cluster ordinato in base alla media di tutti i punti in tempo per una determinata finestra temporale, dove il punto in tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
- Allocabile: la quantità di memoria allocata a tutti i nodi di un
cluster. Calcolata in base alla metrica
node/memory/allocatable_byte
. - Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container
in un cluster. Calcolata in base alla metrica
container/memory/used_bytes
.
- Allocabile: la quantità di memoria allocata a tutti i nodi di un
cluster. Calcolata in base alla metrica
- Utilizzo massimo della memoria per spazio dei nomi: elenco di spazi dei nomi ordinati in base a una media di tutti i punti nel tempo per una determinata finestra temporale, dove il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container
in uno spazio dei nomi. Viene calcolata in base alla
container/memory/used_bytes
in un file di dati. - Richiesta: la quantità di memoria richiesta da tutti i container in uno
spazio dei nomi. Calcolata in base alla metrica
container/memory/request_bytes
.
- Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container
in uno spazio dei nomi. Viene calcolata in base alla
Metriche dei dischi
- Utilizzo totale del disco:
- Per le metriche a livello di parco risorse, si riferisce a una media di tutti
punti nel tempo per un determinato periodo di tempo in cui il momento è un rapporto
tra risorse allocabili e utilizzate in tutti i cluster che appartengono
a una flotta.
- Allocabile: la quantità di spazio di archiviazione temporanea locale allocata
a tutti i nodi di tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
node/ephemeral_storage/allocatable_bytes
. - Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container di tutti i cluster registrati a un parco.
Calcolata in base alla metrica
container/ephemeral_storage/used_bytes
.
- Allocabile: la quantità di spazio di archiviazione temporanea locale allocata
a tutti i nodi di tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
- Per le metriche a livello di team, si fa riferimento a una media di
tutti i punti nel tempo di un determinato periodo di tempo in cui un momento specifico è un
rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi
che appartengono a un ambito di un team.
- Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
container/ephemeral_storage/request_bytes
in un file di dati. - Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica
container/ephemeral_storage/used_bytes
.
- Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
- Per le metriche a livello di parco risorse, si riferisce a una media di tutti
punti nel tempo per un determinato periodo di tempo in cui il momento è un rapporto
tra risorse allocabili e utilizzate in tutti i cluster che appartengono
a una flotta.
- Utilizzo del disco per parco risorse/team:
- A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container di tutti i cluster registrati a un parco.
Calcolata in base alla metrica
container/ephemeral_storage/used_bytes
. - Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta.
da tutti i container in tutti i cluster registrati in un
parco risorse. Viene calcolata in base alla
container/ephemeral_storage/request_bytes
in un file di dati. - Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato.
a tutti i nodi in tutti i cluster registrati in un parco risorse.
Calcolata in base alla metrica
node/ephemeral_storage/allocatable_bytes
.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container di tutti i cluster registrati a un parco.
Calcolata in base alla metrica
- A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
container/ephemeral_storage/used_bytes
in un file di dati. - Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
container/ephemeral_storage/request_bytes
in un file di dati. - Limite: la quantità massima di spazio di archiviazione temporanea locale disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
container/ephemeral_storage/limit_bytes
in un file di dati.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla
- A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
- Principale utilizzo del disco per cluster: elenco dei cluster ordinato in base a una media di
tutti i punti nel tempo di un determinato periodo di tempo in cui il momento specifico è un rapporto
tra risorse allocabili e utilizzate per un determinato cluster.
- Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato a
per tutti i nodi di un cluster. Viene calcolata in base alla
node/ephemeral_storage/allocatable_bytes
in un file di dati. - Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i contenitori di un cluster. Calcolata in base alla metrica
container/ephemeral_storage/used_bytes
.
- Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato a
per tutti i nodi di un cluster. Viene calcolata in base alla
- Principale utilizzo del disco per spazio dei nomi: elenco dello spazio dei nomi ordinato in base a una media.
di tutti i punti nel tempo per un determinato periodo di tempo in cui un momento specifico è un rapporto
tra le risorse utilizzate e quelle richieste per uno spazio dei nomi specifico.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in uno spazio dei nomi. Viene calcolata in base alla
container/ephemeral_storage/used_bytes
in un file di dati. - Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesto da
per tutti i container in uno spazio dei nomi. Calcolata in base alla metrica
container/ephemeral_storage/request_bytes
.
- Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in uno spazio dei nomi. Viene calcolata in base alla
Distribuzione degli errori per spazio dei nomi (solo a livello di team)
Elenco degli spazi dei nomi ordinato in base al numero più alto di log degli errori in un determinato periodo di tempo finestra. I log vengono raccolti da Cloud Logging.
Distribuzione dei conteggi dei riavvii per spazio dei nomi (solo a livello di team)
Elenco di spazi dei nomi ordinati in base al numero più alto di riavvii di container per un determinato intervallo di tempo. Calcolata dalla metrica container/restart_count.
Risoluzione dei problemi
Le metriche non vengono caricate per i nuovi cluster
Se hai creato nuovi cluster, a seconda dell'intervallo di tempo selezionato, potresti visualizzare No Data
nella dashboard Monitoraggio o le metriche. Ad esempio, se hai creato un cluster nell'ultima ora e selezioni
finestra temporale di 1 ora o 6 ore, la dashboard potrebbe restituire alcuni
per i tuoi carichi di lavoro. Tuttavia, se selezioni un intervallo di tempo di 1 giorno o più, potresti visualizzare No data
in tutta la dashboard.
Questo perché Cloud Monitoring raccoglie i dati in periodi diversi (intervalli) per finestre temporali diverse. Per finestre temporali di 1 ora e 6 ore, i dati vengono raccolti in periodi di 1 minuto. Quindi, se il cluster esiste già per alcuni minuti, vedrai le metriche relative a queste finestre temporali.
Per finestre temporali di 1 giorno e 1 settimana, Cloud Monitoring raccoglie i dati in periodi di 1 ora. Se il cluster esiste da meno di un'ora, potresti non vedere dati per queste finestre temporali.
Se si verifica questo errore, controlla la dashboard dopo un po' di tempo dalla creazione del nuovo cluster.