Metriche di utilizzo delle risorse del parco risorse

Questa pagina approfondisce le metriche di utilizzo delle risorse del parco risorse e dei team tramite spiegando come vengono calcolate queste metriche e fornendo suggerimenti per come usare queste metriche per ottimizzare l'uso delle risorse.

Puoi visualizzare queste metriche nelle dashboard seguenti:

Queste metriche descrivono l'efficacia con cui i tuoi cluster utilizzano le risorse disponibili fisicamente che paghi o le risorse allocate dell'hardware on-premise. Puoi usare queste informazioni per comprendere efficacia dell'utilizzo su larga scala, a livello di ambito di parco risorse o team. Questo può ottimizzare le dimensioni dei cluster e l'allocazione delle risorse tra i vari cluster e spazi dei nomi o ottimizzare il modo in cui i team delle applicazioni richiedono e prenotano le risorse.

Usa metriche di utilizzo delle risorse

I seguenti suggerimenti possono aiutarti a utilizzare le metriche della console per identificare e risolvere i problemi:

  • Se l'utilizzo totale di CPU/memoria/disco del parco risorse indica inaspettatamente utilizzo elevato o ridotto degli ultimi sette giorni, controlla sempre corrispondente grafico sull'utilizzo di CPU/memoria/disco per parco risorse per valutare se l'utilizzo imprevisto è costante o causato da picchi di utilizzo.
  • Se Utilizzo superiore di CPU/memoria/disco per cluster indica un valore individuale che si comportano diversamente dagli altri, valuta la possibilità di analizzarli di determinati cluster in modo più dettagliato. Valuta la possibilità di ridimensionare i cluster se possibile.
  • Se Utilizzo superiore di CPU/memoria/disco per spazio dei nomi mostra un errore imprevisto degli ultimi sette giorni, valuta la possibilità di verificare se un carico di lavoro è la causa del picco. Una possibile soluzione potrebbe essere la ridistribuzione carichi di lavoro diversi tra le varie risorse.
  • L'utilizzo di CPU/memoria/disco per parco risorse consente di osservare il rapporto tra le risorse utilizzate e richieste. Una grossa differenza tra i due potrebbe indicare che i team delle applicazioni richiedono e prenotano troppe risorse.

Comprendi le metriche di utilizzo delle risorse

Le seguenti metriche sono fornite nel parco risorse GKE Enterprise e le dashboard di panoramica degli ambiti del team, calcolate utilizzando le informazioni Cloud Monitoring nel tuo parco risorse cluster.

Puoi visualizzare le metriche a livello di parco risorse in GKE Enterprise e nel parco risorse dashboard della panoramica. Le metriche a livello di team sono disponibili Dashboard di panoramica di GKE Enterprise e dei team.

Metriche della CPU

  • Utilizzo totale CPU:
    • Per le metriche a livello di parco risorse, una media di tutti i punti nel tempo per un determinato periodo di tempo in cui è il rapporto tra le risorse allocabili e utilizzate in tutte registrati in un parco risorse.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in a tutti i cluster registrati in un parco risorse. Viene calcolata in base alla node/cpu/allocatable_cores o una metrica di valutazione.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti registrati in un parco risorse. Viene calcolata in base alla container/cpu/core_usage_time o una metrica di valutazione.
    • Per la dashboard di Monitoring del team, una media di tutti i punti tempo per una determinata finestra temporale in cui un momento specifico è un rapporto tra richieste e utilizzate in tutti gli spazi dei nomi associati a un ambito del team.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolata in base alla container/cpu/request_cores o una metrica di valutazione.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti associati a un ambito del team. Calcolata dal container/cpu/core_usage_time o una metrica di valutazione.
  • Utilizzo CPU per parco risorse/team:
    • Per il livello del parco risorse, la relazione tra utilizzato, richiesto e di risorse allocato.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti registrati in un parco risorse. Viene calcolata in base alla container/cpu/core_usage_time o una metrica di valutazione.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Calcolata dal container/cpu/request_cores o una metrica di valutazione.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in a tutti i cluster registrati in un parco risorse. Viene calcolata in base alla node/cpu/allocatable_cores o una metrica di valutazione.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti associati a un ambito del team. Calcolata dal container/cpu/core_usage_time o una metrica di valutazione.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolata in base alla container/cpu/request_cores o una metrica di valutazione.
      • Limite: la quantità massima di CPU disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolata in base alla container/cpu/limit_cores o una metrica di valutazione.
  • Principale utilizzo CPU per cluster: elenco dei cluster ordinato in base alla media di tutti punti nel tempo per un determinato periodo di tempo in cui il momento è un rapporto tra risorse allocabili e utilizzate per un determinato cluster.
    • Allocabile: la quantità di CPU allocata a tutti i nodi in un in un cluster Kubernetes. Viene calcolata in base alla node/cpu/allocatable_cores o una metrica di valutazione.
    • Utilizzata: la quantità di CPU utilizzata da tutti i container in un cluster. Viene calcolata in base alla container/cpu/core_usage_time o una metrica di valutazione.
  • Principale utilizzo CPU per spazio dei nomi: elenco dello spazio dei nomi ordinato in base a una media di tutti i punti nel tempo per un determinato periodo di tempo in cui il momento specifico è un rapporto tra le risorse utilizzate e quelle richieste per uno spazio dei nomi specifico.
    • Usata: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi. Viene calcolata in base alla container/cpu/core_usage_time o una metrica di valutazione.
    • Richiesta: la quantità di CPU richiesta da tutti i container in un nello spazio dei nomi. Viene calcolata in base alla container/cpu/request_cores o una metrica di valutazione.

Metriche di memoria

  • Utilizzo totale della memoria:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti i punti nel tempo per una determinata finestra di tempo in cui point-in-time è il rapporto tra risorse allocabili e utilizzate che appartengono a un parco risorse.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolata dal node/memory/allocatable_byte o una metrica di valutazione.
      • Usata: la quantità di memoria non rimovibile utilizzata da tutte di container in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
    • Per le metriche a livello di team, si fa riferimento a una media di tutti i punti nel tempo per un determinato periodo di tempo in cui un momento specifico è un rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi che appartengono a un ambito di un team.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla container/memory/request_bytes o una metrica di valutazione.
      • Usata: la quantità di memoria non rimovibile utilizzata da tutte container in tutti gli spazi dei nomi associati l'ambito di attività. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
  • Utilizzo della memoria da parte del parco risorse/del team:
    • Per il livello del parco risorse, la relazione tra utilizzato, richiesto e di risorse allocato.
      • Usata: la quantità di memoria non rimovibile utilizzata da tutte di container in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Calcolata dal container/memory/request_bytes o una metrica di valutazione.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolata dal node/memory/allocatable_byte o una metrica di valutazione.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Usata: la quantità di memoria non rimovibile utilizzata da tutte container in tutti gli spazi dei nomi associati l'ambito di attività. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolata in base alla container/memory/request_bytes o una metrica di valutazione.
      • Limite: la quantità massima di memoria disponibile per tutti container in tutti gli spazi dei nomi associati l'ambito di attività. Viene calcolata in base alla container/memory/limit_bytes o una metrica di valutazione.
  • Principale utilizzo della memoria per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo di un determinato periodo di tempo in cui il momento specifico è un rapporto tra risorse allocabili e utilizzate per un determinato cluster.
    • Allocabile: la quantità di memoria allocata a tutti i nodi in una in un cluster Kubernetes. Viene calcolata in base alla node/memory/allocatable_byte o una metrica di valutazione.
    • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in un cluster. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
  • Principale utilizzo della memoria per spazio dei nomi: elenco dello spazio dei nomi ordinato in base a una media. di tutti i punti nel tempo per un determinato periodo di tempo in cui un momento specifico è un rapporto tra le risorse utilizzate e quelle richieste per uno spazio dei nomi specifico.
    • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in uno spazio dei nomi. Viene calcolata in base alla container/memory/used_bytes o una metrica di valutazione.
    • Richiesta: la quantità di memoria richiesta da tutti i container in un nello spazio dei nomi. Viene calcolata in base alla container/memory/request_bytes o una metrica di valutazione.

Metriche del disco

  • Utilizzo totale del disco:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti punti nel tempo per un determinato periodo di tempo in cui il momento è un rapporto tra risorse allocabili e utilizzate in tutti i cluster che appartengono a una flotta.
      • Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato. a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla node/ephemeral_storage/allocatable_bytes o una metrica di valutazione.
      • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte di container in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
    • Per le metriche a livello di team, si fa riferimento a una media di tutti i punti nel tempo di un determinato periodo di tempo in cui un momento specifico è un rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi che appartengono a un ambito di un team.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta. da tutti i container in tutti gli spazi dei nomi associati un ambito. Viene calcolata in base alla container/ephemeral_storage/request_bytes o una metrica di valutazione.
      • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte container in tutti gli spazi dei nomi associati l'ambito di attività. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
  • Utilizzo del disco da parte del parco risorse/del team:
    • Per il livello del parco risorse, la relazione tra utilizzato, richiesto e di risorse allocato.
      • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte di container in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta. da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla container/ephemeral_storage/request_bytes o una metrica di valutazione.
      • Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato. a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolata in base alla node/ephemeral_storage/allocatable_bytes o una metrica di valutazione.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte container in tutti gli spazi dei nomi associati l'ambito di attività. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta. da tutti i container in tutti gli spazi dei nomi associati un ambito. Viene calcolata in base alla container/ephemeral_storage/request_bytes o una metrica di valutazione.
      • Limite: la quantità massima di spazio di archiviazione temporaneo locale disponibile per tutti i container in tutti gli spazi dei nomi che associati a un ambito. Viene calcolata in base alla container/ephemeral_storage/limit_bytes o una metrica di valutazione.
  • Principale utilizzo del disco per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo per un determinato periodo di tempo in cui il momento specifico è un rapporto tra risorse allocabili e utilizzate per un determinato cluster.
    • Allocabile: la quantità di spazio di archiviazione temporaneo locale allocato a per tutti i nodi di un cluster. Viene calcolata in base alla node/ephemeral_storage/allocatable_bytes o una metrica di valutazione.
    • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte dei container in un cluster. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
  • Principale utilizzo del disco per spazio dei nomi: elenco dello spazio dei nomi ordinato in base a una media. di tutti i punti nel tempo per un determinato periodo di tempo in cui un momento specifico è un rapporto tra le risorse utilizzate e quelle richieste per uno spazio dei nomi specifico.
    • Usato: la quantità di spazio di archiviazione temporaneo locale utilizzata da tutte dei container in uno spazio dei nomi. Viene calcolata in base alla container/ephemeral_storage/used_bytes o una metrica di valutazione.
    • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesto dal per tutti i container in uno spazio dei nomi. Viene calcolata in base alla container/ephemeral_storage/request_bytes o una metrica di valutazione.

Distribuzione degli errori per spazio dei nomi (solo a livello di team)

Elenco degli spazi dei nomi ordinato in base al numero più alto di log degli errori in un determinato periodo di tempo finestra. I log vengono raccolti da Cloud Logging.

Il riavvio conteggia la distribuzione per spazio dei nomi (solo a livello di team)

Elenco degli spazi dei nomi ordinato in base al numero più alto di riavvii di container per un determinato finestra temporale. Viene calcolata in base alla container/restart_count o una metrica di valutazione.

Risoluzione dei problemi

Impossibile caricare le metriche per i nuovi cluster

Se hai creato nuovi cluster, a seconda della finestra temporale selezionata, potresti vedere No Data in tutta la dashboard di Monitoring oppure potresti vedere metriche di valutazione. Ad esempio, se hai creato un cluster nell'ultima ora e selezioni finestra temporale di 1 ora o 6 ore, la dashboard potrebbe restituire alcuni per i tuoi carichi di lavoro. Tuttavia, se selezioni una finestra temporale di 1 giorno o potresti vedere No data visualizzato nella dashboard.

Questo perché Cloud Monitoring raccoglie dati in periodi diversi (intervalli) per finestre temporali diverse. Per finestre temporali di 1 ora e 6 ore, i dati vengono raccolti in periodi di 1 minuto. Quindi, se il cluster esiste già per alcuni minuti, vedrai le metriche per queste finestre temporali.

Per le finestre temporali di 1 giorno e 1 settimana, Cloud Monitoring raccoglie i dati in periodi di 1 ora. Se il cluster esiste da meno di un'ora, puoi non vedrai alcun dato per queste finestre temporali.

Se si verifica questo errore, controlla la dashboard una volta trascorso un po' di tempo. a seguito della creazione del nuovo cluster.