Metriche di utilizzo delle risorse del parco risorse

Questa pagina fornisce informazioni più dettagliate sulle metriche di utilizzo delle risorse del parco risorse e dei team, spiegando come vengono calcolate queste metriche e fornendo suggerimenti su come utilizzarle per ottimizzare l'utilizzo delle risorse.

Puoi visualizzare queste metriche nelle seguenti dashboard:

Queste metriche descrivono l'efficacia con cui i tuoi cluster stanno utilizzando le risorse fisicamente disponibili che paghi o le risorse allocate su hardware on-premise. Puoi utilizzare queste informazioni per comprendere l'efficacia dell'utilizzo delle risorse su larga scala, a livello di parco risorse o team. Questo può aiutarti a ottimizzare le dimensioni del cluster e l'allocazione delle risorse in cluster e spazi dei nomi o a ottimizzare il modo in cui i team delle applicazioni richiedono e prenotano le risorse.

Usa metriche di utilizzo delle risorse

I seguenti suggerimenti possono aiutarti a utilizzare le metriche nella console per identificare e risolvere i problemi:

  • Se l'utilizzo totale di CPU/memoria/disco del parco risorse indica un utilizzo imprevisto, elevato o ridotto negli ultimi sette giorni, controlla sempre il grafico corrispondente dell'utilizzo di CPU/memoria/disco per parco risorse per valutare se l'utilizzo imprevisto è costante o causato da picchi di utilizzo.
  • Se Utilizzo massimo di CPU/memoria/disco per cluster indica singoli cluster che si comportano in modo diverso rispetto agli altri, valuta la possibilità di analizzare quei cluster specifici in modo più approfondito. Valuta la possibilità di ridimensionare i cluster, se possibile.
  • Se l'utilizzo massimo di CPU/memoria/disco per spazio dei nomi mostra un picco imprevisto negli ultimi sette giorni, valuta la possibilità di verificare se il picco è causato da un carico di lavoro specifico. Una possibile soluzione potrebbe essere ridistribuire i carichi di lavoro tra le risorse.
  • L'utilizzo di CPU/memoria/disco per parco risorse consente di osservare il rapporto tra le risorse utilizzate e le risorse richieste. Una grande differenza tra i due potrebbe significare che i team applicativi richiedono e prenotano troppe risorse.

Informazioni sulle metriche di utilizzo delle risorse

Le seguenti metriche sono fornite nelle dashboard di panoramica dell'ambito di GKE Enterprise, del parco risorse e dell'ambito del team, calcolate utilizzando le informazioni di Cloud Monitoring sui cluster del tuo parco risorse.

Puoi visualizzare le metriche a livello di parco risorse nelle dashboard di panoramica di GKE Enterprise e del parco risorse. Le metriche a livello di team sono disponibili nelle dashboard di GKE Enterprise e di panoramica dei team.

Metriche della CPU

  • Utilizzo totale CPU:
    • Per le metriche a livello di parco risorse, una media di tutti i punti nel tempo per un determinato periodo di tempo, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate in tutti i cluster registrati in un parco risorse.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/cpu/allocatable_cores.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/cpu/core_usage_time.
    • Per la dashboard Monitoring del team, una media di tutti i punti nel tempo per un determinato periodo di tempo, in cui il punto temporale è un rapporto tra le risorse richieste e quelle utilizzate in tutti gli spazi dei nomi associati a un ambito del team.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolato dalla metrica container/cpu/request_cores.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolato dalla metrica container/cpu/core_usage_time.
  • Utilizzo CPU per parco risorse/team:
    • A livello di parco risorse, la relazione tra risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/cpu/request_cores.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/cpu/allocatable_cores.
    • A livello di team, la relazione tra il limite delle risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolato dalla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolato dalla metrica container/cpu/request_cores.
      • Limite: la quantità massima di CPU disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Viene calcolato dalla metrica container/cpu/limit_cores.
  • Utilizzo massimo della CPU per cluster: elenco di cluster ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate per un determinato cluster.
  • Utilizzo CPU massimo per spazio dei nomi: elenco di spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse utilizzate e le risorse richieste per un determinato spazio dei nomi.
    • Utilizzata: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi. Viene calcolato dalla metrica container/cpu/core_usage_time.
    • Richiesta: la quantità di CPU richiesta da tutti i container in uno spazio dei nomi. Viene calcolato dalla metrica container/cpu/request_cores.

Metriche di memoria

  • Utilizzo totale memoria:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti i punti nel tempo per un determinato periodo di tempo, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/memory/allocatable_byte.
      • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/memory/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti nel tempo per una determinata finestra temporale in cui il punto temporale è un rapporto tra le risorse richieste e quelle utilizzate in tutti gli spazi dei nomi che appartengono a un ambito del team.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/memory/request_bytes.
      • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/memory/used_bytes.
  • Utilizzo della memoria per parco risorse/team:
    • A livello di parco risorse, la relazione tra risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/memory/request_bytes.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/memory/allocatable_byte.
    • A livello di team, la relazione tra il limite delle risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/memory/request_bytes.
      • Limite: la quantità massima di memoria disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/memory/limit_bytes.
  • Utilizzo massimo della memoria per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate per un determinato cluster.
    • Allocabile: la quantità di memoria allocata a tutti i nodi in un cluster. Viene calcolato dalla metrica node/memory/allocatable_byte.
    • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in un cluster. Viene calcolato dalla metrica container/memory/used_bytes.
  • Utilizzo massimo della memoria per spazio dei nomi: elenco di spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse utilizzate e le risorse richieste per un determinato spazio dei nomi.
    • Utilizzata: la quantità di memoria non rimovibile utilizzata da tutti i container in uno spazio dei nomi. Viene calcolato dalla metrica container/memory/used_bytes.
    • Richiesta: la quantità di memoria richiesta da tutti i container in uno spazio dei nomi. Viene calcolato dalla metrica container/memory/request_bytes.

Metriche del disco

  • Utilizzo totale disco:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti i punti nel tempo per un determinato periodo di tempo, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di archiviazione temporanea locale allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/ephemeral_storage/allocatable_bytes.
      • Utilizzata: la quantità di archiviazione temporanea locale utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/ephemeral_storage/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti nel tempo per una determinata finestra temporale in cui il punto temporale è un rapporto tra le risorse richieste e quelle utilizzate in tutti gli spazi dei nomi che appartengono a un ambito del team.
      • Richiesta: la quantità di archiviazione temporanea locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Utilizzata: la quantità di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/ephemeral_storage/used_bytes.
  • Utilizzo del disco per parco risorse/team:
    • A livello di parco risorse, la relazione tra risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di archiviazione temporanea locale utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/ephemeral_storage/used_bytes.
      • Richiesta: la quantità di archiviazione temporanea locale richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Allocabile: la quantità di archiviazione temporanea locale allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Viene calcolato dalla metrica node/ephemeral_storage/allocatable_bytes.
    • A livello di team, la relazione tra il limite delle risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/ephemeral_storage/used_bytes.
      • Richiesta: la quantità di archiviazione temporanea locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Limite: la quantità massima di spazio di archiviazione temporaneo locale disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Viene calcolato dalla metrica container/ephemeral_storage/limit_bytes.
  • Utilizzo massimo del disco per cluster: elenco di cluster ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse allocabili e utilizzate per un determinato cluster.
  • Utilizzo del disco massimo per spazio dei nomi: elenco di spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale, in cui il punto temporale è un rapporto tra le risorse utilizzate e le risorse richieste per un determinato spazio dei nomi.

Distribuzione degli errori per spazio dei nomi (solo a livello di team)

Elenco degli spazi dei nomi ordinato in base al numero più alto di log degli errori per una determinata finestra temporale. I log vengono raccolti da Cloud Logging.

I riavvii conteggiano la distribuzione per spazio dei nomi (solo a livello di team)

Elenco dello spazio dei nomi ordinato in base al numero più alto di riavvii di container per una determinata finestra temporale. Calcolato dalla metrica container/restart_count.

Risoluzione dei problemi

Impossibile caricare le metriche per i nuovi cluster

Se hai creato nuovi cluster, a seconda della finestra temporale selezionata potresti visualizzare No Data nell'intera dashboard di Monitoring oppure metriche. Ad esempio, se hai creato un cluster nell'ultima ora e hai selezionato una finestra temporale di 1 ora o 6 ore, la dashboard potrebbe restituire alcune metriche per i tuoi carichi di lavoro. Tuttavia, se selezioni una finestra temporale di 1 giorno o più, potresti visualizzare No data nella dashboard.

Questo perché Cloud Monitoring raccoglie i dati in periodi (intervalli) diversi per finestre temporali diverse. Per finestre temporali di 1 ora e 6 ore, i dati vengono raccolti in periodi di 1 minuto. Quindi, se il cluster esiste da qualche minuto, vedrai le metriche per queste finestre temporali.

Per finestre temporali di 1 giorno e 1 settimana, Cloud Monitoring raccoglie i dati in periodi di 1 ora. Se il cluster è attivo da meno di un'ora, potresti non vedere dati per queste finestre temporali.

Se si verifica questo errore, controlla la dashboard una volta trascorso un po' di tempo dalla creazione del nuovo cluster.