Metriche di utilizzo delle risorse del parco risorse

Questa pagina analizza più nel dettaglio le metriche di utilizzo delle risorse del parco risorse e del team spiegando come vengono calcolate e fornendo suggerimenti su come utilizzarle per ottimizzare l'utilizzo delle risorse.

Puoi visualizzare queste metriche nei seguenti dashboard:

Queste metriche descrivono l'efficacia con cui i tuoi cluster utilizzano le risorse fisicamente disponibili che paghi o le risorse che allochi sull'hardware on-premise. Puoi utilizzare queste informazioni per comprendere l'efficacia dell'utilizzo delle risorse su larga scala, a livello di flotta o di team. In questo modo puoi ottimizzare le dimensioni del cluster e l'allocazione delle risorse tra cluster e spazi dei nomi oppure ottimizzare il modo in cui i team delle applicazioni richiedono e prenotano le risorse.

Utilizzare le metriche di utilizzo delle risorse

I seguenti suggerimenti possono aiutarti a utilizzare le metriche nella console per identificare e risolvere i problemi:

  • Se l'utilizzo totale di CPU/memoria/disco della tua flotta indica un utilizzo inaspettatamente alto o basso negli ultimi sette giorni, controlla sempre il grafico corrispondente Utilizzo di CPU/memoria/disco per flotta per valutare se l'utilizzo inaspettato è costante o causato da picchi di utilizzo.
  • Se Utilizzo CPU/memoria/disco principale per cluster indica singoli cluster che si comportano in modo diverso dagli altri, valuta la possibilità di esaminare più da vicino questi cluster particolari. Se possibile, valuta la possibilità di ridimensionare i cluster.
  • Se Utilizzo di CPU/memoria/disco principale per spazio dei nomi mostra un picco inatteso negli ultimi sette giorni, valuta la possibilità di verificare se un carico di lavoro specifico sta causando il picco. Una possibile soluzione potrebbe essere quella di ridistribuire i carichi di lavoro tra le risorse.
  • Utilizzo di CPU/memoria/disco per flotta ti consente di osservare il rapporto tra le risorse utilizzate e quelle richieste. Una grande differenza tra i due potrebbe significare che i team delle applicazioni richiedono e prenotano troppe risorse.

Informazioni sulle metriche di utilizzo delle risorse

Le seguenti metriche sono fornite nelle dashboard di panoramica dell'ambito GKE, del parco progetti e del team, calcolate utilizzando le informazioni di Cloud Monitoring sui cluster del parco progetti.

Puoi visualizzare le metriche a livello di parco risorse nelle dashboard di panoramica di GKE e del parco risorse. Le metriche a livello di team sono disponibili nelle dashboard panoramica di GKE e del team.

Metriche della CPU

  • Utilizzo CPU totale:
    • Per le metriche a livello di parco risorse, una media di tutti i punti nel tempo per un determinato intervallo di tempo in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster registrati in un parco risorse.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/cpu/allocatable_cores.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/cpu/core_usage_time.
    • Per la dashboard Monitoraggio del team, una media di tutti i punti nel tempo per un determinato intervallo di tempo in cui il punto nel tempo è un rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi associati a un ambito del team.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolato dalla metrica container/cpu/request_cores.
      • Utilizzato: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolato dalla metrica container/cpu/core_usage_time.
  • Utilizzo CPU per flotta/team:
    • Per il livello del parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/cpu/request_cores.
      • Allocabile: la quantità di CPU allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/cpu/allocatable_cores.
    • Per il livello del team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzato: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolato dalla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolato dalla metrica container/cpu/request_cores.
      • Limite: la quantità massima di CPU disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolato dalla metrica container/cpu/limit_cores.
  • Utilizzo CPU principale per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
  • Utilizzo massimo della CPU per spazio dei nomi: elenco degli spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
    • Utilizzato: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi. Calcolato dalla metrica container/cpu/core_usage_time.
    • Richiesta: la quantità di CPU richiesta da tutti i container in uno spazio dei nomi. Calcolato dalla metrica container/cpu/request_cores.

Metriche di memoria

  • Utilizzo totale della memoria:
    • Per le metriche a livello di parco risorse, questo si riferisce a una media di tutti i punti nel tempo per un determinato intervallo di tempo in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/memory/allocatable_byte.
      • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/memory/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti nel tempo per un determinato intervallo di tempo in cui il punto nel tempo è un rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi appartenenti a un ambito del team.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/memory/request_bytes.
      • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/memory/used_bytes.
  • Utilizzo della memoria per parco risorse/team:
    • Per il livello del parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica container/memory/request_bytes.
      • Allocabile: la quantità di memoria allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/memory/allocatable_byte.
    • Per il livello del team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/memory/request_bytes.
      • Limite: la quantità massima di memoria disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/memory/limit_bytes.
  • Utilizzo massimo della memoria per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
    • Allocabile: la quantità di memoria allocata a tutti i nodi di un cluster. Calcolato dalla metrica node/memory/allocatable_byte.
    • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in un cluster. Calcolato dalla metrica container/memory/used_bytes.
  • Utilizzo massimo della memoria per spazio dei nomi: elenco degli spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
    • Utilizzata: la quantità di memoria non eliminabile utilizzata da tutti i container in uno spazio dei nomi. Calcolato dalla metrica container/memory/used_bytes.
    • Richiesta: la quantità di memoria richiesta da tutti i container in uno spazio dei nomi. Calcolato dalla metrica container/memory/request_bytes.

Metriche del disco

  • Utilizzo totale del disco:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di spazio di archiviazione temporanea locale allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/ephemeral_storage/allocatable_bytes.
      • Utilizzato: la quantità di spazio di archiviazione effimero locale utilizzato da tutti i container in tutti i cluster registrati in una flotta. Calcolato dalla metrica container/ephemeral_storage/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti nel tempo per un determinato intervallo di tempo in cui il punto nel tempo è un rapporto tra le risorse richieste e utilizzate in tutti gli spazi dei nomi appartenenti a un ambito del team.
      • Richiesto: la quantità di spazio di archiviazione temporaneo locale richiesto da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/ephemeral_storage/used_bytes.
  • Utilizzo del disco per flotta/team:
    • Per il livello del parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzato: la quantità di spazio di archiviazione effimero locale utilizzato da tutti i container in tutti i cluster registrati in una flotta. Calcolato dalla metrica container/ephemeral_storage/used_bytes.
      • Richiesto: la quantità di spazio di archiviazione effimero locale richiesto da tutti i container in tutti i cluster registrati in un fleet. Calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Allocabile: la quantità di spazio di archiviazione temporanea locale allocata a tutti i nodi in tutti i cluster registrati in un parco risorse. Calcolato dalla metrica node/ephemeral_storage/allocatable_bytes.
    • Per il livello del team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/ephemeral_storage/used_bytes.
      • Richiesto: la quantità di spazio di archiviazione temporaneo locale richiesto da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/ephemeral_storage/request_bytes.
      • Limite: la quantità massima di spazio di archiviazione temporaneo locale disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolato dalla metrica container/ephemeral_storage/limit_bytes.
  • Principali utilizzi del disco per cluster: elenco dei cluster ordinato in base a una media di tutti i punti nel tempo per un determinato intervallo di tempo, in cui il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
  • Utilizzo del disco principale per spazio dei nomi: elenco degli spazi dei nomi ordinato in base a una media di tutti i punti nel tempo per una determinata finestra temporale in cui il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.

Distribuzione degli errori per spazio dei nomi (solo a livello di team)

Elenco degli spazi dei nomi ordinato in base al numero più alto di log degli errori per un determinato periodo di tempo. I log vengono raccolti da Cloud Logging.

Distribuzione del conteggio dei riavvii per spazio dei nomi (solo a livello di team)

Elenco degli spazi dei nomi ordinato in base al numero più alto di riavvii di container per un determinato intervallo di tempo. Calcolato dalla metrica container/restart_count.

Risoluzione dei problemi

Impossibile caricare le metriche per i nuovi cluster

Se hai creato nuovi cluster, a seconda dell'intervallo di tempo selezionato, potresti visualizzare No Data nella dashboard Monitoraggio oppure potresti visualizzare metriche. Ad esempio, se hai creato un cluster nell'ultima ora e selezioni una finestra temporale di 1 ora o 6 ore, la dashboard potrebbe restituire alcune metriche per i tuoi carichi di lavoro. Tuttavia, se selezioni un periodo di tempo di 1 giorno o più, potresti visualizzare No data in tutta la dashboard.

Questo perché Cloud Monitoring raccoglie i dati in periodi diversi (intervalli) per finestre temporali diverse. Per le finestre temporali di 1 ora e 6 ore, i dati vengono raccolti in periodi di 1 minuto. Quindi, se il cluster esiste da qualche minuto, vedrai le metriche per questi intervalli di tempo.

Per le finestre temporali di 1 giorno e 1 settimana, Cloud Monitoring raccoglie i dati in periodi di 1 ora. Se il cluster esiste da meno di un'ora, potresti non visualizzare dati per questi intervalli di tempo.

Se si verifica questo errore, controlla la dashboard dopo un periodo di tempo più lungo dalla creazione del nuovo cluster.