Metriche di utilizzo della CPU

Questa pagina descrive le metriche di utilizzo della CPU fornite da Spanner. Puoi visualizzare queste metriche nella console Google Cloud e nella console Cloud Monitoring.

Utilizzo della CPU e priorità delle attività

Spanner misura l'utilizzo della CPU in base all'origine e alla priorità dell'attività.

  • Origine: un'attività può essere avviata dall'utente o dal sistema.

  • Priorità: la priorità aiuta Spanner a determinare quali attività devono essere eseguite per prime. La priorità delle attività di sistema è predeterminata e non può essere configurata. Le attività degli utenti vengono eseguite ad alta priorità, se non diversamente specificato. Molte richieste di dati, ad esempio read ed executeSql, consentono di specificare una priorità inferiore per la richiesta. Questo può essere utile, ad esempio, quando esegui query batch, di manutenzione o analitiche che non hanno SLO rigidi per le prestazioni.

    In generale, le attività con priorità più elevata vengono eseguite prima delle attività con priorità più bassa. Spanner consente alle attività ad alta priorità di utilizzare fino al 100% delle risorse della CPU disponibili anche se ci sono attività concorrenti con priorità inferiore. Sebbene le attività di sistema con priorità più bassa possano subire ritardi nel breve termine, alla fine devono essere eseguite. Pertanto, devi eseguire il provisioning dell'istanza con capacità di calcolo sufficiente per gestire tutte le attività.

    Se non ci sono attività ad alta priorità, Spanner utilizzerà fino al 100% delle risorse della CPU disponibili per completare più rapidamente le attività a priorità inferiore. I picchi di utilizzo in background non sono indice di un problema. Le attività con priorità più bassa possono cedere ad attività con priorità più alta, incluse le attività degli utenti, quasi istantaneamente.

La tabella seguente mostra esempi per ogni attività:

Attività degli utenti Attività di sistema
Alta priorità Include le richieste di dati, come read o executeSql, in cui non è specificata alcuna priorità o PRIORITY_HIGH. Include la suddivisione dei dati.
Priorità media Include: Include:
  • Compattazione del database
  • Convalida delle modifiche allo schema
  • La fase di ottimizzazione del ripristino del database
Bassa priorità Include le richieste di dati in cui è specificato PRIORITY_LOW. Include:
  • Backfill di un indice.
  • Backfill di una colonna generata

Metriche disponibili

Spanner fornisce le seguenti metriche per l'utilizzo della CPU:

  • Utilizzo CPU ottimizzato: una media mobile dell'utilizzo totale della CPU, come percentuale delle risorse della CPU dell'istanza, per ogni database. Ogni punto dati rappresenta una media delle 24 ore precedenti. Utilizza questa metrica per creare avvisi e analizzare l'utilizzo della CPU per un lungo periodo di tempo, ad esempio 24 ore. Puoi visualizzare un grafico per questa metrica nella console Google Cloud o nella console Cloud Monitoring come Media mobile su 24 ore.

  • Utilizzo della CPU per priorità: l'utilizzo della CPU, come percentuale delle risorse della CPU dell'istanza, raggruppato per priorità, attività avviate dall'utente e dal sistema. Usa questa metrica per creare avvisi e analizzare l'utilizzo della CPU ad alto livello. Puoi visualizzare un grafico per questa metrica nella console Google Cloud o nella console Cloud Monitoring.

  • Utilizzo della CPU per tipo di operazione: l'utilizzo della CPU, come percentuale delle risorse della CPU dell'istanza, raggruppato per operazioni avviate dall'utente come letture, scritture e commit. Utilizza questa metrica per ottenere un'analisi dettagliata dell'utilizzo della CPU e per risolvere ulteriormente i problemi, come spiegato in Indagare sull'utilizzo elevato della CPU. Puoi creare un grafico per questa metrica nella console di Cloud Monitoring.

    Puoi utilizzare la console di Cloud Monitoring anche per creare avvisi per l'utilizzo della CPU, come descritto di seguito.

La tabella seguente specifica i nostri suggerimenti per l'utilizzo massimo della CPU per istanze a una o più regioni. Questi numeri servono a garantire che l'istanza abbia capacità di calcolo sufficiente per continuare a gestire il traffico in caso di perdita di un'intera zona (per istanze a una singola regione) o di un'intera regione (per istanze multiregionali).

Metrica Valore massimo per istanze a una singola regione Valore massimo per regione per istanze multiregionali
Totale priorità elevata 65% 45%
Aggregazione smussata 24 ore su 24 90% 90%

Per aiutarti a rimanere al di sotto dei valori massimi consigliati, crea avvisi in Cloud Monitoring per monitorare l'utilizzo della CPU ad alta priorità e l'utilizzo medio della CPU in 24 ore.

L'utilizzo della CPU può influire sulle latenze delle richieste. Il sovraccarico di un singolo server di backend attiverà latenze delle richieste più elevate. Le applicazioni devono eseguire benchmark e monitoraggio attivo per verificare che Cloud Spanner soddisfi i requisiti delle prestazioni.

Pertanto, per le applicazioni sensibili alle prestazioni, potrebbe essere necessario ridurre ulteriormente l'utilizzo della CPU utilizzando le tecniche descritte nella sezione seguente.

Utilizzo della CPU superiore al 100%

In alcuni casi, l'utilizzo della CPU di un'istanza Spanner potrebbe superare il 100%. Ciò significa che l'istanza utilizza più risorse della CPU rispetto alla quantità configurata per l'istanza.

Potrebbero essere utilizzate risorse della CPU superiori al 100% per fornire prestazioni migliori e più prevedibili durante i picchi di utilizzo della CPU, ad esempio causati da un improvviso aumento del traffico delle richieste.

Qualsiasi capacità della CPU superiore al 100% NON è garantita e non deve essere utilizzata per le normali operazioni di database.

L'esecuzione di un'istanza Spanner quasi pari o superiore al 100% dell'utilizzo della CPU per un periodo di tempo prolungato rischia di ridurre le prestazioni e la latenza delle normali operazioni. Le risorse aggiuntive della CPU non sono un meccanismo sicuro su cui basarti per ottenere prestazioni coerenti.

Ai clienti non viene addebitato questo utilizzo aggiuntivo della CPU.

Riduzione dell'utilizzo della CPU

Questa sezione spiega come ridurre l'utilizzo della CPU da parte di un'istanza.

In generale, ti consigliamo di aumentare la capacità di calcolo dell'istanza come punto di partenza. Dopo aver aumentato la capacità di calcolo, puoi analizzare e risolvere le cause principali dell'elevato utilizzo della CPU.

Aumento della capacità di calcolo

Se superi i valori massimi consigliati per l'utilizzo della CPU, ti consigliamo vivamente di aumentare la capacità di calcolo dell'istanza, in modo che possa continuare a funzionare in modo efficace. Se vuoi automatizzare questo processo, puoi creare un'applicazione che monitori l'utilizzo della CPU, quindi aumenta o diminuisce la capacità di calcolo in base alle esigenze, utilizzando il metodo UpdateInstance.

Per determinare la capacità di calcolo di cui hai bisogno, considera l'utilizzo di picco della CPU ad alta priorità e la media livellata su 24 ore. Alloca sempre capacità di calcolo sufficiente per mantenere l'utilizzo della CPU al di sotto dei valori massimi consigliati. Come descritto in precedenza, potrebbe essere necessario allocare capacità di calcolo aggiuntiva per applicazioni sensibili alle prestazioni, ad esempio per far fronte ai picchi di carichi di lavoro.

Se la capacità di calcolo non è sufficiente, Spanner posticipa le attività in base al livello di priorità. Le attività di sistema a bassa priorità, come la compattazione del database e la convalida delle modifiche allo schema, possono essere differite a favore delle attività utente. Tuttavia, queste attività sono fondamentali per l'integrità dell'istanza e Spanner non può rimandarle a tempo indeterminato. Se Spanner non è in grado di completare le attività di sistema a bassa priorità in un determinato periodo di tempo, nell'ordine di diverse ore o un giorno, a causa di risorse di calcolo insufficienti, Spanner potrebbe aumentare la priorità delle attività di sistema. Questa modifica influisce sul rendimento delle attività degli utenti.

Analizzeremo ulteriormente con gli strumenti di introspezione

Se la metrica Utilizzo CPU per tipo di operazione indica che un determinato tipo di operazione contribuisce a un utilizzo elevato della CPU, utilizza gli strumenti di introduzione di Spanner per ulteriori informazioni sulla risoluzione dei problemi. Per maggiori informazioni, consulta Indagare sull'utilizzo elevato della CPU.

Passaggi successivi