Metriche di utilizzo della CPU

Questa pagina descrive le metriche di utilizzo della CPU fornite da Spanner. Puoi visualizzare queste metriche nella console Google Cloud e nella console Cloud Monitoring.

Utilizzo della CPU e priorità delle attività

Spanner misura l'utilizzo della CPU in base all'origine e alla priorità dell'attività.

  • Origine: un'attività può essere avviata dall'utente o dal sistema.

  • Priorità: la priorità aiuta Spanner determina quali attività eseguire per prime. La priorità delle attività di sistema è predeterminata e non può essere configurata. Le attività utente vengono eseguite alle se non diversamente specificato. Molte richieste di dati, come read e executeSql, consentono di specificare una priorità inferiore per la richiesta. Questo può essere utile per ad esempio, quando esegui query batch, di manutenzione o analitiche che non hanno SLO con prestazioni molto rigide.

    In generale, le attività con priorità più alta verranno eseguite prima per attività a bassa priorità. Spanner consente alle attività ad alta priorità di utilizzare fino al 100% delle risorse CPU disponibili anche se sono presenti attività con priorità inferiore in concorrenza. Mentre le attività di sistema a priorità inferiore possono subire ritardi a breve termine, prima o poi. Pertanto, devi il provisioning dell'istanza con una capacità di calcolo sufficiente per gestire tutte le attività.

    Se non sono presenti attività ad alta priorità, Spanner utilizzerà fino al 100% delle risorse CPU disponibili per completare più rapidamente le attività con priorità inferiore. I picchi di utilizzo in background non sono indice di un problema. Attività a priorità inferiore può cedere ad attività di priorità più elevata, comprese le attività utente, quasi istantaneamente.

La tabella seguente mostra esempi per ogni attività:

Attività degli utenti Attività di sistema
Priorità elevata Sono incluse le richieste di dati, ad esempio lettura o executeSql, in cui nessuna priorità PRIORITY_HIGH è specificato. Sono inclusi la suddivisione dei dati e
Priorità media Include: Include:
Bassa priorità Sono incluse le richieste di dati per le quali è specificato PRIORITY_LOW. Sono inclusi:
  • Eseguire il backfill di un indice.
  • Backfill di una colonna generata

Metriche disponibili

Spanner fornisce le seguenti metriche per l'utilizzo della CPU:

  • Utilizzo della CPU smussato: una media mobile dell'utilizzo totale della CPU, in percentuale delle risorse della CPU dell'istanza, per ogni database. Ogni punto dati è una media delle 24 ore precedenti. Utilizza questa metrica per creare avvisi e analizzare l'utilizzo della CPU per un lungo periodo di tempo, ad esempio 24 ore. Puoi visualizzare un grafico per questa metrica nella console Google Cloud o nella console Cloud Monitoring come Media mobile su 24 ore.

  • Utilizzo della CPU per priorità: l'utilizzo della CPU, in percentuale delle risorse della CPU dell'istanza, raggruppato per priorità, attività avviate dall'utente e attività avviate dal sistema. Utilizza questa metrica per creare avvisi e analizzare l'utilizzo della CPU a livello generale. Puoi visualizzare un grafico per questa metrica nella console Google Cloud o nella console Cloud Monitoring.

  • Utilizzo della CPU per tipo di operazione: l'utilizzo della CPU, in percentuale delle risorse della CPU dell'istanza, raggruppate per operazioni avviate dall'utente come operazioni di lettura, scrittura e commit. Utilizza questa metrica per ottenere un'analisi dettagliata della CPU sull'utilizzo e per la risoluzione dei problemi, come spiegato in Analisi dell'utilizzo elevato della CPU. Puoi crea un grafico per questa metrica nella console di Cloud Monitoring.

    Puoi anche utilizzare la console Cloud Monitoring per creare avvisi per l'utilizzo della CPU, come descritto di seguito.

La seguente tabella specifica i nostri consigli per l'utilizzo massimo della CPU per le istanze regionali, a due regioni e multiregionali. Questi numeri servono a garantire che la tua istanza disponga di capacità di calcolo sufficiente per continuare a gestire il traffico in caso di perdita di un'intera zona (per le istanze regionali) o di un'intera regione (per le istanze a due regioni e multiregione).

Metrica Massimo per le istanze a livello di regione Massimo per regione per istanze a due regioni e multiregione
Totale con priorità elevata 65% 45%
Aggregato appiattito su 24 ore 90% 90%

Per aiutarti a rimanere al di sotto dei valori massimi consigliati, crea avvisi in Cloud Monitoring, che monitorano l'utilizzo della CPU ad alta priorità e l'utilizzo medio della CPU nelle 24 ore.

L'utilizzo della CPU può influire sulle latenze delle richieste. Il sovraccarico di un singolo server di backend attiverà latenze di richiesta più elevate. Le applicazioni devono eseguire benchmark e monitoraggio attivo per verificare che Spanner soddisfi i relativi requisiti di rendimento.

Di conseguenza, per le applicazioni sensibili alle prestazioni, potrebbe essere necessario ridurre ulteriormente utilizzando le tecniche descritte nella sezione che segue.

Utilizzo CPU superiore al 100%

In alcuni casi, l'utilizzo della CPU di un'istanza Spanner può superare il 100%. Ciò significa che l'istanza utilizza più risorse della CPU rispetto alla quantità configurata per l'istanza.

Le risorse della CPU superiori al 100% potrebbero essere utilizzate per fornire prestazioni migliori e più prevedibili durante i picchi di utilizzo della CPU, ad esempio causati da un aumento improvviso del traffico delle richieste.

Qualsiasi capacità della CPU superiore al 100% NON è garantita e non deve essere considerata attendibile per le normali operazioni del database.

L'esecuzione di un'istanza Spanner con un utilizzo della CPU pari o superiore al 100% per un periodo di tempo prolungato comporta il rischio di degradare le prestazioni e la latenza del normale funzionamento. Le risorse della CPU aggiuntive non sono un meccanismo sicuro su cui fare affidamento prestazioni costanti.

Per questo utilizzo aggiuntivo della CPU non viene addebitato alcun costo ai clienti.

Riduzione dell'utilizzo della CPU

Questa sezione spiega come ridurre l'utilizzo della CPU di un'istanza.

In generale, consigliamo di aumentare la capacità di calcolo dei tuoi come punto di partenza. Dopo aver aumentato la capacità di calcolo, puoi esaminare e risolvere le cause principali dell'utilizzo elevato della CPU.

Aumento della capacità di calcolo

Se superi i valori massimi consigliati per l'utilizzo della CPU, ti consigliamo consigliamo di aumentare la capacità di calcolo dell'istanza in modo che continuano a operare in modo efficace. Se vuoi automatizzare questo processo, puoi crea un'applicazione che monitora l'utilizzo della CPU, quindi aumenta o diminuisce in base alle esigenze, utilizzando l'API UpdateInstance .

Per determinare la quantità di capacità di calcolo necessaria, tieni conto dell'utilizzo della CPU ad alta priorità di picco e della media smorzata di 24 ore. Alloca sempre abbastanza per mantenere l'utilizzo della CPU al di sotto dei valori massimi consigliati. Come descritto in precedenza, potresti dover allocare capacità di calcolo aggiuntiva per le applicazioni sensibili alle prestazioni (ad esempio per far fronte ai picchi dei carichi di lavoro).

Se non disponi di una capacità di calcolo sufficiente, Spanner rimanda le attività in base al livello di priorità. Attività di sistema a bassa priorità, come la compattazione e lo schema dei database la convalida delle modifiche, può essere differita in favore delle attività utente. Tuttavia, queste attività sono fondamentali per l'integrità della tua istanza e Spanner non può posticiparle a tempo indeterminato. Se Spanner non riesce a completare il sistema a bassa priorità di attività in una determinata finestra temporale, nell'ordine di diverse ore fino a un giorno, a causa risorse di calcolo insufficienti, Spanner potrebbe aumentare la priorità le attività di sistema. Questa modifica influisce sulle prestazioni delle attività utente.

Eseguire ulteriori indagini con gli strumenti di introspezione

Se la metrica Utilizzo della CPU per tipo di operazione indica che una determinata di un'operazione sta contribuendo all'utilizzo elevato della CPU, usa strumenti di introspezione per risolvere ulteriori problemi. Per ulteriori informazioni, consulta Indagine sull'utilizzo elevato della CPU.

Passaggi successivi