Scalabilità automatica

Questa pagina spiega come funziona la scalabilità automatica. Prima di leggere questa pagina, devi conoscere la Panoramica di Bigtable e le sezioni Istanze, cluster e nodi.

In Bigtable, le istanze sono contenitori per i cluster, che sono risorse specifiche per località che gestiscono le richieste. Ogni cluster ha uno o più nodi, ovvero le risorse di calcolo utilizzate per gestire i dati. Quando crei un cluster in un'istanza, puoi scegliere l'allocazione manuale dei nodi o la scalabilità automatica.

Con l'allocazione manuale dei nodi, il numero di nodi nel cluster rimane costante fino a quando non lo modifichi. Quando la scalabilità automatica è attivata, Bigtable monitora continuamente il cluster e regola automaticamente il numero di nodi al suo interno, se necessario. La scalabilità automatica funziona sia su cluster HDD che SSD, in tutte le regioni Bigtable.

Puoi configurare la scalabilità automatica nella console Google Cloud, utilizzando gcloud oppure la libreria client di Cloud Bigtable per Java.

Quando utilizzare la scalabilità automatica

Nella maggior parte dei casi, ti consigliamo di attivare la scalabilità automatica. I vantaggi dell'autoscaling includono:

  • Costi: la scalabilità automatica può aiutarti a ottimizzare i costi perché Bigtable riduce il numero di nodi nel tuo cluster possibile. Ciò può aiutarti a evitare il provisioning eccessivo.
  • Prestazioni: la scalabilità automatica consente a Bigtable di aggiungere automaticamente nodi a un cluster quando cambia un carico di lavoro o c'è un aumento dei dati requisiti di archiviazione. In questo modo, puoi mantenere gli obiettivi di prestazioni del carico di lavoro assicurandoti che il cluster disponga di nodi sufficienti per soddisfare i requisiti di utilizzo della CPU e di archiviazione target.
  • Automazione: la scalabilità automatica riduce la complessità della gestione. Non è necessario monitorare e scalare manualmente le dimensioni del cluster o scrivere un'applicazione eseguire queste attività, perché il servizio Bigtable te.

La scalabilità automatica da sola potrebbe non funzionare bene per i seguenti tipi di carichi di lavoro, perché anche se Bigtable aggiunge rapidamente i nodi quando il traffico aumenta, può essere necessario del tempo per bilanciare i nodi aggiuntivi.

  • Traffico irregolare
  • Carichi di lavoro batch improvvisi

Se i picchi di utilizzo sono prevedibili o programmati regolarmente, puoi utilizzare il ridimensionamento automatico e modificare le impostazioni prima dei picchi pianificati. Vedi Posticipa durante viene ribilanciato il nodo per maggiori dettagli.

Come funziona la scalabilità automatica

La scalabilità automatica è il processo di scalabilità, o modifica delle dimensioni, di un cluster aggiungendo o rimuovendo nodi. Quando attivi la scalabilità automatica, Bigtable regola automaticamente le dimensioni del cluster. Quando le esigenze di archiviazione o di carico di lavoro del cluster variano, Bigtable esegue la scalabilità verso l'alto aggiungendo nodi al cluster o esegue la scalabilità verso il basso rimuovendo i nodi dal cluster.

La scalabilità automatica di Bigtable determina il numero di nodi richiesti, in base alle seguenti dimensioni:

  • Target di utilizzo della CPU
  • Target di utilizzo dello spazio di archiviazione
  • Numero minimo di nodi
  • Numero massimo di nodi

Ogni dimensione di scalabilità genera un numero di nodi consigliato e Bigtable utilizza automaticamente quello più alto. Ciò significa, ad esempio, che se il tuo cluster ha bisogno di 10 nodi per raggiungere il target di utilizzo dello spazio di archiviazione, ma di 12 per raggiungere il target di utilizzo della CPU, Bigtable esegue il ridimensionamento del cluster a 12 nodi.

Quando il numero di nodi cambia, Bigtable ottimizza continuamente lo spazio di archiviazione, riequilibrando i dati tra i nodi per garantire che il traffico venga distribuito in modo uniforme e che nessun nodo sia sovraccaricato.

Dopo aver aumentato le dimensioni di un cluster, Bigtable riequilibra automaticamente i nodi del cluster per prestazioni ottimali. Tutte le richieste continuano a raggiungere il cluster mentre sono in corso le operazioni di ridimensionamento e riequilibrio. Per ulteriori informazioni, consulta la sezione Limiti di scalabilità.

Se un cluster ha fatto lo scale up fino al numero massimo di nodi e la CPU di utilizzo del target di utilizzo superato, le richieste potrebbero avere una latenza elevata o non riuscire. Se un cluster è stato scalato fino al numero massimo di nodi e il limite di utilizzo dello spazio di archiviazione viene superato, le richieste di scrittura non andranno a buon fine. Per ulteriori dettagli sui limiti di spazio di archiviazione, consulta Spazio di archiviazione per node.

Quando un nodo viene aggiunto a un piccolo cluster, ad esempio un cluster a un nodo, osservare un aumento temporaneo della latenza durante il ribilanciamento del cluster. Questo è perché il nodo aggiuntivo raddoppia proporzionalmente le dimensioni del cluster. Analogamente, se le dimensioni di un cluster diminuiscono da due nodi a uno, potrebbe verificarsi un po' di latenza.

Quando viene fatto lo scale down di un cluster, i nodi vengono rimossi a una velocità inferiore rispetto a quando fare lo scale up per evitare qualsiasi impatto sulla latenza. Per ulteriori dettagli, consulta le limitazioni di scalabilità.

Parametri di scalabilità automatica

Quando crei o modifichi un cluster e scegli la scalabilità automatica, definisci i valori per il target di utilizzo della CPU, i nodi minimi e i nodi massimi. Puoi configurare il target di utilizzo dello spazio di archiviazione o lasciarlo sul valore predefinito, pari al 50% (2,5 TB). per SSD e 8 TB per HDD).

Parametro Descrizione
Target di utilizzo CPU

Una percentuale della capacità della CPU del cluster. Può variare dal 10% all'80%. Quando l'utilizzo della CPU di un cluster supera il target impostato, Bigtable aggiunge immediatamente nodi al cluster. Quando l'utilizzo della CPU è notevolmente inferiore al target, Bigtable rimuove i nodi. Per indicazioni, consulta Determinare il target di utilizzo della CPU.

Numero minimo di nodi

Il numero minimo di nodi a cui Bigtable ridurrà il cluster. Questo valore deve essere maggiore di zero e non può essere inferiore al 10% del valore impostato per il numero massimo di nodi. Per Ad esempio, se il numero massimo di nodi è 40, il numero minimo di nodi deve essere almeno 4. Il requisito del 10% è un limite fisso. Per indicazioni, consulta Determinare il numero minimo di nodi.

Numero massimo di nodi

Il numero massimo di nodi fino a cui vuoi consentire lo scale up del cluster. Questo valore deve essere maggiore di zero e uguale o maggiore del il numero minimo di nodi. Il valore non può essere più di 10 volte superiore al numero che scegli per il numero minimo di nodi. Questo requisito di 10 volte è un limite massimo. Per indicazioni, consulta Determinare il e il numero massimo di nodi.

Target di utilizzo dello spazio di archiviazione

Il numero massimo di terabyte per nodo che puoi archiviare prima che Bigtable esegua l'upgrade. Questo target garantisce che tu abbia sempre dispongono di nodi sufficienti per gestire le fluttuazioni nella quantità di dati . Per indicazioni, consulta Determinare il target di utilizzo dello spazio di archiviazione.

Configura scalabilità automatica

Questa sezione descrive come scegliere i parametri di scalabilità automatica. Dopo aver impostato i valori iniziali, monitora il cluster e regola numeri, se necessario.

Determina il target di utilizzo della CPU

Basate il target di utilizzo della CPU sul vostro carico di lavoro specifico. La il target ottimale per il cluster dipende dalla latenza e dalla velocità effettiva per soddisfare i requisiti del tuo carico di lavoro. Per saperne di più, consulta Pianificare la capacità di Bigtable.

In generale, se noti una latenza inaccettabilmente elevata, devi abbassare il valore target di utilizzo della CPU.

Determina il target di utilizzo dello spazio di archiviazione

Se la tua applicazione è sensibile alla latenza, mantieni l'utilizzo dello spazio di archiviazione al di sotto del 60%. Se la tua applicazione non è sensibile alla latenza, puoi scegliere uno spazio target di utilizzo del 70% o più. Per saperne di più, consulta Pianificare la capacità di Bigtable.

Per la scalabilità automatica, l'utilizzo dello spazio di archiviazione è espresso in termini di numero di byte di archiviazione per nodo anziché in percentuale. Il target di utilizzo dello spazio di archiviazione è specificato per nodo, ma viene applicato all'intero cluster. I limiti di capacità per i nodi sono 5 TB per nodo per lo spazio di archiviazione SSD e 16 TB per nodo per lo spazio di archiviazione HDD.

La tabella seguente mostra gli importi target per le percentuali target di utilizzo dello spazio di archiviazione. La console Google Cloud accetta il valore in TB per nodo, e le librerie client di gcloud CLI, API e Cloud Bigtable accettano un valore intero in GiB per nodo.

Percentuale SSD HDD
80% 4 TB o 4096 GiB 12,8 TB o 13.107 GiB
70% 3,5 TB o 3584 GiB 11,2 TB o 11.468 GiB
60% 3 TB o 3072 GiB 9,6 TB o 9830 GiB
50% 2,5 TB o 2560 GiB 8 TB o 8192 GiB

Determina il numero massimo di nodi

Il valore scelto come numero massimo di nodi deve corrispondere al numero di nodi di cui il cluster ha bisogno per gestire il traffico più elevato del tuo carico di lavoro, anche se non prevedi di raggiungere questo volume la maggior parte del tempo. Bigtable non esegue mai l'upgrade a più nodi di quelli necessari. Puoi anche pensare a questo numero ovvero il numero più alto di nodi che intendi pagare. Consulta la sezione Scalabilità automatica. parametri per i dettagli sui valori accettati.

Il numero massimo deve essere consentito sia per il target di utilizzo della CPU impostato da te e il target di utilizzo dello spazio di archiviazione impostato da Bigtable.

Se stai passando da un'allocazione manuale a una scalabilità automatica per un cluster, individua il numero più elevato di nodi che il cluster ha avuto nell'ultimo mese circa. Il numero massimo di nodi della scalabilità automatica deve essere almeno pari a questo numero.

Se stai attivando la scalabilità automatica per un nuovo cluster in un'istanza esistente, utilizza le metriche di altri cluster nell'istanza come riferimento.

Se hai un nuovo carico di lavoro e non sai come crescerà, può stimare il numero di nodi necessari per soddisfare lo spazio di archiviazione integrato e poi modificare il numero in un secondo momento.

Per ottenere questo numero, stima la quantità di dati che prevedi di archiviare sul cluster e poi dividi il numero per il target di utilizzo dello spazio di archiviazione per il tipo di archiviazione che utilizzi.

Ad esempio, se archivi 10 TB su un cluster SSD, puoi dividere 10 TB per 2,5 TB, ovvero il target di utilizzo dello spazio di archiviazione impostato per impostazione predefinita per i cluster SSD che utilizzano la scalabilità automatica. Il risultato è 4, il che significa che 4 è il numero di nodi in grado di gestire quella quantità di dati e il valore massimo deve essere un numero superiore.

Utilizzando la stessa formula, i seguenti esempi mostrano il numero di nodi che potrebbero essere necessarie alcune quantità di archiviazione di esempio:

Spazio di archiviazione SSD per cluster Numero massimo di nodi più piccolo
25 TB 10
35 TB 14
50 TB 20

Dopo aver attivato la scalabilità automatica, monitora il cluster e assicurati che il valore scelto per il numero massimo di nodi sia almeno pari a recommended number of nodes for CPU target e recommended number of nodes for storage target.

Determina il numero minimo di nodi

Puoi impostare il valore minimo su 1 per assicurarti che Bigtable possa ridurre le dimensioni al minimo e al costo più conveniente, se possibile. Il cluster non diventa mai troppo piccolo perché Bigtable impedisce automaticamente che il conteggio dei nodi scenda al di sotto del minimo necessario e mantenere i target di utilizzo di CPU e spazio di archiviazione. Consulta la sezione Scalabilità automatica. parametri per i dettagli sui valori accettati.

Tuttavia, in molti casi è consigliabile impostare questo valore su più di uno. Scegli un numero superiore o aumenta il numero minimo di nodi per le seguenti situazioni:

  • Hai in programma un evento, come il Cyber Monday, in cui prevedi un aumento temporaneo del traffico e vuoi assicurarti di avere una capacità sufficiente.
  • La tua applicazione invia traffico irregolare. Quando vengono aggiunti nuovi nodi, Bigtable esegue automaticamente il riequilibrio sui nuovi nodi. Poiché questa operazione può richiedere diversi minuti, spesso è meglio adottare un approccio conservativo e scegliere un valore minimo più elevato in modo che il cluster possa adattarsi senza problemi agli picchi.
  • Aumenta il numero massimo di nodi. Il valore minimo deve sempre essere pari o inferiore al dieci percento del numero massimo di nodi. Ad esempio, se imposti il parametro il valore minimo è 30, il valore minimo deve essere almeno 3.

Se aumenti il valore per il numero minimo di nodi di un cluster, Bigtable tenta immediatamente di scalare il cluster al nuovo minimo. Tuttavia, vengono applicati i vincoli standard. Se una zona non dispone di nodi, non viene eseguito il provisioning di nodi aggiuntivi per soddisfare il numero minimo configurato. Bigtable continua a tentare di aggiungere nodi e crea una voce di audit log per ogni tentativo non riuscito scala il cluster al nuovo numero minimo di nodi. Bigtable non modifica il valore configurato in questa situazione. Di conseguenza, potresti osservare che il numero di nodi del cluster è inferiore al minimo fino al completamento dell'operazione di scalabilità.

Ottimizzare le impostazioni

Tieni d'occhio l'utilizzo dei nodi e modifica le impostazioni, se necessario, soprattutto dopo aver attivato per la prima volta la scalabilità automatica.

Account per la replica

In un'istanza che utilizza la replica, le impostazioni e l'attività di scalabilità automatica di ciascun cluster sono completamente indipendenti da quelle degli altri cluster nell'istanza. Devi configurare la modalità di scalabilità per ciascun cluster in un'istanza.

In generale, per le istanze replicate, devi attivare la scalabilità automatica per ogni cluster nell'istanza. La configurazione della scalabilità automatica sarà spesso la stessa per ogni cluster dell'istanza, ma potrebbe essere diversa a seconda del caso d'uso, del carico di lavoro e dei requisiti di prestazioni di ciascun cluster.

Poiché i cluster in un'istanza replicata svolgono alcune attività aggiuntive gestire la replica, devi scegliere un numero massimo più elevato di nodi rispetto a un'istanza a cluster singolo. Per saperne di più, consulta Repliche e rendimento.

Controllo degli accessi

Per configurare la scalabilità automatica, devi essere un entità in un ruolo che disponga delle autorizzazioni create e update per il cluster e l'istanza che stai configurando.

Monitoraggio

Bigtable offre diverse metriche per aiutarti a comprendere La scalabilità automatica di Bigtable funziona mentre esegue lo scale up e lo scale down per soddisfare requisiti dei carichi di lavoro. Le metriche possono anche aiutarti a valutare se le tue sono ideali per soddisfare i requisiti di costo e carico di lavoro dell'azienda. Per Ad esempio, se noti che il numero di nodi per un cluster è spesso vicino al di nodi, valuta la possibilità di aumentare il numero massimo. Per saperne di più sul monitoraggio delle risorse Bigtable, consulta Monitoraggio di in esecuzione.

Le seguenti metriche vengono visualizzate in grafici nella pagina Panoramica del cluster della console Google Cloud. Puoi anche visualizzare questi utilizzando Cloud Monitoring.

  • bigtable.googleapis.com/cluster/autoscaling/min_node_count
  • bigtable.googleapis.com/cluster/autoscaling/max_node_count
  • bigtable.googleapis.com/cluster/autoscaling/recommended_node_count_for_cpu
  • bigtable.googleapis.com/cluster/autoscaling/recommended_node_count_for_storage

Logging

Bigtable emette un audit log degli eventi di sistema ogni volta che scala in un cluster Kubernetes. La voce di log è simile alla seguente:

Grew from 9 to 10 nodes to maintain CPU utilization at 60%.

Puoi visualizzare i log degli eventi di sistema di scalabilità automatica nella pagina Panoramica del cluster Bigtable nella console Google Cloud. Puoi visualizzarli anche utilizzando Esplora log:

  1. Vai a Esplora log:

    Vai a Esplora log

    Seleziona il progetto Google Cloud appropriato.

  2. Nel campo Query, inserisci quanto segue:

    resource.type="audited_resource" resource.labels.service="bigtableadmin.googleapis.com"
    resource.labels.method="AutoscaleCluster"
    
  3. Fai clic su Esegui query.

    Il riquadro Risultati delle query mostra i log dell'ultima ora.

Per scoprire di più sulla visualizzazione dei log, consulta Cloud Logging.

Passaggi successivi