Panoramica di Data Boost

Spanner Data Boost è un servizio serverless completamente gestito che fornisce risorse di calcolo indipendenti per i carichi di lavoro Spanner supportati. Data Boost consente di eseguire query di analisi ed esportazioni dei dati con un impatto quasi azzerato sui carichi di lavoro esistenti nell'istanza Spanner di cui è stato eseguito il provisioning. Il servizio è costituito da cluster Spanner che Google gestisce a livello di regione. Per le query idonee che richiedono Data Boost, Spanner instrada il carico di lavoro a questi server in modo trasparente. Le query idonee sono quelle per le quali il primo operatore nel piano di esecuzione delle query è un'unione distribuita. Queste query non devono cambiare per sfruttare Data Boost.

Data Boost ha l'impatto maggiore nei seguenti scenari in cui vuoi evitare impatti negativi sul sistema transazionale esistente dovuti alla contesa delle risorse:

  • Query ad hoc o non frequenti che comportano l'elaborazione di grandi quantità di dati. Un esempio tipico è una query federata da BigQuery a Spanner.
  • Job di reporting o esportazione dati. Un esempio è un job Dataflow per esportare dati Spanner in Cloud Storage.

Il seguente diagramma illustra il modo in cui Data Boost si coordina con l'istanza Spanner per fornire risorse di calcolo indipendenti.

Data Boost nell'architettura di Spanner

Vantaggi

Data Boost offre i seguenti vantaggi:

  • Fornisce l'isolamento dei carichi di lavoro. Puoi eseguire query supportate sui dati più recenti con un impatto quasi zero sui carichi di lavoro transazionali esistenti, indipendentemente dalla complessità delle query o dalla quantità di dati elaborati.
  • Fornisce una latenza uguale o migliore.
  • Impedisce l'overprovisioning delle istanze Spanner solo per supportare query di analisi occasionali.
  • Offre un elevato grado di scalabilità con maggiore parallelismo delle query e scala in modo elastico con i carichi di burst.
  • Fornisce metriche complete, che consentono agli amministratori di identificare le query più costose e di determinare il componente di costo da ottimizzare. Gli amministratori possono quindi verificare l'impatto delle ottimizzazioni monitorando il consumo delle unità di elaborazione serverless della query nella prossima esecuzione.
  • Non richiede overhead operativo aggiuntivo. Non è necessario alcun servizio aggiuntivo da gestire, né pianificare la capacità o eseguire il provisioning, né attendere la scalabilità né manutenzione.

Autorizzazioni

Qualsiasi entità che esegue una query o un'esportazione che richiede Data Boost deve disporre dell'autorizzazione Identity and Access Management (IAM) spanner.databases.useDataBoost. Ti consigliamo di creare un ruolo IAM personalizzato basato su Cloud Spanner Database Reader (roles/spanner.databaseReader) e di aggiungere spanner.databases.useDataBoost.

Fatturazione e quote

Paghi solo per le unità di elaborazione effettive utilizzate dalle query eseguite su Data Boost. Gli amministratori possono impostare limiti di utilizzo per evitare sforamenti dei costi.

Passaggi successivi