Panoramica di Data Boost

Spanner Data Boost è un servizio serverless completamente gestito che fornisce risorse di computing indipendenti per i carichi di lavoro Spanner supportati. Data Boost consente di eseguire query di analisi ed esportazioni di dati con un impatto prossimo allo zero sui carichi di lavoro esistenti sull'istanza di Spanner di cui è stato eseguito il provisioning. Il servizio è costituito da cluster Spanner che Google gestisce a livello di regione. Per le query idonee che richiedono Data Boost, Spanner instrada il carico di lavoro a questi server in modo trasparente. Le query idonee sono quelle per cui il primo operatore nel piano di esecuzione delle query è un'unione distribuita. Non è necessario modificare queste query per utilizzare Data Boost.

Data Boost ha l'impatto maggiore negli scenari seguenti in cui vuoi evitare impatti negativi sul sistema transazionale esistente a causa della contesa delle risorse:

  • Query ad hoc o non frequenti che prevedono l'elaborazione di grandi quantità di dati. Un esempio tipico è una query federata da BigQuery a Spanner.
  • Job di reporting o di esportazione dati. Un esempio è un job Dataflow per esportare i dati Spanner in Cloud Storage.

Il seguente diagramma illustra in che modo Data Boost si coordina con l'istanza Spanner per fornire risorse di calcolo indipendenti.

Data Boost nell'architettura Spanner

Vantaggi

Data Boost offre i seguenti vantaggi:

  • Fornisce l'isolamento dei carichi di lavoro. Puoi eseguire query supportate sui dati più recenti con un impatto quasi pari a zero sui carichi di lavoro transazionali esistenti, indipendentemente dalla complessità delle query o dalla quantità di dati elaborati.
  • Offre una latenza uguale o migliore.
  • Impedisce l'over-provisioning delle istanze Spanner solo per supportare query di analisi occasionali.
  • Offre un elevato livello di scalabilità con un maggiore parallelismo delle query, in grado di scalare in modo elastico con i carichi di burst.
  • Fornisce metriche complete, che consentono agli amministratori di identificare le query più costose e di determinare il componente di costo da ottimizzare. Gli amministratori possono quindi verificare l'impatto delle ottimizzazioni monitorando il consumo dell'unità di elaborazione serverless della query nell'esecuzione successiva.
  • Non richiede costi operativi aggiuntivi. Nessun servizio aggiuntivo da gestire, nessuna pianificazione o provisioning della capacità, non è necessario attendere la scalabilità e nessuna manutenzione.

Autorizzazioni

Qualsiasi entità che esegue una query o un'esportazione che richiede Data Boost deve disporre dell'autorizzazione Identity and Access Management (IAM) spanner.databases.useDataBoost. Ti consigliamo di creare un ruolo IAM personalizzato basato su Cloud Spanner Database Reader (roles/spanner.databaseReader) e di aggiungere spanner.databases.useDataBoost.

Fatturazione e quote

Paghi solo per le unità di elaborazione effettive utilizzate dalle query eseguite su Data Boost. Gli amministratori possono impostare limiti di utilizzo per evitare sforamenti dei costi.

Passaggi successivi