Présentation de Data Boost

Spanner Data Boost est un service sans serveur entièrement géré qui fournit des ressources de calcul indépendantes pour les charges de travail Spanner compatibles. Data Boost vous permet d'exécuter des requêtes d'analyse et des exportations de données avec un impact quasiment nul sur les charges de travail existantes sur l'instance Spanner provisionnée. Le service se compose de clusters Spanner que Google gère au niveau de la région. Pour les requêtes éligibles qui demandent Data Boost, Spanner achemine la charge de travail vers ces serveurs de manière transparente. Les requêtes éligibles sont celles pour lesquelles le premier opérateur du plan d'exécution de la requête est une union distribuée. Vous n'avez pas besoin de modifier ces requêtes pour tirer parti de Data Boost.

Data Boost a le plus d'impact dans les scénarios suivants, où vous souhaitez éviter tout impact négatif sur le système transactionnel existant lié à des conflits de ressources:

  • Requêtes ad hoc ou peu fréquentes qui impliquent le traitement de grandes quantités de données. Une requête fédérée entre BigQuery et Spanner en est un exemple typique.
  • Jobs de création de rapports ou d'exportation de données Prenons l'exemple d'un job Dataflow pour exporter des données Spanner vers Cloud Storage.

Le schéma suivant montre comment Data Boost se coordonne avec l'instance Spanner pour fournir des ressources de calcul indépendantes.

Data Boost dans l'architecture Spanner

Avantages

Data Boost offre les avantages suivants:

  • Fournit une isolation des charges de travail. Vous pouvez exécuter des requêtes compatibles sur les données les plus récentes avec un impact quasi nul sur les charges de travail transactionnelles existantes, quelle que soit la complexité des requêtes ou la quantité de données traitées.
  • Fournit une latence égale ou supérieure.
  • Empêche le surprovisionnement des instances Spanner uniquement pour accepter les requêtes d'analyse occasionnelles.
  • Offre un haut niveau d'évolutivité avec un parallélisme des requêtes plus élevé, qui évolue de manière élastique avec les charges intensives.
  • Fournit des métriques complètes, qui permettent aux administrateurs d'identifier les requêtes les plus coûteuses et de déterminer la composante de coût à optimiser. Les administrateurs peuvent ensuite vérifier l'impact de leurs optimisations en surveillant la consommation d'unités de traitement sans serveur de la requête lors de sa prochaine exécution.
  • Aucuns frais opérationnels supplémentaires ne sont requis. Vous n'avez pas besoin de gérer de service supplémentaire, ni de planifier ni de provisionner la capacité, d'attendre la mise à l'échelle et aucune maintenance.

Autorisations

Tout compte principal qui exécute une requête ou une exportation nécessitant Data Boost doit disposer de l'autorisation IAM (Identity and Access Management) spanner.databases.useDataBoost. Nous vous recommandons de créer un rôle IAM personnalisé basé sur Cloud Spanner Database Reader (roles/spanner.databaseReader) et d'y ajouter spanner.databases.useDataBoost.

Facturation et quotas

Vous ne payez que pour les unités de traitement réelles utilisées par les requêtes exécutées sur Data Boost. Les administrateurs peuvent définir des limites d'utilisation pour éviter les dépassements de coûts.

Étapes suivantes