Présentation de Data Boost

Spanner Data Boost est un service sans serveur entièrement géré qui fournit des ressources de calcul indépendantes pour les charges de travail Spanner compatibles. Data Boost vous permet d'exécuter des requêtes d'analyse et des exportations de données avec un impact quasiment nul sur les charges de travail existantes sur l'instance Spanner provisionnée. Le service se compose de clusters Spanner gérés par Google au niveau de la région. Pour les requêtes éligibles qui demandent Data Boost, Spanner achemine la charge de travail vers ces serveurs de manière transparente. Les requêtes éligibles sont celles pour lesquelles le premier opérateur du plan d'exécution des requêtes est une union distribuée. Vous n'avez pas besoin de modifier ces requêtes pour bénéficier de Data Boost.

Data Boost a plus d'impact dans les cas suivants, où vous souhaitez éviter tout impact négatif sur le système transactionnel existant en raison de conflits de ressources:

  • Requêtes ponctuelles ou peu fréquentes impliquant le traitement de grandes quantités de données Une requête fédérée entre BigQuery et Spanner en est un exemple type.
  • Jobs de création de rapports ou d'exportation de données Un job Dataflow permettant d'exporter des données Spanner vers Cloud Storage en est un bon exemple.

Le schéma suivant montre comment Data Boost se coordonne avec l'instance Spanner pour fournir des ressources de calcul indépendantes.

Data Boost dans l'architecture Spanner

Avantages

Data Boost offre les avantages suivants:

  • Permet d'isoler les charges de travail. Vous pouvez exécuter des requêtes compatibles sur les données les plus récentes avec un impact quasi nul sur les charges de travail transactionnelles existantes, indépendamment de la complexité des requêtes ou de la quantité de données traitées.
  • Fournit une latence égale ou supérieure.
  • Empêche le surprovisionnement des instances Spanner uniquement pour traiter les requêtes d'analyse occasionnelles.
  • Offre un haut degré d'évolutivité avec un parallélisme des requêtes plus important qui évolue de manière élastique en cas de charges intensives.
  • Fournit des métriques complètes qui permettent aux administrateurs d'identifier les requêtes les plus coûteuses et de déterminer la composante de coût à optimiser. Les administrateurs peuvent ensuite vérifier l'impact de leurs optimisations en surveillant la consommation d'unités de traitement sans serveur de la requête lors de sa prochaine exécution.
  • Ils ne nécessitent pas de coûts opérationnels supplémentaires. Vous n'avez aucun service supplémentaire à gérer, aucune planification ni aucun provisionnement de la capacité, aucun besoin d'attendre le scaling ni de maintenance.

Autorisations

Tout compte principal qui exécute une requête ou une exportation demandant Data Boost doit disposer de l'autorisation IAM (Identity and Access Management) spanner.databases.useDataBoost. Nous vous recommandons de créer un rôle IAM personnalisé basé sur Cloud Spanner Database Reader (roles/spanner.databaseReader) et d'y ajouter spanner.databases.useDataBoost.

Facturation et quotas

Vous ne payez que pour les unités de traitement réelles utilisées par les requêtes exécutées sur Data Boost. Les administrateurs peuvent définir des limites d'utilisation pour éviter les dépassements de coûts.

Étapes suivantes