Présentation de l'autoscaling

Cette page explique le fonctionnement de l'autoscaling dans Spanner et présente les deux types d'autoscaling dans Spanner.

Scaling de Spanner

Lorsque vous créez une instance Spanner, vous choisissez le nombre de nœuds de capacité de calcul ou unités de traitement à utiliser lors de l'inférence des données. Cependant, il arrive que la charge de travail augmenter ou diminuer. Le scaling d'une instance est le processus d'ajout ou de suppression. de la capacité de calcul en réponse aux changements dans la charge de travail ou les données de l'instance des besoins de stockage.

Il peut être utile de faire évoluer votre instance Spanner en fonction de métriques telles que l'utilisation du processeur par l'instance. Par exemple, si votre instance est soumise à un cluster et que l'utilisation du processeur est élevée, vous pouvez ajouter temporairement de la capacité de calcul et le supprimer à nouveau lorsque son utilisation du CPU chute. Supprimer la capacité de calcul du par exemple lorsqu'il n'est pas très utilisé, réduit les coûts.

Vous ne pouvez pas résoudre tous les problèmes de performances Spanner en ajoutant de la capacité de calcul. Par exemple, le scaling à la hausse d'une instance ne peut pas résoudre les problèmes qui ne sont pas liés à la taille de l'instance, comme les conflits de verrouillage le hotspotting.

Deux options s'offrent à vous pour effectuer le scaling de votre instance Spanner pour répondre aux évolutions de la charge de travail:

  • Configurez votre instance manuellement pour ajouter ou supprimer de la capacité de calcul.
  • Configurez l'autoscaling sur votre instance afin que la capacité de calcul et effectue un scaling automatique à la hausse ou à la baisse en fonction des niveaux de charge de travail.

Pour l'autoscaling, vous disposez des options suivantes:

Les exigences figurant sur cette page s'appliquent à la fois à la fonctionnalité d'autoscaling géré et à Open Source Autoscaler.

Quand utiliser l'autoscaling

L'autoscaling présente les avantages suivants :

  • Coûts:l'autoscaling réduit la capacité de calcul de votre instance. Ce peut vous aider à éviter le surprovisionnement.
  • Performances:l'autoscaling permet à Spanner d'ajouter automatiquement de la capacité de calcul à une instance lorsqu'une charge de travail change ou qu'une d'augmentation des exigences de stockage des données. Cela permet de gérer la charge de travail de performances en s'assurant que l'instance dispose de suffisamment de ressources pour répondre aux besoins en termes d'utilisation du processeur et de stockage.
  • Automatisation:l'autoscaling réduit la complexité de la gestion. Vous n'avez pas besoin de surveiller et d'ajuster la taille de l'instance manuellement. Avec l'autoscaling géré, vous n'écrivez pas d'application pour effectuer ces tâches, Le service Spanner les gère pour vous.

L'autoscaling est souvent le meilleur choix dans les situations suivantes :

  • Des tendances constantes de trafic diurne ou cyclique, telles que celles générées par des systèmes de banque en ligne.
  • Nouvelles applications qui attendent une croissance organique.
  • Charges de travail nouvelles sur Spanner.

Bien que Spanner ajoute rapidement de la capacité de calcul lorsque le trafic l'augmentation de la capacité supplémentaire peut prendre du temps.

Étape suivante