Gérer la capacité et les quotas

Last reviewed 2023-08-21 UTC

Ce document du framework d'architecture Google Cloud vous explique comment évaluer et planifier votre capacité et vos quotas dans le cloud.

Dans un centre de données traditionnel, vous devez chaque trimestre consacrer un temps considérable à l'évaluation des besoins actuels en ressources et des besoins futurs. Vous devez tenir compte de problèmes physiques, logistiques et humains. Vous devez tenir compte des problématiques d'espace de stockage, de refroidissement, d'électricité, de bande passante, de câblage, de délais d'approvisionnement, de délais d'expédition et de nombre d'ingénieurs disponibles pour installer les nouveaux équipements. Vous devez également gérer activement la répartition de la capacité et des charges de travail pour que les tâches gourmandes en ressources (par exemple, les pipelines Hadoop) n'interfèrent pas avec les services qui doivent être hautement disponibles, comme les serveurs Web.

En revanche, lorsque vous utilisez Google Cloud, vous déléguez la majeure partie de ce travail de planification à Google. L'utilisation du cloud évite d'avoir à provisionner et à gérer des ressources inactives lorsqu'elles ne sont pas nécessaires. Par exemple, vous pouvez créer, faire évoluer et réduire des instances de VM en fonction de vos besoins. Grâce à la tarification à l'utilisation, vous pouvez optimiser vos dépenses, y compris la capacité excédentaire dont vous n'avez besoin que lors des pics de trafic. Pour vous aider à réaliser des économies, Compute Engine fournit des recommandations de type de machine lorsqu'il est détecté que certaines de vos instances de VM sont sous-utilisées et peuvent être redimensionnées ou supprimées.

Évaluer vos besoins en termes de capacité cloud

Pour gérer efficacement votre capacité, vous devez connaître les besoins en capacité de votre organisation.

Pour évaluer vos besoins en capacité, commencez par identifier vos charges de travail cloud les plus importantes. Évaluez les utilisations moyennes et maximales de ces charges de travail, ainsi que leurs besoins actuels et futurs en capacité.

Identifiez les équipes qui utilisent ces charges de travail principales. Collaborez avec ces équipes pour mettre en place un processus interne de planification de la demande. Utilisez ce processus pour mieux comprendre les besoins actuels et futurs des équipes en termes de ressources cloud.

Analysez le modèle de charge et la distribution des appels. Utilisez les métriques de pic d'activité sur les 30 derniers jours, par heure et par minute dans votre analyse.

Envisagez d'utiliser Cloud Monitoring pour bénéficier d'une visibilité sur les performances, la disponibilité et l'état général de vos applications et de votre infrastructure.

Afficher les métriques d'utilisation de votre infrastructure

Pour faciliter la planification des capacités, collectez et stockez des données d'historique d'utilisation des ressources cloud par votre organisation.

Assurez-vous de disposer d'une visibilité sur les métriques d'utilisation de l'infrastructure. Par exemple, pour les charges de travail principales, évaluez les éléments suivants :

  • Utilisation moyenne et maximale
  • Pics dans les modèles d'utilisation
  • Pics saisonniers basés sur les exigences commerciales (périodes de vacances pour les sites marchands par exemple)
  • Surprovisionnement nécessaire pour se préparer aux événements de pic d'activité et gérer rapidement les pics de trafic potentiels

Assurez-vous que votre organisation a configuré des alertes pour être informé automatiquement lorsque vous approchez des limites de quota et de capacité.

Utilisez les outils de surveillance de Google pour obtenir des informations sur l'utilisation et la capacité des applications. Par exemple, vous pouvez définir des métriques personnalisées avec Monitoring. Utilisez ces métriques personnalisées pour définir des tendances d'alertes. Stackdriver Monitoring fournit également des tableaux de bord flexibles et des outils de visualisation complets pour vous aider à identifier les problèmes émergents.

Créer un processus de planification de la capacité

Mettez en place un processus de planification de la capacité et documentez-le.

Lorsque vous créez ce processus, procédez comme suit :

  1. Mettez en œuvre des tests de charge pour déterminer la charge que le système peut gérer tout en atteignant ses objectifs de latence, avec une quantité fixe de ressources. Les tests de charge doivent utiliser une combinaison de types de requêtes représentative du profil de trafic de production généré par de vrais utilisateurs. N'utilisez pas une combinaison d'opérations uniforme ou aléatoire. Incluez des pics d'utilisation dans votre profil de trafic.
  2. Créez un modèle de capacité. Un modèle de capacité est un ensemble de formules permettant de calculer les ressources incrémentielles requises en fonction de l'augmentation de la charge du service, conformément aux conclusions des tests de charge.
  3. Prévoyez le trafic futur et tenez compte de la croissance. Pour découvrir comment Google crée ses prévisions de trafic, consultez l'article Mesurer les charges futures.
  4. Appliquez le modèle de capacité à la prévision pour déterminer les besoins futurs en ressources.
  5. Estimez le coût des ressources dont votre organisation a besoin. Ensuite, faites approuver le budget par le service financier de votre organisation. Cette étape est essentielle, car l'entreprise peut choisir de faire des compromis en matière de coûts et de risques pour une gamme de produits. Ces compromis peuvent signifier que vous disposez d'une capacité inférieure ou supérieure aux prévisions pour un produit donné, en fonction des priorités commerciales.
  6. Rapprochez-vous de votre fournisseur cloud pour obtenir une quantité adéquate de ressources lorsque vous en avez besoin grâce aux quotas et aux réservations. Faites appel aux équipes d'infrastructure pour la planification de la capacité et demandez aux équipes opérationnelles de créer des plans de capacité avec des intervalles de confiance.
  7. Répétez les étapes précédentes tous les trimestres ou semestres.

Pour obtenir des conseils plus détaillés sur le processus de planification de la capacité tout en optimisant l'utilisation des ressources, consultez la section Planification des capacités.

Vérifier que vos quotas correspondent à vos besoins en capacité

Google Cloud applique des quotas pour limiter la quantité d'une ressource Google Cloud partagée spécifique que vous pouvez utiliser. Chaque quota représente une ressource dénombrable spécifique, telle que les appels d'API à un service particulier, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Par exemple, les quotas permettent de garantir qu'un petit nombre de clients ou de projets ne va pas monopoliser les cœurs de processeur dans une région ou une zone donnée.

Lorsque vous évaluez vos quotas, tenez compte des points suivants :

  • Planifiez à l'avance les besoins en termes de capacité des projets afin d'éviter toute limitation inattendue de la consommation de ressources.
  • Configurez votre quota et votre capacité de manière à pouvoir gérer une défaillance régionale complète.
  • Utilisez les quotas pour limiter la consommation d'une ressource particulière. Par exemple, vous pouvez définir un quota maximal d'utilisation quotidienne des requêtes pour l'API BigQuery afin de vous assurer qu'un projet ne consomme pas trop de ressources BigQuery.
  • Prévoyez les pics d'utilisation et incluez-les dans votre planification de quotas. Des pics d'utilisation peuvent survenir tout au long de la journée au gré de pics de trafic (prévus ou non) ou lors d'événements de lancement. Pour en savoir plus sur la planification pour les pics de trafic et les événements de lancement, consultez la section suivante intitulée "Excellence opérationnelle : Planifier les pics de trafic et les événements de lancement".

Si vos quotas actuels ne sont pas suffisants, vous pouvez gérer vos quotas dans la console Google Cloud. Si vous avez besoin d'une grande capacité, contactez votre équipe commerciale Google Cloud. Cependant, vous devez savoir que de nombreux services font également l'objet de limites qui ne sont pas liées au système de quotas. Pour en savoir plus, consultez la page Les quotas et leur utilisation.

Évaluez régulièrement vos quotas. Envoyez les demandes de quota avant qu'elles ne soient nécessaires. Consultez la page Les quotas et leur utilisation pour mieux comprendre comment les demandes sont approuvées ou refusées.

Il existe plusieurs façons d'afficher et de gérer votre quota Google Cloud :

Étape suivante