Optimiser vos ressources cloud

Avant votre événement de pic de capacité, gérez et optimisez les ressources utilisées par vos charges de travail Google Cloud . Cela implique de dimensionner les ressources de manière appropriée en fonction de l'utilisation réelle et de la demande, d'utiliser l'autoscaling pour l'allocation dynamique des ressources et d'examiner les recommandations en matière d'architecture et de sécurité. Cloud Monitoring et l'outil de recommandation (Active Assist) peuvent vous aider à identifier les opportunités d'optimisation de vos ressources cloud. Grâce à ces outils, vous pouvez obtenir des informations sur l'utilisation des ressources et prendre des décisions éclairées avant votre événement.

Consulter les bonnes pratiques Google Cloud

Vous pouvez éviter de nombreux problèmes liés aux pics de capacité maximale en suivant les bonnes pratiques recommandées pour le produit Google Cloud que vous utilisez. Voici quelques exemples de guides de bonnes pratiques :

Général
BigQuery
Cloud Storage
Compute Engine
Dataflow
Dataproc
Google Kubernetes Engine

Examiner l'évolutivité

L'autoscaling peut garantir que vos applications dans le cloud disposent des ressources nécessaires pour gérer des charges de travail variables, tout en évitant le surprovisionnement et les coûts inutiles. Google Cloud propose plusieurs options d'autoscaling spécifiques aux produits, y compris les suivantes :

  • Les groupes d'instances gérés (MIG) Compute Engine sont des groupes de VM gérés et mis à l'échelle comme une seule entité. Avec les MIG, vous pouvez définir des règles d'autoscaling qui spécifient le nombre minimal et le nombre maximal de VM à maintenir dans le groupe, ainsi que les conditions qui déclenchent l'autoscaling.
  • L'autoscaling Google Kubernetes Engine (GKE) ajuste dynamiquement les ressources de votre cluster en fonction des besoins de votre application. Il propose des outils permettant d'optimiser l'utilisation des ressources, d'assurer les performances des applications et de simplifier la gestion des clusters.
  • Cloud Run propose un autoscaling intégré, qui ajuste automatiquement le nombre d'instances en fonction du trafic entrant.

Avant votre événement, nous vous recommandons d'effectuer manuellement un scaling à la hausse. Même si vous avez configuré l'autoscaling, il est possible qu'il ne puisse pas répondre à la demande en raison de la vélocité du trafic d'événements. Préchauffez donc les ressources, y compris les suivantes :

  • Machines virtuelles
  • Mise en cache si vous souhaitez précharger
  • Composants sans serveur pour éviter les démarrages à froid

Examiner les recommandations Active Assist

Active Assist fait référence au portefeuille d'outils utilisé dansGoogle Cloud pour générer des recommandations et des insights afin de vous aider à optimiser vos projets Google Cloud . Pour en savoir plus, consultez la présentation d'Active Assist.

Vérifier les versions de vos produits

Assurez-vous que tous vos produits et services cloud sont à jour et utilisent la dernière version stable.

Examiner les alertes et les tableaux de bord

Identifiez et résolvez les problèmes de manière proactive en évaluant les alertes et les tableaux de bord fournis par les outils Google Cloud Observability et les solutions tierces.

Consultez vos métriques, journaux et traces Google Cloud Observability pour obtenir des insights sur l'utilisation des ressources, les caractéristiques de performances et l'état général de vos ressources. Surveillez les métriques importantes qui correspondent aux indicateurs d'état du système, tels que l'utilisation du processeur, de la mémoire, le trafic réseau, les E/S disque et les temps de réponse des applications. Vous devez également tenir compte des métriques spécifiques à votre activité. En suivant ces métriques, vous pouvez identifier les goulots d'étranglement potentiels, les problèmes de performances et les contraintes liées aux ressources. Vous pouvez également configurer des alertes pour avertir de manière proactive les équipes concernées en cas d'anomalies ou de problèmes potentiels.

Pour les alertes, concentrez-vous sur les métriques critiques, définissez des seuils appropriés pour minimiser la fatigue liée aux alertes et assurez-vous de répondre rapidement aux problèmes importants. Cette approche ciblée vous permet de maintenir de manière proactive la fiabilité des charges de travail. Pour en savoir plus, consultez la présentation des alertes.

Étape suivante