Planifier les pics de trafic et les événements de lancement

Last reviewed 2023-06-25 UTC

Ce document du framework d'architecture Google Cloud vous explique comment planifier les pics de trafic et les événements de lancement afin d'éviter toute perturbation de votre activité.

Les événements de pic d'activité sont des événements commerciaux majeurs qui entraînent une augmentation significative du trafic au-delà de référence standard de l'application. Ces événements de pic d'activité nécessitent un scaling planifié.

Par exemple, les entreprises de vente au détail qui ont une présence en ligne peuvent s'attendre à des événements de pic d'activité pendant les fêtes de fin d'année. Le Black Friday, qui a lieu le lendemain de Thanksgiving aux États-Unis, est l'un des jours les plus importants de l'année en termes de ventes. Pour le secteur de la santé aux États-Unis, les mois d'octobre et novembre peuvent connaître des pics d'activité en raison des pics de trafic en ligne liés aux inscriptions aux prestations sociales.

Les événements de lancement sont des déploiements ou des migrations majeures de nouvelles fonctionnalités en production. Par exemple, une migration depuis une infrastructure sur site vers le cloud, ou un lancement d'un nouveau service ou d'une nouvelle fonctionnalité.

Si vous lancez un nouveau produit, vous devrez vous attendre à une augmentation de la charge de vos systèmes pendant et potentiellement après l'annonce. Ces événements peuvent souvent multiplier la charge par 5 ou 20 (voire plus) sur les systèmes de frontend. Cette charge accrue se répercute aussi sur les systèmes backend. Souvent, ces charges de frontend et de backend sont caractérisées par un scaling rapide sur une courte période lorsque le trafic Web est ouvert pour l'événement. Les événements de lancement impliquent une diminution progressive du trafic jusqu'à revenir à des niveaux normaux. Cette baisse est généralement plus lente que le scaling réalisé pour s'adapter au pic de trafic.

Les événements de pic d'activité et de lancement se décomposent en trois étapes :

  • Planification et préparation de l'événement de lancement ou du pic de trafic
  • Lancement de l'événement
  • Évaluation des performances pendant l'événement et analyse post-événement

Les pratiques décrites dans le présent document vous aideront à garantir le bon déroulement de chacune de ces étapes.

Créer un guide général pour les événements de lancement ou de pic de trafic

Élaborez un guide général avec une vision à long terme des événements de pic d'activité actuels et futurs. Continuez à compiler vos apprentissages dans ce guide afin de pouvoir vous en servir de référence pour les futurs événements de pic d'activité.

Planifier votre événement de lancement ou de pic de trafic

Planifiez et préparez-vous. Créez des projections commerciales pour les lancements à venir et pour les événements de pic d'activité attendus (ou inattendus). La préparation de votre système en vue des pics d'activité dépend de votre compréhension des projections commerciales. Plus vous en savez sur les prévisions passées, plus vous améliorerez la précision de vos nouvelles prévisions commerciales. Ces nouvelles prévisions sont des éléments essentiels à la projection de la demande attendue sur le système.

Créer des équipes en charge de la gestion du programme et de la planification coordonnée (au sein de votre organisation et avec les fournisseurs tiers) est un facteur clé de la réussite. Créez ces équipes le plus tôt possible pour que votre équipe en charge de la gestion du programme puisse définir un calendrier, faire approuver des budgets et collecter des ressources pour l'infrastructure, les tests et les formations supplémentaires.

Il est important de mettre en place des canaux de communication clairs. La communication est essentielle à chaque étape de l'événement de lancement ou de pic de trafic. Abordez les risques et les sujets de préoccupation le plus tôt possible et solutionnez les problèmes avant qu'ils ne créent un blocage. Créez une documentation de planification des événements. Condensez les informations les plus importantes sur l'événement de pic d'activité et faites-les circuler dans l'entreprise. Cela permettra aux utilisateurs d'intégrer les informations de planification et de répondre aux questions de base. Ce document aide les nouveaux collaborateurs à se mettre à jour rapidement sur la planification des événements de pic d'activité.

Documentez votre plan pour chaque événement. Lorsque vous documentez votre plan, assurez-vous d'effectuer les actions suivantes :

  • Identifiez les hypothèses, les risques et les inconnues.
  • Passez en revue les événements passés et déterminez les informations pertinentes pour l'événement de lancement ou de pic d'activité à venir. Déterminez les données disponibles et la valeur qu'elles ont fournie par le passé.
  • Détaillez le plan de rollback pour les événements de lancement et de migration.
  • Passez en revue l'architecture :
    • Documentez les ressources clés et les composants architecturaux.
    • Servez-vous du framework d'architecture pour examiner tous les aspects de l'environnement afin de déterminer les risques et les problématiques de scaling.
    • Créez un schéma montrant comment les principaux composants de l'architecture sont connectés. L'examen du diagramme peut vous aider à isoler les problèmes et à en accélérer la résolution.
  • Le cas échéant, configurez le service pour qu'il utilise des actions d'alerte afin de redémarrer automatiquement en cas d'échec. Lorsque vous utilisez Compute Engine, envisagez d'utiliser l'autoscaling pour gérer les pics de débit.
  • Utilisez les réservations pour vous assurer que les ressources Compute Engine sont disponibles lorsque vous en avez besoin. Les réservations offrent un niveau très élevé d'assurance pour l'obtention de capacité de ressources zonales Compute Engine. Vous pouvez utiliser des réservations pour vous assurer que votre projet dispose de ressources disponibles.
  • Identifiez les métriques et les alertes à suivre :
    • Identifiez les métriques métier et système à surveiller pour l'événement. Si des métriques ou des indicateurs de niveau de service (SLI) ne sont pas collectés, modifiez le système pour collecter les données.
    • Vérifiez que vous disposez de capacités de surveillance et d'alerte suffisantes, et que vous avez bien passé en revue les modèles de trafic normaux et des événements précédents. Assurez-vous que les alertes sont définies de manière appropriée. Utilisez les outils Google Cloud Monitoring pour afficher l'utilisation, la capacité et l'état général de vos applications et de votre infrastructure.
    • Assurez-vous que les métriques système sont capturées en incluant les données de surveillance et les niveaux d'alerte.
  • Passez en revue les besoins de capacité accrue avec l'équipe responsable du compte Google Cloud et planifiez la gestion des quotas en fonction. Pour plus de détails, consultez la section Vérifier que vos quotas correspondent à vos besoins.
  • Assurez-vous de disposer de niveaux d'assistance cloud appropriés, que votre équipe comprend comment ouvrir les demandes d'assistance et qu'une procédure de remontée d'assistance est définie. Pour en savoir plus, consultez l'article Établir des procédures d'assistance et de remontée d'assistance cloud.
  • Définissez un plan de communication, un calendrier et des responsabilités :
    • Impliquez des parties prenantes pluridisciplinaires pour coordonner la communication et la planification du programme. Ces parties prenantes peuvent inclure des personnes pertinentes issues des équipes techniques, opérationnelles et dirigeantes, ainsi que des fournisseurs tiers.
    • Établissez une chronologie non ambiguë qui indique les tâches critiques et les équipes en charge de ces tâches.
    • Mettez en place une matrice d'affectation des responsabilités (RACI) pour communiquer les responsabilités aux équipes, chefs d'équipe, parties prenantes et parties responsables.
    • Vous pouvez utiliser le service de gestion des événements de l'assistance Premium pour les événements de pic d'activité planifiés. Grâce à ce service, Customer Care s'associe à votre équipe pour créer un plan et vous conseiller au cours de l'événement.

Mettre en place des processus d'examen

Une fois l'événement de lancement ou de pic de trafic terminé, faites un bilan en documentant vos apprentissages. Ensuite, mettez à jour votre guide pour inclure ces apprentissages. Pour finir, appliquez ces apprentissages lors de votre prochain événement majeur. Il est important de tirer des leçons des événements passés, en particulier lorsqu'ils mettent en évidence les contraintes subies par le système lorsqu'il est fortement sollicité.

Les examens rétrospectifs (également appelés post-mortems) des événements de lancement ou de pic de trafic sont une technique utile pour capturer des données et mieux comprendre les incidents. Effectuez cet examen pour les événements de lancement et de pic de trafic qui se sont déroulés comme prévu, ainsi que pour les incidents qui ont entraîné des problèmes. Cette démarche permet de cultiver une culture irréprochable.

Pour en savoir plus sur les analyses post-mortem, consultez la page Culture du postmortem : apprendre de ses échecs.

Étape suivante

  • Créer une culture d'automatisation (document suivant de cette série)
  • Explorez d'autres catégories du framework d'architecture, telles que la conception système, la sécurité, la confidentialité, la conformité, la fiabilité, l'optimisation des coûts et l'optimisation des performances.