Lorsque vous gérez des pics d'activité ou des événements à fort trafic dans le cloud, vous devez suivre trois phases clés :
- Préparation : effectuez des activités et des tâches pour préparer votre événement, y compris un examen de l'architecture, une planification de la capacité et la création de réservations.
- Exécution : lorsque votre événement commence, surveillez-le attentivement et réagissez en conséquence.
- Analyse : une fois votre événement terminé, analysez ce qui s'est bien passé, ce qui ne s'est pas bien passé et comment améliorer les événements futurs.
Vous devez comprendre et suivre certaines bonnes pratiques au cours de ces phases afin de pouvoir fournir vos services avec un temps d'arrêt minimal ou nul, sans dégradation des performances ni de l'expérience utilisateur pendant votre événement.
Préparation : détaillez votre processus de planification d'événements
Pendant la phase de préparation à un pic de capacité, vous devez contacter l'équipe chargée de votre compte ou votre TAM afin qu'ils vous aident à examiner votre architecture, à créer des diagrammes, à élaborer des calendriers et des checklists de lancement, à vérifier les quotas de service en fonction du profil de trafic prévu et à évaluer l'impact global sur vos projets.
La planification doit commencer bien avant la date de votre événement. Dans certains cas, il peut être nécessaire de commencer à planifier des mois à l'avance alors que votre service est encore en développement. Constituez une équipe qui pourra vous aider à examiner le workflow d'événement que vous proposez, l'audience attendue, vos exigences et vos critères de réussite, ainsi que la chaîne de diffusion média de bout en bout. La phase de préparation doit inclure des évaluations des risques, un plan d'atténuation et un examen de l'état opérationnel pour vous assurer que votre workflow est bien conçu.
Pour en savoir plus, consultez le Framework d'architectureGoogle Cloud , qui fournit des recommandations pour aider les architectes, les développeurs, les administrateurs et les autres professionnels du cloud à concevoir et à exploiter une topologie cloud sécurisée, efficace, résiliente, performante et économique.
Exécution : surveillez et réagissez lors de l'exécution
Lorsque votre pic d'activité ou votre événement de lancement commence, vous devez surveiller attentivement l'activité et réagir en conséquence. Une fois que vous avez configuré la surveillance, les alertes et la journalisation lors de la phase de préparation, vous pouvez surveiller le trafic, les journaux et les niveaux de quota critiques pour l'activité. Vous pouvez utiliser ces informations pour déterminer les causes premières et résoudre rapidement les problèmes. Pour en savoir plus, consultez Examiner les alertes et les tableaux de bord.
En cas de problème, il est essentiel de disposer d'un processus de gestion des incidents et d'escalade bien défini afin de réduire les efforts et le temps nécessaires pour l'identifier et le résoudre. Si ce n'est pas déjà fait, établissez un processus de gestion des incidents. Pour en savoir plus, consultez Se préparer à résoudre des problèmes pendant votre événement.
Analyse : examinez et documentez votre analyse
Une fois le pic d'activité ou l'événement de lancement terminé, examinez et analysez l'événement, puis documentez les enseignements que vous en avez tirés afin de pouvoir les appliquer à votre prochain événement majeur.
Concentrez-vous sur les points suivants :
Récapitulatif de la chronologie : identifiez le moment où votre trafic a commencé à augmenter et les événements clés (pics) au cours de la période concernée. Identifiez les problèmes qui se sont produits, le cas échéant.
Analyse des causes fondamentales : examinez les problèmes qui se sont produits. Y a-t-il quelque chose que vous ou Google Cloud auriez pu faire différemment ? Est-ce quelque chose à envisager pour le prochain événement ? Documentez les enseignements tirés et les étapes nécessaires pour améliorer les futures opérations.
Comparer les prédictions aux résultats réels : analysez votre prédiction de trafic par rapport au trafic réel que vous avez enregistré. Où des ressources supplémentaires étaient-elles nécessaires ? Où les ressources ont-elles été sous-utilisées ou inutiles ?
Rétrospective : partagez et examinez les informations précédentes avec les principales parties prenantes. Promouvez une culture sans blâme, où vous partez du principe que toutes les personnes impliquées avaient de bonnes intentions et où vous vous concentrez sur l'identification des causes contributives sans désigner d'individu ni d'équipe.