Créer une règle d'alerte pour un SLO
Cette page explique comment créer une règle d'alerte dans Cloud Monitoring pour un objectif de niveau de service (SLO, Service Level Objective) que vous créez dans Cloud Service Mesh.
Pour en savoir plus sur les SLO, consultez la page Présentation des objectifs de niveau de service.
Cloud Monitoring peut déclencher une alerte lorsqu'un service est sur le point d'enfreindre un SLO. Vous pouvez créer une règle d'alerte en fonction du taux de consommation de votre marge d'erreur. Toutes les alertes sur les marges d'erreur ont la même condition de base : un pourcentage spécifié de la marge d'erreur pour la période de conformité est consommé dans une période d'analyse, qui correspond à une durée, par exemple les 60 minutes précédentes. Lorsque vous créez la règle d'alerte, Cloud Service Mesh définit automatiquement la plupart des conditions de l'alerte en fonction des paramètres du SLO. Vous indiquez la période d'analyse et le pourcentage de consommation.
Pour déterminer les valeurs à définir pour la période d'analyse et le pourcentage de consommation, vous devrez procéder à des essais et risquez même de faire quelques erreurs. Vous pouvez utiliser la période d'analyse par défaut de 60 minutes comme point de départ. Pour déterminer le pourcentage de consommation, surveillez le comportement du service pour voir quel pourcentage de la marge d'erreur totale (sur la période de conformité) a été utilisé au cours des 60 minutes précédentes. Vous souhaitez définir le pourcentage de consommation de sorte à ne pas consommer au cours de la période d'analyse plus de marge d'erreur que ce que vous pouvez vous permettre, mais vous ne voulez pas déclencher inutilement une alerte.
Par exemple, supposons que vous ayez créé un SLO portant le nom suivant : 95% < 300ms Latency in Calendar Week
Avec ce SLO, seuls 5 % du nombre total de requêtes par semaine peuvent avoir une latence supérieure à 300 ms. Si vous atteignez ou dépassez ces 5 %, la totalité de votre marge d'erreur est consommée. Si vous définissez la période d'analyse sur une heure, chaque période d'analyse correspond à 1/168
de votre période de conformité (il y a 168 heures dans une semaine). Voici comment calculer le pourcentage de consommation horaire qui ne dépasse pas la marge d'erreur totale pour la semaine : 5%
÷ 168
≈ 0.03%
Étant donné que la latence de votre service peut varier en fonction de la charge ou d'autres conditions, le fait de définir un pourcentage de consommation de 0,03 % peut déclencher des alertes inutiles. Vous pouvez commencer par une valeur deux fois supérieure, soit 0,06 %, puis surveiller le service et ajuster la valeur si nécessaire.
Avant de commencer
Créez un SLO pour l'un de vos services.
Créer une règle d'alerte sur un SLO
Accédez à l'onglet État d'un service :
Dans la console Google Cloud, accédez à Cloud Service Mesh.
Sélectionnez le projet Google Cloud dans la liste déroulante de la barre de menu.
Cliquez sur le service pour lequel vous souhaitez créer une règle d'alerte.
Dans la barre de navigation de gauche, cliquez sur État.
Cliquez sur le SLO pour lequel vous souhaitez créer une règle d'alerte.
Dans la section État actuel du SLO à droite, cliquez sur le lien Créer une règle d'alerte.
La boîte de dialogue Ajouter une condition s'affiche. Cloud Service Mesh remplit automatiquement la condition Taux d'utilisation du SLO en fonction du dans le SLO. Configurez la condition Taux d'utilisation du SLO pour recevoir une alerte lorsque la marge d'erreur du SLO diminue trop rapidement. Toi vous devez recevoir une alerte avant que le SLO ne soit en état d'erreur du budget.
Configurez la condition :
- Pour nommer la condition, cliquez sur le lien Titre suggéré pour utiliser le nom défini en fonction de votre SLO, ou saisissez le nom de la condition.
- Dans la section Cible, saisissez la période d'analyse dans le champ Lookback Duration (Durée de la période d'analyse) ou utilisez la valeur par défaut.
- Dans la section Configuration, saisissez le pourcentage de consommation dans le champ Seuil.
- Cliquez sur Enregistrer. La fenêtre Créer une règle d'alerte s'affiche.
Configurez la règle d'alerte :
- Saisissez un nom de règle.
- La condition est automatiquement renseignée, mais vous pouvez également ajouter une autre condition.
- Si la règle d'alerte ne comporte qu'une seule condition, conservez la valeur par défaut Any condition is met (N'importe quelle condition est remplie) dans le champ Policy triggers (Déclencheurs de règle).
- Vous pouvez également configurer les sections Notifications et Documentation. Pour en savoir plus, consultez la page Gérer les règles d'alerte.
- Cliquez sur Enregistrer. La page Détails des règles s'affiche.
- Pour revenir au tableau de bord Cloud Service Mesh, cliquez sur l'icône Menu de navigation dehaze et accédez à Anthos > Services :
Étape suivante
Pour en savoir plus sur les alertes de l'ingénierie en fiabilité des sites (SRE) de Google, consultez les pages suivantes :