Créer une règle d'alerte pour un SLO

Cette page explique comment créer une règle d'alerte dans Cloud Monitoring pour un objectif de niveau de service (SLO, Service Level Objective) que vous créez dans Anthos Service Mesh.

Pour en savoir plus sur les SLO, consultez la page Présentation des objectifs de niveau de service.

Cloud Monitoring peut déclencher une alerte lorsqu'un service est sur le point d'enfreindre un SLO. Vous pouvez créer une règle d'alerte en fonction du taux de consommation de votre marge d'erreur. Toutes les alertes sur les marges d'erreur ont la même condition de base : un pourcentage spécifié de la marge d'erreur pour la période de conformité est consommé dans une période d'analyse, qui correspond à une durée, par exemple les 60 minutes précédentes. Lorsque vous créez la règle d'alerte, Anthos Service Mesh définit automatiquement la plupart des conditions de l'alerte en fonction des paramètres du SLO. Vous spécifiez la période d'analyse et le pourcentage de consommation.

Pour déterminer les valeurs à définir pour la période d'analyse et le pourcentage de consommation, vous devrez procéder à des essais et risquez même de faire quelques erreurs. Vous pouvez utiliser la période d'analyse par défaut de 60 minutes comme point de départ. Pour déterminer le pourcentage de consommation, surveillez le comportement du service pour voir quel pourcentage de la marge d'erreur totale (sur la période de conformité) a été utilisé au cours des 60 minutes précédentes. Vous souhaitez définir le pourcentage de consommation de sorte à ne pas consommer au cours de la période d'analyse plus de marge d'erreur que ce que vous pouvez vous permettre, mais vous ne voulez pas déclencher inutilement une alerte.

Par exemple, supposons que vous ayez créé un SLO portant le nom suivant : 95% < 300ms Latency in Calendar Week

Avec ce SLO, seuls 5 % du nombre total de requêtes par semaine peuvent avoir une latence supérieure à 300 ms. Si vous atteignez ou dépassez ces 5 %, la totalité de votre marge d'erreur est consommée. Si vous définissez la période d'analyse sur une heure, chaque période d'analyse correspond à 1/168 de votre période de conformité (il y a 168 heures dans une semaine). Voici comment calculer le pourcentage de consommation horaire qui ne dépasse pas la marge d'erreur totale pour la semaine : 5% ÷ 168 ≈ 0.03%

Étant donné que la latence de votre service peut varier en fonction de la charge ou d'autres conditions, le fait de définir un pourcentage de consommation de 0,03 % peut déclencher des alertes inutiles. Vous pouvez commencer par une valeur deux fois supérieure, soit 0,06 %, puis surveiller le service et ajuster la valeur si nécessaire.

Avant de commencer

Créez un SLO pour l'un de vos services.

Créer une règle d'alerte sur un SLO

  1. Accédez à l'onglet État d'un service :

    1. Dans Google Cloud Console, accédez à Anthos Service Mesh.

      Accéder à Anthos Service Mesh

    2. Sélectionnez le projet Google Cloud dans la liste déroulante de la barre de menu.

    3. Cliquez sur le service pour lequel vous souhaitez créer une règle d'alerte.

    4. Dans la barre de navigation de gauche, cliquez sur État.

  2. Cliquez sur le SLO pour lequel vous souhaitez créer une règle d'alerte.

  3. Dans la section État actuel du SLO à droite, cliquez sur le lien Créer une règle d'alerte.

    La boîte de dialogue Ajouter une condition s'affiche. Anthos Service Mesh renseigne automatiquement la condition Taux d'utilisation du SLO en fonction des paramètres du SLO. Configurez la condition Taux d'utilisation du SLO pour recevoir une alerte lorsque la marge d'erreur du SLO diminue trop rapidement. Vous devez vous assurer que vous recevez une alerte avant que la marge d'erreur du SLO ne soit totalement consommée.

    Capture d'écran de la boîte de dialogue d'ajout de condition Cloud Monitoring.

  4. Configurez la condition :

    1. Pour nommer la condition, cliquez sur le lien Titre suggéré pour utiliser le nom défini en fonction de votre SLO, ou saisissez le nom de la condition.
    2. Dans la section Cible, saisissez la période d'analyse dans le champ Lookback Duration (Durée de la période d'analyse) ou utilisez la valeur par défaut.
    3. Dans la section Configuration, saisissez le pourcentage de consommation dans le champ Seuil.
    4. Cliquez sur Enregistrer. La fenêtre Créer une règle d'alerte s'affiche.
  5. Configurez la règle d'alerte :

    1. Saisissez un nom de règle.
    2. La condition est automatiquement renseignée, mais vous pouvez également ajouter une autre condition.
    3. Si la règle d'alerte ne comporte qu'une seule condition, conservez la valeur par défaut Any condition is met (N'importe quelle condition est remplie) dans le champ Policy triggers (Déclencheurs de règle).
    4. Vous pouvez également configurer les sections Notifications et Documentation. Pour en savoir plus, consultez la page Gérer les règles d'alerte.
    5. Cliquez sur Enregistrer. La page Détails des règles s'affiche.
    6. Pour revenir au tableau de bord Anthos Service Mesh, cliquez sur le menu de navigation  et accédez à Anthos > Services.

Étapes suivantes