Créer des règles d'alerte basées sur les métriques pour SAP sur Google Cloud

Pour surveiller vos systèmes SAP sur Google Cloud, vous pouvez configurer des règles d'alerte Cloud Monitoring qui informent vos administrateurs SAP des éventuelles erreurs de configuration ou des défaillances de ressources.

Ce document décrit certains problèmes courants de haute disponibilité et explique comment créer des règles d'alerte pour ces problèmes, ou utilise les exemples d'alertes comme référence pour créer vos propres alertes personnalisées. Les exemples d'alertes décrits dans ce document utilisent le langage MQL (Monitoring Query Language) pour interroger les métriques générées par l'agent Google Cloud pour SAP. Bien que ces alertes s'appliquent par défaut à tous les systèmes SAP d'un projet Google Cloud donné, vous pouvez les personnaliser pour filtrer les SID requis ou ajuster le temps écoulé pour déclencher l'alerte.

Pour en savoir plus sur le fonctionnement des alertes Cloud Monitoring, consultez la section Présentation des alertes.

Avant de commencer

  • Assurez-vous de bien maîtriser les concepts généraux des règles d'alerte de surveillance. Pour en savoir plus sur les règles d'alerte, consultez la page Présentation des alertes.

  • Sur chaque instance qui héberge le système SAP que vous souhaitez surveiller, assurez-vous que l'agent Google Cloud pour SAP est installé et configuré pour collecter les métriques de surveillance des processus.

  • Pour obtenir les autorisations nécessaires pour créer et modifier des règles d'alerte à l'aide de la console Google Cloud, demandez à votre administrateur de vous accorder les rôles IAM suivants sur votre projet :

    Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

    Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

  • Pour recevoir les alertes, créez les canaux de notification requis. À des fins de redondance, nous vous recommandons de créer plusieurs canaux de notification. Pour en savoir plus, consultez la page Créer et gérer des canaux de notification.

Importer des règles d'alerte prédéfinies

Google Cloud fournit des règles d'alerte prédéfinies que vous pouvez importer et configurer pour certains problèmes courants de haute disponibilité. Pour plus d'informations, consultez les sections suivantes :

Importer des alertes pour la détection des contraintes d'emplacement

Lorsque vous déplacez manuellement une ressource dans un cluster Pacemaker à l'aide des commandes du cluster, cette ressource obtient une contrainte, ou une préférence client est définie pour favoriser un nœud particulier. Une telle situation peut empêcher le basculement de la ressource en cas de panne du système. Pour plus d'informations, consultez la section Déplacer une ressource de la documentation ClusterLabs.

Pour recevoir une notification concernant une telle situation dans votre système SAP HA s'exécutant sur Google Cloud, vous pouvez importer la règle d'alerte prédéfinie Pacemaker: Location constraint detected.

Cette règle d'alerte vous avertit lorsqu'une contrainte basée sur des préférences est détectée et renvoie vos administrateurs SAP à la section "Affinité involontaire des nœuds qui favorise un nœud particulier" du guide Résoudre les problèmes de configuration à haute disponibilité pour SAP. Cette règle utilise la métrique de surveillance des processus workload.googleapis.com/sap/validation/pacemaker, qui est collectée par l'agent Google Cloud pour SAP.

Pour importer cette règle d'alerte dans votre projet Google Cloud à l'aide de la console Google Cloud, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page Intégrations  :

    Accéder à la page Intégrations

    Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Surveillance.

  2. Filtrez sur Google Cloud Agent for SAP, puis cliquez sur Afficher les détails.
  3. Accédez à l'onglet Alertes.
  4. Sélectionnez Pacemaker: Location constraint detected, puis cliquez sur Afficher les options > Personnaliser la règle d'alerte.
  5. (Facultatif) Pour configurer des alertes pour un ou plusieurs systèmes SAP spécifiques plutôt que pour tous les systèmes SAP de votre projet Google Cloud, mettez à jour l'instruction filter dans l'éditeur de requête comme suit :
    1. Supprimez le caractère #.
    2. Spécifiez les SID requis. Pour spécifier plusieurs SID, séparez-les à l'aide du caractère |. Voici à quoi ressemble une telle instruction de filtre :
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Dans cet exemple, ABC, XYZ et HDB sont des SID.

  6. (Facultatif) Pour personnaliser la durée avant déclenchement d'une alerte, mettez à jour l'instruction window dans l'éditeur de requête pour spécifier votre unité de mesure favorite :
    1. Par exemple, pour définir une limite de temps de trois minutes, définissez
      | window 3m
       :
  7. Sous Détails de l'alerte, accédez à l'onglet Notifications et nom.
  8. Sélectionnez les canaux de notification requis.
  9. Examinez l'alerte et cliquez sur Créer une règle.

Importer des alertes pour la détection des défaillances de ressources

Dans votre système à haute disponibilité, si un agent de ressources en cours d'exécution rencontre un échec, Pacemaker tente d'arrêter cet agent et de le redémarrer. Si l'opération de redémarrage échoue pour une raison quelconque, Pacemaker définit la valeur failcount de cet agent de ressources sur INFINITY (si start-failure-is-fatal est défini sur true, qui est la valeur par défaut) puis tente de démarrer l'agent sur un nœud différent. Si l'agent de ressources ne démarre pas sur tous les nœuds, il reste à l'état Stopped. Pour que cet agent de ressource retrouve un état opérationnel, un administrateur SAP doit supprimer manuellement le nombre d'échecs de l'agent de ressource. Pour en savoir plus sur le comportement de Pacemaker en cas d'échec, consultez la documentation de ClusterLabs.

Pour recevoir une notification concernant une telle situation dans votre système SAP HA s'exécutant sur Google Cloud, vous pouvez importer la règle d'alerte prédéfinie Pacemaker: Resource failed to start.

Cette règle d'alerte vous avertit lorsqu'un agent de ressources ne parvient pas à démarrer et reste à l'état Stopped pendant plus de trois minutes. Cette règle renvoie votre administrateur SAP à la section "L'agent de ressources est arrêté" du guide Résoudre les problèmes de configuration à haute disponibilité pour SAP. Cette règle utilise la métrique de surveillance des processus workload.googleapis.com/sap/cluster/failcounts, qui est collectée par l'agent Google Cloud pour SAP.

Pour importer cette règle d'alerte dans votre projet Google Cloud à l'aide de la console Google Cloud, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page Intégrations  :

    Accéder à la page Intégrations

    Si vous utilisez la barre de recherche pour trouver cette page, sélectionnez le résultat dont le sous-titre est Surveillance.

  2. Filtrez sur Google Cloud Agent for SAP, puis cliquez sur Afficher les détails.
  3. Accédez à l'onglet Alertes.
  4. Sélectionnez Pacemaker: Resource failed to start, puis cliquez sur Afficher les options > Personnaliser la règle d'alerte.
  5. (Facultatif) Pour configurer des alertes pour un ou plusieurs systèmes SAP spécifiques plutôt que pour tous les systèmes SAP de votre projet Google Cloud, mettez à jour l'instruction filter dans l'éditeur de requête comme suit :
    1. Supprimez le caractère #.
    2. Spécifiez les SID requis. Pour spécifier plusieurs SID, séparez-les à l'aide du caractère |. Voici à quoi ressemble une telle instruction de filtre :
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Dans cet exemple, ABC, XYZ et HDB sont des SID.

  6. (Facultatif) Pour personnaliser la durée avant déclenchement d'une alerte, mettez à jour l'instruction window dans l'éditeur de requête pour spécifier votre unité de mesure favorite :
    1. Par exemple, pour définir une limite de temps de trois minutes, définissez
      | window 3m
       :
  7. Sous Détails de l'alerte, accédez à l'onglet Notifications et nom.
  8. Sélectionnez les canaux de notification requis.
  9. Examinez l'alerte et cliquez sur Créer une règle.

Créer une règle d'alerte personnalisée

Outre l'importation de règles d'alerte prédéfinies, vous pouvez mettre à jour les règles pour créer des règles personnalisées adaptées à vos besoins. Pour ce faire, vous pouvez utiliser la console Google Cloud, l'API Cloud Monitoring et Google Cloud CLI ou Terraform.

Pour commencer, nous vous recommandons de consulter le résumé des exemples de règles d'alerte, ainsi que les règles d'alerte préconfigurées décrites dans ce document.

Pour savoir comment gérer ou modifier des règles d'alerte, consultez Gérer des règles d'alerte.