Surveiller des processus à l'aide de l'agent Google Cloud pour SAP

Ce guide de planification se concentre uniquement sur la fonctionnalité de collecte des métriques de surveillance des processus de l'agent Google Cloud pour SAP. Pour en savoir plus sur l'agent et toutes ses fonctionnalités, consultez le Guide de planification de l'agent Google Cloud pour SAP.

Sous Linux, l'agent Google Cloud pour SAP peut vous aider à surveiller les processus de vos applications SAP et leurs états d'exécution. Ce service est assuré via la collecte des métriques de surveillance des processus, que vous pouvez activer après l'installation de l'agent sur vos instances de VM Compute Engine ou vos serveurs de solution Bare Metal.

Les informations collectées dans les métriques de surveillance des processus vous aident à résoudre les problèmes liés à votre système SAP. En cas de problème, le Cloud Customer Care peut vous aider à résoudre les problèmes plus efficacement grâce aux métriques de surveillance des processus. Les données collectées à l'aide des métriques de surveillance des processus offrent une visibilité sur vos configurations de cluster SAP HANA à haute disponibilité.

Pour en savoir plus sur la configuration de l'agent Google Cloud pour SAP afin de collecter les métriques de surveillance de processus, consultez la section Configurer la collecte de métriques de surveillance de processus.

Types de métriques de surveillance des processus

À partir de la version 2.6 de l'agent Google Cloud pour SAP, les métriques de surveillance des processus collectées par l'agent sont désignées comme suit :

  • Métriques à changement rapide : incluent sap/hana/availability, sap/hana/ha/availability et sap/nw/availability. Ces métriques sont collectées à une fréquence par défaut de 5 secondes. Cette fréquence de collecte peut être mise à jour à l'aide du paramètre de configuration process_metrics_frequency.
  • Métriques à évolution lente : les métriques Cloud Monitoring autres que celles à évolution rapide sont appelées métriques à évolution lente. Ces métriques sont collectées à une fréquence par défaut de 30 secondes. Cette fréquence de collecte peut être mise à jour à l'aide du paramètre de configuration slow_process_metrics_frequency.

Tarifs de Cloud Monitoring

Les métriques de surveillance des processus que l'agent Google Cloud pour SAP collecte et envoie à Monitoring sont classées par Monitoring comme des métriques facturables dont les tarifs dépendent du volume ingéré.

La fréquence à laquelle l'agent interroge vos systèmes SAP pour collecter les métriques de surveillance des processus affecte le volume de métriques envoyées à Monitoring.

Les métriques de surveillance des processus évoluent rapidement et sont collectées par défaut toutes les cinq secondes.

Pour en savoir plus sur les tarifs de Monitoring, consultez la page Tarifs de Google Cloud Observability.

Exemple d'estimation des coûts

Pour afficher un exemple d'estimation des coûts pour la collecte des métriques de surveillance des processus à l'aide de l'agent Google Cloud pour SAP, consultez la section Exemple de tarification des métriques facturées par octets ingérés.

Métriques de surveillance des processus

Le tableau suivant décrit les métriques de surveillance des processus collectées par l'agent Google Cloud pour SAP. Les chaînes de métriques de ce tableau doivent être précédées du préfixe workload.googleapis.com/. Ce préfixe a été omis dans les entrées du tableau suivant.

Métrique Catégorie Description
sap/hana/service SAP HANA Code de réponse numérique pour la disponibilité du service SAP HANA.
  • 0 : le service n'est pas en cours d'exécution
  • 1 : Le service est en cours d'exécution
sap/hana/ha/replication SAP HANA Code de réponse numérique pour la réplication du système SAP HANA, basé sur l'ID de système SAP, le numéro d'instance SAP et le nom du service SAP.
  • 0 : une erreur s'est produite.
  • 10 : la réplication est désactivée (mode autonome).
  • 12 : la réplication est active. Le nœud actuel est le nœud secondaire.
  • 15 : la réplication est active. L'initialisation ou la synchronisation avec l'instance principale est terminée, et l'instance secondaire est en cours de réplication en continu.
sap/hana/availability SAP HANA Code de réponse numérique pour la disponibilité du système SAP HANA, basé sur l'ID de système SAP et le numéro d'instance SAP.
  • 0 : un ou plusieurs processus ne sont pas actifs
  • 1 : tous les processus sont actifs
sap/hana/ha/availability SAP HANA Code de réponse numérique pour l'état de haute disponibilité du système SAP HANA, basé sur l'ID de système SAP et le numéro d'instance SAP.
  • 0 : état inconnu
  • 1 : le nœud actuel est secondaire
  • 2 : le nœud principal comporte une erreur
  • 3 : le nœud principal est en ligne, mais la réplication n'est pas entièrement fonctionnelle
  • 4 : le nœud principal est en ligne avec la réplication en cours d'exécution
sap/hana/query/state SAP HANA Code de réponse numérique représentant la vérification de l'état de SAP HANA en fonction de la requête select * from dummy. La valeur 0 indique que la fonction a bien été exécutée. Les autres valeurs indiquent les échecs.
sap/hana/query/overalltime SAP HANA Signalé uniquement si query/state vaut 0. Il s'agit du temps global pris par la requête, y compris le temps côté client et le temps côté serveur, en microsecondes.
sap/hana/query/servertime SAP HANA Signalé uniquement si query/state vaut 0. Il s'agit du temps pris par le serveur pour traiter la requête, en microsecondes.
sap/cluster/failcounts SAP HANA Valeur du nombre d'échecs des ressources Linux à haute disponibilité. Si la ressource n'est pas présente, aucun nombre d'échecs n'a été enregistré. Sinon, le crm_mon de surveillance du cluster indique le nombre d'actions ayant échoué.
sap/cluster/nodes Cluster Pacemaker Code de réponse numérique indiquant l'état du cluster Linux haute disponibilité.
  • -10 : inconnu
  • -1 : état incorrect
  • 0 : arrêt
  • 1 : instance de secours
  • 2 : en ligne
sap/cluster/resources Cluster Pacemaker Code de réponse numérique indiquant si la ressource de cluster Linux haute disponibilité est opérationnelle.
  • -10 : inconnu
  • 0 : échec
  • 1 : arrêté
  • 2 : en cours de démarrage
  • 3 : la ressource est dans l'un des états stables suivants : Master, Slave ou Started.
sap/nw/availability SAP NetWeaver Code de réponse numérique pour la disponibilité du système SAP NetWeaver, basé sur l'ID de système SAP, le numéro d'instance SAP et le nom du service SAP
  • 0 : état inconnu
  • 1 : le nœud actuel est actif ou opérationnel
sap/nw/service SAP NetWeaver Code de réponse numérique pour la disponibilité du service SAP NetWeaver, basé sur l'ID de système SAP, le numéro d'instance SAP et le nom du service SAP.
  • 0 : le service n'est pas en cours d'exécution
  • 1 : Le service est en cours d'exécution
sap/nw/icm/rcode SAP NetWeaver Code de réponse basé sur le protocole HTTP 1.1 d'une ressource d'URL ICM non authentifiée (appel local).
sap/nw/icm/rtime SAP NetWeaver Temps de réponse en millisecondes d'une ressource d'URL ICM non authentifiée (appel local).
sap/nw/ms/rcode SAP NetWeaver Code de réponse basé sur le protocole HTTP 1.1 d'une ressource d'URL de serveur de messages non authentifiée (appel local).
sap/nw/ms/rtime SAP NetWeaver Temps de réponse en millisecondes d'une ressource d'URL de serveur de messages non authentifiée (appel local).
sap/nw/ms/wp SAP NetWeaver Nombre de processus de travail ABAP (NW ABAP) ou de nœuds de serveur Java (NW Java) signalés par la page d'informations du serveur de messages.
sap/nw/abap/proc/busy SAP NetWeaver Nombre de processus de travail ABAP occupés par type, tels que DIA, ICM et DISP.
sap/nw/abap/proc/count SAP NetWeaver Nombre de processus de travail ABAP par type, tels que DIA, ICM et DISP.
sap/nw/abap/queue/current SAP NetWeaver Nombre de files d'attente ABAP utilisées par les processus de travail ABAP, regroupées par types de processus de travail tels que DIA, ICM et DISP.
sap/nw/abap/queue/peak SAP NetWeaver Nombre maximal de files d'attente ABAP utilisées par les processus de travail ABAP, regroupées par types de processus de travail tels que DIA, ICM et DISP.
sap/nw/abap/sessions SAP NetWeaver Nombre de sessions ABAP par type de session.
sap/nw/abap/rfc SAP NetWeaver Nombre de connexions RFC ABAP par type de session.
sap/nw/enq/locks/usercountowner SAP NetWeaver Nombre de verrous en file d'attente dans les systèmes SAP NetWeaver. Si votre système comporte de nombreuses entrées de verrou ouvert, cela peut entraîner des problèmes de performances pour vos utilisateurs.
sap/mntmode Métriques SAP supplémentaires Mode de maintenance de l'ID système SAP (SID) correspondant qui a été défini manuellement pour indiquer que le système est intentionnellement indisponible (maintenancemode = TRUE). La valeur de cette métrique permet de supprimer les alertes concernant les systèmes indisponibles lors de la maintenance planifiée.

Pour avertir l'agent si un SID particulier est en cours de maintenance planifiée, exécutez la commande suivante :


google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed Métriques SAP supplémentaires Indique si les services de système d'exploitation liés à SAP et aux services de cluster ont échoué. Le code de sortie 0 représente un échec.
sap/service/is-disabled Métriques SAP supplémentaires Cette métrique est renseignée lorsque les services pacemaker, corosync, sapconf, saptune et sapinit ne sont pas activés.
sap/hana/cpu/utilization Métriques SAP supplémentaires Utilisation du processeur par processus (%) pour les processus SAP HANA.
sap/nw/cpu/utilization Métriques SAP supplémentaires Utilisation du processeur par processus (%) pour les processus SAP NetWeaver.
sap/control/cpu/utilization Métriques SAP supplémentaires Utilisation du processeur par processus (%) pour les processus SAP Control.
sap/hana/memory/utilization Métriques SAP supplémentaires Utilisation de la mémoire par processus (Mo) des processus HANA.
sap/nw/memory/utilization Métriques SAP supplémentaires Utilisation de la mémoire par processus (Mo) des processus NetWeaver.
sap/control/memory/utilization Métriques SAP supplémentaires Utilisation de la mémoire par processus (Mo) des processus SAP Control.
sap/hana/iops/reads Métriques SAP supplémentaires IOPS par processus de lecture pour les processus SAP HANA.
sap/hana/iops/writes Métriques SAP supplémentaires IOPS par processus d'écriture pour les processus SAP HANA.
sap/nw/iops/reads Métriques SAP supplémentaires IOPS par processus de lecture pour les processus SAP NetWeaver.
sap/nw/iops/writes Métriques SAP supplémentaires IOPS d'écriture par processus pour les processus SAP NetWeaver.
sap/infra/migration Métriques de l'infrastructure Google Cloud Indique si une instance de VM est en cours de migration à chaud.
sap/pacemaker Métriques SAP supplémentaires Code de réponse numérique indiquant si l'hôte inclut une configuration Pacemaker.
  • 0 : aucune configuration Pacemaker trouvée
  • 1 : une configuration de Pacemaker a été trouvée
sap/hana/volumes Métriques SAP supplémentaires Expose les informations suivantes sur les volumes SAP HANA installés : taille totale du volume, espace de stockage utilisé, stockage disponible et pourcentage d'utilisation du stockage.
sap/networkstats/rtt Métriques SAP supplémentaires Temps aller-retour moyen, en millisecondes.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/rcv_rtt Métriques SAP supplémentaires Temps nécessaire au client distant pour épuiser la fenêtre de réception distante actuelle si aucune consommation d'espace utilisateur de ces données n'a été générée. Il est basé sur la bande passante observée de la connexion et renvoie une valeur non nulle.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/rto Métriques SAP supplémentaires Délai avant expiration de la retransmission TCP, en millisecondes.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/bytes_acked Métriques SAP supplémentaires Nombre d'octets confirmés.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/bytes_received Métriques SAP supplémentaires Nombre d'octets reçus.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/lastsnd Métriques SAP supplémentaires Durée, en millisecondes, depuis l'envoi du dernier paquet.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

sap/networkstats/lastrcv Métriques SAP supplémentaires Durée, en millisecondes, depuis la réception du dernier paquet.

Cette métrique contient des informations de connexion TCP liées à votre système SAP HANA. Cette métrique est collectée pour les sockets du processus hdbnameserver de SAP HANA à l'aide de l'utilitaire ss.

Afficher les métriques dans Monitoring

Google Cloud fournit des tableaux de bord personnalisés qui vous aident à visualiser les métriques de surveillance des processus collectées par l'agent Google Cloud pour SAP. Consultez le répertoire dashboards/google-cloud-agent-for-sap dans le dépôt GoogleCloudPlatform/monitoring-dashboard-samples sur GitHub.

Pour en savoir plus sur ces tableaux de bord et obtenir des instructions d'installation, consultez la section Afficher les métriques collectées.

Pour en savoir plus sur la recherche de données de métriques dans Monitoring et sur la configuration des notifications d'alerte, consultez la page Métriques dans Monitoring.