Prozessmonitoring mit dem Google Cloud-Agent für SAP

Dieser Planungsleitfaden konzentriert sich ausschließlich auf das Feature Erfassung von Prozessmonitoring-Messwerten des Agents von Google Cloud für SAP. Informationen zum Agent und allen seinen Features finden Sie im Planungsleitfaden für den Google Cloud-Agent für SAP.

Unter Linux kann der Google Cloud-Agent für SAP Ihnen dabei helfen, die Prozesse in Ihren SAP-Anwendungen und deren Laufzeitstatus zu überwachen. Die Bereitstellung erfolgt über die Erfassung von Prozessmonitoring-Messwerten, die Sie nach der Installation des Agents auf Ihren Compute Engine-Instanzen oder Bare-Metal-Lösungsservern aktivieren können.

Die in den Prozessmonitoring-Messwerten erfassten Informationen helfen Ihnen, die Probleme mit Ihrem SAP-System zu beheben. Bei Problemen mit Prozessmonitoring-Messwerten kann Cloud Customer Care Sie bei einer Lösung unterstützen. Die mit Prozessmonitoring-Messwerten erfassten Daten bieten Beobachtbarkeit für Ihre SAP HANA-Hochverfügbarkeitsclusterkonfigurationen.

Informationen zum Konfigurieren des Google Cloud-Agents für SAP zum Erfassen der Prozessmonitoring-Messwerte finden Sie unter Erfassung von Prozessmonitoring-Messwerten konfigurieren.

Arten von Prozessmonitoring-Messwerten

Ab Version 2.6 des Google Cloud-Agents für SAP werden die vom Agent erfassten Prozess-Monitoring-Messwerte so bezeichnet:

  • Sich schnell ändernde Messwerte: Dazu gehören sap/hana/availability, sap/hana/ha/availability und sap/nw/availability. Diese Messwerte werden mit einer Standardhäufigkeit von 5 Sekunden erfasst. Diese Erfassungshäufigkeit kann mit dem Konfigurationsparameter process_metrics_frequency aktualisiert werden.
  • Langsam wechselnde Messwerte: Prozessmonitoring-Messwerte, die nicht zu den schnell wechselnden Messwerten gehören, werden als langsam wechselnd bezeichnet. Diese Messwerte werden mit einer Standardhäufigkeit von 30 Sekunden erfasst. Diese Erfassungshäufigkeit kann mit dem Konfigurationsparameter slow_process_metrics_frequency aktualisiert werden.

Cloud Monitoring-Preise

Die Prozessmonitoring-Messwerte, die der Google Cloud-Agent für SAP erfasst und an Monitoring sendet, werden von Monitoring als kostenpflichtige Messwerte klassifiziert und nach aufgenommenem Volumen berechnet.

Die Häufigkeit, mit der der Agent Ihre SAP-Systeme abfragt, um die Prozessmonitoring-Messwerte zu erfassen, wirkt sich auf die Menge der Messwerte aus, die an Monitoring gesendet werden.

Prozessmonitoring-Messwerte sind schnell wechselnde Messwerte, die standardmäßig alle fünf Sekunden erfasst werden.

Weitere Informationen zu den Preisen für Monitoring finden Sie unter Google Cloud Observability-Preise.

Beispiel für die Kostenschätzung

Eine Beispielschätzung der Kosten für die Erfassung der Prozessmonitoring-Messwerte mit dem Google Cloud-Agent für SAP finden Sie im Preisbeispiel für Messwerte, die nach aufgenommenen Byte berechnet werden.

Prozessmonitoring-Messwerte

In der folgenden Tabelle werden die Prozessmonitoring-Messwerte beschrieben, die vom Agent von Google Cloud für SAP erfasst werden. Den Messwertstrings in dieser Tabelle muss das Präfix workload.googleapis.com/ vorangestellt werden. Dieses Präfix wurde in den Einträgen der folgenden Tabelle weggelassen.

Messwert Kategorie Beschreibung
sap/hana/service SAP HANA Numerischer Antwortcode für die SAP HANA-Dienstverfügbarkeit.
  • 0: Dienst wird nicht ausgeführt
  • 1: Dienst wird ausgeführt
sap/hana/ha/replication SAP HANA Numerischer Antwortcode für die SAP HANA-Systemreplikation basierend auf der SAP-System-ID, der SAP-Instanznummer und dem SAP-Dienstnamen.
  • 0: Ein Fehler ist aufgetreten.
  • 10: Keine Systemreplizierung (eigenständiger Modus).
  • 11: Bei der Verbindung ist ein Fehler aufgetreten.
  • 12: Das sekundäre System hat seit dem letzten Neustart des primären Systems keine Verbindung zum primären System hergestellt.
  • 13: Die erste Datenübertragung wird ausgeführt. In diesem Zustand kann das sekundäre System überhaupt nicht verwendet werden.
  • 14: Das sekundäre System wird noch einmal synchronisiert. Zum Beispiel nach einem vorübergehenden Verbindungsverlust oder einem Neustart des sekundären Systems.
  • 15: Die Initialisierung oder Synchronisierung mit dem primären System ist abgeschlossen und das sekundäre System wird kontinuierlich repliziert. Im Modus SYNC kommt es zu keinem Datenverlust.
sap/hana/availability SAP HANA Numerischer Antwortcode für die SAP HANA-Systemverfügbarkeit basierend auf der SAP-System-ID und der SAP-Instanznummer.
  • 0: Mindestens ein Prozess ist nicht aktiv
  • 1: Alle Prozesse sind aktiv
sap/hana/ha/availability SAP HANA Numerischer Antwortcode für den Hochverfügbarkeitsstatus des SAP HANA-Systems, basierend auf der SAP-System-ID und der SAP-Instanznummer.
  • 0: Unbekannter Status
  • 1: Aktueller Knoten ist sekundär
  • 2: Primärer Knoten ist fehlerhaft
  • 3: Primärer Knoten ist online, aber Replikation ist nicht vollständig funktionsfähig
  • 4: Primärer Knoten ist online, während die Replikation ausgeführt wird
sap/hana/query/state SAP HANA Numerischer Antwortcode, der die Systemdiagnose von SAP HANA basierend auf der Abfrage select * from dummy darstellt. Der Wert 0 weist auf einen Erfolg hin. Jeder andere Wert gibt Fehler an.
sap/hana/query/overalltime SAP HANA Wird nur gemeldet, wenn query/state den Wert 0 hat. Dies ist die Gesamtzeit, die von der Abfrage beansprucht wird, einschließlich clientseitiger Zeit und Serverzeit in Mikrosekunden.
sap/hana/query/servertime SAP HANA Wird nur gemeldet, wenn query/state den Wert 0 hat. Dies ist die Zeit, die der Server zur Verarbeitung der Abfrage benötigt, in Mikrosekunden.
sap/cluster/failcounts SAP HANA Der Failcount-Wert der Linux-HA-Ressourcen. Wenn die Ressource nicht vorhanden ist, wird keine Failcount registriert. Andernfalls meldet das Cluster-Monitoring crm_mon die Anzahl der fehlgeschlagenen Aktionen.
sap/cluster/nodes Pacemaker-Cluster Numerischer Antwortcode, der den Status des Linux-HA-Clusters angibt.
  • -10: Unbekannt
  • -1: Unbereinigter Status
  • 0: Herunterfahren
  • 1: Standby
  • 2: Online
sap/cluster/resources Pacemaker-Cluster Numerischer Antwortcode, der angibt, ob die Linux-HA-Clusterressource ausgeführt wird.
  • -10: Unbekannt
  • 0: fehlgeschlagen
  • 1: Beendet
  • 2: Wird gestartet
  • 3: Ressource hat einen der folgenden stabilen Status: Master, Slave oder Started
sap/nw/availability SAP NetWeaver Numerischer Antwortcode für die SAP NetWeaver-Systemverfügbarkeit basierend auf der SAP-System-ID, der SAP-Instanznummer und dem SAP-Dienstnamen.
  • 0: Unbekannter Status
  • 1: Aktueller Knoten ist aktiv oder eingerichtet
sap/nw/service SAP NetWeaver Numerischer Antwortcode für die SAP NetWeaver-Dienstverfügbarkeit, basierend auf der SAP-System-ID, der SAP-Instanznummer und dem SAP-Dienstnamen.
  • 0: Dienst wird nicht ausgeführt
  • 1: Dienst wird ausgeführt
sap/nw/icm/rcode SAP NetWeaver Antwortcode, basierend auf dem HTTP 1.1-Protokoll einer nicht authentifizierten ICM-URL-Ressource (lokaler Aufruf).
sap/nw/icm/rtime SAP NetWeaver Antwortzeit in Millisekunden einer nicht authentifizierten ICM-URL-Ressource (lokaler Aufruf).
sap/nw/ms/rcode SAP NetWeaver Antwortcode, basierend auf dem HTTP 1.1-Protokoll einer nicht authentifizierten Message-Server-URL-Ressource (lokaler Aufruf).
sap/nw/ms/rtime SAP NetWeaver Antwortzeit in Millisekunden einer nicht authentifizierten Message-Server-URL-Ressource (lokaler Aufruf).
sap/nw/ms/wp SAP NetWeaver Anzahl der ABAP-Arbeitsprozesse (NW ABAP) oder Java-Serverknoten (NW Java), die von der Message-Server-Informationsseite gemeldet werden.
sap/nw/abap/proc/busy SAP NetWeaver Anzahl der ausgelasteten ABAP-Arbeitsprozesse nach Typ, z. B. DIA, ICM und DISP.
sap/nw/abap/proc/count SAP NetWeaver Anzahl aller ABAP-Arbeitsprozesse nach Typ, z. B. DIA, ICM und DISP.
sap/nw/abap/queue/current SAP NetWeaver Die aktuelle Anzahl der ABAP-Warteschlangen, die von den ABAP-Arbeitsprozessen verwendet werden, gruppiert nach Arbeitsprozesstypen wie DIA, ICM und DISP.
sap/nw/abap/queue/peak SAP NetWeaver Die Spitzenanzahl der ABAP-Warteschlangen, die von den ABAP-Arbeitsprozessen verwendet werden, gruppiert nach Arbeitsprozesstypen wie DIA, ICM und DISP.
sap/nw/abap/sessions SAP NetWeaver Anzahl der ABAP-Sitzungen nach Sitzungstyp.
sap/nw/abap/rfc SAP NetWeaver Anzahl der ABAP-RFC-Verbindungen nach Sitzungstyp.
sap/nw/enq/locks/usercountowner SAP NetWeaver Anzahl der Warteschlangensperren in SAP NetWeaver-Systemen. Wenn Ihr System viele offene Sperreinträge enthält, kann dies zu Leistungsproblemen für Ihre Nutzer führen.
sap/mntmode Zusätzliche SAP-Messwerte Wartungsmodus der entsprechenden SAP-System-ID (SID), die manuell festgelegt wurde, um anzugeben, dass das System absichtlich nicht verfügbar ist (maintenancemode = TRUE). Dieser Messwert wird verwendet, um Benachrichtigungen für die Systeme zu unterdrücken, die während der geplanten Wartung nicht verfügbar sind.

Führen Sie den folgenden Befehl aus, um den Agent zu benachrichtigen, wenn eine bestimmte SID gerade geplant wird:

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed Zusätzliche SAP-Messwerte Gibt an, ob die Betriebssystemdienste in Verbindung mit SAP- und Clusterdiensten fehlgeschlagen sind. Der Exit-Code 0 stellt einen Fehler dar.
sap/service/is-disabled Zusätzliche SAP-Messwerte Dieser Messwert wird ausgefüllt, wenn die Dienste pacemaker, corosync, sapconf, saptune und sapinit nicht aktiviert sind.
sap/hana/cpu/utilization Zusätzliche SAP-Messwerte CPU-Auslastung pro Prozess (%) von SAP HANA-Prozessen.
sap/nw/cpu/utilization Zusätzliche SAP-Messwerte CPU-Auslastung pro Prozess (%) von SAP NetWeaver-Prozessen.
sap/control/cpu/utilization Zusätzliche SAP-Messwerte CPU-Auslastung pro Prozess (%) von SAP Control-Prozessen.
sap/hana/memory/utilization Zusätzliche SAP-Messwerte Speicherauslastung pro Prozess (MB) von HANA-Prozessen.
sap/nw/memory/utilization Zusätzliche SAP-Messwerte Speicherauslastung pro Prozess (MB) von NetWeaver-Prozessen.
sap/control/memory/utilization Zusätzliche SAP-Messwerte Speicherauslastung pro Prozess (MB) von SAP Control-Prozessen.
sap/hana/iops/reads Zusätzliche SAP-Messwerte Lese-IOPS pro Prozess für SAP HANA-Prozesse.
sap/hana/iops/writes Zusätzliche SAP-Messwerte Schreib-IOPS pro Prozess für SAP HANA-Prozesse.
sap/nw/iops/reads Zusätzliche SAP-Messwerte Lese-IOPS pro Prozess für SAP NetWeaver-Prozesse.
sap/nw/iops/writes Zusätzliche SAP-Messwerte Schreib-IOPS pro Prozess für SAP NetWeaver-Prozesse.
sap/infra/migration Google Cloud-Infrastrukturmesswerte Gibt an, ob eine Compute Engine-Instanz eine Live-Migration durchläuft.
sap/pacemaker Zusätzliche SAP-Messwerte Numerischer Antwortcode, der angibt, ob der Host eine Pacemaker-Konfiguration enthält.
  • 0: Keine Pacemaker-Konfiguration gefunden
  • 1: Pacemaker-Konfiguration gefunden

Dieser Messwert wird ab Version 3.2 des Agents unterstützt.

sap/hana/volumes Zusätzliche SAP-Messwerte

Die folgenden Informationen zu den bereitgestellten SAP HANA-Volumes werden angezeigt: Gesamtgröße des Volumes, genutzter Speicher, verfügbarer Speicher und Prozentsatz der Speichernutzung.

Dieser Messwert wird ab Version 3.2 des Agents unterstützt.

sap/networkstats/rtt Zusätzliche SAP-Messwerte Die durchschnittliche Umlaufzeit in Millisekunden.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/rcv_rtt Zusätzliche SAP-Messwerte Die Zeit, die der Remote-Client für die Ausschöpfung des aktuellen Remote-Empfangsfensters (RWIN) benötigt, wenn keine Nutzerbereichsnutzung dieser Daten aufgetreten ist. Sie basiert auf der beobachteten Bandbreite der Verbindung und gibt einen Wert ungleich null zurück.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/rto Zusätzliche SAP-Messwerte Das Zeitlimit für die wiederholte TCP-Übertragung in Millisekunden.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/bytes_acked Zusätzliche SAP-Messwerte Die Anzahl der bestätigten Byte.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/bytes_received Zusätzliche SAP-Messwerte Die Anzahl der empfangenen Bytes.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/lastsnd Zusätzliche SAP-Messwerte Die Zeit in Millisekunden, seit das letzte Paket gesendet wurde.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

sap/networkstats/lastrcv Zusätzliche SAP-Messwerte Die Zeit in Millisekunden, seit das letzte Paket empfangen wurde.

Dieser Messwert enthält TCP-Verbindungsinformationen, die sich auf Ihr SAP HANA-System beziehen. Dieser Messwert wird für Sockets desn SAP HANA-hdbnameserver-Prozesses mit dem Dienstprogramm ss erfasst.

Messwerte in Monitoring ansehen

Google Cloud bietet benutzerdefinierte Dashboards, mit denen Sie die vom Google Cloud-Agent für SAP erfassten Prozess-Monitoring-Messwerte visualisieren können. Weitere Informationen finden Sie im Verzeichnis dashboards/google-cloud-agent-for-sap im Repository GoogleCloudPlatform/monitoring-dashboard-samples auf GitHub.

Informationen zu diesen Dashboards, einschließlich einer Installationsanleitung, finden Sie unter Erfasste Messwerte anzeigen.

Informationen zum Suchen nach Messwertdaten in Monitoring und zum Konfigurieren von Benachrichtigungen finden Sie unter Messwerte in Monitoring.