Monitoraggio dei processi utilizzando l'agente di Google Cloud per SAP

Questa guida alla pianificazione si concentra esclusivamente sulla funzionalità della raccolta delle metriche di monitoraggio dei processi dell'agente di Google Cloud per SAP. Per informazioni sull'agente e su tutte le sue funzionalità, consulta la guida alla pianificazione dell'agente di Google Cloud per SAP.

Su Linux, l'Agente per SAP di Google Cloud può aiutarti a monitorare i processi nelle tue applicazioni SAP e i relativi stati di runtime. Questo viene fornito tramite la raccolta delle metriche di monitoraggio dei processi, che puoi attivare dopo aver installato l'agente sulle tue istanze Compute Engine o sui server Bare Metal Solution.

Le informazioni raccolte nelle metriche di monitoraggio dei processi ti aiutano a risolvere i problemi relativi al sistema SAP. In caso di problemi, con l'aiuto delle metriche di monitoraggio dei processi, l'assistenza clienti Google Cloud può aiutarti a trovare una soluzione in modo più efficiente. I dati raccolti utilizzando le metriche di monitoraggio dei processi forniscono l'osservabilità per le configurazioni dei cluster SAP HANA ad alta disponibilità.

Per informazioni su come configurare l'agente di Google Cloud per SAP per raccogliere le metriche di monitoraggio dei processi, consulta Configurare la raccolta delle metriche di monitoraggio dei processi.

Tipi di metriche di monitoraggio dei processi

A partire dalla versione 2.6 dell'agente di Google Cloud per SAP, le metriche di monitoraggio dei processi raccolte dall'agente sono indicate come segue:

  • Metriche in rapida evoluzione: tra cui sap/hana/availability, sap/hana/ha/availability e sap/nw/availability. Queste metriche vengono raccolte con una frequenza predefinita di 5 secondi. Questa frequenza di raccolta può essere aggiornata utilizzando il parametro di configurazione process_metrics_frequency.
  • Metriche in lenta evoluzione: le metriche di monitoraggio dei processi diverse da quelle in rapida evoluzione sono definite in lenta evoluzione. Queste metriche vengono raccolte con una frequenza predefinita di 30 secondi. Questa frequenza di raccolta può essere aggiornata utilizzando il parametro di configurazione slow_process_metrics_frequency.

Prezzi di Cloud Monitoring

Le metriche di monitoraggio dei processi che l'agente per SAP di Google Cloud raccoglie e invia a Monitoring sono classificate da Monitoring come metriche fatturabili e il prezzo è basato sul volume importato.

La frequenza con cui l'agente esegue query sui sistemi SAP per raccogliere le metriche di monitoraggio dei processi influisce sul volume di metriche inviate a Monitoring.

Le metriche di monitoraggio dei processi sono metriche in rapida evoluzione che vengono raccolte ogni 5 secondi per impostazione predefinita.

Per ulteriori informazioni sui prezzi di Monitoring, consulta Prezzi di Google Cloud Observability.

Stima dei costi di esempio

Per visualizzare una stima del costo di esempio per la raccolta delle metriche di monitoraggio dei processi utilizzando Agent for SAP di Google Cloud, consulta Esempio di prezzi per le metriche addebitate in base ai byte importati.

Metriche di monitoraggio dei processi

La tabella seguente descrive le metriche di monitoraggio dei processi raccolte dall'agente di Google Cloud per SAP. Le stringhe delle metriche in questa tabella devono avere il prefisso workload.googleapis.com/. Questo prefisso è stato omesso dalle voci della tabella seguente.

Metrica Category Descrizione
sap/hana/service SAP HANA Codice di risposta numerico per la disponibilità del servizio SAP HANA.
  • 0: il servizio non è in esecuzione
  • 1: il servizio è in esecuzione
sap/hana/ha/replication SAP HANA Codice di risposta numerico per la replica del sistema SAP HANA, in base all'ID sistema SAP, al numero di istanza SAP e al nome del servizio SAP.
  • 0: si è verificato un errore.
  • 10: nessuna replica del sistema (modalità autonoma).
  • 11: si è verificato un errore di connessione.
  • 12: il sistema secondario non si è connesso al sistema principale dall'ultimo riavvio del sistema principale.
  • 13: il trasferimento iniziale dei dati è in corso. In questo stato, il sistema secondario non è affatto utilizzabile.
  • 14: il sistema secondario si sta sincronizzando di nuovo. Ad esempio, dopo una perdita temporanea della connessione o il riavvio del sistema secondario.
  • 15: l'inizializzazione o la sincronizzazione con il sistema principale è completata e il sistema secondario esegue la replica continua. Non si verifica alcuna perdita di dati in modalità SYNC.
sap/hana/availability SAP HANA Codice di risposta numerico per la disponibilità del sistema SAP HANA, in base all'ID sistema SAP e al numero di istanza SAP.
  • 0: uno o più processi non sono attivi
  • 1: tutti i processi sono attivi
sap/hana/ha/availability SAP HANA Codice di risposta numerico per lo stato di alta disponibilità del sistema SAP HANA, based on SAP system ID and SAP Instance Number.
  • 0: stato sconosciuto
  • 1: il nodo corrente è secondario
  • 2: il nodo principale presenta un errore
  • 3: il nodo principale è online, ma la replica non è completamente funzionale
  • 4: il nodo principale è online con la replica in esecuzione
sap/hana/query/state SAP HANA Codice di risposta numerico che rappresenta il controllo di integrità di SAP HANA in base alla query select * from dummy. Il valore 0 indica il successo. Qualsiasi altro valore indica errori.
sap/hana/query/overalltime SAP HANA Viene registrato solo se query/state è 0. Si tratta del tempo complessivamente impiegato dalla query, inclusi il tempo lato client e il tempo lato server, in microsecondi.
sap/hana/query/servertime SAP HANA Viene registrato solo se query/state è 0. Si tratta del tempo impiegato dal server per elaborare la query, in microsecondi.
sap/cluster/failcounts SAP HANA Il valore failcount delle risorse Linux HA. Se la risorsa non è presente, non viene registrato alcun valore di failcount. In caso contrario, il monitoraggio del cluster crm_mon registra il numero di azioni non riuscite.
sap/cluster/nodes Cluster Pacemaker Codice di risposta numerico che indica lo stato del cluster Linux HA.
  • -10: sconosciuto
  • -1: stato non pulito
  • 0: arresto
  • 1: modalità standby
  • 2: online
sap/cluster/resources Cluster Pacemaker Codice di risposta numerico che indica se la risorsa del cluster Linux HA è attiva e in esecuzione.
  • -10: sconosciuto
  • 0: operazione non riuscita
  • 1: interrotto
  • 2: inizio
  • 3: la risorsa è in uno dei seguenti stati stabili: Master, Slave o Started
sap/nw/availability SAP NetWeaver Codice di risposta numerico per la disponibilità del sistema SAP NetWeaver, based on SAP System ID, SAP Instance Number, and SAP Service Name.
  • 0: stato sconosciuto
  • 1: il nodo corrente è attivo o in funzione
sap/nw/service SAP NetWeaver Codice di risposta numerico per la disponibilità del servizio SAP NetWeaver, basato su ID sistema SAP, numero istanza SAP e nome servizio SAP.
  • 0: il servizio non è in esecuzione
  • 1: il servizio è in esecuzione
sap/nw/icm/rcode SAP NetWeaver Codice di risposta basato sul protocollo HTTP 1.1 di una risorsa URL ICM non autenticata (chiamata locale).
sap/nw/icm/rtime SAP NetWeaver Tempo di risposta in millisecondi di una risorsa URL ICM non autenticata (chiamata locale).
sap/nw/ms/rcode SAP NetWeaver Codice di risposta basato sul protocollo HTTP 1.1 di una risorsa URL del server di messaggi non autenticata (chiamata locale).
sap/nw/ms/rtime SAP NetWeaver Tempo di risposta in millisecondi di una risorsa URL di un server di messaggi non autenticato (chiamata locale).
sap/nw/ms/wp SAP NetWeaver Numero di processi di lavoro ABAP (NW ABAP) o nodi del server Java (NW Java) segnalati dalla pagina delle informazioni del server di messaggi.
sap/nw/abap/proc/busy SAP NetWeaver Numero di processi di lavoro ABAP occupati per tipo, ad esempio DIA, ICM e DISP.
sap/nw/abap/proc/count SAP NetWeaver Numero di tutti i processi di lavoro ABAP per tipo, ad esempio DIA, ICM e DISP.
sap/nw/abap/queue/current SAP NetWeaver Il numero corrente di code ABAP utilizzate dai processi di lavoro ABAP, raggruppati in base ai tipi di processi di lavoro, ad esempio DIA, ICM e DISP.
sap/nw/abap/queue/peak SAP NetWeaver Il numero massimo di code ABAP utilizzate dai processi di lavoro ABAP, raggruppati in base ai tipi di processo di lavoro, ad esempio DIA, ICM e DISP.
sap/nw/abap/sessions SAP NetWeaver Numero di sessioni ABAP per tipo di sessione.
sap/nw/abap/rfc SAP NetWeaver Numero di connessioni RFC ABAP per tipo di sessione.
sap/nw/enq/locks/usercountowner SAP NetWeaver Numero di blocchi di coda nei sistemi SAP NetWeaver. Se il sistema ha molte voci di blocco aperte, possono verificarsi problemi di prestazioni per gli utenti.
sap/mntmode Metriche SAP aggiuntive Modalità di manutenzione dell'ID sistema SAP (SID) corrispondente impostato manualmente per indicare che il sistema è deliberatamente inattivo (maintenancemode = TRUE). Il valore di questa metrica viene utilizzato per eliminare gli avvisi per i sistemi non disponibili durante la manutenzione pianificata.

Per notificare all'agente se per un determinato SID è in corso la manutenzione pianificata, esegui il seguente comando:

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed Metriche SAP aggiuntive Indica se i servizi OS relativi ai servizi SAP e del cluster non sono riusciti. Il codice di uscita 0 indica un errore.
sap/service/is-disabled Metriche SAP aggiuntive Questa metrica viene compilata quando i servizi pacemaker, corosync, sapconf, saptune e sapinit non sono abilitati.
sap/hana/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU (%) per processo dei processi SAP HANA.
sap/nw/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU (%) per processo dei processi SAP NetWeaver.
sap/control/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU (%) per processo dei processi di controllo SAP.
sap/hana/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi HANA.
sap/nw/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi NetWeaver.
sap/control/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi di controllo SAP.
sap/hana/iops/reads Metriche SAP aggiuntive IOPS di lettura per processo per i processi SAP HANA.
sap/hana/iops/writes Metriche SAP aggiuntive IOPS di scrittura per processo per i processi SAP HANA.
sap/nw/iops/reads Metriche SAP aggiuntive IOPS di lettura per processo per i processi SAP NetWeaver.
sap/nw/iops/writes Metriche SAP aggiuntive IOPS di scrittura per processo per i processi SAP NetWeaver.
sap/infra/migration Metriche dell'infrastruttura Google Cloud Indica se un'istanza Compute Engine sta subendo una migrazione live.
sap/pacemaker Metriche SAP aggiuntive Codice di risposta numerico che indica se l'host include una configurazione di Pacemaker.
  • 0: nessuna configurazione del pacemaker trovata
  • 1: configurazione del pacemaker trovata

Questa metrica è supportata dalla versione 3.2 dell'agente.

sap/hana/volumes Metriche SAP aggiuntive

Mostra le seguenti informazioni sui volumi SAP HANA montati: dimensioni totali del volume, spazio di archiviazione utilizzato, spazio di archiviazione disponibile e percentuale di utilizzo dello spazio di archiviazione.

Questa metrica è supportata dalla versione 3.2 dell'agente.

sap/networkstats/rtt Metriche SAP aggiuntive Il tempo di round trip medio, in millisecondi.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/rcv_rtt Metriche SAP aggiuntive Il tempo impiegato dal client remoto per esaurire la finestra di ricezione remota (RWIN) pubblicizzata corrente se non è stato registrato alcun consumo di questi dati nello spazio utente. Si basa sulla larghezza di banda osservata della connessione e restituisce un valore diverso da zero.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/rto Metriche SAP aggiuntive Il timeout della ritrasmissione TCP, in millisecondi.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/bytes_acked Metriche SAP aggiuntive Il numero di byte confermati.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/bytes_received Metriche SAP aggiuntive Il numero di byte ricevuti.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/lastsnd Metriche SAP aggiuntive Il tempo, in millisecondi, dall'invio dell'ultimo pacchetto.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

sap/networkstats/lastrcv Metriche SAP aggiuntive Il tempo, in millisecondi, dall'ultima ricezione del pacchetto.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket del processo hdbnameserver di SAP HANA utilizzando l'utilità ss.

Visualizzazione delle metriche in Monitoring

Google Cloud fornisce dashboard personalizzate che ti aiutano a visualizzare le metriche di monitoraggio dei processi raccolte dall'agente di Google Cloud per SAP. Consulta la directory dashboards/google-cloud-agent-for-sap nel repository GoogleCloudPlatform/monitoring-dashboard-samples su GitHub.

Per informazioni su queste dashboard, incluse le istruzioni di installazione, consulta Visualizzare le metriche raccolte.

Per informazioni su come trovare i dati delle metriche in Monitoraggio e su come configurare le notifiche di avviso, consulta Metriche in Monitoraggio.