Monitoraggio dei processi con l'agente di Google Cloud per SAP

Questa guida alla pianificazione si concentra esclusivamente sulla funzionalità della raccolta delle metriche di monitoraggio dei processi dell'agente di Google Cloud per SAP. Per informazioni sull'agente e su tutte le sue funzionalità, consulta la guida alla pianificazione dell'agente di Google Cloud per SAP.

Su Linux, l'Agente per SAP di Google Cloud può aiutarti a monitorare i processi nelle tue applicazioni SAP e i relativi stati di runtime. Questo viene fornito tramite la raccolta delle metriche di monitoraggio dei processi, che puoi attivare dopo aver installato l'agente sulle tue istanze VM di Compute Engine o sui server della soluzione Bare Metal.

Le informazioni raccolte nelle metriche di monitoraggio dei processi ti aiutano a risolvere i problemi relativi al sistema SAP. In caso di problemi, con l'aiuto delle metriche di monitoraggio dei processi, l'assistenza clienti Google Cloud può aiutarti a trovare una soluzione in modo più efficiente. I dati raccolti utilizzando le metriche di monitoraggio dei processi forniscono l'osservabilità per le configurazioni dei cluster SAP HANA ad alta disponibilità.

Per informazioni su come configurare l'agente di Google Cloud per SAP per raccogliere le metriche di monitoraggio dei processi, consulta Configurare la raccolta delle metriche di monitoraggio dei processi.

Tipi di metriche di monitoraggio dei processi

Dalla versione 2.6 dell'Agente per SAP di Google Cloud, le metriche di Process Monitoring raccolti dall'agente sono definiti come segue:

  • Metriche in rapida evoluzione: sono incluse sap/hana/availability, sap/hana/ha/availability e sap/nw/availability. Queste metriche sono raccolti con una frequenza predefinita di 5 secondi. Questa frequenza di raccolta può essere aggiornato utilizzando il parametro di configurazione process_metrics_frequency.
  • Metriche in lenta evoluzione: le metriche di monitoraggio dei processi diverse da quelle in rapida evoluzione sono definite in lenta evoluzione. Queste metriche vengono raccolte con una frequenza predefinita di 30 secondi. Questa frequenza di raccolta può essere aggiornata utilizzando il parametro di configurazione slow_process_metrics_frequency.

Prezzi di Cloud Monitoring

Le metriche di monitoraggio L'agente Google Cloud per SAP raccoglie e invia a Monitoring classificata da Monitoring come metriche addebitabili e il prezzo è determinato in base al volume importato.

La frequenza con cui l'agente interroga i tuoi sistemi SAP per raccogliere le metriche di Process Monitoring che il volume di metriche inviate a Monitoring.

Le metriche di monitoraggio dei processi sono metriche in rapida evoluzione che vengono raccolte ogni 5 secondi per impostazione predefinita.

Per ulteriori informazioni sui prezzi di Monitoring, consulta Prezzi di Google Cloud Observability.

Stima dei costi di esempio

Per visualizzare una stima del costo di esempio per la raccolta delle metriche di monitoraggio dei processi utilizzando Agent for SAP di Google Cloud, consulta Esempio di prezzi per le metriche addebitate in base ai byte importati.

Metriche di monitoraggio dei processi

La tabella seguente descrive le metriche di Process Monitoring raccolte dall'agente Google Cloud per SAP. Le stringhe delle metriche in questa tabella devono essere precedute dal prefisso workload.googleapis.com/. Questo prefisso è stato omesso dalle voci della tabella seguente.

Metrica Category Descrizione
sap/hana/service SAP HANA Codice di risposta numerico per la disponibilità del servizio SAP HANA.
  • 0: il servizio non è in esecuzione
  • 1: il servizio è in esecuzione
sap/hana/ha/replication SAP HANA Codice di risposta numerico per la replica del sistema SAP HANA, in base all'ID sistema SAP, al numero di istanza SAP e al nome del servizio SAP.
  • 0: si è verificato un errore.
  • 10: nessuna replica di sistema (modalità autonoma).
  • 11: si è verificato un errore durante la connessione.
  • 12: il sistema secondario non si è connesso al sistema principale dall'ultimo riavvio di quest'ultimo.
  • 13: è in corso il trasferimento iniziale dei dati. In questo stato, il sistema secondario non è del tutto utilizzabile.
  • 14: il sistema secondario si sta sincronizzando di nuovo. ad esempio in seguito a una perdita temporanea della connessione o al riavvio del sistema secondario.
  • 15: l'inizializzazione o la sincronizzazione con il sistema principale è completata e il sistema secondario esegue la replica continua. Non si verifica alcuna perdita di dati in modalità SYNC.
sap/hana/availability SAP HANA Codice di risposta numerico per la disponibilità del sistema SAP HANA, basato su SAP ID sistema e numero di istanza SAP.
  • 0: uno o più processi non sono attivi
  • 1: tutti i processi sono attivi
sap/hana/ha/availability SAP HANA Codice di risposta numerico per lo stato di alta disponibilità del sistema SAP HANA, based on SAP system ID and SAP Instance Number.
  • 0: stato sconosciuto
  • 1: il nodo corrente è secondario
  • 2: errore del nodo principale
  • 3: il nodo principale è online, ma la replica non è completamente funzionale
  • 4: il nodo principale è online con la replica in esecuzione
sap/hana/query/state SAP HANA Codice di risposta numerica che rappresenta il controllo di integrità di SAP HANA in base alla query select * from dummy. Il valore 0 indica il successo. Qualsiasi altro valore indica errori.
sap/hana/query/overalltime SAP HANA Viene registrato solo se query/state è 0. Si tratta del tempo complessivamente impiegato dalla query, inclusi il tempo lato client e il tempo lato server, in microsecondi.
sap/hana/query/servertime SAP HANA Segnalato solo se query/state è 0. Si tratta del tempo impiegato dal server per elaborare la query, in microsecondi.
sap/cluster/failcounts SAP HANA Il valore di failcount delle risorse ad alta disponibilità di Linux. Se la risorsa non è presenti, non verrà registrato alcun numero di errori. In caso contrario, il monitoraggio del cluster crm_mon registra il numero di azioni non riuscite.
sap/cluster/nodes Cluster Pacemaker Codice di risposta numerica che indica lo stato dell'alta disponibilità di Linux nello stato del cluster.
  • -10: sconosciuto
  • -1: stato non pulito
  • 0: arresto
  • 1: modalità standby
  • 2: online
sap/cluster/resources Ammasso dei pacemaker Codice di risposta numerico che indica se la risorsa del cluster Linux HA è attiva e in esecuzione.
  • -10: sconosciuto
  • 0: operazione non riuscita
  • 1: interrotto
  • 2: inizio
  • 3: la risorsa si trova in uno dei seguenti stati fissi: Master, Slave oppure Started
sap/nw/availability SAP NetWeaver Codice di risposta numerico per la disponibilità del sistema SAP NetWeaver, based on SAP System ID, SAP Instance Number, and SAP Service Name.
  • 0: stato sconosciuto
  • 1: il nodo corrente è attivo o in funzione
sap/nw/service SAP NetWeaver Codice di risposta numerico per la disponibilità del servizio SAP NetWeaver. in base all'ID sistema SAP, al numero di istanza SAP e al nome del servizio SAP.
  • 0: il servizio non è in esecuzione
  • 1: il servizio è in esecuzione
sap/nw/icm/rcode SAP NetWeaver Codice di risposta basato sul protocollo HTTP 1.1 di una risorsa URL ICM non autenticata (chiamata locale).
sap/nw/icm/rtime SAP NetWeaver Tempo di risposta in millisecondi di un URL ICM non autenticato risorsa (chiamata locale).
sap/nw/ms/rcode SAP NetWeaver Codice di risposta basato sul protocollo HTTP 1.1 di una richiesta Risorsa URL del server dei messaggi (chiamata locale).
sap/nw/ms/rtime SAP NetWeaver Tempo di risposta in millisecondi di un server di messaggi non autenticato Risorsa URL (chiamata locale).
sap/nw/ms/wp SAP NetWeaver Numero di processi di lavoro ABAP (NW ABAP) o nodi server Java (Java NW) segnalato dalla pagina di informazioni su Message Server.
sap/nw/abap/proc/busy SAP NetWeaver Numero di processi di lavoro ABAP impegnati per tipo, ad esempio DIA, ICM e DISP.
sap/nw/abap/proc/count SAP NetWeaver Numero di tutti i processi di lavoro ABAP per tipo, ad esempio DIA, ICM e DISP.
sap/nw/abap/queue/current SAP NetWeaver Il numero attuale di code ABAP utilizzate dai processi di lavoro ABAP, raggruppate per tipi di processo di lavoro, come DIA, ICM e DISP.
sap/nw/abap/queue/peak SAP NetWeaver Il numero massimo di code ABAP utilizzate dai processi di lavoro ABAP, raggruppate per tipi di processo di lavoro, come DIA, ICM e DISP.
sap/nw/abap/sessions SAP NetWeaver Numero di sessioni ABAP per tipo di sessione.
sap/nw/abap/rfc SAP NetWeaver Numero di connessioni RFC ABAP per tipo di sessione.
sap/nw/enq/locks/usercountowner SAP NetWeaver Numero di blocchi in coda nei sistemi SAP NetWeaver. Se il sistema ha molte voci di blocco aperte, possono verificarsi problemi di prestazioni per gli utenti.
sap/mntmode Metriche SAP aggiuntive Modalità di manutenzione dell'ID sistema SAP (SID) corrispondente impostato manualmente per indicare che il sistema è deliberatamente inattivo (maintenancemode = TRUE). Il valore di questa metrica viene utilizzato per eliminare gli avvisi per i sistemi non disponibili durante la manutenzione pianificata.

Per notificare all'agente se per un determinato SID è in corso la manutenzione pianificata, esegui il seguente comando:

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed Metriche SAP aggiuntive Indica se i servizi del sistema operativo correlati a SAP e ai servizi di cluster non riuscito. Il codice di uscita 0 rappresenta un errore.
sap/service/is-disabled Metriche SAP aggiuntive Questa metrica viene compilata quando pacemaker, corosync, sapconf, saptune e I servizi sapinit non sono abilitati.
sap/hana/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU (%) per processo dei processi SAP HANA.
sap/nw/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU per processo (%) dei processi SAP NetWeaver.
sap/control/cpu/utilization Metriche SAP aggiuntive Utilizzo della CPU per processo (%) dei processi di controllo SAP.
sap/hana/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi HANA.
sap/nw/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi NetWeaver.
sap/control/memory/utilization Metriche SAP aggiuntive Utilizzo della memoria per processo (MB) dei processi di controllo SAP.
sap/hana/iops/reads Metriche SAP aggiuntive IOPS di lettura per processo per processi SAP HANA.
sap/hana/iops/writes Metriche SAP aggiuntive IOPS di scrittura per processo per processi SAP HANA.
sap/nw/iops/reads Metriche SAP aggiuntive IOPS di lettura per processo per i processi SAP NetWeaver.
sap/nw/iops/writes Metriche SAP aggiuntive IOPS di scrittura per processo per i processi SAP NetWeaver.
sap/infra/migration Metriche dell'infrastruttura Google Cloud Indica se è in corso una migrazione live di un'istanza VM.
sap/pacemaker Metriche SAP aggiuntive Codice di risposta numerico che indica se l'host include una configurazione di Pacemaker.
  • 0: nessuna configurazione di pacemaker trovata
  • 1: configurazione Pacemaker trovata

Questa metrica è supportata dalla versione 3.2 dell'agente.

sap/hana/volumes Metriche SAP aggiuntive

Espone le seguenti informazioni sui volumi SAP HANA montati: dimensioni totali del volume, dello spazio di archiviazione utilizzato, dello spazio di archiviazione disponibile e dello spazio di archiviazione percentuale di utilizzo.

Questa metrica è supportata dalla versione 3.2 dell'agente.

sap/networkstats/rtt Metriche SAP aggiuntive Il tempo medio di round trip in millisecondi.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

sap/networkstats/rcv_rtt Metriche SAP aggiuntive Il tempo impiegato dal client remoto per esaurire l'attuale finestra di ricezione remota pubblicitaria (RWIN) in assenza di consumo di spazio utente in cui si sono verificati i dati. Si basa sulla larghezza di banda osservata e restituisce un valore diverso da zero.

Questa metrica contiene informazioni sulla connessione TCP correlate a SAP HANA di un sistema operativo completo. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

sap/networkstats/rto Metriche SAP aggiuntive Il timeout di ritrasmissione TCP, in millisecondi.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

sap/networkstats/bytes_acked Metriche SAP aggiuntive Il numero di byte confermati.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

sap/networkstats/bytes_received Metriche SAP aggiuntive Il numero di byte ricevuti.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

sap/networkstats/lastsnd Metriche SAP aggiuntive Il tempo, in millisecondi, dall'invio dell'ultimo pacchetto.

Questa metrica contiene informazioni sulla connessione TCP correlate a SAP HANA di un sistema operativo completo. Questa metrica viene raccolta per i socket del processo hdbnameserver SAP HANA utilizzando l'utilità ss.

sap/networkstats/lastrcv Metriche SAP aggiuntive Il tempo, in millisecondi, dall'ultima ricezione del pacchetto.

Questa metrica contiene informazioni sulle connessioni TCP relative al sistema SAP HANA. Questa metrica viene raccolta per i socket di SAP HANA Processo hdbnameserver con l'utilità ss.

Visualizzazione delle metriche in Monitoring

Google Cloud fornisce dashboard personalizzate che ti aiutano a visualizzare Metriche di monitoraggio dei processi raccolte dall'agente di Google Cloud per SAP. Consulta la directory dashboards/google-cloud-agent-for-sap nel repository GoogleCloudPlatform/monitoring-dashboard-samples su GitHub.

Per informazioni su queste dashboard, incluse le istruzioni di installazione, consulta: Visualizza le metriche raccolte.

Per informazioni su come trovare i dati delle metriche in Monitoring e configurare le notifiche di avviso, consulta Metriche in Monitoring.