Google Cloud の SAP 用エージェントを使用したプロセス モニタリング

このプランニング ガイドでは、Google Cloud の SAP 用エージェントの Process Monitoring 指標収集機能を中心に説明します。エージェントとその他の機能の詳細については、Google Cloud の SAP 用エージェントのプランニング ガイドをご覧ください。

Linux では、Google Cloud の SAP 用エージェントを使用して、SAP アプリケーションのプロセスとそのランタイム状態をモニタリングできます。これは、Process Monitoring 指標の収集を通じて行われます。この収集機能は、Compute Engine VM インスタンスまたは Bare Metal Solution サーバーにエージェントをインストールした後に有効にできます。

Process Monitoring 指標で収集された情報は、SAP システムに関連する問題のトラブルシューティングに役立ちます。問題が発生した場合、Cloud カスタマーケアは、Process Monitoring 指標を使用して効率的に問題を解決できます。Process Monitoring 指標を使用して収集されたデータにより、SAP HANA 高可用性クラスタ構成のオブザーバビリティが提供されます。

Process Monitoring 指標を収集するように Google Cloud の SAP 用エージェントを構成する方法については、Process Monitoring 指標の収集を構成するをご覧ください。

Process Monitoring 指標の種類

Google Cloud の SAP 用エージェントのバージョン 2.6 以降では、エージェントによって収集される Process Monitoring 指標は次のように呼ばれています。

  • 急速に変化する指標: sap/hana/availabilitysap/hana/ha/availabilitysap/nw/availability などです。これらの指標は、5 秒間のデフォルトの頻度で収集されます。この収集頻度は、構成パラメータ process_metrics_frequency を使用して更新できます。
  • 変化が低速な指標: 変化が高速な指標以外の Process Monitoring 指標は、変化が低速な指標と呼ばれます。これらの指標は、30 秒間のデフォルトの頻度で収集されます。この収集頻度は、構成パラメータ slow_process_metrics_frequency を使用して更新できます。

Cloud Monitoring の料金

Google Cloud の SAP 用エージェントが収集して Monitoring に送信する Process Monitoring 指標は、Monitoring によって課金対象の指標として分類され、取り込み量に応じて課金されます。

エージェントが Process Monitoring 指標を収集するために SAP システムにクエリを実行する頻度は、Monitoring に送信される指標の量に影響します。

Process Monitoring 指標は変化の激しい指標で、デフォルトでは 5 秒ごとに収集されるす。

Monitoring の料金の詳細については、Google Cloud Observability の料金をご覧ください。

費用見積もりの例

Google Cloud の SAP 用エージェントを使用して Process Monitoring 指標を収集する際の費用見積もりについては、取り込まれたバイト数で課金される指標の料金の例をご覧ください。

Process Monitoring 指標

次の表に、Google Cloud の SAP 用エージェントによって収集される Process Monitoring 指標を示します。この表の指標文字列は workload.googleapis.com/ で始まりますが、この表のエントリでは省略しています。

指標 カテゴリ 説明
sap/hana/service SAP HANA SAP HANA サービスの可用性を示す数値レスポンス コード。
  • 0: サービスは実行されていません
  • 1: サービスは実行中です
sap/hana/ha/replication SAP HANA SAP システム ID、SAP インスタンス番号、SAP サービス名に基づく SAP HANA システム レプリケーションを示す数値レスポンス コード。
  • 0: エラーが発生しました。
  • 10: システム レプリケーションなし(スタンドアロン モード)。
  • 11: 接続でエラーが発生しました。
  • 12: プライマリ システムの最後の再起動以降、セカンダリ システムがプライマリ システムに接続していません。
  • 13: 最初のデータ転送を実行中。この状態になると、セカンダリ システムはまったく使用できなくなります。
  • 14: セカンダリ システムが再び同期しています。たとえば、一時的に接続が失われた後や、セカンダリ システムが再起動された後などです。
  • 15: 初期化またはプライマリ システムとの同期が完了し、セカンダリ システムが継続的に複製されます。SYNC モードではデータが失われることはありません。
sap/hana/availability SAP HANA SAP システム ID と SAP インスタンス番号に基づく SAP HANA システムの可用性を示す数値レスポンス コード。
  • 0: 1 つ以上のプロセスがアクティブではありません
  • 1: すべてのプロセスがアクティブです
sap/hana/ha/availability SAP HANA SAP システム ID と SAP インスタンス番号に基づく SAP HANA システムの高可用性状態を示す数値レスポンス コード。
  • 0: 不明な状態
  • 1: 現在のノードはセカンダリです
  • 2: プライマリ ノードにエラーがあります
  • 3: プライマリ ノードはオンラインですが、レプリケーションが完全には機能していません
  • 4: プライマリ ノードがオンラインで、レプリケーションを実行中です
sap/hana/query/state SAP HANA クエリ select * from dummy に基づく SAP HANA のヘルスチェックを示す数値レスポンス コード。0 は成功です。その他の値は、失敗を示します。
sap/hana/query/overalltime SAP HANA query/state0 の場合にのみ報告されます。これは、クライアント側とサーバー側を含む、クエリ全体の所要時間をマイクロ秒単位で表したものです。
sap/hana/query/servertime SAP HANA query/state0 の場合にのみ報告されます。サーバーでクエリの処理にかかった時間(マイクロ秒単位)。
sap/cluster/failcounts SAP HANA Linux HA リソースの障害カウントの値。リソースが存在しない場合、障害カウントは登録されません。それ以外の場合、crm_mon をモニタリングするクラスタは、失敗したアクションの数を報告します。
sap/cluster/nodes Pacemaker クラスタ Linux HA クラスタの状態を示す数値レスポンス コード。
  • -10: 不明
  • -1: クリーンでない状態
  • 0: シャットダウン
  • 1: スタンバイ
  • 2: オンライン
sap/cluster/resources Pacemaker クラスタ Linux HA クラスタ リソースが稼働しているかどうかを示す数値レスポンス コード。
  • -10: 不明
  • 0: 失敗
  • 1: 停止
  • 2: 開始中
  • 3: リソースは安定状態(MasterSlaveStarted)のいずれか
sap/nw/availability SAP NetWeaver SAP System ID、SAP インスタンス番号、SAP サービス名に基づく SAP NetWeaver システムの可用性を示す数値レスポンス コード。
  • 0: 不明な状態
  • 1: 現在のノードはアクティブまたは稼働中です
sap/nw/service SAP NetWeaver SAP System ID、SAP インスタンス番号、SAP サービス名に基づく SAP NetWeaver サービスの可用性を示す数値レスポンス コード。
  • 0: サービスは実行されていません
  • 1: サービスは実行中です
sap/nw/icm/rcode SAP NetWeaver 未認証の ICM URL リソースの HTTP 1.1 プロトコル(ローカル呼び出し)に基づくレスポンス コード。
sap/nw/icm/rtime SAP NetWeaver 未認証の ICM URL リソース(ローカル呼び出し)の応答時間(ミリ秒単位)。
sap/nw/ms/rcode SAP NetWeaver 未認証のメッセージ サーバー URL リソースの HTTP 1.1 プロトコル(ローカル呼び出し)に基づくレスポンス コード。
sap/nw/ms/rtime SAP NetWeaver 未認証のメッセージ サーバー URL リソース(ローカル呼び出し)の応答時間(ミリ秒単位)。
sap/nw/ms/wp SAP NetWeaver メッセージ サーバーの情報ページで報告された ABAP 作業プロセス(NW ABAP)または Java サーバーノード(NW Java)の数。
sap/nw/abap/proc/busy SAP NetWeaver ビジー状態の ABAP 作業プロセスの数(DIA、ICM、DISP など)。
sap/nw/abap/proc/count SAP NetWeaver すべての ABAP 処理プロセスの数(DIA、ICM、DISP など)。
sap/nw/abap/queue/current SAP NetWeaver ABAP 作業プロセスで使用される ABAP キューの現在の数。DIAICMDISP などの作業プロセスのタイプ別にグループ化されます。
sap/nw/abap/queue/peak SAP NetWeaver ABAP 作業プロセスで使用される ABAP キューのピーク数。DIAICMDISP などの作業プロセスタイプ別にグループ化されます。
sap/nw/abap/sessions SAP NetWeaver セッション タイプ別の ABAP セッション数。
sap/nw/abap/rfc SAP NetWeaver セッション タイプ別の ABAP RFC 接続数。
sap/nw/enq/locks/usercountowner SAP NetWeaver SAP NetWeaver システムのエンキュー ロック数。システムに多数のオープン ロック エントリがある場合は、ユーザーに対するパフォーマンスの問題につながる可能性があります。
sap/mntmode 追加の SAP 指標 対応する SAP システム ID(SID)のメンテナンス モード。システムが意図的に停止されていることを示すために手動で設定されています(maintenancemode = TRUE)。この指標の値は、計画的なメンテナンス中にシステムが利用できないことを通知するアラートの抑制に使用されます。

特定の SID が計画的なメンテナンス中かどうかをエージェントに通知するには、次のコマンドを実行します。

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed 追加の SAP 指標 SAP とクラスタ サービスに関連する OS サービスに障害が発生したかどうかを示します。終了コード 0 は障害を表します。
sap/service/is-disabled 追加の SAP 指標 この指標は、pacemakercorosyncsapconfsaptunesapinit サービスが有効になっていない場合に提供されます。
sap/hana/cpu/utilization 追加の SAP 指標 SAP HANA プロセスのプロセスごとの CPU 使用率(%)。
sap/nw/cpu/utilization 追加の SAP 指標 SAP NetWeaver プロセスのプロセスごとの CPU 使用率(%)。
sap/control/cpu/utilization 追加の SAP 指標 SAP Control プロセスのプロセスごとの CPU 使用率(%)。
sap/hana/memory/utilization 追加の SAP 指標 HANA プロセスのプロセスごとのメモリ使用量(MB)。
sap/nw/memory/utilization 追加の SAP 指標 NetWeaver プロセスのプロセスごとのメモリ使用量(MB)。
sap/control/memory/utilization 追加の SAP 指標 SAP Control プロセスのプロセスごとのメモリ使用量(MB)。
sap/hana/iops/reads 追加の SAP 指標 SAP HANA プロセスのプロセスごとの読み取り IOPS。
sap/hana/iops/writes 追加の SAP 指標 SAP HANA プロセスのプロセスごとの書き込み IOPS。
sap/nw/iops/reads 追加の SAP 指標 SAP NetWeaver プロセスのプロセスごとの読み取り IOPS。
sap/nw/iops/writes 追加の SAP 指標 SAP NetWeaver プロセスのプロセスごとの書き込み IOPS。
sap/infra/migration Google Cloud インフラストラクチャ指標 VM インスタンスでライブ マイグレーションが行われているかどうかを示します。
sap/pacemaker 追加の SAP 指標 ホストに Pacemaker 構成が含まれているかどうかを示す数値レスポンス コード。
  • 0: Pacemaker 構成はありません
  • 1: pacemaker 構成が見つかりました

この指標は、エージェントのバージョン 3.2 以降でサポートされています。

sap/hana/volumes 追加の SAP 指標

マウントされた SAP HANA ボリュームについて、ボリュームの合計サイズ、使用済みストレージ、使用可能なストレージ、ストレージ使用率を示します。

この指標は、エージェントのバージョン 3.2 以降でサポートされています。

sap/networkstats/rtt 追加の SAP 指標 ラウンドトリップの平均時間(ミリ秒)。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/rcv_rtt 追加の SAP 指標 データでユーザー空間が使用されていない場合に、リモート クライアントが、現在アドバタイズされているリモート受信ウィンドウ(RWIN)を使い果たすまでにかかる時間。これは接続で観測される帯域幅に基づいており、ゼロ以外の値を返します。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/rto 追加の SAP 指標 TCP 再送信のタイムアウト(ミリ秒)。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/bytes_acked 追加の SAP 指標 確認応答されたバイト数。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/bytes_received 追加の SAP 指標 受信バイト数。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/lastsnd 追加の SAP 指標 最後のパケットが送信されてからの経過時間(ミリ秒)。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

sap/networkstats/lastrcv 追加の SAP 指標 最後のパケットが受信されてからの経過時間(ミリ秒)。

この指標には、SAP HANA システムに関連する TCP 接続情報が含まれます。この指標は、ss ユーティリティを使用して SAP HANA hdbnameserver プロセスのソケットに対して収集されます。

Monitoring での指標の表示

Google Cloud には、Google Cloud の SAP 用エージェントによって収集された Process Monitoring 指標を可視化するためのカスタム ダッシュボードが用意されています。GitHub の GoogleCloudPlatform/monitoring-dashboard-samples リポジトリの dashboards/google-cloud-agent-for-sap ディレクトリをご覧ください。

インストール手順など、これらのダッシュボードの詳細については、収集された指標を表示するをご覧ください。

Monitoring での指標データの検出とアラート通知の構成については、Monitoring の指標をご覧ください。