Google Cloud 上の SAP の指標ベースのアラートポリシーを作成する

Google Cloud で SAP システムをモニタリングするには、Cloud Monitoring のアラートポリシーを設定します。このポリシーは、構成ミスやリソース障害が発生した場合に SAP 管理者に通知します。

このドキュメントでは、一般的な HA の問題と、それらの問題に対するアラートポリシーを作成する方法、また独自のカスタムアラートを作成するための参照としてアラートの例を使用する方法について説明します。このドキュメントで説明するアラートの例では、Monitoring Query Language（MQL）を使用して、Google Cloud の Agent for SAP によって生成された指標をクエリします。デフォルトでは、これらのアラートは特定の Google Cloud プロジェクト内のすべての SAP システムに適用されますが、アラートをカスタマイズして必要な SID をフィルタすることや、経過時間を調整してアラートをトリガーすることができます。

Cloud Monitoring アラートの動作については、アラートの概要をご覧ください。

始める前に

Monitoring アラートポリシーの一般的なコンセプトに精通していることを確認してください。アラートポリシーに関する説明は、アラートの概要をご覧ください。
モニタリングする SAP システムをホストする各インスタンスで、Google Cloud の SAP 用エージェントがインストールされ、Process Monitoring 指標を収集するように構成されていることを確認します。
Google Cloud コンソールを使用してアラートポリシーを作成および変更するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールの付与を管理者に依頼してください。
- すべて: モニタリング編集者（roles/monitoring.editor）
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
アラートを受信するには、必要な通知チャネルを作成します。冗長性を確保するために、複数の通知チャネルを作成することをおすすめします。詳細については、通知チャンネルを作成して管理するをご覧ください。

事前定義のアラートポリシーをインポートする

Google Cloud には、一般的な HA の問題をインポートしてアラートを設定できる事前定義のアラートポリシーが用意されています。詳しくは、以下のセクションをご覧ください。

ロケーションの制約検出のためのアラートをインポートする
リソース障害検出のアラートをインポートする
SAP HANA レプリケーションエラーのアラートをインポートする

ロケーションの制約検出のためのアラートをインポートする

クラスタコマンドを使用して Pacemaker クラスタ内のリソースを手動で移動すると、そのリソースに制約が追加されるか、クライアントの設定が特定のノードを優先するように設定されます。このような状況では、システム停止時にリソースのフェイルオーバーが妨げられる可能性があります。詳細については、ClusterLabs ドキュメントの 1 つのリソースの移動をご覧ください。

Google Cloud で実行されている SAP HA システムでこのような状況が発生した場合に通知を受け取るには、事前定義されたアラートポリシー Pacemaker: Location constraint detected をインポートします。

このアラートポリシーは、優先度ベースの制約が検出されると通知し、SAP 管理者に SAP の高可用性構成のトラブルシューティングガイドの「特定のノードを優先する意図しないノードアフィニティ」セクションを参照するよう指示します。このポリシーでは、Google Cloud の SAP 用エージェントによって収集される Process Monitoring の指標 workload.googleapis.com/sap/validation/pacemaker を使用します。

Google Cloud コンソールを使用してこのアラートポリシーを Google Cloud プロジェクトにインポートするには、次の操作を行います。

Google Cloud コンソールで [統合] ページに移動します。
[インテグレーション] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
Google Cloud Agent for SAP でフィルタし、[詳細を表示] をクリックします。
[アラート] タブに移動します。
Pacemaker: Location constraint detected を選択して、[オプションを表示] > [アラートポリシーをカスタマイズ] をクリックします。
（省略可）Google Cloud プロジェクト内のすべての SAP システムではなく、特定の SAP システムに対してアラートを構成するには、クエリエディタで filter ステートメントを次のように更新します。
1. sid 変数の前に存在する # 文字を削除します。
2. 必要な SID を指定します。複数の SID を指定するには、| 文字を使用して SID を区切ります。このようなフィルタステートメントの例を次に示します。
```
sid=~"ABC|HDB|XYZ"
```
  この例では、ABC、XYZ、HDB が SID です。
（省略可）アラートをトリガーするまでの経過時間をカスタマイズするには、クエリエディタで window ステートメントを更新して、任意の測定単位を指定します。
1. たとえば、制限時間を 3 分に設定するには、次のように設定します。
```
| window 3m
```
[アラートの詳細] で、[通知と名前] タブに移動します。
必要な通知チャンネルを選択します。
アラートを確認して [ポリシーを作成] をクリックします。

リソース障害検出のアラートをインポートする

HA システムで、実行中のリソースエージェントが失敗した場合、Pacemaker はエージェントの停止と再起動を試みます。なんらかの理由で再起動オペレーションが失敗した場合、Pacemaker は、そのリソースエージェントの failcount 値を INFINITY に設定します（start-failure-is-fatal がデフォルトの true に設定されている場合）。その後、別のノードでエージェントを起動しようとします。すべてのノードでリソースエージェントが起動に失敗した場合、リソースエージェントは Stopped ステータスのままになります。このリソースエージェントを動作状態に戻すには、SAP 管理者がリソースエージェントの失敗回数を手動でクリアする必要があります。Pacemaker の failcount 動作の詳細については、ClusterLabs のドキュメントをご覧ください。

Google Cloud で実行されている SAP HA システムでこのような状況が発生した場合に通知を受け取るには、事前定義されたアラートポリシー Pacemaker: Resource failed to start をインポートします。

このアラートポリシーは、リソースエージェントの起動に失敗し、ステータスが Stopped のまま 3 分以上経過したときに通知します。このポリシーでは、SAP 管理者に SAP の高可用性構成のトラブルシューティングガイドの「リソースエージェントが停止している」セクションを参照するよう指示します。このポリシーでは、Google Cloud の SAP 用エージェントによって収集される Process Monitoring の指標 workload.googleapis.com/sap/cluster/failcounts を使用します。

Google Cloud コンソールを使用してこのアラートポリシーを Google Cloud プロジェクトにインポートするには、次の操作を行います。

Google Cloud コンソールで [統合] ページに移動します。
[インテグレーション] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
Google Cloud Agent for SAP でフィルタし、[詳細を表示] をクリックします。
[アラート] タブに移動します。
Pacemaker: Resource failed to start を選択して、[オプションを表示] > [アラートポリシーをカスタマイズ] をクリックします。
（省略可）Google Cloud プロジェクト内のすべての SAP システムではなく、特定の SAP システムに対してアラートを構成するには、クエリエディタで filter ステートメントを次のように更新します。
1. sid 変数の前に存在する # 文字を削除します。
2. 必要な SID を指定します。複数の SID を指定するには、| 文字を使用して SID を区切ります。このようなフィルタステートメントの例を次に示します。
```
sid=~"ABC|HDB|XYZ"
```
  この例では、ABC、XYZ、HDB が SID です。
（省略可）アラートをトリガーするまでの経過時間をカスタマイズするには、クエリエディタで window ステートメントを更新して、任意の測定単位を指定します。
1. たとえば、制限時間を 3 分に設定するには、次のように設定します。
```
| window 3m
```
[アラートの詳細] で、[通知と名前] タブに移動します。
必要な通知チャンネルを選択します。
アラートを確認して [ポリシーを作成] をクリックします。

SAP HANA レプリケーションエラーのアラートをインポートする

SAP HANA プライマリサイトで停止が発生した場合、セカンダリがプライマリと同期されていないと、プライマリからセカンダリシステムへの自動フェイルオーバーは実行できません。

このアラートポリシーは、高可用性 SAP HANA システムのレプリケーションステータスが 1 分以上同期されていない場合に通知します。このポリシーでは、systemReplication.py スクリプトから派生した Process Monitoring の指標 workload.googleapis.com/sap/hana/ha/replication を使用します。このポリシーでは、SAP 管理者に、プライマリ SAP HANA システムとセカンダリ SAP HANA システムのステータスとネットワーク接続を確認するよう指示しています。

Google Cloud で実行されている SAP HANA HA システムでこのような状況が発生した場合に通知を受け取るには、事前定義されたアラートポリシー SAP HANA Replication is not in sync をインポートします。

Google Cloud コンソールを使用してこのアラートポリシーを Google Cloud プロジェクトにインポートするには、次の操作を行います。

Google Cloud コンソールで [統合] ページに移動します。
[インテグレーション] に移動

検索バーを使用してこのページを検索する場合は、小見出しが [Monitoring] の結果を選択します。
Google Cloud Agent for SAP でフィルタし、[詳細を表示] をクリックします。
[アラート] タブに移動します。
SAP HANA Replication is not in sync を選択して、[オプションを表示] > [アラートポリシーをカスタマイズ] をクリックします。
（省略可）Google Cloud プロジェクト内のすべての SAP システムではなく、特定の SAP システムに対してアラートを構成するには、クエリエディタで filter ステートメントを次のように更新します。
1. sid 変数の前に存在する # 文字を削除します。
2. 必要な SID を指定します。複数の SID を指定するには、| 文字を使用して SID を区切ります。このようなフィルタステートメントの例を次に示します。
```
sid=~"ABC|HDB|XYZ"
```
  この例では、ABC、XYZ、HDB が SID です。
（省略可）アラートをトリガーするまでの経過時間をカスタマイズするには、クエリエディタで window ステートメントを更新して、任意の測定単位を指定します。
1. たとえば、制限時間を 3 分に設定するには、次のように設定します。
```
| window 3m
```
[アラートの詳細] で、[通知と名前] タブに移動します。
必要な通知チャンネルを選択します。
アラートを確認して [ポリシーを作成] をクリックします。

カスタムアラートポリシーを作成する

事前定義のアラートポリシーをインポートするだけでなく、更新して要件に合ったカスタムポリシーを作成することもできます。これには、Google Cloud コンソール、Cloud Monitoring API、Google Cloud CLI、Terraform を使用できます。

まず、アラートポリシー例の概要と、このドキュメントで説明する事前構成済みアラートポリシーを確認することをおすすめします。

アラートポリシーの管理または変更の方法については、アラートポリシーを管理するをご覧ください。

Google Cloud 上の SAP の指標ベースのアラート ポリシーを作成する

始める前に

事前定義のアラート ポリシーをインポートする

ロケーションの制約検出のためのアラートをインポートする

リソース障害検出のアラートをインポートする

SAP HANA レプリケーション エラーのアラートをインポートする

カスタム アラート ポリシーを作成する

Google Cloud 上の SAP の指標ベースのアラートポリシーを作成する

事前定義のアラートポリシーをインポートする

SAP HANA レプリケーションエラーのアラートをインポートする

カスタムアラートポリシーを作成する