アラート ポリシーの種類

このページでは、Google Cloud Console または Cloud Monitoring API で表されるさまざまなタイプの指標ベースのアラート ポリシーについて説明し、これらのポリシー向けの JSON の例を示します。Monitoring Query Language(MQL)を使用して作成されたアラート ポリシーに関心がある場合は、MQL のアラート ポリシーをご覧ください。

このコンテンツは、ログベースのアラート ポリシーには適用されません。ログに特定のメッセージが表示されたときに通知する、ログベースのアラート ポリシーの詳細については、ログのモニタリングをご覧ください。

アラート ポリシーは条件を定義します。これらの条件は指標に基づいています。アラート ポリシー条件により、たとえば、指標が値に達した場合や、指標がすぐに変化し始めたかどうかをモニタリングできます。指標はリソースに関連付けられていて、そのリソースのいくつかの特性(たとえば、VM グループ全体の平均 CPU 使用率)を測定します。指標の詳細については、指標、時系列、およびリソースをご覧ください。

すべての条件では、ある期間に、ある方法で動作する、ある指標、という 3 つがモニタリングされます。

すべての条件は、指標の不在条件または指標しきい値の 2 つの一般的なタイプのいずれかとして実装されます。

指標の不在条件

指標の不在条件では、特定の期間時間枠に対してデータが存在しない場合にトリガーされます。

「指標の不在」条件では、そのポリシーのインストールまたは変更後、最大時間枠内に測定が 1 回以上成功(測定でデータが取得される)している必要があります。構成可能な最大時間枠は、Google Cloud Console を使用する場合は 24 時間、Cloud Monitoring API を使用する場合は 24.5 時間です。

たとえば、「指標の不在」ポリシーで期間時間枠を 30 分に設定しているとします。指標データを書き込むサブシステムが一度もデータポイントを書き込んでいない場合、この条件は満たされません。サブシステムが 1 つ以上のデータポイントを出力していて、その後の 30 分間に追加のデータポイントが出力できない場合に条件が満たされます。

Monitoring API を使用して指標の不在アラート ポリシーを作成する方法については、指標ベースのアラート ポリシーの条件をご覧ください。

指標しきい値条件

指標しきい値条件は、特定の期間時間枠において指標がある値を上回る、または下回るときにトリガーされます。

「指標しきい値」条件のクラス内には、一般的なサブカテゴリに分類されるパターンがあります。

  • 指標の変化率(パーセント): 期間時間枠内で指標が特定のパーセント以上増加または減少した場合にトリガーされます。

    このタイプの条件では、しきい値との比較の前に、変化率の計算が時系列に適用されます。

    この条件では、過去 10 分間の指標の値の平均が、期間時間枠の直前に測定された 10 分間の平均値と比較されます。「指標の変化率」条件で使用される 10 分間のルックバック時間枠は固定値であり、変更できません。ただし、条件を作成するときに期間時間枠を指定できます。

  • グループ集計しきい値: リソース グループ全体で測定された指標がしきい値を上回るか、または下回るときにトリガーされます。

  • 稼働時間チェックの状態: 稼働時間チェックを作成済みであり、かつ、2 つ以上の地理的ロケーションから送信されたリクエストにリソースが正常にレスポンスを返すことができなかったときにトリガーされます。

    稼働時間チェックの結果は複数の場所に表示されます。Google Cloud Console で [モニタリング] に移動し、[概要] または [稼働時間チェック] を選択します。どちらのウィンドウにも、プロジェクトの稼働時間チェックとチェック ステータスが表示されます。特定の稼働時間チェックの詳細を表示するには、リストから名前を選択します。稼働時間チェックに関するアラート ポリシーを作成することによって、間接的にインシデントを開くことができ、オプションで稼働時間チェックが失敗したときに通知を送信できます。

  • プロセスの状態: これらの条件は、命名規則に一致する VM インスタンス上またはインスタンス グループ上で実行されている、プロセスの数をカウントします。条件は、このカウントが特定の数を上回るか、または下回るときにトリガーされます。

    この条件タイプでは、Ops エージェントまたは Monitoring エージェントがモニタリング対象リソースで実行されている必要があります。エージェントの詳細については、Google Cloud オペレーション スイートのエージェントをご覧ください。

  • 指数率: 2 つの指標の比率が特定期間のしきい値を超えるとトリガーされます。これは、すべての HTTP レスポンスに対する HTTP エラー レスポンスの比率など、2 つの関連する指標を使用するしきい値条件です。

    比率ベースのポリシーの詳細については、比率のアラートの条件をご覧ください。

各ポリシータイプの例は次のリンクから入手できます。

条件タイプ JSON の例
指標しきい値 表示
変化率 表示
グループ集計 表示
稼働時間チェック 表示
プロセスの状態 表示
指標率 表示

次のステップ