アラート ポリシーの条件を指定する

アラート ポリシーの条件では、モニタリングの対象と、アラートをトリガーするタイミングを定義します。

たとえば、Compute Engine VM インスタンスの CPU 使用率が 3 分以上 80% を上回った場合にメールで通知するアラート ポリシーを定義するとします。それには、[Conditions] ダイアログを使用して、Compute Engine VM インスタンスの CPU 使用率をモニタリングすることと、その使用率が 80% を上回っている時間が 3 分間になった時点でアラートをトリガーすることを指定します。

始める前に

[Conditions] ペインを開くには、次の操作を行います。

  1. [Stackdriver] > [Monitoring] > [Alerting] > [Create a Policy] に移動します。

    ポリシーの作成に移動

  2. [Add Condition] をクリックします。

役職

[Title] フィールドは必須フィールドです。[Conditions] ダイアログの各フィールドにすべての情報を入力すると、[Title] フィールドにその情報が自動的に入力されます。自動入力された内容を変更して、よりわかりやすい内容にすることができます。

条件のタイプ

[Conditions] ダイアログでは、追加する条件のタイプを選択できます。すべての条件にはアラート発生のタイミングを定義する構成が含まれますが、各タイプの条件には固有のフィールドがあります。

  • 指標条件は、リソースタイプと指標によって定義されます。
  • 稼働時間チェック条件は、リソースタイプと稼働時間チェックによって定義されます。
  • プロセスの状態条件は、リソースタイプと一連のフィルタによって定義されます。

タブのヘッダーで、矢印を使用してスクロールし、追加する条件のタイプをクリックします。

条件を追加または編集する

対象

条件のタイプを選択したら、[Target] ペインのフィールドを使用して、条件のフィールドの値を定義します。たとえば、指標条件を選択した場合、[Target] ペインにはリソースタイプと指標のリストボックスが表示されます。

任意のタイプのアラート ポリシーのターゲットを選択すると、いくつかの制約に合致する一連の時系列が選択されます。これらの時系列は条件のグラフにプロットされます。時系列の詳細については、指標、時系列、リソースをご覧ください。

指標のターゲットを追加する

指標のターゲットは、リソースタイプと指標によって定義されます。たとえば、リソースタイプと指標として、それぞれ [Compute Engine VM Instance] と [CPU load (15m)] を選択できます。指標条件を追加するには、次の操作を行います。

  1. [Metric] タブをクリックします。

  2. [Find resource type and metric] フィールドをクリックして、利用可能なリソースタイプと指標のプルダウン リストを表示し、モニタリングするリソースタイプを選択します。

    リソースタイプを選択する

  3. リソースタイプを選択すると、リストにはそのリソースタイプの指標のみが表示されます。利用可能なデータが存在する指標のみが一覧表示されます。[Metrics] オプションをスクロールして、ポリシーによってモニタリングする具体的な指標を選択します。

    指標を選択する

リソースタイプと指標を選択すると、ページが拡張されてグラフが表示され、アラート条件を調整するためのコントロールが追加されます。新しいオプションの詳細については、ターゲット指標の構成をご覧ください。追加情報については、以下をご覧ください。

  • 独自のカスタム指標を作成する方法の詳細については、カスタム指標の使用をご覧ください。
  • ログエントリの内容に基づいて指標を作成する方法の詳細については、ログベースの指標の概要をご覧ください。
  • アラート ポリシーのサンプルと、アラート ポリシーを JSON 形式で表現する方法については、サンプル ポリシーをご覧ください。

稼働時間チェックのターゲットを追加する

[Monitoring] > [Uptime checks] ページから稼働時間チェックのアラート ポリシーを作成することをおすすめします。この場合、アラート ポリシーの条件フィールドには値が自動的に設定されます。詳細については、稼働時間チェックに関するアラートをご覧ください。

プロセスの状態のターゲットを追加する

プロセスの状態のターゲットは、リソースタイプと一連のフィルタによって定義されます。特定のパターンと一致するプロセスの数が期間時間枠の間にしきい値を上回るか下回った場合にインシデントをトリガーするよう、このポリシーを構成することができます。プロセスの状態条件を追加するには、次の手順に従います。

  1. [Process health] タブをクリックします。
  2. [Resource Type] の各フィールドで、次の操作を行います。

    • 左のプルダウン リストで、単一のリソース、リソースのグループ、またはすべてのリソースを選択します。
    • 右のプルダウン リストで、モニタリングするリソースタイプを選択します。たとえば、[Compute Engine VM Instance] を選択します。UI では、システムで利用できるリソースタイプの一覧が表示されます。
  3. [Command Line]、[Command]、[User] の各フィルタで、モニタリングするプロセスを特定するためのフィールドを選択します。これらのフィルタにおいて、左のプルダウン リストでは文字列照合演算子を選択し、右のフィールドではクエリを指定します。

    • 使用できる文字列照合演算子は、EqualsContainsStarts withEnds withRegex です。照合時に大文字と小文字は区別されます。
    • クエリの構文は選択した演算によって異なります。クエリではワイルドカード演算子を使用できます。たとえば、ワイルドカード * は任意のプロセスに一致します。

    3 つのフィルタの結果は、次のルールに従って結合されます。

    • どのフィルタにもクエリ値を指定しない場合は、すべてのプロセスが数えられます。

    • 1 つのフィルタに対してクエリを入力した場合は、そのフィルタに一致するプロセスのみが数えられます。

    • コマンドライン クエリとコマンドクエリを入力した場合は、いずれかのフィルタに一致するプロセスが数えられます。コマンドラインの 1024 文字より後の部分は切り捨てられるため、この制限を超えるコマンドライン内のテキストは照合できません。

    • ユーザークエリを入力した場合は、ユーザー フィルタとコマンドライン(またはコマンド)フィルタに一致するプロセスが数えられます。

たとえば、プロジェクト内のすべての Compute Engine VM インスタンスにおいて、名前に nginx が含まれ、オーナーが root であるプロセスの数を数える場合は、[Target] 領域を次のように構成します。

  • [Resource type] の左のプルダウン リストで [All] を選択し、右のプルダウン リストで [Compute Engine VM Instance] を選択します。
  • [Command Line] の左のプルダウン リストで [Contains] を選択し、右のフィールドに「nginx」と入力します。
  • [Command] の右のフィールドは空のままにします。
  • [User] の左のプルダウン リストで [Equals] を選択し、右のフィールドに「root」と入力します。

root の nginx を表示

上の図のグラフは 2 つのインスタンスのデータを示しており、アラートしきい値は 1 プロセスです。一方のインスタンスにはフィルタ条件を満たすプロセスが存在せず、もう一方のインスタンスにはフィルタ条件を満たすプロセスが 2 つ存在します。

構成

ターゲットを指定したら、そのターゲットで制約の違反となる条件を指定する必要があります。

[Configuration] 領域を使用して、アラート ポリシーのトリガーのタイミングを定義します。この領域では、どの時系列でアラートがトリガーされる可能性があるか、またそれらの時系列でポリシー違反になる条件を定義します。

たとえば、いずれかの時系列で 3 分間で 50 を上回った場合にアラート ポリシーをトリガーするように構成するには、次の操作を行います。

  • [Condition triggers if] プルダウン リストで、[Any time series violates] を選択します。
  • [Condition] プルダウン リストで、[is above] を選択します。
  • [Threshold] フィールドに「50」と入力します。
  • [For] プルダウン リストで、[3 minutes] を選択します。

    ターゲット指標の構成

その他のオプション

上記の例で説明した構成オプションに加えて、アラートをトリガーできる時系列のサブセットと違反の基準をそれぞれ指定できます。

[Condition trigger if] プルダウン リストでは、条件に違反するターゲットのサブセット(すべての時系列または時系列のサブセット)を選択できます。次の選択肢があります。

  • Any time series violates
  • Percent of time series violates
  • Number of time series violates
  • All time series violate

[Condition] プルダウン リストには次の選択肢があります。

  • Is above
  • Is below
  • Increases by
  • Decreases by
  • Is absent

上記の例では、1 つの時系列が違反していると制約の違反となります。違反の条件で、[Condition] フィールドが「Is above」と「50」に設定されており、期間は 3 分になっています。したがってこのアラート ポリシーは、ターゲット設定内のいずれかの時系列が 50 を超えて、その状態が 3 分間続いた場合にトリガーされます。

条件の定義を完了する

条件の定義を完了して [Alerting Policy] ダイアログに戻るには、[Save] をクリックします。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

ご不明な点がありましたら、Google のサポートページをご覧ください。