インシデント

このページでは、インシデントを表示、管理する方法について説明します。インシデントは、アラート ポリシーの条件が満たされていると Cloud Monitoring が判断すると開かれます。

インシデントの表示

インシデントのリストを表示する手順は次のとおりです。

  1. Cloud Console のツールバーで、[ナビゲーション メニュー] をクリックし、[モニタリング] を選択します。

    [Monitoring] に移動

  2. [Monitoring] のナビゲーション ペインで、[ アラート]を選択します。

    アラート ダッシュボード ページの [概要] ペインには、対応待ちのインシデントの数が、[インシデント] ペインには最新のインシデントが表示されます。デフォルトでは、クローズされたインシデントは表示されません。クローズされたインシデントを表示するには、[Show closed incidents] をクリックします。

  3. (省略可)[インシデント] ページを開くには、[See all incidents] をクリックします。

    • クロースされたインシデントを含むすべてのインシデントを表示するには、[Show closed incidents] をクリックします。
    • 一覧表示されるインシデントを制御するには、フィルタを追加します。詳しくは、インシデントのフィルタリングをご覧ください。
    • インシデントに関連付けられたアラート ポリシーを編集または表示するには、[その他のオプション] をクリックし、オプションのメニューから選択します。

インシデントの管理

インシデントの状態には、次の 3 つがあります。

  • オープン: ポリシーの条件のセットが満たされているか、条件が満たされなくなったことを示すデータが存在しません。ポリシーに複数の条件が含まれている場合は、条件の組み合わせに応じてインシデントが開かれます。詳しくは、条件の組み合わせをご覧ください。

  • 確認済み: インシデントが対応待ちの状態であり、手動で確認済みとしてマークされています。通常、このステータスは、そのインシデントが調査中であることを示します。

  • 完了済み: 条件が満たされなくなったとシステムが判断した場合、または条件が満たされているとのモニタリング結果がないままさらに 7 日間が経過しました。

アラート ポリシーを構成する場合は、すべてが正常な状態になった安定状態であることを示すシグナルが生成されるようにします。これは、エラーのない状態を識別し、インシデントが開いている場合にそのインシデントをクローズできるようにするために必要となります。エラー状態が停止されたことを示すシグナルがない場合、インシデントが開かれた後、ポリシーが発行されてから 7 日間は開かれたままとなります。

たとえば、エラー数が 0 を超えた場合に通知するポリシーを作成する場合は、エラーがない場合にエラー数 0 を生成するようにします。エラーがない状態でポリシーが null または空を返す場合は、エラーがいつ終了したかを示すシグナルは存在しません。状況によっては、Monitoring Query Language(MQL)で、測定された値を取得できない場合に使用されるデフォルト値を指定できる場合があります。例については、比率の使用をご覧ください。

インシデントの確認

インシデントに確認済みのマークを付けるには、次の手順を行います。

  • [アラート] ダッシュボードの [インシデント] パネルで [すべてのインシデントを表示] をクリックします。[インシデント] ウィンドウが開きます。
  • インシデントを確認するには、次のいずれかを行います。

    • 確認するインシデントの [その他のオプション] を選択し、[確認] を選択します。
    • 確認するインシデントの詳細ページを開き、[Acknowledge incident] をクリックします。

インシデントを確認するには、モニタリング編集者の役割 roles/monitoring.editor が必要です。詳細は、アクセス制御: 事前定義された役割をご覧ください。

条件のミュート

条件をミュートすると、その条件付きの対応待ちのすべてのインシデントがミュート状態になり、条件が満たされてもアラート通知は届きません。条件をミュートすると、アクティブなインシデントの表示からインシデントが削除されます。インシデントを調査する場合は、ミュートするのではなく、インシデントを確認する必要があります。

インシデントをミュートしても、インシデントの根本原因は調整されません。すなわち、インシデントを生成した条件が次のアラート サイクルで引き続き満たされる場合、インシデントが再び開かれます。

条件をミュートするには:

  • [アラート] ダッシュボードの [インシデント] ペインで [See all incidents] をクリックします。
  • [インシデント] ページで確認するインシデントを探して、[その他のオプション] をクリックし、[関連する条件が機能しないようにする] を選択します。

インシデントのクローズ

インシデントは自動的にクローズされます。インシデントをクローズすることはできません。条件が満たされなくなったとシステムが判断した場合、または条件が満たされているとのモニタリング結果がないままさらに 7 日間が経過すると、インシデントはクローズされます。

たとえば、連続する 10 分間に HTTP レイテンシが 2 秒を超える場合にインシデントを生成するように構成されているアラート ポリシーがあり、インシデントが開かれたとします。HTTP レイテンシの次の測定値が 2 秒以下の場合、インシデントはクローズされます。同様に、7 日間データがまったく受信されなかった場合、インシデントはクローズされます。

インシデントのフィルタリング

フィルタを追加する手順は次のとおりです。

  1. [インシデント] ページで、 [表をフィルタリング] をクリックし、フィルタリング属性を選択します。

    • アラートポリシー名
    • 指標タイプ
    • リソースの種類
  2. セカンダリ メニューから値を選択するか、フィルタバーに値を入力します。フィルタバーに値を入力すると、入力した値が含まれるオプションだけがオプションリストに表示されます。

    たとえば、[指標タイプ] を選択して「usage_time」と入力した場合、セカンダリ メニューには次のオプションのみが表示される場合があります。

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time

複数のフィルタを追加すると、すべてのフィルタを満たすインシデントのみが表示されます。

次のステップ

  • Cloud Monitoring API またはコマンドラインでアラート ポリシーを作成および管理する場合は、API の使用をご覧ください。
  • アラート ポリシーの処理のコンセプトについて詳しくは、アラート ポリシーの詳細をご覧ください。