インシデントとイベント

イベントは、アラート ポリシーの条件に違反した場合に発生します。イベントが発生すると、Cloud Monitoring によってインシデントが開かれます。 インシデントやイベントのリストを表示するには次のようにします。

  1. Cloud Console のツールバーで、[ナビゲーション メニュー] をクリックし、[モニタリング] を選択します。

    [モニタリング] に移動

  2. [Monitoring] のナビゲーション ペインで、[ アラート]を選択します。

インシデント

[アラート] ウィンドウの [概要] ペインにインシデントの数が表示され、[インシデント] ペインには最新の 10 件のインシデントが表示されます。各インシデントは次の 3 つの状態のいずれかになります。

  • 対応待ち
  • 確認済
  • クローズ

[すべてのインシデントを表示] をクリックして [インシデント] ウィンドウを開きます。

対応待ちのインシデント

インシデントが対応待ちの場合、条件のポリシーセットが現在満たされている、または条件が満たされなくなったことを示すデータがないことを表します。

ポリシーで複数の条件が指定されている場合は、条件の組み合わせに応じてインシデントが対応待ちとなります。詳しくは、条件の組み合わせをご覧ください。

確認済みのインシデント

インシデントが確認された場合、そのインシデントは対応待ちであり、確認済みとしてマークされています。インシデントに確認済みのマークを付けることによって、そのインシデントが調査中であることを示します。

インシデントに確認済みのマークを付けるには、インシデントの詳細に移動して、[Acknowledge incident] をクリックします。インシデントを確認するには、モニタリング編集者の役割 roles/monitoring.editor が必要です。詳細は、アクセス制御: 事前定義された役割をご覧ください。

クローズしたインシデント

インシデントが作成されると、その条件が満たされているとの新しいモニタリング結果が出るたびにインシデントは更新され、開いたまま保持されます。

条件が満たされなくなったとシステムが判断した場合、または条件が満たされているとのモニタリング結果がないままさらに 7 日間が経過すると、インシデントは自動的に閉じられます。インシデントが、基になる条件が満たされなくなったという理由ではなく、時間の経過により終了した場合、そのインシデントは「期限切れ」と見なされ、通知またはユーザー インターフェースにより、条件がもはや維持されていない場合と区別できるようなラベルが付けられます。

たとえば、連続する 10 秒間に HTTP レイテンシが 2 秒を超える場合にインシデントを生成するアラート ポリシーがあり、インシデントが生成されたとします。HTTP レイテンシの次の測定値が 2 秒以下の場合、インシデントはクローズされます。同様に、7 日間データがまったく受信されなかった場合、インシデントはクローズされます。

インシデントをクローズとしてマークするには、[インシデント] ウィンドウでインシデントを指定し、 [詳細] をクリックして [解決] を選択します。インシデントをクローズとしてマークしても、そのインシデントの根本的原因は調整されません。すなわち、インシデントを生成した条件が次のアラート サイクルで true になる場合、新しいインシデントが生成されます。

インシデントの表示とフィルタリング

[インシデント] ウィンドウには、デフォルトで対応待ちの確認済みのインシデントが表示されます。クローズしたインシデントを表示するには、[クローズしたインシデントを表示] をクリックします。

表示するインシデントを制御するには、フィルタを追加します。フィルタを追加する手順は次のとおりです。

  1. [フィルタテーブル] をクリックし、フィルタ属性を選択します。 

    • 状態
    • アラートポリシー名
    • 指標タイプ
    • リソースの種類
  2. 選択した属性に基づいて、2 つ目のメニューが開き、オプションのリストの一部が表示されます。フィルタバーに値を入力すると、オプションのリストが、入力したテキストを含むオプションに変更されます。

    たとえば、container.googleapis.com/container/cpu/usage_time 指標でフィルタリングするには、指標 の属性を選択します。「usage_time」と入力すると、サブメニューに次のオプションが表示されます。

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time

複数のフィルタを追加すると、すべてのフィルタを満たすインシデントのみが表示されます。

イベントの検査

[アラート] ダッシュボードの [Events] ペインに、最新のイベントと、グラフィカル インジケーターが表示されます。

イベントリストの一部

  • イベントの詳細を表示するには、イベントの名前をクリックします。詳細ウィンドウには、インシデントの開始日時、期間、ステータスが表示されます。

  • すべてのイベントを表示するには、[See all events] をクリックします。[イベント] ウィンドウが開きます。すべてのイベントが表示されます。

    • 次のページまたは前のページのイベントを表示するには、前へボタンと次へボタンを使用します。
    • イベントをフィルタリングするには、[Show filters] をクリックします。フィルタ ダイアログを使用して、アクティビティの種類、リソース、名前を選択します。フィールドをデフォルト値のままにした場合、このフィールドは考慮されません。

      イベント フィルタ ダイアログの表示。

      たとえば、対応待ち状態のすべてのアクティビティを表示するには、[アクティビティ タイプ] メニューで [Opened] を選択し、その他のすべてのフィールドはデフォルト値のままにします。

次の表で、グラフィカル インジケーターについて説明します。

インジケーター 意味
メンテナンス メッセージ アイコン。 メンテナンス メッセージ。
Cloud アカウント追加メッセージ。 Cloud イベント メッセージ。
データベースのバックアップ、構成、またはメンテナンスのメッセージ。 データベースのバックアップ、構成、またはメンテナンスのメッセージ。
確認済み、クローズ、または対応待ちのメッセージ。 確認済み(青)、クローズ(緑)、または対応待ち(赤)のメッセージ。
インスタンスの移行またはプリエンプションのメッセージ、あるいは Kubernetes のメッセージ。 インスタンスが移行またはプリエンプションされたことを示すメッセージ。Kubernetes のセットアップの失敗、準備未完了、またはディスク スペース制限を示すメッセージ。

次のステップ

  • Cloud Monitoring API またはコマンドラインでアラート ポリシーを作成および管理する場合は、API の使用をご覧ください。
  • アラート ポリシーの処理のコンセプトについて詳しくは、アラート ポリシーの詳細をご覧ください。