ログベースのアラートのインシデント

インシデントは、アラート ポリシーのトリガーの記録です。Cloud Monitoring は、アラート ポリシーの条件が満たされたときにインシデントを開きます。 インシデントには、アラートの原因を調査するために使用できる情報が含まれています。

一致するログエントリによって最初にログベースのアラート ポリシーがトリガーされると、Monitoring によってインシデントが開かれ、通知が送信されます。

このドキュメントでは、ログベースのアラート ポリシーのインシデントを表示、調査、管理する方法について説明します。

インシデントの検出

インシデントを一覧表示するには、次のようにします。

  1. Cloud Console のツールバーで、[ナビゲーション メニュー] をクリックし、[モニタリング] を選択します。

    [Monitoring] に移動

  2. [Monitoring] のナビゲーション ペインで、 [アラート] を選択します。

    • [Summary] ペインには、対応待ちのインシデントの数が一覧表示されます。
    • [Incidents] ペインには、最新のインシデントが表示されます。表で終了したインシデントを非表示にするには、[HIDE CLOSED INCIDENTS] をクリックします。

古いインシデントの検出

[アラート] ページの [インシデント] ペインに、最新のインシデントが表示されます。古いインシデントを見つけるには、次のいずれかを行います。

  • [Incidents] テーブルで、 [Newer] または [Older] をクリックすることでページを切替えてエントリを確認する。

  • [See all incidents] をクリックして [インシデント] ページに移動する。[インシデント] ページでは、次の操作をすべて行えます。

    • 終了したインシデントを非表示にする: テーブルに対応待ちのインシデントのみを表示するには、[HIDE CLOSED INCIDENTS] をクリックします。
    • インシデントをフィルタする: フィルタの追加については、インシデントのフィルタリングをご覧ください。
    • インシデントを確認またはクローズする: これらのオプションにアクセスするには、インシデントの行で [その他のオプション] をクリックし、メニューから選択します。詳細については、インシデントの管理をご覧ください。

インシデントのフィルタリング

フィルタバーに値を入力すると、フィルタに一致するインシデントのみが [Incidents] テーブルに表示されます。複数のフィルタを追加すると、すべてのフィルタを満たすインシデントのみが表示されます。

Incidents テーブルのフィルタを追加するには、次のようにします。

  1. [インシデント] ページで [フィルタ] をクリックし、つづいてフィルタ プロパティを選択します。フィルタ プロパティには、次のすべての内容が含まれます。

    • インシデントの状態
    • アラート ポリシーの名前
    • インシデントの開始日、終了日
  2. サブメニューの値を選択するか、フィルタバーに値を入力します。

インシデントの調査

インシデントの詳細を表示するには、少なくとも roles/monitoring.viewer の Identity and Access Management ロールを付与されている必要があります。詳細については、権限エラーのためインシデントの詳細を表示できませんをご覧ください。

調査するインシデントが見つかったら、そのインシデントの[インシデントの詳細]ページに移動します。詳細を表示するには、[アラート] ページまたは [インシデント] ページのインシデントの表でインシデントの概要をクリックします。

または、インシデントへのリンクを含む通知を受け取った場合は、そのリンクを使用してインシデントの詳細を表示できます。

次のスクリーンショットは、インシデントの詳細ページを示しています。

詳細ページには、インシデントの概要情報と調査ツールが表示されます。

[インシデントの詳細] ページには、次の情報が表示されます。

  • 次のようなステータス情報:

    • 名前: このインシデントを引き起こしたアラート ポリシーの名前。
    • ステータス: インシデントのステータス(対応待ち、確認済み、終了)。
    • 期間: インシデントが開かれていた期間。
  • [ログ] ペイン。アラートクエリに一致するログエントリが表示されます。このペインで、調査の一環としてこれらのエントリをフィルタリングできます。

    ログエントリのリストを更新するには、 [更新] をクリックします。ログ エクスプローラでログを表示するには、 [ログ エクスプローラで表示] をクリックします。

  • インシデントを引き起こしたアラート ポリシーに関する情報。

    • [条件] ペイン: インシデントの原因となったアラート ポリシーの条件を識別します。ログ エクスプローラを使用してログベースのアラート ポリシーを作成する場合、条件名は常に「Log match condition」です。

      このペインでは、アラート ポリシーの通知を行う間隔と自動クローズまでの期間も報告されます。

    • [メッセージ] ペイン: アラート ポリシーの条件構成に基づいた原因の簡単な説明が表示されます。このペインには常に値が入力されます。

    • [Documentation] ペイン: アラート ポリシーの作成時に指定した通知のドキュメント テンプレートを表示します。この情報には、アラート ポリシーがモニタリングする内容の説明と、対策のヒントを含めることができます。

      アラート ポリシーを作成するときにこのフィールドを省略した場合、このペインには「No documentation is configured」と表示されます。

  • ラベル: 次の内容を報告します。
    • アラート ポリシーをトリガーしたログエントリに含まれるモニタリング対象リソースのラベルと値。この情報は、インシデントの原因となった具体的なモニタリング対象リソースの特定に役立ちます。これらのラベルは、メッセージ文字列でも報告されます。
    • アラート ポリシーで定義したユーザー指定のラベルと値。これらのラベルを使用して、アラート ポリシーを整理および識別できます。

[インシデント詳細] ページには、インシデント調査用のツールもあります。

  • 他のトラブルシューティング ツールへのリンク。利用可能なリンクは、プロジェクトとアラート ポリシーの構成、インシデントの期間によって決まります。
    • アラート ポリシーの詳細を確認するには、[ポリシーを表示] をクリックします。
    • アラート ポリシーの定義を編集するには、[ポリシーを編集] をクリックします。
    • ログ エクスプローラで関連するログエントリを表示するには、[ログを表示] をクリックします。詳細については、ログ エクスプローラの使用をご覧ください。
  • アノテーション: インシデント調査による、知見、結果、提案、その他のコメントのログを提供します。
    • アノテーションを追加するには、フィールドにテキストを入力して、[コメントを追加] をクリックします。
    • コメントを破棄するには、[キャンセル] をクリックします。

また、[インシデントの詳細] ページでインシデントの承認や終了を行うことができます。詳細については、インシデントの管理をご覧ください。

インシデントの管理

インシデントは次のいずれかの状態になります。

  • 対応待ち: ログベースのアラート ポリシーがトリガーされましたが、インシデントは対応待ちです。同じアラートが再度トリガーされ、インシデントがすでに開かれている場合、新しいインシデントは開かれません。

  • 確認済み: インシデントが対応待ちの状態であり、手動で確認済みとしてマークされています。通常、このステータスは、そのインシデントが調査中であることを示します。

  • 完了済み: インシデントを手動でクローズしたか、自動クローズ期間が終了した後に自動的にクローズされました。

インシデントを管理するには、役割に monitoring.alertPolicy.create 権限または monitoring.alertPolicy.update 権限を含める必要があります。これらの権限は、モニタリング編集者の役割 roles/monitoring.editor に含まれています。役割と権限の詳細については、アクセス制御: 事前定義された役割をご覧ください。

インシデントの確認

インシデントの原因調査を開始するときは、インシデントに確認済みのマークを付けることをおすすめします。

インシデントに確認済みのマークを付けるには、次の手順を行います。

  • [アラート] ダッシュボードの [インシデント] ペインで [See all incidents] をクリックします。
  • [インシデント] ページで、確認するインシデントを見つけて、次のいずれかを行います。

    • [More options]()をクリックし、つづいて [Acknowledge] を選択します。
    • インシデントの詳細ページを開いて、[ACKNOWLEDGE INCIDENT] をクリックします。

インシデントのクローズ

Monitoring によりインシデントをクローズする、またはユーザーがインシデントをクローズすることができます。

アラート ポリシーの自動終了期間が終了すると、Monitoring によってインシデントが自動的にクローズされます。デフォルトの自動クローズ期間は 7 日間です。自動クローズの最短期間は 30 分です。

インシデントをクローズする手順は次のとおりです。

  1. [アラート] ダッシュボードの [インシデント] ペインで [See all incidents] をクリックします。
  2. [インシデント] ページで、クローズするインシデントを見つけて、次のいずれかを行います。

    • [その他の設定] をクリックし、[このインシデントをクローズする] を選択します。
    • インシデントの詳細ページを開いて、[Close incident] をクリックします。
メッセージ「Unable to close incident」が表示された場合は、数分後にもう一度お試しください。トリガーしたログエントリは、アラート システムによって引き続き有効であるとみなされるため、新しいインシデントを直ちにクローズすることはできません。

次のステップ