アラートの概要

アラートによって、クラウド アプリケーションの問題をタイムリーに認識し、問題をすばやく解決できます。

Cloud Monitoring では、アラート ポリシーで、アラートを受け取る状況と通知方法を記述します。このページでは、通知ポリシーの概要について説明します。

Cloud Monitoring によって収集された指標データの追跡に使用されるアラート ポリシーは、指標ベースのアラート ポリシーと呼ばれます。アラート ポリシーに関する Cloud Monitoring のドキュメントの多くは、指標ベースのアラート ポリシーを使用していることを前提としています。指標ベースのアラート ポリシーの設定方法については、Compute Engine のクイックスタートをご覧ください。

ログにアラート ポリシーを作成して、ログに特定のメッセージがある場合に通知することもできます。これらのポリシーは指標に基づいていません。このコンテンツは、ログベースのアラート ポリシーには適用されません。ログベースのアラート ポリシーの詳細については、ログのモニタリングをご覧ください。

アラートの仕組み

各アラート ポリシーで指定するものは、以下の通りです。

  • 1 つのリソースまたはリソースのグループが、レスポンスを必要とする状態かどうかを表す条件。アラート ポリシーには少なくとも 1 つの条件を設定する必要がありますが、複数の条件を設定したポリシーを構成できます。

    たとえば、条件を次のように構成できます。

    The HTTP response latency is higher than two seconds for at least five minutes.
    

    この例では、条件によって指標「HTTP レスポンスのレイテンシ」がモニタリングされ、指標の値に対してレスポンスをする必要があるタイミングが指定されます。リソースまたはリソースのグループがレスポンスを必要とする状態である場合、この条件は「満たされている」状況です。

  • アクションが必要なユーザーを通知する通知チャネルです。アラート ポリシーには、複数の通知チャネルを含めることができます。Cloud Monitoring は、一般的な通知チャネルに加え、Cloud Mobile App と Pub/Sub をサポートしています。サポートされているチャネルのリストと、これらのチャネルを構成する方法については、通知オプションをご覧ください。

    たとえば、アラート ポリシーを構成して my-support-team@example.com にメールを送信し、チャネル #my-support-team に Slack メッセージを投稿できます。

  • 通知に含めるドキュメント。ドキュメント フィールドでは、書式なしテキスト、マークダウン、変数がサポートされています。

    たとえば、次のポリシーをアラート ポリシーに組み込むことができます。

    ## HTTP latency responses
    
    This alert originated from the project ${project}, using
    the variable $${project}.
    

指標ベースのアラート ポリシーの構成後、Monitoring はそのポリシーの条件を継続的にモニタリングします。特定の期間のみをモニタリングする条件を構成することはできません。

このポリシーの条件が満たされると、Monitoring はインシデントを作成し、インシデントの作成に関する通知を送信します。この通知には、インシデントの概要情報、インシデントを調査できる [ポリシーの詳細] ページのリンク、および指定したドキュメントが記載されています。

インシデントが未解決のまま残っていて、Monitoring で指標ベースのポリシーの条件が満たされなくなったと判断された場合、Monitoring は自動的にインシデントを終結させて、終結に関する通知を送信します。

ウェブ アプリケーションを実行している Compute Engine 仮想マシン(VM)インスタンスにウェブ アプリケーションをデプロイします。HTTP レスポンスのレイテンシは変動することが予想されますが、アプリケーションのレイテンシが長期間高いときには、サポートチームが応答するようにする必要があります。

アプリケーションのレイテンシが高くなったときにサポートチームが通知を受け取るようにするには、次のアラート ポリシーを作成します。

  If the HTTP response latency is higher than two seconds for at least five
  minutes, then open an incident and send an email to your support team.

このアラート ポリシーでは、設定条件により HTTP レスポンスのレイテンシがモニタリングされています。このレイテンシが 5 分間で継続して 2 秒を超える場合は、条件が満たされ、インシデントが生成されます。レイテンシの一時的な急上昇によって条件が満たされたり、インシデントが生成されたりすることはありません。

ウェブ アプリケーションが人気になり、レスポンスのレイテンシが 2 秒を超えるようになりました。アラート ポリシーでどのように対応するかを次に示します。

  1. Monitoring は、HTTP レイテンシ測定値が 2 秒を超えるときに 5 分のタイマーを開始します。

  2. 次の 5 分間に受信した各レイテンシ測定値が 2 秒を超えたら、タイマーは期限切れになります。タイマーが期限切れになると、Monitoring によって条件が満たされたと判定され、インシデントが生成されて、サポートチームにメールが送信されます。

  3. サポートチームがメールを受信し、Cloud Console にログインして、通知の受信を確認します。

  4. 通知メールのドキュメントに従って、サポートチームがレイテンシの原因に対応できます。数分以内に、HTTP レスポンスのレイテンシが 2 秒未満に低下します。

  5. Monitoring が 2 秒未満の HTTP レイテンシ測定を受信すると、インシデントを終了し、インシデントが終結されたという通知をサポートチームに送信します。

レイテンシが 2 秒を超え、5 分間にわたってそのしきい値を超えた場合、新しいインシデントが開かれ、通知が送信されます。

アラート ポリシーの追加方法

指標ベースのアラート ポリシーは、Google Cloud Console、Cloud Monitoring API、または Google Cloud CLI を使用して Google Cloud プロジェクトに追加できます。

  • Cloud Console を使用する場合は、推奨アラートを有効にするか、Cloud Monitoring の [アラート] ページからアラートを作成できます。

    推奨アラートは一部の Google Cloud プロダクトでご利用いただけます。これらのアラートには、通知チャネルの追加など、最小限の構成が必要です。たとえば、Pub/Sub Lite の [トピック] ページは、割り当て上限に達したときに通知するように構成されているアラートにリンクします。同様に、Monitoring の [VM インスタンス] ページは、インスタンスのメモリ使用率とネットワーク レイテンシをモニタリングするように構成されたアラート ポリシーにリンクします。

    Cloud Console を使用して作成したポリシーには、Cloud Console または Cloud Monitoring API のいずれかを使用して変更または表示することもできます。Cloud Monitoring API を使用すると、指標の比率をモニタリングするアラート ポリシーを作成できます。これらのポリシーで Monitoring フィルタが使用されている場合、Cloud Console でフィルタを表示または変更することはできません。

    Cloud Monitoring の [アラート] ページに表示されるアラート ポリシーの作成方法については、Cloud Console を使用したアラート ポリシーの作成をご覧ください。

  • Cloud Monitoring API を直接使用する場合、または Google Cloud CLI を使用すると、アラート ポリシーを作成、表示、変更できます。Cloud Monitoring API または Google Cloud CLI を使用して、指標の比率をモニタリングする条件を作成できます。Cloud Monitoring API を使用する場合は、Monitoring Query Language(MQL)または Monitoring フィルタを使用して比率を指定できます。モニタリング フィルタを使用するポリシーの例については、指標率をご覧ください。

    Cloud Monitoring API と Google Cloud CLI の使用に関する詳細については、Cloud Monitoring API または Google Cloud CLI を使用したアラート ポリシーの作成をご覧ください。

Cloud Monitoring は、Google Cloud Console と Cloud Monitoring API で使用できる表現力に優れたテキストベースの言語をサポートしています。この言語をアラートで使用する方法については、Monitoring Query Language(MQL)を使用したアラート ポリシーの作成をご覧ください。

ログベースのアラート ポリシーを Google Cloud プロジェクトに追加するには、Cloud Logging のログ エクスプローラまたは Monitoring API を使用します。このコンテンツは、ログベースのアラート ポリシーには適用されません。ログベースのアラート ポリシーの詳細については、ログのモニタリングをご覧ください。

アラート ポリシーの管理方法

プロジェクトの指標ベースのアラート ポリシーのリストを表示する方法と、それらのポリシーを変更する方法については、以下をご覧ください。

ログベースのアラート ポリシーの管理の詳細については、ログベースのアラートの使用をご覧ください。

アラート ポリシーの作成に必要な承認

このセクションでは、アラート ポリシーの作成に必要なロールまたは権限について説明します。Cloud Monitoring の Identity and Access Management(IAM)の詳細については、アクセス制御をご覧ください。

各 IAM ロールには ID と名前があります。ロール ID は roles/monitoring.editor という形式であり、アクセス制御を構成するときに Google Cloud CLI に引数として渡されます。詳細については、アクセス権の付与、変更、取り消しをご覧ください。Cloud Console に、モニタリング編集者などのロール名が表示されます。

必要な Cloud Console のロール

アラート ポリシーを作成するには、Google Cloud プロジェクトの IAM ロール名が次のいずれかである必要があります。

  • モニタリング編集者
  • モニタリング管理者
  • プロジェクト所有者

ロールとそれに関連する権限のリストを表示するには、ロールをご覧ください。

必要な API 権限

Cloud Monitoring API を使用してアラート ポリシーを作成するには、Google Cloud プロジェクトの IAM のロール ID が次のいずれかである必要があります。

  • roles/monitoring.alertPolicyEditor: このロール ID は、アラート ポリシーの作成に必要な最小限の権限を付与します。このロールの詳細については、事前定義されたアラートのロールをご覧ください。
  • roles/monitoring.editor
  • roles/monitoring.admin
  • roles/owner

特定の Cloud Monitoring API メソッドに必要な権限を特定するには、Cloud Monitoring API の権限をご覧ください。ロールとそれに関連する権限のリストを表示するには、ロールをご覧ください。

ロールの決定

Cloud Console を使用してプロジェクトのロールを決定する手順は次のとおりです。

  1. Cloud Console を開き、Google Cloud プロジェクトを選択します。

    Cloud Console に移動

  2. 役割を表示するには、[IAM と管理] をクリックします。ユーザー名と同じ行に役割が表示されます。

組織レベルの権限については、組織の管理者にお問い合わせください。

アラート ポリシーに関連する費用

アラート ポリシーや稼働時間チェックの利用に伴う費用はありませんが、次の制限が適用されます。

カテゴリ ポリシータイプ 1
指標スコープごとのアラート ポリシー(指標とログの合計)2 500 指標、ログ
1 アラート ポリシーあたりの条件数 6 指標
指標の不在条件が評価される
最大期間 3
1 日 指標
指標のしきい値条件が評価される
最大期間 3
23 時間 30 分 指標
1 アラート ポリシーあたりの通知チャンネル数 16 指標、ログ
通知の最大レート ログベースのアラートごとに 5 分あたり 1 件の通知 ログ
通知の最大数 ログベースのアラートごとに 1 日あたり 20 件の通知 ログ
1 アラート ポリシーあたりの
同時対応待ちインシデントの最大数
5000 指標
新規データのないインシデントが
自動的に終了するまでの期間
7 日 指標
手動で終了していない場合のインシデントの最長時間 7 日 ログ
終了したインシデントの保持 13 か月 該当なし
対応待ちのインシデント 期限なし 該当なし
指標スコープごとの通知チャネル 4000 該当なし
指標スコープごとの稼働時間チェック 4 100 該当なし
1指標: 指標データに基づくアラート ポリシー。ログ: ログメッセージに基づくアラート ポリシー(ログベースのアラート)
2ApigeeApigee ハイブリッドは Cloud Monitoring と緊密に統合されています。すべての Apigee サブスクリプション レベル(Standard、Enterprise、Enterprise Plus)のアラート数の上限は、Cloud Monitoring と同じで、1 指標スコープあたり 500 です。
3条件が評価する最大期間は、アライメント期間と期間時間枠の値の合計です。たとえば、アライメント期間が 15 時間、期間時間枠が 15 時間に設定されている場合、30 時間分のデータが条件を評価するために必要です。
4この上限は稼働時間チェックの構成の数に適用されます。稼働時間チェックの各構成には、指定されたリソースのステータスを確認する時間間隔が含まれます。詳細については、稼働時間チェックの管理をご覧ください。

料金の詳細については、Google Cloud のオペレーション スイートの料金をご覧ください。

次のステップ