一般的なアラート ポリシーの設定

アラート ポリシーを作成するには、モニタリング対象、アラート ポリシーが起動される条件、通知方法を記述する必要があります。このページには、アラート ポリシーの作成に使用できる設定が記載されています。このページのほとんどのセクションには、次のような要素があります。

  • タイトル: 関連するプロダクト名とアラート ポリシーの簡単な説明が一覧表示されています。
  • 概要: アラート ポリシーの簡単な説明。詳細については、プロダクト ドキュメントをご覧ください。
  • アラート ポリシーの作成手順: アラート ポリシーの作成に必要な手順の概要。これらの手順の詳細については、アラート ポリシーの作成をご覧ください。
  • 新しい条件: これらのフィールドでは、モニタリング対象とデータの集計方法を指定します。

  • 条件アラート トリガー: アラート ポリシーがトリガーされるタイミングを指定します。期間時間枠を変更することで、ポリシーがトリガーされる頻度を低減できます。
割り当てデータを表示するグラフのみを構成する場合は、[新しい条件] テーブルの設定を使用できます。アラートの条件では、グラフツールと異なる表記を使用します。グラフ作成ツールのカスタム ダッシュボードには、Metrics Explorer のグラフや構成グラフが含まれています。
[新しい条件] ダイアログの
フィールド名
チャート
ローリング ウィンドウ関数

選択した指標と集計の設定に基づいて最適に構成されます。

アライメント関数を指定する方法は次のとおりです。

  1. [集計] 要素で最初のメニューを展開し、[整列指定子を構成] を選択します。[アライメント関数] と [グループ化] 要素が追加されます。
  2. [アライメント関数] 要素を展開して、選択を行います。

ローリング ウィンドウ [最小間隔]
(アクセスするには、 [クエリ要素を追加] をクリックします)
時系列のグループ化の基準
([時系列をまたぐ] セクション)
[集計] 要素の 2 番目のメニュー
時系列集計
([時系列をまたぐ] セクション)
[集計] 要素の最初のメニュー

請求

請求可能な料金または予測料金が予算を超えた場合に通知を受け取るには、Google Cloud コンソールの [予算とアラート] ページでアラートを作成します。

  1. Google Cloud コンソールに移動するか、次のボタンをクリックします。

    Google Cloud コンソールに移動

  2. Console のナビゲーション メニュー を開き、[お支払い] を選択します。複数の Cloud 請求先アカウントがある場合は、次のいずれかを行います。
    • 現在のプロジェクトの Cloud Billing を管理するには、[リンクされた請求先アカウントに移動] を選択します。
    • 別の Cloud 請求先アカウントを確認するには、[請求先アカウントを管理] を選択し、予算を設定する対象のアカウントを選択します。
  3. [お支払い] ナビゲーション メニューから [予算とアラート] を選択します。
  4. [予算を作成] をクリックします。
  5. 予算ダイアログに入力します。このダイアログでは、Google Cloud のプロジェクトとサービスを選択し、その組み合わせに対する予算を作成します。デフォルトでは、予算の 50%、90%、100% に達すると通知が送られます。詳細については、予算と予算アラートの設定をご覧ください。

BigQuery の実行時間

BigQuery クエリの実行時間の 99 パーセンタイルが、ユーザーによって定義された上限値を超過すると起動するアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで [BigQuery プロジェクト] を選択します。
[Metric categories] メニューで [Query] を選択します。
[指標] メニューで [Query execution times] を選択します。
フィルタ
時系列全体
時系列のグループ化の基準
priority
時系列全体
時系列集計
99th percentile
ローリング ウィンドウ 5 m
ローリング ウィンドウ関数 sum
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 この値を決定します。ただし、しきい値を 60 秒にすることをおすすめします。
再テスト ウィンドウ most recent value

BigQuery の使用

取り込まれた BigQuery 指標がユーザー定義レベルを超えた場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[BigQuery データセット] を選択します。
[指標カテゴリー] メニューで、[ストレージ] を選択します。
[指標] メニューから指標を選択します。Stored bytesUploaded bytesUploaded bytes billed など、使用に固有の指標。利用可能な指標の完全なリストについては、BigQuery 指標をご覧ください。
フィルタ project_id: Google Cloud プロジェクト ID。
dataset_id: データセット ID。
時系列全体
時系列のグループ化の基準
dataset_id: データセット ID。
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 mean
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 許容値を決定します。
再テスト ウィンドウ 1 minute

Compute Engine アーリーブート検証

[Early Boot Validation] には、最後のブート シーケンスの初期ブート部分の合格 / 失敗のステータスが示されます。初期ブートは、UEFI ファームウェアが起動されるところから、UEFI ファームウェアからブートローダーに制御が渡されるまでのブート シーケンスです。

Compute Engine VM インスタンスのアーリーブート シーケンスが失敗したときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[VM インスタンス] を選択します。
[指標カテゴリー] メニューで、[インスタンス] を選択します。
[指標] メニューで [アーリーブート検証] を選択します。
フィルタ status = failed
時系列全体
時系列のグループ化の基準
status
時系列全体
時系列集計
sum
ローリング ウィンドウ デフォルトを使用します。
ローリング ウィンドウ関数 デフォルトを使用します
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

Compute Engine レイトブート検証

[Late Boot Validation] には、最後のブート シーケンスの後期ブート部分の合格 / 失敗のステータスが示されます。後期ブートは、ブートローダーに制御が渡されてから起動が完了するまでのブート シーケンスです。これには、オペレーティング システム カーネルの読み込みが含まれます。

Compute Engine VM インスタンスのレイトブート シーケンスが失敗するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[VM インスタンス] を選択します。
[指標カテゴリー] メニューで、[インスタンス] を選択します。
[指標] メニューで、[レイトブート検証] を選択します。
フィルタ status = failed
時系列全体
時系列のグループ化の基準
status
時系列全体
時系列集計
sum
ローリング ウィンドウ デフォルトを使用します。
ローリング ウィンドウ関数 デフォルトを使用します
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

取り込まれた毎月のログバイト数をロギングする

ログバケットに書き込まれたログバイト数が Cloud Logging のユーザー定義の上限を超えたときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[グローバル] を選択します。
[指標カテゴリー] メニューで、[ログベースの指標] を選択します。
[指標] メニューで、[取り込みログバイト数の月間合計] を選択します。
フィルタ なし
時系列全体
時系列集計
sum
ローリング ウィンドウ 60 m
ローリング ウィンドウ関数 max
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 許容値を決定します。
再テスト ウィンドウ 最小許容値は 30 分です。

推奨事項の予測

推奨事項の予測アラートを設定するには、アラート ポリシーで次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリー] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。
フィルタ service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 5 minutes

推奨事項のユーザー イベント記録の削減

推奨事項のイベント記録の削減アラートを設定するには、アラート ポリシーで次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリー] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。
フィルタ service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
アラート・トリガーの構成
フィールド

条件タイプ Metric absence
アラート トリガー Any time series violates
トリガーとなる不在時間 10 minutes

Spanner の優先度の高い CPU 使用率

Spanner の優先度の高い CPU 使用率が推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Spanner インスタンス] を選択します。
[指標カテゴリー] メニューで、[インスタンス] を選択します。
[指標] メニューで、[優先度別の CPU 使用率] を選択します。

(metric.type は spanner.googleapis.com/instance/cpu/utilization_by_priority です。)
フィルタ instance_id = YOUR_INSTANCE_ID
priority = high
時系列全体
時系列のグループ化の基準
マルチリージョン インスタンスの場合: location
リージョン インスタンスの場合は空白のままにします。
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 mean
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 マルチリージョン インスタンスの場合: 45%
リージョン インスタンスの場合: 65%
再テスト ウィンドウ 10 minutes

Spanner の 24 時間移動使用量

Spanner の CPU 使用率の 24 時間の移動平均が推奨しきい値を上回った場合にトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Spanner インスタンス] を選択します。
[指標カテゴリー] メニューで、[インスタンス] を選択します。
[指標] メニューで、[Smoothed CPU utilization] を選択します。

(metric.type は spanner.googleapis.com/instance/cpu/smoothed_utilization です。)
フィルタ instance_id = YOUR_INSTANCE_ID
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 mean
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 90%
再テスト ウィンドウ 10 minutes

Spanner ストレージ

Spanner インスタンスのストレージが推奨しきい値を上回ったときにトリガーするアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Spanner インスタンス] を選択します。
[指標カテゴリー] メニューで、[インスタンス] を選択します。
[指標] メニューで [ストレージ使用状況] を選択します。

(metric.type は spanner.googleapis.com/instance/storage/utilization です。)
フィルタ instance_id = YOUR_INSTANCE_ID
時系列全体
時系列集計
sum
ローリング ウィンドウ 10 m
ローリング ウィンドウ関数 max
アラート・トリガーの構成
フィールド

条件タイプ Threshold
Condition triggers if Any time series violates
しきい値の位置 Above threshold
しきい値 ノードあたりの最大ストレージの 75% にノード数を掛けて、しきい値を設定します。現在のノード上限については、Spanner の割り当てと上限をご覧ください。
再テスト ウィンドウ 10 minutes

API 使用量の割り当てのトレース

取り込まれた Cloud Trace スパンの月間合計が、割り当て量を超えるとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[消費した API] を選択します。
[指標カテゴリー] メニューで、[API] を選択します。
[指標] メニューで [リクエスト数] を選択します。

(metric.type は serviceruntime.googleapis.com/api/request_count です。)
フィルタ service = cloudtrace.googleapis.com
response_code = 429
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 sum
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

Trace モニタリングの月間スパン使用量

取り込まれた Cloud Trace スパンの月間合計が、ユーザー定義の上限を超えたときにトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[グローバル] を選択します。
[指標カテゴリー] メニューで、[お支払い] を選択します。
[指標] メニューで、[Monthly trace spans ingested] を選択します。
フィルタ
時系列全体
時系列集計
sum
ローリング ウィンドウ 60 m
ローリング ウィンドウ関数 max
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
Threshold value 許容値を決定します。
再テスト ウィンドウ 最小許容値は 30 分です。

トレース エクスポート エラー

BigQuery に Cloud Trace データをエクスポートする際にエラーが発生するとトリガーされるアラート ポリシーを作成するには、次の設定を使用します。

[New condition]
フィールド

リソースと指標 [リソース] メニューで、[Cloud Trace] を選択します。
[指標カテゴリ] メニューで、[BigQuery_export] を選択します。
[Metrics] メニューで、[Spans Exported to BigQuert] を選択します。
フィルタ status != ok
時系列全体
時系列のグループ化の基準
status
時系列全体
時系列集計
sum
ローリング ウィンドウ 1 m
ローリング ウィンドウ関数 rate
アラート・トリガーの構成
フィールド

条件タイプ Threshold
アラート トリガー Any time series violates
しきい値の位置 Above threshold
しきい値 0
再テスト ウィンドウ 1 minute

稼働時間チェックのモニタリング

稼働時間チェックのアラート ポリシーを作成したり、稼働時間チェックの成功またはレイテンシ ステータスを示すグラフを作成したりするには、稼働時間チェックに関するアラートをご覧ください。