常用提醒政策的设置

要创建提醒政策,您必须说明要监控的内容,触发提醒政策的时间以及您希望收到通知的方式。此页面包含可用于创建提醒政策的设置。此页面中的每个部分都包含以下元素:

  • 标题:列出相关产品名称和提醒政策的简要说明。
  • 摘要:提醒政策的简要说明。有关完整信息,请参阅产品文档。
  • 创建提醒政策的步骤:创建提醒政策所需的步骤概览。有关这些步骤的详细信息,请参阅创建提醒政策
  • Target 窗格字段:这些字段指定要监控的内容以及数据汇总方式。如果您使用的是 Google Cloud Console,则这些字段位于 Add Condition 对话框的 Target 窗格中。
  • 配置字段:这些字段用于指定提醒政策的触发时间。如果您使用的是 Google Cloud Console,则这些字段位于 Add Condition 对话框的 Configuration 窗格中。

您可以在创建图表或使用 Metrics Explorer 时使用目标窗格表中的设置。

BigQuery 执行时间

如需创建一项提醒政策,以便在 BigQuery 查询执行时间的第 50 百分位超过用户定义的限制时触发此政策,请使用以下设置:

目标窗格
字段

Resource type Global
Metric Query execution time
Filter
Aggregator none
Advanced Aggregation Aligner: 50th percentile
Alignment Period: 1 m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 确定可接受的值。对于此指标,可将第 50 百分位的平均值的两倍设为阈值。
For 1 minute

BigQuery 使用

如需创建一项提醒政策,并在提取的 BigQuery 指标超出用户定义的级别时触发,请执行以下操作:

目标窗格
字段

Resource type 输入 BigQuery Dataset
Metric 特定于使用的指标包括Stored bytesUploaded bytesUploaded bytes billed。但是,此列表仅包含部分列表。如需可用指标的完整列表,请参阅 BigQuery 指标
Filter project_id:您的 Google Cloud 项目 ID
dataset-id:您的数据集 ID
Group By dataset-id:您的数据集 ID
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 1 m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 可接受的值由您决定。
For 1 minute

Compute Engine 前期启动验证

Early Boot Validation(前期启动验证)显示上次启动序列的前期启动部分的通过/失败状态。前期启动是从 UEFI 固件启动到它将控制传递给引导加载程序的启动序列。

如需创建一项提醒政策,以便在任何 Compute Engine 虚拟机实例的前期启动序列失败时触发,请使用以下设置:

目标窗格
字段

Resource type GCE VM Instance
Metric Early boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation 使用默认值。
条件窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

Compute Engine 后期启动验证

Late Boot Validation(后期启动验证)显示上次启动序列的后期启动部分的通过/失败状态。后期启动是从引导加载程序到完成的启动序列。包括加载操作系统内核。

如需创建一项提醒政策,以便在任何 Compute Engine 虚拟机实例的后期启动序列失败时触发,请使用以下设置:

目标窗格
字段

Resource type GCE VM Instance
Metric late boot validation
Filter status = failed
Group By status
Aggregator sum
Advanced Aggregation 使用默认值。
条件窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

记录 “Monthly log bytes ingested”

如需创建一项提醒政策,并在“Monthly log bytes ingested”指标超过用户为 Cloud Logging 定义的限制时触发,请使用如下设置:

目标窗格
字段

Resource type Global
Metric Monthly log bytes ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 可接受的值由您决定。
For 可接受的最小值是 30 分钟。

Recommendations AI 预测

要设置 Recommendations AI 预测提醒,请在提醒政策中使用以下设置:

目标窗格
字段

Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 0
For 5 minutes

Recommendations AI 用户事件记录缩减

要设置 Recommendations AI 事件记录缩减提醒,请在提醒政策中使用以下设置:

目标窗格
字段

Resource type Consumed API
Metric Request count
Filter service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is absent
Threshold
For 10 minutes

Spanner 高优先级 CPU 使用

要创建在 Cloud Spanner 的高优先级 CPU 利用率高于建议阈值时触发的提醒政策,请使用以下设置:

目标窗格
字段

Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Aggregator max
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* 选择此资源和指标类型等同于在 Find resource type and metric(查找资源类型和指标)窗格中输入以下值:spanner.googleapis.com/instance/cpu/utilization_by_priority
条件窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 多区域实例为 45%
区域实例为 65%
For 10 minutes

Spanner 24 小时滚动使用

要创建当 Cloud Spanner 的 CPU 利用率 24 小时滚动平均值高于建议阈值时触发的提醒政策,请使用以下设置:

目标窗格
字段

Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: mean
Alignment Period: 10 m
* 选择此资源和指标类型等同于在 Find resource type and metric(查找资源类型和指标)窗格中输入以下值:spanner.googleapis.com/instance/cpu/smoothed_utilization
条件窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Spanner 存储空间

要创建当 Cloud Spanner 实例的存储空间高于建议阈值时触发的提醒政策,请使用以下设置:

目标窗格
字段

Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 10 m
* 选择此资源和指标类型等同于在 Find resource type and metric(查找资源类型和指标)窗格中输入以下值:spanner.googleapis.com/instance/storage/used_bytes
条件窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 将阈值设置为每个节点最大存储空间的 75%,并乘以节点数。对于当前节点限制,请参阅 Cloud Spanner 配额和限制

对于每个节点 2 TB 的限制,建议的阈值为:

1649267441664 乘以实例中的节点数。
For 10 minutes

跟踪 API 使用配额

如需创建一项提醒政策,并在您的月度 Cloud Trace span 提取量超过您的配额时触发,请使用以下设置:

目标窗格
字段

Resource type Consumed API
Metric Request count
Filter service = cloudtrace.googleapis.com
response_code = 429
Aggregator sum
Advanced Aggregation Aligner: sum
Alignment Period: 1m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

跟踪监控每月 span 用量

如需创建一项提醒政策,并在您的月度 Stackdriver Trace span 提取量超过用户定义的限制时触发,请使用以下设置:

目标窗格
字段

Resource type global
Metric Monthly trace spans ingested
Filter
Aggregator sum
Advanced Aggregation Aligner: max
Alignment Period: 60m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 可接受的值由您决定。
For 可接受的最小值是 30 分钟。

跟踪导出错误

如需创建一项提醒政策,以便在将 Cloud Trace 数据导出到 BigQuery 时出错时触发,请使用以下设置:

目标窗格
字段

Resource type Cloud Trace
Metric Spans Exported to BigQuery
Filter status != ok
Group by status
Aggregator sum
Advanced Aggregation Aligner: rate
Alignment Period: 1 m
Conditions 窗格
字段

Condition triggers if Any time series violates
Condition is above
Threshold 0
For 1 minute

正常运行时间检查监控

要为正常运行时间检查创建提醒政策,或创建显示正常运行时间检查的成功或延迟状态的图表,请参阅正常运行时间检查提醒