常用提醒政策的设置

要创建提醒政策,您必须说明要监控的内容、满足提醒政策条件的时间以及您希望收到通知的方式。此页面包含可用于创建提醒政策的设置。此页面中的大多数部分包含以下元素:

  • 标题:列出相关产品名称和提醒政策的简要说明。
  • 摘要:提醒政策的简要说明。 有关完整信息,请参阅产品文档。
  • 创建提醒政策的步骤:创建提醒政策所需的步骤概览。有关这些步骤的详细信息,请参阅创建提醒政策
  • 新建条件:这些字段指定要监控的内容以及数据汇总方式。

  • 基于条件的提醒触发器:这些字段用于指定何时满足提醒政策的条件。通过更改重新测试时间范围,您可以降低满足条件的频率。
如果您只想配置用于显示配额数据的图表,可以使用新条件表中的设置。提醒条件使用的表示法与图表工具不同。 图表工具包括 Metrics Explorer 以及在自定义信息中心中配置图表:
新建条件对话框
字段名称
图表
滚动窗口函数

根据所选的指标和汇总设置进行最佳配置。

如需指定对齐函数,请执行以下操作:

  1. 汇总元素中,展开第一个菜单,然后选择配置对齐器。添加了对齐函数分组元素。
  2. 展开对齐函数元素,然后进行选择。

滚动窗口 最小时间间隔
(如需访问,请点击 添加查询元素
时序分组依据
(在跨时间序列部分中)
汇总元素的第二个菜单
时序聚合
(在跨时间序列部分中)
汇总元素的第一个菜单

结算

如需在可结算的费用或预测费用超过预算时收到通知,请使用 Google Cloud 控制台的预算和提醒页面创建提醒:

  1. 在 Google Cloud 控制台中,转到结算页面:

    前往结算

    您也可以使用搜索栏查找此页面。

    如果您有多个 Cloud Billing 账号,请执行以下任一操作:

    • 如需管理当前项目的 Cloud Billing,请选择转至关联的结算账号
    • 如需查找其他 Cloud Billing 账号,请选择管理结算账号,然后选择要为其设置预算的账号。
  2. 在“结算”导航菜单中,选择预算和提醒
  3. 点击 创建预算
  4. 填写预算对话框。在此对话框中,选择 Google Cloud 项目和产品,然后为该组合创建预算。 默认情况下,当费用达到预算的 50%、90% 和 100% 时,您会收到通知。 如需查看完整文档,请参阅设置预算和预算提醒

BigQuery 执行时间

如需创建提醒政策,以便 BigQuery 查询的执行时间的第 99 百分位超过用户定义的限制时触发此政策,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 BigQuery 项目
指标类别菜单中,选择查询
指标菜单中,选择查询执行时间
过滤
跨时间序列
时间序列分组依据
priority
跨时间序列
时间序列聚合
99th percentile
滚动窗口 5 m
滚动窗口函数 sum
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 您可确定此值;不过,建议将阈值设为 60 秒。
重新测试窗口 most recent value

BigQuery 使用

如需创建一项提醒政策,并在提取的 BigQuery 指标超出用户定义的级别时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 BigQuery 数据集
指标类别菜单中,选择存储空间
指标菜单中选择一个指标。特定于使用量的指标包括 Stored bytesUploaded bytesUploaded bytes billed。如需可用指标的完整列表,请参阅 BigQuery 指标
过滤 project_id:您的 Google Cloud 项目 ID
dataset_id:您的数据集 ID。
跨时间序列
时间序列分组依据
dataset-id:您的数据集 ID
跨时间序列
时间序列聚合
sum
滚动窗口 1 m
滚动窗口函数 mean
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 可接受的值由您决定。
重新测试窗口 1 minute

Bigtable 存储空间利用率

如需创建一项提醒政策,并在 Bigtable 集群的存储空间利用率高于建议阈值(例如 70%)时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Cloud Bigtable 集群
指标类别菜单中,选择集群
指标菜单中,选择存储空间利用率

(metric.type 为 bigtable.googleapis.com/cluster/storage_utilization)。
过滤 cluster = YOUR_CLUSTER_ID
配置提醒触发器
字段

条件类型 Threshold
该条件的触发条件 Any time series violates
阈值位置 Above threshold
阈值 70
重新测试窗口 10 minutes

Compute Engine 前期启动验证

前期启动验证展示上次启动序列的前期启动部分的通过/失败状态。前期启动是从 UEFI 固件启动到它将控制传递给引导加载程序的启动序列。

如需创建一项提醒政策,以便在任何 Compute Engine 虚拟机实例的前期启动序列失败时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择虚拟机实例
指标类别菜单中,选择实例
指标菜单中,选择前期启动验证
过滤 status = failed
跨时间序列
时间序列分组依据
status
跨时间序列
时间序列聚合
sum
滚动窗口 使用默认值。
滚动窗口函数 使用默认值
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 0
重新测试窗口 1 minute

Compute Engine 后期启动验证

后期启动验证展示上次启动序列的后期启动部分的通过/失败状态。后期启动是从引导加载程序到完成的启动序列,包括加载操作系统内核。

如需创建一项提醒政策,以便在任何 Compute Engine 虚拟机实例的启动后期序列失败时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择虚拟机实例
指标类别菜单中,选择实例
指标菜单中,选择后期启动验证
过滤 status = failed
跨时间序列
时间序列分组依据
status
跨时间序列
时间序列聚合
sum
滚动窗口 使用默认值。
滚动窗口函数 使用默认值
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 0
重新测试窗口 1 minute

记录 “Monthly log bytes ingested”

如需创建一项提醒政策,并在写入日志存储分区的日志字节数超过用户为 Cloud Logging 定义的限制时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择全局
指标类别菜单中,选择基于日志的指标
指标菜单中,选择每月提取的日志字节数
过滤 无。
跨时间序列
时间序列聚合
sum
滚动窗口 60 m
滚动窗口函数 max
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 可接受的值由您决定。
重新测试窗口 可接受的最小值是 30 分钟。

推荐预测

如需设置 Recommendations 预测提醒,请在提醒政策中使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Consumed API
指标类别菜单中,选择 API
指标菜单中,选择请求数
过滤 service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.Predict
response_code != 200
跨时间序列
时间序列聚合
sum
滚动窗口 1 m
滚动窗口函数 sum
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 0
重新测试窗口 5 minutes

推荐功能用户事件记录缩减

如需设置 Recommendations 事件记录缩减提醒,请在提醒政策中使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Consumed API
指标类别菜单中,选择 API
指标菜单中,选择请求数
过滤 service = recommendationengine.googleapis.com
method = google.cloud.recommendationengine.v1beta1.PredictionService.CollectUserEvent
response_code != 200
跨时间序列
时间序列聚合
sum
滚动窗口 1 m
滚动窗口函数 sum
配置提醒触发器
字段

条件类型 Metric absence
提醒触发器 Any time series violates
触发器缺失时间 10 minutes

Spanner 高优先级 CPU 使用

如需创建在 Spanner 的高优先级 CPU 利用率高于建议阈值时触发的提醒政策,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Spanner 实例
指标类别菜单中,选择实例
指标菜单中,选择按优先级划分的 CPU 利用率

(metric.type 为 spanner.googleapis.com/instance/cpu/utilization_by_priority)。
过滤 instance_id = YOUR_INSTANCE_ID
priority = high
跨时间序列
时间序列分组依据
多区域实例为 location
区域实例则将其留空。
跨时间序列
时间序列聚合
sum
滚动窗口 10 m
滚动窗口函数 mean
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 多区域实例为 45%
区域实例为 65%
重新测试窗口 10 minutes

Spanner 24 小时滚动使用

如需创建当 Spanner 的 CPU 利用率 24 小时滚动平均值高于建议阈值时触发的提醒政策,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Spanner 实例
指标类别菜单中,选择实例
指标菜单中,选择平滑的 CPU 利用率

(metric.type 为 spanner.googleapis.com/instance/cpu/smoothed_utilization)。
过滤 instance_id = YOUR_INSTANCE_ID
跨时间序列
时间序列聚合
sum
滚动窗口 10 m
滚动窗口函数 mean
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
触发阈值 90%
重新测试窗口 10 minutes

Spanner 存储空间

若要创建当 Spanner 实例的存储空间高于建议阈值时触发的提醒政策,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Spanner 实例
指标类别菜单中,选择实例
指标菜单中,选择已用存储空间

(metric.type 为 spanner.googleapis.com/instance/storage/utilization)。
过滤 instance_id = YOUR_INSTANCE_ID
跨时间序列
时间序列聚合
sum
滚动窗口 10 m
滚动窗口函数 max
配置提醒触发器
字段

条件类型 Threshold
该条件的触发条件 Any time series violates
阈值位置 Above threshold
阈值 您无需为每个节点的最大存储空间设置特定阈值。不过,我们建议您设置提醒,以便在接近存储空间上限时收到提醒。如需了解详情,请参阅存储空间利用率指标
重新测试窗口 10 minutes

跟踪 API 使用配额

如需创建一项提醒政策,并在您的月度 Cloud Trace span 提取量超过您的配额时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Consumed API
指标类别菜单中,选择 API
指标菜单中,选择请求数

(metric.type 为 serviceruntime.googleapis.com/api/request_count)。
过滤 service = cloudtrace.googleapis.com
response_code = 429
跨时间序列
时间序列聚合
sum
滚动窗口 1 m
滚动窗口函数 sum
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 0
重新测试窗口 1 minute

跟踪监控每月 span 用量

如需创建一项提醒政策,并在您的月度 Cloud Trace span 提取量超过用户定义的限制时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择全局
指标类别菜单中,选择结算
指标菜单中,选择每月提取的轨迹跨度
过滤
跨时间序列
时间序列聚合
sum
滚动窗口 60 m
滚动窗口函数 max
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
Threshold value 可接受的值由您决定。
重新测试窗口 可接受的最小值是 30 分钟。

跟踪导出错误

如需创建一项提醒政策,以便在将 Cloud Trace 数据导出到 BigQuery 时出错时触发,请使用以下设置。

新建条件
字段

资源和指标 资源菜单中,选择 Cloud Trace
指标类别菜单中,选择 Bigquery_export
指标菜单中,选择 Spans Exported to BigQuert
过滤 status != ok
跨时间序列
时间序列分组依据
status
跨时间序列
时间序列聚合
sum
滚动窗口 1 m
滚动窗口函数 rate
配置提醒触发器
字段

条件类型 Threshold
提醒触发器 Any time series violates
阈值位置 Above threshold
阈值 0
重新测试窗口 1 minute

正常运行时间检查监控

要为正常运行时间检查创建提醒政策,或创建显示正常运行时间检查的成功或延迟状态的图表,请参阅正常运行时间检查提醒