管理提醒政策

提醒政策描述了您要监控的一组条件。这些条件可能与运行状况不佳的系统的状态或资源消耗有关。 例如,您可能希望创建一个政策来监控正常运行时间检查,或者创建一个政策来监控 Cloud Monitoring API 的使用情况。除了条件之外,您还可以在提醒政策中指定通知方式以及该通知中包含的文档。

本页面介绍了如何在 Google Cloud Console 中使用 Monitoring 创建和管理提醒政策。您还可以使用 Cloud Monitoring API 执行这些任务。如需详细了解此方法,请参阅通过 API 管理提醒政策。要查看以 JSON 表示的政策,请参阅示例政策

准备工作

创建提醒政策前,您应该熟悉提醒政策所用的一般概念和术语。这包括了解政策的组成部分、事件的概念以及价格和限制。如需了解详情,请参阅提醒简介

通知渠道

通过通知渠道,您可以指定希望以何种方式接收提醒。 如果配置了一种通知渠道,则可以在为提醒政策设置通知时选择该渠道。

有关通知渠道类型和渠道配置信息的列表,请参阅通知选项

有关正常运行时间检查的提醒政策

正常运行时间检查窗口创建正常运行时间检查的提醒政策。遵循此准则,提醒政策中的大多数字段均已预先配置:

创建提醒政策

  1. 在 Cloud Console 中,选择 Monitoring

    转到“监控”

    如果您从未使用过 Monitoring,则系统会自动创建一个工作区,并将您的项目与该工作区相关联。否则,如果您的项目未与工作区关联,则系统会显示一个对话框,您可以创建新工作区或将该项目添加到现有工作区。完成选择后,点击添加。创建工作区后,系统会自动为您转换至提醒

  2. 选择提醒

  3. 点击 Create Policy(创建政策)。

    此时将显示“创建提醒政策”对话框。

  4. 完成指定名称、条件、通知渠道和添加文档后,点击保存

命名

Create New Alerting Policy 窗口中,输入政策名称。 政策名称包含在通知中,并显示在政策窗口中。

条件

提醒政策的每个条件都描述了受监控的资源以及该资源未达到性能衡量指标的时间。如果提醒政策有 1 个条件,则当条件的配置评估为 true 时创建事件。例如,如果配置为 Any time series is above 10 for 5 minutes,则当此语句的计算结果为 true 时,则满足条件,因此应创建突发事件。有关合并多个条件的信息,请参阅多个条件

要为政策添加提醒条件,请在 Create New Alerting Policy 窗口中点击 Add Condition。 如需了解定义条件的信息,请参阅指定条件

具有多个条件的政策

提醒政策最多可包含 6 个条件。

如果您使用的是 Cloud Monitoring API 或您的提醒政策有多个条件,则必须指定何时违反单个条件导致突发事件:

  • 如果您使用的是 Google Cloud Console,请使用 政策触发条件 (Policy triggers) 字段。
  • 如果您使用的是 Cloud Monitoring API,请使用 combiner 字段。

下表列出了 Cloud Console 中的设置、Cloud Monitoring API 中的等效值以及每个设置的说明:

Cloud Console
政策触发条件值
Cloud Monitoring API
combiner 值
含义
满足任意条件
(默认值)
OR 如果任何资源违反任何条件,则创建一个突发事件。
满足所有条件 AND 如果至少有一个资源违反了 每个 条件,即使有 另一个 资源违反了每个条件,也会创建一个突发事件。
满足
匹配资源的所有条件
AND_WITH_MATCHING_RESOURCE 如果 同一个 资源违反了 每个 条件,,则创建一个突发事件。此设置是最严格的组合选择。

在此上下文中,术语 met 表示条件的配置评估为 true。例如,如果配置为 Any time series is above 10 for 5 minutes,则当此语句的计算结果为 true 时满足条件。

示例

以包含两个虚拟机实例 vm1 和 vm2 的 Google Cloud 项目为例。此外,假设您创建了一个提醒政策,其中包含两个条件:

  • 名为 CPU usage is too high 的条件用于监控实例的 CPU 使用率。当任何实例的 CPU 使用率超过 100ms/s 并持续 1 分钟时,则满足此条件。
  • 名为 Excessive utilization 的条件用于监控实例的 CPU 利用率。当任何实例的 CPU 使用率超过 1 分钟的 60% 时,则满足此条件。

最初,假设两个条件的计算结果均为 false

接下来,假设 vm1 的 CPU 使用率超过 100ms/s,持续 1 分钟。这会导致 CPU usage is too high 的计算结果为 true。如果条件与满足任意条件合并,则创建事件,因为满足条件。如果条件与满足任意条件符合匹配资源的所有条件相结合,则不会创建突发事件。这些组合器选择要求两个条件的计算结果均为 true

现在假设 vm1 的 CPU 使用率持续高于 100ms/s,且 vm2 的 CPU 利用率持续超过 1 分钟的 60%。这样,两个条件评估为 true。以下内容描述了条件组合的方式:

  • 满足任意条件:创建第二个事件,因为 vm2 导致 Excessive utilization 的计算结果为 true

    当条件的配置评估为 true 时,提醒政策会保留受监控的资源和条件的记录。系统会根据资源和条件的配对创建突发事件。因此,产生 CPU usage is too high 为 true 的 vm1 和产生 CPU usage is too high true 的 vm2 是不同的事件。系统会为每个事件创建一个突发事件。

  • 满足所有条件:因为两个条件的评估结果均为 true 时创建事件。

    在此示例中,vm1 使 CPU usage is too high 为 true,而 vm2 使 Excessive utilization 评估为 true。因此,这会创建一个事件。

  • 满足匹配资源的所有条件:在这种情况下,不会创建突发事件,因为 vm1 和 vm2 都不会使两个条件评估为 true。要针对此组合器选择创建突发事件,同一虚拟机实例必须使两个条件的计算结果为 true

通知

通过通知渠道,您可以指定希望以何种方式接收提醒。 如果您未添加至少一个通知渠道,则不会在突发事件发生时收到通知。您可以添加多个通知渠道。 如需了解如何选择通知渠道,请参阅通知选项

要添加通知渠道,请执行以下操作:

  1. 点击添加通知渠道 (Add Notification Channel)。
  2. 选择通知渠道类型 (Notification Channel Type)。
  3. 您可能需要填写其他字段。例如,如果您选择电子邮件,则系统会提示您输入电子邮件地址。
  4. 点击添加

要向政策添加其他通知渠道,请重复上述步骤。配置至少两种通知渠道类型可提高可靠性。

文档

通知中包含文档,可帮助您管理失败情况。您可以使用 Markdown 编写文档,或使用纯文本。

除 Markdown 外,您还可以使用变量从政策本身提取信息,以便按您的需求调整文档内容。如需了解详情,请参阅使用变量

例如,文档可能包含诸如 Addressing High CPU Usage 之类的标题以及能够标识项目的详细信息:

## Addressing High CPU Usage

This note contains information about high CPU Usage.

You can include variables in the documentation. For example:

This alert originated from the project ${project}, using
the variable $${project}.

只有在通知中,变量才会被它们的值替换。 预览 Markdown 窗格以及 Cloud Console 中显示文档的其他位置仅反映 Markdown 格式:

使用 markdown 撰写文档备注的示例。

您还可以添加渠道专用标记来控制通知。 如需了解详情,请参阅使用渠道控制

管理政策

要列出所有提醒政策,请执行以下操作:

  1. 在 Cloud Console 中,选择 Monitoring

    转到“监控”

  2. 选择提醒

  3. 部分政策列表显示在 Policies(政策)窗格中。 要查看所有政策并启用过滤功能,请点击查看所有政策

要查看提醒政策的详细信息,请点击其名称。

要限制列出的提醒政策,请添加过滤条件。 每个过滤条件都由名称和值组成。 您可以将该值设置为与政策名称完全匹配或部分匹配。匹配项不区分大小写。 如果您有多个过滤条件,则除非您插入 OR 过滤条件,否则这些过滤条件会由逻辑 AND 自动联接。以下屏幕截图列出了与 testMy Uptime Check Alert Policy 匹配的所有提醒政策:

包含过滤条件的提醒概览示例。

政策窗口中,您可以修改、删除、复制、启用或停用提醒政策:

  • 要修改或复制政策,请点击更多选项 ,并选择相应选项。修改和复制政策与创建提醒政策的过程类似。您可以更改字段中的值,在某些情况下还可以删除这些值。完成后,点击保存

  • 要删除政策,请点击更多选项,然后选择删除。在确认窗口中,选择删除

  • 要更改提醒政策的启用状态,请点击标题已启用下的切换按钮。

如果您选择了提醒政策,则系统会显示政策详细信息。 例如,以下屏幕截图展示了名称为 My Uptime Check Alert Policy 的提醒政策的详细信息:

提醒政策详情页面示例。

您可以在政策详情窗口中修改,删除,复制,启用或停用提醒政策。例如,要停用当前启用的提醒政策,请点击已启用,然后选择关闭。同样,要启用当前已停用的政策,请点击已停用