提醒概览

本文档介绍了如何在提交申请后 或者应用的性能达不到定义的 条件。

提醒工作的工作原理

Cloud Monitoring 提醒过程包含三个部分:

  • 提醒政策:描述您希望看到哪些情境 提醒以及您希望如何接收有关突发事件的通知。 提醒政策可以监控由 Cloud Logging 存储的监控或日志。 当该数据满足 提醒政策条件后,Monitoring 会创建一个 incident 并发送通知。

  • 每个突发事件都是一条相关数据类型的记录, 以及何时满足这些条件。此信息 可帮助您排查导致突发事件的问题。

  • 通知渠道定义了 您会在 Monitoring 创建突发事件时收到通知。 例如,您可以配置 发送至电子邮件 my-support-team@example.com 的通知渠道 以及将 Slack 消息发布到频道 #my-support-team。 提醒政策可以包含一个或多个通知渠道。

提醒政策可以评估两类数据:

  • 时间序列数据,也称为指标数据, 监控。这些类型的政策称为 基于指标的提醒政策。

    如需了解如何设置基于指标的提醒政策,不妨尝试 Compute Engine 快速入门

  • Cloud Logging 存储的日志数据。这些类型的政策称为 基于日志的提醒政策。基于日志的提醒政策 当特定消息出现在您的日志中时通知您。

    本文档重点介绍基于指标的提醒 政策,包含有关基于日志的提醒政策的一般信息 。如需详细了解 基于日志的提醒政策,请参阅监控日志

提醒过程可帮助您在出现以下情况时对问题做出响应: 应用未达到可接受的值。例如,您要将一个 Web 服务器 部署到 Compute Engine 虚拟机上 (虚拟机)实例。虽然您预计 HTTP 响应延迟时间 波动,您希望支持团队做出回应, 应用的长时间延迟时间较长。您可以创建 基于指标的提醒政策,可监控应用的 HTTP 响应 延迟时间指标如果响应延迟时间至少超过两秒 Monitoring 创建一个事件并发送 发送电子邮件通知您的支持团队。

如何创建提醒政策

您可以通过多种方式创建提醒政策。例如,您可以 通过启用建议的提醒来使用预配置的提醒政策 集成或 Google Cloud 控制台中的特定页面管理。 您还可以使用 Google Cloud 控制台、Cloud Monitoring APIGoogle Cloud CLITerraform

使用集成和推荐的提醒政策

Monitoring 提供 您可以利用预构建的软件包创建提醒政策, Google Cloud 服务和第三方集成。这些套餐包括 推荐提醒政策、示例信息中心和 服务。这些套餐适用于 Google Cloud 服务,例如 Google Kubernetes Engine、Compute Engine 和 Cloud SQL, 以及常见的第三方集成,如 MongoDB、Kafka 和 Elasticsearch。

安装软件包时,您可以启用软件包的推荐提醒功能 政策。启用建议的提醒政策时,您可以配置其 还可以视需要修改其他值。 配置后,提醒政策开始监控其目标 无需用户进一步输入内容。

在部署新服务时,建议的提醒政策非常有用 并希望监控重要指标例如, Cloud SQL 集成软件包附带建议的提醒政策, 实例失败和事务缓慢:

Cloud SQL 集成软件包的两种推荐提醒政策。

如需详细了解提醒集成 请参阅监控第三方应用

使用 Cloud Monitoring

如果要创建提醒政策并选择其条件类型 指标类型和时序等其他组件,然后使用 监控。下表列出了不同类型的 设置提醒政策的条件。

条件类型 说明 示例
指标阈值条件

当指标的值达到 超过或小于特定重新测试期的阈值。

如需了解详情,请参阅 创建指标阈值提醒政策使用 API 创建提醒政策

您需要一个在响应时发送通知的提醒政策 延迟时间为 500 毫秒或以上 进行五次连续拨测 10 分钟以上。
指标缺失条件

如果受监控的时序没有 特定重新测试窗口的数据。最大重新测试窗口为 23.5 小时。

如需了解详情,请参阅 创建指标缺失提醒政策使用 API 创建提醒政策

您需要一个在您的支持下创建突发事件的提醒政策 当资源未响应任何 HTTP 请求时 五分钟的时间
预测的指标值条件

当提醒政策满足预测的指标值条件时 预测出 下一个预测窗口期内将违反阈值。 预测时间范围从 1 小时到 7 天不等。

如需了解详情,请参阅 创建预测的指标值提醒政策使用 API 创建提醒政策

您需要一个在您的支持下创建突发事件的提醒政策 可能会达到 80% 的磁盘可用空间 。
基于日志的条件

提醒满足时满足基于日志的提醒政策的条件 政策会检测基于日志的指标是否与提醒政策匹配 条件。基于日志的指标从日志内容中提取指标数据 条目。例如,您可以使用基于日志的指标 统计包含特定消息或 提取日志条目中记录的延迟时间信息。

如需了解详情,请参阅 配置基于日志的提醒政策 以及使用 Cloud Monitoring API 创建基于日志的提醒政策

您需要一个在您的支持下创建突发事件的提醒政策 则当项目至少有 50 个具有 message包含 product_ids=['tier_1_support', 'tier_2_support']

提醒政策组成部分

每个提醒政策都包含以下组成部分:

  • 描述一个资源或一组 处于需要响应的状态。条件 包括数据源、静态或动态阈值以及数据汇总 方法,例如过滤条件和 groupby。您的条件可能 监控单个指标、多个指标或多个指标比率。您还可以 使用 PromQL 和 Monitoring Query Language (MQL) 等查询语言来 包括动态阈值和 条件逻辑。

    如果您使用集成来启用建议的提醒政策, 系统会预先填充提醒政策条件。

  • 一个通知渠道列表,这些渠道说明了操作发生时要通知的人员 必填字段。如需了解详情,请参阅 创建和管理通知渠道

  • 通知和事件页面中显示的文档。您 还可以配置通知的主题行,还可以 在通知正文中添加有用的信息。例如,您 可能会将通知配置为显示指向内部 playbook 的链接,或 Google Cloud 页面,例如自定义信息中心。 有关文档(包括示例)的详细信息,请参阅 使用用户定义的文档为突发事件添加注释

查询语言

在提醒政策中使用查询语言和过滤器, 可以更好地控制指标评估。监控 支持以下查询类型:

  • Prometheus 查询语言 (PromQL) 是一种实用的查询语言, 来实时评估时序数据。您可以配置提醒政策 要包含的条件 PromQL 查询。您的 PromQL 查询可以使用 例如指标组合、 比例和伸缩阈值使用 Google Cloud 中基于 PromQL 的条件下,您可以减少对 外部提醒基础架构如需了解详情,请参阅 Cloud Monitoring 中的 PromQL 以及使用 PromQL 设置提醒政策

  • Monitoring Query Language (MQL) 是一个具有表现力、基于文本的界面 可用于检索、过滤和处理时间序列数据。 您可以创建具有下列条件的提醒政策: Monitoring Query Language 提醒操作。 如需了解详情,请参阅 Monitoring 查询语言概览使用 MQL 的提醒政策

  • 利用监控过滤条件,您可以配置提醒政策 使用基于过滤条件的指标比率基于过滤器 您无法在 Google Cloud 控制台中查看和修改提醒政策。 如需查看使用 Monitoring 过滤条件的政策示例,请参阅 指标比率

管理提醒政策和突发事件

启用提醒政策后,Monitoring 会持续监控该政策的条件。您无法配置 提醒政策仅监控特定时间段内的条件。如果您想 在特定时间段内停用提醒政策,然后创建一个 延后

如果突发事件未解决,并且 Monitoring 确定 基于指标的政策的条件 监控会自动关闭突发事件并发送 通知。

价格

一般来说,Cloud Monitoring 系统指标是免费的, 不会来自外部系统、代理或应用。计费指标 按注入的字节数或提取的样本数收费。

如需详细了解 Cloud Monitoring 价格,请参阅以下文档:

如需了解如何监控 或者如何在包含特定内容时获得通知 请参阅以下文档:

后续步骤