借助提醒,您可以及时得知云端应用中出现的问题,从而快速解决问题。
要创建提醒政策,您必须说明您想要在哪些情况下接收提醒以及通过什么方式接收通知。本页面简要介绍提醒政策以及政策背后的概念。
如需获取更具实践性的说明,请从以下快速入门中选择一个,按照其中的步骤操作:
如需了解监控用量并在您接近帐单阈值时进行提醒的提醒政策,请参阅月度日志提取量提醒和 Trace 月度 span 提取量提醒。
提醒的工作原理
您可以使用 Google Cloud Console、Cloud Monitoring API 和 Cloud SDK 创建和管理提醒政策。
每个提醒政策指定以下信息:
条件:用于标识一项资源或一组资源何时需要您采取行动。系统会持续监控提醒政策的条件。 您不能将条件配置为仅在特定时间段内受到监控。
在条件满足时发送的通知,以便让您的支持团队知晓。现有通知渠道如下所示:
- 电子邮件
- Cloud Mobile App
- PagerDuty
- 短信
- Slack
- Webhook
- Pub/Sub
您可以选择是否配置通知。如需了解可用的通知渠道,请参阅通知选项。
可在某些类型的通知中包含的文档,用于帮助您的支持团队解决问题。您可以选择是否配置文档。
当提醒政策的条件被满足时,Cloud Monitoring 会在 Google Cloud Console 中创建并显示突发事件。如果您设置了通知,Cloud Monitoring 还会向相关人员或第三方通知服务发送通知。回复者可以确认收到通知,但在触发突发事件的条件不再成立之前,突发事件仍会保持未解决状态。
如需了解如何使用 Google Cloud Console 查看和管理突发事件,请参阅突发事件。
示例
您在运行 LAMP 堆栈的 Compute Engine 虚拟机实例上部署网页应用。虽然您知道 HTTP 响应延迟时间可能会随着正常需求的增减而波动,但如果您的用户开始长时间经历高延时,您需要采取措施。
要在用户经历高延时的时候收到通知,请创建以下提醒政策:
如果 HTTP 响应延迟时间超过两秒钟,
且如果这种情况持续五分钟以上,
则创建一个突发事件,并向您的支持团队发送电子邮件。
事实证明,您的网页应用比您预期的更受欢迎,响应延迟时间超过两秒钟。对此,您的提醒政策通过以下方式进行响应:
在 HTTP 延迟时间超过两秒钟这一情况持续五分钟后,Cloud Monitoring 创建一个突发事件并发送电子邮件。
支持团队收到该电子邮件,登录到 Google Cloud Console,并确认收到通知。
按照通知电子邮件中的文档操作,支持团队就能够解决延迟问题。HTTP 响应时间会在几分钟内重新缩短到两秒钟以内。
一旦 Cloud Monitoring 检测到 HTTP 延迟时间短于两秒钟,提醒政策的条件便不再成立(即使只有一次检测到短于两秒的延迟时间也会违背“连续五分钟”这一要求)。
Cloud Monitoring 会结束该突发事件并重置上述五分钟计时器。 如果延迟时间在下一个连续的五分钟内超过两秒,提醒政策会创建一个新的突发事件。
提醒政策的类型
Cloud Monitoring 可让您创建不同类型的政策。例如,您可以创建一个提醒政策,该政策会在指标缺失或指标值超出阈值时触发。
Google Cloud Console 列出了与 Google Cloud 项目关联的所有提醒政策,甚至是使用 API 或 Cloud SDK 创建的提醒政策。但是,您必须使用 Cloud Monitoring API 或 Cloud SDK 来创建、查看或修改基于比率的提醒政策。
如需了解不同类型的政策和示例政策,请参阅提醒政策类型。
如需了解可能影响提醒的变量,请参阅提醒行为。
授权
本部分介绍创建提醒政策所需的角色或权限。如需详细了解 Cloud Monitoring 的身份和访问权限管理 (IAM),请参阅访问权限控制。
每个 IAM 角色都有一个 ID 和一个名称。角色 ID 的格式为 roles/monitoring.editor
,并在配置访问权限控制时作为参数传递给 gcloud
命令行工具。如需了解详情,请参阅授予、更改和撤消访问权限。角色名称(例如 Monitoring Editor)由 Cloud Console 显示。
所需 Cloud Console 角色
要创建提醒政策,Google Cloud 项目的 IAM 角色名称必须为以下其中一项:
- Monitoring Editor
- Monitoring Admin
- Project Owner
如需查看角色列表及其关联的权限,请参阅角色。
所需 API 权限
要使用 Cloud Monitoring API 创建提醒政策,Google Cloud 项目的 IAM 角色 ID 必须为以下其中一项:
roles/monitoring.alertPolicyEditor
:此角色 ID 授予创建提醒政策所需的最小权限。如需详细了解此角色,请参阅预定义的提醒角色。role/monitoring.editor
role/monitoring.admin
role/owner
如需确定特定 Cloud Monitoring API 方法所需的权限,请参阅 Cloud Monitoring API 权限。如需查看角色列表及其关联的权限,请参阅角色。
确定您的角色
要使用 Cloud Console 确定项目的角色,请执行以下操作:
打开 Cloud Console 并选择 Google Cloud 项目:
如需查看您的角色,请点击 IAM 和管理。您的角色与您的用户名在同一行。
如需确定您的组织级别权限,请与组织管理员联系。
价格和限制
使用提醒政策或正常运行时间检查不产生任何费用,但具有以下限制:
类别 | 值 |
---|---|
每个工作区的正常运行时间检查数量1 | 100 |
每个工作区的提醒政策数量2 | 500 |
每项提醒政策的条件数量 | 6 |
每项提醒政策的通知渠道数量 | 16 |
每个工作区的通知渠道数量 | 4000 |
每项提醒政策同时存在的未解决突发事件数量 | 5000 |
指标缺失条件存在的最长时间 | 1 天 |
指标阈值条件存在的最长时间 | 23 小时 30 分钟 |
2Apigee 和 Apigee Hybrid 已与 Cloud Monitoring 集成。所有 Apigee 订阅层级(标准版、企业版和企业加强版)的提醒限制与 Cloud Monitoring 相同,即每个工作区 500 个。
如需获得完整的价格信息,请参阅 Google Cloud 的运维套件的价格。
后续步骤
- 如需了解不同类型的提醒政策,请参阅提醒政策类型。
- 如需了解影响提醒的变量,请参阅提醒行为。
- 如需通过图形界面创建和管理提醒政策,请参阅使用控制台。
- 如需使用 Cloud Monitoring API 或命令行创建和管理提醒政策,请参阅使用 API。
- 如需了解可用的通知渠道,请参阅通知选项。
- 如需了解各类提醒政策,请参阅示例政策。
- 如需了解如何使用 Monitoring Query Language (MQL) 作为提醒政策的基础,请参阅使用 Monitoring Query Language 的提醒政策。