本页面介绍如何在 Cloud Monitoring 中为您在 Anthos Service Mesh 中创建的服务等级目标 (SLO) 创建提醒政策。
如需了解 SLO,请参阅服务等级目标概览。
在服务即将违反 SLO 时,Cloud Monitoring 可能会触发提醒。您可以根据错误预算的使用率创建提醒政策。有关错误预算的所有提醒都具有相同的基本条件:合规期的错误预算的指定百分比会在回溯期(如前 60 分钟的时间段)中使用。当您创建提醒政策时,Anthos Service Mesh 会根据 SLO 中的设置自动设置提醒的大多数条件。您需要指定回溯期和使用百分比。
确定您应该为回溯期和使用百分比设置哪些值可能需要进行反复试验。您可以将默认回溯期 60 分钟用作起点。如需确定使用百分比,请监控服务行为,以查看之前 60 分钟内使用的总错误预算的百分比(合规期内)。您希望设置使用百分比,以避免在回溯期内承受的错误预算超出承受范围,但您不希望无谓地设置提醒。
例如,假设您创建了一个具有以下名称的 SLO:95% < 300ms Latency in Calendar Week
使用此 SLO 时,在一周内的请求总数中,只有 5% 的延迟时间可以超过 300 毫秒。达到或超出 5% 将使用总错误预算。如果您将回溯期设置为一小时,则每个回溯期为合规期的 1/168
(一周有 168 小时)。如需计算在一周内未超过总错误预算的每小时使用百分比,请进行以下运算:5%
÷ 168
≈ 0.03%
由于您的服务的延迟时间可能会因负载或其他条件而波动,因此将 0.03% 设置为使用百分比可能会触发不必要的提醒。您可以先将值设为该值的两倍(即 0.06%),然后再监控您的服务并根据需要进行调整。
准备工作
为您的其中一项服务创建 SLO。
针对 SLO 创建提醒政策
转到服务的运行状况标签页:
在 Google Cloud Console 中,转到 Anthos Service Mesh。
从菜单栏的下拉列表中选择 Google Cloud 项目。
点击您要为其创建提醒政策的服务。
在左侧导航栏中,点击运行状况。
点击您要为其创建提醒政策的 SLO。
在右侧的 SLO 的当前状态部分中,点击创建提醒政策链接。
此时将显示添加条件对话框。Anthos Service Mesh 会根据 SLO 中的设置自动填充 SLO 消耗率 (SLO Burn Rate) 条件。您可配置 SLO 消耗率 (SLO Burn Rate) 条件,以便在 SLO 的错误预算下降过快时收到提醒。您希望确保在 SLO 用完错误预算之前收到提醒。
配置条件:
- 如需为条件命名,请点击建议的标题 (Suggested title) 链接,以根据您的 SLO 使用该名称,或输入条件的名称。
- 在目标部分的回溯期 (Lookback Duration) 字段中输入回溯期,或使用默认值。
- 在配置部分的阈值字段中输入使用百分比。
- 点击保存。此时将显示新建提醒政策窗口。
配置提醒政策:
- 输入政策名称。
- 系统会自动填充条件,但您可以选择添加其他条件。
- 如果提醒政策只有一个条件,则将政策触发器 (Policy triggers) 字段保留为满足任意条件 (Any condition is met) 的默认值。
- (可选)配置通知和文档部分。如需了解详情,请参阅管理提醒政策。
- 点击保存。此时将显示政策详情页面。
- 如需返回 Anthos Service Mesh 信息中心,请点击导航菜单 dehaze 并转到 Anthos > 服务。