Cloud Monitoring 配额和限制

本文档列出了适用于 Cloud Monitoring 的quotasquotas

配额用于限制您的 Google Cloud 项目可使用的共享 Google Cloud 资源(包括硬件、软件和网络组件)的数量。因此,有以下功能的系统具有配额:

  • 监控 Google Cloud 产品和服务的使用情况或消耗情况。
  • 出于某些原因限制这些资源的消耗量,包括确保公平性和减少使用量高峰。
  • 维护可自动强制执行规定限制的配置。
  • 提供请求或更改配额的方法。

在大多数情况下,当超过配额时,系统会立即阻止对相关 Google 资源的访问,并且您尝试执行的任务将失败。在大多数情况下,配额适用于每个 Google Cloud 项目,并由使用该 Google Cloud 项目的所有应用和 IP 地址共享。

如需增加或减少大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请更高的配额

Monitoring 资源也存在限制。这些限制与配额系统无关。除非另有说明,否则无法更改限制。

用户定义的指标

Cloud Monitoring 指标管理页面提供的信息可帮助您控制在收费指标上支出的金额,而不会影响可观测性。指标管理页面报告以下信息:

  • 针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
  • 有关指标标签和基数的数据。
  • 指标在提醒政策和自定义信息中心内的使用。
  • 指标写入错误率。
如需详细了解指标管理页面,请参阅查看和管理指标使用情况

类别 上限
每个项目的自定义指标描述符数量 1 1 万
每个指标描述符的标签数量 30
标签键的字符串长度 100
标签值的字符串长度 1024
写入请求中包含的时间序列数量2 200
向单个时序写入数据的速率3 每 5 秒 1 个数据点
每个自定义分布指标的直方图分桶数量 200
每个项目的工作负载、Prometheus 和外部4指标描述符数量 25000
每项受监控资源的自定义指标中活跃的时序数量5 20 万
每项受监控资源的工作负载指标中活跃的时序数量5 20 万
每项受监控资源的 Prometheus 中活跃的时序数量5 100 万
每项受监控资源的外部指标中活跃的时序数量5 200000
创建指标描述符的速率 每个项目每分钟 6000 次

1 这是 Cloud Monitoring 施加的限制,其他服务施加的最大值可能会更低。自定义指标是写入 custom.googleapis.com 的指标。
2 您在一个请求中只能为每个时序写入一个数据点,因此该上限也是每个请求可写入的最大数据点数。
3 Cloud Monitoring API 要求,各数据点写入时序的结束时间必须至少相隔 5 秒。您可以将数据点批量写入时序,前提是这些数据点是按顺序写入的。
4 外部指标是指写入 external.googleapis.com 的指标。
5 如果您在过去 24 小时内向某时序写入过数据点,则该时序便处于活跃状态。行中指定的上限是单个受监控的资源(例如,单个 gce_instance 虚拟机或单个 k8s_container 容器)内所有用户定义的指标(自定义、工作负载、Prometheus 或外部)的活跃时序总数。global 受监控的资源例外,该限制分别适用于每个用户定义的各个指标。这是系统范围的安全限制,无法自定义。

Monitoring API 配额和限制

类别 上限
API 用量限制

如需查找 API 配额和限制,请执行以下操作之一:

API 页面令牌有效期 24 小时

Monitoring API 配额简介

Monitoring API 对时间序列提取请求和时间序列查询的速率设有配额限制。提取请求是指写入时间序列数据的调用,查询是指检索时间序列数据的调用。其他 Monitoring API 端点还设有内部限制,这些端点并非用于处理高速率请求。

如需减少您在服务写入时序数据时发出的 API 请求的数量,请使用一个 API 请求为多个时序写入数据。建议您每个请求至少写入 10 个对象。如需详细了解如何批处理 API 请求,请参阅 timeSeries.create

如果在批量处理 API 请求后,您仍然需要更高的 Monitoring API 配额限制,请与 Google Cloud 支持团队联系。

其他限制是固定的,详情请参见本页中的介绍。

如需了解详情,请访问使用配额

数据保留

超过保留期限的指标数据点会从时序中删除。

类别
自定义、外部和代理指标类型的数据点的保留期,其中包括:
  • 自定义指标,前缀为 custom.googleapis.com
  • 来自 Google Cloud Managed Service for Prometheus 的指标,前缀为 prometheus.googleapis.com2
  • 代理指标,前缀为 agent.googleapis.com,其中包括
    processes/count_by_stateprocesses/fork_state
    其余 processes 指标的保留期不同;请参阅以下内容。
  • 外部指标,前缀为 external.googleapis.com
  • OpenTelemetry 和其他工作负载指标,前缀:workload.googleapis.com
24 个月1
以下进程运行状况指标类型的数据点的保留期:agent.googleapis.com/processes
count_by_statefork_state 除外),如先前条目所述。
24 小时
所有其他指标类型的数据点的保留期,其中包括: 6 周 Google Cloud 指标的保留期 6 周
API 页面令牌有效期 24 小时

1 指标数据会按照原始采样频率存储 6 周时间,随后会将采样频率降至 10 分钟一次并长期存储。
2 Google Cloud Managed Service for Prometheus 指标数据会以原始采样频率存储 1 周,然后在接下来的 5 周内以 1 分钟间隔降采样,然后以 10 分钟间隔降采样,以进一步存储。

资源组

类别
每个指标范围 的资源组数 500
一份电子邮件报告中包含的资源组数量上限 1 10

1 配置 Cloud Monitoring 电子邮件报告时,您可以请求显示自己的资源组利用率信息。由于电子邮件报告工具的限制,生成的报告仅包含 10 个资源组的信息。

受监控的项目限制

Cloud Monitoring 为每个指标范围正式支持多达 375 个 Google Cloud 项目。

每个指标范围最多可以添加 1,000 个 Google Cloud 项目,但您可能会遇到性能问题,尤其是在查询自定义指标或历史数据时。Cloud Monitoring 仅为每个指标范围内的 375 个 Google Cloud 项目提供高性能查询和图表。

如需提高 Google Cloud 项目的每指标范围配额,您可以申请增加“受监控的项目 / 监控指标范围”配额。如需了解详情,请参阅有关管理配额的文档。

有关创建和更新指标描述符的限制

在创建新指标、向现有指标添加新指标标签以及删除指标时,Cloud Monitoring 都会强制执行每分钟速率限制。通常,只有在首次与 Cloud Monitoring 集成时(例如,将现有成熟的 Prometheus 部署迁移到 Cloud Monitoring 时),才会达到此速率限制。这不是注入数据点的速率限制。只有在创建从未见过的指标或向现有指标添加新标签时,此速率限制才适用。

此配额是固定的,但在新指标和指标标签的创建达到每分钟限制时,任何问题都会自动解决。

提醒限制

类别 政策类型1
每个指标范围的提醒政策(指标和日志的总和)2 500 指标、日志
每项提醒政策的条件数量 6 指标
指标缺失条件评估的
最长时间段3
1 天 指标
指标阈值条件评估的
最长时间段3
23 小时 30 分钟 指标
在指标阈值条件下使用的
过滤器的最大长度
2048 个 Unicode 字符 指标
一个预测条件
监控的时序数量上限
64 指标
最短预测期 1 小时(3,600 秒) 指标
预测时间范围上限 2.5 天(216,000 秒) 指标
每项提醒政策的通知渠道数量 16 指标、日志
通知率上限 每个基于日志的提醒每 5 分钟 1 条通知 日志
通知数上限 每个基于日志的提醒每天 20 条通知 日志
每项提醒政策同时打开的突发事件数量上限
1,000 指标
无新数据突发事件的
自动关闭期
7 天 指标
非手动关闭的突发事件最长持续时间 7 天 日志
已关闭的突发事件的保留期限 13 个月 不适用
未结突发事件的保留期限 无限期 不适用
每个指标范围的通知渠道 4000 不适用
每次延后的提醒政策数量上限 16 指标、日志
延后的保留时间 13 个月 不适用
1指标:基于指标数据的提醒政策;日志:基于日志消息的提醒政策(基于日志的提醒)
2ApigeeApigee Hybrid 与 Cloud Monitoring 深度集成。所有 Apigee 订阅层级(标准版、企业版和企业加强版)的提醒限制与 Cloud Monitoring 相同,即每个指标范围 500 个。
3条件评估的最长时间段是校准时间段和时长窗口值的总和。例如,如果将校准时间段设置为 15 小时,并将时长窗口设置为 15 小时,则需要 30 小时的数据来评估条件。

合成监控工具的限制

类别
每个指标范围 的拨测* 100
每次公开拨测的 ICMP ping 数量上限 3
按指标范围 的合成监控工具 100
*此限制适用于正常运行时间检查配置的数量。每个正常运行时间检查配置包括指定资源的状态测试之间的时间间隔。
如需了解如何提高此限制,请参阅使用 Google Cloud 控制台管理配额

图表绘制限制

类别
每个指标范围的信息中心 1000
每个信息中心内的图表数量 40
每个图表中的线条数量 50

服务等级目标

类别
每项服务的 SLO 数量 500