本文档列出了适用于 Cloud Monitoring 的配额和系统限制。“配额”用于指定您允许访问的可计数共享资源的数量 它们由 Google Cloud 服务定义 Cloud Monitoring。 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
- 监控 Google Cloud 产品和服务的消耗情况
- 限制这些资源的消耗量
- 提供请求更改配额值的方法
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
如需调整大多数配额,请使用 Google Cloud 控制台。 如需了解详情,请参阅申请配额调整。
Monitoring 资源也有系统限制。系统限制不能更改。
用户定义的指标
Cloud Monitoring 的指标管理页面提供了相关信息, 可帮助您控制在可结算指标上支出的金额 而不会影响可观测性。指标管理页面报告以下信息:
- 针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
- 有关标签和指标基数的数据。
- 每个指标的读取次数。
- 指标在提醒政策和自定义信息中心内的使用。
- 指标写入错误率。
您还可以使用指标管理来 排除不需要的指标 从而省去提取它们的成本 如需详细了解指标管理页面,请参阅 查看和管理指标使用情况。
类别 | 上限 |
---|---|
每个项目的自定义指标描述符数量 1 | 1 万 |
每个指标描述符的标签数量 | 30 |
标签键的字符串长度 | 100 |
标签值的字符串长度 | 1024 |
一个写入请求中包含的时间序列数量2 | 200 |
向单个时间序列写入数据的速率3 | 每 5 秒 1 个数据点 |
每个自定义分布指标的直方图分桶数量 | 200 |
每个项目的工作负载、Prometheus 和外部4指标描述符数量 | 25000 |
每项受监控资源的自定义指标中活跃的时间序列数量5 | 20 万 |
每项受监控资源的工作负载指标中活跃的时间序列数量5 | 20 万 |
每项受监控资源的 Prometheus 中活跃的时间序列数量5 | 100 万 |
每项受监控资源的外部指标中活跃的时间序列数量5 | 200000 |
可创建指标描述符的速率 | 每个项目每分钟 6000 次 |
1
这是 Cloud Monitoring 施加的限制,其他服务施加的限制值可能会更低。自定义指标
custom.googleapis.com
。
2
您在一个请求中只能为每个时间序列写入一个数据点,因此该上限也是每个请求可写入的最大数据点数量。
3
Cloud Monitoring API 要求各个数据点写入时间序列的结束时间的间隔至少为 5 秒。您可以将数据点批量写入时间序列,前提是这些数据点是按顺序写入的。
4
外部指标是指那些写入 external.googleapis.com
的指标,
5如果您在过去 24 小时内向某时间序列写入过数据点,则该时间序列便处于活跃状态。
该行中指定的限制是该行内所有用户定义指标(自定义、工作负载、Prometheus 或外部)的单个受监控资源(例如单个 gce_instance
虚拟机或单个 k8s_container
容器)的活跃时间序列总数。一个
global
受监控的资源例外,该资源的限额适用于
为每个用户定义指标单独创建这是系统范围的安全限制,不可自定义。
Monitoring API 配额和限制
类别 | 上限 |
---|---|
API 用量限制 |
如需查看 API 配额和限制,请执行以下操作之一:
|
API 页面令牌有效期 | 24 小时 |
Monitoring API 配额简介
Monitoring API 对时间序列提取请求和时间序列查询的速率设有配额限制。提取请求是指写入时间序列数据的调用,查询是指检索时间序列数据的调用。其他 Monitoring API 端点还设有内部限制,这些端点并非用于处理高速率请求。
为了减少您在服务写入时发出的 API 请求数量
时间序列数据,请使用一个 API 请求写入多个时间序列的数据。
建议您每个请求至少写入 10 个对象。如需详细了解如何批处理 API 请求,请参阅 timeSeries.create
。
如果在批处理 API 请求后,您仍然需要更高的 Monitoring API 配额限制、联系信息 Google Cloud 支持团队。
其他限制是固定的,详情请参见本页中的介绍。
如需了解详情,请访问使用配额。
数据保留
超过保留期限的指标数据点会从时间序列中删除。
类别 | 值 |
---|---|
自定义、外部和代理指标类型的数据点的保留期,其中包括:
|
24 个月1 |
以下进程运行状况指标类型的数据点的保留期:agent.googleapis.com/processes ( count_by_state 和 fork_state 除外),如先前条目所述。 |
24 小时 |
所有其他指标类型的数据点的保留期,其中包括: | 6 周 |
API 页面令牌有效期 | 24 小时 |
1 指标数据会按照原始采样频率存储 6 周时间,随后会将采样频率降至 10 分钟一次并长期存储。
2 Google Cloud Managed Service for Prometheus 指标数据会存储
1 周(原始画质)
采样频率,则在接下来的
5 周后,系统会以 10 分钟为间隔进行降采样,以延长存储时间。
资源组
类别 | 值 |
---|---|
每个指标范围 的资源组数 | 500 |
一份电子邮件报告中包含的资源组数量上限 1 | 10 |
1 配置 Cloud Monitoring 电子邮件报告时,您可以请求显示自己的资源组利用率信息。由于电子邮件报告工具的限制,生成的报告仅包含 10 个资源组的信息。
受监控的项目限制
Cloud Monitoring 为每个指标范围正式支持多达 375 个 Google Cloud 项目。
每个指标范围最多可以添加 1,000 个 Google Cloud 项目,但您可能会遇到性能问题,尤其是在查询自定义指标或历史数据时。Cloud Monitoring 仅保证每个指标范围内最多 375 个 Google Cloud 项目的查询和图表能够高效运行。
如需提高每个指标范围的 Google Cloud 项目配额,您可以申请 “受监控的项目 / 监控指标范围”增幅配额。如需了解详情,请参阅有关管理配额的文档。
创建和更新指标描述符的限制
Cloud Monitoring 在创建新指标时强制执行每分钟速率限制, 向现有指标添加新标签名称,以及删除指标。 通常,只有在首次集成 Cloud Monitoring,例如 将现有成熟的 Prometheus 部署迁移到 Cloud Monitoring。这不是注入数据点的速率限制。此速率限制仅在创建全新指标或向现有指标添加新标签名称时适用。
此配额是固定的,但在新指标和指标标签的创建达到每分钟限制时,任何问题都会自动解决。
提醒方面的限制
类别 | 值 | 政策类型1 |
---|---|---|
每个指标范围的提醒政策(指标和日志的总和)2 | 500 | 指标、日志 |
每个基于指标的提醒政策的条件 | 6 | 指标 |
每个基于 SQL 的提醒政策的条件(公开预览版) | 1 | SQL |
指标缺失条件评估的 最长时间段3 |
1 天 | 指标 |
指标阈值条件评估的 最长时间段3 |
23 小时 30 分钟 | 指标 |
指标阈值条件中使用的过滤条件的长度上限 |
2,048 个 Unicode 字符 | 指标 |
时序数量上限 由预测条件监控 |
64 | 指标 |
最短预测期 | 1 小时(3,600 秒) | 指标 |
预测窗口期上限 | 2.5 天(216,000 秒) | 指标 |
每项提醒政策的通知渠道数量 | 16 | 指标、日志 |
通知速率上限4 | 每 5 分钟 1 条通知 每个基于日志的提醒政策 | 日志 |
通知数上限 | 每个基于日志的提醒政策每天 20 条通知 | 日志 |
每项提醒政策同时打开的突发事件数量上限 |
1,000 | 指标 |
无新数据突发事件的 自动关闭期 |
7 天 | 指标 |
非手动关闭的突发事件最长持续时间 | 7 天 | 日志 |
已关闭的突发事件的保留期限 | 13 个月 | 不适用 |
未结突发事件的保留期限 | 无限期 | 不适用 |
每个指标范围的通知渠道 | 4000 | 不适用 |
每次延后的提醒政策数量上限 | 16 | 指标、日志 |
延后提醒的保留 | 13 个月 | 不适用 |
2Apigee 和 Apigee Hybrid 与 Cloud Monitoring 深度集成。所有 Apigee 订阅层级(标准版、企业版和企业加强版)的提醒限制与 Cloud Monitoring 相同,即每个指标范围 500 个。
3条件评估的最长时间段是校准时间段和时长窗口值的总和。例如,如果将校准时间段设置为 15 小时,并将时长窗口设置为 15 小时,则需要 30 小时的数据来评估条件。
4如果基于日志的提醒政策的查询会提取标签值,则提取的每个值组合都代表自己的通知时间轴。例如,假设基于日志的提醒政策会提取标签的值。假设标签可以有两个值。使用此配置,您可以在同一位置接收两个通知,每个通知对应一个标签值 5 分钟。
针对合成监控工具的限制
类别 | 值 |
---|---|
每个指标范围的正常运行时间检查次数* | 100 |
每个公开正常运行情况检查的 ICMP ping 数量上限 | 3 |
每个指标范围的合成监控工具 | 100† |
†如需了解如何提高此限制,请参阅 使用 Google Cloud 控制台管理配额。
图表绘制限制
类别 | 值 |
---|---|
每个指标范围的信息中心 | 1000 |
每个信息中心内的图表数量 | 40 |
每个图表中的线条数量 | 50* |
表中的行 | 300 |
To improve performance, we've limited the time series displayed in this chart
。
如需显示所有时序,请展开提示并
选择显示所有时序按钮。
服务等级目标
类别 | 值 |
---|---|
每项服务的 SLO 数量 | 500 |