本文档介绍了如何使用配额调整工具系统调整配额。
配额调整工具会观察您的资源消耗情况并代表您主动提交配额调整请求。监控资源用量并主动提交配额调整请求,可防止因达到配额值而导致中断。使用配额调整工具可以减少监控计划外资源用量增加情况所需的工作量,并减少提交配额调整手动请求的次数。
配额调整工具的工作原理
在启用配额调整工具,后,它会监控所有适用的配额并应用以下逻辑:
- 配额调整工具会在指定时间段内检查峰值用量是否接近配额值。
- 如果是这样,配额调整工具会尝试提高配额值(通常大约提高 10-20%)。
如果可以增加配额值,则系统会批准配额增加请求并调整值。无论是否启用配额调整工具,您都可随时手动提交配额值增加请求。
配额调整工具只会提交配额调整请求,以增加配额的值。它不会尝试降低该值。对于具有手动配额上限的配额,配额调整工具不会提交配额调整请求。
您可以在Google Cloud 控制台的“配额和系统限制”页面中查看配额调整工具发出的请求。您还可以设置提醒来监控由配额调整工具发起的更改。
限制
配额调整工具存在以下限制:
- 配额调整工具设置只能按项目进行。
- 您只能通过Google Cloud 控制台访问配额调整工具设置。
- 配额调整工具不适用于所有配额。如需了解详情,请参阅本文档中的可用性。
可用性
配额调整工具的可用性取决于您的 Google Cloud 项目,并且仅适用于部分 Google Cloud 配额。
根据用量历史记录确定资格
配额调整工具需要足够多的历史用量数据才能准确地确定何时应请求额外的配额。因此,用来启用配额调整工具的选项仅适用于具有足够多的历史活动来支持准确的预测结果的项目。
支持的配额
配额调整工具不适用于所有Google Cloud 配额。 Google Cloud 服务可能支持配额调整工具用于其所有配额或部分配额,也可能不支持配额调整工具用于其配额。如果您为项目启用配额调整工具,该工具会应用于所有受支持的配额。
当某项 Google Cloud 服务为其配额添加或扩展配额调整工具支持时,配额调整工具会自动监控并调整您项目中的这些新支持的配额。即使在您最初启用配额调整工具时不支持这些特定配额,也会发生这种情况。
下表列出了配额调整工具支持的配额。
服务 | 配额 |
---|---|
Artifact Registry API | 每个项目在亚洲多区域每分钟的请求数 |
Artifact Registry API | 每个项目在欧洲多区域每分钟的请求数 |
Artifact Registry API | 每个项目在美国多区域每分钟的请求数 |
Artifact Registry API | 每个区域每个项目每分钟的请求数 |
Cloud Build API | 每分钟的 Build 和 Operation Get 请求数 |
Cloud Build API | 每位用户每分钟的 Build 和 Operation Get 请求数 |
Cloud Build API | 并发 Build CPU 数(区域级默认池) |
Cloud Build API | 并发 Build 数(非区域级默认池) |
Cloud Key Management Service API | 每分钟的加密请求数 |
Cloud Key Management Service API | 每分钟读取请求数 |
Cloud Key Management Service API | 每分钟写入请求数 |
Cloud Logging API | 每个区域每分钟的日志写入字节数 |
Cloud Resource Manager API | 每分钟读取请求数 |
Cloud Run Admin API | 每个区域每分钟的作业运行请求数 |
Cloud Run Admin API | 每分钟每个区域的读取请求数 |
Cloud Run Admin API | 每个项目每个区域的总 CPU 分配量(以毫微 vCPU 为单位) |
Cloud Run Admin API | 每分钟每个区域的写入请求数 |
Cloud Trace API | 每分钟写入请求数(免费) |
Compute Engine API | 亲和性群组数 |
Compute Engine API | 后端存储桶 |
Compute Engine API | C2 CPU |
Compute Engine API | C2D CPU |
Compute Engine API | C3 CPU |
Compute Engine API | 承诺 |
Compute Engine API | 承诺的 A2 CPU 数 |
Compute Engine API | 承诺的 CPU |
Compute Engine API | 在用许可数 |
Compute Engine API | 预留的承诺本地 SSD 磁盘 (GB) |
Compute Engine API | 承诺的 M3 CPU 数 |
Compute Engine API | 承诺的内存优化 CPU 数 |
Compute Engine API | 承诺的 N2 CPU 数 |
Compute Engine API | 承诺的 N2D CPU 数 |
Compute Engine API | 承诺的 T2D CPU 数 |
Compute Engine API | CPU |
Compute Engine API | 每个虚拟机系列的 CPU 数 |
Compute Engine API | 跨项目网络服务项目数 |
Compute Engine API | 每个 VPC 网络的自定义静态路由数 |
Compute Engine API | 外部直通式网络负载均衡器后端服务 |
Compute Engine API | 外部直通式网络负载均衡器转发规则 |
Compute Engine API | 外部协议转发规则 |
Compute Engine API | 防火墙规则 |
Compute Engine API | 转发规则 |
Compute Engine API | 全球外部托管式后端服务 |
Compute Engine API | 全球外部托管式转发规则数 |
Compute Engine API | 全球外部代理 LB 后端服务数 |
Compute Engine API | 全球内部 Traffic Director 后端服务数 |
Compute Engine API | 每个 GPU 系列的 GPU 数量 |
Compute Engine API | GPU 数(所有区域) |
Compute Engine API | 健康检查 |
Compute Engine API | 图片 |
Compute Engine API | 使用中的 IP 地址数 |
Compute Engine API | 正在使用的区域级外部 IPv4 地址 |
Compute Engine API | 正在使用的快照时间表 |
Compute Engine API | 实例组 |
Compute Engine API | 实例模板 |
Compute Engine API | 每个对等互连组的实例数 |
Compute Engine API | 每个 VPC 网络的实例数 |
Compute Engine API | 内部 IP 地址 |
Compute Engine API | 内部直通式网络负载均衡器后端服务数 |
Compute Engine API | 每个对等互连组的内部直通式网络负载均衡器的转发规则数 |
Compute Engine API | 每个 VPC 网络的内部直通式网络负载均衡器转发规则数 |
Compute Engine API | 每个对等互连组的 IP 别名数 |
Compute Engine API | 每个 VPC 网络的 IP 别名数 |
Compute Engine API | 每个虚拟机系列的本地 SSD 磁盘 (GB) |
Compute Engine API | M1 CPU 数 |
Compute Engine API | M2 CPU 数 |
Compute Engine API | M3 CPU 数 |
Compute Engine API | 托管实例组 |
Compute Engine API | N2 CPU |
Compute Engine API | N2D CPU |
Compute Engine API | 网络端点组 |
Compute Engine API | 网络防火墙政策 |
Compute Engine API | 网络负载均衡安全政策规则属性数 |
Compute Engine API | 网络负载均衡安全政策数 |
Compute Engine API | 网络数 |
Compute Engine API | NVIDIA A2 CPU 数 |
Compute Engine API | 每个 VPC 网络的对等互连数 |
Compute Engine API | Persistent Disk IOPS |
Compute Engine API | 永久性磁盘(固态硬盘,单位为 GB) |
Compute Engine API | 永久性磁盘(标准,单位为 GB) |
Compute Engine API | 可抢占的 CPU |
Compute Engine API | 抢占式本地 SSD (GB) |
Compute Engine API | 抢占式 NVIDIA A100 80GB GPU |
Compute Engine API | 抢占式 NVIDIA A100 GPU |
Compute Engine API | 抢占式 NVIDIA H100 GPU |
Compute Engine API | 抢占式 NVIDIA H100 MEGA GPU |
Compute Engine API | 抢占式 NVIDIA K80 GPU |
Compute Engine API | 抢占式 NVIDIA L4 GPU |
Compute Engine API | 抢占式 NVIDIA L4 虚拟工作站 GPU |
Compute Engine API | 抢占式 NVIDIA P100 GPU |
Compute Engine API | 抢占式 NVIDIA P100 虚拟工作站 GPU |
Compute Engine API | 抢占式 NVIDIA P4 GPU |
Compute Engine API | 抢占式 NVIDIA P4 虚拟工作站 GPU |
Compute Engine API | 抢占式 NVIDIA T4 GPU |
Compute Engine API | 抢占式 NVIDIA T4 虚拟工作站 GPU |
Compute Engine API | 抢占式 NVIDIA V100 GPU |
Compute Engine API | 公开通告前缀 |
Compute Engine API | 区域外部代管式后端服务 |
Compute Engine API | 每个 VPC 网络每个区域的区域级外部托管式转发规则数 |
Compute Engine API | 区域级实例模板数 |
Compute Engine API | 区域内部代管式后端服务 |
Compute Engine API | 区域级内部 Traffic Director 后端服务数 |
Compute Engine API | 区域托管实例组 |
Compute Engine API | 区域级安全政策数 |
Compute Engine API | 具有高级匹配条件的区域级安全政策规则数 |
Compute Engine API | 区域级目标 TCP 代理数 |
Compute Engine API | 路由器 |
Compute Engine API | 路线 |
Compute Engine API | 安全政策 |
Compute Engine API | 安全政策规则 |
Compute Engine API | 安全政策规则语言规则 |
Compute Engine API | 快照 |
Compute Engine API | SSL 证书 |
Compute Engine API | 静态 BYOIP IP 地址数 |
Compute Engine API | 静态 IP 地址 |
Compute Engine API | 每个对等互连组的子网范围数 |
Compute Engine API | 每个 VPC 网络的子网范围数 |
Compute Engine API | T2A CPU |
Compute Engine API | T2D CPU 数 |
Compute Engine API | 目标 HTTP 代理 |
Compute Engine API | 目标 HTTPS 代理 |
Compute Engine API | 目标 SSL 代理 |
Compute Engine API | 目标 TCP 代理 |
Compute Engine API | 目标 VPN 网关 |
Compute Engine API | 预留的本地 SSD 磁盘总空间 (GB) |
Compute Engine API | 网址映射 |
Compute Engine API | 虚拟机实例 |
Compute Engine API | VPN 网关 |
Compute Engine API | VPN 隧道 |
Connect Gateway API | 每分钟的网关连接请求数 |
Dialogflow API | 每分钟的所有其他请求数 |
Filestore API | 每个区域的备份数 |
Filestore API | 每个区域的基本 HDD(标准)容量 (GB) |
Filestore API | 每个区域的基本 SSD(高级)容量 (GB) |
Filestore API | 每个区域的可用区级和区域级 1-10 TiB(企业)容量 (GB) |
Filestore API | 每个区域的可用区级和区域级 10-100 TiB(大规模)容量 (GB) |
Google Cloud Memorystore for Redis API | 每个区域的总 Redis 容量 (GB) |
Google Cloud Memorystore for Redis API | 每个区域每个项目的 Redis 集群总单位数 |
Memorystore API | 每个区域每个项目的 Memorystore 总单位数 |
Vertex AI API | 每个区域的自定义模型部署 CPU 数 |
Vertex AI API | 每个区域的自定义模型部署 Nvidia T4 GPU 数 |
Vertex AI API | 每个区域的自定义模型训练 Nvidia T4 GPU 数 |
Vertex AI API | 每个项目每个基本模型每分钟的内容生成请求数 |
Vertex AI API | 每个项目每个基本模型每分钟的区域级在线预测请求数 注意:如需查看可用维度的完整列表,请在 Google Cloud 控制台中展开此条目。 |
Vertex AI API | 每个区域每分钟的资源管理 (CRUD) 请求数 |
Vertex AI API | 每个区域的受限映像训练 TPU V3 Pod 核心数 |
启用配额调整工具
如需启用配额调整工具,您必须具有以下 IAM 权限:
cloudquotas.quotas.update
cloudquotas.quotas.get
如需为 Google Cloud 控制台项目启用配额调整工具,请选择相应的标签页并按照说明操作:
控制台
如需通过 Google Cloud 控制台为 Google Cloud 项目启用配额调整工具,请按照以下步骤操作:
- 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:
- 点击配置标签页。
- 点击启用切换开关。
当状态列显示已启用时,配额调整工具会监控您的资源用量,并在资源用量接近配额值时发出配额调整请求。
REST
如需使用 REST API 在您的 Google Cloud 项目中启用配额调整工具(预览版),请发出 HTTP 请求以更新配额调整工具设置:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
在请求正文中,指定配额调整工具设置资源,并将
enablement
字段设置为ENABLED
。您也可以指定 ETag,但这是可选的:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
替换以下内容:
PROJECT_ID_OR_NUMBER
:要为其启用配额调整工具的项目的项目 ID 或项目编号。OPTIONAL_ETAG
:配额调整工具设置的可选 ETag 字符串。
这会将启用状态更新为
enabled
。
gcloud
如需使用 gcloud CLI 在 Google Cloud 项目上启用配额调整工具(预览版),请按以下步骤操作:
使用 gcloud CLI 进行身份验证:
gcloud auth login
启用配额调整工具设置:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
将
PROJECT_ID_OR_NUMBER
替换为要为其启用配额调整工具的项目的项目 ID 或项目编号。验证启用状态:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
只要您拥有所需权限,这将返回状态为
enabled
。
查看配额调整请求
如需查看配额调整请求,您必须具有以下 IAM 权限:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
如需查看配额调整工具发出的配额调整请求,请执行以下操作:
- 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:
- 点击配额增加请求标签页。增加请求视图会显示项目的增加请求,包括手动请求的增加和由配额调整工具发出的请求。
- 点击过滤条件字段。
- 从菜单中选择类型,然后输入
Auto
。这会过滤配额调整工具发出的请求。
设置配额调整工具提醒
如需接收配额调整工具发出的提醒,请执行以下操作:
- 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:
- 点击配置标签页。
- 点击创建提醒。
- 选择以下一个或两个提醒模板:
- 每当配额调整工具为项目发出配额调整请求时,配额调整工具的所有调整都会发送提醒。
- 仅当配额调整工具尝试提高配额值但无法成功执行此操作时,配额调整工具错误和失败才会发出提醒。
- 可选:点击显示选项,调整提醒之间的最短间隔的默认值以及突发事件自动关闭时长的默认值。
- 选择用于接收提醒的通知渠道。如需调整通知渠道设置或创建新的通知渠道,请点击管理通知渠道。
- 点击创建。
修改或删除配额调整工具提醒
您可以在Google Cloud 控制台中修改或删除配额调整工具提醒:
前往 Cloud Monitoring 控制台中的政策页面。
搜索配额调整工具提醒政策。配额调整工具提醒政策具有以下名称:
Quota adjuster errors and failures
All adjustments by quota adjuster
在显示配额调整工具提醒政策的行中,点击
查看更多。点击修改或删除。
停用配额调整工具
如需停用配额调整工具,您必须具有以下 IAM 权限:
cloudquotas.quotas.update
cloudquotas.quotas.get
如需为 Google Cloud 控制台项目停用配额调整工具,请选择相应的标签页并按照说明操作:
控制台
- 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:
- 点击配置标签页。
- 点击启用切换开关。切换开关会变为灰色。
当切换开关变为灰色并且状态列显示为未启用时,配额调整工具将不再监控您的用量,也不会再发出配额调整请求。
REST
如需使用 REST API 在您的 Google Cloud 项目中停用配额调整工具(预览版),请发出 HTTP 请求以更新配额调整工具设置:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
在请求正文中,指定配额调整工具设置资源,并将
enablement
字段设置为DISABLED
。您也可以指定 ETag,但这是可选的:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
替换以下内容:
PROJECT_ID_OR_NUMBER
:要为其停用配额调整工具的项目的项目 ID 或项目编号。OPTIONAL_ETAG
:配额调整工具设置的可选 ETag 字符串。
这会将启用状态更新为
disabled
。
gcloud
如需使用 gcloud CLI 在 Google Cloud 项目上停用配额调整工具(预览版),请按以下步骤操作:
向 gcloud CLI 进行身份验证:
gcloud auth login
停用配额调整工具设置:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
将
PROJECT_ID_OR_NUMBER
替换为要为其停用配额调整工具的项目的项目 ID 或项目编号。验证启用状态:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
只要您拥有所需权限,这将返回状态为
disabled
。
排查配额增加请求遭拒问题
配额调整工具发起的配额增加请求可能会被拒绝。有时,当 Google Cloud 无法将特定项目、资源或区域的配额增加到超过某一特定值时,就会发生这种情况。不过,在这些情况下,您还是可以手动申请增加配额。
如需在配额调整工具发起的配额调整请求被拒绝时接收通知,请设置配额调整工具提醒。