配额调整工具

本文档介绍了如何使用配额调整工具系统调整配额。

配额调整工具会观察您的资源消耗情况并代表您主动提交配额调整请求。监控资源用量并主动提交配额调整请求,可防止因达到配额值而导致中断。使用配额调整工具可以减少监控计划外资源用量增加情况所需的工作量,并减少提交配额调整手动请求的次数。

配额调整工具的工作原理

启用配额调整工具,后,它会监控所有适用的配额并应用以下逻辑:

  • 配额调整工具会在指定时间段内检查峰值用量是否接近配额值。
  • 如果是这样,配额调整工具会尝试提高配额值(通常大约提高 10-20%)。

如果可以增加配额值,则系统会批准配额增加请求并调整值。无论是否启用配额调整工具,您都可随时手动提交配额值增加请求。

配额调整工具只会提交配额调整请求,以增加配额的值。它不会尝试降低该值。对于具有手动配额上限的配额,配额调整工具不会提交配额调整请求。

您可以在Google Cloud 控制台的“配额和系统限制”页面中查看配额调整工具发出的请求。您还可以设置提醒来监控由配额调整工具发起的更改。

限制

配额调整工具存在以下限制:

  • 配额调整工具设置只能按项目进行。
  • 您只能通过Google Cloud 控制台访问配额调整工具设置。
  • 配额调整工具不适用于所有配额。如需了解详情,请参阅本文档中的可用性

可用性

配额调整工具的可用性取决于您的 Google Cloud 项目,并且仅适用于部分 Google Cloud 配额。

根据用量历史记录确定资格

配额调整工具需要足够多的历史用量数据才能准确地确定何时应请求额外的配额。因此,用来启用配额调整工具的选项仅适用于具有足够多的历史活动来支持准确的预测结果的项目。

支持的配额

配额调整工具不适用于所有Google Cloud 配额。 Google Cloud 服务可能支持配额调整工具用于其所有配额或部分配额,也可能不支持配额调整工具用于其配额。如果您为项目启用配额调整工具,该工具会应用于所有受支持的配额。

当某项 Google Cloud 服务为其配额添加或扩展配额调整工具支持时,配额调整工具会自动监控并调整您项目中的这些新支持的配额。即使在您最初启用配额调整工具时不支持这些特定配额,也会发生这种情况。

下表列出了配额调整工具支持的配额。

服务 配额
Artifact Registry API 每个项目在亚洲多区域每分钟的请求数
Artifact Registry API 每个项目在欧洲多区域每分钟的请求数
Artifact Registry API 每个项目在美国多区域每分钟的请求数
Artifact Registry API 每个区域每个项目每分钟的请求数
Cloud Build API 每分钟的 Build 和 Operation Get 请求数
Cloud Build API 每位用户每分钟的 Build 和 Operation Get 请求数
Cloud Build API 并发 Build CPU 数(区域级默认池)
Cloud Build API 并发 Build 数(非区域级默认池)
Cloud Key Management Service API 每分钟的加密请求数
Cloud Key Management Service API 每分钟读取请求数
Cloud Key Management Service API 每分钟写入请求数
Cloud Logging API 每个区域每分钟的日志写入字节数
Cloud Resource Manager API 每分钟读取请求数
Cloud Run Admin API 每个区域每分钟的作业运行请求数
Cloud Run Admin API 每分钟每个区域的读取请求数
Cloud Run Admin API 每个项目每个区域的总 CPU 分配量(以毫微 vCPU 为单位)
Cloud Run Admin API 每分钟每个区域的写入请求数
Cloud Trace API 每分钟写入请求数(免费)
Compute Engine API 亲和性群组数
Compute Engine API 后端存储桶
Compute Engine API C2 CPU
Compute Engine API C2D CPU
Compute Engine API C3 CPU
Compute Engine API 承诺
Compute Engine API 承诺的 A2 CPU 数
Compute Engine API 承诺的 CPU
Compute Engine API 在用许可数
Compute Engine API 预留的承诺本地 SSD 磁盘 (GB)
Compute Engine API 承诺的 M3 CPU 数
Compute Engine API 承诺的内存优化 CPU 数
Compute Engine API 承诺的 N2 CPU 数
Compute Engine API 承诺的 N2D CPU 数
Compute Engine API 承诺的 T2D CPU 数
Compute Engine API CPU
Compute Engine API 每个虚拟机系列的 CPU 数
Compute Engine API 跨项目网络服务项目数
Compute Engine API 每个 VPC 网络的自定义静态路由数
Compute Engine API 外部直通式网络负载均衡器后端服务
Compute Engine API 外部直通式网络负载均衡器转发规则
Compute Engine API 外部协议转发规则
Compute Engine API 防火墙规则
Compute Engine API 转发规则
Compute Engine API 全球外部托管式后端服务
Compute Engine API 全球外部托管式转发规则数
Compute Engine API 全球外部代理 LB 后端服务数
Compute Engine API 全球内部 Traffic Director 后端服务数
Compute Engine API 每个 GPU 系列的 GPU 数量
Compute Engine API GPU 数(所有区域)
Compute Engine API 健康检查
Compute Engine API 图片
Compute Engine API 使用中的 IP 地址数
Compute Engine API 正在使用的区域级外部 IPv4 地址
Compute Engine API 正在使用的快照时间表
Compute Engine API 实例组
Compute Engine API 实例模板
Compute Engine API 每个对等互连组的实例数
Compute Engine API 每个 VPC 网络的实例数
Compute Engine API 内部 IP 地址
Compute Engine API 内部直通式网络负载均衡器后端服务数
Compute Engine API 每个对等互连组的内部直通式网络负载均衡器的转发规则数
Compute Engine API 每个 VPC 网络的内部直通式网络负载均衡器转发规则数
Compute Engine API 每个对等互连组的 IP 别名数
Compute Engine API 每个 VPC 网络的 IP 别名数
Compute Engine API 每个虚拟机系列的本地 SSD 磁盘 (GB)
Compute Engine API M1 CPU 数
Compute Engine API M2 CPU 数
Compute Engine API M3 CPU 数
Compute Engine API 托管实例组
Compute Engine API N2 CPU
Compute Engine API N2D CPU
Compute Engine API 网络端点组
Compute Engine API 网络防火墙政策
Compute Engine API 网络负载均衡安全政策规则属性数
Compute Engine API 网络负载均衡安全政策数
Compute Engine API 网络数
Compute Engine API NVIDIA A2 CPU 数
Compute Engine API 每个 VPC 网络的对等互连数
Compute Engine API Persistent Disk IOPS
Compute Engine API 永久性磁盘(固态硬盘,单位为 GB)
Compute Engine API 永久性磁盘(标准,单位为 GB)
Compute Engine API 可抢占的 CPU
Compute Engine API 抢占式本地 SSD (GB)
Compute Engine API 抢占式 NVIDIA A100 80GB GPU
Compute Engine API 抢占式 NVIDIA A100 GPU
Compute Engine API 抢占式 NVIDIA H100 GPU
Compute Engine API 抢占式 NVIDIA H100 MEGA GPU
Compute Engine API 抢占式 NVIDIA K80 GPU
Compute Engine API 抢占式 NVIDIA L4 GPU
Compute Engine API 抢占式 NVIDIA L4 虚拟工作站 GPU
Compute Engine API 抢占式 NVIDIA P100 GPU
Compute Engine API 抢占式 NVIDIA P100 虚拟工作站 GPU
Compute Engine API 抢占式 NVIDIA P4 GPU
Compute Engine API 抢占式 NVIDIA P4 虚拟工作站 GPU
Compute Engine API 抢占式 NVIDIA T4 GPU
Compute Engine API 抢占式 NVIDIA T4 虚拟工作站 GPU
Compute Engine API 抢占式 NVIDIA V100 GPU
Compute Engine API 公开通告前缀
Compute Engine API 区域外部代管式后端服务
Compute Engine API 每个 VPC 网络每个区域的区域级外部托管式转发规则数
Compute Engine API 区域级实例模板数
Compute Engine API 区域内部代管式后端服务
Compute Engine API 区域级内部 Traffic Director 后端服务数
Compute Engine API 区域托管实例组
Compute Engine API 区域级安全政策数
Compute Engine API 具有高级匹配条件的区域级安全政策规则数
Compute Engine API 区域级目标 TCP 代理数
Compute Engine API 路由器
Compute Engine API 路线
Compute Engine API 安全政策
Compute Engine API 安全政策规则
Compute Engine API 安全政策规则语言规则
Compute Engine API 快照
Compute Engine API SSL 证书
Compute Engine API 静态 BYOIP IP 地址数
Compute Engine API 静态 IP 地址
Compute Engine API 每个对等互连组的子网范围数
Compute Engine API 每个 VPC 网络的子网范围数
Compute Engine API T2A CPU
Compute Engine API T2D CPU 数
Compute Engine API 目标 HTTP 代理
Compute Engine API 目标 HTTPS 代理
Compute Engine API 目标 SSL 代理
Compute Engine API 目标 TCP 代理
Compute Engine API 目标 VPN 网关
Compute Engine API 预留的本地 SSD 磁盘总空间 (GB)
Compute Engine API 网址映射
Compute Engine API 虚拟机实例
Compute Engine API VPN 网关
Compute Engine API VPN 隧道
Connect Gateway API 每分钟的网关连接请求数
Dialogflow API 每分钟的所有其他请求数
Filestore API 每个区域的备份数
Filestore API 每个区域的基本 HDD(标准)容量 (GB)
Filestore API 每个区域的基本 SSD(高级)容量 (GB)
Filestore API 每个区域的可用区级和区域级 1-10 TiB(企业)容量 (GB)
Filestore API 每个区域的可用区级和区域级 10-100 TiB(大规模)容量 (GB)
Google Cloud Memorystore for Redis API 每个区域的总 Redis 容量 (GB)
Google Cloud Memorystore for Redis API 每个区域每个项目的 Redis 集群总单位数
Memorystore API 每个区域每个项目的 Memorystore 总单位数
Vertex AI API 每个区域的自定义模型部署 CPU 数
Vertex AI API 每个区域的自定义模型部署 Nvidia T4 GPU 数
Vertex AI API 每个区域的自定义模型训练 Nvidia T4 GPU 数
Vertex AI API 每个项目每个基本模型每分钟的内容生成请求数
Vertex AI API

每个项目每个基本模型每分钟的区域级在线预测请求数

注意:如需查看可用维度的完整列表,请在 Google Cloud 控制台中展开此条目。

Vertex AI API 每个区域每分钟的资源管理 (CRUD) 请求数
Vertex AI API 每个区域的受限映像训练 TPU V3 Pod 核心数

启用配额调整工具

如需启用配额调整工具,您必须具有以下 IAM 权限:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

如需为 Google Cloud 控制台项目启用配额调整工具,请选择相应的标签页并按照说明操作:

控制台

如需通过 Google Cloud 控制台为 Google Cloud 项目启用配额调整工具,请按照以下步骤操作:

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:

    进入“配额和系统限制”

  2. 点击配置标签页。
  3. 点击启用切换开关。

状态列显示已启用时,配额调整工具会监控您的资源用量,并在资源用量接近配额值时发出配额调整请求。

REST

  1. 如需使用 REST API 在您的 Google Cloud 项目中启用配额调整工具(预览版),请发出 HTTP 请求以更新配额调整工具设置:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. 在请求正文中,指定配额调整工具设置资源,并将 enablement 字段设置为 ENABLED。您也可以指定 ETag,但这是可选的:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    替换以下内容:

    • PROJECT_ID_OR_NUMBER:要为其启用配额调整工具的项目的项目 ID 或项目编号。
    • OPTIONAL_ETAG:配额调整工具设置的可选 ETag 字符串。

    这会将启用状态更新为 enabled

gcloud

如需使用 gcloud CLI 在 Google Cloud 项目上启用配额调整工具(预览版),请按以下步骤操作:

  1. 使用 gcloud CLI 进行身份验证:

    gcloud auth login
    
  2. 启用配额调整工具设置:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    PROJECT_ID_OR_NUMBER 替换为要为其启用配额调整工具的项目的项目 ID 或项目编号。

  3. 验证启用状态:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    只要您拥有所需权限,这将返回状态为 enabled

查看配额调整请求

如需查看配额调整请求,您必须具有以下 IAM 权限:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

如需查看配额调整工具发出的配额调整请求,请执行以下操作:

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:

    进入“配额和系统限制”

  2. 点击配额增加请求标签页。增加请求视图会显示项目的增加请求,包括手动请求的增加和由配额调整工具发出的请求。
  3. 点击过滤条件字段。
  4. 从菜单中选择类型,然后输入 Auto。这会过滤配额调整工具发出的请求。

设置配额调整工具提醒

如需接收配额调整工具发出的提醒,请执行以下操作:

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:

    进入“配额和系统限制”

  2. 点击配置标签页。
  3. 点击创建提醒
  4. 选择以下一个或两个提醒模板:
    1. 每当配额调整工具为项目发出配额调整请求时,配额调整工具的所有调整都会发送提醒。
    2. 仅当配额调整工具尝试提高配额值但无法成功执行此操作时,配额调整工具错误和失败才会发出提醒。
  5. 可选:点击显示选项,调整提醒之间的最短间隔的默认值以及突发事件自动关闭时长的默认值。
  6. 选择用于接收提醒的通知渠道。如需调整通知渠道设置或创建新的通知渠道,请点击管理通知渠道
  7. 点击创建

修改或删除配额调整工具提醒

您可以在Google Cloud 控制台中修改或删除配额调整工具提醒:

  1. 前往 Cloud Monitoring 控制台中的政策页面。

    转到“政策”

  2. 搜索配额调整工具提醒政策。配额调整工具提醒政策具有以下名称:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. 在显示配额调整工具提醒政策的行中,点击 查看更多

  4. 点击修改删除

停用配额调整工具

如需停用配额调整工具,您必须具有以下 IAM 权限:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

如需为 Google Cloud 控制台项目停用配额调整工具,请选择相应的标签页并按照说明操作:

控制台

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 配额和系统限制页面:

    进入“配额和系统限制”

  2. 点击配置标签页。
  3. 点击启用切换开关。切换开关会变为灰色。

当切换开关变为灰色并且状态列显示为未启用时,配额调整工具将不再监控您的用量,也不会再发出配额调整请求。

REST

  1. 如需使用 REST API 在您的 Google Cloud 项目中停用配额调整工具(预览版),请发出 HTTP 请求以更新配额调整工具设置:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. 在请求正文中,指定配额调整工具设置资源,并将 enablement 字段设置为 DISABLED。您也可以指定 ETag,但这是可选的:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    替换以下内容:

    • PROJECT_ID_OR_NUMBER:要为其停用配额调整工具的项目的项目 ID 或项目编号。
    • OPTIONAL_ETAG:配额调整工具设置的可选 ETag 字符串。

    这会将启用状态更新为 disabled

gcloud

如需使用 gcloud CLI 在 Google Cloud 项目上停用配额调整工具(预览版),请按以下步骤操作:

  1. 向 gcloud CLI 进行身份验证:

    gcloud auth login
    
  2. 停用配额调整工具设置:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    PROJECT_ID_OR_NUMBER 替换为要为其停用配额调整工具的项目的项目 ID 或项目编号。

  3. 验证启用状态:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    只要您拥有所需权限,这将返回状态为 disabled

排查配额增加请求遭拒问题

配额调整工具发起的配额增加请求可能会被拒绝。有时,当 Google Cloud 无法将特定项目、资源或区域的配额增加到超过某一特定值时,就会发生这种情况。不过,在这些情况下,您还是可以手动申请增加配额。

如需在配额调整工具发起的配额调整请求被拒绝时接收通知,请设置配额调整工具提醒