分配配额


本文档列出了适用于 Compute Engine 的分配配额

分配配额

分配配额(也称为资源配额)用于定义项目有权访问的资源数量。出于各种目的,Compute Engine 会对资源用量实施分配配额限制。例如,配额有助于保护 Google Cloud 用户群体,避免出现意外的用量激增。Google Cloud 还提供免费试用配额,可为项目提供一定用量,以便您免费试用 Google Cloud。

并非所有项目的配额都完全相同。随着您的 Google Cloud 使用量逐步增加,您的配额可能会相应地增加。如果您预计自己的用量即将显著增加,可以在 Google Cloud 控制台的配额页面中事先申请调整配额。

如需了解 Compute Engine API 速率限制配额的具体信息,请参阅 API 配额

配额和资源可用性

分配配额是您可以创建的特定类型资源的最大数量(如果这些资源的可用数量足够)。配额不能保证资源始终可用。如果资源不可用,或您选择的区域已无富余资源,您就无法创建该类型的资源,即使您的区域或项目中有剩余配额也是如此。例如,您可能仍有用于在 us-central1 中创建外部 IP 地址的配额,但该区域中可能没有可用的 IP 地址。

类似地,即使您有区域级配额,在特定可用区内也可能无法使用某项资源。例如,您可能仍有在区域 us-central1 中创建虚拟机实例的配额,但如果可用区 us-central1-a 的资源已用尽,您可能无法在该可用区创建虚拟机实例。在这种情况下,请尝试在另一个可用区(例如 us-central1-f)中创建该资源。如需详细了解在可用区级资源用尽时您可采用的方案,请参阅排查资源可用性问题的文档。

分配配额

在规划虚拟机实例需求时,您应该考虑多种配额,这些配额会影响您可以创建的虚拟机实例数量。

区域和全球配额

虚拟机配额是在区域级进行管理的。虚拟机实例、实例组、磁盘配额和 CPU 可以由该区域中的任何虚拟机使用,无论虚拟机在哪个可用区。例如,CPU 配额属于区域性配额,因此每个区域有不同的限制和用量。如需在 us-central1 区域中的任一可用区内启动一个 n2-standard-16 实例,您需要在 us-central1 中有足够的配额(至少 16 个 CPU)。

创建防火墙、负载均衡器、网络和 VPN 需要有网络和负载均衡配额。这些是不受具体区域影响的全球配额。所有区域都可以使用全球配额。例如,分配给负载均衡器和 HTTP 和 HTTPS 代理的使用中和静态外部 IP 地址会使用全球配额。

虚拟机实例

虚拟机实例配额是一种区域配额,会限制指定区域中可存在的虚拟机实例的数量(无论虚拟机是否在运行)。此配额会显示在 Google Cloud 控制台的配额页面上。Compute Engine 会自动将此配额设置为常规 CPU 配额的 10 倍。您无需申请此配额。如果您需要增加配额以容纳更多虚拟机实例,则应该申请更多 CPU,因为增加 CPU 可以增加虚拟机实例配额。此配额适用于正在运行和未运行的虚拟机,以及常规实例和抢占式实例。

  1. 在 Google Cloud 控制台中,转到配额页面。

    转到“配额”

  2. 过滤条件列表中,选择以下选项:

    • 对于服务,请选择 Compute Engine API
    • 类型部分,选择配额
    • 对于名称,请选择虚拟机实例
    • 可选:对于指标,选择您要过滤的任何其他CPU 或已提交 CPU 配额名称
  3. 可选:要按地区对表格进行排序,请点击维度(例如位置)列。

  4. 选择要更改配额的区域。

  5. 点击 修改

  6. 填写表单。

  7. 点击提交请求

实例组

为了使用实例组,您必须具有实例组使用的所有资源的可用配额(例如 CPU 配额)以及实例组资源本身的可用配额。根据您创建的实例组类型,系统将相应地使用以下实例组资源用量配额:

服务类型 服务配额
区域(多可用区)托管式实例组 Regional instance group managers
可用区(单可用区)托管式实例组 以下两者:
  • Instance group managers
  • Instance groups
非代管式(单可用区)实例组 Instance groups
区域(多可用区)自动扩缩器 Regional autoscalers
可用区(单可用区)自动扩缩器 Autoscalers

磁盘配额

下述永久性磁盘、Hyperdisk 和本地 SSD 配额按区域实施:

  • Hyperdisk Balanced Capacity (GB)。此配额是您可以在某个区域中创建的 Hyperdisk Balanced 磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为 HDB-TOTAL-GB
  • Hyperdisk Balanced Throughput (MB/s)。此配额是您可以为某个可用区中的所有 Hyperdisk Balanced 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中,此配额称为 HDB-TOTAL-THROUGHPUT
  • Hyperdisk Balanced IOPS。此配额是您可以为某个可用区中的所有 Hyperdisk Balanced 磁盘预配的 IOPS 总量。在 gcloud CLI 和 API 中,此配额称为 HDB-TOTAL-IOPS
  • Hyperdisk ML Capacity (GB)。此配额是您可以在某个区域中创建的 Hyperdisk ML 磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为 HDML-TOTAL-GB
  • Hyperdisk ML Throughput (MB/s)。此配额是您可以为某个区域中的所有 Hyperdisk ML 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中,此配额称为 HDML-TOTAL-THROUGHPUT
  • Persistent disk standard (GB)。此配额是可在一个区域中创建的标准永久性磁盘的总大小。在 gcloud CLI 和 API 中,此配额称为 DISKS_TOTAL_GB。此配额还适用于:
    • 区域标准永久性磁盘,但由于区域级永久性磁盘会在一个区域内的两个可用区中复制,因此每 GB 消耗的配额将翻倍。
    • 如果您在停止或暂停虚拟机时选择保留本地 SSD 数据,系统会消耗等量的标准永久性磁盘配额。
  • Persistent disk SSD (GB)。此配额是可在一个区域中创建的 SSD 永久性磁盘卷的总大小。在 gcloud CLI 和 API 中,此配额称为 SSD_TOTAL_GB。此配额与本地 SSD 磁盘配额是分开计量的。此配额适用于以下磁盘类型:

    • 可用区级和区域级 SSD 永久性磁盘
    • 可用区级和区域级平衡永久性磁盘

    区域级永久性磁盘在同一区域的两个可用区中进行复制,因此每 GiB 消耗的配额翻倍。

  • Persistent Disk IOPS。此配额是可在一个区域中创建的 Extreme 永久性磁盘卷每秒的 I/O 操作总数。在 gcloud CLI 和 API 中,此配额称为 PD-EXTREME-TOTAL-PROVISIONED-IOPS。此配额与 Google Cloud Hyperdisk 的 IOPS 配额是分开计量的。

  • Local SSD per machine family (GB)。此配额是根据每个虚拟机的机器类型,可以挂接到某个区域中虚拟机的本地 SSD 磁盘的总大小。本地 SSD 是一种快速的临时磁盘,应该用于容错能力较高的暂存、本地缓存或处理作业,因为这类磁盘在虚拟机实例重启时可能会丢失数据。

    本地 SSD 磁盘以 375 GiB 或 3 TiB 为增量销售,具体取决于机器类型。此外,可挂接到单个虚拟机的本地 SSD 磁盘的最大数量取决于机器类型。本地 SSD 磁盘的最大数量和每个本地 SSD 磁盘的大小会限制您可以为虚拟机分配的本地 SSD 磁盘容量总量。在 gcloud CLI 和 API 中,此上限称为 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY 配额。

    对于 A3 和 A2 Ultra 虚拟机,您无需申请此配额,因为本地 SSD 会自动添加到这些虚拟机中。不过,您需要为其他加速器优化虚拟机申请 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY

存储池配额

就容量而言,采用高级容量预配的 Hyperdisk 存储池具有以下配额(以 GB [或 1,000 MB] 为单位):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB):在具有高级容量预配功能的 Hyperdisk Balanced 存储池中,您可以在每个区域预留的磁盘空间总量。

    • gcloud CLI 和 API:HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • 指标:compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB):在具有高级容量预配功能的 Hyperdisk Throughput 存储池中,您可以在每个区域预留的磁盘空间总量。

    • gcloud CLI 和 API:HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • 指标:compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

对于性能,具有高级性能预配的 Hyperdisk 存储池具有以下配额:

  • Hyperdisk Balanced Storage Pools Advanced IOPS:您可以在某个区域的 Hyperdisk Balanced 存储池中预留的总 IOPS,并提供高级性能预配。

    • gcloud CLI 和 API:HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • 指标:compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s):您可以在某个区域的 Hyperdisk Balanced 存储池中预留的总吞吐量(使用高级性能预配)。

    • gcloud CLI 和 API:HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • 指标:compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s):您可以在某个区域的 Hyperdisk 吞吐量存储池中预留的总吞吐量(使用高级性能预配)。

    • gcloud CLI 和 API:HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • 指标:compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

CPU 配额限制

CPU 配额是您在某个区域内的所有虚拟机实例中的虚拟 CPU 总数。CPU 配额适用于正在运行的虚拟机和预留的虚拟机资源。预定义虚拟机和抢占式虚拟机都会消耗此配额。

为了帮助保护 Compute Engine 系统和其他用户的安全,一些新账号和项目还具有 CPUs (All Regions) 全球配额,这种配额适用于所有区域,并按您在所有区域中的所有 vCPU 的总数来计量。

例如,如果在单个区域(如 us-central1)中剩余 48 个 vCPU,但 CPUs (All Regions) 配额只剩余 32 个 vCPU,那么您只能在 us-central1 区域中启动 32 个 vCPU,即使该区域还有剩余配额也是如此。这是因为您达到 CPU (All Regions) 配额的限制,需要删除现有的实例才能启动新实例。

E2 和 N1 机器类型共用一个 CPU 配额池。除非另有说明,否则所有其他机器类型都具有唯一的独立 CPU 配额池。

如果您的虚拟机使用的是承诺使用折扣,您必须先购买承诺使用折扣配额,然后才能购买承诺使用折扣合约。

机器类型 配额池 CPU 配额名称 承诺 CPU 配额名称
N1 共享池 CPUS Committed_CPUS
E2 共享池 CPUS Committed_CPUS
N2 独立池 N2_CPUS Committed_N2_CPUS
N4 独立池 CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D 独立池 N2D_CPUS Committed_N2D_CPUS
T2D 独立池 T2D_CPUS Committed_T2D_CPUS
T2A 独立池 T2A_CPUS 不适用于 T2A
Z3 独立池 CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 独立池 M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 独立池 M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 独立池 M3_CPUS Committed_M3_CPUS
X4 独立池 CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 独立池 CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 独立池 C2_CPUS Committed_C2_CPUS
C2D 独立池 C2D_CPUS Committed_C2D_CPUS
C3 独立池 C3_CPUS Committed_C3_CPUS
C3D 独立池 CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 独立池 CPUS_PER_VM_FAMILY Committed_C4_CPUS
A2* 独立池 A2_CPUS Committed_A2_CPUS
A3 不适用于 A3 不适用于 A3 不适用于 A3
G2 不适用于 G2 不适用于 G2 不适用于 G2
抢占式虚拟机 共享池 PREEMPTIBLE_CPUS 不适用于抢占式虚拟机

*对于 A2 虚拟机,您无需申请 CPU 配额。如果您有足够的 NVIDIA A100 GPU 配额,那么您只需满足此条件即可创建这些虚拟机。

对于 A3 和 G2 虚拟机,CPU 配额不适用。如果您分别拥有所需的 NVIDIA H100 和 L4 GPU 配额,则只需创建这些虚拟机。

GPU 配额

与虚拟 CPU 配额类似,GPU 配额是指您在一个区域内的所有虚拟机实例中的虚拟 GPU 总数。GPU 配额适用于正在运行的虚拟机和预留的虚拟机资源。预定义虚拟机和抢占式虚拟机都会消耗此配额。

若要确保您的项目中有足够的 GPU 可用,或者需要申请增加配额,请查看配额页面。此外,新账号和项目还具有一个 GPU 全球配额,该配额适用于所有区域。

申请 GPU 配额时,您必须为要在每个区域中创建的 GPU 型号申请一个配额,并根据所有区域中所有类型的 GPU 总数另外申请一个全球配额 (GPUs (all regions))。申请抢占式 GPU 配额可使用这些资源。

机器类型 GPU 类型 GPU 配额名称 GPU 系列 承诺 GPU 配额名称 虚拟工作站 抢占式 GPU 抢占式 GPU 虚拟工作站
A3 Mega H100 80GB Mega GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS 不适用 PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS 不适用
A3 High H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS 不适用 PREEMPTIBLE_NVIDIA_H100_GPUS 不适用
A2 标准 A100 40GB NVIDIA_A100_GPUS 不适用 COMMITTED_NVIDIA_A100_GPUS 不适用 PREEMPTIBLE_NVIDIA_A100_GPUS 不适用
A2 Ultra A100 80GB NVIDIA_A100_80GB_GPUS 不适用 COMMITTED_NVIDIA_A100_80GB_GPUS 不适用 PREEMPTIBLE_NVIDIA_A100_80GB_GPUS 不适用
G2 L4 NVIDIA_L4_GPUS 不适用 COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS 不适用 COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS 不适用 COMMITTED_NVIDIA_V100_GPUS 不适用 PREEMPTIBLE_NVIDIA_V100_GPUS 不适用
P100 NVIDIA_P100_GPUS 不适用 COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS 不适用 COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

抢占式配额

您可以为 Preemptible CPUsPreemptible GPUsPreemptible Local SSDs (GB) 申请抢占式配额。这些抢占式配额适用于以下虚拟机的 CPU、GPU 和本地 SSD:

如果您的项目没有抢占式配额,并且您从未申请过抢占式配额,则这些资源会使用标准配额。不过,在您为项目申请抢占式配额后,适用的资源只能使用抢占式配额,而无法恢复使用标准配额。

申请抢占式配额有助于您为临时资源提供单独的配额,从而提高配额的可获取性。在 Compute Engine 授予您某个区域的抢占式配额后,所有适用的资源都会自动消耗抢占式配额。如果此配额用尽,则您必须为这些资源申请抢占式配额。

外部 IP 地址

对于需要通过公共互联网直接访问的虚拟机,您必须拥有足够的外部 IP 地址分配给每一个虚拟机。区域 IP 配额用于为该区域中的虚拟机分配 IPv4 地址。全球 IP 配额用于为全球网络资源(例如负载均衡器)分配 IPv4 地址。Google Cloud 会根据您的需求提供不同类型的 IP 地址。如需了解费用,请参阅外部 IP 地址价格。如需了解配额详情,请参阅配额和限制

  • 使用中的外部 IP 地址。包括正在由某项资源使用的临时和静态 IP 地址。

  • 静态外部 IP 地址:为您的资源预留的外部 IP 地址,机器重启后保持不变。您可以在 DNS 和域名服务商处注册这些地址,以提供方便用户使用的地址,例如 www.example-site.com。

  • 静态内部 IP 地址:利用静态内部 IP 地址,您可以预留子网中配置的 IP 范围内的内部 IP 地址,然后根据需要将这些预留的内部地址分配给资源。

配额发布

有时,Google Cloud 会更改资源和 API 的默认配额。这些更改逐步进行。在新的默认配额发布期间,Google Cloud 控制台中显示的最大配额可能并不反映您可以使用的实际最大配额。

例如,假设 Google Cloud 将防火墙规则的默认最大配额从 200 更改为 300,并且您可以使用 Google Cloud 控制台查看配额,那么您可能会看到新的配额为 300,即使您的实际配额为 200(直到发布完成)。

如需了解持续配额发布,请参阅已知问题。如果未说明任何问题,则不会进行任何配额发布。

如果配额发布正在进行,并且您希望确认可用的实际最大配额,请使用 Google Cloud CLI 检查配额。 如果您需要的配额超出您有权使用的配额,请提交增加配额请求

后续步骤