分配配额

本文档列出了适用于 Compute Engine 的分配配额。

分配配额

分配配额（也称为资源配额）用于定义项目有权访问的资源数量。出于各种目的，Compute Engine 会对资源用量实施分配配额限制。例如，配额可避免出现意料之外的用量突增，从而为 Google Cloud 用户社区提供保护。

Google Cloud 还提供免费试用配额，授予您对项目的有限访问权限，以便您免费试用 Google Cloud。

并非所有项目的配额都完全相同。随着Google Cloud 用量逐步增加，您的配额可能会相应地增加。如果您预计用量即将显著增加，可以在Google Cloud 控制台的配额页面中主动申请调整配额。

如需了解 Compute Engine API 速率限制配额的具体信息，请参阅 API 配额。

配额和资源可用性

分配配额是您可以创建的特定类型资源的最大数量（如果这些资源的可用数量足够）。配额不能保证资源始终可用。如果资源不可用，或您选择的区域已无富余资源，您就无法创建该类型的资源，即使您的区域或项目中有剩余配额也是如此。例如，您可能仍有用于在 us-central1 中创建外部 IP 地址的配额，但该区域中可能没有可用的 IP 地址。

类似地，即使您有区域级配额，在特定可用区内也可能无法使用某项资源。例如，您可能仍有在区域 us-central1 中创建虚拟机实例的配额，但如果可用区 us-central1-a 的资源已用尽，您可能无法在该可用区创建虚拟机实例。在这种情况下，请尝试在另一个可用区（例如 us-central1-f）中创建该资源。如需详细了解在可用区级资源用尽时您可采用的方案，请参阅排查资源可用性问题的文档。

分配配额

在规划虚拟机实例需求时，您应该考虑多种配额，这些配额会影响您可以创建的虚拟机实例数量。

区域和全球配额

虚拟机配额是在区域级进行管理的。虚拟机实例、实例组、磁盘配额和 CPU 可以由该区域中的任何虚拟机使用，无论虚拟机在哪个可用区。例如，CPU 配额属于区域性配额，因此每个区域有不同的限制和用量。如需在 us-central1 区域中的任一可用区内启动一个 n2-standard-16 实例，您需要在 us-central1 中有足够的配额（至少 16 个 CPU）。

创建防火墙、负载均衡器、网络和 VPN 需要有网络和负载均衡配额。这些是不受具体区域影响的全球配额。所有区域都可以使用全球配额。例如，分配给负载均衡器以及 HTTP 和 HTTPS 代理的使用中静态外部 IP 地址使用全球配额。

虚拟机实例

虚拟机实例配额是一种区域配额，会限制指定区域中可存在的虚拟机实例的数量（无论虚拟机是否在运行）。此配额会显示在 Google Cloud 控制台的配额页面上。Compute Engine 会自动将此配额设置为常规 CPU 配额的 10 倍。您无需申请此配额。如果您需要增加配额以容纳更多虚拟机实例，则应该申请更多 CPU，因为增加 CPU 可以增加虚拟机实例配额。此配额适用于正在运行和未运行的虚拟机，以及常规实例和抢占式实例。

在 Google Cloud 控制台中，进入配额页面。

转到“配额”
在 过滤条件列表中，选择以下选项：
- 在服务部分，选择 Compute Engine API。
- 在类型部分，选择配额。
- 在名称部分，选择虚拟机实例。
- 可选：在指标部分，选择您要过滤的任何其他 CPU 或承诺的 CPU 配额名称。
可选：如需按区域对表进行排序，请点击维度（例如位置）列。
选择要您更改其配额的区域。
点击修改。
填写表单。
点击提交请求。

实例组

为了使用实例组，您必须具有实例组使用的所有资源的可用配额（例如 CPU 配额）以及实例组资源本身的可用配额。根据您创建的实例组类型，系统将相应地使用以下实例组资源用量配额：

服务类型	服务配额
区域（多可用区）托管式实例组	`Regional instance group managers`
可用区（单可用区）托管式实例组	以下两者： `Instance group managers` `Instance groups`
非代管式（单可用区）实例组	`Instance groups`
区域（多可用区）自动扩缩器	`Regional autoscalers`
可用区（单可用区）自动扩缩器	`Autoscalers`

磁盘配额

以下永久性磁盘、Hyperdisk 和本地 SSD 配额按区域应用：

Hyperdisk Balanced Capacity (GB)。此配额是您可以在一个区域中创建的 Hyperdisk Balanced 磁盘的总大小。在 gcloud CLI 和 API 中，此配额称为 HDB-TOTAL-GB。
Hyperdisk Balanced Throughput (MB/s)。此配额是您可以为一个可用区中的所有 Hyperdisk Balanced 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中，此配额称为 HDB-TOTAL-THROUGHPUT。
Hyperdisk Balanced IOPS。此配额是您可以为一个可用区中的所有 Hyperdisk Balanced 磁盘预配的总 IOPS。在 gcloud CLI 和 API 中，此配额称为 HDB-TOTAL-IOPS。
Hyperdisk ML Capacity (GB)。此配额是您可以在一个区域中创建的 Hyperdisk ML 磁盘的总大小。在 gcloud CLI 和 API 中，此配额称为 HDML-TOTAL-GB。
Hyperdisk ML Throughput (MB/s)。此配额是您可以为一个区域中的所有 Hyperdisk ML 磁盘预配的总吞吐量。在 gcloud CLI 和 API 中，此配额称为 HDML-TOTAL-THROUGHPUT。
Persistent disk standard (GB)。此配额是您可以在一个区域中创建的标准永久性磁盘的总大小。在 gcloud CLI 和 API 中，此配额称为 DISKS_TOTAL_GB。此配额还适用于：
- 区域级标准永久性磁盘，但由于区域级永久性磁盘在一个区域内的两个可用区中复制，因此每 GiB 使用的配额会翻倍。
- 如果您在停止或暂停虚拟机时选择保留本地 SSD 数据，系统会使用等量的标准永久性磁盘配额。
Persistent disk SSD (GB)。此配额是可在一个区域中创建的 SSD 支持的永久性磁盘卷的总大小。在 gcloud CLI 和 API 中，此配额称为 SSD_TOTAL_GB。此配额与本地 SSD 磁盘配额是分开计量的。此配额适用于以下磁盘类型：
- 可用区级和区域级 SSD 永久性磁盘
- 可用区级和区域级平衡永久性磁盘
由于区域级永久性磁盘在一个区域内的两个可用区中复制，因此每 GiB 使用的配额会翻倍。
Persistent Disk IOPS。此配额是可在一个区域中创建的极端永久性磁盘卷的每秒 I/O 操作总数。在 gcloud CLI 和 API 中，此配额称为 PD-EXTREME-TOTAL-PROVISIONED-IOPS。此配额与 Google Cloud Hyperdisk 的 IOPS 配额是分开计量的。
Local SSD per machine family (GB)。此配额是根据每个虚拟机的机器类型，可以挂接到一个区域中虚拟机的本地 SSD 磁盘的总大小。本地 SSD 是一种快速的临时磁盘，应该用于容错能力较高的暂存、本地缓存或处理作业，因为这类磁盘在虚拟机实例重启时可能会丢失数据。

本地 SSD 磁盘以 375 GiB 或 3 TiB 为增量出售，具体取决于机器类型。可挂接到单个虚拟机的本地 SSD 磁盘数量上限也取决于机器类型。本地 SSD 磁盘的数量上限和每个本地 SSD 磁盘的大小会限制您可以为虚拟机分配的本地 SSD 磁盘总容量。在 gcloud CLI 和 API 中，此限制称为 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY 配额。

注意：LOCAL_SSD_TOTAL_GB 配额已弃用。如需查看本地 SSD 配额用量和限制，您必须在 Cloud Monitoring 信息中心、提醒和查询中使用配额指标 compute.googleapis.com/local_ssd_total_storage_per_vm_family^{Beta 版}。如需了解详情，请参阅查看和管理本地 SSD 配额。

对于 A4X、A4、A3 Ultra、A3 Mega、A3 High、A3 Edge、A2 Ultra 和 G4 机器类型，您无需申请此配额，因为本地 SSD 会自动添加到使用这些机器类型创建的虚拟机。但是，您需要为其他加速器优化虚拟机申请 LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY。

存储池配额

对于容量，采用高级容量预配的 Hyperdisk 存储池具有以下配额（以 GB [或 1,000 MB] 为单位）：

Hyperdisk Balanced Storage Pools Advanced Capacity (GB)：您可以在采用高级容量预配的 Hyperdisk Balanced 存储池中为每个区域预留的磁盘可用空间总量。
- gcloud CLI 和 API：HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- 指标：compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)：您可以在采用高级容量预配的 Hyperdisk Throughput 存储池中为每个区域预留的磁盘可用空间总量。
- gcloud CLI 和 API：HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- 指标：compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

对于性能，采用高级性能预配的 Hyperdisk 存储池具有以下配额：

Hyperdisk Balanced Storage Pools Advanced IOPS：您可以在采用高级性能预配的 Hyperdisk Balanced 存储池中为一个区域预留的总 IOPS。
- gcloud CLI 和 API：HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- 指标：compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)：您可以在采用高级性能预配的 Hyperdisk Balanced 存储池中为一个区域预留的总吞吐量。
- gcloud CLI 和 API：HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- 指标：compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)：您可以在采用高级性能预配的 Hyperdisk Throughput 存储池中为一个区域预留的总吞吐量。
- gcloud CLI 和 API：HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- 指标：compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

承诺和承诺资源的配额

承诺使用折扣 (CUD) 可帮助您节省 Compute Engine 使用费用。您可以通过购买承诺使用合约（也称为“承诺”）来享受这些折扣。您的承诺可以是基于资源的承诺（您承诺达到最低使用量），也可以是基于支出的承诺（您承诺为产品或服务支付最低金额）。

基于支出的承诺不需要任何配额，而基于资源的承诺需要配额。在您能为特定区域资源购买基于资源的承诺之前，您必须在该区域中拥有以下两项配额：

承诺。基于资源的承诺本身就是区域资源，因此您必须有可用的配额才能创建该区域资源。
承诺资源（内存除外）。这些是您在承诺中指定的资源。您必须在相应区域内拥有您要在承诺中指定的任何 vCPU、GPU 或本地 SSD 磁盘的承诺 SKU 的配额。

如需了解详情，请参阅承诺和承诺资源的配额。

CPU 配额限制

CPU 配额是您在某个区域内的所有虚拟机实例中的虚拟 CPU 总数。CPU 配额适用于正在运行的虚拟机和预留的虚拟机资源。预定义虚拟机和抢占式虚拟机都会消耗此配额。

为了帮助保护 Compute Engine 系统和其他用户的安全，一些新账号和项目还具有 CPUs (All Regions) 全球配额，这种配额适用于所有区域，并按您在所有区域中的所有 vCPU 的总数来计量。

例如，如果在单个区域（如 us-central1）中剩余 48 个 vCPU，但 CPUs (All Regions) 配额只剩余 32 个 vCPU，那么您只能在 us-central1 区域中启动 32 个 vCPU，即使该区域还有剩余配额也是如此。这是因为您达到 CPU (All Regions) 配额的限制，需要删除现有的实例才能启动新实例。

E2 和 N1 机器类型共用一个 CPU 配额池。除非另有说明，否则所有其他机器类型都具有唯一的独立 CPU 配额池。

下表列出了 Compute Engine 机器类型的配额名称。如果配额不适用于机器类型，系统会显示值 N/A，表示“不适用”。

机器类型	配额池	CPU 配额名称	承诺 CPU 配额名称
N1	共享池	`CPUS`	`Committed_CPUS`
E2	共享池	`CPUS`	`Committed_CPUS`
N2	独立池	`N2_CPUS`	`Committed_N2_CPUS`
N4	独立池	`CPUS_PER_VM_FAMILY`	`Committed_N4_CPUS`
N2D	独立池	`N2D_CPUS`	`Committed_N2D_CPUS`
T2D	独立池	`T2D_CPUS`	`Committed_T2D_CPUS`
T2A	独立池	`T2A_CPUS`	不适用于 T2A
Z3	独立池	`CPUS_PER_VM_FAMILY`	`Committed_Z3_CPUS`
M1	独立池	`M1_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M2	独立池	`M2_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M3	独立池	`M3_CPUS`	`Committed_M3_CPUS`
M4	独立池	`CPUS_PER_VM_FAMILY`	`Committed_M4_CPUS`
X4	独立池	`CPUS_PER_VM_FAMILY`	`Committed_X4_CPUS`
H4D（预览版）	独立池	`CPUS_PER_VM_FAMILY`	`Committed_H4D_CPUS`
H3	独立池	`CPUS_PER_VM_FAMILY`	`Committed_H3_CPUS`
C2	独立池	`C2_CPUS`	`Committed_C2_CPUS`
C2D	独立池	`C2D_CPUS`	`Committed_C2D_CPUS`
C3	独立池	`C3_CPUS`	`Committed_C3_CPUS`
C3D	独立池	`CPUS_PER_VM_FAMILY`	`Committed_C3D_CPUS`
C4	独立池	`CPUS_PER_VM_FAMILY`	`Committed_C4_CPUS`
C4A	独立池	`CPUS_PER_VM_FAMILY`	`Committed_C4A_CPUS`
A2^*	独立池	`A2_CPUS`	`Committed_A2_CPUS`
A4X^†	不适用于 A4X	不适用于 A4X	不适用于 A4X
A4^†	不适用于 A4	不适用于 A4	不适用于 A4
A3^†	不适用于 A3	不适用于 A3	不适用于 A3
G4^†	不适用于 G4	不适用于 G4	不适用于 G4
G2^†	不适用于 G2	不适用于 G2	不适用于 G2
抢占式虚拟机	共享池	`PREEMPTIBLE_CPUS`	不适用于抢占式虚拟机

^*如需创建 A2 虚拟机，您只需拥有所需的 NVIDIA A100 GPU 配额。您无需申请 CPU 配额。

^† 如需创建 A4X、A4、A3、G4 和 G2 虚拟机，您只需分别拥有所需的 NVIDIA B200、H200、H100、RTX PRO 6000 和 L4 GPU 配额即可。您无需申请 CPU 配额。

GPU 配额

如需确保您的项目中具有充足的 GPU，请查看 Google Cloud 控制台中的“配额”页面。如果您需要，请申请增加配额。新账号和项目还具有一个 GPU 全球配额，该配额适用于所有区域。

与虚拟 CPU 配额类似，您的 GPU 配额是指您在一个区域内您的所有虚拟机实例中的虚拟 GPU 总数。运行实例和预留会消耗 GPU 配额。您在创建标准实例、Spot 虚拟机（例如抢占式实例）、虚拟工作站或使用承诺使用折扣的实例时，可用的配额各不相同。

申请 GPU 配额时，为要在每个区域中创建的 GPU 型号申请一个配额。也根据所有区域中所有类型的 GPU 总数申请一个全球配额 (GPUs (all regions))。

下表列出了每种机器类型可用的 GPU 配额。

机器类型	GPU 类型	标准配额	承诺的配额	虚拟工作站配额	抢占式配额	抢占式虚拟工作站配额
A4X	GB200	不可用	`COMMITTED_NVIDIA_GB200_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_GB200_GPUS`	不可用
A4	B200	不可用	`COMMITTED_NVIDIA_B200_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_B200_GPUS`	不可用
A3 Ultra	H200	不可用	`COMMITTED_NVIDIA_H200_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_H200_GPUS`	不可用
A3 Mega	H100	`GPU_FAMILY:NVIDIA_H100_MEGA`	`COMMITTED_NVIDIA_H100_MEGA_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS`	不可用
A3 Edge 和 A3 High	H100	`GPU_FAMILY:NVIDIA_H100`	`COMMITTED_NVIDIA_H100_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_H100_GPUS`	不可用
A2 Ultra	A100 80GB	`NVIDIA_A100_80GB_GPUS`	`COMMITTED_NVIDIA_A100_80GB_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_A100_80GB_GPUS`	不可用
A2 标准	A100 40GB	`NVIDIA_A100_GPUS`	`COMMITTED_NVIDIA_A100_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_A100_GPUS`	不可用
G4	RTX PRO 6000	`GPU_FAMILY:NVIDIA_RTX_PRO_6000`	`COMMITTED_NVIDIA_RTX_PRO_6000_GPUS`	`NVIDIA_RTX_PRO_6000_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_RTX_PRO_6000_GPUS`	`PREEMPTIBLE_NVIDIA_RTX_PRO_6000_VWS_GPUS`
G2	L4	`GPU_FAMILY:NVIDIA_L4`	`COMMITTED_NVIDIA_L4_GPUS`	`NVIDIA_L4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_L4_GPUS`	`PREEMPTIBLE_NVIDIA_L4_VWS_GPUS`
N1	T4	`NVIDIA_T4_GPUS`	`COMMITTED_NVIDIA_T4_GPUS`	`NVIDIA_T4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_T4_GPUS`	`PREEMPTIBLE_NVIDIA_T4_VWS_GPUS`
N1	V100	`NVIDIA_V100_GPUS`	`COMMITTED_NVIDIA_V100_GPUS`	不可用	`PREEMPTIBLE_NVIDIA_V100_GPUS`	不可用
N1	P100	`NVIDIA_P100_GPUS`	`COMMITTED_NVIDIA_P100_GPUS`	`NVIDIA_P100_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P100_GPUS`	`PREEMPTIBLE_NVIDIA_P100_VWS_GPUS`
N1	P4	`NVIDIA_P4_GPUS`	`COMMITTED_NVIDIA_P4_GPUS`	`NVIDIA_P4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P4_GPUS`	`PREEMPTIBLE_NVIDIA_P4_VWS_GPUS`

抢占式配额

您可以为 Preemptible CPUs、Preemptible GPUs 和 Preemptible Local SSDs (GB) 资源申请抢占式配额。这些抢占式配额适用于以下虚拟机的 CPU、GPU 和本地 SSD：

如果您的项目没有抢占式配额，并且您从未申请过抢占式配额，则这些资源会使用标准配额。但是，在您的项目中申请抢占式配额后，适用的资源只能使用抢占式配额，而无法恢复为使用标准配额。

申请抢占式配额有助于您为临时资源提供单独的配额，从而提高配额的可获取性。在 Compute Engine 授予您某个区域的抢占式配额后，所有适用的资源都会自动使用抢占式配额。如果此配额用尽，您必须为这些资源申请抢占式配额。

外部 IP 地址

对于需要通过公共互联网直接访问的虚拟机，您必须拥有足够的外部 IP 地址分配给每一个虚拟机。区域级 IP 配额用于为该区域中的虚拟机分配 IPv4 或 IPv6 地址。IPv6 IP 地址使用的配额类型与 IPv4 IP 地址相同，但外部和内部 IPv6 静态地址除外，它们有自己的配额类型。

全球 IP 配额用于为全球网络资源（例如负载均衡器）分配 IPv4 地址。

Google Cloud 会根据您的需求提供不同类型的 IP 地址。如需了解费用，请参阅外部 IP 地址价格。如需了解配额详情，请参阅配额和限制。

静态 IP 地址。您可在项目的每个区域中预留的静态区域级外部 IPv4 地址的数量。
区域级静态外部 IPv6 地址范围：您可在项目的每个区域中预留的静态区域级外部 IPv6 地址范围的数量。
全球静态 IP 地址：为您的资源预留的外部 IP 地址，机器重启后保持不变。您可以使用 DNS 和域名提供商服务注册这些地址，以提供方便用户使用的地址，例如 www.example-site.com。
使用中的 IP 地址。您可以在项目中同时使用的静态和临时区域级外部 IP 地址的数量。
使用中的全球 IP 地址。您可以在项目中同时使用的静态和临时全球外部 IP 地址的数量。

注意：如果为多个转发规则分配了同一个 IP 地址，则Google Cloud 会将该地址的每次使用都计入 IN_USE_ADDRESSES 配额，而不是每个使用的 IP 地址对象只计一次。

配额发布

有时， Google Cloud 会更改资源和 API 的默认配额限制。这些更改逐步进行。在新的默认配额发布过程中， Google Cloud 控制台中显示的最大配额可能并不代表您当前可用的实际最大配额。您可以使用 Google Cloud 控制台或 Cloud Quotas API 查看正在进行的配额发布。

例如，假设 Google Cloud 将防火墙规则的默认最大配额从 200 更改为 300，当您在 Google Cloud 控制台查看配额时，可能会看到配额为 300，尽管实际配额仍为 200，直到发布完成。

如果配额发布正在进行，并且您希望确认可用的实际最大配额，请使用 Google Cloud CLI 检查配额。如果您需要的配额超出您有权使用的配额，请提交调整配额请求。

分配配额

分配配额

配额和资源可用性

分配配额

区域和全球配额

虚拟机实例

实例组

磁盘配额

存储池配额

承诺和承诺资源的配额

CPU 配额限制

GPU 配额

抢占式配额

外部 IP 地址

配额发布

后续步骤