服务配额模型

本页介绍了 Google Cloud 上服务配额管理模型。了解该配额模型对使用 Service Usage 配额管理功能很有帮助。如需了解一般信息,请参阅使用配额

服务的使用方是服务的使用应计入的项目、文件夹或组织。

指标和限制

配额指标是由服务定义的实体,用于说明服务的用量。配额指标可以计算具体实体(例如虚拟机实例),也可以计算临时实体(例如特定类型的 API 请求)。

配额限制是由服务定义的实体,用于说明配额指标如何限制使用方的用量。配额指标可能具有多个配额限制。配额限制有两种类型:速率限制和分配限制。速率限制会在指定的时间(例如一分钟或一天)后,重置。分配配额不会在一段时间后重置;相反,当不再使用资源时,必须明确释放它。

配额替换值

对于由服务所有者设置的所有使用方,每个配额限制都有一个默认值。可以通过配额替换值来更改此默认值。

服务所有者可以将配额替换值应用于特定使用方,以替换该使用方的默认值。这称为提供方替换值。例如,服务所有者可以应用提供方替换值,将更高配额作为合同的一部分授予特定客户。

使用方可以将配额替换值应用于他们自己的项目、文件夹或组织,以设置服务用量上限。这称为使用方替换值。例如,作为一项费用控制措施,使用方可以将使用方替换值应用于他们自己的项目,以防止预算超支。

如需将使用方替换值应用于您使用的服务,请使用 Service Usage API

如需将提供方替换值应用于您已拥有的服务的使用方,请使用 Service Consumer Management API

计算配额限制

以下公式计算使用方的配额限制:

if adminOverride is present,
  upperBound = adminOverride
else if producerOverride is present,
  upperBound = producerOverride
else
  upperBound = defaultLimit

if consumerOverride is present,
  quotaLimit = min(consumerOverride, upperBound)
else
  quotaLimit = upperBound

区域和地区配额

配额限制可能是全局计算的,或者可能在每个云端区域或云端地区中单独计算。

例如,假设服务的全局配额限制为每分钟 100 个 API 请求。如果在 us-central1 区域中发出了 80 个 API 请求,而在 asia-northeast3 中发出了 70 个请求,则将在全局限制下计入 150 个请求,而某些请求将被拒绝。然而,对于区域限制,每个区域都有其自己的单独配额,即每分钟 100 个请求。us-central1 中的 80 个请求不会超出该区域中 100 个请求的限制,而且 asia-northeast3 中的 70 个请求也不会超出该区域中 100 个请求的限制,因此不会拒绝任何请求。

配额替换值可以一次应用于所有区域,也可以应用于特定区域。当对特定区域应用替换值时,其他区域的有效限制不受影响。

同样,配额替换值可以一次应用于所有地区,也可以应用于特定地区。当对特定地区应用替换值时,其他地区的有效限制不受影响。