使用配额

Google Cloud 对项目所有者的资源用量设有配额,从而对项目可以使用的特定 Google Cloud 资源设置了限制。配额分为两类:

  • 速率配额,例如每天的 API 请求数。此配额会在特定于服务的时间间隔(例如一分钟或一天)后重置。
  • 分配配额,例如项目在给定时间使用的虚拟机 (VM) 实例或负载平衡器数量。此配额不会在一段时间后重置,而是必须在您不再需要使用相关资源时明确释放,例如删除某个 GKE 集群。

每个配额限制代表一个特定的可数资源,例如每天的 API 请求数,以及应用当前使用的负载平衡器数量。

实施配额的目的有多种:

  • 保护 Google Cloud 用户群体,防止使用量意外激增。
  • 帮助您管理资源。例如,开发和测试应用时,您可以设置自己的服务用量限制。

不同项目对于相同服务可以具有不同配额。例如,如果您使用免费试用帐号探索平台,则配额较为有限。为项目启用结算会增加大多数服务的配额;您还可以明确为特定服务申请更多配额。随着您的 Google Cloud 使用量逐步增加,您的配额可能会相应地增加。

项目中的配额限制可能会受到服务所有者、项目所有者或配额管理员应用的配额替换值的影响。如需详细了解如何计算配额限制,请参阅服务配额模型

您可以配置监控和提醒,跟踪配额用量并在配额到期或用量异常时向您发送提醒。

本文档介绍如何在项目中使用配额,包括如何查找和修改现有配额上限、如何申请更高的配额以及如何监控配额用量。如需了解如何查看其他 API 使用量指标,请参阅监控 API 使用量

如需查找某个产品或服务的配额文档,请使用任意 Google Cloud 文档页面上的 搜索选项,然后搜索相关的服务名称和 quota。例如,搜索“GKE 配额”会返回该服务的“配额和限制”页面作为第一个结果。

亲自尝试

如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。

免费开始使用

权限

查看项目配额的权限

如需在 Google Cloud Console 中查看项目配额或以编程方式访问项目配额,您必须拥有以下 IAM 权限

  • resourcemanager.projects.get
  • resourcemanager.folders.get(如果您想查看整个文件夹的配额)
  • resourcemanager.organizations.get(如果您想查看整个组织的配额)
  • serviceusage.quotas.get

如需了解默认情况下哪些角色具备这些权限,请参阅 IAM 权限参考文档

更改项目配额的权限

如需在项目、文件夹或组织级层更改配额,您必须具有以下权限:

默认情况下,以下角色包含此权限:Owner、Editor、Quota Administrator 和 Service Usage Admin。

在 Cloud Console 中查看配额

您可以在 Google Cloud Console 的两个不同区域查看当前配额限制:

  • 配额页面,其中列出了项目的所有配额用量和限制
  • Cloud Console API 信息中心,其中列出了特定 API 的配额信息,包括随时间变化的资源用量

您还可以采用编程方式以及通过命令行查看和管理配额,本文档稍后对此进行了详细介绍。

如需了解如何监控配额用量以及如何设置配额提醒,请参阅与配额指标有关的监控和提醒功能

查看项目的所有配额

如需查看项目中所有资源的配额用量和限制,请执行以下操作:

  1. 在 Google Cloud Console 中,转到配额页面。

    转到“配额”

    列表会按行列出每项服务中提供的每种配额类型的资源项。

  2. 对结果进行排序和过滤,以便重点查看所需信息:

    • 如需查看特定属性,请点击 过滤表
    • 如需按字母顺序对列表进行排序,请将鼠标指针悬停在服务限制名称配额状态详情标题上。
    • 默认情况下,列表会将您用量最高的配额(根据过去七天的峰值用量)显示在最前面,便于您发现哪些资源用量有超出限制的风险。若要将用量最少的配额排在最前,请切换配额状态箭头。
    • 如需详细了解特定配额的当前用量,请在详细信息列中点击所有配额

配额页面上列出的配额用量指标的计算方式如下:

  • 速率配额:
    • 对于每日速率配额,列出的数字表示当前 24 小时时间段到目前为止的总用量。
    • 对于每分钟或每 100 秒配额,列出的数字表示过去 24 小时内的平均使用量。
  • 分配配额:列出的数字表示项目当前正在使用的资源数量(例如负载平衡器数量)。

如需详细了解特定服务的配额,请参阅该服务的相应文档。例如,资源配额中介绍了 Compute Engine 配额。

API 特定的配额

如需查看特定 API 的详细配额信息(包括一段时间内的用量),请访问 Cloud Console 中的 API 配额页面。根据 API 的不同,这些限制可能包括“每天请求数”、“每分钟请求数”和“每个用户每分钟请求数”。为项目启用结算功能之前,某些 API 设置的限制非常低。

您可以在 Cloud Console 的两个不同区域中查看特定 API 的当前限制:

  • Cloud Console 配额页面,如查看所有项目配额部分所述。

  • Cloud Console API 和服务信息中心页面。在此页面上,选择您的项目,点击 API 名称,然后点击配额配额页面会显示 API 的配额名称。您可以展开各个配额,了解随时间变化的详细用量以及当前的限制。默认情况下,显示的限制是由 Google 施加的。您可以按照限制用量部分中的说明为使用量设置上限。如果 Google 没有对给定配额施加限制,则限制会显示为无限制

    某些配额不会显示在 API 特定的配额页面中。例如,对 Compute Engine API 的请求有 API 特定的配额页面,但该页面中不包含 Compute Engine 计算资源用量(分配配额)。此外,如果您在多个位置使用某个服务,则 API 特定的配额页面不会显示区域或可用区配额限制及其用量。如需查看可以按位置过滤的项目配额用量的完整列表,请参阅项目配额页面。

使用 Cloud Console 管理配额

根据您的资源用量,您可能需要上下调整项目的配额限制。本部分介绍如何更改提供的配额限制。 如需查看配额限制,请在详细信息列中点击所有配额

过滤配额

如需按特定属性过滤配额列表,请执行以下操作:

  1. 转到 Google Cloud Console 中的配额页面:

    转到“配额”

  2. 点击 过滤表,按特定属性查询配额。

申请更高配额限制

您可以按照以下步骤在 Google Cloud Console 中申请提高大部分配额限制。您可能会遇到以下某种异常情况:

  • 在某些情况下,Google Cloud Console 会将您重定向至单独表单,以申请增加限制。提交申请表后,Google Cloud 会通过电子邮件确认您的申请。
  • 有些配额无法使用 Google Cloud Console 进行更新。如果您发现无法在控制台中更改配额,请通过 Cloud Customer Care 申请增加配额。结算团队不会处理配额上限增加的情况。

如需通过 Google Cloud Console 申请提高配额上限,请执行以下操作:

  1. 转到配额页面:

    转到“配额”

  2. 选择要更改的配额,如下所示:

    1. 在要更改的配额对应的行中,点击所有配额。在配额面板中,点击全局复选框。
    2. 您也可以点击 警告(如果它显示在配额状态列中)。在配额面板中,点击要更改的配额旁边的复选框。
  3. 在主配额页面上,点击 修改配额

  4. 填写右侧显示的申请表,如下所示:

    1. 新上限字段中,输入您申请的提升配额。
    2. 申请说明字段中,输入申请的原因。建议您说明未来的发展计划、区域或地区扩展以及其他要求或依赖事项。
    3. 点击下一步
    4. 详细联系信息面板的电话字段中输入您的电话号码。
    5. 点击完成
  5. 点击提交申请

在 Google Cloud Console 中提交申请后,Google Cloud 会向您发送确认申请的电子邮件。如需进一步的帮助,您可以回复此电子邮件。Cloud Customer Care 通常会在 2-3 个工作日内处理您的申请,然后向您发送电子邮件,告知您配额提升是否获得批准。该电子邮件会提供提升的有效日期(如果适用)。

限制用量

您可能希望通过设置自己的配额限制来限制特定资源的用量。例如,为了防止超出免费用量限额而产生费用,您可以申请每日上限。如需为配额设置上限,请在 API 特定的配额页面上修改限制。

  1. 在 Google Cloud Console 中,转到配额页面。

    转到“配额”

  2. 点击 过滤表,按特定属性查询配额。

  3. 点击全部配额,找到您要设置上限的用量。

  4. 点击对应的复选框以选中要修改的属性。

  5. 点击修改配额

  6. 填写申请表。

  7. 输入修改后的配额限制,并视情况输入说明。

  8. 点击完成

  9. 点击提交申请

如果您要为未显示在此页面上的配额设置上限,或者要设置为高于提供的上限,请按照申请更高配额中所述修改限制。

使用 gcloud 命令行工具管理配额(Alpha 版)

您可以使用 gcloud 命令行工具获取某些 Google Cloud API 和服务的当前配额和配额限制项目级层文件夹级层组织级层配额。

如需使用此方法,请先确保您已安装初始化最新版本的 Cloud SDK,包括 Alpha 版命令组件。如果您是使用 Cloud Shell 与 Google Cloud 交互,则会为您安装 Cloud SDK。

如需查看特定服务的项目配额,请运行以下命令,并替换为您的项目 ID 和服务名称:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=projects/PROJECT_ID

如需查看组织的同一服务的配额详细信息,请执行以下操作:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=organizations/ORG_ID

如需查看 gcloud quota 命令和标志的完整列表,请参阅 Cloud SDK 参考文档

除了 gcloud quota 之外,某些服务还可以通过自己的命令行访问配额和资源用量信息。例如,Compute Engine 允许您使用 gcloud compute 命令访问配额信息。

使用 Service Usage API 管理配额

您可以使用 Service Usage API 来获取当前配额并限制某些 Google Cloud API 和服务的配额用量。如需详细了解 Service Usage,请参阅以下内容:

您无法使用 Service Usage API 来申请更高的配额,而必须使用 Cloud Console 进行申请。

与配额指标有关的监控和提醒功能

Cloud Monitoring API 和界面可让您更深入地监控配额用量、限制和错误。您可以使用这些指标创建自定义信息中心和提醒,以便监控一段时间内的配额用量,并在接近配额限制等情况下收到提醒。

Cloud Monitoring 支持多种不同的指标,您可以将这些指标与过滤器和聚合功能结合使用,从全新的角度深入了解配额使用情况。例如,您可以将分配配额用量指标与 Cloud TPU 名称上的 quota_metric 过滤器结合使用。

如需使用 Metrics Explorer 查看受监控资源的指标,请按照以下步骤操作:

  1. 在 Google Cloud Console 中,转到 Monitoring 页面。

    转至 Resources

  2. 在 Monitoring 导航窗格中,点击 Metrics Explorer
  3. 确保所选标签页为指标
  4. 查找资源类型和指标字段中,从菜单中选择或者输入资源和指标的名称。在各字段中填写以下信息:
    1. 对于资源,选择或输入使用者配额
    2. 对于指标,选择或输入分配配额用量速率配额用量,具体取决于需要监控的配额类型。
  5. 如需修改数据的显示方式,请使用过滤条件分组依据聚合器菜单。例如,您可以按资源或指标标签进行分组。如需了解详情,请参阅选择指标

同样,如需查看配额上限或超出配额错误,请先选择 Consumer Quota 作为资源类型,然后选择 Quota limitQuota exceeded error

找到需要的配额用量信息后,您可以使用 Cloud Monitoring 创建自定义信息中心和提醒,以帮助您监控和维护稳健的应用。如需了解详情,请参阅以下文档:

如需查看特定于常见配额的提醒政策示例,请参阅使用配额指标

Cloud Monitoring 参考指南包含配额指标的详细参考文档。

检查配额指标支持

并非所有服务都支持 Cloud Monitoring 中的配额指标。如需查看受支持的服务的适用配额指标,请在构建图表或创建提醒政策时选择使用方配额 (Consumer Quota) 作为资源类型。不会显示不支持配额指标的服务。

  • 支持配额指标的常用服务包括 Compute Engine、Dataflow、Cloud Spanner、Pub/Sub、Cloud Vision、Speech-to-Text、Cloud Monitoring 和 Cloud Logging。

  • 不支持配额指标的常用服务包括 App Engine、Cloud Storage 和 Cloud SQL。

配额错误

如果您的项目在使用服务时超过了配额,Google Cloud 会根据您访问该服务的方式返回错误:

  • 如果在发出 HTTP/REST 请求时超出了配额,Google Cloud 会返回 HTTP 429 TOO MANY REQUESTS 状态代码。
  • 如果在发出 API 请求时超出了配额,Google Cloud 会返回 HTTP 413 REQUEST ENTITY TOO LARGE 状态代码。
  • 如果在使用 gRPC 时超出配额,Google Cloud 会返回 ResourceExhausted 错误。此错误的显示方式取决于该服务。
  • 如果在使用 gcloud 命令行工具命令时超出配额,gcloud 命令行工具会输出超出配额错误消息并返回退出代码 1

速率配额会在特定于每个服务的预定义时间间隔后重置。如需了解详情,请参阅特定服务的配额文档。

如果您希望在将来出现错误时收到提醒,则可以针对特定配额错误创建自定义提醒,如监控配额指标中所述。