配额和限制

本文档列出了适用于适用于 Google Cloud 的 Gemini 的配额和限制。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

  • 监控 Google Cloud 产品和服务的消耗情况
  • 限制这些资源的消耗量
  • 提供请求更改配额值的方法。

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

Gemini 资源也有限制。这些限制与配额系统无关。除非另有说明,否则无法更改限制。

每秒请求次数

Google Cloud 专用 Gemini 对每秒请求数量施加配额限制 为项目中的每个用户分配权限

配额
每秒请求次数 2

每日请求数

Google Cloud 专用 Gemini 会针对项目中每个用户每天的请求总数强制执行配额。

配额
Gemini Code Assist 或 BigQuery 中的 Gemini 代码请求(例如代码生成和代码补全)的每日请求次数。 6000
每天针对聊天、可视化、数据分析表扫描以及在 Google Cloud 控制台和 IDE 的 Gemini 窗格中显示回答的其他请求。 240

Gemini in BigQuery 的配额

对于将 BigQuery in BigQuery 与 BigQuery 企业 Plus 版搭配使用的客户,我们会根据过去一个完整日历月的企业 Plus 槽小时的每日平均使用量来提供配额。此配额适用于组织级别,适用于所有组织 该组织中已分配了企业 Plus 版槽的项目。 配额会向上取整到最接近的 100 个槽小时用量。

每 100 个槽小时的配额(企业 Plus 版每日平均用量)
每天的代码补全请求数 150
每天的代码生成请求数 10
聊天、可视化、表扫描和每日请求次数 Gemini 窗格中显示回答的其他请求 Google Cloud 控制台。 5

示例:如果某个组织拥有以 100 个槽为基准的企业 Plus 版预留,则每天平均会使用 2,400 个槽小时(100 个槽 * 24 小时 = 2,400 个槽小时)。因此,在以下 获得以下每日配额:

  • 每天 3,600 个代码补全请求
  • 每天 240 次代码生成请求
  • 每天 120 次聊天、可视化和数据分析表扫描

如果贵组织尚未购买任何 BigQuery Enterprise Plus 版本可预订,但在您购买企业 Plus 版后仍可继续使用 您将获得以下默认配额, 第一个完整日历月:

  • 每天 7,500 个代码补全请求
  • 每天 500 次代码生成请求
  • 每天扫描 250 次聊天、可视化图表和数据分析表

如果您在月中开始使用企业 Plus 版预留, 至次月月底,此配额会始终有效。

申请增加配额

如需增加或减少大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请更高的配额