本文档列出了适用于适用于 Google Cloud 的 Gemini 的配额和限制。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
- 监控 Google Cloud 产品和服务的消耗情况
- 限制这些资源的消耗量
- 提供请求更改配额值的方法。
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
Gemini 资源也有限制。这些限制与配额系统无关。除非另有说明,否则无法更改限制。
每秒请求次数
Google Cloud 专用 Gemini 对每秒请求数量施加配额限制 为项目中的每个用户分配权限
配额 | 值 |
---|---|
每秒请求次数 | 2 |
每日请求数
Google Cloud 专用 Gemini 会针对项目中每个用户每天的请求总数强制执行配额。
配额 | 值 |
---|---|
Gemini Code Assist 或 BigQuery 中的 Gemini 代码请求(例如代码生成和代码补全)的每日请求次数。 | 6000 |
每天针对聊天、可视化、数据分析表扫描以及在 Google Cloud 控制台和 IDE 的 Gemini 窗格中显示回答的其他请求。 | 240 |
Gemini in BigQuery 的配额
对于将 BigQuery in BigQuery 与 BigQuery 企业 Plus 版搭配使用的客户,我们会根据过去一个完整日历月的企业 Plus 槽小时的每日平均使用量来提供配额。此配额适用于组织级别,适用于所有组织 该组织中已分配了企业 Plus 版槽的项目。 配额会向上取整到最接近的 100 个槽小时用量。
每 100 个槽小时的配额(企业 Plus 版每日平均用量) | 值 |
---|---|
每天的代码补全请求数 | 150 |
每天的代码生成请求数 | 10 |
聊天、可视化、表扫描和每日请求次数 Gemini 窗格中显示回答的其他请求 Google Cloud 控制台。 | 5 |
示例:如果某个组织拥有以 100 个槽为基准的企业 Plus 版预留,则每天平均会使用 2,400 个槽小时(100 个槽 * 24 小时 = 2,400 个槽小时)。因此,在以下 获得以下每日配额:
- 每天 3,600 个代码补全请求
- 每天 240 次代码生成请求
- 每天 120 次聊天、可视化和数据分析表扫描
如果贵组织尚未购买任何 BigQuery Enterprise Plus 版本可预订,但在您购买企业 Plus 版后仍可继续使用 您将获得以下默认配额, 第一个完整日历月:
- 每天 7,500 个代码补全请求
- 每天 500 次代码生成请求
- 每天扫描 250 次聊天、可视化图表和数据分析表
如果您在月中开始使用企业 Plus 版预留, 至次月月底,此配额会始终有效。
申请增加配额
如需增加或减少大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请更高的配额。