本文档列出了适用于 Vertex AI Agent Builder 的配额和系统限制。
- 配额用于指定您可以使用的可计数共享资源的数量。配额由 Vertex AI Agent Builder 等 Google Cloud 服务定义。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
- 监控 Google Cloud 产品和服务的消耗情况
- 限制这些资源的消耗量
- 提供请求更改配额值的方法
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
Vertex AI Agent Builder 资源也有系统限制。系统限制不能更改。
分配配额
以下配额不会在一段时间后重置,而是在您释放资源时释放:
配额 | 值 |
---|---|
每个项目的文档数量 | 1,000,000 |
每个组织的文件数量 | 5000000 |
每个项目的待处理导入长时间运行的操作数 | 300 |
每个组织的待处理的长时间运行的导入操作数 | 1500 |
每个项目的待处理清除文档长时间运行的操作数 | 100 |
每个组织的待处理清除文档长时间运行的操作数 | 500 |
每个项目的广告投放控制功能数量 | 1000 |
每项投放配置的增强型投放控件数量 | 100 |
每个广告投放配置的过滤器投放控制项数量 | 100 |
每个投放配置的重定向投放控件数量 | 100 |
每个投放配置的同义词投放控件数量 | 100 |
每个项目的用户事件数 | 400 亿 |
每个组织的用户事件数 | 200,000,000,000 |
请求配额
以下配额适用于 Vertex AI Agent Builder 请求:
配额 | 值 |
---|---|
每个项目每分钟完成的查询请求数 | 300 |
每个组织每分钟完成的查询请求数 | 1500 |
每个项目每分钟的对话式搜索读取请求数 | 300 |
每个组织每分钟的对话式搜索读取请求数 | 500 |
每个项目每分钟的对话式搜索写入请求数 | 300 |
每个组织每分钟的对话式搜索写入请求数 | 500 |
每个项目每分钟的文件批量请求数 | 100 |
每个组织每分钟的文件批量请求数 | 500 |
每个项目每分钟的文件读取请求数 | 300 |
每个组织每分钟的文件读取请求数 | 1500 |
每个项目每分钟的文档写入请求数 | 12000 |
每个组织每分钟的文档写入请求数 | 60000 |
每个组织每天的评估创建请求数 | 5 |
每个项目每天的评估创建请求数 | 5 |
每个组织每分钟的评估读取请求数 | 500 |
每个项目每分钟的评估读取请求数 | 100 |
每个组织每分钟的评估写入请求数 | 500 |
每个项目每分钟的评估写入请求数 | 100 |
每个项目每分钟的 LLM 查询请求数(搜索摘要、多轮搜索) | 15 |
每个组织每分钟的 LLM 查询请求次数(搜索摘要、多轮搜索) | 75 |
每分钟待处理的 FHIR/BQ 流式写入数 | 6000 |
每个组织的示例查询集数量 | 500 |
每个项目的示例查询集数量 | 100 |
按项目对每分钟 API 请求进行排名 | 500 |
每个项目每分钟的推荐请求数 | 60000 |
每个组织每分钟的推荐请求数 | 无限制 |
每个组织每分钟的查询读取请求数示例 | 1000 |
每个项目每分钟的查询读取请求数示例 | 200 |
每个组织每分钟的查询集读取请求数示例 | 500 |
每个项目每分钟的示例查询集读取请求数 | 100 |
每个组织每分钟的查询集写入请求数示例 | 500 |
每个项目每分钟的查询集写入请求数示例 | 100 |
每个组织每分钟的查询写入请求数示例 | 1000 |
每个项目每分钟的查询写入请求数示例 | 200 |
每个项目每分钟的架构读取请求数 | 100 |
每个组织每分钟的架构读取请求数 | 500 |
每个项目每分钟的架构写入请求数 | 100 |
每个组织每分钟的架构写入请求数 | 500 |
每个项目每分钟的搜索请求数 | 300 |
每个组织每分钟的搜索请求数 | 无限制 |
每个项目每分钟的用户事件批量请求(例如导入和清除) | 100 |
每个组织每分钟的用户事件批量请求(例如导入和清除) | 500 |
每位用户每分钟的每个项目的用户事件收集请求数 | 240 |
每位用户每分钟每个组织的用户事件收集请求数 | 1200 |
每个项目每分钟的用户事件写入请求数 | 60000 |
每个组织每分钟的用户事件写入请求数 | 300000 |
网页索引编制配额
如果您有启用了高级网站索引的数据存储区,则您索引的每个网页都会计入分配配额列表中的“每个项目的文档数量”配额。您还可以在数据存储区的数据页面中的项目网页数与配额字段中查看项目中的网页数量和该项目的网页配额。
如果您向项目中的数据存储区添加网站,而这些网站中的网页导致项目超出配额,则系统不会为这些网站编制索引。如果您的数据存储区中有已编入索引的网站,这些网站将继续像以前一样编入索引。您可以随时申请提高配额。
申请增加配额
如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整。