本文档列出了适用于 Document AI 的配额和系统限制。
- 配额用于指定您可以使用的可计数共享资源的数量。配额由 Document AI 等 Google Cloud 服务定义。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
本文档列出了适用于 Document AI 的配额。
服务层级
Document AI 支持两种服务层级,并为向依托生成式 AI 技术的处理器版本发送的在线处理请求提供相关联的配额:预配层级和尽力而为层级。
预配层级的配额为:基本处理器版本(例如自定义提取器 v1.4 和 v1.5)每分钟 120 页,基本处理器版本(例如自定义提取器 v1.5 Pro)每分钟 30 页。
尽力而为层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供 120 个配额,为 Pro 处理器版本(例如自定义提取器 v1.5 Pro)提供 60 个配额,并且仅在已用完预配的配额后使用。这适用于控制台中的配额 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(指标 best_effort_online_process_document_pages_us
)和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(指标 best_effort_online_process_document_pages_eu
)。
备注 | 自定义提取器 v1.4(基于 Gemini 2.0 Flash) | 自定义提取器 v1.5(基于 Gemini 2.5 Flash) | 自定义提取器 v1.5 Pro(基于 Gemini 2.5 Pro) |
---|---|---|---|
已预配 | 120 | 120 | 30 |
尽力而为 | 120 | 120 | 60 |
组织级已配置 | 240 | 240 | 60 |
如果您需要的配额超出“尽力而为”配额中列出的数量,可以与您的销售团队代表联系,以提交增加配额请求 (QIR)。
尽力而为层级没有服务等级协议。
配额列表
以下配额适用于 Document AI。 这些配额适用于每个 Google Cloud 控制台项目,并由使用该项目的所有应用和 IP 地址共享。
如果您想处理更多请求,请在 Google Cloud 控制台中为您的项目提交 Document AI 配额申请。
在请求中提供有关您的具体需求和使用情形的信息。
请求配额 | 默认值 | 备注 |
---|---|---|
每分钟请求数 | 每位用户 1800 个 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(仅限 v1beta2) | 每个项目 600 个 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(美国) | 每个项目每种处理器类型 120 次 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(欧盟) | 每个项目每种处理器类型 120 次 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(单区域) | 每个项目每种处理器类型 6 个 | 在 Google Cloud 控制台中查看配额 |
每个项目和区域(美国)的并发批处理请求数 | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
每个项目和区域的并发批量处理请求数(欧盟) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
每个处理器的并发批处理请求数(单区域) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
处理中的页面数(仅限 v1beta2) | 每个项目 10,000 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(美国) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(欧盟) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(单区域) | 每个项目 1 个† | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本(美国) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本 (欧盟) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本(单区域) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本(美国) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本 (EU) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本(单区域) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(美国) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(欧盟) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(单个区域) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(美国) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(欧盟) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(单个区域) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
* 此版本尚不支持配额调整请求。
† 在 australia-southeast1
中受支持,但需要提交配额调整申请。