配额

本文档列出了适用于 Document AI 的配额和系统限制。

  • 配额用于指定您可以使用的可计数共享资源的数量。配额由 Document AI 等 Google Cloud 服务定义。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

本文档列出了适用于 Document AI 的配额。

服务层级

Document AI 支持两种服务层级,并为向依托生成式 AI 技术的处理器版本发送的在线处理请求提供相关联的配额:预配层级和尽力而为层级。

预配层级的配额为:基本处理器版本(例如自定义提取器 v1.4 和 v1.5)每分钟 120 页,基本处理器版本(例如自定义提取器 v1.5 Pro)每分钟 30 页。

尽力而为层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供 120 个配额,为 Pro 处理器版本(例如自定义提取器 v1.5 Pro)提供 60 个配额,并且仅在已用完预配的配额后使用。这适用于控制台中的配额 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指标 best_effort_online_process_document_pages_us)和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指标 best_effort_online_process_document_pages_eu)。

备注 自定义提取器 v1.4(基于 Gemini 2.0 Flash) 自定义提取器 v1.5(基于 Gemini 2.5 Flash) 自定义提取器 v1.5 Pro(基于 Gemini 2.5 Pro)
已预配 120 120 30
尽力而为 120 120 60
组织级已配置 240 240 60

如果您需要的配额超出“尽力而为”配额中列出的数量,可以与您的销售团队代表联系,以提交增加配额请求 (QIR)。

尽力而为层级没有服务等级协议

配额列表

以下配额适用于 Document AI。 这些配额适用于每个 Google Cloud 控制台项目,并由使用该项目的所有应用和 IP 地址共享。

如果您想处理更多请求,请在 Google Cloud 控制台中为您的项目提交 Document AI 配额申请。

在请求中提供有关您的具体需求和使用情形的信息。

请求配额 默认值 备注
每分钟请求数 每位用户 1800 个 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(仅限 v1beta2) 每个项目 600 个 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(美国) 每个项目每种处理器类型 120 次 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(欧盟) 每个项目每种处理器类型 120 次 在 Google Cloud 控制台中查看配额
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟的在线处理文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(单区域) 每个项目每种处理器类型 6 个 在 Google Cloud 控制台中查看配额
每个项目和区域(美国)的并发批处理请求数 每个项目 5 个 在 Google Cloud 控制台中查看配额
每个项目和区域的并发批量处理请求数(欧盟) 每个项目 5 个 在 Google Cloud 控制台中查看配额
每个处理器的并发批处理请求数(单区域) 每个项目 5 个 在 Google Cloud 控制台中查看配额
处理中的页面数(仅限 v1beta2) 每个项目 10,000 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(美国) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(欧盟) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(单区域) 每个项目 1 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本(美国) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本 (欧盟) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本(单区域) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本(美国) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本 (EU) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本(单区域) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
并发导入文档请求数(美国) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导入文档请求数(欧盟) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导入文档请求数(单个区域) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(美国) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(欧盟) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(单个区域) 每个项目 1 个 在 Google Cloud 控制台中查看配额

* 此版本尚不支持配额调整请求。

australia-southeast1 中受支持,但需要提交配额调整申请。