Quotas

Este documento lista as quotas e os limites do sistema que se aplicam ao Document AI.

  • As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema de quotas da nuvem faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Este documento lista as quotas que se aplicam à IA Documental.

Níveis de serviço

O Document AI suporta dois níveis de serviço e quotas associadas para pedidos de processamento online para versões de processadores com tecnologia de IA generativa: níveis aprovisionados e de melhor esforço.

A quota do nível aprovisionado oferece 120 páginas por minuto para versões do processador base, como o extrator personalizado v1.4 e v1.5, e 30 páginas por minuto para versões do processador base, como o extrator personalizado v1.5 Pro.

A quota de nível de melhor esforço oferece 120 para versões de processador base, como o extrator personalizado v1.4 e v1.5, 60 para versões de processador Pro, como o extrator personalizado v1.5 Pro, e só é usada quando a quota aprovisionada se esgota. Isto aplica-se às quotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) e BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) na consola.

Notas Extrator personalizado v1.4 (com base no Gemini 2.0 Flash) Extrator personalizado v1.5 (com base no Gemini 2.5 Flash) Extrator personalizado v1.5 Pro (com base no Gemini 2.5 Pro)
Aprovisionado 120 120 30
Dentro do possível 120 120 60
Aprovisionado ao nível da organização 240 240 60

Se precisar de mais do que as quotas de melhor esforço indicadas, pode fazer um pedido de aumento de quota (QIR) contactando o representante da equipa de vendas.

Não existe um contrato de nível de serviço para o nível de melhor esforço.

Lista de quotas

As seguintes quotas aplicam-se à IA Documental. Estas quotas aplicam-se a cada Google Cloud projeto da consola e são partilhadas em todas as aplicações e endereços IP que usam esse projeto.

Se quiser processar mais pedidos, envie uma solicitação de quota da Document AI para o seu projeto na Google Cloud consola.

Forneça informações sobre as suas necessidades específicas e exemplo de utilização no pedido.

Pedir quota Valor predefinido Notas
Pedidos por minuto 1800 por utilizador Veja a quota na Google Cloud consola
Pedidos de processamento online por minuto (apenas v1beta2) 600 por projeto Veja a quota na Google Cloud consola
Processar pedidos online por minuto (EUA) 120 por projeto por tipo de processador Veja a quota na Google Cloud consola
Processar pedidos online por minuto (UE) 120 por projeto por tipo de processador Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (Custom Extractor v1.5 apenas com o Gemini 2.5 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.5 apenas com o Gemini 2.5 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Pedidos de processamento online por minuto (região única) 6 por projeto por tipo de processador Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por projeto e região (EUA) 5 por projeto Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por projeto e região (UE) 5 por projeto Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por processador (região única) 5 por projeto Veja a quota na Google Cloud consola
Número de páginas em processamento ativo (apenas v1beta2) 10 000 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador concorrente (EUA) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador simultâneos (UE) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador simultâneos (região única) 1 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (EUA) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (UE) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (região única) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador generativo implementadas (EUA) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Versões do processador generativo implementadas (UE) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Versões de processadores generativos implementadas (região única) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (EUA) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (UE) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (região única) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (EUA) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (UE) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (região única) 1 por projeto Veja a quota na Google Cloud consola

* Os pedidos de ajuste de quota ainda não são suportados para esta versão.

Suportado no australia-southeast1 com um pedido de ajuste de quota.