Este documento lista as quotas e os limites do sistema que se aplicam ao Document AI.
- As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.
O sistema de quotas da nuvem faz o seguinte:
- Monitoriza o seu consumo de Google Cloud produtos e serviços
- Restringe o seu consumo desses recursos
- Oferece uma forma de pedir alterações ao valor da quota e automatizar os ajustes de quotas
Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.
Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.
Este documento lista as quotas que se aplicam à IA Documental.
Níveis de serviço
O Document AI suporta dois níveis de serviço e quotas associadas para pedidos de processamento online para versões de processadores com tecnologia de IA generativa: níveis aprovisionados e de melhor esforço.
A quota do nível aprovisionado oferece 120 páginas por minuto para versões do processador base, como o extrator personalizado v1.4 e v1.5, e 30 páginas por minuto para versões do processador base, como o extrator personalizado v1.5 Pro.
A quota de nível de melhor esforço oferece 120 para versões de processador base, como o extrator personalizado v1.4 e v1.5, 60 para versões de processador Pro, como o extrator personalizado v1.5 Pro, e só é usada quando a quota aprovisionada se esgota. Isto aplica-se às
quotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(métrica best_effort_online_process_document_pages_us
) e
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(métrica best_effort_online_process_document_pages_eu
) na consola.
Notas | Extrator personalizado v1.4 (com base no Gemini 2.0 Flash) | Extrator personalizado v1.5 (com base no Gemini 2.5 Flash) | Extrator personalizado v1.5 Pro (com base no Gemini 2.5 Pro) |
---|---|---|---|
Aprovisionado | 120 | 120 | 30 |
Dentro do possível | 120 | 120 | 60 |
Aprovisionado ao nível da organização | 240 | 240 | 60 |
Se precisar de mais do que as quotas de melhor esforço indicadas, pode fazer um pedido de aumento de quota (QIR) contactando o representante da equipa de vendas.
Não existe um contrato de nível de serviço para o nível de melhor esforço.
Lista de quotas
As seguintes quotas aplicam-se à IA Documental. Estas quotas aplicam-se a cada Google Cloud projeto da consola e são partilhadas em todas as aplicações e endereços IP que usam esse projeto.
Se quiser processar mais pedidos, envie uma solicitação de quota da Document AI para o seu projeto na Google Cloud consola.
Forneça informações sobre as suas necessidades específicas e exemplo de utilização no pedido.
Pedir quota | Valor predefinido | Notas |
---|---|---|
Pedidos por minuto | 1800 por utilizador | Veja a quota na Google Cloud consola |
Pedidos de processamento online por minuto (apenas v1beta2) | 600 por projeto | Veja a quota na Google Cloud consola |
Processar pedidos online por minuto (EUA) | 120 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Processar pedidos online por minuto (UE) | 120 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (Custom Extractor v1.5 apenas com o Gemini 2.5 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.5 apenas com o Gemini 2.5 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Pedidos de processamento online por minuto (região única) | 6 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por projeto e região (EUA) | 5 por projeto | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por projeto e região (UE) | 5 por projeto | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por processador (região única) | 5 por projeto | Veja a quota na Google Cloud consola |
Número de páginas em processamento ativo (apenas v1beta2) | 10 000 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador concorrente (EUA) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador simultâneos (UE) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador simultâneos (região única) | 1 por projeto† | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (EUA) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (UE) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (região única) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador generativo implementadas (EUA) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Versões do processador generativo implementadas (UE) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Versões de processadores generativos implementadas (região única) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (EUA) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (UE) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (região única) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (EUA) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (UE) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (região única) | 1 por projeto | Veja a quota na Google Cloud consola |
* Os pedidos de ajuste de quota ainda não são suportados para esta versão.
† Suportado no australia-southeast1
com um pedido de ajuste de quota.