Cotas e limites

Neste documento, listamos as cotas e os limites de sistema que se aplicam ao Vertex AI Agent Builder.

  • As cotas especificam a quantidade de um recurso compartilhado e contável que pode ser usado. As cotas são definidas por serviços do Google Cloud, como o Vertex AI Agent Builder.
  • Os limites do sistema são valores fixos que não podem ser alterados.

O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.

O sistema de cotas do Cloud faz o seguinte:

  • Monitora o consumo de produtos e serviços do Google Cloud.
  • Restringe o consumo desses recursos.
  • Fornece um meio de solicitar mudanças no valor da cota

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Também há limites de sistema para os recursos do Vertex AI Agent Builder. Não é possível alterar os limites.

cotas de alocação.

As cotas a seguir não são redefinidas e, em vez disso, são liberadas quando você libera o recurso:

Cotas Valor
Número de documentos por projeto 1.000.000
Número de documentos por organização 5.000.000
Número de operações de longa duração pendentes de importação por projeto 300
Número de operações pendentes de longa duração para importações por organização 1500
Número de operações de longa duração de documentos de limpeza pendentes por projeto 100
Número de operações de longa duração de documentos de limpeza pendentes por organização 500
Número de controles de veiculação por projeto 1.000
Número de controles de exibição de aumento por configuração de exibição 100
Número de controles de veiculação de filtro por configuração de veiculação 100
Número de controles de exibição de redirecionamento por configuração de exibição 100
Número de controles de veiculação de sinônimos por configuração de veiculação 100
Número de eventos do usuário por projeto 40.000.000.000
Número de eventos do usuário por organização 200.000.000.000

Solicitar cotas

As cotas a seguir se aplicam às solicitações do Vertex AI Agent Builder:

Cotas Valor
Solicitações de consulta concluídas por minuto por projeto 300
Solicitações de consulta por minuto e organização 1.500
Solicitações de leitura de pesquisa de conversa por minuto por projeto 300
Solicitações de leitura de pesquisa de conversação por minuto e organização 500
Solicitações de gravação da pesquisa de conversação por minuto por projeto 300
Solicitações de gravação de pesquisa de conversa por minuto por organização 500
Solicitações de lote de documentos por minuto por projeto 100
Solicitações de lote de documentos por minuto e organização 500
Solicitações de leitura de documentos por minuto por projeto 300
Solicitações de leitura de documentos por minuto e organização 1500
Solicitações de gravação de documentos por minuto por projeto 12.000
Solicitações de gravação de documentos por minuto e organização 60.000
Solicitações de criação de avaliação por dia e organização 5
Solicitações de criação de avaliação por dia e por projeto 5
Solicitações de leitura de avaliação por minuto e por organização 500
Solicitações de leitura de avaliação por minuto por projeto 100
Solicitações de gravação de avaliação por minuto e organização 500
Solicitações de gravação de avaliação por minuto por projeto 100
Solicitações de consulta de LLM (resumo da pesquisa, pesquisa com várias etapas) por minuto e por projeto 15
Solicitações de consulta de LLM (resumo de pesquisa, pesquisa com vários turnos) por minuto e organização 75
Número de gravações de streaming pendentes do FHIR/BQ por minuto 6.000
Número de conjuntos de consultas de amostra por organização 500
Número de conjuntos de consultas de amostra por projeto 100
Solicitações de API de classificação por minuto e projeto 500
Solicitações de recomendação por minuto por projeto 60.000
Recomendar solicitações por minuto por organização Ilimitado
Exemplos de solicitações de leitura de consulta por minuto e organização 1000
Exemplos de solicitações de leitura de consulta por minuto e por projeto 200
Exemplo de solicitações de leitura de conjuntos de consultas por minuto por organização 500
Exemplo de solicitações de leitura de conjunto de consultas por minuto e por projeto 100
Exemplo de solicitações de gravação de conjuntos de consultas por minuto por organização 500
Exemplos de solicitações de gravação de conjuntos de consultas por minuto e por projeto 100
Exemplos de solicitações de gravação de consulta por minuto e organização 1000
Exemplos de solicitações de gravação de consulta por minuto e por projeto 200
Solicitações de leitura de esquema por minuto e por projeto 100
Solicitações de leitura de esquema por minuto por organização 500
Solicitações de gravação de esquema por minuto e por projeto 100
Solicitações de gravação de esquema por minuto e organização 500
Solicitações de pesquisa por minuto por projeto 300
Solicitações de pesquisa por minuto e organização Ilimitado
Solicitações em lote de eventos do usuário (como importação e limpeza) por minuto e por projeto 100
Solicitações em lote de eventos do usuário (como importação e eliminação) por minuto por organização 500
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário 240
Solicitações de coleta de eventos do usuário por minuto, organização e usuário 1200
Solicitações de gravação de eventos do usuário por minuto e por projeto 60.000
Solicitações de gravação de eventos do usuário por minuto por organização 300.000

Cota de indexação de páginas da Web

Quando você tem um repositório de dados com a Indexação avançada de sites ativada, cada página da Web indexada conta para a cota "Número de documentos por projeto" na lista Cotas de alocação. Você também pode conferir o número de páginas no seu projeto e a cota de páginas dele no campo Páginas do projeto x cota na página Dados de um repositório de dados.

Se você adicionar sites a um repositório de dados em um projeto e as páginas da Web nesses sites fizerem com que a cota do projeto seja excedida, os sites não serão indexados. Se você tiver sites no repositório de dados que já estão indexados, eles vão continuar sendo indexados como antes. É possível solicitar o upgrade da cota a qualquer momento.

Solicitar aumento de cota

Para ajustar a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar um ajuste de cota.