Neste documento, listamos as cotas e os limites de sistema que se aplicam ao Vertex AI Agent Builder. As cotas especificam a quantidade de um recurso compartilhado e contável que pode ser usado e são definidas por serviços do Google Cloud, como o Vertex AI Agent Builder. Os limites do sistema são valores fixos que não podem ser alterados.
O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud.
- Restringe o consumo desses recursos.
- Fornece um meio de solicitar mudanças no valor da cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistema para os recursos do Vertex AI Agent Builder. Não é possível alterar os limites.
cotas de alocação.
As cotas a seguir não são redefinidas e, em vez disso, são liberadas quando você libera o recurso:
Cotas | Valor |
---|---|
Número de documentos por projeto | 1.000.000 |
Número de documentos por organização | 5.000.000 |
Número de operações de longa duração pendentes de importação por projeto | 300 |
Número de operações pendentes de longa duração para importações por organização | 1500 |
Número de operações de longa duração de documentos de limpeza pendentes por projeto | 100 |
Número de operações de longa duração de documentos de limpeza pendentes por organização | 500 |
Número de controles de veiculação por projeto | 1.000 |
Número de controles de exibição de aumento por configuração de exibição | 100 |
Número de controles de veiculação de filtro por configuração de veiculação | 100 |
Número de controles de exibição de redirecionamento por configuração de exibição | 100 |
Número de controles de veiculação de sinônimos por configuração de veiculação | 100 |
Número de eventos do usuário por projeto | 40.000.000.000 |
Número de eventos do usuário por organização | 200.000.000.000 |
Solicitar cotas
As cotas a seguir se aplicam às solicitações do Vertex AI Agent Builder:
Cotas | Valor |
---|---|
Solicitações de consulta concluídas por minuto por projeto | 300 |
Solicitações de consulta por minuto e organização | 1.500 |
Solicitações de leitura de pesquisa de conversa por minuto por projeto | 300 |
Solicitações de leitura de pesquisa de conversação por minuto e organização | 500 |
Solicitações de gravação da pesquisa de conversação por minuto por projeto | 300 |
Solicitações de gravação de pesquisa de conversa por minuto por organização | 500 |
Solicitações de lote de documentos por minuto por projeto | 100 |
Solicitações de lote de documentos por minuto e organização | 500 |
Solicitações de leitura de documentos por minuto por projeto | 300 |
Solicitações de leitura de documentos por minuto e organização | 1500 |
Solicitações de gravação de documentos por minuto por projeto | 12.000 |
Solicitações de gravação de documentos por minuto e organização | 60.000 |
Solicitações de criação de avaliação por dia e organização | 5 |
Solicitações de criação de avaliação por dia e por projeto | 5 |
Solicitações de leitura de avaliação por minuto e por organização | 500 |
Solicitações de leitura de avaliação por minuto por projeto | 100 |
Solicitações de gravação de avaliação por minuto e organização | 500 |
Solicitações de gravação de avaliação por minuto por projeto | 100 |
Solicitações de consulta de LLM (resumo da pesquisa, pesquisa com várias etapas) por minuto e por projeto | 15 |
Solicitações de consulta de LLM (resumo de pesquisa, pesquisa com vários turnos) por minuto e organização | 75 |
Número de gravações de streaming pendentes do FHIR/BQ por minuto | 6.000 |
Número de conjuntos de consultas de amostra por organização | 500 |
Número de conjuntos de consultas de amostra por projeto | 100 |
Solicitações de API de classificação por minuto e projeto | 500 |
Solicitações de recomendação por minuto por projeto | 60.000 |
Recomendar solicitações por minuto por organização | Ilimitado |
Exemplos de solicitações de leitura de consulta por minuto e organização | 1000 |
Exemplos de solicitações de leitura de consulta por minuto e por projeto | 200 |
Exemplo de solicitações de leitura de conjuntos de consultas por minuto por organização | 500 |
Exemplo de solicitações de leitura de conjunto de consultas por minuto e por projeto | 100 |
Exemplo de solicitações de gravação de conjuntos de consultas por minuto por organização | 500 |
Exemplos de solicitações de gravação de conjuntos de consultas por minuto e por projeto | 100 |
Exemplos de solicitações de gravação de consulta por minuto e organização | 1000 |
Exemplos de solicitações de gravação de consulta por minuto e por projeto | 200 |
Solicitações de leitura de esquema por minuto e por projeto | 100 |
Solicitações de leitura de esquema por minuto por organização | 500 |
Solicitações de gravação de esquema por minuto e por projeto | 100 |
Solicitações de gravação de esquema por minuto e organização | 500 |
Solicitações de pesquisa por minuto por projeto | 300 |
Solicitações de pesquisa por minuto e organização | Ilimitado |
Solicitações em lote de eventos do usuário (como importação e limpeza) por minuto e por projeto | 100 |
Solicitações em lote de eventos do usuário (como importação e eliminação) por minuto por organização | 500 |
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário | 240 |
Solicitações de coleta de eventos do usuário por minuto, organização e usuário | 1200 |
Solicitações de gravação de eventos do usuário por minuto e por projeto | 60.000 |
Solicitações de gravação de eventos do usuário por minuto por organização | 300.000 |
Cota de indexação de páginas da Web
Quando você tem um repositório de dados com a Indexação avançada de sites ativada, cada página da Web indexada conta para a cota "Número de documentos por projeto" na lista Cotas de alocação. Você também pode conferir o número de páginas no seu projeto e a cota de páginas dele no campo Páginas do projeto x cota na página Dados de um repositório de dados.
Se você adicionar sites a um repositório de dados em um projeto e as páginas da Web nesses sites fizerem com que a cota do projeto seja excedida, os sites não serão indexados. Se você tiver sites no repositório de dados que já estão indexados, eles vão continuar sendo indexados como antes. É possível solicitar o upgrade da cota a qualquer momento.
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar um ajuste de cota.