Neste documento, listamos as cotas e os limites do sistema que se aplicam aos aplicativos de IA.
- As cotas têm valores padrão, mas geralmente é possível solicitar ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistemas nos recursos do AI Applications. Os limites do sistema não podem ser alterados.
cotas de alocação.
A tabela a seguir lista as cotas da API Discovery Engine. Elas não são redefinidas com o tempo. Em vez disso, elas são liberadas quando você libera o recurso. Se a cota padrão não for suficiente, solicite um aumento.
Cota | Valor |
---|---|
Número total de repositórios de dados por projeto | 100* |
Número total de mecanismos por projeto | 150† |
Número de operações pendentes de longa duração para importação por projeto | 300 |
Número de operações de longa duração pendentes de exclusão de documentos por projeto | 100 |
Número de controles de veiculação por projeto | 1.000 |
Número de controles de exibição de reforço por configuração de exibição | 100 |
Número de controles de exibição de filtros por configuração de exibição | 100 |
Número de controles de exibição de redirecionamento por configuração de exibição | 100 |
Número de controles de veiculação de sinônimos por configuração de veiculação | 100 |
Número regional de repositórios de dados por projeto e local (global, EUA, UE) | 100 |
Número regional de documentos por projeto e local (global, EUA, UE) | 10.000.000 |
Número regional de mecanismos por projeto por local (global, EUA, UE) | 150 |
Número regional de eventos do usuário por projeto e local (global, EUA, UE) | 40.000.000.000 |
* Devido a uma limitação técnica, a cota máxima para repositórios de dados é de 500 por projeto. Se você precisar de mais repositórios de dados, use novos projetos.
† Devido a uma limitação técnica, a cota máxima para mecanismos é de 500 por projeto. Se você precisar de mais mecanismos, use novos projetos.
cotas de taxa.
As cotas a seguir se aplicam às solicitações da API Discovery Engine. Se a cota padrão não for suficiente, solicite um aumento.
Cota | Valor |
---|---|
Solicitações de consulta completa por minuto por projeto | 300 |
Solicitações de leitura de pesquisa por conversa por minuto por projeto | 300 |
Solicitações de gravação de pesquisa por conversa por minuto por projeto | 300 |
Solicitações de lote de documentos (como importação e remoção inline) por minuto e projeto | 100 |
Documentar solicitações de importação assíncrona (Cloud Storage, BigQuery etc.) por minuto por projeto | 5 |
Solicitações de exclusão de documentos por minuto por projeto | 100 |
Solicitações de leitura de documentos por minuto por projeto | 300 |
Solicitações de gravação de documentos por minuto e por projeto | 12.000 |
Solicitações de criação de avaliação por dia e por projeto | 5 |
Solicitações de leitura de avaliação por minuto por projeto | 100 |
Solicitações de gravação de avaliação por minuto por projeto | 100 |
Verificação de geração embasada por minuto por projeto | 300 |
Consultas de LLM (resumo da pesquisa, pesquisa em várias etapas) por minuto e por projeto | 60 |
Número de gravações pendentes de streaming do FHIR ou do BigQuery por minuto | 6.000 |
Número de conjuntos de consultas de amostra por projeto | 100 |
Solicitações da API Ranking por minuto e projeto | 500 |
Solicitações de recomendação por minuto por projeto | 60.000 |
Exemplo de solicitações de leitura de consultas por minuto por projeto | 200 |
Exemplo de solicitações de leitura de conjunto de consultas por minuto por projeto | 100 |
Exemplo de solicitações de gravação de conjunto de consultas por minuto por projeto | 100 |
Exemplo de solicitações de gravação de consultas por minuto por projeto | 200 |
Solicitações de leitura de esquema por minuto por projeto | 100 |
Solicitações de gravação de esquema por minuto por projeto | 100 |
Solicitações regionais de pesquisa por minuto, por projeto e por local (global, EUA, UE) | 300 |
Solicitações em lote de eventos do usuário (como importação e exclusão) por minuto e por projeto | 100 |
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário | 240 |
Solicitações de gravação de eventos do usuário por minuto e por projeto | 60.000 |
Cota para indexação de páginas da Web
Quando você tem um repositório de dados com a Indexação avançada de sites ativada, cada página da Web indexada conta para a cota "Número de documentos por projeto" na lista Cotas de alocação. Você também pode conferir o número de páginas no seu projeto e a cota de páginas dele no campo Páginas do projeto x cota na página Dados de um repositório de dados.
Se você adicionar sites a um repositório de dados em um projeto e as páginas da Web nesses sites excederem a cota do projeto, os sites não serão indexados. Se você tiver sites no seu repositório de dados que já estão indexados, eles vão continuar sendo indexados como antes. É possível solicitar um upgrade da sua cota a qualquer momento.
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar ajuste de cota.