Este documento lista as cotas e os limites que se aplicam ao Gemini para Google Cloud.
O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud.
- Restringe o consumo desses recursos.
- Fornece um meio de solicitar mudanças no valor da cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites para os recursos do Gemini. Esses limites não estão relacionados ao sistema de cotas. Não é possível mudar os limites, a menos que seja indicado o contrário.
Solicitações por segundo
O Gemini para Google Cloud aplica cotas nas solicitações por segundo para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por segundo | 2 |
Solicitações por dia
O Gemini para Google Cloud aplica cotas ao número total de solicitações por dia para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por dia para o Gemini Code Assist ou o Gemini em solicitações de código do BigQuery, como geração e preenchimento de código. | 6.000 |
Solicitações por dia para chat, visualização, verificações de tabelas de insights de dados e outras solicitações que mostram respostas no painel Gemini na o console do Google Cloud e os ambientes de desenvolvimento integrado. | 240 |
Cotas do Gemini no BigQuery
Para clientes que usam o Gemini no BigQuery com a edição Enterprise Plus, as cotas são fornecidas com base na média diária de uso de horas de slot do Enterprise Plus no último mês completo. Essa cota se aplica no nível da organização e está disponível para todos projetos nessa organização com slots da edição Enterprise Plus atribuídos. As cotas são arredondadas para o uso de 100 horas de slot mais próximo.
Cotas por 100 horas de slot (uso médio diário da edição Enterprise Plus) | Valor |
---|---|
Solicitações de preenchimento de código por dia | 150 |
Solicitações de geração de código por dia | 10 |
Solicitações por dia para chat, visualização, verificação de tabelas e outras solicitações que mostram respostas no painel Gemini na console do Google Cloud. | 5 |
Exemplo: uma organização que tem uma reserva da edição Enterprise Plus com 100 slots como valor de referência vai usar uma média de 2.400 horas-slot por dia (100 slots * 24 horas = 2.400 horas-slot). Como resultado, no seguinte ele recebe as seguintes cotas diárias:
- 3.600 solicitações de preenchimento de código por dia
- 240 solicitações de geração de código por dia
- 120 verificações de tabelas de insights de dados, visualização e chat por dia
Caso sua organização ainda não tenha adquirido nenhuma Reservas da edição Plus até agora e depois de comprar um Enterprise Plus reserva da edição, você receberá a cota padrão dos seguintes itens para a primeiro mês completo:
- 7.500 solicitações de preenchimento de código por dia
- 500 solicitações de geração de código por dia
- 250 verificações de tabela de conversas, visualizações e insights de dados por dia
Se você começar a usar as reservas da edição Enterprise Plus no meio do mês, o a cota padrão será válida até o final do mês seguinte.
Solicitar aumento de cota
Para aumentar ou diminuir a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar uma cota maior.