Cotas e limites

Neste documento, listamos as quotas e os quotas que se aplicam ao Gemini para Google Cloud.

Uma cota restringe quanto de um determinado recurso compartilhado do Google Cloud o projeto do Google Cloud pode usar, incluindo hardware, software e componentes de rede. Dessa forma, as cotas fazem parte de um sistema que:

  • monitora o uso ou o consumo de produtos e serviços do Google Cloud;
  • restringe o consumo desses recursos por motivos, que garantem imparcialidade e reduzem picos de uso;
  • mantém as configurações que aplicam automaticamente restrições prescritas;
  • fornece um meio de solicitar ou faz alterações na cota.

Na maioria dos casos, quando uma cota é excedida, o sistema bloqueia imediatamente o acesso ao recurso relevante do Google. Além disso, a tarefa que você está tentando executar falha. Na maioria dos casos, as cotas se aplicam a todos os projetos do Google Cloud. Além disso, elas são compartilhadas entre todos os aplicativos e endereços IP que usam esse projeto.

Também há limites para os recursos do Gemini. Esses limites não estão relacionados ao sistema de cotas. Não é possível mudar os limites, a menos que seja indicado o contrário.

Solicitações por segundo

O Gemini para Google Cloud aplica cotas nas solicitações por segundo para cada usuário em um projeto.

Cota Valor
Solicitações por segundo 2

Solicitações por dia

O Gemini para Google Cloud aplica cotas para o número total de solicitações por dia para cada usuário em um projeto.

Cota Valor
Solicitações por dia para solicitações de código do Gemini Code Assist, como geração e preenchimento de código. 6.000
Solicitações por dia de chat e outras solicitações que mostram respostas no painel Gemini no console do Google Cloud e nos ambientes de desenvolvimento integrado. 240

Solicitar aumento de cota

Para aumentar ou diminuir a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar uma cota maior.