Neste documento, descrevemos as cotas e os limites que se aplicam a Gemini para Google Cloud.
Uma cota restringe quanto de um determinado recurso compartilhado do Google Cloud o projeto do Google Cloud pode usar, incluindo hardware, software e componentes de rede. Dessa forma, as cotas fazem parte de um sistema que:
- monitora o uso ou o consumo de produtos e serviços do Google Cloud;
- restringe o consumo desses recursos por motivos, que garantem imparcialidade e reduzem picos de uso;
- mantém as configurações que aplicam automaticamente restrições prescritas;
- fornece um meio de solicitar ou faz alterações na cota.
Na maioria dos casos, quando uma cota é excedida, o sistema bloqueia imediatamente o acesso ao recurso relevante do Google. Além disso, a tarefa que você está tentando executar falha. Na maioria dos casos, as cotas se aplicam a todos os projetos do Google Cloud. Além disso, elas são compartilhadas entre todos os aplicativos e endereços IP que usam esse projeto.
Também há limites para os recursos do Gemini. Esses limites não estão relacionados ao sistema de cotas. Não é possível mudar os limites, a menos que seja indicado o contrário.
Solicitações por segundo
O Gemini para Google Cloud aplica cotas nas solicitações por segundo para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por segundo | 2 |
Solicitações por dia
O Gemini para Google Cloud aplica cotas para o número total solicitações por dia para cada usuário em um projeto.
Cota | Valor |
---|---|
Solicitações por dia para solicitações de código do Gemini Code Assist, como código e preenchimento de código. | 6.000 |
Solicitações por dia de chat e outras solicitações que exibem respostas no Gemini no console do Google Cloud e nos ambientes de desenvolvimento integrado. | 240 |
Solicitar aumento de cota
Para aumentar ou diminuir a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar uma cota maior.