Cotas e limites

Este documento lista as cotas e os limites do sistema que se aplicam ao Gemini para Google Cloud.

  • As cotas especificam a quantidade de um recurso compartilhado e mensurável que pode ser usado. Elas são definidas por serviços do Google Cloud , como o Gemini para Google Cloud.
  • Os limites do sistema são valores fixos que não podem ser alterados.

OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso do Google Cloud para uso no projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, como hardwares, softwares e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud e impedem a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.

Em geral, as cotas se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Também há limites de sistemas nos recursos do Gemini. Não é possível alterar esses limites.

Solicitações por segundo

O Gemini para Google Cloud impõe cotas de solicitações por segundo para cada usuário em um projeto.

Cota Valor
Solicitações por segundo 2

Solicitações por dia

O Gemini para Google Cloud impõe cotas para o número total de solicitações por dia para cada usuário em um projeto.

Cota Valor
Solicitações por dia para o Gemini Code Assist ou o Gemini no BigQuery, como geração e conclusão de código. 6000
Solicitações por dia para chat, visualização, verificações de tabelas de insights de dados, geração de metadados, preparação de dados e outras solicitações que mostram respostas no painel Cloud Assist no console e nos ambientes de desenvolvimento do Google Cloud . 960

Cotas do Gemini Code Assist

O Gemini Code Assist impõe cotas para alguns recursos.

Cota Valor
Reconhecimento da base de código local Janela de contexto com 1 milhão de tokens
Repositórios de personalização de código 20.000

Cotas para o modo Agente e a CLI do Gemini

As cotas para solicitações do modo Agente do Gemini Code Assist e da CLI do Gemini são combinadas. No modo Agente ou ao usar a CLI do Gemini, um comando pode resultar em várias solicitações.

Cota Edição do Gemini Code Assist Valor
Solicitações por usuário a cada minuto Padrão 120
Enterprise 120
Solicitações por usuário por dia Padrão 1500
Enterprise 2000

Cotas do Gemini no BigQuery

Para recursos de assistência de programação, a cota para solicitações de código do Gemini Code Assist e do Gemini no BigQuery para recursos como preenchimento automático e geração de código é a mesma.

Para clientes que usam o Gemini no BigQuery com o BigQuery on demand para computação ou com as edições Enterprise ou Enterprise Plus, as cotas de recursos avançados, como insights de dados, são definidas com base no uso médio diário de TiB verificado ou nas horas de slot do último mês. Essa cota é aplicada no nível da organização e está disponível para todos os projetos nela. As cotas são arredondadas para o uso de 100 horas de slot mais próximo.

Cotas por 100 horas de slot (uso médio diário das edições Enterprise ou Enterprise Plus) ou por TiB verificado usando o modelo de computação on demand Valor
Solicitações por dia para chat, visualização, verificações de tabela e outras solicitações que mostram respostas no painel do Cloud Assist no console Google Cloud . 5

Exemplo: uma organização que tem uma reserva da edição Enterprise com 100 slots como valor de referência usa, em média, 2.400 horas de slot por dia (100 slots * 24 horas = 2.400 horas de slot). Consequentemente, no mês seguinte, são atribuídas as seguintes cotas diárias:

  • 120 chats, visualizações, verificações de tabela de insights de dados e gerações automáticas de metadados por dia

Se sua organização não tiver comprado slots da edição Enterprise ou Enterprise Plus do BigQuery nem computação on demand (TiB) até agora, após o primeiro uso, você vai receber a cota padrão do seguinte no primeiro mês:

  • 250 chats, visualizações, verificações de tabela de insights de dados e gerações automáticas de metadados por dia

Se você começar a usar reservas de computação on demand da edição Enterprise ou da edição Enterprise Plus no meio do mês, a cota padrão será aplicada até o fim do mês seguinte.

Solicitar aumento de cota

Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar ajuste de cota.