Quotas e limites

Este documento lista as quotas e os limites do sistema que se aplicam ao Gemini for Google Cloud.

  • As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema de quotas da nuvem faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Também existem limites do sistema nos recursos do Gemini. Não é possível alterar os limites do sistema.

Pedidos por segundo

O Gemini for Google Cloud aplica quotas aos pedidos por segundo para cada utilizador num projeto.

Quota Valor
Pedidos por segundo 2

Pedidos por dia

O Gemini for Google Cloud aplica quotas ao número total de pedidos por dia para cada utilizador num projeto.

Quota Valor
Pedidos por dia para o Gemini Code Assist ou o Gemini em pedidos de código do BigQuery, como geração de código e conclusão de código. 6000
Pedidos por dia para chat, visualização, verificações de tabelas de estatísticas de dados, geração de metadados, preparação de dados e outros pedidos que apresentam respostas no painel do Cloud Assist na consola e nos IDEs. Google Cloud 960

Quotas para o Gemini Code Assist

O Gemini Code Assist aplica quotas a determinadas funcionalidades.

Quota Valor
Deteção da base de código local Capacidade de resposta de 1 000 000 de tokens
Repositórios de personalização de código 20 000

Quotas para o modo de agente e a CLI do Gemini

As quotas para pedidos do modo de agente do Gemini Code Assist e da CLI do Gemini estão combinadas. Quando está no modo de agente ou quando usa a CLI Gemini, um comando pode resultar em vários pedidos.

Quota Edição do Gemini Code Assist Valor
Pedidos por utilizador por minuto Standard 120
Enterprise 120
Pedidos por utilizador por dia Standard 1500
Enterprise 2000

Quotas para o Gemini no BigQuery

Para as funcionalidades de assistência de código, a quota para o Gemini Code Assist e o Gemini em pedidos de código do BigQuery para funcionalidades como o preenchimento automático e a geração de código é a mesma.

Para os clientes que usam o Gemini no BigQuery com o computação a pedido do BigQuery ou com as edições Enterprise ou Enterprise Plus, as quotas para funcionalidades avançadas, como as estatísticas de dados, são fornecidas com base na utilização média diária de TiB analisados ou nas horas de slots do último mês civil completo. Esta quota aplica-se ao nível da organização e está disponível para todos os projetos nessa organização. As quotas são arredondadas para o uso de slots-horas mais próximo de 100.

Quotas por 100 horas de slots (utilização média diária da edição Enterprise ou Enterprise Plus) ou por TiB analisado através do modelo de computação a pedido Valor
Pedidos por dia para chat, visualização, análises de tabelas e outros pedidos que apresentam respostas no painel Cloud Assist na consola Google Cloud . 5

Exemplo: uma organização que tenha uma reserva da edição Enterprise com 100 espaços como base vai usar uma média de 2400 horas de espaço por dia (100 espaços * 24 horas = 2400 horas de espaço). Como resultado, no mês seguinte, recebe as seguintes quotas diárias:

  • 120 chats, visualizações, análises de tabelas de estatísticas de dados e gerações de metadados automáticas por dia

Se a sua organização não tiver comprado nenhum slot da edição Enterprise do BigQuery, da edição Enterprise Plus ou de computação a pedido (TiB) até agora, após a primeira utilização, recebe a quota predefinida do seguinte para o primeiro mês civil completo:

  • 250 chats, visualizações, análises de tabelas de estatísticas de dados e gerações de metadados automáticas por dia

Se começar a usar reservas de computação a pedido, edição Enterprise ou edição Enterprise Plus a meio do mês, a quota predefinida aplica-se até ao final do mês seguinte.

Peça um aumento da quota

Para ajustar a maioria das quotas, use a Google Cloud consola. Para mais informações, consulte o artigo Peça um ajuste da quota.