Limites de taxa de API

Os limites de taxa de API definem o número de solicitações que podem ser feitas para a API Google Compute Engine. Esses limites são aplicados a cada projeto. Ao usar o gcloud compute ou o Console do Google Cloud Platform, você também faz solicitações à API, que são contabilizadas na limitação de taxa de API. Se você usar as contas de serviço para acessar a API, isso também é contabilizado no limite de taxa.

Atualmente, os projetos são limitados às categorias de limitação de taxa da API a seguir. Cada categoria de limite é contada separadamente. Dessa maneira, você atinge o limite máximo em cada categoria simultaneamente. Os limites de taxa são aplicados em intervalos de 100 segundos. Por exemplo, 20 solicitações/segundo seriam convertidas em 2.000 solicitações em 100 segundos. Isso significa que, se você atingir um limite específico a qualquer momento dentro de 100 segundos, precisará aguardar até que seu intervalo de cota seja atualizado para fazer mais solicitações.

  • Consultas - limites para todos os métodos, exceto *.get e *.list:
    • Taxa por projeto: 20 solicitações/segundo
    • Taxa por usuário: 20 solicitações/segundo
  • Solicitações de leitura - limites para métodos *.get:
    • Taxa por projeto: 20 solicitações/segundo
    • Taxa por usuário: 20 solicitações/segundo
  • Solicitações de lista - limites para métodos *.list:
    • Taxa por projeto: 20 solicitações/segundo
    • Taxa por usuário: 20 solicitações/segundo
  • Solicitações de leitura de operação - limites para métodos *OperationsService.Get:
    • Taxa por projeto: 20 solicitações/segundo
    • Taxa por usuário: 20 solicitações/segundo
  • Solicitações de leitura pesadas - limites para métodos *.AggregatedList:
    • Taxa por projeto: 10 solicitações/segundo
    • Taxa por usuário: 10 solicitações/segundo
  • Solicitações de mutação pesadas - limites para métodos patch, delete e insert para os recursos InterconnectsService e InterconnectAttachmentsService:
    • Taxa por projeto: 10 solicitações/segundo
    • Taxa por usuário: 10 solicitações/segundo
  • Solicitações de instância SimulateMaintenanceEvent - limites para métodos *.SimulateMaintenanceEvent:
    • Taxa por projeto: 2 solicitações/segundo
    • Taxa por usuário: 2 solicitações/segundo
  • Solicitações de inserção de licença - limites para métodos *.LicensesService.Insert:
    • Taxa por projeto: 2 solicitações/segundo
    • Taxa por usuário: 2 solicitações/segundo

Se precisar de uma limitação de taxa mais alta para as solicitações de API, solicite um aumento por meio do Console do Google Cloud Platform.

Práticas recomendadas

Veja algumas práticas recomendadas para ajudar você a trabalhar com os limites de taxa da API no Google Compute Engine.

  • Use o bursting com parcimônia e seletivamente. Bursting é o ato de permitir que um cliente específico faça muitas solicitações de API em um curto período de tempo. Geralmente, isso é feito em resposta a cenários excepcionais, como casos em que seu aplicativo precisa lidar com mais tráfego do que o normal. O bursting queima rapidamente seu limite de taxa da API, portanto, certifique-se de usá-lo somente quando necessário.

  • Use uma limitação de taxa no lado do cliente. Uma limitação de taxa no lado do cliente define um limite artificial para que o cliente em questão possa usar apenas uma determinada quantidade de cota. Isso impede que um só cliente consuma toda sua cota.

  • Use a retirada exponencial para distribuir progressivamente as solicitações quando atingir sua cota. Isso dá ao servidor tempo para reabastecer seus intervalos de cota.

  • Evite pesquisas curtas, em que seus clientes continuamente fazem solicitações ao servidor sem esperar por uma resposta. Se você fizer uma pesquisa curta, será mais difícil detectar solicitações incorretas que sejam contadas na sua cota, mesmo que elas não retornem dados úteis.

  • Divida seus aplicativos em vários projetos. Como as cotas são aplicadas em um nível por projeto, você pode dividir seus aplicativos para que cada aplicativo tenha um conjunto de cotas próprio dedicado.

  • Se você receber um erro 403 com a mensagem de erro rateLimitExceeded, aguarde alguns segundos e tente sua solicitação novamente. Os intervalos de cota são recarregados a cada 100 segundos, portanto, sua solicitação deve ser bem-sucedida depois que você ultrapassar esse intervalo.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Compute Engine