Cotas de taxa do Compute Engine


Neste documento, listamos as cotas de taxa do Compute Engine, que definem o número de solicitações que podem ser feitas aos métodos da API Compute Engine.

cotas de taxa.

As cotas de taxa (também conhecidas como limites de taxa de API ou cotas de API) definem o número de solicitações que podem ser feitas para a API Compute Engine. Essas cotas se aplicam por projeto. Cada cota se aplica a um grupo de um ou mais métodos da API Compute Engine. Ao usar a CLI gcloud ou o console do Google Cloud, você também faz solicitações à API, e essas solicitações são contabilizadas na sua cota de taxa. Se você usar as contas de serviço para acessar a API, isso também será contabilizado na cota de taxa.

O Google aplica cotas de taxa a um intervalo por minuto (60 segundos) para cada grupo. Isso significa que, se seu projeto atingir o número máximo de solicitações de API a qualquer momento dentro de 60 segundos, será necessário esperar que a cota de taxa seja recarregada antes de fazer mais solicitações nesse grupo. Se o projeto exceder um limite de taxa, você receberá um erro 403 com o motivo rateLimitExceeded. Para resolver esse erro, aguarde um minuto e tente sua solicitação novamente. A cota precisa ser restaurada novamente no início do próximo intervalo.

O número de solicitações que você pode fazer à API Compute Engine é definido por grupos de cota, conforme descrito nas tabelas a seguir. Cada grupo é contado separadamente. Dessa maneira, você atinge a cota máxima em cada grupo simultaneamente.

Cotas de taxa para métricas globais

Os grupos de cotas a seguir se aplicam a todos os recursos, a menos que especificado de outra forma:

Grupo de cotas
Descrição
Nome da métrica Cota padrão
Consultas
Cota para métodos de mutação global.

Os métodos get a seguir também usam essa métrica default:

  • networkFirewallPolicies.get
  • projects.getXpnHost
  • projects.getXpnResources
compute.googleapis.com/default Cota por projeto (defaultPerMinutePerProject): 1.500 solicitações/minuto
Solicitações de leitura
Cota para métodos *.get globais.
compute.googleapis.com/read_requests Cota por projeto (ReadRequestsPerMinutePerProject): 1.500 solicitações/minuto
Solicitações de lista
Cota para métodos *.list globais.
compute.googleapis.com/list_requests Cota por projeto (ListRequestsPerMinutePerProject): 1.500 solicitações/minuto
Solicitações de leitura da operação
Cota para o método globalOperations.get.
compute.googleapis.com/operation_read_requests Taxa por projeto (OperationReadRequestsPerMinutePerProject): 1.500 solicitações/minuto
Sobrecarga de custo da lista filtrada

Cota para os métodos *.list e *.aggregatedList com filtros.

O Google Cloud cobra o uso de cotas por essa métrica, além das cotas nas métricas compute.googleapis.com/list_requests e compute.googleapis.com/heavy_weight_read_requests. Você receberá cobranças de cota se houver mais de 10 mil recursos filtrados nas solicitações de lista. A API Compute Engine rejeitará as solicitações de lista se você exceder esse limite de cota.

compute.googleapis.com/filtered_list_cost_overheadBETA Cota por projeto (ListRequestsFilterCostOverheadPerMinutePerProject): 750 mil recursos filtrados/minuto
Solicitações globais de mutação de recursos
Cota para os métodos images.delete, images.deprecate, images.insert, images.setLabels, snapshots.delete, snapshots.insert, snapshots.setLabels , machineImages.insert e machineImages.delete.
compute.googleapis.com/global_resource_write_requests Taxa por projeto (GlobalResourceWriteRequestsPerMinutePerProject): 375 solicitações/minuto
Solicitações de mutação pesadas
Cota para métodos patch, delete e insert para os recursos interconnects.
compute.googleapis.com/heavy_weight_write_requests Taxa por projeto (HeavyWeightWriteRequestsPerMinutePerProject): 750 solicitações/minuto
Solicitações de leitura pesadas
Cota para métodos *.aggregatedList.
compute.googleapis.com/heavy_weight_read_requests Taxa por projeto (HeavyWeightReadRequestsPerMinutePerProject): 750 solicitações/minuto

Os seguintes grupos de cotas se aplicam a APIs globais com cotas por método:

Grupo de cotas
Descrição
Nome da métrica Limite padrão
Solicitações de inserção de licença
Cotas para o método licenses.insert.
compute.googleapis.com/license_insert_requests
  • Cota por projeto (LicenseInsertRequestsPerMinutePerProject): 2,5 solicitações/segundo (150 solicitações/minuto)
  • Cota diária por projeto (LicenseInsertRequestsPerDayPerProject): 30 solicitações/dia
Configurações do projeto de solicitações comuns de metadados de instância
Cota para o método projects.setCommonInstanceMetadata.
compute.googleapis.com/project_set_common_instance_metadata_requests Cota por projeto (ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject): 36 solicitações/minuto

Cotas de taxa para métricas regionais

Os limites a seguir se aplicam aos métodos que usam métricas regionais:

Grupo de cotas
Descrição
Nome da métrica Cota padrão
Cota por projeto por região
Consultas
Cota para métodos regionais e zonais que criam, modificam ou excluem recursos do Compute Engine. Por exemplo, os métodos instances.insert, disks.update e instances.delete.

Os métodos get, list e patch a seguir também usam essa métrica default_per_region:

  • projects.listXpnHosts
  • instances.getScreenshot
  • instances.getGuestAttributes
  • instances.getShieldedInstanceIdentity
  • instances.getEffectiveFirewalls
  • projects.listXpnHosts
  • instanceGroupManagers.listManagedInstances
  • instanceGroupManagers.listErrors
  • instanceGroupManagers.listPerInstanceConfigs
  • regionInstanceGroupManagers.listManagedInstances
  • regionInstanceGroupManagers.listErrors
  • regionInstanceGroupManagers.listPerInstanceConfigs
  • resourcePolicies.patch
compute.googleapis.com/default_per_region Queries per minute per region: 1500
Solicitações de leitura
Cota para métodos get regionais e zonais, como autoscalers.get, disks.get, instances.get e machineTypes.get.
compute.googleapis.com/read_requests_per_region Read requests per minute per region: 1500
Solicitações de lista
Cota para métodos list regionais e zonais, como autoscalers.list, disks.list, instances.list e machineTypes.list.
compute.googleapis.com/list_requests_per_region List requests per minute per region: 1500
Sobrecarga de custo da lista filtrada

Cota para os métodos *.list e *.aggregatedList com filtros.

O Google Cloud cobra o uso de cotas por essa métrica, além das cotas nas métricas compute.googleapis.com/list_requests_per_region e compute.googleapis.com/heavy_weight_read_requests_per_region. Você receberá cobranças de cota se houver mais de 10 mil recursos filtrados nas solicitações de lista. A API Compute Engine rejeitará as solicitações de lista se você exceder esse limite de cota.

compute.googleapis.com/filtered_list_cost_overhead_per_regionBETA Cota por projeto (ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion): 750 mil recursos filtrados/minuto
Solicitações de leitura de operações
Cota para os métodos regionOperations.get e zoneOperations.get.
compute.googleapis.com/operation_read_requests_per_region Operation read requests per minute per region: 1500
Solicitações globais de mutação de recursos por região
Cota para os métodos disks.createSnapshot e regionDisks.createSnapshot.
compute.googleapis.com/global_resource_write_requests_per_region GlobalResourceWriteRequestsPerMinutePerProjectPerRegion: 375
Solicitações get de saída da porta serial de instância
Cota para o método instances.getSerialPortOutput.
compute.googleapis.com/get_serial_port_output_requests_per_region GetSerialPortOutputRequestsPerMinutePerProjectPerRegion: 1500
Solicitações de leitura pesadas
Cota para métodos regionOperations.wait, zoneOperations.wait e regionNetworkFirewallPolicies.getEffectiveFirewalls.
compute.googleapis.com/heavy_weight_read_requests_per_region Heavyweight read requests per minute: 750
Solicitações de mutação pesadas por região
Cota para os métodos patch, delete e insert para o recurso interconnectAttachments e para o método networks.updatePeering.
compute.googleapis.com/heavy_weight_write_requests_per_region HeavyWeightWriteRequestsPerMinutePerProjectPerRegion: 750
Solicitações de simulação de eventos de manutenção de instância
Cota para o método instances.simulateMaintenanceEvent.
compute.googleapis.com/simulate_maintenance_event_requests_per_region SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion: 150
Solicitações de referenciadores da lista de instâncias
Cota para o método instances.listReferrers.
compute.googleapis.com/instance_list_referrers_requests_per_region InstanceListReferrersRequestsPerMinutePerProjectPerRegion: 3000
Solicitações de gravação do endpoint da rede
Cota para os métodos networkEndpointGroups.attachNetworkEndpoints e networkEndpointGroups.detachNetworkEndpoints
compute.googleapis.com/network_endpoint_write_requests_per_region NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion: 1500
Solicitações da lista de endpoints da rede
Cota para o método networkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/network_endpoint_list_requests_per_region NetworkEndpointListRequestsPerMinutePerProjectPerRegion: 1500
Solicitações de gravação do endpoint de rede regional
Cota para os métodos regionNetworkEndpointGroups.attachNetworkEndpoints e regionNetworkEndpointGroups.detachNetworkEndpoints.
compute.googleapis.com/regional_network_endpoint_write_requests_per_region RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion: 150
Solicitações da lista de endpoints da rede regional
Cota para o método regionNetworkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/regional_network_endpoint_list_requests_per_region RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion: 1500

Solicitar um aumento nas cotas de taxa

Se você precisar de uma cota maior para fazer solicitações de API, solicite um aumento na cota da API no console do Google Cloud. Para mais detalhes, consulte Como solicitar um limite de cota maior.

Práticas recomendadas

Siga as práticas recomendadas da API Compute Engine para preservar as cotas de taxa e atenuar os efeitos das cotas de taxa.

A seguir