Cotas de taxa do Compute Engine

Neste documento, listamos as cotas de taxa do Compute Engine, que definem o número de solicitações que podem ser feitas aos métodos da API Compute Engine.

cotas de taxa.

As cotas de taxa (também conhecidas como limites de taxa de API ou cotas de API) definem o número de solicitações que podem ser feitas para a API Compute Engine. Essas cotas se aplicam por projeto. Cada cota se aplica a um grupo de um ou mais métodos da API Compute Engine. Ao usar a CLI gcloud ou o console do Google Cloud, você também faz solicitações à API, e essas solicitações são contabilizadas na sua cota de taxa. Se você usar as contas de serviço para acessar a API, isso também será contabilizado na cota de taxa.

O Google aplica cotas de taxa a um intervalo por minuto (60 segundos) para cada grupo. Isso significa que, se seu projeto atingir o número máximo de solicitações de API a qualquer momento dentro de 60 segundos, será necessário esperar que a cota de taxa seja recarregada antes de fazer mais solicitações nesse grupo. Se o projeto exceder um limite de taxa, você receberá um erro 403 com o motivo rateLimitExceeded. Para resolver esse erro, aguarde um minuto e tente sua solicitação novamente. A cota precisa ser restaurada novamente no início do próximo intervalo.

O número de solicitações que você pode fazer à API Compute Engine é definido por grupos de cota, conforme descrito nas tabelas a seguir. Cada grupo é contado separadamente. Dessa maneira, você atinge a cota máxima em cada grupo simultaneamente.

Cotas de taxa para métricas globais

Os grupos de cotas a seguir se aplicam a todos os recursos, a menos que especificado de outra forma:

Grupo de cotas Descrição	Nome da métrica	Cota padrão
Consultas Cota para métodos de mutação global. Os métodos `get` a seguir também usam essa métrica `default`: `networkFirewallPolicies.get` `projects.getXpnHost` `projects.getXpnResources`	`compute.googleapis.com/default`	Cota por projeto (`defaultPerMinutePerProject`): 1.500 solicitações/minuto
Solicitações de leitura Cota para métodos `*.get` globais.	`compute.googleapis.com/read_requests`	Cota por projeto (`ReadRequestsPerMinutePerProject`): 1.500 solicitações/minuto
Solicitações de lista Cota para métodos `*.list` globais.	`compute.googleapis.com/list_requests`	Cota por projeto (`ListRequestsPerMinutePerProject`): 1.500 solicitações/minuto
Solicitações de leitura da operação Cota para o método `globalOperations.get`.	`compute.googleapis.com/operation_read_requests`	Taxa por projeto (`OperationReadRequestsPerMinutePerProject`): 1.500 solicitações/minuto
Sobrecarga de custo da lista filtrada Cota para os métodos `.list` e `.aggregatedList` com filtros. O Google Cloud cobra o uso de cotas por essa métrica, além das cotas nas métricas `compute.googleapis.com/list_requests` e `compute.googleapis.com/heavy_weight_read_requests`. Você receberá cobranças de cota se houver mais de 10 mil recursos filtrados nas solicitações de lista. A API Compute Engine rejeitará as solicitações de lista se você exceder esse limite de cota.	`compute.googleapis.com/filtered_list_cost_overhead`^BETA	Cota por projeto (`ListRequestsFilterCostOverheadPerMinutePerProject`): 750 mil recursos filtrados/minuto Observação: não é possível solicitar um limite maior para essa cota. Para evitar problemas de cota, otimize os filtros de solicitação de lista ou use os filtros de lista no lado do cliente.
Solicitações globais de mutação de recursos Cota para os métodos `images.delete`, `images.deprecate`, `images.insert`, `images.setLabels`, `snapshots.delete`, `snapshots.insert`, `snapshots.setLabels` , `machineImages.insert` e `machineImages.delete`.	`compute.googleapis.com/global_resource_write_requests`	Taxa por projeto (`GlobalResourceWriteRequestsPerMinutePerProject`): 375 solicitações/minuto
Solicitações de mutação pesadas Cota para métodos `patch`, `delete` e `insert` para os recursos `interconnects`.	`compute.googleapis.com/heavy_weight_write_requests`	Taxa por projeto (`HeavyWeightWriteRequestsPerMinutePerProject`): 750 solicitações/minuto
Solicitações de leitura pesadas Cota para métodos `*.aggregatedList`.	`compute.googleapis.com/heavy_weight_read_requests`	Taxa por projeto (`HeavyWeightReadRequestsPerMinutePerProject`): 750 solicitações/minuto

Os seguintes grupos de cotas se aplicam a APIs globais com cotas por método:

Grupo de cotas Descrição	Nome da métrica	Limite padrão
Solicitações de inserção de licença Cotas para o método `licenses.insert`.	`compute.googleapis.com/license_insert_requests`	Cota por projeto (`LicenseInsertRequestsPerMinutePerProject`): 2,5 solicitações/segundo (150 solicitações/minuto) Cota diária por projeto (`LicenseInsertRequestsPerDayPerProject`): 30 solicitações/dia
Configurações do projeto de solicitações comuns de metadados de instância Cota para o método `projects.setCommonInstanceMetadata`.	`compute.googleapis.com/project_set_common_instance_metadata_requests`	Cota por projeto (`ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject`): 36 solicitações/minuto

Cotas de taxa para métricas regionais

Os limites a seguir se aplicam aos métodos que usam métricas regionais:

Grupo de cotas Descrição	Nome da métrica	Cota padrão Cota por projeto por região
Consultas Cota para métodos regionais e zonais que criam, modificam ou excluem recursos do Compute Engine. Por exemplo, os métodos `instances.insert`, `disks.update` e `instances.delete`. Os métodos `get`, `list` e `patch` a seguir também usam essa métrica `default_per_region`: `projects.listXpnHosts` `instances.getScreenshot` `instances.getGuestAttributes` `instances.getShieldedInstanceIdentity` `instances.getEffectiveFirewalls` `projects.listXpnHosts` `instanceGroupManagers.listManagedInstances` `instanceGroupManagers.listErrors` `instanceGroupManagers.listPerInstanceConfigs` `regionInstanceGroupManagers.listManagedInstances` `regionInstanceGroupManagers.listErrors` `regionInstanceGroupManagers.listPerInstanceConfigs` `resourcePolicies.patch`	`compute.googleapis.com/default_per_region`	`Queries per minute per region`: 1500
Solicitações de leitura Cota para métodos `get` regionais e zonais, como `autoscalers.get`, `disks.get`, `instances.get` e `machineTypes.get`.	`compute.googleapis.com/read_requests_per_region`	`Read requests per minute per region`: 1500
Solicitações de lista Cota para métodos `list` regionais e zonais, como `autoscalers.list`, `disks.list`, `instances.list` e `machineTypes.list`.	`compute.googleapis.com/list_requests_per_region`	`List requests per minute per region`: 1500
Sobrecarga de custo da lista filtrada Cota para os métodos `.list` e `.aggregatedList` com filtros. O Google Cloud cobra o uso de cotas por essa métrica, além das cotas nas métricas `compute.googleapis.com/list_requests_per_region` e `compute.googleapis.com/heavy_weight_read_requests_per_region`. Você receberá cobranças de cota se houver mais de 10 mil recursos filtrados nas solicitações de lista. A API Compute Engine rejeitará as solicitações de lista se você exceder esse limite de cota.	`compute.googleapis.com/filtered_list_cost_overhead_per_region`^BETA	Cota por projeto (`ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion`): 750 mil recursos filtrados/minuto Observação: não é possível solicitar um limite maior para essa cota. Para evitar problemas de cota, otimize os filtros de solicitação de lista ou use os filtros de lista no lado do cliente.
Solicitações de leitura de operações Cota para os métodos `regionOperations.get` e `zoneOperations.get`.	`compute.googleapis.com/operation_read_requests_per_region`	`Operation read requests per minute per region`: 1500
Solicitações globais de mutação de recursos por região Cota para os métodos `disks.createSnapshot` e `regionDisks.createSnapshot`.	`compute.googleapis.com/global_resource_write_requests_per_region`	`GlobalResourceWriteRequestsPerMinutePerProjectPerRegion`: 375
Solicitações get de saída da porta serial de instância Cota para o método `instances.getSerialPortOutput`.	`compute.googleapis.com/get_serial_port_output_requests_per_region`	`GetSerialPortOutputRequestsPerMinutePerProjectPerRegion`: 1500
Solicitações de leitura pesadas Cota para métodos `regionOperations.wait`, `zoneOperations.wait` e `regionNetworkFirewallPolicies.getEffectiveFirewalls`.	`compute.googleapis.com/heavy_weight_read_requests_per_region`	`Heavyweight read requests per minute`: 750
Solicitações de mutação pesadas por região Cota para os métodos `patch`, `delete` e `insert` para o recurso `interconnectAttachments` e para o método `networks.updatePeering`.	`compute.googleapis.com/heavy_weight_write_requests_per_region`	`HeavyWeightWriteRequestsPerMinutePerProjectPerRegion`: 750
Solicitações de simulação de eventos de manutenção de instância Cota para o método `instances.simulateMaintenanceEvent`.	`compute.googleapis.com/simulate_maintenance_event_requests_per_region`	`SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion`: 150
Solicitações de referenciadores da lista de instâncias Cota para o método `instances.listReferrers`.	`compute.googleapis.com/instance_list_referrers_requests_per_region`	`InstanceListReferrersRequestsPerMinutePerProjectPerRegion`: 3000
Solicitações de gravação do endpoint da rede Cota para os métodos `networkEndpointGroups.attachNetworkEndpoints` e `networkEndpointGroups.detachNetworkEndpoints`	`compute.googleapis.com/network_endpoint_write_requests_per_region`	`NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion`: 1500
Solicitações da lista de endpoints da rede Cota para o método `networkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/network_endpoint_list_requests_per_region`	`NetworkEndpointListRequestsPerMinutePerProjectPerRegion`: 1500
Solicitações de gravação do endpoint de rede regional Cota para os métodos `regionNetworkEndpointGroups.attachNetworkEndpoints` e `regionNetworkEndpointGroups.detachNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_write_requests_per_region`	`RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion`: 150
Solicitações da lista de endpoints da rede regional Cota para o método `regionNetworkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_list_requests_per_region`	`RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion`: 1500

Solicitar um aumento nas cotas de taxa

Se você precisar de uma cota maior para fazer solicitações de API, solicite um aumento na cota da API no console do Google Cloud. Para mais detalhes, consulte Como solicitar um limite de cota maior.

Práticas recomendadas

Siga as práticas recomendadas da API Compute Engine para preservar as cotas de taxa e atenuar os efeitos das cotas de taxa.

A seguir

Saiba mais sobre Como monitorar o uso da API.
Saiba como configurar alertas de uso de cota.