Cotas de operação simultânea do Compute Engine


Neste documento, descrevemos as cotas de operações simultâneas do Compute Engine.

Cotas de operação simultânea

As cotas de operações simultâneas definem o número de operações simultâneas ou em andamento que podem ocorrer a qualquer momento. Qualquer solicitação de API que cria, modifica ou exclui um recurso do Compute Engine está sujeita a uma verificação de limite de operação simultânea para garantir que o número total de operações em trânsito em qualquer ponto não exceda o limite especificado para essa operação.

Erro de limite de operação simultânea excedido

Se o projeto exceder o limite de operações simultâneas para qualquer operação em trânsito, você receberá um erro 403 com o motivo rateLimitExceededs

A resposta da API do erro é semelhante a:

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Os detalhes do erro contêm os seguintes valores:

  • PROJECT_ID: o ID do projeto em que a cota excede o limite.

  • QUOTA_METRIC: a métrica da cota simultânea que excede o limite. Pode ser um destes:

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT: o nome do limite da cota simultânea. Pode ser um destes:

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE: a operação global ou regional para a qual a cota excede o limite. Para ver uma lista de operações, consulte Grupos de cota de operações simultâneas.

  • O location pode ser um dos seguintes:

    • global: especifica que o limite foi excedido para a cota de operação global.
    • REGION: especifica a região onde o limite foi excedido para a cota de operação.

Confira o uso e limites de cota de operação simultânea e leia as práticas recomendadas para reduzir esses erros de cota.

Grupos de cotas de operações simultâneas

Nesta seção, descrevemos os limites de várias operações em trânsito ou em tempo real do Compute Engine.

Cotas de operação globais

Operações globais simultâneas consomem um limite global especificado para os tipos de operação por projeto. A tabela a seguir lista as cotas globais para operações em andamento e as métricas correspondentes.

É possível visualizar a cota de operações globais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para mais informações, consulte Visualizar cotas e limites de operações simultâneas.

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent global operations per project
Limita o número total de operações globais simultâneas de um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

O URL da solicitação HTTP contém global para esses métodos. Por exemplo, o método networks.insert:
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Limita o número de operações simultâneas por projeto por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

A cota padrão de operações simultâneas é de 500 operações em andamento por projeto, exceto pelos métodos a seguir, que têm limites padrão diferentes:

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Cotas de operação regional

Operações regionais simultâneas consomem um limite regional especificado para os tipos de operação por projeto em uma determinada região.

A tabela a seguir lista as cotas regionais para operações em andamento e as métricas correspondentes.

É possível visualizar a cota de operações regionais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para mais informações, consulte Visualizar cotas e limites de operações simultâneas.

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent regional operations per project
Limita o número total de operações globais simultâneas de um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

O URL da solicitação HTTP contém regions ou zones para esses métodos.
Por exemplo, o método instances.insert:
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Limita o número de operações regionais simultâneas por projeto por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

A cota padrão de operações simultâneas é de 500 operações em andamento por projeto e por região, exceto pelos métodos a seguir, que têm limites padrão diferentes:

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Visualizar cotas e limites de operações simultâneas

Para visualizar o uso e os limites de cota em um projeto, faça o seguinte:

Console

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

    A página Cotas lista todo o uso e os limites das cotas para seu projeto. A lista é classificada por padrão para mostrar primeiramente as cotas mais usadas, o que ajuda a ver os limites que correm risco de serem excedidos.

  2. Para filtrar a lista e ver o uso e o limite de uma cota específica, selecione a Cota ou a Métrica no campo Filtro.

    Por exemplo, selecione a Cota Concurrent global operations per project operation type para saber o uso da cota para métodos globais por tipo de operação.

    Para filtrar a cota de uma operação específica, adicione Dimensões à consulta de filtro e selecione operation_type. Por exemplo, selecione firewalls_insert para ver o uso da cota e o limite da operação firewalls.insert.

gcloud

Use a CLI do Google Cloud para ver o uso e o limite de cotas de operação simultânea.

Para usar essa abordagem, instale o componente de comandos alfa. Se você estiver usando o Cloud Shell para interagir com o Google Cloud, a CLI do Google Cloud será instalada.

Para conferir a cota, use o seguinte comando:

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Substitua PROJECT_ID pelo ID do projeto com a cota que você quer visualizar.

Práticas recomendadas

A lista de verificação a seguir resume as práticas recomendadas para reduzir erros de limite de operações simultâneas insuficientes:

A seguir