Cuotas de operaciones simultáneas de Compute Engine


En este documento, se describen las cuotas de operaciones simultáneas para Compute Engine.

Cuotas de operaciones simultáneas

Las cuotas de operaciones simultáneas definen la cantidad de operaciones en tránsito o simultáneas que pueden ocurrir en cualquier momento. Cualquier solicitud a la API que crea, modifica o borra un recurso de Compute Engine está sujeta a una verificación de límite de operación simultánea para garantizar que la cantidad total de operaciones en tránsito en cualquier momento no exceda. el límite especificado para esa operación.

Error de límite de operaciones simultáneas excedido

Si tu proyecto excede el límite de operaciones simultáneas para cualquier operación en tránsito, recibirás un error 403 con el motivo rateLimitExceeded.

La respuesta de la API del error es similar al siguiente:

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Los detalles del error contienen los siguientes valores:

  • PROJECT_ID: ID del proyecto en el que la cuota excede el límite.

  • QUOTA_METRIC: métrica de la cuota simultánea que excede el límite. Puede ser uno de los siguientes:

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT: el nombre del límite de la cuota simultánea. Puede ser uno de los siguientes:

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE: La operación global o regional para la que la cuota excede el límite. Para obtener una lista de operaciones, consulta Grupos de cuotas de operaciones simultáneas.

  • El location puede ser uno de los siguientes:

    • global: Especifica que se superó el límite para la cuota de operación global
    • REGION: Especifica la región en la que se superó el límite de la cuota de operación.

Los registros de errores detallados solo se devuelven a través de la respuesta de la API. El error en el Explorador de registros es similar al siguiente:

   "protoPayload":{
    "@type": "type.googleapis.com/google.cloud.audit.AuditLog",
    "status": {
      "message": "Rate Limit Exceeded"
    }
    "serviceName": "compute.googleapis.com",
    "methodName": "METHOD_NAME",
    ...
    ...
    "response": {
      "error": {
        "message": "Rate Limit Exceeded",
        "code": 403,
        "errors": [
          {
            "message": "Rate Limit Exceeded",
            "reason": "rateLimitExceeded",
            "domain": "usageLimits"
          }
        ]
      },
      "@type": "type.googleapis.com/error"
    },
    ...
    ... 

El METHOD_NAME en el error representa el método de la API para el que se superó el límite de frecuencia. Un ejemplo es v1.compute.instances.stop.

Grupos de cuotas de operaciones simultáneas

En esta sección se describen los límites de varias operaciones simultáneas o en tránsito de Compute Engine.

Cuotas de operaciones globales

Las operaciones globales simultáneas consumen un límite global que se especifica para los tipos de operación por proyecto. En la siguiente tabla, se enumeran las cuotas globales para las operaciones en tránsito y las métricas correspondientes.

Puedes ver la cuota de las operaciones globales con la consola de Google Cloud, Google Cloud CLI y la API de Service Usage. Para obtener más información, consulta Visualiza las cuotas y los límites de operaciones simultáneas.

Nombre de la cuota
Descripción
Nombre de la métrica Métodos que consumen esta cuota
Concurrent global operations per project
Limita la cantidad total de operaciones globales simultáneas de un proyecto.

Consulta esta cuota en la consola de Google Cloud:

compute.googleapis.com/global_concurrent_operations

Todos los métodos globales

La URL de la solicitud HTTP contiene global para estos métodos. Por ejemplo, el método networks.insert:
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Limita la cantidad de operaciones simultáneas por proyecto y por tipo de operación.

Consulta esta cuota en la consola de Google Cloud:

compute.googleapis.com/global_concurrent_operations

Todos los métodos globales

La cuota de operaciones simultáneas predeterminadas es de 500 operaciones en tránsito por proyecto, excepto para los siguientes métodos, que tienen diferentes límites predeterminados:

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Cuotas de operaciones regionales

Las operaciones regionales simultáneas consumen un límite regional que se especifica para los tipos de operación por proyecto en una región determinada.

En la siguiente tabla se enumeran las cuotas regionales para las operaciones en tránsito y las métricas correspondientes.

Puedes ver la cuota de las operaciones regionales mediante la consola de Google Cloud, Google Cloud CLI y la API de Service Usage. Para obtener más información, consulta Visualiza las cuotas y los límites de operaciones simultáneas.

Nombre de la cuota
Descripción
Nombre de la métrica Métodos que consumen esta cuota
Concurrent regional operations per project
Limita la cantidad total de operaciones regionales simultáneas de un proyecto.

Consulta esta cuota en la consola de Google Cloud:

compute.googleapis.com/regional_concurrent_operations

Todos los métodos regionales

La URL de solicitud HTTP contiene regions o zones para estos métodos.
Por ejemplo, el método instances.insert:
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Limita la cantidad de operaciones regionales simultáneas por proyecto y por tipo de operación.

Consulta esta cuota en la consola de Google Cloud:

compute.googleapis.com/regional_concurrent_operations

Todos los métodos regionales

La cuota de operaciones simultáneas predeterminadas es de 500 operaciones en tránsito por proyecto y por región, excepto los siguientes métodos, que tienen diferentes límites predeterminados:

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Visualiza las cuotas y los límites de operaciones simultáneas

Para ver el uso de la cuota y los límites de un proyecto, haz lo siguiente:

Console

  1. En la consola de Google Cloud, ve a la página Cuotas.

    Ir a Cuotas

    En la página Cuotas se muestra una lista de todos los usos y límites de la cuota para tu proyecto. De forma predeterminada, la lista se ordena para mostrar primero las cuotas más usadas, lo que te ayuda a ver los límites que están en riesgo de excederse.

  2. Para filtrar la lista y ver el uso y el límite de una cuota específica, selecciona Cuota o Métrica en el campo Filtro.

    Por ejemplo, selecciona la cuota Concurrent global operations per project operation type para ver el uso de la cuota de métodos globales por tipo de operación.

    Para filtrar la cuota de una operación específica, agrega Dimensiones a la consulta de filtro y selecciona el tipo de operación. Por ejemplo, selecciona firewalls_insert para ver el uso y el límite de la cuota de la operación firewalls.insert.

gcloud

Puedes usar Google Cloud CLI para ver el uso y el límite de las cuotas de operaciones simultáneas.

Para usar este enfoque, asegúrate de haber instalado el componente de comandos alfa. Si usas Cloud Shell para interactuar con Google Cloud, se instala Google Cloud CLI de manera automática.

Para ver la cuota, usa el siguiente comando:

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Reemplaza PROJECT_ID por el ID del proyecto para el que deseas ver la cuota.

Prácticas recomendadas

En la siguiente lista de tareas, se resumen las prácticas recomendadas para reducir los errores de límite insuficiente de operaciones simultáneas:

¿Qué sigue?