Quotas d'opérations simultanées Compute Engine


Ce document décrit les quotas d'opérations simultanées pour Compute Engine.

Quotas d'opérations simultanées

Les quotas d'opérations simultanées définissent le nombre d'opérations pouvant être menées en même temps à un instant T. Toute requête API qui crée, modifie ou supprime une ressource Compute Engine est soumise à une vérification concernant la limite d'opérations simultanées, pour s'assurer que le nombre total d'opérations en cours ne dépasse pas la limite spécifiée pour cette opération.

Erreur de limite de l'opération simultanée dépassée

Si votre projet dépasse la limite d'opérations simultanées pour toute opération en cours de transfert, vous recevez une erreur 403 pour le motif suivant : rateLimitExceeded.

La réponse de l'API correspondant à cette erreur ressemble à ceci :

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Les détails de l'erreur contiennent les valeurs suivantes :

  • PROJECT_ID : ID du projet dans lequel le quota dépasse la limite.

  • QUOTA_METRIC : métrique du quota d'opérations simultanées dépassant la limite définie. Elle peut correspondre à l'une des suivantes :

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT : nom de la limite du quota d'opérations simultanées. Il peut s'agir de l'un des suivants :

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE : opération globale ou régionale pour laquelle le quota dépasse la limite. Pour obtenir la liste des opérations, consultez la section Groupes de quotas d'opérations simultanées.

  • L'élément location peut avoir l'une des valeurs suivantes :

    • global : indique un dépassement de limite pour le quota d'opérations globales.
    • REGION : spécifie la région dans laquelle la limite du quota d'opérations a été dépassée.

Les journaux d'erreurs détaillés ne sont renvoyés que via la réponse de l'API. L'erreur dans l'explorateur de journaux est semblable à celle-ci:

   "protoPayload":{
    "@type": "type.googleapis.com/google.cloud.audit.AuditLog",
    "status": {
      "message": "Rate Limit Exceeded"
    }
    "serviceName": "compute.googleapis.com",
    "methodName": "METHOD_NAME",
    ...
    ...
    "response": {
      "error": {
        "message": "Rate Limit Exceeded",
        "code": 403,
        "errors": [
          {
            "message": "Rate Limit Exceeded",
            "reason": "rateLimitExceeded",
            "domain": "usageLimits"
          }
        ]
      },
      "@type": "type.googleapis.com/error"
    },
    ...
    ... 

METHOD_NAME dans l'erreur représente la méthode d'API pour laquelle la limite de débit a été dépassée. Exemple :v1.compute.instances.stop

Groupes de quotas d'opérations simultanées

Cette section décrit les limites pour diverses opérations Compute Engine en cours ou simultanées.

Quotas d'opérations globales

Les opérations globales simultanées sont soumises à une limite globale, qui est spécifiée pour un type d'opérations et par projet. Le tableau suivant liste les quotas globaux pour les opérations en cours et les métriques correspondantes.

Vous pouvez afficher le quota associé aux opérations globales à l'aide de la console Google Cloud, de la Google Cloud CLI et de l'API Service Usage. Pour en savoir plus, consultez la page Consulter les quotas d'opérations simultanées et leurs limites.

Nom du quota
Description
Nom de la métrique Méthodes utilisant ce quota
Concurrent global operations per project
Limite le nombre total d'opérations globales simultanées pour un projet.

Consulter ce quota dans la console Google Cloud

compute.googleapis.com/global_concurrent_operations

Toutes les méthodes globales.

L'URL de requête HTTP contient le terme global pour ces méthodes. Exemple avec la méthode networks.insert :
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Limite le nombre d'opérations simultanées par projet et par type d'opération.

Consulter ce quota dans la console Google Cloud

compute.googleapis.com/global_concurrent_operations

Toutes les méthodes globales.

Le quota d'opérations simultanées par défaut est de 500 opérations en cours par projet, à l'exception des méthodes suivantes, qui ont des limites par défaut différentes :

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Quotas d'opérations régionales

Les opérations régionales simultanées sont soumises à une limite régionale, qui est spécifiée pour les types d'opérations par projet dans une région donnée.

Le tableau suivant liste les quotas régionaux pour les opérations en cours et les métriques correspondantes.

Vous pouvez afficher le quota associé aux opérations régionales à l'aide de la console Google Cloud, de la Google Cloud CLI et de l'API Service Usage. Pour en savoir plus, consultez la page Consulter les quotas d'opérations simultanées et leurs limites.

Nom du quota
Description
Nom de la métrique Méthodes utilisant ce quota
Concurrent regional operations per project
Limite le nombre total d'opérations régionales simultanées pour un projet.

Consulter ce quota dans la console Google Cloud

compute.googleapis.com/regional_concurrent_operations

Toutes les méthodes régionales.

L'URL de requête HTTP contient le terme regions ou zones pour ces méthodes.
Exemple avec la méthode instances.insert :
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Limite le nombre d'opérations régionales simultanées par projet et par type d'opération.

Consulter ce quota dans la console Google Cloud

compute.googleapis.com/regional_concurrent_operations

Toutes les méthodes régionales.

Le quota d'opérations simultanées par défaut est de 500 opérations en cours par projet et par région, à l'exception des méthodes suivantes, qui ont des limites par défaut différentes :

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Consulter les quotas d'opérations simultanées et leurs limites

Procédez comme suit pour consulter l'utilisation d'un quota et ses limites dans le cadre d'un projet :

Console

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

    Sur la page Quotas, qui liste l'ensemble des utilisations de quotas et leurs limites pour votre projet. Par défaut, la liste est triée de manière à afficher vos quotas les plus utilisés en premier, ce qui vous permet de visualiser les limites qui risquent d'être dépassées.

  2. Pour filtrer la liste et consulter l'utilisation d'un quota spécifique et sa limite, sélectionnez le Quota ou la Métrique dans le champ Filtre.

    Par exemple, sélectionnez le quota Concurrent global operations per project operation type pour visualiser l'utilisation du quota pour les méthodes globales, par type d'opération.

    Pour filtrer le quota selon une opération spécifique, ajoutez des Dimensions à la requête de filtre et sélectionnez le type d'opération. Par exemple, sélectionnez firewalls_insert pour consulter l'utilisation du quota et sa limite pour l'opération firewalls.insert.

gcloud

Vous pouvez utiliser la Google Cloud CLI pour consulter l'utilisation des quotas d'opérations simultanées et leurs limites.

Assurez-vous pour ce faire d'avoir installé le composant de commandes alpha. Si vous utilisez Cloud Shell pour interagir avec Google Cloud, Google Cloud CLI est installé automatiquement.

Exécutez la commande suivante pour afficher le quota :

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Remplacez PROJECT_ID par l'ID du projet pour lequel vous souhaitez consulter le quota.

Bonnes pratiques

La checklist suivante récapitule les bonnes pratiques à appliquer pour réduire les erreurs de limite d'opérations simultanées insuffisantes :

Étapes suivantes