Quotas et limites

Ce document répertorie les quotas et limites qui s'appliquent à Compute Engine.

Un quota limite la quantité d'une ressource Google Cloud partagée particulière que votre projet cloud peut utiliser, y compris les composants matériels, logiciels et réseau.

Les quotas font partie d'un système qui effectue les opérations suivantes :

  • Surveille votre utilisation ou votre consommation des produits et services Google Cloud
  • Limite la consommation de ces ressources pour des raisons telles que l'équité et la réduction des pics d'utilisation
  • Gère des configurations qui appliquent automatiquement des restrictions recommandées
  • Fournit un moyen de modifier le quota ou de demander des modifications

Dans la plupart des cas, lorsqu'un quota est dépassé, le système bloque immédiatement l'accès à la ressource Google concernée et la tâche que vous essayez d'effectuer échoue. Dans la plupart des cas, les quotas s'appliquent à chaque projet Cloud. Ils sont partagés entre toutes les applications et adresses IP qui utilisent ce projet.

Compute Engine impose des quotas sur l'utilisation des ressources pour différentes raisons. Il s'agit, par exemple, de préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Des quotas d'essai gratuit sont également proposés dans Google Cloud. Ils offrent un accès limité aux projets, ce qui vous permet d'explorer Google Cloud dans le cadre d'un essai gratuit.

Tous les projets ne sont pas soumis aux mêmes quotas. À mesure que votre utilisation de Google Cloud s'accroît, vos quotas peuvent augmenter en conséquence. Si vous prévoyez une augmentation notable de l'utilisation, vous pouvez anticiper cette évolution en demandant des ajustements de quota sur la page Quotas de la console.

Pour plus d'informations sur les quotas de limitations du débit de l'API Compute Engine, consultez la page Limitations du débit des API.

Autorisations de vérifier et modifier les quotas

Pour consulter vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.get.

Pour modifier vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.update.

Ces autorisations sont incluses par défaut dans les rôles IAM de base Propriétaire et Éditeur, ainsi que dans le rôle Administrateur de quotas prédéfini.

Vérifier les quotas

Les quotas régionaux ne font pas partie des quotas de projet. Les instances de machines virtuelles (VM) font partie des quotas régionaux.

Si vous recherchez des quotas régionaux, tels que le nombre de VM que vous pouvez créer dans une région, consultez la section Vérifier les quotas régionaux. Pour vérifier votre quota de projet, utilisez Google Cloud Console ou Google Cloud CLI

Pour en savoir plus sur les catégories de quotas, consultez la page Comprendre les quotas.

Vérifier le quota régional

Console

Dans Google Cloud Console, accédez à la page Quotas.

Accéder à la section "Quotas"

gcloud

Pour répertorier les quotas dans une région :

gcloud compute regions describe REGION

Remplacez REGION par le nom de la région pour laquelle vous souhaitez obtenir une liste des informations sur les quotas.

Vérifier le quota du projet

Console

Dans Google Cloud Console, accédez à la page Quotas.

Accéder à la section "Quotas"

gcloud

Vérifiez les quotas à l'échelle du projet :

gcloud compute project-info describe --project PROJECT_ID

en remplaçant PROJECT_ID par l'ID de votre projet :

Demander une augmentation de quota

Aucuns frais ne sont facturés pour les demandes d'augmentation de quota. Vos coûts n'augmentent que si vous utilisez plus de ressources.

Par défaut, les demandes de réduction de quota sont refusées. Si vous devez réduire votre quota, répondez à l'e-mail de l'assistance en expliquant vos besoins. Un conseiller de l'équipe d'assistance Compute Engine répondra à votre demande dans un délai de 24 à 48 heures.

Effectuez votre demande de ressources supplémentaires au moins quelques jours à l'avance pour que le temps de traitement soit suffisant.

Pour obtenir des instructions détaillées sur l'augmentation du quota à partir de Google Cloud Console, consultez Demander une limite de quota plus élevée.

Quotas et disponibilité des ressources

Les quotas de ressources représentent le nombre maximal de ressources que vous pouvez créer pour un type de ressources donné, sous réserve de disponibilité. Ils ne garantissent pas leur disponibilité permanente. Si une ressource n'est pas disponible ou si la région que vous choisissez ne la propose plus, vous ne pouvez pas créer d'autres ressources de ce type, même si vous disposez du quota restant dans votre région ou votre projet. Par exemple, vous pouvez posséder suffisamment de quota pour créer des adresses IP externes dans us-central1, mais il n'est pas garanti que cette région propose des adresses IP disponibles.

De même, si vous disposez d'un quota régional, il est possible qu'une ressource ne soit pas disponible dans une zone spécifique. Par exemple, vous pourriez disposer d'un quota pour créer des instances de VM dans la région us-central1, mais vous ne pas être en mesure de créer des instances de VM dans la zone us-central1-a si celle-ci n'a plus d'instances de VM disponibles. Dans ce cas, essayez de créer la même ressource dans une autre zone, par exemple us-central1-f. Pour en savoir plus sur les options qui s'offrent à vous si vos ressources zonales sont épuisées, consultez la documentation relative au dépannage de la disponibilité des ressources.

Quotas de ressources

Lors de la planification de vos besoins en instances de VM, vous devez prendre en compte plusieurs quotas qui affectent le nombre d'instances de VM que vous pouvez créer.

Quotas régionaux et mondiaux

Les quotas de VM sont gérés au niveau régional. Les instances de VM, groupes d'instances, quotas de disques et processeurs peuvent être consommés par n'importe quelle VM de la région, indépendamment de sa zone. Par exemple, le quota de processeurs est régional, ce qui signifie que chaque région prévoit une limite et un nombre d'utilisations différents. Pour lancer une instance n2-standard-16 dans n'importe quelle zone de la région us-central1, vous devez disposer d'un quota suffisant pour au moins 16 processeurs dans la région us-central1.

Des quotas de mise en réseau et d'équilibrage de charge sont requis pour créer des pare-feu, des équilibreurs de charge, des réseaux et des VPN. Ces quotas mondiaux ne dépendent d'aucune région, et chaque région peut utiliser un quota mondial. Par exemple, les adresses IP externes en cours d'utilisation et statiques affectées aux équilibreurs de charge et aux proxys HTTP(S) consomment des quotas mondiaux.

Instances de VM

Le quota d'instances de VM est un quota régional. Il limite le nombre d'instances de VM pouvant exister dans une région donnée, que la VM soit en cours d'exécution. Ce quota est visible dans Google Cloud Console, sur la page Quotas. Compute Engine définit automatiquement ce quota comme 10 fois votre quota de processeurs normal. Vous n'avez pas besoin de demander ce quota. Si vous avez besoin d'un quota pour couvrir davantage d'instances de VM, vous devez demander plus de processeurs, ce qui aura aussi pour effet d'augmenter ce quota. Ce quota s'applique aux VM en cours d'exécution et non exécutées, ainsi qu'aux instances normales et préemptives.

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

  2. Cliquez sur Filtrer le tableau, puis sélectionnez Service.

  3. Choisissez API Compute Engine.

  4. Choisissez Nom de la limite : instances de VM.

  5. Pour afficher la liste de vos quotas d'instances de VM par région, cliquez sur Tous les quotas. Vos quotas par région s'affichent de l'utilisation la plus élevée à la plus faible.

  6. Cochez la case correspondant à la région dont vous souhaitez modifier le quota.

  7. Cliquez sur Modifier les quotas.

  8. Remplissez le formulaire.

  9. Cliquez sur Envoyer la requête.

Groupes d'instances

Pour utiliser des groupes d'instances, vous devez disposer d'un quota pour toutes les ressources utilisées par le groupe (par exemple, le quota de processeurs) ou d'un quota pour la ressource du groupe elle-même. Selon le type de groupe que vous créez, les quotas de ressources de groupe suivants s'appliquent :

Type de service Quota de service
Groupe d'instances géré régional (multizone) Regional instance group managers
Groupe d'instances géré zonal (zone unique) Les deux quotas suivants :
  • Instance group managers
  • Instance groups
Groupe d'instances non géré (zone unique) Instance groups
Autoscaler régional (multizone) Regional autoscalers
Autoscaler zonal (zone unique) Autoscalers

Quotas de disques

Les quotas ci-dessous s'appliquent au niveau régional pour les disques persistants et les disques SSD locaux.

  • Local SSD (GB) : taille totale combinée des partitions de disques SSD locaux pouvant être associés à des VM dans une région.  Le disque SSD local est un disque rapide et éphémère à utiliser pour le travail, le cache local ou le traitement des tâches avec une haute tolérance aux pannes, car il n'est pas conçu pour résister aux redémarrages d'une instance de VM. Les partitions de disques SSD locaux sont vendues par incréments de 375 Go, et jusqu'à 24 de ces partitions peuvent être associées à une seule VM. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme LOCAL_SSD_TOTAL_GB.
  • Persistent disk standard (GB) : taille totale des disques persistants standards pouvant être créés dans une région. Comme le décrit l'article sur l'optimisation des performances des disques persistants et des disques SSD locaux, les disques persistants standards offrent des IOPS et un débit plus faibles que les disques persistants SSD ou que les disques SSD locaux. Ils offrent cependant une bonne rentabilité si vous les utilisez en tant que disques volumineux durables pour le stockage, en tant que disques de démarrage et pour les processus d'écriture en série, par exemple pour la journalisation. Les disques persistants standards sont durables et disponibles indéfiniment à des fins d'association à une VM dans la même zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme DISKS_TOTAL_GB. Ce quota s'applique également aux disques persistants régionaux standards, mais les disques régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.
  • Persistent disk SSD (GB) : taille totale combinée des partitions de disques persistants SSD pouvant être créées dans une région. Ces disques disposent de plusieurs instances dupliquées et, comme le décrit l'article sur les performances des options de stockage de blocs, ils offrent des IOPS et un débit plus élevés que les disques persistants standards. Ils sont disponibles indéfiniment pour s'associer à une VM dans la même zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme SSD_TOTAL_GB. Ce quota est différent du quota de disques SSD locaux. Il s'applique aux types de disques répertoriés ci-dessous. Les disques persistants régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région :
    • Disque persistant SSD zonal et régional
    • Disque persistant avec équilibrage zonal et régional

Quota de processeurs

Le quota de processeurs correspond au nombre total de processeurs virtuels sur toutes les instances de VM d'une région. Les quotas de processeurs s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.

Pour protéger les systèmes Compute Engine et les autres utilisateurs, certains nouveaux comptes et projets disposent également d'un quota mondial CPUs (All Regions) qui s'applique à toutes les régions et est mesuré en tant que somme de l'ensemble des processeurs virtuels dans toutes les régions.

Par exemple, si vous disposez de 48 processeurs virtuels dans une seule région (par exemple us-central1), mais qu'il ne reste que 32 processeurs virtuels pour le quota CPUs (All Regions), vous ne pouvez lancer que 32 processeurs virtuels dans la région us-central1 même si tout le quota de cette région n'est pas utilisé. En effet, vous atteindrez le quota CPU (All Regions) et vous devrez supprimer des instances existantes pour pouvoir en lancer de nouvelles.

Les types de machines E2 et N1 partagent un pool de quotas de processeurs. Les types de machines N2, N2D, M1, M2 et C2 ont des pools de quotas de processeurs uniques et distincts.

Si vous utilisez des remises sur engagement d'utilisation pour vos VM, vous devez disposer d'un quota de remise sur engagement d'utilisation avant de souscrire un contrat de remise sur engagement d'utilisation.

Machine type (Type de machine) Pool de quotas Nom du quota de processeurs Nom du quota de processeurs faisant l'objet d'un engagement
E2, N1 pool partagé CPUS Committed_CPUS
N2 pool distinct N2_CPUS Committed_N2_CPUS
N2D pool distinct N2D_CPUS Committed_N2D_CPUS
T2D pool distinct T2D_CPUS Committed_T2D_CPUS
T2A (bêta) pool distinct T2A_CPUS Non disponible (N/A) pour Committed_T2A_CPUS
M1 pool distinct M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool distinct M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
C2 pool distinct C2_CPUS Committed_C2_CPUS
C2D pool distinct C2D_CPUS Committed_C2D_CPUS
A2 pool distinct A2_CPUS Committed_A2_CPUS
VM préemptives pool partagé PREEMPTIBLE_CPUS Non disponible (N/A) pour les VM préemptives

Quota de GPU

De la même manière que pour le quota de processeurs virtuels, le quota de GPU fait référence au nombre total de GPU virtuels dans toutes les instances de VM d'une région. Les quotas de GPU s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.

Consultez la page Quotas pour vérifier que vous disposez de suffisamment de GPU dans votre projet et demander une augmentation de quota si nécessaire. De plus, les nouveaux comptes et projets disposent d'un quota mondial de GPU qui s'applique à toutes les régions.

Lorsque vous demandez un quota de GPU, vous devez demander un quota pour les modèles de GPU que vous souhaitez créer dans chaque région, mais également un quota mondial supplémentaire pour le nombre total de GPU de tout type dans toutes les zones. Demandez un quota de GPU préemptifs pour utiliser ces ressources.

NVIDIA Nom du quota de GPU Nom du quota de GPU faisant l'objet d'un engagement Poste de travail virtuel GPU préemptifs Poste de travail virtuel avec GPU préemptifs
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS ND PREEMPTIBLE_NVIDIA_K80_GPUS ND
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
A100 NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS Non disponible PREEMPTIBLE_NVIDIA_A100_GPUS Non disponible
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS ND PREEMPTIBLE_NVIDIA_V100_GPUS Non disponible

Quotas de ressources préemptives

Vous pouvez utiliser des GPU ou processeurs préemptifs associés à des instances de VM préemptives, ou encore des disques SSD locaux associés à des instances de VM préemptives. Pour cela, vous devez disposer d'un quota disponible dans votre projet pour chaque ressource.

Vous pouvez demander des quotas préemptifs spéciaux pour les ressources Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). Toutefois, si votre projet ne dispose pas de quota préemptif et que vous n'avez jamais demandé de quota préemptif, vous pouvez utiliser le quota standard pour lancer les ressources préemptives.

Lorsque Compute Engine vous accorde un quota préemptif dans une région, toutes les instances préemptives sont automatiquement comptabilisées dans ce quota. Lorsque ce quota est épuisé, vous devez demander un quota préemptif pour ces ressources.

Adresses IP externes

Vous devez disposer de suffisamment d'adresses IP externes pour chaque VM devant être directement accessible depuis l'Internet public. Le quota d'IP régional permet d'attribuer des adresses IPv4 aux VM de cette région. Le quota d'IP mondial sert à attribuer des adresses IPv4 aux ressources réseau mondiales telles que les équilibreurs de charge. Google Cloud propose différents types d'adresses IP en fonction de vos besoins. Pour en savoir plus sur les tarifs, consultez la section Tarifs des adresses IP externes. Pour plus d'informations sur les détails des quotas, consultez la page Quotas et limites.

  • Adresses IP externes en cours d'utilisation : adresses IP éphémères et statiques qui sont actuellement utilisées par une ressource.

  • Adresses IP externes statiques : adresses IP externes réservées aux ressources qui sont conservées lors des redémarrages de machines. Pour fournir une adresse facile à utiliser, vous pouvez enregistrer ces adresses avec des services DNS et de fournisseurs de domaine. Par exemple, votre adresse peut ressembler à www.exemple-site.com.

  • Adresses IP internes statiques : elles vous permettent de réserver des adresses IP internes dans la plage d'adresses IP internes configurée dans le sous-réseau. Vous pouvez attribuer ces adresses internes réservées aux ressources en fonction de vos besoins.

Limites

Limites de débit des API

Les limites de débit des API (également appelées quotas) définissent le nombre de requêtes pouvant être envoyées à l'API Compute Engine. Elles sont définies pour chaque projet. Chaque limite de débit correspond à l'ensemble des requêtes d'un groupe constitué d'une ou de plusieurs méthodes API Compute Engine. Lorsque vous utilisez gcloud compute ou Google Cloud Console, vous envoyez également des requêtes à l'API qui sont comptabilisées dans votre limite de débit. Si vous utilisez des comptes de service pour accéder à l'API, ils sont également pris en compte pour la limite de débit.

Les limites de débit de l'API sont appliquées et réinitialisées automatiquement par intervalles de 60 secondes (1 minute). Cela signifie que si votre projet atteint une limite maximale de débit à tout moment dans un délai de 60 secondes, vous devez attendre que le quota soit réinitialisé avant d'effectuer d'autres requêtes dans ce groupe. Si votre projet dépasse une limite de débit, vous recevez une erreur 403 pour le motif suivant : rateLimitExceeded. Pour résoudre cette erreur, attendez une minute, puis relancez votre requête. Le quota devrait être réinitialisé au début de l'intervalle suivant.

Actuellement, les requêtes sont limitées en fonction des groupes suivants. Chaque groupe est comptabilisé séparément, ce qui vous permet d'atteindre simultanément la limite maximale dans chaque groupe.

Les groupes de limites de débit suivants s'appliquent à toutes les ressources, sauf indication contraire :

Groupe de limites Description Limite par défaut
Queries
  • Limite par défaut pour les méthodes de mutation.
  • Métrique : compute.googleapis.com/default
Débit par projet (defaultPerMinutePerProject) : 1 500 requêtes/minute
Requêtes de lecture
  • Limite pour les méthodes *.get.
  • Métrique : compute.googleapis.com/read_requests
Débit par projet (ReadRequestsPerMinutePerProject) : 1 500 requêtes/minute
Requêtes de listage
  • Limite pour les méthodes *.list.
  • Métrique : compute.googleapis.com/list_requests
Débit par projet (ListRequestsPerMinutePerProject) : 1 500 requêtes/minute
Requêtes de lecture d'opération
  • Limite pour globalOperations.get, regionOperations.get et zoneOperations.get methods.
  • Metric: compute.googleapis.com/operation_read_requests
Débit par projet (OperationReadRequestsPerMinutePerProject) : 1 500 requêtes/minute
Requêtes de mutation de ressources globales
  • Limite pour disks.createSnapshot, images.delete, images.deprecate, images.insert, images.setLabels, snapshots.delete, snapshots.insert, snapshots.setLabels , machineImages.insert et machineImages.delete.
  • Métrique : compute.googleapis.com/global_resource_write_requests
Débit par projet (GlobalResourceWriteRequestsPerMinutePerProject) : 375 requêtes/minute
Requêtes de mutation intensive
  • Limite pour les méthodes patch, delete et insert pour les ressources interconnects et interconnectAttachments.
  • Métrique : compute.googleapis.com/heavy_weight_write_requests
Débit par projet (HeavyWeightWriteRequestsPerMinutePerProject) : 750 requêtes/minute
Requêtes de lecture intensive
  • Limite pour les méthodes telles que Operations.wait, *.getEffectiveFirewalls et *.aggregatedList.
  • Métrique : compute.googleapis.com/heavy_weight_read_requests
Débit par projet (HeavyWeightReadRequestsPerMinutePerProject) : 750 requêtes/minute

Les groupes de limites de débit suivants s'appliquent aux API comportant des limites par méthode :

Groupe de limites Description Limite par défaut
Simuler des requêtes d'événement de maintenance
  • Limite pour la méthode instances.simulateMaintenanceEvent.
  • Métrique : compute.googleapis.com/simulate_maintenance_event_requests
Débit par projet (SimulateMaintenanceEventRequestsPerDayPerProject) : 150 requêtes/minute
Requêtes de référent de liste d'instances
  • Limite pour la méthode instances.listReferrers.
  • Métrique : compute.googleapis.com/instance_list_referrers_requests
Débit par projet (InstanceListReferrersRequestsPerMinutePerProject) : 3 000 requêtes/minute
Requêtes d'obtention de port série d'instance
  • Limite pour la méthode instances.getSerialPortOutput.
  • Métrique : compute.googleapis.com/get_serial_port_output_requests
Débit par projet (GetSerialPortOutputRequestsPerMinutePerProject) : 1 500 requêtes/minute au maximum
Requêtes d'insertion de licence
  • Limites pour la méthode licenses.insert.
  • Métrique : compute.googleapis.com/license_insert_requests
  • Débit par projet (LicenseInsertRequestsPerMinutePerProject) : 2,5 requêtes/seconde (150 requêtes/minute)
  • Débit par jour et par projet : LicenseInsertRequestsPerDayPerProject30 requêtes/jour
Requêtes de métadonnées d'instance courantes d'ensemble de projet
  • Limite pour la méthode projects.setCommonInstanceMetadata.
  • Métrique : compute.googleapis.com/project_set_common_instance_metadata_requests
Débit par projet (ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject) : 36 requêtes/minute
Requêtes de recommandation d'emplacement
  • Limite pour la méthode regionInstances.recommendLocations.
  • Métrique : compute.googleapis.com/recommend_locations_requests
Débit par projet (RecommendLocationsRequestsPerMinutePerProject) : 20 requêtes/minute
Requêtes d'écriture de point de terminaison du réseau
  • Limite pour les méthodes *.AttachNetworkEndpoints et *.DetachNetworkEndpoints.
  • Métrique : compute.googleapis.com/network_endpoint_write_requests
Débit par projet (NetworkEndpointWriteRequestsPerMinutePerProject) : 1 500 requêtes/minute
Requêtes pour répertorier les points de terminaison du réseau
  • Limite pour la méthode networkEndpointGroups.listNetworkEndpoints.
  • Métrique : compute.googleapis.com/network_endpoint_list_requests
Débit par projet (NetworkEndpointListRequestsPerMinutePerProject) : 1 500 requêtes/minute

Suivez les bonnes pratiques de l'API Compute Engine pour conserver les limitations de débit des API afin de limiter les effets des limitations du débit des API.

Si vous avez besoin d'augmenter la limite de débit des API, vous pouvez examiner l'utilisation actuelle et demander une augmentation du quota d'API. Pour obtenir des instructions détaillées sur l'augmentation du quota à partir de la console Google Cloud, consultez Demander une limite de quota plus élevée.

Étapes suivantes