Ce document liste les quotas d'allocation qui s'appliquent à Compute Engine.
Les quotas d'allocation
Les quotas d'allocation, également appelés quotas de ressources, définissent le nombre de ressources auxquelles votre projet a accès. Compute Engine impose des quotas d'allocation sur l'utilisation des ressources pour différentes raisons. Il s'agit, par exemple, de préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Des quotas d'essai gratuits sont également proposés dans Google Cloud. Ils offrent un accès limité aux projets pour vous permettre d'explorer Google Cloud dans le cadre d'un essai gratuit.
Tous les projets ne sont pas soumis aux mêmes quotas. À mesure que votre utilisation de Google Cloud s'accroît, vos quotas peuvent augmenter en conséquence. Si vous prévoyez une augmentation notable de l'utilisation, vous pouvez anticiper cette évolution en demandant des ajustements de quota sur la page Quotas de la console Google Cloud.
Pour plus d'informations sur les quotas de limitations du débit de l'API Compute Engine, consultez la page Quota d'API.
Quotas et disponibilité des ressources
Les quotas d'allocation représentent le nombre maximal de ressources que vous pouvez créer pour un type de ressources donné, sous réserve de disponibilité. Ils ne garantissent pas leur disponibilité permanente. Si une ressource n'est pas disponible ou si la région que vous choisissez ne la propose plus, vous ne pouvez pas créer d'autres ressources de ce type, même si vous disposez du quota restant dans votre région ou votre projet. Par exemple, vous pouvez posséder suffisamment de quota pour créer des adresses IP externes dans us-central1
, mais il n'est pas garanti que cette région propose des adresses IP disponibles.
De même, si vous disposez d'un quota régional, il est possible qu'une ressource ne soit pas disponible dans une zone spécifique. Par exemple, vous pourriez disposer d'un quota pour créer des instances de VM dans la région us-central1
, mais vous ne pas être en mesure de créer des instances de VM dans la zone us-central1-a
si celle-ci n'a plus d'instances de VM disponibles. Dans ce cas, essayez de créer la même ressource dans une autre zone, par exemple us-central1-f
. Pour en savoir plus sur les options qui s'offrent à vous si vos ressources zonales sont épuisées, consultez la documentation sur le dépannage de la disponibilité des ressources.
Les quotas d'allocation
Lors de la planification de vos besoins en instances de VM, vous devez prendre en compte plusieurs quotas qui affectent le nombre d'instances de VM que vous pouvez créer.
Quotas régionaux et mondiaux
Les quotas de VM sont gérés au niveau régional. Les instances de VM, groupes d'instances, quotas de disques et processeurs peuvent être consommés par n'importe quelle VM de la région, indépendamment de sa zone. Par exemple, le quota de processeurs est régional, ce qui signifie que chaque région prévoit une limite et un nombre d'utilisations différents. Pour lancer une instance n2-standard-16
dans n'importe quelle zone de la région us-central1
, vous devez disposer d'un quota suffisant pour au moins 16 processeurs dans la région us-central1
.
Des quotas de mise en réseau et d'équilibrage de charge sont requis pour créer des pare-feu, des équilibreurs de charge, des réseaux et des VPN. Ces quotas mondiaux ne dépendent d'aucune région, et chaque région peut utiliser un quota mondial. Par exemple, les adresses IP externes en cours d'utilisation et statiques affectées aux équilibreurs de charge et aux proxys HTTP et HTTPS consomment des quotas mondiaux.
Instances de VM
Le quota d'instances de VM est un quota régional. Il limite le nombre d'instances de VM pouvant exister dans une région donnée, que la VM soit en cours d'exécution. Ce quota est visible dans la console Google Cloud, sur la page Quotas. Compute Engine définit automatiquement ce quota comme 10 fois votre quota de processeurs normal. Vous n'avez pas besoin de demander ce quota. Si vous avez besoin d'un quota pour couvrir davantage d'instances de VM, vous devez demander plus de processeurs, ce qui aura aussi pour effet d'augmenter ce quota. Ce quota s'applique aux VM en cours d'exécution et non exécutées, ainsi qu'aux instances normales et préemptives.
Dans la console Google Cloud, accédez à la page Quotas.
Dans la liste
Filtre, sélectionnez les options suivantes:- Pour Service (Service), sélectionnez API Compute Engine (API Compute Engine).
- Dans Type, sélectionnez Quota.
- Dans Nom, sélectionnez Instances de VM.
- (Facultatif) Dans Métrique, sélectionnez un autre nom de quota de processeur ou de processeur réservé que vous souhaitez filtrer.
Facultatif: Pour trier le tableau par région, cliquez sur la colonne Dimensions (par exemple, zone géographique).
Sélectionnez les régions dont vous souhaitez modifier le quota.
Cliquez sur
Modifier.Remplissez le formulaire.
Cliquez sur Envoyer la requête.
Groupes d'instances
Pour utiliser des groupes d'instances, vous devez disposer d'un quota pour toutes les ressources utilisées par le groupe (par exemple, le quota de processeurs) ou d'un quota pour la ressource du groupe elle-même. Selon le type de groupe que vous créez, les quotas d'utilisation des ressources de groupe suivants s'appliquent :
Type de service | Quota de service |
---|---|
Groupe d'instances géré régional (multizone) | Regional instance group managers |
Groupe d'instances géré zonal (zone unique) | Les deux quotas suivants :
|
Groupe d'instances non géré (zone unique) | Instance groups |
Autoscaler régional (multizone) | Regional autoscalers |
Autoscaler zonal (zone unique) | Autoscalers |
Quotas de disques
Les quotas ci-dessous s'appliquent au niveau régional pour les disques persistants, les hyperdisques et les disques SSD locaux:
Hyperdisk Balanced Capacity (GB)
: taille totale combinée des disques Hyperdisk Balanced que vous pouvez créer dans une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeHDB-TOTAL-GB
.Hyperdisk Balanced Throughput (MB/s)
: quantité totale de débit que vous pouvez provisionner pour tous les disques Hyperdisk équilibrés d'une zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeHDB-TOTAL-THROUGHPUT
.Hyperdisk Balanced IOPS
: quantité totale d'IOPS que vous pouvez provisionner pour tous les disques Hyperdisk équilibré d'une zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeHDB-TOTAL-IOPS
.Hyperdisk ML Capacity (GB)
: ce quota correspond à la taille totale combinée des disques Hyperdisk ML que vous pouvez créer dans une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeHDML-TOTAL-GB
.Hyperdisk ML Throughput (MB/s)
: quantité totale de débit que vous pouvez provisionner pour tous les disques Hyperdisk ML d'une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeHDML-TOTAL-THROUGHPUT
.Persistent disk standard (GB)
: taille totale des disques persistants standards pouvant être créés dans une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeDISKS_TOTAL_GB
. Ce quota s'applique également aux éléments suivants :- disques persistants régionaux standards, mais les disques persistants régionaux consomment deux fois plus de quota par GiB en raison de la réplication dans deux zones d'une même région.
- Lorsque vous choisissez de conserver les données des disques SSD locaux lorsque vous arrêtez ou suspendez une VM, une quantité équivalente de quota de disques persistants standards est consommée.
Persistent disk SSD (GB)
: taille totale combinée des volumes disques persistants SSD pouvant être créés dans une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formeSSD_TOTAL_GB
. Ce quota est différent du quota de disques SSD locaux. Ce quota s'applique aux types de disques suivants:- Disque persistant SSD zonal et régional
- Disque persistant avec équilibrage zonal et régional
Les disques persistants régionaux consomment deux fois plus de quota par GiB, à cause de la réplication dans deux zones d'une même région.
Persistent Disk IOPS
: nombre total d'opérations d'E/S par seconde pour les volumes de disques persistants Extreme pouvant être créés dans une région. Dans gcloud CLI et dans l'API, ce quota est désigné sous la formePD-EXTREME-TOTAL-PROVISIONED-IOPS
. Ce quota est distinct du quota d'IOPS pour Google Cloud Hyperdisk.Local SSD per machine family (GB)
: ce quota correspond à la taille totale combinée des disques SSD locaux que vous pouvez associer à des VM dans une région, en fonction du type de machine de chaque VM. Le disque SSD local est un espace disque rapide et éphémère à utiliser pour le travail, le cache local ou le traitement des jobs avec une haute tolérance aux pannes, car il n'est pas conçu pour résister aux redémarrages d'une instance de VM.Les disques SSD locaux sont vendus par incréments de 375 Gio ou 3 Tio, selon le type de machine. Il existe également un nombre maximal de disques SSD locaux pouvant être associés à une seule VM, en fonction du type de machine. Le nombre maximal de disques SSD locaux et la taille de chaque disque SSD local limitent la quantité totale de capacité de disque SSD local que vous pouvez allouer à une VM. Dans gcloud CLI et dans l'API, cette limite est désignée sous la forme de quota
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
.Pour les VM A3 et A2 Ultra, vous n'avez pas besoin de demander ce quota, car les SSD locaux sont automatiquement ajoutés à ces VM. Toutefois, vous devez demander
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
pour les autres VM optimisées pour les accélérateurs.
Quotas de pool de stockage
Pour la capacité, les pools de stockage Hyperdisk avec provisionnement de capacité avancé ont les quotas suivants, mesurés en Go (ou 1 000 Mo):
Hyperdisk Balanced Storage Pools Advanced Capacity (GB)
: espace disque total que vous pouvez réserver par région dans un pool de stockage Hyperdisk Balanced avec provisionnement de capacité avancé.- gcloud CLI et API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrique :
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
- gcloud CLI et API:
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)
: quantité totale d'espace disque que vous pouvez réserver par région dans un pool de stockage Hyperdisk Throughput avec provisionnement avancé de la capacité.- gcloud CLI et API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrique :
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity
- gcloud CLI et API:
Pour les performances, les pools de stockage Hyperdisk avec provisionnement des performances avancées ont les quotas suivants:
Hyperdisk Balanced Storage Pools Advanced IOPS
: nombre total d'IOPS que vous pouvez réserver dans un pool de stockage Hyperdisk équilibré avec provisionnement avancé des performances pour une région.- gcloud CLI et API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- Métrique :
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
- gcloud CLI et API:
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)
: débit total que vous pouvez réserver dans un pool de stockage Hyperdisk équilibré avec provisionnement des performances avancées pour une région.- gcloud CLI et API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrique :
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
- gcloud CLI et API:
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)
: débit total que vous pouvez réserver dans un pool de stockage "Hyperdisk Throughput" avec le provisionnement des performances Advanced pour une région.- gcloud CLI et API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrique :
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput
- gcloud CLI et API:
Limites de quota de processeurs
Le quota de processeurs correspond au nombre total de processeurs virtuels sur toutes les instances de VM d'une région. Les quotas de processeurs s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.
Pour protéger les systèmes Compute Engine et les autres utilisateurs, certains nouveaux comptes et projets disposent également d'un quota mondial CPUs (All Regions)
qui s'applique à toutes les régions et est mesuré en tant que somme de l'ensemble des processeurs virtuels dans toutes les régions.
Par exemple, si vous disposez de 48 processeurs virtuels dans une seule région (par exemple us-central1
), mais qu'il ne reste que 32 processeurs virtuels pour le quota CPUs (All Regions)
, vous ne pouvez lancer que 32 processeurs virtuels dans la région us-central1
même si tout le quota de cette région n'est pas utilisé. En effet, vous atteindrez le quota CPU (All Regions)
et vous devrez supprimer des instances existantes pour pouvoir en lancer de nouvelles.
Les types de machines E2 et N1 partagent un pool de quotas de processeurs. Sauf indication contraire, tous les autres types de machines disposent de pools de quotas de processeurs uniques et distincts.
Si vous utilisez des remises sur engagement d'utilisation pour vos VM, vous devez disposer d'un quota de remise sur engagement d'utilisation avant de souscrire un contrat de remise sur engagement d'utilisation.
Type de machine | Pool de quotas | Nom du quota de processeurs | Nom du quota de processeurs faisant l'objet d'un engagement |
---|---|---|---|
N1 | pool partagé | CPUS |
Committed_CPUS |
E2 | pool partagé | CPUS |
Committed_CPUS |
N2 | pool distinct | N2_CPUS |
Committed_N2_CPUS |
N4 | pool distinct | CPUS_PER_VM_FAMILY |
Committed_N4_CPUS |
N2D | pool distinct | N2D_CPUS |
Committed_N2D_CPUS |
T2D | pool distinct | T2D_CPUS |
Committed_T2D_CPUS |
T2A | pool distinct | T2A_CPUS |
Non disponible (N/A) pour T2A |
Z3 | pool distinct | CPUS_PER_VM_FAMILY |
Committed_Z3_CPUS |
M1 | pool distinct | M1_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M2 | pool distinct | M2_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M3 | pool distinct | M3_CPUS |
Committed_M3_CPUS |
X4 | pool distinct | CPUS_PER_VM_FAMILY |
Committed_X4_CPUS |
H3 | pool distinct | CPUS_PER_VM_FAMILY |
Committed_H3_CPUS |
C2 | pool distinct | C2_CPUS |
Committed_C2_CPUS |
C2D | pool distinct | C2D_CPUS |
Committed_C2D_CPUS |
C3 | pool distinct | C3_CPUS |
Committed_C3_CPUS |
C3D | pool distinct | CPUS_PER_VM_FAMILY |
Committed_C3D_CPUS |
C4 | pool distinct | CPUS_PER_VM_FAMILY |
Committed_C4_CPUS |
C4A | pool distinct | CPUS_PER_VM_FAMILY |
Committed_C4A_CPUS |
A2* | pool distinct | A2_CPUS |
Committed_A2_CPUS |
A3† | Non applicable (N/A) pour A3 | Non applicable (N/A) pour A3 | Non applicable (N/A) pour A3 |
G2† | Non applicable (N/A) pour G2 | Non applicable (N/A) pour G2 | Non applicable (N/A) pour G2 |
VM préemptives | pool partagé | PREEMPTIBLE_CPUS |
Non disponible (N/A) pour les VM préemptives |
* Pour les VM A2, vous n'avez pas besoin de demander de quotas de processeurs. Si vous disposez des quotas de GPU NVIDIA A100 requis, il vous suffit de créer ces VM.
†Pour les VM A3 et G2, les quotas de processeurs ne s'appliquent pas. Si vous disposez des quotas de GPU NVIDIA H100 et L4 requis, il vous suffit de créer ces VM.
Quota de GPU
De la même manière que pour le quota de processeurs virtuels, le quota de GPU fait référence au nombre total de GPU virtuels dans toutes les instances de VM d'une région. Les quotas de GPU s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.
Consultez la page Quotas pour vérifier que vous disposez de suffisamment de GPU dans votre projet et demander une augmentation de quota si nécessaire. De plus, les nouveaux comptes et projets disposent d'un quota mondial de GPU qui s'applique à toutes les régions.
Lorsque vous demandez un quota de GPU, vous devez inclure les modèles de GPU que vous souhaitez créer dans chaque région, mais également demander un quota mondial supplémentaire (GPUs (all regions)
) pour le nombre total de GPU de tous types, dans toutes les régions.
Demandez un quota de GPU préemptifs pour utiliser ces ressources.
Type de machine | Type de GPU | Nom du quota de GPU | Famille de GPU | Nom du quota de GPU faisant l'objet d'un engagement | Poste de travail virtuel | GPU préemptifs | Poste de travail virtuel avec GPU préemptifs |
---|---|---|---|---|---|---|---|
A3 Mega | H100 80 Go | GPUS_PER_GPU_FAMILY |
NVIDIA_H100_MEGA |
COMMITTED_NVIDIA_H100_MEGA_GPUS |
N/A | PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS |
N/A |
A3 Edge et A3 High | H100 80 Go | GPUS_PER_GPU_FAMILY |
NVIDIA_H100 |
COMMITTED_NVIDIA_H100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_H100_GPUS |
N/A |
A2 ultra | A100 80 Go | NVIDIA_A100_80GB_GPUS |
Non disponible | COMMITTED_NVIDIA_A100_80GB_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_80GB_GPUS |
N/A |
A2 standard | A100 40 Go | NVIDIA_A100_GPUS |
Non disponible | COMMITTED_NVIDIA_A100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_GPUS |
N/A |
G2 | L4 | NVIDIA_L4_GPUS |
N/A | COMMITTED_NVIDIA_L4_GPUS |
NVIDIA_L4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_L4_GPUS |
PREEMPTIBLE_NVIDIA_L4_VWS_GPUS |
N1 | T4 | NVIDIA_T4_GPUS |
N/A | COMMITTED_NVIDIA_T4_GPUS |
NVIDIA_T4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_T4_GPUS |
PREEMPTIBLE_NVIDIA_T4_VWS_GPUS |
V100 | NVIDIA_V100_GPUS |
ND | COMMITTED_NVIDIA_V100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_V100_GPUS |
ND | |
P100 | NVIDIA_P100_GPUS |
N/A | COMMITTED_NVIDIA_P100_GPUS |
NVIDIA_P100_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P100_GPUS |
PREEMPTIBLE_NVIDIA_P100_VWS_GPUS |
|
P4 | NVIDIA_P4_GPUS |
N/A | COMMITTED_NVIDIA_P4_GPUS |
NVIDIA_P4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P4_GPUS |
PREEMPTIBLE_NVIDIA_P4_VWS_GPUS |
Quotas préemptifs
Vous pouvez demander des quotas préemptifs pour Preemptible CPUs
, Preemptible GPUs
et Preemptible Local SSDs (GB)
. Ces quotas préemptibles s'appliquent aux processeurs, aux GPU et aux SSD locaux des VM suivantes:
Si votre projet ne dispose pas de quota préemptif et que vous n'avez jamais demandé de quota préemptif, ces ressources consomment un quota standard. Toutefois, une fois que vous avez demandé un quota préemptif dans votre projet, les ressources applicables ne peuvent consommer que le quota préemptif et ne peuvent pas revenir à la consommation de quotas standards.
Demander des quotas préemptifs peut vous aider à améliorer la disponibilité des quotas en fournissant des quotas distincts pour les ressources temporaires. Lorsque Compute Engine vous accorde un quota préemptif dans une région, toutes les ressources applicables consomment automatiquement ce quota. Si ce quota est épuisé, vous devez demander un quota préemptif pour ces ressources.
Adresses IP externes
Vous devez disposer de suffisamment d'adresses IP externes pour chaque VM devant être directement accessible depuis l'Internet public. Le quota d'IP régional permet d'attribuer des adresses IPv4 aux VM de cette région. Le quota d'IP mondial sert à attribuer des adresses IPv4 aux ressources réseau mondiales telles que les équilibreurs de charge. Google Cloud propose différents types d'adresses IP en fonction de vos besoins. Pour en savoir plus sur les tarifs, consultez la section Tarifs des adresses IP externes. Pour plus d'informations sur les détails des quotas, consultez la page Quotas et limites.
Adresses IP externes en cours d'utilisation : adresses IP éphémères et statiques qui sont actuellement utilisées par une ressource.
Adresses IP externes statiques : adresses IP externes réservées aux ressources qui sont conservées lors des redémarrages de machines. Pour fournir une adresse facile à utiliser, vous pouvez enregistrer ces adresses avec des services DNS et de fournisseurs de domaine. Par exemple, votre adresse peut ressembler à www.exemple-site.com.
Adresses IP internes statiques : elles vous permettent de réserver des adresses IP internes dans la plage d'adresses IP internes configurée dans le sous-réseau. Vous pouvez attribuer ces adresses internes réservées aux ressources en fonction de vos besoins.
Déploiements de quotas
Google Cloud modifie parfois le quota par défaut des ressources et des API. Ces modifications ont lieu progressivement. Lors du déploiement d'un nouveau quota par défaut, le quota maximal qui s'affiche dans la console Google Cloud peut ne pas refléter le quota maximal effectivement disponible.
Par exemple, supposons que Google Cloud remplace le quota maximal par défaut des règles de pare-feu de 200
par 300
et que vous utilisiez votre console Google Cloud pour afficher votre quota : le nouveau quota 300
peut s'afficher, même si votre quota réel est de 200
jusqu'à la fin du déploiement.
Pour en savoir plus sur les déploiements de quotas en cours, consultez la section Problèmes connus. Si aucun problème n'y est décrit, cela signifie qu'aucun déploiement de quota n'est en cours.
Si un déploiement est en cours et que vous souhaitez vérifier que le quota maximal est disponible, utilisez Google Cloud CLi pour vérifier votre quota. Si vous avez besoin d'un quota supérieur à celui dont vous disposez, envoyez une demande d'augmentation de quota.
Étapes suivantes
- Documentez-vous sur les Tarifs des ressources.
- Documentez-vous sur les Tarifs des instances de VM.
- Découvrez comment afficher et gérer les quotas.
- Découvrez comment configurer des alertes de quotas.
- Découvrez comment augmenter automatiquement les quotas en fonction de l'utilisation de vos ressources Compute Engine.