Les quotas d'allocation

Ce document liste les quotas d'allocation qui s'appliquent à Compute Engine.

Les quotas d'allocation

Les quotas d'allocation, également appelés quotas de ressources, définissent le nombre de ressources auxquelles votre projet a accès. Compute Engine impose des quotas d'allocation sur l'utilisation des ressources pour différentes raisons. Il s'agit, par exemple, de préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Des quotas d'essai gratuits sont également proposés dans Google Cloud. Ils offrent un accès limité aux projets pour vous permettre d'explorer Google Cloud dans le cadre d'un essai gratuit.

Tous les projets ne sont pas soumis aux mêmes quotas. À mesure que votre utilisation de Google Cloud s'accroît, vos quotas peuvent augmenter en conséquence. Si vous prévoyez une augmentation notable de l'utilisation, vous pouvez anticiper cette évolution en demandant des ajustements de quota sur la page Quotas de la console Google Cloud.

Pour plus d'informations sur les quotas de limitations du débit de l'API Compute Engine, consultez la page Quota d'API.

Quotas et disponibilité des ressources

Les quotas d'allocation représentent le nombre maximal de ressources que vous pouvez créer pour un type de ressources donné, sous réserve de disponibilité. Ils ne garantissent pas leur disponibilité permanente. Si une ressource n'est pas disponible ou si la région que vous choisissez ne la propose plus, vous ne pouvez pas créer d'autres ressources de ce type, même si vous disposez du quota restant dans votre région ou votre projet. Par exemple, vous pouvez posséder suffisamment de quota pour créer des adresses IP externes dans us-central1, mais il n'est pas garanti que cette région propose des adresses IP disponibles.

De même, si vous disposez d'un quota régional, il est possible qu'une ressource ne soit pas disponible dans une zone spécifique. Par exemple, vous pourriez disposer d'un quota pour créer des instances de VM dans la région us-central1, mais vous ne pas être en mesure de créer des instances de VM dans la zone us-central1-a si celle-ci n'a plus d'instances de VM disponibles. Dans ce cas, essayez de créer la même ressource dans une autre zone, par exemple us-central1-f. Pour en savoir plus sur les options qui s'offrent à vous si vos ressources zonales sont épuisées, consultez la documentation sur le dépannage de la disponibilité des ressources.

Les quotas d'allocation

Lors de la planification de vos besoins en instances de VM, vous devez prendre en compte plusieurs quotas qui affectent le nombre d'instances de VM que vous pouvez créer.

Quotas régionaux et mondiaux

Les quotas de VM sont gérés au niveau régional. Les instances de VM, groupes d'instances, quotas de disques et processeurs peuvent être consommés par n'importe quelle VM de la région, indépendamment de sa zone. Par exemple, le quota de processeurs est régional, ce qui signifie que chaque région prévoit une limite et un nombre d'utilisations différents. Pour lancer une instance n2-standard-16 dans n'importe quelle zone de la région us-central1, vous devez disposer d'un quota suffisant pour au moins 16 processeurs dans la région us-central1.

Des quotas de mise en réseau et d'équilibrage de charge sont requis pour créer des pare-feu, des équilibreurs de charge, des réseaux et des VPN. Ces quotas mondiaux ne dépendent d'aucune région, et chaque région peut utiliser un quota mondial. Par exemple, les adresses IP externes en cours d'utilisation et statiques affectées aux équilibreurs de charge et aux proxys HTTP(S) consomment des quotas mondiaux.

Instances de VM

Le quota d'instances de VM est un quota régional. Il limite le nombre d'instances de VM pouvant exister dans une région donnée, que la VM soit en cours d'exécution. Ce quota est visible dans Google Cloud Console, sur la page Quotas. Compute Engine définit automatiquement ce quota comme 10 fois votre quota de processeurs normal. Vous n'avez pas besoin de demander ce quota. Si vous avez besoin d'un quota pour couvrir davantage d'instances de VM, vous devez demander plus de processeurs, ce qui aura aussi pour effet d'augmenter ce quota. Ce quota s'applique aux VM en cours d'exécution et non exécutées, ainsi qu'aux instances normales et préemptives.

Dans Google Cloud Console, accédez à la page Quotas.

Accéder à la section "Quotas"
Cliquez sur Filtrer le tableau, puis sélectionnez Service.
Choisissez API Compute Engine.
Choisissez Quota : instances de VM.
Pour afficher la liste de vos quotas d'instances de VM par région, cliquez sur Tous les quotas. Vos quotas par région s'affichent de l'utilisation la plus élevée à la plus faible.
Cochez la case correspondant à la région dont vous souhaitez modifier le quota.
Cliquez sur Modifier les quotas.
Remplissez le formulaire.
Cliquez sur Envoyer la requête.

Groupes d'instances

Pour utiliser des groupes d'instances, vous devez disposer d'un quota pour toutes les ressources utilisées par le groupe (par exemple, le quota de processeurs) ou d'un quota pour la ressource du groupe elle-même. Selon le type de groupe que vous créez, les quotas d'utilisation des ressources de groupe suivants s'appliquent :

Type de service	Quota de service
Groupe d'instances géré régional (multizone)	`Regional instance group managers`
Groupe d'instances géré zonal (zone unique)	Les deux quotas suivants : `Instance group managers` `Instance groups`
Groupe d'instances non géré (zone unique)	`Instance groups`
Autoscaler régional (multizone)	`Regional autoscalers`
Autoscaler zonal (zone unique)	`Autoscalers`

Quotas de disques

Les quotas ci-dessous s'appliquent au niveau régional pour les disques persistants et les disques SSD locaux.

Local SSD per machine family (GB) : ce quota correspond à la taille totale combinée des partitions de disques SSD locaux que vous pouvez associer à des VM dans une région, en fonction du type de machine de chaque VM. Le disque SSD local est un espace disque rapide et éphémère à utiliser pour le travail, le cache local ou le traitement des jobs avec une haute tolérance aux pannes, car il n'est pas conçu pour résister aux redémarrages d'une instance de VM. Les partitions de disques SSD locaux sont vendues par incréments de 375 Go, et jusqu'à 24 de ces partitions peuvent être associées à une seule VM. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

Remarque : Le quota LOCAL_SSD_TOTAL_GB est obsolète. Pour afficher l'utilisation et les limites de quota de disques SSD locaux, vous devez utiliser la métrique de quota compute.googleapis.com/local_ssd_total_storage_per_vm_family^BÊTA dans vos tableaux de bord, alertes et requêtes Cloud Monitoring. Pour en savoir plus, consultez la page Afficher et gérer le quota de disques SSD locaux.
Persistent disk standard (GB) : taille totale des disques persistants standards pouvant être créés dans une région. Comme le décrit l'article sur l'optimisation des performances des disques persistants et des disques SSD locaux, les disques persistants standards offrent des IOPS et un débit plus faibles que les disques persistants SSD ou que les disques SSD locaux. Ils offrent cependant une bonne rentabilité si vous les utilisez en tant que disques volumineux durables pour le stockage, en tant que disques de démarrage et pour les processus d'écriture en série, par exemple pour la journalisation. Les disques persistants standards sont durables et disponibles indéfiniment à des fins d'association à une VM dans la même zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme DISKS_TOTAL_GB. Ce quota s'applique également aux disques persistants régionaux standards, mais les disques régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.
Persistent disk SSD (GB) : taille totale combinée des partitions de disques persistants SSD pouvant être créées dans une région. Ces disques disposent de plusieurs instances dupliquées et, comme le décrit l'article sur les performances des options de stockage de blocs, ils offrent des IOPS et un débit plus élevés que les disques persistants standards. Ils sont disponibles indéfiniment pour s'associer à une VM dans la même zone. Dans gcloud CLI et dans l'API, ce quota est désigné sous la forme SSD_TOTAL_GB. Ce quota est différent du quota de disques SSD locaux. Il s'applique aux types de disques suivants :
- Disque persistant SSD zonal et régional
- Disque persistant avec équilibrage zonal et régional
Les disques persistants régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.

Limites de quota de processeurs

Le quota de processeurs correspond au nombre total de processeurs virtuels sur toutes les instances de VM d'une région. Les quotas de processeurs s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.

Pour protéger les systèmes Compute Engine et les autres utilisateurs, certains nouveaux comptes et projets disposent également d'un quota mondial CPUs (All Regions) qui s'applique à toutes les régions et est mesuré en tant que somme de l'ensemble des processeurs virtuels dans toutes les régions.

Par exemple, si vous disposez de 48 processeurs virtuels dans une seule région (par exemple us-central1), mais qu'il ne reste que 32 processeurs virtuels pour le quota CPUs (All Regions), vous ne pouvez lancer que 32 processeurs virtuels dans la région us-central1 même si tout le quota de cette région n'est pas utilisé. En effet, vous atteindrez le quota CPU (All Regions) et vous devrez supprimer des instances existantes pour pouvoir en lancer de nouvelles.

Les types de machines E2 et N1 partagent un pool de quotas de processeurs. Sauf indication contraire, tous les autres types de machines disposent de pools de quotas de processeurs uniques et distincts.

Si vous utilisez des remises sur engagement d'utilisation pour vos VM, vous devez disposer d'un quota de remise sur engagement d'utilisation avant de souscrire un contrat de remise sur engagement d'utilisation.

Machine type (Type de machine)	Pool de quotas	Nom du quota de processeurs	Nom du quota de processeurs faisant l'objet d'un engagement
N1	pool partagé	`CPUS`	`Committed_CPUS`
E2	pool partagé	`CPUS`	`Committed_E2_CPUS`
N2	pool distinct	`N2_CPUS`	`Committed_N2_CPUS`
N2D	pool distinct	`N2D_CPUS`	`Committed_N2D_CPUS`
T2D	pool distinct	`T2D_CPUS`	`Committed_T2D_CPUS`
T2A	pool distinct	`T2A_CPUS`	Non disponible (N/A) pour T2A
Z3 (preview)	pool distinct	`CPUS_PER_VM_FAMILY`	`Committed_Z3_CPUS`
M1	pool distinct	`M1_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M2	pool distinct	`M2_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M3	pool distinct	`M3_CPUS`	`Committed_M3_CPUS`
H3	pool distinct	`CPUS_PER_VM_FAMILY`	`Committed_H3_CPUS`
C2	pool distinct	`C2_CPUS`	`Committed_C2_CPUS`
C2D	pool distinct	`C2D_CPUS`	`Committed_C2D_CPUS`
C3	pool distinct	`C3_CPUS`	`Committed_C3_CPUS`
C3D	pool distinct	`CPUS_PER_VM_FAMILY`	`Committed_C3D_CPUS`
VM préemptives	pool partagé	`PREEMPTIBLE_CPUS`	Non disponible (N/A) pour les VM préemptives

Quota de GPU

De la même manière que pour le quota de processeurs virtuels, le quota de GPU fait référence au nombre total de GPU virtuels dans toutes les instances de VM d'une région. Les quotas de GPU s'appliquent aux VM en cours d'exécution et aux réservations de VM. Les VM prédéfinies et les VM préemptives utilisent ce type de quota.

Consultez la page Quotas pour vérifier que vous disposez de suffisamment de GPU dans votre projet et demander une augmentation de quota si nécessaire. De plus, les nouveaux comptes et projets disposent d'un quota mondial de GPU qui s'applique à toutes les régions.

Lorsque vous demandez un quota de GPU, vous devez inclure les modèles de GPU que vous souhaitez créer dans chaque région, mais également demander un quota mondial supplémentaire (GPUs (all regions)) pour le nombre total de GPU de tous types, dans toutes les régions. Demandez un quota de GPU préemptifs pour utiliser ces ressources.

NVIDIA	Nom du quota de GPU	Nom du quota de GPU faisant l'objet d'un engagement	Poste de travail virtuel	GPU préemptifs	Poste de travail virtuel avec GPU préemptifs
H100 80 Go	`NVIDIA_H100_GPUS`	`COMMITTED_NVIDIA_H100_GPUS`	N/A	`PREEMPTIBLE_NVIDIA_H100_GPUS`	N/A
A100 40 Go	`NVIDIA_A100_GPUS`	`COMMITTED_NVIDIA_A100_GPUS`	Non disponible	`PREEMPTIBLE_NVIDIA_A100_GPUS`	Non disponible
A100 80 Go	`NVIDIA_A100_80GB_GPUS`	`COMMITTED_NVIDIA_A100_80GB_GPUS`	Non disponible	`PREEMPTIBLE_NVIDIA_A100_80GB_GPUS`	Non disponible
L4	`NVIDIA_L4_GPUS`	`COMMITTED_NVIDIA_L4_GPUS`	`NVIDIA_L4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_L4_GPUS`	`PREEMPTIBLE_NVIDIA_L4_VWS_GPUS`
T4	`NVIDIA_T4_GPUS`	`COMMITTED_NVIDIA_T4_GPUS`	`NVIDIA_T4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_T4_GPUS`	`PREEMPTIBLE_NVIDIA_T4_VWS_GPUS`
V100	`NVIDIA_V100_GPUS`	`COMMITTED_NVIDIA_V100_GPUS`	ND	`PREEMPTIBLE_NVIDIA_V100_GPUS`	ND
P100	`NVIDIA_P100_GPUS`	`COMMITTED_NVIDIA_P100_GPUS`	`NVIDIA_P100_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P100_GPUS`	`PREEMPTIBLE_NVIDIA_P100_VWS_GPUS`
P4	`NVIDIA_P4_GPUS`	`COMMITTED_NVIDIA_P4_GPUS`	`NVIDIA_P4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P4_GPUS`	`PREEMPTIBLE_NVIDIA_P4_VWS_GPUS`
K80	`NVIDIA_K80_GPUS`	`COMMITTED_NVIDIA_K80_GPUS`	ND	`PREEMPTIBLE_NVIDIA_K80_GPUS`	Non disponible

Quotas d'allocation pour des ressources préemptives

Vous pouvez utiliser des GPU ou processeurs préemptifs associés à des instances de VM préemptives, ou encore des disques SSD locaux associés à des instances de VM préemptives. Pour cela, vous devez disposer d'un quota disponible dans votre projet pour chaque ressource.

Vous pouvez demander des quotas préemptifs spéciaux pour les ressources Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). Toutefois, si votre projet ne dispose pas de quota préemptif et que vous n'avez jamais demandé de quota préemptif, vous pouvez utiliser le quota standard pour lancer les ressources préemptives.

Lorsque Compute Engine vous accorde un quota préemptif dans une région, toutes les instances préemptives sont automatiquement comptabilisées dans ce quota. Lorsque ce quota est épuisé, vous devez demander un quota préemptif pour ces ressources.

Adresses IP externes

Vous devez disposer de suffisamment d'adresses IP externes pour chaque VM devant être directement accessible depuis l'Internet public. Le quota d'IP régional permet d'attribuer des adresses IPv4 aux VM de cette région. Le quota d'IP mondial sert à attribuer des adresses IPv4 aux ressources réseau mondiales telles que les équilibreurs de charge. Google Cloud propose différents types d'adresses IP en fonction de vos besoins. Pour en savoir plus sur les tarifs, consultez la section Tarifs des adresses IP externes. Pour plus d'informations sur les détails des quotas, consultez la page Quotas et limites.

Adresses IP externes en cours d'utilisation : adresses IP éphémères et statiques qui sont actuellement utilisées par une ressource.

Remarque : Si la même adresse IP est attribuée à plusieurs règles de transfert, Google Cloud compte et ajoute chaque utilisation de l'adresse dans le champ IN_USE_ADDRESSES au lieu d'utiliser un nombre unique d'objets d'adresses IP utilisés.
Adresses IP externes statiques : adresses IP externes réservées aux ressources qui sont conservées lors des redémarrages de machines. Pour fournir une adresse facile à utiliser, vous pouvez enregistrer ces adresses avec des services DNS et de fournisseurs de domaine. Par exemple, votre adresse peut ressembler à www.exemple-site.com.
Adresses IP internes statiques : elles vous permettent de réserver des adresses IP internes dans la plage d'adresses IP internes configurée dans le sous-réseau. Vous pouvez attribuer ces adresses internes réservées aux ressources en fonction de vos besoins.

Déploiements de quotas

Google Cloud modifie parfois le quota par défaut des ressources et des API. Ces modifications ont lieu progressivement. Lors du déploiement d'un nouveau quota par défaut, le quota maximal qui s'affiche dans la console Google Cloud peut ne pas refléter le quota maximal effectivement disponible.

Par exemple, supposons que Google Cloud remplace le quota maximal par défaut des règles de pare-feu de 200 par 300 et que vous utilisiez votre console Google Cloud pour afficher votre quota : le nouveau quota 300 peut s'afficher, même si votre quota réel est de 200 jusqu'à la fin du déploiement.

Pour en savoir plus sur les déploiements de quotas en cours, consultez la section Problèmes connus. Si aucun problème n'y est décrit, cela signifie qu'aucun déploiement de quota n'est en cours.

Si un déploiement est en cours et que vous souhaitez vérifier que le quota maximal est disponible, utilisez Google Cloud CLi pour vérifier votre quota. Si vous avez besoin d'un quota supérieur à celui dont vous disposez, envoyez une demande d'augmentation de quota.

Étapes suivantes

Documentez-vous sur les Tarifs des ressources.
Documentez-vous sur les Tarifs des instances de VM.
Affichez et gérez les quotas.
Découvrez comment configurer des alertes d'utilisation des quotas.