Quotas de ressources

Compute Engine impose des quotas sur l'utilisation des ressources pour différentes raisons, par exemple pour préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Des quotas d'essai gratuit sont également proposés dans Google Cloud. Ils offrent un accès limité aux projets, ce qui vous permet d'explorer Google Cloud dans le cadre d'un essai gratuit.

Tous les projets ne sont pas soumis aux mêmes quotas. À mesure que votre utilisation de Google Cloud s'accroît, les quotas peuvent augmenter en conséquence. Si vous prévoyez une augmentation notable de l'utilisation, vous pouvez anticiper cette hausse en demandant des ajustements de quota sur la page Quotas de Cloud Console.

Autorisations de vérifier et modifier les quotas

Pour modifier vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.get.
Pour modifier vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.update.
Elle est incluse par défaut pour les rôles de base suivants : propriétaire, éditeur et administrateur de quota.

Vérifier les quotas

Chaque projet est doté de quotas différents. Pour vérifier les quotas disponibles pour un projet spécifique, accédez à la page Quotas dans Google Cloud Console.

Pour utiliser l'outil de ligne de commande gcloud, exécutez la commande suivante pour vérifier les quotas à l'échelle du projet :

gcloud compute project-info describe --project PROJECT_ID

Remplacez PROJECT_ID par votre ID de projet :

Sachez que les quotas par région ne s'affichent pas dans les résultats. Pour répertorier les quotas dans une région, exécutez :

gcloud compute regions describe REGION

Remplacez REGION par le nom de la région pour laquelle vous souhaitez obtenir une liste d'informations sur les quotas.

Demander une augmentation de quota

Demandez des modifications de quota à partir de la page Quotas de Cloud Console. Aucuns frais ne sont facturés pour les demandes d'augmentation de quota. Vos coûts n'augmentent que si vous utilisez plus de ressources.

  1. Dans Google Cloud Console, accédez à Quotas sur la page IAM et administration.

    Accéder à la section "Quotas"

Le moyen le plus efficace de voir vos quotas est d'utiliser le tableau des filtres.

  1. Ouvrez le tableau des filtres et sélectionnez Nom de la limite : pour rechercher le quota que vous souhaitez ajuster.
  2. Sélectionnez le Service pour lequel vous souhaitez ajuster votre quota.
  3. Faites votre sélection parmi les options du menu déroulant.
  4. Modifiez votre limite de quota.
  5. Cliquez sur ENREGISTRER.

Par défaut, les demandes de réduction de quota sont refusées. Si vous devez réduire votre quota, répondez à l'e-mail de l'assistance en expliquant vos besoins. Un conseiller de l'équipe d'assistance Compute Engine répondra à votre demande dans un délai de 24 à 48 heures.

Effectuez votre demande de ressources supplémentaires au moins quelques jours à l'avance pour que le temps de traitement soit suffisant.

Quotas et disponibilité des ressources

Les quotas de ressources représentent le nombre maximal de ressources que vous pouvez créer pour un type de ressources donné, sous réserve de disponibilité. Ils ne garantissent pas leur disponibilité perpétuelle. Si une ressource n'est pas disponible ou si la région que vous choisissez ne la propose plus, vous ne pouvez pas créer d'autres ressources de ce type, même si vous disposez du quota restant dans votre région ou votre projet. Par exemple, vous pouvez posséder suffisamment de quota pour créer des adresses IP externes dans us-central1, mais il n'est pas garanti que cette région propose des adresses IP disponibles.

De même, si vous disposez d'un quota régional, il est possible qu'une ressource ne soit pas disponible dans une zone spécifique. Par exemple, vous pouvez disposer d'un quota vous permettant de créer des instances de VM dans la région us-central1, mais vous n'êtes peut-être pas en mesure de créer des instances de VM dans la zone us-central1-a si celle-ci n'a plus d'instances de VM disponibles. Dans ce cas, essayez de créer la même ressource dans une autre zone, par exemple us-central1-f. Pour en savoir plus sur les options qui s'offrent à vous si vos ressources zonales sont épuisées, consultez la page Dépannage d'ordre général.

Comprendre les quotas

Lors de la planification de vos besoins en instances de machine virtuelle (VM), vous devez tenir compte d'un certain nombre de quotas qui affectent le nombre d'instances de VM que vous pouvez créer.

Quotas régionaux et mondiaux

Les quotas de VM sont gérés au niveau régional. Les quotas d'instances de VM, de groupes d'instances, de processeurs et de disques peuvent être consommés par n'importe quelle VM de la région, indépendamment de sa zone d'installation. Par exemple, le quota de processeurs est régional, ce qui signifie que chaque région prévoit une limite et un nombre d'utilisations différents. Pour lancer une instance n2-standard-16 dans n'importe quelle zone de la région us-central1, vous devez disposer d'un quota suffisant pour au moins 16 processeurs dans la région us-central1.

Des quotas de mise en réseau et d'équilibrage de charge sont requis pour créer des pare-feu, des équilibreurs de charge, des réseaux et des VPN. Ces quotas mondiaux ne dépendent d'aucune région, et chaque région peut utiliser un quota mondial. Par exemple, les adresses IP externes en cours d'utilisation et statiques affectées aux équilibreurs de charge et aux proxys HTTP(S) consomment des quotas mondiaux.

Quota de processeurs

Le quota de processeurs correspond au nombre total de processeurs virtuels sur toutes les instances de VM d'une région. Les quotas de processeurs s'appliquent aux instances en cours d'exécution et aux réservations d'instances. Les instances prédéfinies et préemptives utilisent ce type de quota.

Pour protéger les systèmes Compute Engine et les autres utilisateurs, certains nouveaux comptes et projets disposent également d'un quota mondial CPUs (All Regions) qui s'applique à toutes les régions et est mesuré en tant que somme de l'ensemble des processeurs virtuels dans toutes les régions.

Par exemple, si vous disposez de 48 processeurs virtuels dans une seule région (par exemple us-central1), mais qu'il ne reste que 32 processeurs virtuels pour le quota CPUs (All Regions), vous ne pouvez lancer que 32 processeurs virtuels dans la région us-central1 même si tout le quota de cette région n'est pas utilisé. En effet, vous atteindrez le quota CPU (All Regions) et vous devrez supprimer des instances existantes pour pouvoir en lancer de nouvelles.

Les types de machines E2 et N1 partagent un pool de quotas de processeurs. Les types de machines N2, N2D, M1, M2 et C2 ont des pools de quotas de processeurs uniques et distincts. Vous devez disposer d'un quota de remise sur engagement d'utilisation avant de souscrire un contrat de remise sur engagement d'utilisation.

Machine type (Type de machine) Pool de quotas Nom du quota de processeurs Nom du quota de processeurs faisant l'objet d'un engagement
E2, N1 pool partagé CPUS Committed_CPUS
N2 pool distinct N2_CPUS Committed_N2_CPUS
N2D pool distinct N2D_CPUS Committed_N2D_CPUS
M1 pool distinct M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool distinct M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
C2 pool distinct C2_CPUS Committed_C2_CPUS
A2 pool distinct A2_CPUS Committed_A2_CPUS
VM préemptives pool partagé PREEMPTIBLE_CPUS Non disponible pour les VM préemptives

Quota de GPU

De la même manière que pour le quota de processeurs virtuels, le quota de GPU fait référence au nombre total de GPU virtuels dans toutes les instances de VM d'une région. Consultez la page Quotas pour vérifier que vous disposez de suffisamment de GPU dans votre projet et demander une augmentation de quota si nécessaire. De plus, les nouveaux comptes et projets disposent d'un quota mondial de GPU qui s'applique à toutes les régions.

Lorsque vous demandez un quota de GPU, vous devez demander un quota pour les modèles de GPU que vous souhaitez créer dans chaque région, mais également un quota mondial supplémentaire pour le nombre total de GPU de tout type dans toutes les zones.

NVIDIA Nom du quota de GPU Nom du quota de GPU faisant l'objet d'un engagement Poste de travail virtuel GPU préemptifs Poste de travail virtuel avec GPU préemptifs
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS ND PREEMPTIBLE_NVIDIA_K80_GPUS ND
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
A100 NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS N/A PREEMPTIBLE_NVIDIA_A100_GPUS N/A
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS ND PREEMPTIBLE_NVIDIA_V100_GPUS ND

Instances de VM

Le quota d'instances de VM est un quota régional et limite le nombre d'instances de VM pouvant exister dans une région donnée, que la VM soit en cours d'exécution ou non. Ce quota est visible dans Google Cloud Console, sur la page "Quotas". Il est automatiquement défini par Compute Engine et correspond à 10 fois votre quota normal de processeurs. Vous n'avez pas besoin de demander ce quota. Si vous avez besoin d'un quota pour couvrir davantage d'instances de VM, vous devez demander plus de processeurs, ce qui aura aussi pour effet d'augmenter ce quota. Ce quota s'applique aux VM en cours d'exécution et non exécutées, ainsi qu'aux instances normales et préemptives.

  1. Dans Google Cloud Console, accédez à Quotas sur la page IAM et administration.

    Accéder à la section "Quotas"

  2. Ouvrez le tableau des filtres et sélectionnez Service.

  3. Choisissez API Compute Engine.

  4. Choisissez Nom de la limite : instances de VM.

  5. Cliquez sur Tous les quotas pour afficher la liste de vos quotas d'instances de VM par région. Vos quotas par région s'affichent de l'utilisation la plus élevée à la plus faible.

  6. Cochez la case correspondant à la région dont vous souhaitez modifier le quota.

  7. Cliquez sur MODIFIER LES QUOTAS .

  8. Remplissez le formulaire.

  9. Cliquez sur ENVOYER LA REQUÊTE.

Quotas de ressources préemptives

Vous pouvez utiliser des GPU ou processeurs préemptifs associés à des instances de VM préemptives, ou encore des disques SSD locaux associés à des instances de VM préemptives. Pour cela, vous devez disposer d'un quota disponible dans votre projet pour chaque ressource.

Vous pouvez demander des quotas préemptifs spéciaux pour les ressources Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). Toutefois, si votre projet ne dispose pas de quota préemptif, vous pouvez toujours utiliser le quota normal pour lancer des ressources préemptives.

Lorsque Compute Engine vous accorde un quota préemptif dans une région, toutes les instances préemptives sont automatiquement comptabilisées dans ce quota.

Quotas de disques

Les quotas ci-dessous s'appliquent au niveau régional pour les disques persistants et les disques SSD locaux.

  • Local SSD (GB) : taille totale combinée des partitions de disques  SSD locaux pouvant être associés à des VM dans une région. Le disque SSD local est un disque rapide et éphémère à utiliser pour le travail, le cache local ou le traitement des tâches avec une haute tolérance aux pannes, car il n'est pas conçu pour résister aux redémarrages d'une instance de VM. Les partitions de disques SSD locaux sont vendues par incréments de 375 Go, et jusqu'à 24 de ces partitions peuvent être associées à une seule VM. Dans l'outil gcloud et dans l'API, ils sont désignés sous la forme LOCAL_SSD_TOTAL_GB.

  • Persistent disk standard (GB) : taille totale des disques persistants standards pouvant être créés dans une région. Comme le décrit l'article sur l'optimisation des performances des disques persistants et des disques SSD locaux, les disques persistants standards offrent des IOPS et un débit plus faibles que les disques persistants SSD ou que les disques SSD locaux. Ils offrent cependant une bonne rentabilité si vous les utilisez en tant que disques volumineux durables pour le stockage, en tant que disques de démarrage et pour les processus d'écriture en série, par exemple pour la journalisation. Les disques persistants standards sont durables et disponibles indéfiniment à des fins d'association à une VM dans la même zone. Dans l'outil gcloud et dans l'API, ils sont désignés sous la forme DISKS_TOTAL_GB. Ce quota s'applique également aux disques persistants régionaux standards, mais les disques régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.

  • Persistent disk SSD (GB) : taille totale combinée des partitions de disques persistants SSD pouvant être créées dans une région. Ces disques disposent de plusieurs instances dupliquées et, comme le décrit l'article sur les performances des options de stockage de blocs, ils offrent des IOPS et un débit plus élevés que les disques persistants standards. Ils sont disponibles indéfiniment pour s'associer à une VM dans la même zone. Dans l'outil gcloud et dans l'API, ils sont désignés sous la forme SSD_TOTAL_GB. Ce quota est différent du quota de disques SSD locaux. Il s'applique aux types de disques répertoriés ci-dessous. Les disques persistants régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.

    • Disque persistant SSD zonal et régional
    • Disque persistant avec équilibrage zonal et régional

Adresses IP externes

Vous devez disposer de suffisamment d'adresses IP externes pour chaque VM devant être directement accessible depuis l'Internet public. Le quota d'IP régional permet d'attribuer des adresses IPv4 aux VM de cette région. Le quota d'IP mondial sert à attribuer des adresses IPv4 aux ressources réseau mondiales telles que les équilibreurs de charge. Google Cloud propose différents types d'adresses IP en fonction de vos besoins. Pour en savoir plus sur les tarifs, consultez la section Tarifs des adresses IP externes. Pour plus d'informations sur les détails des quotas, consultez la page Quotas et limites.

  • Adresses IP externes en cours d'utilisation : adresses IP éphémères et statiques qui sont actuellement utilisées par une ressource.
  • Adresses IP externes statiques : adresses IP externes réservées aux ressources qui sont conservées lors des redémarrages de machines. Pour fournir une adresse facile à utiliser, vous pouvez enregistrer ces adresses avec des services DNS et de fournisseurs de domaine. Par exemple, votre adresse peut ressembler à www.exemple-site.com.
  • Adresses IP internes statiques : elles permettent de réserver des adresses dans la plage d'adresses IP internes configurée dans le sous-réseau. Vous pouvez attribuer ces adresses internes réservées aux ressources en fonction de vos besoins.

Groupes d'instances

Pour utiliser des groupes d'instances, vous devez disposer d'un quota pour toutes les ressources qui seront utilisées par le groupe (par exemple, le quota de processeurs), mais aussi d'un quota pour la ressource du groupe elle-même. Selon le type de groupe que vous créez, les quotas de ressources de groupe suivants s'appliquent :

Type de service Quota de service
Groupe d'instances géré régional (multizone) Regional instance group managers
Groupe d'instances géré zonal (zone unique) Les deux quotas suivants :
  • Instance group managers
  • Instance groups
Groupe d'instances non géré (zone unique) Instance groups
Autoscaler régional (multizone) Regional autoscalers
Autoscaler zonal (zone unique) Autoscalers