Quotas de ressources

Compute Engine impose des quotas sur l'utilisation des ressources pour différentes raisons. Il s'agit, par exemple, de préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Des quotas d'essai gratuit sont également proposés dans Google Cloud. Ils offrent un accès limité aux projets, ce qui vous permet d'explorer Google Cloud dans le cadre d'un essai gratuit.

Tous les projets ne sont pas soumis aux mêmes quotas. À mesure que votre utilisation de Google Cloud s'accroît, vos quotas peuvent augmenter en conséquence. Si vous prévoyez une augmentation notable de l'utilisation, vous pouvez anticiper cette hausse en demandant des ajustements de quota sur la page Quotas de Cloud Console.

Pour plus d'informations sur les quotas de limitations du débit de l'API Compute Engine, consultez la page Limitations du débit des API.

Autorisations de vérifier et modifier les quotas

Pour consulter vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.get.

Pour modifier vos quotas, vous devez bénéficier d'une autorisation serviceusage.quotas.update.

Ces autorisations sont incluses par défaut dans les rôles IAM de base Propriétaire et Éditeur, ainsi que dans le rôle Administrateur de quotas prédéfini.

Vérifier les quotas

Les quotas régionaux ne font pas partie des quotas de projet. Les instances de machines virtuelles (VM) font partie des quotas régionaux.

Si vous recherchez des quotas régionaux, tels que le nombre de VM que vous pouvez créer dans une région, consultez la section Vérifier les quotas régionaux. Pour vérifier votre quota de projet, utilisez Google Cloud Console ou l'outil de ligne de commande gcloud.

Pour en savoir plus sur les catégories de quotas, consultez la page Comprendre les quotas.

Vérifier les quotas régionaux

Console

Dans Google Cloud Console, accédez à la page Quotas.

Accéder à la section "Quotas"

gcloud

Pour répertorier les quotas dans une région :

gcloud compute regions describe REGION

Remplacez REGION par le nom de la région pour laquelle vous souhaitez obtenir une liste des informations sur les quotas.

Vérifier les quotas du projet

Console

Dans Google Cloud Console, accédez à la page Quotas.

Accéder à la section "Quotas"

gcloud

Vérifiez les quotas à l'échelle du projet :

gcloud compute project-info describe --project PROJECT_ID

Remplacez PROJECT_ID par l'ID du projet.

Demander une augmentation de quota

Demandez des modifications de quota à partir de la page Quotas de Cloud Console. Aucuns frais ne sont facturés pour les demandes d'augmentation de quota. Vos coûts n'augmentent que si vous utilisez plus de ressources.

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

    Le moyen le plus efficace de voir vos quotas est d'utiliser le tableau des filtres.

  2. Pour rechercher le quota à ajuster, cliquez sur Filtrer le tableau, puis sélectionnez Limiter le nom.

  3. Sélectionnez le Service pour lequel vous souhaitez ajuster votre quota.

  4. Cliquez sur le bouton Modifier les quotas en haut de la page.

  5. Modifiez votre limite de quota et indiquez une justification si nécessaire.

  6. Cliquez sur Enregistrer.

Par défaut, les demandes de réduction de quota sont refusées. Si vous devez réduire votre quota, répondez à l'e-mail de l'assistance en expliquant vos besoins. Un conseiller de l'équipe d'assistance Compute Engine répondra à votre demande dans un délai de 24 à 48 heures.

Effectuez votre demande de ressources supplémentaires au moins quelques jours à l'avance pour que le temps de traitement soit suffisant.

Quotas et disponibilité des ressources

Les quotas de ressources représentent le nombre maximal de ressources que vous pouvez créer pour un type de ressources donné, sous réserve de disponibilité. Ils ne garantissent pas leur disponibilité permanente. Si une ressource n'est pas disponible ou si la région que vous choisissez ne la propose plus, vous ne pouvez pas créer d'autres ressources de ce type, même si vous disposez du quota restant dans votre région ou votre projet. Par exemple, vous pouvez posséder suffisamment de quota pour créer des adresses IP externes dans us-central1, mais il n'est pas garanti que cette région propose des adresses IP disponibles.

De même, si vous disposez d'un quota régional, il est possible qu'une ressource ne soit pas disponible dans une zone spécifique. Par exemple, vous pourriez disposer d'un quota pour créer des instances de VM dans la région us-central1, mais vous ne pas être en mesure de créer des instances de VM dans la zone us-central1-a si celle-ci n'a plus d'instances de VM disponibles. Dans ce cas, essayez de créer la même ressource dans une autre zone, par exemple us-central1-f. Pour en savoir plus sur les options qui s'offrent à vous si vos ressources zonales sont épuisées, consultez la page Dépannage d'ordre général.

Comprendre les quotas

Lors de la planification de vos besoins en instances de VM, vous devez prendre en compte plusieurs quotas qui affectent le nombre d'instances de VM que vous pouvez créer.

Quotas régionaux et mondiaux

Les quotas de VM sont gérés au niveau régional. Les instances de VM, groupes d'instances, quotas de disques et processeurs peuvent être consommés par n'importe quelle VM de la région, indépendamment de sa zone. Par exemple, le quota de processeurs est régional, ce qui signifie que chaque région prévoit une limite et un nombre d'utilisations différents. Pour lancer une instance n2-standard-16 dans n'importe quelle zone de la région us-central1, vous devez disposer d'un quota suffisant pour au moins 16 processeurs dans la région us-central1.

Des quotas de mise en réseau et d'équilibrage de charge sont requis pour créer des pare-feu, des équilibreurs de charge, des réseaux et des VPN. Ces quotas mondiaux ne dépendent d'aucune région, et chaque région peut utiliser un quota mondial. Par exemple, les adresses IP externes en cours d'utilisation et statiques affectées aux équilibreurs de charge et aux proxys HTTP(S) consomment des quotas mondiaux.

Instances de VM

Le quota d'instances de VM est un quota régional. Il limite le nombre d'instances de VM pouvant exister dans une région donnée, que la VM soit en cours d'exécution. Ce quota est visible dans Google Cloud Console, sur la page Quotas. Compute Engine définit automatiquement ce quota comme 10 fois votre quota de processeurs normal. Vous n'avez pas besoin de demander ce quota. Si vous avez besoin d'un quota pour couvrir davantage d'instances de VM, vous devez demander plus de processeurs, ce qui aura aussi pour effet d'augmenter ce quota. Ce quota s'applique aux VM en cours d'exécution et non exécutées, ainsi qu'aux instances normales et préemptives.

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

  2. Cliquez sur Filtrer le tableau, puis sélectionnez Service.

  3. Choisissez API Compute Engine.

  4. Choisissez Nom de la limite : instances de VM.

  5. Pour afficher la liste de vos quotas d'instances de VM par région, cliquez sur Tous les quotas. Vos quotas par région s'affichent de l'utilisation la plus élevée à la plus faible.

  6. Cochez la case correspondant à la région dont vous souhaitez modifier le quota.

  7. Cliquez sur Modifier les quotas.

  8. Remplissez le formulaire.

  9. Cliquez sur Envoyer la requête.

Groupes d'instances

Pour utiliser des groupes d'instances, vous devez disposer d'un quota pour toutes les ressources utilisées par le groupe (par exemple, le quota de processeurs) ou d'un quota pour la ressource du groupe elle-même. Selon le type de groupe que vous créez, les quotas de ressources de groupe suivants s'appliquent :

Type de service Quota de service
Groupe d'instances géré régional (multizone) Regional instance group managers
Groupe d'instances géré zonal (zone unique) Les deux quotas suivants :
  • Instance group managers
  • Instance groups
Groupe d'instances non géré (zone unique) Instance groups
Autoscaler régional (multizone) Regional autoscalers
Autoscaler zonal (zone unique) Autoscalers

Quotas de disques

Les quotas ci-dessous s'appliquent au niveau régional pour les disques persistants et les disques SSD locaux.

  • Local SSD (GB) : taille totale combinée des partitions de disques SSD locaux pouvant être associés à des VM dans une région.  Le disque SSD local est un disque rapide et éphémère à utiliser pour le travail, le cache local ou le traitement des tâches avec une haute tolérance aux pannes, car il n'est pas conçu pour résister aux redémarrages d'une instance de VM. Les partitions de disques SSD locaux sont vendues par incréments de 375 Go, et jusqu'à 24 de ces partitions peuvent être associées à une seule VM. Dans l'outil gcloud et dans l'API, ce quota est désigné sous la forme LOCAL_SSD_TOTAL_GB.
  • Persistent disk standard (GB) : taille totale des disques persistants standards pouvant être créés dans une région. Comme le décrit l'article sur l'optimisation des performances des disques persistants et des disques SSD locaux, les disques persistants standards offrent des IOPS et un débit plus faibles que les disques persistants SSD ou que les disques SSD locaux. Ils offrent cependant une bonne rentabilité si vous les utilisez en tant que disques volumineux durables pour le stockage, en tant que disques de démarrage et pour les processus d'écriture en série, par exemple pour la journalisation. Les disques persistants standards sont durables et disponibles indéfiniment à des fins d'association à une VM dans la même zone. Dans l'outil gcloud et dans l'API, ce quota est désigné sous la forme DISKS_TOTAL_GB. Ce quota s'applique également aux disques persistants régionaux standards, mais les disques régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.
  • Persistent disk SSD (GB) : taille totale combinée des partitions de disques persistants SSD pouvant être créées dans une région. Ces disques disposent de plusieurs instances dupliquées et, comme le décrit l'article sur les performances des options de stockage de blocs, ils offrent des IOPS et un débit plus élevés que les disques persistants standards. Ils sont disponibles indéfiniment pour s'associer à une VM dans la même zone. Dans l'outil gcloud et dans l'API, ce quota est désigné sous la forme SSD_TOTAL_GB. Ce quota est différent du quota de disques SSD locaux. Il s'applique aux types de disques répertoriés ci-dessous. Les disques persistants régionaux consomment deux fois plus de quota par Go, à cause de la réplication dans deux zones d'une même région.
    • Disque persistant SSD zonal et régional
    • Disque persistant avec équilibrage zonal et régional

Quota de processeurs

Le quota de processeurs correspond au nombre total de processeurs virtuels sur toutes les instances de VM d'une région. Les quotas de processeurs s'appliquent aux instances en cours d'exécution et aux réservations d'instances. Les instances prédéfinies et préemptives utilisent ce type de quota.

Pour protéger les systèmes Compute Engine et les autres utilisateurs, certains nouveaux comptes et projets disposent également d'un quota mondial CPUs (All Regions) qui s'applique à toutes les régions et est mesuré en tant que somme de l'ensemble des processeurs virtuels dans toutes les régions.

Par exemple, si vous disposez de 48 processeurs virtuels dans une seule région (par exemple us-central1), mais qu'il ne reste que 32 processeurs virtuels pour le quota CPUs (All Regions), vous ne pouvez lancer que 32 processeurs virtuels dans la région us-central1 même si tout le quota de cette région n'est pas utilisé. En effet, vous atteindrez le quota CPU (All Regions) et vous devrez supprimer des instances existantes pour pouvoir en lancer de nouvelles.

Les types de machines E2 et N1 partagent un pool de quotas de processeurs. Les types de machines N2, N2D, M1, M2 et C2 ont des pools de quotas de processeurs uniques et distincts.

Si vous utilisez des remises sur engagement d'utilisation pour vos VM, vous devez disposer d'un quota de remise sur engagement d'utilisation avant de souscrire un contrat de remise sur engagement d'utilisation.

Machine type (Type de machine) Pool de quotas Nom du quota de processeurs Nom du quota de processeurs faisant l'objet d'un engagement
E2, N1 pool partagé CPUS Committed_CPUS
N2 pool distinct N2_CPUS Committed_N2_CPUS
N2D pool distinct N2D_CPUS Committed_N2D_CPUS
M1 pool distinct M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool distinct M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
C2 pool distinct C2_CPUS Committed_C2_CPUS
A2 pool distinct A2_CPUS Committed_A2_CPUS
VM préemptives pool partagé PREEMPTIBLE_CPUS Non disponible (N/A) pour les VM préemptives

Quota de GPU

De la même manière que pour le quota de processeurs virtuels, le quota de GPU fait référence au nombre total de GPU virtuels dans toutes les instances de VM d'une région. Consultez la page Quotas pour vérifier que vous disposez de suffisamment de GPU dans votre projet et demander une augmentation de quota si nécessaire. De plus, les nouveaux comptes et projets disposent d'un quota mondial de GPU qui s'applique à toutes les régions.

Lorsque vous demandez un quota de GPU, vous devez demander un quota pour les modèles de GPU que vous souhaitez créer dans chaque région, mais également un quota mondial supplémentaire pour le nombre total de GPU de tout type dans toutes les zones. Demandez un quota de GPU préemptifs pour utiliser ces ressources.

NVIDIA Nom du quota de GPU Nom du quota de GPU faisant l'objet d'un engagement Poste de travail virtuel GPU préemptifs Poste de travail virtuel avec GPU préemptifs
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS ND PREEMPTIBLE_NVIDIA_K80_GPUS ND
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
A100 NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS Non disponible PREEMPTIBLE_NVIDIA_A100_GPUS Non disponible
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS ND PREEMPTIBLE_NVIDIA_V100_GPUS Non disponible

Quotas de ressources préemptives

Vous pouvez utiliser des GPU ou processeurs préemptifs associés à des instances de VM préemptives, ou encore des disques SSD locaux associés à des instances de VM préemptives. Pour cela, vous devez disposer d'un quota disponible dans votre projet pour chaque ressource.

Vous pouvez demander des quotas préemptifs spéciaux pour les ressources Preemptible CPUs, Preemptible GPUs ou Preemptible Local SSDs (GB). Toutefois, si votre projet ne dispose pas de quota préemptif et que vous n'avez jamais demandé de quota préemptif, vous pouvez utiliser le quota standard pour lancer les ressources préemptives.

Lorsque Compute Engine vous accorde un quota préemptif dans une région, toutes les instances préemptives sont automatiquement comptabilisées dans ce quota. Lorsque ce quota est épuisé, vous devez demander un quota préemptif pour ces ressources.

Adresses IP externes

Vous devez disposer de suffisamment d'adresses IP externes pour chaque VM devant être directement accessible depuis l'Internet public. Le quota d'IP régional permet d'attribuer des adresses IPv4 aux VM de cette région. Le quota d'IP mondial sert à attribuer des adresses IPv4 aux ressources réseau mondiales telles que les équilibreurs de charge. Google Cloud propose différents types d'adresses IP en fonction de vos besoins. Pour en savoir plus sur les tarifs, consultez la section Tarifs des adresses IP externes. Pour plus d'informations sur les détails des quotas, consultez la page Quotas et limites.

  • Adresses IP externes en cours d'utilisation : adresses IP éphémères et statiques qui sont actuellement utilisées par une ressource.

  • Adresses IP externes statiques : adresses IP externes réservées aux ressources qui sont conservées lors des redémarrages de machines. Pour fournir une adresse facile à utiliser, vous pouvez enregistrer ces adresses avec des services DNS et de fournisseurs de domaine. Par exemple, votre adresse peut ressembler à www.exemple-site.com.

  • Adresses IP internes statiques : elles vous permettent de réserver des adresses IP internes dans la plage d'adresses IP internes configurée dans le sous-réseau. Vous pouvez attribuer ces adresses internes réservées aux ressources en fonction de vos besoins.

Étape suivante