Les quotas et leur utilisation

Google Cloud applique des quotas pour limiter la quantité d'une ressource Google Cloud partagée spécifique que vous pouvez utiliser. Chaque quota représente une ressource dénombrable spécifique, telle que les appels d'API à un service particulier, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer.

Cette page explique comment utiliser les quotas dans vos projets, y compris comment rechercher et modifier les limites de quota existantes, comment demander un quota supérieur et comment surveiller l'utilisation des quotas.

De nombreux services présentent également des limites qui ne sont pas liées au système de quotas. Il s'agit de contraintes fixes, telles que la taille maximale des fichiers ou les limitations du schéma de base de données, qui ne peuvent pas être augmentées ou diminuées. Pour en savoir plus à ce sujet, consultez la page "Quotas et limites" du service concerné (par exemple, Quotas et limites relatifs à Cloud Storage).

Les liens suivants fournissent des informations supplémentaires sur l'utilisation des ressources :

Faites l'essai

Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.

Essai gratuit

À propos des quotas

Avant de savoir comment surveiller et gérer votre quota, il est utile de comprendre les principes de fonctionnement du système de quota de Google Cloud. Cette section présente certains concepts clés concernant les quotas, y compris les types de quotas, les limites de quota et les requêtes d'augmentation de quota.

Pourquoi appliquons-nous les quotas ?

Les quotas sont appliqués pour différentes raisons, y compris :

  • Protéger la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus et les services surchargés.
  • Pour vous aider à gérer vos ressources Par exemple, vous pouvez définir vos propres limites d'utilisation du service lors du développement et du test de vos applications afin d'éviter que des frais inattendues dus à l'utilisation de ressources coûteuses.

Types de quotas

Il existe deux catégories de quotas :

  • Les quotas de débit permettent généralement de limiter le nombre de requêtes que vous pouvez envoyer à une API ou à un service. Les quotas de débit sont réinitialisés après un délai spécifique au service (par exemple, le nombre de requêtes API par jour).
  • Les quotas d'allocation permettent de restreindre l'utilisation des ressources qui ne sont pas soumises à un taux d'utilisation, tel que le nombre de VM utilisées par votre projet à un moment donné. Les quotas d'allocation ne sont pas réinitialisés au fil du temps, mais vous devez explicitement libérer la ressource lorsque vous ne souhaitez plus l'utiliser, par exemple en supprimant un cluster GKE.

Dans ces catégories, certains quotas sont mondiaux et s'appliquent à votre utilisation de la ressource n'importe où dans Google Cloud, tandis que d'autres sont régionaux ou zonaux et s'appliquent à votre utilisation de la ressource dans une région Google Cloud spécifique (les deux types de quota) ou zone (quotas d'allocation uniquement). Par exemple, il existe des limites distinctes pour le nombre d'instances de VM Compute Engine que vous pouvez créer dans chaque région Google Cloud.

Les quotas sont appliqués par projet, à l'exception du nombre de projets que vous pouvez créer, qui est appliqué par compte utilisateur et par compte de facturation.

Afficher les informations sur les quotas

Il existe plusieurs façons d'afficher et de gérer votre quota Google Cloud :

Vous trouverez des détails sur l'utilisation de ces approches dans la suite de ce document. Chaque produit ou service possède également sa propre page de quotas et de limites qui contient des informations spécifiques sur les quotas de ce service, par exemple la page Quotas et limites de GKE.

Comprendre les limites de quota

Bien que de nombreux services disposent de quotas par défaut pour certaines ressources, l'ensemble de limites qui s'applique à vos applications est propre à vous, à votre projet ou à votre organisation. Par exemple, si vous utilisez un compte d'essai gratuit pour explorer la plate-forme, votre quota peut être très faible pour certaines ressources par rapport aux quotas les plus bas pour un compte de facturation. L'activation de la facturation pour votre projet augmente les quotas pour la plupart des services. Les quotas peuvent également augmenter à mesure que votre utilisation de Google Cloud s'accroît.

Si votre projet nécessite plus d'une ressource que ne le permettent vos quotas, vous pouvez demander plus de quota pour un service spécifique. Pour en savoir plus sur le fonctionnement des demandes d'augmentation de quota, consultez la page À propos des demandes d'augmentation de quota. Vous pouvez également ajouter vos propres limites de certains quotas si vous souhaitez imposer des plafonds budgétaires, en particulier lors du développement ou du test d'une application utilisant des ressources coûteuses.

Certains quotas sont illimités pour certains utilisateurs spécifiques. Dans ce cas, vous pouvez utiliser autant de ressources que vous le souhaitez.

Enfin, pour quelques quotas, les valeurs par défaut ne peuvent pas être augmentées. C'est le cas par exemple lorsqu'une utilisation plus importante constitue un antimodèle ou que les ressources sont très limitées. Cela est généralement documenté dans la page "Quotas et limites" du service concerné, comme dans cet exemple Cloud Functions.

Épuisement des quotas

Dans la plupart des cas, si vous avez dépassé le quota que vous essayez d'appliquer, par exemple le déploiement d'une application, la création d'un projet ou l'appel d'une API, l'opération échoue et une erreur de quota s'affiche. La tâche continue d'échouer jusqu'à ce que vous libériez des ressources (pour le quota d'allocation), que la période soit réinitialisée (pour le quota de débit) ou que vous demandiez une augmentation de quota.

L'affichage de l'erreur de quota dépend de l'outil ou du client que vous utilisez pour interagir avec Google Cloud. Vous pouvez consulter les détails des erreurs de quota dans Erreurs de quota.

Pour éviter d'obtenir des erreurs de quota, configurez la surveillance de sorte à être averti lorsque vous approchez des limites de quota. Pour en savoir plus sur la surveillance de vos quotas, consultez Surveillance et alertes sur les métriques de quota, plus loin dans ce document.

À propos des demandes d'augmentation de quota

La plupart des demandes d'augmentation de quota sont évaluées par des systèmes automatisés selon des critères stricts, y compris la disponibilité des ressources, la durée d'utilisation de Google Cloud et d'autres facteurs. Les requêtes qui ne répondent pas à des critères spécifiques sont refusées. Les critères d'évaluation des examens automatisés ne sont pas divulgués afin de garantir l'équité pour tous les clients et d'empêcher les tentatives de manipulation du processus. Dans certains cas, les demandes d'augmentation de quota sont transmises aux évaluateurs humains, qui suivent également des critères stricts mais peuvent tenir compte de vos circonstances uniques.

Vous devrez peut-être régler à l'avance certaines augmentations de quota. Par exemple, vous pouvez être invité à effectuer un paiement si vous demandez d'autres projets qui utiliseront des services cloud payants. Le paiement peut être appliqué à tous les frais encourus à l'avenir et sera visible en tant que crédit sur votre compte.

Les demandes d'augmentation de quota sont traitées par Cloud Customer Care (et non Billing), qui traite votre demande, généralement dans un délai de deux à trois jours ouvrés. Vous recevez un e-mail lorsque votre demande est reçue. Vous pouvez y répondre si vous avez des questions ou souhaitez fournir des informations supplémentaires sur votre demande (par exemple, si votre demande d'augmentation est urgente). Vous recevez ensuite un autre e-mail après le traitement de la demande, vous indiquant si l'augmentation du quota a été approuvée ou refusée. L'e-mail indique la date d'entrée en vigueur de l'augmentation, le cas échéant.

Pour en savoir plus sur le fonctionnement des demandes de quota, consultez l'article Demander une augmentation de limite de quota.

Autorisations

Autorisations d'afficher les quotas de projets

Pour afficher le quota de votre projet dans Google Cloud Console ou pour accéder au quota du projet de manière automatisée, vous devez disposer des autorisations IAM suivantes :

  • resourcemanager.projects.get
  • resourcemanager.folders.get (si vous souhaitez afficher le quota d'un dossier complet)
  • resourcemanager.organizations.get (si vous souhaitez afficher le quota de l'ensemble d'une organisation)
  • serviceusage.quotas.get

Pour savoir quels rôles incluent ces autorisations par défaut, consultez la documentation de référence sur les autorisations IAM.

Autorisations de modifier les quotas de projets

Pour modifier votre quota au niveau du projet, du dossier ou de l'organisation, vous devez disposer de l'autorisation suivante :

Elle est incluse par défaut pour les rôles suivants : Propriétaire, Éditeur, Administrateur de quotas et Administrateur Service Usage.

Afficher votre quota dans Cloud Console

Vous pouvez afficher vos limites de quota actuelles dans Google Cloud Console en deux endroits :

  • Sur la page Quotas, qui répertorie l'utilisation et les limites de quota de votre projet
  • Dans le tableau de bord des API de Cloud Console, qui répertorie les informations de quota pour une API spécifique, y compris l'utilisation des ressources au fil du temps

Afficher tous les quotas de projet

Pour afficher l'utilisation et les limites de quota de toutes les ressources de votre projet :

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

    La liste comprend une ligne pour chaque type de quota disponible dans chaque service.

  2. Triez et filtrez les résultats pour vous concentrer sur les informations dont vous avez besoin :

    • Pour afficher une propriété spécifique, cliquez sur  Filtrer le tableau.
    • Pour trier les listes par ordre alphabétique, placez le pointeur sur Service, Nom de la limite, État du quota ou Détails.
    • Par défaut, la liste est triée de manière à afficher votre quota le plus utilisé en premier (en fonction du pic d'utilisation au cours des sept derniers jours). Vous pouvez ainsi afficher les limites qui risquent d'être dépassées. Pour afficher le quota le moins utilisé en premier, cliquez sur la flèche État du quota.
    • Pour en savoir plus sur votre utilisation actuelle concernant un quota particulier, cliquez sur Tous les quotas dans la colonne Détails.

Les métriques d'utilisation des quotas répertoriées sur la page Quotas sont calculées comme suit :

  • Quotas de débit :
    • Pour le quota de débit quotidien, le nombre indiqué représente l'utilisation totale à l'instant T pour la période de 24 heures en cours.
    • Pour le quota par minute ou pour 100 secondes, le nombre indiqué représente l'utilisation moyenne au cours des dernières 24 heures.
  • Quotas d'allocation : le nombre indiqué représente la quantité de ressources (telle que le nombre d'équilibreurs de charge) actuellement utilisées par votre projet.

Pour en savoir plus sur les quotas d'un service spécifique, consultez la documentation associée à ce service. Par exemple, le quota de Compute Engine est décrit dans la section Quotas de ressources.

Afficher les quotas spécifiques aux API

Pour afficher des informations détaillées sur le quota d'une API spécifique, y compris son utilisation dans le temps, consultez la page des quotas de l'API dans Cloud Console. Selon l'API, ces limites peuvent inclure des requêtes par jour, des requêtes par minute, et des requêtes par minute et par utilisateur. Certaines API définissent des limites très basses tant que vous n'avez pas activé la facturation sur votre projet.

Vous pouvez afficher les limites actuelles d'une API particulière dans Cloud Console, à deux endroits :

  • Sur la page Quotas de Cloud Console, comme décrit dans la section Afficher tous les quotas de projet

  • Sur le tableau de bord API et services dans Cloud Console. Sélectionnez votre projet, cliquez sur le nom de l'API, puis sur Quotas. La page Quotas indique le nom des quotas pour l'API. Vous pouvez développer chacun de ces quotas pour afficher l'utilisation détaillée dans le temps ainsi que la limite actuelle. Google impose ces limites par défaut. Comme décrit dans la section Limiter l'utilisation des ressources, vous pouvez imposer une limite d'utilisation. Si Google n'impose pas de limite pour un quota donné, la limite est affichée comme illimitée.

    Certains quotas n'apparaissent pas sur la page de quota spécifique à une API. Par exemple, les requêtes vers l'API Compute Engine ont une page de quota spécifique, mais cela n'inclut pas l'utilisation des ressources de calcul Compute Engine (quota d'allocation). En outre, si vous utilisez un service dans plusieurs emplacements, la page de quota spécifique à l'API ne présente pas les limites et l'utilisation régionales ou zonales des quotas. Pour obtenir la liste des quotas utilisés par votre projet (que vous pouvez filtrer par emplacement), consultez la page Quotas du projet.

Afficher le nombre de projets que vous pouvez créer

Chaque compte utilisateur (y compris les comptes de service) et compte de facturation a un nombre limité de projets qu'il peut créer. S'il vous reste moins de 30 projets dans votre quota, une notification affiche le nombre de projets restants sur la page Nouveau projet. Pour en savoir plus sur la gestion de ce quota, consultez les pages Gérer les quotas de projets et Demandes de quotas de projet.

Gérer votre quota avec Cloud Console

Selon l'utilisation de vos ressources, vous pouvez ajuster les limites de quota de votre projet à la hausse ou à la baisse. Cette section décrit comment modifier les limites de quota fournies. Pour consulter vos limites de quota, cliquez sur Tous les quotas dans la colonne Détails.

Filtrer les quotas

Pour filtrer la liste des quotas en fonction de propriétés spécifiques, procédez comme suit :

  1. Accédez à la page Quotas de Google Cloud Console :

    Accéder à la section "Quotas"

  2. Cliquez sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.

Demander une augmentation de limite de quota

Vous pouvez demander une augmentation de la plupart des quotas directement dans Google Cloud Console en procédant comme suit : Vous pouvez rencontrer l'une des exceptions suivantes :

  • Dans certains cas, Google Cloud Console vous redirige vers un formulaire distinct pour demander une augmentation de la limite. Une fois le formulaire envoyé, Google Cloud accuse réception de votre demande par e-mail.
  • D'autres quotas ne peuvent pas être mis à jour à l'aide de Google Cloud Console. Si vous constatez que vous ne pouvez pas modifier un quota dans la console, vous devez demander l'augmentation auprès de Cloud Customer Care. L'équipe chargée de la facturation ne gère pas les augmentations de limite de quota.

Pour en savoir plus sur le fonctionnement de l'augmentation de quota, consultez la page À propos des demandes d'augmentation de quota.

Pour demander une augmentation de limite de quota dans Google Cloud Console, procédez comme suit :

  1. Accédez à la page Quotas :

    Accéder à la section "Quotas"

  2. Sélectionnez le quota que vous souhaitez modifier comme suit :

    1. Cliquez sur TOUS LES QUOTAS sur la ligne du quota que vous souhaitez modifier. Dans le panneau QUOTA, cochez la case Global.
    2. Vous pouvez également cliquer sur l'avertissement  s'il s'affiche dans la colonne État du quota. Dans le panneau QUOTA, cochez la case à côté du quota que vous souhaitez modifier.
  3. Sur la page principale Quotas, cliquez sur  MODIFIER LES QUOTAS.

  4. Remplissez le formulaire de demande qui s'affiche à droite comme suit :

    1. Dans le champ Nouvelle limite, saisissez le nouveau quota que vous demandez.
    2. Dans le champ Description de la demande, saisissez le motif de votre demande. Il est utile d'indiquer des informations, telles que les projets de croissance futurs, la répartition régionale ou zonale, et toute autre exigence ou dépendance.
    3. Cliquez sur NEXT (Suivant).
    4. Dans le panneau Coordonnées, saisissez votre numéro de téléphone dans le champ Téléphone.
    5. Cliquez sur OK.
  5. Cliquez sur ENVOYER LA REQUÊTE.

Une fois votre demande envoyée dans Google Cloud Console, Google Cloud vous envoie un e-mail pour confirmer sa réception. Si vous avez besoin d'aide, vous pouvez répondre à cet e-mail. Cloud Customer Care traite votre demande, généralement sous deux à trois jours ouvrés, puis vous envoie un autre e-mail pour vous informer de l'approbation ou du refus de l'augmentation de quota. L'e-mail indique la date d'entrée en vigueur de l'augmentation, le cas échéant.

Limiter l'utilisation des ressources

Si vous souhaitez limiter l'utilisation d'une ressource particulière, vous devez définir vos propres limites de quota. Par exemple, pour éviter de vous faire facturer une utilisation au-delà des limites d'utilisation gratuite, vous pouvez définir un nombre maximal de requêtes par jour. Pour limiter le quota, modifiez les limites sur la page de quota spécifique à l'API.

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

  2. Cliquez sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.

  3. Cliquez sur TOUS LES QUOTAS pour afficher celui dont vous souhaitez limiter l'utilisation.

  4. Cochez la case correspondant à la propriété que vous souhaitez modifier.

  5. Cliquez sur MODIFIER LES QUOTAS .

  6. Remplissez le formulaire de demande.

  7. Saisissez la nouvelle limite de quota et, éventuellement, une description.

  8. Cliquez sur OK.

  9. Cliquez sur ENVOYER LA REQUÊTE.

Si vous souhaitez limiter un quota qui ne s'affiche pas sur cette page ou définir une limite supérieure à la limite maximale fournie, vous devez modifier vos limites comme décrit dans la section Demander un quota supérieur.

Gérer votre quota à l'aide de l'outil de ligne de commande gcloud (alpha)

Vous pouvez utiliser l'outil de ligne de commande gcloud pour obtenir les quotas actuels et limiter l'utilisation des quotas pour certains API et services Google Cloud, y compris les quotas au niveau des projets, des dossiers, et de l'organisation, le cas échéant.

Pour utiliser cette approche, assurez-vous d'abord que vous avez installé et initialisé la dernière version du SDK Cloud, y compris les commandes alpha. Si vous utilisez Cloud Shell pour interagir avec Google Cloud, le SDK Cloud est installé automatiquement.

Pour afficher le quota d'un projet pour un service particulier, exécutez la commande suivante en remplaçant votre ID de projet et votre nom de service :

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=projects/PROJECT_ID

Pour afficher les détails de quota de ce même service pour une organisation, procédez comme suit :

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=organizations/ORG_ID

Pour obtenir la liste complète des commandes et des options gcloud quota, consultez la documentation de référence du SDK Cloud.

En plus de gcloud quota, certains services disposent de leur propre accès en ligne de commande aux informations sur l'utilisation des quotas et des ressources. Par exemple, Compute Engine vous permet d'accéder aux informations sur les quotas à l'aide de la commande gcloud compute.

Gérer votre quota avec l'API Service Usage

Vous pouvez utiliser les API Service Usage pour obtenir les quotas actuels, et limiter l'utilisation des quotas pour certaines API et certains services Google Cloud. Pour plus d'informations sur Service Usage, consultez les ressources suivantes :

Vous ne pouvez pas utiliser l'API Service Usage pour demander un quota plus élevé. Utilisez Cloud Console pour cela.

Surveillance des métriques de quota et alertes associées

L'API et l'interface utilisateur Cloud Monitoring vous permettent de surveiller de plus près l'utilisation des quotas, les limites et les erreurs. Vous pouvez utiliser ces métriques pour créer des tableaux de bord et des alertes personnalisés, afin de surveiller l'utilisation des quotas dans le temps et de recevoir des alertes lorsque vous approchez, par exemple, d'une limite de quota.

Cloud Monitoring accepte une grande variété de métriques que vous pouvez associer à des filtres et des agrégations pour créer de nouvelles vues pertinentes de votre utilisation des quotas. Par exemple, vous pouvez associer une métrique liée à l'utilisation des quotas d'allocation à un filtre quota_metric sur les noms Cloud TPU.

Pour afficher les métriques d'une ressource surveillée à l'aide de l'explorateur de métriques, procédez comme suit :

  1. Dans Google Cloud Console, accédez à la page Monitoring.

    Accéder à Monitoring

  2. Dans le volet de navigation "Surveillance", cliquez sur  Explorateur de métriques.
  3. Sélectionnez l'onglet Configuration, puis saisissez ou sélectionnez un type de ressource et une métrique. Remplissez les champs à l'aide des informations suivantes :
    1. Pour le champ Ressource, sélectionnez ou saisissez Quota du client.
    2. Pour le champ Métrique, sélectionnez ou saisissez Utilisation du quota d'allocation ou Utilisation du quota de débit, en fonction du type de quota que vous souhaitez surveiller.
  4. (Facultatif) Pour configurer le mode d'affichage des données, utilisez les menus Filtre, Grouper par et Agrégateur. Par exemple, vous pouvez grouper les données par libellé de ressource ou de métrique. Pour plus d'informations, consultez la page Sélectionner des métriques.

De même, pour afficher les limites ou les erreurs de dépassement de quota, vous devez d'abord sélectionner le type de ressource Quota du client, puis choisir Limite de quota ou Erreur de dépassement de quota.

Une fois que vous avez trouvé les informations d'utilisation de quotas souhaitées, vous pouvez utiliser Cloud Monitoring pour créer des tableaux de bord et des alertes personnalisés vous permettant de continuer à surveiller votre application et à préserver sa fiabilité. Pour en savoir plus, consultez les documents suivants :

Pour obtenir des exemples de règles d'alerte courantes spécifiques à un quota, consultez la page Utiliser des métriques de quota.

Le guide de référence Cloud Monitoring comprend une documentation de référence détaillée sur les métriques de quota.

Vérifier la compatibilité des métriques de quota

Tous les services ne sont pas compatibles avec les métriques de quota dans Cloud Monitoring. Pour afficher les métriques de quota applicables aux services compatibles, sélectionnez Quota du client comme type de ressource lorsque vous créez un graphique ou une règle d'alerte. Les services non compatibles avec ces métriques ne s'affichent pas.

  • Voici quelques services courants qui acceptent les métriques de quota : Compute Engine, Dataflow, Cloud Spanner, Pub/Sub, Cloud Vision, Speech-to-Text, Cloud Monitoring et Cloud Logging.

  • Les services courants non compatibles avec les métriques de quota incluent App Engine, Cloud Storage et Cloud SQL.

Erreurs de quota

Si votre projet dépasse un quota pendant que vous utilisez un service, Google Cloud renvoie une erreur en fonction de la manière dont vous avez accédé au service :

  • Si vous avez dépassé un quota avec une requête HTTP/REST, Google Cloud renvoie un code d'état HTTP 429 TOO MANY REQUESTS.
  • Si vous dépassez un quota avec une requête API, Google Cloud renvoie un code d'état HTTP 413 REQUEST ENTITY TOO LARGE.
  • Si vous avez dépassé un quota avec gRPC, Google Cloud renvoie une erreur ResourceExhausted. La manière dont cette erreur s'affiche dépend du service.
  • Si vous avez dépassé un quota avec l'outil de ligne de commande gcloud, l'outil gcloud génère un message d'erreur de dépassement de quota, puis affiche le code de sortie 1.

Les quotas de débit sont réinitialisés après un intervalle prédéfini spécifique à chaque service. Pour en savoir plus, consultez la documentation sur les quotas d'un service spécifique.

Si vous souhaitez être averti lorsque des erreurs se produisent à l'avenir, vous pouvez créer des alertes personnalisées pour des erreurs de quota spécifiques, comme décrit dans la section Surveillance des métriques de quota.