Les quotas et leur utilisation

Google Cloud impose des quotas sur l'utilisation des ressources aux propriétaires de projets, en définissant une limite de l'utilisation d'une ressource Google Cloud particulière par votre projet. Les quotas sont classés dans deux catégories :

  • Les quotas de débit, comme le nombre de requêtes API par jour. Ce quota est réinitialisé après un délai propre au service utilisé, tel qu'une minute ou un jour.
  • Les quotas d'allocation, comme le nombre d'instances de machine virtuelle (VM) ou d'équilibreurs de charge utilisés par votre projet à un moment donné. Ce quota ne se réinitialise pas avec le temps, mais il doit être explicitement libéré lorsque vous ne souhaitez plus utiliser la ressource (par exemple, en supprimant un cluster GKE).

Chaque limite de quota représente une ressource dénombrable spécifique, comme le nombre de requêtes API effectuées quotidiennement par rapport au nombre d'équilibreurs de charge utilisés simultanément par votre application.

Les quotas sont appliqués pour différentes raisons :

  • Pour préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus
  • Pour vous aider à gérer vos ressources (par exemple, vous pouvez définir vos propres limites d'utilisation au fil du développement et du test de vos applications)

Chaque projet peut avoir des quotas différents pour les mêmes services. Par exemple, si vous utilisez un compte d'essai gratuit pour explorer la plate-forme, vos quotas sont plus limités. L'activation de la facturation pour votre projet augmente les quotas pour la plupart des services. Vous pouvez aussi demander explicitement plus de quota pour un service spécifique. Les quotas peuvent également augmenter à mesure que votre utilisation de Google Cloud s'accroît.

Les limites de quota de votre projet peuvent être affectées par les remplacements de quota appliqués par le propriétaire du service, le propriétaire du projet ou l'administrateur de quotas. Pour en savoir plus sur le calcul des limites de quota, consultez la section Modèle de quota de service.

Vous pouvez configurer la surveillance et les alertes pour suivre l'utilisation des quotas et être averti en cas d'expiration des quotas ou d'utilisation inhabituelle.

Ce document explique comment utiliser les quotas dans vos projets, y compris comment rechercher et modifier les limites de quota existantes, comment demander un quota supérieur et comment surveiller l'utilisation des quotas. Pour savoir comment afficher d'autres métriques d'utilisation des API, consultez la section Contrôler votre utilisation des API.

Pour trouver la documentation sur les quotas d'un produit ou d'un service, utilisez l'option  Rechercher sur n'importe quelle page de la documentation Google Cloud, puis recherchez le nom de service approprié et quota. Par exemple, une recherche de type "Quota GKE" renvoie tout d'abord un résultat sur la page Quotas et limites de ce service.

Faites l'essai

Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.

Essai gratuit

Autorisations

Autorisations d'afficher les quotas de projets

Pour afficher le quota de votre projet dans Google Cloud Console ou pour accéder au quota du projet de manière automatisée, vous devez disposer des autorisations IAM suivantes :

  • resourcemanager.projects.get
  • resourcemanager.folders.get (si vous souhaitez afficher le quota d'un dossier complet)
  • resourcemanager.organizations.get (si vous souhaitez afficher le quota de l'ensemble d'une organisation)
  • serviceusage.quotas.get

Pour savoir quels rôles incluent ces autorisations par défaut, consultez la documentation de référence sur les autorisations IAM.

Autorisations de modifier les quotas de projets

Pour modifier votre quota au niveau du projet, du dossier ou de l'organisation, vous devez disposer de l'autorisation suivante :

Elle est incluse par défaut pour les rôles suivants : Propriétaire, Éditeur, Administrateur de quotas et Administrateur Service Usage.

Afficher votre quota dans Cloud Console

Vous pouvez afficher vos limites de quota actuelles dans Google Cloud Console en deux endroits :

  • Sur la page Quotas, qui répertorie l'utilisation et les limites de quota de votre projet
  • Dans le tableau de bord des API de Cloud Console, qui répertorie les informations de quota pour une API spécifique, y compris l'utilisation des ressources au fil du temps

Vous pouvez également afficher et gérer votre quota de manière automatisée, à partir de la ligne de commande que vous découvrirez plus loin dans ce document.

Pour découvrir comment surveiller votre utilisation des quotas et définir des alertes, consultez la section Surveillance des métriques de quota et alertes associées.

Afficher tous les quotas de projet

Pour afficher l'utilisation et les limites de quota de toutes les ressources de votre projet :

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

    La liste comprend une ligne pour chaque type de quota disponible dans chaque service.

  2. Triez et filtrez les résultats pour vous concentrer sur les informations dont vous avez besoin :

    • Pour afficher une propriété spécifique, cliquez sur  Filtrer le tableau.
    • Pour trier les listes par ordre alphabétique, placez le pointeur sur Service, Nom de la limite, État du quota ou Détails.
    • Par défaut, la liste est triée de manière à afficher votre quota le plus utilisé en premier (en fonction du pic d'utilisation au cours des sept derniers jours). Vous pouvez ainsi afficher les limites qui risquent d'être dépassées. Pour afficher le quota le moins utilisé en premier, cliquez sur la flèche État du quota.
    • Pour en savoir plus sur votre utilisation actuelle concernant un quota particulier, cliquez sur Tous les quotas dans la colonne Détails.

Les métriques d'utilisation des quotas répertoriées sur la page Quotas sont calculées comme suit :

  • Quotas de débit :
    • Pour le quota de débit quotidien, le nombre indiqué représente l'utilisation totale à l'instant T pour la période de 24 heures en cours.
    • Pour le quota par minute ou pour 100 secondes, le nombre indiqué représente l'utilisation moyenne au cours des dernières 24 heures.
  • Quotas d'allocation : le nombre indiqué représente la quantité de ressources (telle que le nombre d'équilibreurs de charge) actuellement utilisées par votre projet.

Pour en savoir plus sur les quotas d'un service spécifique, consultez la documentation associée à ce service. Par exemple, le quota de Compute Engine est décrit dans la section Quotas de ressources.

Quota spécifique à l'API

Pour afficher des informations détaillées sur le quota d'une API spécifique, y compris son utilisation dans le temps, consultez la page des quotas de l'API dans Cloud Console. Selon l'API, ces limites peuvent inclure des requêtes par jour, des requêtes par minute, et des requêtes par minute et par utilisateur. Certaines API définissent des limites très basses tant que vous n'avez pas activé la facturation sur votre projet.

Vous pouvez afficher les limites actuelles d'une API particulière dans Cloud Console, à deux endroits :

  • Sur la page Quotas de Cloud Console, comme décrit dans la section Afficher tous les quotas de projet

  • Sur le tableau de bord API et services dans Cloud Console. Sélectionnez votre projet, cliquez sur le nom de l'API, puis sur Quotas. La page Quotas indique le nom des quotas pour l'API. Vous pouvez développer chacun de ces quotas pour afficher l'utilisation détaillée dans le temps ainsi que la limite actuelle. Google impose ces limites par défaut. Comme décrit dans la section Limiter l'utilisation des ressources, vous pouvez imposer une limite d'utilisation. Si Google n'impose pas de limite pour un quota donné, la limite est affichée comme illimitée.

    Certains quotas n'apparaissent pas sur la page de quota spécifique à une API. Par exemple, les requêtes vers l'API Compute Engine ont une page de quota spécifique, mais cela n'inclut pas l'utilisation des ressources de calcul Compute Engine (quota d'allocation). En outre, si vous utilisez un service dans plusieurs emplacements, la page de quota spécifique à l'API ne présente pas les limites et l'utilisation régionales ou zonales des quotas. Pour obtenir la liste des quotas utilisés par votre projet (que vous pouvez filtrer par emplacement), consultez la page Quotas du projet.

Gérer votre quota avec Cloud Console

Selon l'utilisation de vos ressources, vous pouvez ajuster les limites de quota de votre projet à la hausse ou à la baisse. Cette section décrit comment modifier les limites de quota fournies. Pour consulter vos limites de quota, cliquez sur Tous les quotas dans la colonne Détails.

Filtrer les quotas

Pour filtrer la liste des quotas en fonction de propriétés spécifiques, procédez comme suit :

  1. Accédez à la page Quotas de Google Cloud Console :

    Accéder à la section "Quotas"

  2. Cliquez sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.

Demander une augmentation de limite de quota

Vous pouvez demander une augmentation de la plupart des limites de quota dans Google Cloud Console en suivant les étapes ci-dessous. Vous pouvez rencontrer l'une des exceptions suivantes :

  • Dans certains cas, Google Cloud Console vous redirige vers un formulaire distinct pour demander une augmentation de la limite. Une fois le formulaire envoyé, Google Cloud accuse réception de votre demande par e-mail.
  • D'autres quotas ne peuvent pas être mis à jour à l'aide de Google Cloud Console. Si vous constatez que vous ne pouvez pas modifier un quota dans la console, vous devez demander l'augmentation auprès de Cloud Customer Care. L'équipe chargée de la facturation ne gère pas les augmentations de limite de quota.

Pour demander une augmentation de limite de quota dans Google Cloud Console, procédez comme suit :

  1. Accédez à la page Quotas :

    Accéder à la section "Quotas"

  2. Sélectionnez le quota que vous souhaitez modifier comme suit :

    1. Cliquez sur TOUS LES QUOTAS sur la ligne du quota que vous souhaitez modifier. Dans le panneau QUOTA, cochez la case Global.
    2. Vous pouvez également cliquer sur l'avertissement  s'il s'affiche dans la colonne État du quota. Dans le panneau QUOTA, cochez la case à côté du quota que vous souhaitez modifier.
  3. Sur la page principale Quotas, cliquez sur  MODIFIER LES QUOTAS.

  4. Remplissez le formulaire de demande qui s'affiche à droite comme suit :

    1. Dans le champ Nouvelle limite, saisissez le nouveau quota que vous demandez.
    2. Dans le champ Description de la demande, saisissez le motif de votre demande. Il est utile d'indiquer des informations, telles que les projets de croissance futurs, la répartition régionale ou zonale, et toute autre exigence ou dépendance.
    3. Cliquez sur NEXT (Suivant).
    4. Dans le panneau Coordonnées, saisissez votre numéro de téléphone dans le champ Téléphone.
    5. Cliquez sur OK.
  5. Cliquez sur ENVOYER LA REQUÊTE.

Une fois votre demande envoyée dans Google Cloud Console, Google Cloud vous envoie un e-mail pour confirmer sa réception. Si vous avez besoin d'aide, vous pouvez répondre à cet e-mail. Cloud Customer Care traite votre demande, généralement sous deux à trois jours ouvrés, puis vous envoie un autre e-mail pour vous informer de l'approbation ou du refus de l'augmentation de quota. L'e-mail indique la date d'entrée en vigueur de l'augmentation, le cas échéant.

Limiter l'utilisation des ressources

Si vous souhaitez limiter l'utilisation d'une ressource particulière, vous devez définir vos propres limites de quota. Par exemple, pour éviter de vous faire facturer une utilisation au-delà des limites d'utilisation gratuite, vous pouvez définir un nombre maximal de requêtes par jour. Pour limiter le quota, modifiez les limites sur la page de quota spécifique à l'API.

  1. Dans Google Cloud Console, accédez à la page Quotas.

    Accéder à la section "Quotas"

  2. Cliquez sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.

  3. Cliquez sur TOUS LES QUOTAS pour afficher celui dont vous souhaitez limiter l'utilisation.

  4. Cochez la case correspondant à la propriété que vous souhaitez modifier.

  5. Cliquez sur MODIFIER LES QUOTAS .

  6. Remplissez le formulaire de demande.

  7. Saisissez la nouvelle limite de quota et, éventuellement, une description.

  8. Cliquez sur OK.

  9. Cliquez sur ENVOYER LA REQUÊTE.

Si vous souhaitez limiter un quota qui ne s'affiche pas sur cette page ou définir une limite supérieure à la limite maximale fournie, vous devez modifier vos limites comme décrit dans la section Demander un quota supérieur.

Gérer votre quota à l'aide de l'outil de ligne de commande gcloud (alpha)

Vous pouvez utiliser l'outil de ligne de commande gcloud pour obtenir les quotas actuels et limiter l'utilisation des quotas pour certains API et services Google Cloud, y compris les quotas au niveau des projets, des dossiers, et de l'organisation, le cas échéant.

Pour utiliser cette approche, assurez-vous d'abord que vous avez installé et initialisé la dernière version du SDK Cloud, y compris les commandes alpha. Si vous utilisez Cloud Shell pour interagir avec Google Cloud, le SDK Cloud est installé automatiquement.

Pour afficher le quota d'un projet pour un service particulier, exécutez la commande suivante en remplaçant votre ID de projet et votre nom de service :

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=projects/PROJECT_ID

Pour afficher les détails de quota de ce même service pour une organisation, procédez comme suit:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=organizations/ORG_ID

Pour obtenir la liste complète des commandes et des options gcloud quota, consultez la documentation de référence du SDK Cloud.

En plus de gcloud quota, certains services disposent de leur propre accès en ligne de commande aux informations sur l'utilisation des quotas et des ressources. Par exemple, Compute Engine vous permet d'accéder aux informations sur les quotas à l'aide de la commande gcloud compute.

Gérer votre quota avec l'API Service Usage

Vous pouvez utiliser les API Service Usage pour obtenir les quotas actuels, et limiter l'utilisation des quotas pour certaines API et certains services Google Cloud. Pour plus d'informations sur Service Usage, consultez les ressources suivantes :

Vous ne pouvez pas utiliser l'API Service Usage pour demander un quota plus élevé. Utilisez Cloud Console pour cela.

Surveillance des métriques de quota et alertes associées

L'API et l'interface utilisateur Cloud Monitoring vous permettent de surveiller de plus près l'utilisation des quotas, les limites et les erreurs. Vous pouvez utiliser ces métriques pour créer des tableaux de bord et des alertes personnalisés, afin de surveiller l'utilisation des quotas dans le temps et de recevoir des alertes lorsque vous approchez, par exemple, d'une limite de quota.

Cloud Monitoring accepte une grande variété de métriques que vous pouvez associer à des filtres et des agrégations pour créer de nouvelles vues pertinentes de votre utilisation des quotas. Par exemple, vous pouvez associer une métrique liée à l'utilisation des quotas d'allocation à un filtre quota_metric sur les noms Cloud TPU.

Pour afficher les métriques d'une ressource surveillée à l'aide de l'explorateur de métriques, procédez comme suit :

  1. Dans Google Cloud Console, accédez à la page Monitoring.

    Accéder à Monitoring

    Si vous n'avez jamais utilisé Cloud Monitoring, la première fois que vous y accédez dans Google Cloud Console, un espace de travail est automatiquement créé et votre projet lui est associé. Sinon, si votre projet n'est pas associé à un espace de travail, une boîte de dialogue s'affiche. Vous pouvez soit créer un espace de travail, soit ajouter le projet à un espace de travail existant. Nous vous recommandons de créer un espace de travail. Après avoir effectué votre sélection, cliquez sur Ajouter.

  2. Dans le volet de navigation "Surveillance", cliquez sur  Explorateur de métriques.
  3. Assurez-vous que l'onglet Métrique est sélectionné.
  4. Dans le champ Rechercher un type de ressource et une métrique, sélectionnez des valeurs dans le menu ou saisissez le nom de la ressource et de la métrique. Remplissez les champs à l'aide des informations suivantes :
    1. Pour le champ Ressource, sélectionnez ou saisissez Quota du client.
    2. Pour le champ Métrique, sélectionnez ou saisissez Utilisation du quota d'allocation ou Utilisation du quota de débit, en fonction du type de quota que vous souhaitez surveiller.
  5. Pour modifier l'affichage des données, utilisez les menus Filtre, Grouper par et Agrégateur. Par exemple, vous pouvez grouper les données par libellé de ressource ou de métrique. Pour plus d'informations, consultez la page Sélectionner des métriques.

De même, pour afficher les limites ou les erreurs de dépassement de quota, vous devez d'abord sélectionner le type de ressource Quota du client, puis choisir Limite de quota ou Erreur de dépassement de quota.

Une fois que vous avez trouvé les informations d'utilisation de quotas souhaitées, vous pouvez utiliser Cloud Monitoring pour créer des tableaux de bord et des alertes personnalisés vous permettant de continuer à surveiller votre application et à préserver sa fiabilité. Pour en savoir plus, consultez les documents suivants :

Pour obtenir des exemples de règles d'alerte courantes spécifiques à un quota, consultez la page Utiliser des métriques de quota.

Le guide de référence Cloud Monitoring comprend une documentation de référence détaillée sur les métriques de quota.

Vérifier la compatibilité des métriques de quota

Tous les services ne sont pas compatibles avec les métriques de quota dans Cloud Monitoring. Pour afficher les métriques de quota applicables aux services compatibles, sélectionnez Quota du client comme type de ressource lorsque vous créez un graphique ou une règle d'alerte. Les services non compatibles avec ces métriques ne s'affichent pas.

  • Voici quelques services courants qui acceptent les métriques de quota : Compute Engine, Dataflow, Cloud Spanner, Pub/Sub, Cloud Vision, Speech-to-Text, Cloud Monitoring et Cloud Logging.

  • Les services courants non compatibles avec les métriques de quota incluent App Engine, Cloud Storage et Cloud SQL.

Erreurs de quota

Si votre projet dépasse un quota pendant que vous utilisez un service, Google Cloud renvoie une erreur en fonction de la manière dont vous avez accédé au service :

  • Si vous avez dépassé un quota avec une requête HTTP/REST, Google Cloud renvoie un code d'état HTTP 429 TOO MANY REQUESTS.
  • Si vous dépassez un quota avec une requête API, Google Cloud renvoie un code d'état HTTP 413 REQUEST ENTITY TOO LARGE.
  • Si vous avez dépassé un quota avec gRPC, Google Cloud renvoie une erreur ResourceExhausted. La manière dont cette erreur s'affiche dépend du service.
  • Si vous avez dépassé un quota avec l'outil de ligne de commande gcloud, l'outil gcloud génère un message d'erreur de dépassement de quota, puis affiche le code de sortie 1.

Les quotas de débit sont réinitialisés après un intervalle prédéfini spécifique à chaque service. Pour en savoir plus, consultez la documentation sur les quotas d'un service spécifique.

Si vous souhaitez être averti lorsque des erreurs se produisent à l'avenir, vous pouvez créer des alertes personnalisées pour des erreurs de quota spécifiques, comme décrit dans la section Surveillance des métriques de quota.