Les quotas et leur utilisation

Google Cloud impose des quotas sur l'utilisation des ressources aux propriétaires de projets, en définissant une limite stricte de l'utilisation d'une ressource Google Cloud particulière par votre projet. Les quotas sont classés dans deux catégories :

  • Les quotas de débit, comme le nombre de requêtes API par jour. Ce quota est réinitialisé après un intervalle spécifique au service, tel qu'une minute ou un jour.
  • Les quotas d'allocation, tels que le nombre de machines virtuelles ou d'équilibreurs de charge utilisés par votre projet à un moment donné. Ce quota ne se réinitialise pas avec le temps, mais il doit être explicitement libéré lorsque vous ne souhaitez plus utiliser la ressource (par exemple, en supprimant un cluster GKE).

Chaque limite de quota représente une ressource dénombrable spécifique, telle que le nombre de requêtes API adressées chaque jour ou le nombre d'équilibreurs de charge utilisés simultanément par votre application.

Les quotas sont appliqués pour différentes raisons :

  • Pour préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus
  • Pour vous aider à gérer vos ressources Par exemple, vous pouvez définir vos propres limites d'utilisation lors du développement et du test de vos applications.

Tous les projets ne bénéficient pas des mêmes quotas pour les mêmes services. Par exemple, si vous utilisez un compte d'essai gratuit pour explorer la plate-forme, vos quotas sont plus limités. L'activation de la facturation pour votre projet augmente les quotas de la plupart des services. Vous pouvez aussi demander explicitement un quota supérieur pour un service spécifique. Les quotas peuvent également augmenter à mesure que votre utilisation de Google Cloud s'accroît.

Les limites de quota de votre projet peuvent être affectées par les quotas de remplacement appliqués par le propriétaire du service, le propriétaire du projet ou l'administrateur de quotas. Pour en savoir plus sur le calcul des limites de quota, consultez le modèle de quota de service.

Vous pouvez configurer la surveillance et les alertes pour suivre l'utilisation des quotas et vous avertir en cas d'expiration des quotas ou d'utilisation inhabituelle.

Cette page explique comment utiliser les quotas dans vos projets, y compris comment rechercher et modifier les limites de quota existantes, comment demander un quota supérieur et comment surveiller l'utilisation des quotas. Pour savoir comment afficher d'autres métriques d'utilisation des API, consultez la page Contrôler votre utilisation des API.

Autorisations

Pour afficher le quota de votre projet dans Google Cloud Console ou y accéder de manière automatisée, vous avez besoin des autorisations IAM suivantes :

  • resourcemanager.projects.get
  • resourcemanager.folders.get (si vous souhaitez afficher le quota d'un dossier complet)
  • resourcemanager.organizations.get (si vous souhaitez afficher le quota de l'ensemble d'une organisation)
  • serviceusage.quotas.get

Vous pouvez voir quels rôles incluent ces autorisations par défaut dans la documentation de référence sur les autorisations IAM.

Pour modifier les quotas au niveau du projet, du dossier ou de l'organisation, vous devez également disposer de l'autorisation suivante :

  • serviceusage.quotas.update

Elle est incluse par défaut pour les rôles suivants : Propriétaire, Éditeur, Administrateur de quotas et Administrateur Service Usage.

Afficher votre quota

Vous pouvez afficher vos limites de quota actuelles dans Google Cloud Console en deux endroits :

  • Sur la page Quotas, qui répertorie l'utilisation et les limites de quota de votre projet
  • Dans le tableau de bord des API de Cloud Console, qui répertorie les informations de quota pour une API spécifique, y compris l'utilisation des ressources au fil du temps

Vous pouvez gérer l'utilisation des quotas de manière automatisée avec l'API Service Usage.

En outre, certains services offrent un accès en ligne de commande aux informations sur l'utilisation des quotas et des ressources. Par exemple, Compute Engine vous permet d'accéder aux informations sur les quotas à l'aide de la commande gcloud compute.

Pour découvrir comment surveiller votre utilisation des quotas et définir des alertes, consultez la section consacrée à la surveillance des métriques de quota.

Afficher tous les quotas de projet

Pour afficher l'utilisation et les limites de quota de toutes les ressources de votre projet :

  1. Accédez à la page Quotas de la section "IAM et admin" de Cloud Console, qui répertorie une ligne pour chaque type de quota disponible dans chaque service.

  2. Triez et filtrez les résultats pour vous concentrer sur les informations dont vous avez besoin :

    • Pour afficher une propriété spécifique, cliquez sur  Filtrer le tableau.
    • Pour trier les listes par ordre alphabétique, placez le pointeur sur Service, Nom de la limite, État du quota ou Détails.
    • Par défaut, la liste est triée de manière à afficher votre quota le plus utilisé en premier (en fonction du pic d'utilisation au cours des sept derniers jours). Vous pouvez ainsi afficher les limites qui risquent d'être dépassées. Pour afficher le quota le moins utilisé en premier, cliquez sur la flèche État du quota.
    • Pour en savoir plus sur votre utilisation actuelle d'un quota particulier, cliquez sur Tous les quotas dans la colonne Détails.

Les métriques d'utilisation des quotas répertoriées sur la page Quotas sont calculées comme suit :

  • Quotas de débit :
    • Pour le quota de débit quotidien, le nombre indiqué représente l'utilisation totale à l'instant T pour la période de 24 heures en cours.
    • Pour le quota par minute ou pour 100 secondes, le nombre indiqué représente l'utilisation moyenne au cours des dernières 24 heures.
  • Quotas d'allocation : le nombre indiqué représente la quantité de ressources (telle que le nombre d'équilibreurs de charge) actuellement utilisées par votre projet.

Pour en savoir plus sur les quotas d'un service spécifique et leur signification, consultez la documentation du service donné : par exemple, le quota de Compute Engine est décrit sur la page Quotas de ressources.

Quota spécifique à l'API

Pour afficher des informations plus détaillées sur le quota d'une API spécifique, y compris son utilisation dans le temps, consultez la page sur le quota de l'API dans Cloud Console. Selon l'API, ces limites peuvent inclure des requêtes par jour, des requêtes par minute, et des requêtes par minute et par utilisateur. Certaines API définissent des limites très basses tant que vous n'avez pas activé la facturation sur votre projet.

Vous pouvez afficher les limites actuelles d'une API particulière dans Cloud Console, à deux endroits :

  • Sur la page Quotas de Cloud Console, comme décrit dans la section Afficher tous les quotas de projet

  • Sur la page Tableau de bord de la section "API et services" de Cloud Console Sur cette page, sélectionnez votre projet et cliquez sur le nom de l'API, puis sur Quotas. La page Quotas affiche les noms des quotas pour l'API. Vous pouvez développer chacun de ces quotas pour afficher l'utilisation détaillée dans le temps ainsi que la limite actuelle. Par défaut, les limites affichées sont celles imposées par Google. Vous pouvez limiter l'utilisation, comme décrit dans la section Limiter l'utilisation des ressources. Si Google n'impose pas de limite pour un quota donné, la limite est affichée comme illimitée.

    • Certains quotas n'apparaissent pas sur une page de quota spécifique à une API. Par exemple, les requêtes adressées à l'API Compute Engine ont une page de quota spécifique, mais cela n'inclut pas l'utilisation des ressources de calcul Compute Engine (quota d'allocation). En outre, si vous utilisez un service dans plusieurs emplacements, la page de quota spécifique à l'API ne présente pas les limites et l'utilisation régionales ou zonales des quotas. Pour obtenir la liste complète des quotas utilisés par votre projet (que vous pouvez filtrer par emplacement), consultez la page Quotas du projet.

Gérer votre quota avec Cloud Console

Selon l'utilisation de vos ressources, vous pouvez ajuster les limites de quota de votre projet à la hausse ou à la baisse. Cette section décrit comment modifier les limites de quota fournies. Vous pouvez consulter vos limites de quota en cliquant sur TOUS LES QUOTAS dans la colonne Détails.

Demander un quota supérieur

Vous pouvez demander une modification de quota pour la plupart des services facturables avec une limite de quota sur la page Quotas de Cloud Console.

  1. Dans la colonne État du quota, cliquez sur  avertissement. Le panneau des quotas répertorie tous vos quotas.
  2. Cochez la case correspondant à l'emplacement du quota que vous souhaitez modifier.
  3. Cliquez sur MODIFIER LES QUOTAS .
  4. Remplissez le formulaire de demande.
  5. Saisissez la nouvelle limite de quota et, éventuellement, une description.
  6. Cliquez sur OK.
  7. Cliquez sur ENVOYER LA REQUÊTE.

Vous pouvez également cliquer sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.

Vous recevrez un e-mail en réponse à votre requête.

Les demandes de quota Google Cloud sont généralement traitées rapidement, dans un délai de deux jours ouvrés, et confirmées par e-mail de Google Cloud. Si vous avez besoin d'aide supplémentaire, vous pouvez répondre à cet e-mail. Notez que l'approbation des modifications de quota importantes peut prendre plus de temps.

Limiter l'utilisation des ressources

Si vous souhaitez limiter l'utilisation d'une ressource particulière, vous devez définir vos propres limites de quota. Par exemple, pour éviter de vous faire facturer une utilisation au-delà des limites d'utilisation gratuite, vous pouvez définir un nombre maximal de requêtes par jour. Le moyen le plus simple de limiter le quota consiste à modifier les limites sur la page de quota spécifique à l'API.

Dans Google Cloud Console, accédez à Quotas sur la page IAM et administration.

Accéder à la section "Quotas"

  1. Cliquez sur  Filtrer le tableau pour interroger votre quota selon une propriété spécifique.
  2. Cliquez sur TOUS LES QUOTAS pour afficher celui dont vous souhaitez limiter l'utilisation.
  3. Cochez la case pour sélectionner la propriété à modifier.
  4. Cliquez sur MODIFIER LES QUOTAS .
  5. Remplissez le formulaire de demande.
  6. Saisissez la nouvelle limite de quota et, éventuellement, une description.
  7. Cliquez sur OK.
  8. Cliquez sur ENVOYER LA REQUÊTE.

Si vous souhaitez limiter un quota qui ne s'affiche pas sur cette page ou définir une limite supérieure à la limite maximale fournie, modifiez vos limites comme décrit dans la section Demander un quota supérieur.

Gérer votre quota avec l'API Service Usage

Vous pouvez utiliser les API Service Usage pour obtenir les quotas actuels, et limiter l'utilisation des quotas pour certaines API et certains services Google Cloud. Pour plus d'informations sur Service Usage, consultez les ressources suivantes :

Vous ne pouvez pas utiliser l'API Service Usage pour demander un quota plus élevé. Utilisez Cloud Console pour cela.

Surveillance des métriques de quota et alertes associées

L'API et l'interface utilisateur Cloud Monitoring vous permettent de surveiller plus en détail l'utilisation des quotas, les limites et les erreurs. Vous pouvez utiliser ces métriques pour créer des tableaux de bord et des alertes personnalisés vous permettant de surveiller l'utilisation des quotas dans le temps et de recevoir des alertes lorsque vous approchez d'une limite de quota, par exemple.

Cloud Monitoring accepte une grande variété de métriques que vous pouvez associer à des filtres et des agrégations pour créer de nouvelles vues pertinentes de votre utilisation des quotas. Par exemple, vous pouvez associer une métrique liée à l'utilisation des quotas d'allocation à un filtre quota_metric sur les noms Cloud TPU.

{ % include "monitoring/_shared/metrics-explorer/_template_metrics_explorer.html" %}

De même, pour afficher les limites ou les erreurs de dépassement de quota, vous devez d'abord sélectionner le type de ressource Quota du client, puis choisir Limite de quota ou Erreur de dépassement de quota.

Une fois que vous avez trouvé les informations d'utilisation de quotas souhaitées, vous pouvez utiliser Cloud Monitoring pour créer des tableaux de bord et des alertes personnalisés vous permettant de continuer à surveiller votre application et à préserver sa fiabilité. Pour en savoir plus, consultez les pages suivantes :

Consultez la page Utiliser des métriques de quota dans la documentation Cloud Monitoring pour en savoir plus et trouver des exemples courants de règles d'alertes basées sur les quotas.

Vous trouverez une documentation de référence détaillée sur les métriques de quota dans le guide de référence Cloud Monitoring.

Erreurs de quota

Si votre projet dépasse un quota pendant que vous utilisez un service, Google Cloud renvoie une erreur en fonction de la manière dont vous avez accédé au service :

  • Si vous avez dépassé un quota avec une requête HTTP/REST, Google Cloud renvoie un code d'état HTTP 429 TOO MANY REQUESTS.
  • Si vous dépassez un quota avec une requête API, Google Cloud renvoie un code d'état HTTP 413 REQUEST ENTITY TOO LARGE.
  • Si vous avez dépassé un quota avec gRPC, Google Cloud renvoie une erreur ResourceExhausted. La manière dont cette erreur s'affiche dépend du service.
  • Si vous avez dépassé un quota avec l'outil de ligne de commande gcloud, celui-ci gcloud génère un message d'erreur de dépassement de quota, puis affiche le code de sortie 1.

Les quotas de débit sont réinitialisés après un intervalle prédéfini spécifique à chaque service. Consultez la documentation relative aux quotas pour un ou plusieurs services spécifiques afin d'obtenir des informations plus détaillées.

Vous pouvez identifier l'utilisation du quota associée à une erreur à l'aide de Cloud Monitoring et créer des alertes personnalisées pour des erreurs de quota spécifiques, comme décrit dans la section Surveillance des métriques de quota.