Les quotas et leur utilisation

Google Cloud impose des quotas sur l'utilisation des ressources aux propriétaires de projets, en définissant une limite stricte de l'utilisation d'une ressource Google Cloud particulière par votre projet. Nous imposons des quotas sur deux types d'utilisation de ressources :

  • Le quota de débit, comme le nombre de requêtes API par jour. Ce quota est réinitialisé après un délai spécifié, tel qu'une minute ou un jour.
  • Le quota d'allocation, comme le nombre de machines virtuelles ou d'équilibreurs de charge utilisés par votre projet. Ce quota ne se réinitialise pas avec le temps, mais il doit être explicitement libéré lorsque vous ne souhaitez plus utiliser la ressource (par exemple, en supprimant un cluster GKE).

Des quotas sont appliqués pour différentes raisons, par exemple pour préserver la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Les quotas vous aident également à gérer vos ressources. Par exemple, vous pouvez définir vos propres limites d'utilisation du service dans le cadre de votre quota fourni par Google lors des processus de développement et de test de vos applications. Chaque limite de quota est exprimée en fonction d'une ressource dénombrable donnée, des requêtes API par jour au nombre d'équilibreurs de charge utilisés par votre application.

Tous les projets ne bénéficient pas des mêmes quotas pour les mêmes services. Par exemple, si vous utilisez un compte d'essai gratuit pour explorer la plate-forme, votre quota peut être très limité. Certains services ne bénéficient de quotas supérieurs que lorsque vous activez la facturation pour votre projet. À mesure que votre utilisation de Google Cloud s'accroît, les quotas peuvent augmenter en conséquence. Au besoin, vous pouvez également demander des quotas supplémentaires, et configurer la surveillance et les alertes dans Cloud Monitoring de façon à être averti en cas de comportement inhabituel d'utilisation ou d'épuisement des quotas.

Vos limites de quota peuvent être affectées par les remplacements de quota appliqués par le propriétaire du service, le propriétaire du projet ou l'administrateur de quotas. Pour en savoir plus sur le calcul des limites de quota, consultez la page Modèle de quota de service.

Cette page explique comment utiliser les quotas dans vos projets, y compris comment rechercher et modifier les limites de quota existantes, comment demander un quota supérieur et comment surveiller l'utilisation des quotas. Pour savoir comment afficher d'autres métriques d'utilisation des API, consultez la page Contrôler votre utilisation des API.

Autorisations

Pour afficher le quota de votre projet dans Google Cloud Console ou y accéder de manière automatisée, vous avez besoin des autorisations IAM suivantes :

  • resourcemanager.projects.get
  • resourcemanager.folders.get (si vous souhaitez afficher le quota d'un dossier complet)
  • resourcemanager.organizations.get (si vous souhaitez afficher le quota de l'ensemble d'une organisation)
  • serviceusage.quotas.get

Vous pouvez voir quels rôles incluent ces autorisations par défaut dans la documentation de référence sur les autorisations IAM.

Pour modifier votre quota de projet, de dossier ou d'organisation, vous devez également disposer de l'autorisation suivante :

  • serviceusage.quotas.update

Elle est incluse par défaut pour les rôles suivants : Propriétaire, Éditeur, Administrateur de quotas et Administrateur Service Usage.

Consulter votre quota

Vous pouvez afficher les limites de quota actuelles dans Google Cloud Console des deux manières suivantes :

  • Consultez la page Quotas pour obtenir la liste de l'utilisation et des limites de tous les quotas de votre projet.

  • Accédez à la console pour obtenir des informations sur le quota d'une API spécifique, y compris sur l'utilisation des ressources au fil du temps.

Vous pouvez également accéder aux limites de quota de manière automatisée via l'API Service Usage.

En outre, certains services offrent un accès en ligne de commande aux informations sur l'utilisation des quotas et des ressources. Par exemple, Compute Engine vous permet d'accéder aux informations sur les quotas à l'aide de la commande gcloud compute.

Pour découvrir comment surveiller votre utilisation des quotas et définir des alertes, consultez la section consacrée à la surveillance des métriques de quota.

Consulter tous les quotas de projet

Pour afficher les quotas (utilisation et limites des quotas) de toutes les ressources de votre projet, procédez comme suit :

  1. Accédez à la page Quotas de la section "IAM et administration" de Cloud Console.
  2. La page Quotas du projet en cours s'affiche. Elle répertorie une ligne pour chaque type de quota disponible dans chaque service. Si vous souhaitez afficher les quotas d'un autre projet, sélectionnez le projet dans la liste des projets ou créez-en un.
  3. Vous pouvez trier et filtrer les résultats pour trouver les informations dont vous avez besoin :

    • Utilisez les filtres en haut de la page pour ajuster la liste par Service, Nom de la limite, État du quota, ID de service et/ou Métrique.
    • Par défaut, la liste est triée par État du quota (les services associés à chaque état sont classés par ordre alphabétique) de manière à afficher votre quota le plus utilisé en premier. Vous pouvez ainsi repérer les limites qui risquent d'être dépassées. Pour afficher le quota le moins utilisé en premier, sélectionnez la flèche État du quota. Vous pouvez également trier la liste en fonction du Service et du Nom de la limite par ordre alphabétique ou par ordre alphabétique inverse.
  4. Sélectionnez un élément dans la liste pour en afficher les limites et l'utilisation actuelles dans le panneau des quotas :

    • La valeur Limite représente la limite actuelle du quota. Google impose ces limites par défaut. Si vous souhaitez définir une limite inférieure, vous pouvez consulter les instructions pour limiter l'utilisation. Si Google n'impose pas de limite pour un quota donné, la limite est affichée comme illimitée. Les valeurs d'utilisation dans cette colonne vous indiquent si vous approchez de cette limite.
    • La valeur Utilisation actuelle peut avoir différentes significations selon le type de quota. Pour le quota d'allocation, il s'agit tout simplement de l'utilisation actuelle d'une ressource à proprement parler. Pour le quota de débit quotidien, il s'agit de l'utilisation jusqu'à un instant T de la journée en cours. Pour le quota de débit à la minute ou par tranche de 100 secondes, il s'agit de l'utilisation moyenne au cours des dernières 24 heures.
    • La valeur Pic sur sept jours vous indique le pic d'utilisation au cours des sept derniers jours.

    Dans le cas de quotas régionaux ou zonaux, le panneau des quotas affiche ces valeurs pour chaque région ou zone.

Dans le cas de quotas régionaux ou zonaux, cliquez sur Tous les quotas dans l'élément de la liste, afin d'afficher le résumé de votre utilisation par région ou zone. Vous pouvez également cliquer sur le nom d'un service dans la liste pour afficher des informations plus détaillées concernant le quota spécifique à l'API, comme décrit ci-dessous.

Pour en savoir plus sur les quotas d'un service spécifique et leur signification, consultez la documentation du service donné : par exemple, le quota de Compute Engine est décrit sur la page Quotas de ressources.

Quota spécifique à l'API

Pour afficher des informations plus détaillées sur le quota d'une API spécifique, y compris son utilisation dans le temps, consultez la page sur le quota de l'API dans Cloud Console. Selon l'API, ces limites peuvent inclure des requêtes par jour, des requêtes par minute, et des requêtes par minute et par utilisateur. Certaines API définissent des limites très basses tant que vous n'avez pas activé la facturation sur votre projet.

Pour afficher les limites actuelles d'une API spécifique, procédez de l'une des manières suivantes :

ou :

  1. Accédez au tableau de bord API et services dans Cloud Console.
  2. Dans la liste des projets, sélectionnez un projet ou créez-en un.
  3. Cliquez sur le nom de l'API qui vous intéresse.
  4. Cliquez sur Quotas.

Les noms de quota définis pour l'API sélectionnée s'affichent sur la page Quotas. Vous pouvez développer chacun de ces quotas pour afficher l'utilisation détaillée dans le temps ainsi que la limite actuelle. Google impose ces limites par défaut. Si vous souhaitez définir une limite inférieure, vous pouvez consulter les instructions pour limiter l'utilisation. Si Google n'impose pas de limite pour un quota donné, la limite est affichée comme illimitée.

Tous les quotas ne s'affichent pas sur la page de quota spécifique à une API. Par exemple, les requêtes vers l'API Compute Engine ont une page de quota spécifique, mais cela n'inclut pas l'utilisation des ressources de calcul Compute Engine (quota d'allocation). En outre, si vous utilisez le service dans plusieurs emplacements, la page de quota spécifique à l'API ne présente pas les limites et l'utilisation régionales ou zonales des quotas. Pour obtenir la liste complète des quotas de votre projet (qui vous permet également d'appliquer un filtre par emplacement), vous devez consulter la page Quotas du projet.

Gérer votre quota avec Cloud Console

Selon l'utilisation de vos ressources, vous pouvez ajuster les limites de quota de votre projet à la hausse ou à la baisse. Cette section décrit comment modifier les limites de quota fournies.

Demander un quota supérieur

Vous pouvez demander un changement de quota pour la plupart des services facturables avec une limite de quota, comme suit :

  1. Sur la page Quotas, cochez les cases pour sélectionner un ou plusieurs quotas à modifier, puis cliquez sur MODIFIER LES QUOTAS. La facturation doit être activée sur le projet pour que vous puissiez cocher les cases.
  2. Dans le panneau Modifier les quotas sur la droite, remplissez le formulaire en indiquant votre nom, votre adresse e-mail et votre numéro de téléphone, puis cliquez sur Suivant.
  3. Dans le panneau Modifier les quotas, sélectionnez le service pour développer la vue associée, puis modifiez les quotas de ce service en fonction de la limite souhaitée. Cliquez sur OK.
  4. Répétez l'opération pour modifier les quotas dans chacun des services sélectionnés.
    • Un service avec une icône d'alerte () signifie qu'il n'a pas encore été modifié ou qu'un champ n'a pas été renseigné.
    • Vous pouvez ajouter davantage de quotas à modifier en les sélectionnant dans la liste de gauche.
    • Vous pouvez supprimer un service du panneau "Modifier les quotas" en cliquant sur l'icône de suppression ().
  5. Lorsque vous avez terminé de modifier les quotas, cliquez sur Envoyer la requête.

Les demandes de quota Google Cloud sont généralement traitées rapidement, dans un délai de deux jours ouvrés. Vous recevrez un e-mail de confirmation de l'assistance Google Cloud. Si vous avez besoin d'aide supplémentaire, vous pouvez répondre à cet e-mail. Notez que les augmentations de quota importantes peuvent prendre plus de temps pour être approuvées.

Limiter l'utilisation des ressources

Si vous souhaitez limiter l'utilisation d'une ressource particulière, vous devez définir vos propres limites de quota. Par exemple, pour éviter de vous faire facturer une utilisation au-delà des limites d'utilisation gratuite, vous pouvez définir un nombre maximal de requêtes par jour. Le moyen le plus simple de limiter le quota consiste à modifier les limites sur la page de quota spécifique à l'API.

  1. Accédez à la page des quotas spécifique à l'API dont vous souhaitez limiter l'utilisation dans Cloud Console.
  2. Sur la ligne de quota que vous souhaitez modifier, cliquez sur l'icône de modification (), puis saisissez le quota total souhaité, dans la limite spécifiée par Google.
  3. Cliquez sur Enregistrer pour enregistrer les modifications.

Si vous souhaitez limiter un quota qui ne s'affiche pas sur cette page ou définir une limite supérieure à la limite maximale fournie, vous devez modifier vos limites en suivant la procédure décrite dans la section Demander un quota supérieur.

Gérer votre quota avec l'API Service Usage

Vous pouvez utiliser l'API Service Usage pour limiter l'utilisation des quotas, et obtenir les limites de quota actuelles pour les API et services Google Cloud gérés par Service Usage. Pour plus d'informations sur Service Usage, consultez les ressources suivantes :

Vous ne pouvez pas utiliser l'API Service Usage pour demander un quota plus élevé. Utilisez Cloud Console pour cela.

Surveillance des métriques de quota et alertes associées

En plus d'afficher les informations de base sur les quotas dans Cloud Console, Google Cloud vous permet de surveiller de plus près leur utilisation, les limites et les erreurs à l'aide de l'API et de l'interface utilisateur Cloud Monitoring en consultant l'explorateur de métriques. Vous pouvez ensuite utiliser ces métriques pour créer des tableaux de bord et des alertes personnalisés vous permettant de surveiller l'utilisation des quotas dans le temps et de recevoir des alertes lorsque vous approchez d'une limite de quota, par exemple.

Cloud Monitoring accepte une grande variété de métriques que vous pouvez associer à des filtres et des agrégations pour créer de nouvelles vues pertinentes de votre utilisation des quotas. Par exemple, vous pouvez associer une métrique liée au nombre d'utilisations de quotas d'allocation à un filtre quota_metric sur les noms Cloud TPU.

Pour afficher les métriques d'une ressource surveillée à l'aide de l'explorateur de métriques, procédez comme suit :

  1. Dans le volet de navigation de Google Cloud Console, sélectionnez Surveillance :
    Accéder à Google Cloud Console

    S'il s'agit du premier accès à Cloud Monitoring pour ce projet Google Cloud, Cloud Monitoring crée un espace de travail. En règle générale, ce processus est automatique et ne prend que quelques minutes. Si vous êtes invité à sélectionner un espace de travail ou à en créer un, cliquez sur "Créer".

  2. Dans le volet de navigation "Surveillance", cliquez sur  Explorateur de métriques.
  3. Assurez-vous que l'onglet Métrique est sélectionné.
  4. Cliquez dans la zone intitulée Rechercher un type de ressource et une métrique, puis sélectionnez l'élément dans le menu ou saisissez le nom de la ressource et de la métrique. Remplissez les champs de cette zone de texte à l'aide des informations suivantes :
    1. Pour le champ Ressource, sélectionnez ou saisissez Quota du client.
    2. Pour le champ Métrique, sélectionnez ou saisissez Utilisation du quota d'allocation pour surveiller ce quota. Sélectionnez ou saisissez Utilisation du quota de débit pour surveiller ce quota.
  5. Utilisez les menus Filtre, Grouper par et Agrégateur pour modifier le mode d'affichage des données. Par exemple, vous pouvez grouper les données par libellé de ressource ou de métrique. Pour plus d'informations, consultez la page Sélectionner des métriques.

De même, pour afficher les limites ou les erreurs de dépassement de quota, vous devez d'abord sélectionner le type de ressource Quota du client, puis choisir Limite de quota ou Erreur de dépassement de quota.

Une fois que vous avez trouvé les informations d'utilisation de quotas souhaitées, vous pouvez utiliser Cloud Monitoring pour créer des tableaux de bord et des alertes personnalisés vous permettant de continuer à surveiller votre application et à préserver sa fiabilité. Consultez les pages suivantes pour obtenir la marche à suivre :

Consultez la page Utiliser des métriques de quota dans la documentation Cloud Monitoring pour en savoir plus et trouver des exemples courants de règles d'alertes basées sur les quotas.

Vous trouverez une documentation de référence détaillée sur les métriques de quota dans le guide de référence Cloud Monitoring.

Erreurs de quota

Si votre projet dépasse un quota particulier lors de l'utilisation d'un service, la plate-forme affiche une erreur.

En général, Google Cloud renvoie un code d'erreur HTTP 429 si vous utilisez HTTP/REST pour accéder au service ou ResourceExhausted si vous utilisez gRPC. La manière dont cette erreur s'affiche dépend du service.

Si vous utilisez Cloud Monitoring, vous pouvez vous en servir pour identifier le quota associé à l'erreur, puis créer des alertes personnalisées indiquant les erreurs de quota, comme décrit dans la section consacrée à la surveillance des métriques de quota.