Quotas de débit de Compute Engine

Ce document liste les quotas de débit de Compute Engine, qui définissent le nombre de requêtes que vous pouvez envoyer aux méthodes de l'API Compute Engine.

Les quotas de débit

Les quotas de débit (également appelés limites de débit des API ou quotas d'API) définissent le nombre de requêtes pouvant être envoyées à l'API Compute Engine. Ces quotas s'appliquent par projet. Chaque quota s'applique à un groupe d'une ou plusieurs méthodes de l'API Compute Engine. Lorsque vous utilisez gcloud CLI ou la console Google Cloud, vous envoyez également des requêtes à l'API, qui vont être comptabilisées dans votre quota de débit. Si vous utilisez des comptes de service pour accéder à l'API, ils sont également pris en compte dans votre quota de débit.

Google applique des quotas de débit en respectant un intervalle d'une minute (60 secondes) pour chaque groupe. Cela signifie que si votre projet atteint le nombre maximal de requêtes API au cours d'un délai de 60 secondes, vous devez attendre que le quota de débit soit réinitialisé avant d'effectuer d'autres requêtes dans ce groupe. Si votre projet dépasse un quota de débit, vous recevez une erreur 403 associée au motif suivant : rateLimitExceeded. Pour résoudre cette erreur, attendez une minute, puis relancez votre requête. Le quota devrait être réinitialisé au début de l'intervalle suivant.

Le nombre de requêtes que vous pouvez envoyer à l'API Compute Engine est défini par des groupes de quotas, comme décrit dans les tableaux suivants. Chaque groupe est comptabilisé séparément, ce qui vous permet d'atteindre simultanément le quota maximal dans chaque groupe.

Quotas de débit pour les métriques globales

Les groupes de quotas suivants s'appliquent à toutes les ressources, sauf indication contraire :

Groupe de quotas Description	Nom de la métrique	Quota par défaut
Requêtes Quota pour les méthodes de mutation globales. Les méthodes `get` suivantes utilisent également cette métrique `default` : `networkFirewallPolicies.get` `projects.getXpnHost` `projects.getXpnResources`	`compute.googleapis.com/default`	Quota par projet (`defaultPerMinutePerProject`) : 1 500 requêtes/minute
Requêtes de lecture Quota pour les méthodes `*.get` globales.	`compute.googleapis.com/read_requests`	Quota par projet (`ReadRequestsPerMinutePerProject`) : 1 500 requêtes/minute
Requêtes de liste Quota pour les méthodes `*.list` globales.	`compute.googleapis.com/list_requests`	Quota par projet (`ListRequestsPerMinutePerProject`) : 1 500 requêtes/minute
Requêtes de lecture d'opérations Quota pour la méthode `globalOperations.get`.	`compute.googleapis.com/operation_read_requests`	Débit par projet (`OperationReadRequestsPerMinutePerProject`) : 1 500 requêtes/minute
Frais généraux associés aux coûts catalogue filtrés Quota pour les méthodes `.list` et `.aggregatedList` avec des filtres. Google Cloud facture l'utilisation du quota pour cette métrique, en plus des quotas sur les métriques `compute.googleapis.com/list_requests` et `compute.googleapis.com/heavy_weight_read_requests`. Des frais de quota vous sont facturés si les requêtes de liste renvoient plus de 10 000 ressources filtrées. L'API Compute Engine rejette les requêtes de liste si vous dépassez cette limite de quota.	`compute.googleapis.com/filtered_list_cost_overhead`^bêta	Débit par projet (`ListRequestsFilterCostOverheadPerMinutePerProject`) : 750 000 ressources filtrées/minute Remarque : Vous ne pouvez pas demander de limite plus élevée pour ce quota. Pour éviter les problèmes de quota, optimisez vos filtres de requêtes de liste ou utilisez des filtres de liste côté client.
Requêtes de mutation de ressources globales Quota pour les méthodes `images.delete`, `images.deprecate`, `images.insert`, `images.setLabels`, `snapshots.delete`, `snapshots.insert`, `snapshots.setLabels`, `machineImages.insert` et `machineImages.delete`.	`compute.googleapis.com/global_resource_write_requests`	Débit par projet (`GlobalResourceWriteRequestsPerMinutePerProject`) : 375 requêtes/minute
Requêtes de mutation intensive Quota pour les méthodes `patch`, `delete` et `insert` pour les ressources `interconnects`.	`compute.googleapis.com/heavy_weight_write_requests`	Débit par projet (`HeavyWeightWriteRequestsPerMinutePerProject`) : 750 requêtes/minute
Requêtes de lecture intensive Quota pour les méthodes `*.aggregatedList`.	`compute.googleapis.com/heavy_weight_read_requests`	Débit par projet (`HeavyWeightReadRequestsPerMinutePerProject`) : 750 requêtes/minute

Les groupes de quotas suivants s'appliquent aux API globales avec des quotas par méthode :

Groupe de quotas Description	Nom de la métrique	Limite par défaut
Requêtes d'insertion de licence Quotas pour la méthode `licenses.insert`.	`compute.googleapis.com/license_insert_requests`	Quota par projet (`LicenseInsertRequestsPerMinutePerProject`) : 2,5 requêtes/seconde (150 requêtes/minute) Quota par jour et par projet (`LicenseInsertRequestsPerDayPerProject`) : 30 requêtes/jour
Requêtes de métadonnées d'instance communes définies au niveau du projet Quota pour la méthode `projects.setCommonInstanceMetadata`.	`compute.googleapis.com/project_set_common_instance_metadata_requests`	Quota par projet (`ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject`) : 36 requêtes/minute

Quotas de débit pour les métriques régionales

Les quotas suivants s'appliquent aux méthodes qui utilisent des métriques régionales :

Groupe de quotas Description	Nom de la métrique	Quota par défaut Quota par projet et par région
Requêtes Quota pour les méthodes régionales et zonales qui créent, modifient ou suppriment des ressources Compute Engine. Par exemple, les méthodes `instances.insert`, `disks.update` et `instances.delete`. Les méthodes `get`, `list` et `patch` suivantes utilisent également cette métrique `default_per_region` : `projects.listXpnHosts` `instances.getScreenshot` `instances.getGuestAttributes` `instances.getShieldedInstanceIdentity` `instances.getEffectiveFirewalls` `projects.listXpnHosts` `instanceGroupManagers.listManagedInstances` `instanceGroupManagers.listErrors` `instanceGroupManagers.listPerInstanceConfigs` `regionInstanceGroupManagers.listManagedInstances` `regionInstanceGroupManagers.listErrors` `regionInstanceGroupManagers.listPerInstanceConfigs` `resourcePolicies.patch`	`compute.googleapis.com/default_per_region`	`Queries per minute per region` : 1500
Requêtes de lecture Quota pour les méthodes `get` régionales et zonales telles que `autoscalers.get`, `disks.get`, `instances.get` et `machineTypes.get`.	`compute.googleapis.com/read_requests_per_region`	`Read requests per minute per region` : 1500
Requêtes de liste Quota pour les méthodes `list` régionales et zonales telles que `autoscalers.list`, `disks.list`, `instances.list` et `machineTypes.list`.	`compute.googleapis.com/list_requests_per_region`	`List requests per minute per region` : 1500
Frais généraux associés aux coûts catalogue filtrés Quota pour les méthodes `.list` et `.aggregatedList` avec des filtres. Google Cloud facture l'utilisation du quota pour cette métrique, en plus des quotas sur les métriques `compute.googleapis.com/list_requests_per_region` et `compute.googleapis.com/heavy_weight_read_requests_per_region`. Des frais de quota vous sont facturés si les requêtes de liste renvoient plus de 10 000 ressources filtrées. L'API Compute Engine rejette les requêtes de liste si vous dépassez cette limite de quota.	`compute.googleapis.com/filtered_list_cost_overhead_per_region`^bêta	Débit par projet (`ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion`) : 750 000 ressources filtrées/minute Remarque : Vous ne pouvez pas demander de limite plus élevée pour ce quota. Pour éviter les problèmes de quota, optimisez vos filtres de requêtes de liste ou utilisez des filtres de liste côté client.
Requêtes de lecture d'opérations Quota pour les méthodes `regionOperations.get` et `zoneOperations.get`.	`compute.googleapis.com/operation_read_requests_per_region`	`Operation read requests per minute per region` : 1500
Requêtes de mutation de ressources globales par région Quota pour les méthodes `disks.createSnapshot` et `regionDisks.createSnapshot`.	`compute.googleapis.com/global_resource_write_requests_per_region`	`GlobalResourceWriteRequestsPerMinutePerProjectPerRegion` : 375
Requêtes d'obtention de sortie du port série d'instance Quota pour la méthode `instances.getSerialPortOutput`.	`compute.googleapis.com/get_serial_port_output_requests_per_region`	`GetSerialPortOutputRequestsPerMinutePerProjectPerRegion` : 1500
Requêtes de lecture intensive Quota pour les méthodes `regionOperations.wait`, `zoneOperations.wait` et `regionNetworkFirewallPolicies.getEffectiveFirewalls`.	`compute.googleapis.com/heavy_weight_read_requests_per_region`	`Heavyweight read requests per minute` : 750
Requêtes de mutation intensive par région Quota pour les méthodes `patch` ,`delete` et `insert`, pour la ressource `interconnectAttachments` et pour la méthode `networks.updatePeering`.	`compute.googleapis.com/heavy_weight_write_requests_per_region`	`HeavyWeightWriteRequestsPerMinutePerProjectPerRegion` : 750
Requêtes de simulation d'événements de maintenance d'instance Quota pour la méthode `instances.simulateMaintenanceEvent`.	`compute.googleapis.com/simulate_maintenance_event_requests_per_region`	`SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion` : 150
Requêtes de liste d'URL de provenance d'instance Quota pour la méthode `instances.listReferrers`.	`compute.googleapis.com/instance_list_referrers_requests_per_region`	`InstanceListReferrersRequestsPerMinutePerProjectPerRegion` : 3000
Requêtes d'écriture de point de terminaison du réseau Quota pour les méthodes `networkEndpointGroups.attachNetworkEndpoints` et `networkEndpointGroups.detachNetworkEndpoints`.	`compute.googleapis.com/network_endpoint_write_requests_per_region`	`NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion` : 1500
Requêtes de liste de points de terminaison du réseau Quota pour la méthode `networkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/network_endpoint_list_requests_per_region`	`NetworkEndpointListRequestsPerMinutePerProjectPerRegion` : 1500
Requêtes d'écriture de point de terminaison du réseau régional Quota pour les méthodes `regionNetworkEndpointGroups.attachNetworkEndpoints` et `regionNetworkEndpointGroups.detachNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_write_requests_per_region`	`RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion` : 150
Requêtes de liste de points de terminaison du réseau régional Quota pour la méthode `regionNetworkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_list_requests_per_region`	`RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion` : 1500

Demander une augmentation des quotas de débit

Si vous avez besoin d'un quota plus élevé pour effectuer des requêtes API, vous pouvez demander une augmentation du quota d'API à partir de la console Google Cloud. Pour plus d'instructions, consultez la section Demander une augmentation de quota.

Bonnes pratiques

Suivez les bonnes pratiques de l'API Compute Engine pour maîtriser votre consommation des quotas de débit, afin de limiter les effets s'y rapportant.

Étapes suivantes

Découvrez comment surveiller l'utilisation des API.
Découvrez comment configurer des alertes de quotas.