Compute Engine-Ratenkontingente

In diesem Dokument sind die Ratenkontingente für Compute Engine aufgeführt, die die Anzahl der Anfragen definieren, die Sie an Compute Engine API-Methoden senden können.

Ratenkontingente

Ratenkontingente (auch als API-Ratenbegrenzungem oder API-Kontingente bezeichnet) definieren die Anzahl der Anfragen, die an die Compute Engine API gesendet werden können. Diese Kontingente gelten pro Projekt. Jedes Kontingent gilt für eine Gruppe von einer oder mehreren Compute Engine API-Methoden. Wenn Sie die gcloud CLI oder die Google Cloud Console verwenden, stellen Sie auch Anfragen an die API. Diese Anfragen werden auf Ihr Ratenkontingent angerechnet. Dasselbe gilt für Zugriffe auf die API über Dienstkonten.

Google erzwingt Ratenkontingente pro Minute (60 Sekunden) für jede Gruppe. Wenn Ihr Projekt also innerhalb von 60 Sekunden die maximale Anzahl von API-Anfragen erreicht, müssen Sie warten, bis das Kontingent wieder aufgefüllt ist, bevor Sie weitere Anfragen in dieser Gruppe stellen. Wenn Ihr Projekt eine Ratenbegrenzung überschreitet, erhalten Sie einen 403-Fehler mit dem Grund rateLimitExceeded. Um diesen Fehler zu beheben, warten Sie eine Minute und wiederholen Sie dann die Anfrage. Das Kontingent sollte zu Beginn des nächsten Intervalls neu aufgefüllt werden.

Die Anzahl der Anfragen, die Sie an die Compute Engine API richten können, wird durch API-Kontingente definiert, wie in den folgenden Tabellen beschrieben. Jede Gruppe wird separat gezählt, sodass Sie das höchste Kontingent in jeder Gruppe gleichzeitig erreichen können.

Ratenkontingente für globale Methoden

In den folgenden Abschnitten sind die Kontingente aufgeführt, die die Anzahl der Anfragen definieren, die Sie an die globalen Compute Engine API-Methoden richten können.

Vereinfachte API-Kontingente für globale Methoden

Um die Auffindbarkeit und Verwaltung von Compute Engine API-Kontingenten zu verbessern, hatGoogle Cloud die Anzahl der Kontingentmesswerte reduziert, indem Messwerte in weniger Kontingenten zusammengefasst wurden. Diese vereinfachten Kontingentmesswerte bieten auch höhere Limits für jedes Kontingent.

Eine vollständige Liste der globalen Methoden und der Kontingentmesswerte, mit denen die Kosten der einzelnen Methoden erfasst werden, finden Sie in der Referenz zu Kontingentmesswerten für die Compute Engine API.

In der folgenden Tabelle sind alle vereinfachten API-Kontingentmesswerte für die Compute Engine API aufgeführt:

Kontingent
Kontingentbeschreibung
Messwertname
Leseanfragen pro Minute (GlobalReadsPerMinutePerProject)
Kontingent für globale get- und list-Methoden.
compute.googleapis.com/global_reads
Schreibanfragen pro Minute (GlobalWritesPerMinutePerProject)
Kontingent für globale Schreibmethoden, die nicht in anderen Kontingentmesswerten enthalten sind.
compute.googleapis.com/global_writes
Verfügbare Anfragen pro Minute auflisten (GlobalListUsablePerMinutePerProject)
Kontingent für globale ListUsable-Methoden.
compute.googleapis.com/list_usable_requests
Cache-Entwertungsanfragen pro Minute (GlobalCacheInvalidationRequestsPerMinutePerProject)
Kontingent für globale UrlMapsService.InvalidateCache-Methoden.
compute.googleapis.com/global_cache_invalidation_requests
Gefilterte Liste Kostenaufwand (ListRequestsFilterCostOverheadPerMinutePerProject)

Kontingent für die globalen Methoden *.list und *.aggregatedList mit Filtern.

Google Cloud berechnet die Kontingentnutzung für diesen Messwert zusätzlich zu den Kontingenten für den Messwert compute.googleapis.com/global_reads. Wenn mehr als 10.000 Ressourcen aus den Auflistunganfragen herausgefiltert werden, fallen Kontingentgebühren an. Die Compute Engine API lehnt die Auflistungsanfragen ab, wenn Sie dieses Kontingentlimit überschreiten.

compute.googleapis.com/filtered_list_cost_overhead
Rate pro Projekt: 750.000 Ressourcen, die pro Region und Minute aus den Auflistunganfragen herausgefiltert werden. Da das Kontingent für jeweils 10.000 Ressourcen berechnet wird, wird das Limit in der Google Cloud -Konsole als 75 (750.000/10.000) angezeigt, wenn Sie dieses Kontingentlimit abfragen.
Anfragen pro Minute (GlobalRequestsPerMinutePerProject)

Kontingent für alle globalen Lese- und Schreibanfragen.

compute.googleapis.com/global_requests

Legacy-API-Kontingente für globale Methoden

In der folgenden Tabelle sind alle Compute Engine API-Kontingente für globale Methoden aufgeführt.

Kontingent
Kontingentbeschreibung
Messwertname
Abfragen pro Minute (defaultPerMinutePerProject)
Kontingent für globale Listen- und Änderungsmethoden, die nicht in anderen Kontingentmesswerten enthalten sind.

Die folgenden get-Methoden verwenden ebenfalls diesen default-Messwert:

  • networkFirewallPolicies.get
  • projects.getXpnHost
  • projects.getXpnResources
compute.googleapis.com/default
Leseanfragen (Legacy) (ReadRequestsPerMinutePerProject)
Kontingent für globale *.get-Methoden.
compute.googleapis.com/read_requests
Auflistungsanfragen (ListRequestsPerMinutePerProject)
Kontingent für globale *.list-Methoden.
compute.googleapis.com/list_requests
Leseanfragen für Vorgänge (OperationReadRequestsPerMinutePerProject)
Kontingent für die Methode globalOperations.get.
compute.googleapis.com/operation_read_requests
Globale Anfragen zum Ändern von Ressourcen (GlobalResourceWriteRequestsPerMinutePerProject)
Kontingent für die Methoden images.delete, images.deprecate, images.insert, images.setLabels, snapshots.delete, snapshots.insert, snapshots.setLabels, machineImages.insert und machineImages.delete.
compute.googleapis.com/global_resource_write_requests
Umfangreiche Mutationsanfragen (HeavyWeightWriteRequestsPerMinutePerProject)
Kontingent für die Methoden patch, delete und insert für die interconnects-Ressourcen.
compute.googleapis.com/heavy_weight_write_requests
Umfangreiche Leseanfragen (HeavyWeightReadRequestsPerMinutePerProject)
Kontingent für *.aggregatedList-Methoden.
compute.googleapis.com/heavy_weight_read_requests

Für globale APIs mit methodenspezifischen Kontingenten gelten die folgenden Kontingente:

Kontingent
Kontingentbeschreibung
Messwertname Standardbegrenzung
Lizenzeinfügeanfragen
Kontingente für die Methode licenses.insert.
compute.googleapis.com/license_insert_requests
  • Rate pro Projekt (LicenseInsertRequestsPerMinutePerProject): 2,5 Anfragen/Sekunde (150 Anfragen/Minute)
  • Rate pro Tag und Projekt (LicenseInsertRequestsPerDayPerProject): 30 Anfragen/Tag
Anfragen zum Festlegen häufiger Instanzmetadaten für Projekte
Kontingent für die projects.setCommonInstanceMetadata-Methode.
compute.googleapis.com/project_set_common_instance_metadata_requests Kontingent pro Projekt (ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject): 36 Anfragen/Minute

Ratenkontingente für regionale und zonale Methoden

In den folgenden Abschnitten sind alle Kontingente aufgeführt, die für Methoden mit regionalen Messwerten gelten.

Vereinfachte API-Kontingente für regionale und zonale Methoden

In der folgenden Tabelle sind alle vereinfachten Kontingente für regionale und zonale Methoden der Compute Engine API aufgeführt. Eine vollständige Liste der regionalen und zonalen Methoden sowie der Kontingentmesswerte, mit denen die Nutzung der einzelnen Methoden erfasst wird, finden Sie in der Referenz zu Kontingentmesswerten für die Compute Engine API.

Kontingent
Kontingentbeschreibung
Messwertname
Leseanfragen pro Minute und Region (ReadRequestsPerMinutePerProjectPerRegion)
Kontingent für regionale und zonale „get“- und „list“-Methoden.
compute.googleapis.com/reads_per_region
Schreibanfragen pro Region (WritesPerMinutePerProjectPerRegion)
Kontingent für regionale und zonale Schreibmethoden, die nicht unter andere Kontingentmesswerte fallen.
compute.googleapis.com/writes_per_region
Verfügbare Anfragen pro Region auflisten (ListUsablePerMinutePerProjectPerRegion)
Kontingent für regionale und zonale ListUsable-Methoden.
compute.googleapis.com/list_usable_requests_per_region
Gefilterte Liste Kostenaufwand pro Region

Kontingent für regionale und zonale Methoden *.list und *.aggregatedList mit Filtern.

Google Cloud berechnet die Kontingentnutzung für diesen Messwert zusätzlich zu den Kontingenten für den Messwert compute.googleapis.com/reads_per_region. Wenn mehr als 10.000 Ressourcen aus den Auflistunganfragen herausgefiltert werden, fallen Kontingentgebühren an. Die Compute Engine API lehnt die Auflistungsanfragen ab, wenn Sie dieses Kontingentlimit überschreiten.

compute.googleapis.com/filtered_list_cost_overhead_per_region
Rate pro Projekt (ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion): 750.000 Ressourcen, die pro Region und Minute aus den Listenanfragen herausgefiltert werden. Da das Kontingent für jeweils 10.000 Ressourcen berechnet wird, wird das Limit in der Google Cloud -Konsole als 75 (750.000/10.000) angezeigt, wenn Sie dieses Kontingentlimit abfragen.
Anfragen pro Minute und Region (RequestsPerMinutePerProjectPerRegion)

Kontingent für alle regionalen Lese- und Schreibanfragen.

compute.googleapis.com/requests_per_region

Legacy-API-Kontingente für regionale Methoden

In der folgenden Tabelle sind alle Compute Engine API-Kontingente für regionale und zonale Methoden aufgeführt.

Kontingent
Kontingentbeschreibung
Messwertname
Abfragen (QueriesPerMinutePerRegion)
Kontingent für regionale und zonale Methoden, mit denen Compute Engine-Ressourcen erstellt, geändert oder gelöscht werden. Beispiel: Methoden instances.insert, disks.update und instances.delete.

Die folgenden get-, list- und patch-Methoden verwenden ebenfalls diesen default_per_region-Messwert:

  • projects.listXpnHosts
  • instances.getScreenshot
  • instances.getGuestAttributes
  • instances.getShieldedInstanceIdentity
  • instances.getEffectiveFirewalls
  • projects.listXpnHosts
  • instanceGroupManagers.listManagedInstances
  • instanceGroupManagers.listErrors
  • instanceGroupManagers.listPerInstanceConfigs
  • regionInstanceGroupManagers.listManagedInstances
  • regionInstanceGroupManagers.listErrors
  • regionInstanceGroupManagers.listPerInstanceConfigs
  • resourcePolicies.patch
compute.googleapis.com/default_per_region
Leseanfragen (Legacy) (ReadRequestsPerMinutePerRegion)
Kontingent für regionale und zonale get-Methoden wie autoscalers.get, disks.get, instances.get und machineTypes.get.
compute.googleapis.com/read_requests_per_region
Auflistungsanfragen (ListRequestsPerMinutePerRegion)
Kontingent für regionale und zonale list-Methoden wie autoscalers.list, disks.list, instances.list und machineTypes.list.
compute.googleapis.com/list_requests_per_region
Gefilterte Liste Kostenaufwand

Kontingent für die Methoden *.list und *.aggregatedList mit Filtern.

BeiGoogle Cloud wird die Kontingentnutzung für diesen Messwert zusätzlich zu den Kontingenten für die Messwerte compute.googleapis.com/list_requests_per_region und compute.googleapis.com/heavy_weight_read_requests_per_region berechnet. Wenn mehr als 10.000 Ressourcen aus den Auflistunganfragen herausgefiltert werden, fallen Kontingentgebühren an. Die Compute Engine API lehnt die Auflistungsanfragen ab, wenn Sie dieses Kontingentlimit überschreiten.

compute.googleapis.com/filtered_list_cost_overhead_per_region
Rate pro Projekt (ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion): 750.000 Ressourcen, die pro Region und Minute aus den Listenanfragen herausgefiltert werden. Da das Kontingent für jeweils 10.000 Ressourcen berechnet wird, wird das Limit in der Google Cloud -Konsole als 75 (750.000/10.000) angezeigt, wenn Sie dieses Kontingentlimit abfragen.
Leseanfragen für Vorgänge (OperationReadRequestsPerMinutePerRegion)
Kontingent für die Methoden regionOperations.get und zoneOperations.get.
compute.googleapis.com/operation_read_requests_per_region
Globale Anfragen zum Ändern von Ressourcen pro Region (GlobalResourceWriteRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methoden disks.createSnapshot und regionDisks.createSnapshot.
compute.googleapis.com/global_resource_write_requests_per_region
Anfragen zum Abrufen der Ausgabe serieller Ports für Instanzen (GetSerialPortOutputRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methode instances.getSerialPortOutput.
compute.googleapis.com/get_serial_port_output_requests_per_region
Komplexe Leseanfragen (HeavyWeightReadRequestsPerMinutePerRegion)
Kontingent für die Methoden regionOperations.wait, zoneOperations.wait und regionNetworkFirewallPolicies.getEffectiveFirewalls.
compute.googleapis.com/heavy_weight_read_requests_per_region
Umfangreiche Änderungsanfragen pro Region HeavyWeightWriteRequestsPerMinutePerProjectPerRegion
Kontingent für die Methoden patch, delete und insert für die interconnectAttachments-Ressource und für die Methode networks.updatePeering.
compute.googleapis.com/heavy_weight_write_requests_per_region
Anfragen zum Simulieren von Wartungsereignissen für Instanzen (SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methode instances.simulateMaintenanceEvent.
compute.googleapis.com/simulate_maintenance_event_requests_per_region
Anfragen an die Liste der Verweis-URLs für Instanz InstanceListReferrersRequestsPerMinutePerProjectPerRegion
Kontingent für die Methode instances.listReferrers.
compute.googleapis.com/instance_list_referrers_requests_per_region
Schreibanfragen für Netzwerkendpunkt NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion
Kontingent für die Methoden networkEndpointGroups.attachNetworkEndpoints und networkEndpointGroups.detachNetworkEndpoints.
compute.googleapis.com/network_endpoint_write_requests_per_region
Auflistungsanfragen für Netzwerkendpunkt (NetworkEndpointListRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methode networkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/network_endpoint_list_requests_per_region
Schreibanfragen für regionale Netzwerkendpunkte (RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methoden regionNetworkEndpointGroups.attachNetworkEndpoints und regionNetworkEndpointGroups.detachNetworkEndpoints.
compute.googleapis.com/regional_network_endpoint_write_requests_per_region
Auflistungsanfragen für regionalen Netzwerkendpunkt (RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion)
Kontingent für die Methode regionNetworkEndpointGroups.listNetworkEndpoints.
compute.googleapis.com/regional_network_endpoint_list_requests_per_region

Erhöhung der Ratenkontingente anfordern

Wenn Sie ein höheres Kontingent für API-Anfragen benötigen, können Sie über die Google Cloud Console eine Erhöhung des API-Kontingents anfordern. Eine Anleitung finden Sie unter Kontingentanpassung anfordern.

Best Practices

Halten Sie sich an die Best Practices für das Beibehalten von Ratenkontingenten der Compute Engine API, um die Auswirkungen von Ratenkontingenten zu reduzieren.

Nächste Schritte