Cloud-Kontingente – Übersicht

Google Cloud verwendet Kontingente, um den Umfang einer bestimmten freigegebenen Google Cloud-Ressource einzuschränken. Jedes Kontingent stellt eine bestimmte zählbare Ressource dar. Beispiel: API-Aufrufe an einen bestimmten Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load-Balancer oder die Anzahl der Projekte, die Sie erstellen können.

Auf dieser Seite wird beschrieben, wie Sie in Ihren Projekten mit Kontingenten arbeiten. Auf dieser Seite erfahren Sie, wie Sie vorhandene Kontingentlimits einsehen und ändern, wie Sie höhere Kontingente anfordern und wie Sie die Kontingentnutzung überwachen.

Viele Dienste haben auch Limits, die nicht mit dem Kontingentsystem in Zusammenhang stehen. Limits sind feste Einschränkungen wie die maximale Dateigröße oder die Datenbankschema-Begrenzungen, die nicht erhöht oder verringert werden können. Informationen zu Limits finden Sie auf der entsprechenden Seite für Kontingente und Limits für Ihren Dienst, z. B. unter Kontingente und Limits für Cloud Storage.

Weitere Informationen zur Ressourcennutzung finden Sie unter den folgenden Links:

Jetzt testen

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Jetzt kostenlos starten

Über Kontingente

Bevor Sie lernen, wie Sie Ihr Kontingent überwachen und verwalten, sollten Sie sich mit den Funktionsweisen des Google Cloud-Kontingentsystems vertraut machen. In diesem Abschnitt werden einige wichtige Kontingentkonzepte vorgestellt: Kontingenttypen, Kontingentlimits und Anfragen zur Kontingenterhöhung.

Warum verwenden wir Kontingente?

Kontingente gibt es aus verschiedenen Gründen. Darunter:

  • Der Schutz der Community der Google Cloud-Nutzer vor unvorhergesehenen Auslastungsspitzen und überlasteten Diensten.
  • Für die Ressourcenverwaltung. Sie können zum Beispiel Ihre eigenen Limits für die Nutzung von Diensten festlegen, während Sie Ihre Anwendungen entwickeln und testen, um unerwartete Kosten durch die Nutzung teurer Ressourcen zu vermeiden.

Arten von Kontingenten

Google Cloud hat drei Arten von Kontingenten:

  • Ratenkontingente werden in der Regel verwendet, um die Anzahl der Anfragen zu begrenzen, die an APIs oder Dienste gesendet werden können. Ratenkontingente werden nach einem für den Dienst spezifischen Zeitintervall zurückgesetzt, z. B. die Anzahl der API-Anfragen pro Tag.
  • Zuteilungskontingente werden verwendet, um die Nutzung von Ressourcen zu begrenzen, die keine Nutzungsrate haben. Beispiel: Die Anzahl der VMs, die von Ihrem Projekt zu einer bestimmten Zeit verwendet werden. Zuweisungskontingente werden nicht nach Ablauf einer bestimmten Zeit zurückgesetzt. Stattdessen müssen sie explizit freigegeben werden, wenn Sie sie nicht mehr verwenden möchten, z. B. durch Löschen eines GKE-Clusters.
  • Gleichzeitige Kontingente werden verwendet, um die Gesamtzahl der gleichzeitigen Vorgänge im laufenden Betrieb zu einem bestimmten Zeitpunkt zu begrenzen. Diese Vorgänge sind in der Regel Vorgänge mit langer Ausführungszeit. Compute Engine verwendet beispielsweise Einfügevorgänge, die voraussichtlich bis zu eine Stunde dauern.

Innerhalb dieser Kategorien sind einige Kontingente global und gelten für die Nutzung der Ressource in der gesamten Google Cloud. Andere sind regional oder zonal und gelten für die Nutzung der Ressource in einer bestimmten Google Cloud-Region oder -Zone (nur für Zuweisungskontingente). Beispielsweise gibt es separate Limits für die Anzahl der Compute Engine-VM-Instanzen, die Sie in jeder Google Cloud-Region erstellen können.

Kontingente werden auf Projektbasis erzwungen – mit Ausnahme der Anzahl der Projekte, die Sie erstellen können. Diese werden pro Nutzerkonto und Rechnungskonto erzwungen.

Nächste Schritte