Mit Kontingenten arbeiten

Google Cloud legt Kontingente für die Ressourcennutzung durch Projektinhaber fest. Diese festen Limits bestimmen, in welchem Umfang ein Projekt eine bestimmte Google Cloud-Ressource maximal nutzen darf. Kontingente fallen in zwei Kategorien:

  • Ratenkontingente, z. B. die Anzahl der API-Anfragen pro Tag. Diese Art von Kontingent wird nach einem für den Dienst spezifischen Zeitintervall wie einer Minute oder einem Tag zurückgesetzt.
  • Zuteilungskontingente, wie die Anzahl der virtuellen Maschinen oder Load-Balancer, die von Ihrem Projekt zu einem bestimmten Zeitpunkt verwendet werden. Diese Art von Kontingent wird nicht nach Ablauf einer bestimmten Zeit zurückgesetzt, sondern muss explizit freigegeben werden, wenn Sie die Ressource nicht mehr nutzen möchten. Dies geschieht beispielsweise durch Löschen eines GKE-Clusters.

Jedes Kontingentlimit stellt eine bestimmte zählbare Ressource dar, z. B. API-Anfragen pro Tag zur Anzahl der von Ihrer Anwendung gleichzeitig verwendeten Load-Balancer.

Kontingente gibt es aus verschiedenen Gründen:

  • Sie sollen unplanmäßige Nutzungsspitzen verhindern und dadurch die ganze Nutzergemeinschaft von Google Cloud vor Störungen schützen.
  • Für die Ressourcenverwaltung. Sie können z. B. beim Entwickeln und Testen Ihrer Anwendungen eigene Limits für die Nutzung des Dienstes festlegen.

Unterschiedliche Projekte können für unterschiedliche Dienste unterschiedliche Kontingente haben. Wenn Sie beispielsweise ein kostenloses Testkonto zum Ausprobieren der Plattform nutzen, sind Ihre Kontingente begrenzt. Durch Aktivieren der Abrechnung für Ihr Projekt werden die Kontingente für die meisten Dienste erhöht. Sie können auch explizit ein größeres Kontingent für einen bestimmten Dienst anfordern. Kontingente können sich auch im Laufe der Zeit erhöhen, wenn Sie Google Cloud mit der Zeit stärker nutzen.

Kontingentüberschreibungen, die vom Dienstinhaber, Projektinhaber oder Kontingentadministrator festgelegt werden, können sich auf die Kontingentlimits in Ihrem Projekt auswirken. Weitere Informationen zur Berechnung von Kontingentlimits finden Sie unter Dienstkontingentmodell.

Sie können Monitoring und Benachrichtigungen konfigurieren, um die Kontingentnutzung zu beobachten und Sie im Fall eines Kontingentablaufs oder bei ungewöhnlicher Nutzung zu benachrichtigen.

Auf dieser Seite wird die Verwendung von Kontingenten in Ihren Projekten beschrieben, z. B. wie Sie vorhandene Kontingentlimits einsehen und ändern, wie Sie ein höheres Kontingent anfordern und wie die Kontingentnutzung überwacht wird. Informationen zur Anzeige weiterer API-Nutzungsmesswerte finden Sie unter API-Nutzung überwachen.

Berechtigungen

Sie brauchen die folgenden IAM-Berechtigungen, um Ihr Projektkontingent in der Google Cloud Console anzusehen oder programmatisch darauf zuzugreifen:

  • resourcemanager.projects.get
  • resourcemanager.folders.get (wenn Sie das Kontingent für einen gesamten Ordner ansehen möchten)
  • resourcemanager.organizations.get (wenn Sie das Kontingent für eine gesamte Organisation ansehen möchten)
  • serviceusage.quotas.get

In der Referenz für IAM-Berechtigungen sehen Sie, welche Rollen diese Berechtigungen standardmäßig beinhalten.

Wenn Sie Kontingente auf Projekt-, Ordner- oder Organisationsebene ändern möchten, benötigen Sie außerdem die folgende Berechtigung:

  • serviceusage.quotas.update

Diese ist standardmäßig in den Rollen „Inhaber“, „Bearbeiter“, „Kontingentadministrator“ und „Service Usage-Administrator“ enthalten.

Kontingente aufrufen

Ihre aktuellen Kontingentlimits können Sie in zwei verschiedenen Bereichen der Google Cloud Console einsehen:

  • Auf der Seite Kontingente sind alle Kontingentnutzungen und -limits für Ihr Projekt aufgelistet.
  • Das Cloud Console API-Dashboard, das Kontingentinformationen für eine bestimmte API auflistet, einschließlich der Ressourcennutzung in einem bestimmten Zeitraum.

Sie können die Kontingentnutzung mit der Service Usage API programmatisch verwalten.

Darüber hinaus bieten einige Dienste über ein Befehlszeilentool Zugriff auf Informationen zu Kontingenten und zur Ressourcennutzung. In Compute Engine können Sie beispielsweise mithilfe von gcloud compute auf Kontingentinformationen zugreifen.

Informationen zur Überwachung der Kontingentnutzung und zum Einrichten von Kontingentbenachrichtigungen finden Sie im Abschnitt Monitoring und Benachrichtigungen zu Kontingentmesswerten.

Alle Projektkontingente ansehen

So rufen Sie die Kontingentnutzung und -limits für alle Ressourcen in Ihrem Projekt auf:

  1. Rufen Sie die Seite Cloud Console-Kontingente unter IAM & Verwaltung auf. Dort wird eine Zeile für jeden Kontingenttyp angezeigt, der in den einzelnen Diensten verfügbar ist.

  2. Sortieren und filtern Sie die Ergebnisse, um die gewünschten Informationen einfacher zu finden:

    • Wenn Sie ein bestimmtes Attribut aufrufen möchten, klicken Sie auf Filtertabelle.
    • Um die Listen alphabetisch zu sortieren, halten Sie den Mauszeiger über Dienst, Name des Limits, Kontingentstatus oder Details.
    • Standardmäßig wird die Liste so sortiert, dass zuerst das am stärksten genutzte Kontingent angezeigt wird (in Bezug auf die Nutzung der letzten sieben Tage). So können Sie ermitteln, bei welchen Limits die Gefahr besteht, dass sie überschritten werden. Sie können sich das am wenigsten verwendete Kontingent zuerst anzeigen lassen, indem Sie den Pfeil Kontingentstatus umschalten.
    • Weitere Informationen zur aktuellen Nutzung eines bestimmten Kontingents erhalten Sie, wenn Sie in der Spalte Details auf Alle Kontingente klicken.

Die auf der Seite Kontingente aufgeführten Messwerte zur Kontingentnutzung werden so berechnet:

  • Ratenkontingente:
    • Bei Tageskontingenten entspricht der aufgelistete Wert die gesamte Nutzung im aktuellen 24-Stunden-Zeitraum.
    • Für das Kontingent pro Minute oder pro 100 Sekunden steht die angegebene durchschnittliche Nutzung für die letzten 24 Stunden.
  • Zuordnungskontingente: Die angezeigte Anzahl entspricht der Ressourcenmenge (z. B. der Anzahl der Load-Balancer), die derzeit von Ihrem Projekt verwendet wird.

Weitere Informationen zu Kontingenten für einen bestimmten Dienst und zu deren Bedeutung finden Sie in der jeweiligen Dokumentation: Die Kontingente zu Compute Engine sind beispielsweise unter Ressourcenkontingente dokumentiert.

API-spezifische Kontingente

Weitere Details zu Kontingenten für eine bestimmte API, einschließlich der laufenden Nutzung, finden Sie in der Cloud Console auf der Seite mit den Kontingenten für die API. Je nach der API können diese Limits Anfragen pro Tag, Anfragen pro Minute und Anfragen pro Minute pro Nutzer umfassen. Für einige APIs gelten sehr niedrige Limits, bis Sie die Abrechnung für Ihr Projekt aktivieren.

Sie können sich die aktuellen Limits für eine bestimmte API in zwei verschiedenen Bereichen der Cloud Console ansehen:

  • Auf der Seite „Kontingente” der Cloud Console, wie im Abschnitt Alle Projektkontingente ansehen beschrieben.

  • Auf der Dashboard-Seite „APIs & Dienste” der Cloud Console. Wählen Sie auf dieser Seite Ihr Projekt aus, klicken Sie auf den API-Namen und dann auf Kontingente. Auf der Seite Kontingente werden die Kontingentnamen für die API angezeigt. Sie können die Kontingente maximieren, um Informationen zur Nutzung in einem bestimmten Zeitraum sowie zum aktuellen Limit einzublenden. Standardmäßig entsprechen die angezeigten Limits denen von Google. Sie können die Nutzung einschränken, wie im Abschnitt Nutzung einschränken beschrieben. Wenn für ein bestimmtes Kontingent kein von Google festgelegtes Limit besteht, wird das Limit als unbegrenzt angezeigt.

    • Einige Kontingente werden nicht auf einer API-spezifischen Kontingentseite angezeigt. Zum Beispiel haben Anfragen an die Compute Engine API eine API-spezifische Kontingentseite, jedoch ohne die Nutzung von Compute Engine-Ressourcen (Zuweisungskontingent). Wenn Sie einen Dienst an mehreren Standorten verwenden, werden auf der API-spezifischen Kontingentseite keine regionalen und zonalen Kontingentlimits und deren entsprechende Nutzung angezeigt. Eine vollständige Liste der Kontingentnutzung Ihres Projekts, die Sie nach Standort filtern können, finden Sie auf der Seite Kontingente des Projekts.

Kontingente über die Cloud Console verwalten

Abhängig von Ihrer Ressourcennutzung möchten Sie die Kontingentlimits Ihres Projekts unter Umständen erhöhen oder herabsetzen. In diesem Abschnitt wird beschrieben, wie Sie die festgelegten Kontingentlimits ändern können. Sie können Ihre Kontingentlimits ansehen, indem Sie in der Spalte Details auf Alle Kontingente klicken.

Höheres Kontingent anfordern

Sie können eine Kontingentänderung für die meisten abrechenbaren Dienste mit einem Kontingentlimit auf der Seite Cloud Console Quotas anfordern.

  1. Klicken Sie in der Spalte Kontingentstatus auf die Warnung . Im Kontingentbereich sind alle Kontingente aufgelistet.
  2. Klicken Sie das Kästchen für den Standort des Kontingents an, das Sie ändern möchten.
  3. Klicken Sie auf Kontingente bearbeiten.
  4. Füllen Sie das Antragsformular aus.
  5. Geben Sie Ihr geändertes Kontingentlimit und optional eine Beschreibung ein.
  6. Klicken Sie auf FERTIG.
  7. Klicken Sie auf Anfrage senden.

Klicken Sie alternativ auf Filtertabelle von , um Ihr Kontingent anhand eines bestimmten Attributs abzufragen.

Sie erhalten eine E-Mail als Antwort auf Ihre Anfrage.

Google Cloud-Kontingentanfragen werden normalerweise innerhalb von zwei Werktagen verarbeitet und mit einer E-Mail von Google Cloud bestätigt. Wenn Sie weitere Hilfe benötigen, können Sie auf diese E-Mail antworten. Beachten Sie, dass eine umfangreiche Kontingentänderung länger dauert als die Genehmigung.

Nutzung einschränken

Möglicherweise möchten Sie die Nutzung einer bestimmten Ressource einschränken, indem Sie ein eigenes Kontingentlimit festlegen. Wenn Sie beispielsweise verhindern möchten, dass Ihnen Anfragen berechnet werden, die das Limit für die kostenlose Nutzung überschreiten, können Sie eine Obergrenze für die Anfragen pro Tag anfordern. Begrenzen Sie das Kontingent einfach, indem Sie die Limits auf der API-spezifischen Kontingentseite bearbeiten.

Rufen Sie in der Google Cloud Console auf der Seite IAM & Verwaltung die Option Kontingente auf.

Kontingente aufrufen

  1. Klicken Sie auf Filtertabelle von , um Ihr Kontingent anhand eines bestimmten Attributs abzufragen.
  2. Klicken Sie für die Nutzung, die Sie beschränken möchten, auf Alle Kontingente.
  3. Klicken Sie auf das Kästchen, um das Attribut auszuwählen, das Sie bearbeiten möchten.
  4. Klicken Sie auf Kontingente bearbeiten.
  5. Füllen Sie das Antragsformular aus.
  6. Geben Sie Ihr geändertes Kontingentlimit und optional eine Beschreibung ein.
  7. Klicken Sie auf FERTIG.
  8. Klicken Sie auf Anfrage senden.

Wenn Sie ein Kontingent begrenzen möchten, das nicht auf dieser Seite angezeigt wird, oder ein Limit über dem angegebenen Maximum festlegen, bearbeiten Sie die Limits wie unter Höheres Kontingent anfordern beschrieben.

Kontingente über die Service Usage API verwalten

Mit den Service Usage APIs können Sie aktuelle Kontingente abrufen und die Kontingentnutzung für einige Google Cloud APIs und -Dienste beschränken. Weitere Informationen zu Service Usage finden Sie hier:

Sie können die Service Usage API allerdings nicht nutzen, um ein höheres Kontingent anzufordern. Dazu müssen Sie die Cloud Console verwenden.

Monitoring und Benachrichtigungen zu Kontingentmesswerten

Mit der Cloud Monitoring API und der Benutzeroberfläche können Sie die Kontingentnutzung, -limits und -fehler im Detail überwachen. Mit diesen Messwerten können Sie benutzerdefinierte Dashboards und Benachrichtigungen einrichten, um die Kontingentnutzung in einem bestimmten Zeitraum zu beobachten und über Ereignisse informiert zu werden, z. B. wenn ein Kontingentlimit erreicht wird.

Cloud Monitoring unterstützt eine Vielfalt an Messwerten, die Sie mit Filtern und Aggregationen kombinieren können. Auf diese Weise erhalten Sie neue und aufschlussreiche Einblicke in Ihre Kontingentnutzung. Beispielsweise können Sie einen Messwert für die Nutzung von Zuteilungskontingenten mit einem quota_metric-Filter für Cloud TPU-Namen kombinieren.

{ % include "monitoring/_shared/metrics-explorer/_template_metrics_explorer.html" %}

Auf ähnliche Weise können Sie Kontingentlimits oder Fehler aufgrund von Kontingentüberschreitungen einsehen. Zuerst wählen Sie als Ressourcentyp Nutzerkontingent und dann Kontingentlimit oder Kontingent überschritten aus.

Nachdem Sie die gewünschten Informationen zur Kontingentnutzung ermittelt haben, können Sie mit Cloud Monitoring benutzerdefinierte Dashboards und Benachrichtigungen erstellen. Dies erleichtert Ihnen die Beobachtung und Wartung einer robusten Anwendung. Weitere Informationen dazu finden Sie auf den folgenden Seiten:

Weitere Informationen, einschließlich Beispiele für gängige kontingentspezifische Benachrichtigungsrichtlinien, finden Sie in der Cloud Monitoring-Dokumentation unter Kontingentmesswerte verwenden.

Details zu Kontingentmesswerten finden Sie in der Cloud Monitoring-Übersicht.

Kontingentfehler

Wenn Ihr Projekt bei der Nutzung eines Dienstes ein Kontingent überschreitet, gibt Google Cloud einen Fehler basierend darauf zurück, wie Sie auf den Dienst zugegriffen haben:

  • Wenn Sie mit einer HTTP/REST-Anfrage ein Kontingent überschritten haben, gibt Google Cloud den HTTP-Statuscode 429 TOO MANY REQUESTS zurück.
  • Wenn Sie mit einer API-Anfrage ein Kontingent überschreiten, gibt Google Cloud den HTTP-Statuscode 413 REQUEST ENTITY TOO LARGE zurück.
  • Wenn Sie mit gRPC ein Kontingent überschritten haben, gibt Google Cloud einen ResourceExhausted-Fehler zurück. Wie dieser Fehler angezeigt wird, hängt vom Dienst ab.
  • Wenn Sie mit einem gcloud-Befehlszeilentool ein Kontingent überschritten haben, gibt das gcloud-Befehlszeilentool eine Fehlermeldung über das Kontingent aus und liefert den Exit-Code 1.

Ratenkontingente werden nach einem vordefinierten Zeitintervall zurückgesetzt, das für jeden Dienst spezifisch ist. Ausführliche Informationen finden Sie in der Dokumentation zu Kontingenten für bestimmte Dienste.

Sie können die mit einer Fehlerbenachrichtigung verknüpfte Kontingentnutzung in Cloud Monitoring ermitteln und benutzerdefinierte Benachrichtigungen für bestimmte Kontingentfehler erstellen, wie in Kontingentmesswerte überwachen beschrieben.