Mit Kontingenten arbeiten

Google Cloud legt Kontingente für die Ressourcennutzung durch Projektinhaber fest. Diese festen Limits bestimmen, in welchem Umfang ein Projekt eine bestimmte Google Cloud-Ressource maximal nutzen darf. Es gibt zwei Arten von Kontingenten, die die Ressourcennutzung beschränken:

  • Ratenkontingente wie API-Anfragen pro Tag. Diese Art von Kontingent wird nach einer bestimmten Zeit zurückgesetzt, z. B. nach einer Minute oder einem Tag.
  • Zuteilungskontingente wie die Anzahl der vom Projekt genutzten virtuellen Maschinen oder der Load-Balancer. Diese Art von Kontingent wird nicht nach Ablauf einer bestimmten Zeit zurückgesetzt, sondern muss explizit freigegeben werden, wenn Sie die Ressource nicht mehr nutzen möchten. Dies geschieht beispielsweise durch Löschen eines GKE-Clusters.

Kontingente gibt es aus verschiedenen Gründen. Unter anderem schützen sie die Nutzer der Google Cloud-Community vor unvorhergesehenen Auslastungsspitzen. Die Kontingente helfen Ihnen auch bei der Ressourcenverwaltung: Sie können z. B. beim Entwickeln und Testen Ihrer Anwendungen innerhalb des von Google bereitgestellten Kontingents eigene Obergrenzen für die Nutzung von Diensten festlegen. Jedes Kontingentlimit wird in Form einer bestimmten zählbaren Ressource ausgedrückt, zum Beispiel Anfragen an eine API pro Tag oder Anzahl an Load-Balancern, die von einer Anwendung genutzt werden.

Nicht alle Projekte verfügen über die gleichen Kontingente für die gleichen Dienste. Wenn Sie beispielsweise ein kostenloses Testkonto nutzen, um die Plattform kennenzulernen, ist das Kontingent möglicherweise stark begrenzt. Höhere Kontingente sind für einige Dienste erst verfügbar, nachdem Sie für Ihr Projekt die Abrechnung aktiviert haben. Wenn Sie Google Cloud mit der Zeit stärker nutzen, können sich Ihre Kontingente entsprechend erhöhen. Bei Bedarf können Sie auch eine Kontingenterhöhung anfordern. Außerdem können Sie Monitoringfunktionen und Benachrichtigungen in Cloud Monitoring einrichten, um über ungewöhnliches Verhalten bei der Verwendung von Kontingenten oder bevorstehende Kontingentüberschreitungen informiert zu werden.

Kontingentüberschreibungen, die vom Dienstinhaber, Projektinhaber oder Kontingentadministrator festgelegt werden, können sich auf Ihre Kontingentlimits auswirken. Weitere Informationen zur Berechnung von Kontingentlimits finden Sie unter Dienstkontingentmodell.

Auf dieser Seite wird die Verwendung von Kontingenten in Ihren Projekten beschrieben, z. B. wie Sie vorhandene Kontingentlimits einsehen und ändern, wie Sie ein höheres Kontingent anfordern und wie Sie die Kontingentnutzung überwachen. Informationen zur Anzeige weiterer API-Nutzungsmesswerte finden Sie unter API-Nutzung überwachen.

Kontingente aufrufen

Es gibt zwei Möglichkeiten, Ihre aktuellen Kontingentlimits in der Google Cloud Console aufzurufen:

  • Auf der Seite Kontingente finden Sie eine Liste mit der Kontingentnutzung und den Kontingentlimits Ihrer gesamten Projekte.

  • In der Console finden Sie Kontingentinformationen zu einer bestimmten API, z. B. zur Ressourcennutzung in einem bestimmten Zeitraum.

Kontingentlimits können auch programmatisch über die Service Usage API aufgerufen werden.

Darüber hinaus bieten einige Dienste über ein Befehlszeilentool Zugriff auf Informationen zu Kontingenten und zur Ressourcennutzung. In Compute Engine können Sie beispielsweise mithilfe von gcloud compute auf Kontingentinformationen zugreifen.

Informationen zur Überwachung der Kontingentnutzung und zum Einrichten von Kontingentbenachrichtigungen finden Sie im Abschnitt Monitoring und Benachrichtigungen zu Kontingentmesswerten.

Alle Projektkontingente aufrufen

Führen Sie die folgenden Schritte aus, um sich die Kontingente (Kontingentnutzung und Kontingentlimits) für alle Ressourcen in Ihrem Projekt anzeigen zu lassen:

  1. Öffnen Sie in der Cloud Console unter "IAM & Verwaltung" die Seite "Kontingente".
  2. Wählen Sie aus der Projektliste ein Projekt aus oder erstellen Sie ein neues. Die Seite Kontingente wird für das ausgewählte Projekt angezeigt. Jeder Kontingenttyp, der in den einzelnen Diensten verfügbar ist, wird in einer eigenen Zeile aufgeführt.
  3. Sie können die Ergebnisse sortieren und filtern, um die benötigten Informationen zu finden:

    • Ordnen Sie die Liste mithilfe der Filter am oberen Seitenrand nach Kontingenttyp, Dienst, Messwert und/oder Ort neu an.
    • Standardmäßig wird die Liste so sortiert, dass zuerst das am stärksten genutzte Kontingent angezeigt wird (in Bezug auf die Nutzung der letzten sieben Tage). So können Sie ermitteln, bei welchen Limits die Gefahr besteht, dass sie überschritten werden. Sie können sich auch das am wenigsten verwendete Kontingent zuerst anzeigen lassen. Wählen Sie hierfür den Pfeil Spitzenzeiten in den letzten 7 Tagen aus.

In der Liste sehen Sie auch die aktuelle Nutzung eines bestimmten Kontingents. Bei Zuteilungskontingenten entspricht die aktuelle Nutzung einfach der Menge an Ressourcen, die Sie aktuell nutzen. Bei Ratenkontingenten pro Tag wird die bisherige Nutzung des aktuellen Tages angezeigt. Bei Ratenkontingenten pro Minute oder 100 Sekunden wird die durchschnittliche Nutzung in den letzten 24 Stunden angezeigt.

Weitere Informationen zu Kontingenten für einen bestimmten Dienst und zu deren Bedeutung finden Sie in der jeweiligen Dokumentation: Die Kontingente zu Compute Engine sind beispielsweise unter Ressourcenkontingente dokumentiert.

API-spezifische Kontingente

Weitere Details zu Kontingenten für eine bestimmte API, einschließlich der laufenden Nutzung, finden Sie in der Cloud Console auf der Seite mit den Kontingenten für die API. Je nach der API können diese Limits Anfragen pro Tag, Anfragen pro Minute und Anfragen pro Minute pro Nutzer umfassen. Für einige APIs gelten sehr niedrige Limits, bis Sie die Abrechnung für Ihr Projekt aktivieren.

Führen Sie folgende Schritte aus, um sich die aktuellen Limits für eine bestimmte API anzeigen zu lassen:

  1. Öffnen Sie in der Cloud Console unter "APIs & Dienste" die Seite "Dashboard".
  2. Wählen Sie aus der Projektliste ein Projekt aus oder erstellen Sie ein neues.
  3. Klicken Sie auf den Namen der jeweiligen API.
  4. Klicken Sie auf Kontingente. Die Kontingentnamen und die zugehörigen Limits für die ausgewählte API werden auf der Seite Kontingente angezeigt. Standardmäßig entsprechen diese Limits den von Google vorgegebenen Limits. Informationen dazu, wie Sie ein niedrigeres Limit festlegen können, finden Sie unter Nutzung einschränken. Wenn für ein bestimmtes Kontingent kein von Google festgelegtes Limit besteht, wird das Limit als unbegrenzt angezeigt.

Nicht alle Kontingente werden auf einer API-spezifischen Kontingentseite angezeigt. Für Anfragen an die Compute Engine API gibt es beispielsweise eine API-spezifische Kontingentseite, auf der jedoch die Nutzung der Compute-Ressourcen von Compute Engine (Zuteilungskontingent) nicht angezeigt wird. Wenn Sie einen Dienst an mehreren Standorten nutzen, werden auf der API-spezifischen Kontingentseite keine regionalen und zonalen Kontingentlimits und deren entsprechende Nutzung angezeigt. Eine vollständige Liste der Kontingente Ihres Projekts finden Sie auf der Projektseite Kontingente. Dort können Sie auch nach Orten filtern.

Kontingente über die Cloud Console verwalten

Abhängig von Ihrer Ressourcennutzung möchten Sie die Kontingentlimits Ihres Projekts unter Umständen erhöhen oder herabsetzen. In diesem Abschnitt wird beschrieben, wie Sie die festgelegten Kontingentlimits ändern können.

Höheres Kontingent anfordern

Für die meisten abrechenbaren Dienste mit einem Kontingentlimit können Sie so vorgehen, um eine Kontingentänderung anzufordern:

  1. Klicken Sie auf der Seite Kontingente die Kästchen eines oder mehrerer zu bearbeitender Kontingente an. Klicken Sie dann auf KONTINGENTE BEARBEITEN. Damit die Kästchen angeklickt werden können, muss die Abrechnung für das Projekt aktiviert sein.
  2. Füllen Sie rechts im Feld Kontingente bearbeiten das Formular mit Ihrem Namen, Ihrer E-Mail-Adresse und Ihrer Telefonnummer aus und klicken Sie dann auf Weiter.
  3. Wählen Sie im Feld Kontingente bearbeiten einen Dienst aus, um die Ansicht zu maximieren, und bearbeiten Sie dann die Kontingente zu diesem Dienst. Setzen Sie die Limits auf den gewünschten Wert. Klicken Sie auf Fertig.
  4. Wiederholen Sie diese Schritte, um die Kontingente in jedem der ausgewählten Dienste zu bearbeiten.
    • Ein Dienst mit einem Warnsymbol () wurde noch nicht bearbeitet oder es wurde kein Feld dafür ausgefüllt.
    • Wenn Sie weitere Kontingente bearbeiten möchten, wählen Sie diese aus der Liste auf der linken Seite aus.
    • Durch Klicken auf das Löschsymbol () können Sie einen Dienst aus dem Bereich "Kontingente bearbeiten" entfernen.
  5. Klicken Sie auf Anfrage senden, wenn Sie mit dem Bearbeiten der Kontingente fertig sind.

Anfragen zu Google Cloud-Kontingenten werden normalerweise innerhalb von zwei Werktagen bearbeitet. Sie erhalten vom Google Cloud-Support per E-Mail eine Bestätigung Ihrer Anfrage. Sollten Sie weitere Hilfe benötigen, können Sie auf diese E-Mail antworten. Beachten Sie, dass die Genehmigung großer Kontingenterhöhungen länger dauern kann.

Nutzung einschränken

Möglicherweise möchten Sie die Nutzung einer bestimmten Ressource einschränken, indem Sie ein eigenes Kontingentlimit festlegen. Wenn Sie beispielsweise verhindern möchten, dass Ihnen Anfragen berechnet werden, die das Limit für die kostenlose Nutzung überschreiten, können Sie eine Obergrenze für die Anfragen pro Tag festlegen. Die einfachste Möglichkeit, das Kontingent zu begrenzen, besteht darin, die Limits auf der API-spezifischen Kontingentseite zu bearbeiten.

  1. Rufen Sie in der Cloud Console die Kontingentseite für die API auf, deren Nutzung Sie beschränken möchten.
  2. Klicken Sie in der Kontingentzeile, die geändert werden soll, auf das Bearbeitungssymbol () und geben Sie Ihr gewünschtes Gesamtkontingent bis zum von Google festgelegten Limit ein.
  3. Klicken Sie auf Speichern, um die Änderungen zu speichern.

Wenn Sie ein Kontingent beschränken möchten, das nicht auf dieser Seite angezeigt wird, oder ein höheres Limit als das vorgegebene Maximum festlegen möchten, müssen Sie Ihre Limits bearbeiten. Gehen Sie dazu wie unter Höheres Kontingent anfordern beschrieben vor.

Kontingente über die Service Usage API verwalten

Mit den Service Usage APIs können Sie für Google Cloud APIs und Dienste, die über Service Usage verwaltet werden, die Kontingentnutzung beschränken und die aktuellen Kontingentlimits abrufen. Weitere Informationen zu Service Usage finden Sie hier:

Sie können die Service Usage API allerdings nicht nutzen, um ein höheres Kontingent anzufordern. Dazu müssen Sie die Cloud Console verwenden.

Monitoring und Benachrichtigungen zu Kontingentmesswerten

Sie können in der Cloud Console nicht nur grundlegende Kontingentinformationen ansehen, sondern auch die Kontingentnutzung, Limits und Fehler in der Cloud Monitoring API und UI im Detail verfolgen. Kontingentmesswerte werden im Metrics Explorer aufgeführt. Mit diesen Messwerten können Sie benutzerdefinierte Dashboards und Benachrichtigungen einrichten, um die Kontingentnutzung in einem bestimmten Zeitraum zu verfolgen und über Ereignisse informiert zu werden, z. B. wenn ein Kontingentlimit erreicht wird.

Cloud Monitoring unterstützt eine Vielfalt an Messwerten, die Sie mit Filtern und Aggregationen kombinieren können. Auf diese Weise erhalten Sie neue und aufschlussreiche Einblicke in Ihre Kontingentnutzung. Sie können z. B. einen Messwert zum Erfassen der Nutzung von Zuteilungskontingenten mit dem Filter quota_metric für Cloud TPU-Namen kombinieren.

So rufen Sie mit Metrics Explorer die Messwerte für eine überwachte Ressource auf:

  1. Wechseln Sie in der Google Cloud Console zu Monitoring oder verwenden Sie die folgende Schaltfläche:
    Zu Monitoring
  2. Klicken Sie im Navigationsbereich von Monitoring auf Metrics Explorer.
  3. Prüfen Sie, ob der Tab Messwert ausgewählt ist.
  4. Klicken Sie in das Feld mit der Bezeichnung Ressourcentyp und Messwert finden und treffen Sie Ihre Auswahl über das Menü oder geben Sie den Namen für die Ressource und den Messwert ein. Verwenden Sie die folgenden Informationen, um dieses Textfeld auszufüllen:
    1. Wählen Sie für Ressource das gewünschte Nutzerkontingent aus oder geben Sie es ein.
    2. Wählen Sie für Messwert die Option Nutzung von Zuteilungskontingenten aus oder geben Sie sie ein, um diese zu überwachen. Wählen Sie die Option für Nutzung von Ratenkontingenten aus oder geben Sie sie ein, um diese zu überwachen.
  5. Mit den Menüs Filter, Gruppieren nach und Aggregator können Sie die Darstellung der Daten ändern. Sie können beispielsweise nach Ressourcen- oder Messwertlabels gruppieren. Weitere Informationen finden Sie unter Messwerte auswählen.

Auf ähnliche Weise können Sie Kontingentlimits oder Fehler aufgrund von Kontingentüberschreitungen einsehen. Zuerst wählen Sie als Ressourcentyp Nutzerkontingent und dann Kontingentlimit oder Kontingent überschritten aus.

Nachdem Sie die gewünschten Informationen zur Kontingentnutzung ermittelt haben, können Sie in Cloud Monitoring benutzerdefinierte Dashboards und Benachrichtigungen erstellen. Dies erleichtert Ihnen, eine robuste Anwendung aufrechtzuerhalten. Auf den folgenden Seiten erhalten Sie Informationen über die Vorgehensweise:

Weitere Informationen, einschließlich Beispiele für gängige kontingentspezifische Benachrichtigungsrichtlinien, finden Sie in der Cloud Monitoring-Dokumentation unter Kontingentmesswerte verwenden.

Details zu Kontingentmesswerten finden Sie in der Cloud Monitoring-Übersicht.

Kontingentfehler

Wenn Ihr Projekt bei der Nutzung eines Dienstes ein bestimmtes Kontingent überschreitet, gibt die Plattform einen Fehler zurück.

Im Allgemeinen gibt Google Cloud den HTTP-Fehlercode 429 zurück, wenn Sie für den Zugriff auf den Dienst HTTP/REST nutzen, oder ResourceExhausted, wenn Sie gRPC verwenden. Wie Ihnen dieser Fehler angezeigt wird, hängt vom jeweiligen Dienst ab.

Wenn Sie Cloud Monitoring einsetzen, können Sie damit das mit dem Fehler verknüpfte Kontingent identifizieren und für Kontingentfehler benutzerdefinierte Benachrichtigungen erstellen, wie unter Monitoring und Benachrichtigungen zu Kontingentmesswerten beschrieben.