Auf dieser Seite werden die Kontingente und Limits für die Nutzung von Cloud Run erläutert.
Der Umfang der Cloud Run-Ressourcen ist begrenzt. Zu den Kontingenten für Cloud Run gehört auch eine API-Ratenbegrenzung, die bestimmt, mit welcher Rate die Cloud Run Admin API aufgerufen werden kann.
Für Folgendes besteht keine unmittelbare Begrenzung:
- Die Größe der bereitstellbaren Container-Images.
- Die Anzahl der gleichzeitigen Anfragen durch einen Cloud Run-Dienst.
Ressourcenlimits für Cloud Run
Ressource | Beschreibung | Limit | Kann erhöht werden | Geltungsbereich |
---|---|---|---|---|
Dienst | Maximale Anzahl von Diensten | 1.000 | Nein | pro Projekt und Region |
Job | Maximale Anzahl von Jobs | 1000 | Nein | pro Projekt und Region |
Dienst- und Jobausführung | Maximale Anzahl von Diensten und laufenden Job-Ausführungen | 1000 | Nein | pro Projekt und Region |
Überarbeitung | Maximale Anzahl von Überarbeitungen pro Dienst. Wenn das Limit erreicht wird, werden Revisionen, die keinen Traffic bedienen, in der Reihenfolge ihrer Erstellung automatisch gelöscht | 1.000 | Nein | pro Dienst |
Überarbeitung und Jobausführung | Maximale Anzahl an Revisionen, die Traffic bedienen und Jobausführungen ausführen | 4000 | Nein | pro Projekt und Region |
Revision-Tag | Maximale Anzahl von Revision-Tags | 2000 | Nein | pro Projekt und Region |
Jobausführung | Aufbewahrungsdauer für abgeschlossene Jobausführungen. Wenn die Anzahl der abgeschlossenen Ausführungen für einen Job dieses Limit erreicht, werden Ausführungen automatisch in der Reihenfolge des Verlaufs gelöscht | 1.000 | Nein | pro Job |
Jobausführungsaufgabe1 | Maximale Anzahl von parallel ausgeführten Aufgaben | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja | pro Jobausführung |
Jobausführungsaufgabe | Maximales Zeitlimit für Aufgaben | 24 Stunden | Nein | pro Jobausführung |
Jobausführungsaufgabe | Maximale Anzahl von Aufgaben in einem einzelnen Job | 10.000 | Nein | pro Jobausführung |
Jobausführungsaufgabe | Maximale Anzahl von Aufgabenwiederholungen in einem Job | 10 | Nein | pro Jobausführung |
Containerinstanz1 | Maximale Anzahl von Containerinstanzen | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja | pro Überarbeitung |
Containerinstanz1 | Maximale Anzahl von Containerinstanzen aller ausgeführten Jobausführungen | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja | pro Projekt und Region |
Containerinstanz2 | Maximale Anzahl von Containerinstanzen mit ausgehendem Direct VPC-Traffic | 100 bis 200, abhängig von den ausgewählten regionalen Konfigurationen. | Ja | pro Überarbeitung und Region |
Containerinstanz | Zeitüberschreitung beim Start in Minuten | 4 | Nein | pro Containerinstanz |
Speicher | Maximale Arbeitsspeichergröße in GiB | 32 | Nein | pro Containerinstanz |
CPU | Maximale Anzahl von vCPUs | 8 | Nein | pro Containerinstanz |
Laufwerk | Maximal großes, beschreibbares In-Memory-Dateisystem, begrenzt durch den Instanzarbeitsspeicher in GiB | 32 | Nein | pro Containerinstanz |
Umgebungsvariable | Maximale Variablenlänge in KB | 32 | Nein | pro Variable |
Domainzuordnung | Maximale Anzahl von SSL-Zertifikaten | 50 | Nein | pro übergeordneter Domain und Woche |
Domainzuordnung | Maximale Anzahl der Duplikate von SSL-Zertifikaten | 5 | Nein | pro übergeordneter Domain und Woche |
Zugriffstoken | Maximale Anzahl der generierten eindeutigen Zugriffstokens | 50 | Nein | pro Containerinstanz und Sekunde |
Identitätstoken | Maximale Anzahl der generierten eindeutigen Identitätstokens | 50 | Nein | pro Containerinstanz und Sekunde |
1Dieses regionale Kontingent wird in einigen Fällen verwendet:
Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.
Es steuert die maximale Parallelität eines Jobs. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.
Es steuert die Gesamtzahl der Containerinstanzen für die Ausführung von Jobausführungen in einer Region.
2Dieses regionale Kontingent wird in einigen Fällen verwendet:
Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung mit Direct VPC-Ausgang ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.
Es steuert die maximale Parallelität eines Jobs mit ausgehendem Direct VPC-Traffic. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.
Netzwerklimits für Cloud Run
Anfragelimits für Cloud Run
Beschreibung | Limit | Notes |
---|---|---|
Maximale Anzahl gleichzeitiger Anfragen pro Instanz | 1000 | |
Maximale Anzahl gleichzeitiger Streams pro HTTP/2-Clientverbindung | 100 | |
Maximale Zeit vor einer Zeitüberschreitung pro Anfrage | 60 Minuten | |
Maximale Größe von HTTP/1-Anfragen | 32 MiB bei Verwendung des HTTP/1-Servers. Keine Beschränkung bei Verwendung des HTTP/2-Servers. | |
Maximale Größe von HTTP/1-Antworten | 32 MiB, wenn keine Transfer-Encoding: chunked oder Streaming-Mechanismen verwendet werden |
|
Ausgehende Verbindungen pro Sekunde und Instanz | 700 | |
Eingehende Anfragen pro Sekunde an einen HTTP/1-Containerport pro Instanz | 800 | Gilt nicht für HTTP/2-Containerports. |
Bandbreitenlimits für Cloud Run
Für Cloud Run-Instanzen gelten folgende Bandbreitenlimits:
Beschreibung | Limit | Notes |
---|---|---|
Maximale Byte pro Instanz für ausgehenden Traffic über Direct VPC | 1 Gbit/s | Ausgehender Traffic über Direct VPC zu Zielen im VPC-Netzwerk. |
Maximale Byte pro Instanz, ohne ausgehenden Traffic über Direct VPC | 75 Megabyte pro Sekunde (Mbit/s) | Basierend auf der Summe der eingehenden und ausgehenden Byte, ohne ausgehenden Traffic über den Direct VPC-Traffic zu Zielen im VPC-Netzwerk. |
Maximale Gesamtpaketrate pro Instanz, ohne ausgehenden Traffic über Direct VPC | 64.000 Pakete pro Sekunde | Basierend auf der Summe der eingehenden und ausgehenden Pakete, mit Ausnahme des ausgehenden Direct VPC-Traffics zu Zielen im VPC-Netzwerk. |
Wird eines der beiden Limits erreicht, so gilt für die Cloud Run-Instanz eine eingeschränkte Bandbreite.
Ratenbegrenzung für Cloud Run Admin API
Die folgende Ratenbegrenzung gilt für die Cloud Run Admin API. Sie gelten nicht für die Anfragen, die bereitgestellte Cloud Run-Dienste erreichen.
Kontingent | Beschreibung | Limit | Kann erhöht werden | Geltungsbereich |
---|---|---|---|---|
Cloud Run Admin API-Leseanfragen | Die Anzahl der API-Lesevorgänge pro 60 Sekunden und Projekt. Dies ist nicht die Anzahl der Leseanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. | 3.000 pro 60 Sekunden | Ja | pro Projekt und Region |
Cloud Run Admin API-Schreibanfragen | Die Anzahl der API-Schreibvorgänge pro 60 Sekunden und Region. Dies ist nicht die Anzahl der Schreibanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. | 180 pro 60 Sekunden | Ja | pro Projekt und Region |
Jobausführung | Maximale Häufigkeit, mit der ein Job pro 60 Sekunden und Region ausgeführt werden kann. | 180 pro 60 Sekunden | Ja | pro Projekt und Region |
Kontingent erhöhen
So fordern Sie über die Google Cloud Console einen höheren Kontingentwert an:
Rufen Sie die Seite Kontingente auf:
Die verbleibenden Schritte werden automatisch in der Google Cloud Console angezeigt.
Suchen Sie auf der Seite Kontingente in der Spalte Kontingent nach dem Kontingent, das Sie erhöhen möchten.
Über das Suchfeld Filter können Sie nach Ihrem Kontingent suchen.
Klicken Sie das Kästchen links neben Ihrem Kontingent an.
Klicken Sie auf
. Das Formular Kontingentänderungen wird angezeigt. KONTINGENTE BEARBEITEN Geben Sie im Formular Kontingentänderungen in das Feld Neues Limit das gewünschte Kontingent für Ihr Projekt ein.
Füllen Sie die zusätzlichen Felder im Formular aus und klicken Sie dann auf FERTIG.
Klicken Sie auf Anfrage senden.
Obwohl das vorherige Verfahren für die meisten Anfragen zur Kontingenterhöhung gilt, kann eine der folgenden Ausnahmen auftreten:
- Wenn für das Kontingent eine Nutzungsobergrenze vorhanden ist, muss die Nutzungsobergrenze entfernt werden, bevor das Kontingent erhöht werden kann. Sie erhalten eine Offenlegung und eine Vereinbarung. In der Offenlegung wird angegeben, dass die Nutzungsbeschränkung gelöscht und das Limit sofort auf das Standardlimit aktualisiert wird. Ihre Kontingenterhöhungsanfrage wird dann normal von Google Cloud verarbeitet.
- In manchen Fällen werden Sie von der Google Cloud Console zu einem separaten Formular weitergeleitet, um ein höheres Limit anzufordern. Nachdem Sie das Formular gesendet haben, bestätigt Google Cloud Ihre Anfrage per E-Mail.
- Einige Kontingente können nicht über die Google Cloud Console aktualisiert werden. Wenn Sie feststellen, dass Sie ein Kontingent nicht über die Console ändern können, fordern Sie eine Erhöhung über Cloud Customer Care an. Das Abrechnungsteam bearbeitet keine Kontingenterhöhungen.
Google empfiehlt, für jede Ressourcenklasse eine eigene Anfrage zur Kontingenterhöhung zu erstellen. Beispielsweise sollten Sie die Netzwerk-Kontingenterhöhungen pro Projekt von den Compute Engine-Kontingenterhöhungen ohne Netzwerk trennen. Wenn verschiedene Klassen von Anfragen kombiniert werden, kann eine Erhöhungsanfrage den Batch verzögern, wenn ihre Genehmigung mehr Bewertungszeit erfordert.
Wenn Ihre Anfrage zur Kontingenterhöhung Genehmigung erfordert, können Sie erwarten, eine E-Mail von Google Cloud mit einer Empfangsbestätigung zu erhalten. Wenn Sie weitere Hilfe benötigen, können Sie auf diese E-Mail antworten. Cloud Customer Care bearbeitet Ihre Anfrage in der Regel innerhalb von zwei bis drei Arbeitstagen. Cloud Customer Care sendet Ihnen dann eine zweite E-Mail, in der Sie darüber informiert werden, ob die Kontingenterhöhung genehmigt oder abgelehnt wurde. Die E-Mail gibt gegebenenfalls das Datum des Inkrafttretens der Erhöhung an.
Weitere Informationen zur Funktionsweise der Kontingenterhöhung finden Sie unter Anfragen zur Kontingenterhöhung.