Auf dieser Seite werden die Kontingente und Limits für die Nutzung von Cloud Run erläutert.
Der Umfang der Cloud Run-Ressourcen ist begrenzt. Zu den Kontingenten für Cloud Run gehört auch eine API-Ratenbegrenzung, die bestimmt, mit welcher Rate die Cloud Run Admin API aufgerufen werden kann.
Für Folgendes besteht keine unmittelbare Begrenzung:
- Die Größe der bereitstellbaren Container-Images.
- Die Anzahl der gleichzeitigen Anfragen durch einen Cloud Run-Dienst.
Ressourcenlimits für Cloud Run
Wenn Sie über die Limits hinausgehen möchten, die erhöht werden können, fordern Sie eine Kontingenterhöhung an. Wenn Sie die pro Projekt geltenden Limits überschreiten möchten, die nicht erhöht werden können, erstellen Sie neue Ressourcen in einem anderen Google Cloud-Projekt oder einer anderen Region.
Ressource | Umfang | Beschreibung | Limit | Kann erhöht werden |
---|---|---|---|---|
Dienst | pro Projekt und Region | Maximale Anzahl von Diensten | 1.000 | Nein |
Job | pro Projekt und Region | Maximale Anzahl von Jobs | 1000 | Nein |
Jobausführung | pro Projekt und Region | Maximale Anzahl aktiver Jobausführungen | 1000 | Nein |
Überarbeitung | pro Dienst | Maximale Anzahl von Überarbeitungen pro Dienst. Wenn das Limit erreicht wird, werden Revisionen, die keinen Traffic bedienen, in der Reihenfolge ihrer Erstellung automatisch gelöscht | 1.000 | Nein |
Überarbeitung | pro Projekt und Region | Maximale Anzahl an Revisionen, die Traffic bedienen | 4000 | Nein |
Revision-Tag | pro Projekt und Region | Maximale Anzahl von Revision-Tags. Wenn das Limit für Revision-Tags überschritten wird, führt Cloud Run eine Tag-Bereinigung für den Dienst durch. Für den Dienst, für den ein neues Tag erstellt wird, werden Tags ohne festgelegten Traffic-Prozentsatz automatisch in chronologischer Reihenfolge gelöscht. | 2000 | Nein |
Jobausführung | pro Job | Aufbewahrungsdauer für abgeschlossene Jobausführungen. Wenn die Anzahl der abgeschlossenen Ausführungen für einen Job dieses Limit erreicht, werden Ausführungen automatisch in der Reihenfolge des Verlaufs gelöscht | 1.000 | Nein |
Jobausführungsaufgabe1 | pro Jobausführung | Maximale Anzahl von parallel ausgeführten Aufgaben | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja |
Jobausführungsaufgabe | pro Jobausführung | Maximales Zeitlimit für Aufgaben | 24 Stunden | Nein |
Jobausführungsaufgabe | pro Jobausführung | Maximale Anzahl von Aufgaben in einem einzelnen Job | 10.000 | Nein |
Jobausführungsaufgabe | pro Jobausführung | Maximale Anzahl von Aufgabenwiederholungen in einem Job | 10 | Nein |
Umgebungsvariablen | pro Job oder pro Dienst | Maximale Anzahl von Umgebungsvariablen pro Container | 1000 | Nein |
Befehlsargumente | pro Job oder pro Dienst | Maximale Anzahl von Befehlsargumenten pro Container | 1000 | Nein |
Containerinstanz1 | pro Überarbeitung | Maximale Anzahl von Containerinstanzen | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja |
Containerinstanz1 | pro Projekt und Region | Maximale Anzahl von Containerinstanzen aller ausgeführten Jobausführungen | Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja |
Containerinstanz2 | pro Überarbeitung und Region | Maximale Anzahl von Containerinstanzen mit ausgehendem Direct VPC-Traffic | 100 bis 200, abhängig von den ausgewählten regionalen Konfigurationen. | Ja |
Containerinstanz | pro Containerinstanz | Zeitüberschreitung beim Start in Minuten | 4 | Nein |
Speicher | pro Containerinstanz | Maximale Arbeitsspeichergröße in GiB | 32 | Nein |
CPU | pro Containerinstanz | Maximale Anzahl von vCPUs | 8 | Nein |
CPU | pro Projekt und Region | Maximale CPU-Kapazität in Milli-vCPUs, die allen Instanzen über einen Zeitraum von einer Minute zugewiesen wurde. | Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja |
Speicher | pro Projekt und Region | Maximaler Gesamtspeicher in Byte, der allen Instanzen innerhalb eines Zeitraums von einer Minute zugewiesen wurde. | Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. | Ja |
GPU-Instanz3 | pro Projekt und Region | Maximale Anzahl von Containerinstanzen mit GPU | 03 | Ja |
Laufwerk | pro Containerinstanz | Maximal großes, beschreibbares In-Memory-Dateisystem, begrenzt durch den Instanzarbeitsspeicher in GiB | 32 | Nein |
Umgebungsvariable | pro Variable | Maximale Variablenlänge in KB | 32 | Nein |
Domainzuordnung | pro übergeordneter Domain und Woche | Maximale Anzahl von SSL-Zertifikaten | 50 | Nein |
Domainzuordnung | pro übergeordneter Domain und Woche | Maximale Anzahl der Duplikate von SSL-Zertifikaten | 5 | Nein |
Zugriffstoken | pro Containerinstanz und Sekunde | Maximale Anzahl der generierten eindeutigen Zugriffstokens | 50 | Nein |
Identitätstoken | pro Containerinstanz und Sekunde | Maximale Anzahl der generierten eindeutigen Identitätstokens | 50 | Nein |
Geöffnete Dateien | pro Containerinstanz | Maximale Anzahl von Dateien, die gleichzeitig geöffnet werden können. Entspricht /proc/sys/fs/file-max . |
25.000 | Nein |
1Dieses regionale Kontingent wird in einigen Fällen verwendet:
Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.
Es steuert die maximale Parallelität eines Jobs. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.
Es steuert die Gesamtzahl der Containerinstanzen für die Ausführung von Jobausführungen in einer Region.
2Dieses regionale Kontingent wird in einigen Fällen verwendet:
Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung mit Direct VPC-Ausgang ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.
Es steuert die maximale Parallelität eines Jobs mit ausgehendem Direct VPC-Traffic. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.
3
Um auf die GPU zugreifen zu können, müssen Sie eine Kontingentaufstockung für Total Nvidia L4 GPU allocation, per project per region
beantragen.
Netzwerklimits für Cloud Run
Anfragelimits für Cloud Run
Beschreibung | Limit | Hinweise |
---|---|---|
Maximale Anzahl gleichzeitiger Anfragen pro Instanz | 1000 | |
Maximale Anzahl gleichzeitiger Streams pro HTTP/2-Clientverbindung | 100 | |
Maximale Zeit vor einer Zeitüberschreitung pro Anfrage | 60 Minuten | |
Maximale Größe von HTTP/1-Anfragen | 32 MiB bei Verwendung des HTTP/1-Servers. Keine Beschränkung bei Verwendung des HTTP/2-Servers. | |
Maximale Größe von HTTP/1-Antworten | 32 MiB, wenn keine Transfer-Encoding: chunked oder Streaming-Mechanismen verwendet werden |
|
Ausgehende Verbindungen pro Sekunde und Instanz | 700 | |
Ausgehende DNS-Auflösungen pro Sekunde und Instanz | 1000 | |
Eingehende Anfragen pro Sekunde an einen HTTP/1-Containerport pro Instanz | 800 | Gilt nicht für HTTP/2-Containerports. |
Bandbreitenlimits für Cloud Run
Für Cloud Run-Instanzen gelten folgende Bandbreitenlimits:
Beschreibung | Limit | Hinweise |
---|---|---|
Maximale Bit pro Instanz für ausgehenden Traffic über Direct VPC | 1 Gbit/s | Ausgehender Traffic über Direct VPC zu Zielen im VPC-Netzwerk. |
Maximale Bit pro Instanz, ohne ausgehenden Traffic über Direct VPC | 600 Mbit/s | Basierend auf der Summe der eingehenden und ausgehenden Bit, ohne ausgehenden Traffic über den Direct VPC-Traffic zu Zielen im VPC-Netzwerk. |
Maximale Gesamtpaketrate pro Instanz, ohne ausgehenden Traffic über Direct VPC | 64.000 Pakete pro Sekunde | Basierend auf der Summe der eingehenden und ausgehenden Pakete, mit Ausnahme des ausgehenden Direct VPC-Traffics zu Zielen im VPC-Netzwerk. |
Wird eines der beiden Limits erreicht, so gilt für die Cloud Run-Instanz eine eingeschränkte Bandbreite.
Ratenbegrenzung für Cloud Run Admin API
Die folgende Ratenbegrenzung gilt für die Cloud Run Admin API. Sie gelten nicht für die Anfragen, die bereitgestellte Cloud Run-Dienste erreichen.
Kontingent | Beschreibung | Limit | Kann erhöht werden | Umfang |
---|---|---|---|---|
Cloud Run Admin API-Leseanfragen | Die Anzahl der API-Lesevorgänge pro 60 Sekunden und Projekt. Dies ist nicht die Anzahl der Leseanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. | 3.000 pro 60 Sekunden | Ja | pro Projekt und Region |
Cloud Run Admin API-Schreibanfragen | Die Anzahl der API-Schreibvorgänge pro 60 Sekunden und Region. Dies ist nicht die Anzahl der Schreibanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. | 180 pro 60 Sekunden | Ja | pro Projekt und Region |
Jobausführung | Maximale Häufigkeit, mit der ein Job pro 60 Sekunden und Region ausgeführt werden kann. | 180 pro 60 Sekunden | Ja | pro Projekt und Region |
Kontingent erhöhen
So fordern Sie einen höheren Kontingentwert an:Rufen Sie die Seite Kontingente und Seite zu den Systemlimits auf:
Suchen Sie in der Spalte Kontingent nach dem Kontingent, das Sie erhöhen möchten. Über das Suchfeld Filter können Sie nach Ihrem Kontingent suchen.
Klicken Sie das Kästchen neben dem Kontingent an, das Sie erhöhen möchten.
Klicken Sie auf
. Das Dialogfeld Kontingentänderungen wird angezeigt. Bearbeiten Optional: Wenn Sie das Kontingent über den auf dem Bildschirm angezeigten Wert hinaus erhöhen möchten, wählen Sie Höheres Kontingent beantragen aus. Füllen Sie das Formular aus, reichen Sie es ein und überspringen Sie die verbleibenden Schritte.
Geben Sie im Formular Kontingentänderungen in das Feld Neuer Wert das gewünschte Kontingent ein. Wenn das Feld Anfragebeschreibung angezeigt wird, geben Sie eine Beschreibung ein. Klicken Sie auf Fertig.
Wenn Sie ein Kästchen mit dem Text „Ich weiß, dass durch diese Anfrage alle Überschreibungen entfernt werden“ sehen, ist Ihr Kontingentwert unter dem Standardwert festgelegt. Wenn Sie den Kontingentwert auf den Standardwert oder darüber anpassen, wird die Überschreibung entfernt. Setzen Sie ein Häkchen in das Kästchen, um fortzufahren. Weitere Informationen zu Kontingentüberschreibungen.
Wenn die Schaltfläche Weiter angezeigt wird, klicken Sie darauf und füllen Sie auf dem nächsten Bildschirm Ihre Kontaktdaten aus.
Klicken Sie auf Anfrage senden.
Wenn Sie feststellen, dass Sie eine Anpassung nicht über die Console beantragen können, fordern Sie eine Erhöhung über Cloud Customer Care an.
Anträge auf Anpassung von Cloud-Kontingenten unterliegen einer Prüfung. Wenn Ihre Anfrage zur Kontingentanpassung geprüft werden muss, erhalten Sie eine E-Mail, in der der Eingang Ihrer Anfrage bestätigt wird. Wenn Sie weitere Hilfe benötigen, antworten Sie einfach auf diese E-Mail. Nach der Prüfung Ihrer Anfrage erhalten Sie eine E-Mail-Benachrichtigung, in der Sie darüber informiert werden, ob Ihre Anfrage genehmigt wurde.
Weitere Informationen zur Funktionsweise der Kontingenterhöhung finden Sie unter Anfragen zur Kontingenterhöhung.
Batchanfragen für höhere Kontingentwerte
Sie können mehrere Anträge auf ein höheres Kontingent gleichzeitig stellen, indem Sie die Kästchen neben den gewünschten Kontingenten anklicken. Wenn Sie mehrere Anfragen gleichzeitig senden, kann es länger dauern, bis Google Cloud Ihre Anfrage bearbeitet. Gruppieren Sie Anträge auf Kontingentanpassung nach Produkt und Region, um die Bearbeitungszeit zu verkürzen. Wenn Sie beispielsweise Anpassungen an den Netzwerk- und Compute Engine-VM-Kontingenten anfordern möchten, erstellen Sie eine Anfrage für die Netzwerkkontingente und eine weitere für die Compute Engine-VM-Kontingente.