Auf dieser Seite wird beschrieben, wie Sie die maximale Anzahl von Instanzen festlegen, die für Ihren Cloud Run-Dienst verwendet werden können. Durch die Angabe von maximalen Instanzen in Cloud Run können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen, obwohl diese Maximaleinstellung aufgrund von Umständen wie Trafficspitzen für kurze Zeit überschritten werden kann. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.
Informationen zu den Limits für die maximale Anzahl von Instanzen, die für Ihren Dienst gelten können, finden Sie unter Maximale Instanzlimits.
Weitere Informationen dazu, wie Cloud Run Container-Instanzen automatisch skaliert, finden Sie unter Instanz-Autoscaling.
Maximale Instanzen festlegen und aktualisieren
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Standardmäßig sind Cloud Run-Dienste so konfiguriert, dass sie auf maximal 100 Instanzen skaliert werden können.
Sie können die Einstellung für die maximale Anzahl von Instanzen über die Google Cloud Console, die gcloud-Befehlszeile oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen.
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen wie gewünscht aus und klicken Sie dann auf Container, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.
Klicken Sie auf den Tab Container.
- Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von
1
bis maximales Limit an.
- Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von
Klicken Sie auf Erstellen oder Bereitstellen.
Befehlszeile
Mit dem folgenden Befehl können Sie die maximale Anzahl von Instanzen eines bestimmten Dienstes aktualisieren:
gcloud run services update SERVICE --max-instances MAX-VALUE
Ersetzen
- SERVICE durch den Namen Ihres Dienstes und
- MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Verwenden Sie einen beliebigen Ganzzahlwert von
1
bis zum maximalen Limit. Geben Siedefault
an, um alle maximalen Instanzeinstellungen zu löschen und die Standardeinstellung von 100 Instanzen wiederherzustellen.
Mit dem folgenden Befehl können Sie auch während der Bereitstellung die maximale Anzahl von Instanzen festlegen:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Ersetzen
- IMAGE_URL durch einen Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die FormREGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen.
YAML
Sie können vorhandene Dienstkonfigurationen mit dem Befehl gcloud run services describe --format export
herunterladen und aufrufen, was bereinigte Ergebnisse im YAML-Format liefert.
Anschließend können Sie die unten beschriebenen Felder ändern und die geänderte YAML-Datei mit dem Befehl gcloud run services replace
hochladen.
Achten Sie darauf, dass Sie die Felder nur wie dokumentiert ändern.
So rufen Sie die Konfiguration auf und laden sie herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Ersetzen Sie
- SERVICE durch den Namen Ihres Cloud Run-Dienstes
- MAX-INSTANCE durch die gewünschte Höchstzahl.
- REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Die folgende google_cloud_run_v2_service
-Ressource gibt eine maximale Anzahl von Instanzen von 10
unter template.scaling
an.
Ersetzen Sie 10
durch die gewünschte maximale Anzahl von Instanzen.
Limits für die maximale Anzahl von Instanzen
Standardmäßig sind Cloud Run-Dienste auf maximal 100 Instanzen konfiguriert.
Die maximale Obergrenze hängt von der Region des Cloud Run-Dienstes und seinen CPU- und Arbeitsspeicherkonfigurationen ab.
Auf der Seite „Kontingente“ werden die grundlegenden Kontingente pro Region angezeigt.
Die maximale Anzahl von Instanzen wird bestimmt als das Minimum von:
- regionales Basiskontingent / gewünschtes Vielfaches von 1 CPU
- regionales Basiskontingent / gewünschtes Vielfaches von 2 GB Speicher
Beispielsweise hat ein Basiskontingent von 1.000 Instanzen mit 4 GB Arbeitsspeicher oder 2 CPUs ein effektives Limit von 500.
Wenn Sie eine maximale Anzahl von Instanzen angeben möchten, die die in der Region des Cloud Run-Dienstes zulässige maximale Anzahl überschreitet, müssen Sie eine Kontingenterhöhung anfordern.
Einstellungen für die maximale Anzahl von Instanzen ansehen
So rufen Sie die aktuellen Einstellungen der maximalen Instanzen für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich rechts wird die Einstellung für die maximale Anzahl von Instanzen auf dem Tab Container aufgelistet.
Befehlszeile
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach der Einstellung für die maximale Anzahl von Instanzen.