Auf dieser Seite wird beschrieben, wie Sie die maximale Anzahl von Instanzen festlegen, die für Ihren Cloud Run-Dienst verwendet werden können. Durch die Angabe von maximalen Instanzen in Cloud Run können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen, obwohl diese Maximaleinstellung aufgrund von Umständen wie Trafficspitzen für kurze Zeit überschritten werden kann. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.
Informationen zu den Limits für die maximale Anzahl von Instanzen, die für Ihren Dienst gelten können, finden Sie unter Maximale Instanzlimits.
Weitere Informationen dazu, wie Cloud Run Container-Instanzen automatisch skaliert, finden Sie unter Instanz-Autoscaling.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:
-
Rolle Cloud Run Entwickler (
roles/run.developer
) im Cloud Run-Job -
Dienstkontonutzer (
roles/iam.serviceAccountUser
) für die Dienstidentität
Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run Service mit Google Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.
Maximale Instanzen festlegen und aktualisieren
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Standardmäßig sind Cloud Run-Dienste so konfiguriert, dass sie auf maximal 100 Instanzen skaliert werden können.
Sie können die Einstellung für die maximale Anzahl von Instanzen über die Google Cloud Console, die gcloud-Befehlszeile oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen.
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf Container bereitstellen und wählen Sie Dienst aus, um einen neuen Dienst zu konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen aus und klicken Sie dann auf Container, Volumes, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.
Klicken Sie auf den Tab Container.
- Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von
1
bis maximales Limit an.
- Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von
Klicken Sie auf Erstellen oder Bereitstellen.
gcloud
Mit dem folgenden Befehl können Sie die maximale Anzahl von Instanzen eines bestimmten Dienstes aktualisieren:
gcloud run services update SERVICE --max-instances MAX-VALUE
Ersetzen
- SERVICE durch den Namen Ihres Dienstes und
- MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Verwenden Sie einen beliebigen Ganzzahlwert von
1
bis zum maximalen Limit. Geben Siedefault
an, um alle maximalen Instanzeinstellungen zu löschen und die Standardeinstellung von 100 Instanzen wiederherzustellen.
Mit dem folgenden Befehl können Sie auch während der Bereitstellung die maximale Anzahl von Instanzen festlegen:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Ersetzen
- IMAGE_URL durch einen Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die FormLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen.
YAML
Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Ersetzen
- SERVICE durch den Namen Ihres Cloud Run-Dienstes
- MAX-INSTANCE durch die gewünschte Höchstzahl.
- REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Die folgende google_cloud_run_v2_service
-Ressource gibt die maximale Anzahl von 10
-Instanzen unter template.scaling
an.
Ersetzen Sie 10
durch die gewünschte maximale Anzahl von Instanzen.
Limits für die maximale Anzahl von Instanzen
Standardmäßig sind Cloud Run-Dienste auf maximal 100 Instanzen konfiguriert.
Die maximale Obergrenze hängt von der Region des Cloud Run-Dienstes und seinen CPU- und Arbeitsspeicherkonfigurationen ab.
Auf der Seite „Kontingente“ werden die grundlegenden Kontingente pro Region angezeigt.
Die maximale Anzahl von Instanzen wird bestimmt als das Minimum von:
- regionales Basiskontingent / gewünschtes Vielfaches von 1 CPU
- regionales Basiskontingent / gewünschtes Vielfaches von 2 GB Speicher
Beispielsweise hat ein Basiskontingent von 1.000 Instanzen mit 4 GB Arbeitsspeicher oder 2 CPUs ein effektives Limit von 500.
Wenn Sie eine maximale Anzahl von Instanzen angeben möchten, die die in der Region des Cloud Run-Dienstes zulässige maximale Anzahl überschreitet, müssen Sie eine Kontingenterhöhung anfordern.
Einstellungen für die maximale Anzahl von Instanzen ansehen
So rufen Sie die aktuellen Einstellungen der maximalen Instanzen für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich rechts wird die Einstellung für die maximale Anzahl von Instanzen auf dem Tab Container aufgelistet.
gcloud
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach der Einstellung für die maximale Anzahl von Instanzen.