Um die Einstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz zu verstehen, lesen Sie das Konzeptdokument.
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Für Cloud Run-Dienste können Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz über die Google Cloud Console, die gcloud-Befehlszeile oder über eine .yaml-Datei festlegen, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen wie gewünscht aus und klicken Sie dann auf Container, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.
Klicken Sie auf den Tab Container.
- Sie können den gewünschten Maximalwert für gleichzeitige Anfragen pro Instanz im Textfeld Maximale Anfragen pro Container festlegen:
Klicken Sie auf Erstellen oder Bereitstellen.
Befehlszeile
Mit dem folgenden Befehl legen Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz fest:
gcloud run services update SERVICE --concurrency CONCURRENCY
Ersetzen
- SERVICE durch den Namen des Dienstes.
CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz. Im Folgenden wird beispielsweise ein Maximum von 1 gleichzeitigen Anfrage festgelegt:
gcloud run services update SERVICE --concurrency 1
Wenn Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz eines bestimmten Dienstes ändern, wird diese Einstellung auch für neue Überarbeitungen übernommen.
Mit dem folgenden Befehl können Sie zur Standardeinstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz (80
) zurückkehren:
gcloud run services update SERVICE --concurrency default
Ersetzen Sie SERVICE durch den Namen des Dienstes, den Sie konfigurieren möchten.
YAML
Sie können vorhandene Dienstkonfigurationen mit dem Befehl gcloud run services describe --format export
herunterladen und aufrufen, was bereinigte Ergebnisse im YAML-Format liefert.
Anschließend können Sie die unten beschriebenen Felder ändern und die geänderte YAML-Datei mit dem Befehl gcloud run services replace
hochladen.
Achten Sie darauf, dass Sie die Felder nur wie dokumentiert ändern.
So rufen Sie die Konfiguration auf und laden sie herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containerConcurrency: CONCURRENCY
Ersetzen Sie
- SERVICE durch den Namen Ihres Cloud Run-Dienstes
- IMAGE_URL durch einen Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die FormREGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz.
- REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Fügen Sie einer google_cloud_run_v2_service
-Ressource in Ihrer Terraform-Konfiguration unter template
Folgendes hinzu: Ersetzen Sie 80
durch die gewünschte maximale Anzahl gleichzeitiger Anfragen.
Gleichzeitigkeitseinstellungen anzeigen
So rufen Sie die aktuellen Gleichzeitigkeitseinstellungen für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich auf der rechten Seite ist die Gleichzeitigkeitseinstellung auf dem Tab Container aufgelistet.
Befehlszeile
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach der Gleichzeitigkeitseinstellung.