Um die Einstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz zu verstehen, lesen Sie das Konzeptdokument.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:
-
Rolle Cloud Run Entwickler (
roles/run.developer
) im Cloud Run-Job -
Dienstkontonutzer (
roles/iam.serviceAccountUser
) für die Dienstidentität
Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run Service mit Google Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.
Maximale Anzahl gleichzeitiger Anfragen pro Instanz konfigurieren
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Für Cloud Run-Dienste können Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz über die Google Cloud Console, die gcloud-Befehlszeile oder über eine .yaml-Datei festlegen, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen wie gewünscht aus und klicken Sie dann auf Container, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.
Klicken Sie auf den Tab Container.
- Sie können den gewünschten Maximalwert für gleichzeitige Anfragen pro Instanz im Textfeld Maximale Anfragen pro Container festlegen:
Klicken Sie auf Erstellen oder Bereitstellen.
Befehlszeile
Mit dem folgenden Befehl legen Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz fest:
gcloud run services update SERVICE --concurrency CONCURRENCY
Ersetzen
- SERVICE durch den Namen des Dienstes.
CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz. Im Folgenden wird beispielsweise ein Maximum von 1 gleichzeitigen Anfrage festgelegt:
gcloud run services update SERVICE --concurrency 1
Wenn Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz eines bestimmten Dienstes ändern, wird diese Einstellung auch für neue Überarbeitungen übernommen.
Mit dem folgenden Befehl können Sie zur Standardeinstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz (80
) zurückkehren:
gcloud run services update SERVICE --concurrency default
Ersetzen Sie SERVICE durch den Namen des Dienstes, den Sie konfigurieren möchten.
YAML
Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containerConcurrency: CONCURRENCY
Ersetzen
- SERVICE durch den Namen Ihres Cloud Run-Dienstes
- IMAGE_URL durch einen Verweis auf das Container-Image, z. B.
us-docker.pkg.dev/cloudrun/container/hello:latest
. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die FormLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz.
- REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Fügen Sie einer google_cloud_run_v2_service
-Ressource in Ihrer Terraform-Konfiguration unter template
Folgendes hinzu: Ersetzen Sie 80
durch die gewünschte maximale Anzahl gleichzeitiger Anfragen.
Gleichzeitigkeitseinstellungen anzeigen
So rufen Sie die aktuellen Gleichzeitigkeitseinstellungen für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf.
Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich auf der rechten Seite ist die Gleichzeitigkeitseinstellung auf dem Tab Container aufgelistet.
Befehlszeile
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach der Gleichzeitigkeitseinstellung.