Maximale Anzahl gleichzeitiger Anfragen pro Instanz festlegen (Dienste)

Um die Einstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz zu verstehen, lesen Sie das Konzeptdokument.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:

Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run Service mit Google Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.

Maximale Anzahl gleichzeitiger Anfragen pro Instanz konfigurieren

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Für Cloud Run-Dienste können Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz über die Google Cloud Console, die gcloud-Befehlszeile oder über eine .yaml-Datei festlegen, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Zu Cloud Run

  2. Klicken Sie auf Container bereitstellen und wählen Sie Dienst aus, um einen neuen Dienst zu konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen aus und klicken Sie dann auf Container, Volumes, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.

  4. Klicken Sie auf den Tab Container.

    Bild

    • Sie können den gewünschten Maximalwert für gleichzeitige Anfragen pro Instanz im Textfeld Maximale Anfragen pro Container festlegen:
  5. Klicken Sie auf Erstellen oder Bereitstellen.

gcloud

Mit dem folgenden Befehl legen Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz fest:

gcloud run services update SERVICE --concurrency CONCURRENCY

Ersetzen

  • SERVICE durch den Namen des Dienstes.
  • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz. Im Folgenden wird beispielsweise ein Maximum von 1 gleichzeitigen Anfrage festgelegt:

    gcloud run services update SERVICE --concurrency 1

Wenn Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz eines bestimmten Dienstes ändern, wird diese Einstellung auch für neue Überarbeitungen übernommen.

Mit dem folgenden Befehl können Sie zur Standardeinstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz (80) zurückkehren:

gcloud run services update SERVICE --concurrency default

Ersetzen Sie SERVICE durch den Namen des Dienstes, den Sie konfigurieren möchten.

YAML

  1. Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aktualisieren Sie das Attribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containerConcurrency: CONCURRENCY

    Ersetzen

    • SERVICE durch den Namen Ihres Cloud Run-Dienstes
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. us-docker.pkg.dev/cloudrun/container/hello:latest. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die Form LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz.
    • REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
      • Beginnt mit SERVICE-
      • Enthält nur Kleinbuchstaben, Ziffern und -
      • Endet nicht mit -
      • Darf nicht mehr als 63 Zeichen enthalten
  3. Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:

    gcloud run services replace service.yaml

Terraform

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

Fügen Sie einer google_cloud_run_v2_service-Ressource in Ihrer Terraform-Konfiguration unter template Folgendes hinzu: Ersetzen Sie 80 durch die gewünschte maximale Anzahl gleichzeitiger Anfragen.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-concurrency"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    # Maximum concurrent requests
    max_instance_request_concurrency = 80
  }
}

Gleichzeitigkeitseinstellungen anzeigen

So rufen Sie die aktuellen Gleichzeitigkeitseinstellungen für Ihren Cloud Run-Dienst auf:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Zu Cloud Run

  2. Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.

  3. Klicken Sie auf den Tab Überarbeitungen.

  4. Im Detailbereich auf der rechten Seite ist die Gleichzeitigkeitseinstellung auf dem Tab Container aufgelistet.

gcloud

  1. Verwenden Sie den folgenden Befehl:

    gcloud run services describe SERVICE
  2. Suchen Sie in der zurückgegebenen Konfiguration nach der Gleichzeitigkeitseinstellung.