Maximale Anzahl gleichzeitiger Anfragen pro Instanz (Dienste)

Um die Einstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz zu verstehen, lesen Sie das Konzeptdokument.

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Für Cloud Run-Dienste können Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz über die Google Cloud Console, die gcloud-Befehlszeile oder über eine .yaml-Datei festlegen, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Öffnen Sie Cloud Run.

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen wie gewünscht aus und klicken Sie dann auf Container, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.

  4. Klicken Sie auf den Tab Container.

    Image

    • Sie können den gewünschten Maximalwert für gleichzeitige Anfragen pro Instanz im Textfeld Maximale Anfragen pro Container festlegen:
  5. Klicken Sie auf Erstellen oder Bereitstellen.

Befehlszeile

Mit dem folgenden Befehl legen Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz fest:

gcloud run services update SERVICE --concurrency CONCURRENCY

Ersetzen

  • SERVICE durch den Namen des Dienstes.
  • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz. Im Folgenden wird beispielsweise ein Maximum von 1 gleichzeitigen Anfrage festgelegt:

    gcloud run services update SERVICE --concurrency 1

Wenn Sie die maximale Anzahl gleichzeitiger Anfragen pro Instanz eines bestimmten Dienstes ändern, wird diese Einstellung auch für neue Überarbeitungen übernommen.

Mit dem folgenden Befehl können Sie zur Standardeinstellung für die maximale Anzahl gleichzeitiger Anfragen pro Instanz (80) zurückkehren:

gcloud run services update SERVICE --concurrency default

Ersetzen Sie SERVICE durch den Namen des Dienstes, den Sie konfigurieren möchten.

YAML

Sie können vorhandene Dienstkonfigurationen mit dem Befehl gcloud run services describe --format export herunterladen und aufrufen, was bereinigte Ergebnisse im YAML-Format liefert. Anschließend können Sie die unten beschriebenen Felder ändern und die geänderte YAML-Datei mit dem Befehl gcloud run services replace hochladen. Achten Sie darauf, dass Sie die Felder nur wie dokumentiert ändern.

  1. So rufen Sie die Konfiguration auf und laden sie herunter:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aktualisieren Sie das Attribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containerConcurrency: CONCURRENCY

    Ersetzen Sie

    • SERVICE durch den Namen Ihres Cloud Run-Dienstes
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. us-docker.pkg.dev/cloudrun/container/hello:latest. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die Form REGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Instanz.
    • REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
      • Beginnt mit SERVICE-
      • Enthält nur Kleinbuchstaben, Ziffern und -
      • Endet nicht mit -
      • Darf nicht mehr als 63 Zeichen enthalten
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud run services replace service.yaml

Terraform

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

Fügen Sie einer google_cloud_run_v2_service-Ressource in Ihrer Terraform-Konfiguration unter template Folgendes hinzu: Ersetzen Sie 80 durch die gewünschte maximale Anzahl gleichzeitiger Anfragen.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-concurrency"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    # Maximum concurrent requests
    max_instance_request_concurrency = 80
  }
}

Gleichzeitigkeitseinstellungen anzeigen

So rufen Sie die aktuellen Gleichzeitigkeitseinstellungen für Ihren Cloud Run-Dienst auf:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Öffnen Sie Cloud Run.

  2. Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.

  3. Klicken Sie auf den Tab Überarbeitungen.

  4. Im Detailbereich auf der rechten Seite ist die Gleichzeitigkeitseinstellung auf dem Tab Container aufgelistet.

Befehlszeile

  1. Verwenden Sie den folgenden Befehl:

    gcloud run services describe SERVICE
  2. Suchen Sie in der zurückgegebenen Konfiguration nach der Gleichzeitigkeitseinstellung.