Gleichzeitigkeit festlegen

Die maximale Anzahl von Anfragen festlegen, die gleichzeitig von einer bestimmten Containerinstanz in Cloud Run for Anthos verarbeitet werden können. Weitere Informationen zur Gleichzeitigkeit.

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Sie können Gleichzeitigkeitseinstellungen mit der Google Cloud Console oder der Google Cloud CLI konfigurieren, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:

Console

  1. Rufen Sie Cloud Run for Anthos in der Google Cloud Console auf:

    Zu Cloud Run for Anthos

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Klicken Sie unter Erweiterte Einstellungen auf Container.

    Image

  4. Legen Sie den gewünschten Wert für die Gleichzeitigkeit im Textfeld Maximale Anfragen pro Container fest:

  5. Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.

  6. Wählen Sie im Abschnitt Konfigurieren, wie dieser Dienst ausgelöst wird die Verbindung aus, die Sie zum Auslösen des Dienstes verwenden möchten.

  7. Klicken Sie auf Erstellen, um das Image in Cloud Run for Anthos bereitzustellen. Warten Sie dann, bis die Bereitstellung abgeschlossen ist.

Befehlszeile

  • Legen Sie für vorhandene Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud run services update mit dem Parameter --concurrency ausführen.

    gcloud run services update SERVICE --concurrency CONCURRENCY

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  • Legen Sie für neue Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud run deploy mit dem Parameter --concurrency ausführen:

    gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. gcr.io/myproject/my-image:latest.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.

YAML

Sie können die Konfiguration eines vorhandenen Dienstes in eine YAML-Datei herunterladen – mit dem gcloud run services describe-Befehl mithilfe des Flags --format=export. Sie können diese YAML-Datei dann ändern und diese Änderungen mit dem Befehl gcloud beta run services replace bereitstellen. Sie müssen sicherstellen, dass Sie nur die angegebenen Attribute ändern.

  1. Laden Sie die Konfiguration des Dienstes in eine Datei mit dem Namen service.yaml im lokalen Arbeitsbereich herunter:

    gcloud run services describe SERVICE --format export > service.yaml

    SERVICE durch den Namen Ihres Cloud Run for Anthos-Dienstes.

  2. Aktualisieren Sie in Ihrer lokalen Datei das Attribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Ersetzen Sie:

    • SERVICE durch den Namen Ihres Cloud Run for Anthos-Dienstes.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um die Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud beta run services replace service.yaml