Gleichzeitigkeit festlegen

Die maximale Anzahl von Anfragen festlegen, die gleichzeitig von einer bestimmten Containerinstanz in Knative Serving verarbeitet werden können. Weitere Informationen zur Gleichzeitigkeit.

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Sie können Gleichzeitigkeitseinstellungen mit der Google Cloud Console oder der Google Cloud CLI konfigurieren, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:

Console

  1. Rufen Sie in der Google Cloud Console Knative Serving auf:

    Zu Knative Serving

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Klicken Sie unter Erweiterte Einstellungen auf Container.

  4. Legen Sie den gewünschten Wert für die Gleichzeitigkeit im Textfeld Maximale Anfragen pro Container fest:

  5. Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.

  6. Wählen Sie im Abschnitt Konfigurieren, wie dieser Dienst ausgelöst wird die Verbindung aus, die Sie zum Auslösen des Dienstes verwenden möchten.

  7. Klicken Sie auf Erstellen, um das Image in Knative Serving bereitzustellen. Warten Sie, bis die Bereitstellung abgeschlossen ist.

Befehlszeile

  • Legen Sie für vorhandene Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud run services update mit dem Parameter --concurrency ausführen.

    gcloud run services update SERVICE --concurrency CONCURRENCY
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  • Legen Sie für neue Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud run deploy mit dem Parameter --concurrency ausführen:

    gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. gcr.io/cloudrun/hello.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.

YAML

Sie können die Konfiguration eines vorhandenen Dienstes in eine YAML-Datei herunterladen – mit dem gcloud run services describe-Befehl mithilfe des Flags --format=export. Sie können diese YAML-Datei dann ändern und diese Änderungen mit dem Befehl gcloud run services replace bereitstellen. Sie müssen sicherstellen, dass Sie nur die angegebenen Attribute ändern.

  1. Laden Sie die Konfiguration des Dienstes in eine Datei mit dem Namen service.yaml im lokalen Arbeitsbereich herunter:

    gcloud run services describe SERVICE --format export > service.yaml

    Ersetzen Sie SERVICE durch den Namen Ihres Knative-Serving-Dienstes.

  2. Aktualisieren Sie in Ihrer lokalen Datei das Attribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Ersetzen Sie:

    • SERVICE durch den Namen Ihres Knative Serving-Dienstes
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um die Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud run services replace service.yaml