Die maximale Anzahl von Anfragen festlegen, die gleichzeitig von einer bestimmten Containerinstanz in Knative Serving verarbeitet werden können. Weitere Informationen zur Gleichzeitigkeit.
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Sie können Gleichzeitigkeitseinstellungen mit der Google Cloud Console oder der Google Cloud CLI konfigurieren, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:
Console
Rufen Sie in der Google Cloud Console Knative Serving auf:
Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Klicken Sie unter Erweiterte Einstellungen auf Container.
Legen Sie den gewünschten Wert für die Gleichzeitigkeit im Textfeld Maximale Anfragen pro Container fest:
Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.
Wählen Sie im Abschnitt Konfigurieren, wie dieser Dienst ausgelöst wird die Verbindung aus, die Sie zum Auslösen des Dienstes verwenden möchten.
Klicken Sie auf Erstellen, um das Image in Knative Serving bereitzustellen. Warten Sie, bis die Bereitstellung abgeschlossen ist.
Befehlszeile
Legen Sie für vorhandene Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl
gcloud run services update
mit dem Parameter--concurrency
ausführen.gcloud run services update SERVICE --concurrency CONCURRENCY
Ersetzen Sie:
- SERVICE durch den Namen des Dienstes.
- CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie
default
an, um alle Gleichzeitigkeitseinstellungen zu löschen:--concurrency default
.
Legen Sie für neue Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl
gcloud run deploy
mit dem Parameter--concurrency
ausführen:gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
Ersetzen Sie:
- SERVICE durch den Namen des Dienstes.
- IMAGE_URL durch einen Verweis auf das Container-Image, z. B.
gcr.io/cloudrun/hello
. - CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie
default
an, um alle Gleichzeitigkeitseinstellungen zu löschen:--concurrency default
.
YAML
Sie können die Konfiguration eines vorhandenen Dienstes in eine YAML-Datei herunterladen – mit dem gcloud run services describe
-Befehl mithilfe des Flags --format=export
.
Sie können diese YAML-Datei dann ändern und diese Änderungen mit dem Befehl gcloud run services replace
bereitstellen.
Sie müssen sicherstellen, dass Sie nur die angegebenen Attribute ändern.
Laden Sie die Konfiguration des Dienstes in eine Datei mit dem Namen
service.yaml
im lokalen Arbeitsbereich herunter:gcloud run services describe SERVICE --format export > service.yaml
Ersetzen Sie SERVICE durch den Namen Ihres Knative-Serving-Dienstes.
Aktualisieren Sie in Ihrer lokalen Datei das Attribut
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
Ersetzen Sie:
- SERVICE durch den Namen Ihres Knative Serving-Dienstes
- CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie
default
an, um die Gleichzeitigkeitseinstellungen zu löschen:--concurrency default
.
Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:
gcloud run services replace service.yaml