Gleichzeitigkeit festlegen

Erfahren Sie, wie Sie die maximale Anzahl von Anfragen festlegen, die gleichzeitig von einer bestimmten Containerinstanz in Cloud Run for Anthos in Google Cloud verarbeitet werden können. Weitere Informationen zur Gleichzeitigkeit.

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Sie können Gleichzeitigkeitseinstellungen mit der Cloud Console oder dem gcloud-Befehlszeilentool konfigurieren, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:

Console

  1. Rufen Sie Cloud Run for Anthos in Google Cloud auf.

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Klicken Sie unter Erweiterte Einstellungen auf Container.

    Bild

  4. Legen Sie den gewünschten Wert für die Gleichzeitigkeit im Textfeld Maximale Anfragen pro Container fest:

  5. Klicken Sie auf Erstellen oder Bereitstellen.

Befehlszeile

  • Legen Sie für vorhandene Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud kuberun core services update mit dem Parameter --concurrency ausführen.

    gcloud kuberun core services update SERVICE --concurrency CONCURRENCY
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  • Legen Sie für neue Dienste die maximale Anzahl gleichzeitiger Anfragen fest, indem Sie den Befehl gcloud kuberun core services create mit dem Parameter --concurrency ausführen:

    gcloud kuberun core services create SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. gcr.io/myproject/my-image:latest.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um alle Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.

YAML

Wenn Sie eine Konfiguration Ihres bestehenden Dienstes mithilfe einer YAML-Datei ändern möchten, erhalten Sie eine Kopie der aktuellen Konfiguration. Bearbeiten und speichern Sie die Änderungen und in einer lokalen Datei. Anschließend stellen Sie diese Änderungen für Ihren Dienst bereit.

  1. Lassen Sie die Konfiguration als YAML anzeigen und kopieren Sie dann die Konfiguration Ihres Dienstes in eine lokale Datei, z. B. service.yaml:

    gcloud kuberun core services describe SERVICE --format yaml

    Ersetzen Sie SERVICE durch den Namen Ihres Cloud Run for Anthos-Dienstes.

  2. Aktualisieren Sie in Ihrer lokalen Datei das Attribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Ersetzen Sie:

    • SERVICE durch den Namen Ihres Dienstes von Cloud Run for Anthos in Google Cloud.
    • CONCURRENCY durch die maximale Anzahl gleichzeitiger Anfragen pro Containerinstanz. Geben Sie default an, um die Gleichzeitigkeitseinstellungen zu löschen: --concurrency default.
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud beta run services replace service.yaml