Maximale Anzahl von Containerinstanzen festlegen

So legen Sie die maximale Anzahl von Containerinstanzen fest, die für Ihren Knative-Bereitstellungsdienst verwendet werden können. Durch Angabe einer maximalen Anzahl von Instanzen in der Knative-Bereitstellung können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.

Weitere Informationen zur automatischen Skalierung von Containerinstanzen durch Knative finden Sie unter Instanz-Autoscaling.

Maximale Instanzen festlegen und aktualisieren

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Standardmäßig kann die Anzahl der Containerinstanzen unbegrenzt skaliert werden. Sie können eine Obergrenze für die maximale Anzahl von Instanzen festlegen. Verwenden Sie dazu die Google Cloud Console oder die Google Cloud CLI, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:

Console

  1. Rufen Sie in der Google Cloud Console die Knative-Bereitstellung auf:

    Zur Knative-Bereitstellung

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Klicken Sie unter Erweiterte Einstellungen auf Container.

  4. Geben Sie im Feld Maximale Anzahl von Instanzen die gewünschte maximale Anzahl von Containerinstanzen an.

  5. Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.

  6. Wählen Sie im Abschnitt Konfigurieren, wie dieser Dienst ausgelöst wird die Verbindung aus, die Sie zum Auslösen des Dienstes verwenden möchten.

  7. Klicken Sie auf Erstellen, um das Image für Knative bereitzustellen, und warten Sie, bis die Bereitstellung abgeschlossen ist.

Befehlszeile

  • Legen Sie für vorhandene Dienste die maximale Anzahl von Containerinstanzen fest. Führen Sie dazu den Befehl gcloud run services update mit dem Parameter --max-instances aus.

    gcloud run services update SERVICE --max-instances MAX-VALUE

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Geben Sie default an, um alle Maximalwerte der Instanzeinstellungen zu löschen.
  • Legen Sie für neue Dienste die maximale Anzahl von Containerinstanzen fest, indem Sie den Befehl gcloud run deploy mit dem Parameter --max-instances ausführen:

    gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. gcr.io/cloudrun/hello.
    • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Geben Sie default an, um alle Maximalwerte der Instanzeinstellungen zu löschen.

YAML

Sie können die Konfiguration eines vorhandenen Dienstes in eine YAML-Datei herunterladen – mit dem gcloud run services describe-Befehl mithilfe des Flags --format=export. Sie können diese YAML-Datei dann ändern und diese Änderungen mit dem Befehl gcloud run services replace bereitstellen. Sie müssen sicherstellen, dass Sie nur die angegebenen Attribute ändern.

  1. Laden Sie die Konfiguration des Dienstes in eine Datei mit dem Namen service.yaml im lokalen Arbeitsbereich herunter:

    gcloud run services describe SERVICE --format export > service.yaml

    Ersetzen Sie SERVICE durch den Namen Ihres Knative-Bereitstellungsdienstes.

  2. Aktualisieren Sie in Ihrer lokalen Datei das Attribut autoscaling.knative.dev/maxScale::

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Ersetzen Sie

    • MAX-INSTANCE durch die gewünschte Höchstzahl.
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud run services replace service.yaml