Maximale Anzahl von Containerinstanzen festlegen

Erfahren Sie, wie Sie die maximale Anzahl von Containerinstanzen festlegen, die für Ihren Dienst von Cloud Run for Anthos in Google Cloud verwendet werden können. Durch Angabe einer maximalen Anzahl von Instanzen in Cloud Run for Anthos können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.

Weitere Informationen dazu, wie Cloud Run for Anthos Container-Instanzen automatisch skaliert, finden Sie unter Instanz-Autoscaling.

Maximale Instanzen festlegen und aktualisieren

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Standardmäßig kann die Anzahl der Containerinstanzen unbegrenzt skaliert werden. Sie können eine Obergrenze für die maximale Anzahl von Instanzen festlegen. Verwenden Sie dazu die Cloud Console oder das gcloud-Befehlszeilentool, wenn Sie einen neuen Dienst bereitstellen oder einen vorhandenen Dienst aktualisieren und eine Überarbeitung bereitstellen:

Console

  1. Rufen Sie Cloud Run for Anthos in Google Cloud auf.

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Klicken Sie unter Erweiterte Einstellungen auf Container.

    Bild

  4. Geben Sie im Feld Maximale Anzahl von Instanzen die gewünschte maximale Anzahl von Containerinstanzen an.

  5. Klicken Sie auf Erstellen oder Bereitstellen.

Befehlszeile

  • Legen Sie für vorhandene Dienste die maximale Anzahl von Containerinstanzen fest. Führen Sie dazu den Befehl gcloud kuberun core services update mit dem Parameter --max-instances aus.

    gcloud kuberun core services update SERVICE --max-instances MAX-VALUE
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Geben Sie default an, um alle Maximalwerte der Instanzeinstellungen zu löschen.
  • Legen Sie für neue Dienste die maximale Anzahl von Containerinstanzen fest, indem Sie den Befehl gcloud kuberun core services create mit dem Parameter --max-instances ausführen:

    gcloud kuberun core services create SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
    

    Ersetzen Sie:

    • SERVICE durch den Namen des Dienstes.
    • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. gcr.io/myproject/my-image:latest.
    • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Geben Sie default an, um alle Maximalwerte der Instanzeinstellungen zu löschen.

YAML

Wenn Sie eine Konfiguration Ihres bestehenden Dienstes mithilfe einer YAML-Datei ändern möchten, erhalten Sie eine Kopie der aktuellen Konfiguration. Bearbeiten und speichern Sie die Änderungen und in einer lokalen Datei. Anschließend stellen Sie diese Änderungen für Ihren Dienst bereit.

  1. Lassen Sie die Konfiguration als YAML anzeigen und kopieren Sie dann die Konfiguration Ihres Dienstes in eine lokale Datei, z. B. service.yaml:

    gcloud kuberun core services describe SERVICE --format yaml

    Ersetzen Sie SERVICE durch den Namen Ihres Cloud Run for Anthos-Dienstes.

  2. Aktualisieren Sie in Ihrer lokalen Datei das Attribut autoscaling.knative.dev/maxScale::

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Ersetzen Sie:

    • MAX-INSTANCE durch die gewünschte Höchstzahl.
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud beta run services replace service.yaml