Maximale Anzahl von Instanzen (Dienste)

Auf dieser Seite wird beschrieben, wie Sie die maximale Anzahl von Instanzen festlegen, die für Ihren Cloud Run-Dienst verwendet werden können. Durch die Angabe von maximalen Instanzen in Cloud Run können Sie die Skalierung Ihres Dienstes als Reaktion auf eingehende Anfragen begrenzen, obwohl diese Maximaleinstellung aufgrund von Umständen wie Trafficspitzen für kurze Zeit überschritten werden kann. Verwenden Sie diese Einstellung, um Ihre Kosten zu kontrollieren oder die Anzahl der Verbindungen zu einem Sicherungsdienst zu begrenzen, z. B. zu einer Datenbank.

Informationen zu den Limits für die maximale Anzahl von Instanzen, die für Ihren Dienst gelten können, finden Sie unter Maximale Instanzlimits.

Weitere Informationen dazu, wie Cloud Run Container-Instanzen automatisch skaliert, finden Sie unter Instanz-Autoscaling.

Maximale Instanzen festlegen und aktualisieren

Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.

Standardmäßig sind Cloud Run-Dienste so konfiguriert, dass sie auf maximal 100 Instanzen skaliert werden können.

Sie können die Einstellung für die maximale Anzahl von Instanzen über die Google Cloud Console, die gcloud-Befehlszeile oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Revision bereitstellen.

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Öffnen Sie Cloud Run.

  2. Klicken Sie auf Dienst erstellen, wenn Sie einen neuen Dienst für die Bereitstellung konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.

  3. Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen wie gewünscht aus und klicken Sie dann auf Container, Netzwerk, Sicherheit, um die Seite zur Dienstkonfiguration zu maximieren.

  4. Klicken Sie auf den Tab Container.

    Image

    • Im Feld mit der Bezeichnung Maximale Anzahl von Instanzen geben Sie die gewünschte maximale Anzahl von Instanzen mit einem beliebigen Ganzzahlwert von 1 bis maximales Limit an.
  5. Klicken Sie auf Erstellen oder Bereitstellen.

Befehlszeile

Mit dem folgenden Befehl können Sie die maximale Anzahl von Instanzen eines bestimmten Dienstes aktualisieren:

gcloud run services update SERVICE --max-instances MAX-VALUE

Ersetzen

  • SERVICE durch den Namen Ihres Dienstes und
  • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen. Verwenden Sie einen beliebigen Ganzzahlwert von 1 bis zum maximalen Limit. Geben Sie default an, um alle maximalen Instanzeinstellungen zu löschen und die Standardeinstellung von 100 Instanzen wiederherzustellen.

Mit dem folgenden Befehl können Sie auch während der Bereitstellung die maximale Anzahl von Instanzen festlegen:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Ersetzen

  • IMAGE_URL durch einen Verweis auf das Container-Image, z. B. us-docker.pkg.dev/cloudrun/container/hello:latest. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die Form REGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
  • MAX-VALUE durch die gewünschte maximale Anzahl von Containerinstanzen.

YAML

Sie können vorhandene Dienstkonfigurationen mit dem Befehl gcloud run services describe --format export herunterladen und aufrufen, was bereinigte Ergebnisse im YAML-Format liefert. Anschließend können Sie die unten beschriebenen Felder ändern und die geänderte YAML-Datei mit dem Befehl gcloud run services replace hochladen. Achten Sie darauf, dass Sie die Felder nur wie dokumentiert ändern.

  1. So rufen Sie die Konfiguration auf und laden sie herunter:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aktualisieren Sie das Attribut autoscaling.knative.dev/maxScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Ersetzen Sie

    • SERVICE durch den Namen Ihres Cloud Run-Dienstes
    • MAX-INSTANCE durch die gewünschte Höchstzahl.
    • REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
      • Beginnt mit SERVICE-
      • Enthält nur Kleinbuchstaben, Ziffern und -
      • Endet nicht mit -
      • Darf nicht mehr als 63 Zeichen enthalten
  3. Ersetzen Sie den Dienst mit dem folgenden Befehl durch die neue Konfiguration:

    gcloud run services replace service.yaml

Terraform

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

Die folgende google_cloud_run_v2_service-Ressource gibt eine maximale Anzahl von Instanzen von 10 unter template.scaling an. Ersetzen Sie 10 durch die gewünschte maximale Anzahl von Instanzen.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Limits für die maximale Anzahl von Instanzen

Standardmäßig sind Cloud Run-Dienste auf maximal 100 Instanzen konfiguriert.

Die maximale Obergrenze hängt von der Region des Cloud Run-Dienstes und seinen CPU- und Arbeitsspeicherkonfigurationen ab.

Auf der Seite „Kontingente“ werden die grundlegenden Kontingente pro Region angezeigt.

Die maximale Anzahl von Instanzen wird bestimmt als das Minimum von:

  • regionales Basiskontingent / gewünschtes Vielfaches von 1 CPU
  • regionales Basiskontingent / gewünschtes Vielfaches von 2 GB Speicher

Beispielsweise hat ein Basiskontingent von 1.000 Instanzen mit 4 GB Arbeitsspeicher oder 2 CPUs ein effektives Limit von 500.

Wenn Sie eine maximale Anzahl von Instanzen angeben möchten, die die in der Region des Cloud Run-Dienstes zulässige maximale Anzahl überschreitet, müssen Sie eine Kontingenterhöhung anfordern.

Einstellungen für die maximale Anzahl von Instanzen ansehen

So rufen Sie die aktuellen Einstellungen der maximalen Instanzen für Ihren Cloud Run-Dienst auf:

Console

  1. Rufen Sie in der Google Cloud Console Cloud Run auf.

    Öffnen Sie Cloud Run.

  2. Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.

  3. Klicken Sie auf den Tab Überarbeitungen.

  4. Im Detailbereich rechts wird die Einstellung für die maximale Anzahl von Instanzen auf dem Tab Container aufgelistet.

Befehlszeile

  1. Verwenden Sie den folgenden Befehl:

    gcloud run services describe SERVICE
  2. Suchen Sie in der zurückgegebenen Konfiguration nach der Einstellung für die maximale Anzahl von Instanzen.